Εξάμηνο | Χειμερινό 2017 |
Πότε/Πού | Τετάρτη 17:15-19:00, Πέμπτη 9:15-11:00, (Εργαστήριο Aρεταίος) |
Βιβλιογραφία |
|
On-line Βιβλία και άλλοι πόροι | |
Διδάσκων: | Δημήτριος Τσουμάκος |
E-mail: | dtsouma@ionio.gr (Aναφέρετε το μάθημα και τον Α.Μ. σας στο "subject" του e-mail υποχρεωτικά) |
Ο βαθμός του μαθήματος προκύπτει από βαθμολόγηση εργαστηριακών θεμάτων και παρουσιάσεων (15%),
ενεργή συμμετοχή στο μάθημα (5%) και απαλλακτικής προγραμματιστικής εργασίας (80%).
Κάθε ομάδα φοιτητών θα παρουσιάσει στην τάξη ένα επιλεγμένο θέμα (δείτε παρακάτω πιθανά θέματα) καθώς και μια (απλή) υλοποίησή του.
Το θέμα της απαλλακτικής εργασίας τίθεται σε συννενόηση με τον διδάσκοντα και πρέπει να παραδίδεται στο τέλος του εξαμήνου που θα λάβει βαθμολογία ο φοιτητής χωρίς εξαίρεση. Η εργασία περιλαμβάνει παρουσίαση μεθόδου και αποτελεσμάτων καθώς και γραπτή αναφορά.
Εργασίες εκτός προθεσμίας δεν βαθμολογούνται στην παρούσα ούτε καμιά από τις επόμενες εξεταστικές περιόδους του ακαδημαϊκού έτους. Ο βαθμός των εργαστηρικών ασκήσεων διατηρείται μόνον μέχρι και την εξεταστική περίοδο του Σεπτεμβρίου.
Το μάθημα είναι καθαρά εργαστηριακό. Απαιτούνται πολύ καλες προγραμματιστικές γνώσεις καθώς και γνώση Δομών Δεδομένων, Βάσεων Δεδομένων και Λειτουργικών Συστημάτων.
Το μάθημα επικεντρώνεται στην έννοια "δεδομένα μεγάλου όγκου" (big data) και στη μελέτη μοντέρνων τεχνικών και τεχνολογιών αποθήκευσης και διαχείρισής τους. Συγκεκριμένα, θα μελετηθούν: Τα Υπολογιστικά Νέφη (Cloud Computing). Βάσεις δεδομένων στο διαδίκτυο: Σχεσιακές, κατανεμημένες και columnar βάσεις, με έμφαση στις τεχνολογίες κατανεμημένων συστημάτων αρχείων (HDFS), ΝοSQL (HBase, Cassandra), graph-databases(Neo4j). Μοντέλα υπολογισμού μεγάλου όγκου δεδομένων (MapReduce, BSP) και πλατφόρμες που τα υλοποιούν (Hadoop, Hama, Spark, κλπ). Επιστήμη Δεδομένων και η γλώσσα R. Εφαρμογές των παραπάνω και υλοποίηση αλγορίθμων με κατανεμημένο τρόπο για επεξεργασία μεγάλου όγκου δεδομένων.
Οι φοιτητές μπορούν να χρησιμοποιούν είτε πόρους του εργαστηρίου, είτε Εικονικές Μηχανές από τον ~okeano, είτε και προσωπικά μηχανήματα. Οι εργασίες περιλαμβάνουν το στήσιμο και δημιουργία εφαρμογών πάνω από σύγχρονες πλατφόρμες (π.χ. hadoop, HBase, Mahout, κλπ), με βασική εμπλοκή του φοιτητή σε όλα αυτά τα στάδια.
Παρακάτω αναφέρονται ενδεικτικά θέματα για παρουσίαση από 1 ομάδα στα πλαίσια του μαθήματος:
Ημερομηνία | Θέμα | Ομάδα |
---|---|---|
Ημερομηνία | Θέμα | Αναγνώσματα |
---|---|---|
4,5 Οκτ. | Εισαγωγή στα Big Data Εισαγωγή στο Cloud Computing |
Κεφ.1 από το "Data-Intensive Text Processing with MapReduce" Τί είναι τα Big Data Σύνοψη του Cloud Computing από τη NIST |
18,19 Οκτ. | Εισαγωγή στο MapReduce - Hadoop - HDFS |
MapReduce paper from Google Apache Hadoop site HDFS Architecture |
1,2 Νοε. | Τεχνολογίες Data-Warehousing Columnar Datastores |
An Overview of Data Warehousing and OLAP Technology The Design and Implementation of Modern Column-Oriented Database Systems C-Store |
8,9 Νοε. | NoSQL Databases - Cassandra - Hbase | NoSQL Databases CAP theorem Hbase BigTable Cassandra - A Decentralized Structured Storage System Cassandra |