Nuova ricerca

Sonia BERGAMASCHI

SENIOR PROFESSOR
Dipartimento di Ingegneria "Enzo Ferrari"

Insegnamento: Big Data Management and Governance

Ingegneria informatica (Offerta formativa 2022)

Obiettivi formativi

To provide fundamental notions of Data Management and Governance: Database Management & Architecture, Management of Massive Data, Data Security and Quality.
To provide advanced skills on: Relational Database Programming, Relational Design Theory and Database System Implementation;
To provide fundamental notions on Management of Massive Data;
To provide fundamental notions on Data Security and Quality to fullfill the overall Data Resource Management requirement of enterprises.

Prerequisiti

The courses of Database and Lab. of the Computer Engineering degree at the "Enzo Ferrari" Engineering Department in Modena. For students coming from other universities and/or other disciplines, the acquisition of the notions included in the cited course.

Programma del corso

Relational Database Programming and Advanced Database Modelling (2.0 CFU)
- Advanced SQL:
o constraints and triggers
o Views & Indexes
- SQL in a server environment:
o SQL/Host-Language Interface
o store procedures
o Using a Call-Level interface, JDBC, Dynamic SQL

Design Theory for Relational Databases (0.5 CFU)
- Functional Dependencies, Normal Forms, Decomposition

Database System Implementation (2.0 CFU)
- Relational Technology
o Database Management Systems (DBMS) Architecture: DBMS three levels architecture (ANSI/X3/Sparc); Relational DBMS architecture. Elements of Hierarchical and Network data models
o Storage and Management of very large amount of data on secondary memory devices
o Primary and secondary file indexing techniques. Hash indexing
o Query Execution, the Query Compiler & Optimizer
o Database Transactions Management: Concurrency Control, Serializability and Recoverability.


Management of Massive Data (4 CFU)
o Distributed databases and Distributed transactions processing: two phase commit, from ACID to BASE properties
o Information Integration Principles and Entity Resolution
o Architectures and Technology for Big Data Management (Map Reduce, Hadoop Spark); NOSQL data models and DBMS, Cloud DBMS, Graph DBMS.

Data Governance (0.5 CFU)
o General notions on architectures, policies, practicies and procedures to properly manage the full data life cycle of an enterprise
o General notions on Data Security and Quality Management
o Data preparation.

Metodi didattici

Lectures, practical exercises, laboratory activities.

Testi di riferimento

o Course transparencies available on the dolly VLE platform
o H.Garcia Molina, Jeffrey D. Ullman, Jennifer Widom: “Database Systems – the Complete Book – Second Edition –Pearson-Prentice Hall
o D. Beneventano, S. Bergamaschi, F. Guerra, M. Vincini: Progetto di Basi di Dati Relazionali: lezioni ed esercizi Pitagora editrice - Bologna (edizione 2007). (in italian)

Verifica dell'apprendimento

---
METODO E CONTENUTI DELL'ESAME
---
L'esame si compone di una prova progetto da svolgere in gruppo con presentazione, un test di SQL avanzato e una prova orale individuale.

Progetto (40% del voto finale):
Il progetto deve essere svolto in gruppo (composto da 2 o 3 candidati). Il tema deve essere concordato preventivamente con il docente e deve essere inerente al programma del corso. Il progetto deve comprendere:
- una parte progettuale, una parte sperimentale implementativa e/o di confronto/sperimentazione di sistemi software per la gestione di big data applicati a un particolare dominio identificato per il progetto
- una relazione breve (max. 4 pagine) per descrivere l’attività svolta
- un repository con il codice prodotto

Presentazione del progetto:
- Presentazione breve (max. 20 minuti) da parte del gruppo del progetto: presentazione del problema, approccio utilizzato per risolverlo, analisi critica dell’esperienza e conclusioni. Discussione del progetto con domande. Ogni candidato deve presenta la parte del progetto di cui è responsabile.


Test di SQL avanzato (30% del voto finale):
- Il test può essere sostenuto durante la sospensione delle lezioni dedicata alle prove intermedie oppure all'inizio della prova orale

Prova orale individuale (30% del voto finale):
- Tre domande aperte per candidato che possono spaziare su tutto il programma dell'insegnamento


---
TEMPI
---
La prova orale individuale ha come prerequisito il superamento del test di SQL avanzato e la prova di presentazione del progetto di gruppo. Le date delle prove possono essere concordate con i docenti dell’insegnamento (attraverso la classe MS Teams dell'insegnamento).


---
NOTE
---
Le prove potrebbero essere svolte in presenza o a distanza a seconda dell'evoluzione della situazione COVID19.

Risultati attesi

Knowledge and understanding: Through lectures, students will get deep knowledge and understanding of the relational technology, also at the level of implementation techniques, as well as the basics of data distributed databases.
Applying knowledge and understanding: Through classroom exercises and practical computer exercises, the student will be able to use the advanced features of the standard language for DBMS and to apply the knowledge gained in the design and implementation of distributed databases.
Making judgments: Thanks to the resolution of individual exercises and practical exercises in the laboratory, the student will be able to critically evaluate the design and implementative choices taken and the results obtained.
Communication skills: The oral exam with a subject of further choice, will equip the student to organize and clearly present, through the technical language, the results of his work.
Learning skills: The activities carried out during the course and during the examination allow the student to acquire the instruments to autonomously upgrade his knowledge. This is especially crucial in the field of advanced data management, where technology is constantly evolving.