Nuova ricerca

Domenico BENEVENTANO

Professore Associato
Dipartimento di Ingegneria "Enzo Ferrari"

Insegnamento: Sistemi Informativi e Web Semantico

Ingegneria informatica (Offerta formativa 2022)

Obiettivi formativi

Il corso fornirà allo studente solide conoscenze e capacità di comprensione delle principali problematiche correlate ai sistemi informativi in azienda. Particolare enfasi sarà data ai sistemi informativi direzionali. Il corso affronterà tre argomenti principali: 1) integrazione dei dati e data warehousing, 2) business intelligence e visualizzazione dati, 3) Linked Data e web semantico.

L'integrazione dei dati riguarda la creazione di una visione unificata di dati provenienti da diverse sorgenti, memorizzate utilizzando varie tecnologie. L'integrazione dei dati diventa cruciale nel caso di fusione di società diverse o per il consolidamento delle applicazioni all'interno di un’unica azienda per fornire una visione unificata delle attività sui dati aziendali. Quest’ultimo aspetto è spesso chiamato data warehouse.

Business Intelligence è un sistema di modelli, metodi, processi, persone e strumenti che consentono di raccogliere e organizzare il patrimonio informativo aziendale. Attraverso elaborazioni, analisi o aggregazioni, consentono di trasformare, memorizzare, accedere e presentare le informazioni in una forma semplice, flessibile ed efficace che supporta decisioni strategiche, tattiche e operative.

Le tecnologie del Semantic Web e dei Linked Open Data (LOD) introducono nuove prospettive di integrazione e nuove direzioni di analisi dei dati. Introducendo la semantica sui dati aziendali e permettono di affiancare ai dati interni, dati open, accrescono il valore delle informazioni aziendali.

Prerequisiti

Non sono richieste propedeuticità.
Le conoscenze preliminari riguardano conoscenze sulle basi di dati, il modello relazionale e il linguaggio SQL, inoltre è apprezzata una conoscenza di base del linguaggio HTML

Programma del corso

Integrazione dei Dati & Data Warehousing ( 2.5 CFU, 20 ore – tenuto dal prof. Beneventano)
- Introduzione all’Integrazione dei Dati
- Corrispondenze tra schemi e corrispondenze tra dati
- Qualità dei dati e Fusione dei dati
- Big Data Integration
- Data Warehousing: progettazione concettuale e logica; alimentazione e progettazione fisica;

Business Intelligence & Data Visualization ( 1.5 CFU, 12 ore – tenuto dal prof. Beneventano)
- Introduzione al processo di Business Intelligence
- Sistemi OLAP per la Business Intelligence
- SQL per l'aggregazione e l'analisi dei dati.
- Architetture di Business Intelligence e Analytics Platforms
- Introduzione alla Data Visualization

Linked Data & Semantic Web (3.5 CFU, 28 ore – tenuto dalla prof. Po)
- Introduzione alle tecnologie del Semantic Web Stack
- Il web dei dati: la Linked Open Data Cloud e i principi dei Linked Data
- Vocabolari e ontologie nel Web semantico
- Open Governament e Open Data: principi di trasparenza
- Creare e pubblicare Linked Open Data: le best practice, le tecnologie, i tool, esempi pratici e di successo
- Usare i Linked Open Data: interrogazione e integrazione di linked data/ open data /dati proprietari

NLP & Semantic Web (1.5 CFU, 12 ore – tenuto dalla prof. Po)
- Cosa sono e cosa fanno le tecnologie di Natural Language Processing
- Casi d’uso delle tecnologie NLP
- Come l’NLP può essere usata e abbinata al Semantic Web in particolare per aiutare a gestire i dati non strutturati ed estrarre informazioni utili

Saranno possibili integrazioni e/o modifiche dei contenuti in relazione a situazioni contingenti o alla luce dei feedback degli studenti.

Metodi didattici

L’insegnamento viene erogato in lingua italiana mediante lezioni frontali in presenza che vengono svolte con l’ausilio di mezzi audiovisivi (presentazioni in Power Point rese disponibili agli studenti, prevalentemente in lingua inglese). Sono previste diverse esercitazioni pratiche che prevedono l’uso di strumenti software e attività pratiche di laboratorio, quali uso di framework per l’integrazione dei dati, la costruzione del datawarehouse e l’analisi dei dati, uso di strumenti per la creazione, visualizzazione, interrogazione di dataset rdf, ontologie, linked data, uso di tool per la manipolazione di documenti testuali con tecniche NLP. La frequenza non è obbligatoria.

Nel caso in cui, l’attività in presenza non fosse possibile (come verificatosi durante l’emergenza covid) le lezioni sono svolte in diretta streaming e videoregistrate; le registrazioni rimangono a disposizione per tutto l’anno accademico per favorire e supportare gli studenti che non hanno potuto frequentare alcune o la totalità delle lezioni.

Testi di riferimento


Per affrontare alla verifica dell’apprendimento, gli studenti devono prepararsi utilizzando le slide e il materiale fornito dai docenti durante le lezioni, oltre che i tool software analizzati, e le esercitazioni svolte.

Tutte le slide e il materiale didattico sono rese disponibili man mano che vengono affrontate durante le lezioni sul sito MOODLE https:// https://moodle.unimore.it/

Materiali didattici aggiuntivi per l'approfondimento, come libri e articoli di ricerca saranno menzionati durante le lezioni o elencati come materiali per lo svolgimento della tesina.

Nel seguito si riporta una lista di libri di riferimento utilizzabili come materiale di approfondimento.

---
To address the verification of learning, students must prepare using the slides and material provided by the teachers during the lessons, as well as the software tools analyzed, and the exercises carried out.

All the slides and teaching material are made available as they are addressed during the lessons on the MOODLE website https:// https://moodle.unimore.it/

Additional teaching materials for in-depth study, such as books and research articles will be mentioned during the lessons or listed as materials for carrying out the dissertation.

Below is a list of reference books.

---
Principles of Data Integration, AnHai Doan, Alon Halevy, and Zachary Ives, Morgan Kaufmann, 1st edition (2012), 520 pages, ISBN: 9780124160446

The Semantic Web Explained — the technology and mathematics behind Web 3.0, Péter Szeredi, Gergely Lukácsy, Tamás Benkő, Cambridge University (2014), ISBN: 9780521700368

Linked Data for Libraries, Archives and Museums: How to Clean, Link and Publish Your Metadata, Seth van Hooland and Ruben Verborgh, Facet Publishing (2014), ISBN: 9781856049641

ITALIAN BOOK:
Semantic Web - Dai fondamenti alla realizzazione di un'applicazione, Emanuele Della Valle, Irene Celino, Dario Cerizza, Pearson Addison-Wesley (2009), ISBN:9788871925783

Verifica dell'apprendimento

La verifica si compone di esame orale svolto tramite due colloqui orali con i rispettivi docenti e di una tesina individuale su un argomento scelto a piacere dallo studente a partire da suggerimenti forniti dai docenti.
Sono previste due prove intermedie, una a metà delle lezioni, durante l’interruzione didattica e una alla fine delle lezioni. Le date delle prove intermedie sono concordate con gli studenti frequentanti le lezioni. Le liste d'iscrizione sono pubblicate su esse3.
La prova completa, così come ciascuna prova intermedia, consta di un orale con il prof. Beneventano e uno con la prof. Po. Ciascun orale ha una durata di circa mezz’ora. Gli orali tratteranno tutti gli argomenti svolti a lezione da ciascun docente e potranno contenere sia domande di teoria che esercizi. Le domande (aperte e chiuse) sono finalizzate a valutare l’acquisizione da parte dello studente delle conoscenze e delle capacità di comprensione della parte nozionistica/teorica dell’insegnamento. Gli esercizi svolti, anche tramite l’ausilio di software, sono finalizzati a valutare la capacità di applicare conoscenza e comprensione. Al termine di ciascuna prova orale il docente comunicherà la valutazione dell’orale.

La tesina individuale richiede all’incirca 3 settimane di lavoro e può consistere nel l’ideazione ed elaborazione di un progetto o in un rapporto su uno studio di ricerca. Terminato il lavoro della tesina, lo studente compone un articolo di 4/6 pagine in formato ACM o IEEE oppure una presentazione power point di 10-15 slide e la presenta al docente referente. In fase di esposizione della tesina il docente referente comunicherà la valutazione.
La tesina è finalizzata a valutare la capacità di applicare conoscenza e comprensione oltre che l’autonomia di giudizio. Può essere svolta prima o dopo la prova completa/le prove intermedie.

Ciascuna prova orale, e la tesina, si intende superata con un voto pari almeno a 18/30. La valutazione della tesina incide per 1/3 sul voto finale, mentre la prova completa incide per i 2/3. Nel caso si svolgano i due parziali, al posto della prova completa, ciascuno incide 1/3 sul voto finale.

Durante lo svolgimento degli esercizi il candidato potrà accedere a tutta la documentazione del corso (slide, libri, appunti etc.)

Risultati attesi

1) Conoscenza e capacità di comprensione
Al termine dell’insegnamento e della verifica dell’apprendimento, si auspica che lo/a studente/essa sia in grado di:
a) orientarsi all’interno dei sistemi informativi aziendali riconoscendo le esigenze di integrazione e analisi dati;
b) descrivere i passi da intraprendere per integrare fonti dati eterogenee, pubblicare open data, individuare ed estrarre informazioni di interesse da linked open data.

2) Conoscenza e capacità di comprensione applicate
a) svolgere una analisi di dettaglio di una sorgente dati, individuando nuove fonti dati utili da integrare e suggerendo un processo di integrazione dati efficace ed efficiente;
b) padroneggiare gli strumenti software utilizzati durante l’insegnamento e l’esame;
c) strutturare o estendere una ontologia di dominio a un caso applicativo;

3) Autonomia di giudizio
a) verificare il proprio grado di apprendimento e comprensione dei concetti esposti grazie alla possibilità d’intervento a lezione e alla possibilità rappresentata dalla tesina individuale;
b) riorganizzare le conoscenze apprese ed implementare la propria capacità di valutazione critica ed autonoma di quanto appreso;
c) valutare soluzioni informatiche avanzate nell’ambito dell’integrazione, analisi e visualizzazione dei dati.


4) Abilità comunicative
a) esprimere in modo corretto e logico le proprie conoscenze, riconoscendo l’argomento richiesto e rispondendo in modo puntuale e completo alle domande d’esame orale;
b) sintetizzare ed elaborare compiutamente le ricerche condotte sull’argomento della tesina illustrandone i concetti chiave e gli elementi di distinzione del proprio lavoro individuale rispetto allo stato dell’arte;
c) padroneggiare una terminologia accurata e propria dei sistemi informativi, e del semantic web.

5) Capacità di apprendimento
a) approfondire le nozioni apprese per provvedere autonomamente al proprio aggiornamento particolarmente cruciale in un ambito di sistemi informativi e di analisi dei dati, dove le tecnologie sono in continua evoluzione;
b) impadronirsi ed affinare il proprio linguaggio scientifico e tecnico.