Nuova ricerca

STEFANO GHINOI

Professore Associato
Dipartimento di Comunicazione ed Economia

Insegnamento: Data Reduction, Information Design e Data Visualization

Analisi dei dati per l'impresa e la finanza (Offerta formativa 2024)

Obiettivi formativi

L’obiettivo di questo corso è quello di introdurre gli studenti ai concetti di statistical learning e data reduction, oltre a fornire gli strumenti necessari per fare data visualization. Al termine dell’insegnamento, lo studente sarà in grado di: 1) comprendere ed utilizzare tecniche statistiche per l’analisi e la visualizzazione di dati; 2) usare diversi metodi per l’analisi e la visualizzazione di dati; 3) presentare in maniera efficace un lavoro di analisi e visualizzazione di dataset complessi.

Prerequisiti

Conoscenza degli elementi di statistica descrittiva.

Programma del corso

Statistical learning e data reduction (0.5 CFU)
Regressione lineare (1 CFU).
Metodi di classificazione e ri-campionamento. (1 CFU)
Analisi delle Componenti Principali e Analisi Fattoriale. (1.5 CFU)
Alberi di decisione. (1 CFU)
Network analysis. (1 CFU)
Il processo di visualizzazione dei dati. (0.5 CFU)
Preparare il dataset per la data visualisation e l’utilizzo del pacchetto ggplot2 in R. (1 CFU)
Grafici per analisi univariata, bivariata, e multivariata. (1 CFU)
Data visualisation per modelli statistici. (1 CFU)
Altri grafici: networks, heatmaps, word clouds, e grafici interattivi. (0.5 CFU)

Metodi didattici

Lezioni frontali comprensive di esercitazioni in laboratorio, nel quale verrà utilizzato il software per l’analisi statistica R e il linguaggio di programmazione Python. La frequenza non è obbligatoria ma vivamente consigliata. Le lezioni in aula verranno registrate e rese disponibili agli studenti sulla piattaforma ONELab del Dipartimento di Comunicazione ed Economia. L’insegnamento si svolge in lingua italiana.

Testi di riferimento

Obbligatori:

• James, G., Witten, D., Hastie, T., e Tibshirani, R. (2020). Introduzione all'apprendimento statistico con applicazioni in R. Piccin Editore. Disponibile al seguente indirizzo (con versione per R e Python): https://www.statlearning.com
• Kabacoff, R. (2024) Modern Data Visualization with R (versione online). Disponibile al seguente indirizzo: https://rkabacoff.github.io/datavis/index.html

Altri testi consigliati:

• Kirk, A. (2016). Data Visualisation: A Handbook for Data Driven Design. SAGE.
• Pegoraro, E. (2019). Statistica per Data Science con R - V. 03. Disponibile al seguente indirizzo: http://www.r-project.it/_book/

Slide delle lezioni a cura del docente.

Verifica dell'apprendimento

La prova d’esame è divisa in due parti. La prima parte consiste nella stesura di un report (2000 parole massimo, referenze escluse) in cui gli studenti dovranno descrivere e commentare il lavoro di analisi di un dataset fornito dal docente e disponibile su Moodle. Il report dovrà essere inviato al docente prima della prova orale. La seconda parte (prova orale) si svolgerà al termine dell’insegnamento secondo il calendario ufficiale degli appelli d’esame, e consisterà in una serie di domande sui temi trattati durante il corso (teoria, applicazioni, e scrittura del codice in R o Python). Il punteggio complessivo di 30 punti è così suddiviso: 15 punti per il report, 15 punti per l’esame orale.

Risultati attesi

Conoscenza e capacità di comprensione: lo studente sarà in grado di comprendere i principali approcci statistici per la gestione, manipolazione, e visualizzazione di grandi quantità di dati.

Conoscenza e capacità di comprensione applicate: lo studente sarà in grado di adottare strumenti statistici volti ad estrarre informazioni da dataset complessi, utilizzando metodi robusti per la parte di data reduction e tecniche innovative di data visualisation.

Autonomia di giudizio: lo studente sarà in grado di decidere in autonomia quali sono tecniche di data reduction e data visualisation più adatte in vari contesti.

Abilità comunicative: lo studente sarà in grado di discutere le principali tecniche di data reduction e data visualisation discusse all’interno del corso, ed interpretare ed esporre correttamente i risultati ottenuti tramite l’analisi statistica.

Capacità di apprendere: lo studente sarà in grado di apprendere nuovi concetti e strumenti per l’analisi dei dati.