Nuova ricerca

Isabella MORLINI

Professore Associato
Dipartimento di Comunicazione ed Economia

Insegnamento: Analisi dei dati multidimensionali

Analisi dei dati per l'impresa e la finanza (Offerta formativa 2023)

Obiettivi formativi

Molte aree dell'economia, dell'industria e della finanza hanno come oggetto lo studio di fenomeni attraverso l'analisi di grandi insiemi di dati, la cui misurazione è caratterizzata da incertezza.
Questo corso ha come oggetto i principi di base dell'analisi dei dati da un punto di vista statistico ed introduce lo studente alla pratica di tali principi.
L'enfasi è posta sull'analisi esplorativa dei dati, sulla costruzione di modelli statistici bivariati e multivariati e sulla corretta interpretazione dei risultati.

I principali concetti sono presentati rigorosamente durante il corso. Tuttavia, particolare attenzione sarà posta sullo sviluppo della capacità di risoluzione di problemi.

Prerequisiti

Occorre avere superato un corso di base di analisi matematica ed uno di statistica a livello di laurea triennale.

Programma del corso

- L’analisi dei dati in azienda: il data warehouse ed il data mining come supporto alle decisioni. I sondaggi e le indagini statistiche.
- Primary e secondary data. Tecniche di campionamento per l'acquisizione dei secondary data.
- Il questionario.
- Presentazione e classificazione delle informazioni rilevate: la matrice dei dati. Il trattamento preliminare dei dati: valori mancanti e valori anomali. Analisi esplorative e visualizzazione dei dati. Rappresentazioni grafiche. Il boxplot.
- Ripasso: indici univariati di posizione e variabilità, distribuzioni di frequenza, la distribuzione normale
- La correlazione e la cograduazione per la relazione tra variabili quantitative.
- La relazione tra variabili qualitative nominali: indici di associazione per tabelle 2x2 e per tabelle rxc
- Indici di associazione per variabili ordinali. Indici di associazione per variabili rilevate su scala differente.
- Market basket analysis
- Il problema della riduzione delle dimensioni di una matrice di dati quantitativi: il metodo delle componenti principali. Scomposizione in valori singolari di una matrice di covarianza e di correlazione. I criteri di scelta del numero di componenti. Il biplot. La scatter plot matrix e altre metodologie grafiche multivariate.
- I metodi statistici per la segmentazione del mercato: misure di distanza e di similarità tra individui o oggetti. Impiego delle distanze per l’analisi di mercato
- Formazione di gruppi omogenei con metodi gerarchici di cluster analysis. Applicazioni a casi reali con l’impiego di SPSS: i segmenti del mercato d’un prodotto, la classificazione della clientela. Metodi non gerarchici di classificazione: le k-medie.

Metodi didattici

Le lezioni in aula saranno svolte con l’ausilio del personal computer per l’illustrazione di Excel e del software statistico Spss.
Materiali didattici integrativi (data set ed elaborazioni in excel, slides utilizzate a lezione, esercizi svolti e da svolgere, esempi di compito di esame, ecc.) saranno a disposizione nel sito moodle del corso.

Testi di riferimento

Zani S., Cerioli A. (2007). Analisi dei dati a data mining per le decisioni aziendali. Giuffrè editore. Milano
Capitoli: I, II, III, IV, V, VI, VIII, IX.

Slides e materiale didattico scaricabili dal sito dolly del corso

Verifica dell'apprendimento

La verifica dell’apprendimento avviene tramite una prova scritta. L’esame ha una durata massima di 90 minuti. La prova generalmente consta di 4/5 esercizi e di domande a risposta multipla.
Le domande e gli esercizi riguardano quesiti su alcuni punti importanti della teoria e della pratica e sono diretti ad accertare la capacità di comprensione, l’autonomia di giudizio e la capacità di comunicare con linguaggio tecnico appropriato. L’ampia articolazione dei quesiti nelle diverse domande dovrebbe consentire di valutare sia la capacità di apprendimento sia la capacità di applicare le conoscenze acquisite. Alcuni esercizi prevedono il calcolo di indici statistici e la valutazione della loro significatività o l'interpretazione del risulato. Altri esercizi prevedono l'analisi delle tabelle di output di Spss.

Alcuni esempi di struttura di prova finale e tipologia di domande sono presenti sulla pagina moodle del corso.

Materiale da portare all'esame: tavole statistiche, calcolatrice scientifica.

Risultati attesi

I risultati di apprendimento che il corso intende far raggiungere agli studenti sono:
- Identificazione delle fasi del processo di ricerca, degli strumenti di misura e di raccolta dei dati, conoscenza dele tecniche di campionamento. Capacità di effettuare un'indagine statistica in tutte le sue fasi (dalla individuazione della popolazione e del campione alla raccolta dei dati, all'elaborazione e alla interpretazione dei risultati)
- Conoscenza dei metodi statistici utili a misurare l'eventuale relazione esistente tra due variabili e ridurre le dimensioni della matrice dei dati.
- Conoscenza dei principali metodi statistici multivariati quali le componenti principali e le tecniche di clustering.
- Utilizzo di queste conoscenze in problemi reali in ambito economico, finanziario e sociale.
- Capacità di usare un linguaggio matematico e statistico per studiare e formalizzare problemi economici, finanziari e aziendali.
- Capacità di scelta della metodologia appropriata, fra quelle studiate, a seconda del problema, della scala di misura delle variabili e delle informazioni che si vogliono ottenere.
- Capacità di interpretare i risultati delle elaborazioni in maniera critica e trarre conclusioni.
- Capacità di comunicare i risultati, sotto forma di report o grafici, a persone senza competenza statistica.