Nuova ricerca

Barbara PISTORESI

Professore Associato
Dipartimento di Economia "Marco Biagi"

Insegnamento: Analisi dei dati

Analisi dei dati per l'economia e il management (Offerta formativa 2023)

Obiettivi formativi

*Data Management (CdLM EPPS)-12cfu: 6cfu Cavicchioli + 6cfu Pistoresi
*Analisi dei dati (CdLM ADEM) - 9cfu Pistoresi

L’insegnamento è orientato all'applicazione di tecniche di analisi dei dati nell'ambito di scenari specifici di analisi economica e gestione aziendale. Esso consta di vari moduli: un primo modulo di introduzione ai principi di base per l’analisi di insieme di dati da un punto di vista esplorativo e statistico-inferenziale è rivolto agli studenti del CdLM EPPS. Il secondo e terzo modulo riguardano la costruzione di modelli econometrici per l’analisi delle relazioni tra variabili. Il secondo modulo è comune ai CdLM EPPS ed ADEM, mentre il terzo modulo è rivolto solo agli studenti di ADEM.

Modulo 1: Metodi statistici per la gestione dei dati (6cfu - CAVICCHIOLI)
ll modulo di Metodi statistici per la gestione dei dati introdurrà gli studenti ai principi di base di gestione e trattamento dei dati da un punto di vista esplorativo e statistico-inferenziale. A tal scopo si introdurranno le distribuzioni di probabilità e le tecniche di statistica inferenziale per problemi di stima e verifica d’ipotesi. Inoltre, si presenteranno i metodi di campionamento e la raccolta di dati primari, come anche la preparazione della matrice dei dati e la sua descrizione numerica e grafica. Infine, si studieranno tecniche basate sulla statistica inferenziale per il confronto delle caratteristiche di gruppi.
Costituiscono parte integrante del corso le esercitazioni sull’uso dei software statistici e la discussione settimanale degli esercizi assegnati.


Modulo 2 (6cfu - PISTORESI) e Modulo 3 (3cfu - PISTORESI)
Questi moduli sono orientati all'applicazione di tecniche econometriche nell'ambito di scenari specifici di analisi economica e gestione aziendale. Essi introducono gli studenti allo studio dell’efficacia di un intervento di policy analizzando gli effetti causali di una o più variabili su un fenomeno di interesse congiuntamente al problema della loro identificazione e stima.
A questo scopo il secondo modulo si soffermerà sul modello di regressione lineare e sul metodo per stimarne i parametri con lo stimatore dei minimi quadrati ordinari (OLS). Saranno introdotti modelli alternativi alla regressione lineare, come i modelli non lineari o panel e metodi di stima alternativi agli OLS, quali gli stimatori con variabili strumentali (IV), in particolare lo stimatore dei minimi quadrati a due stadi (2SLS). Nel terzo modulo verranno presentati principalmente metodi di stima per dati panel (regressioni con effetti fissi, temporali e random) e metodi per “big data” (cenni).
Al termine del corso gli studenti saranno in grado di riconoscere quali siano le metodologie statistiche più adatte per un particolare problema empirico, anche in base alla natura dei dati disponibili, ad interpretare i risultati di stima, e a giudicarne la validità interna ed esterna.

Prerequisiti

Questi moduli poggiano sulla conoscenza dei concetti di base di statistica a livello di laurea triennale. Tuttavia, il modulo 1 rivolto agli studenti di EPPS ripropone nella sua parte iniziale concetti di statistica di base utili per coloro che provengono da lauree triennali in cui il corso di statistica non è obbligatorio. Il modulo 1 non obbligatorio per gli studenti di ADEM può essere scelto come esame a libera scelta nel caso in cui non si ritenessero solide le basi di statistica della laurea triennale di provenienza

Programma del corso

Per ogni Credito Formativo Universitario (CFU) sono previste 7 ore di didattica frontale e 18 ore di studio autonomo di studenti e studentesse. Dunque, un CFU equivale ad un impegno standard di studio pari a 25 ore.
Modulo 1 (EPPS - CAVICCHIOLI)
1 CFU (7 ore)
Introduzione alla statistica e all’analisi dei dati. Distribuzioni di probabilità discrete e continue. Distribuzione campionaria. [NCT cap. 5, 6 e 7]
1 CFU (7 ore)
Problemi di stima e intervalli di confidenza per la media di una popolazione e per la differenza di medie di due popolazioni [NCT cap. 8 e 9]
2 CFU (14 ore)
Verifica d’ipotesi sulla media di una popolazione e sulla differenza di medie di due popolazioni [NCT cap. 10 e 11]
2 CFU (14 ore)
Tecniche di campionamento e indagini statistiche con utilizzo di dati primari (survey). La matrice dei dati e la descrizione numerica e grafica di tali dati. [NCT cap. 7, 2 e 3]
1 CFU (7 ore)
Il test del chi-quadro come test di indipendenza e misura di associazione. [NCT cap. 13]
1 CFU (7 ore)
Tecniche statistiche di analisi della varianza (ANOVA) per il confronto tra gruppi. [materiale proprio]
**Tutti gli argomenti saranno accompagnati da esercitazioni, anche con l’utilizzo di diversi software statistici.
Modulo 2 (EPPS + ADEM - PISTORESI)
1CFU (7 ore)
Dati e Fonti. Struttura dei dati: serie storiche, cross sezionali e panel (bilanciati e non bilanciati). Regressione lineare con regressore singolo: continuo, dicotomico. Bontà del modello: R-quadro [SW, Capitoli 4, 5]. Esercitazioni in laboratorio con l’utilizzo di un software statistico
1CFU (7 ore)
Regressione lineare con regressori multipli [SW, Capitolo 6]. Multicollinearità e variabili omesse. Strategie di selezione del modello ottimale con R quadro corretto, AIC, BIC, HQ [SW, Capitolo 7]. Esercitazioni in laboratorio con l’utilizzo di un software statistico
1 CFU (7 ore)
Regressione non lineare (modelli polinomiali, log-log, lin-log, log-lin, modelli con interazioni) [SW, Capitolo 8]. Esercitazioni in laboratorio con l’utilizzo di un software statistico
1CFU (7 ore)
Test sui parametri del modello di regressione: test unilaterali e bilaterali. Verifica di ipotesi e intervalli di confidenza nella regressione multipla. Strategie di selezione del modello ottimale con l’ F test. Ancora su multicollinearita’: VIF [SW, Capitoli 4,5, e 6]. Valutazione di studi basati sulla regressione multipla [SW, Capitolo 9 + articoli]. Esercitazioni in laboratorio con l’utilizzo di un software statistico
2 CFU (14 ore)
Regressione con variabili strumentali . Cenni[SW, Capitolo 12].
Regressione con variabile dipendente binaria. Cenni [SW, Capitolo 11]. Esercitazioni in laboratorio con l’utilizzo di un software statistico
Regressione con effetti di moderazione e mediazione (cenni).
Esercitazioni in laboratorio con l’utilizzo di un software statistico

Modulo 3 (ADEM - PISTORESI)
1CFU (7 ore) ADEM
Regressione con variabili strumentali [SW, Capitolo 12].
Esercitazioni in laboratorio con l’utilizzo di un software statistico
1.5 CFU (10.5 ore) ADEM
Regressione con dati panel. Effetti fissi e temporali. [SW, Capitolo 10].
Pseudo panel (articoli).
0.5 CFU(3.5 ore) ADEM
Regressione con serie storiche. Correlazione seriale e stazionarietà: la regressione spuria.

Metodi didattici

L'insegnamento si svolge in presenza ed è erogato in lingua italiana. Il metodo didattico si basa su: (a) lezioni frontali con contenuti sia teorici che applicati supportati materiale didattico (slides, esercizi, etc,) e registrazioni delle lezioni (b) esercitazioni al computer con uso di software statistici, in cui si sviluppa la capacità di applicare le conoscenze acquisite. Le esercitazioni riguarderanno contesti economici e aziendali di vario genere che emergono anche come casi studio negli altri corsi del piano di studi. I software statistici saranno disponibili nel laboratorio virtuale di UNIMORE e/o scaricabile nel computer personale del singolo studente.
Costituiscono quindi parte integrante del corso le esercitazioni con l'uso di pacchetti statistici e la discussione settimanale degli esercizi assegnati. Nello svolgimento dell’insegnamento, sia nelle lezioni frontali che nelle esercitazioni, agli studenti frequentanti viene sempre richiesta una partecipazione attiva, attraverso interventi singoli e con discussioni collettive sui temi oggetto di studio. La partecipazione attiva è richiesta anche durante le attività seminariali con esperti, ricercatori e rappresentanti del mondo del lavoro che interverranno per mostrare come applicare in contesti lavorativi le tecniche di analisi empirica previste nel corso.
Dal 1 ottobre 2023 verrà reso disponibile il materiale relativo alle lezioni e le videoregistrazioni immediatamente. Lo streaming invece non è permesso in linea con le decisioni relative alla erogazione della didattica di UNIMORE. Potrebbe anche essere richiesta una interazione da remoto per esercitazioni o presentazioni.

Testi di riferimento

• Newbold P., Carlson W. e Thorne B. (2021) Statistica (nona edizione), Pearson Education Italia [NCT]

• Stock J. H. e Watson M. W. (2020), Introduzione all’Econometria (quinta edizione italiana), Pearson Education Italia [SW].

Suggerimenti per ulteriori letture verranno forniti durante il corso.

Verifica dell'apprendimento

L’esame sarà in forma scritta della durata di 75 minuti e prevede domande a risposta multipla, domande aperte ed esercizi da svolgere con casi pratici di analisi empirica da svolgere usando anche software statistici.
Gli indicatori di valutazione sono: capacità di utilizzare le conoscenze teoriche per impostare l’utilizzo del software statistico; padronanza del linguaggio statistico; capacità di discutere gli argomenti e i risultati dell’analisi empirica, capacità di approfondire gli argomenti, capacità critica.
Il voto è espresso in trentesimi ed è necessario ai fini di superamento dell’esame il raggiungimento della soglia dei 18/30 (vale a dire una preparazione ragionevolmente sufficiente). Per i frequentanti, possono essere previste presentazioni in classe e/o discussioni di esercizi che concorrono alla definizione di bonus spendibili solo al raggiungimento all’ esame finale del voto di 18/30). Gli esiti saranno comunicati entro e non oltre due settimane dalla prova scritta; la pubblicazione avverrà tramite Esse3.

Risultati attesi

Completato con successo l’insegnamento, lo studente consegue i seguenti risultati:
1.Conoscenza e capacità di comprensione. Attraverso lezioni teoriche, esercitazioni guidate, esercitazioni autonome e discussioni collegiali dei risultati lo studente apprende le tecniche statistiche ed econometriche di base da applicare ai dati economici e aziendali, impara a descrivere i risultati nonché argomentare le proprie risposte in modo articolato e chiaro.
2.Capacità di applicare conoscenza e comprensione. Attraverso esercitazioni in cui si utilizza un software statistico lo studente riesce a gestire banche dati con cui stimare i parametri dei modelli teorici, sottoporre tali modelli a test, prevedere variabili di interesse economico-aziendale, e infine può condurre un'analisi di politica economica o gestione aziendale.

3 Autonomia di giudizio nel valutare criticamente le esercitazioni ai punti 1 e 2.

4. Abilità comunicative. La presentazione in aula dei risultati ottenuti dall’elaborazione al computer organizzate anche in forma scritta (ad esempio presentazione dei risultati in tabelle), aiuta lo studente ad argomentare in modo efficace e conciso la scelta fatta delle tecniche statistiche ed econometriche appropriate al tipo di problema analizzato, la sua capacità di presentazione dei risultati e infine la discussione collegiale aiuta la valutazione critica del lavoro fatto.

5. Capacità di apprendimento. Le attività sopra descritte consentono allo studente di acquisire gli strumenti econometrici di base per l'elaborazione dei dati economici e aziendali. Esse inoltre consentono di maturare la capacità di formulare giudizi critici, di problem solving e di elaborazione di un report chiaro e sistematico favorendo il rafforzamento delle abilità personali di team working e quindi anche competenze trasversali. In sintesi, le competenze disciplinari e trasversali saranno utili per affrontare in modo autonomo l'analisi quantitativa utile per la tesi di laurea o impiegata in corsi di formazione superiore (dottorato o master secondo livello) o sempre più utilizzata nel mondo del lavoro.