Nuova ricerca

Roberto SIMONINI

Professore Associato
Dipartimento di Scienze della Vita sede ex-Biologia

Insegnamento: Disegno sperimentale e analisi di dati biologici

Bioscienze (Offerta formativa 2024)

Obiettivi formativi

Il corso vuole fornire le conoscenze e le competenze necessarie a comprendere i criteri logici e metodologici necessari per un efficiente disegno sperimentale. Fornisce inoltre agli studenti gli strumenti principali per l'analisi di problemi biologici in contesto uni- e bi-variato (con cenni a quello multi-variato).
Per una più completa comprensione degli obiettivi formativi, si rimanda alla lettura dei risultati di apprendimento attesi.

Prerequisiti

Conoscenze relative a principi di Matematica acquisite durante i corsi di laurea di primo livello. Gli studenti dovranno inoltre essere in grado di interpretare grafici a barre, istogrammi e grafici sparsi.

Programma del corso

Introduzione e basi (1 CFU-8 ore)
Presentazione del corso e del materiale didattico. Esempi di applicazioni della statistica in scienze della vita
Le basi: fattori, variabili, media, varianza; precisione, accuratezza, percentili
Contesto di applicazione dei test statistici; Un esempio diapplicazione del metodo ipotetico deduttivo.
Testare ipotesi; ""Regole d’ingaggio”.

Controllo di omoschedasticità, normalità e test per confronto di due gruppi (1 CFU - 8 ore)
Intervalli di normalità e applicazioni della normale
Test su varianze; Test su normalità; Trasformazioni
Inquadramento del confronto tra due gruppi. Test z per il confronto delle medie di due gruppi e direzionalità
Test t e test U per il confronto delle medie o delle mediane di due gruppi; Test adatti a due gruppi di dati appaiati (dipendenti)

Analisi della varianza (ANOVA) (1 CFU - 8 ore)
introduzione. Tabella e interpretazione dell’ANOVA
Confronti multipli definiti a posteriori
Confronti multipli definiti a priori
Confronti multipli e errore. Applicazione del test di Kruskal-Wallis
Errore associato ai contrasti e test di KW

Analisi di relazioni e analisi univariate a due fattori (1 CFU - 8ore)
Introduzione a analisi correlazione
Approfondimenti su correlazione e correlazione non parametrica
Basi della Regressione
Statistiche per la regressione
Introduzione alle analisi multifattoriali. Fattori fissi e random
Disegni ortogonali
Disegni gerarchizzati

Fondamenti di analisi multivariate (1 CFU - 8 ore)
Matrici, similarità e distanze
Classificazioni e ordinamenti
Test di permutazione e ANOSIM
Analisi delle componenti principali PCA

Esercitazioni al PC (1 CFU - 8 ore [distribuite lungo la durata del corso])
Esercizi sull'utilizzo di software per analisi dati (PAST) e fogli di calcolo: funzioni di base, per il controllo dei dati, la costruzione dei grafici e i test più comuni.


Il docente si riserva la possibilità di integrazioni e/o modifiche dei contenuti in relazione a situazioni contingenti. Potrà essere dedicato un tempo maggiore ad alcuni argomenti rispetto a quanto preventivato alla luce dei feedback degli studenti.

Il programma include nozioni che lo studente potra applicare anche nel corso a scelta "Coding in R for data analysis"

Metodi didattici

L’insegnamento viene erogato mediante lezioni frontali in presenza che vengono svolte con l’ausilio di mezzi audiovisivi (presentazioni, fogli di calcolo, testi di articoli scientifici) ed esercitazioni pratiche in aula informatica svolte in presenza (compatibilmente con la situazione sanitaria). Oltre ad aspetti teorici, vengono presi in considerazione rapporti tecnici e casi di studio da letteratura scientifica che sono oggetto di discussione al termine delle lezioni. L'insegnamento si svolge in presenza ed è erogato in lingua italiana. La frequenza non è obbligatoria. Gli studenti potranno approfondire gli argomenti trattati sfruttando ulteriore materiale opzionale messo a disposizione sulla piattaforma Dolly. In relazione all'evolversi della situazione pandemica, l'attività didattica, o parte di essa, potrebbe essere svolte a distanza.

Testi di riferimento

Sulla pagina Teams/Moodle relativa all’insegnamento è presente materiale messo a disposizione (nel rispetto del copyright) dal docente (materiale multimediale, slide presentate a lezione, articoli scientifici, report tecnici) su cui lo studente deve prepararsi per la verifica dell'apprendimento. I contenuti "facoltativi" sono appositamente specificati.

Chi desidera approfondire gli argomenti, anche in riferimento alle necessità di ricerca e professionale, può consultare i testi messi a disposizione dal Prof. Soliani, disponibile in rete all'indirizzo http://www.dsa.unipr.it/soliani/soliani.html (in italiano) anche pubbliciati da diversi editori come questo: Soliani 2015. Statistica di base. PICCIN (680 pp).

Un testo più sintetico e recente in cui sono descritti i contenuti trattati nel corso è

Michael C. Whitlock Dolph Schluter
Analisi statistica dei dati biologici
Seconda edizione italiana condotta sulla terza edizione americana 2022 Zanichelli

Il programma include nozioni che lo studente potrà applicare anche nel corso a scelta "Coding in R for data analysis", la cui frequenza è fortemente consigliata

Verifica dell'apprendimento

L'esame consiste in una verifica orale sui contenuti del corso secondo le modalità di un colloquio tra Docente ed esaminando/a di durata approssimativa di venti-trenta minuti. All'inizio della prova lo studente/studentessa può presentare un argomento a scelta tra quelli trattati nel corso. L'argomento a scelta va comunicato al docente al momento dell'iscrizione all'appello. Nella verifica saranno valutate le competenze acquisite riguardo agli argomenti del Corso e alla capacità di discutere criticamente i casi studio illustrati a lezione.
In particolare, gli indicatori (caratteristiche accertate) di valutazione della prova sono:
- Capacità di utilizzare e collegare le conoscenze utili alla corretta costruzione di esperimenti e all'analisi dei dati biologici (50 %);
- Capacità di discutere e approfondire gli argomenti sopra citati mostrando padronanza del linguaggio scientifico (50%)
Il voto è espresso in trentesimi. L'esame è superato con la votazione di almeno 18/30 (preparazione ragionevolmente sufficiente sia in termini di conoscenze sia di adeguatezza del linguaggio). Per conseguire il voto massimo (30/30 e lode), lo studente deve dimostrare di aver acquisito una conoscenza eccellente di tutti gli argomenti trattati ed essere in grado di raccordarli in modo logico e coerente mostrando ottime capacità espositive.
Gli esami orali si svolgono al termine dell'insegnamento e nell’arco del calendario didattico dell’offerta formativa e per ogni appello lo/a studente/essa che intenda sostenerlo dovrà iscriversi utilizzando la Piattaforma EsseTre. Non sono previste valutazioni intermedie.
Gli esami potrebbero essere svolti in presenza o a distanza a seconda dell'evoluzione della situazione pandemica

Risultati attesi

Conoscenza e capacità di comprensione:
- descrivere le principali tecniche statistiche e i principi di disegno sperimentali applicate
- comprendere le motivazioni per cui sono applicate negli ambiti di attività del biologo.

Conoscenza e capacità di comprensione applicate:
- comprendere le procedure statistiche descritte nei testi e nelle pubblicazioni tecnico/ scientifiche.
- padroneggiare le tecniche statistiche e di disegno sperimentale per applicarli alla propria attività professionale e di ricerca.

Autonomia di giudizio
- identificare i punti di forza e di debolezza delle procedure apprese
- valutare e interpretare di dati sperimentali di laboratorio/campo in modo autonomo

Abilità comunicative
- capacità di presentare e spiegare i risultati di analisi statistici

Capacità di apprendimento
- sapere identificare tecniche non affrontate nel corso potenzialmente adatte per analizzare i problemi specifici di singoli campi della biologia.