Nuova ricerca

Elisa BERGAMI

Ricercatore t.d. art. 24 c. 3 lett. B
Dipartimento di Scienze della Vita sede ex-Biologia

Insegnamento: Introduzione all'analisi di dati biologici

Biotecnologie mediche (Offerta formativa 2024)

Obiettivi formativi

Il corso vuole fornire la capacità di utilizzare uno strumento informatico per analizzare i dati biologici in forma quantitativa. Lo strumento è il linguaggio R per la statistica e, in generale, per l’elaborazione dei dati e dei segnali (http://www.r-project.org/). Lo studente acquisisce i concetti fondamentali sugli oggetti informatici che supportano la strutturazione dei dati e impara a estrarre l’informazione quantitativa, sia elementare sia avanzata, che essi contengono. Il processo didattico ha natura introduttiva e mira a mettere lo studente in grado di decidere le funzioni di R da utilizzare in uno script per eseguire il disegno sperimentale, la formattazione dei dati e l’applicazione dei metodi computazionali più adeguati alla loro analisi e la presentazione dei risultati.
Per una più completa comprensione degli obiettivi formativi, si rimanda alla lettura dei risultati di apprendimento attesi a seguito dello svolgimento del presente percorso formativo.

Prerequisiti

L'insegnamento richiede conoscenze di base di Matematica, Informatica e Statistica applicate alla biologia, chimica organica, biologia della cellula, biochimica, biologia molecolare, genetica. In particolare, gli studenti dovranno essere in grado di comprendere i principi per la descrizione e la risoluzione di un problema attraverso il formalismo matematico.

Programma del corso

La scansione dei contenuti per CFU è da intendere come puramente indicativa. Essa può infatti subire modifiche nel corso dell’insegnamento alla luce dei feedback degli studenti e delle studentesse.

0.5 CFU (4 ore):
Caratteristiche di base del linguaggio R. Installazione di R e R Studio. Installazione e caricamento dei pacchetti.

0.5 CFU (4 ore):
Gli oggetti di R per la gestione dei dati: scalare, vettore, matrice, array, data frame, lista. Input e output di dati. Struttura e programmazione di uno script. Sintassi delle funzioni di R.

0.5 CFU (4 ore):
Metodi di analisi (test statistici, regressioni, classificatori).

0.5 CFU (4 ore):
Proprietà e funzioni per la grafica elementare e avanzata. Applicazioni ed esempi operativi.

Metodi didattici

Il corso integra acquisizione di abilità informatiche e conoscenze statistiche e mette in grado lo studente di analizzare e raggiungere conclusioni quantitative su analisi di dati sperimentali in forma avanzata. Il metodo è basato su lezioni in cui si alternano problemi di analisi dati con tecniche software semplici e avanzate per estrarre l’informazione significativa dai dati per mezzo del calcolo con R. Aspetto fondamentale è l’impiego del proprio PC portatile in aula da parte di ogni singolo studente durante la lezione; ciò permette allo studente la verifica del suo grado di comprensione e al docente capire il livello di difficoltà sperimentato dagli studenti nel passaggio dalla teoria all'applicazione. Gli studenti hanno a disposizione, all’inizio del corso, le dispense relative agli argomenti che verranno trattati. In aggiunta il docente mette a disposizione gli script realizzati con le soluzioni dei problemi applicativi affrontati durante la lezione.
La frequenza alle lezioni frontali in presenza (teoria, esempi applicativi ed esercitazioni) non è obbligatoria.
L’insegnamento è erogato in lingua italiana.

Testi di riferimento

1. Dispense fornite dal docente e file di script degli esercizi
2. An Introduction to R (https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf)

Sulla pagina del Portale MOODLE relativa all’insegnamento di Analisi dei dati biologici sono disponibili già all'inizio del corso (e nel rispetto dei diritti d’autore) le dispense utilizzate dal docente nel corso delle lezioni frontali, assieme a materiale bibliografico, a scripts in R e a set di dati di esempio.

Verifica dell'apprendimento

L'esame si svolgerà al termine dell’insegnamento secondo il calendario ufficiale degli appelli d’esame. La prova è orale. La durata del colloquio è di circa 15 minuti durante il quale allo studente è chiesto di illustrare l’analisi di un set di dati assegnato alla fine del corso.
Il colloquio è finalizzato a valutare:
- le conoscenze e le capacità di comprensione;
- l’applicazione di conoscenze e capacità di comprensione;
- l’autonomia di giudizio.
I parametri di valutazione sono costituiti da:
- l’applicazione di conoscenze e capacità di comprensione (80%);
- l’autonomia di giudizio (15%);
- le abilità comunicative (5%).
Il voto finale dell’esame sarà comunicato alla fine del colloquio; la verbalizzazione avverrà tramite Esse3.

Risultati attesi

1) Conoscenza e capacità di comprensione
al termine del Corso, si auspica che lo/a studente/essa sia in grado di:
a) applicare metodi matematici, statistici e informatici all'analisi dei dati biologici;
b) utilizzare il linguaggio R per risolvere numericamente problemi di analisi dei dati.
2) Capacità di applicare
a) strumenti logico-matematici, statistici, informatici e fisici;
b) metodologie informatiche per l'analisi dei dati biologici.
c) metodologie e applicazioni strumentali ad ampio spettro per la ricerca biotecnologica.
3) Autonomia di giudizio
a) valutare e interpretare i dati sperimentali;
b) riorganizzare le conoscenze apprese ed implementare la propria capacità di valutazione critica ed autonoma di quanto appreso;
c) sviluppare consapevolezza delle problematiche sperimentali.
4) Abilità comunicative
a) esprimere in modo corretto e logico le proprie conoscenze, riconoscendo l’argomento richiesto e rispondendo in modo puntuale e completo alle domande d’esame.
b) comunicare in lingua italiana e straniera (inglese) scritta e/o orale con linguaggio scientifico appropriato;
c) elaborare e presentare dati sperimentali
5) Capacità di apprendimento
a) sviluppare autonomia nello studio e nel lavoro di laboratorio;
b) saper consultare materiale bibliografico e banche dati e altre risorse della rete;
c) apprendere strumenti conoscitivi di base per l'aggiornamento continuo delle conoscenze.