|
Alessandro ULRICI
Professore Ordinario Dipartimento di Scienze della Vita sede ex-Agraria
|
Insegnamento: Chemiometria per il controllo degli alimenti
Controllo e sicurezza degli alimenti (RE) (Offerta formativa 2024)
Obiettivi formativi
Il corso si propone di fornire le conoscenze teoriche e pratiche relative alle principali tecniche di disegno sperimentale e di analisi multivariata dei dati, sia a fini esplorativi che per la costruzione di modelli di calibrazione e di classificazione, con l’obiettivo di mettere lo studente in grado di applicare le principali tecniche chemiometriche all'analisi di dati chimici, tecnologici e sensoriali acquisiti su matrici alimentari.
Per una più completa comprensione degli obiettivi formativi, si rimanda alla lettura dei risultati di apprendimento attesi a seguito dello svolgimento del presente percorso formativo.
Prerequisiti
Conoscenze acquisite nella laurea di primo livello (triennale) in Chimica Generale, Chimica Analitica, Matematica.
È inoltre suggerita la conoscenza dei seguenti argomenti di statistica di base: statistica descrittiva, distribuzioni, limiti di confidenza, test di significatività, ANOVA, carte di controllo, regressione unilineare e multilineare, nonché di fogli di calcolo (ad es. Microsoft Excel) per l’esecuzione di analisi statistiche di base. Per coloro i quali ritenessero di non avere una preparazione sufficiente su questi argomenti si segnala che presso il Dipartimento di Scienze della Vita è presente in offerta formativa il corso opzionale di Elaborazione dei dati sperimentali.
Programma del corso
La scansione dei contenuti per CFU è da intendere come indicativa. Essa può infatti subire modifiche nel corso dell’insegnamento alla luce dei feedback di studentesse e studenti.
- Introduzione agli argomenti del corso: definizione di analisi multivariata e di Chemiometria ; l'approccio multivariato per l'analisi della struttura dei dati e per l'estrazione dell'informazione utile (0,5 CFU).
- Disegno Sperimentale. Disegni fattoriali a 2 e 3 livelli, disegno centrale composito, Dohelert. Disegni di screening: FFD, Plackett-Burmann. Disegni in domini constrained: D-Optimal. Disegni di miscela. Hill climbing techniques: steepest ascent, simplex (1,5 CFU).
- Esercitazioni con MS-Excel sui metodi di disegno sperimentale (1 CFU).
- Analisi esplorativa dei dati. Struttura, variabilità e informazione. Clustering: distanza e similarità; metodi di linkage; clustering agglomerativo; dendrogrammi. Pretrattamento dei dati per colonna: mean centering, autoscaling. Analisi delle componenti principali (PCA): interpretazione geometrica delle PC. Score, loading, percentuale di varianza spiegata. Scree plot, grafici di score e loading, biplot, grafici Q vs T^2. PCA su segnali; pretrattamenti per riga: SNV, smoothing, derivate, detrending, MSC. Carte di controllo multivariate (Q e T^2); contribution plots. Carte di controllo multivariate. Definizione matriciale di PCA; ortogonalità dei vettori degli score ed ortonormalità dei vettori dei loading; autovalori e percentuale di varianza spiegata. Esempi di applicazioni reali di Clustering e PCA a problematiche in ambito agro-alimentare (2 CFU).
- Esercitazioni con software per analisi chemiometrica (Eigenvector PLS-Toolbox) su Clustering e PCA (1 CFU).
- Calibrazione e classificazione multivariata: dalla regressione multilineare (MLR) ai metodi di calibrazione basati sulle variabili latenti; Principal Component Regression (PCR) e Partial Least Squares (PLS). Selezione del numero di LV: overfitting e underfitting. Crossvalidazione e validazione esterna. Statistiche RMSE e R^2; confronto dei parametri calcolati in calibrazione, crossvalidazione e predizione. Esempi di applicazioni dei modelli di calibrazione multivariata a problematiche in ambito agro-alimentare. Analogie e differenze tra calibrazione e classificazione; modellamento di classe ed analisi discriminante: principi di funzionamento degli algoritmi SIMCA e PLS-DA. Modelli e soglie di classe. Principali parametri statistici per la valutazione dei modelli di classificazione: sensibilità, specificità ed efficienza in classificazione. Esempi di applicazioni dei modelli di classificazione multivariata a problematiche in ambito agro-alimentare (1 CFU).
- Esercitazioni con software per analisi chemiometrica (Eigenvector PLS-Toolbox)su calibrazione e classificazione multivariata (1 CFU).
Metodi didattici
L'insegnamento si svolge in presenza ed è erogato in lingua italiana. La frequenza non è obbligatoria ma è consigliata, in particolare per le esercitazioni al computer.
I metodi didattici comprendono:
- lezioni frontali in aula (40 ore, 5 CFU), che includono discussioni guidate su aspetti relativi alla pianificazione degli esperimenti ed all’analisi multivariata dei dati sperimentali, nonché esempi di applicazioni delle tecniche chemiometriche a problematiche in ambito agro-alimentare;
- esercitazioni al computer (24 ore, 3 CFU) su set di dati sperimentali in ambito agro-alimentare mediante software per l’analisi statistica dei dati (Microsoft Excel ed Eigenvector PLS-Toolbox); le esercitazioni si svolgono in aula informatica e prevedono una parte guidata dal docente ed una parte in cui gli studenti elaborano autonomamente i dati e si confrontano con il docente sulle problematiche incontrate e sui risultati ottenuti.
Testi di riferimento
Durante il corso verranno messe a disposizione sulla piattaforma Microsoft Teams le dispense delle lezioni frontali in lingua inglese e videoregistrazioni relative agli argomenti delle lezioni ed alle esercitazioni al computer.
Testi di consultazione:
- J.C.Miller and J.N. Miller "Statistics and Chemometrics for Analytical Chemistry" Ellis Horwood PTR Prentice Hall
- R.G. Brereton, "Chemometrics - Data Analysis for the Laboratory and Chemical Plant", WILEY
- P. Gemperline (ed.) "Practical Guide to Chemometrics" CRC Press
- T. Naes, T. Isaksson, T. Fearn, T. Davies "A user-friendly guide to Multivariate Calibration and Classification" NIR Publications
Verifica dell'apprendimento
Al termine dell’insegnamento è previsto un esame orale che comprende anche una prova pratica di elaborazione dei dati al computer mediante i software utilizzati durante l’insegnamento stesso. L’esame si svolgerà nell’arco del calendario didattico dell’offerta formativa e lo/la studente/studentessa che vorrà sostenerlo concorderà la data con il docente contattandolo via email.
Il colloquio, della durata di 40 minuti circa, sarà semi-strutturato e partirà da una richiesta di esporre in forma sintetica gli argomenti del tirocinio di tesi in corso di svolgimento o, nel caso in cui questo non sia ancora iniziato, della tesi/tirocinio di laurea triennale. Partendo da tali argomenti il docente porrà quindi un problema simulato, per il quale sia necessario ricorrere ad uno o più metodi chemiometrici tra quelli descritti nel corso. Una volta identificato l’approccio corretto si procederà quindi a discuterne sia gli aspetti pratici che quelli teorici, al fine di valutare la capacità di descrivere ed applicare correttamente le tecniche chemiometriche, di sapere analizzare e valutare correttamente i risultati, e di pianificare correttamente l’intero processo di elaborazione. Al colloquio seguirà quindi una prova pratica al computer della durata di 20 minuti circa; i software utilizzati nelle esercitazioni saranno applicati a un dataset sperimentale il più possibile attinente alle problematiche precedentemente discusse.
Gli indicatori (caratteristiche accertate) di valutazione della prova orale sono:
- capacità di utilizzare e collegare le conoscenze (30%)
- capacità di discutere e approfondire gli argomenti (40%)
- padronanza del linguaggio scientifico (30%)
La valutazione è espressa in trentesimi e il punteggio finale rifletterà in maniera progressiva il diverso raggiungimento degli indicatori di valutazione.
Risultati attesi
Conoscenza e capacità di comprensione:
- descrivere e discutere le principali tecniche di disegno sperimentale e di analisi multivariata dei dati nello specifico settore professionale delle scienze e tecnologie degli alimenti;
- illustrare l’uso di software per l’elaborazione chemiometrica di dataset sperimentali relativi a problematiche in campo alimentare.
Conoscenza e capacità di comprensione applicate:
- utilizzare autonomamente alcuni tra i più diffusi software per l’elaborazione dei dati con tecniche multivariate;
- padroneggiare i principali metodi di disegno sperimentale e di analisi multivariata dei dati.
Autonomia di giudizio:
- determinare autonomamente le strategie di analisi dei dati più opportune per la risoluzione di problemi comuni nell'industria alimentare, anche correlando competenze trasversali inerenti le proprietà chimiche, fisiche e tecnologiche gli alimenti, le condizioni di processo e le tecniche analitiche.
Abilità comunicative:
- comunicare in modo chiaro le conoscenze teoriche acquisite;
- utilizzare in maniera corretta e appropriata linguaggio, concetti e modelli acquisiti per discutere le strategie più opportune per la pianificazione degli esperimenti e per l’analisi dei dati;
- descrivere e giustificare i risultati ottenuti mediante le tecniche chemiometriche utilizzate.
Capacità di apprendimento:
- acquisire la terminologia e la metodologia appropriata per il reperimento delle informazioni utili a provvedere autonomamente al proprio aggiornamento, con particolare attenzione agli strumenti informatici per l’elaborazione dei dati.