|
Marina COCCHI
Professore Ordinario Dipartimento di Scienze Chimiche e Geologiche - Sede Dipartimento di Scienze Chimiche e Geologiche
|
Insegnamento: Chemiometria
Scienze chimiche (Offerta formativa 2023)
Obiettivi formativi
Il corso si propone di fornire gli elementi di base dell'analisi chemiometrica dei dati illustrando l'applicazione di tali metodiche nei seguenti contesti: ottimizzazione e disegno sperimentale; analisi esplorativa e statistica descrittiva; metodologie per il controllo di qualità di prodotto e processi industriali (QbD, PAT); gestione ed elaborazione dei dati da tecniche strumentali; aspetti applicativi dell'analisi di regressione e classificazione.
Al termine dell'insegnamento lo studente sarà in grado di:
- conoscere i metodi principali per l’analisi multivariata dei dati ad elevata dimensionalità e complessità e per la loro rappresentazione grafica;
- conoscere i principali contesti di applicazione della chemiometria nelle scienze sperimentali ed in ambito produttivo;
- riconoscere le diverse tipologie e struttura dei dati e le problematiche inerenti il preprocessing;
- saper utilizzare le principali metodologie di analisi multivariata dei dati nei contesti: analisi esplorativa, pianificazione degli esperimenti, classificazione e calibrazione multivariata.
- costruire modelli appropriati per l’analisi di insiemi di dati mediante esercitazioni pratiche svolte con tools commerciali e/o open source.
- validare e interpretare criticamente e validare i risultati ottenuti.
Per maggiore dettaglio sugli obiettivi formativi si rimanda alla sezione relativa ai risultati di apprendimento attesi.
Prerequisiti
Conoscenza della Chimica Generale e della Chimica Analitica per quanto concerne le basi del campionamento, incertezza di misura, una panoramica delle principali tecniche di analisi strumentali. Alcune nozioni di statistica univariata: concetto di distribuzione di una variabile, media, deviazione standard, correlazione tra coppie di variabili. Saper utilizzare un computer, un foglio elettronico e un editor di testo.
Programma del corso
Introduzione alle tecniche di Disegno Sperimentale e Ottimizzazione (1 CFU): disegni di esplorazione e screening (disegni fattoriali completi e frazionari, pluckett and burman design); disegni di ottimizzazione (disegni centrali compositi); disegni d-ottimali; disegni per lo studio di formulazioni. Cenni all'elaborazione delle superfici di risposta. Diagnostica dei modelli attraverso l'analisi dei residui, normal probability plots.
Analisis esplorativa dei dati (2 CFU): metodi esplorativi univariati (istogrammi di frequenza, box-plot, grafici a dispersione); metodi esplorativi multivariati, definizione significato e calcolo delle variabili latenti. Analisi delle componenti Principali, PCA (definizione, derivazione, applicazione), rappresentazione grafica (scores, loadings, biplot); Analisi di cluster. Pretrattamento di dati multivariati: variabili puntuali, segnali strumentali, immagini.
Introduzione ai metodi multivariati per il controllo di processo (1 CFU): carte di controllo multivariate; introduzione alla spettroscopia NIR e pretrattamenti di segnali NIR. Cenni alle tecniche spettroscopiche implementabili at/on/in-line in contesto PAT.
Modellamento Lineare (2 CFU)
Metodi di Regressione Uni e Multivariata: MLR, PCR e PLS. Calibrazione multivariata. Cenni ad alcuni metodi di ranking di variabili.
Introduzione ai metodi di classificazione: SIMCA, LDA, PLS-DA, differenze e contesto d'uso.
Ciascun argomento prevede l'integrazione con esercitazioni che prevedono l'analisi (e in qualche caso l'acquisizione) di data set legati a sperimentazione in ambito chimico. Softwares utilizzato: Open Office, PLS-Toolbox per MATLAB.
ORARIO DI RICEVIMENTO (Dip. Scienze Chimiche e Geologiche 1 Piano):
Martedi 12-13
Mercoledi 14-15
Curriculum: http://personale.unimore.it/AddressBook/curriculum/cocchi
Metodi didattici
Le lezioni ed esercitazioni si svolgeranno in presenza a meno di diverse indicazioni a causa della situazione sanitaria COVID19 che impongano l'erogazione a distanza. In tal caso saranno erogate mediante piattaforma teams in modalità sincrona.
Lezioni frontali con ausilio di presentazioni power points. Esercitazioni interattive con software chemiometrico. Esercitazioni condotte in autonomia dagli studenti su data set reali. Discussione sugli argomenti presentati a lezione. Commenti e correzione sui reports presentati dagli studenti sulle singole esercitazioni. Seminari e/o visite in azienda volti ad illustrare le applicazioni della chemiometria nel contesto industriale.
Testi di riferimento
-PLS toolbox Manual - Eigenvectors: www.eigenvector.com
-Several Tutorial papers suggested and furnished by the Teacher.
-K. Varmuza, P. Filzmoser, Introduction to multivariate statistical analysis in chemometrics, CRC press 2009. Print ISBN: 978-1-4200-5947-2 eBook ISBN:978-1-4200-5949-6
- Kim H. Esbensen, Brad Swarbrick, Frank Westad, Pat Whitcomb, Mark Anderson, Multivariate Data Analysis: An introduction to Multivariate Analysis, Process Analytical Technology and Quality by Design 6th Edition 2018. ISBN-13: 978-8269110401 ISBN-10: 826911040X.
Per approfondire:
- Trevor Hastie, Robert Tibshirani, Jerome Friedman, The elements of statistical learning. Data Mining, Inference, and Prediction. 2nd Ed. Springer Series in Statistics, Springer. Stanford, California 2008
- M. Forina Fondamenta di Chimica Analitica e-book:
www.sisnir.org/452/index.html (download at the bottom of the page)
- D.L. Massart and B. Vandeginste, Chemometrics: a textbook, Elsevier 1988, ISBN: 978-0-444-42660-4, www.sciencedirect.com/science/bookseries/09223487/23
Verifica dell'apprendimento
Verifiche in itinere: è richiesto di redigere una relazione per ciascuna esercitazione condotta in aula. Ciascuna relazione è valutata in una scala numerica da 0 a 10, secondo i criteri: organizzazione, linguaggio e capacità di sintesi (0-3); selezione dei metodi appropriate di analisi (0-2); corretta applicazione (0-2); capacità di descrivere ed interpretare i risultati (0-3). La valutazione non porta all'attribuzione di punteggio valido per la prova finale ma serve come idoneità a sostenere l'esame (media >= 6).
Verifca finale, è possibile scegliere tra due modalità:
1) allo studente è assegnato alla fine del corso un data set da elaborare con alcune delle metodologie utilizzate durante le esercitazioni, seguendo le richieste (obiettivi) indicati. E' richiesto quindi di effetuare una presentazione in formato elettronico e discussione orale dei dati elaborati in sede di prova di verifica finale; durante la discussione sono poste un paio di domande dal docente prendendo spunto dalla trattazione dello studente, che possono riguardare anche altri argomenti del corso non discussi in precedenza.
2) allo studente sono poste 3 domande ampie sulle tre parti base del programma (DoE, analisi esplorativa, modellamento) ed altre 2-3 domande su argomenti più speicifci volti a valutare la capacità di applicare le metodologie studiate.
Nell’attribuzione del punteggio della verifica finale si valuta: la corretta descrizione/scelta e discussione/applicazione dei metodi di elaborazione impiegati (30%); la capacità di applicare le conoscenze acquisite (30%); l'abilità comunicativa (10%), il livello delle conoscenze teoriche acquisite (30%).
La votazione finale è espressa in trentesimi con eventuale lode.
Agli studenti non frequentanti, che non avranno svolto le valutazioni in itinere, sono poste ulteriori domande volte ad accertare le loro conoscenze e capacità di giudizio nell’analisi di data sets.
Risultati attesi
Conoscenza comprensione
Lezioni, discussioni collegiali e studio del materiale didattico consentono di apprende gli elementi di base dell'analisi chemiometrica e sua applicazione a: ottimizzazione/disegno sperimentale; controllo di qualità di prodotto e processi (QbD, PAT); gestione di dati, segnali e immagini da tecniche ifenate; aspetti applicativi dell'analisi di regressione, classificazione, calibrazione multivariata.
Capacità di applicare conoscenza comprensione
Esercitazioni al computer, discussione collegiale dei risultati permettono di applicare le conoscenze acquisite e le metodiche per: i) progettare disegni sperimentale fattoriali, elaborare e interpretare superfici di risposta, individuare condizioni sperimentali ottimali; ii) effettuare analisi esplorativa di dati bidimensionali; iii) calcolare, rappresentare, interpretare e validare modelli di regressione e classificazione; iv) utilizzare software chemiometrico in MATLAB. I seminari e/o visite in azienda danno conoscenza delle tecniche non invasive e non distruttive per l’analisi di materiali, alimenti, dati ambientali e per monitoraggio di processo.
Autonomia giudizio
Le Relazioni scritte sulle esercitazioni danno capacità di discutere criticamente ed esporre i risultati ottenuti. Discussioni collegiali danno la capacità di suggerire metodi efficaci in funzione del problema posto e discutere i risultati ai fini dell’interpretazione chimica del problema.
Abilità communicative
Le relazioni scritte portano a redigere rapporti e presentare risultati in modo comprensibile a utenti inesperti. Le discussioni in aula e la prova finale esercitano la capacità di comunicare i risultati con lessico adeguato e utilizzando strumenti multimediali.
Capacità apprendimento
Le attività descritte consentono di sviluppare capacità di identificare le fonti bibliografiche e software efficaci per migliorare le conoscenze rispetto all’analisi dei dati e di approfondire in modo autonomo aspetti collaterali/sinergici.