Foto personale

Pagina personale di Rita CUCCHIARA

Dipartimento di Ingegneria "Enzo Ferrari"

Contenuti Insegnamento: Visione Artificiale e Lab.

Corso di studio: Ingegneria Informatica (D.M.270/04) (offerta formativa anno 2017)
  • CFU: 9
  • SSD: ING-INF/05

Contenuti Insegnamento: Visione artificiale

Corso di studio: Ingegneria Informatica (D.M.270/04) (offerta formativa anno 2017)
  • CFU: 6
  • SSD: ING-INF/05

Obiettivi formativi

La Visione Artificiale (VA) studia come i computer possono percepire e comprendere il mondo attraverso immagini e video. Sviluppa sistemi che basati sull'elaborazione delle immagini, la analisi del contenuto video, la ricostruzione da 2D a 3D. In senso lato, è la parte visiva dell'Intelligenza Artificiale e il più importante componente dei sistemi cognitivi. Il “Cognitive Computing” e’ una disciplina emergente che integra l’AI e la “signal processing”; sfrutta dati sensoriali (immagini, audio, suono, dati di profondità e altri dati sensoriali) per estrarre conoscenza ed inferenze in molti ambiti, dall'interazione uomo-macchina, alla robotica e big data. Il corso fornisce i fondamenti della VA: l’acquisizione, l’image processing ed analysis, la geometria 3D, la stima del movimento e la classificazione. Il corso sarà principalmente un corso di laboratorio con progetti in Python e con Librerie (OpenCv e Tensorflow per Deep Learning) e sensori (fotocamere, eyetracker…). È un corso di ingegneria: fornisce strumenti per la progettazione di sistemi cognitivi basati sulla visione. Nel corso si proporranno progetti in diversi contesti: video-sorveglianza, guida autonoma, HMI, robotica, interpretazione del comportamento umano (viso, riconoscimento e tracciamento del corpo). La teoria dei sistemi cognitivi, integrando paradigmi di visione con quelli più ampi del calcolo cognitivo delle neuroscienze, e dell'apprendimento automatico permetterà di comprendere le tendenze future dell'AI, come progettare e implementare sistemi software capaci di imparare, interagire e collaborare con gli esseri umani. Durante il corso discuteremo alcuni progetti realizzati in grandi aziende come Google, IBM, Panasonic, Facebook e Amazon; inoltre riceveremo presentazioni di aziende emergenti che lavorano nella VA e piattaforme cognitive e richiedono nuovi saperi in queste discipline.

Prerequisiti

Sono estremamente consigliati i corsi di Multimedia Data processing e di machine learning e pattern recognition

Programma del corso

1.Introduction: Computer Vision vs Computer graphics; Cognitive computing and Artificial intelligence; history; the market, applications, future trends. 2Image processing: image, video, resolution; histograms; color and other spaces; compositing and matting; OpenCV labs. linear operators; binarization with Otsu and adaptive thresholding; Noise; correlation and convolution; smoothing, Gaussian, median, bilateral filtering, deblurring; edge detection; Canny; lab; border tracing, active contours; Humans Perceptive systems; attention and saliency; saliency detection with deep learning; pixel adiacency, labeling, morphology, distance transform; region segmentation, graph cut; lab for robotic manipulation; 3.Image formation,: the pinhole model, 2D and 3D isometries, similarities, affine and projective transformation; mosaics. dstortion; calibration tools; stereo vision and 3D; labs. 4.Human and cognitive vision; cognitive computing: philosophy, psychology, gestalt; neuroscience and computer science; D.Marr computational vision;. The brain; pathways in the cortex; Gabor filters; detection and recognition; neural networks trends for recognition. Integration with natural language processing (NLP); cognitive systems for HMI; adaptive reasoning. 5.Identification, detection, classification: performance evaluation, NCC for template matching; Machine Vision, standards in label reading; Shapes and Hough transform, line and circle recognition, GHT; labs; features, Hog for people detection; Faces VJ: CNN for detection of road signs, DL for autonomous driving; labs. Harris, Sift detector, Bag of words; lab of image retrieval. 6.Motion analysis: video segmentation; motion field; optical flow; LKT; affine motion; Motion segmentation with static camera, MoG, Sakbot, shadow analysis; tracking; NCC, Kalman; Particle filtering; multiple target tracking; re-id; 7.Applications to Surveillance big data and biometry; fingerprint; face, iris detection; applications.

Testi di riferimento

-slides and papers from CVPR; NIPS; ICCV; TPAMI - D. Fosith: Computer Vision

Metodi Didattici

teoria con slide letture di libri e di paper scientifici laboratori in aula con librerie opensourse progetti di gruppo presentazioni e discussioni con aziende

Verifica dell'apprendimento

L'esame consiste in una prova orale, con domande teoriche e presentazione del risultatio dei progetti e dei labratori sciluppati durante il corso

Risultati attesi

- developing vision systems - designing and impelemneting cognitive systems - providing software applications in computer vision for robotics, autonomous driving, video and image big data analysis, human -machine - interaction