Il corso copre le basi per comprendere e affrontare i problemi dell'Apprendimento Automatico e del Data Mining e più in generale le problematiche relative al processo di estrazione della conoscenza da basi di dati (KDD).

Oltre all'esposizione delle principali tematiche che caratterizzano l'apprendimento automatico (classificazione, clustering, estrazione di pattern ricorrenti) si vuole fornire allo studente una base di conoscenza di statistica e di teoria dell'informazione necessari per capire e utilizzare i fondamenti teorici di questi approcci.

Inoltre, si vogliono proporre alcune tecniche per affrontare l'analisi dei dati su grandi volumi di dati, quali le tecniche di pre-processing (pulizia dei dati, il campionamento, selezione delle dimensioni) e la validazione sui dati dei risultati dell'analisi e la loro interpretazione.

Infine si vuole proporre allo studente uno strumento di data mining quale ad esempio RapidMiner o SAS Enterprise Miner o Intelligent Miner di IBM e disponibile per Oracle, e alcune esperienze pratiche. In particolare si sperimenteranno alcuni algoritmi di analisi dei dati e apprendimento automatico disponibili pubblicamente e già implementati in Java (Suite di algoritmi WEKA).