TEORIE, MODELLI E TECNICHE INFORMATICHE E DI ANALISI DEI DATI
Anno accademico 2015/2016 - 2° anno
Docenti
SSD
Organizzazione didattica: 150 ore d'impegno totale, 114 di studio individuale, 36 di lezione frontale
Semestre: 1°
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA: Cesare Garofalo
- INTRODUZIONE AL DATA MINING: Giovanni Giuffrida
SSD
- SPS/07 - Sociologia generale
- INF/01 - Informatica
Organizzazione didattica: 150 ore d'impegno totale, 114 di studio individuale, 36 di lezione frontale
Semestre: 1°
Obiettivi formativi
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATAGli obiettivi del modulo sono condurre lo studente:
-alla conoscenza del linguaggio R e ad auto-apprendere le sue potenzialità mediante l’uso delle risorse disponibili in internet.
-alla conoscenza di alcuni argomenti di statistica monovariata e multivariata mediante applicazioni con il linguaggio R. - INTRODUZIONE AL DATA MININGDare una panoramica delle tecniche di gestione di basi di dati e delle nozioni di data e text mining per derivare, in maniera automatica, pattern di interesse. Negli ultimi anni queste tecniche si sono via via consolidate per l’aumento imponente della quantità di dati digitali raccolti in seguito al tracciamento elettronico delle attività che svolgiamo abitualmente: acquisti online, attività sui social media, accesso a online news, etc. Analisi accurate di questi dati permettono di scoprire fenomeni sociali di sicuro interesse per gli scienziati sociali.
Prerequisiti richiesti
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
nessuno
Frequenza lezioni
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Fortemente consigliata
Contenuti del corso
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Il corso prevede la trattazione di:
- vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti in R;
-operazioni di lettura e scrittura su file esterni in R;
-rappresentazioni grafiche dei dati in R;
-programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi -statistica univariata e bivariata con R.
-correlazione e regressione lineare con R.
-analisi delle componenti principali con R.
-cluster analysis con R.
- INTRODUZIONE AL DATA MINING
Lo studente imparerà alcune delle tecniche
di Data Mining orientate all’estrazione
di informazione rilevante a partire da grandi masse di dati strutturati.
Particolare attenzione verrà posta alle tecniche di classificazione di dati
tramite alberi binari e agli algoritmi associativi basati su regole. Si intende dare una panoramica delle
tecniche informatiche e degli algoritmi di analisi di basi di dati di grandi
dimensioni al fine di scoprire correlazioni esistenti tra i dati. Negli ultimi
anni queste tecniche si sono via via consolidate per l’aumento imponente della
quantità di dati raccolti in seguito al tracciamento elettronico delle attività
che svolgiamo abitualmente: acquisti al supermercato, attività sui social media
(quali Facebook), accesso a news su Internet, emails, solo per fare qualche
esempio, generano flussi enormi di dati. Analisi accurate di questi dati
permettono di scoprire fenomeni sociali di sicuro interesse per gli scienziati
sociali. Si studieranno sia tecniche di analisi di dati strutturati (Data
Mining Algorithms) che dati non strutturati (Text Mining algorithms).
Testi di riferimento
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Testi adottati:
- Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo
- Michael J. Crawley - The R Book, 2nd Edition. Casa Edistrice Wiley
Letture consigliate:- Brian Everitt, Torsten Hothorn - An Introduction to Applied Multivariate Analysis with R. Springer. 2011
- Yanchang Zhao, Yonghua Cen - Data Mining Applications With R. Academic Press. 2013
- Espa G., Micciolo R. - Problemi ed esperimenti di statistica con R. Apogeo, 2008.
- Iacus S., Masarotto G. - Laboratorio di statistica con R. McGraw Hill Companies, 2007.
- Paganoni A., Ieva F., Vitelli V. - Laboratorio di statistica con R. Eserciziario. Pearson, 2012.
- Matloff N. - The Art of R Programming. No Starch Press, 2011.
- Torgo L. - Data Mining with R. Learning with Case Studies. Chapman & Hall/CRC, 2011.
- INTRODUZIONE AL DATA MININGMateriale fornito dal docente
Programmazione del corso
TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA | |||
Argomenti | Riferimenti testi | ||
---|---|---|---|
1 | sintassi di base del linguaggio R: vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti; | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo | |
2 | operazioni di lettura e scrittura su file esterni | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo | |
3 | rappresentazioni grafiche dei dati | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo | |
4 | programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi (if, ifelse, for, while, break, repeat, next) | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
prova pratica al computer