TEORIE, MODELLI E TECNICHE INFORMATICHE E DI ANALISI DEI DATI
Anno accademico 2016/2017 - 2° anno
Docenti
SSD
Semestre: 2°
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA: Cesare Garofalo
- INTRODUZIONE AL DATA MINING: Giovanni Giuffrida
SSD
- SPS/07 - Sociologia generale
- INF/01 - Informatica
Semestre: 2°
Obiettivi formativi
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATAGli obiettivi del modulo sono condurre lo studente:
-alla conoscenza del linguaggio R e ad auto-apprendere le sue potenzialità mediante l’uso delle risorse disponibili in internet.
-alla conoscenza di alcuni argomenti di statistica monovariata e multivariata mediante applicazioni con il linguaggio R. - INTRODUZIONE AL DATA MININGDare una panoramica delle tecniche di gestione di basi di dati e delle nozioni di data e text mining per derivare, in maniera automatica, pattern di interesse. Negli ultimi anni queste tecniche si sono via via consolidate per l’aumento imponente della quantità di dati digitali raccolti in seguito al tracciamento elettronico delle attività che svolgiamo abitualmente: acquisti online, attività sui social media, accesso a online news, etc. Analisi accurate di questi dati permettono di scoprire fenomeni sociali di sicuro interesse per gli scienziati sociali.
Prerequisiti richiesti
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
nessuno
Frequenza lezioni
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Fortemente consigliata
Contenuti del corso
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Il corso prevede la trattazione di:
- vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti in R;
-operazioni di lettura e scrittura su file esterni in R;
-rappresentazioni grafiche dei dati in R;
-programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi -statistica univariata e bivariata con R.
-correlazione e regressione lineare con R.
-analisi delle componenti principali con R.
-cluster analysis con R.
- INTRODUZIONE AL DATA MININGDati e informazione. Panoramica sui sistemi per la gestione di basi di dati. Modello relazionale dei dati. Introduzione a “Big Data”. Panoramica degli algoritmi di “data discovery”: alberi di classificazione, derivazione di regole e clustering ad esempio. Nozioni di “text mining” e “sentiment analysis”.
Testi di riferimento
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Testi adottati:
- Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo
- Michael J. Crawley - The R Book, 2nd Edition. Casa Edistrice Wiley
Letture consigliate:- Brian Everitt, Torsten Hothorn - An Introduction to Applied Multivariate Analysis with R. Springer. 2011
- Yanchang Zhao, Yonghua Cen - Data Mining Applications With R. Academic Press. 2013
- Espa G., Micciolo R. - Problemi ed esperimenti di statistica con R. Apogeo, 2008.
- Iacus S., Masarotto G. - Laboratorio di statistica con R. McGraw Hill Companies, 2007.
- Paganoni A., Ieva F., Vitelli V. - Laboratorio di statistica con R. Eserciziario. Pearson, 2012.
- Matloff N. - The Art of R Programming. No Starch Press, 2011.
- Torgo L. - Data Mining with R. Learning with Case Studies. Chapman & Hall/CRC, 2011.
- INTRODUZIONE AL DATA MINING- Slides fornite dal docente
- Raccomandato: Informatica e Cultura dell’Informazione, Luca Mari, Giacomo Bonanno e Donatella Sciuto
- Raccomandato: Il computer come macroscopio, Davide Bennato, Franco Angeli editore
- Opzionale: Big data. Una rivoluzione che trasformerà il nostro modo di vivere e già minaccia la nostra libertà. Viktor Mayer-Schönberger, Kenneth N. Cukier e R. Merlini
- Opzionale: Introduction to Computational Social Science, Principle and Applications. Claudio Cioffi-Revilla (In inglese)
Programmazione del corso
TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA | |||
Argomenti | Riferimenti testi | ||
---|---|---|---|
1 | sintassi di base del linguaggio R: vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti; | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo | |
2 | operazioni di lettura e scrittura su file esterni | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo | |
3 | rappresentazioni grafiche dei dati | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo | |
4 | programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi (if, ifelse, for, while, break, repeat, next) | Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
prova pratica al computer