TEORIE, MODELLI E TECNICHE INFORMATICHE E DI ANALISI DEI DATI

Anno accademico 2016/2017 - 2° anno
Docenti Crediti: 6
SSD
  • SPS/07 - Sociologia generale
  • INF/01 - Informatica
Organizzazione didattica: 150 ore d'impegno totale, 114 di studio individuale, 36 di lezione frontale
Semestre:

Obiettivi formativi

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
    Gli obiettivi del modulo sono condurre lo studente:
    -alla conoscenza del linguaggio R e ad auto-apprendere le sue potenzialità mediante l’uso delle risorse disponibili in internet.
    -alla conoscenza di alcuni argomenti di statistica monovariata e multivariata mediante applicazioni con il linguaggio R.
  • INTRODUZIONE AL DATA MINING
    Dare una panoramica delle tecniche di gestione di basi di dati e delle nozioni di data e text mining per derivare, in maniera automatica, pattern di interesse. Negli ultimi anni queste tecniche si sono via via consolidate per l’aumento imponente della quantità di dati digitali raccolti in seguito al tracciamento elettronico delle attività che svolgiamo abitualmente: acquisti online, attività sui social media, accesso a online news, etc. Analisi accurate di questi dati permettono di scoprire fenomeni sociali di sicuro interesse per gli scienziati sociali.

Prerequisiti richiesti

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    nessuno


Frequenza lezioni

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Fortemente consigliata


Contenuti del corso

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Il corso prevede la trattazione di:

    - vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti in R;

    -operazioni di lettura e scrittura su file esterni in R;

    -rappresentazioni grafiche dei dati in R;

    -programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi -statistica univariata e bivariata con R.

    -correlazione e regressione lineare con R.

    -analisi delle componenti principali con R.

    -cluster analysis con R.

  • INTRODUZIONE AL DATA MINING
    Dati e informazione. Panoramica sui sistemi per la gestione di basi di dati. Modello relazionale dei dati. Introduzione a “Big Data”. Panoramica degli algoritmi di “data discovery”: alberi di classificazione, derivazione di regole e clustering ad esempio. Nozioni di “text mining” e “sentiment analysis”.

Testi di riferimento

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    Testi adottati:

    1. Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo
    2. Michael J. Crawley - The R Book, 2nd Edition. Casa Edistrice Wiley


    Letture consigliate:

    1. Brian Everitt, Torsten Hothorn - An Introduction to Applied Multivariate Analysis with R. Springer. 2011
    2. Yanchang Zhao, Yonghua Cen - Data Mining Applications With R. Academic Press. 2013
    3. Espa G., Micciolo R. - Problemi ed esperimenti di statistica con R. Apogeo, 2008.
    4. Iacus S., Masarotto G. - Laboratorio di statistica con R. McGraw Hill Companies, 2007.
    5. Paganoni A., Ieva F., Vitelli V. - Laboratorio di statistica con R. Eserciziario. Pearson, 2012.
    6. Matloff N. - The Art of R Programming. No Starch Press, 2011.
    7. Torgo L. - Data Mining with R. Learning with Case Studies. Chapman & Hall/CRC, 2011.
  • INTRODUZIONE AL DATA MINING
    - Slides fornite dal docente
    - Raccomandato: Informatica e Cultura dell’Informazione, Luca Mari, Giacomo Bonanno e Donatella Sciuto
    - Raccomandato: Il computer come macroscopio, Davide Bennato, Franco Angeli editore
    - Opzionale: Big data. Una rivoluzione che trasformerà il nostro modo di vivere e già minaccia la nostra libertà. Viktor Mayer-Schönberger, Kenneth N. Cukier e R. Merlini
    - Opzionale: Introduction to Computational Social Science, Principle and Applications. Claudio Cioffi-Revilla (In inglese)

Programmazione del corso

TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
 ArgomentiRiferimenti testi
1sintassi di base del linguaggio R: vettori, matrici, fattori, liste, tabelle, data frame, e le operazioni sui suddetti oggetti;Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 
2operazioni di lettura e scrittura su file esterniFranco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 
3rappresentazioni grafiche dei datiFranco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 
4programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi (if, ifelse, for, while, break, repeat, next)Franco Crivellari - Analisi statistica dei dati con R. Casa Editrice Apogeo 

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

  • TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA

    prova pratica al computer