TEORIE, MODELLI E TECNICHE INFORMATICHE E DI ANALISI DEI DATI
Anno accademico 2017/2018 - 2° anno- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA: Cesare Garofalo
- INTRODUZIONE AL DATA MINING: Giovanni Giuffrida
SSD
- SPS/07 - Sociologia generale
- INF/01 - Informatica
Semestre: 2°
Prerequisiti richiesti
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Corso di statistica di base
- INTRODUZIONE AL DATA MINING
Conoscenze di base di informatica
Frequenza lezioni
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Praticamente obbligatoria.
- INTRODUZIONE AL DATA MINING
libera
Contenuti del corso
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Il corso si focalizzerà sullo studio dell’analisi monovariata, bivariata e multivariata utilizzando il linguaggio R, ossia un ambiente open source per la gestione dei dati, l’analisi statistica, la produzione di grafici e, più in generale, per l’uso di moltissimi metodi formali (Networks Analysis, Time Series Analysis, Differential Equations, Machine Learning, Multivariate Statistics, ecc.).
Il corso prevede la trattazione di:
1) nozioni basilari di matematica e logica propedeutiche alla programmazione informatica;
2) operazioni su vettori, matrici, fattori, liste, tabelle, data frame, mediante il linguaggio R;
3) operazioni di lettura e scrittura su file esterni mediante in linguaggio R;
4) rappresentazioni grafiche dei dati mediante il linguaggio R;
5) programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e
costrutti iterativi (if, ifelse, for, while, break, repeat, next);
6) statistica descrittiva univariata e bivariata mediante il linguaggio R;
7) correlazione e regressione lineare mediante il linguaggio R;
8) analisi delle componenti principali mediante il linguaggio R;
9) cluster analysis mediante il linguaggio R;
10) network analysis mediante il linguaggio R;
- INTRODUZIONE AL DATA MINING
SI introduce il tema del dato e dell’informazione. SI passa poi alle tecniche relazionali di archiviazione e recupero del dato. Si discute dei “data base management systems” e del sistema delle transazioni che garantisce la coerenza del dato. Si introduce anche l’algebra relazionale che rappresenta la logica per il recupero dell’informazione dalle basi di dati relazionali e che rappresenta la base dei linguaggi di interrogazione SQL
Testi di riferimento
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Dispense del docente
- INTRODUZIONE AL DATA MINING
- Opzionale: Introduction to Computational Social Science, Principle and Applications. Claudio Cioffi-Revilla (In inglese)
- Opzionale: Big data. Una rivoluzione che trasformerà il nostro modo di vivere e già minaccia la nostra libertà. Viktor Mayer-Schönberger, Kenneth N. Cukier e R. Merlini
Programmazione del corso
TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA | |||
Argomenti | Riferimenti testi | ||
---|---|---|---|
1 | 1) nozioni basilari di matematica e logica propedeutiche alla programmazione informatica; | Dispense del cocente | |
2 | 2) operazioni su vettori, matrici, fattori, liste, tabelle, data frame, mediante il linguaggio R; | Dispense del cocente | |
3 | 3) operazioni di lettura e scrittura su file esterni mediante in linguaggio R; | Dispense del cocente | |
4 | 4) rappresentazioni grafiche dei dati mediante il linguaggio R; | Dispense del cocente | |
5 | 5) programmazione con R: definizioni di nuove funzioni, costrutti di controllo, costrutti condizionali e costrutti iterativi (if, ifelse, for, while, break, repeat, next); | Dispense del cocente | |
6 | 6) statistica descrittiva univariata e bivariata mediante il linguaggio R; | Dispense del cocente | |
7 | 7) correlazione e regressione lineare mediante il linguaggio R; | Dispense del cocente | |
8 | 8) analisi delle componenti principali mediante il linguaggio R; | Dispense del cocente | |
9 | 9) cluster analysis mediante il linguaggio R; | Dispense del cocente | |
10 | 10) network analysis mediante il linguaggio R; | Dispense del cocente |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
prova pratica al computer
Esempi di domande e/o esercizi frequenti
- TECNICHE DI ANALISI MONOVARIATA E MULTIVARIATA
Uso delle funzioni di base principali di R.
Come si installano e si caricano i pacchetti in R.
Come si costruisce e si opera su un vettore, una matrice, un dataframe in R.
Come si costrisce un grafico in R.
Come si costruisce una funzione in R.
Come si svolge l’analisi di correlazione e regressione in R.