STATISTICA SOCIALE
Anno accademico 2018/2019 - 1° annoCrediti: 9
SSD: SECS-S/05 - Statistica sociale
Organizzazione didattica: 225 ore d'impegno totale, 171 di studio individuale, 54 di lezione frontale
Semestre: 2°
Obiettivi formativi
Il corso ha l’obiettivo di fornire allo studente, strumenti di analisi delle fonti di dati istituzionali e non, per la costruzione di un data- base, tecniche di trasformazione dei dati, costruzione di indicatori compositi e modelli di analisi multivariata, tecniche ei piani di campionamento, test non parametrici più diffusi.Statistica descrittiva e inferenziale.
Modalità di svolgimento dell'insegnamento
Il corso affronta i principali argomenti relativi alla gestione di un’indagine statistica. Gli argomenti sono trattati seguendo il percorso logico delle fasi di un’attività di ricerca: la specificazione del problema, la raccolta dei dati, l’elaborazione, l’analisi dei dati e la valutazione dei risultati conseguiti secondo specifiche dimensioni d’analisi spazio-temporale.
Prerequisiti richiesti
Nozioni di base di statistica descrittiva e inferenziale.
Frequenza lezioni
Fortemente consigliata anche se non obbligatoria
Contenuti del corso
Il corso è suddiviso in tre moduli, con i seguenti contenuti:
Modulo 1 - Fonti e sistemi di indicatori. Strumenti per l’analisi territoriale dei dati
Le fonti delle informazioni statistiche. Modelli di rilevazione delle informazioni da fonti istituzionali. I sistemi statistici informativi. Procedure d’integrazione fra data-bases. Le trasformazioni dei dati. Classificazione tipologica di tassi, rapporti, numeri indici. La questione degli indicatori. Le tecniche di costruzione e di standardizzazione degli indicatori.
Modulo 2 - Piani di campionamento. Test d’ipotesi non parametrici
Piani di campionamento. Disegno di campionamento. Dimensioni campionarie. Errori di campionamento. Criteri di selezione dei campioni. Test su un campione: binomiale, χ2, Kolmogorov-Smirnov
Test su campioni a due misure dipendenti: McNemar, dei segni. Test su due campioni indipendenti: esatto di Fisher, χ2, della mediana, Wilcoxon-Mann-Whitney.
Modulo 3 - Modelli di analisi delle serie spazio-temporali. Cenni su strumenti di analisi multivariata.
Analisi delle serie temporali:
a. procedimento classico
b. procedimento moderno: modello di Box-Jenkins, tipologia dei processi stocastici: stazionari, invertibili, lineari, autoregressivi (AR), casuali o a media mobile (MA), modelli ARMA o ARIMA
Serie spazio-temporali. I principi e la logica dell’analisi multidimensionale e multivariata. I paradossi dell’analisi multivariata. La tipologia delle matrici.
Testi di riferimento
Per il modulo 1:
ISTAT (2011), Navigando tra le fonti demografiche e sociali, ISTAT, Roma,http://www3.istat.it/dati/catalogo/20100325_01/Navigando_tra_le_fonti_demografiche_sociali.pdf
Bonarini F. (2006), Guida alle fonti statistiche socio-demografiche, CLEUP, Padova, pp. 1-142; 231-308.
Cavaleri P. e Venturini F. (a cura di) (2004), Documenti e dati pubblici sul web. Guida all'informazione di fonte pubblica in rete, Il Mulino, Bologna.D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma (Cap. 10 e 11).
OECD (2008), Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing
Per il modulo 2:
G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84.
L. Fabbris (1989), L’indagine campionaria, N.I.S., Roma, capp. I (§ 1.4, 1.5, 1.6), pp. 24-39.S. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.
Per il modulo 3:
Fraire M. e Rizzi A. (1998), Statistica, Carocci, Roma, pp. 445-478.
L. Fabbris (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77.
Programmazione del corso
Argomenti | Riferimenti testi | |
---|---|---|
1 | Modulo 1A: Le fonti delle informazioni statistiche. Modelli di rilevazione delle informazioni da fonti istituzionali | ISTAT (2011), Navigando tra le fonti demografiche e sociali, ISTAT, Roma, http://www3.istat.it/dati/catalogo/20100325_01/Navigando_tra_le_fonti_demografiche_sociali.pdf |
2 | Modulo 1B: I sistemi statistici informativi. Procedure d’integrazione fra data-bases. | Bonarini F. (2006), Guida alle fonti statistiche socio-demografiche, CLEUP, Padova, pp. 1-142; 231-308. Cavaleri P. e Venturini F. (a cura di) (2004), Documenti e dati pubblici sul web. Guida all'informazione di fonte pubblica in rete, Il Mulino, Bologna. |
3 | Modulo 1C: Le trasformazioni dei dati. Classificazione tipologica di tassi, rapporti, numeri indici. La questione degli indicatori. Le tecniche di costruzione e di standardizzazione degli indicatori. | D. F. Iezzi (2009), Statistica per le Scienze Sociali, Carocci, Roma (Cap. 10 e 11). OECD (2008), Handbook on Constructing Composite Indicators. Methodology and user guide., www.oecd.org/publishing. |
4 | Modulo 2A: Piani di campionamento Disegno di campionamento Dimensioni campionarie Errori di campionamento | G. Cicchitelli, A. Herzel e G. E. Montanari (1992), Il campionamento statistico, Il Mulino, Bologna, cap. III (§§ 1, 2, 3, 4, 5, 6, 7), pp. 69-84. |
5 | Modulo 2B: Criteri di selezione dei campioni | L. Fabbris (1989), L’indagine campionaria, N.I.S., Roma, capp. I (§ 1.4, 1.5, 1.6), pp. 24-39. |
6 | Modulo 2C: Test su un campione: binomiale, χ2, Kolmogorov-Smirnov Test su campioni a due misure dipendenti: McNemar, dei segni Test su due campioni indipendenti: esatto di Fisher, χ2, della mediana, Wilcoxon-Mann-Whitney | S. Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191. |
7 | Modulo 3A: Analisi delle serie temporali: a. procedimento classico b. procedimento moderno: modello di Box-Jenkins tipologia dei processi stocastici: stazionari, invertibili, lineari, autoregressivi (AR), casuali o a media mobile (MA), modelli ARMA o ARIMA Serie spazio-temporali | Fraire M. e Rizzi A. (1998), Statistica, Carocci, Roma, pp. 445-478. |
8 | Modulo 3B: I principi e la logica dell’analisi multidimensionale e multivariata I paradossi dell’analisi multivariata La tipologia delle matrici | L. Fabbris (1997), Statistica multivariata. Analisi esplorativa dei dati, McGraw-Hill, Milano, pp. 3-77. |
Verifica dell'apprendimento
Modalità di verifica dell'apprendimento
L'esame sarà scritto. Per i frequentanti sono previste tre prove intermedie. Le date verranno concordate di volta in volta con gli studenti per venire incontro alle esigenze degli stessi. Si provvederà, tuttavia, a darne informazione tramite avviso con notevole anticipo. Per svolgere la verifica di apprendimento del modulo successivo è necessario aver superato la verifica di apprendimento del modulo precedente. La prova consisterà nella risoluzione di due esercizi e la risposta a tre domande inerenti al modulo in oggetto. Sarà possibile portare con se: calcolatrice e tavole di distribuzione di probabilità.
Per chi decidesse di sostenere l'esame per intero, la prova si svolgerà negli appelli ufficiali, consisterà nella risoluzione di due esercizi e la risposta a cinque domande in 90 minuti. Sarà possibile portare con se: calcolatrice e tavole di distribuzione di probabilità.
Esempi di domande e/o esercizi frequenti
1) Le fonti delle informazioni statistiche.
2) Campionamento probabilistico e non probabilistico
3) I processi stocastici stazionari
Esercizio 1
Si costruisca un indicatore composito di integrazione degli immigrati considerando tre indicatori semplici (attrazione, inserimento sociale ed inserimento occupazionale) calcolato su cinque province. Si commenti la procedura e i risultati cui si perviene.
Prov |
Attraz |
InsSoc |
InsOcc |
Torino |
40,6 |
37,3 |
39,4 |
Milano |
65 |
46,2 |
55,8 |
Trento |
46,1 |
62,2 |
37,1 |
Vicenza |
57,3 |
64,7 |
51,8 |
Treviso |
58,4 |
58,3 |
47,6 |
Esercizio 2
Un ricercatore vuole verificare se la scelta di frequentare un determinato Corso di Laurea è condizionata dal genere. Estratti casualmente 15 soggetti, frequentanti il corso, rileva che 3 sono maschi e 12 sono femmine. Verificare ad un livello di significatività α = 0.05 che il genere non influenza la scelta.