ANALISI DEI DATI

Anno accademico 2024/2025 - Docente: ROSARIO GIUSEPPE D'AGATA

Risultati di apprendimento attesi

Il corso mira a fornire gli strumenti metodologici necessari per poter trarre informazioni operative da un insieme di dati. Un’attenzione particolare sarà rivolta alla fase di ‘creazione’ del dato, a partire da un approfondimento critico sulle fonti e sulla creazione di indicatori con particolare riferimento a quelli utilizzati nell’ambito della P.A. Un’importanza particolare, inoltre, sarà rivolta ai criteri di costruzione di un’indagine campionaria, dalla scelta delle unità d’analisi (campionamento) alla rilevazione di opinioni, giudizi, ecc. (questionario). Infine, il corso fornirà gli strumenti base per condurre un'analisi delle reti sociali ed un'analisi testuale 

Modalità di svolgimento dell'insegnamento

La frequenza non è obbligatoria ma fortemente consigliata. 

 

Prerequisiti richiesti

Lo studente deve essere in possesso delle nozioni fondamentali di matematica come da programma di qualsiasi istituto superiore di secondo grado e delle nozioni basilari di statistica descrittiva ed inferenziale.

Frequenza lezioni

Per i frequentanti è prevista una prova intermedia alla fine di ciascun modulo; per un totale di 3 prove intermedie.  Per i frequentanti, inoltre, sono previste attività laboratoriali che, oltre ad agevolare il superamento delle verifiche intermedie, forniranno conoscenze pratiche in merito alla gestione di un database

Contenuti del corso

Il primo modulo si concentrerà sulla progettazione di un'indagine statistica a partire dall'analisi delle fonti statistiche ufficiali, nazionali ed internazionali. In questa fase un'attenzione particolare sarà rivolta alle strategie di campionamento e alla costruzione del questionario compresi alcuni cenni sulle tecniche di scaling. Il secondo modulo prevede un approfondimento del concetto di indicatore, nello specifico si tratteranno gli argomenti legati alla costruzione di un indicatore composito. Il terzo modulo prevede lo studio dei test non parametrici più utilizzati in ambito sociale ed alcuni cenni di analisi multivariata

Testi di riferimento

D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni, Carocci, Roma.  

Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.

Programmazione del corso

 ArgomentiRiferimenti testi
1Analisi delle fonti, piani di campionamento e costruzione di un data baseD. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 19 a pag. 123) 
2La stesura di un questionario ed il ruolo degli indicatori nella ricerca sociale. D. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 125 a pag. 240 e da da pag. 373 a pag. 423) 
3Analisi delle reti sociali. Analisi testuale e test non parametriciD. F. Iezzi (2024), Dai dati alla conoscenza. Statistica per le decisioni Carocci, Roma.  (da pag. 481 a pag. 567) Siegel e N. J. Castellan jr. (1992), Statistica non parametrica, McGraw-Hill, Milano, cap. III (§§ 3.4, 3.4.1, 3.4.2) e cap. IV (§§ 4.1, 4.2, 4.3), pp. 67-92; cap. V (§§ 5.1,5.2), pp. 113-130; cap. VI (§§ 6.1, 6.2, 6.3, 6.4), pp. 151-191.

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

Per i frequentanti sono previste tre prove intermedie, ciascuna a fine di ogni modulo trattato. Per poter sostenere la successiva prova bisogna aver superato la precedente. La prima verifica consiste nella presentazione di un progetto di indagine che contempli tutti gli aspetti metodologici a partire dal piano di campionamento. La seconda verifica si svolgerà in laboratorio multimediale e prevederà l’esclusivo utilizzo di excel o R. In merito alla terza verifica, lo studente concorderà col docente una tecnica di analisi affrontata durante il corso e consegnerà un paper che verrà discusso in aula

 

 

Per i non frequentanti

L’esame sarà interamente scritto, consterà di 4 esercizi e 8 quesiti a risposta aperta che coprono l’intero programma. Lo studente avrà a disposizione 100 minuti per svolgere il compito.

Esempi di domande e/o esercizi frequenti

Quesiti

 

1) La qualità dei dati

2) I rapporti statistici

3) Campionamento casuale  a Grappoli

4) Le fasi di un test non parametrico

5) La scala di Guttman

6) Il metodo CAPI

7) Dal concetto all'indicatore

8) Il ruolo di ISTAT


 

Esercizio 1

Si costruisca un indicatore composito di integrazione degli immigrati considerando tre indicatori semplici (attrazione, inserimento sociale ed inserimento occupazionale) calcolato su cinque province. Si commenti la procedura e i risultati cui si perviene.

 

Prov

Attraz

InsSoc

InsOcc

Torino

40,6

37,3

39,4

Milano

65

46,2

55,8

Trento

46,1

62,2

37,1

Vicenza

57,3

64,7

51,8

Treviso

58,4

58,3

47,6

 

 

 

 

 

Esercizio 2

Sia data la seguente distribuzione di pesi rilevati su 51 studenti. Verificare l’ipotesi che la distribuzione dalla quale è estratto il campione sia  normale. (α=0.05)

Kg

40- 45

46-50

51-55

56-60

Totale

ni

7

12

17

15

51

 

 Esercizio 3

 

La tabella nostra l’esito di un’indagine condotta su 116 studenti in merito alla valutazione del corso di Laurea L16. Ad un livello di significatività α=0.05 è possibile stabilire che nella popolazione di riferimento vi sia un giudizio sostanzialmente positivo?

negativo

abbastanza negativo

abbastanza positivo

positivo

Totale

1

6

64

45

116