- Oggetto:
- Oggetto:
INTRODUCTION TO DATA SCIENCE - MODULO DATA MANAGEMENT AND PROGRAMMING
- Oggetto:
INTRODUCTION TO DATA SCIENCE - DATA MANAGEMENT AND PROGRAMMING
- Oggetto:
Anno accademico 2021/2022
- Codice dell'attività didattica
- SEM0125A
- Docente
- Elena Grinza (Titolare del corso)
- Insegnamento integrato
- Corso di studi
- ECONOMIA - percorso in Economia e Data Science
- Anno
- 3° anno
- Periodo didattico
- Secondo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- INF/01 - informatica
- Modalità di erogazione
- Mista
- Lingua di insegnamento
- Inglese
- Modalità di frequenza
- Facoltativa
- Tipologia d'esame
- Scritto
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Gli obiettivi formativi di questo modulo sono i seguenti: (i) imparare le basi teoriche della gestione dei dati e della programmazione; (ii) conoscere le basi per gestire, organizzare ed elaborare dati con il software STATA; (iii) conoscere le basi del software R.
The objectives of this module are as follows: (i) learn the theoretical basis of data management and programming; (ii) know the basics for managing, organizing, and processing data with the STATA software; (iii) know the basics of the R software.- Oggetto:
Risultati dell'apprendimento attesi
Alla fine di questo modulo, lo studente avrà conoscenze di base per gestire banche dati con i software STATA ed R. Sarà inoltre in grado di applicare tecniche di programmazione (per esempio, uso di cicli e variabili macro) per elaborare i dati e condurre analisi statistiche di base.
At the end of this module, the student will have basic knowledge to manage databases with the STATA and R softwares. The student will also be able to apply programming techniques (for example, use of loops and macro variables) to process data and conduct basic statistical analysis.
- Oggetto:
Modalità di insegnamento
Lezioni frontali e, salvo disponibilità di aule informatiche, lezioni interattive con utilizzo diretto dei software da parte degli studenti.
Standard lectures and, subject to the availability of computer rooms, interactive lessons with direct use of the softwares by the students.
- Oggetto:
Modalità di verifica dell'apprendimento
Written exam.
Esame scritto.
- Oggetto:
Programma
Il programma è il seguente:
1. Introduzione alla gestione e programmazione dei database.
Che cos'è un database?
Quali sono i software utilizzati nella gestione dei database?
Quali tipi di analisi economico-finanziarie possono essere effettuate attraverso l'utilizzo dei dati?
Che tipo di dati esistono (ad esempio, dati a livello di impresa, indagini su individui e famiglie, dati del tipo "matched employer-employee", dati relativi ai brevetti)?
2. R
Introduzione generale al software.
R come calcolatrice.
Cosa sono gli oggetti?
Cosa sono i file .R e .Rdata?
Data frames e importazione di dati in R.
Elaborazione di statistiche descrittive (univariate, bivariate, per variabili categoriche e continue)
Analisi grafica utilizzando R.
Programmazione in R: loop e definizione di funzioni.
3. STATA
Introduzione generale al software.
Cosa sono i file .do, .dta e .log?
Come si importa un set di dati in STATA?
Come vengono create nuove variabili?
Come si "pulisce" un set di dati?
Come vengono condotte le analisi statistiche di base (ad esempio, statistiche univariate, bivariate, grafici)?
La programmazione in STATA: i loop e l'uso di variabili macro.
The program is as follows:
1. Introduction to database management and programming.
What is a database?
What are the software used in database management?
What types of economic-financial analyzes can be carried out through the use of data?
What kinds of data exist (for example, firm-level data, surveys on individuals and households, matched employer-employee data, data relating to patents)?
2. R
General introduction to the software.
Using R as a calculator.
What are objects?
What are the .R and .Rdata files?
Data frames and importing data in R.
Obtaining descriptive statistics (univariate, bivariate, for categorical and continuous variables)
Graphical analysis using R.
Programming in R: loops and definition of functions.
3. STATA
General introduction to the software.
What are .do, .dta, and .log files?
How do you import a data set into STATA?
How are new variables created?
How do you "clean" a data set?
How are basic statistical analyzes conducted (for example, univariate statistics, bivariate statistics, graphs)?
Programming in STATA: loops and the use of macro variables.
Testi consigliati e bibliografia
- Oggetto:
Other material (for example, slides, programming files) will be provided by the Professor.
Altro materiale (per esempio, slide, file di programmazione) verrà fornito dalla Docente.
- Oggetto: