- Oggetto:
- Oggetto:
INTRODUCTION TO DATA SCIENCE - MODULO DATA MANAGEMENT AND PROGRAMMING
- Oggetto:
INTRODUCTION TO DATA SCIENCE - DATA MANAGEMENT AND PROGRAMMING
- Oggetto:
Anno accademico 2023/2024
- Codice dell'attività didattica
- SEM0125A
- Docente
- Elena Grinza (Titolare del corso)
- Insegnamento integrato
- Corso di studi
- ECONOMIA - percorso in Economia e Data Science
- Anno
- 3° anno
- Periodo didattico
- Primo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- INF/01 - informatica
- Modalità di erogazione
- Tradizionale
- Lingua di insegnamento
- Inglese
- Modalità di frequenza
- Facoltativa
- Tipologia d'esame
- Scritto
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Gli obiettivi formativi di questo modulo sono i seguenti: (i) imparare le basi teoriche della gestione dei dati e della programmazione; (ii) conoscere le basi per gestire, organizzare ed elaborare dati con il software R; (iii) conoscere le basi del software STATA.
The objectives of this module are as follows: (i) learn the theoretical basis of data management and programming; (ii) know the basics for managing, organizing, and processing data with the R software; (iii) know the basics of the STATA software.- Oggetto:
Risultati dell'apprendimento attesi
Alla fine di questo modulo, lo studente avrà conoscenze di base per gestire banche dati con i software R e STATA. Sarà inoltre in grado di applicare tecniche di programmazione (per esempio, uso di cicli e variabili macro) per elaborare i dati e condurre analisi statistiche di base.
At the end of this module, the student will have basic knowledge to manage databases with the R and STATA software. The student will also be able to apply programming techniques (for example, use of loops and macro variables) to process data and conduct basic statistical analysis.
- Oggetto:
Modalità di insegnamento
Lezioni interattive in aula informatica con utilizzo diretto dei software da parte degli studenti.
Interactive lectures in computer rooms, with direct use of the software by the students.
- Oggetto:
Modalità di verifica dell'apprendimento
Prova scritta sulle tre parti del modulo (teoria, R e STATA). Durata dell'esame: 2 ore. L'esame consisterà in tre domande aperte relative alla prima parte (teoria). La seconda e la terza parte (R e STATA) consisteranno nella scrittura di file di programmazione, rispettivamente in R e STATA, seguendo una serie di istruzioni fornite dalla Docente e basandosi su un data set anch'esso fornito dalla Docente al momento dell'esame. L'esame si svolgerà al computer.
Written exam on the three parts of the module (theory, R, and STATA). Duration of the exam: 2 hours. The exam will consist of three open questions related to the first part (theory). The second and third parts will consist of writing program files in R and STATA, respectively, following a set of instructions provided by the Professor and based on a data set also provided by the Professor at the start of the exam. The exam will be performed on the computer.
- Oggetto:
Programma
Il programma è il seguente:
1. Introduzione alla gestione e programmazione dei database.
Che cos'è un database?
Quali sono i software utilizzati nella gestione dei database?
Quali tipi di analisi economico-finanziarie possono essere effettuate attraverso l'utilizzo dei dati?
Che tipo di dati esistono (ad esempio, dati a livello di impresa, indagini su individui e famiglie, dati del tipo "matched employer-employee", dati relativi ai brevetti)?
2. R.
Introduzione generale al software.
R come calcolatrice.
Cosa sono gli oggetti?
Cosa sono i file .R e .Rdata?
Data frames e importazione di dati in R.
Come si "pulisce" un set di dati?
Elaborazione di statistiche descrittive (univariate, bivariate, per variabili categoriche e continue).
Analisi grafica utilizzando R.
Programmazione in R: loop e definizione di funzioni.
3. STATA.
Introduzione generale al software.
Cosa sono i file .do, .dta e .log?
Come si importa un set di dati in STATA?
Come vengono create nuove variabili?
Come si "pulisce" un set di dati?
Come vengono condotte le analisi statistiche di base (ad esempio, statistiche univariate, bivariate, grafici)?
La programmazione in STATA: i loop e l'uso di variabili macro.
The program is as follows:
1. Introduction to database management and programming.
What is a database?
What are the software used in database management?
What types of economic-financial analyzes can be carried out through the use of data?
What kinds of data exist (for example, firm-level data, surveys on individuals and households, matched employer-employee data, data relating to patents)?
2. R
General introduction to the software.
Using R as a calculator.
What are objects?
What are the .R and .Rdata files?
Data frames and importing data in R.
How do you "clean" a data set?
Obtaining descriptive statistics (univariate, bivariate, for categorical and continuous variables).
Graphical analysis using R.
Programming in R: loops and definition of functions.
3. STATA.
General introduction to the software.
What are .do, .dta, and .log files?
How do you import a data set into STATA?
How are new variables created?
How do you "clean" a data set?
How are basic statistical analyzes conducted (for example, univariate statistics, bivariate statistics, graphs)?
Programming in STATA: loops and the use of macro variables.
Testi consigliati e bibliografia
- Oggetto:
Tutto il materiale (per esempio, slide, file di programmazione e banche dati) verrà fornito dalla Docente.
All the material (including slides, lecture notes, programming files, and data sets) will be provided by the Professor.
- Oggetto: