- Oggetto:
- Oggetto:
INTRODUCTION TO DATA SCIENCE - MODULO DATA MANAGEMENT AND PROGRAMMING
- Oggetto:
INTRODUCTION TO DATA SCIENCE - DATA MANAGEMENT AND PROGRAMMING
- Oggetto:
Anno accademico 2022/2023
- Codice dell'attività didattica
- SEM0125A
- Docenti
- Elena Grinza (Titolare del corso)
Prof. Vincent Martin C Vandenberghe (Titolare del corso) - Insegnamento integrato
- Corso di studi
- ECONOMIA - percorso in Economia e Data Science
- Anno
- 3° anno
- Periodo didattico
- Primo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- INF/01 - informatica
- Modalità di erogazione
- Tradizionale
- Lingua di insegnamento
- Inglese
- Modalità di frequenza
- Facoltativa
- Tipologia d'esame
- Scritto
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Gli obiettivi formativi di questo modulo sono i seguenti: (i) imparare le basi teoriche della gestione dei dati e della programmazione; (ii) conoscere le basi per gestire, organizzare ed elaborare dati con il software R; (iii) conoscere le basi del software STATA.
The objectives of this module are as follows: (i) learn the theoretical basis of data management and programming; (ii) know the basics for managing, organizing, and processing data with the R software; (iii) know the basics of the STATA software.- Oggetto:
Risultati dell'apprendimento attesi
Alla fine di questo modulo, lo studente avrà conoscenze di base per gestire banche dati con i software R e STATA. Sarà inoltre in grado di applicare tecniche di programmazione (per esempio, uso di cicli e variabili macro) per elaborare i dati e condurre analisi statistiche di base.
At the end of this module, the student will have basic knowledge to manage databases with the R and STATA softwares. The student will also be able to apply programming techniques (for example, use of loops and macro variables) to process data and conduct basic statistical analysis.
- Oggetto:
Modalità di insegnamento
Lezioni interattive in aula informatica con utilizzo diretto dei software da parte degli studenti.
Interactive lectures in computer rooms, with direct use of the softwares by the students.
- Oggetto:
Modalità di verifica dell'apprendimento
Written exam on the three parts of the module (theory, R, and STATA). The exam will consist of open questions related to the first part (theory). The second and third parts will consist in writing program files in R and STATA, respectively, following a set of instructions. The exam will be performed on the computer.
Prova scritta sulle tre parti del modulo (teoria, R e STATA). L'esame consisterà in domande aperte relative alla prima parte (teoria). La seconda e la terza parte (R e STATA) consisteranno nella scrittura di file di programmazione, rispettivamente in R e STATA, seguendo una serie di istruzioni. L'esame si svolgerà al computer.
- Oggetto:
Programma
Il programma è il seguente:
1. Introduzione alla gestione e programmazione dei database (Prof. Grinza).
Che cos'è un database?
Quali sono i software utilizzati nella gestione dei database?
Quali tipi di analisi economico-finanziarie possono essere effettuate attraverso l'utilizzo dei dati?
Che tipo di dati esistono (ad esempio, dati a livello di impresa, indagini su individui e famiglie, dati del tipo "matched employer-employee", dati relativi ai brevetti)?
2. R (Prof. Grinza).
Introduzione generale al software.
R come calcolatrice.
Cosa sono gli oggetti?
Cosa sono i file .R e .Rdata?
Data frames e importazione di dati in R.
Come si "pulisce" un set di dati?
Elaborazione di statistiche descrittive (univariate, bivariate, per variabili categoriche e continue)
Analisi grafica utilizzando R.
Programmazione in R: loop e definizione di funzioni.
3. STATA: see the English version (Prof. Vandenberghe).
The program is as follows:
1. Introduction to database management and programming (Prof. Grinza).
What is a database?
What are the software used in database management?
What types of economic-financial analyzes can be carried out through the use of data?
What kinds of data exist (for example, firm-level data, surveys on individuals and households, matched employer-employee data, data relating to patents)?
2. R
General introduction to the software (Prof. Grinza).
Using R as a calculator.
What are objects?
What are the .R and .Rdata files?
Data frames and importing data in R.
How do you "clean" a data set?
Obtaining descriptive statistics (univariate, bivariate, for categorical and continuous variables)
Graphical analysis using R.
Programming in R: loops and definition of functions.
3. STATA (Prof. Vandenberghe).
Working environment
Writing commands
Using Stata effectivelyImporting data
Transforming data
Adding labelsOrganizing datasets
Combining datasetsQualitative variables (descriptive statistics)
Quantitative variables (descriptive statistics)Building complex graph
Programming loops and macros
Testi consigliati e bibliografia
- Oggetto:
All the material (including slides, lecture notes, programming files, and data sets) will be provided by the Professor.
Tutto il materiale (per esempio, slide, file di programmazione e banche dati) verrà fornito dalla Docente.
- Oggetto: