Vai al contenuto principale
Oggetto:
Oggetto:

INTRODUCTION TO DATA SCIENCE - MODULO DATA MANAGEMENT AND PROGRAMMING

Oggetto:

INTRODUCTION TO DATA SCIENCE - DATA MANAGEMENT AND PROGRAMMING

Oggetto:

Anno accademico 2023/2024

Codice attività didattica
SEM0125A
Docente
Elena Grinza (Titolare del corso)
Corso di studio
ECONOMIA - percorso in Economia e Data Science
Anno
3° anno
Periodo
Primo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD attività didattica
INF/01 - informatica
Erogazione
Tradizionale
Lingua
Inglese
Frequenza
Facoltativa
Tipologia esame
Scritto
Tipologia unità didattica
modulo
Insegnamento integrato
INTRODUCTION TO DATA SCIENCE - CORSO INTEGRATO (SEM0125)
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi


Gli obiettivi formativi di questo modulo sono i seguenti: (i) imparare le basi teoriche della gestione dei dati e della programmazione; (ii) conoscere le basi per gestire, organizzare ed elaborare dati con il software R; (iii) conoscere le basi del software STATA.


The objectives of this module are as follows: (i) learn the theoretical basis of data management and programming; (ii) know the basics for managing, organizing, and processing data with the R software; (iii) know the basics of the STATA software.

Oggetto:

Risultati dell'apprendimento attesi

Alla fine di questo modulo, lo studente avrà conoscenze di base per gestire banche dati con i software R e STATA. Sarà inoltre in grado di applicare tecniche di programmazione (per esempio, uso di cicli e variabili macro) per elaborare i dati e condurre analisi statistiche di base.

At the end of this module, the student will have basic knowledge to manage databases with the R and STATA software. The student will also be able to apply programming techniques (for example, use of loops and macro variables) to process data and conduct basic statistical analysis.

Oggetto:

Programma

Il programma è il seguente:

 

1. Introduzione alla gestione e programmazione dei database.

Che cos'è un database?

Quali sono i software utilizzati nella gestione dei database?

Quali tipi di analisi economico-finanziarie possono essere effettuate attraverso l'utilizzo dei dati?

Che tipo di dati esistono (ad esempio, dati a livello di impresa, indagini su individui e famiglie, dati del tipo "matched employer-employee", dati relativi ai brevetti)?

 

2. R.

Introduzione generale al software.

R come calcolatrice.

Cosa sono gli oggetti?

Cosa sono i file .R e .Rdata?

Data frames e importazione di dati in R.

Come si "pulisce" un set di dati?

Elaborazione di statistiche descrittive (univariate, bivariate, per variabili categoriche e continue).

Analisi grafica utilizzando R.

Programmazione in R: loop e definizione di funzioni.

 

3. STATA.

Introduzione generale al software.

Cosa sono i file .do, .dta e .log?

Come si importa un set di dati in STATA?

Come vengono create nuove variabili?

Come si "pulisce" un set di dati?

Come vengono condotte le analisi statistiche di base (ad esempio, statistiche univariate, bivariate, grafici)?

La programmazione in STATA: i loop e l'uso di variabili macro.

 

The program is as follows:

 

1. Introduction to database management and programming.

What is a database?

What are the software used in database management?

What types of economic-financial analyzes can be carried out through the use of data?

What kinds of data exist (for example, firm-level data, surveys on individuals and households, matched employer-employee data, data relating to patents)?

 

2. R

General introduction to the software.

Using R as a calculator.

What are objects?

What are the .R and .Rdata files?

Data frames and importing data in R.

How do you "clean" a data set?

Obtaining descriptive statistics (univariate, bivariate, for categorical and continuous variables).

Graphical analysis using R.

Programming in R: loops and definition of functions.

 

3. STATA.

General introduction to the software.

What are .do, .dta, and .log files?

How do you import a data set into STATA?

How are new variables created?

How do you "clean" a data set?

How are basic statistical analyzes conducted (for example, univariate statistics, bivariate statistics, graphs)?

Programming in STATA: loops and the use of macro variables.

Oggetto:

Modalità di insegnamento

Lezioni interattive in aula informatica con utilizzo diretto dei software da parte degli studenti.

Interactive lectures in computer rooms, with direct use of the software by the students.

Oggetto:

Modalità di verifica dell'apprendimento

Prova scritta sulle tre parti del modulo (teoria, R e STATA). Durata dell'esame: 2 ore. L'esame consisterà in tre domande aperte relative alla prima parte (teoria). La seconda e la terza parte (R e STATA) consisteranno nella scrittura di file di programmazione, rispettivamente in R e STATA, seguendo una serie di istruzioni fornite dalla Docente e basandosi su un data set anch'esso fornito dalla Docente al momento dell'esame. L'esame si svolgerà al computer.

 

Written exam on the three parts of the module (theory, R, and STATA). Duration of the exam: 2 hours. The exam will consist of three open questions related to the first part (theory). The second and third parts will consist of writing program files in R and STATA, respectively, following a set of instructions provided by the Professor and based on a data set also provided by the Professor at the start of the exam. The exam will be performed on the computer.

Testi consigliati e bibliografia

Oggetto:

Tutto il materiale (per esempio, slide, file di programmazione e banche dati) verrà fornito dalla Docente.

 

All the material (including slides, lecture notes, programming files, and data sets) will be provided by the Professor.



Registrazione
  • Aperta
    Oggetto:
    Ultimo aggiornamento: 28/07/2023 11:44
    Non cliccare qui!