Vai al contenuto principale
Oggetto:
Oggetto:

INTRODUCTION TO DATA SCIENCE - MODULO DATA MANAGEMENT AND PROGRAMMING

Oggetto:

INTRODUCTION TO DATA SCIENCE - DATA MANAGEMENT AND PROGRAMMING

Oggetto:

Anno accademico 2022/2023

Codice dell'attività didattica
SEM0125A
Docenti
Elena Grinza (Titolare del corso)
Prof. Vincent Martin C Vandenberghe (Titolare del corso)
Insegnamento integrato
Corso di studi
ECONOMIA - percorso in Economia e Data Science
Anno
3° anno
Periodo didattico
Primo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD dell'attività didattica
INF/01 - informatica
Modalità di erogazione
Tradizionale
Lingua di insegnamento
Inglese
Modalità di frequenza
Facoltativa
Tipologia d'esame
Scritto
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi


Gli obiettivi formativi di questo modulo sono i seguenti: (i) imparare le basi teoriche della gestione dei dati e della programmazione; (ii) conoscere le basi per gestire, organizzare ed elaborare dati con il software R; (iii) conoscere le basi del software STATA.


The objectives of this module are as follows: (i) learn the theoretical basis of data management and programming; (ii) know the basics for managing, organizing, and processing data with the R software; (iii) know the basics of the STATA software.

Oggetto:

Risultati dell'apprendimento attesi

Alla fine di questo modulo, lo studente avrà conoscenze di base per gestire banche dati con i software R e STATA. Sarà inoltre in grado di applicare tecniche di programmazione (per esempio, uso di cicli e variabili macro) per elaborare i dati e condurre analisi statistiche di base.

At the end of this module, the student will have basic knowledge to manage databases with the R and STATA softwares. The student will also be able to apply programming techniques (for example, use of loops and macro variables) to process data and conduct basic statistical analysis.

Oggetto:

Modalità di insegnamento

Lezioni interattive in aula informatica con utilizzo diretto dei software da parte degli studenti.

Interactive lectures in computer rooms, with direct use of the softwares by the students.

Oggetto:

Modalità di verifica dell'apprendimento

Written exam on the three parts of the module (theory, R, and STATA). The exam will consist of open questions related to the first part (theory). The second and third parts will consist in writing program files in R and STATA, respectively, following a set of instructions. The exam will be performed on the computer.

 

Prova scritta sulle tre parti del modulo (teoria, R e STATA). L'esame consisterà in domande aperte relative alla prima parte (teoria). La seconda e la terza parte (R e STATA) consisteranno nella scrittura di file di programmazione, rispettivamente in R e STATA, seguendo una serie di istruzioni. L'esame si svolgerà al computer.

Oggetto:

Programma

Il programma è il seguente:

1. Introduzione alla gestione e programmazione dei database (Prof. Grinza).

Che cos'è un database?

Quali sono i software utilizzati nella gestione dei database?

Quali tipi di analisi economico-finanziarie possono essere effettuate attraverso l'utilizzo dei dati?

Che tipo di dati esistono (ad esempio, dati a livello di impresa, indagini su individui e famiglie, dati del tipo "matched employer-employee", dati relativi ai brevetti)?

 

2. R (Prof. Grinza).

Introduzione generale al software.

R come calcolatrice.

Cosa sono gli oggetti?

Cosa sono i file .R e .Rdata?

Data frames e importazione di dati in R.

Come si "pulisce" un set di dati?

Elaborazione di statistiche descrittive (univariate, bivariate, per variabili categoriche e continue)

Analisi grafica utilizzando R.

Programmazione in R: loop e definizione di funzioni.

 

3. STATA: see the English version (Prof. Vandenberghe).

The program is as follows:

1. Introduction to database management and programming (Prof. Grinza).

What is a database?

What are the software used in database management?

What types of economic-financial analyzes can be carried out through the use of data?

What kinds of data exist (for example, firm-level data, surveys on individuals and households, matched employer-employee data, data relating to patents)?

 

2. R

General introduction to the software (Prof. Grinza).

Using R as a calculator.

What are objects?

What are the .R and .Rdata files?

Data frames and importing data in R.

How do you "clean" a data set?

Obtaining descriptive statistics (univariate, bivariate, for categorical and continuous variables)

Graphical analysis using R.

Programming in R: loops and definition of functions.

 

3. STATA (Prof. Vandenberghe).

Working environment
Writing commands
Using Stata effectively

Importing data
Transforming data
Adding labels

Organizing datasets
Combining datasets

Qualitative variables (descriptive statistics)
Quantitative variables (descriptive statistics)

Building complex graph

Programming loops and macros

Testi consigliati e bibliografia

Oggetto:

All the material (including slides, lecture notes, programming files, and data sets) will be provided by the Professor.

Tutto il materiale (per esempio, slide, file di programmazione e banche dati) verrà fornito dalla Docente.



Oggetto:
Ultimo aggiornamento: 10/10/2022 16:40
Location: https://www.ecocomm.unito.it/robots.html
Non cliccare qui!