ADA.14.01.20 Data Science and Analytics

SETTORE
Servizi digitali
PROCESSO
Sviluppo e gestione di prodotti e servizi digitali
SEQUENZA
Abilitazione, potenziamento e supporto in aziende ICT (Enable)

Questa scheda fa riferimento solo a un risultato atteso dell'area di attività. Per consultare la scheda completa di tutti i risultati attesi clicca qui

RA2: Realizzazione di analisi avanzate di data set (anche di notevoli dimensioni e di big data), anche a partire dalla creazione di modelli, algoritmi e strumenti di raccolta e analisi dati, provvedendo, successivamente, a realizzare rapporti per supportare i processi decisionali

Dimensioni

Casi

1 - Procedure data curation and data quality control
EXPLORATION

Assicurare una maggiore comprensione analitica dei dati raccolti in funzione degli obiettivi delle analisi, in modo da avere una caratterizzazione più accurata delle informazioni disponibili

Grado di complessità 4
CLEANING

Individuare e correggere I dati grezzi (raw data) provenienti da fonti diversi che contengono imprecisioni, armonizzando le relative informazioni mediante specifici dataset (es. Alteryx, Apache Spark, SAS, Big ML, MATLAB, Jupyter)

Grado di complessità 3
ARRICCHIMENTO DEL DATABASE

Categorizzare i dati disponibili a seconda del loro uso finale creando nuove variabili dai valori originali, al fine di consentire un loro facile utilizzo

Grado di complessità 2
STANDARDIZZAZIONE

Promuovere una standardizzazione del processo di data curation, attraverso l'utilizzo di processi semi-automatici (ontologies) di text mining per identificare eventuali sovrapposizioni di metadati

Grado di complessità 1
2 - Creazione di modelli, algoritmi e strumenti per la raccolta e analisi dei dati
CLASSIFICATION MODELING

Assegnare ogni campione alla giusta categoria, avendo a disposizione una serie di dati appartenenti ad un numero finito di categorie note

Grado di complessità 4
CLUSTERING MODELING

Creare i gruppi in modo tale che gli elementi al loro interno abbiano dei punti in comune, avendo a disposizione una serie di dati appartenenti ad un numero finito di gruppi non noti

Grado di complessità 3
NATURAL LANGUAGE PROCESSING

Sfruttare le potenzialità dei modelli di elaborazione del linguaggio naturale (NLP) per il riconoscimento e l'estrazione automatica di informazioni

Grado di complessità 2
FORECASTING MODELING

Esaminare le caratteristiche chiave di una serie ordinata di campioni, per rilevare la stagionalità delle tendenze, l'influenza di fattori esterni, e prevedere i valori futuri di una variabile in base alla sua relazione con le altre o con determinate serie storiche

Grado di complessità 1
3 - Cura dei rapporti di sintesi e di comunicazione dell’esito dell’analisi a supporto delle decisioni
DATA VISUALISATION

Estrarre e intrepretare le informazioni mediante l'utilizzo di strumenti di data visualisation (es. Tableau, RawGraphs, ChartBlocks, PowerBI, QlikSense, ecc.), così da comunicare i risultati con i propri stakeholders in modo efficace

Grado di complessità 5
DESCRIPTIVE ANALITYCS

Predisporre analisi “descrittive” con riferimento a dati riguardanti situazioni attuali o precedenti relativi al mercato, identificando i principali KPIs e gli indicatori di prestazione

Grado di complessità 4
PREDICTIVE ANALITYCS

Predisporre analisi “predittive”, mediante l'utilizzo di tool programmati per fornire risposte relative alla tendenze del mercato nel futuro e avvalendosi di strumenti matematici (forecasting; regressione, applicazione modelli predittivi)

Grado di complessità 3
PRESCRIPTIVE ANALITYCS

Predisporre analisi “prescrittive”, proponendo soluzioni operative/strategiche, sulla base delle analisi svolte, fra le quali il decision maker potà scegliere

Grado di complessità 2
AUTOMATED ANALYTICS

Predisporre analisi “automatizzate”, capaci di mettere in atto autonomamente le scelte che, in base alle analisi svolte, ritengono valide rispetto agli obiettivi prefissati

Grado di complessità 1

Fonti

  • Cesarini, M., Fontana, M. Mercorio, F., Mezzancanica M. & Vegetti, N., Data Quality: Un Approccio Metodologico e Applicativo. “Il caso delle COB del mercato del lavoro in Lombardia”, Working Paper “Documentazione relativa alla ricostruzione di una metodologia unificata, ripetibile e aperta, CRISP E ARIFL
  • EMC (2015), Data Science & Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data, John Wiley & Sons, Indianapolis
  • European e-Competence Framework (E-CF), v.04: https://www.ecompetences.eu/
  • Freitas, A. & Curry E. (2016). Big Data Curation, In Cavanillas, J.M & Curry E. (2016). New Horizons for a Data-Driven Economy. A Roadmap for Usage and Exploitation of Big Data in Europe, Big Data Public Private Forum, Springer Open, p. 87-119
  • Gelernter, J. & Lesk, M. (2011), Use of Ontologies for Data Integration and Curation. In The International Journal of Digital Curation, Issue 1, Volume 6
  • SITOGRAFIA
  • MediaSapens, Data Curation: the essential step for integrated data-driven research