ADA.14.01.20 Data Science and Analytics

SETTORE
Servizi digitali
PROCESSO
Sviluppo e gestione di prodotti e servizi digitali
SEQUENZA
Abilitazione, potenziamento e supporto in aziende ICT (Enable)

Questa scheda fa riferimento solo a un risultato atteso dell'area di attività. Per consultare la scheda completa di tutti i risultati attesi clicca qui

RA1: Eseguire operazioni di raccolta dati e data mining, provvedendo alla preparazione per i successivi trattamenti

Dimensioni

Casi

1 - Raccolta e Preparazione Dati
DATA PREPARATION

Promuovere operazioni di data cleaning, eliminando possibili errori e stabilendo dei meccanismi di comportamento in caso di dati mancanti, e di pre-processing, esplorando il target data ed effettuando un'analisi su base campionaria

Grado di complessità 4
SELEZIONE DI UN TARGET DATA SET

Selezionare, decodificare e segmentare i dati grezzi secondo criteri prestabiliti al fine di pervenire ad un sottoinsieme di variabili e di dati o di un campione di dati (structured data, unstructured data) che rappresentano un determinato target data o dati obiettivo

Grado di complessità 3
TRANSFORMATION & CONFIGURATION

Effettuare operazioni di trasformation, convertendo tipi di dati in altri o definendo nuovi dati ottenuti attraverso l'uso di operazioni matematiche o logiche sulle variabili, e configuration, effettuando una loro riconfigurazione in caso di provenienza da fonti diverse

Grado di complessità 2
DATA GATHERING

Raccogliere dati e informazioni “grezze”, disponibili in diversi format (.pdf, .csv, .txt, ecc.), utilizzando fonti attendibili, certificate e coerenti con il fabbisogno richiesto

Grado di complessità 1
2 - Operazioni di Data mining
SCELTA DEL PROCESSO DI DATA MINING

Stabilire la tipologia di tecnica di data mining da utilizzare (cluster analysis, regression analysis, classification analysis, anomaly detection analysis, intrusion detection, association rule learning, decision tree, neural networks, rule induction, data warehouse) più idonea rispetto all'obiettivo dell'analisi

Grado di complessità 2
SCELTA DEGLI ALGORITMI DI DATA MINING

Selezionare il metodo da usare per ricercare patterns nei dati, definendo quali parametri possono essere più appropriati e integrando i metodi di data mining scelti con i criteri generali di Data Analytics (Knowledge Discovery in Databases)

Grado di complessità 2
DATA MINING

Adattare l'algoritmo standard prodotto al caso preso in esame, in base alla tipologia di data mining selezionata (cluster analysis, regression analysis, classification analysis, ecc.), applicandolo ad relativo database e fornendo come outcome la descrizione dell'informazione ricercata

Grado di complessità 1
3 - Consolidamento Dati
CONSOLIDAMENTO DEI MODELLI IDENTIFICATI

Analizzare e verificare i risultati ottenuti e le performance del sistema, anche valutando possibile retroazione a fasi precedenti, al fine di migliorare l'efficacia dei modelli di data analytics

Grado di complessità 1

Fonti

  • Cesarini, M., Fontana, M. Mercorio, F., Mezzancanica M. & Vegetti, N., Data Quality: Un Approccio Metodologico e Applicativo. “Il caso delle COB del mercato del lavoro in Lombardia”, Working Paper “Documentazione relativa alla ricostruzione di una metodologia unificata, ripetibile e aperta, CRISP E ARIFL
  • EMC (2015), Data Science & Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data, John Wiley & Sons, Indianapolis
  • European e-Competence Framework (E-CF), v.04: https://www.ecompetences.eu/
  • Freitas, A. & Curry E. (2016). Big Data Curation, In Cavanillas, J.M & Curry E. (2016). New Horizons for a Data-Driven Economy. A Roadmap for Usage and Exploitation of Big Data in Europe, Big Data Public Private Forum, Springer Open, p. 87-119
  • Gelernter, J. & Lesk, M. (2011), Use of Ontologies for Data Integration and Curation. In The International Journal of Digital Curation, Issue 1, Volume 6
  • SITOGRAFIA
  • MediaSapens, Data Curation: the essential step for integrated data-driven research