ADA.14.01.20 Data Science and Analytics

SETTORE
Servizi digitali
PROCESSO
Sviluppo e gestione di prodotti e servizi digitali
SEQUENZA
Abilitazione, potenziamento e supporto in aziende ICT (Enable)
RA1: Eseguire operazioni di raccolta dati e data mining, provvedendo alla preparazione per i successivi trattamenti

Dimensioni

Casi

1 - Raccolta e Preparazione Dati
DATA PREPARATION

Promuovere operazioni di data cleaning, eliminando possibili errori e stabilendo dei meccanismi di comportamento in caso di dati mancanti, e di pre-processing, esplorando il target data ed effettuando un'analisi su base campionaria

Grado di complessità 4
SELEZIONE DI UN TARGET DATA SET

Selezionare, decodificare e segmentare i dati grezzi secondo criteri prestabiliti al fine di pervenire ad un sottoinsieme di variabili e di dati o di un campione di dati (structured data, unstructured data) che rappresentano un determinato target data o dati obiettivo

Grado di complessità 3
TRANSFORMATION & CONFIGURATION

Effettuare operazioni di trasformation, convertendo tipi di dati in altri o definendo nuovi dati ottenuti attraverso l'uso di operazioni matematiche o logiche sulle variabili, e configuration, effettuando una loro riconfigurazione in caso di provenienza da fonti diverse

Grado di complessità 2
DATA GATHERING

Raccogliere dati e informazioni “grezze”, disponibili in diversi format (.pdf, .csv, .txt, ecc.), utilizzando fonti attendibili, certificate e coerenti con il fabbisogno richiesto

Grado di complessità 1
2 - Operazioni di Data mining
SCELTA DEL PROCESSO DI DATA MINING

Stabilire la tipologia di tecnica di data mining da utilizzare (cluster analysis, regression analysis, classification analysis, anomaly detection analysis, intrusion detection, association rule learning, decision tree, neural networks, rule induction, data warehouse) più idonea rispetto all'obiettivo dell'analisi

Grado di complessità 2
SCELTA DEGLI ALGORITMI DI DATA MINING

Selezionare il metodo da usare per ricercare patterns nei dati, definendo quali parametri possono essere più appropriati e integrando i metodi di data mining scelti con i criteri generali di Data Analytics (Knowledge Discovery in Databases)

Grado di complessità 2
DATA MINING

Adattare l'algoritmo standard prodotto al caso preso in esame, in base alla tipologia di data mining selezionata (cluster analysis, regression analysis, classification analysis, ecc.), applicandolo ad relativo database e fornendo come outcome la descrizione dell'informazione ricercata

Grado di complessità 1
3 - Consolidamento Dati
CONSOLIDAMENTO DEI MODELLI IDENTIFICATI

Analizzare e verificare i risultati ottenuti e le performance del sistema, anche valutando possibile retroazione a fasi precedenti, al fine di migliorare l'efficacia dei modelli di data analytics

Grado di complessità 1
RA2: Realizzazione di analisi avanzate di data set (anche di notevoli dimensioni e di big data), anche a partire dalla creazione di modelli, algoritmi e strumenti di raccolta e analisi dati, provvedendo, successivamente, a realizzare rapporti per supportare i processi decisionali

Dimensioni

Casi

1 - Procedure data curation and data quality control
EXPLORATION

Assicurare una maggiore comprensione analitica dei dati raccolti in funzione degli obiettivi delle analisi, in modo da avere una caratterizzazione più accurata delle informazioni disponibili

Grado di complessità 4
CLEANING

Individuare e correggere I dati grezzi (raw data) provenienti da fonti diversi che contengono imprecisioni, armonizzando le relative informazioni mediante specifici dataset (es. Alteryx, Apache Spark, SAS, Big ML, MATLAB, Jupyter)

Grado di complessità 3
ARRICCHIMENTO DEL DATABASE

Categorizzare i dati disponibili a seconda del loro uso finale creando nuove variabili dai valori originali, al fine di consentire un loro facile utilizzo

Grado di complessità 2
STANDARDIZZAZIONE

Promuovere una standardizzazione del processo di data curation, attraverso l'utilizzo di processi semi-automatici (ontologies) di text mining per identificare eventuali sovrapposizioni di metadati

Grado di complessità 1
2 - Creazione di modelli, algoritmi e strumenti per la raccolta e analisi dei dati
CLASSIFICATION MODELING

Assegnare ogni campione alla giusta categoria, avendo a disposizione una serie di dati appartenenti ad un numero finito di categorie note

Grado di complessità 4
CLUSTERING MODELING

Creare i gruppi in modo tale che gli elementi al loro interno abbiano dei punti in comune, avendo a disposizione una serie di dati appartenenti ad un numero finito di gruppi non noti

Grado di complessità 3
NATURAL LANGUAGE PROCESSING

Sfruttare le potenzialità dei modelli di elaborazione del linguaggio naturale (NLP) per il riconoscimento e l'estrazione automatica di informazioni

Grado di complessità 2
FORECASTING MODELING

Esaminare le caratteristiche chiave di una serie ordinata di campioni, per rilevare la stagionalità delle tendenze, l'influenza di fattori esterni, e prevedere i valori futuri di una variabile in base alla sua relazione con le altre o con determinate serie storiche

Grado di complessità 1
3 - Cura dei rapporti di sintesi e di comunicazione dell’esito dell’analisi a supporto delle decisioni
DATA VISUALISATION

Estrarre e intrepretare le informazioni mediante l'utilizzo di strumenti di data visualisation (es. Tableau, RawGraphs, ChartBlocks, PowerBI, QlikSense, ecc.), così da comunicare i risultati con i propri stakeholders in modo efficace

Grado di complessità 5
DESCRIPTIVE ANALITYCS

Predisporre analisi “descrittive” con riferimento a dati riguardanti situazioni attuali o precedenti relativi al mercato, identificando i principali KPIs e gli indicatori di prestazione

Grado di complessità 4
PREDICTIVE ANALITYCS

Predisporre analisi “predittive”, mediante l'utilizzo di tool programmati per fornire risposte relative alla tendenze del mercato nel futuro e avvalendosi di strumenti matematici (forecasting; regressione, applicazione modelli predittivi)

Grado di complessità 3
PRESCRIPTIVE ANALITYCS

Predisporre analisi “prescrittive”, proponendo soluzioni operative/strategiche, sulla base delle analisi svolte, fra le quali il decision maker potà scegliere

Grado di complessità 2
AUTOMATED ANALYTICS

Predisporre analisi “automatizzate”, capaci di mettere in atto autonomamente le scelte che, in base alle analisi svolte, ritengono valide rispetto agli obiettivi prefissati

Grado di complessità 1
RA3: Pianificare e coordinare i processi di data analytics, assicurando il corretto feeding dei livelli strategici e decisionali

Dimensioni

Casi

1 - Pianificazione e coordinamento dei processi
MODELLO DATA DRIVEN

Pianificare un modello organizzativo per la gestione dei dati business driven, in cui le competenze di Data Science sono localizzate all'interno delle singole unità di business

Grado di complessità 1
MODELLO CENTRALIZZATO

Pianificare un approccio centralizzato per la gestione dei dati, identificando una specifica figura (Chief Data Scientist) che coordini le risorse in una struttura dedicata

Grado di complessità 1
MODELLO “A MATRICE”

Pianificare un modello organizzativo per la gestione dei dati in cui il responsabile (Chief Data Scientist) pianifica le risorse distribuite all'interno delle aree di business

Grado di complessità 1
2 - Trasferimento alle strategie di business
COLLEGAMENTO CON LA STRATEGIA AZIENDALE

Favorire lo svolgimento di operazioni real-time tramite l'utilizzo di asset strategici, in grado di convertire istantaneamente il processo di business in atto, fornendo anche dei feedback in tempo reale

Grado di complessità 3
SUPPORTO AI PROCESSI DECISIONALI

Supportare il processo decisionale fornendo opzioni di scelta al top management, basate sull'analisi di grandi volumi di dati, così da fornire soluzioni applicabili in tempo reale

Grado di complessità 2
SUPPORTO ALLA COSTUMER ORIENTATION

Supportare azioni di di fidelizzazione e customer care sulla base dell'analisi di grandi volumi di dati che consentano maggiore accuratezza nella profilazione dei clienti o personalizzazione del servizio

Grado di complessità 2
SUPPORTO ALLO SVILUPPO DI NUOVI PRODOTTI/SERVIZI

Contribuire all'ideazione di nuovi prodotti o servizi innovativi grazie alle idee provenienti dai risultati dei processi di data analytics e business intelligence

Grado di complessità 1

Fonti

  • Cesarini, M., Fontana, M. Mercorio, F., Mezzancanica M. & Vegetti, N., Data Quality: Un Approccio Metodologico e Applicativo. “Il caso delle COB del mercato del lavoro in Lombardia”, Working Paper “Documentazione relativa alla ricostruzione di una metodologia unificata, ripetibile e aperta, CRISP E ARIFL
  • EMC (2015), Data Science & Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data, John Wiley & Sons, Indianapolis
  • European e-Competence Framework (E-CF), v.04: https://www.ecompetences.eu/
  • Freitas, A. & Curry E. (2016). Big Data Curation, In Cavanillas, J.M & Curry E. (2016). New Horizons for a Data-Driven Economy. A Roadmap for Usage and Exploitation of Big Data in Europe, Big Data Public Private Forum, Springer Open, p. 87-119
  • Gelernter, J. & Lesk, M. (2011), Use of Ontologies for Data Integration and Curation. In The International Journal of Digital Curation, Issue 1, Volume 6
  • SITOGRAFIA
  • MediaSapens, Data Curation: the essential step for integrated data-driven research