Skip to main content
Modulo di Big Data

Modulo di Big Data


Il Modulo affronta lo studio della elaborazione e analisi di grandi quantità di dati nell’ambito della Data Science.

La Data Science è una scienza abbastanza recente che permette di gestire grandi quantità di dati, superando le limitazioni dei database tradizionali, e ne permette la elaborazione senza la necessità della conoscenza dei linguaggi di programmazione.

Fornisce strumenti GUI (Graphical User Interface) di semplice utilizzo che permettono a chiunque, con minime conoscenze specifiche, di archiviare, manipolare e modellare i dati.

Il Modulo è costituito da una piattaforma di Data Science utilizzabile su tutte le stazioni di lavoro del laboratorio, che permette:

• l’elaborazione di dati in tempo reale;

• l’elaborazione di dati storici;

• la programmazione in Python, Java ed R;

• l’analisi grafica dei dati;

• il Machine Learning.

Il Modulo prevede l’utilizzo di Apache Spark, un motore di analisi unificato per l’elaborazione di dati su vasta scala con moduli integrati per SQL, flussi di dati, machine learning ed elaborazione di grafici, che permette di utilizzare anche dati in streaming che potrebbero, ad esempio, arrivare dai sensori dell’IoT.


Prodotti correlati