Luigi Minnaja descrive il significato delle quattro V del Big Data

Le quattro V

La tecnologia Big Data si basa su quattro concetti fondamentali meglio conosciuti come le quattro V:

  • - Volume
  • - Velocity
  • - Variety
  • - Veracity

  • Volume
    Con volume si intende la mole di dati da immagazzinare e successivamente analizzare. Il volume di dati generato ogni secondo è enorme e si parla ormai di Zattabytes o Brontobytes.
    I nuovi tools utilizzati nell'ambito del Big Data si basano su sistemi distribuiti per poter gestire enormi quantità di dati.

    Velocity
    Con velocity ci si riferisce alla velocità con cui i nuovi dati vengono generati e la velocità con cui si muovono nella rete. Pensiamo ad esempio ad un messaggio su un social network che diventa virale. La tecnologia Big Data permette di analizzare i dati non appena vengono generati senza nemmeno doverli precedentemente registrare su uno storage, questa tecnica è conosciuta come in-memory analytics.

    Variety
    Con variety si intende la varietà di dati che si possono analizzare. In passato venivano analizzati esclusivamente dati strutturati che ben si adattavano a tabelle e database relazionali. Al giorno d'oggi la maggior parte dei dati generati sono non strutturati (testi, immagini, video, audio, etc.). La tecnologia Big Data permette la gestione di dati disomogenei.

    Veracity
    Con veracity si intende la qualità del dato inteso come correttezza e attendibilità. Se pensiamo ad esempio ai dati generati dal social network Twitter i messaggi contengono un elevato numero di errori di battitura, hashtag, abbreviazioni, forme colloquiali, inoltre l'attendibilità di questi dati è tutta da verificare.


    << Big Data 3° parte - Big Data 5° parte >>

    Big Data
    Indice Articoli