E' scontato dire che questi dati rappresentano una fonte preziosa a cui le stesse aziende fanno riferimento per realizzare studi statistici ma anche, ancor'oggi, campagne marketing in alcuni casi o campagne sociali in altre. EMC Greenplum
Tutto svolto sapendo che la fonte primaria, i dati appunto, sono certi, in quanto ben strutturati e raccolti nei Data Warehouse aziendali. Nessun dubbio sulla veriticidà, liberi da "contaminazioni". E questa è (e dovrà sempre essere cosi'!!!) una garanzia per tutti noi.
Sappiamo che questa loro purezza ne circoscrive il perimetro di utilizzo in quanto, per loro natura, non si prestano a studi "predittivi" se non in termini statistici. La purezza dei dati unita alle query standard dei Data Warehouse ci offrono quindi ottime statistiche, fondamentali per il nostro vivere,
Si può comunque, e si deve, fare di più.
Dall'altra parte abbiamo la ben conosciuta esplosione dei dati non strutturati. La bellezza dell'informazione condivisa da tutti e per tutti. Un patrimonio immenso che racchiude in se tante cose tutte da scoprire se lo si va ad analizzare in profondità.
Vero che questo è un patrimonio esposto alla possibilità che non tutto ciò che lo costituisce sia garantito dal punto di vista di veriticidà. Ma non usarlo per questo timore sarebbe un peccato in quanto le potenti statistiche di cui sopra unite a tutto ciò che muove il quotidiano ed il sociale ci aiuterebbe a migliorare la nostra vità rendendola più facile, più sicura, socialmente più salvaguardata, più aperta alle innovazioni e al business.
Allora è arrivato il momento di unire la forza di questi due mondi. La simbiosi vantaggiosa genererebbe degli studi predittivi sicuri. E' questa è la frontiera della modernizzazione dei Data Warehouse, la sua alimentazione realizzata in modo contestuale con tutte le categorie di dati possibili mantenedo integro il valore del risultato. EMC e il valore del Data Lake
Ezio Falcione, EMC ASE