A volte può succedere di ritrovarsi con un file particolarmente grande, da dover inviare attraverso una rete instabile, da dover processare o ancora da dover trasportare su più pendrive USB…
Tag
Big Data
Estrarre valori distinti (distinct) con Hadoop MapReduce
In questo breve articolo introduciamo un algoritmo per Hadoop Map/Reduce, per estrarre i valori distinti di un dataset. Iniziamo subito vedendo lo pseudocodice: def map(key, value): emit(value, null) def reduce(key, null[]):…
ChronoZoom: Microsoft ci spiega l’origine dell’universo
Microsoft Research, che ultimamente stà sfornando un sacco di idee innovaive, ha creato un software (in collaborazione con le Università di Bekeley, California, e Lomonosov Moscow State) che permette di…