brueslymuesh
Grünschnabel
Hallo zusammen,
Ich bin neu bei Hadoop und hab da mal eine Frage. Und zwar geht es darum eine sortierte Liste von Woertern zu erstellen (aehnlich dem WordCount-Example). Allerdings wuerde ich gerne zuerst fuer jedes Input-File auch ein Output-File schreiben (ich moechte also die Daten nicht combinen und nicht shuffeln).
Warum das Ganze mit Hadoop sein soll: Das liegt an der Aufgabenstellung die ich bekommen habe, mittlerweile frage ich mich aber ob die so schon richtig ist oder an dem was Hadoop macht vorbei geht.
Naja, evtl. hat ja wer Erfahrung mit Hadoop und kann da mal was dazu sagen. Bringt es was den Combiner zu ueberschreiben oder irgendwas?
Danke...
Ich bin neu bei Hadoop und hab da mal eine Frage. Und zwar geht es darum eine sortierte Liste von Woertern zu erstellen (aehnlich dem WordCount-Example). Allerdings wuerde ich gerne zuerst fuer jedes Input-File auch ein Output-File schreiben (ich moechte also die Daten nicht combinen und nicht shuffeln).
Warum das Ganze mit Hadoop sein soll: Das liegt an der Aufgabenstellung die ich bekommen habe, mittlerweile frage ich mich aber ob die so schon richtig ist oder an dem was Hadoop macht vorbei geht.
Naja, evtl. hat ja wer Erfahrung mit Hadoop und kann da mal was dazu sagen. Bringt es was den Combiner zu ueberschreiben oder irgendwas?
Danke...