r17 - flinke Alternative zu Hadoop...
16.05.2012 - 17:55
r17 - flinke Alternative zu Hadoop...
...zumindest für Data-Mining in Datensätzen bis 100 Gigabyte hat sich r17 als Outperformer erwiesen, wie sich jetzt im Vergleich zu einem Benchmark von Pangool herausgestellt hat. Auch die Programmierung einfacher Befehle gestaltet sich mit r17 erheblich simpler als mit Hadoop, Pangool, Crunch oder Cascading.
Den Einsatzbereich sieht Autor Matthew Nourse irgendwo zwischen SQL und Hadoop, sagt er in der Reddit-Diskussion. Datensätze um 100 GB, also die Obergrenze üblicher RDBMSs, sind der Punkt, an dem sich SQL nicht mehr und Hadoop noch nicht rentieren, da SQL hier ihre Skalierungs-Obergrenze überschreitet und Hadoop mit seinem gewaltigen Overhead des Guten zu viel wäre.
Details zu der besagten Syntax findet Ihr hier. r17 steht zum Download für diverse Linux-Distributionen, MAC und FreeBSD bereit. Schon bald will Nourse den Quellcode offenlegen.
Links & Literatur:
Als Gast kommentieren:
Gastkommentare werden nach redaktioneller Prüfung freigegeben (bitte Policy beachten).
-
PHP Magazin - Die aktuelle Ausgabe
Inhalt, Editorial, Quellcodes und Link-Tipps zum aktuellen PHP Magazin -
Archiv
-
Digital lesen
-
PHP Magazin Abo

Warenkorb
Login
Registrieren
Kommentare
Ihr Kommentar zum Thema