Rückblick: Webinar Talend & Palo

Mittwoch, 12. Mai 2010, 11:24 Uhr

1 Kommentar

Zum zweiten Mal fand heute ein gemeinsames Webinar vom ETL-Tool Talend Open Studio und Palo statt. Hiermit möchte ich einen kleinen Rückblick auf das Webinar geben.

Das Talend Open Studio ist ein ETL-Tool, von dem ich sehr viel halte und über das ich auch schon einmal einen Vortrag auf dem OSBI-Workshop 2009 an der Hochschule Karlsruhe gehalten habe. Palo ist zunächst einmal ein Open-Source OLAP-Server, für den es ein Excel-Plugin zur Datenanalyse und Planung gibt.

Ziel des Webinars war es natürlich die Zusammenarbeit zwischen den beiden Programmen zu zeigen. Das ist meiner Meinung nach auch relativ ansprechend gelungen auch wenn das Szenario relativ simpel und vielleicht auch nicht wirklich sinnvoll gewählt wurde. Aber es geht ja ums Prinzip. Es wurden Daten aus einer CSV-Datei extrahiert, die Dimensionen und der Würfel in Palo angelegt und anschließend die Daten in die OLAP-Datenbank geladen.


Talend Open Studio

Dabei wurden allerdings Komponenten verwendet, die in der „normalen“ Open-Source-Version immer noch nicht verfügbar sind. Die neuen Komponenten sind laut Aussagen von Talend „momentan in der Qualitätssicherung“ und werden irgendwann auch in der Download-Version enthalten sein. Ein Termin wurde immer noch nicht genannt weshalb wir jetzt auch nicht schlauer sind als zuvor. Immerhin haben nun scheinbar die drei Firmen, die die Entwicklung der Komponenten bezahlt haben, grünes Licht für deren Veröffentlichung. Abwarten und Tee trinken also… Ich werde natürlich berichten sobald es etwas Neues gibt.


Palo

In Palo wurde wieder das Excel-Plugin (mit dem bald erscheinenden Excel 2010 werden sich auch die Möglichkeiten weiter erhöhen) und Palo Web – quasi Excel im Internet – gezeigt. Mir imponieren die Reports mit ihren Sparklines und Grafiken immer wieder aufs Neue, auch wenn es einige Arbeit kostet diese in dieser Weise auch umzusetzen.


Fragen

Für Fragen blieben noch genau 11 Minuten Zeit, in denen es noch folgende Informationen gab:

  • Preise: Palo Premium (es wurden im Webinar einige Premium-Features gezeigt) beginnt bei 4600 € im Jahr für 10 Benutzer, Talend machte keine Angaben
  • die Anbindung von Open Office an Palo ist auch möglich, hierfür gibt es
  • Grenzen der Palo-Datenbank: Palo ist in erster Linie durch die Hardware (Arbeitsspeicher) begrenzt, keine pauschale Aussage an dieser Stelle
  • maximale Anzahl Zeilen im Excel: früherer Versionen machten bei knapp 64.000 Zeilen oder Spalten Schluss; dies ist heute nicht mehr der Fall aber die gleichzeitige Anzeige von so vielen Zeilen dürfte sehr selten sein
  • die Integration von Palo in Powerpoint wird von einem Partner bereitgestellt
  • Talend Open Studio vs. Palo ETL: Palo ETL gibt es, um beim ETL-Prozess nicht generell auf Dritte angewiesen zu sein; dennoch bietet sich insbesondere bei großen Mengen eher das Talend Open Studio an
  • die Spreadsheets sind in der Version 3.1 auch in der Community-Version enthalten, es fehlen aber der OLAP- und der Report-Manager
  • der Talend Open Profiler (hatte nichts direkt mit diesem Webinar zu tun) bietet die Möglichkeit anhand diverser Metriken den Überblick über den eigenen Datenbestand zu behalten
  • zuletzt noch die Frage wann man Daten direkt in Palo halten sollte oder wann ein Data Warehouse sinnvoll ist: wenn Daten aus mehreren Datenquellen zusammengefasst und bereinigt werden sollen und dabei viele Berechnungen durchgeführt werden sollen (anstatt dies in die Palo Rules zu packen) macht ein Data Warehouse wahrscheinlich Sinn


Fazit

Ein schöner Überblick und Talend Open Studio und Palo (leider jetzt wieder nur nach Registrierung) kann man kostenlos herunterladen.

Das Webinar wird es sicherlich in Kürze auch OnDemand nachzuschauen geben. Wer bis dahin Interesse an den Folien des Webinars hat, kann eine eMail an webinar@talend.com schicken.

Tags: , , , ,

Kommentare zu diesem Beitrag

  1. […] die Komponenten doch scheinbar schon fertig sind und stabil laufen – zumindest konnte man im Webinar von Talend und Palo im Mai 2010 diese Information bekommen. Die dort propagierte “Qualitätssicherung” ist […]

Jetzt einen neuen Kommentar abgeben



(optional, Ihr Name wird entsprechend verlinkt)