Talend & Palo – tPaloCube, tPaloCubeList

Donnerstag, 09. Februar 2012, 10:10 Uhr

Noch keine Kommentare

Nach dem Anlegen von Dimensionen innerhalb der OLAP-Datenbank Palo und Jedox können die Cubes (Datenwürfel) erstellt werden. Wenn die Cubes mit Hilfe des ETL-Tools Talend Open Studio for Data Integration erstellt werden sollen, dann gibt es dafür die Komponente tPaloCube.

Dieser Artikel ist der 3. Teil einer kleinen Serie, in der die Komponenten des Talend Open Studio for Data Integration vorgestellt werden, mit deren Hilfe mit dem OLAP-Server der Palo BI-Suite oder der Jedox BI-Suite kommuniziert werden kann. Auch wenn zumeinst nur von “Palo” die Rede ist, so gelten die Beschreibungen in analoger Weise auf für die (kommerzielle) Jedox BI Suite (weitere Informationen zur Abgrenzung von Jedox und Palo).

tPaloCube – Cube anlegen, löschen oder überschreiben

Um einen neuen Cube anzulegen oder auch einen bestehenden Cube zu löschen oder zu ersetzen steht tPaloCube zur Verfügung. Da sich ein Cube innerhalb von Palo aus x-beliebigen Dimensionen definiert, müssen vor dem Anlegen des Cubes die Dimensionen bereits existieren, sie müssen allerdings nicht zwingenderweise bereits mit (allen) Elementen gefüllt sein. Eine Anleitung zum Anlegen vom Dimensionen gibt es im 2. Teil dieser Serie.

Die dafür nötigen Einstellungen der Komponente tPaloCube sind schnell erklärt:

Der Cube wird aus den Dimensionen "Land" und "Kennzahl" erstellt.

Die Reihenfolge der Dimensionen ist zwar grundsätzlich beliebig aber nicht egal denn sie hat Einfluss auf die Koordinaten der Daten, die später in der korrekten Reihenfolge innerhalb der PALO.DATA-Funktion eingegeben werden müssen. Klingt jetzt „schlimmer“ als es wirklich ist, denn normalerweise bedient man sich später der Hilfe der Excel-Plugins oder der Web-Oberfläche Palo Web und darin werden die PALO.DATA-Funktionen automatisch generiert. Ich habe mir zumindest angewöhnt, dass die Kennzahlen-Dimension immer die letzte Dimension in der Liste ist.

tPaloCubeList – Liste aller Cubes einer Palo-Datenbank

Die Komponente tPaloCubeList ist eine sehr unspektakuläre Komponente, deren einzige Aufgabe es ist, eine Auflistung aller Cubes einer Datenbank zurückzugeben. Obligatorische Angaben sind die Verbindung zum Palo-Server sowie der Datenbankname. Die zurückgelieferten Daten lassen sich testweise per tLogRow ausgeben oder anweitig verarbeiten und entsprechen dann folgendem Schema:

  • cube_id – interne (technische) ID des Cubes
  • cube_name – Name des Cubes
  • cube_dimensions – Anzahl der Dimensionen
  • cube_cells – Produkt aus der Anzahl Elemente aller Dimensionen
  • cube_filled_cells – Zellen innerhalb des Cubes, die ungleich 0 sind (eine leere Zelle enthält per Definition den Wert 0)
  • cube_status – 1 für „geladen“, 0 für „nicht geladen“
  • cube_type – 0 für einen „normalen“ Cube, 1 für einen Cube vom Typ „User Info“ und 2 für Attributswürfel

Tags: , , , ,

Kommentare zu diesem Beitrag

Bisher wurde noch keine Kommentare abgegeben.
Sie können also die oder der Erste sein.

Jetzt einen neuen Kommentar abgeben



(optional, Ihr Name wird entsprechend verlinkt)