Pentaho : mise en place d'une solution open source de business intelligence

Ce livre sur Pentaho s'adresse à tout informaticien désireux de mettre en place les principales briques de ce
puissant outil de Business Intelligence Open Source . Pour chaque brique de la suite Pentaho détaillée dans
le livre (en version 3.6 au moment de l'écriture), une procédure d'installation est décrite en détail. L'auteur
propose ensuite une présentation détaillée puis une étude de cas avec de nombreux exemples concrets. Plutôt
qu'une étude exhaustive des multiples composants faisant partie de la suite Pentaho , l'option retenue est de
mettre l'accent sur les modules principaux en privilégiant une approche par l'exemple .
Dans les premiers chapitres, après une présentation rapide des concepts utilisés en Business Intelligence , l'auteur
propose une prise en main rapide de Pentaho (installation de la suite, interfaces d'administration...)
accompagnée de nombreux exemples d'utilisation. Des rappels sont ensuite faits sur la modélisation ( modèle
en étoile, modèle en flocon de neige, cube, dimension, mesure, ...) et sur la construction d'un Datawarehouse .
Les fonctionnalités de l' ETL Pentaho Data Integration sont listées et de nombreuses transformations sont analysées.
L'auteur décrit le générateur de rapports Adhoc (WAQR) toujours au travers d'exemples.
Une partie importante du livre est consacrée au puissant générateur de rapports et de graphes Pentaho
Report Designer , illustrée là encore par de nombreux exemples. Un autre volet conséquent est dédié à la
modélisation et à l'exploitation de cubes de données multidimensionnelles. Mondrian (moteur multidimensionnel),
MDX (langage de manipulation de données multidimensionnelles), JPivot (interface de restitution
des résultats) et Pentaho Schema Workbench (assistance à la modélisation) sont détaillés. Le module
Pentaho Aggregator Designer vient optimiser l'exploitation des données sous Mondrian en réalisant des
agrégations. Le module Pentaho Design Studio (PDS) , servant à l'installation des développements réalisés
(transformations, analyses, rapports, ...) sur le serveur Web Pentaho est aussi largement commenté.
L'auteur met également en avant l'interopérabilité de la suite Pentaho avec des briques Open Source tierces,
comme le générateur de rapports BIRT . Le puissant outil de Data Mining Weka , désormais intégré dans la
suite Pentaho , et qui permet l'analyse des données au travers de multiples algorithmes est traité. L'auteur
décrit la gestion des métadonnées via Pentaho Metadata Editor qui rend l'exploitation des données plus
aisée dans les différents modules de la suite Pentaho par la création de vues métier .
L'ensemble des exemples et les jeux de données nécessaires sont en téléchargement sur le site www.editions-eni.fr.