|
L’engouement pour les systèmes décisionnels a poussé des communautés de
programmeurs à développer des outils Open Source gratuits pour
satisfaire les demandes des entreprises à budget limité.
Dans chaque domaine du décisionnel, de nombreux projets indépendants ont
vu le jour. Ce document a pour vocation de présenter succinctement les
principaux projets dans les domaines que sont l’ETL, les serveurs OLAP,
le datawarehouse, le reporting et le datamining.
Dans un dernier point seront présentées les offres de suites décisionnelles
, qui mettent en commun un certain nombre des solutions évoquées pour gérer
l’ensemble du processus décisionnel.
1. Les ETL open source
Pour collecter les données éparses des entreprises, les outils
d’ETL (Extract, Transform, Load) permettent
d’alimenter les datawarehouse à partir des multiples
sources de données.
Les outils Octopus,
CloverETL
et Ketl sont des ETL
ne possédant pas d’interface graphique. Il est donc
nécessaire de connaître les langages de programmation associés
pour pouvoir les utiliser.
Pentaho Data Integration
(anciennement Kettle, renommé pour intégrer la suite
Pentaho
et Talend
sont des produits à peu près
équivalents qui proposent une interface graphique. Ils sont
donc ergonomiques et accessibles à des spécialistes du
décisionnel sans connaître de langages de programmation.
L’outil Talend a l’avantage sur kettle de pouvoir
gérer les contextes (développement, intégration, production).
2. Les serveurs OLAP open source
Pour effectuer les analyses multidimensionnelles, plusieurs logiciels
Open Source ont été créé, dont ces deux plus importants :
-
Palo, qui inclue une intégration dans Microsoft Excel.
-
Mondrian,
plus populaire, est notablement rattaché au projet Pentaho mais
est également utilisé par la suite décisionnelle SpagoBI.
3. Les Datawarehouse open source
Bien que l’ensemble des logiciels de rapports et d’ETL
Open Source puissent
se connecter aux SGBD propriétaires du marché (Oracle, SQL server …), le
projet Bizgres est un datawarehouse basé sur le SGBD
Open Source PostgreSQL.
4. Les outils reporting open source
De multiples outils de génération de rapports et graphiques,
Open Source
ont vu le jour. Parmi les plus utilisés nous pouvons citer :
-
JasperReport
de la société JasperSoft, qui a créé une suite décisionnelle autour
de cet outil performant.
-
BIRT de
la société Eclipse a l’avantage d’être très simple
d’utilisation.
-
JFreeReport qui a rejoint le projet pentaho.
-
JXLS,
spécialisé dans la restitution Microsoft Excel des rapports.
OpenReports est un outil permettant la planification et la gestion des paramètres pour les outils de reporting. Il supporte ces 4 technologies.
5. Les outils de datamining open source
L’outil de datamining Open Source le plus complet est proposé par
l’université de Waikato en Nouvelle-Zélande :
WEKA.
Le groupe Pentaho est devenu le principal sponsor de cet outil, qui est de
ce fait intégré dans leur suite. Il est également compatible avec la suite
SpagoBI.
YALE, de
l’université de Dortmund (Allemagne), reprend le cœur
de WEKA en y ajoutant une interface graphique plus élaborée.
Orange, de
l’université de Ljubljana (Slovénie).
6. Les plateformes décisionnelles
Plusieurs éditeurs open source proposent des outils permettant de gérer
l’ensemble de la chaîne décisionnelle.
Pentaho Corporation
est de ce point de vue la plus évoluée, ayant rassemblé les principaux
outils Open Source dans tous les secteurs du décisionnel.
Engineering Ingegneria Informatica a fondé l’outil
SpagoBI qui regroupe également plusieurs technologies.
JasperSoft, fort d’une technologie de reporting performante
(JasperReport), s’est lancé plus récemment dans la production de la
suite décisionnelle
JasperIntelligence.
Ces 3 plateformes regroupent les différents outils évoqués ci-dessus. Les
rapprochements peuvent ce résumer par ce tableau :
|
Outils / Editeurs
|
Pentaho
|
SpagoBI
|
JasperIntelligence
|
|
ETL
|
Pentaho Data Integration (Kettle)
|
Talend
|
JasperETL (Talend)
|
|
Reporting
|
Pentaho JFreeReport
JasperReport
BIRT
|
JasperReport
BIRT
|
JasperReport
iReport
|
|
Serveur OLAP
|
Mondrian
|
Mondrian
|
JasperAnalysis
|
|
Data Mining
|
WEKA
|
WEKA
|
N.C.
|
L’avantage de l’Open Source est de pouvoir assembler les outils
préférés de manière à obtenir une solution personnalisée. Néanmoins, un
effort sur l’intégration serait nécessaire contrairement à
l’utilisation de l’une de ces trois suites.
En résumé, bien que ces technologies soient fiables et performantes, il
manque des références client qui leur fournirait une meilleure
reconnaissance et une plus grande popularité.
Pourtant, ces solutions méritent d’être étudiées de près et
comparées aux offres propriétaires du marché. Le
développement de ces produits se fait avec une très forte
interactivité avec les utilisateurs, parfois même une
collaboration, ce qui tend le produit à répondre à de
nombreux cas concrets.
|