Cours d'informatique décisionnelle

Cours d’Informatique Décisionnelle
Version de mars 2014
L’âge de pierre : gestion de l’information
- Dessin et peinture sur la roche
- main négative préhistorique de la Grotte du Pech
Merle (Lot, France).
L’âge de pierre
- Tout au début de la civilisation, l’homme préhistorique :
- Commence à s’adapter à son environnent,
- Il apprend la façon de tirer profit des ressources qui sont à sa disposition,
- D’un autre côté, il grave (stocke) l’information sur la pierre (la roche), art, gravures ou peintures rupestres, dans grottes, ou obélisque, totems, etc.
L’âge du bronze (métal)
…
L’âge du métal
- A l’âge de bronze, l’homme commence :
- à savoir comment transformer la roche en métal,
- Puis à créer des outils à partir du métal, - De nouvelles techniques apparaissent, - De nouveaux procédés apparaissent.
L’ère industrielle
L’ère industrielle
- L’homme :
- généralise l’approche utilisée pour créer des outils en métal et en bois, des outils de sa propre création :

- Il commence à créer des machines complexes,
- Début vers 1600, apparition de la machine à vapeur, le train, l’automobile, etc.
- Les procédés de création de machines sont de plus en plus nombreux, comment les documenter ?
Besoin de stocker et d’archiver l’information
- Avec le développement de l’industrie :
- Le besoin de stocker et d’archiver les données est créé, afin de :
- Avoir un moyen de contrôler l’activité des entreprises en général,
- Garder une trace écrite et,
- Pouvoir réitérer les mêmes processus organisationnels en question, autant que nécessaire dans le temps,
Stocker « papier» de l’information
image source licenced under the Creative Commons
Attribution-Share Alike 3.0 Unported, 2.5 Generic, 2.0 Generic and 1.0 Generic license. Attribution : Archivo-FSP
Dépôts d’information
- Le premier support de stockage d’information est le papier (papyrus, etc.), il en découle plusieurs dépôts d’information :
- Centre d’archives d’industries, d’entreprises,
- Registres des entrées/sorties,
- Historiques des achats/ventes,
- Livres, manuscrits, bibliothèques (privées ou publiques)

- Processus organisationnels et données non documentées (à documenter).
Informatique et nouvelles possibilités
- Avec l’apparition des premiers ordinateurs en 1930, permettant de stocker et de traiter des données ,
- Il est devenu possible d’envisager le stockage de données sur un support autre que le support PAPIER,
- La généralisation de l’approche mène à la création des centres de données
(serveurs).
Data Center (centre de données)
Data Center (centre de données)
- Capacité de stockage des centres de données actuels (2013) :
- Par exemple, le centre de données de l’UTAH
(centre américain national de cyber sécurité )
Data Center (centre de données)
Nouvelle problématique : Information Overload (surcharge d’information)
Recherche d’information
- Nouvelle problématique : comment accéder rapidement à l’information ?
- Information à propos d’un sujet donné,
- Solution à un problème donné,
- Décision à prendre,
- Plan d’actions à suivre.
Principe des moteurs de recherche
Limites des moteurs de recherche

(locaux et Web)
- Les résultats de recherche sont : - Affichés sous forme de listing,
- Les résultats sont très nombreux,
- Et il n’y a pas de conclusion ou de corrélation générale entre ces résultats,
- La surcharge d’information reste valable,
- Il y a un nouveau besoin en ce qui concerne l’accès à l’information utile, pertinente.
Les Ages de l’homme
- Age de pierre,
- Age du bronze,
- Age industriel,
- Age de l’information,
- Age de l’intelligence :
- Intelligence économique
Intelligence et Intelligence
- Il est nécessaire de différencier entre :
- Intelligence (en anglais), et
- Business intelligence (BI),

- La première désigne le degré d’implication + ou - intrusive d’un organisme dans ce qu’on appelle l’espionnage industriel.
Intelligence d’affaires
(économique)
- La deuxième désigne plutôt la capacité d’une entreprise à être en parfait contrôle des données et informations relatives à son propre domaine d’affaires (business).
- ensemble d’actions et de réactions, basées sur l’utilisation « intelligente» de l’information pour des fins à utilité économiques.
Définition de l’intelligence
économique
- ensemble de théories, méthodologies, procédures (fonctionnelles et techniques), processus, architectures et technologies .
- collectent, consolident, modélisent, transforment, et restituent des collections de données brutes
- en informations pertinentes et utiles à destination des acteurs « métier» pour leur permettre d’agir, à des fins économiques et stratégiques.
Définition de l’intelligence
économique
- traiter de grandes quantités d'informations (du passé).
- pour aider à identifier et développer de nouvelles opportunités (pour le futur).
- En conséquence, l’usage de ces nouvelles opportunités et mettre en Å“uvre une stratégie efficace peut fournir un avantage concurrentiel et la stabilité de l’activité ou entreprise à long terme.

Bases de l’informatique décisionnelle Informatique décisionnelle
- L’informatique décisionnelle :
- en anglais : DSS pour Decision Support System
- ou encore BI pour Business Intelligence
- désigne les moyens, les outils et les méthodes et les techniques
- qui permettent d'offrir une aide à la décision et
- de permettre aux responsables de la stratégie d’un organisme (économique, administratif, ou politique),
- d’avoir une vue d’ensemble de l’activité traitée, et d’élaborer un processus de prise ou d’aide à la décision.
Exemple de système de support à l'aide à la décision (géographique)
Prise de décision
- La prise de décision peut être considérée comme le processus cognitif ,
- qui entraîne la sélection d'un plan d'action parmi plusieurs scénarios alternatifs.
- Chaque processus décisionnel produit un choix final. La sortie/output peut être une action ou une opinion, ou un choix.
Exemple de prise de décision
Arbre de décision :
+/- calcul de probabilités
Arbre de décision :
+/- calcul de probabilités
Relation entre décisionnel et intelligence économique
- Dans le domaine des finances, et de l’économie, une simple décision ou simple mauvais choix peut coûter à l’entreprise des millions.
- Le décisionnel atteint sa plus grande importance dans le domaine financier.

Processus de prise de décision dans la business intelligence
- La prise de décision puis l’action stratégique à suivre sera basée :
- Non pas sur les données brutes,
- Non pas sur les données extraites, et traitées,
- Mais sur le résultat de transformation, puis de chargement puis représentation de ces données :
- Sous forme de rapports, diagrammes, etc.
Système d’information
- L'utilisation combinée de moyens informatiques, électroniques et de procédés de
télécommunication permet aujourd'hui -
- selon les besoins et les intentions exprimés- d'accompagner, d'automatiser presque toutes les opérations incluses dans les activités en entreprise.
Système d’information
- Un système d'information (SI) est un ensemble organisé de ressources (matériels, logiciels, personnel, données et procédures)
- qui permet de collecter, regrouper, classifier, traiter et diffuser de l'information sur un environnement donné.
Système d’information d’aide à la décision (ou décisionnel)
- Dés que l’on parle de « Informatique décisionnelle», nous sommes obligé d’introduire le terme de SID (Système d’Information
Décisionnel).
- Le SID a pour objectif de fournir des indicateurs sur la vie de l’entreprise. Pour cela, il exploite une richesse déjà à sa disposition : l’ensemble des données qu’une entreprise génère dans le cadre de son activité.
Historique de la BI : Ralph kimball
- Ralph Kimball (Né en 1944) est un auteur autour du sujet « entrepôts de données» et de la business intelligence. Il est largement considéré comme l'un des architectes du « datawarehouse».

- Sa méthodologie, aussi connu comme la modélisation dimensionnelle ou la méthodologie de Kimball, est devenu le standard dans le domaine de l'aide à la décision.
- L'apport de la méthodologie kimball est de montrer la manière de mener à bien un projet décisionnel, c'est à dire comment créer un système d'information décisionnel.
Historique de la BI : Bill Inmon
- William H. Inmon (né en 1945) est un informaticien américain, reconnu par beaucoup comme le père du datawarehouse.
- Inmon écrit le premier livre, tient la première conférence (avec Arnie Barnett), a écrit la première colonne dans un magazine et a été le premier à offrir des cours sur le sujet.
Historique de la BI : Bill Inmon
- Inmon donne la définition de ce qu’un datawarehouse : c’est un ensemble de données non volatiles, orienté par un sujet donné, relatif à un temps donné, en support à des décisions pour le management.
- Par rapport à l'approche Ralph Kimball, l'approche de Inmon est souvent caractérisée comme une approche top-down.
- L'apport de l'approche de bill inmon consiste à montrer ce que doit faire un système d'information décisionnel.
Construction d’un entrepôt de données
Quelques explications
ODS : operational data storage.
- Serveur de stockage de données opérationnel.
SCM : supply chain management.
- Gestion de la chaîne logistique.
ERP : enterprise ressource planning. - Progiciel de gestion intégré.
Data vault : modélisation de BDD relationnelles
Sources de données
- Il faut savoir qu’un SI habituel traite et génère un ensemble de données « brutes» , les sources de données (Finances, ERP, CRM, etc.) utilisées dans l’entrepôt de données peuvent provenir de :

- Données structurées : - Base de données relationnelles hétérogènes,
- MS SQL SERVER, IBM DB2, Oracle, Informix,
- XML, Excel,
- Serveurs applicatifs, CRM (gestion de relation client),
- Données non structurées :
- Fichiers plats, logs de scripts,
Exemple d'ERP : openERP
Fichier plat
- Une base de données orientée texte est un modèle de base de données sous la forme d'un simple fichier.
- Un fichier plat est un fichier texte ou du texte combiné avec un fichier binaire contenant généralement un seul enregistrement par ligne.
Extract Transform and Load
- l’extraction (récupération/collecte) de données stockées à partir de différentes sources de données, applications de l’entreprise, puis,
- La transformation du résultat pour être adéquat avec le format destination souhaité (voir cube OLAP), puis
- Le chargement/intégration/enregistrement du résultat dans des datamarts indépendantes.
Exemple d’outil ETL : Talend Open Studio
Transformation de données
- Le but est de transformer, traduire, convertir les données brutes précédemment extraites au format du datawarehouse au moment de la copie.
- en des informations dotées de sens, et utiles de point de vue économique, stratégique ou organisationnel.
- Trier, résumer, consolider, vérifier l’intégrité, réaliser les indices.
Intégration de données
- si la donnée unitaire est la matière première, elle n’a que peu d’intérêt en tant que telle.

- Elle ne prend tout son sens que lorsque, regroupée avec d’autres données unitaires, elle forme un indicateur utile.
- D’où l’intérêt de ce que l’on appelle l’intégration de données.
Intégration de données
L'intégration consiste à concentrer les données collectées dans un espace unifié, dont le socle informatique essentiel est l'entrepôt de données.
Elément central du dispositif, il permet aux applications décisionnelles de bénéficier d'une source d'information commune, homogène, normalisée et fiable, susceptible de masquer la diversité de l'origine des données.
Intégration de données : fusion de 2 tables contenant les mêmes champs
Nettoyage des données : pourquoi
- Après l’agrégation de l’ensemble des données provenant des différentes sources de données, il se peut que l’on aie comme résultat :
- Des redondances (des n-uplets identiques),
- Des incohérences (des n-uplets contradictoires), erreurs de saisie, etc.
- Des erreurs (une transformation non réussie).
solution
- Le nettoyage des données permet de:
- vérifier et de corriger les données
- tout en assurant la standardisation des formats des n-uplets des tables de bases de données.
- Les procédés de nettoyage de données permettent d’optimiser la qualité et la cohérence de l’ensemble des données.
quoi
- Le nettoyage de données consiste à :

- Corriger les erreurs de saisie, de frappe,
- Vérifier l’intégrité des domaines par ex. les dates, (15/02/2000 vs 02/15/2000) pour les notations francophones et anglophones, les valeurs telles que Centrimètre ou Pouce, KM ou Mile, etc.
- Proposer une alternative aux données nulles, manquantes, champs vides,
comment
- Valeurs manquantes (nulles)
- Ignorer le tuple
- Remplacer par une valeur fixe ou par la moyenne
- Valeurs erronées ou inconsistantes
- Détecter par une analyse de voisinage
- Ecart par rapport à la moyenne
- Remplacer par une valeur fixe ou par la moyenne
- Inspection manuelle de certaines données.
Datawarehouse et Datamart
- Parmi les termes qui reviennent le plus souvent dans le domaine de l’intelligence économique, on note :
- Datawarehouse : regroupe toutes les données applicatives de l’entreprise, et représente l’élément principal du système d’information décisionnel.
Datawarehouse (entrepôts de données)
- L'entrepôt de données assure la consolidation des contenus sous forme de structures destinées à en faciliter la manipulation par les outils d'analyses, puis le stockage de ses données.

- base de données centrale utilisée pour le traitement, stockage, et présentation d’un ensemble de données provenant de différentes sources de données indépendantes, et hétérogènes.
Datamart (magasin de données)
- Les datamarts (BDDR) généralement alimentés depuis les données du datawarehouse, sont des sous-ensembles d’informations
- destinés à fournir des données (et informations) aux utilisateurs finaux,
- souvent spécialisés vers un groupe, département, ou un type d'affaire (business), ou métier particulier de l’entreprise (marketing, risque, contrôle de gestion.)
Exemple de datamarts pour le domaine de la gestion de production
OLAP : représentation des données en SID
- Online Analytical Processing est un terme utilisé dans le domaine du décisionnel, pour désigner le traitement analytique en ligne.
- OLAP est une application/technique informatique orienté vers l'analyse instantané de données économiques selon plusieurs axes (dimensions),
- dans le but d'obtenir des rapports de synthèse tels que ceux utilisés en analyse financière, et aider la direction à avoir une vue transversale de l'activité d'une entreprise.
Exemple de cube OLAP : tableau multi-dimentionnel
OLAP : représentation des tables de données en Cube à 3
dimensions
Produit s | Villes | Temps |
P1 ![]() | V1 | T1 |
P1 | V2 | T2 |
p2 | V1 | T1 |
p3 | V3 | T3 |
Perspective = Dimensions
- Produit, et Région représentent ici des points de vue ou perspectives ou dimensions
- Une dimension est tout ce qui permet de consulter les données (les ventes) selon une catégorie ou repères, et nous donner une meilleure/différente perspective/point de vue.
Table de dimension
- La Table de dimension contient :
- les axes (dimension) étudiées dans l'analyse

- selon lesquels on veut étudier des données à mesurer
(les faits).
- Exemple de dimension :
- Les produits (référence, famille, etc.
- le temps (jour, mois, période, année, etc.
- La Localisation (ville, pays, territoire, etc.,
Ventes par produit et par période
- Par ex. vous pouvez avoir besoin de consulter les ventes d’un produit selon/durant une année.
Produits/Année | 2001 | 2002 |
P1 | 1000 | 989 |
p2 | 12000 ![]() | 1099 |
p3 | 1220 | 1223 |
Vente par région et par période
- Puis, vous pouvez souhaiter d’avoir un point de vue différent sur les ventes en consultant les performances d’un produit selon une région.
Produits/Région | Afrique | Europe | Amérique |
P1 | 13000 | 1989 | 1245 |
p2 | 100 ![]() | 1234 | 2676 |
p3 | 1343 | 342 |
Table de faits :
- La Table des faits contient les données observables (les faits, par exemple Quantité, Montant) que l'on possède sur un sujet et que l'on veut étudier,
- selon divers axes d'analyse (les dimensions), par exemple : Produit, Ville, Année.
Les tables situées aux extrémités sont les tables de dimensions ou niveaux de suivi.
Fait : mesure
- Un fait est l'abréviation de « fait observable», on peut l'appeler également « mesure», qui est l’abréviation de mesure économique.
- Pour exemple, on peut avoir la nécessité de mesurer la quantité, le prix de vente, et le montant (de vente totale) concernant des produits vendus, par type de produit, par date, et par localisation.
Mesures : intersection de deux dimensions
- Si l’on considère que l’on doit manipuler des tables à deux dimensions, considérons à titre d'exemple les deux dimensions suivantes
« produit» et « année»,

- l’information/ou donnée (en vert dans la TDF) qui va résulter de l’intersection de ces deux dimensions peut être :
- Profit, Vente, Prix, Quantité, etc.
Modèle en étoile
- le modèle de données « en étoile» est typique des structures multidimensionnelles stockant des données atomiques ou agrégées.
- La table située au centre de l'étoile est la table des faits ou mesures (ou encore métriques) : ce sont les éléments mesurés dans l'analyse comme les montants, les quantités, les taux, etc.
Modèle en étoile : schéma
Modèle en étoile : exemple
Hiérarchie : fils de dimension
- Considérons cette fois-ci, que vous voulez consulter les ventes par région, mais que vous voulez approfondir votre recherche par ville, etc.
- C’est ici, que la notion de hiérarchie intervient en décomposant les dimensions, en sous-unités permettant
- d’avoir une meilleure granularité des résultats.
- Flocon : variante du modèle en étoile : chaque table de dimension fait apparaître la hiérarchie sous-jacente (catégorie pour produit).
Modèle de données en flocon
Creative Commons Attribution-ShareAlike 3.0 License. Attribution : SqlPac
Modèle de données en flocon : exemple
Wikipedia
Chargement de données
- Cela consiste à représenter les données dans un format compréhensible (rapports).
- Puis le distribuer/publier vers l’utilisateur final, en général détenant des compétences d’analyse financière/économique, ou stratégique. La distribution peut être par portail Web, mail, ou autre, etc.
Restitution, Représentation, et diffusion des données
- Représentation visuelle des données rentre sous le terme « data visualization».
- La représentation graphique de données statistiques ou visualisation de données statistiques est un résumé visuel des données chiffrées. Elle permet en un seul coup d'Å“il d'en saisir la tendance générale.
Rapports graphiques
Limites de la restitution de données
- La représentation de résultats sous forme de rapports (à valeur économique) ou le « reporting» n’est pas suffisant pour pouvoir conclure des décisions stratégiques.

- Un autre domaine intervient ici, c’est ce que l’on appelle « data analytics», ou l’analyse de données.
Beaucoup de données mais sans information à premier abord
Creative Commons Attribution 2.0 Generic licence. Attribution : Rafael Matsunaga
Data analytics
- Obtenir l’information à partir de la donnée,
- Regrouper les éléments de prise de décision,
- Utilisabilité du tableau de bord par
- Des employés avec connaissance limitée en:
- bureautique,
- Des employés sans connaissance approfondie en :
- Informatique, bases de données,
- En finance-comptabilité,
- Ressources humaines,
- Logistique, productique,
Outils de business intelligence
Business Intelligence
Reporting Tool

- BIRT est un système de reporting pour les applications basées sur Java et Java EE (en particulier).
- BIRT a deux composantes principales:
- un concepteur de rapport basé sur Eclipse,
- et un composant d'exécution que vous pouvez ajouter à votre serveur d'applications.
- BIRT propose également un moteur de diagrammes qui vous permet d'ajouter des graphiques pour votre propre application.
Possibilités de BIRT
- Avec BIRT , vous pouvez ajouter une riche variété de rapports à votre application .
- Listes - Les rapports les plus simples sont des listes de données . Comme les listes s'allongent , vous pouvez ajouter le regroupement pour organiser les données ( commandes groupées par client, produits regroupés par le fournisseur) .
- Si vos données sont numériques, vous pouvez facilement ajouter des totaux (sum), des moyennes (avg) et d'autres résumés .
Possibilités de BIRT
- Graphiques - Les données numériques sont beaucoup plus faciles à comprendre lorsqu'ils sont présentés sous forme de graphiques. BIRT fournit des camemberts, graphiques linéaires et beaucoup plus. Les
- Les Graphiques BIRT peuvent être rendus en SVG et soutien des événements pour permettre une interaction de l'utilisateur .
Exemple de diagramme
Possibilités de BIRT
- Tableaux croisés (également appelés un tableau « crosstab» ou matrice) montre les données en deux dimensions : les ventes par trimestre par exemple.
- Lettres & Documents - Avis, des lettres et d'autres documents textuels sont faciles à créer avec BIRT.
- Les documents peuvent inclure du texte, mise en forme , des listes , des tableaux et plus .
Tableau croisé avec Eclipse BIRT
Création de cube OLAP avec BIRT
- Rapports composés - De nombreux rapports doivent combiner tout ce dont on a parlé en un seul document .

- Par exemple, une déclaration à la clientèle peut indiquer l'information pour le client, fournir un texte sur les promotions en cours, et de fournir des listes de paiements et les charges.
- Un rapport financier peut inclure des avertissements, des graphiques, des tableaux, toutes avec beaucoup de formatage qui correspond à des couleurs de l'entreprise.
- Les Rapports BIRT se composent de quatre parties principales : les données , les transformations de données , la logique « métier» et présentation .
- Les Données - Bases de données , services Web, objets Java, peuvent fournir des données à votre rapport de BIRT. BIRT offre un support pour les sources de données JDBC , XML , Web Services , et fichiers plats, ainsi que le soutien pour l'utilisation de code pour obtenir d'autres sources de données .
- En outre, un seul rapport peut inclure des données provenant de plusieurs sources de données . BIRT fournit également une fonctionnalité qui permet aux sources de données disparates pour être combinés en utilisant jointures internes et externes.
- La Transformation des données - les rapports présentent des données triées, résumées, filtrées et regroupées pour répondre aux besoins de l'utilisateur.
- Bien que les bases de données peuvent faire partie de ce travail, BIRT doit le faire pour les sources «simples» de données telles que des fichiers plats ou des objets Java.
- BIRT permet des opérations complexes telles que le regroupement sur les sommes (sur différentes dimensions, ce qui n'est pas possible avec l'utilisation d'un simple groupe by et decode), les pourcentages des totaux globaux et plus.
- Business Logic (la logique métier) - les données du monde réel sont rarement structurées exactement comme on le souhaite pour un rapport.
- De nombreux rapports exigent une logique métier spécifique pour convertir des données brutes en informations utiles pour l'utilisateur.
- Si la logique est juste pour le rapport, nous pouvons utilisez un script, puisque BIRT supporte JavaScript. Si votre application contient déjà la logique, vous pouvez l'utilisez dans votre code Java existant.
- Présentation - Une fois que les données sont prêtes, vous avez un large éventail d'options pour le présenter à l'utilisateur. Tableaux, graphiques, texte et plus encore.
- Un seul ensemble de données peut apparaître dans de multiples façons, et un seul rapport peut présenter des données à partir de plusieurs ensembles de données.
Architecture de BIRT

Limites de BIRT
- Pour l'instant BIRT ne gère pas :
- L'analyse statistique,
- Les outils de Data Mining,
- Les outils de modélisation du Data Warehouse,
- Les outils Extract Transform and Load (ETL).
Spago BI
- SpagoBI est une solution de Business Intelligence entièrement open source.
- Cette solution fait partie de l'initiative libre/open source SpagoWorld, fondée et soutenue par Engineering Group.
- SpagoBI est distribué sous licence Mozilla Public License, qui est compatible avec les usages commerciaux.
SpagoBI Architecture
SpagoBI
SpagoBI studio, sdk, meta
- SpagoBI Studio est l’environnement de développement intégré qui permet aux développeurs de concevoir et modifier les modèles des différents moteurs d’analyse, comme rapports, diagrammes, rapports d’analyse géographique et tableaux de bord.
- Ce module soutient la phase de déploiement, où les documents analytiques sont testés et publiés sur SpagoBI Server, avec lequel SpagoBI Studio interagit grâce à SpagoBI SDK.
- SpagoBI SDK est utilisé pour l’intégration des services fournis par SpagoBI Server. Il permet d’intégrer des documents à travers un éventail de services web et de publier les documents SpagoBI dans de portails et applications externes.
Spago BI
- SpagoBI Meta a été spécifiquement conçu pour la gestion et interrogation des métadonnées.
- La plateforme permet la gestion des métadonnées techniques et des métadonnées métier, en permettant aux administrateurs et utilisateurs d’interpréter correctement leurs sources de données.
- SpagoBI Server est le module principal de la suite, qui offre toutes les fonctionnalités centrales et analytiques de la plateforme.

Rapports, pour l'affichage des données structurées,
Rapports, pour l'affichage des données structurées,
Analyse OLAP, pour consulter et naviguer à travers les données,
Diagrammes, pour l'affichage simple et intuitif des informations,
Tableaux de bord en temps réel, pour suivre l'évolution des indicateurs clé
de performance,
Modèles d'Indicateurs clé de performance pour développer et tester des modèles de monitorage
des performances,
Cockpits, pour générer des tableaux de bord structurés et interactifs,
Exécuter les processus externes qui peuvent interagir avec des systèmes de traitement de transactions en ligne (OLTP),
Smart Filter, pour la sélection guidée des données
Analyse géo-référencée, pour l'affichage des informations sur une base géographique
Analyse géo-référencée, pour l'affichage des informations sur une base géographique
Spago ETL
- SpagoBI comprend un outil de chargement et la gestion des données (ETL) dans l'entrepôt de données.
- Le Moteur ETL SpagoBI intègre la suite open source Talend Open Studio TOS de produits open source.
ETL/ EII, pour collecter les données de différentes sources.
Talend Open Studio
- Talend est un éditeur de logiciels open source qui permet :

- l'intégration des données,
- la gestion des données,
- l'intégration d'applications d'entreprise
- L’intégration des logiciels et les services de données grand.
- L’outil qui nous intéresse de près est : Talend Open Studio for Data Integration: une application open source pour la conception des tâches (jobs) d'intégration de données avec un environnement de développement graphique.
Talend ETL
Pentaho
- Le deuxième outil open source et gratuit le plus populaire est « Pentaho Data Integration». Pentaho est une entreprise fondée en 2004,
- Il propose une suite de produits open source pour la business intelligence appelés Pentaho
Business Analytics pour fournir des services :
- pour l'intégration de données, les services OLAP, reporting, tableaux de bord, l'exploration de données et les outils ETL.
ETL de Pentaho (kettle pour l’ETL, et spoon pour la GUI)
Pentaho ETL (kettle pour l’ETL, et spoon pour la GUI)
Outils de BI payants
- Microsoft BI (idéal pour les SGBD microsoft SQL server, avec ses différentes composantes ssrs, ssas, ssis, etc.)
- Sap Business Objects (idéal pour les systèmes utilisant des ERP de SAP),
- Oracle Business Intelligence Enterprise Edition
(idéal pour les SGBD oracle),

- IBM cognos (idéal pour les SGBD db2),
Futur de la business intelligence
- Big Data :
- Analyser d’énormes quantités de données, - partir de sources structurées :
- Base de données, systèmes opérationnels, Servers, etc.
- À partir de sources non structurées :
- Blogs, Réseaux sociaux, sites Web de tous genres, etc.
- Data Visualization :
- Visualisation de données de façon à faire apparaître l’information rapidement et la rendre compréhensible par les utilisateurs.
Merci pour votre attention
Questions ?