Fiabilisation de données informatiques

Le problème du manque de fiabilité ou de la perte de fiabilité des données
La fiabilisation des données numériques est un sujet d'importance, au même titre que leur stockage et leur sécurisation. Les données informatiques peuvent être facilement modifiées - que ce soit intentionnellement ou non - et donc prendre des formes non souhaitables. Mais aussi, au fil de leur existence les données se retrouvent dupliquées, modifiées, transformées, et réapparaissent dans le système d'information sous forme de doublons, ou avec un degré d'incertitude lié à leur version.
Par exemple, une partie des informations d'une entité (individu ou organisme) peut être perdue lors d'une manipulation informatique; un format de date peut subir une inversion dans un logiciel qui interprète les dates au format américain au lieu du format français; les données d'un catalogue produits peuvent être modifiées à plusieurs niveaux après une gestion par le SAV. Les exemples sont nombreux, les cas particuliers courants.
Il est normal que dans la vie numérique d'une Entreprise, d'un Service, ou d'une application informatique, la qualité et la fiabilité des données soit remise en question. C'est le cas lorsque la décision est prise d'intégrer les données issues de plusieurs sources, et lorsqu'on souhaite exploiter les données dans un projet BI (business intelligence) ou pour du reporting. Les données inconsistantes sont problématiques : elles causent des pertes de temps, un défaut de confiance, une réduction de valeur (valeur que ces données pourraient avoir dans une situation idéale).
Fiabiliser les données pour retrouver un état cohérent et exploitable
La solution est de procéder à une fiabilisation des données qui posent problème. Tâche délicate - voire particulièrement difficile - lorsque le SI est vaste et que les sources de données sont nombreuses. Mais pas impossible. L'Expert Data est chargé de la mission de reconnaissance des données, de leur intégration (en général au sein d'un système intermédiaire conçu à cet effet), de leur nettoyage et fiabilisation, puis de leur mise à disposition du SI. Combinant des expertises multiples (audit et cartographie, bases de données, stockage de données, analyse de données, ETL) il dresse un plan d'action précis pour remettre de l'ordre dans les jeux de données qui posent problème.
Outre le bénéfice de retrouver des données « propres » et uniques, la mission de fiabilisation apporte un autre bénéfice : les nouveaux jeux de données permettent d'envisager une exploitation dans le cadre de nouveaux services destinés aux utilisateurs et aux processus de l'Entreprise. De la valeur nouvelle est ainsi créée, avec de possibles profits à la clé.