Nettoyage de base de données

Alléger une base pour la rendre plus compacte et plus performante
L'allègement, ou nettoyage, consiste à sortir de la base les données devenues inutiles, c'est à dire non essentielles au fonctionnement de la base de données et des applications qui en dépendent. Par exemple on peut vouloir supprimer des données historiques, des données redondantes, des données de traçabilité (logs), des données statistiques anciennes, des données issues de calculs, des données produits hors catalogue, des données de personnes ayant quitté l'Organisation... etc. Ce nettoyage peut consister en une suppression définitive des données, de leur déplacement vers une base de données archive, ou en un export sous un autre format de fichier.
L'allègement de base de données est à différencier de l'opération de segmentation de base de données dans laquelle on cherche plutôt à répartir les données - existantes et futures - dans d'autres bases ou dans plusieurs fichiers logiques d'une même base de données. Le nettoyage de données est aussi à différencier de l'opération de simplification (ou d'optimisation) des données, dans laquelle on cherche à réduire la place que prennent les données mais sans les retirer de la base. La simplification peut consister à réduire la redondance des données (à condition que cela ne réduise pas les performances de la base).
Si elle s'avère possible, la réduction du volume de données dans une base est une opération qu'il convient de réaliser périodiquement. Cela permet de rendre la base plus compacte - donc plus rapide et facile à sauvegarder - et la rendre plus performante. Les gains de performance sont obtenus à plusieurs niveaux :
- Un volume réduit de données prend moins de place dans les fichiers logiques de la base. Ces fichiers se chargent plus rapidement en mémoire lors des requêtes SQL.
- Un volume réduit de données est parcouru plus rapidement lors des requêtes SQL, notamment lors d'opérations impliquant des jointures multiples.
- Un volume réduit de données est sauvegardé plus rapidement sur disque lorsque des requêtes SQL modifient ces données.
- Un volume réduit de données permet de réaliser plus vite les opérations de maintenance de la base, ce qui la bloque moins longtemps.
- Un volume réduit de données à pour conséquence un fichier de sauvegarde de la base moins encombrant, ce qui facilite les opérations d'archivage.