Les petits papiers de SQLPro

NOTA : la structure de la base de données exemple, ainsi qu'une version des principales bases utilisées sont disponibles dans la page « La base de données exemple ».

Si les SGBDR sont dotés d'un optimiseur, cela n'empêche pas ce dernier de se tromper ou d'être limité par le carcan de votre expression de requête. De plus l'optimiseur étant interne au SGBDR, il n'a aucune influence sur le SGBDR lui-même, la machine ni l'infrastructure du réseau, élément décisif en matière de rapidité de traitement des flux de données.
Voici donc, point par point, les éléments qu'il faut prendre en considération pour « booster » votre SGBDR et l'exécution des requêtes SQL !

L'environnement informatique, c'est-à-dire l'architecture globale du SI, a une influence déterminante sur les performances du SGBDR et donc sur la vitesse à laquelle vos utilisateurs vont accéder aux données.

L'indispensable est un serveur dédié pour le SGBDR surtout s'il est en Client/Serveur. L'utile est de paramétrer l'OS du serveur sur lequel travaille le SGBDR de façon à ce que le serveur dispose de ressources adéquates.

On veillera à mettre des dispositifs d'accès adéquats en fonction du nombre d'utilisateurs simultanés et de la charge qu'ils induisent. Le mieux étant un réseau déterministe, ce que hélas Ethernet n'est pas. Mais on pourra par exemple employer plusieurs cartes réseau pour un même serveur pour des groupes d'utilisateurs ou sous-réseaux distincts.
On peut aussi employer des dispositifs accélérant le débit comme de la connexion fibre optique, ou des switch plutôt que des hubs. Dans ce dernier cas, des switch administrables présentent un intérêt majeur, celui de pouvoir répartir la charge…

Voici un tableau dont on peut s'inspirer :

utilisateurs simultanés	15	15	50	50	300	300
débit	faible	fort	faible	fort	faible	fort
architecture	10 Mo/s, 1 carte réseau	100 Mo/s, 1 carte réseau	100 Mo/s, 1 à 2 cartes réseau	100 Mo/s, 1 à 4 cartes réseau + switch frontal	1 Go/s, 1 carte réseau FO + switch frontal	1 Go/s, 2 à 4 cartes réseau en FO + switch frontal cascadé

FO : fibre optique

Au-delà, la répartition de charge passe par des techniques de clustering. Dans ce cas entrent en compte les phénomènes de réplication et il vaut mieux prévoir un développement en mode « client serveur déconnecté ».

Des adresses fixes des ressources du réseau sont préférables.

CE QUI FAIT GAGNER DU TEMPS…

Une infrastructure réseau adaptée à la charge, où le nombre de collisions va être minime, voire nul… C'est-à-dire :

des interfaces réseau rapides (fibre, switch…) ;
des sous-réseaux parallélisés ;
un protocole réseau déterministe (100 VG anylan, SPX/IPX…) ;
la répartition de la charge par les dispositifs d'interface administrables et/ou un ensemble de serveurs.

Un SGBDR ne fonctionne correctement que sur une machine qui lui est dédiée. Toute autre solution d'exploitation est à proscrire.
La machine est donc un PC de type serveur.

ATTENTION : un PC de base ne peut en aucun cas être reconverti en serveur, car l'architecture interne d'un serveur n'a rien à voir avec un PC destiné à une utilisation personnelle. Ainsi un serveur est taillé pour paralléliser des flux de données et accéder rapidement aux ressources disque, tandis qu'un PC personnel est plutôt conçu pour traiter rapidement des routines graphiques…

On vérifiera que le serveur choisi possède au moins les caractéristiques et équipements suivants :

alimentation redondante, répartissant la charge et extractible à chaud (hot swap et hot plug) ;
mémoire RAM autocorrective (ECC) ;
cartes réseau redondantes (IPSEC) ;
ondulation électrique (UPS) ;
disques durs redondants (RAID) ;
système de sauvegarde des données sur support physique externe.

L'alimentation redondante permet de continuer l'exploitation du serveur malgré une panne de ce sous-système, ainsi que son remplacement à chaud. Il est particulièrement recommandé de disposer d'une alimentation de secours de dépannage.

La mémoire RAM autocorrective ECC (Error Checking and Correction) est une mémoire qui isole les parties abimées de l'espace mémoire et en interdit l'accès dynamiquement, ce qui empêche la survenance des erreurs. Elle doit être en quantité suffisante par rapport à la taille de la base. Il n'est pas rare de définir une taille de RAM d'au moins 256 Mo + taille de la base pour le serveur. Si par exemple votre base de données fait 800 Mo, une RAM de plus de 1 Go est souhaitable. Ainsi la quasi-totalité des données servies pourront être montées en mémoire afin d'assurer un temps d'accès bien inférieur à la lecture du disque.

On a tout intérêt à prévoir au moins une carte réseau redondante et lui affecter une adresse logique supplémentaire. C'est plus facile lorsque la carte tombe en panne de dévier le trafic vers une carte déjà installée que d'éteindre le serveur pour remplacer la carte !

Un onduleur est un dispositif électronique permettant de pallier un défaut d'alimentation électrique pendant un temps restreint. Contrairement à une idée reçue, les onduleurs ne sont pas destinés à filtrer le courant électrique et en principe ne protègent pas de la surtension ou des parasites. Pour cela il faut un dispositif complémentaire à l'onduleur, et c'est pourquoi il existe des onduleurs « on line » et « off line ». Pour un serveur il faut toujours utiliser un onduleur « on line » doté d'une sortie logique afin d'informer le serveur d'une panne de courant, pour que l'extinction du serveur se fasse dans de bonnes conditions, ou bien qu'un groupe électrogène, qui doit prendre le relai, soit démarré.

REMARQUE : le talon d'Achille d'un serveur est les disques et sur ces disques se trouve le capital « savoir » de l'entreprise, c'est-à-dire les données. La plupart des défaillances matérielles des systèmes informatiques viennent des alimentations et des disques durs des PC qui fonctionnent 24 heures/24… C'est donc sur ces éléments qu'il convient d'être le plus exigeant.

En ce qui concerne les disques, tous les éditeurs de SGBDR un tant soit peu sérieux, recommandent une technologie de contrôleur disque de type RAID en SCSI.
Rappelons la définition du système RAID (Redundant Array of Inexpensive Disks) : un ensemble de disques dans lesquels une partie de la capacité physique est utilisée pour y stocker de l'information redondante. Cette information redondante permet la régénération des données perdues. Les systèmes RAID se caractérisent par différents niveaux dont les plus connus sont numérotés de 0 à 10 (en fait, 0, 1, 3, 4, 5, 6 7 et 10). Le niveau RAID 5 constitue une bonne sécurité combinée à une bonne tolérance à la panne, puisqu'en principe, un disque endommagé peut être remplacé « à chaud », c'est-à-dire sans interruption du fonctionnement du serveur.
Le SCSI (Small Computer System Interface ) est particulièrement intéressant parce qu'il s'agit d'un système « intelligent » de gestion de l'espace disque et de ses antémémoires qui sollicite notablement moins le processeur que les technologies classiques comme l'IDE. Le débit des périphériques SCSI est plus important et il est multitâche alors que l'IDE est monotâche.

Un dispositif physique de sauvegarde des données : une mauvaise habitude consiste à croire qu'il suffit de se doter de la technologie RAID pour d'être à l'abri de tout problème et donc de faire l'impasse sur un dispositif de sauvegarde. C'est une hérésie !
Une sauvegarde implique une réelle délocalisation des données pour parer à tout problème grave (dégâts des eaux, incendie, malveillance…), mais aussi tout incident d'exploitation comme la suppression malencontreuse ou malintentionnée des données.

NOTA : il ne faut pas confondre la sauvegarde logique des données que la plupart des éditeurs de SGBDR proposent dans leur package et une sauvegarde physique. En effet les SGBDR fonctionnant en permanence il n'est bien souvent pas possible de « fermer » le ou les fichiers constituant la base de données à des fins de copie lors d'une sauvegarde. Pour pallier cela, les éditeurs proposent un mécanisme qui écrit un jeu de données intègres de la base dans un fichier externe à des fins de stockage et d'archivage (sauvegarde logique). Il convient toujours d'utiliser ce principe associé à la sauvegarde physique.

ATTENTION : il ne faut jamais dépasser un taux d'occupation de l'ordre de 67 % de l'espace disque. En effet, en exploitation, votre base de données « grossit », et occupe donc une place de plus en plus grande sur le disque. Plus le disque se remplit et plus les temps d'accès sont longs. Le phénomène n'est pas linéaire. S'il est insensible lorsque le disque est faiblement rempli, il peut devenir sensible lors des lectures lorsque le disque arrive à saturation. Il peut même bloquer totalement le SGBDR en cas de modification des données. Certains OS réseau permettent de définir des alertes administratives en cas de dépassement de quotas d'espace disque. Elles sont absolument nécessaires pour une exploitation sereine et performante du SGBDR.

CE QUI FAIT GAGNER DU TEMPS…

Un PC qui est un véritable serveur.
De la RAM en quantité suffisante.
Des disques SCSI.
Un taux d'occupation d'espace disque toujours inférieur à 67 %.

Nous avons déjà dit que le SGBDR doit être installé sur une machine dédiée. Il est même conseillé de n'installer qu'une seule base en exploitation par machine. Ainsi dans le cadre de l'organisation de votre système informatique, si vous disposez d'une base de données « front-office » et d'une autre « back-office », il vous faudra opter pour deux machines indépendantes (pensez simplement à prendre exactement les mêmes, car en cas de panne de l'une il est plus facile de redémarrer l'ensemble des services sur l'autre…).

Les paramètres de l'installation du serveur peuvent avoir une grande influence sur les temps de réponse, mais aussi sur le comportement de vos requêtes. Par exemple le choix d'un jeu de caractères combiné à une collation compatible dont le tri est binaire sera bien plus rapide et efficace qu'une collation insensible à la casse et aux caractères diacritiques. Lire à ce sujet « Une question de caractères ».

Mais l'ensemble de ces paramètres étant spécifiques à chaque éditeur il est difficile d'en dire plus…

CE QUI FAIT GAGNER DU TEMPS…

Une base exploitée, sur une machine dédiée.
Des paramètres SGBDR adaptés (collation binaire, taille des buffers…).

Lors de la création d'une base, il est possible de demander la création d'un fichier doté d'une taille précise. Il convient de toujours créer le fichier de la base de données avec la taille qu'aura la base de données au cours de son exploitation. Ainsi, si votre base de données doit faire à terme 3 Go, lors de la création de la base, donnez cette valeur comme taille du fichier. Les dispositifs d'autoadaptation de la taille de la base font généralement perdre du temps par le fait qu'ils fragmentent le fichier constituant la base.

Placez le fichier des données de la base sur un disque à part en évitant le disque système. Placez le fichier du journal sur un disque à part en évitant le disque système et celui contenant les données de la base.
Ceci retarde la saturation des disques et fait gagner du temps du fait de la parallélisation des tâches d'écriture du système SCSI sur deux disques physiques différents.

Si vous le pouvez, répartissez les données de votre base sur plusieurs disques par exemple en plaçant les données les plus lourdes (BLOB) sur les disques les moins performants.

Choisissez bien la taille de la page de données (c'est la granule de base pour le stockage des données de votre SGBDR). Cela se calcule en fonction de la taille de la base adulte, de la taille des disques et de la taille de la RAM…
On peut donner à titre indicatif l'échelle suivante (mieux vaut consulter la documentation de votre SGBDR) : si la taille préconisée par votre SGBDR est 8 Ko pour une base de quelques Go avec 1 Go de RAM sur des disques de 9 Go avec un OS 32 bits… alors :

RAM	256 Mo	512 Mo	1 Go	2 Go	4 Go
Disque	4Go	4Go	9 Go	18Go	36Go
Base	600 Mo	1 Go	3 Go	8 Go	25 Go
Page	2 Ko	4 Ko	8 Ko	16 Ko	32 Ko

Réglez les paramètres des structures de stockage en fonction de la place disque et du pourcentage de mise à jour.
Par exemple, les structures d'arbres pour stocker les index utilisent le plus souvent un paramètre, le « fill factor » (facteur de remplissage) qui peut être ajusté. La plupart du temps ce « fill factor » est de l'ordre de 92 à 98 %. Plus il est faible, plus l'accès à l'index sera rapide, mais plus le volume de données occupé par cet index sera important et donc couteux en termes de mise à jour. À vous de décider si vous voulez optimiser les lectures ou les écritures sur la base de données.

CE QUI FAIT GAGNER DU TEMPS…

Créez la base de données avec une taille de fichier calculé sur le volume à l'âge adulte de la base.
Répartissez les fichiers de données et du journal sur des disques différents, en évitant le disque système.
Répartissez les données sur plusieurs disques, notamment les BLOBS sur les disques les moins rapides.
Précisez une taille de page de données adaptée à la structure physique du système et au volume des données.
Réglez les paramètres des structures de stockage des index.

Normalisez au maximum… Créez des tables les plus petites possible en externalisant dans des tables de références toutes les informations susceptibles d'être utilisées plusieurs fois.

Exemple :

Standardisez vos types de données et leur format en utilisant des domaines. Voir définir les domaines et les utiliser… Vous n'aurez donc pas d'effort à demander au SGBDR lors de comparaisons sur des colonnes de contenu similaire (trantypage implicite). En effet si vous voulez comparer le nom d'un client défini comme VARCHAR(32) au nom d'un prospect défini comme NCHAR(25), le SGBDR devra fournir un effort supplémentaire pour homogénéiser les types de colonnes avant d'opérer la comparaison.

Choisisez des clefs dont la taille soit exactement la taille du mot du processeur (par exemple CHAR(4), INTEGER dans un OS 32 bits comme Win95, 98, NT, 2000…). Préférez des clefs purement informatiques pour vos jointures plutôt que les clefs naturelles qui découlent de votre analyse.

MAUVAIS	BON

Évitez les clefs composites. Préférez encore une fois une clef purement informatique !

Évitez les colonnes « nullables » (c'est-à-dire pouvant posséder une valeur nulle) lorsque ces dernières doivent être calculées. En particulier les données comptables et les colonnes représentant des données booléennes. Préférez mettre la valeur par défaut 0, sinon il vous faudra utiliser un opérateur COALESCE ou CASE dans les requêtes effectuant une opération arithmétique afin que les marqueurs NULL soient pris en compte en tant que 0.

Préférez les types fixes (CHAR, NCHAR…) plutôt que les types variables (VARCHAR…) chaque fois que la colonne sera sollicitée en recherche et jointure.

Utilisez au maximum les contraintes prévues dans la clause CREATE avant de passer à une programmation de triggers. Par exemple préférez le ON DELETE SET NULL et un batch de nuit pour une suppression en cascade plutôt que d'utiliser un trigger.

Modélisez vos relations de manière performante. Ainsi une hiérarchie sera avantageusement modélisée par un arbre représenté par intervalle plutôt que par une autoréférence. Évitez les jointures trop complexes en particulier sur plus de deux tables.

Indexez l'essentiel, c'est-à-dire, les clefs primaires et étrangères, les colonnes les plus sollicitées en recherche et jointure, etc. Jamais les colonnes de type BLOB ou texte libre !

Ajoutez à votre base une table des dates, plutôt que d'utiliser des fonctions de calculs temporelles.

Dénormalisez à bon escient si tout le reste a échoué dans votre recherche de gain de temps.

CE QUI FAIT GAGNER DU TEMPS…

Normalisez vos données, entités et relations.
Standardisez le format et le type de vos colonnes.
Utiliser des clefs composées d'une colonne unique d'un type 32 bits et purement informatique (un entier c'est parfait).
Évitez les colonnes nullables surtout si elles doivent être calculées.
Préférez les types fixes (CHAR au lieu de VARCHAR) pour les colonnes fréquemment sollicitées en recherche et jointure.
Utilisez des modèles performants pour vos relations complexes (héritage, arbres… ).
Indexez l'essentiel, pas le superflu !
Ajoutez une table des dates plutôt que d'utiliser des fonctions de calcul temporel.
Dénormalisez vos relations lorsque tout le reste a échoué !

Prévoyez le formatage de vos données avant toute insertion ou mise à jour. Par exemple, assurez-vous qu'un nom de personne soit toujours en majuscules sans blanc parasite ni début ni en fin (TRIM + UPPER).

Exemple - pour ma part j'utilise systématiquement une routine de formatage comprenant les modèles suivants :

Format	Règles
DateFr	retire tous les caractères autres que chiffres et pose des barres JJ/MM/AAAA
Téléphone	formate une chaine de chiffres en téléphone : 33 1 45 78 45 78 (11 chiffres) ou 01 45 78 45 78 (10 chiffres) dans tous les autres cas : groupes de 2 et si impair, alors commence par 1 chiffre isolé
Prénom	ne retient que les caractères a à z (minuscule) accent, et lettres diacritiques et les caractères [' ', '-', '''] (espace, tiret, apostrophe) avec capitalisation des initiales
Mail	formatage d'une adresse mail : minuscule, acceptation des caractères '_' , '-' , et '.' ; présence obligatoire d'un seul @
IDENTIFIANT	ne retient que les caractères A à Z (majuscule) et le caractère '_' (blanc souligné) transforme les accents et lettres diacritiques. Tous les autres caractères sont rejetés
09	ne retient que les caractères 0 à 9 sans espace
AZ_maj	ne retient que les caractères A à Z (majuscule), transforme les accents et lettres diacritiques. Tous les autres caractères sont rejetés
AZ09_maj	ne retient que les caractères A à Z (majuscule) et 0 à 9, transforme les accents et lettres diacritiques. Tous les autres caractères sont rejetés
az_min	ne retient que les caractères a à z (minuscule), transforme les accents et lettres diacritiques. Tous les autres caractères sont rejetés
az09_min	ne retient que les caractères a à z (minuscule) et 0 à 9, transforme les accents et lettres diacritiques. Tous les autres caractères sont rejetés
AZ_maj_plus	ne retient que les caractères A à Z (majuscule) et les caractères [' ', '-', '''] (espace, tiret, apostrophe) sans aucun autre caractère (ni accent, ni lettres diacritiques)
AZ09_maj_plus	ne retient que les caractères A à Z (majuscule) et 0 à 9 et les caractères [' ', '-', '''] (espace, tiret, apostrophe) sans aucun autre caractère (ni accent, ni lettres diacritiques)
az_min_plus	ne retient que les caractères a à z (minuscule) et les caractères [' ', '-', '''] (espace, tiret, apostrophe) sans aucun autre caractère (ni accent, ni lettres diacritiques)
az09_min_plus	ne retient que les caractères a à z (minuscule) et 0 à 9 t les caractères [' ', '-', '''] (espace, tiret, apostrophe) sans aucun autre caractère (ni accent, ni lettres diacritiques)
Az09plusplus	convertit les accents et diacritiques en lettres non accentuées non diacritées

Dès lors les recherches et comparaisons n'ont pas besoin d'être effectuées avec un paramétrage de type « insensible à la casse » + « insensible aux accents », car les données sont toujours formatées de la même façon. Ce qui accélère notablement les recherches.

Prévenez les doublons en cherchant avant insertion si la ligne n'a pas déjà été saisie. Pour des noms propres, utiliser les recherches phonétiques comme le Soundex. Voir L'art des « Soundex ».

Interdisez les orphelins… Utiliser l'intégrité référentielle et les triggers pour l'étendre afin de prévenir toute ligne orpheline.

Indexer les mots de vos textes longs s'ils doivent faire l'objet d'une recherche interne. Voir L'indexation textuelle.

CE QUI FAIT GAGNER DU TEMPS…

Un bon formatage des données saisies et mises à jour permet des recherches plus rapides.
L'absence de doublons évite le double comptage et l'emploi du mot clef DISTINCT.
Une indexation textuelle évite les recherches longues et fastidieuses.

Surveillez le volume des données : la base est-elle trop grosse ? Pourquoi ? Le fichier du journal trop grand ? Pouvez-vous le tronquer ? La place libre du disque est-elle assez importante (au moins 33 %) ?…

Si votre SGBDR est doté d'un optimiseur statistiques, mettez à jour régulièrement les statistiques.

Réindexez de temps à autre la base, surtout après d'importantes mises à jour par lot.

Réorganisez votre base, afin d'optimiser le nombre de pages réellement utiles.

Surveillez la charge en accès et le volume du trafic : identifiez les gros consommateurs et optimisez-leur les « tuyaux ».

CE QUI FAIT GAGNER DU TEMPS…

Ne descendez jamais en dessous de 33 % de place vide sur les disques.
Mettez à jour les statistiques.
Réorganisez votre base régulièrement et réindexez si besoin est.
Surveillez la charge et adaptez les tuyaux.

La plupart des SGBDR sont dotés d'un optimiseur qui analyse de façon logique ou statistique la meilleure façon d'exécuter la requête. Il n'est pas rare que vous puissiez intervenir sur la façon dont le SGBDR et son optimiseur prétendent opérer.
La façon dont il va opérer s'appelle le « plan de requête » et montre les opérations simplistes qu'il va réaliser pour répondre à votre demande. Des SGBDR comme Oracle, MS SQL Server ou encore DB2 possèdent un outil permettant de visualiser ce plan.

Voici l'exemple de l'outil de visualisation des plans de requêtes de MS SQL Server :

Il est certes très beau, mais la principale information manque : le temps d'exécution de chaque étape ainsi que le nombre d'entrées/sorties effectuées sur le disque… Pour cela il faut faire un clic droit sur chaque emblème, ce qui ne s'avère pas très pratique…

Suivant les éditeurs, vous pouvez intervenir directement sur le plan de requête ou bien préciser les index à utiliser ou encore vous pouvez n'être autorisé qu'à réécrire votre requête différemment afin de trouver l'optimisation la plus économe en temps et en ressources…

CE QUI FAIT GAGNER DU TEMPS…

Choisissez le bon plan !

Voici quelques transformations usuelles qu'il convient d'avoir à l'esprit afin d'optimiser vos requêtes.

ATTENTION : vérifiez bien que la transformation opère une réduction du temps de traitement, car cela n'est pas toujours le cas et peut dépendre de votre indexation, du type de données, des paramètres de votre SGBDR et des ressources de votre machine… Il n'y a pas de miracle, seuls des tests peuvent vous convaincre de l'efficacité d'écrire votre requête de telle ou telle manière.


SELECT CLI_ID, TIT_CODE, CLI_NOM, 
       CLI_PRENOM, CLI_ENSEIGNE
FROM   T_CLIENT
SELECT  CHB_NUMERO, CHB_ETAGE
FROM T_CHAMBRE
SELECT CHB_ID
FROM   T_CHAMBRE T1
WHERE  NOT EXISTS (SELECT *
                   FROM   TJ_CHB_PLN_CLI T2
                   WHERE  PLN_JOUR = '2000-11-11'
                     AND  T2.CHB_ID = T1.CHB_ID)
SELECT COUNT (*)
FROM T_CHAMBRE
SELECT *
FROM   T_CLIENT
WHERE  CLI_NOM BETWEEN 'D' AND 'E '
SELECT *
FROM   T_CLIENT C
       JOIN T_FACTURE F
            ON F.CLI_ID = C.CLI_ID 
WHERE  EXTRACT(YEAR FROM F.FAC_DATE) = 2000
SELECT *
FROM   T_FACTURE
WHERE  FAC_DATE BETWEEN '2000-06-18' 
                AND '2000-07-14'
SELECT *
FROM T_CHAMBRE
WHERE CHB_NUMERO BETWEEN 11  AND 14
SELECT CLI_NOM, CLI_PRENOM
FROM   T_CLIENT C
WHERE  EXISTS (SELECT *
               FROM   TJ_CHB_PLN_CLI J
               WHERE  C.CLI_ID = J.CLI_ID
                 AND  PLN_JOUR = '2000-11-11')
SELECT DISTINCT C.CHB_ID 
FROM   T_CHAMBRE C
       LEFT OUTER JOIN TJ_CHB_PLN_CLI P
            ON C.CHB_ID = P.CHB_ID 
               AND PLN_JOUR = '2000-11-11'
WHERE P.CHB_ID IS  NULL
SELECT CHB_ID
FROM   T_CHAMBRE T1
WHERE  NOT EXISTS (SELECT *
                   FROM   TJ_CHB_PLN_CLI T2
                   WHERE  PLN_JOUR = '2000-11-11'
                     AND  T2.CHB_ID = T1.CHB_ID)
SELECT LIF_ID, (LIF_QTE * LIF_MONTANT)
FROM   T_LIGNE_FACTURE
WHERE  LIF_REMISE_POURCENT IS NULL 
  AND  LIF_REMISE_MONTANT IS NULL
UNION
SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) 
               - LIF_REMISE_MONTANT
FROM   T_LIGNE_FACTURE
WHERE  LIF_REMISE_POURCENT IS NULL
  AND  LIF_REMISE_MONTANT IS NOT NULL
UNION
SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) 
               * (1 - LIF_REMISE_POURCENT/100) 
FROM   T_LIGNE_FACTURE
WHERE  LIF_REMISE_POURCENT IS NOT NULL
  AND  LIF_REMISE_MONTANT IS NULL
UNION
SELECT LIF_ID, (LIF_QTE * LIF_MONTANT)
               * (1 - LIF_REMISE_POURCENT/100)
               - LIF_REMISE_MONTANT
FROM   T_LIGNE_FACTURE
WHERE  LIF_REMISE_POURCENT IS NOT NULL
  AND  LIF_REMISE_MONTANT IS NOT NULL
SELECT CHB_NUMERO, 0 AS ETAGE, CHB_COUCHAGE 
FROM   T_CHAMBRE 
WHERE CHB_ETAGE = 'RDC'
UNION
SELECT CHB_NUMERO, 1 AS ETAGE, CHB_COUCHAGE 
FROM   T_CHAMBRE 
WHERE CHB_ETAGE = '1er'
UNION
SELECT CHB_NUMERO, 2 AS ETAGE, CHB_COUCHAGE 
FROM   T_CHAMBRE 
WHERE CHB_ETAGE = '2e'
ORDER  BY  ETAGE, CHB_COUCHAGE
SELECT DISTINCT C.CHB_ID 
FROM   T_CHAMBRE C
       LEFT OUTER JOIN TJ_CHB_PLN_CLI P
            ON C.CHB_ID = P.CHB_ID 
               AND PLN_JOUR = '2000-11-11'
WHERE P.CHB_ID IS  NULL
SELECT DISTINCT C.CHB_ID 
FROM   T_CHAMBRE C
       INNER JOIN TJ_CHB_PLN_CLI P
             ON C.CHB_ID = P.CHB_ID 
WHERE  PLN_JOUR = '2000-11-11'
SELECT COALESCE(OBJ_NOM, MAC_NOM) AS NOM, 
       COALESCE(OBJ_PRIX, MAC_PRIX) AS PRIX 
FROM   T_OBJET O 
       FULL OUTER JOIN T_MACHINE M 
            ON O.OBJ_NOM = M.MAC_NOM 
               AND O.OBJ_PRIX = M.MAC_PRIX 
ORDER  BY NOM, PRIX
SELECT CHB_ID, CHB_COUCHAGE
FROM T_CHAMBRE
WHERE CHB_COUCHAGE 
      NOT IN (SELECT CHB_COUCHAGE
              FROM   T_CHAMBRE
              WHERE  CHB_ETAGE ='RDC')
SELECT CHB_ID, CHB_COUCHAGE
FROM T_CHAMBRE
WHERE CHB_COUCHAGE IN (SELECT CHB_COUCHAGE
                       FROM   T_CHAMBRE
                       WHERE  CHB_ETAGE ='RDC')
SELECT CHB_ID, CHB_COUCHAGE
FROM T_CHAMBRE
WHERE CHB_COUCHAGE > (SELECT MAX(CHB_COUCHAGE)
                      FROM   T_CHAMBRE
                      WHERE  CHB_ETAGE ='RDC')
SELECT DISTINCT VILLE_ETP 
FROM   T_ENTREPOT 
WHERE  RAYON_RYN IN 
   (SELECT RAYON_RYN 
    FROM   T_ENTREPOT 
    WHERE  RAYON_RYN NOT IN 
       (SELECT RAYON_RYN 
        FROM   T_ENTREPOT 
        WHERE  RAYON_RYN NOT IN 
           (SELECT RAYON_RYN 
            FROM T_RAYON))) 
GROUP   BY VILLE_ETP 
HAVING  COUNT (*) = 
   (SELECT COUNT(DISTINCT RAYON_RYN) 
    FROM   T_RAYON)
SELECT F.FAC_ID,  MAX(LIF_QTE * LIF_MONTANT)
FROM   T_FACTURE F
       JOIN T_LIGNE_FACTURE L 
            ON F.FAC_ID = L.FAC_ID
GROUP BY F.FAC_ID
ORDER BY F.FAC_ID
SELECT LIF_ID, 
       (LIF_QTE * LIF_MONTANT) AS LIF_MONTANT
FROM   T_LIGNE_FACTURE
ORDER BY LIF_ID, LIF_MONTANT

N°	ÉVITEZ	PRÉFÉREZ
1	évitez d'employer l'étoile dans la clause SELECT… Sélectionnez `SELECT * FROM T_CLIENT`	…préférez nommer les colonnes une à une Sélectionnez `SELECT CLI_ID, TIT_CODE, CLI_NOM, CLI_PRENOM, CLI_ENSEIGNE FROM T_CLIENT`
2	évitez d'employer DISTINCT dans la clause SELECT… Sélectionnez `SELECT DISTINCT CHB_NUMERO, CHB_ETAGE FROM T_CHAMBRE`	…lorsque cela n'est pas nécessaire Sélectionnez `SELECT CHB_NUMERO, CHB_ETAGE FROM T_CHAMBRE`
3	n'employez pas de colonne dans la clause SELECT… de la sous-requête EXISTS… Sélectionnez `SELECT CHB_ID FROM T_CHAMBRE T1 WHERE NOT EXISTS (SELECT CHB_ID FROM TJ_CHB_PLN_CLI T2 WHERE PLN_JOUR = '2000-11-11' AND T2.CHB_ID = T1.CHB_ID)`	…utilisez l'étoile ou une constante Sélectionnez `SELECT CHB_ID FROM T_CHAMBRE T1 WHERE NOT EXISTS (SELECT * FROM TJ_CHB_PLN_CLI T2 WHERE PLN_JOUR = '2000-11-11' AND T2.CHB_ID = T1.CHB_ID)`
4	évitez de compter une colonne… Sélectionnez `SELECT COUNT (CHB_ID) FROM T_CHAMBRE`	…quand il suffit de compter les lignes Sélectionnez `SELECT COUNT (*) FROM T_CHAMBRE`
5	évitez d'utiliser le LIKE… Sélectionnez `SELECT * FROM T_CLIENT WHERE CLI_NOM LIKE 'D%'`	…si une fourchette de recherche le permet Sélectionnez `SELECT * FROM T_CLIENT WHERE CLI_NOM BETWEEN 'D' AND 'E '`
6	évitez les jointures dans le WHERE… Sélectionnez `SELECT * FROM T_CLIENT C, T_FACTURE F WHERE EXTRACT(YEAR FROM F.FAC_DATE) = 2000 AND F.CLI_ID = C.CLI_ID`	…préférez l'opérateur normalisé JOIN Sélectionnez `SELECT * FROM T_CLIENT C JOIN T_FACTURE F ON F.CLI_ID = C.CLI_ID WHERE EXTRACT(YEAR FROM F.FAC_DATE) = 2000`
7	évitez les fourchettes < et > pour des valeurs discrètes… Sélectionnez `SELECT * FROM T_FACTURE WHERE FAC_DATE > '2000-06-18' AND FAC_DATE < '2000-07-15'`	…préférez le BETWEEN Sélectionnez `SELECT * FROM T_FACTURE WHERE FAC_DATE BETWEEN '2000-06-18' AND '2000-07-14'`
8	évitez le IN avec des valeurs discrètes recouvrantes… Sélectionnez `SELECT * FROM T_CHAMBRE WHERE CHB_NUMERO IN (11, 12, 13, 14)`	…préférez le BETWEEN Sélectionnez `SELECT * FROM T_CHAMBRE WHERE CHB_NUMERO BETWEEN 11 AND 14`
9	évitez d'employer le DISTINCT… Sélectionnez `SELECT DISTINCT CLI_NOM, CLI_PRENOM FROM T_CLIENT C JOIN TJ_CHB_PLN_CLI J ON C.CLI_ID = J.CLI_ID WHERE PLN_JOUR = '2000-11-11'`	…si une sous-requête EXISTS vous offre le dédoublonnage Sélectionnez `SELECT CLI_NOM, CLI_PRENOM FROM T_CLIENT C WHERE EXISTS (SELECT * FROM TJ_CHB_PLN_CLI J WHERE C.CLI_ID = J.CLI_ID AND PLN_JOUR = '2000-11-11')`
10	évitez les sous-requêtes… Sélectionnez `SELECT CHB_ID FROM T_CHAMBRE WHERE CHB_ID NOT IN (SELECT CHB_ID FROM TJ_CHB_PLN_CLI WHERE PLN_JOUR = '2000-11-11')`	…quand vous pouvez utiliser les jointures Sélectionnez `SELECT DISTINCT C.CHB_ID FROM T_CHAMBRE C LEFT OUTER JOIN TJ_CHB_PLN_CLI P ON C.CHB_ID = P.CHB_ID AND PLN_JOUR = '2000-11-11' WHERE P.CHB_ID IS NULL`
11	évitez les sous-requêtes avec IN… Sélectionnez `SELECT CHB_ID FROM T_CHAMBRE WHERE CHB_ID NOT IN (SELECT CHB_ID FROM TJ_CHB_PLN_CLI WHERE PLN_JOUR = '2000-11-11')`	…lorsque vous pouvez utiliser EXISTS Sélectionnez `SELECT CHB_ID FROM T_CHAMBRE T1 WHERE NOT EXISTS (SELECT * FROM TJ_CHB_PLN_CLI T2 WHERE PLN_JOUR = '2000-11-11' AND T2.CHB_ID = T1.CHB_ID)`
12	transformez les COALESCE… Sélectionnez `SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) * (1 - COALESCE(LIF_REMISE_POURCENT, 0)/100) - COALESCE(LIF_REMISE_MONTANT, 0) AS TOTAL_LIGNE FROM T_LIGNE_FACTURE`	…en UNION Sélectionnez SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) FROM T_LIGNE_FACTURE WHERE LIF_REMISE_POURCENT IS NULL AND LIF_REMISE_MONTANT IS NULL UNION SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) - LIF_REMISE_MONTANT FROM T_LIGNE_FACTURE WHERE LIF_REMISE_POURCENT IS NULL AND LIF_REMISE_MONTANT IS NOT NULL UNION SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) * (1 - LIF_REMISE_POURCENT/100) FROM T_LIGNE_FACTURE WHERE LIF_REMISE_POURCENT IS NOT NULL AND LIF_REMISE_MONTANT IS NULL UNION SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) * (1 - LIF_REMISE_POURCENT/100) - LIF_REMISE_MONTANT FROM T_LIGNE_FACTURE WHERE LIF_REMISE_POURCENT IS NOT NULL AND LIF_REMISE_MONTANT IS NOT NULL
13	transformez les CASE… Sélectionnez `ELECT CHB_NUMERO, CASE CHB_ETAGE WHEN 'RDC' THEN 0 WHEN '1er' THEN 1 WHEN '2e' THEN 2 END AS ETAGE, CHB_COUCHAGE FROM T_CHAMBRE ORDER BY ETAGE, CHB_COUCHAGE`	…en UNION Sélectionnez `SELECT CHB_NUMERO, 0 AS ETAGE, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE = 'RDC' UNION SELECT CHB_NUMERO, 1 AS ETAGE, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE = '1er' UNION SELECT CHB_NUMERO, 2 AS ETAGE, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE = '2e' ORDER BY ETAGE, CHB_COUCHAGE`
14	transformez les EXCEPT… Sélectionnez `SELECT CHB_ID FROM T_CHAMBRE EXCEPT SELECT CHB_ID FROM TJ_CHB_PLN_CLI WHERE PLN_JOUR = '2000-11-11'`	…en jointures Sélectionnez `SELECT DISTINCT C.CHB_ID FROM T_CHAMBRE C LEFT OUTER JOIN TJ_CHB_PLN_CLI P ON C.CHB_ID = P.CHB_ID AND PLN_JOUR = '2000-11-11' WHERE P.CHB_ID IS NULL`
15	transformez les INTERSECT… Sélectionnez `SELECT CHB_ID FROM T_CHAMBRE INTERSECT SELECT CHB_ID FROM TJ_CHB_PLN_CLI WHERE PLN_JOUR = '2000-11-11'`	…en jointure Sélectionnez `SELECT DISTINCT C.CHB_ID FROM T_CHAMBRE C INNER JOIN TJ_CHB_PLN_CLI P ON C.CHB_ID = P.CHB_ID WHERE PLN_JOUR = '2000-11-11'`
16	transformez les UNION… Sélectionnez `SELECT OBJ_NOM AS NOM, OBJ_PRIX AS PRIX FROM T_OBJET UNION SELECT MAC_NOM AS NOM, MAC_PRIX AS PRIX FROM T_MACHINE ORDER BY NOM, PRIX` (l'exemple complet se trouve dans : les techniques des SGBDR)	…en jointure Sélectionnez `SELECT COALESCE(OBJ_NOM, MAC_NOM) AS NOM, COALESCE(OBJ_PRIX, MAC_PRIX) AS PRIX FROM T_OBJET O FULL OUTER JOIN T_MACHINE M ON O.OBJ_NOM = M.MAC_NOM AND O.OBJ_PRIX = M.MAC_PRIX ORDER BY NOM, PRIX`
17	transformez les sous-requêtes <> ALL … Sélectionnez `SELECT CHB_ID, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_COUCHAGE <> ALL (SELECT CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE ='RDC')`	… en NOT IN Sélectionnez `SELECT CHB_ID, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_COUCHAGE NOT IN (SELECT CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE ='RDC')`
18	transformez les sous-requêtes = ANY … Sélectionnez `SELECT CHB_ID, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_COUCHAGE = ANY (SELECT CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE ='RDC')`	… en IN Sélectionnez `SELECT CHB_ID, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_COUCHAGE IN (SELECT CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE ='RDC')`
19	transformez les sous-requêtes ANY / ALL … Sélectionnez `SELECT CHB_ID, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_COUCHAGE > ALL (SELECT CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_ETAGE ='RDC')`	…en combinant sous-requêtes et agrégats Sélectionnez `SELECT CHB_ID, CHB_COUCHAGE FROM T_CHAMBRE WHERE CHB_COUCHAGE > (SELECT MAX(CHB_COUCHAGE) FROM T_CHAMBRE WHERE CHB_ETAGE ='RDC')`
20	évitez les sous-requêtes corrélées… Sélectionnez `SELECT DISTINCT VILLE_ETP FROM T_ENTREPOT AS ETP1 WHERE NOT EXISTS (SELECT * FROM T_RAYON RYN WHERE NOT EXISTS (SELECT * FROM T_ENTREPOT AS ETP2 WHERE ETP1.VILLE_ETP = ETP2.VILLE_ETP AND (ETP2.RAYON_RYN = RYN.RAYON_RYN)))` (l'exemple complet se trouve dans : la division relationnelle…)	…préférez des sous-requêtes sans corrélation Sélectionnez `SELECT DISTINCT VILLE_ETP FROM T_ENTREPOT WHERE RAYON_RYN IN (SELECT RAYON_RYN FROM T_ENTREPOT WHERE RAYON_RYN NOT IN (SELECT RAYON_RYN FROM T_ENTREPOT WHERE RAYON_RYN NOT IN (SELECT RAYON_RYN FROM T_RAYON))) GROUP BY VILLE_ETP HAVING COUNT (*) = (SELECT COUNT(DISTINCT RAYON_RYN) FROM T_RAYON)`
21	évitez les sous-requêtes corrélées… Sélectionnez `SELECT FAC_ID, (SELECT MAX(LIF_QTE * LIF_MONTANT) FROM T_LIGNE_FACTURE L WHERE F.FAC_ID = L.FAC_ID) FROM T_FACTURE F ORDER BY FAC_ID`	…préférez des jointures Sélectionnez `SELECT F.FAC_ID, MAX(LIF_QTE * LIF_MONTANT) FROM T_FACTURE F JOIN T_LIGNE_FACTURE L ON F.FAC_ID = L.FAC_ID GROUP BY F.FAC_ID ORDER BY F.FAC_ID`
22	n'utilisez pas de nombre dans la clause ORDER BY… Sélectionnez `SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) FROM T_LIGNE_FACTURE ORDER BY 1, 2`	…spécifiez de préférence les noms des colonnes, y compris dans la clause SELECT Sélectionnez `SELECT LIF_ID, (LIF_QTE * LIF_MONTANT) AS LIF_MONTANT FROM T_LIGNE_FACTURE ORDER BY LIF_ID, LIF_MONTANT`

REMARQUE : toutes les transformations ne répondent pas de la même manière à la charge. Autrement dit, en fonction du volume des données telle ou telle transformation peut s'avérer gagner du temps puis en faire perdre lorsque le volume des données s'accroit.

CE QUI FAIT GAGNER DU TEMPS…

Transformez vos requêtes et choisissez après tests.
Réévaluez le cout à la charge.

Filtrez au maximum en utilisant la clause WHERE, moins il y a de lignes retournées, mieux le SGBDR traitera vite les données.

Si votre SGBDR le supporte, ajoutez une clause limitant le nombre de lignes renvoyées (TOP, LIMIT…), surtout lorsque vous testez ou mettez au point votre code et que la base est exploitée. Moins le SGBDR a de données à servir, plus il sera véloce.

Projetez au minimum en utilisant la clause SELECT et des colonnes nommées. Moins il y a de colonnes retournées, mieux le SGBDR traitera rapidement votre requête.

Surnommez vos tables avec des alias les plus courts possible. Évitez de préfixer les colonnes non ambigües.

Exemple :

Sélectionnez

-- surnoms trop longs, préfixes inutiles
SELECT CLIENT.CLI_ID, CLIENT.CLI_NOM, CLIENT.CLI_PRENOM, TELEPHONE.TEL_NUMERO 
FROM T_CLIENT CLIENT
     JOIN T_TELEPHONE TELEPHONE
          ON CLIENT.CLI_ID = TELEPHONE.CLI_ID

Sélectionnez

-- le flux de caractères comporte 55 caractères de moins et est tout aussi compréhensible.
SELECT C.CLI_ID, CLI_NOM, CLI_PRENOM, TEL_NUMERO 
FROM T_CLIENT C
     JOIN T_TELEPHONE T
          ON C.CLI_ID = T.CLI_ID

Dans un batch répétant cette requête 2000 fois, le volume de caractères inutiles aurait été de 100 Ko…

N'utilisez pas de jointure inutile pour un filtrage.

Exemple :

Sélectionnez

-- une table de référence sert à la saisie interactive de la référence
-- elle est redondante dans un filtrage puisque le code figure dans
-- la table mère (T_TELEPHONE)
SELECT C.CLI_ID, CLI_NOM, CLI_PRENOM, TEL_NUMERO 
FROM   T_CLIENT C
       JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID 
       JOIN T_TYPE TT
            ON T.TYP_CODE = TT.TYP_CODE
WHERE  TYP_LIBELLE = 'Téléphone fixe'

Sélectionnez

-- la table mère (T_TELEPHONE) est filtré directement
-- sur le code correspondant au téléphone de type 'fixe'
SELECT C.CLI_ID, CLI_NOM, CLI_PRENOM, TEL_NUMERO 
FROM   T_CLIENT C
       JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID 
WHERE TYP_CODE = 'TEL'

Dans une expression filtrée, placez toujours une colonne seule d'un côté de l'opérateur de comparaison.

Exemple :

Sélectionnez

-- l'index sur la colonne LIF_QTE ou LIF_MONTANT ne peut être activé

SELECT *
FROM   T_LIGNE_FACTURE
WHERE  LIF_QTE + 10 = LIF_MONTANT / 5

Sélectionnez

-- l'index sur la colonne LIF_QTE peut être activé

SELECT *
FROM   T_LIGNE_FACTURE
WHERE  LIF_QTE  = LIF_MONTANT / 5 - 10

N'utilisez pas de joker en début de mot dans le cadre d'une recherche LIKE. Si le besoin est impératif, ajoutez une colonne contenant la chaine de caractères à l'envers.

Exemple :

Sélectionnez

CREATE TABLE T_MOT
(MOT VARCHAR(25))

INSERT INTO T_MOT (MOT) VALUES ('marchand')
INSERT INTO T_MOT (MOT) VALUES ('marcher')
INSERT INTO T_MOT (MOT) VALUES ('flamand')

SELECT *
FROM   T_MOT
WHERE  MOT LIKE '%and'

MOT 
------------------------- 
marchand
flamand

-- l'index sur la colonne MOT ne peut être activé

Sélectionnez

ALTER TABLE T_MOT
ADD TOM VARCHAR(25)

UPDATE T_MOT
SET TOM = REVERSE(MOT)  -- REVERSE renvoie la chaine en inversant l'ordre des lettres

SELECT *
FROM   T_MOT
WHERE  TOM LIKE 'dna%'

MOT                       TOM 
------------------------- ------------------------- 
marchand                  dnahcram
flamand                   dnamalf

-- l'index sur la colonne TOM peut être activé

Évitez la recherche de négation (NOT) ou de différence (<>), préférez la recherche positive.

Exemple :

Sélectionnez

SELECT *
FROM   T_FACTURE
WHERE  FAC_PMT_DATE NOT BETWEEN FAC_DATE AND FAC_DATE + INTEVAL 30 DAY

Sélectionnez

SELECT *
FROM   T_FACTURE
WHERE  FAC_PMT_DATE < FAC_DATE 
   OR  FAC_PMT_DATE > FAC_DATE + NTEVAL 30 DAY

Créez des vues pour simplifier vos requêtes.

Exemple :

Sélectionnez

-- recherche du tarif des chambres 1, 3 et 5 à la date du 25/12/2000

SELECT CHB_ID, TRF_CHB_PRIX
FROM   TJ_TRF_CHB
WHERE  TRF_DATE_DEBUT = (SELECT MAX(TRF_DATE_DEBUT)
                         FROM   TJ_TRF_CHB
                         WHERE  TRF_DATE_DEBUT < '2000-12-25')
AND CHB_ID IN (1, 3, 5)

Sélectionnez

-- vue simplifiant la présentation des intervalles de validité des tarifs

CREATE VIEW V_TARIF_CHAMBRE
AS
SELECT CHB_ID, TRF_DATE_DEBUT,
       COALESCE((SELECT MIN(TRF_DATE_DEBUT)
                 FROM   TJ_TRF_CHB T2
                 WHERE  T2.TRF_DATE_DEBUT > T1.TRF_DATE_DEBUT), '2099-12-31')
                 - INTERVAL 1 DAY AS TRF_DATE_FIN,
       TRF_CHB_PRIX
FROM TJ_TRF_CHB T1

SELECT CHB_ID, TRF_CHB_PRIX
FROM   V_TARIF_CHAMBRE
WHERE  '2000-12-25' BETWEEN TRF_DATE_DEBUT AND TRF_DATE_FIN
  AND  CHB_ID IN (1, 3, 5)

Essayez de ne jamais utiliser de BLOB (TEXT, BLOB, CLOB…) stockez vos images, vos longs textes et vos fichiers de ressources associés directement dans les fichiers de l'OS, cela désencombre la base de données qui traitera les données les plus utiles plus vite. Voir par exemple l'article « Des images dans ma base ».

Essayez de ne jamais utiliser le CASE dans les requêtes. Utilisez les transformations en UNION ou jointures au pire faites cette cuisine dans le code de l'interface cliente (voir ci-dessus n° 13).

N'utilisez pas de type UNICODE pour vos chaines de caractères si votre application n'a pas d'intérêt à être internationalisée. En effet des colonnes UNICODE (NCHAR, NVARCHAR) sont deux fois plus longues et coutent donc le double en temps de traitement par rapport à des colonnes de type CHAR ou VARCHAR…

Précisez toujours la liste de colonnes dans un ordre INSERT.

Exemple :

Sélectionnez

-- mauvais
INSERT INTO T_CLIENT VALUES (198, 'M.', 'DUCORNET', 'Archibald', NULL)

Sélectionnez

-- bon
INSERT INTO T_CLIENT (CLI_ID, TIT_CODE, CLI_NOM, CLI_PRENOM, CLI_ENSEIGNE)
VALUES (198, 'M.', 'DUCORNET', 'Archibald', NULL)

Sélectionnez

-- excellent (insertion implicite des NULL)
INSERT INTO T_CLIENT (CLI_ID, TIT_CODE, CLI_NOM, CLI_PRENOM)
VALUES (198, 'M.', 'DUCORNET', 'Archibald')

Remaniez vos requêtes de façon à lire les tables toujours dans le même ordre (par exemple l'ordre alphabétique des noms des tables) de façon à prévenir les verrous mortels et les temps d'attente trop longs dus à des interblocages.

Déchargez le serveur des tâches basiques que vous pouvez aisément faire sur le client. Par exemple si vous devez présenter l'initiale d'un nom, inutile de la demander au serveur, rapatriez les noms et sélectionnez la première lettre dans le code de l'interface cliente.

Évitez l'emploi systématique d'une clause ORDER BY.
Si l'ordre que vous voulez activer est complexe, ajoutez une colonne ORDRE et spécifiez-le manuellement.

Exemple :

Sélectionnez

-- vous voulez présenter une liste de noms de pays ayant en premier la France 
-- en second les états de l'Union européenne en ordre alphabétique
-- et en troisième tous les autres pays en ordre alphabétique.

CREATE TABLE T_PAYS
(PAYS VARCHAR(16),
 UNION_EUROPEENE BIT(1))

INSERT INTO T_PAYS VALUES ('Allemagne', 1)
INSERT INTO T_PAYS VALUES ('Autriche', 1)
INSERT INTO T_PAYS VALUES ('Espagne', 1)
INSERT INTO T_PAYS VALUES ('France', 1)
INSERT INTO T_PAYS VALUES ('Irlande', 1)
INSERT INTO T_PAYS VALUES ('Chili', 0)
INSERT INTO T_PAYS VALUES ('Chine', 0)
INSERT INTO T_PAYS VALUES ('Japon', 0)

SELECT PAYS, 1 AS N
FROM   T_PAYS
WHERE  PAYS = 'France'
UNION
SELECT PAYS, 2 AS N
FROM   T_PAYS
WHERE  UNION_EUROPEENE = 1
  AND  PAYS <> 'France'
UNION
SELECT PAYS, 3 AS N
FROM   T_PAYS
WHERE  UNION_EUROPEENE = 0
ORDER  BY N, PAYS
-- mauvais : requête lourde !

Sélectionnez

-- ajout d'une colonne d'ordre
ALTER TABLE T_PAYS ADD ORDRE INTEGER

-- ajout de l'ordre manuel
UPDATE T_PAYS SET ORDRE = 1 WHERE PAYS = 'France'
UPDATE T_PAYS SET ORDRE = 2 WHERE PAYS = 'Allemagne'
UPDATE T_PAYS SET ORDRE = 3 WHERE PAYS = 'Autriche'
UPDATE T_PAYS SET ORDRE = 4 WHERE PAYS = 'Espagne'
UPDATE T_PAYS SET ORDRE = 5 WHERE PAYS = 'Irlande'
UPDATE T_PAYS SET ORDRE = 6 WHERE PAYS = 'Chili'
UPDATE T_PAYS SET ORDRE = 7 WHERE PAYS = 'Chine'
UPDATE T_PAYS SET ORDRE = 8 WHERE PAYS = 'Japon'

SELECT PAYS, ORDRE
FROM   T_PAYS
ORDER  ORDRE

Utilisez UNION ALL si vous ne souhaitez pas le dédoublonnage dans le résultat, cela pénalise moins le serveur.

Essayez de vous affranchir de la clause HAVING par exemple en imbriquant une sous-requête dans la clause FROM.

Un index créé sur deux colonnes ne peut pas être utilisé pour filtrer la seconde colonne, car il stocke en principe les données sur la concaténation des deux colonnes. Restructurez les index en évitant les index composites.

Sélectionnez

CREATE INDEX NDX_CLI_NOM_PRENOM ON T_CLIENT (CLI_NOM, CLI_PRENOM)

SELECT *
FROM T_CLIENT
ORDRE BY PRENOM
-- l'index ne peut être activé sur la seule colonne CLI_PRENOM, car il contient :
AIACHAlexandre
ALBERTChristian
AUZENATMichel
BACQUEMichel
BAILLYJean-François
...

Activez le calcul des statistiques après des mises à jour massives.

Faites des transactions les plus courtes possible, validez vos transactions dès que possible, mettez des points de sauvegarde partiels.

Lorsqu'une requête devient trop importante, pensez à en faire une procédure stockée paramétrée, surtout si votre SGBDR prépare les requêtes.

Évitez autant que faire se peut d'utiliser des CURSOR. Préférez des requêtes mêmes complexes. Bannissez les CURSOR parcourus en arrière (une clause ORDER BY … DESC le remplace aisément). Interdisez-vous les CURSOR parcourus par bond de plus d'une ligne.

CE QUI FAIT GAGNER DU TEMPS…

Évitez les gros pièges.
Ajoutez de l'information : des tables, des vues, des index pour faciliter le requêtage.

Désolé, il n'y a pas de recettes miracles pour l'optimisation des requêtes. Simplement quelques grosses fautes à éviter. L'essentiel est un bon paramétrage de la machine et son environnement, du serveur et de l'OS. Le reste est spécifique à chaque SGBDR et nécessite un peu d'huile de coude et beaucoup de prudence.
Mais n'oubliez surtout pas que des tests en charge sont indispensables afin de trancher entre telle ou telle expression de requête avec le volume probable de votre base en exploitation.

À LIRE :

RAID :

SCSI :

Onduleurs :

OPTIMISATION des SGBDR et du SQL

L'auteur

L'article

Liens sociaux

Préambule▲

1. L'environnement▲

2. Le serveur physique ou « la machine »▲

3. Le Serveur logique ou SGBDR▲

4. La base de données▲

5. Le modèle de données▲

6. En développement▲

7. En exploitation▲

8. Optimiseurs et plan de requêtes▲

9. Transformations usuelles▲

10. Quelques trucs▲

11. CONCLUSION▲