LE SQL de A à Z : 3e partie - les jointures
Date de publication : 22/04/2004 , Date de mise à jour : 12/07/2008
Par
SQLPro (Autres articles)
Dans le précédent article nous avons commencer à décortiquer le simple SELECT. Dans le présent, nous allons nous consacrer aux jointures entre tables. Toutes les jointures sous toutes les coutûres !
Autrement dit comment faire des requêtes portant sur plusieurs tables.
I. Préambule
II. Les jointures ou comment faire des requêtes sur plusieurs tables
II-A. Premiers essais de jointure
II-B. Différents type de jointures (naturelles, équi, non equi, auto, externes, hétérogènes, croisée et union)
III. Syntaxe normalisée des jointures
III-A. Opérateur de jointure naturelle
III-B. Les jointures internes
III-C. Les jointures externes
III-D. Différence entre jointure externe et jointure interne
III-D-1. L'hypothèse du monde clos
III-D-2. Mécanisme en jeu
III-D-3. Discussion sur la jointure externe
III-E. La jointure croisée
III-F. La jointure d'union
IV. Nature des conditions de jointures
IV-A. Équi-jointure
IV-B. Non équi-jointure
IV-C. Auto-jointure
IV-D. La jointure hétérogène
V. Récapitulatif des jointures normalisées
V-A. Terminologie et syntaxe des jointures
V-B. Arbre de jointure
VI. Note importante
VII. Résumé
I. Préambule
La structure de la base de données exemple, ainsi qu'une version des principales bases utilisées sont disponibles dans la page "
La base de données exemple"
II. Les jointures ou comment faire des requêtes sur plusieurs tables
Vous trouverez des compléments d'information sur le sujet aux pages 129 à 152 de l'ouvrage "
SQL"
, collection "La Référence", Campus Press éditeur.
Les jointures permettent d'exploiter pleinement le modèle relationnel des tables d'une base de données.
Elle sont faites pour mettre en relation deux (ou plus) tables concourant à rechercher la réponse à des interrogations.
Une jointure permet donc de combiner les colonnes de plusieurs tables.
Il existe en fait différentes natures de jointures que nous expliciterons plus en détail.
Retenez cependant que la plupart des jointures entre tables s'effectuent en imposant l'égalité des valeurs d'une colonne d'une table à une colonne d'une autre table.
On parle alors de jointure naturelle ou équi-jointure.
Mais on trouve aussi des jointures d'une table sur elle-même.
On parle alors d'auto-jointure.
De même, il arrive que l'on doive procéder à des jointures externe, c'est-à-dire joindre une table à une autre, même si la valeur de liaison est absente dans une table ou l'autre.
Enfin, dans quelques cas, on peut procéder à des jointures hétérogènes, c'est-à-dire que l'on remplace le critère d'égalité par un critère d'inégalité ou de différence.
Nous verrons au moins un cas de cette espèce.
Une jointure entre tables peut être mise en oeuvre, soit à l'aide des éléments de syntaxe SQL que nous avons déjà vu, soit à l'aide d'une clause spécifique du SQL, la clause JOIN.
Nous allons commencer par voir comment à l'aide du SQL de base nous pouvons exprimer une jointure.
II-A. Premiers essais de jointure
Rappel de la syntaxe du SELECT :
SELECT [ DISTINCT ou ALL ] * ou liste_de_colonnes FROM nom_des_tables_ou_des_vues
|
C'est ici le pluriel de la partie FROM qui change tout!
Tâchons donc de récupérer les n° des téléphones associés aux clients.
Exemple 1 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT, T_TELEPHONE
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
DUPONT 06-11-86-78-89
DUPONT 02-41-58-89-52
DUPONT 01-51-58-52-50
DUPONT 01-54-11-43-21
DUPONT 06-55-41-42-95
DUPONT 01-48-98-92-21
DUPONT 01-44-22-56-21
...
|
|
Cette requête ne possède pas de critère de jointure entre une table et l'autre.
Dans ce cas, le compilateur SQL calcule le produit cartésien des deux ensembles, c'est-à-dire qu'à chaque ligne de la première table, il accole l'ensemble des lignes de la seconde à la manière d'une "multiplication des petits pains" !
Nous verrons qu'il existe une autre manière, normalisée cette fois, de générer ce produit cartésien.
Mais cette requête est à proscrire.
Dans notre exemple elle génère 17 400 lignes!
Il faut donc définir absolument un critère de jointure.
Dans le cas présent, ce critère est la correspondance entre les colonnes contenant la référence de l'identifiant du client (CLI_ID).
Exemple 2 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT, T_TELEPHONE
WHERE CLI_ID = CLI_ID
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
DUPONT 06-11-86-78-89
DUPONT 02-41-58-89-52
DUPONT 01-51-58-52-50
DUPONT 01-54-11-43-21
DUPONT 06-55-41-42-95
DUPONT 01-48-98-92-21
DUPONT 01-44-22-56-21
...
|
|
Nous n'avons pas fait mieux, car nous avons créé une clause toujours vraie, un peu à la manière de 1 = 1 !
En fait il nous manque une précision : il s'agit de déterminer de quelles tables proviennent les colonnes CLI_ID de droite et de gauche.
Cela se précise à l'aide d'une notation pointée en donnant le nom de la table.
Il est donc nécessaire d'indiquer au compilateur la provenance de chacune des colonnes CLI_ID et donc d'opérer une distinction entre l'une et l'autre colonne.
Ainsi, chaque colonne devra être précédée du nom de la table, suivi d'un point.
Exemple 3 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT, T_TELEPHONE
WHERE T_CLIENT.CLI_ID = T_TELEPHONE.CLI_ID
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
BOUVIER 06-11-86-78-89
DUBOIS 02-41-58-89-52
DREYFUS 01-51-58-52-50
DUHAMEL 01-54-11-43-21
BOUVIER 06-55-41-42-95
MARTIN 01-48-98-92-21
MARTIN 01-44-22-56-21
...
|
|
On tombe ici à 174 enregistrements dans la table !
Mais il existe une autre façon de faire, plus simple encore.
On utilise la technique du "surnommage", c'est-à-dire que l'on attribue un surnom à chacune des tables présente dans la partie FROM du SELECT :
Exemple 4 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C, T_TELEPHONE T
WHERE C.CLI_ID = T.CLI_ID
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
BOUVIER 06-11-86-78-89
DUBOIS 02-41-58-89-52
DREYFUS 01-51-58-52-50
DUHAMEL 01-54-11-43-21
BOUVIER 06-55-41-42-95
MARTIN 01-48-98-92-21
MARTIN 01-44-22-56-21
...
|
|
Ici, la table T_CLIENT a été surnommée "C" et la table T_TELEPHONE "T".
Bien entendu, et comme dans les requêtes monotabulaires on peut poser des conditions supplémentaires de filtrage dans la clause WHERE.
Cherchons par exemple les clients dont les numéros de téléphone correspondent à un fax :
Exemple 5 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C, T_TELEPHONE T
WHERE C.CLI_ID = T.CLI_ID
AND TYP_CODE = ' FAX '
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-44-28-52-50
MARTIN 01-44-22-56-21
DUHAMEL 01-54-11-43-89
DUPONT 05-59-45-72-42
MARTIN 01-47-66-29-55
DUBOIS 04-66-62-95-64
DREYFUS 04-92-19-18-58
DUHAMEL 01-55-60-93-81
PHILIPPE 01-48-44-86-19
DAUMIER 01-48-28-17-95
...
|
|
Le fait de placer comme critère de jointure entre les tables, l'opérateur logique "égal" donne ce que l'on apelle une "équi-jointure".
|
Comme vous pouvez le constater, le nom du client "BOUVIER" n'apparaît pas.
Il n'a pas été "oublié" par le traitement de la requête, mais le numéro de fax de ce client n'est pas présent dans la table T_TELEPHONE.
Or le moteur SQL recherche les valeurs de la jointure par égalité.
Comme l'ID_CLI de "BOUVIER" n'est pas présent dans la table T_TELEPHONE, il ne peut effectuer la jointure et ignore donc cette ligne.
Nous verrons comment réparer cette lacune lorsque nous parlerons des jointures externes.
|
|
On peut aussi utiliser les surnoms dans la partie qui suit immédiatement le mot clef SELECT.
Ainsi l'exemple 4, peut aussi s'écrire :
|
Exemple 6 :
SELECT C.CLI_ID, C.CLI_NOM, T.TEL_NUMERO
FROM T_CLIENT C, T_TELEPHONE T
WHERE C.CLI_ID = T.CLI_ID
AND T.TYP_CODE = ' FAX '
|
|
CLI_ID CLI_NOM TEL_NUMERO
------ ------- --------------
1 DUPONT 01-44-28-52-50
10 MARTIN 01-44-22-56-21
8 DUHAMEL 01-54-11-43-89
1 DUPONT 05-59-45-72-42
2 MARTIN 01-47-66-29-55
4 DUBOIS 04-66-62-95-64
5 DREYFUS 04-92-19-18-58
8 DUHAMEL 01-55-60-93-81
13 PHILIPPE 01-48-44-86-19
15 DAUMIER 01-48-28-17-95
...
|
|
C'est particulièrement pratique lorsque l'on veut récupérer une colonne qui se retrouve dans les deux tables, ce qui est souvent le cas de la (ou les) colonne(s) de clef étrangère qui permet justement d'assurer la jointure.
Pour joindre plusieurs tables, on peut utiliser le même processus de manière répétitive...
Exemple 7 :
SELECT C.CLI_ID, C.CLI_NOM, T.TEL_NUMERO, E.EML_ADRESSE, A.ADR_VILLE
FROM T_CLIENT C, T_TELEPHONE T, T_ADRESSE A, T_EMAIL E
WHERE C.CLI_ID = T.CLI_ID
AND C.CLI_ID = A.CLI_ID
AND C.CLI_ID = E.CLI_ID
|
|
CLI_ID CLI_NOM TEL_NUMERO EML_ADRESSE ADR_VILLE
------ -------- -------------- ----------------------- ---------
1 DUPONT 01-45-42-56-63 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 05-59-45-72-42 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 05-59-45-72-24 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 01-44-28-52-50 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 01-44-28-52-52 alain.dupont@wanadoo.fr VERSAILLES
2 MARTIN 01-47-66-29-29 mmartin@transports_martin_fils.fr VERGNOLLES CEDEX 452
2 MARTIN 01-47-66-29-55 mmartin@transports_martin_fils.fr VERGNOLLES CEDEX 452
2 MARTIN 01-47-66-29-29 plongeur@aol.com VERGNOLLES CEDEX 452
2 MARTIN 01-47-66-29-55 plongeur@aol.com VERGNOLLES CEDEX 452
5 DREYFUS 04-92-19-18-58 pdreyfus@club-internet.fr PARIS
...
|
|
|
De même que nous l'avons vu dans l'exemple 2.4, ne sont visible ici que les lignes clients ayant à la fois, au moins une adresse, un e-mail et au moins un numéro de téléphone.
Si nous avions voulu une liste complète des clients avec toutes les coordonnées disponibles, nous aurions du faire une requête externe sur les tables.
|
II-B. Différents type de jointures (naturelles, équi, non equi, auto, externes, hétérogènes, croisée et union)
Lorsque nous étudions le modèle relationnel de notre base de données exemple nous avons vu que le modèle physique des données, répercute les clefs des tables maîtres en tant que clefs étrangères des tables pour lesquelles une jointure est nécessaire.
En utilisant la jointure entre clefs primaires et clefs secondaires basée sur l'égalité des valeurs des colonnes nous exécutons ce que les professionnels du SQL appelle une jointure naturelle.
Il est aussi possible de faire des équi-jointures qui ne sont pas naturelles, soit par accident (une erreur !), soit par nécessité.
Il est aussi possible de faire des non équi-jointures, c'est-à-dire des jointures basée sur un critère différent de l'égalité, mais aussi des auto-jointures, c'est-à-dire de joindre la table sur elle-même.
Le cas le plus délicat à comprendre est celui des jointures externes, c'est-à-dire exiger que le résultat comprenne toutes
les lignes des tables (ou d'au moins une des tables de la jointure), même s'il n'y a pas correspondance
des lignes entre les différentes tables mise en oeuvre dans la jointure.
La jointure d'union consiste à ajouter toutes les données des deux tables à condition qu'elles soient
compatibles dans leurs structures.
La jointure croisée permet de faire le produit cartésien des tables.
Enfin on peut effectuer des requêtes hétérogènes, c'est-à-dire de joindre une table d'une base de
données, à une ou plusieurs autres base de données éventuellement même sur des serveurs différents,
voire même sur des serveurs de différents types (par exemple joindre une table T_CLIENT de
la base BD_COMMANDE d'un serveur Oracle à la table T_PROSPECT de la base BD_COMMERCIAL
d'un serveur Sybase !).
|
Dans la mesure du possible, utilisez toujours un opérateur de jointure normalisé Sql2 (mot clef
JOIN).
|
En effet :
-
Les jointures faites dans la clause WHERE (ancienne syntaxe de 1986 !) ne permettent pas de faire la
distinction de prime abord entre ce qui relève du filtrage et ce qui relève de la jointure.
-
Il est à priori absurde de vouloir filtrer dans le WHERE (ce qui restreint les données du résultat) et
de vouloir "élargir" ce résultat par une jointure dans la même clause WHERE de filtrage.
-
La lisibilité des requêtes est plus grande en utilisant la syntaxe à base de JOIN, en isolant ce qui
est du filtrage et de la jointure, mais aussi en isolant avec clarté chaque condition de jointures
entre chaque couples de table.
-
L'optimisation d'exécution de la requête est souvent plus pointue du fait de l'utilisation du JOIN.
-
Lorsque l'on utilise l'ancienne syntaxe et que l'on supprime la clause WHERE à des fins de tests, le
moteur SQL réalise le produit cartésiens des tables ce qui revient la plupart du temps à mettre
à genoux le serveur !
III. Syntaxe normalisée des jointures
Vous trouverez des compléments d'information sur le sujet aux pages 136 à 152 de l'ouvrage "
SQL"
, collection "La Référence", Campus Press éditeur.
Les jointures normalisées s'expriment à l'aide du mot clef JOIN dans la clause FROM. Suivant la
nature de la jointure, on devra préciser sur quels critères se base la jointure.
Voici un tableau résumant les différents types de jointures normalisées :
Jointure interne |
SELECT ...
FROM < table gauche>
[ INNER ] JOIN < table droite>
ON < condition de jointure>
|
|
Jointure externe |
SELECT ...
FROM < table gauche>
LEFT | RIGHT | FULL OUTER JOIN < table droite>
ON condition de jointure
|
|
Jointure naturelle |
SELECT ...
FROM < table gauche>
NATURAL JOIN < table droite>
[ USING <noms de colonnes> ]
|
|
Jointure croisée |
SELECT ...
FROM < table gauche>
CROSS JOIN < table droite>
|
|
Jointure d'union |
SELECT ...
FROM < table gauche>
UNION JOIN < table droite>
|
|
Nous allons décrire en détail toutes ces jointures.
III-A. Opérateur de jointure naturelle
Il existe un opérateur normalisé pour effectué en SQL la jointure naturelle des tables :
SELECT [ DISTINCT ou ALL ] * ou liste de colonnes
FROM table1 NATURAL JOIN table2 [ USING (colonne1 [, colonne2 ... ] )]
|
L'opérateur NATURAL JOIN permet d'éviter de préciser les colonnes concernées par la jointure.
Dans ce cas, le compilateur SQL va rechercher dans les 2 tables, les colonnes dont le nom est identique.
Bien entendu, le type de données doit être le même !
NOTA : on veillera au niveau de la modélisation et notamment au niveau du MPD (Modèle Physique
de Données) que les noms des colonnes de clefs en relation avec d'autres tables par l'intermédiaires
des clefs étrangères soient strictement identiques.
Exemple 8 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT NATURAL JOIN T_TELEPHONE
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
BOUVIER 06-11-86-78-89
DUBOIS 02-41-58-89-52
DREYFUS 01-51-58-52-50
DUHAMEL 01-54-11-43-21
BOUVIER 06-55-41-42-95
MARTIN 01-48-98-92-21
MARTIN 01-44-22-56-21
...
|
|
Mais cette syntaxe est rarement acceptée par les moteurs SQL actuels !
La partie optionnelle USING permet de restreindre les colonnes concernées, lorsque plusieurs colonnes
servent à définir la jointure naturelle. Ainsi la commande SQL :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT
NATURAL JOIN T_TELEPHONE
USING (CLI_ID)
|
Revient au même que la commande SQL de l'exemple 8.
III-B. Les jointures internes
Comme il s'agit de la plus commune des jointures c'est celle qui s'exerce par défaut si on ne précise
pas le type de jointure. Après le mot clef ON on doit préciser le critère de jointure.
Reprenons notre exemple de départ :
Exemple 9 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT
INNER JOIN T_TELEPHONE
ON T_CLIENT.CLI_ID = T_TELEPHONE.CLI_ID
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
BOUVIER 06-11-86-78-89
DUBOIS 02-41-58-89-52
DREYFUS 01-51-58-52-50
DUHAMEL 01-54-11-43-21
BOUVIER 06-55-41-42-95
MARTIN 01-48-98-92-21
MARTIN 01-44-22-56-21
...
|
|
Ou en utilisant le surnommage :
Exemple 10 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
INNER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
BOUVIER 06-11-86-78-89
DUBOIS 02-41-58-89-52
DREYFUS 01-51-58-52-50
DUHAMEL 01-54-11-43-21
BOUVIER 06-55-41-42-95
MARTIN 01-48-98-92-21
MARTIN 01-44-22-56-21
...
|
|
Plus pratique à écrire et aussi lisible sinon plus !
NOTA : le mot clef INNER est facultatif. Par défaut l'absence de précision de la nature de la
jointure la fait s'exécuter en jointure interne.
Ainsi on peut reformuler le requête ci-dessus en :
Exemple 11 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
BOUVIER 06-11-86-78-89
DUBOIS 02-41-58-89-52
DREYFUS 01-51-58-52-50
DUHAMEL 01-54-11-43-21
BOYER 06-55-41-42-95
MARTIN 01-48-98-92-21
MARTIN 01-44-22-56-21
...
|
|
III-C. Les jointures externes
Les jointures externes sont extrêmement pratiques pour rapatrier le maximum d'informations disponible,
même si des lignes de table ne sont pas renseignées entre les différentes tables jointes.
Procédons à l'aide d'un exemple pour mieux comprendre la différence entre une jointure interne et une
jointure externe. Nous avons vu à l'exemple 9 que seul les clients dotés d'un numéro de téléphone
étaient répertoriés dans la réponse. Ainsi, le client "BOUVIER" était absent.
Exemple 12 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
INNER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-44-28-52-50
MARTIN 01-44-22-56-21
DUHAMEL 01-54-11-43-89
DUPONT 05-59-45-72-42
MARTIN 01-47-66-29-55
DUBOIS 04-66-62-95-64
DREYFUS 04-92-19-18-58
DUHAMEL 01-55-60-93-81
PHILIPPE 01-48-44-86-19
DAUMIER 01-48-28-17-95
...
|
|
Que faut-il modifier dans la requête pour obtenir une ligne "BOUVIER" avec aucune référence de téléphone
associée dans la réponse ?
Il suffit en fait d'opérer à l'aide d'une jointure externe :
Exemple 13 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
LEFT OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX ' OR TYP_CODE IS NULL
|
|
CLI_NOM TEL_NUMERO
------- --------------
DUPONT 01-44-28-52-50
DUPONT 05-59-45-72-42
MARTIN 01-47-66-29-55
BOUVIER NULL
DUBOIS 04-66-62-95-64
DREYFUS 04-92-19-18-58
FAURE NULL
LACOMBE NULL
DUHAMEL 01-54-11-43-89
DUHAMEL 01-55-60-93-81
...
|
|
ou encore :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
LEFT OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID AND TYP_CODE IS NULL
|
La syntaxe de la jointure externe est la suivante :
SELECT ...
FROM < table gauche>
LEFT | RIGHT | FULL OUTER JOIN < table droite 1 >
ON < condition de jointure>
[ LEFT | RIGHT | FULL OUTER JOIN <table droite 2>
ON < condition de jointure 2 > ]
...
|
Les mots clefs LEFT, RIGHT et FULL indiquent la manière dont le moteur de requête doit effectuer la jointure
externe. Il font référence à la table située à gauche (LEFT) du mot clef JOIN ou à la table située
à droite (RIGHT) de ce même mot clef. Le mot FULL indique que la jointure externe est bilatérale.
SELECT colonnes
FROM TGauche LEFT OUTER JOIN TDroite ON condition de jointure
|
|
On recherche toutes les valeurs satisfaisant la condition de jointure précisée dans prédicat, puis on
rajoute toutes les lignes de la table TGauche qui n'ont pas été prises en compte au titre de la
satisfaction du critère.
|
SELECT colonnes
FROM TGauche RIGHT OUTER JOIN TDroite ON condition de jointure
|
|
On recherche toutes les valeurs satisfaisant la condition de jointure précisée dans prédicat, puis on
rajoute toutes les lignes de la table TDroite qui n'ont pas été prises en compte au titre de la
satisfaction du critère.
|
SELECT colonnes
FROM TGauche FULL OUTER JOIN TDroite ON condition de jointure
|
|
On recherche toutes les valeurs satisfaisant la condition de jointure précisée dans prédicat, puis on
rajoute toutes les lignes de la table TGauche et TDroite qui n'ont pas été prises en compte au
titre de la satisfaction du critère.
|
NOTA : il existe des équivalences entre différentes expressions logiques à base de jointures externes.
Les principales sont :
-
la jointure externe droite peut être obtenue par une jointure externe gauche dans laquelle on inverse
l'ordre des tables.
-
la jointure externe bilatérale peut être obtenue par la combinaison de deux jointures externes unilatérales
avec l'opérateur ensemblistes UNION.
Remplacement d'une jointure externe droite par une jointure externe gauche.
L'équivalent logique de :
Exemple 14 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
RIGHT OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
|
est :
SELECT CLI_NOM, TEL_NUMERO
FROM T_TELEPHONE T
LEFT OUTER JOIN T_CLIENT C
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
|
Remplacement d'un FULL OUTER JOIN avec jointures externes gauche et droite :
L'équivalent logique de ...
Exemple 15 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
FULL OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
|
est :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
LEFT OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
UNION
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
RIGTH OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
|
Remplacement d'un FULL OUTER JOIN avec jointures externes gauche uniquement :
L'équivalent logique de ...
Exemple 16 :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
FULL OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
|
est :
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
LEFT OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
UNION
SELECT CLI_NOM, TEL_NUMERO
FROM T_TELEPHONE T
LEFT OUTER JOIN T_CLIENT C
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = ' FAX '
|
III-D. Différence entre jointure externe et jointure interne
Pour bien comprendre la distinction entre les jointures internes et externes, nous devons consacrer quelques
instants à aborder des problèmes de logique ensembliste sous un oeil pragmatique.
III-D-1. L'hypothèse du monde clos
Les jointures externes sont extrêmement pratiques pour rapatrier le maximum d'informations disponible,
même si des lignes de table ne sont pas renseignées entre les différentes tables jointes.
Sans le savoir, nous faisons assez systématiquement l'hypothèse du monde clos. c'est-à-dire que nous
considérons que l'absence d'information, n'est pas une information. Si vous demandez à une secrétaire
de vous communiquer les coordonnées des clients qui sont domiciliés à Paris, elle vous donnera
une liste où figurera autant de fois le nom "Paris" qu'il y a de clients dans la liste, et ceci paraît
bien normal ! Sauf que, comme l'aurait fait tout un chacun, votre secrétaire a fait l'hypothèse
du monde clos sans le savoir en présumant que les clients pour lesquels l'adresse n'est pas renseignée
ne sont pas domiciliés à PARIS !
C'est cela l'hypothèse du monde clos : considérer que l'absence d'information doit être synonyme
de critère de discrimination... La jointure externe permet de contrer l'hypothèse du monde
clos en considérant qu'en cas d'absence de jointure entre une table et l'autre, on ne supprime
par pour autant l'information.
III-D-2. Mécanisme en jeu
Lorsqu'une ligne d'une table figurant dans une jointure n'a pas de correspondance dans les autres tables,
le critère d'équi-jointure n'est pas satisfait et la ligne est rejetée. C'est la jointure interne.
Au contraire, la jointure externe permet de faire figurer dans le résultat les lignes satisfaisant
la condition d'équi-jointure ainsi que celles n'ayant pas de correspondances.
Ainsi, si je veux contacter tous mes clients, quelque soit le mode de contact que je veux utiliser dans
le cadre d'une campagne publicitaire, j'ai intérêt à obtenir une réponse contenant tous les clients,
même ceux qui n'ont pas de téléphone, d'e-mail ou d'adresse.
Exemple 17 :
SELECT CLI_ID, CLI_NOM, TYP_CODE | | ' : ' | | TEL_NUMERO AS TEL_CONTACT, EML_ADRESSE, ADR_VILLE
FROM T_CLIENT C
LEFT OUTER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
LEFT OUTER JOIN T_EMAIL E
ON C.CLI_ID = E.CLI_ID
LEFT OUTER JOIN T_ADRESSE A
ON C.CLI_ID = A.CLI_ID
|
|
CLI_ID CLI_NOM TEL_CONTACT EML_ADRESSE ADR_VILLE
------ -------- -------------- ----------------------- ---------
1 DUPONT 01-45-42-56-63 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 05-59-45-72-42 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 05-59-45-72-24 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 01-44-28-52-50 alain.dupont@wanadoo.fr VERSAILLES
1 DUPONT 01-44-28-52-52 alain.dupont@wanadoo.fr VERSAILLES
2 MARTIN 01-47-66-29-29 mmartin@transports_martin_fils.fr VERGNOLLES CEDEX 452
2 MARTIN 01-47-66-29-55 mmartin@transports_martin_fils.fr VERGNOLLES CEDEX 452
2 MARTIN 01-47-66-29-29 plongeur@aol.com VERGNOLLES CEDEX 452
2 MARTIN 01-47-66-29-55 plongeur@aol.com VERGNOLLES CEDEX 452
3 BOUVIER GSM : 06-11-86-78-89 NULL MONTMAIZIN
...
|
|
NOTA : Sur certains moteurs SQL la jointure bilatérale externe (FULL OUTER JOIN) s'exprime :
SELECT colonnes
FROM TGauche FULL JOIN TDroite ON condition de jointure
|
D'anciennes syntaxes permettent de faire des jointures externes unilatérale. Par exemple, il n'est pas
rare de rencontrer les syntaxes suivantes :
SELECT colonnes
FROM table_1 t1, table_2 t2
WHERE t1.id1 * = t2.id2
|
ou encore :
SELECT colonnes
FROM table_1 t1, table_2 t2
WHERE t1.id1 (+ )= t2.id2
|
Elles sont bien évidemment à proscrire si la syntaxe SQL 2 est disponible !
III-D-3. Discussion sur la jointure externe
La jointure externe est rarement bien comprise du premier coup. Si je vous propose de lire cette discussion
qui a eût lieu sur un forum Internet, c'est parce quelle permet de mieux la comprendre.
Objet : Optimisation Jointure
Date : 26 Dec 2002 11:54:07 +0100
De : Laurent Moreau
Bonjour a tous,
Je me pose une petite question de syntaxe SQL sur les jointures.
Et comme Frédéric va surement me répondre, je prend un exemple de son site.
Y-a t-il une syntaxe meilleure que l'autre (si oui pourquoi) ?
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
INNER JOIN T_TELEPHONE T
ON C.CLI_ID = T.CLI_ID
WHERE TYP_CODE = 'FAX'
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C
INNER JOIN T_TELEPHONE T
ON (C.CLI_ID = T.CLI_ID AND T.TYP_CODE = 'FAX' )
Merci,
|
|
Date : 26 Dec 2002 14:20:39 -0800
De : Med Bouchenafa
Au niveau performance, il n'y a aucune différence, l'optimiseur de
SQL/Server contruit le même plan
Par contre, au niveau conceptuel il est interessant de différencier ce qui
appartient à la jointure et ce qui appartient à la limitation du jeu de
résultat
Cela facilite la maintenance et la lecture du source
[...]
|
|
Date : 26 Dec 2002 16:31:14 +0100
De : Frédéric BROUARD
Pour comprende la différence entre le prédicat de la clause de jointure
et le prédicat du filtre WHERE, je vous propose le petit test suivant :
-- test de jointure
CREATE TABLE TEST_JOIN1
(COL1 INT,
COL2 CHAR(2))
CREATE TABLE TEST_JOIN2
(COL1 INT,
COL2 CHAR(2))
INSERT INTO TEST_JOIN1 VALUES (101, 'AA')
INSERT INTO TEST_JOIN1 VALUES (102, 'AA')
INSERT INTO TEST_JOIN1 VALUES (103, 'BB')
INSERT INTO TEST_JOIN2 VALUES (101, 'AA')
INSERT INTO TEST_JOIN2 VALUES (102, 'AA')
INSERT INTO TEST_JOIN2 VALUES (201, 'BB')
-- équivalente ??? En apparence seulement !
SELECT TJ1.COL1, TJ1.COL2
FROM TEST_JOIN1 TJ1
JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1
WHERE TJ1.COL2 = 'AA'
SELECT TJ1.COL1, TJ1.COL2
FROM TEST_JOIN1 TJ1
JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'AA'
-- d'accord... même résultat !!!
--changeons le lien interne en lien externe...
SELECT TJ1.COL1, TJ1.COL2
FROM TEST_JOIN1 TJ1
LEFT OUTER JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1
WHERE TJ1.COL2 = 'AA'
SELECT TJ1.COL1, TJ1.COL2
FROM TEST_JOIN1 TJ1
LEFT OUTER JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'AA'
-- pas d'acord !!! résultat différend...
-- POURQUOI ???
-- je vous laisse méditer la chose !
|
|
Date : 26 Dec 2002 16:55:13 +0100
De : Lionel Pénuchot
Salut Fred,
Tu peux alors m'expliquer pourquoi cette requête renvoie le même résultat que ta dernière ?
SELECT TJ1.COL1, TJ1.COL2
FROM TEST_JOIN1 TJ1
LEFT OUTER JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'taratata' and 1=0
Cordialement
|
|
Date : 27 Dec 2002 10:17:10 +0100
De : Frédéric BROUARD
La clause WHERE est un filtre d'élimination. Il suppose que les
différentes tables sont déjà jointes en une seule et parcoure
l'ensemble des résultats à la recherche des lignes correspondant aux
critères donnés.
En revanche la clause JOIN se comporte différemment. Elle agit AVANT
que la jointure soit effective.
Dans le cadre d'une jointure INTERNE le comportement est similaire à
celui d'une clause WHERE.
Dans le cas d'une jointure externe il faut décomposer la logique en
plusieurs étapes :
1) évaluation des éléments du prédicat
2) application de la jointure : lignes jointe en 1)
+ lignes sans correspondance
Reprennons la clause de jointure de la requête donnée par Laurent :
TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'taratata' and 1=0
^^^^^^^^^^^^^^^^^^^ ^^^^^^^^^^^^^^^^^^^^^ ^^^
prédicat de jointure prédicats hors jointure
1° 1=0 => aucune ligne n'est récupérée
donc aucune ligne de TEST_JOIN1 n'a de correspondance avec TEST_JOIN2
conclusion : toutes les lignes de TEST_JOIN1 seront reprises du fait
de la jointure externe
2° TJ1.COL2 = 'taratata' => encore une fois aucune ligne n'est récupérée
donc aucune ligne de TEST_JOIN1 n'a de correspondance avec TEST_JOIN2
conclusion : toutes les lignes de TEST_JOIN1 seront reprises du fait
de la jointure externe
3° TJ1.COL1 = TJ2.COL1 => 2 lignes sont en correspondance avec TEST_JOIN2
conclusion, ces deux lignes seront récupérées du fait de la jointure
externe et la 3eme ligne aussi puisqu'elle n'a aucune correspondance
???
Pour comprendre la différence, il suffit de demander à voir les colonnes
de la table TEST_JOIN2 dans les différents cas :
SELECT TJ1.COL1, TJ1.COL2, TJ2.COL1, TJ2.COL2
FROM TEST_JOIN1 TJ1
LEFT OUTER JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'AA'
COL1 COL2 COL1 COL2
----------- ---- ----------- ----
101 AA 101 AA
102 AA 102 AA
103 BB NULL NULL
SELECT TJ1.COL1, TJ1.COL2, TJ2.COL1, TJ2.COL2
FROM TEST_JOIN1 TJ1
LEFT OUTER JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1
WHERE TJ1.COL2 = 'AA'
COL1 COL2 COL1 COL2
----------- ---- ----------- ----
101 AA 101 AA
102 AA 102 AA
SELECT TJ1.COL1, TJ1.COL2, TJ2.COL1, TJ2.COL2
FROM TEST_JOIN1 TJ1
LEFT OUTER JOIN TEST_JOIN2 TJ2
ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'taratata' and 1=0
COL1 COL2 COL1 COL2
----------- ---- ----------- ----
101 AA NULL NULL
102 AA NULL NULL
103 BB NULL NULL
et voilà !
|
|
III-E. La jointure croisée
La jointure croisée n'est autre que le produit cartésien de deux tables. Rappelons que le produit cartésien
de deux ensembles n'est autre que la multiplication généralisée. Dans le cas des tables, c'est le
fait d'associer à chacune des lignes de la première table, toutes les lignes de la seconde. Ainsi,
si la première table compte 267 lignes et la seconde 1214, on se retrouve avec un résultat contenant
324 138 lignes. Bien entendu, s'il n'y a aucun doublon dans les tables, toutes les lignes du résultat
seront aussi uniques.
La jointure croisée peut s'écrire de deux manières différentes :
-
à l'aide de l'opérateur normalisé :
SELECT colonnes
FROM table_1 CROSS JOIN table_2
|
-
ou à l'aide d'une clause FROM simplifiée :
SELECT colonnes
FROM table_1, table_2
|
Ce qui est certainement l'expression la plus minimaliste de tous les ordres SELECT du SQL !
Nous voudrions savoir si notre table des tarifs de chambre (TJ_TRF_CHB) est complète, c'est-à-dire si
l'on a bien toutes les chambres (T_CHAMBRE) pour toutes les dates de début de tarif (T_TARIF) :
Exemple 18 :
SELECT CHB_ID, TRF_DATE_DEBUT, 0 AS TRF_CHB_PRIX
FROM T_TARIF, T_CHAMBRE
ORDER BY CHB_ID, TRF_DATE_DEBUT
|
|
CHB_ID TRF_DATE_DEBUT TRF_CHB_PRIX
------ -------------- ------------
1 1999-01-01 0,00
1 1999-09-01 0,00
1 2000-01-01 0,00
1 2000-09-01 0,00
1 2001-01-01 0,00
2 1999-01-01 0,00
2 1999-09-01 0,00
2 2000-01-01 0,00
2 2000-09-01 0,00
2 2001-01-01 0,00
...
|
|
En comparant rapidement le contenu des deux tables on peut s'assurer que tous les tarifs ont bien été
renseignés.
Avec la syntaxe normalisée, cette requête s'écrit :
Exemple 19 :
SELECT CHB_ID, TRF_DATE_DEBUT, 0 AS TRF_CHB_PRIX
FROM T_TARIF CROSS JOIN T_CHAMBRE
ORDER BY CHB_ID, TRF_DATE_DEBUT
|
|
CHB_ID TRF_DATE_DEBUT TRF_CHB_PRIX
------ -------------- ------------
1 1999-01-01 0,00
1 1999-09-01 0,00
1 2000-01-01 0,00
1 2000-09-01 0,00
1 2001-01-01 0,00
2 1999-01-01 0,00
2 1999-09-01 0,00
2 2000-01-01 0,00
2 2000-09-01 0,00
2 2001-01-01 0,00
...
|
|
et donne le même résultat !
III-F. La jointure d'union
La jointure d'union, permet de faire l'union de deux tables de structures quelconque. Elle s'exprime
qu'à l'aide de l'opérateur normalisé SQL2 suivant :
SELECT colonnes
FROM table_1 UNION JOIN table_2
|
Effectuons par exemple la jointure d'union entre les tables T_TITRE ("M.", "Mme.", "Melle." ) et T_TYPE
("FAX", "GSM", "TEL") :
Exemple 20 :
SELECT *
FROM T_TITRE UNION JOIN T_TYPE
|
|
TIT_CODE TIT_LIBELLE TYP_CODE TYP_LIBELLE
-------- -------------------------------- -------- -------------------
M. Monsieur NULL NULL
Melle. Mademoiselle NULL NULL
Mme. Madame NULL NULL
NULL NULL FAX Télécopie
NULL NULL GSM Téléphone portable
NULL NULL TEL Téléphone fixe
|
|
En fait c'est comme si l'on avait listé la première table, puis la seconde en évitant toute colonne commune
et compléter les espaces vides des valeurs NULL.
Mais cette jointure est très rarement implantée dans les moteurs SQL.
NOTA : si l'opérateur UNION JOIN n'est pas présent dans votre moteur, vous pouvez le fabriquer
comme suit, car elle (l'union) peut être facilement remplacée par un autre ordre SQL presque aussi simple :
SELECT *
FROM < table gauche>
FULL OUTER JOIN < table droite>
ON < critère>
|
Où la condition <critère> est n'importe quel prédicat valant toujours faux comme "1=2".
En dehors du fait de linéariser des tables hétérogènes, il est franchement permis de douter de l'utilité
d'un tel opérateur.
IV. Nature des conditions de jointures
Nous allons maintenant analyser les différentes jointures basées sur la nature des conditions pour bien
les distinguer.
IV-A. Équi-jointure
L'équi-jointure consiste à opérer une jointure avec une condition d'égalité. Cette condition d'égalité
dans la jointure peut ne pas porter nécessairement sur les clefs (primaires et étrangères).
Recherchons par exemple les clients dont le nom est celui d'une ville contenu dans la table des
adresses :
Exemple 21 :
SELECT DISTINCT C.CLI_ID, C.CLI_NOM, A.ADR_VILLE
FROM T_CLIENT C
JOIN T_ADRESSE A
ON C.CLI_NOM = A.ADR_VILLE
|
|
CLI_ID CLI_NOM ADR_VILLE
------ ------- ---------
92 PARIS PARIS
...
|
|
Nous avons donc bien réalisé une équi-jointure, mais elle n'est pas naturelle parce qu'elle ne repose
pas sur les clefs des tables.
Bien entendu, il existe un opérateur normalisé SQL 2 permettant de traiter le cas de l'équi-jointure :
SELECT [ DISTINCT ou ALL ] * ou liste de colonnes
FROM table1 [ INNER ] JOIN table2 ON condition de jointure
|
Le mot clef INNER n'étant pas obligatoire, mais voulant s'opposer aux mot clefs OUTER, UNION et CROSS.
Ainsi, la requête précédente, s'écrit à l'aide de cette syntaxe :
Exemple 22 :
SELECT DISTINCT C.CLI_ID, C.CLI_NOM, A.ADR_VILLE
FROM T_CLIENT C
INNER JOIN T_ADRESSE A
ON C.CLI_NOM = A.ADR_VILLE
|
|
CLI_ID CLI_NOM ADR_VILLE
------ ------- ---------
92 PARIS PARIS
...
|
|
IV-B. Non équi-jointure
Il s'agit là d'utiliser n'importe quelle condition de jointure entre deux tables, exceptée la stricte
égalité. Ce peuvent être les conditions suivantes :
>
|
supérieur
|
>=
|
supérieur ou égal
|
<
|
inférieur
|
<=
|
inférieur ou égal
|
<>
|
différent de
|
IN
|
dans un ensemble
|
LIKE
|
correspondance partielle
|
BETWEEN ... AND ...
|
entre deux valeurs
|
EXISTS
|
dans une table
|
En règle générale ou trouve des non équi-jointures dans le cadre de comparaisons temporelles ou de mesures
physiques. Par exemple on pourrait rechercher une pièce mécanique dans un stock qui soit de même
nature ou de même fonction qu'une pièce donnée, mais plus légère.
Nous voulons obtenir les factures qui ont été émises avant que le prix des petits déjeuners n'atteigne 6 €.
Exemple 23 :
SELECT F.*
FROM T_FACTURE F
INNER JOIN T_TARIF T
ON F.FAC_DATE < T.TRF_DATE_DEBUT
WHERE TRF_PETIT_DEJEUNE > = 6
|
|
FAC_ID CLI_ID PMT_CODE FAC_DATE FAC_PMT_DATE
------ ------ -------- ---------- ------------
1 1 CB 1999-01-31 1999-02-14
3 1 CHQ 1999-02-28 1999-03-12
5 1 CB 1999-03-31 1999-04-23
7 1 CHQ 1999-04-30 1999-05-14
9 1 CHQ 1999-05-31 1999-06-14
11 1 CB 1999-06-30 1999-07-14
13 1 CHQ 1999-07-31 1999-08-12
15 1 CB 1999-08-31 1999-09-23
25 2 CB 1999-01-31 1999-02-23
27 2 CHQ 1999-02-28 1999-03-18
...
|
|
NOTA : pour récupérer toutes les colonnes d'une table, on peut utiliser l'opérateur * suffixé
par le nom de table, comme nous l'avons fait ici pour la table des factures.
Si notre table des tarifs avait été organisée par tranches, comme ceci :
TRF_DATE_DEBUT TRF_DATE_FIN TRF_TAUX_TAXES TRF_PETIT_DEJEUNE
-------------- ------------ -------------- -----------------
1999-01-01 1999-08-31 18,60 6,00 E
1999-09-01 1999-12-31 20,60 7,00 E
2000-01-01 2000-08-31 20,60 8,00 E
2000-09-01 2000-12-31 20,60 9,00 E
2001-01-01 2001-12-31 20,60 10,00 E
|
alors,récupérer le tarif des chambres pour chacune des dates du planning devient un exercice très simple :
Exemple 24 :
SELECT CPC.CHB_ID, CPC.PLN_JOUR, TC.TRF_CHB_PRIX
FROM TJ_CHB_PLN_CLI CPC
INNER JOIN T_TARIF T
ON CPC.PLN_JOUR BETWEEN T.TRF_DATE_DEBUT AND T.TRF_DATE_FIN
INNER JOIN TJ_TRF_CHB TC
ON T.TRF_DATE_DEBUT = TC.TRF_DATE_DEBUT
AND CPC.CHB_ID = TC.CHB_ID
|
|
CHB_ID PLN_JOUR TRF_CHB_PRIX
------ ---------- ------------
1 2000-01-22 40,00 E
1 2000-01-28 40,00 E
1 1999-01-02 33,50 E
1 1999-01-03 33,50 E
1 1999-01-05 33,50 E
1 1999-01-07 33,50 E
1 1999-01-09 33,50 E
1 1999-01-10 33,50 E
1 1999-01-11 33,50 E
1 1999-01-13 33,50 E
...
|
|
Nous avons donc à nouveau un exemple remarquable de non equi-jointure.
|
Constatons que la colonne TRF_DATE_FIN de cette nouvelle version de la table des tarifs
implique une redondance de l'information. En effet, cette date de fin est déductible de la date de
début de la ligne qui contient la date immédiatement postérieure avec un jour de moins. De plus
le problème induit par cette organisation des données fait qu'il faut obligatoirement définir une
date de fin des tarifs, même dans le futur, sinon certaines tarifications ne pourront être établies
par cette requête. Il ne s'agit donc pas d'une modélisation correcte !
|
IV-C. Auto-jointure
Le problème consiste à joindre une table à elle-même. Il est assez fréquent que l'on ait besoin de telles
auto-jointures car elle permettent notamment de modéliser des structures de données complexes comme
des arbres. Voici quelques exemples de relation nécessitant une auto-jointure de tables :
-
dans une table des employées, connaître le supérieur hiérarchique de tout employé
-
dans une table de nomenclature savoir quels sont les composants nécessaires à la réalisation d'un module,
ou les modules nécessaires à la réalisation d'un appareil
-
dans une table de personnes, retrouver l'autre moitié d'un couple marié.
La représentation d'une telle jointure dans le modèle de données, se fait par le rajout d'une colonne
contenant une pseudo clef étrangère basée sur le clef de la table.
Dans ce cas, une syntaxe possible pour l'auto-jointure est la suvante :
SELECT [ DISTINCT ou ALL ] * ou liste de colonnes
FROM laTable t1
INNER JOIN laTable t2
ON t1.laClef = t2.laPseudoClefEtrangère
|
C'est l'exemple typique ou l'utilisation de surnoms pour les tables est obligatoire, sinon il y a risque
de confusion pour le moteur SQL.
Pour donner un exemple concret à nos propos nous allons modéliser le fait qu'une chambre puisse communiquer
avec une autre (par une porte). Dès lors, le challenge est de trouver quelles sont les chambres
qui communiquent entre elles par exemple pour réaliser une sorte de suite. Pour ce faire, nous
allons ajouter à notre table des chambres une colonne de clef étrangère basée sur la clef de la
table.
Dans ce cas, cette colonne doit obligatoirement accepter des valeurs nulles !
Voici l'ordre SQL pour rajouter la colonne CHB_COMMUNIQUE dans la table T_CHAMBRE :
ALTER TABLE T_CHAMBRE ADD CHB_COMMUNIQUE INTEGER
|
Alimentons là de quelques valeurs exemples en considérant que la 7 communique avec la 9 et la 12 avec la 14 :
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 9 WHERE CHB_ID = 7
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 7 WHERE CHB_ID = 9
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 12 WHERE CHB_ID = 14
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 14 WHERE CHB_ID = 12
|
Pour formuler la recherche de chambres communiquantes, il suffit de faire la requête suivante :
Exemple 25 :
SELECT DISTINCT c1.CHB_ID, c1.CHB_COMMUNIQUE
FROM T_CHAMBRE c1
INNER JOIN T_CHAMBRE c2
ON c1.CHB_ID = c2.CHB_COMMUNIQUE
|
|
CHB_ID CHB_COMMUNIQUE
------ --------------
7 9
9 7
12 14
14 12
|
|
où la table T_CHAMBRE figure deux fois par l'entremise de deux surnommages différents c1 et c2.
Notons que cette présentation n'est pas pratique car elle dédouble le nombre de couples de chambres communiquantes,
donnant l'impression qu'il y a 4 couples de chambres communiquantes ce qui est faux. Il manque
juste un petit quelque chose pour que cette requête soit parfaite. Il suffit en effet de ne retenir
les solutions que pour des identifiants inférieurs ou supérieur d'une table par rapport à l'autre :
Exemple 26 :
SELECT DISTINCT c1.CHB_ID, c1.CHB_COMMUNIQUE
FROM T_CHAMBRE c1
INNER JOIN T_CHAMBRE c2
ON c1.CHB_ID = c2.CHB_COMMUNIQUE
AND c1.CHB_ID < = c2.CHB_ID
|
|
CHB_ID CHB_COMMUNIQUE
------ --------------
7 9
12 14
|
|
IV-D. La jointure hétérogène
Une jointure hétérogène consiste à joindre dans une même requête, des tables provenant de bases de données
différentes, voire de serveurs de données différents. Un tel type de jointure n'est possible que :
-
entre deux bases d'un même serveur : que si le SQL du serveur le permet (par exemple deux bases Oracle,
deux bases SQL Server, etc.)
-
entre deux bases de deux serveurs différents : qu'en passant par un outil tiers de type "middleware"
(par exemple une entre une base Oracle et une base Sybase). L'un des rares middleware a faire ce
type de jointure est le BDE (Borland Database Engine) d'Inprise.
Dans ces deux cas, il faut bien vérifier la compatibilité des types car il se peut que des résultats
surprenants apparaissent notamment dans le traitement des nombre réels.
Pour effectuer de telles requêtes, la syntaxe est toujours spécifique au moteur employé. Avec le BDE
le niveau de SQL est SQL 2, cantonné aux fonctions de base.
Voici un exemple de requête entre deux serveur à l'aide du BDE :
Exemple 27 :
SELECT C.CLI_NOM, T.TEL_NUMERO
FROM " :ORACLE_CLIBD:T_CLIENT " C, " :SYBASE_TELBD:T_TELEPHONE " T
WHERE C.CLI_ID = T.CLI_ID
|
|
NOM_CLI TEL_NUMERO
------- --------------
DUPONT 01-45-42-56-63
DUPONT 01-44-28-52-52
DUPONT 01-44-28-52-50
BOUVIER 06-11-86-78-89
DUBOIS 02-41-58-89-52
DREYFUS 01-51-58-52-50
DUHAMEL 01-54-11-43-21
BOYER 06-55-41-42-95
MARTIN 01-48-98-92-21
MARTIN 01-44-22-56-21
...
|
|
En fait le BDE se sert d'alias permettant de définir à la fois le serveur et la base concerné. Ici les
alias sont : ":ORACLE_CLIBD:" et ":SYBASE_TELBD:".
V. Récapitulatif des jointures normalisées
V-A. Terminologie et syntaxe des jointures
-
Jointure naturelle : la jointure s'effectue sur les colonnes communes, c'est-à-dire celles de
même nom et type :
SELECT colonnes
FROM table1 NATURAL JOIN table2 [ USING col1, col2 ... ]
[ WHERE prédicat ] ...
|
Le mot clef USING permet de restreindre les colonnes communes à prendre en considération.
-
Jointure interne : la jointure s'effectue entre les tables sur les colonnes précisées dans la
condition de jointure :
SELECT colonnes
FROM table1 t1 [ INNER ] JOIN table2 t2 ON condition
[ WHERE prédicat ] ...
|
-
Jointure externe : la jointure permet de récupérer les lignes des tables correspondant au critère
de jointure, mais aussi celle pour lesquelles il n'existe pas de correspondances.
SELECT colonnes
FROM table1 t1 [ RIGHT OUTER | LEFT OUTER | FULL OUTER ] JOIN table2 t2 ON condition
[ WHERE prédicat ] ...
|
-
RIGHT OUTER : la table à droite de l'expression clef "RIGHT OUTER" renvoie des lignes sans correspondance avec la table à gauche.
-
LEFT OUTER : la table à gauche de l'expression clef "LEFT OUTER" renvoie des lignes sans correspondance avec la table à droite.
-
FULL OUTER : les deux tables renvoient des lignes sans correspondance entre elles.
-
Jointure croisée : la jointure effectue le produit cartésien (la "multiplication") des deux tables.
Il n'y a pas de condition.
SELECT colonnes
FROM table1 t1 CROSS JOIN table2 t2
[ WHERE prédicat ] ...
|
-
Jointure d'union : la jointure concatène les tables sans aucune correspondances de colonnes.
SELECT colonnes
FROM table1 UNION JOIN table2
|
Il n'y a pas de critère de jointure.
|
Si votre SGBDR n'implémente pas la jointure externe droite, inversez l'ordre des tables
et faire une jointure externe gauche lorsque cela est possible.
|
V-B. Arbre de jointure
La jointure de multiple tables peut se représenter sous la forme d'un arbre. Cet arbre possède donc une
racine, c'est la table principale, celle d'où l'on veut que l'information parte. Elle possède aussi
des feuilles, c'est-à-dire des tables d'entités. Les tables situées entre la racine et les feuilles,
sont souvent des tables de jointure, possédant en principe deux clef étrangères. Dans le principe
toute table de jointure devrait être un noeud de l'arbre.
La représentation arborescente d'une jointure est un excellent moyen pour visualiser si la clause
de jointure de votre requête est à priori correcte. En effet, une référence circulaire dans la clause
de jointure ne peut pas être représentée sous la forme d'un arbre et il y a fort à parier que la
requête soit incorrecte.
Voici par exemple la requête qui "met à plat", la base hotel :
SELECT *
FROM T_CLIENT CLI
JOIN T_ADRESSE ADR
ON CLI.CLI_ID = ADR.CLI_ID
JOIN T_TITRE TIT
ON CLI.TIT_CODE = TIT.TIT_CODE
JOIN T_EMAIL EML
ON CLI.CLI_ID = EML.CLI_ID
JOIN T_TELEPHONE TEL
ON CLI.CLI_ID = TEL.CLI_ID
JOIN T_TYPE TYP
ON TEL.TYP_CODE = TYP.TYP_CODE
JOIN TJ_CHB_PLN_CLI CPC
ON CLI.CLI_ID = CPC.CLI_ID
JOIN T_PLANNING PLN
ON CPC.PLN_JOUR = PLN.PLN_JOUR
JOIN T_CHAMBRE CHB
ON CPC.CHB_ID = CHB.CHB_ID
JOIN TJ_TRF_CHB TC
ON CHB.CHB_ID = TC.CHB_ID
JOIN T_TARIF TRF
ON TC.TRF_DATE_DEBUT = TRF.TRF_DATE_DEBUT
JOIN T_FACTURE FAC
ON CLI.CLI_ID = FAC.CLI_ID
JOIN T_LIGNE_FACTURE LIF
ON FAC.FAC_ID = LIF.FAC_ID
JOIN T_MODE_PAIEMENT PMT
ON FAC.PMT_CODE = PMT.PMT_CODE
|
Correctement indenté on distingue déjà la structure arborescente. On peut la mettre en évidence en supprimant
tout ce qui n'est pas un nom de table :
T_CLIENT CLI
T_ADRESSE ADR
T_TITRE TIT
T_EMAIL EML
T_TELEPHONE TEL
T_TYPE TYP
TJ_CHB_PLN_CLI CPC
T_PLANNING PLN
T_CHAMBRE CHB
TJ_TRF_CHB TC
T_TARIF TRF
T_FACTURE FAC
T_LIGNE_FACTURE LIF
T_MODE_PAIEMENT PMT
|
Par cette indentation, il est facile de repérer les jointures entre les tables.
VI. Note importante
Les jointures ne sont pas la seule manière de mettre en realtion différentes tables au sein d'une même
requête SQL. On peut aussi joindre plusieurs tables à l'aide des sous-requêtes ainsi qu'à l'aide
des opérateurs ensemblistes que nous allons voir aux deux prochains chapitres.
VII. Résumé
Voici les différences entre les moteurs des bases de données :
|
Paradox
|
Access
|
PostGreSQL
|
Sybase
|
SQL Server 7
|
Oracle 8
|
DB2 (400)
|
INNER JOIN
|
Oui
|
Oui
|
Oui
|
Oui
|
Oui
|
Non (1)
|
Oui
|
OUTER JOIN
|
LEFT, RIGHT, FULL
|
LEFT, RIGHT
|
LEFT, RIGHT, FULL
|
LEFT, RIGHT, FULL
|
LEFT, RIGHT, FULL
|
Non (1)
|
LEFT (4)
|
UNION JOIN
|
Non (2)
|
Non
|
Non
|
Non (2)
|
Non (2)
|
Non (1) (2)
|
Non
|
CROSS JOIN
|
Non (3)
|
Non (3)
|
Oui
|
Non (3)
|
Oui
|
Non (1) (3)
|
Oui
|
(1) Oracle ne connaît toujours pas le JOIN (ça fait quand même plus de dix ans de retard pour cet éditeur
pionnier qui semble s'endormir sur ses lauriers). Il faut donc utiliser une syntaxe propriétaire.
Exception : la version 9 supporte enfin les jointures normalisées.
(2) Possible avec un FULL OUTER JOIN
(3) Possible avec l'ancienne syntaxe sans précision de critère WHERE
(4) de plus IBM DB2 (400) dispose d'un très intéressant "exception join" equivalent à :
SELECT *
FROM tablegauche
LEFT OUTER JOIN tabledroite
ON références de jointure
WHERE tabledroite.clef IS NULL
|
Données concernant DB2 400 aimablement communiquées par kerigan.
Copyright © 2004 Frédéric Brouard.
Aucune reproduction, même partielle, ne peut être faite
de ce site ni de l'ensemble de son contenu : textes, documents, images, etc.
sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à
trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.