IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

LE SQL de A à Z : 3e partie - les jointures

Dans le précédent article, nous avons commencé à décortiquer le simple SELECT. Dans le présent, nous allons nous consacrer aux jointures entre tables. Toutes les jointures sous toutes les coutures !
Autrement dit, comment faire des requêtes portant sur plusieurs tables. ♪

Article lu   fois.

L'auteur

Profil ProSite personnel

Liens sociaux

Viadeo Twitter Facebook Share on Google+   

I. Préambule

La structure de la base de données exemple, ainsi qu'une version des principales bases utilisées sont disponibles dans la page « La base de données exemple »

II. Les jointures ou comment faire des requêtes sur plusieurs tables

Vous trouverez des compléments d'information sur le sujet aux pages 129 à 152 de l'ouvrage « SQL », collection « La Référence », Campus Press éditeur.

Les jointures permettent d'exploiter pleinement le modèle relationnel des tables d'une base de données.
Elles sont faites pour mettre en relation deux (ou plus) tables concourant à rechercher la réponse à des interrogations. Une jointure permet donc de combiner les colonnes de plusieurs tables.

Il existe en fait différentes natures de jointures que nous expliciterons plus en détail. Retenez cependant que la plupart des jointures entre tables s'effectuent en imposant l'égalité des valeurs d'une colonne d'une table à une colonne d'une autre table. On parle alors de jointure naturelle ou équijointure. Mais on trouve aussi des jointures d'une table sur elle-même. On parle alors d'autojointure.
De même, il arrive que l'on doive procéder à des jointures externes, c'est-à-dire joindre une table à une autre, même si la valeur de liaison est absente dans une table ou l'autre. Enfin, dans quelques cas, on peut procéder à des jointures hétérogènes, c'est-à-dire que l'on remplace le critère d'égalité par un critère d'inégalité ou de différence.
Nous verrons au moins un cas de cette espèce.

Une jointure entre tables peut être mise en œuvre, soit à l'aide des éléments de syntaxe SQL que nous avons déjà vus, soit à l'aide d'une clause spécifique du SQL, la clause JOIN. Nous allons commencer par voir comment à l'aide du SQL de base nous pouvons exprimer une jointure.

II-A. Premiers essais de jointure

Rappel de la syntaxe du SELECT :

 
Sélectionnez
SELECT [DISTINCT ou ALL] * ou liste_de_colonnes FROM nom_des_tables_ou_des_vues

C'est ici le pluriel de la partie FROM qui change tout !

Tâchons donc de récupérer les n° des téléphones associés aux clients.

Exemple 1 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT, T_TELEPHONE
 
Sélectionnez
CLI_NOM  TEL_NUMERO
-------  --------------
DUPONT   01-45-42-56-63
DUPONT   01-44-28-52-52
DUPONT   01-44-28-52-50
DUPONT   06-11-86-78-89
DUPONT   02-41-58-89-52
DUPONT   01-51-58-52-50
DUPONT   01-54-11-43-21
DUPONT   06-55-41-42-95
DUPONT   01-48-98-92-21
DUPONT   01-44-22-56-21
...


Cette requête ne possède pas de critère de jointure entre une table et l'autre. Dans ce cas, le compilateur SQL calcule le produit cartésien des deux ensembles, c'est-à-dire qu'à chaque ligne de la première table, il accole l'ensemble des lignes de la seconde à la manière d'une « multiplication des petits pains » !
Nous verrons qu'il existe une autre manière, normalisée cette fois, de générer ce produit cartésien. Mais cette requête est à proscrire.
Dans notre exemple elle génère 17 400 lignes !

Il faut donc définir absolument un critère de jointure.

Dans le cas présent, ce critère est la correspondance entre les colonnes contenant la référence de l'identifiant du client (CLI_ID).

Exemple 2 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT, T_TELEPHONE
WHERE CLI_ID = CLI_ID
 
Sélectionnez
CLI_NOM  TEL_NUMERO
-------  --------------
DUPONT   01-45-42-56-63
DUPONT   01-44-28-52-52
DUPONT   01-44-28-52-50
DUPONT   06-11-86-78-89
DUPONT   02-41-58-89-52
DUPONT   01-51-58-52-50
DUPONT   01-54-11-43-21
DUPONT   06-55-41-42-95
DUPONT   01-48-98-92-21
DUPONT   01-44-22-56-21
...


Nous n'avons pas fait mieux, car nous avons créé une clause toujours vraie, un peu à la manière de 1 = 1 !
En fait il nous manque une précision : il s'agit de déterminer de quelles tables proviennent les colonnes CLI_ID de droite et de gauche. Cela se précise à l'aide d'une notation pointée en donnant le nom de la table.

Il est donc nécessaire d'indiquer au compilateur la provenance de chacune des colonnes CLI_ID et donc d'opérer une distinction entre l'une et l'autre colonne.
Ainsi, chaque colonne devra être précédée du nom de la table, suivi d'un point.

Exemple 3 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT, T_TELEPHONE
WHERE T_CLIENT.CLI_ID = T_TELEPHONE.CLI_ID
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-45-42-56-63
DUPONT    01-44-28-52-52
DUPONT    01-44-28-52-50
BOUVIER   06-11-86-78-89
DUBOIS    02-41-58-89-52
DREYFUS   01-51-58-52-50
DUHAMEL   01-54-11-43-21
BOUVIER   06-55-41-42-95
MARTIN    01-48-98-92-21
MARTIN    01-44-22-56-21
...


On tombe ici à 174 enregistrements dans la table !

Mais il existe une autre façon de faire, plus simple encore. On utilise la technique du « surnommage », c'est-à-dire que l'on attribue un surnom à chacune des tables présentes dans la partie FROM du SELECT :

Exemple 4 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C, T_TELEPHONE T
WHERE C.CLI_ID = T.CLI_ID
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-45-42-56-63
DUPONT    01-44-28-52-52
DUPONT    01-44-28-52-50
BOUVIER   06-11-86-78-89
DUBOIS    02-41-58-89-52
DREYFUS   01-51-58-52-50
DUHAMEL   01-54-11-43-21
BOUVIER   06-55-41-42-95
MARTIN    01-48-98-92-21
MARTIN    01-44-22-56-21
...


Ici, la table T_CLIENT a été surnommée « C » et la table T_TELEPHONE « T ».

Bien entendu, et comme dans les requêtes monotabulaires on peut poser des conditions supplémentaires de filtrage dans la clause WHERE. Cherchons par exemple les clients dont les numéros de téléphone correspondent à un fax :

Exemple 5 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT C, T_TELEPHONE T
WHERE C.CLI_ID = T.CLI_ID
  AND TYP_CODE = 'FAX'
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-44-28-52-50
MARTIN    01-44-22-56-21
DUHAMEL   01-54-11-43-89
DUPONT    05-59-45-72-42
MARTIN    01-47-66-29-55
DUBOIS    04-66-62-95-64
DREYFUS   04-92-19-18-58
DUHAMEL   01-55-60-93-81
PHILIPPE  01-48-44-86-19
DAUMIER   01-48-28-17-95
...


Le fait de placer comme critère de jointure entre les tables, l'opérateur logique « égal » donne ce que l'on appelle une « équijointure ».

Comme vous pouvez le constater, le nom du client « BOUVIER » n'apparaît pas. Il n'a pas été « oublié » par le traitement de la requête, mais le numéro de fax de ce client n'est pas présent dans la table T_TELEPHONE. Or le moteur SQL recherche les valeurs de la jointure par égalité. Comme l'ID_CLI de « BOUVIER » n'est pas présent dans la table T_TELEPHONE, il ne peut effectuer la jointure et ignore donc cette ligne. Nous verrons comment réparer cette lacune lorsque nous parlerons des jointures externes.

On peut aussi utiliser les surnoms dans la partie qui suit immédiatement le mot clef SELECT. Ainsi l'exemple 4, peut aussi s'écrire :

Exemple 6 :

 
Sélectionnez
SELECT C.CLI_ID, C.CLI_NOM, T.TEL_NUMERO
FROM T_CLIENT C, T_TELEPHONE T
WHERE C.CLI_ID = T.CLI_ID
  AND T.TYP_CODE = 'FAX'
 
Sélectionnez
CLI_ID  CLI_NOM   TEL_NUMERO
------  -------   --------------
     1  DUPONT    01-44-28-52-50
    10  MARTIN    01-44-22-56-21
     8  DUHAMEL   01-54-11-43-89
     1  DUPONT    05-59-45-72-42
     2  MARTIN    01-47-66-29-55
     4  DUBOIS    04-66-62-95-64
     5  DREYFUS   04-92-19-18-58
     8  DUHAMEL   01-55-60-93-81
    13  PHILIPPE  01-48-44-86-19
    15  DAUMIER   01-48-28-17-95
...


C'est particulièrement pratique lorsque l'on veut récupérer une colonne qui se retrouve dans les deux tables, ce qui est souvent le cas de la (ou les) colonne(s) de clef étrangère qui permet justement d'assurer la jointure.

Pour joindre plusieurs tables, on peut utiliser le même processus de manière répétitive…

Exemple 7 :

 
Sélectionnez
SELECT C.CLI_ID, C.CLI_NOM, T.TEL_NUMERO, E.EML_ADRESSE, A.ADR_VILLE
FROM T_CLIENT C, T_TELEPHONE T, T_ADRESSE A, T_EMAIL E
WHERE C.CLI_ID = T.CLI_ID
  AND C.CLI_ID = A.CLI_ID
  AND C.CLI_ID = E.CLI_ID
 
Sélectionnez
CLI_ID   CLI_NOM  TEL_NUMERO      EML_ADRESSE                        ADR_VILLE
------  --------  --------------  -----------------------            ---------
     1  DUPONT    01-45-42-56-63  alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    05-59-45-72-42  alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    05-59-45-72-24  alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    01-44-28-52-50  alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    01-44-28-52-52  alain.dupont@wanadoo.fr            VERSAILLES
     2  MARTIN    01-47-66-29-29  mmartin@transports_martin_fils.fr  VERGNOLLES CEDEX 452
     2  MARTIN    01-47-66-29-55  mmartin@transports_martin_fils.fr  VERGNOLLES CEDEX 452
     2  MARTIN    01-47-66-29-29  plongeur@aol.com                   VERGNOLLES CEDEX 452
     2  MARTIN    01-47-66-29-55  plongeur@aol.com                   VERGNOLLES CEDEX 452
     5  DREYFUS   04-92-19-18-58  pdreyfus@club-internet.fr          PARIS
...

De même que nous l'avons vu dans l'exemple 2.4, ne sont visibles ici que les lignes clients ayant à la fois, au moins une adresse, un e-mail et au moins un numéro de téléphone. Si nous avions voulu une liste complète des clients avec toutes les coordonnées disponibles, nous aurions du faire une requête externe sur les tables.

II-B. Différents types de jointures (naturelles, équi, non equi, auto, externes, hétérogènes, croisées et union)

Lorsque nous étudions le modèle relationnel de notre base de données exemple nous avons vu que le modèle physique des données, répercute les clefs des tables maîtres en tant que clefs étrangères des tables pour lesquelles une jointure est nécessaire. En utilisant la jointure entre clefs primaires et clefs secondaires basée sur l'égalité des valeurs des colonnes, nous exécutons ce que les professionnels du SQL appellent une jointure naturelle.
Il est aussi possible de faire des équijointures qui ne sont pas naturelles, soit par accident (une erreur !), soit par nécessité.
Il est aussi possible de faire des non équi-jointures, c'est-à-dire des jointures basées sur un critère différent de l'égalité, mais aussi des autojointures, c'est-à-dire de joindre la table sur elle-même. Le cas le plus délicat à comprendre est celui des jointures externes, c'est-à-dire exiger que le résultat comprenne toutes les lignes des tables (ou d'au moins une des tables de la jointure), même s'il n'y a pas correspondance des lignes entre les différentes tables mises en œuvre dans la jointure.
La jointure d'union consiste à ajouter toutes les données des deux tables à condition qu'elles soient compatibles dans leurs structures.
La jointure croisée permet de faire le produit cartésien des tables.
Enfin on peut effectuer des requêtes hétérogènes, c'est-à-dire de joindre une table d'une base de données, à une ou plusieurs autres bases de données éventuellement même sur des serveurs différents, voire même sur des serveurs de différents types (par exemple joindre une table T_CLIENT de la base BD_COMMANDE d'un serveur Oracle à la table T_PROSPECT de la base BD_COMMERCIAL d'un serveur Sybase !).

Dans la mesure du possible, utilisez toujours un opérateur de jointure normalisé Sql2 (mot clef JOIN).

En effet :

  • les jointures faites dans la clause WHERE (ancienne syntaxe de 1986 !) ne permettent pas de faire la distinction de prime abord entre ce qui relève du filtrage et ce qui relève de la jointure ;
  • il est à priori absurde de vouloir filtrer dans le WHERE (ce qui restreint les données du résultat) et de vouloir « élargir » ce résultat par une jointure dans la même clause WHERE de filtrage ;
  • la lisibilité des requêtes est plus grande en utilisant la syntaxe à base de JOIN, en isolant ce qui est du filtrage et de la jointure, mais aussi en isolant avec clarté chaque condition de jointures entre chaque couple de tables ;
  • l'optimisation d'exécution de la requête est souvent plus pointue du fait de l'utilisation du JOIN ;
  • lorsque l'on utilise l'ancienne syntaxe et que l'on supprime la clause WHERE à des fins de tests, le moteur SQL réalise le produit cartésien des tables ce qui revient la plupart du temps à mettre à genoux le serveur !

III. Syntaxe normalisée des jointures

Image non disponible

Vous trouverez des compléments d'information sur le sujet aux pages 136 à 152 de l'ouvrage « SQL », collection « La Référence », Campus Press éditeur.

Les jointures normalisées s'expriment à l'aide du mot clef JOIN dans la clause FROM. Suivant la nature de la jointure, on devra préciser sur quels critères se base la jointure.

Voici un tableau résumant les différents types de jointures normalisées :

Jointure interne

 
Sélectionnez
SELECT ...
FROM   <table gauche>
       [INNER]JOIN <table droite>
       ON <condition de jointure>

Jointure externe

 
Sélectionnez
SELECT ...
FROM   <table gauche>
       LEFT | RIGHT | FULL OUTER JOIN <table droite>
               ON condition de jointure

Jointure naturelle

 
Sélectionnez
SELECT ...
FROM   <table gauche>
       NATURAL JOIN <table droite>
               [USING <noms de colonnes>]

Jointure croisée

 
Sélectionnez
SELECT ...
FROM   <table gauche>
       CROSS JOIN <table droite>

Jointure d'union

 
Sélectionnez
SELECT ...
FROM   <table gauche>
       UNION JOIN <table droite>


Nous allons décrire en détail toutes ces jointures.

III-A. Opérateur de jointure naturelle

Image non disponible

Il existe un opérateur normalisé pour effectuer en SQL la jointure naturelle des tables :

 
Sélectionnez
SELECT [DISTINCT ou ALL] * ou liste de colonnes
FROM table1 NATURAL JOIN table2 [USING (colonne1 [, colonne2 ...])]


L'opérateur NATURAL JOIN permet d'éviter de préciser les colonnes concernées par la jointure.
Dans ce cas, le compilateur SQL va rechercher dans les deux tables, les colonnes dont le nom est identique. Bien entendu, le type de données doit être le même !

NOTA : on veillera au niveau de la modélisation et notamment au niveau du MPD (Modèle Physique de Données) que les noms des colonnes de clefs en relation avec d'autres tables par l'intermédiaire des clefs étrangères soient strictement identiques.

Exemple 8 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM T_CLIENT NATURAL JOIN T_TELEPHONE
 
Sélectionnez
CLI_NOM  TEL_NUMERO
-------  --------------
DUPONT    01-45-42-56-63
DUPONT    01-44-28-52-52
DUPONT    01-44-28-52-50
BOUVIER   06-11-86-78-89
DUBOIS    02-41-58-89-52
DREYFUS   01-51-58-52-50
DUHAMEL   01-54-11-43-21
BOUVIER   06-55-41-42-95
MARTIN    01-48-98-92-21
MARTIN    01-44-22-56-21
...


Mais cette syntaxe est rarement acceptée par les moteurs SQL actuels !

La partie optionnelle USING permet de restreindre les colonnes concernées, lorsque plusieurs colonnes servent à définir la jointure naturelle. Ainsi la commande SQL :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT 
       NATURAL JOIN T_TELEPHONE
               USING (CLI_ID)

Revient au même que la commande SQL de l'exemple 8.

III-B. Les jointures internes

Image non disponible

Comme il s'agit de la plus commune des jointures, c'est celle qui s'exerce par défaut si on ne précise pas le type de jointure. Après le mot clef ON on doit préciser le critère de jointure.

Reprenons notre exemple de départ :

Exemple 9 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT
       INNER JOIN T_TELEPHONE
             ON T_CLIENT.CLI_ID = T_TELEPHONE.CLI_ID
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-45-42-56-63
DUPONT    01-44-28-52-52
DUPONT    01-44-28-52-50
BOUVIER   06-11-86-78-89
DUBOIS    02-41-58-89-52
DREYFUS   01-51-58-52-50
DUHAMEL   01-54-11-43-21
BOUVIER   06-55-41-42-95
MARTIN    01-48-98-92-21
MARTIN    01-44-22-56-21
...


Ou en utilisant le surnommage :

Exemple 10 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C
       INNER JOIN T_TELEPHONE T
             ON C.CLI_ID = T.CLI_ID
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-45-42-56-63
DUPONT    01-44-28-52-52
DUPONT    01-44-28-52-50
BOUVIER   06-11-86-78-89
DUBOIS    02-41-58-89-52
DREYFUS   01-51-58-52-50
DUHAMEL   01-54-11-43-21
BOUVIER   06-55-41-42-95
MARTIN    01-48-98-92-21
MARTIN    01-44-22-56-21
...


Plus pratique à écrire et aussi lisible sinon plus !

NOTA : le mot clef INNER est facultatif. Par défaut l'absence de précision de la nature de la jointure la fait s'exécuter en jointure interne.
Ainsi on peut reformuler la requête ci-dessus en :

Exemple 11 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C
       JOIN T_TELEPHONE T
             ON C.CLI_ID = T.CLI_ID
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-45-42-56-63
DUPONT    01-44-28-52-52
DUPONT    01-44-28-52-50
BOUVIER   06-11-86-78-89
DUBOIS    02-41-58-89-52
DREYFUS   01-51-58-52-50
DUHAMEL   01-54-11-43-21
BOYER     06-55-41-42-95
MARTIN    01-48-98-92-21
MARTIN    01-44-22-56-21
...

III-C. Les jointures externes

Image non disponible

Les jointures externes sont extrêmement pratiques pour rapatrier le maximum d'informations disponibles, même si des lignes de table ne sont pas renseignées entre les différentes tables jointes.

Procédons à l'aide d'un exemple pour mieux comprendre la différence entre une jointure interne et une jointure externe. Nous avons vu à l'exemple 9 que seuls les clients dotés d'un numéro de téléphone étaient répertoriés dans la réponse. Ainsi, le client « BOUVIER » était absent.

Exemple 12 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       INNER JOIN T_TELEPHONE T
             ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-44-28-52-50
MARTIN    01-44-22-56-21
DUHAMEL   01-54-11-43-89
DUPONT    05-59-45-72-42
MARTIN    01-47-66-29-55
DUBOIS    04-66-62-95-64
DREYFUS   04-92-19-18-58
DUHAMEL   01-55-60-93-81
PHILIPPE  01-48-44-86-19
DAUMIER   01-48-28-17-95
...


Que faut-il modifier dans la requête pour obtenir une ligne « BOUVIER » avec aucune référence de téléphone associée dans la réponse ?
Il suffit en fait d'opérer à l'aide d'une jointure externe :

Exemple 13 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       LEFT OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX' OR TYP_CODE IS NULL
 
Sélectionnez
CLI_NOM   TEL_NUMERO
-------   --------------
DUPONT    01-44-28-52-50
DUPONT    05-59-45-72-42
MARTIN    01-47-66-29-55
BOUVIER   NULL 
DUBOIS    04-66-62-95-64
DREYFUS   04-92-19-18-58
FAURE     NULL
LACOMBE   NULL 
DUHAMEL   01-54-11-43-89
DUHAMEL   01-55-60-93-81
...


ou encore :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       LEFT OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID AND TYP_CODE IS NULL

La syntaxe de la jointure externe est la suivante :

 
Sélectionnez
SELECT ...
FROM   <table gauche>
       LEFT | RIGHT | FULL OUTER JOIN <table droite 1>
            ON <condition de jointure>
       [LEFT | RIGHT | FULL OUTER JOIN <table droite 2>
            ON <condition de jointure 2>]
...


Les mots clefs LEFT, RIGHT et FULL indiquent la manière dont le moteur de requête doit effectuer la jointure externe. Ils font référence à la table située à gauche (LEFT) du mot clef JOIN ou à la table située à droite (RIGHT) de ce même mot clef. Le mot FULL indique que la jointure externe est bilatérale.

 
Sélectionnez
SELECT colonnes
FROM TGauche LEFT OUTER JOIN TDroite ON condition de jointure

On recherche toutes les valeurs satisfaisant la condition de jointure précisée dans prédicat, puis on rajoute toutes les lignes de la table TGauche qui n'ont pas été prises en compte au titre de la satisfaction du critère.

 
Sélectionnez
SELECT colonnes
FROM TGauche RIGHT OUTER JOIN TDroite ON condition de jointure

On recherche toutes les valeurs satisfaisant la condition de jointure précisée dans prédicat, puis on rajoute toutes les lignes de la table TDroite qui n'ont pas été prises en compte au titre de la satisfaction du critère.

 
Sélectionnez
SELECT colonnes
FROM TGauche FULL OUTER JOIN TDroite ON condition de jointure

On recherche toutes les valeurs satisfaisant la condition de jointure précisée dans prédicat, puis on rajoute toutes les lignes de la table TGauche et TDroite qui n'ont pas été prises en compte au titre de la satisfaction du critère.


NOTA : il existe des équivalences entre différentes expressions logiques à base de jointures externes. Les principales sont :

  • la jointure externe droite peut être obtenue par une jointure externe gauche dans laquelle on inverse l'ordre des tables ;
  • la jointure externe bilatérale peut être obtenue par la combinaison de deux jointures externes unilatérales avec l'opérateur ensembliste UNION.

Remplacement d'une jointure externe droite par une jointure externe gauche.
L'équivalent logique de :

Exemple 14 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       RIGHT OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'


est :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_TELEPHONE T
       LEFT OUTER JOIN T_CLIENT C 
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'

Remplacement d'un FULL OUTER JOIN avec jointures externes gauche et droite :
L'équivalent logique de…

Exemple 15 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       FULL OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'


est :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       LEFT OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX' 
UNION
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       RIGTH OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'

Remplacement d'un FULL OUTER JOIN avec jointures externes gauche uniquement :
L'équivalent logique de…

Exemple 16 :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       FULL OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'


est :

 
Sélectionnez
SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C 
       LEFT OUTER JOIN T_TELEPHONE T
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX' 
UNION
SELECT CLI_NOM, TEL_NUMERO
FROM   T_TELEPHONE T 
       LEFT OUTER JOIN T_CLIENT C
            ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'

III-D. Différence entre jointure externe et jointure interne

Pour bien comprendre la distinction entre les jointures internes et externes, nous devons consacrer quelques instants à aborder des problèmes de logique ensembliste sous un œil pragmatique.

III-D-1. L'hypothèse du monde clos

Les jointures externes sont extrêmement pratiques pour rapatrier le maximum d'informations disponibles, même si des lignes de table ne sont pas renseignées entre les différentes tables jointes.

Sans le savoir, nous faisons assez systématiquement l'hypothèse du monde clos. C'est-à-dire que nous considérons que l'absence d'information, n'est pas une information. Si vous demandez à une secrétaire de vous communiquer les coordonnées des clients qui sont domiciliés à Paris, elle vous donnera une liste où figurera autant de fois le nom « Paris » qu'il y a de clients dans la liste, et ceci paraît bien normal ! Sauf que, comme l'aurait fait tout un chacun, votre secrétaire a fait l'hypothèse du monde clos sans le savoir en présumant que les clients pour lesquels l'adresse n'est pas renseignée ne sont pas domiciliés à PARIS !
C'est cela l'hypothèse du monde clos : considérer que l'absence d'information doit être synonyme de critère de discrimination… La jointure externe permet de contrer l'hypothèse du monde clos en considérant qu'en cas d'absence de jointure entre une table et l'autre, on ne supprime pas pour autant l'information.

III-D-2. Mécanisme en jeu

Lorsqu'une ligne d'une table figurant dans une jointure n'a pas de correspondance dans les autres tables, le critère d'équijointure n'est pas satisfait et la ligne est rejetée. C'est la jointure interne. Au contraire, la jointure externe permet de faire figurer dans le résultat les lignes satisfaisant la condition d'équijointure ainsi que celles n'ayant pas de correspondances.

Ainsi, si je veux contacter tous mes clients, quel que soit le mode de contact que je veux utiliser dans le cadre d'une campagne publicitaire, j'ai intérêt à obtenir une réponse contenant tous les clients, même ceux qui n'ont pas de téléphone, d'e-mail ou d'adresse.

Exemple 17 :

 
Sélectionnez
SELECT CLI_ID, CLI_NOM, TYP_CODE || ' : ' || TEL_NUMERO AS TEL_CONTACT, EML_ADRESSE, ADR_VILLE
FROM T_CLIENT C
   LEFT OUTER JOIN T_TELEPHONE T 
        ON C.CLI_ID = T.CLI_ID
   LEFT OUTER JOIN T_EMAIL E 
        ON  C.CLI_ID = E.CLI_ID
   LEFT OUTER JOIN T_ADRESSE A 
        ON  C.CLI_ID = A.CLI_ID
 
Sélectionnez
CLI_ID   CLI_NOM  TEL_CONTACT           EML_ADRESSE                        ADR_VILLE
------  --------  --------------        -----------------------            ---------
     1  DUPONT    01-45-42-56-63        alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    05-59-45-72-42        alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    05-59-45-72-24        alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    01-44-28-52-50        alain.dupont@wanadoo.fr            VERSAILLES
     1  DUPONT    01-44-28-52-52        alain.dupont@wanadoo.fr            VERSAILLES
     2  MARTIN    01-47-66-29-29        mmartin@transports_martin_fils.fr  VERGNOLLES CEDEX 452
     2  MARTIN    01-47-66-29-55        mmartin@transports_martin_fils.fr  VERGNOLLES CEDEX 452
     2  MARTIN    01-47-66-29-29        plongeur@aol.com                   VERGNOLLES CEDEX 452
     2  MARTIN    01-47-66-29-55        plongeur@aol.com                   VERGNOLLES CEDEX 452
     3  BOUVIER   GSM : 06-11-86-78-89  NULL                               MONTMAIZIN
...


NOTA : Sur certains moteurs SQL la jointure bilatérale externe (FULL OUTER JOIN) s'exprime :

 
Sélectionnez
SELECT colonnes
FROM TGauche FULL JOIN TDroite ON condition de jointure


D'anciennes syntaxes permettent de faire des jointures externes unilatérales. Par exemple, il n'est pas rare de rencontrer les syntaxes suivantes :

 
Sélectionnez
SELECT colonnes
FROM table_1 t1, table_2 t2
WHERE t1.id1 *= t2.id2


ou encore :

 
Sélectionnez
SELECT colonnes
FROM table_1 t1, table_2 t2
WHERE t1.id1 (+)= t2.id2


Elles sont bien évidemment à proscrire si la syntaxe SQL 2 est disponible !

III-D-3. Discussion sur la jointure externe

La jointure externe est rarement bien comprise du premier coup. Si je vous propose de lire cette discussion qui a eu lieu sur un forum Internet, c'est parce qu’elle permet de mieux la comprendre.

 
Sélectionnez
Objet : Optimisation Jointure
Date :  26 Dec 2002 11:54:07 +0100
De :    Laurent Moreau

Bonjour a tous,
Je me pose une petite question de syntaxe SQL sur les jointures.
Et comme Frédéric va surement me répondre, je prends un exemple de son site.
Y a-t-il une syntaxe meilleure que l'autre (si oui pourquoi) ?

SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C
       INNER JOIN T_TELEPHONE T
                ON C.CLI_ID = T.CLI_ID
WHERE  TYP_CODE = 'FAX'

SELECT CLI_NOM, TEL_NUMERO
FROM   T_CLIENT C
       INNER JOIN T_TELEPHONE T
             ON (C.CLI_ID = T.CLI_ID  AND  T.TYP_CODE = 'FAX' )

Merci,
 
Sélectionnez
   Date : 26 Dec 2002 14:20:39 -0800
   De :   Med Bouchenafa

   Au niveau performance, il n'y a aucune différence, l'optimiseur de
   SQL/Server construit le même plan
   Par contre, au niveau conceptuel il est intéressant de différencier ce qui
   appartient à la jointure et ce qui appartient à la limitation du jeu de
   résultat.
   Cela facilite la maintenance et la lecture du source
   [...]
 
Sélectionnez
      Date : 26 Dec 2002 16:31:14 +0100
      De :   Frédéric BROUARD 

      Pour comprende la différence entre le prédicat de la clause de jointure
      et le prédicat du filtre WHERE, je vous propose le petit test suivant :

      -- test de jointure

      CREATE TABLE TEST_JOIN1
      (COL1 INT,
       COL2 CHAR(2))

      CREATE TABLE TEST_JOIN2
      (COL1 INT,
       COL2 CHAR(2))

      INSERT INTO TEST_JOIN1 VALUES (101, 'AA')
      INSERT INTO TEST_JOIN1 VALUES (102, 'AA')
      INSERT INTO TEST_JOIN1 VALUES (103, 'BB')

      INSERT INTO TEST_JOIN2 VALUES (101, 'AA')
      INSERT INTO TEST_JOIN2 VALUES (102, 'AA')
      INSERT INTO TEST_JOIN2 VALUES (201, 'BB')

      -- équivalente ??? En apparence seulement !

      SELECT TJ1.COL1, TJ1.COL2
      FROM   TEST_JOIN1 TJ1
             JOIN TEST_JOIN2 TJ2
                  ON TJ1.COL1 = TJ2.COL1
      WHERE  TJ1.COL2 = 'AA' 

      SELECT TJ1.COL1, TJ1.COL2
      FROM   TEST_JOIN1 TJ1
             JOIN TEST_JOIN2 TJ2
                  ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'AA' 

      -- d'accord... même résultat !!!

      --changeons le lien interne en lien externe...

      SELECT TJ1.COL1, TJ1.COL2
      FROM   TEST_JOIN1 TJ1
             LEFT OUTER JOIN TEST_JOIN2 TJ2
            ON TJ1.COL1 = TJ2.COL1
      WHERE  TJ1.COL2 = 'AA' 

      SELECT TJ1.COL1, TJ1.COL2
      FROM   TEST_JOIN1 TJ1
             LEFT OUTER JOIN TEST_JOIN2 TJ2
                  ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'AA' 

      -- pas d'accord !!! résultat différent...

      -- POURQUOI ???
      -- je vous laisse méditer la chose !
 
Sélectionnez
         Date : 26 Dec 2002 16:55:13 +0100
         De :   Lionel Pénuchot

         Salut Fred,

         Tu peux alors m'expliquer pourquoi cette requête renvoie le même résultat que ta dernière ?

         SELECT TJ1.COL1, TJ1.COL2
         FROM   TEST_JOIN1 TJ1
                LEFT OUTER JOIN TEST_JOIN2 TJ2
                     ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'taratata' and 1=0

         Cordialement
 
Sélectionnez
            Date : 27 Dec 2002 10:17:10 +0100
            De :   Frédéric BROUARD

            La clause WHERE est un filtre d'élimination. Il suppose que les 
            différentes tables sont déjà jointes en une seule et parcourt 
            l'ensemble des résultats à la recherche des lignes correspondant aux
            critères donnés.

            En revanche la clause JOIN se comporte différemment. Elle agit AVANT
            que la jointure soit effective.

            Dans le cadre d'une jointure INTERNE le comportement est similaire à
            celui d'une clause WHERE.

            Dans le cas d'une jointure externe, il faut décomposer la logique en 
            plusieurs étapes :
            1) évaluation des éléments du prédicat
            2) application de la jointure : lignes jointes en 1)
                                            + lignes sans correspondance

            Reprenons la clause de jointure de la requête donnée par Laurent :
               TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'taratata' and 1=0
               ^^^^^^^^^^^^^^^^^^^     ^^^^^^^^^^^^^^^^^^^^^     ^^^
              prédicat de jointure         prédicats hors jointure

            1° 1=0 =&gt; aucune ligne n'est récupérée
               donc aucune ligne de TEST_JOIN1 n'a de correspondance avec TEST_JOIN2
               conclusion : toutes les lignes de TEST_JOIN1 seront reprises du fait
               de la jointure externe 

            2° TJ1.COL2 = 'taratata' =&gt; encore une fois aucune ligne n'est récupérée
               donc aucune ligne de TEST_JOIN1 n'a de correspondance avec TEST_JOIN2
               conclusion : toutes les lignes de TEST_JOIN1 seront reprises du fait
               de la jointure externe 

            3° TJ1.COL1 = TJ2.COL1 =&gt; 2 lignes sont en correspondance avec TEST_JOIN2 
               conclusion, ces deux lignes seront récupérées du fait de la jointure
               externe et la 3e ligne aussi puisqu'elle n'a aucune correspondance 

            ???

            Pour comprendre la différence, il suffit de demander à voir les colonnes
            de la table TEST_JOIN2 dans les différents cas :
 

            SELECT TJ1.COL1, TJ1.COL2, TJ2.COL1, TJ2.COL2
            FROM   TEST_JOIN1 TJ1
                   LEFT OUTER JOIN TEST_JOIN2 TJ2
                        ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'AA'

            COL1        COL2 COL1        COL2 
            ----------- ---- ----------- ---- 
            101         AA   101         AA
            102         AA   102         AA
            103         BB   NULL        NULL
 

            SELECT TJ1.COL1, TJ1.COL2, TJ2.COL1, TJ2.COL2
            FROM   TEST_JOIN1 TJ1
                   LEFT OUTER JOIN TEST_JOIN2 TJ2
                        ON TJ1.COL1 = TJ2.COL1 
            WHERE TJ1.COL2 = 'AA'

            COL1        COL2 COL1        COL2 
            ----------- ---- ----------- ---- 
            101         AA   101         AA
            102         AA   102         AA
 

            SELECT TJ1.COL1, TJ1.COL2, TJ2.COL1, TJ2.COL2
            FROM   TEST_JOIN1 TJ1
                   LEFT OUTER JOIN TEST_JOIN2 TJ2
                        ON TJ1.COL1 = TJ2.COL1 AND TJ1.COL2 = 'taratata' and 1=0

            COL1        COL2 COL1        COL2 
            ----------- ---- ----------- ---- 
            101         AA   NULL        NULL
            102         AA   NULL        NULL
            103         BB   NULL        NULL

            et voilà !

III-E. La jointure croisée

Image non disponible

La jointure croisée n'est autre que le produit cartésien de deux tables. Rappelons que le produit cartésien de deux ensembles n'est autre que la multiplication généralisée. Dans le cas des tables, c'est le fait d'associer à chacune des lignes de la première table, toutes les lignes de la seconde. Ainsi, si la première table compte 267 lignes et la seconde 1214, on se retrouve avec un résultat contenant 324 138 lignes. Bien entendu, s'il n'y a aucun doublon dans les tables, toutes les lignes du résultat seront aussi uniques.

La jointure croisée peut s'écrire de deux manières différentes :

  • à l'aide de l'opérateur normalisé :

     
    Sélectionnez
    SELECT colonnes
    FROM table_1 CROSS JOIN table_2
  • ou à l'aide d'une clause FROM simplifiée :
 
Sélectionnez
SELECT colonnes
FROM table_1, table_2

Ce qui est certainement l'expression la plus minimaliste de tous les ordres SELECT du SQL !

Nous voudrions savoir si notre table des tarifs de chambre (TJ_TRF_CHB) est complète, c'est-à-dire si l'on a bien toutes les chambres (T_CHAMBRE) pour toutes les dates de début de tarif (T_TARIF) :

Exemple 18 :

 
Sélectionnez
SELECT CHB_ID, TRF_DATE_DEBUT, 0 AS TRF_CHB_PRIX
FROM   T_TARIF, T_CHAMBRE
ORDER  BY CHB_ID, TRF_DATE_DEBUT
 
Sélectionnez
CHB_ID  TRF_DATE_DEBUT  TRF_CHB_PRIX
------  --------------  ------------
     1  1999-01-01              0,00 
     1  1999-09-01              0,00
     1  2000-01-01              0,00
     1  2000-09-01              0,00
     1  2001-01-01              0,00
     2  1999-01-01              0,00
     2  1999-09-01              0,00
     2  2000-01-01              0,00
     2  2000-09-01              0,00
     2  2001-01-01              0,00
...


En comparant rapidement le contenu des deux tables, on peut s'assurer que tous les tarifs ont bien été renseignés.

Avec la syntaxe normalisée, cette requête s'écrit :

Exemple 19 :

 
Sélectionnez
SELECT CHB_ID, TRF_DATE_DEBUT, 0 AS TRF_CHB_PRIX
FROM   T_TARIF CROSS JOIN T_CHAMBRE
ORDER  BY CHB_ID, TRF_DATE_DEBUT
 
Sélectionnez
CHB_ID  TRF_DATE_DEBUT  TRF_CHB_PRIX
------  --------------  ------------
     1  1999-01-01              0,00 
     1  1999-09-01              0,00
     1  2000-01-01              0,00
     1  2000-09-01              0,00
     1  2001-01-01              0,00
     2  1999-01-01              0,00
     2  1999-09-01              0,00
     2  2000-01-01              0,00
     2  2000-09-01              0,00
     2  2001-01-01              0,00
...


et donne le même résultat !

III-F. La jointure d'union

Image non disponible

La jointure d'union permet de faire l'union de deux tables de structures quelconque. Elle s'exprime qu'à l'aide de l'opérateur normalisé SQL2 suivant :

 
Sélectionnez
SELECT colonnes
FROM table_1 UNION JOIN table_2

Effectuons par exemple la jointure d'union entre les tables T_TITRE (« M. », « Mme. », « Melle. » ) et T_TYPE (« FAX », « GSM », « TEL ») :

Exemple 20 :

 
Sélectionnez
SELECT *
FROM T_TITRE UNION JOIN T_TYPE
 
Sélectionnez
TIT_CODE TIT_LIBELLE                      TYP_CODE TYP_LIBELLE 
-------- -------------------------------- -------- -------------------
M.       Monsieur                         NULL     NULL
Melle.   Mademoiselle                     NULL     NULL
Mme.     Madame                           NULL     NULL
NULL     NULL                             FAX      Télécopie
NULL     NULL                             GSM      Téléphone portable
NULL     NULL                             TEL      Téléphone fixe


En fait c'est comme si l'on avait listé la première table, puis la seconde en évitant toute colonne commune et compléter les espaces vides des valeurs NULL.

Mais cette jointure est très rarement implantée dans les moteurs SQL.

NOTA : si l'opérateur UNION JOIN n'est pas présent dans votre moteur, vous pouvez le fabriquer comme suit, car elle (l'union) peut être facilement remplacée par un autre ordre SQL presque aussi simple :

 
Sélectionnez
SELECT *
FROM   <table gauche> 
       FULL OUTER JOIN <table droite>
            ON <critère>


Où la condition <critère> est n'importe quel prédicat valant toujours faux comme « 1=2 ».

En dehors du fait de linéariser des tables hétérogènes, il est franchement permis de douter de l'utilité d'un tel opérateur.

IV. Nature des conditions de jointures

Nous allons maintenant analyser les différentes jointures basées sur la nature des conditions pour bien les distinguer.

IV-A. Équijointure

L'équijointure consiste à opérer une jointure avec une condition d'égalité. Cette condition d'égalité dans la jointure peut ne pas porter nécessairement sur les clefs (primaires et étrangères).
Recherchons par exemple les clients dont le nom est celui d'une ville contenu dans la table des adresses :

Exemple 21 :

 
Sélectionnez
SELECT DISTINCT C.CLI_ID, C.CLI_NOM, A.ADR_VILLE
FROM   T_CLIENT C
       JOIN T_ADRESSE A
            ON C.CLI_NOM = A.ADR_VILLE
 
Sélectionnez
CLI_ID  CLI_NOM  ADR_VILLE
------  -------  ---------
    92  PARIS    PARIS
...


Nous avons donc bien réalisé une équijointure, mais elle n'est pas naturelle parce qu'elle ne repose pas sur les clefs des tables.

Bien entendu, il existe un opérateur normalisé SQL 2 permettant de traiter le cas de l'équijointure :

 
Sélectionnez
SELECT [DISTINCT ou ALL] * ou liste de colonnes
FROM   table1 [INNER] JOIN table2 ON condition de jointure

Le mot clef INNER n'étant pas obligatoire, mais voulant s'opposer aux mots clefs OUTER, UNION et CROSS.
Ainsi, la requête précédente s'écrit à l'aide de cette syntaxe :

Exemple 22 :

 
Sélectionnez
SELECT DISTINCT C.CLI_ID, C.CLI_NOM, A.ADR_VILLE
FROM   T_CLIENT C 
       INNER JOIN T_ADRESSE A 
             ON C.CLI_NOM = A.ADR_VILLE
 
Sélectionnez
CLI_ID  CLI_NOM  ADR_VILLE
------  -------  ---------
    92  PARIS    PARIS
...

IV-B. Non-équijointure

Il s'agit là d'utiliser n'importe quelle condition de jointure entre deux tables, excepté la stricte égalité. Ce peuvent être les conditions suivantes :

>

supérieur

>=

supérieur ou égal

<

inférieur

<=

inférieur ou égal

<>

différent de

IN

dans un ensemble

LIKE

correspondance partielle

BETWEEN … AND …

entre deux valeurs

EXISTS

dans une table


En règle générale on trouve des non-équijointures dans le cadre de comparaisons temporelles ou de mesures physiques. Par exemple on pourrait rechercher une pièce mécanique dans un stock qui soit de même nature ou de même fonction qu'une pièce donnée, mais plus légère.

Nous voulons obtenir les factures qui ont été émises avant que le prix des petits déjeuners n'atteigne 6 €.

Exemple 23 :

 
Sélectionnez
SELECT F.*
FROM   T_FACTURE F
       INNER JOIN  T_TARIF T
             ON F.FAC_DATE < T.TRF_DATE_DEBUT
WHERE  TRF_PETIT_DEJEUNE >= 6
 
Sélectionnez
FAC_ID  CLI_ID  PMT_CODE  FAC_DATE    FAC_PMT_DATE
------  ------  --------  ----------  ------------
     1       1  CB        1999-01-31  1999-02-14
     3       1  CHQ       1999-02-28  1999-03-12
     5       1  CB        1999-03-31  1999-04-23
     7       1  CHQ       1999-04-30  1999-05-14
     9       1  CHQ       1999-05-31  1999-06-14
    11       1  CB        1999-06-30  1999-07-14
    13       1  CHQ       1999-07-31  1999-08-12
    15       1  CB        1999-08-31  1999-09-23
    25       2  CB        1999-01-31  1999-02-23
    27       2  CHQ       1999-02-28  1999-03-18
...


NOTA : pour récupérer toutes les colonnes d'une table, on peut utiliser l'opérateur * suffixé par le nom de table, comme nous l'avons fait ici pour la table des factures.

Si notre table des tarifs avait été organisée par tranches, comme ceci :

 
Sélectionnez
TRF_DATE_DEBUT  TRF_DATE_FIN  TRF_TAUX_TAXES  TRF_PETIT_DEJEUNE
--------------  ------------  --------------  -----------------
1999-01-01      1999-08-31             18,60             6,00 E
1999-09-01      1999-12-31             20,60             7,00 E 
2000-01-01      2000-08-31             20,60             8,00 E
2000-09-01      2000-12-31             20,60             9,00 E
2001-01-01      2001-12-31             20,60            10,00 E


alors,récupérer le tarif des chambres pour chacune des dates du planning devient un exercice très simple :

Exemple 24 :

 
Sélectionnez
SELECT CPC.CHB_ID, CPC.PLN_JOUR, TC.TRF_CHB_PRIX
FROM   TJ_CHB_PLN_CLI CPC
       INNER JOIN T_TARIF T
             ON CPC.PLN_JOUR BETWEEN T.TRF_DATE_DEBUT AND T.TRF_DATE_FIN
       INNER JOIN TJ_TRF_CHB TC
             ON T.TRF_DATE_DEBUT = TC.TRF_DATE_DEBUT
                AND  CPC.CHB_ID = TC.CHB_ID
 
Sélectionnez
CHB_ID  PLN_JOUR    TRF_CHB_PRIX
------  ----------  ------------
     1  2000-01-22       40,00 E
     1  2000-01-28       40,00 E
     1  1999-01-02       33,50 E
     1  1999-01-03       33,50 E
     1  1999-01-05       33,50 E
     1  1999-01-07       33,50 E
     1  1999-01-09       33,50 E
     1  1999-01-10       33,50 E
     1  1999-01-11       33,50 E
     1  1999-01-13       33,50 E
...


Nous avons donc à nouveau un exemple remarquable de non-equijointure.

Constatons que la colonne TRF_DATE_FIN de cette nouvelle version de la table des tarifs implique une redondance de l'information. En effet, cette date de fin est déductible de la date de début de la ligne qui contient la date immédiatement postérieure avec un jour de moins. De plus le problème induit par cette organisation des données fait qu'il faut obligatoirement définir une date de fin des tarifs, même dans le futur, sinon certaines tarifications ne pourront être établies par cette requête.

Il ne s'agit donc pas d'une modélisation correcte !

IV-C. Autojointure

Le problème consiste à joindre une table à elle-même. Il est assez fréquent que l'on ait besoin de telles autojointures, car elles permettent notamment de modéliser des structures de données complexes comme des arbres. Voici quelques exemples de relation nécessitant une autojointure de tables :

  • dans une table des employées, connaître le supérieur hiérarchique de tout employé ;
  • dans une table de nomenclature savoir quels sont les composants nécessaires à la réalisation d'un module, ou les modules nécessaires à la réalisation d'un appareil ;
  • dans une table de personnes, retrouver l'autre moitié d'un couple marié.

La représentation d'une telle jointure dans le modèle de données, se fait par le rajout d'une colonne contenant une pseudo clef étrangère basée sur la clef de la table.
Dans ce cas, une syntaxe possible pour l'autojointure est la suvante :

 
Sélectionnez
SELECT [DISTINCT ou ALL] * ou liste de colonnes
FROM   laTable t1
       INNER JOIN laTable t2
       ON t1.laClef = t2.laPseudoClefEtrangère

C'est l'exemple typique ou l'utilisation de surnoms pour les tables est obligatoire, sinon il y a risque de confusion pour le moteur SQL.

Pour donner un exemple concret à nos propos, nous allons modéliser le fait qu'une chambre puisse communiquer avec une autre (par une porte). Dès lors, le challenge est de trouver quelles sont les chambres qui communiquent entre elles par exemple pour réaliser une sorte de suite. Pour ce faire, nous allons ajouter à notre table des chambres une colonne de clef étrangère basée sur la clef de la table.
Dans ce cas, cette colonne doit obligatoirement accepter des valeurs nulles !

Voici l'ordre SQL pour rajouter la colonne CHB_COMMUNIQUE dans la table T_CHAMBRE :

 
Sélectionnez
ALTER TABLE T_CHAMBRE ADD CHB_COMMUNIQUE INTEGER

Alimentons là de quelques valeurs exemples en considérant que la 7 communique avec la 9 et la 12 avec la 14 :

 
Sélectionnez
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 9 WHERE CHB_ID = 7
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 7 WHERE CHB_ID = 9
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 12 WHERE CHB_ID = 14
UPDATE T_CHAMBRE SET CHB_COMMUNIQUE = 14 WHERE CHB_ID = 12

Pour formuler la recherche de chambres communicantes, il suffit de faire la requête suivante :

Exemple 25 :

 
Sélectionnez
SELECT DISTINCT c1.CHB_ID, c1.CHB_COMMUNIQUE 
FROM   T_CHAMBRE c1
       INNER JOIN T_CHAMBRE c2
             ON c1.CHB_ID = c2.CHB_COMMUNIQUE
 
Sélectionnez
CHB_ID  CHB_COMMUNIQUE 
------  -------------- 
     7               9
     9               7 
    12              14
    14              12


où la table T_CHAMBRE figure deux fois par l'entremise de deux surnommages différents c1 et c2.

Notons que cette présentation n'est pas pratique, car elle dédouble le nombre de couples de chambres communicantes, donnant l'impression qu'il y a 4 couples de chambres communicantes ce qui est faux. Il manque juste un petit quelque chose pour que cette requête soit parfaite. Il suffit en effet de ne retenir les solutions que pour des identifiants inférieurs ou supérieurs d'une table par rapport à l'autre :

Exemple 26 :

 
Sélectionnez
SELECT DISTINCT c1.CHB_ID, c1.CHB_COMMUNIQUE 
FROM   T_CHAMBRE c1
       INNER JOIN T_CHAMBRE c2
             ON c1.CHB_ID = c2.CHB_COMMUNIQUE
                AND c1.CHB_ID <= c2.CHB_ID
 
Sélectionnez
CHB_ID  CHB_COMMUNIQUE 
------  -------------- 
     7               9
    12              14

IV-D. La jointure hétérogène

Une jointure hétérogène consiste à joindre dans une même requête, des tables provenant de bases de données différentes, voire de serveurs de données différents. Un tel type de jointure n'est possible que :

  • entre deux bases d'un même serveur : que si le SQL du serveur le permet (par exemple deux bases Oracle, deux bases SQL Server, etc.) ;
  • entre deux bases de deux serveurs différents : qu'en passant par un outil tiers de type « middleware » (par exemple une entre une base Oracle et une base Sybase). L'un des rares middleware à faire ce type de jointure est le BDE (Borland Database Engine) d'Inprise.

Dans ces deux cas, il faut bien vérifier la compatibilité des types, car il se peut que des résultats surprenants apparaissent notamment dans le traitement des nombres réels.

Pour effectuer de telles requêtes, la syntaxe est toujours spécifique au moteur employé. Avec le BDE le niveau de SQL est SQL 2, cantonné aux fonctions de base.

Voici un exemple de requête entre deux serveurs à l'aide du BDE :

Exemple 27 :

 
Sélectionnez
SELECT C.CLI_NOM, T.TEL_NUMERO
FROM ":ORACLE_CLIBD:T_CLIENT" C, ":SYBASE_TELBD:T_TELEPHONE" T
WHERE C.CLI_ID = T.CLI_ID
 
Sélectionnez
NOM_CLI  TEL_NUMERO
-------  --------------
DUPONT   01-45-42-56-63
DUPONT   01-44-28-52-52
DUPONT   01-44-28-52-50
BOUVIER  06-11-86-78-89
DUBOIS   02-41-58-89-52
DREYFUS  01-51-58-52-50
DUHAMEL  01-54-11-43-21
BOYER    06-55-41-42-95
MARTIN   01-48-98-92-21
MARTIN   01-44-22-56-21
...


En fait le BDE se sert d'alias permettant de définir à la fois le serveur et la base concerné. Ici les alias sont : « :ORACLE_CLIBD: » et « :SYBASE_TELBD: ».

V. Récapitulatif des jointures normalisées

V-A. Terminologie et syntaxe des jointures

Image non disponible
  • Jointure naturelle : la jointure s'effectue sur les colonnes communes, c'est-à-dire celles de même nom et type :
 
Sélectionnez
SELECT colonnes
FROM table1 NATURAL JOIN table2 [USING col1, col2 ... ]
[WHERE prédicat] ...

Le mot clef USING permet de restreindre les colonnes communes à prendre en considération.

  • Jointure interne : la jointure s'effectue entre les tables sur les colonnes précisées dans la condition de jointure :
 
Sélectionnez
SELECT colonnes
FROM table1 t1 [INNER ] JOIN table2 t2 ON condition
[WHERE prédicat] ...
  • Jointure externe : la jointure permet de récupérer les lignes des tables correspondant au critère de jointure, mais aussi celles pour lesquelles il n'existe pas de correspondance.
 
Sélectionnez
SELECT colonnes
FROM table1 t1 [RIGHT OUTER | LEFT OUTER | FULL OUTER ] JOIN table2 t2 ON condition
[WHERE prédicat] ...
  • RIGHT OUTER : la table à droite de l'expression clef « RIGHT OUTER » renvoie des lignes sans correspondance avec la table à gauche.
  • LEFT OUTER : la table à gauche de l'expression clef « LEFT OUTER » renvoie des lignes sans correspondance avec la table à droite.
  • FULL OUTER : les deux tables renvoient des lignes sans correspondance entre elles.
  • Jointure croisée : la jointure effectue le produit cartésien (la « multiplication ») des deux tables.
    Il n'y a pas de condition.
 
Sélectionnez
SELECT colonnes
FROM table1 t1 CROSS JOIN table2 t2
[WHERE prédicat] ...
  • Jointure d'union : la jointure concatène les tables sans aucune correspondance de colonnes.
 
Sélectionnez
SELECT colonnes
FROM table1 UNION JOIN table2

Il n'y a pas de critère de jointure.

Si votre SGBDR n'implémente pas la jointure externe droite, inverser l'ordre des tables et faire une jointure externe gauche lorsque cela est possible.

V-B. Arbre de jointure

La jointure de multiples tables peut se représenter sous la forme d'un arbre. Cet arbre possède donc une racine, c'est la table principale, celle d'où l'on veut que l'information parte. Elle possède aussi des feuilles, c'est-à-dire des tables d'entités. Les tables situées entre la racine et les feuilles sont souvent des tables de jointure, possédant en principe deux clefs étrangères. Dans le principe toute table de jointure devrait être un nœud de l'arbre.
La représentation arborescente d'une jointure est un excellent moyen pour visualiser si la clause de jointure de votre requête est à priori correcte. En effet, une référence circulaire dans la clause de jointure ne peut pas être représentée sous la forme d'un arbre et il y a fort à parier que la requête soit incorrecte.

Voici par exemple la requête qui « met à plat », la base hotel :

 
Sélectionnez
SELECT *
FROM   T_CLIENT CLI                      -- le client (racine de l'arbre)
       JOIN T_ADRESSE ADR                -- adresse, table d'entité (feuille de l'arbre)
            ON CLI.CLI_ID = ADR.CLI_ID
       JOIN T_TITRE TIT                  -- titre, table d'entité (feuille de l'arbre)
            ON CLI.TIT_CODE = TIT.TIT_CODE
       JOIN T_EMAIL EML                  -- mail, table d'entité (feuille de l'arbre)
            ON CLI.CLI_ID = EML.CLI_ID
       JOIN T_TELEPHONE TEL              -- téléphone, table d'entité servant de jointure (noeud dans l'arbre)
            ON CLI.CLI_ID = TEL.CLI_ID
            JOIN T_TYPE TYP              -- type de téléphone, table d'entité  (feuille de l'arbre)
                 ON TEL.TYP_CODE = TYP.TYP_CODE
      JOIN TJ_CHB_PLN_CLI CPC            -- table de jointure (noeud dans l'arbre) 
           ON CLI.CLI_ID = CPC.CLI_ID
           JOIN T_PLANNING PLN           -- date du planning, table d'entité (feuille de l'arbre)
                ON CPC.PLN_JOUR = PLN.PLN_JOUR
           JOIN T_CHAMBRE CHB            -- chambre, table d'entité servant de jointure (noeud dans l'arbre)
                ON CPC.CHB_ID = CHB.CHB_ID
                JOIN TJ_TRF_CHB TC       -- table de jointure (noeud dans l'arbre)
                     ON CHB.CHB_ID = TC.CHB_ID
                     JOIN T_TARIF TRF    -- tarif, table d'entité (feuille de l'arbre)
                          ON TC.TRF_DATE_DEBUT = TRF.TRF_DATE_DEBUT
      JOIN T_FACTURE FAC                 -- facture, table d'entité servant de jointure
           ON CLI.CLI_ID = FAC.CLI_ID
           JOIN T_LIGNE_FACTURE LIF      -- ligne de facture, table d'entité (feuille de l'arbre)
                ON FAC.FAC_ID = LIF.FAC_ID 
           JOIN T_MODE_PAIEMENT PMT      -- mode de paiement, table d'entité (feuille de l'arbre) 
                ON FAC.PMT_CODE = PMT.PMT_CODE

Correctement indenté on distingue déjà la structure arborescente. On peut la mettre en évidence en supprimant tout ce qui n'est pas un nom de table :

 
Sélectionnez
       T_CLIENT CLI                      -- le client (racine de l'arbre)
            T_ADRESSE ADR                -- adresse, table d'entité (feuille de l'arbre)
            T_TITRE TIT                  -- titre, table d'entité (feuille de l'arbre)
            T_EMAIL EML                  -- mail, table d'entité (feuille de l'arbre)
            T_TELEPHONE TEL              -- téléphone, table d'entité servant de jointure (noeud dans l'arbre)
                 T_TYPE TYP              -- type de téléphone, table d'entité  (feuille de l'arbre)
            TJ_CHB_PLN_CLI CPC           -- table de jointure (noeud dans l'arbre) 
                T_PLANNING PLN           -- date du planning, table d'entité (feuille de l'arbre)
                T_CHAMBRE CHB            -- chambre, table d'entité servant de jointure (noeud dans l'arbre)
                     TJ_TRF_CHB TC       -- table de jointure (noeud dans l'arbre)
                          T_TARIF TRF    -- tarif, table d'entité (feuille de l'arbre)
           T_FACTURE FAC                 -- facture, table d'entité servant de jointure
                T_LIGNE_FACTURE LIF      -- ligne de facture, table d'entité (feuille de l'arbre)
                T_MODE_PAIEMENT PMT      -- mode de paiement, table d'entité (feuille de l'arbre)

Par cette indentation, il est facile de repérer les jointures entre les tables.

VI. Note importante

Les jointures ne sont pas la seule manière de mettre en relation différentes tables au sein d'une même requête SQL. On peut aussi joindre plusieurs tables à l'aide des sous-requêtes ainsi qu'à l'aide des opérateurs ensemblistes que nous allons voir aux deux prochains chapitres.

VII. Résumé

Voici les différences entre les moteurs des bases de données :

 

Paradox

Access

PostGreSQL

Sybase

SQL Server 7

Oracle 8

DB2 (400)

INNER JOIN

Oui

Oui

Oui

Oui

Oui

Non (1)

Oui

OUTER JOIN

LEFT, RIGHT, FULL

LEFT, RIGHT

LEFT, RIGHT, FULL

LEFT, RIGHT, FULL

LEFT, RIGHT, FULL

Non (1)

LEFT (4)

UNION JOIN

Non (2)

Non

Non

Non (2)

Non (2)

Non (1) (2)

Non

CROSS JOIN

Non (3)

Non (3)

Oui

Non (3)

Oui

Non (1) (3)

Oui


(1) Oracle ne connaît toujours pas le JOIN (ça fait quand même plus de dix ans de retard pour cet éditeur pionnier qui semble s'endormir sur ses lauriers). Il faut donc utiliser une syntaxe propriétaire. Exception : la version 9 supporte enfin les jointures normalisées.

(2) Possible avec un FULL OUTER JOIN

(3) Possible avec l'ancienne syntaxe sans précision de critère WHERE

(4) de plus IBM DB2 (400) dispose d'un très intéressant « exception join » équivalent à :

 
Sélectionnez
SELECT * 
FROM tablegauche
   LEFT OUTER JOIN tabledroite
      ON références de jointure
WHERE tabledroite.clef IS NULL

Données concernant DB2 400 aimablement communiquées par kerigan.

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

Copyright © 2004 Frédéric Brouard. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.