IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library 
Associations and InstitutionsAnnual 
ConferenceSearchContacts

64th IFLA Conference Logo

   64th IFLA General Conference
   August 16 - August 21, 1998

 


Code Number: 034-99-F
Division Number: IV.
Professional Group: Classification and Indexing
Joint Meeting with: -
Meeting Number: 99.
Simultaneous Interpretation:   No

GOO : le Système National Néerlandais d'Indexation-Matière

G.J.A. Riesthuis
Université d' Amsterdam,
Département de bibliothéconomie et des sciences de l'information
Amsterdam, Pays-Bas

et

R. Storm

Bibliothèque royale
La Haye, Pays-Bas


Résumé :

Le NCC (Catalogue collectif néerlandais) est un catalogue intégré d'environ 400 bibliothèques des Pays-Bas, dont la Bibliothèque nationale, les bibliothèques universitaires et les principales bibliothèques publiques. Le NCC permet plusieurs possibilités de recherche : auteurs, titres, mots du titre, etc. Pour la recherche par sujet, la "Basis-Classification" néerlandaise (BC) et un système national d'indexation, le "Gemeenschappelijke Trefwoordenthesaurus" (GTT), sont disponibles. Ce document traite de la BC et du GTT. La BC est une classification générale récemment développée, à larges divisions (2200 classes environ). La recherche détaillée par sujet est possible par l'utilisation des 45 000 termes néerlandais du GTT. La BC et le GTT peuvent aussi être utilisés en combinaison


Paper

Le Catalogue collectif néerlandais (NCC)

Le catalogue collectif néerlandais (NCC) est un catalogue intégré comprenant environ 400 catalogues de bibliothèques des Pays-Bas, dont celui de la Bibliothèque royale de La Haye (Bibliothèque nationale des Pays-Bas), et ceux des bibliothèques universitaires et des principales bibliothèques publiques. Le catalogue collectif offre les possibilités de recherche suivantes : mots du titre, titres (de périodiques seulement), auteurs, collectivités auteurs, clés auteur/titre (quatre premières lettres du nom de l'auteur suivies des quatre premières lettres du premier mot du titre), vedettes-matière ainsi que les notations de la classification de base néerlandaise (BC).

La Classification de base néerlandaise (BC)

La classification de base néerlandaise (disponible en néerlandais, anglais et allemand sur Internet : http://www.konbib.nl/home-fe.html ) est une classification à larges divisions qui comprend quelque 2200 classes. La classification de base comporte 48 classes principales regroupées en quatre grappes :
généralités, arts et lettres (humanités), sciences et technologie, sciences sociales.
Chaque classe principale a une notation à deux chiffres. On subdivise en ajoutant une autre tranche de deux chiffres. Ainsi, chaque classe principale peut avoir 100 subdivisions. Toutefois, la plupart des classes principales comportent beaucoup moins de subdivisions, avec trois ou quatre niveaux hiérarchiques seulement. La deuxième édition de la classification a été publiée en 1992 ; la troisième est en cours d'impression.

La BC est utilisée pour donner une vue générale de la documentation. La plupart des notations donnent accès à trop d'ouvrages pour en avoir un aperçu rapide, mais c'est un bon moyen de voir quels sont les derniers titres parus dans un domaine donné. Une recherche faite le 11 mars 1998 sur la notation 15.75 "Histoire de l'Asie" (le niveau le plus précis disponible) donne 7 465 réponses, dont les 9 premières correspondent à des titres publiés en 1998, et en 1997 pour les 323 suivantes.
Toutes les notations ne donnent pas autant de réponses que la notation 15.75 : 06.04 "Histoire de l'archivistique" donne seulement 7 titres, 06.72 "Catalogage matière" 198 titres et 79.21 "Services aux sans-abri" 41. Pour la plupart des notations, on trouve plusieurs centaines de réponses.

La classification de base, toutefois, n'a jamais été conçue comme un outil de recherche directe. Elle a été élaborée à la fin des années 80 par la communauté des bibliothèques scientifiques des Pays-Bas avec les deux objectifs suivants : coordination de la gestion des collections et partage des tâches d'indexation-matière. Dans ce système conjoint classification-vedettes-matière, une liste de vedettes-matière ou un thésaurus prend en charge l'indexation précise alors que la BC présente le contexte disciplinaire de l'ensemble des entrées. Aujourd'hui, elle est bien utilisée dans ces deux buts, mais dans quelques bibliothèques elle sert également pour le rangement des documents sur les rayons, ce pourquoi elle n'était pas faite et n'est guère adaptée puisqu'elle n'est pas suffisamment détaillée.

En accord avec l'utilisation normale de la BC, la plupart des ouvrages ne reçoivent qu'une seule notation. Elle doit correspondre au sujet général du document. Il est important de classifier le document dans la discipline scientifique exacte. Une publication sur l'utilisation de la télédétection comme outil d'exploration en sciences de la Terre ne devrait pas être classifié à la notation 74.41 "Photographies aériennes, photogrammétrie, télédétection", le seul endroit pourtant où le mot "télédétection" apparaît, mais à 38.03 "Méthodes et techniques des sciences de la Terre".
En raison du lien qui existe entre la classification et le langage documentaire, la classification comporte peu de subdivisions chronologiques et géographiques et il y en aura encore moins dans l'avenir. Ces éléments appartiennent au système d'indexation-matière.
Dans le catalogue collectif national néerlandais en ligne, il est possible d'utiliser la classification pour restreindre la recherche. On peut chercher les ouvrages qui ont la notation 15.75 et le sujet "Thaïlande" ou le mot du titre "Thaïlande ". De cette manière, on peut séparer les ouvrages historiques sur la Thaïlande des ouvrages géographiques.

Thésaurus GOO (GTT)

Le langage d'indexation national s'appelle " Gemeenschappelijke Trefwoordenthesaurus (GTT) " (Thésaurus conjoint de vedettes-matière). Ce thésaurus comprend les catégories de vedettes suivantes :
  1. Descripteurs de noms communs, c'est-à-dire termes correspondant aux concepts qui n'appartiennent pas aux catégories listées ci-dessous (Pluie, Sucre, Meubles)
  2. Descripteurs géographiques (Allemagne, Amsterdam (ville), Orénoque)
  3. Noms de collectivités (British Railways, Nations unies)
  4. Titres ou noms d'œuvres d'art (Othello (Shakespeare), Guernica (Picasso))
  5. Descripteurs pour la forme des documents (Dissertations (forme), Bibliographies (forme))
  6. Descripteurs pour les genres de fiction (Poésie (textes), Nouvelles (textes))
  7. Noms d'"unica", i.e. événements particuliers, médicaments et choses qui portent un nom
          (Titanic (navire))

Les noms de personne ne sont pas intégrés dans le thésaurus. Dans le système, il existe un thésaurus spécifique pour les noms des personnes, également utilisé pout le catalogage signalétique.
Le GTT est en néerlandais. Les descripteurs peuvent être des unitermes comme "Logiciel" ou des expressions comme "Economisch beleid" (Politique économique). Le néerlandais permet également la combinaison de plusieurs mots pour former un seul mot composé (comme l'allemand le fait), par exemple "Welzijnsbeleid" (Politique de bien-être).

Règles pour l'utilisation de la BC et du GTT

L'indexeur dispose d'un ensemble de règles pour l'aider dans l'utilisation de la classification et du thésaurus. Il est important de noter que la BC est indépendante du thésaurus.
Il n'existe pas d'ensembles de descripteurs liés à une classe de la classification. L'attribution des descripteurs est complètement indépendante de la classification. La BC est générale et globale, le
GTT est le plus précis possible.
En principe, les descripteurs rendent le sujet du document et non la discipline à laquelle il appartient. Si un ouvrage a comme descripteur "Sociologie", c'est qu'il étudie la sociologie. S'il s'agit d'une étude
sociologique sur la société, le descripteur sera "Sociétés". Il faut également noter que ni le point de vue ni le public cible ne font partie des descripteurs. "Statistiques pour bibliothécaires" a comme descripteur "Statistiques" mais pas "Bibliothécaires" ou "Bibliothéconomie".

Cohérence et ambiguïté

En principe, on n'indexe qu'un seul sujet, le sujet général de l'ouvrage. On n'admet plus d'un sujet
que dans des cas exceptionnels.
Le GTT comprend actuellement quelque 45 000 descripteurs, en majorité des noms propres et des titres appartenant à l'une des 6 dernières catégories déjà mentionnées. Chaque mois, de nouveaux descripteurs, noms propres surtout, s'ajoutent au thésaurus. Dans la mesure du possible, on évite les
dédoublements de descripteurs pour un même concept, de même que des noms différents pour un même événement ou des titres différents par une même oeuvre. Toutefois, compte tenu du nombre de descripteurs déjà dans le thésaurus, il est impossible d'éviter tout doublon. Une attention toute particulière doit être donnée à des sujets tels que "Bibliothèques" et "Éducation" par rapport à "Éducation bibliothéconomique". En néerlandais, ces descripteurs seraient "Bibliotheken" et "Opleidingen" en concurrence avec "Bibliotheekopleidingen ". Il est assez difficile de reconnaître ce type de double emploi. Mais il existe des règles particulières pour déterminer quand utiliser un mot composé et quand utiliser des unitermes, règles basées sur les normes ISO pour les thésaurus.

Quand plusieurs indexeurs utilisent la même classification et le même thésaurus, la cohérence s'avère un problème majeur. Le nombre de personnes qui font de l'indexation avec ce système de façon régulière est d'environ 150. Pour une bibliothèque spécialisée en sociologie, toutes les mathématiques
sont de la statistique, alors que dans une bibliothèque de mathématiques, un document sur les problèmes sociaux des étudiants peut être indexé à "Problèmes sociaux".
Ce qui est spécifique pour un indexeur peut être très général pour un autre.
Le problème de cohérence est un problème réel dans le Catalogue collectif néerlandais. C'est une illusion de croire que tous les ouvrages sur un sujet donné sont toujours indexés de la même manière. Cela dépend de la bibliothèque où a été faite l'indexation et également de l'indexeur lui-même.
Cela dépend aussi du sujet de l'ouvrage. Il est préférable d'avoir un sujet très précis. Des sujets bien définis sont moins susceptibles d'introduire l'incohérence que des sujets vagues. Un ouvrage sur une ville sera probablement rendu par le nom de la ville, mais qui peut vraiment dire quel sera le descripteur utilisé pour un ouvrage sur le plaisir de tomber amoureux ?

En pratique, il apparaît inévitable que certains livres qui portent sur un sujet complexe reçoivent une combinaison de descripteurs et d'autres un seul descripteur composé : "Kinderen" et "Mishandeling" ["Enfants" et "Mauvais traitements"] versus "Kindermishandeling" ["Mauvais traitements à enfants"].

Il existe des termes qui ont une signification ambiguë. "Catalogues" comporte différents sens et n'est pas synonyme de "Bibliographies". Une recherche avec le descripteur "Catalogues" permet néanmoins de trouver aussi quelques bibliographies dont le titre comporte le mot "catalogue". Or le descripteur "Catalogues" est réservé pour les livres portant sur des catalogues et sur le catalogage. Quant aux catalogues eux-mêmes, ils devraient être indexés par le terme "Catalogues (forme)" ; mais l'utilisateur ne trouvera pas sous ce descripteur de catalogues de bibliothèques parce qu'il existe un autre descripteur pour ce sujet.

On peut souvent éviter de tels problèmes en cherchant d'abord comment ont été indexés des ouvrages sur le même sujet. Mais est-ce une pratique courante?
L'utilisation du thésaurus pose plus de problèmes que l'utilisation de la classification. La classification est plus générale, et de nombreuses indications guident vers une discipline et ses sous-disciplines. Dans la prochaine édition, la troisième, on trouvera encore un plus grand nombre d'orientations que dans l'édition actuelle.

Le Thésaurus GOO

Il apparaît utile d'expliquer comment on indexe avec le thésaurus GOO.
Une vedette-matière dans le GTT porte le nom de "notice" ; elle est, avec les noms de personne utilisés comme auteur ou sujet, quelque chose qui diffère tout à fait d'un titre.
Chaque élément d'une notice possède sa propre étiquette. Ces étiquettes sont les suivantes :

005       Type et statut de la notice
009       Genre de notice
160       Vedette-matière
260       Synonyme
460       Terme générique
470       Terme spécifique
600       Référence générale
901       Explications pour l'utilisateur
911       Source de la vedette-matière
921       Explications pour l'indexeur

La plupart de ces éléments peuvent être répétés. Le nombre des synonymes peut être particulièrement impressionnant.
L'indexeur doit immédiatement relier la vedette-matière à la description bibliographique de l'ouvrage qu'il est en train de compléter. Selon les différents types de vedettes, plusieurs étiquettes peuvent être utilisées :

5300       Code de la bibliothèque qui a indexé le livre
5301       Code de la classification de base
5311      Subdivision chronologique du sujet
5401       Vedette-matière
5421       Vedette de nom de lieu
5431       Vedette de forme
5441       Vedette de genre littéraire
5601       Nom de personne utilisé comme sujet

Ces étiquettes peuvent être répétées quoique, en principe, on n'attribue pas plus d'un code de la BC à chaque ouvrage. Par contre, dans la plupart des cas, on utilise plus d'une vedette-matière.

Voyons maintenant comment fonctionne le thésaurus en pratique.

D'abord, l'indexeur d'une bibliothèque participante travaille toujours en ligne dans le catalogue collectif néerlandais. Il a sur son bureau un ou des ouvrages à indexer. Il vérifie une à une les entrées dans le catalogue. Quand un titre est déjà traité par une autre bibliothèque, relié au bon code de la BC et à la vedette-matière correcte, il n'y a rien d'autre à faire et le livre poursuit son chemin sans délai.
Quand la notice de l'ouvrage paraît incomplète dans son indexation, il est possible de la compléter.
Si une publication n'est pas encore indexée, l'indexeur doit donner un code et une ou des vedettes-matière appropriées. Pour l'aider, il dispose de quelques commandes déjà intégrées au système sur les
ordinateurs PICA IBW (postes de travail intelligents). Les vedettes et codes nécessaires sont alors ajoutés aux étiquettes appropriées. Une fois ce travail terminé, l'ouvrage est indexé pour toutes les bibliothèques qui en possèdent déjà un exemplaire ou qui en acquerront un.
Depuis que l'utilisation du GOO a commencé en 1991, plus d'un million de documents ont été indexés par les bibliothèques participantes.

Il arrive bien sûr que des vedettes qui ne sont pas encore dans le thésaurus GTT paraissent nécessaires à l'indexation d'un document. L'indexeur doit alors être particulièrement attentif : s'il n'est pas difficile d'ajouter une nouvelle vedette au thésaurus, il est vraiment peu souhaitable d'ajouter des notices inutiles. Une nouvelle vedette doit être réellement nouvelle, et non un synonyme d'une vedette déjà dans le thésaurus, ou un mot composé correspondant à une expression déjà présente sous forme d'unitermes utilisés en combinaison. Mais quand un indexeur est certain après recherches dans le GTT que l'ajout d'une vedette est nécessaire, il peut le faire sans plus attendre. Il est alors possible et même obligatoire d'utiliser la nouvelle vedette dans la notice correspondante : les nouvelles vedettes qui ne sont pas utilisées sont détruites après une période relativement brève.
L'ajout direct et quotidien de nouvelles vedettes assure la mise à jour de la base de données et renforce la dynamique du GTT. Cette mise à jour régulière rend difficile la publication sur papier d'éditions complètes du thésaurus. On nous demande parfois des éditions imprimées, pas tant d'ailleurs pour les utiliser comme outil de travail que pour avoir une impression générale du contenu du GTT. Comme de nouvelles vedettes s'ajoutent chaque jour, une édition imprimée serait périmée trop rapidement.
NB. Au cours des sept dernières années, quelque 15 000 nouvelles vedettes se sont ajoutées au GTT, ce qui représente environ trois cent nouvelles vedettes chaque mois.
Le contrôle formel et la vérification des nouvelles vedettes suivent toujours la création.
Si pour une raison quelconque, la nouvelle vedette n'est pas correcte, elle est modifiée et reçoit alors son statut définitif. Si, après réflexion, on juge que la vedette n'est pas nécessaire, elle est alors retirée du GTT et la notice catalographique est modifiée en conséquence.

L'utilisation quotidienne du GOO, décrite ici de façon très générale, pose également des problèmes.
Ils peuvent être de nature technique, mais peuvent également être liés aux sujets spécifiques des ouvrages ou aux vedettes.
Par exemple : jusqu'où et comment peut-on adapter une notice indexée par des collègues d'autres bibliothèques? Le principe de l'indexation la plus précise possible doit-il vraiment être pris au sérieux et de nouvelles vedettes toujours plus spécifiques peuvent-elles s'ajouter indéfiniment au thésaurus? L'indexeur doit-il toujours utiliser comme exemple des titres déjà indexés, même si ces indexations diffèrent de ce qui est déjà appliqué avec les nouvelles règles du GOO? Que faire quand deux publications qui portent sur un sujet presque semblable ont été indexées différemment? Que faire encore de vedettes différentes qui ont plus ou moins le même sens mais sous lesquelles se retrouvent différentes publications? Il faut admettre qu'il n'est pas facile de répondre à ce type de questions.
Le GOO est relativement jeune et continue de se développer vers une forme plus définie. De plus, des petits changements dans le thésaurus peuvent nécessiter la modification de milliers d'entrées dans les catalogues mais qui a le temps et l'argent pour le faire?

On se doit de continuer d'acquérir de l'expérience dans l'utilisation du GOO. Ceci signifie : un usage national d'un instrument général pour l'indexation-matière, dans différentes bibliothèques, en différents
endroits, mais de la même façon partout. Quand on fait la description d'un ouvrage, il y a peu de chance de désaccord sur le nombre de pages. Mais c'est une autre affaire quand il s'agit d'indexation : un document sur l'"essence de l'être" pourra être indexé bien différemment par différentes personnes dans différentes bibliothèques.

GOO et GdC

On ne peut séparer le GOO de ce que l'on appelle la coordination de la gestion des collections (GdC). À la base, la GdC a pour but de permettre l'ajustement de la gestion des collections des principales bibliothèques d'enseignement et d'institut l'une à l'autre (rationalisation des collections) de façon à mieux partager les ressources financières et à éviter les achats en double. Avant de prendre des décisions importantes sur le sujet, il faut au préalable connaître les fonds particuliers des bibliothèques et leur mode de gestion des collections. Pour ce faire, la classification BC s'avère utile.

Participants

Le groupe de bibliothèques qui a commencé à utiliser le GOO en 1991 comprenait les bibliothèques universitaires de Groningue, Leyde, Nimègue et Utrecht ainsi que la Bibliothèque royale de La Haye. Peu après, les bibliothèques universitaires de Rotterdam, d'Amsterdam (UVA) et de Maastricht les rejoignirent, pendant que quelques bibliothèques de collège et bibliothèques provinciales se joignaient aussi au groupe. En 1998, le réseau compte environ une quizaine de bibliothèques participantes dont les principales bibliothèques scientifiques, à l'exception des bibliothèques de sciences pures et de technologie (Delft, Wageningen, Twente, Eindhoven et KNAW - Académie royale néerlandaise).

Structure de l'organisation

La responsabilité du GOO est partagée entre les bibliothèques universitaires et la Bibliothèque royale d'une part, et la société de services informatiques PICA d'autre part.
La coordination nationale du GOO est assurée par la Bibliothèque royale depuis 1993.
La Bibliothèque royale fournit également deux personnes pour superviser le travail fait dans le thésaurus quotidiennement. Le coordonnateur national ne pourrait s'en sortir sans l'assistance d'un petit comité de coordination. Ce comité prend des décisions sur de nombreux sujets, grands ou petits.
Pour leur part, les bibliothèques ont leur propre représentant au conseil des usagers du GOO qui agit d'abord comme forum d'échange et aussi comme point de contact régulier entre les représentants et le comité de coordination. Les indexeurs, enfin, ont des réunions régulières avec leurs collègues, rencontres au cours desquelles on s'entend sur les questions de base et les problèmes concrets ainsi que sur le niveau d'indexation.

Développements récents


French translation : Michel Fournier