IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library Associations and InstitutionsAnnual ConferenceSearchContacts
*    
To Bangkok Conference programme

65th IFLA Council and General
Conference

Bangkok, Thailand,
August 20 - August 28, 1999


Code Number: 080-155(WS)-G
Division Number: IV
Professional Group: Cataloguing: Workshop
Joint Meeting with: -
Meeting Number: 155
Simultaneous Interpretation:   No

Der Bedarf nach Kooperation bei Erarbeitung und Pflege mehrsprachiger Schlagwortnormdateien

Genevieve Clavel-Merrin
Swiss National Library
Bern, Switzerland


Abstract

Die Aufgaben der Erarbeitung, Verwaltung und Pflege mehrsprachiger Schlagwortnormdateien erfordert erhebliche Mittel und sollte daher am besten in Kooperation erfolgen. Vier europäische Nationalbibliotheken (die Schweizerische Landesbibliothek, die Bibliothèque de France, Die Deutsche Bibliothek und die British Library) haben gemeinsam eine Machbarkeitsstudie über die Verknüpfung bestehender Schlagwortverzeichnisse in verschiedenen Sprachen erarbeitet, um einen mehrsprachigen Schlagwort-Zugang zu ihren Daten zu ermöglichen.


Paper

Einleitung

Am 24. August 1995 fand in Istanbul ein Workshop über „Mehrschriftliche, mehr-Zeichensatz-Probleme im Online-Umfeld" statt, der von der IFLA Section on Classification and Indexing unterstützt wurde. Auf diesem Workshop habe ich die Diskussionen zusammengefasst, die in der Schweizerischen Landesbibliothek1 über ein Format für mehrsprachigen Zugang zu bibliographischen Daten stattgefunden haben. Ich habe betont, dass der Bedarf nach mehrsprachigem Zugang zu bibliographischen Datenbanken sowohl Institutionen in mehrsprachigen Ländern wie die Schweiz betrifft als auch in Ländern, die üblicherweise als einsprachig angesehen werden.

Die Gründe dafür sind wohl bekannt: viele unserer Institutionen, sowohl nationale als auch universitäre sammeln Daten in mehreren Sprachen und machen mit Hilfe des Internet ihre Kataloge den Benutzern und Studierenden weltweit verfügbar. Eine Datenbankabfrage sollte somit nicht nur durch Benutzer-Oberflächen in den relevanten Sprachen möglich sein, sondern idealerweise auch in der Sprache des Benutzers, um Suchbegriffe einzugeben (oder Eigennamen, Körperschaften, Länder usw.). Derzeit ist in der Mehrzahl der Fälle eine sachliche Suche in Datenbanken nur möglich beim Gebrauch der Schlagwörter in der Sprache des jeweiligen Landes. Beispielsweise wird in der Bibliothèque de France, ein Dokument unabhängig von seiner Originalsprache mit einer französischen Dokumentationssprache indexiert. Aus diesem Grunde sollte der ausländische Benutzer der französischen Nationalbibliothek des Französischen mächtig sein, um nach Schlagwörtern zu suchen für Texte, die in Englisch oder Deutsch geschrieben wurden. Das gleiche Problem kommt in gewissem Masse auch vor, wenn man nach bestimmten Eigennamen (insbesondere bei Transliterationen), Körperschaften oder Einheitstiteln sucht. In diesem Vortrag werden wir uns aber auf den sachlichen Zugang konzentrieren.

Wie schon 1995 festgestellt, sollte theoretisch der Indexierer dazu fähig sein, ein Dokument zu analysieren und ihm Schlagwörter in seiner Muttersprache zuzuweisen, wobei der/die Benutzer(in) imstande sein sollte, in seiner/ihrer Muttersprache zu suchen. Die Sprache des Dokuments selbst sollte weder Einfluss auf die Sprache der Schlagwörter, die für die Erschließung verwendet wurde, haben, noch auf die Sprache, die für die Abfrage verwendet wird. Dennoch - wie damals festgestellt, hatten wir aus mehreren Gründen keine Sprache für die Sacherschließung ausgewählt. Die Kosten der Erarbeitung und Pflege einer mehrsprachigen Liste hätte viel mehr Mittel erfordert als die SLB zur Verfügung hatte, sogar wenn wir mit anderen Institutionen in unserem Lande zusammengearbeitet hätten. Idealerweise hätten wir gewünscht, eine Liste mit anderen Bibliotheken in Europa oder woanders in der Welt zu teilen, aber eine solche Liste existierte nicht. Auf lange Sicht konnten dennoch, wie wir gesagt hatten, solche mehrsprachigen Listen nur auf internationaler Ebene erarbeitet und gepflegt werden.

In der Zwischenzeit hat nun eine solche Zusammenarbeit begonnen. In diesem Vortrag möchte ich erklären, warum sie von den Partnern als erforderlich betrachtet wurde, und dann die Arbeit beschreiben, die wir bis jetzt erbracht haben, und abschließend die Pläne für die Zukunft zeigen.

CENL und CoBRA+

1997 bat die Conference of European National Libraries (CENL) (Konferenz von Europäischen Nationalbibliotheken) CoBRA+, das Problem des mehrsprachigen Zugangs zu bibliographischen Datenbanken anzugehen. CENL ist eine unabhängige Vereinigung von Bibliotheksdirektoren aus den europäischen Nationalbibliotheken, die Mitgliedsstaaten des Europarats angehören. Die Konferenz besteht gegenwärtig aus 39 Mitgliedern (1998) (2). 1998 wurde beschlossen, CENL als eine private Stiftung zu errichten.2 CoBRA+ (Computerised Bibliographic Record Actions) (Aktion automatisierter bibliographischer Datenbanken) war eine vereinbarte Aktion zwischen Nationalbibliotheken und anderen nationalbibliographischen Einrichtungen in ganz Europa. Von Juni 1996 bis Anfang Januar 1999 wurde sie von der Europäischen Kommission finanziert. Damit wurde die Arbeit weiter fortgesetzt, die Anfang der 90er Jahre vom Programm CoBRA begonnen worden war. Das Programm umfasste eine Reihe von Forschungsprojekten und Pilotversuchen, die auf die Zusammenarbeit zwischen nationalen Initiativen für die Bereitstellung von bibliographischen Diensten zielten3. Obwohl die EG-Finanzierung jetzt beendet ist, haben die Partner von CoBRA+ vereinbart, dass das CoBRA Forum sich weiter treffen und sich weiter bei CENL melden sollte.

CoBRA+ wird von einem Forum aus acht Nationalbibliotheken geleitet:

  • British Library (BL) (Großbritannien), (Brian Lang, Vorsitz)
  • Die Deutsche Bibliothek (DDB), Deutschland (Elisabeth Niggeman)
  • Bibliothèque nationale de France (BnF), Frankreich (Alix Chevallier)
  • Koninklijke Bibliotheek (KB), Niederlande (Wim van Drimmelen und Johan Steenbakkers)
  • Biblioteca nacional de Lisboa (BNP), Portugal ( Fernada Campos)
  • Helsigin Yliopiston Kirjasto (HUL), Finnland (Esko Hakli)
  • Schweizerische Landesbibliothek (SLB), Schweiz (Jean-Frederick Jauslin)
  • ICCU, Italien (Giovanna Merola)
  • Narodna in Univerzitetna Knizznica (NUK), Slowenien (Vilenka Jakac-Bizjak) (Beobachter)

1997 wurde eine Arbeitsgruppe unter der umfassenden Bezeichnung CoBRA+ Geschäftsbereich A zusammengerufen, um die mehrsprachigen Angelegenheiten zu diskutieren, die Nationalbibliotheken berühren. Die Gruppe erstellte ein Konzept, das der CENL bei einem Treffen in Warschau am 2.-3. Oktober 1997 vorgetragen wurde. CENL entschied, dass eine Pilotstudie über mehrsprachige Sacherschließung in Französisch, Deutsch und Englisch bis Anfang 1999 durch die Gruppe erarbeitet werden sollte4. Die Information über die Studie wurde von den durch die Gruppe produzierten Sachstudien und dem Abschlussbericht entnommen. (Zur Zeit der Abfassung sind diese noch nicht öffentlich, im August sollten sie auf der WWW-Seite Gabriel plaziert werden)5.

Hintergrund des gewählten Ansatzes

Das Problem der Erarbeitung mehrsprachiger Thesauri wurde viel diskutiert, obwohl oft auf einer restrikten Basis, und ein Standard existiert (ISO 59646) , der drei mögliche Wege zu ihrem Aufbau vorschlägt:

  • Aufbau eines neuen mehrsprachigen Vokabulars, ohne direkte Referenzen zu Wortschatz oder Strukturen eines bestehenden Thesaurus;
  • Übersetzung eines existierenden einsprachigen Thesaurus;
  • Ausgleich und Zusammenführung existierender Thesauri in zwei oder mehr Arbeitssprachen.

Beim Blick auf diese Ansätze im Zusammenhang dieser Studie wurden die folgenden Punkte in Betracht gezogen:

  • Bibliotheken der verschiedenen Sprachgebiete, die von der Studie behandelt werden (Französisch, Deutsch, Englisch) haben sich schon lange um Erarbeitung und Pflege von Schlagwortnormdateien bemüht. Diese werden sehr viel benutzt und ermöglichen den Schlagwort-Zugang zu Millionen von Dokumenten. Die Erarbeitung eines neuen Vokabulars, mehrsprachig oder sonstwie, wäre unrealistisch und unwirtschaftlich;
  • Die Übersetzung und Pflege einer Schlagwortsprache in eine oder mehrere Sprachen, die dann von anderen Institutionen angewandt werden würde, bedeutete aber, dass diese Institutionen ihre vergangenen Bemühungen in ihre eigene Schlagwortsprache aufgeben müssten. Damit würde der Zugang zu Dokumenten behindert werden, die schon früher indexiert wurden.
  • Deshalb ist es im Interesse der Bibliotheken, in diesem Gebiet zusammen zu arbeiten und Wege zu erforschen, um mehrsprachigen Zugang zu ihren Beständen zu ermöglichen, ohne ihre eigenen Schlagwörter abzuschaffen oder zu übersetzen.

Der Pilotversuch

Infolgedessen wählte die Gruppe den dritten Ansatz der Machbarkeitsstudie: wie ein mehrsprachiger Schlagwort-Zugang geschaffen werden könnte durch Verwendung dreier verschiedener Schlagwortnormdateien: RAMEAU, SWD/RSWK und LCSH mit Hilfe der Formulierung von Verweisungen zwischen den Schlagwörtern in jeder Sprache. (Ein ähnlicher Ansatz wurde auch von zwei wichtigen Terminologieprojekten ausgewählt mit der Zusammenstellung von vergleichbarer Termini zwischen dem Kunst- und dem Architektur-Thesaurus und anderen kontrollierten Vokabularen in demselben Bereich7, und in dem Unified Medical Language System (UMLS)8) (Vereinbarten Medizinischen Sprachsystem). Es sollte auch betont werden, dass der von der Gruppe gewählte Ansatz mit den Regeln von ISO 5964 nicht genau vereinbar ist, doch wurden die Lösungen, die vom genannten Standard vorgeschlagen werden, untersucht und teilweise in der Festlegung der Verweisungs-Methode der Gruppe benutzt. Das Ziel der Studie war die Festlegung von gleichwertigen Worten (oder von bestmöglichen Übereinstimmungen) zwichen RAMEAU, SWD/RSWK und LCSH, indem einerseits Schlagwörter aus bestimmten Themenbereichen und andererseits die Erschließung von Dokumenten verglichen wurden. Die vier Hauptpunkte waren:

  • Formulierung von Regeln für Auswahl und Verweisung von Schlagwörtern;
  • Verweisungen von Schlagwörtern und Analyse von Resultaten in den gewählten Themenbereichen Sport und Theater;
  • Untersuchung der praktischen Folgen dieser mit Verweisungen versehenen Schlagwörter, indem 40 Titel im Themenbereich Theater mit jeder Schlagwort-Sprache indexiert und die Resultate dann verglichen wurden;
  • Vergleich der Erschließung von Titeln in anderen Themenbereichen als denen der Verweisungs-Studie selbst. Dafür stand eine Erschließung in jeder der Schlagwort-Sprachen zur Verfügung (im ganzen wurden 21 Titel gefunden).

Es war von Anfang an klar, dass die Verweisungs-Studie Konsequenzen auf zukünftige Zusammenarbeit haben würde. Die wichtigste war, dass es möglich ist, für die Mehrheit der Schlagwörter Synonyme zu finden, und dass, wenn jeder Partner diese Verweisungen benutzen würde, völlig standardisierter Schlagwort-Zugang nur in der Quell-Sprache des Katalogs garantiert wäre, und dass dieser Zugang für jede Institution anders wäre.

Mit anderen Worten, jedes Dokument würde in einer Institution nicht dreimal indexiert mit SWD/RSWK, RAMEAU und LCSH, sondern eine Institution würde Dokumente indexieren und ihre eigene Schlagwort-Sprache benutzen, z.B. für DDB wäre sie SWD/RSWK, und dann einen Zugang anbieten, der durch Verweisungen auf den übrigen Schlagwort-Sprachen basiert wäre, z.B. DDB würde englischen und deutschen Sprachzugang gewähren, gestützt auf die Schlagwörter von LCSH und RAMEAU. Dennoch würde die Gegenüberstellung dieser Schlagwörter für die anderen Sprachen keine Erschließung gemäß den Regeln der anderen Regelwerke bedeuten.

Während dieser Ansatz keinen „idealen" mehrsprachigen Zugang bildet, wie in der Einleitung beschrieben, hat er immerhin das Potential, mehr als ein einfaches 'Leit-Wort' zu sein. Gewiss bildet er eine Verbesserung der gegenwärtigen Situation, in der Schlagwort-Zugang zu Datenbanken einsprachig stattfindet.

Schlagwort-Sprachen

Es ist wichtig, etwas von der Natur der Sacherschließung und auch von Struktur und Inhalten der drei genannten Schlagwort-Sprachen zu wissen, um die Probleme besser einzuschätzen, auf die man traf, wenn sie als Mittel des mehrsprachigen Zugangs benutzt werden, und um die Vorteile besser einzuschätzen, die man von einem solchen Ansatz gewinnt. Die drei Schlagwort-Sprachen enthalten eine Liste von Schlagwörtern (ein kontrolliertes Vokabular von Vorstellungen, die in einem oder mehreren Wörtern ausgedrückt werden können), eine semantische Struktur (im Normdatensatz für jedes Schlagwort bezeichnet) und einen Regelsatz, womit diese Schlagwörter kombiniert werden können, um den Inhalt eines Dokuments zu beschreiben (die Syntax einer Sprache).

    z.B. Acteurs
    Formation
    France

sind Schlagwörter in RAMEAU, jedes davon mit einem Datensatz in der RAMEAU Schlagwort-Sprache, während:

    Acteurs - Formation - France

eine Kette ist, gebaut nach den Syntaxsregeln von RAMEAU, die einem Dokument gegeben werden könnte: sie hat keinen Datensatz in der Schlagwort-Sprache.

Die ersten Aufgaben, die von der Gruppe ausgeführt wurden, befanden sich auf der Ebene der Schlagwörter und waren darauf gezielt, zu sehen, zu welchem Grade Verweisungen zwischen den drei Schlagwort-Sprachen gemacht werden konnten. Nach der Erarbeitung von mehrsprachigen Listen von Schlagwörtern erweiterte dann die Gruppe die Studie, so dass die Benutzung dieser Schlagwörter innerhalb von Indexierungsketten sowie die Folgen für den Zugang untersucht werden konnte.

Methodologie

Die Kriterien für die Auswahl der zwei Themenbereiche Sport und Theater waren pragmatisch: Sport wurde als ein relativ einfaches Thema betrachtet in dem Sinne, dass es keine großen kulturellen oder nationalen Unterschiede enthielt, währenddessen Theater als ein breiteres und komplexeres semantisches Feld betrachtet wurde. Dieses ermöglichte der Gruppe, die Verweisungsmethode zu testen, die im Themenbereich Sport definiert und verfeinert war.

Die endgültige Methodologie (die bei anderen Themenbereichen angewandt werden kann) wurde so definiert:

  • Umfassende und konsistente einsprachige Listen von Schlagwörtern werden von den Bibliotheken bereitgestellt, die für Pflege einer Schlagwortnormdatei zuständig sind,
  • in einem (nach Homogenität und Größe) passenden Themenbereich, der durch vereinbarte Hauptschlagwörter bestimmt wird, werden alle relevanten Schlagwörter ausgewählt. Dabei geht man von einem hierarchischen Ansatz (Unterbegriffe) und von einem alphabetischen Ansatz aus.
  • Die Abgrenzung des Themenbereichs (ein- oder ausgeschlossene Arten von Schlagwörtern) werden genau definiert.
  • Die drei alphabetischen Listen ausgewählter Schlagwörter sind für den Vergleich bereit,
  • nach einer letzten Prüfung auf Einheitlichkeit (Addition, Entfernung).
  • Von diesen drei Listen wird eine dreisprachige Liste mit allen ausgewählten Schlagwörtern aufgebaut
  • zuerst durch Vergleich von Datensätzen (terminologische Ebene), um Synonyme zu finden,
  • dann durch Erarbeitung von Normdatensätzen mit der Hinzufügung der Synonyme. Dabei werden semantische Methoden benutzt (insbesondere für Verweisungen "nach oben").
  • Dennoch wird diese Art von Über/Unterbegriff-Gleichwertigkeit nur benutzt, wenn sie in einer Normeintragung bezeichnet wird.
  • Eine weitere Verbesserung wird auf der Ebene der Indexierungsketten gesucht, um Schlagwort-Schlagwortkette-Äquivalenzen zu finden.
  • Dennoch wird ein 1:1 Ansatz immer vorgezogen und deshalb können neue Schlagwörter in einer Schlagwort-Sprache geschaffen werden, die gleichwertigen Wörtern in einer anderen Sprache entsprechen.

Zusammenfassung der Ergebnisse für Sport und Theater

  • Themenbereich Sport:
    • 86 % der Schlagwörter stimmen in allen drei Listen überein (dreisprachige Übereinstimmung)
    • 8 % der Schlagwörter stimmen in zwei Listen überein (zweisprachige Übereinstimmung)
    • 6 % der Schlagwörter sind lediglich einsprachig
  • Themenbereich Theater:
    • 60 % der Schlagwörter stimmen in allen drei Listen überein (dreisprachige Übereinstimmung)
    • 18 % der Schlagwörter stimmen in allen drei Listen überein (zweisprachige Übereinstimmung)
    • 22 % der Schlagwörter sind lediglich einsprachig

Diese Anfangsergebnisse waren viel versprechend, besonders wenn man das Folgende in Betracht zieht:

  • Selbstverständlich werden bestimmte Schlagwörter öfters benutzt als andere z.B. das Wort 'théâtre' wird öfters benutzt als 'Nô'. Nachdem die fünfzig am meisten benutzten RAMEAU Schlagwörter des Themenbereichs Theater im BN-OPALE Katalog identifiziert wurden, wurde herausgefunden, dass mehr als 86 % dieser 50 Schlagwörter in allen drei Listen zusammenpassten. Es ist also wichtig, in einer zukünftigen Strategie die Priorität auf die Identifizierung und Festlegung der am meisten benutzten Schlagwörter zu legen.
  • jede Schlagwort-Sprache wurde auf dem Konzept der 'literarischen Erfordernis' aufgebaut, d.h. ein Schlagwort wird nur formuliert, wenn es gebraucht wird, um ein Dokument zu erschließen, das die jeweilige Institution erhalten hat. Deshalb fehlen gültige Schlagwörter der Liste einfach deshalb, weil keine Dokumente über das angesprochene Thema in dem Lande veröffentlicht noch von der jeweiligen Institution erworben wurden. Jede Schlagwort-Sprache ist also repräsentativ für die Kultur des Landes, für das sie entwickelt worden ist, und bestimmte Schlagwörter spiegeln diese kulturellen Differenzen wider (z.B. die in den Institutionen studierten Themen, die kein gleichwertiges Wort oder keine Übersetzung in einer anderen Sprache kennen, und deshalb in einer anderen Schlagwort-Sprache nicht vorhanden sind, z.B. "Kasperletheater" existiert nur im SWD und "Living newspaper" gibt es nicht in RAMEAU. Es ist ausgesprochen bedeutend, dass eines der Ergebnisse dieser Studie die Bereicherung der verschiedenen Vokabulare durch den Vergleich ihrer Inhalte darstellte (siehe Methodologie). Diese Bereicherung wird also dazu verhelfen, den Anteil von Übereinstimmungen in Zukunft zu vermehren;

Dennoch,

  • der erste Vergleich war auf 1:1 Übereinstimmungen zwischen Schlagwörtern zentriert. Es gab auch Fälle, wo diese Art von Übereinstimmung nicht möglich war, d.h. wenn es mehrfache Übereinstimmungen in einer der Listen gab, oder wenn ein Schlagwort in einer Liste mit einem Schlagwort + Unterschlagwort in einer anderen Liste übereinstimmte. Wie schon früher erwähnt, definierte die Gruppe Verfahren, um die Fragen von mehrfachen Übereinstimmungen zu klären, und auch Übereinstimmungen zwischen Prozeduren, um die Frage von vielfachen Übereinstimmungen, und auch Übereinstimmungen zwischen einem Schlagwort einerseits und einer Schlagwortkette andererseits z.B. enfants acteurs = child actors = Schauspieler + Kind (Kette bestehend aus zwei Datensätzen).

Derzeit legt keiner der Partner systematisch Schlagwortketten in seinen Normlisten fest (aus Gründen der Pflege und auch aus grundsätzlichern Erwägungen), doch wenn die Schlagwort/Kette- Übereinstimmungen übergangen werden, sind die Resultate weniger vielversprechend. Entweder dass eine Lösung außerhalb der verschiedenen Systeme gefunden werden, oder es muss ein niedrigeres Niveau der Gleichwertigkeit akzeptiert werden, zusammen mit den Konsequenzen für die Suche. Es ist wichtig, Verweisungsmöglichkeiten zu betrachten, nicht nur auf theoretischer Ebene (Schlagwörter), sondern auch auf der Ebene der Durchführung (Ketten). Das Ziel ist ja nicht nur die Verweisung von Schlagwörtern, sondern auch der Zugang zu Dokumenten, normalerweise durch Schlagwortketten. Eigentlich, das heißt nach der Natur der Normierung von Schlagwörtern, können die Schlagwörter von ihrer Anwendung in der Erschließung nicht getrennt werden. Während der Arbeit an der Verweisung von Schlagwörtern in Sport und Theater war es daher immer möglich und manchmal auch erforderlich, zur wirklichen Erschließung in bibliographischen Datensätzen zurückzugehen, um die Bedeutung von Schlagwörtern zu prüfen, um terminologische Zweideutigkeiten zu lösen, und schließlich um bestimmte Synonymien zu bestätigen.

Vergleichende Analysis von Titeln, die mit LCSH, RAMEAU und SWD/RSWK indexiert sind

Nach der Erstellung der Verweisungen zwischen Schagwörtern wurden die Konsequenzen auf der Ebene der Erschließung mit Schlagwortketten untersucht. Ursprünglich war es geplant, die Sacherschließung von 500 Neuerscheinungen mit internationalen Auflagen zu vergleichen. Als sich jedoch die Schwierigkeit ergab, in allen drei Sprachen erschlossene Publikationen zu finden, musste die Gruppe ihren Ansatz modifizieren:

Eine vergleichende Analyse der Indexierung dieser Titel (in jedem Themenbereich) wurde für diejenigen Titel angefertigt, für die Originalsacherschließung in allen drei Schlagwort-Sprachen verfügbar war. Darüber hinaus wurden Titel im Themenbereich Theater verglichen. Jede Bibliothek wurde dafür gefordert, 10 Beispiele aus ihrer laufenden Katalogisierung in diesem Themenbereich anzugeben, die die anderen Bibliotheken dann mit ihren eigenen Systemen erschließen sollten.

Doch gab es inhaltliche Schwierigkeiten in beiden Methoden. In der ersten Methode: Da die Gruppe nur in den Themenbereichen Theater und Sport eine detaillierte Auswahl und einen Vergleich von Schlagwörtern durchgeführt hatten, waren keine allgemeinen mehrsprachigen Listen für den Vergleich vorhanden. Man musstete deshalb damit anfangen, indem man Verweisungen 'across the board' für die gefundenen Titeln schuf, ohne imstande zu sein, mit der Methode vorzugehen, die in den anderen Themenbereichen definiert worden war. Infolgedessen mögen falsche Verweisungen gemacht worden sein, und andere mögen gar nicht aufgefunden worden sein.

Der Versuch bestätigte die folgenden Punkte: obgleich die untersuchten Schlagwortnormdateien den gleichen Grundsätzen folgen9, sind die Anzahl von Schlagwörtern und Unterschlagwörtern, die kombiniert werden können, und die Vielfalt von Ketten, die daraus folgen, von Sprache zu Sprache unterschiedlich. Die Anzahl von Ketten, die bei einem bestimmten Dokument angewandt werden können, unterscheidet sich auch je nach den verschiedenen angewandten Regeln. Generell kann man sagen, dass das Niveau von Koordination und Benutzung von Regeln näher ist zwischen RAMEAU und LCSH als zwischen SWD/RSWK und den zwei anderen Regelwerken, aber nicht so weit, dass sie austauschbar sind. Dazu kommt, dass die Anzahl von Ketten, die bei einem Dokument verwendet werden, sich nach der Subjektivität des Indexierers und nach der Regelinterpretation ändert. Außerdem kann die Erschließung innerhalb unterschiedlicher sprachlicher und kultureller Zusammenhänge zu Unterschieden in den verwendeten Schlagwortketten führen.

Die Gruppe war sich dieser unterschiedlichen Struktur und Syntax bereits von Anfang der Studie an bewusst. Aus diesem Grunde wurde beschlossen, sich auf die Verweisungsstudie zu konzentrieren, indem man untersuchte, ob gleichwertige Worte auf der Ebene der Schlagwort-Sprache möglich waren, und dabei prüfte, ob diese Verweisungen in der vergleichenden Erschließung von aktuellen Dokumenten nützlich waren. Es wurde geschätzt, dass die Überschneidung von Normbegriffen, die in der Erschließung von Dokumenten benutzt worden waren, zwischen 29 % bis 56 % variierte.

Die zweite Studie befasste sich ausschließlich mit Titeln im Themenbereich Theater und sollte deshalb weniger Schwierigkeiten bereiten. Dennoch zeigte sich wegen des Mangels an Dokumenten, die in diesem Themenbereich gefunden werden konnten, dass die ausgewählten Dokumente zwar zum Themenbereich Theater gehörten, sich aber in verschiedener Hinsicht außerhalb des Rahmens der Studie befanden: Die dreisprachige Auswahl und der Vergleich von Schlagwörtern war auf Substantiva begrenzt, und mehrere der ausgewählten Dokumente erforderten den Nachweis von Eigenamen, sowie Zeit- und Formschlagwörtern, von denen keines in einer dreisprachigen Form verfügbar war. Wenn wir die Analyse auf die 27 Titel begrenzen, ohne diese fremden Elemente einzuschließen, merkt man, dass in den 23 Titeln mindestens ein gleichwertiges Wort auf der Ebene der Normdaten geschaffen werden konnte. Dreisprachiger Zugang durch verwiesene Schlagwörter steht dennoch in vielen Fällen zur Verfügung.

Generell zeigte ein Vergleich der Erschließung, dass es, trotz einer Konvergenz bei den angewandten Schlagwörtern, (d.h. auf der Ebene der Normbegriffe), viel weniger Überschneidung in der Kombination der Schlagwörter für Ketten gibt. Dies spiegelt teilweise die Subjektivität des Bearbeiters wider, betont aber auch die Unterschiede, die in den Regeln und Strukturen der einzelnen Schlagwort-Sprachen festgelegt wird. Das ist ein wichtiger Punkt in der Anwendung einer dreisprachigen Liste bei der Benutzersuche und wird im Versuchsmodell weiter untersucht.

Versuchsmodell

Die Machbarkeitsanalyse sollte die intellektuellen Beziehungen zwischen Schlagwort-Sprachen untersuchen, nicht die technischen Aspekte, die hinter der Verweisung und dem darauf erfolgenden Zugang zu verwiesenen Schlagwörtern oder zu den indexierten Dokumenten stecken. Dennoch wurden auch Gesichtspunkte der Dateipflege diskutiert. Es wurde zuerst überlegt, dass bei der Pflege von Verweisungen innerhalb jedes Systems ein zusätzliches Niveau der Datenpflege eliminiert werden konnte. Dennoch: Wenn jeder Partner Verweisungen innerhalb jeder Schlagwort-Sprache pflegen sollte, hätte es doppelten Aufwand bedeutet, und wahrscheinlich auch Komplikationen in dem Versuch, jede Verweisung mit jedem Partner zu vereinbaren. Zusätzlich würde jeder zusätzlich eingeführte Partner die Last des Aufbaus und der Pflege von Verweisungen erhöhen. Zuletzt konnte man Probleme voraussehen für Verweisungen von einem auf mehrere Begriffe, ebenso wie bei der darauf folgenden Einführung neuer Schlagwörter und deren entsprechenden Verweisungen. Die Gruppe sah es hingegen als besser an, ein externes System oder einen 'Metathesaurus' zu schaffen, der für jedes gleichwertige Wort einen Datensatz enthalten würde (vielleicht durch die Benutzung eines internationalen Identifizierers), der den Identifizierer des Schlagworts in den verschiedenen [Normdaten] angeben würde, und damit eine Verbindung aufrechterhalten würde (in dem Diagramm unten, Mt = Metathesaurus Eintrag). Ein Metathesaurus Datensatz wäre für jede [Eintragung] anzulegen, ob einsprachig (d.h. ein Schlagwort ohne gleichwertiges Wort in einer anderen Sprache), ob zweisprachig (ein Schlagwort mit einem gleichwertigen Wort in einer anderen Schlagwort-Sprache), ob dreisprachig usw.:

[für das Diagramm bitte Kontakt mit der Autorin]

Dieser Metathesaurus würde flexible Verwaltungsstrukturen ermöglichen: Spezialisten in jeder Institution hätten das Recht, gleichwertige Wörter zu schaffen (und die dazu notwendigen Verweisungen) auf der Metathesaurus-Ebene, die dann überprüft werden sollten. Die Erfahrung von BnF und DDB, die RAMEAU und SWD in ihren eigenen Ländern gemeinsam verwalten werden, wird hier von Vorteil sein.

Es bleiben noch Fragen mit Bezug auf die Verwaltung von Querverweisungen und der damit verbundenen Schlagwörter. Wenn die Verwaltung auf der lokalen Ebene stattfindet und wenn sie einsprachig bleiben soll, wird dies einen Einfluss auf die Abfragen haben: der 'transparente' Parallel-Ansatz für die Ansetzungsform wird begrenzt bleiben. Wenn die Normdaten-Struktur auf der Ebene des Metathesaurus doppelt bleibt, hat dies natürlich Folgen für Doppelarbeit und zukünftige Pflege.

Dazu kommt, dass die Wirkung der Schlagwort-Suche im Metathesaurus im Verhältnis zur Kettensuche geprüft werden muss. Vielleicht wird die Verwendung der Boolschen Suche in den Schlagwörtern möglich sein, das sollte aber zuerst als Versuchsmodell getestet werden. Es sollte auch betont werden, dass keines der von den Partnern benutzten automatisierten Systeme gegenwärtig mehrsprachige Sacherschließung, mehrsprachigen Thesaurus oder mehrsprachige Suche unterstützt. Wenn 'transparente' mehrsprachige Ketten-Suche gefordert wird, müssen die folgenden Punkte untersucht werden: die Präsentation von Schlagwörtern in Sachregistern (getrennte, oder kombinierte Register); welche Schlagwörter sollen sichtbar gemachen werden (in einer oder allen Sprachen; bevorzugte Sprache); Benutzer-Oberfläche (sichtbar / unsichtbarer Wechsel von einer Sprache in die andere). Diese Fragen sind besonders wichtig für SLB, da im Idealfall die Bibliothek sich wünscht, dem Benutzer einen möglichst transparenten Ansatz zu mehrsprachiger Suche zu ermöglichen.

Welches Datenverwaltungssystem auch immer ausgewählt wird, es werden die Fragen von Datenformat und -austausch abgeklärt werden müssen. Eine UNIMARC-[authority]Struktur für den Metathesaurus wäre eine Möglichkeit, da es gegenwärtig die einzige Struktur ist, die mehrsprachige Verweisungen ermöglicht10. Konversionsprogramme von und zu UNIMARC von den [Normdaten-] Formaten des Partners wären erforderlich, da jeder Partner gegenwärtig ein anderes Format benutzt: BnF benutzt INTERMARC, DDB benutzt MAB, BL benutzt UKMARC und SLB benutzt USMARC. Ein Versuchsmodell wird getestet werden müssen für die mehrsprachige Suche durch den Benutzer nach bibliographischen Datensätzen innerhalb eines oder mehrerer Systeme, indem es entweder vom Metathesaurus aus an ein oder mehrere Systeme gerichtet ist, oder indem es eine Suche von einem System zu einem anderen in einer anderen Sprache mittels des Metathesaurus erweitet.

Da Benutzer Abfragen nicht nur mit Substantiven, sondern auch mit geographischen- und Eigennamen durchführen, muss deren Behandlung und ihre mögliche Integration in Betracht gezogen werden im Zusammenhang mit anderer Arbeit auf diesem Gebiet (z.B. AUTHOR) 11.

Dazu sollte die Benutzung des Metathesaurus als Erschließungsmittel untersucht werden, um zu sehen, ob dieser bei der Erschließung helfen und die Schlagwort-Sprachen bereichern kann.

Ein weiterer Punkt, der in Betracht gezogen werden sollte, könnte die Verwendung eines Klassifikationssystems als Mechanismus, zur Organisation der Verweisungsstruktur sein.

Von den Anfangsversuchen her wird es klar, dass die Verweisung von gleichwertigen Wörtern viel Arbeit und Zeit erfordern wird, um alle Themenbereiche abzudecken. Es wäre nützlich, die 'am meistbenutzten' Schlagwörter festzustellen, die einen großen Anteil der verwendeten Begriffe darstellen, und dann an solchen Schlagwort-Sätzen zu arbeiten. Die Struktur der RAMEAU-Liste und das Informationssystem von der Bibliothèque Nationale de France ermöglichen das Auffinden solcher Informationen. Es wäre auch produktiv, zu studieren, inwiefern die Auswahl von Schlagwörtern in einem Themenbereich automatisiert werden könnte, d.h. indem man hierarchische Beziehungen anwendet (Unter-Begriffe), oder mit Notationen, deren Schlagwörter schon zugeordnet sind, entsprechend dem Klassifizierungssystem jeder Schlagwort-Sprache (zum Beispiel DDC Nummern in dem LCSH-Datei, die bei der BL benutzt wird).

Ausblick

Bei ihrer Zusammenkunft am 18. März 1999 und während weiterer Gespräche in Leipzig am 24. März 1999 haben die Direktoren von den BL, BnF, DDB und SNL vereinbart, die Errichtung eines Versuchmodells mit dem folgenden Zeitplan zu unterstützen:

  • 1. April - 31. Mai 1999: Projektbeschreibung und Zeitplan
  • 1. Juni - 20. Juni 1999: Diskussion mit Partnerbibliotheken
  • 21. Juni 1999: Begutachtung durch die Partner-Bibliotheken (CoBRA + Forum)
  • 1. Juli - 31. Dezember 1999: Aufzeichnung von Spezifikationen, die CENL an die potentiellen Partner überreicht.
  • 1. Januar - 30. Juni 2000: Entwicklung und Test der Versuchsmodells.

Vorteile der Zusammenarbeit

Obwohl die Machbarkeitsstudie viele Fragen stellt, die nur dadurch gelöst werden können, indem man das Projekt einen Schritt weiter führt d.h. ein Versuchsmodell errichtet und testet, hat die bis jetzt durchgeführte Arbeit schon auf mehrere Ebenen den Vorteil der Zusammenarbeit bewiesen:

  • Schaffung und Verwendung von gleichwertigen Begriffen in anderen Sprachen wird den Zugang für den Benutzer vereinfachen
  • sie wird auch für den Indexierer folgende Vorteile haben: die Erschließung eines Dokuments in einer anderen Sprache wird allen Partnern helfen;
  • die Schaffung von Verweisen zwischen Schlagwörtern in verschiedenen Sprachen wird die Fähigkeit erhöhen, die Arbeit zu benutzen, die in einer Schwester-Institution schon durchgeführt wurde;
  • außerdem hatte der Vergleich von den Listen in den Themenbereichen Sport und Theater zur Folge, dass bestimmte fehlende Schlagwörter in den Listen formuliert werden konnten, und hat deshalb jeder Institution ermöglicht, ihr eigenes Vokabular zu bereichern und zu erweitern, was dann den Zugang für den Benutzer und den Indexierer verbessert;
  • in der mittelfristigen Planung wird der Vergleich der Listen jede Liste verbessern und bereichern, und die Konvergenz verbessern;
  • obwohl diese Studie auf drei Schlagwort-Sprachen begrenzt war, geht ihr Potential weit über die Partnerinstitutionen hinaus. Die drei Schlagwort-Sprachen werden nicht nur in den Partnerbibliotheken angewandt, sondern auch weitgehend in anderen Bibliotheken in Frankreich, Deutschland und Großbritannien benutzt, ebenso in vielen anderen englisch-sprachigen, französischsprachigen und deutschsprachigen Ländern. Verknüpfungen der Schlagwort-Sprachen könnten den Zugang zu Millionen von Dokumenten ermöglichen. Dazu kommt, dass die studierte Methodologie und der angewandte Ansatz von Anfang an mit dem Ziel bestimmt wurde, sie in Richtung der Sacherschließungssprachen zu erweitern, wenn sie sich in dem untersuchten Kontext als gültig bewähren.

Wir hoffen, dass im Jahr 2000 eines der Mitglieder der Arbeitsgruppe über die Resultate der zweiten Phase dieses kooperativen Projekts berichten wird, das den Aufbau und die Pflege von mehrsprachigen Normschlagwortlisten beinhaltet.

Dieser Vortrag stützt sich natürlich auf die Resultate der Arbeitsgruppe, der besonderer Dank für ihre Kooperation und Bemühungen ausgedrückt werden soll.

Anmerkungen:

1. Mehrsprachige und verschiedenartige Daten in Bibliothekssystemen- und -netzen: Erfahrungen und Perspektiven aus der Schweiz und Finnland, von RiittaLehtinen (Helsinki Universitätsbibliothek, Automationsabteilung der finnischen Forschungsbibliotheken) und Genevieve Clavel-Merrin (Schweizerische Nationalbibliothek). In: Multi-sprachige, multi-charakter Fragestellungen für die Online-Umgenbung : Vorträge von einer Arbeitsgruppe von der IFLA Sektion über Katalogisierung finanziert, Istanbul, Türkei, August 24, 1999 / herausgegeben von John D. Byrum, Jr. und Olivia Madison..- München : K.G. Saur, 1998.- 123 S. : Ill. ; 22 cm. IFLA Publikationen 85. ISBN: 3598218141

2. für mehr Information über CENL siehe: http://www.konbib.nl/gabriel/en/cenl-general.html

3. für mehr Information über CoBRA+ siehe: http://www.bl.uk/information/cobra.html

4. Mitglieder desr Pilotversuchs: Genevieve Clavel (SNL), Magda Heiner-Freiling (DDB). Martin Kunz (DDB), Patrice Landry (SNL), Andrew MacEwan (BL), Max Naudi (BnF), Pat Oddy (BL) (bis Apr. 1998), Angelique Saget (BnF), Ross Bourne (BL), CoBRA+ Sekretär als Berichterstatter bis April 1998, dann Peter Dale (BL)

5. http://www.bl.uk/gabriel/

6. Internationale Standard Organization (ISO). Regeln für die Errichtung und die Entwicklung von mehrsprachigen Thesauri. Genf : ISP, 1985 (ISO 5964 1985-92-15)

7. Siehe http://www.ahip.getty.edu/guidelines/index.html und Verweise: Internationale Terminologie Arbeitsgruppe, sponsoriert von dem Getty Institute. Regelwerk für die Formulierung sprachlicher Äquivalente: ein Modell basierend auf dem Kunst & Architektur Thesaurus basier.

8. Siehe http://www.nlm.nih.gov/research/umls/umlsmain.html und Verweisungen

9. wie es in der Studie festgelegt war: 'Grundsätze zur Erarbeitung von Schlagwort-Sprachen/ IFLA Sektion zu Klassifizierung und Indexierung. Arbeitsgruppe Grundsätze zur Erarbeitung von hinter Schlagwort-Sprachen. 2. endgültige Ausgabe, August 1998 (im Druck)

10. ein Vorschlag, um andere Sprach-Schlagwörtern zu kodifizieren in USMARC [authority records] wurde beim 1998 ALA meeting in Wahington von der MARBI-Gruppe diskutiert, aber es wurde kein Beschluss gefasst; dieses Thema scheint in den VS keine Priorität zu haben.

11. Siehe http://www.bl.uk/information/author.html für eine Zusammenfassung und http://www.bl.uk/information/author.pdf für den Abschlussbericht.

*    

Latest Revision: July 28, 1999 Copyright © 1995-2000
International Federation of Library Associations and Institutions
www.ifla.org