IFLA

As of 22 April 2009 this website is 'frozen' in time — see the current IFLA websites

This old website and all of its content will stay on as archive – http://archive.ifla.org

IFLANET home - International Federation of Library Associations and InstitutionsAnnual ConferenceSearchContacts
*    
To Bangkok Conference programme

65th IFLA Council and General
Conference

Bangkok, Thailand,
August 20 - August 28, 1999


Code Number: 013-117_G
Division Number: IV
Professional Group: Classification and Indexing
Joint Meeting with: -
Meeting Number: 117
Simultaneous Interpretation:   No

Erstellung eines Registers für die chinesische Ausgabe der DDC, 21. Auflage (DDC 21) : Aufgabenstellung und Vorgehensweise

Hou Hanqing
&
Wang Dongbo

Herausgeber der chinesischen Bibliotheksklassifikation CLC
Beijing, China


Paper

1. Auswahl des Register-Typs

Allgemein gesprochen lassen sich die Register in den Klassifikationssystemen der Welt in drei Typen einteilen:

  1. Relationales Register: dazu gehören die Register der 21. Auflage der DDC und der CLC.
  2. Kettenregister: Die Register der Colon-Klassifikation in Indien und der Bliss Bibliographic Classification in Großbritannien gehören zu diesem Typ.
  3. Thesaurusartiges Register: Die Register einiger Spezialtafeln der universalen Dezimal-klassifikation (UDK) gehören zu diesem Typ. Register dieser Art enthalten nicht nur die Texte der Klassenbeschreibungen und ihre Notationen, sondern auch Synonymenverweisungen, Unter-, Ober- und verwandte Begriffe, wie man sie gewöhnlich in Thesauri findet. Diese Art von Register ist sozusagen bereits ein Thesaurus geworden.

Alle Indexierungsmethoden, besonders computergenerierte wie KWIC (Keyword in context), KWOC (Keyword out of context) und PRECIS (Preserved context indexing system) können bei der Erstellung von Registern zu Klassifikationen genutzt werden. Für welche Art von Register sollte man sich bei der chinesischen DDC entscheiden? Einfach wäre es gewesen, ein relationales Register wie bei der Originalausgabe der DDC und bei der CLC zu erstellen. Doch ein solches Register hat seine Nachteile. Erstens ist es schwierig, es automatisch zu erstellen. Die Herstel-lung erfordert einen großen Anteil menschlicher Arbeit und ist deshalb zeitraubend und teuer.

Zweitens ist die Spezifizität der Registereintragungen begrenzt. Eine große Zahl von zusammengesetzten Wörtern, die komplizierte Sachverhalte ausdrücken, können im Register nicht vollständig permutiert werden und bieten daher nicht alle Einstiegsstellen für die Suche.

Bei der Planung des Registers für die chinesische DDC 21 wurden folgende Ziele formuliert:

  1. Registereinträge sollten eine hohe Spezifizität haben und so weit wie möglich den Klassenbe-schreibungen in den Tafeln entsprechen.
  2. Das Register sollte vielfältige Einstiegspunkte zu jeder Klasse anbieten.
  3. Das Register sollte leicht zu benutzen und zu erstellen sein, die Erstellung sollte automatisch erfolgen und effizient organisiert sein, bei gleichzeitig gesicherter Qualität, und
  4. das Register sollte die Eigenheiten der chinesischen Sprache berücksichtigen.

Um das zu erreichen, entschied man sich für ein permutierendes Register im KWIC-Format und in chinesischer Sprache, das die Vorteile der anderen Verfahren in sich vereinigte. Hauptvorteile dieses Registers waren die schnelle und leichte automatische Erzeugung, niedrige Kosten und hohe Spezifizität. Ausgehend vom Registereintrag kann der Benutzer leicht den verwendeten Suchbegriff in eine Notation übersetzen. Zusätzlich kann er direkt die Klassenbeschreibung und alternativ in Frage kommende Klassen durch die Registereinträge ermitteln. Damit erhält er genügend Informationen, um eine sinnvolle Wahl zu treffen.

Dem Klassifizierer erlaubt ein solches Register, nach ganzen Wörtern (im Chinesischen durch ein oder mehrere Schriftzeichen ausgedrückt) oder Wortelementen (einzelnen chinesischen Schriftzeichen) in den Klassenbeschreibungen zu suchen. Zahlreiche Einstiegspunkte führen den Benutzer schnell zu den geeigneten Registereinträgen. Eine der typischen Eigenschaften der chinesischen Sprache ist es, daß viele Begriffe im Umfeld einer 'Familie' die selben Wörter oder Wortelemente teilen. In einem Register treffen solche Wörter und Wortelemente aus verschie-denen Sachgebieten dann ganz natürlich wieder zusammen. So kann der Benutzer ganz einfach sachlich Zusammenhängendes auf verschiedenen hierarchisch oder assoziativ verbundenen Ebenen suchen und finden.

2. Methode der Registererstellung

Zwei Methoden für die Erstellung eines Registers einer chinesischen DDC-Ausgabe sind möglich. Eine ist die Übersetzung des englischen Registers der 21. Auflage der DDC ins Chinesische, nachdem die Klassifikation selbst ganz übersetzt worden ist. Die andere ist die automatische Erstellung eines permutierenden Registers zur chinesischen Ausgabe auf der Basis der übersetzten Tafeln der Klassifikation. Die erste Methode ist eine direkte Übersetzung, die den Nachteil hat, daß trotz des großen Aufwandes an Zeit und Arbeitskraft eine Diskrepanz zwischen den übersetzten Eintragungen und den Klassenbeschreibungen der chinesischen DDC-Ausgabe nicht immer zu vermeiden ist. Außerdem muß vuiel Arbeit in die Auswahl der chinesischen Registereinträge investiert werden. Die zweite Methode wird Rearrangement (Neuanordnung) genannt. Ein neues Register wird direkt aus den Klassifikationstafeln der chinesischen Ausgabe der DDC 21 erzeugt. Dadurch spart man viel Zeit und Arbeitskraft, da die Übersetzung der Haupttafeln direkt genutzt werden kann. Nachteil eines solchen Registers ist die Inkonsistenz gegenüber dem Register der englischen DDC 21. Bei Abwägung der Vor- und Nachteile entschied man sich für die zweite Methode und wählte ein KWIC-Register. Eine Eintragung umfaßt ein Schlagwort und sein Umfeld in der Klassenbeschreibung, siehe-auch-Verweisungen und alternative Notationsstellen und die Lokatoren (d.h. die damit verbundenen Notationen). Das Register kann zahlreiche Sucheinstiege anbieten (die Indexierungstiefe ist mehr als zweistufig). Die Spezifizität der Registereinträge ist hoch, und das Register ist leicht zu benutzen.

3. Mensch-Maschine-Zusammenarbeit bei der Erstellung des Registers

Ranganathan hat auf geschickte Weise seine Ketten entwickelt, indem er die Beziehungen zwischen den Klassen und den Schlagwörtern ausnutzte. Dies hat Bibliotheks- und Informations-wissenschaft beeinflußt und wurde bei der Erstellung alphabetischer Register zu Klassifikations-systemen und alphabetischen Katalogen angewendet. Die Ketten-Erstellung ist ein halbautoma-tisches Verfahren für die Registererstellung. Heute können wir die Kette für die Klassenbeschrei-bung automatisch in Registereinträge übersetzen. Der manuelle Aufwand ist geringfügig; sobald die zur jeweiligen Klasse gehörige Kette verifiziert und ediert ist, erfolgt der Registereintrag automatisch.

Die Erfahrungen, die 1999 bei der Erstellung des Registers zur CLC (etwa 1000 Seiten) mit diesem Ketten-Verfahren und einer dafür entwickelten Software gemacht wurden, konnten für das Register zur chinesischen DDC 21 genutzt werden. Bei der Übersetzung der DDC 21 ins Chinesische wurden maschinenlesbare Daten produziert, die als Basis für die Registererstellung dienten. Das System, das für die Generierung der Registereinträge mit Erfolg entwickelt wurde, besteht aus sechs Modulen:

  1. Das Wörterbuch-Modul: Dieses Modul sammelt die Begriffe, die für das Register der chinesischen DDC 21 verwendet werden sollen, und erstellt daraus ein Begriffswörterbuch durch die Neusortierung der eingesammelten Wörter.
  2. Das maschinelle Modul: Hauptfunktion dieses Moduls ist die Bearbeitung des Klassifikati-onsschemas der chinesischen DDC, nachdem manuell Indikatoren hinzugefügt wurden. Endergebnis ist eine maschinell erstellte Liste von Einträgen, die selbständig, vollständig und semantisch eindeutig sind.
  3. Das automatische Wortsegmentierungsmodul: Hauptaufgabe ist die automatische Segmentierung von Phrasen durch Verwendung des Begriffswörterbuchs, um Geschwindigkeit und Konsistenz der Begriffszerlegung zu verbessern. Zusätzlich kann auch, wenn nötig, eine manuelle Nachbearbeitung der automatisch segmentierten Wörter erfolgen.
  4. Das computergestützte Verifikations- und Testmodul: Dieses Modul verifiziert und testet Daten, die automatisch erstellt wurden. Damit wird die Wahrscheinlichkeit menschlicher Fehler reduziert, durch die Verwendung von Stopwörtern werden ungeeignete Begriffszerlegungen ausgeschieden.
  5. Das Registererstellungs- und Sortierungsmodul: Es vervollständigt die Permutation der Einträge und Verweise und stellt sie zusammen. Außerdem eliminiert es alle Indikatoren und Steuerzeichen, die bei der Segmentierung verwendet wurden.
  6. Das Statistik- und Managementmodul: Seine Hauptfunktionen umfassen das Erzeugen statistischer Daten, die Überwachung der Produktion von Registereinträgen und die Kontrolle des endgültigen Registers im Hinblick auf die Zahl der Einträge und den Umfang des gedruck-ten Registers.

Der Prozeß der Registererstellung für die chinesische DDC 21 zeigt eine Kombination von manueller Arbeit und Computertechnologie, wobei der menschliche Anteil sich auf die intellektuelle Arbeit beschränken konnte. Es wurde viel Aufmerksamkeit darauf verwendet, die Vorteile des Computers bei der Durchführung von Aufgaben wie Wortsegmentierung, Erstellung von Registereinträgen, Permutation, Sortierung, Verifizierung, Testen und Ausdrucken zu nutzen. Die Hauptarbeit bei der Erstellung der chinesischen DDC 21 kann wie folgt zusammengefaßt werden:

  1. Das Computerprogramm entfernt automatisch alle Steuerzeichen einschließlich der Bearbeitungshinweise aus dem maschinenlesbaren Daten des Klassifikationsschemas für die chinesische DDC, dann verschiebt es die Daten in eine relationale Datenbank.
  2. Die manuelle Bearbeitung der Daten umfaßt: a) Hinzufügen spezieller Indikatoren für die Beziehungen zwischen Klassen; b) Verwendung spezieller Symbole, um definierte oder modifizierte Positionen bestimmter Wörter oder Wortelemente anzuzeigen; c) Entfernung von solchen Klassen, die für die Suche nicht verwendbar sind; d) Korrektur oder Neuerfassung einer kleinen Anzahl von Klassenbeschreibungen, bei denen das Hinzufügen besonderer Symbole zu aufwendig wäre.
  3. Nachdem diese manuelle Überarbeitung abgeschlossen ist, generiert das Computerprogramm Eintragungen, die selbständig, vollständig und semantisch eindeutig sind, einschließlich einer oder mehrerer Klassenbeschreibungen, Umfangs- und Anwendungshinweise.
  4. Das Computerprogramm segmentiert automatisch Klassenbeschreibungen durch die Benutzung eines Begriffswörterbuchs.
  5. Die Bearbeiter des Registers fügen einige Wörter, die aufgrund der Beschränkungen des Begriffswörterbuchs nicht automatisch segmentiert werden können, manuell hinzu. Diese erscheinen dann an allen zugehörigen Sucheinstiegen des Registers.
  6. Nach der automatischen Verifikation und den Tests ist noch eine intellektuelle Qualitätskon-trolle der Registereintragungen nötig, die auf einem Vergleich von Klassifikationsschema und Register beruht.
  7. Das Computerprogramm erstellt Registereintragungen, ordnet und permutiert die Eintragungen und druckt einen Entwurf des Registers aus, der noch einmal Korrektur gelesen wird.
  8. Das Endprodukt wird vom Computer zum Laserdrucker übermittelt und dann ein letztes Mal von den Bearbeitern des Registers kontrolliert.

Literaturhinweise:

Hou Hanqing, et al. Computer-aided compilation of permuted index of Chinese Thesaurus. Journal of Information Science (in Chinese), v.17, no.4 1998.

Wilson, T.D. An introduction to subject indexing. London: Clive, Bingley, 1971.

*    

Latest Revision: July 7, 1999 Copyright © 1995-2000
International Federation of Library Associations and Institutions
www.ifla.org