T-Rex - Terminosaurus Rex - Die Informationswissenschaft in Begriffen

HINWEIS: Dieses Webangebot entstand in den Jahren 1999-2005 an der Universität des Saarlandes und wird nicht mehr aktiv betreut.
Wir empfehlen das InfoWissWiki als neue Quelle.

Index der Begriffe alphabetisch | nach Notation
Top-Down-Navigation
  Hilfswissenschaften
  Informationswissenschaft
      Gegenstandsbereiche
      Grundbegriffe
           Informationsarbeit
                Informationsbedarfsanalyse
                Informationserschlie√üung
                     Clustering
                     Indexierung
                          Intellektuelle Indexierung
                          computergest√ľtzte Indexierung
                          automatische Indexierung
                               Freitextverfahren
                               Statistische Verfahren
                               Informationslinguistische Verfahren
                          Additionsmethode
                          Extracting
                          Deskriptor
                          Gleichordnende Indexierung
                          Syntaktische Indexierung
                          Volltextindexierung
                          Bewertungskriterien des Indexierens
                     Katalogisierung
                     Klassifizieren
                     Textkondensierung
                Informationspr√§sentation
                Informationsvermittlung
           Informationstheorie
           Information
           Interaktion
           Kommunikation
           Wissen
           informationeller Mehrwert
      Methoden und Verfahren
      Problemfelder
      Spezialdisziplinen
  Nachbardisziplinen

Statistische Verfahren (statistical methods)

Definition

Im Gegensatz zur Volltextinvertierung beim Freitextverfahren gibt es bei statistischen Verfahren zwei Grundsätze:

‚ÄúNicht alle Terme sind als Indexterme geeignet, eine Auswahl ist erforderlich‚Äú und ‚Äěnicht alle ausgew√§hlten Terme besitzen die gleiche Wertigkeit hinsichtlich ihrer inhaltlichen Bedeutung, es muss eine Gewichtung vorgenommen werden‚Äú.

Die zu kl√§rende Frage ist: ‚ÄěWann ist ein Term ein guter Indexterm?‚Äú, die man versucht mit statistischen Mitteln zu beantworten. Grundlage ist der so genannte Termfrequenzansatz. Danach haben einmal h√§ufig auftretende W√∂rter eine h√∂here Signifikanz f√ľr die Bedeutung eines Textes als W√∂rter mit geringem Vorkommen. Andererseits haben seltener in einer Dokumentenmenge auftretende W√∂rter einen h√∂heren Diskriminanzeffekt als h√§ufig vorkommende W√∂rter.

Beide Faktoren werden in der so genannten inversen Dokumenth√§ufigkeit in Beziehung gestellt. Danach weisen wichtige Indexterme eine hohe Frequenz im Dokument bei gleichzeitig niedriger Dokumentfrequenz auf. Eine Verfeinerung kann erfolgen, indem z.B. W√∂rter in Titeln oder Kapitel√ľberschriften st√§rker gewichtet werden.

Literatur

DIN 31623. Indexierung zur inhaltlichen Erschließung von Dokumenten. Berlin 1988

Knorz, G. (1997). Indexieren, Klassieren, Extrahieren. In: Buder/Rehfeld/Seeger/Strauch (Hrsg., 1997): Grundlagen der praktischen Information und Dokumentation.

Lustig, G. (Hrsg., 1986). Automatische Indexierung zwischen Forschung und Anwendung. Hildesheim et al.: Olms

Nohr, Holger (2001). Automatische Indexierung. Einf√ľhrung in betriebliche Verfahren, Systeme und Anwendungen. Potsdam: Verlag f√ľr Berlin-Brandenburg

Synonyme, Unter-/Oberbegriffe, verwandte Begriffe

Oberbegriff: Automatische Indexierung;
Verwandte Begriffe: Information Retrieval, Thesaurus, intellektuelle Indexierung, computergest√ľtzte Indexierung, automatische Indexierung, Freitextverfahren, Morphologisch-lexikalische Verfahren, Syntaktische Verfahren

Links

Automatische und intellektuelle Indexierung:
http://is.uni-sb.de/studium/handbuch/exkurs.ind.php,18.7.2000

Harald. H. Zimmermann: Automatische Indexierung und elektronische Thesauri.
http://www.rz.uni-duesseldorf.de/WWW/ulb/mil_zimm.htm

(16.10.2002)

Homepage der Informationswissenschaft

© 2000-2005 FR 5.6 Informationswissenschaft