Helene Schmolz: Die Suche nach Informationen unter sprachwissenschaftlichen Gesichtspunkten: das Potenzial von Anaphern
Zusammenfassung: Die Informatik tendiert dazu, zur Lösung von natürlichsprachigen Anwendungen vor allem quantitative Analysen zu verwenden sowie qualitative Methoden, die einfach umzusetzen sind. Doch könnte eine Einbeziehung der Sprachwissenschaft auf Augenhöhe solche Anwendungen entscheidend verbessern. Ein vielversprechender Ansatz sind Anaphern, die den Text semantisch-syntaktisch verknüpfen und dadurch den Inhalt eines Textes an der Oberfläche spiegeln. Auf Basis einer umfassenden Definition und Kategorisierung zeigt sich an einem Korpus, dass die Anaphernart, die bisher noch nie beachtet wurde, am häufigsten auftritt. Diese Erkenntnisse bergen großes Potenzial, wenn sie bei Suchmaschinen, wo Anaphern bisher generell kaum Beachtung finden, angewandt werden.
Schlagwörter: Text Retrieval, Anapher, Anaphernauflösung, Korpuslinguistik, Suchmaschinen, Ranking
Helene Schmolz: Searching for information from a linguistic point of view: the potential of anaphors
Abstract: Information science tends to use predominantly quantitative analyses and also qualitative methods that are easy to implement, in order to solve natural language tasks. However, the integration of linguistics on an equal footing could improve such tasks decisively. One promising approach are anaphors, which connect the texts in a semantic-syntactic way and thereby reflect the content of texts on the surface. Based on a comprehensive definition and categorisation, it is shown by means of a corpus that the type of anaphor which has so far never been regarded is in fact the most frequent. This knowledge offers high potential if it is applied to search engines, where anaphors have generally attracted little attention to date.
Keywords: Text Retrieval, anaphor, anaphora resolution, corpus linguistics, search engines, ranking
Veröffentlicht in Mitteilungen der VÖB 67 (2014) Nr. 2, S. 249-262.
Online in E-LIS: http://eprints.rclis.org/23850/
Gesamte Ausgabe online in Phaidra: https://fedora.phaidra.univie.ac.at/fedora/get/o:360033/bdef:Content/get