Liebe Freunde der Sicherheit,
heute möchte ich euch eine linguistische Kategorie vorstellen, mit deren Hilfe man mehr über Texte bzw. ihre Autorinnen und Autoren lernen kann, als mit einer einfachen Schlagwortsuche. Und zwar geht es heute um Kollokationen. Sicher ist euch schon aufgefallen, dass manche Wörter öfter zusammen vorkommen als andere. Warum zum Beispiel sagt man „einen Weg einschlagen“ statt „einen Weg wählen“? Warum „begeht“ oder „verübt“ man Terroranschläge statt sie zu „machen“? Oder warum kommt in den Texten der NPD „Ausländer“ sehr häufig zusammen mit dem Wort „kriminell“ vor?
Während wir bei „Weg einschlagen“ und „Terroranschlag verüben“ nicht sagen könne, warum wir ausgerechnet diese Wörter zusammen benutzen, ist das Wortpaar „kriminelle Ausländer“ relativ leicht als Ausdruck einer Ideologie zu deuten. Und wenn man anhand einer Vielzahl solcher häufig gemeinsam gebrauchter Wörter eine Ideologie aus Texten extrahieren kann, dann ist das ein hübscher Ansatzpunkt für Internetüberwacher und Sprachprofiler.
Zwei Definitionsansätze
Solche mehr oder weniger festen Verbindungen von Wörtern nennt man in der Sprachwissenschaft Kollokationen. Natürlich ist sich die Linguistik uneins darüber, was eine Kollokation ist.
Die einen definieren Kollokationen über formale und semantische Merkmale. Demnach könne man die Bedeutung einer Kollokation oft nicht vollständig aus der Bedeutung ihrer Komponenten herleiten, wie das zum Beispiel bei der Wortfolge „keine müde Mark“ der Fall ist. Außerdem seien die Elemente von Kollokationen nicht einfach durch Synonyme oder ähnliche Wörter ersetzbar. „Mittel zum Zweck“ kann man zwar sagen, nicht aber „Mittel zum Ziel“. Und schließlich könne man Kollokationen auch nicht morphologisch modifizieren, also zum Beispiel „zu Sachen kommen“ statt „zur Sache kommen sagen“. Um eine Kollokation nach dieser Definition zu bestimmen, braucht man linguistische Tests und ein gehöriges Maß an Intuition. Für die Freunde der Sicherheit ist diese Definition daher nur bedingt hilfreich.
Der zweite Definitionsansatz eignet sich da schon viel besser. Er definiert Kollokationen als statistisch überzufällig häufige Wortkombinationen, die in natürlicher Sprache gemessen werden können. Kollokationen sind damit ein sprachstatistisches Phänomen und mithin brauchbar für automatisierte Textanalyse.
Wie berechnet man Kollokationen?
Man berechnet Kollokationen zu einem Lemma wie folgt: Man teilt das Korpus in zwei Subkorpora: eines, das den Kontext des gesuchten Wortes (nehmen wir mal das Wort „Zeit“ als Beispiel) bei jedem seiner Auftreten umfasst; ein zweites, das aus dem Rest des Korpus besteht. Kommt nun ein Wort in Subkorpus 1 (also im Kontext des Lemmas „Zeit“) signifikant häufiger vor als im Subkorpus 2, dann handelt es sich um eine Kollokation zum Wort „Zeit“.
Im Beispiel hier sind beispielsweise die Lemmata „kurz“, „letzt“, aber auch „in“, „zu“ und der bestimmte Artikel gute Kandidaten.
Berechnungsparameter
Kollokationen sind aber natürlich trotzdem nicht objektiv gegeben. Es hängt in hohem Maße von den Berechnungsparametern ab, was als eine Kollokation zu einer Basis aufgefasst wird und was nicht. Zum Beispiel kann man den Raum um die Basis herum variieren, der in den Grafiken oben gelb markiert ist. Man kann Kollokationen aber zum Beispiel auch nur für mit solchen Wörtern berechnen, die im selben Satz stehen. Man kann aber auch grammatische Konstruktionen (z.B. Subjekt-Prädikat-Verbindung) oder Phrasen (Nominalphrasen) als Räume für die Berechnung von Kollokationen ansetzen. Je nach Fragestellung kann es sogar sinnvoll sein, den gesamten Text als Kollokatorenraum zu betrachten. Man erhält jeweils sehr unterschiedliche Ergebnisse.
Natürlich liefert die Kollokation zu einem Wort noch nicht hinreichende Informationen darüber, ob ein Autor oder eine Autorin demnächst einen Kabelbrand legt oder ein Auto anzündet. Aber ich werde demnächst ein paar Beispiele zeigen, was man mit Kollokationen alles machen kann.
One Response to "Was sind Kollokationen?"
Pings responses to this post
[…] zwar am Beispiel des militanten Islamismus. Wer noch nicht weiß, was Kollokationen sind, sollte in einem frühreren Artikel […]