Mehr Zeit für die wichtigen Dinge
Wie lassen sich kapitalmarktrelevante Informationen aus qualitativen Textdaten gewinnen? Ein neues Tool vereinfacht die Analyse und Identifikation von Geschäftsberichten und Wettbewerbern.
Wer in Einzelaktien investiert, will bestens über die Unternehmen informiert sein, denen man sein Geld anvertraut. Geschäftsberichte sind dabei eine wertvolle Informationsquelle. Sie können Aufschluss darüber geben, mit welchen Themen sich das Management beschäftigt und welchen Risiken die Firma ausgesetzt ist. Auch finden Investorinnen und Investoren hier unternehmensspezifische Informationen bezüglich Nachhaltigkeit oder Digitalisierung.
Aber: Ein Großteil der Informationen war bereits im Vorjahr vorhanden und wurde schon im Markt eingepreist. „Investoren interessieren sich daher grundsätzlich für neue Informationen“, erklärt Prof. Sebastian Müller, Professor für Finanzierung am TUM Campus Heilbronn. Der manuelle Abgleich von zwei aufeinanderfolgenden Jahresberichten ist jedoch äußerst zeitintensiv. Das trifft auch auf die Suche nach bestimmten Themen mithilfe von Wörterlisten zu.
Dank der Fortschritte im Bereich Natural Language Processing gibt es für diese Fragen mittlerweile fortschrittlichere Methoden. Daran forscht Prof. Müller gemeinsam mit seinem Doktoranden Christian Breitung. „In aktuellen Projekten nutzen wir anstelle von Wörterlisten moderne Verfahren, die mithilfe von maschinellem Lernen in der Lage sind, die Semantik bzw. den Kontext eines Textes zu berücksichtigen“, sagt Prof. Müller. „Es handelt sich dabei um vortrainierte Sprachmodelle, die an unterschiedliche Anwendungsaufgaben angepasst werden können. Mithilfe dieser Modelle ist es möglich, jene Sätze in Geschäftsberichten zu identifizieren, die semantisch neue Informationen beinhalten. Auch können damit Sätze bestimmten Themen zugeordnet werden, ganz ohne Wörterlisten. Kombiniert lassen sich so neue Informationen zu einem bestimmten Thema identifizieren.“
Um das Potenzial der Methode zu nutzen, hat Christian Breitung gemeinsam mit TUM-Alumnus Felix Alexander Müller das Tool Qannual entwickelt. Damit erhalten die Userinnen und User Zugriff auf die aktuellen sowie vergangenen Geschäftsberichte von mehr als 9000 Unternehmen. Neben Jahresberichten bietet Qannual seit Neuestem auch Quartalsberichte an. Nutzerinnen und Nutzer können sich hier gezielt einzelne Abschnitte eines Geschäftsberichts anzeigen lassen. Sätze mit semantisch neuen Informationen werden standardmäßig hervorgehoben.
Aktuell sind in Qannual hauptsächlich US-Firmen gelistet. Perspektivisch sollen aber auch Unternehmen aus anderen Ländern hinzukommen. Daraus könnten sich für deutsche Firmen neue Möglichkeiten ergeben. Das Tool bietet einige Funktionen, mit denen die Analyse und Identifikation von Wettbewerbern vereinfacht wird. Mittels des Unternehmensfinders kann man gezielt nach börsennotierten Firmen suchen, die ein bestimmtes Produkt anbieten. Anschließend lassen sich die jeweiligen Geschäftsberichte mithilfe der semantischen Suche nach bestimmten Themen clustern.
„Dank der Fortschritte im Bereich Textanalyse sind aber auch völlig neue Anwendungsfelder denkbar“, meint Breitung. Neben der Identifikation von Firmen mit ähnlichem Geschäftsmodell oder Risikoprofil wäre auch eine Prognose von Umsätzen über eine textbasierte Ermittlung des Marktsentiments denkbar.
Eine der Hürden für die Analyse internationaler Kapitalmärkte liegt in der Natur der Sprache. Anhand multilingualer Modelle lassen sich themenbezogene Informationen auch über Ländergrenzen hinweg identifizieren. Für die Forschung am TUM Campus Heilbronn eröffnet das völlig neue Möglichkeiten. So kann das Team um Prof. Müller beispielsweise analysieren, ob Investorinnen oder Investoren aus unterschiedlichen Ländern bestimmte Informationen unterschiedlich einpreisen.