Texte auswerten und Trends finden

Texte auswerten und Trends finden

Der Artikel behandelt Text Mining am Beispiel Berufswahl. Hier genügt das einfache Sammeln von Worthäufigkeiten zur Ermittlung von Trends.

Möchte man Stimmungen oder Trends detailliert ermitteln, ordnet man den Wörtern im Text Bedeutungsgruppen oder Gefühle zu. So können aus Kundenrezensionen Zufriedenheitsbarometer und Trendmessungen berechnet werden oder auch Falschmeldungen erkannt werden.

In der folgenden Einführung werden Anforderungen des Arbeitsmarktes anhand von publizierten Lebensläufen und Stellenangeboten analysiert. Dafür genügt auch kleinere Software als R mit den Paketen tm oder dem neueren und umfangreicheren tidytext[0] .

Text Mining für die Marktforschung am Arbeitsmarkt

Xing kann als Datenquelle für Karriereentscheidungen[1] benutzt werden. Viele der dortigen Mitglieder haben dort ihre Lebensläufe, Interessen und Angebote hinterlegt. Xing lässt die volle Suchfunktion über dort hinterlegte Profile nur mit kostenpflichtigem Premium-Konto zu. Ohne Premium geht nur die Suche nach Namen. Warum Xing? Es ist die deutschsprachige Entsprechnung zu Linkedin. Linkedin beschränkt sich auf die englische Sprache und ist daher gut für internationale Beziehungen, während Xing auf die deutsche Sprache setzt und lokal ist. Die Mitglieder werden dort direkt aufgefordert, unter Klarnamen richtige Lebensläufe einzupflegen. Dies soll helfen, die eigene Positionierung im Arbeitsmarkt zu verbessern. Viele Deutsche tun sich mit englischsprachigen Lebensläufen schwer, weswegen Xing für Deutschland aussagekräftiger ist.

Aus den Profilen, auch aus Stellenanzeigen oder Webseiten können Karrierepfade, Anforderungsprofile und mehr ausgewählt werden. Diese kann man einfach anschauen und auf Erkenntnis hoffen. Alternativ lassens sich Textanalysewerkzeuge anwenden, dazu später. Dazu müssen die Daten jedoch entweder in einer Textdatei oder einer vollwertigen Datenbank zusammen gefaßt werden.

Wie gut sind die Daten?

Die Aussagekraft dieser Recherche ist insofern begrenzt, als im Falle einer Xing-Recherche die Stichprobe ausschließlich Xing-Mitglieder betrifft oder alternativ für den englischen Sprachraum Linkedin-Mitglieder sind. Das sind in der Regel Menschen, die entweder wegen Stellensuche ihre Sichtbarkeit erhöhen wollen, generell Freizeitkontakte suchen (auch das gibt es über Xing) oder viele Kunden- und Lieferantenkontakte haben, die sie über Xing pflegen. Glückliche Fleißarbeiter, die in Hinterzimmern Daten und Texte auswerten, sind in Xing seltener zu finden.

Trends lassen sich aus Texten gut ablesen – höhere Worthäufigkeiten, mehr Bedeutung. Man staunt, wieviel Bullshit im Sinn sich wiederholender Verstärkerwörter sich besonders in der Werbung breit macht. Auch Stellenangebote bleiben hier nicht verschont.

Texte auswerten – Verfahren

Es gibt komplexe Verfahren, wie etwa das von Google verwendete, in dem die Wörter nach Bedeutung gewichtet werden. Die einfachste Methode zur Textauswertung ist Wörter zählen. Möchte man das nicht über kostenpflichtige Konten bei spezialisierten Diensten machen, sondern mithilfe freier Software selbst, empfiehlt sich Textstat. Dieses kann Word- und Openoffice-Dokumente sowie Webseiten und Textdateien einlesen und die Worthäufigkeiten ermitteln.

Folgende Grafik zeigt eine beispielhaft Text Mining aus 14 Stellenangeboten für Trainer und Marktforscher.

Texte auswerten mit Textstat
Analyse großer Texte mit Textstat – hier Worthäufigkeiten bei 14 Stellenangeboten für Trainer und Marktforscher
(für größeren Text auf die Grafik klicken) Einerseits ist erkennbar, wie viele immergleiche Füllwörter in Stellenangeboten verwendet werden, andererseits liegt der Schwerpunkt in Frankfurt am Main – die Hälfte der Stellen.

———————————————-

  1. [0] Personal Coach Svenja Hofert argumentiert hier für eine datenbasierte Studien- und Berufswahl.
  2. [1] Analyseverfahren im Text-Mining – eine Übersicht (Fallstudienarbeit)
  3. [2]Die Auswertungen von Freitext mit tidytext für R ist ein breites Gebiet. Siehe auch im Tidytext-Manual
Published by Johannes Winterhalter

ich bin spezialisiert auf die Schnittstelle von Vertrieb, Pädagogik und Marketing für Händler, Dienstleister, Trainer, Berater und Coaches. Als Schulleiter an privaten Bildungseinrichtungen, EDV-Administrator und Marktforscher habe ich schon viele Unternehmen bezüglich Öffentlichkeitsarbeit, Werbung und Internetauftritt beraten oder war an entscheidender Stelle. Als gelernter Marktforscher habe ich viele Möglichkeiten, etwas über die Einstellungen von Menschen zu erfahren und potentielle Kunden zu identifizieren. Sie können sich zurück lehnen und dem widmen, was Sie am besten können, ihre Kernkompetenzen für Ihre Kunden einsetzen.

One thought on “Texte auswerten und Trends finden

  1. Post Author Johannes Winterhalter

    Texte auswerten geht sehr gut mit der Statistiksoftware R. Der Einstieg in diese Software ist schwer, dafür hat man hinterher eine riesige Menge Funktionen.

Leave a Reply

Your email address will not be published. Required fields are marked *