Wissenschaftler Haben Ein Neuronales Netzwerk Trainiert, Um Das Geschlecht Einer Person Anhand Des Geschriebenen Textes - Alternative Ansicht

Wissenschaftler Haben Ein Neuronales Netzwerk Trainiert, Um Das Geschlecht Einer Person Anhand Des Geschriebenen Textes - Alternative Ansicht
Wissenschaftler Haben Ein Neuronales Netzwerk Trainiert, Um Das Geschlecht Einer Person Anhand Des Geschriebenen Textes - Alternative Ansicht

Video: Wissenschaftler Haben Ein Neuronales Netzwerk Trainiert, Um Das Geschlecht Einer Person Anhand Des Geschriebenen Textes - Alternative Ansicht

Video: Wissenschaftler Haben Ein Neuronales Netzwerk Trainiert, Um Das Geschlecht Einer Person Anhand Des Geschriebenen Textes - Alternative Ansicht
Video: Künstliche Intelligenz Special: Künstliche neuronale Netze - Computer lernen sehen | Phil's Physics 2024, Kann
Anonim

Ein Team von Wissenschaftlern der National Research Nuclear University "MEPhI", des National Research Center "Kurchatov Institute" und der Voronezh State University hat eine Methode entwickelt, mit der ein Computer das Geschlecht einer Person anhand eines von ihm verfassten Textes mit einer Genauigkeit von 80 Prozent erkennt. Die wissenschaftliche Entwicklung gehört zum Bereich der Computerlinguistik. Die Forschung wurde mit einem Stipendium der Russian Science Foundation durchgeführt. Die Ergebnisse werden in der Zeitschrift Procedia Computer Science veröffentlicht.

Zahlreiche wissenschaftliche Studien zeigen, dass ein geschriebener Text unweigerlich die Merkmale seines Autors widerspiegelt - Geschlecht, psychologische Merkmale, Bildungsniveau. Sprache ist ein wertvolles psychodiagnostisches Instrument, das von Personalfachleuten großer Unternehmen sowie von Sicherheitsdiensten verwendet wird.

Basierend auf der Analyse der Sprache ist es möglich, das Vorhandensein bestimmter Krankheiten bei einer Person (Demenz, Depression) und eine Tendenz zum Selbstmordverhalten zu diagnostizieren. Die Notwendigkeit, die Merkmale des Autors des Textes festzulegen, wächst auch mit der Entwicklung der Internetkommunikation: Für Unternehmen ist es wichtig zu wissen, welche Personengruppen ihre Produkte und Dienstleistungen mögen.

In dieser Richtung arbeitende Wissenschaftler (Linguisten, Psychologen, Spezialisten für Informationstechnologie) erstellen auf der Grundlage der numerischen Werte verschiedener Parameter des Textes mathematische Modelle zur Diagnose bestimmter Persönlichkeitsparameter.

Ein Expertenteam analysierte die Wirksamkeit verschiedener Technologien für maschinelles Lernen unter Verwendung neuronaler Netze zur Textanalyse.

Im Verlauf der Studie verglichen sie die Genauigkeit der Lösung des Problems der Geschlechtsidentifikation von Texten auf der Grundlage von zwei Ansätzen zur datenbasierten Modellierung: einerseits Algorithmen für maschinelles Lernen (Support Vector Machine und Gradient Boosting), andererseits Deep Learning Neuronale Netze (Convolutional Neural Networks und wiederkehrende neuronale Netze mit langem Kurzzeitgedächtnis).

„Wir haben dank fortschrittlicher neuronaler Netzwerkmodelle unter Bedingungen, unter denen der Autor sein Geschlecht nicht verbirgt, hohe Ergebnisse bei der Bestimmung des Geschlechts des Autors des Textes erzielt. Die nächste Aufgabe besteht darin, das Geschlecht im Hinblick auf seine absichtliche Verschleierung zu bestimmen “, sagt Alexander Sboev, außerordentlicher Professor am NRNU MEPhI.

In den folgenden Texten, die ursprünglich auf einer Dating-Site veröffentlicht wurden, findet das neuronale Netzwerk in zehn von zehn Fällen leicht einen Haken. Darüber hinaus setzt der Autor den Namen des anderen Geschlechts absichtlich in die Signatur ein.

Werbevideo:

Der Text wurde von einem Mädchen geschrieben: „Ich bin ein hübscher, muskulöser Mann von 30 Jahren. Ich arbeite für ein großes Öl- und Gasunternehmen in einer guten Position mit einem anständigen Gehalt. Ich wohne in meiner eigenen Wohnung in Moskau. Das Anwesen hat auch ein kleines, aber hübsches Haus in einem der Dörfer in Italien. Ich mag Sportarten, insbesondere Fußball. Ich gehe gerne übers Wochenende aus, ich hasse es, zu Hause zu bleiben. Ein Mädchen, das zu mir passen würde, sollte eine bescheidene Einstellung, ein gutes Aussehen und eine nach modernen Maßstäben attraktive Figur haben. Sie sollte meine Interessen teilen, nicht eifersüchtig sein und nicht versuchen, mich eifersüchtig zu machen. Ich werde das Mädchen nicht unterstützen, weil ich glaube, dass beide in der Familie arbeiten sollten. Ich ziehe es auch vor, das Budget separat aufzubewahren. Ich werde Verrat nicht tolerieren."

Der Text wurde von einem Mann geschrieben: „Hallo! Ich bin sehr unglücklich, sehr! Warum benimmst du dich bei uns so ?! Wir sind auch Menschen, wir sind alle gleich! Bist du sexistisch Ich werde das nicht mehr ertragen! Ich werde dein Auto überall kaputt machen, es lackieren. Warte, unmenschlich. Ich werde diesen Weg beenden."

Die Ergebnisse dieser Studie zeigten, dass ein Ansatz, der auf der Verwendung von Faltungsnetzwerken und Deep-Learning-Methoden zur Erkennung des Geschlechts der Person basiert, die den Text geschrieben hat, am optimalsten ist.

Jetzt arbeitet eine Gruppe von Forschern am Problem der Alterserkennung.

Empfohlen: