Forskere Har Trænet Et Neuralt Netværk Til At Bestemme En Persons Køn Ud Fra Den Skrevne Tekst - Alternativ Visning

Forskere Har Trænet Et Neuralt Netværk Til At Bestemme En Persons Køn Ud Fra Den Skrevne Tekst - Alternativ Visning
Forskere Har Trænet Et Neuralt Netværk Til At Bestemme En Persons Køn Ud Fra Den Skrevne Tekst - Alternativ Visning

Video: Forskere Har Trænet Et Neuralt Netværk Til At Bestemme En Persons Køn Ud Fra Den Skrevne Tekst - Alternativ Visning

Video: Forskere Har Trænet Et Neuralt Netværk Til At Bestemme En Persons Køn Ud Fra Den Skrevne Tekst - Alternativ Visning
Video: Neural Network lærer at spille slange 2024, Kan
Anonim

Et team af forskere fra National Research Nuclear University "MEPhI", National Research Center "Kurchatov Institute" og Voronezh State University har udviklet en metode, der lærer en computer til at genkende en persons køn fra en tekst skrevet af ham med en nøjagtighed på 80 procent. Videnskabelig udvikling hører til området computing-sprogvidenskab. Forskningen blev udført med et tilskud fra Russian Science Foundation. Resultaterne offentliggøres i tidsskriftet Procedia Computer Science.

Talrige videnskabelige undersøgelser viser, at en skriftlig tekst uundgåeligt afspejler dens forfatters karakteristika - køn, psykologiske egenskaber, uddannelsesniveau. Tale er et værdifuldt psykodiagnostisk værktøj, der bruges af menneskelige ressourcespecialister fra store virksomheder såvel som sikkerhedstjenester.

Baseret på analyse af tale er det muligt at diagnosticere tilstedeværelsen af visse sygdomme hos en person (demens, depression) og en tendens til selvmordsadfærd. Behovet for at fastlægge kendetegnene for forfatteren af teksten vokser også med udviklingen af internetkommunikation: det er vigtigt for virksomhederne at vide, hvilke grupper mennesker der synes om deres produkter og tjenester.

Forskere, der arbejder i denne retning (lingvister, psykologer, informationsteknologis specialister), bygger på de numeriske værdier for forskellige parametre i teksten, bygger matematiske modeller til diagnosticering af visse personlighedsparametre.

Et team af eksperter analyserede effektiviteten af forskellige maskinlæringsteknologier ved hjælp af neurale netværk til tekstanalyse.

I løbet af undersøgelsen sammenlignede de nøjagtigheden af at løse problemet med kønsidentifikation af tekster baseret på to tilgange til databaseret modellering: på den ene side maskinlæringsalgoritmer (understøttelsesvektormaskine og gradient boosting), på den anden side dyb læring af neurale netværk (indviklede neurale netværk og tilbagevendende neurale netværk med lang kortvarig hukommelse).

”Vi har opnået høje resultater med at bestemme køn for forfatteren af teksten takket være avancerede neurale netværksmodeller under forhold, når forfatteren ikke skjuler sit køn. Den næste opgave er at bestemme kønet i forhold til dets forsætlige skjule,”siger Alexander Sboev, lektor ved NRNU MEPhI.

Så i de følgende tekster, der oprindeligt blev lagt ud på en datingside, finder det neurale netværk let en fangst i ti ud af ti tilfælde, og forfatteren sætter desuden bevidst navnet på det modsatte køn i underskriften.

Salgsfremmende video:

Teksten blev skrevet af en pige:”Jeg er en smuk, muskuløs mand på 30 år. Jeg arbejder for et stort olie- og gasfirma i en god position med en anstændig løn. Jeg bor i min egen lejlighed i Moskva. Ejendommen har også et lille, men smukt hus i en af landsbyerne i Italien. Jeg er glad for sport, især fodbold. Jeg elsker at gå ud i weekenden, jeg hader at blive hjemme. En pige, der passer mig, skal have en beskeden disposition, godt udseende og en attraktiv figur efter moderne standarder. Hun skulle dele mine interesser, skulle ikke være jaloux og skulle ikke prøve at få mig til at være jaloux. Jeg vil ikke støtte pigen, fordi jeg mener, at begge skal arbejde i familien. Jeg foretrækker også at holde budgettet separat. Jeg tåler ikke forræderi."

Teksten blev skrevet af en mand:”Hej! Jeg er ekstremt ulykkelig, ekstremt! Hvorfor opfører du dig sådan med os ?! Vi er også mennesker, vi er alle lige! Er du sexist? Jeg tager ikke dette længere! Jeg bryder din bil overalt, maler den. Vent, umenneskelig. Jeg vil afslutte på denne måde."

Resultaterne af denne undersøgelse viste, at en tilgang, der er baseret på brugen af indviklede neurale netværk og dybe læringsmetoder til at genkende kønet til den person, der skrev teksten, er den mest optimale.

Nu arbejder en gruppe forskere på problemet med aldersgenkendelse.

Anbefalet: