Forskare Har Utbildat Ett Neuralt Nätverk För Att Bestämma En Persons Kön Från Den Skrivna Texten - Alternativ Vy

Forskare Har Utbildat Ett Neuralt Nätverk För Att Bestämma En Persons Kön Från Den Skrivna Texten - Alternativ Vy
Forskare Har Utbildat Ett Neuralt Nätverk För Att Bestämma En Persons Kön Från Den Skrivna Texten - Alternativ Vy

Video: Forskare Har Utbildat Ett Neuralt Nätverk För Att Bestämma En Persons Kön Från Den Skrivna Texten - Alternativ Vy

Video: Forskare Har Utbildat Ett Neuralt Nätverk För Att Bestämma En Persons Kön Från Den Skrivna Texten - Alternativ Vy
Video: Artificiella Neurala Nätverk 2024, Maj
Anonim

Ett team av forskare från National Research Nuclear University "MEPhI", National Research Center "Kurchatov Institute" och Voronezh State University har utvecklat en metod som lär en dator att känna igen en persons kön från en text skriven av honom med en noggrannhet på 80 procent. Vetenskaplig utveckling tillhör området computinglingvistik. Forskningen genomfördes med ett bidrag från Russian Science Foundation. Resultaten publiceras i tidskriften Procedia Computer Science.

Många vetenskapliga studier visar att en skriftlig text oundvikligen återspeglar dess författares egenskaper - kön, psykologiska egenskaper, utbildningsnivå. Tal är ett värdefullt psykodiagnostiskt verktyg som används av personalföretagens specialister från stora företag, såväl som säkerhetstjänster.

Baserat på talanalysen är det möjligt att diagnostisera förekomsten av vissa sjukdomar hos en person (demens, depression) och en tendens till självmordsbeteende. Behovet av att fastställa egenskaperna hos författaren till texten växer också med utvecklingen av internetkommunikation: det är viktigt för företag att veta vilka grupper människor som gillar sina produkter och tjänster.

Forskare som arbetar i denna riktning (lingvister, psykologer, specialister inom informationsteknologi) bygger på de numeriska värdena för olika parametrar i texten matematiska modeller för att diagnostisera vissa personlighetsparametrar.

Ett team av experter analyserade effektiviteten hos olika maskininlärningstekniker med hjälp av neurala nätverk för textanalys.

Under studien jämförde de noggrannheten i att lösa problemet med könsidentifiering av texter baserat på två tillvägagångssätt för databaserad modellering: å ena sidan maskininlärningsalgoritmer (stödvektormaskin och gradientökning), å andra sidan djupa lärande neurala nätverk (convolutional neurala nätverk och återkommande nervnätverk med långt korttidsminne).

”Vi har uppnått höga resultat när det gäller att fastställa kön för författaren av texten tack vare avancerade neurala nätverksmodeller, under förutsättningar när författaren inte döljer sitt kön. Nästa uppgift är att bestämma könet i termer av dess avsiktliga döljning, säger Alexander Sboev, docent vid NRNU MEPhI.

Så i följande texter, som ursprungligen publicerades på en datingsida, hittar det neurala nätverket lätt en fångst i tio av tio fall, dessutom sätter författaren medvetet namnet på det motsatta könet i signaturen.

Kampanjvideo:

Texten är skriven av en flicka:”Jag är en stilig, muskulös man på 30 år. Jag arbetar för ett stort olje- och gasföretag i en bra position med en anständig lön. Jag bor i min egen lägenhet i Moskva. Fastigheten har också ett litet men vackert hus i en av byarna i Italien. Jag är förtjust i sport, särskilt fotboll. Jag älskar att åka ut i helgen, jag hatar att vara hemma. En tjej som passar mig borde ha en blygsam disposition, snygg utseende och en attraktiv figur enligt moderna standarder. Hon borde dela mina intressen, ska inte vara avundsjuk och bör inte försöka få mig att bli avundsjuk. Jag kommer inte att stödja flickan, för jag tror att båda borde arbeta i familjen. Jag föredrar också att hålla budgeten separat. Jag tål inte förräderi."

Texten är skriven av en man:”Hej! Jag är extremt olycklig, extremt! Varför uppför du dig så med oss ?! Vi är människor också, vi är alla lika! Är du sexist? Jag tar inte det här längre! Jag bryter din bil överallt, målar den. Vänta, omänskligt. Jag kommer att avsluta på det här sättet."

Resultaten av denna studie visade att en metod baserad på användningen av invandrade neurala nätverk och djupa inlärningsmetoder för att känna igen könet till den person som skrev texten är den mest optimala.

Nu arbetar en grupp forskare med problemet med åldersigenkänning.

Rekommenderas: