Baanbrekersnavorsing oor dit is wat sy gesê het

Die verrassende doeltreffendheid en lang lewe van die nou legendariese Dis wat sy gesê het grap, onlangs weer gewild gemaak met behulp van Die kantoor , het meer as net miljoene mense 'n kniehalter reaksie op informele gesprekke gegee. Dit het nou 'n nuwe vlak van sosiale belang bereik deur ernstige taalkundige navorsing te inspireer. Dit kom in die vorm van 'n navorsingsartikel genaamd Dit is wat sy gesê het: dubbele entender-identifikasie , geskryf deur twee rekenaarwetenskapstudente, Chloe kiddon en Yuriy Brun .

In hul referaat skets die paar hul skepping van die Dubbele aanbieder via selfstandige naamwoordoordrag of DEviaNT benadering wat outomaties identifiseer, is dit wat sy gesê het (TWSS) skerts. Hulle noem hul benadering metaforiese analise, wat 'n dubbele betekenis het, en dit is gebaseer op die gewig van sekere woorde as seksier as ander. Die span het verskeie sexy selfstandige naamwoorde en werkwoorde geweeg en daarna hul algoritme gebruik.

In hul navorsing het die paar ook 'n paar interessante reëls vir TWSS-grappies ontdek. Byvoorbeeld, die risiko om verkeerd 'n TWSS-grap aan te roep. Uit hul studie:

Byvoorbeeld, in 'n sosiale omgewing is die koste om dit te sê wat sy onbehoorlik gesê het, hoog, terwyl die koste om dit nie te sê as dit gepas was nie, weglaatbaar is.

Om dit aan te spreek en om beter resultate te lewer, het die span 'n leeralgoritme gebruik. Dit het onder andere die skepping van vals-positiewe 100 keer hoër as vals negatiewe gestel.

Nadat DEviaNT deur 'n reeks vooraf geïdentifiseerde TWSS-grapmateriaal en ewekansige aanhaling uitgevoer is. In hul toets het hulle 1,5 erotiese sinne en 57 000 nie-erotiese sinne gebruik. Die span sê dat hulle 'n sukseskoers van meer as 71,4% behaal het. Al lyk dit miskien nie veel nie, sê die span dat hulle met 'n groter datastel resultate nader aan 99,5% sou verwag. Daarbenewens het DEviaNT interessante resultate gelewer. Weereens uit die studie:

DEviaNT het 28 sulke sinne opgelê (almal is waarskynlik 'n TWSS), waarvan 20 ware positiewe is. 2 van die 8 vals positiewe is egter in werklikheid TWSS's (ten spyte van die negatiewe toetsdata): Ja, gee my al die room en hy is weg. en Ja, maar sy gat ruik soms.

Sommige doen afbreuk aan hierdie navorsing en noem dit bloot 'n leeuwerik en van min waarde. Dit sou 'n aanval met 'n lae slag wees, want selfs die navorsers beskryf hul werk as 'n harde probleem met die begrip van taal. (Dis wat sy gesê het.)

( Nuwe wetenskaplike via Die ontvlugting )