Sisse keeleteadus, üheseltmõistetamine on protsess, mille abil saab kindlaks teha, millist a-tähendust tunda sõna kasutatakse konkreetses piirkonnas kontekst. Tuntud ka kui leksikaalset eristamist.
Arvutuslikus lingvistikas nimetatakse seda diskrimineerivat protsessi sõnasõnaline eristamine (WSD).
Näited ja tähelepanekud
"Nii juhtub, et meie suhtlus, erinevates keeled sarnaselt, võimaldab sama sõnavormi kasutada erinevate asjade tähendamiseks üksikutes kommunikatiivsetes tehingutes. Selle tagajärg on see, et konkreetses tehingus tuleb välja mõelda antud sõna kavandatud tähendus selle potentsiaalselt seotud meelte hulgas. Samal ajal kui ebamäärasused mis tulenevad sellistest mitme vormitähendusega ühendustest, on leksikaalne tasandil tuleb neid sageli lahendada suuremas kontekstis diskursus sõna kinnistamine. Seega saab sõna "teenus" erinevaid meeli lahutada ainult siis, kui võiks vaadata kaugemale sõnast endast, nagu vastandades " mängija teenistus Wimbledonis 'koos kelneriteenistusega Sheratonis. See sõna tähenduste tuvastamise protsess diskursuses toimub üldiselt tuntud kui
sõnatunnetus üheseltmõistetav (WSD). "(Oi Yee Kwong, Uued vaatenurgad sõnade mõistmise arvutuslike ja kognitiivsete strateegiate jaoks. Springer, 2013)Leksikaalne ja sõna-mõistmise eristamine (WSD)
"Leksikaline üheseltmõistetav selle kõige laiem määratlus pole midagi muud kui iga sõna tähenduse määramine kontekstis, mis näib inimestes olevat suuresti alateadlik protsess. Arvutusliku probleemina kirjeldatakse seda sageli kui "AI-täielikku", see tähendab probleemi, mille lahendamine eeldab lahenduse täielikku täitmist looduskeel mõistmine või terve mõistuse mõttekäik (Ide ja Véronis 1998).
"Arvutusliku lingvistika valdkonnas nimetatakse seda probleemi tavaliselt sõnasõnaliseks eristamiseks (WSD) ja seda määratletakse järgmiselt: probleem arvutuslikult kindlaks teha, milline sõna "tähendus" on sõna kasutamisega aktiveeritud kontekst. WSD on sisuliselt klassifitseerimise ülesanne: sõnameeled on klassid, kontekst pakub tõendusmaterjal ja iga sõna esinemine omistatakse ühele või mitmele selle võimalikule klassile, tuginedes tõendid. See on WSD tavapärane ja üldine iseloomustus, mis näeb seda sõnaselgelt üheselt mõistetava sõnamõtlemismeetodi tuvastamise protsessina. Eeldatakse, et sõnadel on a-st piiratud ja diskreetne aistingute komplekt sõnastik, leksikaalne teadmistebaas või ontoloogia (viimases vastavad aistingud mõistetele, mida sõna leksikaliseerib). Kasutada võib ka rakendusespetsiifilisi loendeid. Näiteks masintõlke (MT) seadistuses saab sõna tõlkeid käsitleda kui sõna meeli, an lähenemisviis, mis on üha enam teostatav suurte mitmekeelsete keelte olemasolu tõttu paralleelselt korporatsioonid mida saab kasutada treeningandmetena. Traditsioonilise WSD fikseeritud inventuur vähendab probleemi keerukust, kuid alternatiivsed väljad on olemas.. .. "(Eneko Agirre ja Philip Edmonds," Sissejuhatus. " Word Sense'i seletamine: algoritmid ja rakendused. Springer, 2007)
Homonüümia ja seletamine
"Leksikaline üheseltmõistetav sobib hästi näiteks homonüümianäiteks bass tuleb kaardistada ühele leksikaalsetest elementidest bass1 või bass2, sõltuvalt kavandatud tähendusest.
"Leksiline eristamine tähendab kognitiivset valikut ja on ülesanne, mis pärsib mõistmisprotsesse. Seda tuleks eristada protsessidest, mis viivad sõnameeli eristumiseni. Esimene ülesanne täidetakse üsna usaldusväärselt ka ilma palju kontekstuaalset teavet esitamata, viimane aga mitte (vrd. Veronis 1998, 2001). Samuti on näidatud, et homonüümsed sõnad, mis nõuavad eristamist, aeglustavad leksikaalset juurdepääsu, samal ajal kui polüseemilised sõnad, mis aktiveerivad paljusid sõnameeli, kiirendavad leksikaalset juurdepääsu (Rodd e.a. 2002).
"Kuid nii semantiliste väärtuste produktiivsel muutmisel kui ka sirgjoonelisel valimisel leksikaalselt erinevate üksuste vahel on üldiselt vajavad nad mitteleksikaalset lisateavet. "(Peter Bosch," Produktiivsus, polüseemia ja ennustatav indeksilisus ". Loogika, keel ja arvutus: 6. rahvusvaheline Tbilisi sümpoosion loogika, keele ja arvutuse teemal, toim. autor Balder D. kümme Cate ja Henk W. Zeevat. Springer, 2007)
Leksika kategooria selgitus ja tõenäosuse põhimõte
"Corley ja Crocker (2000) tutvustavad laiaulatuslikku mudelit leksikaalne kategooriaüheseltmõistetav põhinedes Tõenäosuse põhimõte. Täpsemalt, nad soovitavad seda sõnadest koosneva lause puhul w0... wn, valib lauseprotsessor kõige tõenäolisemalt kõne osa jada t0... tn. Täpsemalt öeldes kasutab nende mudel kahte lihtsat tõenäosust: (i) sõna tinglik tõenäosus wi antud konkreetses kõnes tija (ii) tõenäosus ti arvestades eelmise osa kõnes ti-1. Kuna lause iga sõna on kokku puutunud, määrab süsteem selle kõneosaks ti, mis maksimeerib nende kahe tõenäosuse korrutise. See mudel kasutab ära paljude teadmised süntaktiline kahemõttelisustel on leksikaalne alus (MacDonald jt, 1994), nagu punktis 3:
(3) Laopinnad / margid on odavamad kui ülejäänud.
"Need laused on ajutiselt mitmetähenduslikud lugemise vahel, kus hinnad või teeb on põhitegusõna või osa sellest liitnimisõna. Pärast suure korpuse väljaõpet ennustab mudel kõige tõenäolisemat kõneosa hinnad, arvestades õigesti tõsiasjaga, et inimesed saavad aru hind nimisõnana aga teeb kui tegusõna (vt Crocker & Corley, 2002 ja nendes viidatud viited). Mudel ei kajasta mitte ainult leksikaalses kategoorias juurdunud paljusid üheselt mõistetavaid eelistusi ebamäärasus, see selgitab ka seda, miks üldiselt on inimesed selliste ebamäärasuste lahendamisel ülitäpsed. " (Matthew W. Crocker, "Mõistmise ratsionaalsed mudelid: jõudlusparadoksi käsitlemine". 21. sajandi psühholingvistika: neli nurgakivi, toim. autor Anne Cutler. Lawrence Erlbaum, 2005)