Parsimine on a grammatiline harjutus, mis hõlmab teksti jaotamist kõneosadeks koos vormi, funktsiooni ja süntaktiline iga osa seos teksti mõistmiseks. Mõiste "parsimine" pärineb ladina keelest pars jaoks "osa (kõne)."
Kaasaegses lingvistikas viitab parsimine tavaliselt keele arvutipõhisele süntaktilisele analüüsile. Arvutiprogrammid, mis lisavad a-le automaatselt parsimismärgendid tekst nimetatakse parserid.
Peamised võtmed: parsimine
- Parsimine on lause jaotamine selle osadeks, et lauset mõistaks.
- Traditsiooniline sõelumine toimub käsitsi, mõnikord lausete diagrammide abil. Parsimine on seotud ka keerukamate analüüsivormidega, näiteks diskursuseanalüüs ja psühholingvistika.
Sõelumine määratlus
Sisse keeleteadus, kuni parsida tähendab lause jaotust selleks komponendid nii et saaks aru lause tähendusest. Mõnikord toimub parsimine selliste tööriistade abil nagu lausediagrammid (süntaktiliste konstruktsioonide visuaalsed kujutised). Lause sõelumisel võtab lugeja teadmiseks lause elemendid ja nende kõneosad (kas sõna on nimisõna, tegusõna, omadussõna jne). Lugeja märkab ka teisi elemente, nagu tegusõna tegus (oleviku pinge, mineviku pinge, tuleviku pinge jne). Kui lause on jaotatud, saab lugeja lause tähenduse tõlgendamiseks kasutada nende analüüsi.
Mõned keeleteadlased teevad vahet "täieliku parsimise" ja "skeleti parsimise" vahel. Esimene viitab teksti täielikule analüüsile, sealhulgas võimalikult üksikasjalikule selle elementide kirjeldusele. Viimane viitab lihtsamale analüüsi vormile, mida kasutatakse lause põhitähenduse mõistmiseks.
Traditsioonilised parsimismeetodid
Tavaliselt toimub parsimine lause võtmise ja selle osadeks jaotamise teel. Sõnad paigutatakse eristatavatesse grammatilistesse kategooriatesse ja seejärel tuvastatakse sõnade grammatilised suhted, mis võimaldab lugejal lauset tõlgendada. Võtke näiteks järgmine lause:
- Mees avas ukse.
Selle lause sõelumiseks liigitame kõigepealt iga sõna selle kõneosa järgi: (artikkel), mees (nimisõna), avati (tegusõna), (artikkel), uks (nimisõna). Lausel on ainult üks verb (avati); saame seejärel tuvastada selle verbi subjekti ja objekti. Kuna mees sooritab toimingu, siis on see teema mees ja objekt on uks. Sest tegusõna on avati-pigem kui avaneb või avaneb—Teada, et lause on minevikus olnud, see tähendab, et kirjeldatud toiming on juba aset leidnud. See näide on lihtne, kuid see näitab, kuidas saab parsimist kasutada teksti tähenduse selgitamiseks. Traditsioonilised sõelumismeetodid võivad sisaldada lausete diagramme või mitte. Sellistest visuaalsetest abivahenditest on mõnikord abi, kui analüüsitavad laused on eriti keerulised.
Diskursuse analüüs
Erinevalt lihtsast parsimisest viitab diskursuseanalüüs laiemale uurimisvaldkonnale, mis käsitleb keele sotsiaalseid ja psühholoogilisi aspekte. Need, kes diskursuseanalüüsi teevad, on muu hulgas huvitatud keeležanritest (need, kellel on kindel seada kokkuleppeid eri valdkondade piires) ning seoseid keele ja sotsiaalse käitumise, poliitika ja mälu. Sel viisil väljub diskursuse analüüs traditsioonilise parsimise ulatusest, piirdudes ainult selle üksikute tekstidega.
Psühholingvistika
Psühholingvistika on õppesuund, mis tegeleb keelega ning selle seostega psühholoogia ja neuroteadustega. Selles valdkonnas töötavad teadlased uurivad viise, kuidas aju töötleb keelt, muutes märgid ja sümbolid tähenduslikeks avaldusteks. Seetõttu on nad huvitatud peamiselt protsessidest, mis võimaldavad traditsioonilist parsimist. Neid huvitab näiteks see, kuidas erinevad ajustruktuurid hõlbustavad keele omandamist ja mõistmist.
Arvutipõhine parsimine
Arvutuslingvistika on uurimisvaldkond, milles teadlased on inimkeelte arvutimudelite väljatöötamisel kasutanud reeglitel põhinevat lähenemisviisi. See töö ühendab arvutiteaduse kognitiivse teaduse, matemaatika, filosoofia ja tehisintellektiga. Arvutipõhise parsimise abil saavad teadlased tekstianalüüsi tegemiseks kasutada algoritme. See on teadlastele eriti kasulik, kuna erinevalt traditsioonilisest parsimisest saab selliseid tööriistu kiiresti kasutada analüüsida suures mahus teksti, paljastades mustreid ja muud teavet, mida polnud kerge hankida teisiti. Digitaal humanitaarteaduste arenevas valdkonnas on näiteks Shakespeare'i tööde analüüsimiseks kasutatud arvutipõhist parsimist; 2016. aastal järeldasid kirjandusajaloolased näidendi arvutianalüüsist, et Kaasautor oli Christopher Marlowe Shakespeare'i "Henry VI."
Üks arvutipõhise parsimise väljakutseid on see, et keele arvutimudelid on reeglipõhised, st teadlased peavad rääkima algoritmidele, kuidas teatud struktuure ja mustreid tõlgendada. Inimkeeles ei ole aga sellistel struktuuridel ja mustritel alati ühesugused tähendused ja keeleteadlased peavad neid juhtima rakendatavate põhimõtete kindlaksmääramiseks analüüsima üksikuid näiteid.
Allikad
- Dowty, David R. jt. "Looduskeele parsimine: psühholoogiline, arvutuslik ja teoreetiline perspektiiv." Cambridge University Press, 2005.
- Halley, Ned. "Kaasaegse inglise keele Wordsworthi sõnaraamat: 21. sajandi grammatika, süntaks ja stiil." Wordsworthi väljaanded, 2001.