Կորպուսային լեզվաբանությունը տեքստային կորպուսի միջոցով բնական լեզվի ուսումնասիրությունն է։ Համաձայն կորպուսային լեզվաբանության՝ հուսալի ուսումնասիրությունն առավել իրագործելի է բնական համատեքստում հավաքագրված կորպուսների միջոցով՝ արտաքին նվազագույն միջամտությամբ։
Տեքստային կորպուսի մեթոդը ներառում է մի շարք վերացական կանոններ, որոնք այդ լեզվի տեքստերի միջոցով ներկայացնում են բնական լեզուն։ Այս մեթոդն ուսումնասիրում է, թե ինչպես է տվյալ լեզուն հարաբերվում այլ լեզուների հետ։ Ելակետային տեքստերից կորպուսի ձևավորումը սկզբնական շրջանոմ կատարվել է ձեռքով, իսկ այժմ գործընթացն ավտոմատացված է։
Կորպուսները միմիայն լեզվաբանական ուսումնաիրությունների նպատակով չեն կիրառվել, այլև բառարանագրության (առաջինը՝ «The American Heritage Dictionary of the English Language», 1969 թվական), ինչպես քերականության ուղեցույցներ կազմելու նպատակով, ինչպես օրինակ՝ «A Comprehensive Grammar of the English Language»՝ հրատարակված 1985 թվականին։
Ոլորտի մասնագետները տարբեր դիրքորոշումներ ունեն կորպուսի ծանոթագրության առնչությամբ։ Տեսակետները տարբերվում են. Ջոն ՄըքՀարդի Սինքլեիրը նախապատվությունը տալիս է նվազագույն ծանոթագրության գաղափարին՝ թողնելով, որ տեքստերը ներկայացնեն իրենք իրենց, մինչդեռ «Survey of English Usage» խումբը (Լոնդոնի համալսարանական քոլեջ) առավել կարևորում է ծանոթագրության նշանակությունը՝ համարելով, որ այն ճշգրիտ գրառման միջոցով ապահովում է լեզվաբանական ավելի մեծ ըմբռնում։
Քերականության նկարագրության որոշ նախնական փորձեր մասամբ հիմնված էին որոշակի կրոնական կամ մշակութային նշանակության կորպուսների վրա։ Օրինակ՝ պրատիշախյայի գրականությունը նկարագրում էր սանսկրիտի հնչյունային օրինաչափությունները , ինչպես որ Վեդասում, իսկ Պանինիի դասական սանսկրիտի քերականությունը գրեթե մասամբ հիմնված էր միևնույն կորպուսի վերլուծության վրա։ Նմանապես վաղ արաբ քերականագետները հատուկ ուշադրություն էին դարձնում Ղուրանի լեզվի վրա։ Արևմտյան եվրոպական ավանդույթի հետևորդ գիտնականները բառացանկ կազմեցին՝ հնարավոր դարձնելով Աստվածաշնչի և այլ նմանաբնույթ տեքստերի լեզվի մանրակրկիտ ուսումնասիրությունը։
Ժամանակակից կորպուսային լեզվաբանության մեջ կարևոր դեր խաղաց 1967 թվականին «Ժամանակակից ամերիկյան անգլերենի համակարգչային ուսումնասիրություն» վերնագրով աշխատության հրատարակումը։ Հեղինակներն էին Հենրի Կուչերան ու Նելսոն Ֆրենսիսը։ Աշխատությունը հիմված էր Բրաունյան Կորպուսի ուսումնասիրության վրա։ Այն տարբեր աղբյուրներից ընտրված շուրջ մեկ միլիոն ժամանակակից ամերիկյան անգլերեն բառերի հավաքածու էր։ Կուչերան և Ֆրենսիսը տարաբնույթ և մանրամասն վերլուծության ենթարկեցին Բրաունյան կորպուսը և այնուհետև մեկտեղեցին լեզվաբանության, լեզվի ուսուցման, հոգեբանության, վիճակագրության ու հասարակագիտության հիմնական մոտեցումները, որպեսզի ստեղծեն հարուստ և համապարփակ աշխատություն։ Հաջորդը Ռանդոլֆ Քվիրկի «Անգլերենի կիրառման նկարագրություն» նշանակալի աշխատությունն էր՝ հրատարակված 1960 թվականին և հիմնված անգլերենի կիրառական կողմի հետազոտության վրա։
Դրանից անմիջապես հետո Բոսթոնի հրատարակիչ Հոութըն-Միֆֆլին դիմում է Կուչերային, որպեսզի վերջինս մեկ միլիոն բառանյութով, եռատող մեջբերմամբ համակարգ ստեղծի իր նոր Բառարանի համար՝ «American Heritage Dictionary»: Սա առաջին բառարանն էր՝ կազմված կորպուսային լեզվաբանության հիման վրա։ Առաջին անգամ նորարարական քայլ ձեռնարկվեց՝ համատեղելով երկու մոտեցում՝ թե ինչպես պետք է լեզուն կիրառվի ու թե այն իրականում ինչպես է կիրառվում։
Մյուս հրատարակիչները ևս հետևեցին այդ օրինակին։ Բրիտանական «Collins» հրատարակչատան «COBUILD monolingual learner's dictionary» բառարանը, նախատեսված անգլերենը՝ որպես օտար լեզու սովորողների համար, ստեղծվեց «Bank of English» կորպուսի կիրառմամբ։ «Survey of English Usage» կորպուսը դրվեց կորպուսի վրա հիմնված քերականության մշակման հիմքում, որը գրվել է Քվիրկի և այլոց կողմից ու հրատարակվել է 1985 թվականին՝ «A Comprehensive Grammar of the English Language»։
Բրաունյան Կորպուսի հիման վրա ստեղծվել են նմանատիպ կառուցվածք ունեցող մի շարք այլ կորպուսներ՝ «LOB» կորպուսը (1960-ականներ, բրիտանական անգլերեն), «Kolhapur»(հնդկական անգլերեն), «Wellington» (Նորզելանդական անգլերեն), «Australian Corpus of English» (Ավստրալիական անգլերեն), «Frown Corpus» (վաղ 1990-ականներ, ամերիկյան անգլերեն) և «FLOB Corpus» (1990-ականներ, բրիտանական անգլերեն)։ Այլ կորպուսներ ներկայանում են տարբեր լեզուներով, տարատեսակներով ու ոճերով, այդ թվում՝ Անգլերենի Միջազգային Կորպուսը, Բրիտանական Ազգային Կորպուսը, որը մի շարք բանավոր ու գրավոր տեքստերից բաղկացած 100 միլիոնանոց բառերի հավաքածու է՝ ստեղծված 1990-ականներին հրատարակիչների, համալսարանների (Օքսֆորդ և Լանքասթեր) ու Բրիտանական Ազգային Կորպուսի համահեղինակությամբ։ Ամերիկյան Ազգային Կորպուսում աշխատանքը դադարեցվել է ժամանակակից ամերիկյան անգլերենի համար, ու այժմ Ժամանակակից Ամերիկյան Անգլերենի Կորպուսում (1990–մինչ օրերս) 400 միլիոնից ավելի բառ է հասանելի վեբ ինթերֆեյսի միջոցով։
Բանավոր խոսքի առաջին համակարգչային կորպուսը ստեղծվել է 1971 թվականին «Montreal French» նախագծի կողմից։ Այն կազմված է մեկ միլիոն բառից, և այն ոգեշնչեց Շանա Պոպլակին՝ Օտտավա-Հալի շրջանում ստեղծելու խոսակցական ֆրասներենի ավելի մեծ կորպուս։
1990-ականներին բնական լեզվով ծրագրավորման մեջ կիրառելի վիճակագրական մեթոդների վաղ, նշանակալի հաջողություններից շատերը գրանցվել են մեքենայական թարգմանության ոլորտում, մասնավորապես «IBM Research»-ի աշխատանքների շնորհիվ։ Այս համակարգերը կարող էին օգտվել գոյություն ունեցող բազմալեզվյան տեքստային կորպուսներից, որոնք ստեղծվել էին Կանադայի խորհրդարանի ու Եվրամիության կողմից այն օրենքների արդյունքում, որոնք կոչ էին անում թարգմանել բոլոր կառավարական վարույթները կառավարության համապատասխան համակարգերի պաշտոնական բոլոր լեզուներով։
Բացի կենդանի լեզուների կորպուսներից՝ համակարգչային կորպուսներ են նաև ստեղծվել հին լեզուներով տեքստերի հավաքագրմամբ։ Որպես օրինակ եբրայերեն Աստվածաշնչի շտեմարանն է՝ կազմված Անդերսեն-Ֆորբսի կողմից՝ 1970-ականներից ի վեր, որում յուրաքանչյուր բաղադրիչ նախադասություն վերլուծվում է՝ օգտագործելով մինչև յոթ շարահյուսական մակարդակների հասնող գծագրեր, ու յուրաքանչյուր հատված պիտակավորված է յոթ տեսակի տեղեկույթով։ Արաբերեն Ղուրանի կորպուսը դասական արաբերենով պիտակավորված կորպուս է։ Սա վերջին նախագիծն է պիտակավորման բազմաթիվ շերտերով՝ ներառյալ ձևաբանական հատույթավորումը, խոսքիմասային պիտակավորումը և շարահյուսական վերլուծությունը՝ կախումների ծառի տեսքով։
Բացի լոկ լեզվաբանական ուսումնասիրությունից` հետազոտողները սկսել էին կիրառել կորպուսային լեզվաբանությունը այլ ակադեմիական ու մասնագիտական ոլորտներում, արդյունքում ձևավորվում են միջգիտակարգային կապեր, օրինակ՝ օրենք ու կորպուսային լեզվաբանություն, որի նպատակն է հասկանալ իրավական տեքստերը՝ կիրառելով կորպուսային տվյալներն ու գործիքները։
Կորպուսային լեզվաբանությունը սկիզբ է դրել ուսումնասիրության մի շարք մեթոդների՝ ապահովելով տեսության և տվյալների կապը։ Վոլիսն ու Նելսոնը (2001) առաջինն էին, որ ներկայացրին 3Ա-ի մոտեցումը՝ աննոտացիա (պիտակավորում, ծանոթագրություն), աբստրակցիա (ընդհանրացում, վերացարկում) ու անալիզ (վերլուծություն)։
Այսօր շատ բառագիտական կորպուսներ խոսքիմասային պիտակավորման տեսակին են պատկանում։ Այնուամենայնիվ, նույնիսկ կորպուսային լեզվաբանները, որոնք աշխատում են չպիտակավորված, պարզունակ տեքստերի հետ, անխուսափելիորեն կիրառում են որևէ մեթոդ՝ առանձնացնելու կարևոր եզրույթները։ Այսպիսի դեպքերում պիտակավորումն ու վերացարկումը մեկտեղվում են բառային որոնման մեջ։
Պիտակավորված կորպուսի առավելությունն այն է, որ օգտվողները կարող են տարբեր հետազոտություններ իրականացնել կորպուսի միջոցով։ Անկախ կորպուսի ստեղծողների լեզվաբանական հայացքներից՝ տարբերվող հետաքրքրություններ ու տեսակետներ ունեցող բոլոր լեզվաբանները կարող են կիրառել կորպուսը։ Տվյալների փոխանակման միջոցով կորպուսային լեզվաբանները կարող են դարձնել կորպուսը լեզվաբանական քննարկումների ու ուսումնասիրությունների առարկա։
Այս ոլորտի գրքաշարերը ներառում են.
Կան կորպուսային լեզվաբանությանը նվիրված մի շարք միջազգային գրախոսվող ամսագրեր, ինչպիսիք են՝
Վիքիպահեստ նախագծում կարող եք այս նյութի վերաբերյալ հավելյալ պատկերազարդում գտնել Կորպուսային լեզվաբանություն կատեգորիայում։ |
This article uses material from the Wikipedia Հայերեն article Կորպուսային լեզվաբանություն, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Բովանդակությունը թողարկված է CC BY-SA 4.0 թույլատրագրով, եթե այլ բան նշված չէ։ Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Հայերեն (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.