ԱՐԵՎԱԿ-ի քերականական վերլուծիչ

ԱՐԵՎԱԿ-ում ընդգրկված տեքստերի էլեկտրոնային հավաքածուն մշակվել է ԱՐԵՎԱԿ-ի քերականական վերլուծիչի միջոցով: Այն ձևաբանական վերլուծման ծրագիր է, որը ստեղծվել է Կորպուս Թեքնոլոջիսի կողմից: ԱՐԵՎԱԿ-ի քերականական վերլուծիչը կցում է բառանիշի պիտակավորում յուրաքանչյուր բառաձևին, որի բառույթը առկա է ԱՐԵՎԱԿ-ի քերականական բառացանկում:

Ձեր ուշադրությանն ենք ներկայացնում ԱՐԵՎԱԿ-ի քերականական վերլուծիչի կողմից մշակված նմուշ:

Քերականական վերլուծությունը ապահովելու համար նախ և առաջ մշակվել է անվանական և բայական բառաթեքման տեսակների սպառիչ դասակարգման համակարգ: Ապա բառացանկի յուրաքանչյուր բառաթեքման ենթարկվող բառույթին կցվել է թեքման տեսակին համապատասխանող որոշակի պիտակ (օրինակ`N11): Արդյունքում ստեղծվել է ԱՐԵՎԱԿ-ի քերականական բառացանկը:

Ներկայումս ԱՐԵՎԱԿ-ի բառանիշների 72.6%-ը ստանում է միանշանակ վերլուծություն, 17%-ը` ոչ միանշանակ, իսկ 7.5%-ը՝ չի վերլուծվում: Քերականական վերլուծությունը անմիջականորեն կախված է ժանրից: Հասկանալի պատճառներով ամենաշատ չվերլուծված բառերը բանավոր խոսքի տեքստերում են:

ԱՐԵՎԱԿ-ի Քերականական վերլուծիչ՝ ըստ վերլուծությունների տեսակների բաշխման
2009 թ. հունվարի դրությամբ

# վերլուծություն	Մեկնաբա նություններ	Գեղ.	Գիտ.	Մամուլ	Այլ գրավոր խոսք	Բանավոր խոսք	Ընդամենը

1	միանշանակ	75,4%	67,0%	72,6%	69,4%	65,2%	72,6%

2	համանուն բառեր	15,1%	9,6%	12,7%	12,3%	12,8%	13,3%
3	համանուն բառեր	1,8%	2,1%	2,0%	1,8%	1,6%	1,9%
4 - 7	համանուն բառեր	1,8%	2,1%	2,0%	1,8%	1,6%	1,9%
Միանշանակ ընդամենը՝		18,7%	13,7%	16,7%	15,8%	16,0%	17,0%

1?	վարկածային (բառարանում չընդգրկված)	0,0%	1,3%	0,6%	0,7%	0,2%	0,5%

0	չճանաչված	5,4%	11,9%	7,7%	7,0%	12,3%	7,5%

Հատուկ բառանիշեր՝ կիրիլիկ, լատիներեն, թվեր		0,3%	6,3%	2,8%	5,6%	6,0%	2,4%

Ընդամենը՝		100%	100%	100%	99%	100%	100%

Ոչ միանշանակ վերլուծություն (համանունություն)

Կանոնավոր և պատահական համանուն բառերը արևելահայերենում շատ տարածված են: Օրինակ` արևելահայերենի -ե (-e) խոնարհման բայերի անորոշ և վաղակատար դերբայների ձևերը սովորաբար համանուն են (գրել grel ‘to write’): Որպես պատահական համանունության օրինակ կարելի է բերել հարգի բառաձևը, որը վերլուծվում է և՛ որպես ածական՝ հարգի hargi ‘respectable’, և՛ որպես հարգել hargel բայի ստորադասական եղանակի երրորդ դեմքի եզակի թվի ներկա ժամանակի բառաձև:

Ներկայումս ԱՐԵՎԱԿ-ի քերականական վերլուծիչը չի վերլուծում համատեքստային և շարահյուսական ինֆորմացիան. այն մշակում է միայն ձևաբանական ինֆորմացիան: Արդյունքում ԱՐԵՎԱԿ-ի քերականական հարցումները կարող են տալ համանուն վերլուծություններ, որոնք իրականում կարող են տարբերակվել՝ կախված համատեքստից: Հնարավոր սխալ վերլուծությունները կրճատելու համար անհրաժեշտ է ավելացնել սահմանափակող չափանիշներ, օր.՝ ավելացնել ևս մեկ բառաձև, որը կարող է լինել համապատասխան համատեքստում: Բացի այդ համանուն դեպքերը կարող են ընդհանրապես բացառվել (տե՛ս Ընդլայնված որոնում բաժինը): Այդ դեպքում, սակայն, արդյունքների քանակը կարող է զգալի կերպով կրճատվել:

Երբեմն որոշակի հաճախակի հանդիպող դեպքերի համար քիչ հավանական համանունությունը հանվել է, օր.՝ աս գոյականի ներգոյական բառաձևը՝ ասում, որը համընկնում է ասել բայի անկատար դերբայի հետ:

Զրոյական վերլուծություն

Ներկայումս որոշ բառանիշներ չեն վերլուծվում, քանի որ դրանք բացակայում են ԱՐԵՎԱԿ-ի քերականական բառացանկից: Նման բառերը հիմնականում ընդգրկում են.

համեմատաբար վերջերս փոխ առնված բառերը,
նորաբանությունները,
որոշ ռուսերեն կամ անգլերեն բառերը,
հապավումները,
հատուկ անունները,
տեխնիկական տերմինները,
արևմտահայերեն ուղղագրությամբ բառերը,
գրաբարի ուղղագրությամբ բառերը,
տպագրական սխալները,
բառացանկում չընդգրկված բառաթեքման տեսակների (հիմնականում բանավոր խոսքի դեպքում) բառերը,
տեսածրման հետևանքվ առաջացած սխալները,
բնագրում առկա տառասխալները:

Տարվում են մշտական աշխատնքներ ԱՐԵՎԱԿ-ի բառացանկի բացթուղումները լրացնելու և տեքստերում առկա վրիպակներն ուղղելու ուղղությամբ: Մենք շատ երախտապարտ կլինենք նման թերությունների մասին Ձեր արձագանքի համար:

Հավանական վերլուծություն

Որոշ հապավումների համար ԱՐԵՎԱԿ-ի վերլուծական ծրագիրը առաջարկում է հավանական վերլուծության տարբերակներ (հիմնականում գծիկով և հոլովի/թվի վերջածանցին նախորդող հապավումների համար): Նման բառանիշների վերլուծություններում ավելացվում է հավանական բառույթը հարցական նշանով:

Վերլուծական կազմություններ

Ոչ համատեքստային քերականական վերլուծության արդյունքում արևելահայերենի բայական վերլուծական կազմությունների բաղադրիչ մասերը ներկայումս վերլուծվում են որպես առանձին ձևաբանական-շարահյուսական միավորներ: Նման վերլուծական կազմությունները կարելի է գտնել քերականական հարցումների միջոցով, որի համար անհրաժեշտ է միայն ավելացնել օժանդակ բայը: Օրինակ՝ անկատար դերբայի հարցումը, որին անմիջապես հետևում է է ē ‘to be’ օժանդակ բայը, կտա անկատար ժամանակի վերլուծական բայաձևերը: