|
ԱՐԵՎԱԿ-ի քերականական վերլուծիչ
ԱՐԵՎԱԿ-ում ընդգրկված տեքստերի էլեկտրոնային հավաքածուն մշակվել է ԱՐԵՎԱԿ-ի քերականական վերլուծիչի միջոցով: Այն ձևաբանական վերլուծման ծրագիր է, որը ստեղծվել է Կորպուս Թեքնոլոջիսի կողմից: ԱՐԵՎԱԿ-ի քերականական վերլուծիչը կցում է բառանիշի պիտակավորում յուրաքանչյուր բառաձևին, որի բառույթը առկա է ԱՐԵՎԱԿ-ի քերականական բառացանկում:
Ձեր ուշադրությանն ենք ներկայացնում ԱՐԵՎԱԿ-ի քերականական վերլուծիչի կողմից մշակված նմուշ:
Քերականական վերլուծությունը ապահովելու համար նախ և առաջ մշակվել է անվանական և բայական բառաթեքման տեսակների սպառիչ դասակարգման համակարգ: Ապա բառացանկի յուրաքանչյուր բառաթեքման ենթարկվող բառույթին կցվել է թեքման տեսակին համապատասխանող որոշակի պիտակ (օրինակ`N11): Արդյունքում ստեղծվել է ԱՐԵՎԱԿ-ի քերականական բառացանկը:
Ներկայումս ԱՐԵՎԱԿ-ի բառանիշների 72.6%-ը ստանում է միանշանակ վերլուծություն, 17%-ը` ոչ միանշանակ, իսկ 7.5%-ը՝ չի վերլուծվում: Քերականական վերլուծությունը անմիջականորեն կախված է ժանրից: Հասկանալի պատճառներով ամենաշատ չվերլուծված բառերը բանավոր խոսքի տեքստերում են:
ԱՐԵՎԱԿ-ի Քերականական վերլուծիչ՝ ըստ վերլուծությունների տեսակների բաշխման |
|
2009 թ. հունվարի դրությամբ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
# վերլուծություն |
Մեկնաբա
նություններ |
Գեղ. |
Գիտ. |
Մամուլ |
Այլ գրավոր խոսք |
Բանավոր խոսք |
Ընդամենը |
|
|
|
|
|
|
|
|
1 |
միանշանակ |
75,4% |
67,0% |
72,6% |
69,4% |
65,2% |
72,6% |
|
|
|
|
|
|
|
|
2 |
համանուն բառեր |
15,1% |
9,6% |
12,7% |
12,3% |
12,8% |
13,3% |
3 |
համանուն բառեր |
1,8% |
2,1% |
2,0% |
1,8% |
1,6% |
1,9% |
4 - 7 |
համանուն բառեր |
1,8% |
2,1% |
2,0% |
1,8% |
1,6% |
1,9% |
Միանշանակ ընդամենը՝ |
18,7% |
13,7% |
16,7% |
15,8% |
16,0% |
17,0% |
|
|
|
|
|
|
|
|
1? |
վարկածային (բառարանում չընդգրկված) |
0,0% |
1,3% |
0,6% |
0,7% |
0,2% |
0,5% |
|
|
|
|
|
|
|
|
0 |
չճանաչված |
5,4% |
11,9% |
7,7% |
7,0% |
12,3% |
7,5% |
|
|
|
|
|
|
|
|
Հատուկ բառանիշեր՝ կիրիլիկ, լատիներեն, թվեր |
|
0,3% |
6,3% |
2,8% |
5,6% |
6,0% |
2,4% |
|
|
|
|
|
|
|
|
Ընդամենը՝ |
|
100% |
100% |
100% |
99% |
100% |
100% |
Ոչ միանշանակ վերլուծություն (համանունություն)Կանոնավոր և պատահական համանուն բառերը արևելահայերենում շատ տարածված են: Օրինակ` արևելահայերենի -ե (-e) խոնարհման բայերի անորոշ և վաղակատար դերբայների ձևերը սովորաբար համանուն են (գրել grel ‘to write’): Որպես պատահական համանունության օրինակ կարելի է բերել հարգի բառաձևը, որը վերլուծվում է և՛ որպես ածական՝ հարգի hargi ‘respectable’, և՛ որպես հարգել hargel բայի ստորադասական եղանակի երրորդ դեմքի եզակի թվի ներկա ժամանակի բառաձև:
Ներկայումս ԱՐԵՎԱԿ-ի քերականական վերլուծիչը չի վերլուծում համատեքստային և շարահյուսական ինֆորմացիան. այն մշակում է միայն ձևաբանական ինֆորմացիան: Արդյունքում ԱՐԵՎԱԿ-ի քերականական հարցումները կարող են տալ համանուն վերլուծություններ, որոնք իրականում կարող են տարբերակվել՝ կախված համատեքստից: Հնարավոր սխալ վերլուծությունները կրճատելու համար անհրաժեշտ է ավելացնել սահմանափակող չափանիշներ, օր.՝ ավելացնել ևս մեկ բառաձև, որը կարող է լինել համապատասխան համատեքստում: Բացի այդ համանուն դեպքերը կարող են ընդհանրապես բացառվել (տե՛ս Ընդլայնված որոնում բաժինը): Այդ դեպքում, սակայն, արդյունքների քանակը կարող է զգալի կերպով կրճատվել:
Երբեմն որոշակի հաճախակի հանդիպող դեպքերի համար քիչ հավանական համանունությունը հանվել է, օր.՝ աս գոյականի ներգոյական բառաձևը՝ ասում, որը համընկնում է ասել բայի անկատար դերբայի հետ:
Զրոյական վերլուծություն
Ներկայումս որոշ բառանիշներ չեն վերլուծվում, քանի որ դրանք բացակայում են ԱՐԵՎԱԿ-ի քերականական բառացանկից: Նման բառերը հիմնականում ընդգրկում են.
- համեմատաբար վերջերս փոխ առնված բառերը,
- նորաբանությունները,
- որոշ ռուսերեն կամ անգլերեն բառերը,
- հապավումները,
- հատուկ անունները,
- տեխնիկական տերմինները,
- արևմտահայերեն ուղղագրությամբ բառերը,
- գրաբարի ուղղագրությամբ բառերը,
- տպագրական սխալները,
- բառացանկում չընդգրկված բառաթեքման տեսակների (հիմնականում բանավոր խոսքի դեպքում) բառերը,
- տեսածրման հետևանքվ առաջացած սխալները,
- բնագրում առկա տառասխալները:
Տարվում են մշտական աշխատնքներ ԱՐԵՎԱԿ-ի բառացանկի բացթուղումները լրացնելու և տեքստերում առկա վրիպակներն ուղղելու ուղղությամբ: Մենք շատ երախտապարտ կլինենք նման թերությունների մասին Ձեր արձագանքի համար:
Հավանական վերլուծությունՈրոշ հապավումների համար ԱՐԵՎԱԿ-ի վերլուծական ծրագիրը առաջարկում է հավանական վերլուծության տարբերակներ (հիմնականում գծիկով և հոլովի/թվի վերջածանցին նախորդող հապավումների համար): Նման բառանիշների վերլուծություններում ավելացվում է հավանական բառույթը հարցական նշանով:
Վերլուծական կազմություններՈչ համատեքստային քերականական վերլուծության արդյունքում արևելահայերենի բայական վերլուծական կազմությունների բաղադրիչ մասերը ներկայումս վերլուծվում են որպես առանձին ձևաբանական-շարահյուսական միավորներ: Նման վերլուծական կազմությունները կարելի է գտնել քերականական հարցումների միջոցով, որի համար անհրաժեշտ է միայն ավելացնել օժանդակ բայը: Օրինակ՝ անկատար դերբայի հարցումը, որին անմիջապես հետևում է է ē ‘to be’ օժանդակ բայը, կտա անկատար ժամանակի վերլուծական բայաձևերը:
|