Պիտակավորում

ԱՐԵՎԱԿ-ն արևելահայերեն տեքստերի էլոկտրոնային հավաքածու է, որոնք համակարգչային վերլուծական ծրագրի կողմից մշակման ենթարկվելու արդյունքում ստանում են բառային և ձևաբանական նշումներ: ԱՐԵՎԱԿ-ի նշումները ներկայացնում են ներքին XML պիտակների համակարգ, որոնք կցված են տեքստերին և բառանիշներին որոնումը իրականացնելու նպատակով: Ընդգրկված տեքստերից յուրաքանչյուրի համար ներկայացված է համապատասխան հիմնական մետատեքստային (մատենագիտական) ինֆորմացիան:

ԱՐԵՎԱԿ-ում իրականացվում է երեք տեսակի պիտակավորում`
  • մետատեքստային (մատենագիտական), որը կցվում է յուրաքանչյուր տեքստային միավորի,
  • բառային և ձևաբանական, որը կցվում է բառանիշերի ավելի քան 90%-ին, ինչպես նաև անգլերեն թարգմանություններ բառանիշների մոտ 85 %-ի համար,
  • կետադրության, նախադասության սահմանների, ինչպես նաև այլ օժանդակ հատկանիշների պիտակավորում:

Ի տարբերություն բառային և ձևաբանական պիտակների, որոնցից  ԱՐԵՎԱԿ-ի գործածողները կարող են օգտվել, մետատեքստային ինֆորմացիայի և օժանդակ հատկանիշների նշումները մատչելի են միայն ԱՐԵՎԱԿ-ի ինտերֆեյսի միջոցով (օրինակ` Ենթակորպուսի միջոցով): ԱՐԵՎԱԿ-ի ներքին օգտագործման համար ներմուծված են ընդմանենը մի քանի պիտակներ. ընդհանուր առմամաբ պահպանված են ընդունված անվանումները: