ВАНК 3.0 (март 2009 г.)
Это третья версия Восточноармянского национального корпуса. Вот некоторые изменения по сравнению со вторым релизом (март 2008):

  • Увеличение корпуса: сейчас ВАНК включает почти 110 млн. словоупотреблений (примерно на 20% больше, чем ВАНК 2.0)
  • Устный подкорпус вырос до 3 млн. по сравнению с 1,84 млн. в ВАНК 2.0 (в основном за счет включения новых записей публичной устной речи)
  • Включен новый тип текстов – электронная коммуникация (более 400 тыс. словоупотреблений)
  • Статистика словоупотреблений: в разделе Статистика (ссылка в верхней части экрана) приводятся данные по частотности словоформ; частотность можно просмотреть по любой словоформе, и не только по всему корпусу в целом, но и по конкретным десятилетиям и основным жанрам
  • Для всех текстов, не защищенных авторским правом (все художественные произведения, со времени смерти авторов которых прошло более семидесяти лет; все газеты до 1920 г. и весь устный корпус), возможно неограниченное расширение контекста; в ВАНК 2.0 контекст не мог расширяться далее 9 предложений
  • В новой закладке Лексические категории в окне Грамматика приведен список добавленных в разметку лексико-семантических помет, дающих новые возможности поиска по частям речи: топонимы, имена существительные, обозначающие человека, локативные местоимения, переходные глаголы и др.


(См. также ВАНК 2.0)