Корпус української мови – це електронне зібрання текстів, впорядковане, організоване й оформлене певним чином, призначене для наукового та практичного вивчення української мови.
У корпусі зберігаються тексти, опрацьовані автоматичним лінгвістичним аналізатором. Це означає, що кожній одиниці тексту (морфемі, слову, словосполученню, реченню) приписана певна супровідна інформація: частиномовна належність, граматична форма, синтаксична функція, контекст тощо.
Ви можете здійснювати пошук текстових прикладів у корпусі як за конкретними словами, так і за лінгвістичними характеристиками (наприклад, знайти всі речення з невідмінюваними іменниками або всі словосполучення, що складаються з прикметників та іменників).
Тому що корпус створюється та анотується в автоматичному режимі. Відредагувати вручну такий великий обсяг інформації неможливо, але ми працюємо над тим, щоб поліпшувати її якість.
Корпус надає інформацію двох типів: