Морфний сегментатор українського тексту. - Науковий керівник - доцент Дарчук Наталія Петрівна; виконавці: доц.Алексієнко Людмила Антонівна, доц. Дарчук Наталія Петрівна, доц. Зубань Оксана Миколаївна, інженер-програміст Сорокін Віктор Михайлович (укладання пакету алгоритмів та програм сегментування українського тексту на морфи)
Мета - створення морфного сегментатора українського тексту
Однією із задач прикладної лінгвістики є здобуття знань про будову та функціонування мови у різних сферах діяльності людини. Текст є основною формою збереження інформації. Будучи результатом мовленнєвого акту, він включає в себе певний інвентар мовних елеменів, які відбираються і комбінуються у ньому у відповідності з граматикою мови, регулюються його нормою. А оскільки у мовленні нема нічого, чого не було б у мові, то й текст одночасно реалізує і формує систему мови. Отже, правомірним і перспективним є опосередкований шлях вивчення мовних явищ через текст, оскільки аналізуються всі лінгвістичні одиниці всіх мовних рівнів як єдина реальність у спостереженні.
Використання ЕОМ забезпечує одержання об’єктивних результатів функціонування мовних одиниць у мові, розширює арсенал застосовуваних методів і прийомів у лінгвістичних дослідженнях, підвищує ефективність роботи дослідника.
Автоматичний морфний сегментатор представляє собою систему, на вході якої словоформи звичайного тексту, на виході - ті ж самі словоформи, заіндексовані кодами граматичної приналежності до певної частини мови та розчленовані на морфи (кореневі та афіксальні) з відповідними індексами.
Автоматичний морфний сегментатор може бути використаний у лінгвістичних дослідженнях морфемної та словотворчої структури, а саме при:
укладанні алфавітно-частотних словників усіх типів морфів та базі текстів різних типів дискурсів;встановленні та об’єднанні афіксальних аломорфів у морфему (аломорфія коренів переноситься з базового словника на текстову словоформу автоматично);встановленні системних та функціональних характеристик морфем;конструюванні гнізд (індекс омонімії коренів переноситься автоматично з базового словника на текстову словоформу)проведенні словотворчого аналізу словоформВ перспективі планується робота демонстраційної версії сегментатора в on-line режимі на цьому сервері.