Додаткові дані про проект.

“Параметризація українського поетичного мовлення ІІ Пол. ХХст”. (електронна база даних). Науковий керівник - доц. Дарчук Наталія Петрівна ; виконавці : доц.Алексієнко Людмила Антонівна (збір матеріалу, редагування), доц.Дарчук Наталія Петрівна (Вступ. Збір матеріалу, редагування), інженер-програміст Сорокін Віктор Михайлович (пакет алгоритмів та програм укладання частотного словника, статистичного опрацювання матеріалу), студенти Інституту філології.

Це лексикографічна, граматична і статистична електронні бази даних на основі параметризованих текстів п’ятнадцяти видатних поетів 60-90-х років. Фундаментом бази служить Генеральний частотний словник, укладений автоматично за вибірками з поетичних текстів обсягом 300.000 слововживань. Генеральний частотний словник містить 31 000 слів і 69 000 словоформ з такими статистичними параметрами, як абсолютна частота, середня частота, середнє квадратичне відхилення, коефіцієнт стабільності.

Крім Генерального частотного словника в електронній базі наявні аналогічні частотні словники для кожного з 15 авторів: поетів-шістдесятників (Л. Костенко, І. Драч, Б.Олійник, В. Стус, В. Коломієць, Т.Коломієць, Д. Павличко, М. Вінграновський, М. Воробйов), поетів 70-х років (І. Жиленко, С. Йовенко, Л. Скирда) та поетів нової генерації (Ю. Андрухович, О. Забужко, І. Малкович). За бажанням користувача можна одержати також 105 зіставно-порівняльних списків спільної лексики для кожної пари поетів.

Лексика частотних словників кожного з поетів дістала різноаспектної параметризації та систематизації в серії таких словників: тезаурусах (комплексний словник синонімів, антонімів та гіперонімів), у словниках неологізмів, діалектизмів, поетичних тропів (епітетів, метафор, метонімій, порівнянь, оксюморонів, синекдох, гіпербол), морфемних і словотвірних словниках та словниках дієслівного керування.

Основні наукові результати

Запропонована методологія обробки лінгвістичних даних в електронній базі є узагальненням комплексу теоретичних і прикладних ідей сучасного мовознавства. Технологія конструювання бази робить її надзвичайно ефективним та раціональним інструментом (вона зберігає багато часу та людських ресурсів) для спеціалістів-філологів різного профілю.

Систематизована у серіях словників і списках інформація є важливою для стилістичних, літературознавчих і семантичних досліджень лексичного фонду української поетичної мови в його статиці та динаміці.

Потреба в точних функціональних характеристиках мовних одиниць в різних стилях та жанрах гостро відчувалася в останні десятиліття фахівцями ряду галузей, що мають справу з комп’ютерним аналізом текстів, з укладанням навчальних словників, з теорією та практикою функціонування мови. Пропонована база даних є одним із перших кроків у заповненні цієї лакуни.

Електронна база даних зі своєю методологією і технологією допомагає ефективно та оперативно здійснювати масштабні комплексні філологічні дослідження на рівні сучасної наукометрії.

Ця база даних використовується в навчальному процесі на філологічних факультетах університетів та коледжів, забезпечуючи необхідний теоретичний і технологічний рівень підготовки фахівців.

Створена нами база даних уже починає використовуватися як готовий продукт і як модель для конструювання аналогічних електронних баз університетами України.

Ця методологія дослідження мови на базі літератури із застосуванням комп’ютерних технологій обробки даних є експериментальною та іноваційною.