Що таке verba
2026-06-24
verba — це відкритий, уніфікований корпус українських прислів'їв, приказок та народних висловів. Він зводить під одним дахом спадщину української пареміології за останні майже два століття — від перших друкованих збірок середини XIX століття до сучасних видань XXI століття.
Наразі корпус налічує 48 787 записів, які походять із п'яти знакових пареміографічних джерел.
Навіщо створено verba?
Досі українські прислів'я залишалися розпорошеними по різних друкованих та електронних джерелах. Кожна збірка мала свій правопис (часто історичний або діалектний), свою структуру й не мала машиночитаного формату. Це ускладнювало як просте читання та пошук, так і наукові дослідження чи використання народної мудрості в цифрових проєктах.
Проєкт verba вирішує ці проблеми: 1. Уніфікує формат: усі прислів'я зведені в єдину структуру. 2. Зберігає першоджерело: оригінальний правопис збережено без змін, що важливо для мовознавців. 3. Полегшує пошук: до кожного запису додано сучасне нормалізоване написання та тематичні мітки. 4. Зв'язує варіанти: близькі за значенням або формою вислови згруповані разом.
Джерела корпусу
Корпус об'єднує п'ять визначних пареміографічних праць: * Збірка Івана Ількевича (1841): видана у Відні, одна з перших спроб фіксації галицьких прислів'їв. * Збірка Матвія Номиса (1864): фундаментальна праця, видана в Санкт-Петербурзі, що містить понад 14 тисяч записів. * Збірка Івана Франка (1901–1909): тритомне академічне видання Наукового товариства ім. Шевченка у Львові, вершина української класичної пареміографії. * Збірка за ред. Максима Рильського (упорядник В. Бобкова, 1961): радянське академічне видання, що відображає стан пареміології середини XX століття. * Сучасне зібрання Валерія Млодзинського (2009): велика праця, що фіксує сучасне побутування та нові пласти народних висловів.
Детальніше про кожне з цих зібрань ви можете дізнатися в нашій статті «П'ять зібрань: звідки прислів'я».
Можливості пошуку
Вебдодаток verba пропонує кілька режимів роботи: * Повнотекстовий пошук: шукайте за ключовим словом, причому пошук працює як за історичним оригінальним текстом, так і за сучасним написанням. * Фільтрація за темами та джерелами: ви можете обрати одну з 27 тем або конкретну збірку. * Семантичний пошук («за змістом»): завдяки штучному інтелекту (моделі BGE-M3) ви можете шукати прислів'я за описом ситуації або близьким за значенням реченням, навіть якщо в самому прислів'ї немає жодного з цих слів. * Режим «Гортати»: випадкова вибірка прислів'їв у вигляді зручних карток для щоденного натхнення.
Спробуйте, наприклад, знайти прислів'я через швидкі посилання: * Прислів'я №1 — «Баба з воза — кобилі легше» (у збірці Номиса). * Прислів'я №126 — відомий вислів «Апетит з їдою прибуває».
Відкриті дані та ліцензія
Проєкт verba повністю відкритий. Упорядкування корпусу, сучасне написання, тематичні мітки та групи варіантів поширюються на умовах ліцензії CC BY 4.0 (Ініціатор проєкту: Дмитро Ємельянов).
Розробникам та дослідникам доступний повний REST API, а також готові файли для завантаження в популярних форматах (JSON, CSV, Croissant). Про те, як використовувати ці ресурси у власних дослідженнях, читайте у статті «Відкриті дані: як користуватися корпусом» або перейдіть до документації API.