Перцептивна модифікація метода N-грам для оцінювання схожості послідовностей символів за коефіцієнтом Серенсена

  • Савченко Д. С.

Анотація

У статті запропоновано модифікацію методу N-грам з використанням коефіцієнту Серенсена для кількісної оцінки схожості послідовностей символів, що відповідає сформованому критерію і дозволяє оцінювати схожість послідовностей символів з урахуванням особливості їх сприйняття людиною експертом (принципу перцептивності). Запропонований метод дозволяє будувати більш ефективні механізми автоматизованого виявлення та корегування помилок у неструктурованих текстах.

Ключові слова: послідовність символів, коефіцієнтом Серенсена, метод N-грам, принцип перцептивності, дистанція між послідовностями символів, схожість послідовностей

Номер
Розділ
Статті