МЕТОДИ АНАЛІЗУ ПОТОКОВИХ ДАНИХ ДЛЯ ЗАБЕЗПЕЧЕННЯ ВІДМОВОСТІЙКОСТІ РОЗПОДІЛЕНИХ СИСТЕМ

Ігор Анатолійович Бученко; Андрій Вікторович Лемешко; Наталія Олександрівна Лащевська

Бученко Ігор Анатолійович (Buchenko Ihor) Державний університет інформаційно-комунікаційних технологій, Київ https://orcid.org/0009-0003-9012-9632
Лемешко Андрій Вікторович (Lemeshko Andriy) Державний торговельно-економічний університет, Київ https://orcid.org/0000-0001-8003-3168
Лащевська Наталія Олександрівна (Lashchevska Nataliia) Державний університет інформаційно-комунікаційних технологій, Київ https://orcid.org/0000-0003-2148-115X

Анотація

Актуальність теми зумовлена тим, що сучасні розподілені інформаційні системи (РС) є базисом функціонування цифрових платформ у хмарних обчисленнях, фінансових сервісах та Інтернеті речей (IoT). Ефективність їхньої роботи та загальна надійність безпосередньо залежать від здатності обробляти величезні обсяги даних у реальному часі. Збої в роботі окремих компонентів або некоректна обробка даних можуть призводити до масштабних відмов, втрати даних та значних фінансових збитків. У цьому контексті особливої актуальності набувають методи потокового аналізу, які дозволяють у режимі реального часу відстежувати стан інфраструктури, виявляти аномалії та своєчасно реагувати на загрози. Застосування машинного навчання (ML) у потоковому аналізі суттєво підвищує точність прогнозування збоїв та оптимізації ресурсів. Метою дослідження є аналіз сучасних методів обробки та аналізу потокових даних для забезпечення безперебійної роботи та відмовостійкості інфраструктур розподілених систем, а також визначення практичних підходів до впровадження таких методів у реальних умовах. Методологія дослідження базується на аналізі наукових публікацій та технічної документації, порівняльному аналізі сучасних платформ потокової обробки даних, методах математичного моделювання для створення моделей моніторингу та прогнозування відмов, а також емпіричних методах для дослідження продуктивності РС. Детально проаналізовано такі платформи, як Apache Kafka, Apache Flink та Apache Spark Streaming. Оцінено роль методів машинного навчання, зокрема, у контексті виявлення аномалій та адаптації до «дрейфу концепцій» (concept drift). У результаті дослідження систематизовано методи потокового аналізу для підвищення відмовостійкості РС. Визначено ключові архітектурні відмінності провідних інструментів: Apache Kafka як розподілена платформа збереження та передавання подій (принцип «журналу змін»); Apache Flink як інструмент для обробки потоків з мінімальною затримкою та підтримкою станоутримуючих обчислень (stateful computations) і контрольних точок (checkpointing); Apache Spark Streaming, що реалізує підхід міні-пакетної обробки (micro-batching). Розглянуто роль інструментів оркестрації, зокрема Kubernetes, у автоматизації розгортання, масштабування та самовідновлення потокових конвеєрів. Обґрунтовано доцільність застосування ML для прогнозування відмов у режимі реального часу. Деталізовано практичні методи забезпечення безперебійної роботи, включаючи резервне копіювання (знімки Velero у Kubernetes), кластеризацію , моніторинг (Prometheus, Grafana) та тестування відмовостійкості, зокрема, із застосуванням підходів "chaos engineering" (наприклад, Chaos Mesh). Практична значущість дослідження полягає у підготовці рекомендацій для впровадження методів потокового аналізу та систем забезпечення відмовостійкості у реальних інформаційних системах, зокрема у хмарних платформах, IoT-системах та критичних ІТ-інфраструктурах.

Ключові слова: комп’ютерна мережа, потокові дані, обробка в реальному часі, Apache Kafka, Apache Flink, машинне навчання, виявлення аномалій, Kubernetes, chaos engineering.

МЕТОДИ АНАЛІЗУ ПОТОКОВИХ ДАНИХ ДЛЯ ЗАБЕЗПЕЧЕННЯ ВІДМОВОСТІЙКОСТІ РОЗПОДІЛЕНИХ СИСТЕМ

DOI: 10.31673/2412-4338.2025.048913

Анотація