Камаралі Роман Вадимович
НТУУ «КПІ ім. Ігоря Сікорського»
м. Київ
Проблема аналізу часових рядів такого роду визначається в необхідності виявлення взаємозв'язків і циклічності складних процесів в умовах неповної і нечіткої апріорної інформації з метою з'ясування ходу розвитку складових того чи іншого процесу.
Такого роду проблема відноситься до розряду «сліпої проблеми», яка вирішується з використанням технології цифрової обробки сигналів і називається «сліпа обробка сигналів» (blind signal processing).
Для вирішення цієї проблеми було вирішено розробити класифікатор для виявлення аномальних подій.
Рисунок 1 – Фазовий портрет випадкового сигналу
У якості явних ознак були обрані наступні характеристики:
- Площина центральної плями
- Кількість витків у другої та третьої осях координат
- Кількість витків у першої та четвертої осях координат
Для першого каналу були виділені такі параметри ознак
Площина плями 1 класу – 12600 ед.кв., 2 класу –120000 ед.кв.
Кількість витків у другої та третьої осях координат 1 класу -2
Кількість витків у другої та третьої осях координат 2 класу -6
Кількість витків у першої та четвертої осях координат 1 класу -3
Кількість витків у першої та четвертої осях координат 2 класу -5
Експеримент проводився на основі реальних даних. Загалом 4 потока даних, у кожному потоці 35 файлів, у кожному файлі 92160 відліків. Налаштування класифікатору проходило наступним чином:
Вибірка з кожного потоку були розбита на 3 частини:
- 50% навчальна
- 30% тестова
- 20% валідаційна
Після навчання класифікатору результат виглядає таким чином:
Рисунок 2 – Результат роботи класифікатора
У порівнянні із очікуваним результатом маємо наступне:
Рисунок 3- Порівняння очікуваного та отриманого результату
Був оцінен класифікатор за допомогою наступних параметрів:
- Метрика правильності – співвідношення правильно класифікованих, як позитивні, та помилково класифікованих, як позитивні, об’єктів до усіх.
- Точність (precision) - показує яку частку об'єктів, розпізнаних як об'єкти позитивного класу, ми передбачили вірно.
- Повнота (recall) - показує, яку частку об'єктів, реально належать до позитивного класу, ми передбачили вірно.
- F-міра (F- measure) - характеристика, яка дозволяє дати оцінку одночасно по точності і повноти.
- False Positive Rate (FPR) - показує, скільки від загального числа об'єктів, виявилися передбаченими невірно.
Таблиця 1
Результат оцінки класифікатора
TP |
12 |
FP |
3 |
TN |
20 |
FN |
0 |
accuracy |
0,428571 |
fмера |
0,888889 |
precision |
0,8 |
FPR |
0,869565 |
recall |
1 |
|
|
Розроблений класифікатор дозволяє класифікувати із достатньою точністю часові ряди методом нелінійної динаміки а саме методом фазових портретів.
Точність класифікатора задовільна. Розроблений класифікатор може бути задіяний у медико-біологічній або геофізичній галузях.
Список літератури:
1. Оценка классификатора (точность, полнота, F-мера) http://bazhenov.me/blog/2012/07/21/classification-performance-evaluation.html
2. Оценка точности классификатора http://www.michurin.net/computer-science/precision-and-recall.html