Камаралі Роман Вадимович

НТУУ «КПІ ім. Ігоря Сікорського»

м. Київ

 

 Проблема аналізу часових рядів такого роду визначається в необхідності виявлення взаємозв'язків і циклічності складних процесів в умовах неповної і нечіткої апріорної інформації з метою з'ясування ходу розвитку складових того чи іншого процесу. 

 Такого роду проблема відноситься до розряду «сліпої проблеми», яка вирішується з використанням технології цифрової обробки сигналів і називається «сліпа обробка сигналів» (blind signal processing). 

 Для вирішення цієї проблеми було вирішено розробити класифікатор для виявлення аномальних подій.

 

Рисунок 1 – Фазовий портрет випадкового сигналу

 У якості явних ознак були обрані наступні характеристики:

  • Площина центральної плями
  • Кількість витків у другої та третьої осях координат
  • Кількість витків у першої та четвертої осях координат

 Для першого каналу були виділені такі параметри ознак

 Площина плями 1 класу – 12600 ед.кв., 2 класу –120000 ед.кв.

 Кількість витків у другої та третьої осях координат 1 класу -2

 Кількість витків у другої та третьої осях координат 2 класу -6

 Кількість витків у першої та четвертої осях координат 1 класу -3

 Кількість витків у першої та четвертої осях координат 2 класу -5

 Експеримент проводився на основі реальних даних. Загалом 4 потока даних, у кожному потоці 35 файлів, у кожному файлі 92160 відліків. Налаштування класифікатору проходило наступним чином:

 Вибірка з кожного потоку були розбита на 3 частини:

  • 50% навчальна
  • 30% тестова
  • 20% валідаційна

 Після навчання класифікатору результат виглядає таким чином:  

Рисунок 2 – Результат роботи класифікатора

 У порівнянні із очікуваним результатом маємо наступне:

 

Рисунок 3- Порівняння очікуваного та отриманого результату

 

 Був оцінен класифікатор за допомогою наступних параметрів:

 - Метрика правильності – співвідношення правильно класифікованих, як позитивні, та помилково класифікованих, як позитивні, об’єктів до усіх.

  

 - Точність (precision) - показує яку частку об'єктів, розпізнаних як об'єкти позитивного класу, ми передбачили вірно. 

  

 - Повнота (recall) - показує, яку частку об'єктів, реально належать до позитивного класу, ми передбачили вірно.

  

 - F-міра (F- measure) - характеристика, яка дозволяє дати оцінку одночасно по точності і повноти. 

  

 - False Positive Rate (FPR) - показує, скільки від загального числа об'єктів, виявилися передбаченими невірно. 

 

Таблиця 1

Результат оцінки класифікатора

TP

12

FP

3

TN

20

FN

0

accuracy

0,428571

fмера

0,888889

precision

0,8

FPR

0,869565

recall

1

 

 

 

 Розроблений класифікатор дозволяє класифікувати із достатньою точністю часові ряди методом нелінійної динаміки а саме методом фазових портретів. 

 Точність класифікатора задовільна. Розроблений класифікатор може бути задіяний у медико-біологічній або геофізичній галузях.

 

Список літератури:

1. Оценка классификатора (точность, полнота, F-мера) http://bazhenov.me/blog/2012/07/21/classification-performance-evaluation.html

2. Оценка точности классификатора http://www.michurin.net/computer-science/precision-and-recall.html