Морозова Марія Миколаївна,
кандидат технічних наук
Національний технічний університет України
«Київський політехнічний інститут ім. Ігоря Сікорського»,
Україна, м. Київ
Анотація: у статті розглянуто особливості чинників, що впливають на побудову структури нейромережі. Вибрано оптимальну структуру нейромережі, необхідні та достатні для її конфігурації параметри. Виділено етапи реалізації методу навчання нейронної мережі.
Ключові слова: нейромережа, мікроклімат теплиці, модель мікроклімату, врожайність.
У [1] було розглянуто засади щодо створення методу з використанням нейромережевих технологій, що має за мету контроль параметрів мікроклімату теплиці та спрямоване позитивно впливати на якість врожаю, підвищуючи врожайність.
Проаналізувавши зібрану інформацію щодо вирощування грибів було знайдено та проведено аналіз математичної моделі теплиці для вирощування грибів (глив). Для підтримання мікроклімату в теплиці необхідно створити інтелектуальну систему аналізу та коригування параметрів температури, вологості та вуглекислого газу. На основі цих параметрів можливим є прогнозування врожайності теплиці.
Вибір структури нейромережі, тобто числа шарів, числа нейронів і числа зв'язків для кожного нейрона є, мабуть, найбільш складним завданням. Існують різні стратегії пошуку оптимальної структури нейромережі: поступове нарощування, побудова свідомо занадто складної нейромережі з подальшим спрощенням, почергове нарощування і спрощення. Проблема вибору структури тісно пов'язана з проблемами недонавчання і перенавчання. Занадто прості нейромережі не здатні адекватно моделювати цільові залежності в реальних задачах. Занадто складні мережі мають надмірну кількість вільних параметрів, які в процесі навчання налаштовуються не тільки на відновлення цільової залежності, але і на відтворення шуму.
Вибір числа шарів здійснюється наступним чином. Якщо конкретне завдання не вимагає складних обчислень, то можна обмежитися одношаровим персептроном.
Тришаровими мережами користуються для представлення складних багатозв'язних областей. Чим більше шарів, тим більше функцій реалізує мережу, але тим гірше сходяться градієнтні методи, тим важче навчити нейромережу.
Вибір числа нейронів в прихованому шарі здійснюють різними способами:
- Візуальний спосіб. Якщо межа класів занадто згладжена, тоді нейромережа спрощена, і необхідно збільшувати число нейронів в прихованому шарі. Якщо межа класів викидає занадто різкі коливання, на тестових даних спостерігаються великі викиди, ваги нейромережі приймають великі по модулю значення, тоді нейромережа переускладнена, і прихований шар слід скоротити. Недолік цього способу в тому, що він підходить тільки для задач з низькою розмірністю простору (невеликим числом ознак).
- Оптимізація по зовнішньому критерію, наприклад, за критерієм змінного контролю. Залежність зовнішніх критеріїв від параметра складності (H), зазвичай має характерний оптимум. Недолік цього способу в тому, що доводиться багато раз заново будувати мережу при різних значеннях параметра H, а в разі змінного контролю – ще й при різних розбиттях вибірки на навчальну і контрольну частини [2].
Модель нейронної мережі було створено на основі персептрона з трьома прихованими шарами (див. рисунок 1).
Рисунок 1 – Структура нейромережі
На вхід нейромережі поступають значення з датчиків: температура (Т), вологість (Х), вміст вуглекислого газу (СО2) . Кількість нейронів у перщому прихованому шарі – 128, у другому – 64, у третьому – 16. Завдяки трьом прихованим шарам нейромережа є більш гнучкою, та прогнозоване значення врожайності отримаємо з більшою вірогідністю. На виході нейромережі отримуємо значення врожайності за трьома вхідними параметрами, а також витрату теплоносія, витрату пари, значення виділеня вуглекислого газу. Ці вихідні параметри є необхідними для подальшого регулювання параметрів мікроклімату (за допомогою відповідних технічних засобів), для отримання максимально можливої врожайності. При конфігурації моделі встановили першому, другому та третьому прихованому шару функцію активації RELU, оскільки вона є хорошим апроксиматором.
Для вихідних параметрів було встановлено інші функції активації:
- для виходу врожайності – застосовано функцію сигмоїда. Оскільки врожайність виражено нормованим значенням, від 0 до 1, як ймовірність, то застосування саме сигмоїдної функції дозволяє знаходити чіткі межі при прогнозуванні врожайності;
- для виходу витрати теплоносія, витрати пара, значення виділення вуглекислого газу ( ) – застосовано лінійну функцію.
У задачах класифікації найбільш очевидним вибором є порогова функція втрат:
L(y,y′)=[y′≠y], (1)
де y – бажаний вихід; y′ – реальний вихід.
У завданнях регресії найбільш типовим вибором є квадратична функція втрат (MSE):
L(y,y′)=(y′−y)2 , (2)
лінійна функція втрат MAE:
L(y,y′)=|y′−y| . (3)
Для отримання результатів навчання по параметрам мікроклімату використовується квадратична функція втрат. Для оцінки якості навчання – лінійна функція втрат.
Вагові коефіцієнти для виходів нейромережі встановлено наступні: для врожайності – ваговий коефіцієнт дорівнює 0,4; для витрати теплоносія (GT), витрати пару ( Ln ), значення виділеня вуглекислого газу ( VCO2 ) – вагові коефіцієнти дорівнюють по 0,2. Такий вибір є цілеспрямованим, оскільки знаходження прогнозованого значення врожайності є в пріоритеті.
Відповідно до математичної моделі було створено файл для навчання нейронної мережі.
Було виділено наступні етапи реалізації методу навчання нейронної мережі:
Етап 1. Створюємо діапазони для вимірювання температури, вологості та вмісту вуглекислого газу.
Етап 2. Обчислюємо за формулами, що наведено в [1], витрату теплоносія, витрату пару, кількість виділень вуглекислого газу.
Етап 3. Відповідно до визначених діапазонів для вимірювання температури, вологості та вмісту вуглекислого газу створюємо функцію врожайності по кожному параметру.
Етап 4. Поділ значень, розрахованих у трьох етапах, на діапазони для навчання.
Етап 5. Формування масиву даних для навчальної вибірки:
- Значення температури повітря у теплиці (°С).
- Значення вологості повітря (%).
- Вміст вуглекислого газу в повітрі (кг/м3).
- Показник врожайності (від 0 до 1).
- Значення витрати теплоносія.
- Значення витрати пару.
- Значення виділень вуглекислого газу.
Етап 6. Перемішування елементів масиву для кращого навчання нейромережі.
Етап 7. Збереження у файл навчальної вибірки для подальшого тренування нейромережі.
Етап 8. Навчання за допомогою методу градієнтного спуска.
Для навчання проектованої нейромережі на її вхід подаються сім параметрів, а саме:
- показання з трьох датчиків (температури, вологості, СО2)
- положення регуляторів, що необхідно виставити (GT, Ln, VCO2), які вираховують за формулами [1];
- прогнозована врожайність (ідеальна), згідно встановлених градацій.
Експериментальні дані, обраховані за формулами математичної моделі, являють собою файл зі значеннями, розділеними комами, в якому кожен рядок відповідає одній вибірці. Урожайність було розділено на піддіапазони (з граничними значеннями діапазону від 0 до 1), в залежності від параметрів температури, вологості, вуглекислого газу: «погана» врожайність ( [0;0,25) ), врожайність «нижче середнього» ( [0,25;0,5) ), «середня» врожайність ( [0,5;0,75) ), врожайність «вище середнього» ( [0,75;1) ), «висока» врожайність – [1] .
Висновки. На основі моделі та оптимальних умов мікроклімату теплиці: температури, вологості, вмісту вуглекислого газу, - було розроблено структуру нейромережі та окреслено етапи реалізації методу навчання нейронної мережі.
Література:
1. М. М. Морозова, Застосування нейромережевих технологій при проєктуванні інтелектуальних систем контролю параметрів мікроклімату. / НАУКОВЕ МИСЛЕННЯ: Збірник статей учасників сорок першої всеукраїнської практично-пізнавальної інтернет-конференції «Наукова думка сучасності і майбутнього», (20 - 28 лютого 2021).– Видавництво НМ. – Дніпро, 2021. – 28с. – С. 6 – 9.
2. К. В. Воронцов, Математические методы обучения по прецедентам (теория обучения машин). [Електронний ресурс]. Режим доступу - http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf