Ільченко Михайло Юхимович
доктор технічних наук, професор,
Національний технічний університет України
«Київський політехнічний інститут» ,
Україна, м.Київ
Цурін Олег Пилипович
кандидат технічних наук, доцент,
Національний технічний університет України
«Київський політехнічний інститут»,
Україна, м.Київ
Прасолов Андрій Павлович
магістр,
Національний технічний університет України
«Київський політехнічний інститут» ,
Україна, м.Київ
Анотація: У статті розглянуто питання розміщення наукових публікацій в Інтернеті. Розклануто систему, що парсит (моніторить) базу Google Scholar Університету і поновлює дані кожного науковця. Система дозволяє онлайн, офлайн та автоматично заповнювати базу Університету. Надано можливість продивитись рейтинги факультетів та кафедр у межах Університету та кафедр у межах факультетів . Показано можливість використання системи для декількох Університетів в межах однієї програмної реалізації.
Ключові слова: Наукові публікації в Інтернет, використання Google Scholar, база наукового закладу, парсинг бази Google Scholar, рейтинги факультетів та кафедр.
Актуальність: Упродовж останніх років послідовно набуває сили євроінтеграційний вектор державної політики України в сфері науки. У зв’язку з цим робляться кроки до впровадження кількісних та напівкількісних методів аналізу наукової активності не тільки наукових установ але й науковців. За таких умов актуальною стає потреба вибору джерел наукометричних даних для проведення оціночних досліджень на корпоративному та загальнодержавному рівнях. Існує декілька баз розміщення наукових публікацій
Передумови: З точки зору розміщення електронних версій наукових праць в InterNet та доступу користувачів до них можна виділити три види, які надано на мал. 1
Мал. 1 Види розміщення наукових праць
«Відкриті»
Очевидним недоліком відкритих систем є загальна невисока якість публікацій. Вони в основному не перевіряються і не рецензуються. Може бути значна кількість плагіату.
«Не видимі»
Можна продивитись за допомогою спеціальних систем. Орієнтовані на бібліографічні матеріали, мають відповідні поля, широкі можливості у пошуку інформації, Більшість з цих баз дозволяють оцінити ще 2 важлиуих параметри це цитованість та Н-індекс. Глобальні «невидимі бази» менш розповсюджені бо вимагають досить потужні ресурси і до таких баз відноситься Google Scholar . Це популярна міжнародна база, яка використовується у Вебометричних системах при побудові глобальних рейтингів, наприклад , такого як Webometrics ( http:// www.webometrics.info ).
Недоліком « Не видимих» баз є те, що вони спеціально не відбирають журнали чи конференції для включення робіт у цю базу і тому вважається, що якість робіт гірша ніж у Scopus чи Web of Sience.
«Закриті» бази вимагають логіни та паролі для входження. Найбільш відомими закритими базами є Scopus (Elsevier), Web of Science. Їх основний сервіс- пошук наукових статей у базах відповідних систем та оцінка індекса цитувань.
Scopus є найбільшою мультидисциплінарною реферативною базою даних наукових публікацій (з посиланнями на повні тексти публікацій). Scopus містить посилання на повні тексти понад 28 млн. статей більше 4 тис. видавництв з усього світу, контент щодня оновлюється. Scopus дозволяє проводити пошук по більш ніж 15 тис. наукових видань, найбільш авторитетних в науковому середовищі. Scopus веде підрахунок цитувань авторів наукових публікацій з 1960 року. Оцінюється також і Н-і Індекс.SCOPUS є платна база і потрапити туди журналам досить складно.
Цей аналіз показує, що для Університетів України слід звернути увагу на Google Scholar. Глобальна пошукова платформа Google Scholar, зокрема її апарат підрахунку наукової цитованості, спеціалізується на індексації наукових публікацій не лише онлайнових, а і друкованих науково-інформаційних продуктів (статей, монографій, препринтів, звітів та інших академічних матеріалів). Набір вимог для індексування у Google Scholar нескладний і надається у відкритому доступі. Реєстрація науковців досить проста, знаходиться у відкритому доступі і вимагає заповнення таких позицій як приналежність (Affiliation) науковця. Приналежність задається двома даними - назвою установи зареєстрованою Google Академією та Електронною поштою відповідного наукового закладу. Це дозволяє Google Scholar створити профілі відповідних наукових установ. Ці профілі є своєрідним звітом наукової спільноти суспільству про результати наукових напрацювань Університетів. При цьому Google Scholar рейтингує науковців кожного Університету по параметру цитованості і це використовується як для створення рейтингу університетів у Google Scholar [1] , так і при обліку рейтингу у популярній системі Webometrics (параметр прозорість). Для оцінки кожного університету по цитованості береться сума значень цього параметру у перших 10 науковців.
Google Scholar з’явився пізніше ніж Scopus та Web of Science, але її відкритість, гнучкість та популярність дозволила наздогнати ці популярні бренди. У порівнянні з іншими безкоштовними і платними сервісами Google Академія опирається на більшу базу даних наукових журналів у більшій кількості мов. Тому Google Академія часто знаходить більше цитувань
Таким чином передумови можуть бути наступними
1. Можливість у Google Scholar створення кабінетів науковців із визначенням приналежності до певної наукової установи (Університету);
2. Виконане Google Scholar рейтингування науковців кожного Університету по його цитованості;
3. Наявність в Університетах списків науковців з визначенням підрозділів в яких вони працюють;
4. Наявність мов програмування та засобів створення Веб додатків із забезпеченням зручного інтерйфейсу
Мета:
1. Необхідність оцінки наукового рівня як Університет в порівнянні з іншими, так і підрозділів Університету (інститутів, факультетів, кафедр);
2. Рейтингування Університетів у межах країни, Факультетів та інститутів у межах Університету, кафедр у межах факультетів (інститутів);
3. Виконання програмної реалізації у виді Веб додатку зі зруним Веб інтерфейсом;
4. При реалізації виконати умови створення аналогічних систем для інших Університетів.
Методи: Побудова online системи з Web інтерфейсом, online та offline заповнення даних співробітників Університету, парсинг даних бази Google Scholar.
Результати: Фактично кожний Університет має свій ІР та ID (ідентифікаційний код) свого профілю. Покрокова інструкція створення особистого кабінету та його заповнення, що розроблено авторами статті, надано за адресою: http://phone.kpi.ua/schol База Google Scholar досить зручна для кирилично мовних прізвищ. По вказаному автором приналежності до наукового закладу Google Scholar робить рейтингову таблицю по цитованості цього закладу. Так для КПІ ім. Ігоря Сікорського адреса бази наступна: https://scholar.google.com.ua/citations?view_op=view_org&hl=uk&org=5596117057032671997 База надає можливість зробити порівняння науковців по цитованості. Важливість таких порівнянь розглянуто у роботі [1].
Відомі рішення та їх недоліки У Google Scholar кожний науковець може створити свій робочий кабінет зі списком робіт, що є у Google Scholar, і Google Scholar автоматично підраховує цитованість (бібліографічні посилання) та Н-індекс. Не вистачає даних про присутність автора у базі Google Scholar, що є потенційною можливістю автора і параметр «Присутність» є у такій відомій системі як SCOPUS. Для отримання цього параметру треба рахувати кількість робіт, що надано у кожного автора. База наукової організації надається в послідовності зменшення бібліографічних посилань. Перше, що треба відзначити, це відсутність пошуку у цій базі (надано пошук через Google) і друге, це вивід на сторінку N записаних у базу науковців (при загальній кількості більше 2000, як це є у КПІ ім..Ігоря Сікорського) пошук стає досить трудомістко задачею. Якщо Університет достатньо великий і має внутрішню структуру, наприклад, факультети та кафедри на факультетах, то виникає задача рейтингування підрозділів. Прибирання цих недоліків було покладено в основу системи, що розроблено в КПІ ім. Ігоря Сікорського
Функції системи
1. Система надає можливість online введення даних науковцем при наявності у нього відповідного логіну та паролю чи адміністратору, який може вводити дані декількох науковців, що підготовлено у форматі CSV;
2. Система парсит (переглядає) базу Google Scholar і підраховує кількість робіт, та переписує кількість цитувань та Н-індекс, що є у кожного автора. Необхідно це тому, що дані у базі Google Scholar періодично змінюються і ця функція дозволяє оперативно (автоматично) поновлювати дані кожного науковця.
3. В системі реалізовано пошук інформації про авторів по: прізвищу, імені та по ID. У таблиці надаються отримані дані, а по «посиланню» можна перейти до кабінету відповідного автора.
Якщо є декілька даних, то можна отримувати суму по стовпчикам натиснувши клавішу «Всього» . Дані можна видати у вигляді CSV файлів, натиснувши клавішу «Вивантажити таблицю»
4. Можна продивитись дані по співробітникам кафедр та факультетів;
5. Після збирання 90% інформації через парсінг дані переписуютья у базу даних системи. Формат запису «Прізвище», «Факультет», «Кафедра», «Присутність», «Цитованість», «Н-індекс»
6. Для аналізу роботи факультетів (інститутів) надана можливість продивитись і порівняти їх гістограми, як це показано на мал.2
Мал. 2 Скріншот порівняльної гістограми факультетів
7. Надано можливість аналізу даних по кафедрам , що входять до відповідного факультету (інституту)
Реалізація Систему реалізовано на мові програмування РНР (парсинг та робота з базою даних), JS (сортування таблиць), JS бібліотека Google Charts (побудова гістограм), база даних MySQL . Виконано НВО КПІ-Телеком у вигляді Веб сайта з відкритим доступом за адресою : http://telef.kpi.ua з переходом до КПІ ім. Ігоря Сікорського
При наданні даних в Excel у форматі <Ім’я>< прізвище>< скорочена назва факультету>< скорочена назва кафедри ><цитованість>< Н-індекс> та <ІD>, зберіганні у форматі .csv і завантажені їх у базу MySQL у.систему можна використовувати і для інших університетів. Так як видно за адресою http://telef.kpi.ua надано аналогічну систему для Чернівецького державного університету. Як і при організації обслуговування у CLOUD це є зручним як для замовника, так і для виконавця. Зважаючи на невеликі обсяги інформації фінансові розрахунки не розглядаються.
Висновки: Можуть бути сформульовані наступні висновки;
1. Веб додаток дозволяє оцінити науковий потенціал не тільки співробітників, але й підрозділів;
2. Порівняти підрозділи і в наглядному виді зробити рейтингування у вигляді гістограм;
3. Розроблене програмне забезпечення дозволяє без додаткового налаштування використовуватися іншими Університетами (це перевірено для Чернівецького національного університету);
4. При включенні у додаток інших університетів доцільно використовувати технологію обслуговування прийняту у Клауд, коли передаються дані, а програмне забезпечення знаходиться у центрі обслуговування. Це значно скорочує витрати університетів.
Література:
1. Цурін О.П. Інструментальні засоби супроводження конференцій з Web-інтерфейсом/О.П.Цурін// Технологія і техніка друкарства. — 2014. — № 2(44). — С. 73-78.