Біля 100 команд з Вінницького національного технічного університету взяли участь у конкурсах зі штучного інтелекту, системного аналізу та передбачення на базі платформи Kaggle (від Google) протягом 2018-2019 навчального року за участі чи під керівництвом викладачів кафедри системного аналізу, комп’ютерного моніторингу та інженерної графіки (САКМІГ). Вже отримано 37 медалей, у т.ч. 7 (1 «золота» і 6 «бронзових») за перемоги в змаганнях і 30 за участь у професійних дискусіях (1 «золота», 4 «срібні» і 25 «бронзових»). Ще у зоні призових місць різних змагань перебувають 24 студенти з 19 команд (можливі 1 «золота», 7 «срібних» і 16 «бронзових»), але ті конкурси ще тривають (https://www.kaggle.com/competitions).
4 команди були створені викладачами і аспірантами секції системного аналізу та ІТ (САІТ) кафедри САКМІГ. За перемогу у змаганні «золоту» медаль отримав член групи забезпечення і проектної групи спеціальності 124 «Системний аналіз» професор Олександр Мокін (Oleksandr Mokin). А я (завідувач кафедри САКМІГ, професор Віталій Мокін) отримав «бронзову» медаль.
Усі інші 92 команди (назви їх усіх: "SAIT VNTU" або "VNTU_SAIT" і далі номер чи код команди) – студентські, тренером яких є я, створені у межах вивчення дисциплін таких спеціальностей та освітніх програм:
- 126 «Інформаційні системи та технології» (освітня програма «Прикладні ІТ» у бакалавраті, 2 курс та «ІТ аналізу даних та зображень» у магістратурі, 1 курс) дисципліна «ІТ моніторингу та аналізу даних» - 6 команд (83% посідають призові місця, вже є 2 медалі);
- 124 «Системний аналіз» (освітня програма «Системний аналіз»), дисципліни «Основи системного аналізу», 3 курс та «ІТ моніторингу та аналізу стану складних систем», 2 курс - 28 команд (50% посідають призові місця, вже є 1 медаль);
- 122 «Комп’ютерні науки та ІТ» (освітня програма кафедри АІІТ ФКСА, сучасна назва якої "Інтелектуальні інформаційні системи" спеціальності 126 "Інформаційні системи та технології", та ін.)
В усіх цих дисциплінах викладались змістові модулі, присвячені сучасним технологіям аналізу і передбачення даних методами машинного навчання (Machine Learning), основам мови програмування Python 3 (це – основна мова програм на Kaggle) та бібліотек sklearn, pandas, numpy, matplotlib, seaborn, роботі з деревами рішень (xgboost, lightgbm), нейронними мережами тощо, викладались сучасні методи системного аналізу, виділення ознак (features selection), методи кластеризації, статистичного аналізу, глибинного навчання (Deep Learning), у т.ч. згорткові і рекурентні нейронні мережі, бібліотеки keras, tensorflow та ін.
На власному досвіді участі у змаганнях Kaggle з вересня по даний час я демонстрував прийоми розв’язання задач та найбільш ефективної роботи з платформою Kaggle. Для старту команд видав свій код-стартер, з яким можна було завантажити базове рішення у різні конкурси і дав поради, що зробити, щоб піднятись в рейтингу. Усі лекції проводились з використанням мультимедійного проектору. Робота багатьох програм демонструвалась одразу в реальному режимі часу (пакет Anaconda Python). Усі розробки і поради у вигляді презентацій були доступні студентам через веб-систему організації навчального процесу JetIQ. У ній же були створені комп’ютерні тести (2 колоквіуми та іспит з програмованими на PHP завданнями – про це буде ще окремий пост) для закріплення отриманих знань.
Конкурси Kaggle, де брали участь студенти, стосувались різної тематики – і передбачення зараження комп’ютерів вірусами (конкурс від Microsoft з десятками даних про біля 17 млн. комп’ютерів), і прогнозування транзакцій в Інтернет-магазинах Google (GStore) та, окремо, в банку Santander, і прогнозування цін на житло, і автоматичне розпізнавання та класифікація образів, і передбачення прибутків від американських фільмів, і прогнозування землетрусів, і передбачення загибелі пасажирів Титаніка, в залежності від статі, класу каюти та ін., і розпізнавання цифр відомого датасету MNIST, і передбачення вартості поїздок на таксі в Нью-Йорку – мільйони даних, сотні тисяч зображень, сотні спроб учасників, місяці роботи, саме це дозволяє відточити справжні знання та навички в ІТ!
Приємно, що 16 членів команд підняли категорію з 5-ї («новачок») до 4-ї («учасник»), 7 осіб виконали половину вимог на 3-ю категорію («експерт»).
Періодично відома у сфері технологій штучного інтелекту та машинного навчання Ізраїльська ІТ-компанія NestLogic (з філією у Вінниці) (директор - David Groozman) проводить конкурс найбільш оригінальних рішень учасників Kaggle-змагань і їх переможці отримують цінні призи (комп’ютерну техніку чи її комплектуючі). Вже двічі були проведені такі конкурси. Призи отримали викладачі, аспіранти та студенти ФКСА (доц. Andrey Yascholt, асп. сп-ті 124 Misha Dratovany, ст-ти сп-ті 124 Лотоцький А., Лебухорський А. та Клішин І.) та ФІТКІ (ст-ти сп-ті 122 Vladislav Girdvainis та Dariia Zelinska).
Звичайно, значні успіхи студентів пов’язані зі стимулюванням – в усіх дисциплінах Мокіна В.Б. давались бали за появу в рейтингу Kaggle у складі команди, за отриману медаль за змагання, за отриману медаль за активну участь у змістовній дискусії з демонструванням отриманих у дисципліні знань, за набуття статусу «учасник», найбільші бали давались за презентоване належним чином своє оригінальне рішення у Kaggle – все це було передбачено у робочих навчальних програмах дисциплін, затверджених Методрадою ВНТУ.
Найбільш варто відмітити таких студентів: Andriy Bogachuk (сп-ть 126, 2 курс, ОПП «Прикладні ІТ») – 7 конкурсів, «бронза» за змагання, «бронза» за дискусії, у конкурсах, що ще тривають, претендує на «золото», посідаючи 3-тє з 5126 місць (див. скан), на 2 «срібла» і 1 «бронзу». А також Андрій Лотоцький (сп-ть 124, ОПП «СА», 3 курс) – 5 конкурсів, «бронза» за змагання, «бронза» за дискусії, у конкурсах, що ще тривають, претендує на 1 «срібло» і 1 «бронзу».
У ряді світових фірм у сфері штучного інтелекту та Data Science зі статусом «Майстер» (категорія 2) або «Гросмейстер» ( «Грандмайстер») (категорія 1) одразу беруть на високооплачувану роботу, в інших – це підстава для підняття рівня, посади, оплати чи просто для проведення співбесіди для прийняття на роботу. За умов сучасного висококонкурентного ринку участь в рейтингу та різні здобутки прикрасять будь-яке резюме під час співбесіди в ІТ-фірмі, особливо, якщо учасники цих команд продовжуватимуть розвивати набуті знання та навички.
Kaggle-орієнтований комплекс знань та навичок мною викладався вперше, але на спеціальності 122 і востаннє. З наступного навчального року Kaggle-орієнтовані дисципліни будуть зосереджені на кафедрі САКМІГ тільки для студентів спеціальностей 124 «Системний аналіз» (бакалавр) та 126 «Інформаційні системи та технології» (освітня програма «Прикладні ІТ» у бакалавраті і «ІТ аналізу даних та зображень» у магістратурі). Планується створити ряд команд із найбільш активних учасників і поборотись за місця конкурсів з великими грошовими преміями (від $1 000 до $500 000), тим більше, що компанія NestLogic надала доступ для вирішення таких задач до одного зі своїх потужних серверів.
Також, планується створення команд серед учнів шкіл. Це планувалось раніше, але співпало в часі з фінальними турами олімпіад з фізики, математики та інформатики у школах, а потім з сесією на 3-му курсі. За домовленістю з керівництвом провідних шкіл Вінниці, планується провести ознайомлювальні лекції про Kaggle та штучний інтелект і машинне навчання у травні, відібрати бажаючих до гуртка «Технології аналізу даних» (керівник – Мокін В.Б.) і потім з ними сформувати команди для участі в Kaggle. А в ідеалі, що найбільш цікаво теперішнім 10-класникам, в наступному році подати роботу на конкурс Малої академії наук України, перемога на якому дає додаткові бали під час вступу у ЗВО.
Навину взято із сайту кафедри САКМІГ.