Зміст допису
Вступ – тринадцятий онлайн-курс
Шановні друзі! Нещодавно я підготував для Вас огляди свого першого (An Introduction to Interactive Programming in Python) та другого (Model Thinking) онлайн-курсів, які завершив ще у 2013 році. На цей раз я вирішив зробити огляд не третього онлайн-курсу, а найновішого – тринадцятого. Справа в тому, що 29-го листопада я отримав черговий (свіженький 🙂 ) сертифікат про завершення онлайн-курсу – 13-тий загалом і 3-тій на Prometheus. На цей раз мова піде про короткий, але досить цікавий курс Аналіз даних та статистичне виведення на мові R.

Зауважу, що хоч це і третій мій курс на Prometheus, але раніше я вивчав україномовні адаптації гарвардського CS50 та курсу Як створити стартап Сема Альтмана – президента найвідомішого у світі венчурного фонду Y Combinator. Про них я також згодом напишу. Що ж стосується онлайн-курсу Аналіз даних та статистичне виведення на мові R, то це ексклюзивний курс, розроблений безпосереднього командою Prometheus за сприяння Міжнародного фонду «Відродження», Фонду розвитку аналітичних центрів (TTF) та за фінансової підтримки посольства Швеції в Україні.

Про викладача
Згідно з інформацією на сторінці курсу, Анастасія Корнілова є фахівцем з даних (Data Scientist), має загальний досвід в аналітиці даних 4 роки та загалом в IT – 9 років. Зі свого боку можу сказати, що Анастасія протягом курсу дійсно показала себе гарним фахівцем.
Тривалість та вартість курсу
На відміну від онлайн-курсів на Coursera, де вартість більшості сертифікатів вже сягнула $79, Prometheus продовжує видавати сертифікати безкоштовно. Бажаю команді Prometheus і далі успішно залучати спонсорські та меценатські ресурси, щоб якомога довше зберігати цю приємну особливість! А користувачам рекомендую не зволікати і не відкладати навчання на потім, адже на Coursera у 2013 році всі сертифікати також були безкоштовними. 😉
Щодо тривалості, то цей онлайн-курс триває всього 5 тижнів. А з огляду на те, що тижневий обсяг лекцій також відносно невеликий, цей курс добре підійде на роль першого онлайн-курсу. До речі, нагадаю, що як перший англомовний курс я рекомендував обрати курс Model Thinking, але там справа не у обсязі та тривалості, а у певній простоті та універсальності навчального матеріалу.
План курсу
У онлайн-курсі Аналіз даних та статистичне виведення на мові R розглядаються такі теми та поняття:
- Тиждень 1: аналіз даних, статистика, типи даних, центральна тенденція, візуальний аналіз даних, трактування результатів.
- Тиждень 2: коробчаста діаграма, інтерквартильний розмах, приклад використання візуального аналізу для очищення даних, дисперсія, середньоквадратичне відхилення, вступ до R.
- Тиждень 3: теорія ймовірності, ймовірність однієї події, ймовірність кількох подій, умовні ймовірності, дерева прийняття рішень, теорема Баєса, біноміальний розподіл, нормальний розподіл, Z-стандартизація, коваріація, кореляція, регресія.
- Тиждень 4: вивідна статистика, вибірка, принципи формування репрезентативної вибірки, центральна гранична теорема, довірчий інтервал для пропорції, рівень довіри, розмір вибірки, довірчий інтервал для середнього значення, покроковий план побудови довірчого інтервалу.
- Тиждень 5: тестування гіпотез, тестування гіпотез для середнього значення, p-value, статистична значущість, тестування гіпотез для пропорції, покроковий план тестування гіпотез.
Контрольні заходи
Для успішного завершення курсу та отримання сертифікату потрібно набрати 60% від загальної кількості балів. Для цього є такі можливості:
- Потрібно скласти п’ять тестів (в кінці кожного тижня), які складаються з 10 завдань. Дається 3 спроби, зараховується остання. Всі тести загалом складають 50% від загальної кількості балів курсу.
- В кінці тижнів 2-5 є чотири корисні лабораторні роботи, які виконуються на мові R. Всі лабораторні містять детальні та зрозумілі методичні вказівки. Як захист лабораторних робіт використовуються додаткові тести, кожний з яких містить 5 завдань (також дається 3 спроби, зараховується остання). Всі лабораторні роботи сумарно дають ще 40% загальної кількості балів курсу.
- В кінці курсу студентів чекає екзамен з 20 завдань (3 спроби, зараховується остання), який дає можливість заробити ще 10% балів.
Ось як цей розподіл балів виглядає у розділі “Прогрес”, де можна спостерігати за своєю оцінкою в процесі навчання:

Сертифікати
Через 7-10 днів після успішного завершення онлайн-курсу у профілі студента з’являється посилання на сертифікат:

Сертифікат гарний та стильний, як і інші сертифікати Prometheus. Мій виглядає так:

Помилки та неточності
Зауважу, що оскільки це перша ітерація курсу, то не варто дивуватись, що іноді можна натрапити на певні дрібні помилки та неточності. Але, я впевнений, що з часом вони будуть виправлені, оскільки в розділі “Обговорення” уважні студенти вже вказали на більшість з них. Це нормальна практика.
Особливості та поради
Наприкінці хочу відзначити деякі приємні та важливі особливості курсу:
- Дуже зручно, що у тестів та лабораторних робіт немає дедлайну. Можна без поспіху та зайвого напруження вивчати матеріал у власному темпі. Зауважу, що це зручна особливість всіх курсів, які я вивчав на Prometheus.
- У процесі навчання рекомендую не лише дивитись відеолекції, але й обов’язково переглядати PDF-файли конспектів лекцій та розділ “Література” для кращого розуміння та засвоєння матеріалу.
- До першої лабораторної роботи додається гарний конспект з викладенням основ мови R. Дуже рекомендую тим, хто ще не знайомий з R (не пропустіть цей файл).
- Колегам-викладачам раджу взяти даний онлайн-курс на озброєння. Він недовгий та має досить широке застосування, а тому підійде для рекомендування студентам широкого спектру спеціальностей. Наприклад, своїм студентам я вже пообіцяв додаткові бали за проходження цього курсу. Зауважу, що поки що не бачу у них великого ентузіазму – перемогти лінь завжди було непростим завданням 🙂 . Але я наполегливий та вигадливий – вже є нові ідеї інтегрування онлайн-курсів у традиційну викладацьку практику. 🙂
Висновок
На мою думку, Аналіз даних та статистичне виведення на мові R – цікавий та корисний онлайн-курс. Вітаю Анастасію та команду Prometheus з цим успіхом! 🙂 Окремо хочу відмітити заставку та “саундтрек” курсу – дуже професійні та стильні – респект авторам 🙂 .
Дякую, що дочитали! 🙂 Сподіваюсь, було корисно. Бажаю успіхів!