Машинное обучение для работы с геоданными

Machine learning для гео-специалистов на понятном языке
Старт: 17 ноября
Следующий запуск в 2025
Сможете претендовать на позицию ГИС-аналитика
Научитесь решать геопространственные задачи с помощью машинного обучения в Python
Освоите навыки построения и обучения современных ML моделей
Набор закрыт
Оставьте свой e-mail, и мы направим вам приглашение, когда определим даты следующего набора
Вам подойдет курс, если
  • Знаете базовый синтаксис Python
  • Математика вас не пугает
  • Хотите понимать разницу между моделями машинного обучения
  • Хотите уметь подбирать и обучать модель под свои задачи
Что изменится после курса?
  • Сможете правильно сформулировать задачу и выбрать подходящую модель. Когда у вас появляется задача детектировать дороги на снимках или предсказать заболачивания участка, машинное обучение становится одним из самых эффективных решений. Но в ML существует огромное количество инструментов, с которыми нужно уметь правильно работать, а иногда ML и вовсе неуместно применять. Именно разумному применению ML в различных задачах и посвящен курс
  • Получите практические навыки программирования для решения прикладных задач. Мы не будем погружаться в математические доказательства, большие выводы, теоремы и строгие формулировки. Изучаем самую важную теорию и смотрим ее прикладное использование на реальных задачах. Например, узнаем, что, иногда, для классификации подстилающей поверхности на спутниковом снимке достаточно применить алгоритм кластеризации
  • Научитесь обучать модели машинного обучения и применять их в конкретных задачах на языке программирования Python
  • Добавите к знакомым библиотекам новые: pytorch, xgboost, sklearn, catboost. В любом data science проекте будет фигурировать хотя бы одна из них
Проверка знаний
Проверьте свои знания Python на двух задачках от нашего эксперта.

Если у вас получилось решить задачки, то можете смело записываться на этот курс.

Если нет, то рекомендуем сначала пройти наш курс "Введение в Python: основы синтаксиса" и дополнительно познакомиться с библиотеками numpy и matplotlib
Ок, зачем мне вообще изучать Machine Learning?
Machine learning или машинное обучение нужно изучать, чтобы анализировать большие объемы пространственных данных и находить скрытые закономерности, которые сложно выявить вручную. ML появляется в решениях, когда вам нужно обнаружить, предсказать, выделить или сегментировать что угодно.

Машинное обучение помогает улучшить точность прогнозов, например:
  • при моделировании изменений климата
  • при мониторинге природных катастроф
  • при прогнозировании движения транспорта

Освоив машинное обучение, гео-специалист сможет эффективнее работать с данными дистанционного зондирования: автоматически классифицировать типы ландшафта или детектировать оползни; с временными рядами: предсказание температуры воздуха, влажности; и табличными данными: прогноз урожайности поля или вероятности пожара.
Эти навыки действительно требуются в работе геоспециалиста?
Да! Хоть эти навыки еще не являются стандартом в нашей области, машинное обучение используется повсеместно. Например, его применяют для предсказания вероятности наводнений, засух, изменения землепользования.

Специалисты ГИС все чаще работают с ДЗЗ (спутниковыми и беспилотными снимками), и использование методов машинного обучения позволяет автоматизировать процесс, например, классификации ландшафтов, оценки лесных массивов, мониторинга состояния сельскохозяйственных угодий, детектирования зданий, озер и многого другого.
Программа
6 недель, 1 занятие в неделю
1
Первая неделя
На этой неделе у вас появится понимание типов и примеров задач, которые решает машинное обучение (Machine Learning - ML), и вы научитесь классифицировать геопространственную задачу как один из типов задач машинного обучения

Пройдете общую идею ML, разницу обучения с учителем и без учителя, классификации, регрессию, кластеризацию. Узнаете, что такое понижение размерности, признаки, целевые переменные и какие бывают ошибки


2
Вторая неделя
На второй неделе вы узнаете типы данных, с которыми работает ML, и основные принципы их предобработки

Изучите категориальные, десятичные и целочисленные переменные, табличные данные. Узнаете, что такое нормализация и стандартизация данных, пропуски, one-hot encoding. Научитесь выделять обучающую и тестовую выборки и делать кросс-валидацию
3
Третья неделя
На третьей неделе вы узнаете, в чем отличие между k-Means и DBCScan. Поймете зачем нужно понижение размерности, и что оно из себя представляет

Посмотрите на примеры задач, метрики расстояния и алгоритмы k-Means, DBScan, PCA
4
Четвертая неделя
На этой неделе вы изучите, что такое линейная и логистическая регрессия, узнаете основные метрики для решения задач регрессии и классификации

Разберете линейную и логистическую регрессию, узнаете потери классификации и регрессии, что такое оптимизация, градиентный спуск и метрики производительности (R2, F1, точность, полнота)
5
Пятая неделя
На пятой неделе вы узнаете, что такое искусственная нейронная сеть (ИНС) и как реализовать ее в pytorch

Разберете, что такое нейроны, перцептрон, функции активации, оптимизацию, градиентный спуск, обратное распространение ошибки и само обучение
6
Шестая неделя
На этой неделе вы поймете основную идею модели дерева решения (регрессионного дерева), узнаете отличия между случайным лесом и бустингом

Изучите деревья классификации, деревья регрессии, энтропию, критерий Джини, случайный лес, бэггинг, бустинг
Пример практической задачи с курса:
В этой домашней работе вам потребуется адаптировать нейронную сеть, которую мы построили к задаче классификации с использованием библиотеки pytorch.

В этот раз возьмем классный датасет с Kaggle Satellite Image Classification. Оригинальный датасет содержит четыре класса:
- cloudy (облачность)
- desert (пустыня)
- green_area (зеленая территория)
- water (вода)

Оценить качество вашей модели необходимо с помощью метрики Accuracy (отношение числа корректных предсказаний к числу всех предсказаниям).

К концу пятой-шестой недели курса вы уже сможете делать самостоятельно такие задачи
Как проходят занятия?
Объем
6 недель, 12 часов: 6 онлайн-семинаров по 1,5 часа на платформе Контур.Толк
Группа
до 15 человек
Формат
живые онлайн-семинары с экспертом, домашними заданиями и маленькими тестами
Время
занятия по воскресеньям, первая встреча в 20:00, остальные в 17:00 по МСК
Обратная связь
чат с экспертом, проверка домашних заданий
После курса у вас останется доступ:
  • к записям встреч — на год с начала курса
  • к обратной связи от эксперта в телеграм-чате — в течение месяца после завершения курса
  • к телеграм-чату — навсегда
Расписание следующего запуска:
Старт занятий 17 ноября 2024 года


Занятия по воскресеньям: 17 ноября в 20:00 по МСК, 24 ноября и 1, 7, 15, 22 декабря в 17:00 по МСК

Курс рассчитан на 6 недель

Курс разработан экспертом

Алексей Розанов
Преподаватель курса по ML
Когда меня спрашивают, чем я занимаюсь, то отвечаю Geo Data Science. По сути дела, это комбинация навыков программирования и машинного обучения (нейросетей и т.д.) для решения любых геопространственных задач.

Мой опыт складывается из научной части, где я занимаюсь оценкой потоков углерода с помощью спутниковых данных и ML, и частных проектов, где я помогаю решать широкий ряд задач от детектирования пожаров до предсказания урожайности. У меня есть степень магистра в Больших данных и машинном обучении из Университета ИТМО, и сейчас я занимаюсь научными исследованиями в области GeoAI
Чтобы получить сертификат, нужно выполнить 5 из 6 домашних заданий в срок

Машинное обучение для работы с геоданными

р.
р.
На этом курсе вы научитесь правильно определять задачу обучения и ее тип, подбирать и реализовывать подходящий алгоритм машинного обучения для работы с пространственными данными по вашей конкретной задаче. Вы изучите регрессию, кластеризацию и деревья решений, а также научитесь использовать библиотеки PyTorch и Scikit-learn для обучения и применения созданных моделей машинного обучения. Эти навыки можно будет применять для таких задач, как детектирование пожаров, водных объектов, классификации растительности или предсказания климатических изменений.

В стоимость курса входит: все живые онлайн-семинары, проверка домашних заданий и обратная связь. Всего шесть онлайн вебинаров с экспертом по воскресеньям. Все встречи записываются, записи доступны в течение года с начала занятий.

Курс начинается 17 ноября 2024 года.

Занятия по воскресеньям: 17 ноября в 20:00 по МСК, 24 ноября и 1, 7, 15, 22 декабря в 17:00 по МСК
Кроме 7 декабря - это занятие пройдет в субботу вместо воскресенья


Набор закрыт
Оставьте свой e-mail, и мы направим вам приглашение, когда определим даты следующего набора

Курс может оплатить ваш работодатель, вы сами через свою компанию или ИП

Оставьте заявку и мы свяжемся с вами

А что если есть конкретная задача?
Так бывает, что вы ищете ответ на конкретный вопрос или решение одной задачи, а находите целый курс.

Если вы считаете, что в курсе много информации, которую вы и так знаете или она не кажется нужной, то зовем вас записаться на индивидуальную консультацию.

Под ваш вопрос мы подберем специалиста, и вы с ним разберете вашу задачку за один или несколько часов, в зависимости от сложности и вашего желания.
Остались вопросы?