Время прочтения: 6 минут
Несколько месяцев назад в гео-сообществе обсуждали и репостили статью Артёма Кушлевича на Хабре про муниципальные округа — лонгрид о том, как лаборатория «СберИндекс» сделала датасет с границами муниципалитетов и историей их изменения. В статье подробно описан процесс и подводные камни работы с данными о муниципальных округах, а на сайте лаборатории выложен открытый итоговый датасет с лицензией CC BY-SA. Такая информация может помочь аналитикам, которые работают с Базой данных показателей муниципальных образований Росстата, или иначе используют данные о муниципалитетах.
Когда мы обсуждали эту статью в команде, наш менеджер Света сказала, что у нее есть контакт с Артёмом. Так мы договорилась на интервью, чтобы узнать о жизни геоаналитика в дата-аналитической лаборатории «СберИндекс». И спросить, как найти работу с такими же интересными задачами.
— Что такое «СберИндекс» и чем он занимается?
«СберИндекс» — лаборатория, ориентированная на исследования и data-продукты, которые помогают лучше понимать социально-экономические процессы в стране, на отдельных территориях и в отдельных отраслях. При этом используется множество данных из платежных систем, но обезличенных и агрегированных.
Для принятия решений в бизнесе и государстве часто важна оперативность, но официальная статистика не всегда может ответить на этот вызов. Для решения наших задач редко подходят «алгоритмы из коробки», каждый проект — отдельное исследование.
— Какая у тебя должность? Какие задачи решаешь по работе?
Должность — аналитик, но выполняю геоаналитические задачи. Важный трек работы нашей Лаборатории — создать стандартизированную статистику на муниципальном уровне на основе транзакционных данных Сбера. Для этого я разработал и создал версионный справочник муниципальных образований, о котором можно почитать в статье на Хабре. Сейчас работаю над несколькими научно-исследовательскими проектами (межмуниципальные связи и кластеризация муниципалитетов по социально-экономическому развитию).
Еще я разрабатываю геофичи на различных уровнях, которые учитываются в других моделях Лаборатории. Параллельно сформировал несколько скриптов для быстрой картографической визуализации данных на муниципальном и региональном уровне (на основе библиотеки folium), в том числе bivariate choropleth.
— Какие навыки используешь по работе? Какие навыки считаешь важными для аналитика?
На первом месте — высокие навыки программирования и работа с пространственными файлами. Знание источников данных для работы с регионами и муниципалитетами нашей страны и понимание как происходит сбор и предобработка статистики Росстата также не на последнем месте. Еще навыки картографической визуализации, автоматизация отрисовки карт. И понимание пространства и специфики регионов, муниципалитетов и городов.
— Что сейчас считаешь самым актуальным, без чего не обойтись в хорошем резюме?
Думаю, опыт работы. Можно пытаться сочетать учебу на последних курсах вуза со стажировками и с part-time работой, чтобы по окончании обучения у вас уже было резюме, которое может заинтересовать работодателя. Специализированные же навыки зависят от того, какое направление вы выберете. Везде точно будут необходимы владение языками программирования и базовым статистическим анализом.
— Чем интересна твоя работа?
Интересна тем, что она по специальности, а задачи – исследовательские и соответствуют времени. Мы сейчас в мейнстриме стандартизации статистики и формирования новых статистических рядов на уровне, который был всегда труден для анализа — на муниципальном. Все то, что мы делаем в Лаборатории, уже сейчас и особенно в будущем поможет исследователям лучше понимать, что происходит в российском пространстве, выявлять шоки и их влияние на отдельные территориальные единицы. Поэтому мне интересно помогать «СберИндексу» становиться лучше.
— Видишь ли рост для себя на этой специальности?
Для меня сейчас на первом месте повышение навыков, чтобы можно было претендовать на повышение или на работу в других областях (к примеру, переход с folium на javascript). Возможность роста бесспорно существует, в большом количестве компаний есть геоаналитические отделы, где соответственно есть и потребность в нас.
— Как такая компания как Сбер использует геоданные? Зачем ей геоспециалисты?
Пространство нашей страны чрезвычайно неоднородно. Велики центр-периферийные различия, сильно разнится стоимость жизни, различная социально-демографическая ситуация в городах накладывает свои особенности на деятельность Сбера в каждом регионе. Сбер учитывает эту дифференциацию, поэтому пространственная аналитика пронизывает многие сферы деятельности бизнеса.
Люди, получившие географическое образование, отлично понимают пространство, поэтому мы можем найти себя в различных отраслях деятельности, в том числе в банковской среде.
— Трудно было попасть на текущую вакансию?
Когда наступило понимание, что необходимо менять работу, я решил поменять и профиль (ранее я работал в государственных учреждениях, связанных с территориальным планированием и городским управлением). Друг-экономист прислал вакансию от Сбера с сайта EMCR — это платформа в большей степени с финансовыми, бизнес и банковскими вакансиями, поэтому встретить там вакансию, подходящую моему профилю, было неожиданно.
У меня как раз стартовал двухнедельный отпуск, нашлось время осмыслить мой дальнейший жизненный путь и проходить собеседования, поэтому в первый же день я отправил резюме и почти сразу же получил приглашение на первое собеседование. Оно длилось менее часа, но было насыщенным вопросами по моему предыдущему опыту, моим навыкам в анализе векторных и растровых данных. На некоторые вопросы об опыте я давал отрицательные ответы — к примеру, я ранее не работал со spark (фреймворк для распределенной работы с большим объемом данных). При этом транзакционные данные, с которыми мне бы предстояло работать, не могли бы быть эффективно обработаны и проанализированы с использованием обычного python.
Меня принимали на позицию «геоаналитик». В требованиях к вакансии указывались необходимость разбираться в ГИС, наличия базовых навыков программирования и обработки данных, пространственной аналитики. Также указывалось владение статистическим анализом, но под вторую часть требований я подходил меньше — со статистикой были трудности, но я все равно собирался наверстывать это дополнительным обучением.
Тестовое задание было на обработку статистических данных, я постарался сделать его максимально скрупулезно и тщательно, думаю, это сыграло роль в дальнейшем моем приглашении на второе, уже очное собеседование, так как первым заданием на должности было создание справочника муниципальных образований, о котором я упомянул ранее и где перфекционизм был необходим.

— Видишь ли ты рост для геоспециалистов в крупных компаниях РФ?
Было бы неправдоподобно ожидать обратное. Мир так быстро меняется, например, продуктовые сети, отраслевые сетевые магазины, маркетплейсы — все столкнулись с реструктуризацией спроса и необходимостью ускоренного развития сервисов доставки начиная с Covid-2019 и после, поэтому они же и заинтересованы в геоаналитиках, которые могли бы им повысить оптимальность их работы через анализ потребительского спроса в существующих и перспективных локациях и снизить издержки на работу всего комплекса.
— Гео-сфера вообще жива?
Бесспорно жива. География — мультидисциплинарная наука, которая сочетает в себе множество других (практически во всех науках, будь то физика, химия, биология есть свои пространственные закономерности), поэтому географы по образованию достаточно востребованы в различных государственных и коммерческих учреждениях.
— Что ты считаешь главными трудностями геоспециалиста в наше время?
Поиск и обработка пространственных данных. Чтобы работать с муниципальной статистикой, нужно предварительно долго и упорно ее предобрабатывать и сводить воедино. При этом адекватной государственной платформы в России, предоставляющей статистику на этом уровне не существует. БДПМО — неструктурированная база данных. Но всем экономико и социо-географам, заинтересованным во внутрирегиональной дифференциации, приходится с ней работать, так как альтернатив нет и пока не предвидится.
Вторая часть проблемы — непосредственно пространственные данные. Многие базы данных теперь оказываются закрытыми (пример — пространственные слои института Карпинского). Национальная система пространственных данных пока в стадии наполнения, а получение информации из нее осложнено трудностями, в том числе в связи с реструктуризацией в конце 2024 года: протокол wfs стал более недоступен…
Слежу за постами в ТГ-канале Ивана Бегтина и, непринужденно сравнивая с зарубежными кейсами, приходится признать, что статистика и базы данных в нашей стране требуют качественного улучшения. Уже сейчас можно заметить некоторые сдвиги в лучшую сторону, но темпы изменений заставляют создавать собственные решения. Пример — работы «СберИндекса» в части стандартизованной муниципальной статистики.
— Что посоветуешь тем, кто хочет работать с такими же задачами, как и ты?
Постоянно развивать свои навыки пространственной аналитики и программирования — в современном мире без них никуда. Также можно выбрать смежное направление в других отраслях, например, пространственная экономика, визуализация пространственных данных (в том числе веб-картографирование), отраслевая бизнес-аналитика и геомаркетинг и т.д.). Чтобы иметь конкурентное преимущество перед другими кандидатами в нашем быстро меняющемся мире, насыщенным новыми возможностями, как мне кажется, необходимо всегда находить время для повышения квалификации и самообразования.
Если говорить о процессе обучения, то не нужно бояться писать качественные большие научные статьи и применять современные методы анализа данных. Но здесь я говорю через призму собственного образования, и мне сложно избавиться от субъективизма — сейчас пришло понимание, что хотелось бы большего в научно-исследовательской среде.
Над текстом работали Светлана Першуткина и Юлия Федорова. Спасибо Артёму Кушлевичу за время, которое он выделил, чтобы пообщаться с командой Картетики!