Статьи

Открытый датасет от Overture Maps — почти 60 млн. POI по всему миру

2023-09-04 19:06 Полезные ресурсы Другое Выбор команды
Время прочтения: 3 минуты

Что такое Overture Maps Foundation

В прошлом году несколько крупных компаний (включая, например, TomTom и Microsoft) организовали фонд Overture Maps Foundation, чтобы создавать новые картографические продукты и иметь замену данным Google. В основе их сотрудничества — то, что глобальные геоданные в общем активе обойдутся дешевле, особенно если отчасти они основаны на открытых базах данных.
В июле 2023 года группа выпустила свой первый открытый набор картографических данных, доступный для любого разработчика. Датасет от Overture Maps Foundation – готовый продукт, который уже можно использовать в основе приложений, где нужны геоданные, и создавать сервисы, не зависящие от Google и Apple.
Релиз Overture 2023-07-26-alpha.0 включает четыре слоя с данными: POI, здания, транспортная сеть и административные границы. Эти слои с информацией из разных источников были проверены, объединены и представлены в схеме данных Overture Maps.

Что входит в датасет

  • Слой данных "Places" ("места"). Этот слой включает почти 60 млн. точек интереса (POI) по всему миру, впервые опубликованные под открытой лицензией. Хотя качество данных может быть под вопросом (и где-то не сравнится с OpenStreetMap*), здесь интересно их количество, а еще то, что они впервые публикуются открыто.
  • Слой "Здания" включает более 780 млн. зданий по всему миру. В его основе — несколько источников открытых данных, включая OpenStreetMap, набор AI-сгенерированных зданий от Microsoft и данные от Esri.
  • Слой транспортной инфраструктуры — это глобальная дорожная сеть на основе данных OpenStreetMap. Эти данные тоже были переработаны под формат Overture, который дает возможность добавить в будущем новую информацию, такую как ограничение скорости на дорогах или движение транспорта в реальном времени.
  • Данные об административных границах включают границы и названия регионов, переведенные на более чем 40 языков.
*После публикации датасета "Places" с POI в сообществе OSM не раз обсуждали их качество — можно ли вообще что-то делать с этими точками, и насколько им можно верить. Чтобы проверить это, разработчик Wille Marcel уже показал в мини-исследовании, что с данными можно работать, если отсортировать их по "показателю достоверности". К тому же в будущем Overture обещает улучшать, обновлять и расширять этот набор данных.
Лицензии для данных OMF:
  • места (POI) — CDLA Permissive v 2.0;
  • здания — ODbL;
  • транспорт — ODbL;
  • административные границы — CDLA Permissive v 2.0.

Доступ к данным Overture Maps

Изначальные данные Overture 2023-07-26-alpha.0 были доступны только в формате Parquet, который часто используется для big data. Инструкция по загрузке датасета размещена на GitHub, с детальными описаниями и примерами запросов, но все же такой формат был неудобным для большинства пользователей.
В апреле 2024 года данные стали доступны еще и через библиотеку Python, и пользоваться ими стало гораздо удобнее. Подробнее читайте в описании overturemaps-py, где есть пример простой загрузки данных OMF в формате GeoJSON одной строкой. Посмотреть на это в действии можно на красивом примере со страницы библиотеки Lonboard.
Разработчики могут использовать эту информацию для создания картографических приложений или сервисов, основанных на навигации. Все слои данных отформатированы в соответствии с недавно запущенной схемой данных OMF, которая предназначена для того, чтобы геоданные были в едином стандартном виде.
А если вы просто хотите посмотреть, что входит в датасет, создатели подготовили готовую интерактивную демо-карту:
Исходный датасет — это только начало; в будущем разработчикам фонда OMF предстоит уточнять и обновлять информацию в условиях постоянных изменений, чтобы соответствовать ожиданиям пользователей, а также добавлять больше данных, например, навигацию и трехмерные модели зданий. Overture планирует поддерживать базу данных точек интереса в актуальном состоянии и регулярно выпускать обновления.
Картографические данные необходимы для работы целого ряда гаджетов и приложений (сейчас без них не могут работать даже фитнес-браслеты), поэтому крупным компаниям оказалось выгодно не зависеть от Google и Apple, а объединиться и сделать общий продукт, попутно дополняя OpenStreetMap. Будем надеяться, что они продолжат идти по пути открытости и доступности данных.
Источники:
Материал подготовила Юлия Федорова
Текст обновлен 14.05.2024