Статьи

Новый открытый датасет от Overture Maps — почти 60 млн. POI по всему миру

Полезные ресурсы Другое Выбор команды
Время прочтения: 3 минуты
В прошлом году несколько крупных компаний (включая, например, TomTom и Microsoft) организовали фонд Overture Maps Foundation, чтобы создавать новые картографические продукты и иметь замену данным Google. В основе их сотрудничества — то, что глобальные геоданные в общем активе обойдутся дешевле, особенно если отчасти они основаны на открытых базах данных.
В июле 2023 года группа выпустила свой первый открытый набор картографических данных, доступный для любого разработчика. Новый датасет от Overture Maps Foundation – готовый продукт, который уже можно использовать в основе приложений, где нужны геоданные, и создавать сервисы, не зависящие от Google и Apple.
Датасет от Overture включает почти 60 млн. точек интереса по всему миру. Источник: Overture Maps Foundation.
Релиз Overture 2023-07-26-alpha.0 включает четыре слоя с данными: POI, здания, транспортная сеть и административные границы. Эти слои с информацией из разных источников были проверены, объединены и представлены в схеме данных Overture Maps.

Что входит в датасет

  • Слой данных "Places" ("места"). Этот слой включает почти 60 млн. точек интереса (POI) по всему миру, впервые опубликованные под открытой лицензией. Хотя качество данных может быть под вопросом (и где-то не сравнится с OpenStreetMap*), здесь интересно их количество, а еще то, что они впервые публикуются открыто.
  • Слой "Здания" включает более 780 млн. зданий по всему миру. В его основе — несколько источников открытых данных, включая OpenStreetMap, набор AI-сгенерированных зданий от Microsoft и данные от Esri.
  • Слой транспортной инфраструктуры — это глобальная дорожная сеть на основе данных OpenStreetMap. Эти данные тоже были переработаны под формат Overture, который дает возможность добавить в будущем новую информацию, такую как ограничение скорости на дорогах или движение транспорта в реальном времени.
  • Данные об административных границах включают границы и названия регионов, переведенные на более чем 40 языков.
*После публикации датасета "Places" с POI в сообществе OSM не раз обсуждали их качество — можно ли вообще что-то делать с этими точками, и насколько им можно верить. Чтобы проверить это, разработчик Wille Marcel уже показал в мини-исследовании, что с данными можно работать, если отсортировать их по "показателю достоверности". К тому же в будущем Overture обещает улучшать, обновлять и расширять этот набор данных.
Лицензии для данных OMF:
  • места (POI) — CDLA Permissive v 2.0;
  • здания — ODbL;
  • транспорт — ODbL;
  • административные границы — CDLA Permissive v 2.0.

Доступ к данным

Данные Overture 2023-07-26-alpha.0 доступны в формате Parquet, который часто используется для big data. Инструкция по загрузке датасета есть на GitHub, с детальными описаниями и примерами запросов. Но если вы просто хотите посмотреть, что входит в датасет, создатели подготовили готовую интерактивную демо-карту.
Разработчики уже могут использовать эту информацию для создания картографических приложений или сервисов, основанных на навигации. Все слои данных отформатированы в соответствии с недавно запущенной схемой данных OMF, которая предназначена для того, чтобы разработчики получали геоданные в одном стандартном виде. В будущих релизах добавятся новые источники открытых данных, и работать с датасетом, возможно, станет удобнее.
Фрагмент интерактивной демо-карты от Overture, где каждый может посмотреть, что входит в датасет.
Исходный датасет — это только начало; в будущем разработчикам фонда OMF предстоит уточнять и обновлять информацию в условиях постоянных изменений, чтобы соответствовать ожиданиям пользователей, а также добавлять больше данных, например, навигацию и трехмерные модели зданий. Overture планирует поддерживать базу данных точек интереса в актуальном состоянии и в дальнейшем регулярно выпускать обновления, но дата следующих релизов пока неизвестна.
Картографические данные необходимы для работы целого ряда гаджетов и приложений (сейчас без них не могут работать даже фитнес-браслеты), поэтому крупным компаниям оказалось выгодно не зависеть от Google и Apple, а объединиться и сделать общий продукт, попутно дополняя OpenStreetMap. Будем надеяться, что они продолжат идти по пути открытости и доступности данных.
Источники:
Материал подготовила Юлия Федорова