Статьи

GBIF – открытые данные о биоразнообразии

Полезные ресурсы Туториалы
Все 2,3 млрд наблюдений на одной карте. Источник: GBIF
Скажем, вы хотите составить карту ареала бобра обыкновенного. Или провести временной анализ распространения борщевика Сосновского. Или найти территории, где чаще всего встречаются бабочки монархи. Где взять для этого данные?
Источников много, но в первую очередь посмотрите на GBIF.
Global Biodiversity Information Facility (GBIF) – это международная сеть и база данных, которая предоставляет открытый доступ к данным о всех живых организмах на Земле. Разные организации передают в GBIF свои данные о том, где и когда обнаружены живые организмы, и сервис предоставляет их в открытом доступе любому желающему.
Сейчас в GBIF более 2,3 млрд записей о наблюдениях видов. Сведения поступают в GBIF из разных источников: от музейных и гербарных образцов, собранных еще в в XVIII веке, до штрих-кодов ДНК и фотографий со смартфонов, сделанных на прошлой неделе. Наибольшим количеством данных в GBIF делятся платформы iNaturalist, eBird и observation.org. Эти крупные сервисы используют автоматическую загрузку – например, iNaturalist передает данные каждые две недели и уточняет свои прошлые данные, если ранее вид определили неправильно.
Полный список источников GBIF – это 2478 организаций из разных стран мира, и их число увеличивается с каждым днем. Каждый человек может поделиться данными после своей экспедиции или личной коллекцией через GBIF – на странице Publishing data вы можете посмотреть, как это работает.
GBIF объединяет все источники данных в один доступный формат, что позволяет исследователям и всем желающим использовать данные для любых целей. От воздействия изменения климата и распространения инвазивных вредителей до изучения продовольственной безопасности и здоровья человека – многие из современных исследований были бы невозможны без GBIF.
Как скачать данные из базы GBIF
Все данные GBIF доступны после регистрации. Рассмотрим на примере, как пользоваться базой данных и удобными фильтрами на сайте.
1. Вводим латинское название вида на главной странице GBIF (это же можно сделать во вкладках Occurrences или Species, но сейчас разберем общий случай).
Главная страница GBIF с запросом Limecola balthica
2. Выбираем нужный результат. Если идти с главной страницы, в результатах появится все, что содержит ваш запрос – нужный вид, виды-синонимы, а также датасеты с этим видом. Чтобы скачать только данные о распространении, переходим по первой ссылке с тегом Species и верным названием.
Скриншот с результатами поиска GBIF.
3. На странице вида – его описание и таксономия. Чтобы скачать данные, нажмите на Occurrences.
Скриншот страницы вида в GBIF. Для моллюска Limecola balthica есть 12844 записей, 1277 из них – с фото.
4. Можете скачать все данные сразу или отфильтровать нужные записи в меню, выбрав точки из конкретной страны, только записи с фото или наблюдения в отдельный период времени. После выбора подходящих фильтров нажмите Download над таблицей и скачайте данные в формате csv.
Скриншот таблицы GBIF и меню фильтров (слева).
В базе есть информация, где и когда был обнаружен организм, а для некоторых точек есть дополнительные сведения: автор наблюдения или количество особей. Как и с любыми данными, с этим датасетом вам, скорее всего, придется поработать. В нем встретятся дубли, данные с неточными координатами или неверно определенные образцы.
Как еще работать с GBIF
У GBIF есть и API – его удобно использовать, например, если вы делаете статистическую обработку данных на вашем любимом языке программирования. Для удобного импорта данных в R есть пакет rgbif, а для Python – pygbif. В разделе с ресурсами вы найдете еще больше удобных инструментов для работы с данными и публикации результатов в своих исследованиях.
Как цитировать GBIF
Этому вопросу посвящен целый раздел Citation guidelines, так как общая политика GBIF – это общедоступные данные с обязательным указанием источника. GBIF просит правильно цитировать использованные данные и отслеживает статьи, где использована информация этого сервиса.
GBIF ежемесячно отбирает статьи, основываясь на их научном влиянии, актуальности и уникальности, а также разнообразии в таксономии и географии. Позже они попадают в ежегодный сборник научных статей "Научный обзор".
Авторы: Алия Кутуева, Юлия Федорова