Статьи

Карты виртуальных пространств: Nomic Atlas и карта GitHub

Время прочтения: 2 минуты
Нанести на карту можно не только реальные территории, но и виртуальные. Это помогает находить новые связи между веб-страницами и видеть более полную картину, а также исследовать новые территории онлайн-пространств. Посмотрим на два проекта, визуализирующих связи веб-страниц на картах: Nomic Atlas и карту репозиториев GitHub.

Nomic Atlas и связи в Stack Overflow

Несмотря на название, Nomic Atlas – это не атлас, а онлайн-инструмент для визуализации и изучения больших наборов данных. Он позволяет пользователям хранить, обновлять и организовывать многомиллионные наборы данных из неструктурированного текста, изображений и других объектов, а потом создает из них интерактивные карты и показывает полную картину со связями отдельных частей. Пошаговый пример структурирования данных через Nomic Atlas есть в открытом блокноте Colab.
Карта Stack Overflow в Nomic Atlas с красочными облаками взаимосвязей запросов
Для примера реального и полезного проекта посмотрим на карту постов Stack Overflow – популярного сервиса вопросов и ответов о программировании. C помощью Nomic Atlas эта интерактивная карта упорядочивает вопросы, размещенные программистами на Stack Overflow, и визуализирует взаимосвязи между разными темами.
Поскольку карта показывает связи между вопросами в разных разделах, ее можно использовать для определения связей в темах и поиска новых IT-топиков, а также для исследования конкретных вопросов и ответов о программировании.

Карта GitHub и целые страны репозиториев

Огромное пространство репозиториев GitHub с названиями "стран". Приблизив, вы увидите паутину связей проектов
Map of GitHub – это сетевой график с более 400000 проектами GitHub. Каждая точка на этой интерактивной карте отражает отдельный проект, нанесенный на карту в зависимости от количества звезд, которыми пользователи сохраняют понравившиеся репозитории.
Скриншот карты GitHub с выделенным проектом и связями, отходящими от него.
Карта соединяет пары репозиториев GitHub на основе общих пользователей, которые отметили звездами проекты в период с 2020 года по конец марта 2023 года. Другими словами, здесь изображена база данных из 350 миллионов звезд, присвоенных репозиториям GitHub, связанных через алгоритм сходства Жаккара. Подробнее о процессе создания автор пишет на странице своего проекта GitHub.
Источники:
Материал подготовила Юлия Федорова