Мало кто знает, но государство публикует полноценную базу данных с адресами на всю Россию.
КЛАДР, ФИАС и ГАР – форматы предоставления информации об адресах на территории Российской федерации.
Немного истории. 17 ноября 2005 года публикуется приказ Федеральной налоговой службы N САЭ-3-13/594@ об изменении структуры ведомственного классификатора адресов Российской Федерации (КЛАДР). В первую очередь, КЛАДР создавался для Федеральной налоговой службы, дабы распределить территории между налоговыми инспекции и автоматизировать процесс рассылки корреспонденции. Утверждается новая структура базы данных, а также закрепляется модернизация для программного обеспечения. Сама БД публикуются формате DBF (читается любым геопространственным ПО). КЛАДР содержит следующую структуру данных, содержащих в себе 6 уровней адресов (не считая уровень -- дома): · KLADR — содержит объекты c 1-го по 4-й уровень классификации (регионы; районы (улусы); города, посёлки городского типа, сельсоветы; сельские населённые пункты); · STREET — содержит объекты 5-го уровня классификации (улицы городов и населённых пунктов); · DOMA — содержит объекты 6-го уровня классификации (номера домов, улиц, городов и населённых пунктов); · FLAT — содержит объекты 7-го уровня классификации (номера квартир домов); · SOCRBASE — содержит объекты с краткими наименованиями типов адресных объектов; · ALTNAMES — содержит сведения о соответствии кодов записей со старыми и новыми наименованиями адресных объектов, а также сведения о соответствии кодов адресных объектов до и после их переподчинения.
Все это связывается классификационными кодами. Для КЛАДРа он следующий: СС+РРР+ГГГ+ППП+УУУУ+ДДДД, где СС – код субъекта Российской Федерации (региона); РРР – код района; ГГГ – код города (код сельского поселения); ППП – код населенного пункта; УУУУ – код улицы, планировочной единицы территории);
Один из основных минусов КЛАДРа -- множественные неточности в адресах. В 2011 году начинается разработка новой модернизированной адресной базы данных – Федеральной информационной адресной системы (ФИАС). ФИАС содержит следующую информацию: · классификатор адресообразующих элементов, или классифицированные коды; · сведения об элементах адреса, идентифицирующих адресуемые объекты - земельные участки и объекты капитального строительства (дома, владения, домовладения, корпуса, строения, сооружения), дополнительная информация, уточняющая (при необходимости) местоположение этих объектов относительно ориентиров на местности.
Классифицированный код представлен в следующем виде: СС – код субъекта Российской Федерации (региона); А – код округа в составе субъекта Российской Федерации (региона); РРР– код района; ГГГ– код города (код сельского поселения); ВВВ– код внутригородского района; ППП– код населенного пункта; УУУУ – код улицы, планировочной единицы территории); ЭЭЭЭ – код дополнительного адресообразующего элемента; ЦЦЦ – код подчиненного адресного объекта дополнительного адресообразующего элемента.
В ФИАС была сильно переработана структура данных. Классификационный код отражает текущую структуру адреса, если один из элементов будет изменен, то это приведет к потере информации. Поэтому одно из важны дополнений – наличие поля GUID, или глобального идентификатора, позволяющего связать структуру адреса воедино. В 2022 году появляется ГАР – государственный адресный реестр. Понадобился он по причине реформы местного самоуправления, которая позволяется проследить цепочку подчинения объектов территориального деления. Ко всем трем базам данных доступ осуществляется через сайт федеральной налоговой службы: https://fias.nalog.ru/Updates
Основные отличия ГАР от ФИАС: · Введены новые уровни адресов: «Муниципальный район», «Сельское/городское поселение», «Машиноместо» · Введен уникальный идентификатор компонентов адреса – OBJECTID, который позволят собирать части адресов, расположенные по разным справочникам; · Изменен формат хранения адресов.
Остается последний вопрос: как с этим всем работать? Согласны, когда первый раз качаешь БД, выглядит страшно и не очень понятно, тк руками в ней работать бесполезно. В каждой папке лежат 10 xml-файлов. Внутри каждого хранится информация об адресах соответствующего папке субъекта РФ. В папках неактуальных регионов хранятся исторические адресные данные.
Рисунок 1 Содержание ГАР ФИАС БД
Рисунок 2- XML-файлы для Москвы
Рисунок 3 -- Записи внутри XML-файла
Но выход есть. Энтузиасты опубликовали код для парсинга данных из ГАР БД ФИАС:https://habr.com/en/post/595107/ . Осталось лишь разобраться с кодом разработчика и достать необходимую вам информацию)
И ответ на поставленный вопрос: это не съедобно ;)