С городом на «ты»
В Национальном центре когнитивных разработок с участием Института дизайна и урбанистики (ИДУ) Университета ИТМО создали языковую модель, облегчающую работу с градостроительными документами. Мы поговорили с одним из создателей — Сергеем Митягиным, директором ИДУ, кандидатом технических наук.
— Можете тремя словами описать «Цифрового мэра»?
— Это интерфейс, чат-бот, который позволяет главе города, специалисту или местному жителю быстро получать информацию о текущей градостроительной ситуации.
Сергей Митягин, директор ИДУ, кандидат технических наук
— Расскажите о принципе работы вашей модели.
— «Цифровой мэр» — это наша инициативная разработка прошлого года. Мы придумали, как применить большие языковые модели к данным городской среды и документам планирования города.
Существующие модели, такие как ChatGPT или DeepSeek, в ответ на ваш вопрос подбирают максимально вероятный и близкий ответ по базе, которую они выучили. Для нормативно точной области городского управления это не подходит. Для нас важно, чтобы модель при формулировке ответа могла ссылаться на конкретную строчку из нужного документа.
Мы использовали агентный подход, взяв несколько моделей для работы с геоданными и с основным инструментом урбаниста — картой. Один агент подготавливал запрос, второй его классифицировал: он про карту, про данные или про документы. После вопрос обрабатывался большой языковой моделью , которая работает с соответствующим источником — с документами или градостроительными моделями, которые занимаются расчетами, хранят данные о городе, формируют карты. Затем, в зависимости от запроса, формируется ответ, включающий результат работы этих агентов.
Например, можно написать: «Сколько детских садов в Василеостровском районе?» И модель выводит все садики на карту, пишет их количество и прочую сопутствующую статистику. Вы можете решить и обратную задачу, задав вопрос: «Где мне построить школу?» По существующим сведениям об обеспеченности и доступности школ в районе модель ищет, где лучше всего разместить новый объект и какого он должен быть масштаба. Сейчас она может подсказать место для размещения детских садов, школ и зеленых зон.
— В чем заключается актуальность этого инструмента?
— Максимально упростить доступ к данным. Потому что их много, они сложно составлены, имеют различную структуру и часто непонятно, где искать нужный норматив или карту. Даже сама процедура получения материалов из базы занимает какое-то время. И часто к информации платный доступ, поэтому также важно знать, что именно ты хочешь получить.
Модель может быть полезна для архитектурных студий, инвесторов, исследователей, которым необходимо собирать данные из многих источников: нормативы, существующие городские объекты, их свойства. Но особенно это актуально для представителей городского менеджмента, органов власти, так как решения часто принимаются быстро, а необходимой информации на руках может не быть. Например, возможно ли в этом месте строительство трех домов-башен? Модель укажет, какие акты смотреть и что нужно знать для принятия решения.
— По сути это инструмент скорее консультативный, не для проектирования?
— Получается, так. Он действительно больше для консультации и получения профессиональных справок.
— Его где-то уже удалось внедрить?
— Да. У нас было пилотное внедрение для муниципального образования «Васильевский» в Санкт-Петербурге, где для упрощения и ускорения взаимодействия с гражданами потребовалось какое-то цифровое решение. Администрация обратилась к нам, и мы решили попробовать. Оформили «Цифрового мэра» в телеграм-бот, куда граждане могли писать свои вопросы. Бот до сих пор доступен.
— А в других регионах его можно использовать?
— Конкретно сейчас в базе данные только по Петербургу, но помощник может использоваться и в других городах. Адаптируется легко, единственная проблема — в различиях нормативов, потому что даже в рамках одного региона они кое-где различаются от поселения к поселению. Из-за этого самое большое время займет не настройка чат-бота, а адаптация моделей оценки под каждые локальные нормативы.
— Какие проблемы возникали при разработке?
— Во время создания датасетов для классификатора мы вынесли для себя некоторое новое знание: специалисту сложно вербализовать свою работу. Для сбора данных мы привлекли профессионалов: градостроителей, архитекторов, проектировщиков. И оказалось, что им очень сложно перестроить мозг с «как сделать» на то, какой вопрос задать, чтобы модель ответила «что мне делать». Когда ты проектируешь, ты не спрашиваешь: «Как мне спроектировать?»
Была еще одна сложность при обучении классификатора. Когда речь заходила о выборе между близкими по смыслу документом А и документом Б, появлялась проблема. Оказалось, сложно научить модель различать, допустим, Стратегию социально-экономического развития и госпрограмму «Развитие образования», так как и там, и там написано про развитие образования. В итоге модель научилась, но все равно иногда путается.
— Языковые модели требуют больших вычислительных мощностей. Насколько затратно дальнейшее оперирование моделью?
— Затратно, но хорошо, что в ИТМО есть соответствующие мощности. Если же «Цифрового мэра» куда-то передавать, то заказчику нужно будет подумать об обслуживании модели.
— Планируется ли распространение модели? И в каком формате?
— Да, планируется. Мы хотим максимально продвигать ее на различных площадках, где встречаются наши целевые аудитории: городские менеджеры, представители органов власти. В случае отклика мы заключаем либо лицензионное соглашение, либо дорабатываем модель под запрос конкретного заказчика.
— Расскажите о дальнейших планах работы.
— Как прототип модель завершена. В будущем мы планируем адаптировать ее для нашего магистрального проекта «Простор», сделать более пригодной для проектировщиков. Модель должна подсказывать, в зависимости от условий локации, на что обратить внимание, что почитать, какие данные еще нужно подгрузить, где есть риски. Такой чат-бот «Градостроитель».
Если заказчика не найдется, будем потихоньку дорабатывать модель и выкладывать в открытый доступ.
Фото предоставлены собеседником
