Федеральная служба государственной статистики разработала новый порядок расчёта потребительской инфляции, который должен объединить большие данные от контрольно-кассовой техники (ККТ) и технологии искусственного интеллекта, следует из презентации замруководителя Росстата по цифровой трансформации Григория Остапенко.
В Росстате указали, что предварительные оценки индекса потребительских цен (ИПЦ), рассчитанного при помощи ККТ, планируется получить уже в следующем году.
Для машинной обработки кассовых данных будет применяться технология нейронных сетей Open Neural Network Exchange (открытая библиотека ПО для построения нейронных сетей глубокого обучения), информирует РБК.
В настоящее время свыше тысячи сотрудников Росстата в регионах вручную собирают данные о ценах для расчёта инфляции. Каждый месяц обследуются около 400 товаров и примерно 120 услуг, собираются 700 тысяч ценовых котировок. При новом методе количество ценовых котировок увеличится «до максимально возможного» — нескольких миллионов. Охват товаров, за которыми ведётся наблюдение, увеличится до одной тысячи. С помощью веб-скрейпинга (технологии извлечения онлайн-данных) Росстат начнёт агрегировать данные ККТ о стоимости товаров в кассовых товарных чеках.
Ряд экспертов в области статистики цен полагают, что видимые слабости существующего подхода к определению динамики потребительской инфляции заключаются в определении состава потребительской корзины — набора товаров и услуг, по которым осуществляется мониторинг изменения цен. По мнению специалистов, в корзину входят товары и услуги, которые не отражают реальное удовлетворение потребностей граждан.
Кроме того, продолжает эксперт, сама концепция некоего «среднестатистического» набора продовольственных и непродовольственных товаров, необходимых каждому жителю, неприемлема для понимания — очевидно, что у каждой семьи или каждого человека существует собственный набор потребностей, исходя из которого складывается его рацион и структура непродовольственных расходов. Наконец, специалисты полагают, что издержки сбора информации о ценах «ручным» способом, то есть с привлечением большого числа переписчиков, особенно в территориально-географических условиях России, слишком высоки.
В вопросе использования данных ККТ для статистики не идёт речи о полной замене методики расчёта инфляции. Российская статистика цен гармонизирована с официальными международными подходами: полностью отказаться от использования методик расчёта статистических показателей — значит погрузить Россию в международную информационную изоляцию. По новым методикам расчёта индексов инфляции невозможно будет произвести международные сопоставления, а также невозможно будет учитывать динамику изменений в ретроспективе. В развитых странах до сих пор не было разработано единой концепции новой парадигмы статистики цен, построенной на основе первичных данных контрольно-кассовой техники. Отдельные инициативы уже на протяжении более десяти лет имеют разовый, экспериментальный характер. Поэтому в ближайшее время расчёт на основе данных «миллионов» цен следует рассматривать только как альтернативу действующему подходу.
Если изменить методику расчёта индекса потребительских цен сейчас, то, возможно, потребители статистической информации будут более благосклонно относиться к официальным данным Росстата. Тем не менее экспериментальные расчёты, произведённые в ряде стран Запада, демонстрируют сильную взаимосвязь между результатами, полученными по новой методике, и статистикой, рассчитанной по традиционной модели. Поэтому вопрос о целесообразности использования данных ККТ и проведении целого комплекса мероприятий по изменению методики подсчёта инфляции остаётся открытым, — сказал Прохоров.
Действующий подход (как у нас, так и во всех остальных странах) основан на расчёте инфляции по выборке из генеральной совокупности, объясняет эксперт института «Центр развития» НИУ ВШЭ Игорь Сафонов. Так, в каждом регионе Росстат определяет несколько населённых пунктов (обычно областной центр и ещё ряд городов на достаточном удалении друг от друга), в которых в очном режиме производятся замеры цен.
При их измерении по товарам одного вида (например, молоко) берутся наиболее продаваемые позиции (но всегда не менее 5 шт.), цены на которые затем усредняются по доле в объёме продаж. Если разброс цен достаточно велик, то количество принимаемых в расчёт позиций увеличивается. Несмотря на то что правильно составленная таким образом выборка может достаточно хорошо описывать генеральную совокупность (т. е. цены в целом), в ней всё равно содержится некоторая доля ошибки. Использование онлайн-данных ККТ позволит анализировать цены уже по абсолютно всем населённым пунктам и по всему многообразию товаров, что позволит снизить до минимума возможные ошибки.
При этом возможности для какого-либо искажения цен (умышленного или нет) уменьшаются практически до нуля, т. к. исключается человеческий фактор при формировании выборки — расчёт цен будет производиться только на реально проведённых населением транзакциях. Более точным должен стать учёт долей отдельных товаров и услуг в расходах на потребительскую корзину, а также станет возможным оперативное наблюдение за паттернами потребительского поведения — переход к покупкам более качественных и дорогих товаров или, наоборот, более дешёвых и простых в зависимости от изменения экономической ситуации.
Для рядовых же россиян станет потенциально возможным отслеживание темпов роста цен на отдельные товары и услуги (или на личную потребительскую корзину) в конкретном населенном пункте в онлайн-режиме, отметил экономист.
Действующий подход базируется на сравнении стоимости потребкорзины в разные моменты времени. Состав корзины ограничен возможностью сотрудников наблюдать цены. Применение автоматического сбора данных позволит расширить состав корзины и увеличит оперативность. Информация будет поступать быстрее, и ее точность будет выше. Самый сложный вопрос, на который нет универсального ответа, — состав потребкорзины. У разных людей совершенно разная структура расходов. А соответственно, и инфляцию все видят по-разному. Возможно, индексация пенсий и пособий будет несколько более оперативной.
Сама по себе идея о получении цен от контрольно-кассовой техники с отказом от наблюдателей в магазинах очень правильная. Более детальная информация даёт более широкие возможности для исследования экономики, говорит экономист ГАУГН Иван Неволин.
Наш институт, например, покупает данные о ценах в региональном разрезе для использования в агент-ориентированном моделировании. Последнее позволяет проводить сценарный анализ типа «что если»: например, как изменится производство при введении обсуждаемого плана регулирования отрасли. И если говорить о реальном управлении, данные из торговых точек кардинально меняют представления о спросе.
Перспективы использования данных о покупках гораздо шире, чем расчёт индекса потребительских цен: можно не только наблюдать за распределением спроса по ценовым сегментам, отслеживать распространение заболеваний по спросу на лекарства, но и сделать косвенные наблюдения о предложении. При расчёте индекса потребительских цен Росстат ограничен методикой. Без её корректировки не добиться существенного уточнения, замечает специалист.
В частности, наименование товаров и процедура усреднения прописаны. Однако данные из торговых точек позволяют использовать новые веса — например, с учётом частоты покупок (наблюдатели в магазинах видят только цены, но не количество продаж по этим ценам). Помимо организационных препятствий есть и технические. Например, нужно сопоставлять названия товаров из чеков с классификатором Росстата. Если в чеке присутствует сокращённое название, придётся использовать элементы искусственного интеллекта, чтобы «мол. паст. 3,2» распознать, как «молоко пастеризованное 3,2% жирности», а не что-то ещё.
В целом следом за получением доступа к данным от контрольно-кассовой техники можно ожидать организационные шаги, направленные на изменение методики расчёта ИПЦ, на обеспечение технической инфраструктуры, а также использование данных в других расчётах, — резюмировал Иван Неволин.