МВД объявило о тендере на исследование применимости методов машинного обучения и анализа данных для предотвращения серийных преступлений. Работы в рамках нацпрограммы «Цифровая экономика РФ» предполагают внедрение в работу полиции искусственного интеллекта, а также изучение отечественного и мирового опыта применения соответствующих технологий при расследованиях. Например, речь идёт об извлечении ключевых данных и анализе материалов дел, оперативных сводок, заявлений граждан, экспертиз и аудиоматериалов. NEWS.ru узнал, как это должно работать и поможет ли в борьбе с издержками человеческого фактора.
Следствие вели нейросети
Как следует из материалов, размещённых на сайте госзакупок, ФКУ «Научно-производственное объединение „Специальная техника и связь“ МВД РФ» готово потратить 23,1 млн рублей на выполнение научно-исследовательской работы «Исследование применимости методов машинного обучения и анализа данных для выявления признаков серийности (сходства) определённых категорий преступлений».
Исполнитель работ должен до конца 2022 года проанализировать отечественный и зарубежный опыт применения «технологий машинного обучения и семантического анализа данных при раскрытии и расследовании преступлений», а также «существующих технологий распознавания речи и технологий оптического распознавания печатных и рукописных текстов, в том числе с применением нейронных сетей».
Далее в рамках исследования победителю конкурса предстоит сбор и обработка источников информации: материалов уголовных и административных дел, заключений экспертов, судебных решений, заявлений граждан, отказных материалов, оперативных сводок, аудиоматериалов и «различных формализованных документов», под которыми подразумеваются «структурированные бланки».
В рамках предварительной обработки данных исполнитель обязан проинтервьюировать сотрудников, занимающихся расследованием уголовных дел, провести «классификацию источников информации и выработку подхода для сбора документов и данных», а также собрать данные из доступных источников. Кроме этого, победитель обязан подготовить репрезентативную выборку материалов для анализа и выполнить ручную разметку документов для выделения ключевой информации.
В ходе исследования необходимо проанализировать такие технологии, как распознавание текста на основе нейросетей, «извлечение сущностей из текста документов» (персональные данные физлиц, родство, национальность, особые приметы, в том числе татуировки, упоминания юридических лиц, орудия и способы совершения преступления). Также в техническом задании указано, что исполнитель с помощью технологий искусственного интеллекта обязан провести поиск информации по предварительно оцифрованным документам, учитывая языковые особенности, и классифицировать документы с применением технологий машинного обучения.
В итоге победителю конкурса предстоит разработать макет информационной системы выявления признаков серийности или сходства определённых категорий преступлений.
Как должна работать эта система, NEWS.ru рассказал директор по науке и технологиям Агентства искусственного интеллекта Роман Душкин. По его словам, нововведения «могут и должны использоваться для облегчения труда следователей, особенно в поиске людей, совершающих серийные преступления». Также внедрение нейросетей в работу силовиков может повысить эффективность работы следственных органов.
Он обратил внимание на то, что технологии искусственного интеллекта включают массу решений, которые позволяют «эмулировать или стимулировать когнитивную деятельность человека, в том числе искать разные скрытые закономерности». Нейронные сети, которые сегодня являются самой трендовой технологией искусственного интеллекта, предназначены именно для этого.
Ключевой темой технологий искусственного интеллекта, которые сегодня используются для моделирования когнитивных функций человека, является поиск скрытых закономерностей. Суть работы следователя — это сбор огромного массива данных из тех источников, которые ему доступны, и поиск из этих данных зацепок и улик, чтобы выйти на преступника. А серийные преступления характеризуются как раз тем, что у них обнаруживается одинаковый почерк, по которому мы можем определить, что за человек их совершил, каковы его психологические особенности и черты характера. На основании собранного массива данных о выявленных особенностях мы уже можем провести выборку по базе данных людей, отфильтровать тех, кто под эти показатели подпадает и так далее. Человек-следователь делает это при помощи своих нейронных сетей, а ситуация заключается в том, чтобы выполнением этих функций занимались искусственные нейронные сети, созданные для выполнения этих конкретных задач. Тогда мы будем сгружать информацию о преступлениях в систему искусственного интеллекта, который станет искать те самые скрытые закономерности, выявлять особенности, почерк преступления, делая это намного лучше, чем следователь-человек, потому что будет работать намного быстрее, в режиме самообучения, в том числе во взаимодействии с людьми.
Говоря о взаимодействии искусственного интеллекта и человека, он подчеркнул, что система предлагает разные решения, а люди, исходя из своего профессионального опыта, выбирают наиболее правильные из них. После этого информационная система, которую предстоит создать, будет «раскручивать» уже выбранные человеком варианты. При этом, как отмечает Роман Душкин, хорошо обученная нейронная сеть, в отличие от человека, «не применяет различные предубеждения», когда конкретные следователи кладут в основу своей работы некую выборку, которая, по его мнению, характеризует потенциального преступника.
Отсюда вытекает и проблема так называемого профилирования — метода криминалистики, который зачастую становится расистским инструментом разделения людей. Например, в США полицейские проявляют интерес к афроамериканцам чаще, чем к белым (например, первые погибают от рук силовиков в 13 раз чаще), в Европе также к неграм или выходцам из исламских стран, в России — к «лицам кавказской национальности» или рабочим мигрантам из стран Центральной Азии.
Ещё в 2015 году в докладе ООН говорилось, что «профилирование, определяемое как использование сотрудниками правоохранительных органов, сил безопасности и пограничного контроля расы, цвета кожи, происхождения или национальной или этнической принадлежности в качестве основания для проведения в отношении соответствующих лиц тщательных досмотров, проверок личности и следственных действий для определения того, принимало ли то или иное лицо участие в уголовно-наказуемой деятельности, является устойчивой и повсеместной проблемой». Во всемирной организации подчёркивали, что данное явление часто усиливает и без того существующую дискриминацию, оставаясь серьёзной проблемой во всём мире.
У следователя на основе его личного опыта может сложиться предубеждение, что тот или иной тип преступлений характеризуется статистической выборкой. Например, мужчина в возрасте от 30 до 40 лет, потому что конкретно этому следователю попадались только такие преступники, хотя объективных причин для того, чтобы отдельно выделять эту группу, нет, — комментирует Роман Душкин.
Он объясняет, что у людей бывают когнитивные искажения и многие склонны подтверждать то, во что они верят, а при изучении больших данных, собранных в процессе следствия, человек-следователь может свои предубеждения подсознательно использовать и искать тех, кто соответствует стереотипу. Система искусственного интеллекта выгодно отличается тем, что «не подвержена этому искажению, она не будет подтверждать то, во что верит, потому что она ни во что не верит, а просто выполняет свою конкретную задачу».
Можно только приветствовать внедрение цифровых технологий, которые не подвержены когнитивным искажениям и разным другим негативным аспектам человеческого фактора, которые проявляют люди на местах, связанных с властью и возможностью давления на других, — добавил эксперт.
Достижения на фоне провалов
По информации, изложенной в материалах госзакупки, тендер на изучение возможности применения нейросетей в работе полиции проводится в рамках федерального проекта «Искусственный интеллект» нацпрограммы «Цифровая экономика РФ». Как писал «Коммерсант», использование новых технологий для раскрытия преступлений — это часть программы цифровой трансформации МВД, бюджет которой составляет 55 млрд рублей.
Роман Душкин считает, что программа «Цифровая экономика» — «это не пустые декларации, она работает, на неё выделяются огромные деньги, во всех ведомствах и сферах жизни происходит цифровая трансформация». По его словам, силовые структуры «сами по себе очень инертные и традиционалистские», но благодаря господдержке внедрения цифровых технологий и искусственного интеллекта Россия не является аутсайдером.
[Силовики] чуть ли не самыми последними применяют инновации, которые происходят в обществе и государстве. Во всём мире происходит постепенное задействование в полицейских силах новых технологий. И Россия в этом отношении находится в одном из первых эшелонов. Наше общество достаточно продвинуто в этом плане, — резюмировал Роман Душкин.
Помимо России, технологии искусственного интеллекта используются правоохранительными органами других стран. В Нидерландах, к примеру, используется машинный алгоритм на основе нейротехнологий, который, изучая различные данные, помогает полиции классифицировать и готовить к расследованию материалы уголовных дел, совершая это за пару дней, тогда как обычный полицейский может заниматься этим несколько недель. Искусственный интеллект, в частности, разбирает и изучает документы, анализирует улики и определяет вероятный уровень сложности материала.
Кроме этого, в Нидерландах нейросети подключены к государственной базе ДНК, могут обнаружить общие детали в разных делах и найти недостающие улики.
В Великобритании также используют искусственный интеллект в расследовании преступлений, что позволяет полицейским быстрее обрабатывать огромные массивы данных. Яркий пример — антикоррупционное расследование против Rolls-Royce Holdings Plc. Вести его детективам помогал робот, который изучил 30 млн документов, просматривая по 600 тысяч различных файлов в день. На весь процесс у него ушло всего пять дней, а в «аналоговом» режиме на это потребовалось бы несколько месяцев.
Как рассказывает NEWS.ru бывший следователь Зелимхан Бициев, также на высоком технологическом уровне построена работа полиции в Германии, где ещё с 1990-х годов машины, на которые следственно-оперативные группы выезжали на место происшествия, были оборудованы специальной техникой для того, чтобы было можно получать дактилоскопические образцы. А в России автомобили силовых ведомств, особенно в нестоличной России, по его словам, «через раз не могут выехать на места происшествия из-за поломок».
Следственные отделы и следственно-оперативные группы в небольших провинциальных городах и сельской местности воспримут новость [о тендере ФКУ «Научно-производственное объединение „Специальная техника и связь“ МВД РФ»] обиднее всего. Чтобы запускать какие-то нейронные сети, нужно сначала решить проблему с элементарной техникой у МВД. Многие следователи не могут даже заправить принтер за счёт государства, делая это за свой счёт. Я не знаю, помогут ли новые технологии в раскрытии серийных преступлений — алгоритм действий можно проанализировать только после запуска самих этих технологий и их непосредственного внедрения. Только тогда можно будет сказать, отвечают ли они тем стандартам, которые заявлены МВД. Хотелось бы надеяться, что они действительно окажут помощь в работе.
Ранее NEWS.ru подробно разбирался, стали ли современные цифровые опции политическим инструментом и источником злоупотреблений силовиков. В феврале полицейские стали задерживать участников зимних антиправительственных акций, опознавая их по камерам наблюдения, «умеющим» определять лица. Соответствующая инициатива в Москве стартовала ещё в 2019 году, она активно использовалась и во время условного карантина в первую волну пандемии. МВД отчитывалось об эффективности системы внедрения искусственного интеллекта (ИИ) и анонсировало многомиллиардные траты в этом направлении.