Спецпроекты

Безопасность Цифровизация

Владимир Арлазаров, Smart Engines: Сегодня мы ведем необъявленную войну с подделкой документов

Сегодня мошенничество с документами достигло невиданных масштабов. Между злоумышленниками и научным сообществом, разработчиками антифрод-систем идет настоящая, пусть и необъявленная война. Здесь, как писал Льюис Кэрролл, чтобы просто оставаться на месте, нужно бежать со всех ног. О том, как искусственный интеллект помогает выявлять подделки и как создавать системы, которые не навредят добросовестным пользователям, рассказывает генеральный директор компании Smart Engines, д.т.н. Владимир Арлазаров.

CNews: Вы — 10 лет на рынке распознавания документов. Как менялись и эволюционировали задачи?

Владимир Арлазаров: Десять лет назад никто не умел распознавать паспорт с мобильного телефона. Тогда мы первыми в мире представили технологию, которая могла извлекать данные из документов на фотографии и в видеопотоке на смартфоне за секунды. Это стало настоящим прорывом именно с этого началась волна цифровизации и появились новые форматы обслуживания: выездное, дистанционное, мобильное. Одним из первых технологию внедрил Т-Банк, который за десять лет нарастил клиентскую базу с 5 до 50 млн. Вслед за ним этот путь повторили другие банки.

Уже пять лет назад произошёл заметный сдвиг приоритетов. К тому моменту появились другие важные задачи: распознавание рукописных полей, распознавание рукописи в штампах о прописке, поддержка ИНН, СНИЛС, водительских прав и других документов. Все эти задачи мы успешно решили и дали рынку технологию, которая распознает более 3000 типов документов.

Сегодня мы живём в совершенно другой эпохе. Теперь распознавать паспорт и другие документы, пусть даже на самом высоком уровне, недостаточно. Главный вызов последних нескольких лет, сегодняшнего и завтрашнего дня борьба с мошенничеством.

Владимир Арлазаров, Smart Engines: Сегодня мошенничество с документами — это уже проблема национального масштаба

CNews: Каковы масштабы у проблемы? Что способствует росту мошенничества?

Владимир Арлазаров: Сегодня мошенничество с документами это уже проблема национального масштаба. Ущерб исчисляется миллиардами: страдают и граждане, и бизнес. Если раньше фрод встречался примерно в одном случае на 100 тысяч, то сегодня — уже в одном на тысячу, а иногда и чаще.

Рост фрода подогревают сразу несколько факторов. Это и массовые утечки персональных данных, хотя государство предпринимает меры, и демократизация фрода. Если еще недавно изготовление поддельных документов требовало специальных знаний, оборудования и времени, то сегодня достаточно одного грамотно составленного промпта. И с развитием генеративных моделей качество и количество подделок неизбежно будут только расти.

CNews: В октябре вы совместно с юридической фирмой Intellect представили отчет о мошенничестве с поддельными документами за последние пять лет. Какие тренды прослеживаются в этой области?

Владимир Арлазаров: Мы видим устойчивый рост числа уголовных дел и осужденных по статьям, связанным с подделкой документов. Всё чаще в этих делах фигурируют организованные группы и подпольные структуры. Более чем в половине случаев осужденными оказываются мигранты, вовлечённые в схемы изготовления или использования подделок.

Среди поддельных документов абсолютным лидером остаются удостоверения личности — паспорта граждан России и стран СНГ, водительские права, служебные и военные удостоверения. На высоком уровне также сохраняется число подделок судебных и нотариальных доверенностей, которые чаще всего используются в незаконных операциях с недвижимостью и при взыскании фиктивных задолженностей. Все это говорит о том, что сегодня проверять только паспорт РФ уже недостаточно — необходимо комплексное распознавание и верификация документов разных типов и происхождения.

CNews: Один из способов защиты — антифрод-решения для проверки документов. Что самое сложное при построении такой системы?

Владимир Арлазаров: Здесь важно понимать один ключевой момент: фундамент любой антифрод-системы — это исключительно высокое качество распознавания полей документа. Причем под «высоким качеством» мы понимаем не 95%, а точность на уровне 99,9% и выше. Показатель в 95% мог считаться приемлемым 5–10 лет назад, когда стояли другие задачи. Но при проверке подлинности этого уровня недостаточно — здесь важна абсолютная надежность.

Если алгоритмы работают неточно, это неминуемо приводит к росту ложных срабатываний: система начинает ошибочно отклонять добросовестных клиентов. Для бизнеса опасно пропустить мошенника — это прямые финансовые потери и репутационные риски. Но не менее опасно потерять честного клиента: отказ в обслуживании снижает доверие и в итоге оборачивается упущенной прибылью. А если таких клиентов тысячи?

CNews: Чем принципиально отличается антифрод-система от классической системы распознавания?

Владимир Арлазаров: Антифрод-решения — это системы совершенно другого уровня сложности. Их задача — не просто «найти» документ и извлечь данные, а обнаружить аномалии как внутри документа, так и вокруг него. На уровне шаблона система не только определяет тип документа, но и проверяет защитные элементы. На уровне заполнения — анализирует не просто символы, а шрифт и способ нанесения текста. И все это при том, что документы разных стран и поколений устроены по-разному, а правила их оформления постоянно меняются.

Ещё один важный аспект — современные антифрод-системы должны работать в мультимодальной среде, где объединяются данные из разных источников и форматов. Они обрабатывают изображения в оптическом, ультрафиолетовом и инфракрасном диапазонах, анализируют видеопоследовательности, текстовые поля, данные NFC-чипа, штрих-коды, метаданные и цифровые сигнатуры. При этом проверяться должны не только отдельные элементы, но и связи между ними.

CNews: Какие способы защиты от мошенников вы предлагаете в отделениях?

Владимир Арлазаров: При классическом обслуживании в офисах ключевую роль по-прежнему играет человек — именно оператор решает, оказать услугу или нет. Но человеческий фактор часто становится уязвимостью: сотрудник может банально устать, может не знать всех нюансов проверки иностранных документов, попасть под психологическое давление или даже вступить в сговор.

Чтобы исключить эти риски, мы совместно с партнером — группой «Интек» — разработали линейку программно-аппаратных комплексов для проверки документов. Это мультиспектральные сканеры, которые одновременно распознают данные и анализируют документ в трех диапазонах — оптическом, ультрафиолетовом и инфракрасном. Такая мультимодальная проверка позволяет выявлять подделки, незаметные человеческому глазу: например, следы переклейки или отсутствие люминесцирующих волокон на бланке паспорта.

Мы адаптировали решения под разные сценарии: есть встраиваемый модуль для киосков самообслуживания и автономный сканер со встроенным микрокомпьютером — оптимальный вариант для планшетов и тонких клиентов. По сути, это уже не просто считыватель документов, а полноценный интеллектуальный ассистент, который самостоятельно анализирует и принимает решение о подлинности документа в реальном времени.

Мультимодальная проверка позволяет выявлять подделки, незаметные человеческому глазу

CNews: Можно ли проверять документы без сканера? Как вы защищаете каналы онлайн-обслуживания?

Владимир Арлазаров: Цифровые каналы сегодня особенно привлекательны для мошенников. Во-первых, цифровые подделки стало значительно проще создавать: инструменты для этого — от продвинутых фоторедакторов до нейросетей и LLM — доступны буквально каждому. Во-вторых, в дистанционных сервисах — от онбординга до кредитного скоринга и МФО-платформ — злоумышленники часто создают на системы искусственную нагрузку, массово загружая неподходящие или намеренно искаженные изображения, чтобы «пробить» защиту.

По отражению таких атак у нас накоплена огромная экспертиза. Мы разработали и запатентовали десятки технологий для проверки голограмм в видеопотоке, фильтрации «мусорных» кадров, детекции пересъемки с экрана и других атак на предъявление, а также для выявления следов цифрового вмешательства. В общей сложности на решения Smart Engines зарегистрировано 15 патентов в США и более 70 в России.

CNews: С какими документами работают сегодня ваши решения? Только с паспортом или перечень шире?

Владимир Арлазаров: Мы поддерживаем документы всех стран мира — сегодня это 3000 типов и 5000 уникальных шаблонов. Только в России это полсотни документов, включая национальный и заграничный паспорта, водительские удостоверения, СТС, ПТС, а также документы формата А4 — нотариальные доверенности, судебные приказы, свидетельства о рождении, браке, смерти, дипломы и многие другие.

Помимо российских, система распознаёт паспорта других государств — в частности, тех, откуда в Россию идут основные миграционные потоки. Это Китай, Индия, Пакистан, Узбекистан, Таджикистан, Кыргызстан.

Система распознаёт паспорта других государств — в частности, тех, откуда в Россию идут основные миграционные потоки.

CNews: В каком виде система возвращает результаты проверки? Подделка или нет?

Владимир Арлазаров: Все зависит от задач клиента — мы можем гибко адаптировать формат выдачи результатов. При этом система не работает по принципу «чёрного ящика», который просто сообщает: подделка или не подделка. Она выступает скорее как экспертная модель, которая выделяет все признаки, анализирует их и по каждому формирует результат со степенью уверенности.

CNews: Обращаетесь ли вы к внешним сервисам при проверке документов?

Владимир Арлазаров: Нет. Наша компания разрабатывает программные библиотеки SDK, которые клиенты встраивают в свой ИТ-контур. Вся проверка подлинности, как и распознавание, происходит полностью локально на стороне клиента. Мы не получаем, не храним и тем более никуда не передаем на обработку ни изображения документов, ни персональные данные из них.

CNews: Как вы обучаете ваши системы? Откуда берете документы?

Владимир Арлазаров: Для разработки и тестирования наших алгоритмов мы используем исключительно синтезированные документы со сгенерированными данными. Поскольку общедоступных датасетов не так много, мы развиваем семейство собственных — MIDV. Сейчас оно включает восемь открытых датасетов, в сумме это почти 30 тысяч фотографий, сканов и видеоклипов с документами.

Например, MIDV-Holo содержит документы с голографической защитой, новый датасет MIDV-DM — документы с отфотошопленными полями, отредактированными фотографиями и другими наиболее распространенными манипуляциями. Мы воспроизводим наиболее распространенные атаки, чтобы обучать ИИ лучше их отражать.

CNews: Где уже стоят ваши системы для проверки подлинности документов?

Владимир Арлазаров: Один из главных кейсов, которым мы очень гордимся — это интеграция наших сканеров в российские аэропорты. Вот уже пять лет «Шереметьево» использует наши программно-аппаратные комплексы в системах автоматического паспортного контроля, сейчас опыт переняли «Внуково» и екатеринбургский аэропорт «Кольцово». Система стоит на страже государственной границы — это лучше любых слов подтверждает ее надежность и технологическую зрелость.

Наши сканеры также работают в ФНС России — при оформлении электронной цифровой подписи, в МВД и других государственных институтах. У нас также есть заказчики из числа банков, МФО, страховых компаний и другого крупного бизнеса. Так, «А Деньги» использует наше решение для идентификации клиентов: ИИ проверяет подлинность документа и сверяет фото клиента с паспортом. А компания «Займер» в 2024 году с помощью нашего ИИ предотвратила более 10 тысяч попыток оформления займов по чужим паспортам. Другой заказчик из финтеха после установки сканеров в отделениях отмечал: мошенники, увидев сканер, просто разворачиваются и уходят.

Короткая ссылка