Спецпроекты

Безопасность Цифровизация Бизнес-приложения

На что способны ИТ-решения для силовиков

Информационно-аналитические системы, предназначенные для решения задач, стоящих перед государственными правоохранительными органами, существенным образом отличаются от традиционных аналитических систем поддержки принятия решений. Для раскрытия преступлений требуются особые методы отображения и обработки данных.

Для обеспечения информационной поддержки принятия решения в области охраны порядка, антитеррористической деятельности, разведки, борьбы с различного рода мошенничеством требуется решение специфических следственных задач. К ним, в частности, могут быть отнесены сбор и анализ информации о физических и юридических лицах (адрес, телефоны, место регистрации, место работы, государственные идентификаторы (ИНН и проч.), информация об удостоверяющих документах). Кроме того, к числу указанных задач можно отнести необходимость выявления связей объекта с другими объектами, сбор и анализ информации о деятельности объекта, например, участие в последовательности каких-либо событий, а также транзакционный анализ, то есть анализ телефонного или электронного почтового трафика, анализ банковских транзакций.

У большинства же пользователей сам термин «система поддержки принятия решений» ассоциируется в основном с информационно-аналитическими системами, предназначенными для анализа финансовой и статистической информации. В итоге традиционная система поддержки принятия решения воспринимается как хранилище данных, использующее типичные структуры данных: «звезда», «снежинка» и многомерные кубы. В качестве средства, обеспечивающего аналитику доступ к данным на различных уровнях агрегации, используются варианты OLAP-технологий.

Архитектура традиционных аналитических систем
Архитектура традиционных аналитических систем

Такие аналитические системы действительно эффективны, когда решаются задачи анализа численной информации. Основными задачами такого анализа являются: понимание поведения анализируемого показателя как функции ряда параметров, выявление значений параметров с аномальным поведением анализируемого показателя, а также предсказание значения анализируемого показателя при изменении параметров. Типичным примером подобных систем являются продажи того или иного продукта по регионам и кварталам. Серьезные отличия в решаемых задачах требуют различного представления данных и использования различных технологий анализа.

Внимание! CNews Analytics готовит аналитический Обзор "Информационные технологии в органах государственной власти 2006".
В рамках Обзора будет размещен рейтинг ИТ-проектов в органах государственной власти России. В случае, если вы заинтересованы в размещении рекламно-информационных материалов, просьба обращаться к ведущему Обзора.

Ключевые отличия

Для аналитиков, занимающихся следственной деятельностью, наиболее естественной моделью данных является граф, а не многомерный куб. Значительная часть аналитической работы в этом случае заключается в выявлении связей между объектами. И, соответственно, основными понятиями модели данных становятся не «мера» и «размерность», как в случае многомерных моделей, а «объект» и «связь». Подобного рода информация большей частью не может быть агрегирована, что делает традиционные средства представления информации в виде экранных форм и таблиц малопригодными. На первый план выходят визуальные средства анализа и такие графические представления данных как диаграммы связей, диаграммы последовательности событий и диаграммы транзакций.

Диаграмма связей
Диаграмма связей

Диаграмма последовательности событий
Диаграмма последовательности событий

Диаграмма транзакций
Диаграмма транзакций

Другой весьма существенной особенностью построения аналитических систем, связанных с безопасностью, является способ формирования хранилища данных. В случае финансовых аналитических систем источником данных, как правило, являются информационные системы, работающие в рамках одной и той же организации. При этом число объектов, подлежащих идентификации при загрузке хранилища по сравнению с объемом данных об этих объектах относительно невелико. Количество подобных объектов обычно исчисляется несколькими сотнями или тысячами.

Совершенно иная ситуация наблюдается в аналитических системах безопасности. Объектом исследования является физическое или юридическое лицо. Количество таких объектов в хранилище исчисляется десятками миллионов. Данные в систему поступают из совершенно не связанных между собой источников, таких как интернет, базы данных различных государственных ведомств. Естественно, ни о каком согласованном способе идентификации объектов между подобными источниками данных не может быть и речи. Объем дублирующих данных по одному и тому же объекту чрезвычайно велик.

Поиск иголки в стоге сена

В традиционных статистико-финансовых системах наибольший интерес представляют макропоказатели, и, соответственно, логика анализа данных строится на изучении поведения существенным образом агрегированных данных, что позволяет сжать исходный объем данных до уровня, доступного для восприятия аналитика. Подобный подход далеко не всегда адекватен задачам, стоящим перед ИАС силовых подразделений. Информация в таких системах часто не подлежит агрегированию. Но даже в тех случаях, когда данные могут быть агрегированы, их анализ зачастую не представляет интереса, поскольку предметом поиска являются достаточно редкие на фоне стандартного поведения факты.

Например, борьба с отмыванием нелегальных доходов предполагает поиск в огромном потоке вполне легальных финансовых операций отдельных случаев отмывания денег. Основной поток операций носит легальный характер, и если изучать агрегированные данные, то обнаружить нарушения вряд ли удастся. Аналогичные проблемы стоят и во множестве других сфер деятельности: выявление фактов мошенничества в страховом бизнесе, принятие решения об открытии кредитной линии банком и т.п. Общим для этих случаев является поиск в массиве данных, хотя и относительно редких, но важных событий, в той или иной мере обладающих устойчивыми характерными признаками. Безусловно, сказанное выше не означает, что OLAP-технологии не применимы в аналитических системах различного рода силовых структур. Они отлично работают в случае, когда речь идет об анализе статистической информации. Например, ведение статистики правонарушений по регионам

Короткая ссылка