USER-MASTER.ORG

Емельянов С. Л. Использование методов научно-технического прогнозирования для добывания охраняемых сведений на основе анализа открытых источников / С. Л. Емельянов // Науковий журнал “Інформаційна безпека”. – 2010. – Вип. 2(4), м. Луганськ: Східноукраїнський національний університет імені Володимира Даля. – С.117-121.

УДК 681.3.06

Обосновывается возможность и приводится пример добывания охраняемых сведений на основе корреляционно-регрессионного анализа данных из открытых источников информации.

Введение

Известно, что анализ открытых источников (ОИ) является одним из основных направлений деятельности любой разведки мира, поскольку позволяет добывать, по разным оценкам, от 80 до 95% разведываемой информации [1-3].

К использованию ОИ относят способы добывания информации, реализуемые путем анализа газет, книг, научных и технических изданий и публикаций, официальных отчетов, рекламных проспектов, бюллетеней, Интернет-ресурсов и других ОИ, режим доступа к которым не ограничен правовыми нормами.

При анализе ОИ в целях разведки актуальной является проблема разработки эффективных методов и технологий обработки открытой информации в целях добывания охраняемых сведений.

Решение данной проблемы, на наш взгляд, наиболее продуктивно рассматривается применительно к конкурентной разведке (называемой также экономической, деловой, коммерческой, competitive intelligence, business intelligence и др.) [2, 3]. В этой сфере уже сегодня применяются специальные программные пакеты класса Deep Mining, позволяющие вести эффективный поиск в массивах электронных данных и в Интернете, Business Intelligence, способные автоматически анализировать поступающие электронные данные по заданным алгоритмам, различные виды прогнозирующих и экспертных систем, которые в результате исследования информации могут оценивать тенденции развития объектов и вероятность проявления кризисных явлений, осуществлять мониторинг обстановки, визуализировать результаты и формировать отчеты [3].

Однако, засекречивание информации по-прежнему играет большую роль во многих направлениях науки и техники, не только близких к военно-промышленному комплексу. По данным российских ученых, в области, например, неорганической химии засекречивается от 50 до 80 % информации, создаваемой и накапливаемой фундаментальной наукой, и (90…95)% новой информации в прикладной науке [4].

Наивно предполагать, что в процессе обработки даже большого объема открытой информации, можно непосредственно “наткнуться” на охраняемые сведения. Например, по оценкам [2], только (10…15)% нужной для ведения экономической разведки информации имеется в Интернет, а остальные (85…90)% получаются в результате сравнения, анализа и синтеза разрозненных и разбросанных по разным открытым источникам сведений.

В связи с этим актуальной задачей является исследование возможности применения методов научно-технического прогнозирования (НТП) при анализе ОИ, позволяющих восстановить отдельные причинно-следственные связи в деятельности, структуре и характеристиках разведываемых объектов, в том числе получить количественные оценки некоторых защищаемых сведений.

Целью статьи является исследование возможности применения методов НТП для получения охраняемых сведений на основе использования пакета корреляционно-регрессионного анализа типа SPSS (Statistica Package for the Social Science – статистический пакет для социальных наук).

Основная часть

Методы НТП могут быть основаны на [5]:

  • экстраполяции тренда и авторегрессии путем математической обработки значений характеристики, принимавшихся на ретроспективном периоде развития, которые позволяют рассчитать числовое значение характеристики на заданный момент времени и оценить точность прогнозирования;
  • корреляционном анализе на основе математической обработки совокупности характеристик образцов-аналогов, которые позволяют установить вид их взаимосвязи и по набору известных характеристик нового образца рассчитать значения неизвестных характеристик, которые являются объектом защиты;
  • получении опережающей информации на основе анализа темпов научно-технических публикаций и тематики патентования, позволяющих сформировать облик нового изделия, являющегося объектом защиты;
  • построении сценариев и морфологического анализа на основе совокупной информации об организации-разработчике и рынках сбыта, позволяющие определить варианты облика нового образца и диапазоны значений его характеристик, и др.

Предположим, что органы разведки имеет в своем распоряжении совокупность данных, характеризующих ТТХ советских (российских) самолетов-истребителей различных типов и производителей (Табл. 1) [6].

Таблица 1

Основные ТТХ советских (российских) истребителей

№ п/п Тип истребителя R –
Размах крыла,
м /
в % к Σ
L –
Длина,
м /
в % к Σ
H –
Высота,
м /
в % к Σ
M –
Макс. масса,
кг /
в % к Σ
V –
Макс. скорость,
км/час /
в % к Σ
1 МиГ-29К 11,99 / 10,94 17,37 / 11,08 5,18 / 11,127 22400 / 9,583 2300 / 11,358
2 Су-30 14,7 / 13,413 21,93 / 13,68 5,93 / 12,738 29940 / 12,809 2500 / 12,346
3 МиГ-29С 11,35 / 10,356 15,32 / 9,557 4,73 / 10,16 19700 / 8,428 2450 / 12,099
4 Су-35 14,7 / 13,413 22,18 / 13,836 6,43 / 13,812 34000 / 14,546 2500 / 12,346
5 Су-27 14,7 / 13,413 21,935 / 13,683 5,932 / 12,742 30000 / 12,835 2500 / 12,346
6 Су-37 14,698 / 13,41 22,183/ 13.838 6,433 / 13,812 34000 / 14,546 2500 / 12,346
7 МиГ-31 13,46 / 12,281 22,69 / 14,154 6,15 / 13,21 45900 / 19,637 3000 / 14,815
8 МиГ-23 13,46 / 12,774 16,7 / 10,417 5,77 / 12,394 17800 / 7,615 2500 / 12,346
  Σ 109,058 160,308 46,555 233740 20250
 F4-H "Фантом" 11,7 / 9,98 17,38 / 10,84 4,95 / 10,63 20231 / 8,66 2390 / 11,8

На основании данных Табл. 1 можно построить корреляционно-регрессионную модель зависимости одних переменных от совокупности других, на основе которой с большой вероятностью прогнозировать (предсказывать) значения неизвестных (“секретных”) характеристик аналогов по совокупности известных параметров.

Например, найдем на основе линейной регрессии зависимость максимальной скорости истребителя V от его длины L, массы M, высоты H и размаха крыла R, используя программный пакет SPSS.

Уравнение регрессии в этом случае будет иметь вид [7]

. (1)

Здесь Vпр – прогноз значения максимальной скорости; CONST – некоторая константа; L, M, H, R – соответствующие ТТХ истребителей из Табл. 1; tk (k=1…4) – коэффициенты регрессии. При этом все переменные (независимая и зависимые), входящие в (1), берутся в относительных единицах (нормируются, например, к суммарному значению Σ соответствующих характеристик – предпоследняя строка в Табл. 1).

На рис. 1 показаны фрагменты выводимых данных, сгенерированных программой SPSS в ходе проведения регрессионного анализа. Обозначения и физический смысл параметров и коэффициентов, фигурирующих здесь, можно найти в работах [7, 8].

С учетом данных на рис. 1 (Таблица Coefficients) уравнение (1) принимает вид

. (2)

Реальное значение максимальной скорости V будет отличаться от спрогнозированного на основе (2) значения Vпр на величину остатка прогнозирования Δ [7, 8]

. (3)

Рис. 1. Фрагменты выводимых данных в программе SPSS в режиме регрессионного анализа

В Табл. 2. представлены значения максимальной скорости V (из Табл.1), Vпр, вычисленные на основе (2), и остаток прогнозирования Δ, вычисленный на основе (3), а также дано среднеарифметическое значение остатка прогнозирования Δср.

Таблица 2

Результаты расчетов по регрессионной модели (1-3)

Тип истребителя V [км/час] Vпр [км/час] Δ [км/час] Δср [км/час]
МиГ-29К 2300 2647 – 347  
Су-30 2500 2682 – 182
МиГ-29С 2450 2675 – 225
Су-35 2500 2703 – 203
Су-27 2500 2682 – 182
Су-37 2500 2703 – 203
МиГ-31 3000 2781 + 219
МиГ-23 2500 2631 – 131
Сред. значен. остатка прогн.   – 178,75

Предположим, что в открытой печати появились сведения о “секретном” истребителе США F-4H “Фантом”, содержащие данные о его массогабаритных характеристиках L, M, H, R (последняя строка в Табл. 1).

На основании (2) и характеристик в последней строке Табл. 1 имеем спрогнозированное значение максимальной скорости

=12,803-6,527·0,1084+8,609·0,0866-3,232·0,1063+4,796·0,0998≈2,975.

Учитывая, что полученное значение пронормировано в % относительно Σ=20250 [км/час], получаем ≈2627 км/час.

Учитывая среднее значение найденного остатка прогнозирования Δср=-178,75 [км/час], окончательно имеем

[км/час].

Нетрудно заметить, что погрешность прогнозирования δ для данного примера составляет около 5%.

Выводы

  1. Применение методов научно-технического прогнозирования при анализе открытых источников может позволить с достаточной точностью оценить неизвестные разведке (защищаемые) сведения.
  2. С этой целью могут использоваться корреляционно–регрессионные зависимости, полученные для образцов–аналогов разведываемого объекта, например, с помощью программного пакета SPSS.
  3. Целесообразны дальнейшие исследования возможности применения методов научно-технического прогнозирования для добывания охраняемых сведений на основе анализа открытых источников.

Литература

  1. Хорошко В. А. Методы и средства защиты информации / В. А. Хорошко, А. А. Чекатков. – Юниор, 2003. – 504 с.
  2. Доронин А. И. Бизнес-разведка. – 2-ое изд., перераб. и доп./ А. И. Доронин. – М.: Изд-во «Ось-89», 2003. – 384 с.
  3. Митрофанов А. А. Экономическая безопасность коммерческих предприятий и деловая разведка [Электронный ресурс] / А. А. Митрофанов. – Режим доступа: http://www.bre.ru/security/22843.html.
  4. Веревченко А. П. О доступности информационных ресурсов (Часть 3) [Электронный ресурс] / А. П. Веревченко. – Режим доступа: http://www.It2b.ru/It2b2.view3.page178.html.
  5. Глущенко В. В. Прогнозирование. – 3-е издание / В. В. Глущенко. – М.: Вузовская книга, 2002. – 208 с.
  6. Техника / Авиация по странам / Самолеты России [Электронный ресурс]. – Режим доступа: http://ru.wikipedia.org/wiki (Википедия. Свободная энциклопедия).
  7. Наследов А. Д. SPSS: Компьютерный анализ данных в психологии и социальных науках / А. Д. Наследов. – СПб.: Питер, 2005. – 416 с.
  8. Дубнов Ю. П. Обработка статистической информации с помощью SPSS / Ю. П. Дубнов. – М.: ООО “Издательство АСТ: НТ Пресс”, 2004. – 221 с.

Добавить комментарий

Защитный код
Обновить

Поиск