Ранговые распределение. Ранговые распределения для определения пороговых значений сетевых переменных и анализа DDoS атак Ранговое распределение

Лекция 5.

технологияРАНГОВогоАНАЛИЗа

ТЕХНОЦЕНОЗОВ

Вводные замечания

Ранговый анализ как основной инструмент техноценологического метода исследования больших технических систем определенного класса, базируется на трех основаниях: технократическом подходе к окружающей реальности, восходящем к третьей научной картине мира; началах термодинамики; негауссовойматематической статистике устойчивых безгранично делимых распределений.

Центром третьей научной картины мира представляется фундаментальное понятие, дополняющее принципиально новым стратификационным уровнем онтологическое описание окружающей реальности. Это техноценоз, главной отличительной чертой которого является специфика связей между техническими элементами-особями. В техноценозах сегодня видится прообраз будущей техносферы, которая по сложности организации и скорости эволюции превзойдет порождающую ее биологическую реальность.

Специфика техноценозов состоит в методологических основаниях их исследования. Техноценозы не поддаются описанию ни традиционными методами гауссовой математической статистики, оперирующей понятиями среднего и дисперсии как информативно насыщенными свертками больших массивов статистической информации, ни лежащими в основе редукционизма имитационными моделями. Чтобы корректно описать техноценоз, необходимо постоянно оперировать выборкой в целом, как бы велика она ни была, что предполагает построение видовых и ранговых распределений, теоретическая основа которых лежит в области негауссовой математической статистики устойчивых безгранично делимых распределений.

Методики построения видовых и ранговых распределений и их последующее использование в целях оптимизации техноценоза составляют основной смысл рангового анализа, содержание и технология которого представляют собой, по сути, новое фундаментальное научное направление, сулящее большие практические результаты.

Целевая установка лекции – подробно изложить методологию рангового анализа, систематизировать его технологию, включающую процедуры описания, обработки статистики, построения видовых и ранговых распределений, а также номенклатурной и параметрической оптимизации техноценозов.

5.1. Методикапостроения ранговых распределений

В основе рангового анализа лежит весьма сложный математический аппарат. Однако, как и в любой фундаментальной теории, здесь имеется определенный вполне доступный уровень решения задач, фактически граничащий с инженерной методологией. Глубокая теоретическая проработка, всестороннее философское осмысление и многократное апробирование на практике в самых различных областях человеческой деятельности позволяют считать ранговый анализ вполне надежным и, как мы теперь видим, единственным эффективным средством решения задач определенного класса (рис. 5.1).

Как представляется, ранговый анализ, позволяя решать задачи оптимального построения техноценозов, занимает своего рода промежуточное положение между имитационным модели-

рованием,спомощьюкоторогоосуществляетсяэффективное проектирование отдельных видов техники, и методологией исследования операций, применяемой в настоящее время для решения проблем геополитического и макроэкономического планирования. В этой связи представляется важным отметить два момента. Во-первых, отсутствие достаточно глубоко разработанной специальной математической методологии делает аппарат исследования операций весьма ненадежным при решении задач соответствующего макроуровня и приводит, с одной стороны, к многочисленным безрезультатным попыткам применения имитационного моделирования в сфере геополитики и макроэкономики, а с другой, – порождает недоверие к данной методологии со стороны большинства практиков, которые до сих пор предпочитают в большей мере полагаться в этих вопросах на свою интуицию.

Во-вторых, все попытки выдвигать требования, основанные на макропрогнозах, непосредственно разработчикам отдельных видов техники либо политика последних, заключающаяся в полном игнорировании геополитических и макроэкономических процессов, с одинаковым успехом приводят к провалу. Думается, именно техноценологическая методология может разрешить проблему органической связи между крайними уровнями современных технических задач (рис. 5.1).

В рамках лекции, безусловно, нет возможности подробно разобрать техноценологический подход во всей его глубине. Мы и не ставим перед собой такую задачу. Однако в первом приближении (как говорится, на инженерном уровне) рассмотреть ранговый анализ представляется возможным.

Итак, ранговый анализ включает следующие этапы-процедуры:

1. Выделение техноценоза.

2. Определение перечня видов в техноценозе.

3. Задание видообразующих параметров.

4. Параметрическое описание техноценоза.

5. Построение табулированного рангового распределения.

6. Построение графического рангового видового распределения.

7. Построение ранговых параметрических распределений.

8. Построение видового распределения.

9. Аппроксимация распределений.

10. Оптимизация техноценоза.

Обратим внимание на одну терминологическую особенность. Дело в том, что термин «ранговый анализ», хотя и стал уже традиционным, не совсем точен. Правильнее было бы пользоваться термином «ранговый анализ и синтез», т.к. в десяти перечисленных процедурах имеются операции как анализа, так и синтеза. Однако не будем вводить новых понятий и ограничимся существующим, толкуя его расширительно (аналогично терминам «корреляционный анализ», «регрессионный анализ», «фактор-анализ» и др.).

Рассмотрим процедуры рангового анализа более подробно.

1. Выделение техноценоза

Первая процедура трудно формализуется из-за проблем, которые в техноценологической теории называют конвенционностью границ и фрактальностью видообразования (в совокупности приводящими к трансцендентности техноценозов), следствием чего являются ограниченность и зависимость реально существующих техноценозов. Не вдаваясьв теоретические дебри, сформулируем лишь ряд рекомендаций по выделению техноценоза, которые непосредственно следуют из его определения.

Во-первых, техноценоз должен быть локализован (отграничен) в пространстве и времени. Эта операция требует от исследователя некоторой решительности, ибо он должен понимать, что абсолютно точного выделения техноценозаникому и никогда сделать не удастся. Кроме того, техноценоз постоянно изменяется («живет», эволюционирует), поэтому исследовать его надо без промедления. Принципиальным является также и то, что в техноценозе должно быть представлено значительное количество (тысячи, десятки тысяч) отдельных технических изделий различных видов (изготовленных по разной технической документации), не связанных друг с другом сильными связями. То есть техноценоз – это не отдельное изделие, а их многочисленная совокупность.

Во-вторых, в техноценозе должна явно просматриваться единая инфраструктура, в которую входят системы управления и всестороннего обеспечения функционирования. Самое главное – в техноценозе должна наличествовать и четко формулироваться единая цель, заключающаяся, как правило, в получении наибольшего положительного эффекта при наименьших затратах. Безусловно, среди элементов техноценоза может иметь место конкуренция, однако и она должна быть направлена на достижение общей цели. В этом смысле техноценозами, как правило, не могут считаться цеха предприятия, либо два-три завода, не связанных между собой системой управления, либо город в целом. Нельзя считать техноценозом и несколько взаимосвязанных предприятий, если они составляют лишь часть системы. Если говорить о группировках войск, то техноценозами являются дивизия, армия, фронт, однако, отдельно взятые войска связи фронта или армейская авиация (как и любой другой род войск) таковыми не являются.

Выделение техноценоза сопровождается его описанием. Рекомендуется создать для этого специальную базу данных, включающую максимально систематизированную и стандартизированную, достаточно полную и в то же время без излишних частностей информацию о видах и особях техноценоза. Информация структурируется по оргштатным подразделениям. Доступ к ней должен быть, по возможности, автоматизирован, необходимо предусмотреть процедуры ее анализа и обобщения в интерактивном режиме. При этом следует максимально использовать возможности компьютерной техники (в частности, стандартные приложения Windows: Access, Excel, Fox-pro и др.).

2. Определение перечня видов

Эта процедура рангового анализа так же сложна и трудноформализуема. Суть ее заключается в определении полного перечня видов техники в уже выделенном техноценозе. Делается это путем анализа разработанной информационной базы.

Как мы уже знаем, вид техники выделяется как единица, на которую имеется отдельная конструкторско-технологическая документация. Однако и здесь есть свои нюансы. Дело в том, что большинство современных технических изделий состоят из других изделий, на которые, в свою очередь, также имеется своя документация. Следовательно, нужно исходить из того, что вид техники должен быть функционально законченным, относительно независимым. В этом смысле видом техники может быть признана лопата, а процессорный блок компьютера – нет. Лопата может выполнять свои функции (копать землю), а процессорный блок, будучи взят отдельно, никому не нужен.

Сложность заключается и в том, что всегда одновременно существует множество модификаций одного и того же вида техники, и в какой момент из очередной модификации возникает новый вид, определить очень не просто. Ясно, что один вид от другого должен отличаться существенно. Критерием такого отличия является либо отличие одного из важнейших классификационных параметров назначения (мощности, скорости, напряжения, частоты, дальности и др.), либо наличие в конструкции принципиально нового функционально важного узла, блока, агрегата (двигателя, генератора, навесного оборудования, транспортной базы, шасси, кузова и др.).

По опыту исследования техноценозов (в различных областей человеческой деятельности), в перечне видов рекомендуется иметь двести-триста наименований (при общем количестве технических изделий-особей до десятков тысяч единиц). Составляя перечень, важно активно использовать существующие стандартные номенклатуры, классификации, оргштатные структуры, требования, нормали, технические описания и др. Однако в любом случае следует стремиться к тому, чтобы перечень видов был, с одной стороны, исчерпывающим, а с другой, – равномерным с точки зрения детализации по модификациям. Имеется ввиду, что не должно быть такого положения, когда какой-то из видов представлен лишь одной модификацией, а другой – десятью.

Выделенный перечень видов должен быть зафиксирован в отдельном списке и многократно перепроверен различными специалистами.

3. Задание видообразующих параметров

Выполняя эту процедуру рангового анализа, в качестве видообразующих рекомендуется задавать несколько функционально значимых для техноценоза, физически измеряемых и доступных для исследования параметров. Желательно, чтобы они были комплексными и в совокупности представляли группу, достаточно полную для качественного описания техноценоза с точки зрения его конечной цели функционирования. Такими параметрами могут быть стоимость, энергетическая мощность, сложность структуры (если ее можно описать), надежность, живучесть, численность обслуживающего персонала, массогабаритные показатели, топливная экономичность и др. Как видим, любой из перечисленных параметров весьма емко характеризует технические изделия. Наиболее важными из них представляются стоимость, энергетическая мощность и количество обслуживающего персонала (безусловно, включая и тот персонал, который осуществляет всестороннее обеспечение функционирования данного вида техники). Представляется, что именно эти параметры наиболее емко отражают энергию, овеществленную в то или иное техническое изделие при его изготовлении.

4. Параметрическое описание техноценоза

После задания видообразующих параметров необходимо определить и внести в базу данных техноценоза конкретные значения этих параметров, которыми обладает каждый вид техники из его состава. Это длительная и кропотливая статистическая работа, однако вполне доступная для каждого исследователя. Следует лишь стремиться к тому, чтобы была применена единая система измерения, т.е. для разных видов параметр должен определяться в одних и тех же единицах (килограммах, киловаттах, рублях по одному курсу, человеко-часах и др.). В создаваемой информационной базе техноценоза, естественно, должны изначально предусматриваться соответствующие поля для последующего внесения значений конкретных параметров.

Работа по созданию информационной базы техноценоза завершается после того как будет создана многомерная электронная таблица (база данных, включающая банк данных и систему управления), которая вбирает в себя систематизированную в определенном порядке (по укрупненным видам техники, подразделениям техноценоза, граничным значениям параметров или другим признакам) информацию о видах технических изделий, входящих в техноценоз, и значениях видообразующих параметров, которыми характеризуется каждый из этих видов.

Ключевым параметром, о котором мы пока не говорили, но который обязательно должен присутствовать в сформированной базе данных, причем на первом месте, является количество единиц техники каждого из видов, которым они представлены в техноценозе. Мы знаем, что группа технических изделий одного вида в составе техноценоза называется популяцией, а их численность – мощностью популяции.

Здесь полезным будет еще раз напомнить о принципиальной разнице между видом и особью. Вид – это абстрактное объективированное понятие, по сути, наше внутреннее представление об облике технического изделия, сформированное на основе знаний и опыта. Вид мы именуем маркой или образцом техники (автомобиль ЗИЛ-131, электростанция ЭСБ-0,5-ВО, большая саперная лопата, космический корабль «Прогресс» и др.). В составе исследуемого техноценоза функционирует техническая особь, например конкретный автомобиль (марка – ЗИЛ-131, шасси – № 011337, заводской номер двигателя – 17429348, пробег на данный момент – 300 тыс. км, водитель – Иванов, на левом борту кузова – грязное масляное пятно). Всего в техноценозе в данный момент наличествует 150 автомобилей марки ЗИЛ-131. Таким образом, в базе данных у нас будет в каком-то месте фигурировать запись: вид – автомобиль ЗИЛ-131; предназначение – перевозка грузов; количество в техноценозе (мощность популяции) – 150 единиц; стоимость – 10 тыс. долларов; масса – 5 тонн и т.д.

5. Построение табулированного рангового

распределения

Первые четыре процедуры завершают так называемый информационный этап рангового анализа. Следующий, аналитический этап, по сути, сводится к построению на основе информационной базы данных ранговых и видовых распределений техноценоза. Исходным здесь является табулированное ранговое распределение.

Вообще под ранговым распределением понимается распределение Ципфа в ранговой дифференциальной форме, являющееся результатом аппроксимации полученной в процедуре упорядочения видов техноценоза невозрастающей последовательности значений параметра, поставленных в соответствие рангу. В качестве параметра может рассматриваться численность, которой представлены виды в техноценозе (мощность популяции). В этом случае распределение называется ранговым видовым. А может фигурировать какой-либо из видообразующих параметров – тогда распределение будет ранговым параметрическим. В технологии построения распределений есть существенная специфика, однако об этом чуть позже. Ранг вида или особи есть комплексная характеристика, определяющая их место в упорядоченном распределении. Ранжирование имеет глубокое энергетическое обоснование и фундаментальное философское значение. Однако не будем вдаваться в детали и скажем лишь, что для нас ранг – это номер вида по порядку в некотором распределении.

Табулированное ранговое распределение объединяет в себе всю статистику о техноценозе, значимую с точки зрения техноценологического подхода вообще. По форме это таблица. Ниже представлен вариант данного распределения (табл. 5.1). Как видим, первую строчку таблицы занимает запись о самом многочисленном видетехники (в данном случае анализировалась электроэнергетическая инфраструктура группировки войск, а в качестве видов рассматривались электротехнические средства). На второе место поставлена вторая по численности электростанция и так далее вплоть до уникальных для данного техноценоза видов, которых всего по единице.

Таблица 5.1

Пример табулированного рангового распределения техноценоза

Ранг

Вид ЭТС

Количество в группировке, ед.

Видообразующий параметр

м ощность, кВт

с тоимость, $

м асса, кг

……

АБ-0,5-П/30

2349

……

ЭСБ-0,5-ВО

1760

……

АБ-1-О/230

1590

……

АБ-1-П/30

1338

……

ЭСБ-1-ВО

1217

1040

……

ЭСБ-1-ВЗ

1170

……

АБ-2-О/230

1093

1500

……

АБ-2-П/30

1540

……

АБ-4-Т/230

1990

……

……

……

……

……

……

……

……

……

……

……

……

……

……

……

ЭСД-100-ВС

85000

3400

……

ЭД200-Т400

120000

4200

……

ЭД500-Т400

250000

6700

……

ЭД1000-Т400

1000

340000

9300

……

ПАЭС-2500

2500

500000

13700

……

Существенной для нас является закономерность: чем меньше численность вида в техноценозе, тем выше его основные видообразующие параметры. И хотя кое-где имеются отклонения от этой закономерности, общая тенденция очевидна. И в этом находит свое проявление один из фундаментальнейших законов природы.

6. Построение графического рангового

видового распределения

Ранговое видовое распределение может быть изображено в графической форме. Оно представляет собой зависимость количества технических особей, которым представлен вид в техноценозе, от ранга (рис. 5.2 – для примера, приведенного в табл. 5.1). По сути, график рангового видового распределения есть совокупность точек, однако для наглядности на рисунке изображены также и гладкие аппроксимирующие кривые. Но о них несколько позже.


Каждой точке графика соответствует определенный вид техники.При этом абсцисса на графике–ранг, а ордината–число особей, которым этот вид представлен в техноценозе. Все данные берутся из табулированного распределения.

7. Построение ранговых параметрических распределений

В ходе рангового анализа техноценоза по табулированному распределению строятся также графики ранговых распределений по каждому из видообразующих параметров. Однако здесь прослеживается определенная специфика, заключающаяся в том, что если в ранговом распределении ранжируются виды, то в параметрическом – особи. На рисунке 5.3 приведен график параметрического распределения по мощности (в киловаттах) для примера, приведенного в таблице 5.1. Так как в техноценозах могут насчитываться десятки тысяч технических особей, то построить график параметрического распределения в одних осях для всего техноценоза не представляется возможным. Для наглядности его делят на фрагменты с соответствующим масштабом.


Как мы уже отметили, в ранговом параметрическом распределении каждой точке соответствует не вид, а особь. Первый ранг присваивается особи, имеющей наибольшее значение параметра, второй – особи, имеющей наибольшее значение параметра среди особей, кроме первой, и так далее. Здесь необходимо сделать ряд замечаний. Во-первых, как нам теперь понятно, ранг на рисунке 5.3 (он называется параметрическим) не соответствует рангу (видовому) на рисунке 5.2. Теоретически между ними имеется связь, однако она чрезвычайно сложна. Во-вторых, т.к. в пределах вида мы принимаем значение видообразующего параметра одним и тем же, то на графике параметрического распределения все особи этого вида будут изображены точками с одинаковыми ординатами. Количество этих точек будет равно количеству особей данного вида в техноценозе. Сам жеграфик состоит как бы из горизонтальных отрезков различной длины. В-третьих, виды на ранговом видовом распределении и особи на ранговом параметрическом, имеющие одинаковые ординаты, ранжируются произвольно. В-четвертых, ранжировка особей по различным параметрам, хотя в целом и схожа, однако точно никогда не соответствует одна другой, что также важно учитывать, чтобы не ошибиться. У каждого параметрического распределения свой ранг.

8. Построение видового распределения

Среди распределений рангового анализа особое место занимает видовое. Есть мнение, что оно является наиболее фундаментальным. Имеются теоретическое обоснование и эмпирическое подтверждение тому, что, с одной стороны, видовое и ранговое видовое есть взаимообратные формы одного распределения, а с другой, – что бесконечная совокупность (континуум) ранговых параметрических распределений техноценоза математически свертывается в одно видовое.

По определению, под видовым понимается безгранично делимое распределение, устанавливающее в непрерывной или дискретной форме упорядоченную взаимосвязь между множеством возможной численности особей техноценоза и количеством видов данных особей, реальнопредставленных в техноценозе фиксированной численностью.

Видовое распределение в графической форме (рис. 5.4) строится по табулированному распределению. На рисунке показано распределение (которое, строго говоря, является совокупностью точек) для примера, приведенного ранее в таблице 5.1. Ясно, что его, как и ранговое параметрическое, практически невозможно изобразить в одних осях, поэтому обычно видовое распределение изображают фрагментами с удобным масштабом (один из таких фрагментов показан на рис. 5.4).


Еще раз уточним, как строится видовое распределение. Итак, по оси абсцисс откладывается возможная численность особей одного вида (возможная мощность популяции) в техноценозе. Очевидно, что особей может быть одна, две, три и т.д. вплоть до цифры, соответствующей максимальной по объему популяции. Иными словами, это ряд натуральных чисел в порядке возрастания. По оси ординат откладывается количество видов, представленных в анализируемом техноценозе данной численностью. Как видно из табулированного рангового распределения, одной особью у нас представлено четыре вида (ЭД200-Т400, ЭД500-Т400, ЭД1000-Т400, ПАЭС-2500). Поэтому мы откладываем точку с координатами (1,4). Двумя особями представлено три вида – точка (2,3); тремя особями два вида – точка (3,2); четырьмя, пятью, семью и восемью особями представлено по одному виду – точки (4,1); (5,1); (7,1); (8,1), а вот шестью особями не представлен ни один вид, поэтому среди точек графика имеется точка с координатами (6,0). Последняя точка имеет координаты (2349,1).

Сделаем еще несколько важных замечаний. Во-первых, все точки с нулевыми ординатами должны учитываться в последующей процедуре аппроксимации. Во-вторых, теоретически в видовом распределении заложена фундаментальная тенденция: чем больше численность в техноценозе (больше цифра по оси абсцисс), тем меньше разнообразие видов (меньше количество видов по оси ординат). Это закон природы. Однако в отличие от ранговых распределений (которые всегда убывающие) в видовом распределении не производится ранжирование, поэтому на его графике присутствуют точки, которые как бы аномально отклоняются от сформулированного выше правила. На рисунке 5.4 такие точки видны (например, (6,0)). Там, где имеется сгущение аномально отклоненных точек (как в ту, так и в другую сторону), мы фиксируем так называемые зоны номенклатурных нарушений в техноценозе.

Попробуем разобраться, что означают аномальные отклонения в видовом распределении (при этом вспомним закон оптимального построения техноценозов). Если точки отклоняются ниже некоторой гладкой аппроксимирующей кривой, то это означает, что в аномальной зоне номенклатурного ряда техноценоза отмечается завышенная унификация техники. А мы знаем, что любая унификация приводит к снижению функциональных показателей, т.е. эта техника недостаточно надежна, ремонтопригодна, хуже массогабаритные показатели и т.д. Если же точки отклоняются выше кривой, то здесь неоправданно большое разнообразие техники, что непременно скажется (в худшую сторону) на функционировании обеспечивающих систем (труднее доставать запчасти, готовить обслуживающий персонал, подбирать инструмент и т.д.) В любом случае, отклонение – это аномалия.

В заключение отметим, что для наглядности иногда видовые распределения строят в виде гистограмм, однако никакого теоретического значения это не имеет.

9. Аппроксимация распределений

Как мы уже отмечали, строго математически каждое распределение в графической форме представляет собой совокупность точек, получаемых по эмпирическим данным:

(x 1, y 1); (x 2 , y 2); …; (x i , y i); …; (x n , y n), (5.1)

где i –формальный индекс;

n – общее количество точек.

Точки – результат анализа табулированного рангового распределения техноценоза. Для каждого из распределений имеется свое число точек (что есть абсцисса в распределении, а что ордината, мы уже знаем). С точки зрения последующей оптимизации техноценоза большое значение имеет аппроксимация эмпирических распределений. Ее задача заключается в подборе аналитической зависимости, наилучшим образом описывающей совокупность точек (5.1). Мы задаемв качестве стандартной формы гиперболическое аналитическое выражение вида

(5.2)

где А и α – параметры.

Выбор формы (5.2) объясняется традиционно сложившимся подходом среди исследователей, занимающихся ранговым анализом. Безусловно, данная форма далеко не самая совершенная, однако она обладает неоспоримым достоинством – сводит задачу аппроксимации к определению всего двух параметров: А и α . Решается эта задача (также традиционно) методом наименьших квадратов.

Суть метода заключается в отыскании таких параметров аналитической зависимости (5.2) А и α , которые минимизируют сумму квадратов отклонений реально полученных в ходе рангового анализа техноценоза эмпирических значений y i от значений, рассчитанных по аппроксимационной зависимости (5.2), т.е.:

(5.3)

Известно, что решение задачи (5.3) сводится к решению системы дифференциальных уравнений (для (5.2) – двух с двумя неизвестными):

Ниже приводится текст программы:

В итоге после аппроксимации мы получаем двухпараметрическую зависимость вида (5.2) для каждого из распределений. На этом собственно аналитическая часть рангового анализа заканчивается.

5.2. Оптимизация техноценоза на основе

ранговыхраспределений

Ранговый анализ никогда не заканчивается с определением соответствующих распределений техноценоза. За ним всегда следует оптимизация, т. к. нашей главной задачей всегда является определение направлений и критериев улучшения существующего техноценоза. Оптимизация является одной из сложнейших проблем техноценологической теории. Этому направлению исследований посвящено значительное число работ. И хотя это отдельный серьезный разговор мы все же рассмотрим несколько простейших оптимизационных процедур, хорошо апробированных на практике.

Первая процедура – определение направления трансформации рангового видового распределения. Она основывается на понятии об идеальном распределении (рис. 5.5), которое на рисунке обозначено цифрой 2. Единицей обозначено реально полученное в результате анализа техноценоза ранговое видовое распределение. Здесь Λ – это количество видов, а r в – видовой ранг (см. рис. 5.2).

Как показывает многолетний опыт исследования техноценозов из различных областей человеческой деятельности, наилучшим является такое состояние техноценоза, при котором в аппроксимационном выражении рангового видового распределения

(5.13)

параметр β находится в пределах

0,5 ≤ β ≤ 1,5.(5.14)

Кстати, закон оптимального построения техноценозов гласит, что оптимальное состояние достигается при β = 1. Однако это распространяется лишь на некий идеальный техноценоз, функционирующий абсолютно изолированно. Таких на практике не бывает, поэтому можно пользоватьсяинтервальной оценкой (5.14). На рисунке 5.5 для лучшего понимания показана идеальная кривая (с β = 1), а не полоса, удовлетворяющая требованию (5.14).

Из рисунка видно, что реальное распределение резко отличается от идеального, причем кривые пересекаются в точке R . Отсюда вывод: среди видов техники с рангамиr в < R следует увеличивать разнообразие, и одновременно там, где r в > R , наоборот, проводить унификацию, что на рисунке проиллюстрировано стрелками. Такой представляется первая оптимизационная процедура.

Вторая процедура – устранение аномальных отклонений на видовом распределении. Как уже отмечалось, на видовом распределении техноценоза можно выделить области максимальных аномальных отклонений (они показаны, хотя и весьма условно, на рисунке 5.6).

Здесь мы отчетливо видим как минимум три ярко выраженные аномалии, где реально полученные в ходе анализа эмпирические точки явно отклоняются от плавной аппроксимационной кривой. При этом кривая строится, как мы уже знаем, методом наименьших квадратов по данным табулированного рангового распределения и описывается выражением

(5.15)

где Ω – количество видов (см. рис. 5.4.);

х – непрерывный аналог мощности популяции;

ω 0 и α – параметры распределения.

После выявления аномалий на видовом распределении по тому же табулированному распределению определяются виды техники, «ответственные» за аномалии, и намечаются первоочередные мероприятия по их устранению. При этом отклонения вверх от аппроксимирующей кривой свидетельствуют о недостаточной унификации, а вниз – наоборот, об избыточной.

Следует заметить, что первая и вторая процедуры взаимосвязаны, причем первая показывает стратегическое направление изменения видовой структуры техноценоза в целом, а вторая – помогает локально выявить «самые больные» зоны в номенклатуре (перечне видов) техники.

Третья процедура – верификация номенклатурной оптимизации техноценоза (рис. 5.7). Очевидно, что в любом реальном техноценозе номенклатурная оптимизация, осуществляемая в рамках первой и второй процедур, может быть выполнена лишь в течение длительного промежутка времени. Кроме того, реализация на практике предлагаемых мероприятий может натолкнуться на ряд трудностей субъективного характера. Поэтому весьма полезной представляется дополнительная оптимизационная процедура – верификация (рис. 5.7).

Для ее осуществления требуется статистическая информация о состоянии техноценоза за обозримый промежуток времени. Это позволит исследователю построить зависимость параметра β рангового видового распределения во времени t . Предположим, что эта зависимость получилась такой, как показано на рисунке 5.7. То есть, видовой состав техноценоза со временем трансформировался, изменялся и параметр β . С зависимостью β(t) на одном графике необходимо сопоставить зависимость E(t) , где Е – некоторый ключевой параметр, характеризующий функционирование техноценоза в целом, например – прибыль. В случае если дополнительный корреляционный анализ покажет, что взаимообусловленность Е и β значима, сопоставление их временных зависимостей позволит сделать целый ряд чрезвычайно важных выводов. В качестве примера на рисунке 5.7 стрелками показан способ определения оптимального значения β опт .

Четвертая процедура – параметрическая оптимизация (рис. 5.8). Строго говоря, первые три оптимизационные процедуры относятся к так называемой номенклатурной оптимизации. Четвертая, хотя и рассматривается в данном случае как дополнительная к предыдущим, принадлежит к несколько другой сфере и называется, как уже указано, параметрической. Дадим точные определения.

Под номенклатурной оптимизацией техноценоза понимается целенаправленное изменение набора видов техники (номенклатуры), устремляющее видовоераспределение техноценоза по форме к каноническому (образцовому, идеальному). Параметрическая оптимизация – целенаправленное изменение параметров отдельных видов техники, приводящее техноценоз к более устойчивому, и, следовательно, эффективному состоянию.

К настоящему времени теоретически показано, что между процедурами номенклатурной и параметрической оптимизации существует взаимосвязь, когда одну процедуру без другой осуществить практически невозможно. Обе они фактически являются разными сторонами одного процесса. Существует концепция оптимизации техноценозов,по которой номенклатурная оптимизации задает конечное состояние техноценоза, к которому она устремлена, а параметрическая – определяет детальный механизм этого процесса. Не будем углубляться в суть этой концепции (по причине ее достаточной сложности), ограничимся лишь предельно упрощенным вариантом параметрической оптимизационной процедуры.

Ранее мы ознакомились с процессом получения рангового параметрического распределения. Рассмотрим абстрактный пример распределения техноценоза по параметру W (рис. 5.8). Из закона оптимального построения следует, что для любого техноценоза может быть теоретически задана форма так называемого идеального рангового параметрического распределения. На рисунке оно изображено кривой, обозначенной цифрой 2 (реальное – 1). Хорошо видно, что эти два распределения значительно различаются, что свидетельствует об упущениях в научно-технической политике, проводимой при формировании техноценоза.

Если применять ставшую уже традиционной для нас гиперболическую форму распределений

(5.16)

гдеr – параметрический ранг;

W 0 и β – параметры распределения,

то идеальное распределение будет задаваться интервальной оценкой требований к параметру β , причем

0,5 £ β £ 1,5.(5.17)

Исходя из тех же соображений, которые приведены в комментариях к выражению (5.14), в данном случае интервальную оценку заменяют конкретным значением β = 1 . Поэтому на рисунке 5.8 вместо полосы изображена кривая 2.

Суть параметрической оптимизации в данном случае сводится к тому, что после выявления на видовом распределении видов техники, «ответственных» за аномальные отклонения (вторая процедура оптимизации), определяются параметрические ранги этих видов. На рисунке 5.8 подобному виду соответствует точка с координатами (r т, W 1) . Далее по оптимальной кривой 2 определяется значение W 2 , соответствующее той же абсциссе (r т). Очевидно, что W 2 может интерпретироваться как своего рода требование к разработчикам видов техники по данному, конкретному параметру (направление оптимизации показано на рисунке стрелкой). Если в ранговых распределениях провести подобную операцию по всем основным параметрам, можно вести речь о задании комплекса технических требований на разработку или модернизацию видов технических изделий.

Ко всему сказанному имеется ряд замечаний. Во-первых,полученные технические требования не обязательно должны реализовываться напрактике путем разработки новых или модернизации эксплуатируемых видов. Достаточно найти соответствующий требованиям уже существующий образец (если, конечно, он где-тоимеется) и включить его в номенклатуру взамен того, который нас не удовлетворяет.

Во-вторых, что чрезвычайно важно понять, в техноценозе существует глубокая, фундаментальная взаимосвязь между численностью видов техники (объемом популяции) и уровнем их основных видообразующих параметров. Поэтому оптимизация может осуществляться не только за счет изменения параметров, но также и путем изменения численности особей данного вида в техноценозе. Выбор пути целиком зависит от конкретной ситуации. То, как это делается, мы здесь опускаем и адресуем интересующихся к специальной литературе.

И, наконец, последнее замечание по четвертой процедуре оптимизации. В ее простейшем варианте, представленном здесь, могут возникнуть чисто технические трудности с определением параметрического ранга r т . Дело в том, что по табулированному распределению мы можем напрямую определить лишь видовой ранг, т.к. в таблице приводится перечень видов. А на ранговых параметрических распределениях ранжируются все особи. Повторимся и отметим, что теоретически между параметрическим и видовым рангами существует фундаментальная взаимосвязь, однако она очень сложна. Выйти из этого положения можно следующим образом. После выявления вида, требующего параметрической оптимизации (а это делается по видовому распределению), определяется его видовой ранг. Причем по видовому распределению определяется лишь численность этого вида в техноценозе, а уже потом, с учетом численности, по ранговому видовому распределению определяется видовой ранг (и собственно марка данного вида техники). Если одной и той же численностью обладает несколько видов, то принимать решение относительно того, какой из них подвергать оптимизации, должен исследователь. Зная видовой ранг, по табулированному распределению определяем значение параметра, соответствующее данному виду. Откладываем его на ранговом параметрическом распределении (на рис. 5.8 это значение W 1 ) и далее поступаем в соответствии с предложенной выше процедурой.

Мы завершаем изложение общих вопросов рангового анализа. В данной лекции были предложены сравнительно простые методики, и это естественно, т.к. начинать постижение техноценологического метода надо «от простого». Однако опыт многолетних исследований реальных техноценозов свидетельствует, что даже сравнительно несложные методы оказываются эффективными и весьма полезными. Есть основание даже говорить, что для определенного класса задач техноценологический метод вообще и ранговый анализ в частности являются единственными корректными методами исследования и оптимизации.

Джордж Ципф эмпирически установил, что частота использования N-го наиболее часто используемого слова в естественных языках приблизительно обратно пропорциональна числу N и была описана автором в книге: Zipf G.R., Human Behavior and the Principle of Least Effort, 1949

«Он обнаружил, что самое распространённое в английском языке слово («the») используется в десять раз чаще, чем десятое по частоте употребления слово, в 100 раз чаще, чем 100-е по частоте употребления слово, и в 1000 раз чаще, чем 1000-е по частоте употребления слово. Кроме того, было выявлено, что такая же закономерность действует для доли рынка программного обеспечения, безалкогольных напитков, автомобилей, конфет и для частоты обращений к интернет-сайтам. [...] Стало ясно, что в практически в каждой сфере деятельности быть номером один намного лучше, чем номером три или номером десять. Причём распределение вознаграждения отнюдь не равномерно, особенно в нашем опутанном различными сетями мире. А в сети Интернет ставки ещё выше. Рыночная капитализация Priceline, eBay и Amazon достигает 95% совокупной рыночной капитализации всех остальных сфер электронного бизнеса. Вне сомнений, победитель получает очень много».

Сет Годин, Идея-вирус? Эпидемия! Заставьте клиентов работать на ваш сбыт, СПб, «Питер», 2005 г., с. 28.

«Смысл этого явления состоит в том, что […] способность участников творчества входить в законченные произведения распределяется по участникам в согласии с законом произведение числа вхождений на ранг участника (на число участников с той же частотой вхождения) величина постоянная: f r = Const. […] В ранговом списке всех участников творчества, в данном случае слов, как раз и выявляется свойство неравномерного распределения миграционной способности, а с ним и закономерность связи между количеством и качеством в творческой деятельности вообще. […]

Кроме литературных источников Ципф исследовал множество других подозрительных на ранговое распределение явлений - от распределения населения по городам до расположения инструментов на верстаке столяра, книг на столе и стеллаже ученого, повсюду натыкаясь на одну и ту же закономерность.

Независимо от Ципфа близкое распределение было вскрыто Парето при исследовании банковских вкладов, Урквартом при анализе запросов на литературу, Лоткой в анализе авторской продуктивности учёных. Даже боги Олимпа, с точки зрения их нагрузки навыкообразующими и навыкосохраняющими функциями, ведут себя по закону Ципфа.

Усилиями Прайса и его коллег, а позднее усилиями многих науковедов было выяснено, что закон Ципфа имеет прямое отношение к ценообразованию в науке.

Прайс по этому поводу пишет: «Все данные, связанные с распределением таких характеристик, как степень совершенства, полезности, продуктивности, размера подчиняются нескольким неожиданным, но простым закономерностям [...] Является ли точная форма этого распределения логарифмически нормальной или геометрической, или обратно-квадратичной или подчинена закону Ципфа , - это предмет конкретизации для каждой отдельной отрасли. То, что нам известно, состоит в констатации самого факта, что любой из этих законов распределения даёт близкие к эмпирическим результаты в каждой из исследуемых отраслей, и что такое общее для всех отраслей явление есть, видимо, результат действия одного закона». Price D., Regular Patterns in the Organisation of Science, Organon, 1965, N 2., р. 246 ».

Петров М.К. , Искусство и наука. Пираты Эгейского моря и личность, М., «Российская политическая энциклопедия, 1995 г., с. 153-154.

Кроме этого, Джордж Ципф также установил, что наиболее часто употребляемые слова языка, существующего длительное время, короче остальных. Частое употребление «истёрло» их...

Планировение и проведение экспериментов по определению параметров сетевых атак

На следующем этапе по проверке модели трафика необходимо выяснить, можно ли применить данную модель для задач сетевой безопасности, в частности, - для обнаружения сетевых атак.

Для того чтобы выяснить детали несанкционированного вторжения было решено провести эксперименты, имитирующие попытки атак. Они проводились на сети Самарского государственного аэрокосмического университета (СГАУ).

В качестве источника атаки использовались удаленные персональные компьютеры, подключенные к сети Интернет, находящиеся во внешней сети по отношению к исследуемой. Целью атаки являлся один из внутренних серверов сети СГАУ. В качестве NetFlow-сенсора был выбран пограничный маршрутизатор сети СГАУ Cisco 6509, NetFlow-коллектор - тот же сервер, который подвергался атаке.

При проведении сканирования был задействован только один компьютер, поскоольку атака сканирования портов производится с одиночных источников. Для сканирования применялась программа Nmap , которой было предписано провести полное сканирование всех портов атакуемого сервера.

Nmap - свободная утилита, предназначенная для разнообразного настраиваемого сканирования IP-сетей с любым количеством объектов, определения состояния объектов сканируемой сети (портов и соответствующих им служб). Nmap использует множество различных методов сканирования, таких как UDP, TCP (connect), TCP SYN (полуоткрытое), FTP proxy (прорыв через ftp), Reverse-ident, ICMP (ping), FIN, ACK, Xmas tree, SYN- и NULL-сканирование.

При осуществлении DDoS-атаки в качестве атакуемой цели был выбран тот же веб-сервер, что и при сканировании. Источниками атаки служили несколько компьютеров, находящихся во внешней сети. В первой части эксперимента атакующие компьютеры одновременно отправляли в течение получаса ping-запросы, осуществляя атаку ICMP-flood. Во второй части эксперимента атакующие компьютеры проводили DDoS-атаку при помощи специализированной программы LOIC. В течение часа веб-сервер подвергался атаке с применением различных типов трафика: HTTP, UDP, TCP. В ходе всех экспериментов производился сбор данных, которые впоследствии анализировались для выявления закономерностей разных типов атак.

Рисунок 1.16 – Схема эксперимента

Данные о потоках, которые служат основой для анализа, собирались с пограничного маршрутизатора сети Cisco 6509. Для сбора данных с маршрутизатора использовался NetFlow-коллектор nfdump . Экспорт NetFlow данных для анализа проводится с периодичностью пять минут. Каждые пять минут формируется файл с указанием параметров всех потоков, зафиксированных на маршрутизаторе в это время. Эти параметры перечислены во введении и включают в себя: время начала потока, длительность потока, протокол передачи данных, адрес и порт источника, адрес и порт назначения, число переданных пакетов, число переданных данных в байтах.

В результате анализа данных, собранных во время сканирования сети, было выявлено резкое увеличение числа активных потоков при практически неизменном количестве переданного трафика (см. Рис.1.16). Каждый сканирующий компьютер генерировал в течении 5 минут порядка 10-20 тысяч очень коротких потоков (размером до 50 байт). При этом суммарное число активных потоков на маршрутизаторе, генерируемое всеми пользователями, составляло порядка 50-60 тысяч.

На рисунке 1.17 изображен график состояния сети, по оси абсцисс откладывается число завершившихся потоков N, по оси ординат - суммарная нагрузка канала в Мегабит в секунду (Мбит/с). Каждая точка на графике отражает состояние исследуемой сети за предшествующий пятиминутный интервал, показывая зависимость средней нагрузки канала от числа активных потоков. Точки соответствуют нормальным состояниям сети, а треугольники - состояниям сети, зафиксированным во время сканирования портов. Отрезки, изображенные на графике и параллельные оси ординат, показывают доверительные интервалы для средней нагрузки, рассчитанные для пяти промежутков потоков (20000-30000, 30000-40000, 40000-50000, 50000-60000, 60000-70000).


Рисунок 1.17 – Сканирование портов

По итогам эксперимента с ping-запросами было выяснено, что на каждый атакующий компьютер приходился всего один очень длинный поток ICMP трафика, если посылать запросы по единственному порту. Поскольку данные об одном потоке записываются только по его завершению, то необходимые данные были записаны в файл nfdump уже по завершению атаки. Было обнаружен один аномально длинный поток трафика по протоколу ICMP, источником являлся атакующий компьютер. Таким образом, в результате анализа экспериментальных данных удалось определить атаку типа ICMP-flood. Следует отметить, что для достижения результата – сбоев в работе информационной системы одного активного потока ICMP-трафика явно недостаточно, счет должен идти на десятки тысяч запросов.

Анализ эксперимента по моделированию DDoS атаки утилитой LOIC также показал резкое увеличение числа активных потоков наряду с увеличением передаваемого трафика. Утилита параллельно отсылает данные на разные порты цели, создавая тем самым большое количество коротких потоков длительностью до минуты (см. Рис.1.18). Треугольниками изображены состояния сети, зафиксированные во время атаки.


Рисунок 1.18 – DDoS-атака

Таким образом, стало очевидным, что при помощи протокола NetFlow возможно выявить не только момент начала атаки, но и определить ее тип. Подробное описание алгоритмов обнаружения атак и работ по созданию защищенного хостинга можно найти в следующих разделах.

Литература

1. Bolla R., Bruschi R. RFC 2544 performance evaluation and internal measurements for a Linux based open router //High Performance Switching and Routing, 2006 Workshop on. – IEEE, 2006. – С. 6 pp.

2. Fraleigh C. et al. Packet-level traffic measurements from the Sprint IP backbone //IEEE network. – 2003. – Т. 17. – №. 6. – С. 6-16.

3. Park K., Kim G., Crovella M. On the relationship between file sizes, transport protocols, and self-similar network traffic //Network Protocols, 1996. Proceedings., 1996 International Conference on. – IEEE, 1996. – С. 171-180.

4. Fred S. B. et al. Statistical bandwidth sharing: a study of congestion at flow level //ACM SIGCOMM Computer Communication Review. – ACM, 2001. – Т. 31. – №. 4. – С. 111-122.

5. Barakat C. et al. A flow-based model for internet backbone traffic //Proceedings of the 2nd ACM SIGCOMM Workshop on Internet measurment. – ACM, 2002. – С. 35-47.

6. Sukhov A. M. et al. Active flows in diagnostic of troubleshooting on backbone links //Journal of High Speed Networks. – 2011. – Т. 18. – №. 1. – С. 69-81.

7. Lyon G. F. Nmap network scanning: The official Nmap project guide to network discovery and security scanning. – Insecure, 2009.

8. Haag P. Watch your Flows with NfSen and NFDUMP //50th RIPE Meeting. – 2005.

Ранговые распределения для определения пороговых значений сетевых переменных и анализа DDoS атак

Введение

Экспоненциальный рост интернет трафика и числа информационных источников сопровождается быстрым увеличением числа аномальных состояний сети. Аномальные состояния сети объясняются как причинами техногенного характера, так и человеческим фактором. Распознание аномальных состояний, созданных злоумышленниками достаточно тяжело из-за того, что они имитируют действия обычных пользователей . Поэтому такие аномальные состояния крайне сложно выявить и заблокировать. Задачи обеспечения надёжности и безопасности Интернет сервисов требуют изучения поведения пользователей на конкретном ресурсе.

В данной статье пойдёт речь о выявлении аномальных сетевых состояний и методах противодействия DDoS атакам . (Distributed Denial of Service, распределённая атака типа «отказ в обслуживании») – это такой тип атак, при котором некоторое множество компьютеров в сети Интернет, называемых «зомби», «ботами» или бот сетью (ботнет), по команде злоумышленника начинают отправлять запросы на сервис жертвы. Когда число запросов превышает возможности серверов жертвы, новые запросы от настоящих пользователей перестают обслуживаться и становится недоступным. При этом жертва несёт финансовые убытки.

Исследования, которые описаны в данной главе учебного пособия, используют унифицированный математический подход. Был выделен ряд важнейших сетевых переменных, которые генерирует внешний единичный IP адрес при обращении к заданному серверу или локальной сети. К таким переменным относятся: частота обращения к веб серверу (по заданному порту), число активных потоков, величина входящего TCP, UDP и ICMP трафика и т.д. Построенная инфраструктура позволила измерять величины для вышеперечисленных сетевых переменных.

После нахождения данных величин для анализируемых переменных в произвольный момент времени необходимо построить ранговое распределение. Для этого найденные значения располагаются в порядке убывания. Анализ сетевых состояний будет производиться путем сравнения соответствующих распределений. Особенно наглядно это сравнение, когда распределения для аномального и обычного состояния сети построены на одном графике. Подобный подход позволяет легко определить границу между обычным и аномальным состоянием сети.

Эксперименты по DDoS атаке на сервис можно провести с помощью эмуляции в лабораторных условиях. При этом ценность полученных результатов значительно меньше, чем при DDoS атаке на введённый в эксплуатацию коммерческий сервис, так как эмулятор не может полностью воспроизвести реальную компьютерную сеть. Кроме того, для полноценного понимания принципов и методов DDoS атаки необходим опыт работы с ней. Поэтому авторы анонимно договорились о проведении реальной DDoS атаки на специально подготовленный веб сервис. В процессе атаки был записан сетевой трафик, собрана статистика NetFlow. Изучение ранговых распределений для числа потоков и различных типов входящего трафика, генерируемых единичным внешним IP адресом, что позволило определить пороговые значения. Превышение пороговых значений можно классифицировать как признак атакующего узла, что позволяет сделать выводы об эффективности способов обнаружения и методов противодействия.

1

1. Кудрин Б.И. Введение в технетику. – 2-е изд., перераб., доп. – Томск: ТГУ, 1993. – 552 с.

2. Математическое описание ценозов и закономерности технетики. Философия и становление технетики / под ред. Б.И. Кудрина // Ценологические исследования. – Вып. 1-2. – Абакан: Центр системных исследований, 1996. – 452 с.

3. Гнатюк В.И. Закон оптимального построения техноценозов: монография. – Выпуск 29. Ценологические исследования. – М.: Изд-во ТГУ – Центр системных исследований, 2005. – 452 с. (http://www.baltnet.ru/~gnatukvi/ind.html).

4. Гурина Р.В. Ранговый анализ образовательных систем (ценологический подход): методические рекомендации для работников образования. – Вып.32. «Ценологические исследования». – М.: Технетика, 2006. – 40 с. (http://www.gurinarv.ulsu.ru).

5. Гурина Р.В., Дятлова М.В., Хайбуллов Р.А. Ранговый анализ астрофизических и физических систем // Казанская наука. – 2010. – №2. – С. 8-11.

6. Гурина Р.В., Ланин А.А. Границы применимости закона рангового распределения // Техногенная самоорганизация и математический аппарат ценологических исследований. – Вып. 28. «Ценологические исследования». – М.: Центр системных исследований, 2005. –С. 429-437.

7. Хайбуллов Р.А. Ранговый анализ космических систем // Известия ГАО в Пулкове. Труды второй Пулковской молодёжной конференции. – СПб., 2009. – № 219. – Вып. 3. – С. 95-105.

8. Учайкин М.В. Применение закона рангового распределения к объектам Солнечной системы // Известия ГАО в Пулкове. Труды второй Пулковской молодёжной конференции. – СПб., 2009. – № 219. – Вып. 3. – С. 87-95.

Под ранговым распределением (РР) понимается распределение, полученное в результате процедуры ранжирования последовательности значений параметра, поставленных соответственно рангу. Ранг r - это номер особи по порядку в РР. Ранжирование - процедура упорядочения объектов по степени выраженности какого-либо качества в порядке убывания этого качества. Реальные РР могут выражаться различными математическими зависимостями и иметь соответственный графический вид, однако, наиболее важными являются гиперболические ранговые распределения (ГРР), так как они отражают признак «ценозности» - принадлежности совокупности ранжируемых объектов (элементов, особей) к ценозам. Теория ценозов применительно к техническим изделиям была разработана профессором МЭИ Б.И. Кудриным более 30 лет назад (www kudrinbi.ru) и успешно внедрена в практику . Методики построения ГРР и их последующее использование в целях оптимизации ценоза составляют основной смысл рангового анализа (РА) (ценологического подхода), содержание и технология которого представляют собой новое направление, сулящее большие практические результаты. Закон гиперболического рангового распределения особей в техноценозе (Н-распределение) имеет вид :

W = A / r β (1)

где W - ранжируемый параметр особей; r - ранговый номер особи (1,2,3….); А - максимальное значение параметра лучшей особи с рангом r =1, т.е. в первой точке; β - ранговый коэффициент, характеризующий степень крутизны кривой РР (для техноценозов 0,5 < β < 1,5 ).

Если ранжируется какой-либо параметр ценоза, то РР называется ранговым параметрическим. Подчинённость сообщества особей закону ГРР (1) - главный признак ценоза, но недостаточный. Кроме этого признака, ценозы, в отличие от других сообществ, имеют общую среду обитания, а его объекты включены в борьбу за ресурсы.

В.И. Гнатюком разработан метод РА для оптимизации технических систем-ценозов . Возможности практического использования РА в педагогике описаны Р.В. Гуриной (http://www.gurinarv.ulsu.ru), а также разработана методика его применения в этой области . Количество особей в ценозе определяет мощность популяции. Терминология пришла из биологии, из теории биоценозов. «Ценоз» - это сообщество. Термин биоценоз, введённый Мёбиусом (1877), лёг в основу экологии как науки. Б.И. Кудрин перенес понятия «ценоз», «особь», «популяция», «вид» а из биологии в технику: в технике «особи» - отдельные технические изделия, технические параметры, а многочисленную совокупность технических изделий (особей), РР которых выражается законом (1) называют техноценозом .

В социальной сфере «особи» - это люди, организованные в социальные группы (классы, учебные группы), тогда мощность популяции - это количество учащихся в группе. Школа - это тоже социоценоз, состоящий из особей - отдельных структурных единиц - классов. Здесь мощность популяции - количество классов в школе. Совокупность школ - это ценоз более крупного масштаба, где особью, структурной единицей данного ценоза является школа. В качестве ранжируемых параметров W в техноценозах выступают технические или физические параметры, характеризующие особь, например, размер, масса, мощность потребления, энергия излучения и т.д. В социоценозах, в частности педагогических ценозах, ранжируемые параметры - это успеваемость, рейтинг в баллах участников олимпиад или тестирования; число учащихся, поступивших в вузы и так далее, а ранжируемыми особями выступают сами учащиеся, классы, учебные группы, школы и так далее.

Исследования последних лет показали, что совокупности космических объектов многих систем (галактики, солнечная система, скопления галактик и т.д.) представляют собой ценозы (космоценозы, астроценозы) . Однако, астроценозы отличаются от теноценозов и социоценозов тем, что человек не может влиять на из состояние, изменять и оптимизировать их. В космосе объекты жёстко связаны между собой силами тяготения, определяющими их поведение. Специфика астроценозов до конца не выяснена, метод РА применительно к астроценозам не разработан, что определило цель настоящего исследования. Цель разделилась на ряд задач:

1. Изучение метода РА, выяснение возможности применимости метода РА к астрофизическим системам-ценозам (т.е. в какой мере РА применим к астроценозам).

2. Пошаговое описание применения метода РА для астроценозов.

После изучения методики применения РА для техноценозов , были выделены её общие (универсальные) элементы, которые распространяются на все виды ценозов. Таким образом, метод РА включает следующие универсальные этапы-процедуры.

1. Выделение ценоза - совокупности объектов изучаемого сообщества (системы).

2. Выделение параметров ранжирования. Такими параметрами могут выступать масса, размеры объектов, стоимость, энергетическая надежность, процентное содержание элемтентов в составе исследуемого объекта, баллы ЕГЭ участников тестирования и т.д.

3. Параметрическое описание ценоза. Создание электронной таблицы (базы данных), содержащей систематизированную информацию о параметрах отдельных особей ценоза.

4. Построение табулированного эмпирического РР. Табулированное РР представляет собой таблицу из двух столбцов: параметров особей W выстроенных по рангу и рангового номера особи r (r = 1,2,3…). Первый ранг имеет особь с максимальным значением параметра, второй ранг имеет особь с наибольшим значением параметра среди остальных особей и т.д.

5. Построение графического эмпирического РР. График эмпирической ранговой кривой имеет вид гиперболы: по оси абсцисс откладывается ранговый номер r , по оси ординат - исследуемый параметр W, рис.1, а. Все данные берутся из табулированного РР.

Рис. 1. Гипербола (а) и «спрямленная» гиперболическая зависимость в двойном логарифмическом масштабе (б); В = lnА

6. Аппроксимация эмпирических РР. Аппроксимация и определение параметров РР, как правило, проводится с помощью компьютерных программ, с их помощью задается доверительный интервал, находятся параметры кривой распределения А, В, также определяется коэффициент регрессии Rе (или Rе2), показывающий степень приближения эмпирической гиперболы к теоретической. При этом прорисовывается аппроксимационная идеальная кривая (а в случае необходимости - по обе стороны от нее - линии доверительного интервала).

7. Линеаризация ГРР: построение эмпирического РР в логарифмических координатах. Поясним процесс линеаризации зависимости (1). Прологарифмировав зависимость (1) W = А / r β , получаем:

lnW = lnА - β ln r (2)

Обозначив:

lnW = у; lnА = В = const; ln r = х, (3)

получаем (2) в виде:

у = В - β х. (4)

Уравнение (4) - это убывающая линейная функция (рис.1,б). Только по оси ординат откладывается lnW, а по оси абсцисс - lnr. Для построения линейного графика составляется таблица эмпирических значений lnW и lnr, по значениям которой строится график зависимости lnW(lnr) с использованием компьютерных программ.

Вручную коэффициент β определяется по формуле:

β = tg α = lnA: ln r ,

коэффициент А определяется из условия: r = 1, W1= А.

8. Аппроксимация эмпирической зависимости ln W (lnr) к линейной У = В - β х.

Эта процедура производится также с использованием компьютерных программ; далее следует нахождение параметров β, А, определение доверительного интервала, определение коэффициента регрессии Rе (или Rе 2), выражающего степень приближения эмпирического графика ln W (ln r) к линейному виду. При этом вырисовывается апроксимационная прямая.

9. Оптимизация ценоза (для био, - техно, - социоценозов).

Процедура оптимизации системы (ценоза) состоит в совместной работе с табулированным и графическим распределениями и сравнении идеальной кривой с реальной, после чего делают вывод: что практически нужно сделать в ценозе, чтобы точки реальной кривой стремились лечь на идеальную кривую. Чем ближе эмпиричекая кривая распределения приближается к идеальной кривой вида (1), тем устойчивее система. Этап оптимизации включает следующие процедуры (действия) .

Теоретическая часть: совместная работа с табулированным и графическим РР:

Нахождение аномальных точек и искажений по графику;

Определение их координат и их идентификация с реальными особями по табулированному распределению;

Практическая часть: работа с реальными объектами ценоза по его улучшению:

Анализ причин аномалий и поиск способов их устранения (управленческих, экономических, производственных и т.д.);

Устранение аномалий в реальном ценозе.

Оптимизация техноценозов по В.И. Гнатюку осуществляется двумя путями :

1. Номенклатурная оптимизация - целенаправленное изменение численности ценоза, устремляющее реальное РР по форме к идеальному (1). В биоценозе-стае это изгнание или уничтожение слабых особей, в учебной группе это отсев неуспевающих, в техноценозе - избавление от хлама, перевод отработанной техники в разряд металлолома.

2. Параметрическая оптимизация - целенаправленное улучшение параметров отдельных особей, приводящее ценоз к более устойчивому, эффективному состоянию. В педагогическом ценозе - учебной группе (классе) - это работа с неуспевающими - улучшение их показателей успеваемости, в техноценозе - замена старой техники улучшенными образцами.

Как указывалось выше, процедура оптимизации 9 неприменима к астроценозам. Изучая их ГРР, можно лишь извлечь ту или иную полезную научную информацию о состоянии астроценоза, тем самым расширив представления об астрономической картине Мира. Каков характер отклонений в реальных ГРР объектов астрофизических ценозов от идеального Н-распределения и на что они указывают? На графиках ГРР объектов систем-астроценозов обнаружены 2 вида искажений:

I. Несколько точек выпадают из доверительного интервала ГРР или гипербола искажена (наличие «горбов», «впадин», «хвостов» (рис. 2, а).

II. Резкий излом логарифмической прямой lnW (lnr), разделяющий её на 2 отрезка (под углом друг к другу или со смещением по оси у).

На рис 2, а, б - графики РР спутников Сатупа с искажениями первого вида.

В силу несовершенства измерительной техники или методов астрономических измерений из всех 62 спутников Сатурна есть сведения о массах 19 спутников и о диаметрах 45 спутников. Из графиков хорошо видно, что в системе с большим количеством особей (рис.2,б) эмпирические точки, отражающие размеры спутников лучше ложатся на логарифмическую прямую., что указывает на более адекватную информацию о полноте системы. Сказанное позволяет утверждать, что применение РА дает возможность прогнозировать наличие недостающих объектов в космических системах.

Рис. 2. Ранговое распределение спутников Сатурна в двойном логарифмическом масштабе ln W = f(ln r); r -ранговый номер спутника; а) РР 19 спутников по известным массам; б) РР спутников в той же системе с большим количеством особей - 45 спутников по известным диаметрам

При изучении графических РР астроценозов выяснено, что первый вид искажений может свидетельствовать о том, что:

Некоторые объекты не принадлежат данному астроценозу (системе, классу);

Измерения параметров объектов астроценоза не точны;

Недостаточно сведений о полноте астрофизической системы-ценоза. При этом, чем полнее система, тем больше коэффициент регрессии.

Второй вид искажений свидетельствует о следующем.

Если наблюдается резкий излом на графике спрямления, это означает, что система состоит из двух подсистем. Подобный случай представлен графиками рис. 3, 4. При этом, на графике W (r) острый излом образуется двумя «наползающими друг на друга» гиперболами (рис. 3, а), при этом этот излом не всегда так ярко выражен, как на графике в двойном логарифмическом масштабе (рис.3 б, 4, б). Чем меньше угол между линеаризованными отрезками на графике ln W (ln r), тем более выражен излом гиперболы на графике W (r).

На рис. 3, а, б изображены графики ГРР известных галактик по расстоянию от нашей Солнечной системы (всего 40 объектов).

Если наблюдается резкий излом на графике спрямления, это означает, что система состоит из двух подсистем. РА позволяет теоретически разделить систему галактик на два класса: периферийную (удалённую) группу -1 и местную (близлежащую) группу галактик - 2 , что соответствует астрономическим классификационным данным.

Рис. 3. Ранговое распределение галактик по расстоянию от Солнечной системы, где 1 - периферийная группа галактик, при этом Re=0,97; 2 - местная группа галактик, Re=0,86 ; W - расстояние Галактики, кпк; r - ранговый номер галактики. Всего 40 объектов. а) График W(r), Re=0,97; б) График ln W= f(ln r), Re=0,86

Рис. 4. РР масс планет Солнечной системы (в земных массах), где группа 1 - планеты гиганты (Юпитер, Сатурн, Уран, Нептун); 2 - планеты земной группы; W - масса планеты, М; r - ранговый номер планеты. Всего 8 объектов; а) График W(r), Re= 0,99; б) График ln W= f(ln r), для 1 - (планеты гиганты) Re = 0,86, для 2 также - Re = 0,86

Как известно из курса астрономии в нашей планетной системе выделяется 2 подсистемы: планеты-гиганты и планеты Земной группы. На рис. 4, а, б представлены ГРР планет Солнечной системы по массам. Заметим, что непосредственно на гиперболических РР изломы могут недостаточно явно просматриваться, и на них невозможно выделить подсистемы (рис.4, а), поэтому необходимо обязательное построение РР в двойном логарифмическом масштабе, на которых изломы ярко выражены (рис.4,б).

Используя справочники физических величин и Интернет-ресурс, были выполнены построения ГРР других астроценозов, подтверждающие вышесказанное. Аппроксимация проводилась с помощью программы QtiPlot.

Таким образом:

Рассмотрен и расписан пошагово метод РА для систем-ценозов по аналогии с техноценозами;

Определена специфика применения РА к астроценозам;

Определена возможность применения РА к исследованию астрофизических систем- ценозов в планах:

Идентификации подсистем в космических системах-ценозах; метод заключается в фиксации и изучении изломов линейных графиков ГРР в двойном логарифмическом масштабе;

Прогнозирования полноты астрофизических систем-ценозов;

Требуются дальнейшие исследования в данном направлении, подтверждающие сделанные выводы.

Библиографическая ссылка

Устинова К.А., Козырев Д.А., Гурина Р.В. РАНГОВЫЙ АНАЛИЗ КАК МЕТОД ИССЛЕДОВАНИЯ И ВОЗМОЖНОСТЬ ЕГО ПРИМЕНЕНИЯ К АСТРОФИЗИЧЕСКИМ СИСТЕМАМ // Международный студенческий научный вестник. – 2015. – № 3-4.;
URL: http://eduherald.ru/ru/article/view?id=14114 (дата обращения: 26.12.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»

Для моделирования структуры электропотребления предприятия используются ранговые распределения, а для моделирования структуры установленного и ремонтируемого электрооборудования - видовые распределения.  


Ранговые распределения. К ранговым относятся такие распределения, в которых основным признаком является электроемкость всех видов выпускаемой продукции .  

Распределение электроемкостей всех видов продукции, выпускаемых на одном конкретном предприятии, относится к ранговому распределению. Параметром рангового распределения является ранговый коэффициент. Можно получить кривые рангового распределения и определить ранговые коэффициенты за периоды отчетного времени (по кварталам, полугодиям или по годам). Если с течением времени ранговый коэффициент остается постоянным, то это означает, что структура выпускаемой продукции и структура электропотребления с течением времени не изменяются. Возрастание рангового коэффициента показывает, что на предприятии с годами увеличивается разнообразие выпускаемой продукции и разница в расходах электроэнергии на выпуск различных видов.  

Если для каждого вида продукции многономенклатурного производства рассчитать электроемкость как отношение годового электропотребления к объему выпуска этого вида, то в целом по предприятию эти величины подчиняются ранговому распределению. Полученные параметры рангового распределения по годам имеют достаточно стабильную тенденцию к увеличению. Возрастание рангового коэффициента показывает, что на предприятии с годами увеличиваются разнообразие выпускаемой продукции и разница в расходах электроэнергии на выпуск различных видов.  

Совокупность кривых рангового распределения представляет собой поверхность. Анализ структурно -топологической динамики (траектории движения особи по кривой рангового распределения) на этой поверхности дает временной ряд электроемкости каждого исследуемого вида продукции, что представляет интерес с точки зрения возможности прогноза параметров электропотребления. Можно сделать вывод о наличии жесткой корреляционной связи между годовым электропотреблением многономенклатурного производства, структурой выпускаемых изделий и видовым разнообразием выпускаемой продукции .  

Структура установленного и ремонтируемого оборудования. Ранговые и видовые распределения  

Какие распределения относятся к ранговым  

Вариант 2 (при числе вариантов более 20). На первом этапе респондент раскладывает предложенные варианты на две-три группы 1 - подходят, 2 - не подходят, третью группу могут составлять варианты, которые респондент затрудняется отнести к другим группам. Если при первом распределении в группе подходят остается больше 10-12 позиций, то эту группу респонденту предлагается разделить еще раз по принципу точно подходят - возможно подходят. После выделения подходящих вариантов респондент должен провести прямое ранжирование, отсортировав варианты от лучшего к худшему. В соответствии с результатами выбора присваиваются ранговые значения по каждому респонденту, предпочтительно в обратном порядке (лучшее значение - 10, следующее - 9, худшее - 1 при более чем 10 выборах последним выборам всем присваивается значение 1 .  

Как уже говорилось, для характеристики формы распределения вариационного ряда применяют ранговые показатели. Под этим понимают такие единицы исследуемого массива, которые занимают определенное место в вариационном ряду (например, десятое, двадцатое и т.д.). Они получили название квантилей или градиентов. Квантили в свою очередь подразделя-  

Почему ранговая статистика Данн (dt) для проверки контрастов (см. уравнение (41)) требует таблиц нормального распределения , а не -критерия  

Непараметрические методы. Непараметрические методы статистики , в отличие от параметрических, не базируются на каких-либо предположениях о законах распределения данных3. В качестве непараметрических критериев связи переменных часто используют коэффициент ранговой корреляции Спирмена и коэффициент ранговой корреляции Кендалла.  

Гистограмма - графическое изображение статистических распределений какой-либо величины по количественному признаку . Гистограмму (гр. histos - ткань) удобно строить сверху, откладывая по оси абсцисс соответствующие факторы, а по оси ординат - их ранговые суммы. Гистограмма может показать спады, по которым целесообразно сгруппировать факторы по степени их влияния на изучаемый показатель.  

Изложенные ценологические представления могут быть положены в основу изменения организации системы 111 IF на промышленном предприятии (в цехе). В этом случае применяется не видовое распределение установленного электрооборудования, а представление всего перечня, например, электрических машин в ранговой по параметру форме Н-распределения. Осуществляется это следующим образом. Все множество установленных машин ранжируется по их значимости (важности) в техническом или ином процессе. Каждой машине присваивается свой ранг (номер). Первый ранг присваивается машине, которая в наибольшей степени определяет производственный процесс . Второй - следующей по важности машине и т.д., так что последние ранги достанутся машинам, отказ которых не влияет, точнее, влияет крайне незначительно, на производственную и иные виды деятельности предприятия. Операция присвоения ранга не требует особой точности, так что данная машина может в данном ранговом списке попасть в несколько иное место.  

Воспользуемся фактом х2 (12)-распределенности случайной величины т (п - 1) W (т), который имеет место приближенно) в случае, если в исследуемой генеральной совокупности множественная ранговая связь отсутствует. Тогда критерий сводится к проверке неравенства (2.18). Задавшись уровнем значимости критерия а = 0,05, находим из табл. П.4 значение 5%-ной точки х2-распределения с 12 степенями свободы Х ОБ (12) = 21,026. В то же время т (п - I) W (т) = - 28-12-0,08 - 27.  

Прежде всего обратите еще раз внимание, что распределение частот всегда симметрично. Данные табл. 6.9 показывают, что соответственно симметричность частот отражает симметричность количественной определенности коэффициента ранговой корреляции по инверсиям Кинв.  коэффициентов корреляции Спирмена (р) и Кендэлла (Т). Эти методы применимы не только для качественных, но и для количественных показателей , особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака.  

После получения последовательности распределений ft(P) возникает задача изучения процесса перехода между ними, т.е. мобильности регионов по ценам. Как отмечено в обзоре Fields, Ok (2001), само понятие мобильности чётко не определено, посвящённая мобильности литература не даёт унифицированного описания анализа (как нет и сложившейся терминологии). Тем не менее, в экономической и социологической литературе есть согласие относительно двух основных концепций мобильности. Первая - относительная (или ранговая) мобильность, связанная с изменениями упорядоченности, в нашем случае, регионов по уровню цен. Вторая концепция - абсолютная (или количественная) мобильность, связанная с изменением самих уровней цен в регионах. В дальнейшем анализе использованы обе эти концепции.  

Другие процедуры. В рассматривается процедура, основанная на ранговой статистике Стила для сравнений экспериментальной и контрольной средних, обсуждавшихся "ранее. Эта альтернативная процедура также предполагает стохастически упорядоченные распределения. Для этого класса распределений про-цедура менее эффективна она более эффективна для частного случая- для распределений, отличающихся только сдвигом (см.

Последовательный ранговый метод Хоула с исключением для стохастически упорядоченных распределений. Стохастически упорядоченные распределения охватывают распределения, различающиеся только сдвигом, но не нормальные распределения с различными дисперсиями. Мы не знаем, чувствителен ли метод к отклонениям от предположения о стохастической упорядоченности.