Гнатюк В.И. Закон оптимального построения техноценозов, 2005 – главная страница

Адрес монографии в сети – http://gnatukvi.ru/ind.html

 

 

 

 

2.4. Тонкие процедуры рангового анализа

 

 

Методика оптимального управления объектами техноценоза. Тонкие процедуры рангового анализа. Верификация базы данных. Интервальное оценивание рангового параметрического распределения. Дифлекс-анализ. Прогнозирование в техноценозе. GZ-анализ. Нормирование в техноценозе. ASR-анализ. Выводы по главе.

 

 

Как показано в п. 2.3, третья задача рангового анализа не ставит целью как таковую структурную оптимизацию в техноценозе. Речь идет лишь о так называемой локальной ресурсной оптимизации, которая осуществляется в рамках седьмой процедуры методами анализа ранговых параметрических распределений, построенных по функциональным параметрам. Тем не менее, подобная задача достаточно часто возникает в процессе развития уже существующего техноценоза, когда его оптимизация осуществляется с целью повышения эффективности путем экономии потребляемых (вещественных, информационных, энергетических или каких-либо других) ресурсов.

Седьмая оптимизационная процедура рангового анализа (см. п. 2.3) реализуется в рамках разработанной автором взаимосвязанной методики оптимального управления объектами техноценоза (рис. 2.12) [17-20].

 

 

Рис. 2.12.

Методика оптимального управления

объектами техноценоза

 

На этапе первичного анализа техноценоза по специально разработанным формам запроса осуществляется сбор данных о значениях функциональных параметров его объектов. Это позволяет получить картину изменения параметров во времени (с историей на глубину 5 – 6 лет), а также подготовить электронную базу данных для дальнейшего многофакторного анализа. На этапе статистического анализа и построения эмпирической модели техноценоза осуществляется полномасштабная обработка данных по функциональным параметрам, которая включает взаимосвязанные процедуры рангового и кластерного анализа. Ранговый анализ позволяет упорядочивать информацию, выявлять в динамике и наглядно представлять аномальные объекты, а также эффективно осуществлять прогнозирование в техноценозе. Кластерный анализ позволяет разбивать объекты по группам и осуществлять нормирование в каждой группе с подробным статистическим описанием норм. Центральным инструментальным звеном методики выступает Информационно-аналитический комплекс «Модель оптимального управления объектами техноценоза» [15-20], который позволяет в автоматическом интерактивном режиме реализовывать ключевые процедуры методики: формирование базы данных, интервальное оценивание, прогнозирование и нормирование.

С целью повышения точности расчетов стандартные процедуры рангового анализа дополняются тонкими процедурами: верификацией базы данных, а также дифлекс-, GZ-, ASR-анализом рангового параметрического распределения (рис. 2.13).

 

 

Рис. 2.13.

Тонкие процедуры рангового анализа

 

В процессе параметрического описания техноценоза следует обращать внимание на корректность базы данных, а также ее строгое соответствие статистическим критериям Н-распределения [12,15,28]. Оценка корректности базы данных осуществляется в рамках первой тонкой процедуры рангового анализа – верификации (рис. 2.13), которая включает следующие процедуры: 1) устранение нулевых данных; 2) устранение явно ошибочных данных (выбросов); 3) устранение равных данных; 4) восстановление утерянных данных; 5) проверка на Н-распределение. Нулевые и абсолютно равные данные являются первым признаком некорректности базы, что очевидно даже с точки зрения физического смысла. Кроме того, подобные данные плохо обрабатываются компьютерными программами. Выбросы в данных являются следствием грубых ошибок при фиксации параметров обслуживающим персоналом либо сбоев в работе технических средств измерений. Наконец, утеря данных может произойти как по вине персонала, так и по причине тяжелых сбоев в работе серверов, на которых хранятся базы. В ряде случаев требуется просто корректное наращивание базы данных на несколько лет «назад». Методика расчетов изложена в работах [1,23,24,39,40,62,65,68]. Кроме того, подробно верификация базы данных будет рассмотрена на конкретном примере здесь в пятой главе.

Проверка соответствия данных критериям Н-распределения заключается в глубокой статистической обработке с целью проверки совместного выполнения двух гипотез. Во-первых, совокупность данных не подчиняется нормальному закону и, во-вторых, данные являются значимо взаимосвязанными. В случае если обе гипотезы выполняются, появляется возможность утверждать, что исследуемый объект является техноценозом, и его данные по функциональным параметрам могут обрабатываться методами рангового анализа. Основным признаком негауссовости данных является смещение среднего по мере наращивания выборки из генеральной совокупности. Проверка гипотезы о несоответствии генеральной совокупности данных нормальному распределению осуществляется при помощи критерия Пирсона, а также методом спрямленных диаграмм. Исследование взаимосвязанности техноценоза выполняется с помощью коэффициента конкордации, выборочного коэффициента ранговой корреляции Кендалла, а также выборочного коэффициента линейной корреляции. Методика расчетов и интерпретация параметров изложены в наших работах [1,23,24,39,40,62,65,68]. Кроме того, более подробно данная процедура будет рассмотрена здесь в пятой главе.

Ключевой аналитической процедурой рангового анализа является интервальное оценивание рангового параметрического распределения (рис. 2.14) [17,20].

 

 

Рис. 2.14.

Интервальное оценивание в техноценозе

 

По общему определению интервальное оценивание – процедура оптимального управления ресурсами техноценоза, заключающаяся в определении точек эмпирического рангового параметрического распределения по исследуемому функциональному параметру, выходящих за пределы гауссового переменного доверительного интервала, построенного относительно аппроксимационной кривой распределения. Точки, выходящие за пределы доверительного интервала, фиксируют объекты техноценоза, аномально потребляющие ресурс. При этом если точка находится ниже доверительного интервала, то считается, что объект потребляет ресурсы аномально мало, а если выше интервала, то аномально много. В обоих случаях объект нуждается в углубленном обследовании с целью выявления причин его аномального состояния.

Ранговое параметрическое распределение разбивается на ряд участков с таким расчетом, чтобы, во-первых, на каждом участке было не менее 10 – 12 точек, а во-вторых, отклонения значений экспериментальных параметров от соответствующих теоретических значений, определяемых аппроксимационной кривой, были распределены внутри участка по нормальному закону. Для каждого участка можно записать уравнение [20,23-25]:

 

(2.28)

где

ширина доверительного интервала в одну сторону от кривой;

 

среднеквадратичное отклонение экспериментальных точек от теоретической кривой (в расчетах принимается эмпирический стандарт);

 

обратная функция Лапласа;

 

априорно принимаемая доверительная вероятность.

 

В (2.28) применяется стандартная функция Лапласа [23]:

 

(2.29)

 

Решение уравнения (2.28) позволяет определить ширину доверительного интервала на каждом из участков разбиения. Последующая аппроксимация значений на границах участков дает переменный доверительный интервал распределения. Учитывая принятые выше допущения относительно экспериментальных точек, выходящих за пределы доверительного интервала, можно сделать следующие выводы. Если точка входит в доверительный интервал, то в пределах гауссового разброса параметров можно судить, что объект потребляет ресурсы нормально для своего участка разбиения рангового распределения. Если точка находится ниже доверительного интервала, то это, как правило, свидетельствует о нарушении нормального процесса ресурсопотребления на данном объекте. Если точка находится выше интервала, то на соответствующем объекте имеет место аномально большое потребление ресурсов. Именно на эти объекты в первую очередь и должно нацеливаться углубленное обследование (аудит).

Для более тонкой настройки процедур управления объектами техноценоза на этапе интервального оценивания проводится дифлекс-анализ (Deflexion analysis) рангового распределения (рис. 4.3). Его целью является разработка оптимального плана углубленных энергетических обследований «аномальных» объектов на среднесрочную перспективу (до 5 – 7 лет). При этом предполагается, что основным индикатором дифлекс-анализа является отклонение эмпирического значения функционального параметра «аномального» объекта от верхней границы переменного доверительного интервала (рис. 4.5).

 

 

Рис. 2.15.

К понятию дифлекс-анализа в техноценозе

 

Из рисунка 2.15 видно, что «степень аномальности» k-го объекта с точки зрения его ресурсопотребления может характеризоваться абсолютным дифлекс-параметром:

 

(2.30)

где

эмпирическое значение параметра k-го объекта;

 

W(r)

ранговое параметрическое распределение объектов техноценоза по функциональному параметру;

 

ранг k-го объекта на распределении;

 

значение параметра, соответствующее k-му рангу на верхней границе переменного доверительного интервала.

 

Можно вести речь также и об относительном дифлекс-параметре объекта:

 

(2.31)

 

Значения параметра, соответствующие k-му рангу на верхней и нижней границах переменного доверительного интервала рангового параметрического распределения (см. рис. 2.15), определяются следующим образом:

 

(2.32)

где

значение параметра на аппроксимационной кривой рангового распределения, соответствующее рангу объекта;

 

обратная функция Лапласа, задающая верхнюю и нижнюю границы доверительного интервала (см. выражение (2.29));

 

априорно принимаемая (как правило, 95%-ная) доверительная вероятность;

 

эмпирический стандарт рангового распределения в параметрическом кластере k-го объекта.

 

Следует отметить, что для сравнения объектов в пределах одного параметрического кластера на фиксированном временном интервале можно использовать относительный дифлекс-параметр. Однако для более тонкой оценки следует осуществлять процедуру ранжирования аномальных объектов по абсолютному дифлекс-параметру с последующей аппроксимацией и получением рангового параметрического распределения. Это, в свою очередь, позволит определить интегральный дифлекс-параметр техноценоза:

 

(2.33)

где

ранговое параметрическое распределение «аномальных» объектов по абсолютному дифлекс-параметру;

 

параметрический ранг данного распределения.

 

Аппроксимация рангового параметрического распределения по дифлекс-параметру обычно осуществляется с помощью стандартной гиперболической формы:

 

(2.34)

где

параметры (первая точка и ранговый коэффициент) двухпараметрической аппроксимационной формы.

 

Дальнейшее исследование техноценоза в рамках тонких процедур рангового анализа заключается в получении ключевых динамических дифлекс-функций:

 

(2.35)

где

t

время функционирования техноценоза.

 

Реализация процедур прогнозирования применительно к функциям (2.35) позволяет оценить динамику «аномальных» объектов, а также разработать программу аудита на среднесрочную перспективу, реализующую критерий:

 

(2.36)

где

ранговое параметрическое распределение «аномальных» объектов по абсолютному дифлекс-параметру на t-ом временном интервале;

 

m

количество анализируемых временных интервалов.

 

Прогнозированиепроцедура оптимального управления ресурсами техноценоза, заключающаяся в определении вероятных значений функциональных параметров в будущем. Применительно к объектам техноценоза процедура прогнозирования может осуществляться Gauss-методами (G-методами, основанными на гауссовой математической статистике), Zipf-методами (Z-методами, основанными на ципфовой математической статистике) и синтетическими GZ-методами, органично сочетающими их достоинства. GZ-прогнозирование предполагает выполнение предварительной процедуры верификации, реализуемой методами GZ-анализа техноценоза (Gauss-Zipf analysis), в основе которого лежит процедура оценки системного параметрического ресурса кластеров объектов. Прогнозирование может выполняться на основе статической модели, корректно отражающей процесс потребления ресурса техноценозом на год вперед. Динамическое стохастическое моделирование, учитывающее вероятные изменения в системе исходных данных, позволяет осуществлять прогноз потребления ресурса техноценозом на среднесрочную перспективу (5 – 7 лет и более).

Процедура реализуется следующим образом. Предварительно осуществляется выделение из состава базы данных следующих информационных подсистем. Фактические известные данные в текущем году составляют «Вектор верификации». Прогнозируемые данные в будущем году определяются как «Вектор прогнозирования». Все остальные известные данные по объектам техноценоза образуют «Матрицу данных». Процесс прогнозирования реализуется в два взаимосвязанных этапа. На первом этапе в качестве базы прогнозирования используется матрица данных, применительно к которой реализуются последовательно все имеющиеся в распоряжении методы прогнозирования. Статистическое сравнение полученных прогнозных результатов с соответствующими данными вектора верификации позволяет для каждого из объектов определить наиболее эффективный метод. Затем на втором этапе прогнозирования вектор верификации присоединяется к матрице данных и осуществляется окончательный прогноз изменения параметра, причем процедура для каждого объекта осуществляется именно тем методом, который на первом этапе был определен для него как наиболее эффективный. Данная синтетическая методология названа автором GZ-методом. В базе данных прогнозирования могут использоваться самые различные методы. В любом случае в процессе реализации алгоритма выбирается наиболее эффективный из них.

Для прогнозирования G-методами используются нелинейные многочлены [20,59]. В случае необходимости может быть применено линейное или экспоненциальное сглаживание модели [1,59], что несколько повышает точность расчетов. В процессе прогнозирования Z-методами должны учитываться техноценологические свойства, сводящиеся в конечном итоге к понятию устойчивости гиперболических ранговых параметрических распределений (рис. 2.16) [34,41,59]. Полная совокупность методов прогнозирования составляет так называемый GZ-модуль прогнозирования, который подробно будет разобран на конкретном примере в параграфе 4.4.

 

 

Рис. 2.16.

Прогнозирование в техноценозе Z-методами

 

После получения GZ-методами прогнозных значений параметра для каждого объекта в отдельности, для техноценоза строится прогнозное ранговое параметрическое распределение. Суммарное значение функционального параметра определяется на основе численной реализации гиперболической формы:

 

(2.37)

где

прогнозные параметры (первая точка и ранговый коэффициент) двухпараметрической формы рангового параметрического распределения,

 

по эмпирическому выражению:

 

(2.38)

где

n

общее количество объектов техноценоза;

 

прогнозное значение параметра k-го объекта.

 

В процедуре прогнозирования существенную сложность составляет операция выбора G- или Z-методологии. Предлагается данный выбор осуществлять на основе предварительной тонкой процедуры GZ-анализа параметрического распределения (рис. 2.15 и 2.17), а в качестве GZ-критерия выбора метода рассматривать определенное соотношение объемов гауссового и системного ресурсов кластеров техноценоза.

 

 

Рис. 2.17.

К понятию GZ-анализа в техноценозе

 

Как следует из основных уравнений закона оптимального построения техноценозов, гауссовый ресурс кластера равен [20]:

 

(2.39)

где

W(r)

реальное ранговое параметрическое распределение;

 

гауссовое распределение, соответствующее кластерному распределению параметров в ранговой форме (рис. 2.17);

 

значение параметра, соответствующее правой ранговой границе кластера (рис. 2.17).

 

При этом системный ресурс кластера определяется следующим образом [20]:

 

(2.40)

 

В качестве GZ-критерия выбора метода прогнозирования в рамках GZ-методологии может применяться следующая альтернатива:

 

(2.41)

где

критериальное значение соотношения GZ-ресурсов кластера.

 

Следует отметить, что критериальное значение соотношения GZ-ресурсов в выражении (2.41) определяется отдельно для каждого параметрического кластера техноценоза на основе предварительной юстировки базы методов прогнозирования к базе данных по функциональным параметрам (подробнее – см. ниже пп. 4.1, 4.4 и 4.5).

Нормирование – процедура оптимального управления ресурсами техноценоза, заключающаяся в определении статистических параметров (эмпирического среднего и стандарта) кластеров техноценоза, выделенных на ранговом параметрическом распределении по исследуемому функциональному параметру. Кластеризация объектов техноценоза осуществляется методами анализа главных компонент, кластерного анализа, а также автоматической классификации [1,20,23] и позволяет выделить группы объектов, которые на определенном временном интервале потребляют ресурс сходным образом. Статистически внутри кластера функциональные параметры должны распределяться по нормальному закону (рис. 2.18). Как показали исследования и практическая реализация методологии, процедура нормирования в сочетании с прогнозированием позволяет предъявлять объектам научно обоснованные параметрические нормы.

 

 

Рис. 2.18.

Нормирование в техноценозе

 

В соответствии с [1,20,39,65] кластер-процедуры реализуются на пространстве экспериментальных данных по функциональным параметрам объектов техноценоза в соответствии с критерием качества разбиения на классы, который на фиксированном множестве f-разбиений  на заданное число классов

 

(2.42)

 

выглядит следующим образом:

 

(2.43)

где

фиксированное множество f-разбиений;

 

заданное число классов;

 

взвешенное евклидово расстояние между полученными точками.

 

Кластер-процедура (2.43) дополняется проверкой расстояния между классами, измеренного по принципу «ближнего соседа». При этом циклично реализуется критерий:

 

(2.44)

где

фиксированные классы разбиения.

 

В результате объекты техноценоза разбиваются на параметрические кластеры, после чего возникает возможность определения параметрических норм внутри каждой из групп. Норма представляет собой среднее и эмпирический стандарт, определяемые на выборке значений параметра группы. Количество групп разбиения целесообразно иметь таким, чтобы в наиболее многочисленные из них входило не более 10 – 12 объектов. Среднее значение параметра для s-ой группы объектов определяется следующим образом:

 

(2.45)

где

соответственно левая и правая ранговые границы нормируемой группы объектов на параметрическом распределении;

 

параметры (первая точка и ранговый коэффициент) двухпараметрической формы рангового параметрического распределения;

 

количество объектов в s-ой группе;

 

эмпирическое значение параметра i-го объекта.

 

Эмпирический стандарт для этой же группы объектов:

 

(2.46)

 

Классические процедуры, будучи применены в рамках процедуры нормирования техноценоза, обладают существенным недостатком. Они усредняют анализируемый параметр в пределах кластера на основе гауссовой математической статистики и тем самым не учитывают системный ресурс параметрического кластера техноценоза (см. рис. 2.17). Устраняется данный недостаток в рамках процедуры ASR-анализа (Adding System Resource analysis), являющейся тонким дополнением к нормированию (рис. 2.15 и 2.19).

 

 

Рис. 2.19.

К понятию ASR-анализа в техноценозе

 

Реализация процедуры ASR-анализа в данном случае заключается в добавлении к прогнозируемому среднему нормы объекта соответствующей его рангу ASR-нормы:

 

(2.47)

где

результирующее среднее параметрической нормы для k-го объекта техноценоза с учетом ASR-нормы;

 

среднее параметрической нормы k-го объекта, полученное по результатам процедуры нормирования;

 

ASR-норма k-го объекта (см. выражение (2.39)).

 

ASR-нормирование техноценоза на эмпирическом материале всей имеющейся базы данных позволяет закрепить за каждым объектом на каждом временном интервале индивидуальную параметрическую норму. Процедура аппроксимации дает функции зависимости среднего и стандарта нормы k-го объекта во времени:

 

(2.48)

где

t

время функционирования техноценоза.

 

Реализация процедур прогнозирования применительно к функциям (2.48) позволяет оценить динамику параметрических норм объектов, а также разработать программу нормирования на среднесрочную перспективу, реализующую критерий:

 

(2.49)

где

ASR-среднее параметрической нормы k-го объекта на t-ом временном интервале;

 

m

количество анализируемых временных интервалов;

 

n

количество объектов техноценоза.

 

Таким образом, на этапе статистического анализа и построения эмпирической модели осуществляется полномасштабная обработка данных по функциональным параметрам техноценоза, которая включает интервальное оценивание, прогнозирование и нормирование. Интервальное оценивание выявляет в динамике и наглядно представляет так называемые «аномальные» объекты. С использованием гауссовых и ципфовых методов осуществляется прогнозирование изменения параметров отдельных объектов и техноценоза в целом. Кластерный анализ позволяет разбить объекты по группам и осуществить нормирование объектов в каждой группе с подробным статистическим описанием норм. Более тонкий анализ рангового параметрического распределения позволяет существенно повысить эффективность рангового анализа. Он осуществляется в рамках следующих процедур: дифлекс-анализа (на этапе интервального оценивания), GZ-анализа (на этапе прогнозирования) и ASR-анализа (на этапе нормирования).

 

 

ВЫВОДЫ

 

Ранговый анализ – это метод исследования техноценозов, имеющий целью их статистический анализ, а также оптимизацию, и полагающий в качестве основного критерия форму видовых и ранговых распределений. Он базируется на следующих основаниях: технократическом подходе к окружающей реальности, восходящем к третьей научной картине мира; началах термодинамики; негауссовой математической статистике устойчивых безгранично делимых распределений; понятии техноценоза, специфика которого, кроме прочего, видится в методологии исследования. Техноценозы не поддаются описанию ни традиционными методами гауссовой математической статистики, оперирующей понятиями среднего и дисперсии как информативно насыщенными свертками больших массивов статистической информации, ни лежащими в основе редукционизма имитационными моделями. Чтобы корректно описать техноценоз, необходимо постоянно оперировать выборкой в целом, как бы велика она ни была, что предполагает построение видовых и ранговых распределений, теоретическая основа которых лежит в области негауссовой математической статистики.

Целью рангового анализа является оптимальное построение (или оптимизация) техноценозов. Известные семь оптимизационных процедур, как правило, реализуются комплексно и позволяют решать три основных задачи. Первая, наиболее общая задача заключается в полномасштабной номенклатурной оптимизации техноценоза. При ее решении в той или иной степени задействуются все семь процедур. Первоначально с помощью анализа рангового видового распределения определяется направление глобальной трансформации структуры техноценоза. Затем выявляются аномальные отклонения на видовом распределении, которые устраняются методами параметрической оптимизации по видообразующим параметрам (двумя различными способами). В ходе реализации предусматривается верификация процедур с помощью анализа динамики изменения параметров гиперболической формы рангового видового распределения. Как уже отмечалось, в отдельных случаях в ходе проектирования осуществляется синтез оптимальной структуры еще не существующего техноценоза. Здесь находят применение первая, четвертая и шестая оптимизационные процедуры. Вторая задача возникает в том случае, когда, по какой-либо причине, нет возможности осуществлять коренные структурные изменения, однако необходимо реализовывать эффективную научно-техническую политику в техноценозе. Здесь используется синтетическая методология, основанная на совместном анализе ранговых видовых и параметрических распределений, а также зависимостей, отражающих связь между видовым и параметрическим рангами техноценоза. В ходе решения данной задачи можно говорить об использовании в той или иной мере первой, четвертой и пятой оптимизационных процедур. Наконец, третья задача не ставит целью как таковую структурную оптимизацию в техноценозе. Речь идет лишь о так называемой локальной ресурсной оптимизации, которая осуществляется в рамках седьмой процедуры методами анализа ранговых параметрических распределений, построенных по функциональным параметрам. Тем не менее, подобная задача достаточно часто возникает в процессе развития уже существующего техноценоза, когда его оптимизация осуществляется с целью повышения эффективности путем экономии потребляемых (энергетических или каких-либо других) ресурсов.

Седьмая оптимизационная процедура рангового анализа, будучи реализуема в рамках взаимосвязанной методики оптимального управления объектами техноценоза, включает процедуры интервального оценивания, прогнозирования и нормирования. Интервальное оценивание выявляет в динамике и наглядно представляет так называемые «аномальные» объекты. С использованием различных гауссовых и ципфовых методов осуществляется прогнозирование изменения параметров отдельных объектов и техноценоза в целом. Кластерный анализ позволяет разбить объекты по группам и осуществить нормирование объектов в каждой группе с подробным статистическим описанием норм. Более тонкий анализ рангового параметрического распределения позволяет существенно повысить эффективность рангового анализа. Он осуществляется в рамках следующих процедур: дифлекс-анализа (на этапе интервального оценивания), GZ-анализа (на этапе прогнозирования) и ASR-анализа (на этапе нормирования).

 

 

 

 

Рейтинг@Mail.ru

При использовании материалов ссылки обязательны

Все права защищены © Гнатюк В.И., 2005

E-mail: mail@gnatukvi.ru