Гнатюк В.И. Закон оптимального построения техноценозов, 2005 – главная страница

Адрес монографии в сети – http://gnatukvi.ru/ind.html

 

 

 

 

4.5. Тонкие процедуры рангового анализа

в задачах энергосбережения

 

4.5.1. GZ-анализ рангового параметрического распределения

 

 

Тонкие процедуры рангового анализа. Методика GZ-анализа рангового распределения. Прогнозирование. Варианты GZ-анализа. Структура прогнозной базы данных. Эвристический вариант GZ-анализа. Методы прогнозирования. Критериальный вариант GZ-анализа. Системный доверительный интервал. Гауссовый доверительный интервал. Коэффициент когерентности. Критериальные значения коэффициента. Прогнозирование в области неопределенности.

 

 

Оптимальное управление электропотреблением объектов техноценоза на системном уровне осуществляется в рамках связанной методики, включающей ряд стандартных этапов (см. п. 4.1). На этапе статистического анализа осуществляется обработка данных по электропотреблению, которая включает взаимосвязанные процедуры рангового анализа (формирования базы данных по электропотреблению, интервального оценивания, прогнозирования и нормирования) (рис. 4.2, 4.32).

 

 

Рис. 4.32.

Стандартные и тонкие процедуры рангового анализа:

АРСС – модель авторегрессионного скользящего среднего;

МДВР – модель декомпозиции временного ряда;

SSA – модель анализа сингулярного спектра временного ряда;

БПТ – модель без фиксированной первой точки;

СПТ – модель с фиксированной первой точкой;

ДКЗ – модель с делением на кастовые зоны

 

С целью повышения точности расчетов стандартные процедуры рангового анализа дополняются соответствующими тонкими процедурами: верификацией базы данных, а также дифлекс-, GZ- и ASR-анализом рангового параметрического распределения (рис. 4.3, 4.32). Рассмотрим центральную тонкую процедуру рангового анализа, существенно уточняющую процедуру прогнозирования – GZ-анализ (рис. 4.32, 4.33).

 

 

Рис. 4.33.

Варианты реализации GZ-анализа

 

Прогнозированиепроцедура оптимального управления ресурсами техноценоза, заключающаяся в определении вероятных значений функциональных параметров в будущем. Прогнозирование может выполняться на основе статической модели, отражающей процесс электропотребления на год вперед. Динамическое стохастическое моделирование позволяет осуществлять прогноз на среднесрочную перспективу (5 – 7 лет) [20]. Применительно к техноценозу прогнозирование может осуществляться G-методами (Gauss-методами, основанными на гауссовой математической статистике), Z-методами (Zipf-методами, основанными на ципфовой математической статистике) и синтетическими GZ-методами, органично сочетающими их достоинства. Последние предполагают выполнение предварительной тонкой процедуры GZ-анализа (Gauss-Zipf analysis).

GZ-анализ может реализовываться в двух вариантах, первый из которых является упрощенным эвристическим, а второй – основным критериальным (см. рис. 4.33). Эвристический вариант как основной метод прогнозирования применяется только для оценочных расчетов, причем на сравнительно небольших базах данных. Кроме того, с помощью него на предварительном этапе синтезируется так называемая GZ-матрица методов прогнозирования, необходимая для процедуры юстировки ключевых параметров критериального варианта GZ-анализа.

На рисунке 4.34 приведена упрощенная структура прогнозной базы данных техноценоза по электропотреблению.

 

 

Рис. 4.34.

Структура прогнозной базы данных по электропотреблению:

 – электропотребление k-го объекта техноценоза

на (tm)-ом временном интервале (месяце, году)

 

Из имеющейся базы данных предварительно осуществляется выделение следующих информационных подсистем. Фактические известные данные по электропотреблению на текущем временном интервале составляют «Вектор верификации». Прогнозируемые данные на будущем временном интервале определяются как «Вектор прогнозирования». Все остальные известные данные образуют «Матрицу данных».

Процесс прогнозирования электропотребления объектов техноценоза с помощью эвристического варианта GZ-анализа реализуется следующим образом (рис. 4.33 – 4.35). На первом этапе в качестве базы прогнозирования используется матрица данных, применительно к которой реализуются последовательно все имеющиеся в распоряжении методы прогнозирования. Статистическое сравнение полученных прогнозных результатов с соответствующими данными вектора верификации позволяет для каждого из объектов определить наиболее эффективный метод. Затем вектор верификации присоединяется к матрице данных и осуществляется окончательный прогноз электропотребления, причем процедура для каждого объекта осуществляется именно тем методом, который на первом этапе был определен для него как наиболее эффективный. В базе данных прогнозирования могут использоваться различные методы (как G-, так и Z-). В любом случае в процессе реализации эвристического варианта GZ-анализа выбирается наиболее эффективный [20].

 

 

Рис. 4.35.

Данные по электропотреблению (фрагмент примера)

 

Для прогнозирования электропотребления объектов G-методами в основном используются модели авторегрессионного скользящего среднего (см. рис. 4.36 для примера, показанного на рис. 4.35), декомпозиции временного ряда, а также различные вариации методов на основе анализа сингулярного спектра траекторной матрицы временного ряда. В процессе прогнозирования электропотребления техноценоза Z-методами должны учитываться техноценологические свойства, сводящиеся в конечном итоге к известному понятию устойчивости гиперболических ранговых параметрических распределений (см. рис. 4.37 для примера, показанного на рис. 4.35). Здесь, как правило, находят применение методы без фиксированной первой точки, с фиксированной первой точкой, а также с делением на кастовые зоны. Полная совокупность методов прогнозирования составляет так называемый GZ-модуль прогнозирования, который ранее подробно разобран в параграфе 4.4.

 

 

Рис. 4.36.

Пример осуществления процедуры прогнозирования

одного из объектов техноценоза G-методом

 

 

 

Рис. 4.37.

Пример прогноза электропотребления

техноценоза в целом Z-методом

 

Критериальный вариант GZ-анализа (рис. 4.33) позволяет еще до начала собственно процедуры прогнозирования осуществить выбор G- или Z-методологии, что существенно ускоряет расчеты и повышает их точность (положительный эффект пропорционален размерам базы данных). Как следует из закона оптимального построения техноценозов, в качестве критерия выбора метода следует рассматривать соотношение объемов системного и гауссового ресурсов кластеров техноценоза (рис. 4.38) [20].

 

 

Рис. 4.38.

К вопросу априорного выбора G- или Z-метода прогнозирования

по критерию соотношения системного и гауссового ресурсов

 

Как следует из основных уравнений закона оптимального построения техноценозов, гауссовый ресурс кластера равен [20]:

 

(4.81)

где

W(r)

реальное ранговое параметрическое распределение;

 

гауссовое распределение, соответствующее кластерному распределению параметров в ранговой форме (рис. 4.38);

 

значение электропотребления, соответствующее правой ранговой границе кластера (рис. 4.38).

 

При этом системный ресурс кластера определяется следующим образом [20]:

 

(4.82)

 

Как показывает анализ, процедура кластеризации ранговых параметрических распределений по исследуемому параметру существенно затруднена из-за негауссовости распределений, что неотвратимо ведет к негауссовости кластеров. При этом нарушается главный минимаксный критерий кластер-анализа (то, что статистически внутри кластера функциональные параметры объектов должны распределяться по нормальному закону) [1,23,24]. Выход из этого положения возможен в результате увеличения количества кластеров (стремлении размера кластера к нулю), при этом системный и гауссовый ресурсы кластеров в пределе сводятся к системному и гауссовому доверительным интервалам, соответственно, рангов и объектов техноценоза.

Под системным доверительным интервалом рангового параметрического распределения техноценоза понимается совокупность верхних и нижних доверительных границ, каждая из которых получается в результате статистической обработки выборки значений параметров, соответствующих данному рангу на протяжении определенного количества временных интервалов (независимо от объектов, которые «проходят» через ранг в процессе функционирования). Для определения ширины доверительного интервала используется понятие интерквартильного размаха применительно к выборке значений электропотребления, соответствующих данному рангу на протяжении ряда временных интервалов развития техноценоза [23,24]:

 

(4.83)

где

верхний квартиль распределения значений электропотребления (квантиль порядка 0,75);

 

нижний квартиль (квантиль порядка 0,25).

 

Квартили распределения определяются как значение электропотребления, при котором функция распределения становится равной соответствующей величине (0,75 или 0,25). Если исходить из того, что распределение значений электропотребления для одного ранга на протяжении ряда временных интервалов является нормальным [20], то ширина интерквартильного размаха может быть определена на основе решения относительно переменной  следующего уравнения [23,24]:

 

(4.84)

где

ширина системного доверительного интервала в одну сторону от математического ожидания (в расчетах принимается эмпирическое среднее);

 

среднеквадратичное отклонение экспериментальных точек от математического ожидания (в расчетах принимается эмпирический стандарт);

 

обратная функция Лапласа [23]:

 

x

формальная переменная интегрирования;

 

априорно принимаемая доверительная вероятность (для получения интерквартильного размаха должна быть принята равной 0,95).

 

Системный доверительный интервал является мерилом системного ресурса объекта, «занимающего» в рассматриваемый момент времени определенный ранг на ранговом параметрическом распределении, и характеризует разброс параметров техноценоза, при котором его функционирование можно считать нормальным (рис. 4.39). Фактически этот интервал отражает требования или ограничения, которые система выдвигает объектам, чтобы обеспечить свое устойчивое функционирование. Если эмпирическое значение параметра объекта выходит за пределы системного интервала, то это означает, что объект не подчиняется системным требованиям и проявляет индивидуальность. Сама же величина отклонения может рассматриваться как мера индивидуальности объекта.

 

 

Рис. 4.39.

Пример системного доверительного интервала

 

Ширина системного доверительного интервала определяется предысторией развития техноценоза, будучи взятого в целом, и если она невелика, то это свидетельствует о том, что техноценоз развивается стабильно и сбалансировано, все изменения в нем происходят плавно. Напротив, широкий интервал свидетельствует о резких структурных изменениях. Методика определения системного интервала позволяет противопоставить его гауссовому доверительному интервалу, который определяется применительно не к рангу распределения, а к объекту техноценоза.

Под гауссовым доверительным интервалом рангового параметрического распределения техноценоза понимается совокупность верхних и нижних доверительных границ, каждая из которых получается в результате статистической обработки выборки значений параметров, соответствующих данному объекту на протяжении определенного количества временных интервалов (независимо от рангов, которые он принимает в процессе функционирования). Для определения ширины гауссового доверительного интервала также используется понятие интерквартильного размаха применительно к выборке значений электропотребления объекта на протяжении ряда временных интервалов развития техноценоза [23,24]:

 

(4.85)

 

Если исходить из того, что распределение значений электропотребления для одного объекта на протяжении ряда временных интервалов также является нормальным [20], то ширина интерквартильного размаха может быть определена на основе решения относительно переменной  уравнения, аналогичного (4.84).

Гауссовый доверительный интервал является мерилом гауссового ресурса объекта на ранговом параметрическом распределении и характеризует разброс параметров объекта, при которых его функционирование можно считать нормальным (независимо от поведения техноценоза). Ширина данного интервала задается предысторией развития объекта, и чем ширина меньше, тем стабильней его функционирование. В случае выхода эмпирического значения параметра объекта за границы гауссового интервала, можно говорить, что на самом объекте произошли резкие изменения (осуществлена модернизация оборудования, внедрены новые технологии) либо система предъявила новые требования, для выполнения которых объект вынужден резко изменить свой режим функционирования (рис. 4.40).

 

 

Рис. 4.40.

Пример гауссового доверительного интервала

 

Таким образом, для каждого объекта можно получить отношение системного и гауссового доверительных интервалов, которое называется коэффициентом когерентности и показывает степень согласованности поведения объекта по отношению к техноценозу:

 

(4.86)

где

KK

количество кластеров, выделяемое на ранговом параметрическом распределении техноценоза;

 

KO

количество объектов техноценоза.

 

Итак, теоретически коэффициент когерентности может быть определен как предел отношения системного ресурса кластера (выражение (4.82)) к его гауссовому ресурсу (4.81) при условии сужения ширины кластера до нуля (устремления количества кластеров к общему количеству объектов техноценоза). Это проиллюстрировано на рисунке 4.38. Эмпирически же, как указано выше, коэффициент когерентности может быть определен как отношение системного доверительного интервала (см. (4.83)) к гауссовому (4.85). Если коэффициент когерентности близок к единице (то есть системный и гауссовый интервалы примерно равны), то можно говорить о согласованном поведении.

Дальнейший более глубокий GZ-анализ техноценоза заключается в определении кумулятивного когерент-фактора (coherent factor), который равен отношению суммарного системного доверительного интервала всех объектов техноценоза к соответствующему суммарному гауссовому доверительному интервалу:

 

(4.87)

 

где

n

количество объектов техноценоза.

 

Когерент-фактор техноценоза показывает, в какой степени его системное поведение согласовано с индивидуальным поведением объектов по отдельности (под поведением здесь, безусловно, понимаются свойства параметрического временного ряда). Затем могут быть получены динамические когерент-функции (coherent function):

 

(4.88)

 

где

t

время функционирования техноценоза.

 

Когерент-функции позволяют оценивать в любой момент времени и прогнозировать изменение динамических свойств как техноценоза в целом, так и объектов в частности.

Когерент-параметры могут существенно оптимизировать процесс прогнозирования в техноценозе. В частности, коэффициент когерентности является индикатором выбора наиболее эффективного метода прогнозирования для рассматриваемого объекта. При сравнительно больших значениях коэффициента лучше работают G-методы, в противном случае – Z-методы, а в качестве критерия выбора может применяться альтернатива [20]:

 

(4.89)

 

где

соответственно левое и правое критериальные значения коэффициента когерентности;

 

соответственно минимальное и максимальное значения коэффициента когерентности.

 

Критериальные значения коэффициента когерентности в выражении (4.89) определяются на основе юстировки базы методов прогнозирования к базе данных по электропотреблению. Здесь находит применение эвристический вариант GZ-анализа, целью которого является определение так называемой GZ-матрицы, представляющей собой таблицу методов прогнозирования, определенных как наиболее эффективных применительно к объектам на соответствующих временных интервалах (рис. 4.41) [20].

 

 

Рис. 4.41.

Фрагмент транспонированной GZ-матрицы

методов прогнозирования (пример)

 

Строки GZ-матрицы – объекты, столбцы – последние пять временных интервалов предыстории функционирования (следует учесть, что для наглядности на рис. 4.41 изображена транспонированная матрица). Элемент матрицы – код метода, который дает для объекта наименьшую относительную ошибку. Кодировка методов прогнозирования в GZ-матрице следующая (рис. 4.32): 1 – G-метод на основе АРСС; 2 – G-метод на основе МДВР; 3 – G-метод на основе SSA; 4 – Z-метод БПТ; 5 – Z-метод СПТ; 6 – Z-метод ДКЗ.

Следует отметить, что GZ-матрица получается в результате последовательной многократной реализации различных методов прогнозирования применительно к базе данных по электропотреблению. При этом глубина матрицы данных меняется прибавлением вектора данных по одному временному интервалу (начиная от минус пятого), и применительно к каждому состоянию матрицы данных выполняются процедуры эвристического варианта GZ-анализа (см. комментарии к рис. 4.33, 4.34).

Параллельно с GZ-матрицей формируется матрица коэффициентов когерентности объектов на последних пяти временных интервалах, имеющая ту же размерность (матрица G, рис. 4.42). При этом расчет коэффициентов когерентности каждый раз осуществляется на основе статистической обработки выборок значений электропотребления из матрицы данных соответствующей глубины. В результате каждому объекту на каждом временном интервале можно соотнести два ключевых параметра: код наиболее эффективного метода прогнозирования и коэффициент когерентности.

 

 

Рис. 4.42.

Фрагмент транспонированной матрицы

коэффициентов когерентности (пример)

 

Статистическое сравнение GZ-матрицы и матрицы коэффициентов когерентности G позволяет получить параметры для выражения (4.89). При этом граничные значения коэффициента когерентности  получаются путем извлечения минимального и максимального элементов из матрицы G:

 

(4.90)

 

Значения левого и правого критериальных значений коэффициента когерентности  получаются на основе предварительного анализа чувствительности, в ходе которого методом случайного поиска осуществляется варьирование с целью определения таких значений, при которых частота встречаемости в GZ-матрице кодов G- и Z-методов различалась бы в наибольшей степени. Частота встречаемости кодов определяется путем статистической обработки предварительно векторизованной GZ-матрицы. Поиск осуществляется в разделенной пополам области определения, в качестве которой выступает векторизованная матрица коэффициентов когерентности G, путем численного решения следующей оптимизационной задачи нулевого порядка (рис. 4.43) [20,52]:

 

(4.91)

 

где

количество элементов GZ-матрицы, имеющих коды, соответствующие G-методам (1 – 3);

 

количество элементов GZ-матрицы, имеющих коды, соответствующие Z-методам (4 – 6);

 

общее количество элементов GZ-матрицы.

 

 

 

Рис. 4.43.

Результат решения оптимизационной задачи (пример)

 

Следует подчеркнуть, что целевая функция в формуле (4.91) формально прописана неоднозначно, т.к. в ее левой части предусмотрены операции над GZ-матрицей, а в правой записаны условия, касающиеся матрицы коэффициентов когерентности G. Однако данная неоднозначность снимается однозначным соответствием между элементами двух матриц.

Кроме того, оптимизационная задача (4.91) неизбежно порождает область неопределенности, в которой G- и Z-методы прогнозирования, как наиболее эффективные, встречаются примерно с одинаковой частотой (см. выражение (4.89) и рис. 4.43). В области неопределенности предлагается использовать комбинацию применяемых методов прогнозирования электропотребления. Прогноз в заданный момент времени вычисляется по отдельности каждым методом с использованием информации, доступной на интервале предыстории. Окончательное прогнозное значение электропотребления получается как билинейная комбинация всех применяемых методов:

 

(4.92)

 

где

результирующее прогнозное значение электропотребления на момент времени (t+1) (см. рис. 4.34);

 

KF

количество факторов, оказывающих значимое воздействие на процесс электропотребления;

 

весовой коэффициент i-го фактора (второе уравнение системы – условие нормировки данных весовых коэффициентов);

 

KM

количество применяемых методов прогнозирования;

 

весовой коэффициент j-го метода прогнозирования с учетом i-го фактора  на (t+1)-ом временном интервале (третье уравнение – условие нормировки данных весовых коэффициентов);

 

прогнозное значение электропотребления, полученное j-м методом с учетом i-го фактора на момент времени (t+1).

 

Весовые коэффициенты факторов, воздействующих на процесс электропотребления, определяются на основе предварительного фактор-анализа [23], а весовые коэффициенты каждого из методов прогнозирования вычисляются как частота встречаемости данного метода прогнозирования как лучшего в области неопределенности GZ-матрицы:

 

(4.93)

 

где

количество элементов области неопределенности GZ-матрицы, где рассматриваемый метод фиксируется как лучший;

 

общее количество элементов области неопределенности;

 

коэффициент когерентности объектов техноценоза;

 

GZ

GZ-матрица лучших методов прогнозирования;

 

G

G-матрица коэффициентов когерентности;

 

i, j

индексы матриц.

 

К системе (4.93) необходимо дать следующие важные пояснения. Во-первых, для выполнения нормировочного условия (второе уравнение) должны быть рассмотрены все элементы области неопределенности GZ-матрицы. Во-вторых, границы самой области неопределенности фиксируются по соответствующим критериальным значениям коэффициента когерентности G-матрицы (третье уравнение системы). В-третьих, однозначное соответствие между GZ-матрицей и матрицей коэффициентов когерентности устанавливается по индексам строк и столбцов (четвертое выражение).

Таким образом, на этапе статистического анализа и построения эмпирической модели процесса электропотребления осуществляется глубокая обработка данных по электропотреблению объектов, которая включает процедуры интервального оценивания, прогнозирования и нормирования. Прогнозирование электропотребления объектами осуществляется с использованием гауссовых и ципфовых (G- и Z-) методов. Более тонкий анализ рангового параметрического распределения, осуществляемый с помощью процедур GZ-анализа, позволяет существенно повысить эффективность прогнозирования. Как показано в работе [20], погрешность прогнозирования электропотребления с применением процедур критериального GZ-анализа для отдельных объектов может составить 4 – 10 %. При этом погрешность прогноза для техноценоза в целом, как правило, не превышает 1,5 – 2 %, что является хорошим результатом.

 

 

 

 

Рейтинг@Mail.ru

При использовании материалов ссылки обязательны

Все права защищены © Гнатюк В.И., 2005

E-mail: mail@gnatukvi.ru