Гнатюк В.И. Закон оптимального построения техноценозов, 2005 – главная страница

Адрес монографии в сети – http://gnatukvi.ru/ind.html

 

 

 

 

4.4. Структура GZ-модуля динамической

адаптивной модели

 

 

G-методы прогнозирования. G-метод прогнозирования с помощью авторегрессионной модели. G-метод декомпозиции временных рядов. Z-методы прогнозирования. Z-метод без деления на кастовые зоны. Z-метод без деления на кастовые зоны с фиксированной первой точкой. Z-метод с делением на кастовые зоны.

 

 

Ядром разрабатываемой динамической адаптивной модели управления процессом электропотребления объектов техноценоза является так называемый GZ-модуль прогнозирования. Следовательно, от корректности его работы в первую очередь зависит качество модели. GZ-модуль реализует замысел GZ-методики прогнозирования [20], в полной мере учитывающей как индивидуальные, так и системные свойства объектов техноценоза, которые проявляются на различных этапах функционирования. В основе прогностического аппарата данной методики лежат два основных класса [20]: G-методы, основанные на гауссовой математической статистике, и Z-методы, основанные на ципфовой математической статистике. В качестве G-методов используются следующие: прогнозирования с помощью авторегрессионной модели; декомпозиции временных рядов. Выбор данных методов основывается на том, что они при достаточной простоте моделей наилучшим образом описывают временные ряды электропотребления. Z-методы, в свою очередь, включают следующие разновидности: с делением на кастовые зоны; без деления на кастовые зоны; с делением на кастовые зоны с фиксированной первой точкой; без деления на кастовые зоны с фиксированной первой точкой.

Рассмотрим поочередно модели, используемые при прогнозировании G-методами. При этом для наглядности используем имеющиеся данные по электропотреблению реального техноценоза (приложение 2) [20]. Электропотребление объектов техноценоза представляет собой дискретный временной ряд  (рис. 4.19).

 

 

Рис. 4.19.

Временной ряд электропотребления одного

из объектов техноценоза (реальный пример):

абсцисса – известные месяцы предыстории;

ордината – электропотребление, кВт·ч

 

Авторегрессионная модель – это частный случай общей линейной модели. В ней текущее значение процесса выражается как конечная линейная комбинация предыдущих значений процесса и белого шума [23]. Авторегрессионная модель записывается следующим образом:

 

 

(4.59)

где

отклонение процесса от своего выборочного среднего значения;

 

параметры авторегрессии;

 

t

время (как правило, месяцы);

 

p

порядок модели;

 

последовательность одинаково распределенных величин (белый шум);

 

B

оператор сдвига назад.

 

Важными характеристиками авторегрессионных моделей являются выборочные автоковариационная и автокорреляционная функции [23,24]:

 

 

 

(4.60)

где

k = 1,2,3,…,(n–1)

предиктор авторегрессионной модели;

 

выборочная автоковариационная функция;

 

выборочная автокорреляционная функция;

 

выборочная дисперсия временного ряда;

 

n

объем выборки.

 

На рисунке 4.20 представлена выборочная автокорреляционная функция (АКФ) для временного ряда одного из объектов рассматриваемого техноценоза.

 

 

Рис. 4.20.

Выборочная АКФ для ряда одного из объектов техноценоза:

абсцисса – известные месяцы предыстории;

ордината – значения АКФ в относительных единицах;

штриховые линии – границы доверительного интервала

 

Выборочная АКФ вычисляется с помощью быстрого преобразования Фурье, после чего необходимо идентифицировать процесс авторегрессии, т.е. определить порядок разрабатываемой модели. Это осуществляется с помощью выборочной частной автокорреляционной функции (ЧАКФ) модели. Знание свойств данной функции требуется при решении вопроса, является ли порядок предиктора k достаточно большим для адекватного описания структуры временного ряда с возможностью использования параметров авторегрессии  для прогнозирования. Главное характеризующее свойство авторегрессионной модели – это конечность ее выборочной ЧАКФ [23], т.е.:

 

(4.61)

 

Процедура вычисления коэффициентов конечного предиктора, останавливаемая при k = p, сводится к решению уравнений Юла – Уолкера для нахождения параметров по данным выборочных автокорреляций [23]:

 

 

или в матричной форме:

(4.62)

где

вектор-столбец неизвестных параметров модели;

 

вектор-столбец выборочных автокорреляций;

 

матрица выборочных автокорреляций;

 

j = 1,2,…,k

формальный индекс.

 

Решая систему (4.49) последовательно для различных k получим:

 

(4.63)

 

На рисунке 4.21 представлена выборочная ЧАКФ для временного ряда одного из объектов техноценоза. Анализ рисунка показывает, что выборочная ЧАКФ не становится равной нулю на третей задержке, что свидетельствует о необходимости в данном случае решить систему уравнений Юла – Уолкера (4.62) для проверки достаточности модели авторегрессии. Вхождение выборочной ЧАКФ на четвертой задержке в пределы доверительного интервала свидетельствует о необходимости идентифицировать процесс с помощью авторегрессионной модели третьего порядка.

 

 

Рис. 4.21.

Выборочная ЧАКФ для ряда одного из объектов техноценоза:

абсцисса – номера задержек ЧАКФ;

ордината – значения ЧАКФ в относительных единицах;

штриховые линии – границы доверительного интервала

 

Для окончательной оценки параметров модели составляется целевая функция, где белый шум представляется в виде функции значений ряда:

 

 

(4.64)

 

Поиск минимума функции  осуществляется с помощью алгоритмов оптимизации, основывающихся на стандартных итерационных вычислениях с использованием методов квазиньютоновского или сопряженных градиентов. Оба метода основаны на идее замены минимизируемой функции в окрестности очередной точки первыми членами ее разложения в ряд Тейлора [23,52]. В градиентном методе берется линейная часть разложения, в методе Ньютона – квадратическая.

Последовательность приближений  к точке минимума выбирается по следующему правилу:

 

(4.65)

где

направление убывания функции F в точке ;

 

параметр, регулирующий длину шага вдоль .

 

В градиентном методе  приравнивается антиградиенту функции F в точке области определения  [23,52]:

 

(4.66)

 

Если длина шага в градиентном методе выбирается из условия минимизации функции вдоль направления антиградиента (4.66), то получается распространенный метод наискорейшего спуска.

Метод сопряженных градиентов дает более высокую скорость сходимости и реализуется в общем виде следующим образом:

 

 

k = 0, 1, …;

   

(4.67)

где

скалярное произведение элементов x и y;

 

норма элемента x.

 

При первой итерации  выбирается, как и в методе наискорейшего спуска, а при последующих – вдоль направления .

К методам оптимизации второго порядка относится квазиньютоновский метод. Он несколько эффективнее метода сопряженных градиентов, так как в нем результаты вычислений сходятся быстрее [23,52]. Квазиньютоновский метод в общем случае реализуется следующим образом:

 

 

 

 

(4.68)

 

В качестве  часто применяется единичная матрица. Длина шага выбирается из условия минимизации F вдоль заданного направления:

 

(4.69)

 

Недостатком метода является то, что его сходимость и результат вычислений зависят от начального приближения. Следует отметить, что результаты, полученные с помощью двух перечисленных методов, различаются лишь в восьмом знаке после запятой, что совпадает с результатами, полученными в [20,41,48-50].

После идентификации модели и нахождения окончательных оценок ее параметров необходимо проверить качество модели, тестируя остатки на белый шум (рис. 4.22). Кумулятивный спектр остатков вычисляется с помощью быстрого преобразования Фурье.

 

 

Рис. 4.22.

Кумулятивный спектр остатков для одного из объектов:

абсцисса – частота, 1/месяц;

ордината – накопленный спектр в относительных единицах;

верхняя и нижняя сплошные линии – доверительные границы;

средняя сплошная линия – теоретический нормированный

кумулятивный спектр остатков;

кривая с кругами – кумулятивный спектр остатков;

кривая с крестиками – кумулятивный спектр исходного

процесса электропотребления объекта

 

В данном случае накопленный спектр остатков модели лежит внутри доверительных границ, что подтверждает адекватность разработанной модели и свидетельствует о том, что остатки являются белым шумом. Так как разработанная модель адекватна, то с ее помощью можно осуществлять прогноз на год вперед (рис. 4.23). Для нашего случая (модель третьего порядка) прогноз осуществляется по следующему выражению:

 

 

   

q = (3…n) + 12,

(4.70)

где

q

индексы известных значений электропотребления временного ряда объекта плюс время упреждения (12 месяцев).

 

 

Рис. 4.23.

Прогноз электропотребления объекта на год вперед с помощью

авторегрессионной модели третьего порядка:

абсцисса – номер месяца;

ордината – электропотребление, кВт·ч;

кривая с крестиками – электропотребление за известный период;

кривая без крестиков – прогнозное электропотребление

 

Как показывают расчеты, относительная ошибка для техноценоза в целом при прогнозировании с помощью авторегрессионных моделей может составить до 4 %.

Прогнозная модель декомпозиции временных рядов при анализе случайного процесса электропотребления в своей основе содержит следующие составляющие: детерминированную (тренд), сезонную, и остаточную случайную. В общем случае, вычитание тренда приводит к моделированию стационарного процесса, что обеспечивает повышение устойчивости и точности. Рассматриваемую модель можно представить выражением вида [23,24]:

 

(4.71)

где

f(t)

детерминированная составляющая процесса (тренд);

 

сезонная составляющая;

 

остаточная случайная составляющая.

 

На начальном этапе временной ряд электропотребления объекта логарифмируется с целью устранения нелинейности математического ожидания и дисперсии. Далее с помощью линейного метода наименьших квадратов вычисляется тренд:

 

 где a, b – коэффициенты.

(4.72)

 

На рисунках 4.24 и 4.25 приведен случайный процесс электропотребления объекта после логарифмирования данных и удаления тренда.

 

 

Рис. 4.24.

Временной ряд электропотребления объекта после

логарифмирования данных и вычитания тренда:

абсцисса – известные месяцы предыстории;

ордината – электропотребление в относительных

единицах по логарифмической шкале

 

 

Рис. 4.25.

Изменение электропотребления объекта в различные годы

исследуемого периода:

абсцисса – номер месяца в пределах года;

ордината – электропотребление в относительных единицах;

ломаные линии – электропотребление в различные годы

 

Анализ рисунка 4.24 показывает, что присутствует довольно сильная периодическая составляющая. Для выделения зависимости значений электропотребления объекта от времени года (сезонности) производится помесячная группировка данных. На рисунке 4.25 приведены результаты, из которого можно сделать вывод о том, что в процессе электропотребления объекта также явно прослеживается сезонность.

Для дальнейшей обработки выделяются ежемесячные медианные и минимальные уровни электропотребления. Данные сглаживаются по методу Гаусса в зависимости от ширины гауссовского окна и времени [23]. Результаты представлены на рисунке 4.26.

 

 

Рис. 4.26.

Сравнение среднемесячных характеристик электропотребления:

абсцисса – номер месяца в пределах года;

ордината – электропотребление в относительных единицах;

верхняя и нижняя кривые – среднемесячные медианные

и минимальные значения электропотребления

 

Для определения границ переменного доверительного интервала с помощью критерия Кохрена [23,52] проверяется гипотеза об однородности дисперсий электропотребления по месяцам за все годы наблюдений. После подтверждения гипотезы верхние и нижние границы переменного доверительного интервала определяются следующим образом:

 

(4.73)

где

H

верхняя граница переменного доверительного интервала;

 

L

нижняя граница переменного доверительного интервала;

 

медианный уровень электропотребления объекта;

 

ширина доверительного интервала;

 

среднее значение дисперсии за все годы наблюдения.

 

Далее методом наименьших квадратов определяется тренд на 12 месяцев вперед. Прибавление тренда к медианному уровню электропотребления объекта и обратное преобразование данных (после логарифмирования) позволяют получить прогноз на год вперед (рис. 4.27).

 

 

Рис. 4.27.

Прогноз электропотребление объекта на год вперед:

абсцисса – номер месяца в пределах года;

ордината – электропотребление в кВт·ч;

кривая с крестиками – известное электропотребление;

кривая без крестиков – прогноз электропотребления;

штриховые линии – границы доверительного интервала

 

На завершающем этапе модель проверяется на адекватность. При этом остатки прогнозирования проверяются на нормальность с помощью критерия Пирсона [24] (рис. 4.28) и тестируются на белый шум (рис. 4.29). В частности, из рисунков видно, что разработанная модель адекватна, и ее можно применять для прогноза электропотребления техноценоза. Как показывают расчеты, относительная ошибка для техноценоза в целом при прогнозировании с помощью рассматриваемого метода может составить до 2 %.

 

 

Рис. 4.28.

Проверка гипотезы о нормальном законе распределения

остатков по критерию Пирсона:

абсцисса – границы интервалов;

ордината – частота попадания точек в интервал;

гистограмма – эмпирические частоты;

кривая линия – теоретические частоты

 

 

Рис. 4.29.

Кумулятивный спектр остатков электропотребления объекта:

абсцисса – частота спектра, 1/год;

ордината – накопленный спектр в относительных единицах;

верхняя и нижняя сплошные линии – доверительные

границы кумулятивного спектра остатков;

средняя сплошная линия – теоретический нормированный

кумулятивный спектр стандартизированных остатков;

кривая с кругами – кумулятивный спектр остатков

 

В процессе прогнозирования электропотребления техноценоза Z-методами должны учитываться техноценологические свойства, сводящиеся в конечном итоге к понятию устойчивости ранговых гиперболических распределений [20,59].

Рассмотрим Z-метод прогнозирования без деления на кастовые зоны. Суммарное электропотребление техноценоза определяется на основе интерполяции основных параметров гиперболической формы рангового параметрического распределения с рангом r [20,59]:

 

(4.74)

где

прогнозные параметры, определяемые на основе временных рядов или вторичного рангового анализа.

 

Для определения коэффициентов регрессии целесообразно использовать классическую двухпараметрическую форму Н-распределения, получившую наибольшее распространение среди исследователей [20,28,41]:

 

(4.75)

где

вектор расчетных значений электропотребления;

 

вектор рангов объектов техноценоза;

 

максимальное значение электропотребления, которому соответствует первый ранг (первая точка);

 

ранговый коэффициент, задающий степень крутизны и форму аппроксимирующей кривой.

 

Коэффициенты регрессии определяются по методу наименьших квадратов, с помощью которого получаются наиболее точные результаты [49]. Прогнозные значения рангового коэффициента и первой точки можно получить экстраполяцией временных рядов (рис. 4.30). Ошибка регрессии непосредственно по выражению (4.75) достаточно велика. Для повышения точности вычисляется расчетный ранг (4.76), который является рангом проекции фактических значений на аппроксимирующую кривую:

 

(4.76)

где

вектор расчетных рангов;

 

вектор фактических значений электропотребления объектов за последний известный год предыстории;

 

расчетные коэффициенты регрессии для последнего известного года предыстории.

 

 

Рис. 4.30.

Прогнозные кривые параметров рангового распределения:

абсциссы – временные интервалы (годы);

ординаты – значения параметров  (кВт·ч) и ;

точки – эмпирические значения параметров

 

Подставляя в выражение (4.62) прогнозные значения коэффициентов регрессии и расчетный ранг, считая его неизменным, можно получить прогноз на следующий временной шаг. Относительная ошибка прогноза для техноценоза в целом здесь может составить 1,8 % [20].

Имеется разновидность Z-метода без деления на кастовые зоны, которая реализуется с фиксированной первой точкой. Она отличается тем, что для прогнозирования электропотребления вычисляется только ранговый коэффициент, а в качестве первой точки распределения берется не расчетное значение, а результат экстраполяции на последующий год эмпирических значений за все годы предыстории. Относительная ошибка прогноза по второму методу иногда снижается до 1,5 % [20].

Возможен прогноз электропотребления техноценоза с делением на кастовые зоны, границы которых определяются с использованием критерия равного распределения ресурсов, являющегося следствием закона оптимального построения техноценозов [20]. В рамках данного метода вычисляется суммарный энергетический ресурс техноценоза по электропотреблению, который затем делится на три равные части (рис. 4.31):

 

(4.77)

где

треть суммарного энергетического ресурса техноценоза;

 

W(r)

ранговое параметрическое распределение техноценоза по электропотреблению.

 

 

Рис. 4.31.

Деление рангового параметрического распределения

техноценоза на кастовые зоны:

абсцисса – ранг объекта;

ордината – электропотребление, кВт·ч;

вертикальные линии – кастовые границы

 

Для прогнозирования электропотребления объектов ноевой касты техноценоза (левая зона на рис. 4.31) используются многочлены вида:

 

(4.78)

где

электропотребление объекта на j-ом этапе предыстории;

 

t

время (годы);

 

i-й коэффициент многочлена на j-ом этапе предыстории.

 

В основе принятой методики прогнозирования лежит подбор многочлена (4.78), который наилучшим образом описывает тенденцию процесса электропотребления. Прежде всего определяется оптимальная степень полинома для каждого из объектов ноевой касты, позволяющая осуществить прогноз с минимальной ошибкой. В качестве критерия оптимальности степени полинома используется минимум квадратического отклонения прогноза на последний известный год от проверочного значения за этот же год. Предыстория электропотребления разбивается на ряд этапов с определением наиболее подходящей аппроксимационной формы и соответствующих параметров многочлена. В итоге, прогнозная оценка электропотребления объекта в (t+1)-м году выглядит следующим образом:

 

(4.79)

где

n

количество этапов предыстории.

 

Для уточнения прогноза может быть применено линейное или экспоненциальное сглаживание модели (4.79).

При прогнозировании электропотребления объектов пойнтер-касты (средняя зона на рис. 4.31) и саранчовой касты (правая зона) должны учитываться техноценологические свойства, сводящиеся в конечном итоге к понятию устойчивости гиперболических распределений [20,57-59]. Метод прогноза в данном случае основан на экстраполяции временных рядов коэффициентов регрессии параметров гиперболической формы рангового распределения. При этом прогнозируемое электропотребление k-го объекта может быть определено следующим образом:

 

(4.80)

где

значения электропотребления для первой точки распределения с учетом и без учета k-го объекта в техноценозе;

 

соответствующие ранговые коэффициенты.

 

Как показывают расчеты, относительная ошибка прогнозирования для техноценоза в целом при реализации Z-метода с делением на кастовые зоны составляет до 1,6 % (с фиксированной первой точкой – 1,8).

Таким образом, исследование широкого спектра методов прогнозирования, часть из которых базируется на гауссовой методологии (G-методы), а часть – на ципфовой (Z-методы), позволило выявить наиболее эффективные из них. Данные методы составляют базу синтетического GZ-метода прогнозирования, позволяющего учитывать как индивидуальные, так и системные свойства объектов техноценоза, что существенно повышает точность прогноза. Кроме того, на базе этой методологии разработан так называемый GZ-модуль, лежащий в основе алгоритма обратных связей динамической адаптивной модели электропотребления.

 

 

 

 

Рейтинг@Mail.ru

При использовании материалов ссылки обязательны

Все права защищены © Гнатюк В.И., 2005

E-mail: mail@gnatukvi.ru