Гнатюк В.И. Закон оптимального построения техноценозов, 2005 – главная страница

Адрес монографии в сети – http://gnatukvi.ru/ind.html

 

 

 

 

4.7. Проверка адекватности полученных

результатов моделирования

 

 

Замысел оценки адекватности (первая процедура проверки). Абсолютная ошибка прогнозирования. Коэффициент вариации. Относительная ошибка. Вторая процедура оценки адекватности. Проверка остатков на наличие выбросов. Проверка остатков по критерию Пирсона. Оценка однородности дисперсий остатков. Выявление сериальной корреляции остатков. Тест остатков моделирования на белый шум. Проверка адекватности по критерию Фишера. Выводы по главе.

 

 

Оценка адекватности динамической адаптивной модели управления процессом электропотребления техноценоза является обязательной процедурой, реализуется в рамках постоянного мониторинга качества работы модели и включает две основные процедуры. Первая заключается в оценке ошибок (погрешностей) прогнозирования, т.е. проверке качества процесса прогнозирования. Вторая процедура предполагает анализ остатков прогнозирования на наличие полезной информации и различных неучтенных моделью закономерностей [4,23,24].

Замысел оценки адекватности заключается в следующем. Из имеющихся данных по электропотреблению объектов техноценоза последние пять лет резервируются в качестве матрицы верификации, а по оставшимся данным осуществляется перспективный прогноз на полную глубину матрицы верификации. Затем полученные прогнозные значения электропотребления техноценоза сравниваются с соответствующими эмпирическими данными с использованием двух процедур оценки адекватности. Отрицательный вывод по первой процедуре свидетельствует либо о существенных недостатках в методологии, применяемой в модели, либо о неправильной оценке ее прогностических возможностей. Вторая процедура служит индикатором полноты и корректности алгоритма модели. В любом случае, отрицательный вывод хотя бы по одной из процедур не позволяет применять модель в практических расчетах.

Абсолютная ошибка прогнозирования вычисляется по формуле:

 

(4.118)

где

вектор ошибок прогнозирования;

 

X

вектор эмпирических данных;

 

вектор прогнозных оценок.

 

Определение погрешностей осуществляется для всех исследуемых лет матрицы верификации, причем в качестве эмпирических значений электропотребления объектов техноценоза для расчетов берутся истинные значения, соответствующие расчетному году прогнозирования. Суммарная абсолютная ошибка определяется следующим образом:

 

(4.119)

где

i

формальный индекс;

 

n

количество объектов техноценоза.

 

Абсолютная ошибка для техноценоза в целом:

 

(4.120)

 

Численные значения абсолютных ошибок прогнозирования электропотребления техноценоза приведены в таблице 4.1 и на рисунке 4.61.

 

Таблица 4.1

ЗНАЧЕНИЯ АБСОЛЮТНЫХ ОШИБОК ПРОГНОЗИРОВАНИЯ

 

Год

Максимальная абсолютная ошибка, кВт·ч

Суммарная абсолютная ошибка, кВт·ч

Абсолютная ошибка для техноценоза, кВт·ч

+1

1,863·104

3,294·105

1,017·105

+2

4,687·104

4,421·105

1,589·105

+3

4,226·104

5,316·105

2,160·105

+4

1,865·104

5,094·105

3,440·105

+5

8,545·104

7,438·105

3,851·105

 

 

Рис. 4.61.

Динамика изменения абсолютной ошибки

прогнозирования для техноценоза:

абсцисса – исследуемые годы;

ордината – электропотребление, кВт·ч

 

Мерой рассеяния прогнозных значений служит коэффициент вариации [23,24]. Для его расчета сначала определяется выборочное среднее квадратическое отклонение абсолютной ошибки прогнозирования:

 

(4.121)

где

n

объем выборки;

 

выборочное среднее абсолютной ошибки прогнозирования.

 

Коэффициент вариации определяется по формуле:

 

(4.122)

где

выборочное среднее квадратическое отклонение абсолютной ошибки прогнозирования;

 

выборочное среднее реальных данных.

 

Численные значения коэффициента вариации, рассчитанные на годы прогноза, находятся в пределах 2 – 6 %.

Относительная ошибка прогнозирования для объектов техноценоза вычисляется по следующей формуле:

 

(4.123)

 

Суммарная относительная ошибка прогнозирования (рис. 4.62):

 

(4.124)

 

Средняя относительная ошибка (рис. 4.63):

 

(4.125)

 

Относительная ошибка для техноценоза в целом (рис. 4.64):

 

(4.126)

 

 

Рис. 4.62.

Динамика изменения суммарной относительной

ошибки прогнозирования:

абсцисса – исследуемые годы;

ордината – относительные единицы

 

 

Рис. 4.63.

Динамика изменения средней относительной

ошибки прогнозирования:

абсцисса – исследуемые годы;

ордината – проценты

 

 

Рис. 4.64.

Динамика изменения относительной ошибки

прогнозирования для техноценоза:

абсцисса – исследуемые годы;

ордината – проценты

 

Численные значения относительных ошибок прогнозирования электропотребления техноценоза приведены в таблице 4.2.

 

Таблица 4.2

ЗНАЧЕНИЯ ОТНОСИТЕЛЬНЫХ ОШИБОК ПРОГНОЗИРОВАНИЯ

 

Год

Суммарная относительная ошибка

Средняя относительная ошибка, %

Относительная ошибка для техноценоза, %

+1

5,114

7,4

0,6

+2

6,844

9,9

0,9

+3

8,498

12,3

1,2

+4

10,679

15,5

1,9

+5

11,387

16,5

2,1

 

Главным показателем, характеризующим точность прогноза, является относительная ошибка прогнозирования для всего техноценоза. Ее значение растет с увеличением глубины, принимая свое максимальное значение на последнем году исследования – 2,1 % (табл. 4.2). Такая точность перспективного прогноза электропотребления превосходит все известные методы и вполне соответствует существующим высоким требованиям [20].

В рамках второй процедуры оценки адекватности работы модели производится анализ остатков, который включает проверку выполнения ряда условий [23,24,40]: остатки должны быть независимыми, иметь нулевые средние, одинаковую (постоянную) дисперсию, и их распределение должно подчиняться нормальному закону. В первую очередь при анализе вычисляются стандартизированные остатки прогнозирования [23]:

 

(4.127)

где

абсолютная ошибка прогнозирования;

 

выборочное среднее абсолютной ошибки прогнозирования;

 

выборочное среднее квадратическое отклонение абсолютной ошибки прогнозирования.

 

Полученные стандартизированные остатки проверяются на наличие выбросов. Выбросом называется остаток, который по абсолютной величине превосходит остальные и отличается от среднего по остаткам более чем на три стандартных отклонения. Из рисунка 4.65 видно, что для исследуемого техноценоза все стандартизированные остатки лежат в пределах доверительного интервала, что указывает на отсутствие существенных аномалий в рассматриваемом процессе прогнозирования.

 

 

Рис. 4.65.

Проверка остатков на наличие выбросов:

абсцисса – номера объектов;

ордината – значения стандартизированных остатков;

точки – стандартизированные остатки;

сплошные линии – границы доверительного интервала

 

При корректном моделировании остатки всегда являться результатом случайного рассеяния, в котором не прослеживается доминирующее действие какого-либо алгоритмически неконтролируемого и неуправляемого процесса [23,24]. Если данное условие выполняется, то согласно центральной предельной теореме, при увеличении числа опытов, распределение остатков будет подчиняться закону Гаусса. Проверка остатков на соответствие нормальному закону распределения осуществлялась по критерию Пирсона [23], наблюдаемое значение которого вычисляется по формуле:

 

(4.128)

где

m

количество интервалов;

 

h

эмпирические частоты;

 

теоретические частоты.

 

Наблюдаемые значения критерия для моделируемых лет показаны в таблице 4.3. По табулированному распределению , при уровне значимости  и числе степеней свободы k = m – 3, найдена критическая точка правосторонней критической области: . Если , то гипотеза о нормальном законе распределения остатков принимается, в противном случае – отвергается.

 

Таблица 4.3

ВЫЧИСЛЕННЫЕ ЗНАЧЕНИЯ  НА ПРОГНОЗИРУЕМЫЕ ГОДЫ

 

Годы прогноза

+1

+2

+3

+4

+5

Значения

10,681

7,805

6,393

9,347

10,819

 

Исходя из полученных результатов, приведенных в таблице 4.3, можно сделать вывод о том, что теоретические и эмпирические частоты различаются не значимо (рис. 4.66), следовательно, гипотеза о нормальном распределении генеральной совокупности остатков принимается.

 

 

Рис. 4.66.

Проверка гипотезы о нормальном законе распределения

остатков прогнозирования по критерию Пирсона:

абсцисса – границы интервалов;

ордината – частоты попадания точек в интервал;

гистограмма – эмпирические частоты;

кривая линия – теоретические частоты

 

Так как остатки прогнозирования подчиняются нормальному закону распределения, то далее необходимо оценить однородность их дисперсий с помощью критерия Кохрена [23,24]. В рамках данной процедуры сначала вычисляются исправленные выборочные дисперсии стандартизированных остатков для всех прогнозных лет:

 

(4.129)

где

n

объем выборки;

 

se

вектор стандартизированных остатков;

 

выборочное среднее стандартизированных остатков.

 

Наблюдаемое значение критерия Кохрена вычисляется по формуле:

 

(4.130)

где

максимальная исправленная выборочная дисперсия стандартизированных остатков;

 

исправленные выборочные дисперсии стандартизированных остатков на прогнозные годы.

 

Расчеты, выполненные для исследуемого техноценоза, дали . По таблице для критических точек распределения Кохрена, при уровне значимости , числе степеней свободы k = n – 1 и количестве расчетных выборок, равном пяти, с помощью интерполяции для заданных значений параметров найдена критическая точка правосторонней критической области: . Так как , то гипотеза об однородности дисперсий стандартизированных остатков принимается. Это является доказательством того, что максимальное значение изменчивости не является инородным, а представляет собой результат случайного рассеяния исследуемой функции отклика.

Если разработанная модель адекватна, то остатки моделирования должны являться независимыми случайными величинами с распределением , т.е. все сериальные корреляции . В противном случае, наличие сериальной корреляции остатков ставит под сомнение подобранную модель и делает целесообразным повторный анализ данных. Для выявления сериальной корреляции остатков применяется специальный критерий Дарбина – Уотсона [23,24].

Прежде всего, по вектору стандартизированных остатков прогнозирования оценивается значение d-статистики:

 

(4.131)

где

se

вектор стандартизированных остатков прогнозирования;

 

n

число наблюдений;

 

i

формальный индекс.

 

Ниже в таблице 4.4 представлены численные значения d-статистики для пяти лет прогнозирования.

 

Таблица 4.4

ЗНАЧЕНИЯ D-СТАТИСТИКИ НА ИССЛЕДУЕМЫЕ ГОДЫ

 

Годы прогноза

+1

+2

+3

+4

+5

Значения

d-статистики

1,866

2,011

1,789

1,985

2,154

 

Рассматриваемая d-статистика оценивается с помощью двустороннего критерия Дарбина – Уотсона с равными хвостами  [24]. Если , то d-статистика значима и гипотеза  отвергается на уровне . При , d-статистика незначима и гипотеза  принимается на уровне . В противном случае, когда , критерий не позволяет сделать какие-либо выводы. По таблице критических точек критерия Дарбина – Уотсона, при уровне вероятности , числе наблюдений n = 69 и количестве предикторов k = 5, найдены обе критические точки:  и . При сравнении вычисленных значений d-статистики (табл. 4.4) с критическими точками можно заключить, что d-статистика незначима, что позволяет принять гипотезу об отсутствии сериальной корреляции остатков.

Еще одним критерием проверки модели на адекватность является тест остатков моделирования на белый шум, который проводится с помощью критерия Бартлетта [23,24]. Спектр мощности белого шума p(f) имеет в частотном диапазоне 0 – 0,5 Гц постоянное значение . Следовательно, график кумулятивного (накопленного) спектра белого шума, как интегральной функции частоты

 

(4.132)

 

имеет вид прямой линии, идущей от точки (0;0) к точке (0,5;1,0). Выборочное значение спектра белого шума вычисляется с помощью быстрого преобразования Фурье.

Вероятностное соотношение между теоретическим и выборочным кумулятивным спектром такое же, как между теоретической и эмпирической функциями распределения вероятности. Благодаря этому возникает возможность построить доверительные границы для теоретического кумулятивного спектра с помощью широко известного критерия Колмогорова [23], в соответствии с которым вычисляется теоретически нормированный накопленный спектр белого шума:

 

   

(4.133)

где

нормированный накопленный спектр белого шума;

 

частота спектра;

 

n

объем выборки.

 

Верхние и нижние доверительные границы теоретического кумулятивного спектра рассчитываются по формулам:

 

(4.134)

где

верхняя и нижняя доверительные граница спектра.

 

Анализ рисунка 4.67 показывает, что накопленный спектр стандартизированных остатков лежит внутри доверительных границ, т.е. спектр остатков представляет собой белый шум, что, в свою очередь, подтверждает адекватность разработанной модели.

 

 

Рис. 4.67.

Кумулятивный спектр стандартизированных остатков:

абсцисса – частота спектра, 1/год;

ордината – накопленный спектр в относительных единицах;

верхняя и нижняя сплошные линии – доверительные

границы кумулятивного спектра остатков;

средняя сплошная линия – теоретический нормированный

кумулятивный спектр стандартизированных остатков;

кривая с кругами – кумулятивный спектр остатков

 

На завершающем этапе проверки адекватности модели проверяется выполнение критерия Фишера [23,24], в соответствии с которым вычисляется выборочная дисперсия принятой регрессионной модели:

 

(4.135)

где

n

объем выборки;

 

p

число коэффициентов, входящих в модель;

 

i

формальный параметр;

 

вектор прогнозных оценок и его среднее.

 

В качестве критерия значимости используется специальный F-параметр, который равен отношению двух рассматриваемых выборочных дисперсий (табл. 4.5):

 

(4.136)

где

выборочная дисперсия регрессионной модели;

 

выборочная дисперсия абсолютной ошибки прогнозирования.

 

Таблица 4.5

ЗНАЧЕНИЯ F-ПАРАМЕТРА НА ИССЛЕДУЕМЫЕ ГОДЫ

 

Годы прогноза

+1

+2

+3

+4

+5

Значения

F-параметра

9006

3551

3071

7878

1594

 

По таблице критических значений критерия Фишера [24], при уровне значимости , числе степеней свободы  и  определено критическое значение критерия: . Так как , то дисперсия, обусловленная регрессией, значимо больше дисперсии остатков, полученной для всех прогнозных лет, следовательно, модель адекватна.

Таким образом, оценка адекватности динамической адаптивной модели управления процессом электропотребления объектов исследуемого техноценоза показала следующее. Относительная ошибка прогнозирования для всей инфраструктуры, несколько возрастающая с увеличением глубины прогноза, на последнем (пятом) году не превышает 2,1 %. Следует отметить, что погрешность прогноза статической модели, описанной в работах [14-20,48-50], уже на первом году прогнозирования достигает 2 %, а на последующих годах она резко возрастает. Анализ остатков динамической модели показал, что все предъявляемые к ним требования выполняются: у стандартизированных остатков отсутствуют ярко выраженные выбросы, и они распределены по нормальному закону с однородной дисперсией; отсутствуют сериальные корреляции остатков, которые являются белым шумом, а дисперсия, обусловленная регрессией, значимо больше дисперсии остатков. Это является подтверждением адекватности разработанной модели, которая может применяться для моделирования электропотребления объектов техноценоза на глубину до 5 – 7 лет.

 

 

ВЫВОДЫ

 

Оптимизация электропотребления на системном уровне осуществляется в рамках связанной методики в четыре этапа. На этапе статистического анализа и построения эмпирической модели процесса электропотребления осуществляется полномасштабная обработка данных по электропотреблению, которая включает интервальное оценивание, прогнозирование и нормирование. Интервальное оценивание выявляет в динамике и наглядно представляет объекты с аномальным электропотреблением. С использованием гауссовых и ципфовых методов осуществляется прогнозирование электропотребления отдельными объектами и техноценозом в целом. Кластерный анализ позволяет разбить объекты по группам и осуществить нормирование электропотребления объектов в каждой группе с подробным статистическим описанием норм. Более тонкий анализ рангового параметрического распределения позволяет существенно повысить эффективность рангового анализа. Он осуществляется в рамках следующих процедур: дифлекс-анализа (на этапе интервального оценивания), GZ-анализа (на этапе прогнозирования) и ASR-анализа (на этапе нормирования).

Статическая модель электропотребления, стержнем которой является глубокая детерминированная обработка данных посредством процедур рангового, интервального и кластерного анализа, дополняется динамической адаптивной моделью, отражающей процесс электропотребления объектов техноценоза на глубину в будущем 5 – 7 лет и более. При этом ключевым является наличие обратной связи, корректирующей исходную базу данных по электропотреблению на основе результатов текущего моделирования. Динамический характер модели придает развитая система входных параметров, отражающих свойства и внешние условия функционирования объектов техноценоза, а также стохастический аналитический аппарат, основанный на имитационных принципах моделирования и оптимизации.

Результаты практической реализации и моделирования показывают, что даже в условиях средних (с точки зрения установленной мощности) техноценозов возможна экономия миллионов долларов в течение ближайших нескольких лет исключительно за счет внедрения методологии оптимального управления электропотреблением без существенных капитальных вложений. Параллельное внедрение технических решений и энергосберегающих технологий еще больше увеличивает экономию.

 

 

 

 

Рейтинг@Mail.ru

При использовании материалов ссылки обязательны

Все права защищены © Гнатюк В.И., 2005

E-mail: mail@gnatukvi.ru