Гнатюк В.И. Закон оптимального построения техноценозов, 2005 – главная страница

Адрес монографии в сети – http://gnatukvi.ru/ind.html

 

 

 

 

2. МЕТОДОЛОГИЯ РАНГОВОГО АНАЛИЗА

 

2.1. Общее содержание рангового анализа

 

 

Определение рангового анализа. Место рангового анализа в общей методологии научных картин мира. Понятие распределения. Понятие случайной величины. Случайность в техноценозе. Понятия негауссовости и ципфовости гиперболических распределений. Понятие безгранично делимого распределения. Определение распределения Ципфа. Определения видовых и ранговых распределений техноценоза. Специфика рангового функционального распределения. Аппроксимация распределений. Комплексные этапы-процедуры рангового анализа.

 

 

Специфика техноценозов, в том числе проявляется в методологических основаниях их исследования. Техноценозы не поддаются описанию ни традиционными методами гауссовой математической статистики, оперирующей понятиями среднего и дисперсии как информативно насыщенными свертками больших массивов статистической информации, ни лежащими в основе редукционизма имитационными моделями. Чтобы корректно описать техноценоз, необходимо постоянно оперировать выборкой в целом, как бы велика она ни была, что предполагает построение видовых и ранговых распределений, теоретическая основа которых лежит в области негауссовой (ципфовой) математической статистики устойчивых гиперболических безгранично делимых распределений [20,28,37]. Методология построения видовых и ранговых распределений, а также их последующего использования в целях оптимизации техноценоза составляет основной смысл рангового анализа, содержание и технология которого представляют собой новое фундаментальное научное направление, сулящее большие практические результаты.

Начнем с уже достаточно устоявшегося определения. Ранговый анализ – метод исследования больших технических систем особого ценологического типа (техноценозов), имеющий целью их статистический анализ, а также оптимизацию, и полагающий в качестве основного критерия форму видовых и ранговых распределений. Включает стандартные процедуры параметрического нормирования, интервального оценивания, прогнозирования и нормирования потребления ресурсов. Более тонкий анализ ранговых параметрических распределений позволяет существенно повысить эффективность рангового анализа. Он осуществляется в рамках следующих (так называемых «тонких») процедур: дифлекс-анализа (на этапе интервального оценивания), GZ-анализа (на этапе прогнозирования) и ASR-анализа (на этапе нормирования) [13,20].

В основе рангового анализа лежит весьма сложный математический аппарат. Однако как и в любой фундаментальной теории, здесь имеется определенный вполне доступный уровень решения задач, фактически граничащий с инженерной методологией. Глубокая теоретическая проработка, всестороннее философское осмысление и многократное апробирование на практике в различных областях человеческой деятельности позволяют считать ранговый анализ надежным средством решения задач определенного класса.

Как представляется, ранговый анализ, основываясь на ценологических негауссовых представлениях (особой ципфовой математической статистике негауссовых безгранично делимых гиперболических распределений) и позволяя решать задачи оптимального построения техноценозов, составляет методологическую основу третьей научной картины мира, впервые сформулированной Б.И. Кудриным (рис. 2.1).

 

 

Рис. 2.1.

Место рангового анализа в методологии

трех научных картин мира

 

В рамках первой научной картины мира (рис. 2.1) на основе методологического аппарата математической физики, основывающейся на классических детерминистских представлениях, осуществляется разработка отдельных видов техники. Вторая научная картина мира, вобрав вероятностно-статистические представления гауссовой математики, позволила разработать аппарат имитационного моделирования, позволяющий решать задачи проектирования технологических кластеров. И лишь в рамках третьей научной картины мира появилась методология оптимального построения техноценозов.

Представляется важным отметить ряд моментов. Во-первых, как уже неоднократно показано, аппарат гауссовой математической статистики практически непригоден для решения задач уровня третьей научной картины мира и приводит, с одной стороны, к многочисленным безрезультатным попыткам применения имитационного моделирования в сфере оптимального построения техноценозов, а с другой – порождает недоверие к данной методологии со стороны большинства практиков, которые до сих пор предпочитают полагаться в вопросах управления техноценозами лишь на свою интуицию.

Во-вторых, все попытки выдвигать требования, основанные на эвристических макропрогнозах, непосредственно разработчикам отдельных видов техники, равно как и политика последних, заключающаяся в полном игнорировании геополитических и макроэкономических процессов, с одинаковым успехом приводят к провалу. Думается, именно ранговый анализ позволяет решить проблему разработки технических требований к видам техники, действительно учитывающих специфику техноценозов.

В-третьих, основным методологическим критерием, которым руководствуются проектировщики отдельных видов техники и пространственно-технологических кластеров, является достижение максимального положительного эффекта при минимальных затратах. Формально данный критерий не вызывает сомнений, т.к. полностью соответствует философскому толкованию полезности, восходящему к аристотелевскому «минимаксу». Проблема заключается лишь в том, что здесь закладывается в понятие «положительный эффект» и что – в «затраты». Подавляющее большинство разработчиков техники трактует эти понятия в узком смысле как некие интегральные параметры, рассчитываемые без глубокого учета того, что произойдет после попытки внедрения спроектированного технического изделия в инфраструктуру. В результате может оказаться, что новое техническое изделие вполне хорошо, будучи рассмотрено и испытано как совершенно независимый образец. Однако последующие попытки его внедрения в техноценоз могут закончиться провалом из-за невозможности адекватного обеспечения жизненного цикла системами управления, восстановления, снабжения, подготовки кадров и т.д.

В-четвертых, на уровне геополитического и макроэкономического планирования решения, как правило, принимаются на основе эвристических и алгоритмических процедур, базирующихся на методологи исследования операций и квалиметрии. Очевидно, что этот уровень является системным по отношению к уровню, на котором разрабатываются отдельные виды технических изделий. Однако «расстояние» между ними настолько велико, что трудно говорить о какой-либо корректной методологии, позволяющей не на словах, а на деле учитывать, например, геополитические интересы при проектировании или модернизации отдельных видов техники. Или, наоборот, в процессе принятия геополитических решений в какой-либо отрасли экономики учитывать параметры техники, представляющей данную отрасль на рынке. Ясно, что подобной методологии собственно в рамках первой и второй научных картин мира нет, если конечно мы говорим о научной методологии в полном смысле этого слова.

Итак, решение задач оптимального построения техноценозов может корректно осуществляться только в рамках третьей научной картины (рис. 2.1). Здесь применяется специфическая методология рангового анализа, основанная на ценологических представлениях и негауссовой (ципфовой) математической статистике гиперболических безгранично делимых распределений. Рассмотрим ключевые понятия, математические основы и содержание рангового анализа. Однако прежде чем начинать рассмотрение, обратим внимание на одну важную особенность. Дело в том, что термин «ранговый анализ», хотя и стал уже традиционным, не совсем точен. Правильнее было бы пользоваться термином «ранговый анализ и синтез», т.к. в его процедурах наличествуют операции как анализа, так и синтеза. Однако не будем здесь вводить новых и ограничимся существующим понятием, традиционно вкладывая в него не столько философский, сколько математический смысл («анализ» как математизация, теоретизирование).

Первым исходным моментом в методологии рангового анализа является понятие распределения. В самом общем случае распределение – это расположение элементов подмножества внутри множества [1,23,24]. В математике рассматриваются статистические и вероятностные распределения. Как правило, на практике исследователь начинает работу с построения статистического распределения, которое возникает при эмпирическом описании выборки конечного объема из генеральной совокупности. Следовательно, оно дискретно на множестве значений случайной величины. Как идеализация статистического распределения в ситуации, когда объем выборки из генеральной совокупности стремится к бесконечности, возникает вероятностное распределение, которое в общем случае является непрерывным на множестве значений случайной величины [20,60].

 Вторым ключевым моментом является понятие случайной величины, которое базируется на общем представлении о таком понятии, как «случайность». В современной литературе обычно различают семь причин случайности: 1) непонятая закономерность; 2) скрещение несогласованных процессов; 3) уникальность; 4) неустойчивость движения; 5) относительность знания; 6) имманентная случайность; 7) произвольный выбор [63,64]. Нам представляется, что при исследовании объектов техноценологического типа мы, в той или иной степени, имеем дело с причинами пятого и седьмого типов.

Во-первых, насыщение техноценозов изделиями-особями происходит в условиях одновременного воздействия огромного количества слабосогласованных внешних и внутренних факторов, что делает случайной его номенклатуру или видовую структуру. Также доказано, что видообразование в техноценозе фрактально, а его границы размыты, конвенционны. Кроме того, техноценоз постоянно изменяется во времени, причем это изменение векторизовано и необратимо (однонаправленно). Данные феномены ранее широко обсуждались в литературе [8,11,20,28-37]. Сказано об этом достаточно и здесь в первой главе. Следовательно, можно говорить, что в данный фиксированный момент времени номенклатура техноценоза является случайной. И если описать номенклатуру частотным распределением, то форма последнего будет случайной (его параметры будут случайными величинами). Очевидно, здесь мы имеем дело в полном смысле этого слова с проявлением трансцендентности техноценозов [12,27,32,33,35,36], делающей наши знания относительными, что является фундаментальной причиной случайности пятого типа.

Во-вторых, совокупность параметров, описывающих особи техноценоза, составляет двумерное пространство. Оба измерения данного пространства бесконечны, однако, одно из них (перечисляющее особи техноценоза) счетно, а второе (описывающее параметры) – континуально. Это является следствием другого известного свойства техноценозов, а именно того, что число особей в них бесконечно (точнее – математически счетно) [12,27,32,33,35,36]. Кроме того, общее параметрическое пространство делится на два равномощных подпространства: видообразующих и функциональных параметров (об этом подробнее речь будет идти в третьей главе). В любом случае, если осуществлять произвольный выбор особей техноценоза, то параметры выбранных технических изделий составят статистическую выборку случайных величин. Если учесть, что техноценоз трансцендентен, то выбор особей при этом может осуществляться как угодно. Очевидно, что любой выбор из трансцендентной бесконечности будет произвольным и, по сути, случайным. Здесь мы констатируем причину случайности седьмого типа (произвольный выбор). Если полученную выборку обрабатывать методами математической статистики, то можно получить параметрическое распределение.

Таким образом, случайным в широком смысле является сочетание (именно фиксированное сочетание) видов технических изделий, составляющих техноценоз, если мы его рассматриваем среди большого количества других подобных техноценозов. Судить о статистическом (и далее – вероятностном) распределении данных сочетаний можно лишь полномасштабно исследовав поведение техноценозов в более общем таксономическом образовании – метаценозе (доступной для исследования в данный момент времени совокупности техноценозов). В узком смысле случайной является форма видового распределения, описывающего номенклатуру техноценоза, что делает случайной величиной значение соответствующего формального параметра. С другой стороны, если рассматривать совокупность одноименных параметров технических изделий (особей) отдельного техноценоза как выборку из параметрического пространства, то значение фиксированного параметра конкретного технического изделия может рассматриваться как случайная величина, а саму выборку можно описать как статистическое распределение.

В этом смысле следует подчеркнуть принципиальную разницу между видовыми и ранговыми распределениями техноценоза. Его видовые распределения случайны, потому что случайны макроскопические параметры их формы. Ранговые же распределения – это распределения случайных величин (параметров, характеризующих особи). Именно в этом контексте мы и применяем к техноценозам понятие статистического распределения. Последующее особое обобщение на континууме техноценоза (его особенность будет показана ниже) позволяет получать распределение, имеющее смысл вероятностного.

Третьим ключевым моментом в методологии рангового анализа являются понятия негауссовости и ципфовости описывающих техноценозы гиперболических распределений. Как всегда, начнем с устоявшихся определений.

Вероятностное распределение мы называем гауссовым, если для него выполняется центральная предельная теорема, т.е. при широких предположениях относительно законов распределения независимых случайных величин с ростом числа слагаемых закон распределения суммы этих величин неограниченно приближается к нормальному. Статистическое распределение называется гауссовым, если зависимость его среднего и дисперсии от объема выборки несущественна, т.е. в условиях данной конкретной исследовательской задачи выполняется закон больших чисел (при достаточно большом числе независимых испытаний среднее арифметическое наблюденных значений случайной величины сходится по вероятности к ее математическому ожиданию) [60]. Очевидно, что, в общем случае, любое распределение, для которого не выполняется хотя бы одно из приведенных выше двух условий, является негауссовым.

Ципфовым принято называть распределение, имеющее при больших значениях переменной вид распределения Ципфа [20,60]:

 

 

(2.1)

 

где

 

 

частота;

 

параметры распределения.

 

Распределение Ципфа ципфово, ципфовое же распределение в общем случае не является распределением Ципфа. Вероятностное ципфовое распределение гауссово при значениях показателя распределения альфа больших или равных двум и негауссово – при меньших двух. Статистическое ципфовое распределение с показателем альфа большим двух может быть негауссовым, если зависимость его среднего и дисперсии от объема выборки существенна в рамках данной конкретной исследовательской задачи [60].

Видовые и ранговые распределения техноценозов относятся к классу безгранично делимых распределений [20,23]. В общем случае распределение вероятностей случайной величины называется безгранично делимым, если оно представимо в виде сколь угодно кратной свертки самого с собой:

 

(2.2)

 

где

распределение вероятностей случайной величины;

 

k-ое распределение случайной величины;

 

кратность свертки распределения самого с собой;

 

операция свертки двух k-ых распределений [23].

 

Если отвлечься от физического смысла, то сугубо математически безгранично делимые распределения могут быть как устойчивыми, так и неустойчивыми. Говорить, в приложении к техноценозам, о неустойчивых распределениях смысла нет, т.к. последние не предполагают вообще какой-либо фиксированной аппроксимационной формы.

К настоящему времени на весьма обширном эмпирическом материале многократно показана устойчивость и негауссовость ранговых распределений техноценозов [6-20,27-37,41,43,48-51,54-61,67]. Следовательно, для их статистического описания особое значение имеет распределение Ципфа с показателем альфа меньшим двух, которое удовлетворяет предельной теореме Гнеденко – Деблина: для сходимости распределений нормированных сумм одинаково распределенных независимых случайных величин к устойчивым распределениям, отличным от нормального, необходимо и достаточно, чтобы [60]:

 

(2.3)

где

 

 

функции, медленно меняющиеся в смысле Карамата, т.е. такие, что для всех t > 0 имеет место равенство:

 

 

 

 

Распределение Ципфа имеет частотную и ранговую формы [60]. Как увидим позже, для распределений техноценоза актуальны обе из них. В частотной форме, как правило, представляются видовые распределения, в ранговой – ранговые видовые и ранговые параметрические (по видообразующим или функциональным параметрам). Частотная дифференциальная форма вероятностного распределения Ципфа задана выше выражением (2.1). Частотная интегральная его форма для выборки:

 

(2.4)

где

объем выборки.

 

Ранговая дифференциальная форма распределения Ципфа:

 

(2.5)

где

характеристический ранг;

 

основные параметры распределения;

 

параметр, учитывающий эффект рангового искажения.

 

Ранговая интегральная форма:

 

(2.6)

 

Четыре параметра распределения Ципфа можно поставить в соответствие параметру альфа следующим образом [60]:

 

(2.7)

где

минимальное значение случайной величины на эмпирической выборке;

 

соответствующее максимальное значение случайной величины.

 

Система (2.7) позволяет учесть известный эффект рангового искажения, который подробно описан в [60]. При этом один из пяти ключевых параметров распределения Ципфа (в случае (2.7) – альфа) должен быть определен априорно по эмпирическим данным методом максимума правдоподобия либо графически.

Теперь мы готовы повторить точные определения, распространяющие ципфовую методологию на прикладную область рангового анализа. Под видовым понимается распределение Ципфа в частотной дифференциальной форме, устанавливающее непрерывную или дискретную упорядоченную взаимосвязь между множеством значений возможной численности особей техноценоза и количеством популяций, реально представленных в техноценозе данной фиксированной численностью. По сути, видовое распределение устанавливает основополагающую взаимосвязь между массовостью изделий различных видов в техноценозе и их разнообразием. Математически оно относится к гиперболическим устойчивым безгранично делимым распределениям [12,28].

Под ранговым распределением вообще понимается убывающая последовательность значений параметров, упорядоченная таким образом, что каждое последующее число меньше предыдущего, и поставленная в соответствие рангу (номеру по порядку в данной упорядоченной последовательности). Таким образом, неотъемлемой чертой рангового распределения является целенаправленное ранжирование входящих в него параметров видов, объектов или особей техноценоза. В этом его принципиальное отличие от видового распределения, где подобная операция не предусмотрена.

Ранговое распределение техноценоза – полученное в результате процедуры ранжирования видов или особей техноценоза по какому-либо параметру распределение Ципфа в ранговой дифференциальной форме, по сути являющееся невозрастающей последовательностью значений самих параметров, поставленных в соответствие рангу. Различают ранговые распределения, в которых ранжируются: виды по количеству особей, которым они представлены в техноценозе (ранговые видовые); особи по значению видообразующего параметра (ранговые параметрические); особи (объекты) по значению параметра, характеризующего их функционирование (ранговые функциональные) [12,14].

Особым образом здесь следует оговорить специфику рангового функционального распределения. Как показано в первой главе, оно может строиться как для отдельных особей техноценоза, так и для объектов (пространственно-технологических кластеров). Очевидно, что во втором случае должны ранжироваться кумулятивные параметры, полученные для отдельных объектов. При этом математическая суть, а также порядок построения и последующей аппроксимации распределения не меняются. Как показывает опыт применения рангового анализа для решения прикладных задач, именно второй вариант рангового функционального распределения является реально применимым. Дело в том, что на практике почти никогда не удается получить корректные данные по результатам функционирования отдельных особей техноценоза. Учет всегда ведется по объектам. Характерным примером здесь является параметр электропотребления (в кВт·ч). Теоретически конечно можно вести речь о ранговом параметрическом распределении, построенном по электропотреблению для каждого отдельного электроприемника завода (двигателя, печи, лампочки, чайника и т.д.). Однако любой энергетик скажет, что это с практической точки зрения бессмысленно, т.к. на отдельных электроприемниках никогда нет счетчиков электроэнергии, а учет ведется по цехам и подразделениям завода (объектам, пространственно-технологическим кластерам). Более того, как будет показано ниже, одним из главных критериев деления техноценоза на объекты как раз и является наличие корректного учета основных функциональных параметров.

Изначально каждое распределение техноценоза в аналитической или графической форме представляет собой совокупность точек, получаемых по эмпирическим данным:

 

(2.8)

 

 

 

 

где

формальный индекс;

 

общее количество точек.

 

Точки – результат анализа табулированного рангового распределения техноценоза, о котором подробно будет сказано в следующем параграфе. Для каждого из распределений имеется свое число точек (что есть абсцисса в распределении, а что ордината, мы уже знаем). С точки зрения последующей оптимизации техноценоза, большое значение имеет аппроксимация эмпирических ранговых и видовых распределений, которая в данном случае обладает существенной онтологической спецификой. Учитывая, что в процессе аппроксимации мы фактически без изменения формы обобщаем конечную выборку эмпирических точек техноценоза до континуума генеральной совокупности, можно заключить, что аппроксимационная форма – это и есть соответствующее вероятностное распределение техноценоза. Таким образом, задача корректной аппроксимации превращается в случае негауссовых распределений в задачу первостепенной важности.

Формально задача аппроксимации заключается в подборе аналитической зависимости, наилучшим образом описывающей совокупность точек (2.8). При этом мы, следуя устоявшейся среди исследователей традиции, задаем в качестве стандартной формы двухпараметрическое гиперболическое аналитическое выражение вида [28-31]:

 

(2.9)

где

параметры распределения;

 

непрерывная переменная (мощность популяции в случае видового распределения и непрерывный ранг – в случае рангового).

 

Как уже сказано, выбор (2.9) объясняется традиционно сложившимся подходом среди исследователей, занимающихся ранговым анализом. Безусловно, данная форма далеко не самая совершенная и не учитывает эффект рангового искажения [60], однако она обладает неоспоримым достоинством – сводит задачу аппроксимации к определению всего двух параметров. Решается эта задача различными методами. В данном случае рассмотрим аппроксимацию методом наименьших квадратов [14,15].

Суть метода заключается в отыскании таких параметров аналитической зависимости (2.9), которые минимизируют сумму квадратов отклонений реально полученных в ходе рангового анализа техноценоза эмпирических значений  от значений, рассчитанных по аппроксимационной зависимости (2.9), т.е.:

 

(2.10)

где

эмпирические значения, полученные в ходе анализа;

 

теоретические значения, рассчитанные по аппроксимационной зависимости.

 

Известно, что решение оптимизационной задачи (2.10) сводится к решению системы дифференциальных уравнений (для (2.9) – двух с двумя неизвестными):

 

(2.11)

 

Для того чтобы упростить расчеты и перейти от дифференциальных уравнений к алгебраическим, прологарифмируем (2.9) и введем формальные параметры. Получим:

 

(2.12)

где

 

 

При этом (2.10) сводится к условию

 

(2.13)

 

а (2.11) – к упрощенной системе

 

(2.14)

 

и далее, после дифференцирования, к системе

 

(2.15)

 

где (по правилу Крамера)

 

 

 

Очевидно, что после получения C и D вычислить параметры исходной зависимости (2.9) не составляет особого труда. При этом

(2.16)

 

Следует отметить, что здесь подробно разобран лишь метод наименьших квадратов. Имеется и целый ряд других методов аппроксимации данных (наименьших модулей, максимума правдоподобия и др.). Возможно различное комбинирование методов. В любом случае после аппроксимации мы получаем двухпараметрическую зависимость вида (2.9) для каждого из ранговых и видовых распределений. Обычно на графиках ранговых распределений, наряду с эмпирическими точками, показывают аппроксимационные кривые. Это имеет существенное значение с точки зрения последующей оптимизации техноценоза, т.к. применяемые в оптимизационных процедурах критерии во многом строятся на требованиях, предъявляемых к форме соответствующих гиперболических распределений. Технологически, в конечном итоге, это выливается в систему ограничений к параметрам аппроксимационных кривых или границ доверительных интервалов.

Практическая реализация рангового анализа, как правило, состоит в осуществлении следующих комплексных этапов-процедур (впервые введены в [20]):

                             1.    Выделение техноценоза.

                             2.    Определение перечня видов в техноценозе.

                             3.    Задание видообразующих параметров.

                             4.    Параметрическое описание техноценоза.

                             5.    Построение табулированного рангового распределения.

                             6.    Построение графического рангового видового распределения.

                             7.    Построение графических ранговых параметрических распределений.

                             8.    Построение видового распределения.

                             9.    Аппроксимация распределений.

                        10.    Оптимизация техноценоза.

 

Таким образом, ранговый анализ представляет собой метод исследования больших технических систем особого ценологического типа (техноценозов), имеющий целью их статистический анализ, а также оптимизацию, и полагающий в качестве основного критерия форму видовых и ранговых распределений. Подчеркнем, что для негауссовых по своей природе видовых и ранговых распределений нет смысла вычислять эмпирические среднее и стандарт, а также выводить теоретические моменты (математическое ожидание и дисперсию). Ранговый анализ состоит из десяти комплексных этапов-процедур и предполагает оперирование распределениями, будучи взятыми в целом. В следующих параграфах мы приступим к подробному рассмотрению данных процедур.

 

 

 

 

Рейтинг@Mail.ru

При использовании материалов ссылки обязательны

Все права защищены © Гнатюк В.И., 2005

E-mail: mail@gnatukvi.ru