Лекционный курс по дисциплине
СД.08 СИСТЕМНЫЙ АНАЛИЗ И МОДЕЛИРОВАНИЕ ПРОЦЕССОВ В ТЕХНОСФЕРЕ
для специальности
280103 «Защита в чрезвычайных ситуациях»
Очно-заочной формы обучения
Составитель: ст. преп. Яковлева А.И.
Срок обучения: нормативный - 34 ч.
сокращенный - 16 ч.
Оглавление
Лекция 1. Понятие и основные принципы системного анализа
1.1 Понятие системы. Базовые категории систем
1.2 Классификация систем
1.3 Общее представление о системном анализе
1.4 Принципы системного анализа
Лекция 2. Структурный анализ систем
2.1 Этапы анализа и синтеза
2.2 Понятие о структурном анализе
2.3 Методы декомпозиции
2.4 Требования, предъявляемые к декомпозиции
2.5 Алгоритм декомпозиции
2.6 Программно-целевой подход к решению системных задач
Лекция 3. Агрегирование систем
3.1 Агрегирование системы и эмерджентность
3.2 Виды связей в системе
3.3 Виды агрегирования
Лекция 4. Понятие процесса принятия решения (ППР)
4.1 Общие свойства процесса принятия решений
4.2 Участники процесса принятия решения
4.3 Схема ППР
4.4 Формулирование проблемы
4.5 Определение целей
4.6 Генерирование альтернатив
4.7 Формирование критериев
4.8 Физиология принятия решений
4.9 Виды и особенности задач принятия решений
4.10 Формализация принятия решений
Лекция 5. Информационное обеспечение ППР
5.1 Понятие информации
5.2 Информационная структура процесса принятия решений
Лекция 6. Неформальные методы принятия решений (3 часа)
6.1 Особенности группового выбора
6.2 Экспертные методы выбора
6.3 Методы типа мозговой атаки или коллективной генерации идей
6.4 Методы типа сценариев
6.5 Методы типа «Делфи»
6.6 Методы типа дерева целей
6.7 Морфологические методы
Лекция 7. Теория управления
7.1 Основные положения теории управления
7.2 Аксиомы теории управления
7.3 Модели основных функций организационно-технического управления
7.4 Описание функций управления
Лекция 8. Понятие и классификация моделей
8.1 Понятие модели, моделирования
8.2 Познавательные и прагматические модели
8.3 Статические и динамические модели
8.4 Классификация моделей по способу воплощения
8.5 Место математического моделирования в системных исследованиях
8.6 Типы и виды математических моделей
8.7 Процесс построения математической модели
8.8 Структура моделирования происшествий в техносфере
Лекция 9. Теория игр
9.1 Конфликт - предмет рассмотрения теории игр
9.2 Понятие игры. Классификация игр. Формальное представление игр
9.3 Определение бескоалиционной игры
9.4 Приемлемые ситуации и ситуации равновесия
9.5 Примеры игровых задач
Лекция 10. Моделирование на основе орграфов
10.1 Граф и его виды
10.2 Задача о кратчайшем пути
10.3 Задача о максимальном потоке
Лекция 11. Основные положения теории планирования экспериментов
11.1 Поверхность отклика
11.2 Этапы планирования эксперимента
11.3 Обработка и анализ результатов моделирования
Лекция 12. Методы получения регрессионных уравнений
12.1 Полный факторный эксперимент
12.2 Дробный факторный эксперимент
12.3 Метод наименьших квадратов
Лекция 13. Кластерный анализ
13.1 Основная цель кластерного анализа
13.2 Объединение (древовидная кластеризация)
13.3 Двувходовое объединение
13.4 Метод K средних
13.5 Алгоритм нечеткой кластеризации
Лекция 14. Когнитивное моделирование
14.1 Понятие когнитивного моделирования
14.2 Подсистема представления субъективной информации
14.3 Подсистема извлечения предпочтений эксперта
14.4 Подсистема обработки
14.5 Подсистема представления результатов моделирования
14.6 Подсистема поддержки аналитической деятельности эксперта
14.7 Моделирование бизнес процессов на основе BPMN-диаграмм
14.8 Метод анализа иерархий (МАИ): введение
14.9 Основные принципы МАИ
14.10. Общая оценка МАИ как метода принятия решений
Лекция 15. Метод конечных элементов
15.1 Общий ход решения задачи на основе метода конечных элементов
15.2 Сети одномерных конечных элементов
15.3 Виды конечных элементов
Лекция 16. Аналитические модели сложных систем
16.1 Основные понятия
16.2 Приближенное решение ОДУ при заданных начальных условиях
16.3 Метод Эйлера и его модификации
16.4 Метод Рунге-Кутта
16.5 Приближенное решение ДУ n-го порядка при заданных начальных условиях
16.6 Приближенное решение ДУ при заданных граничных условиях (краевых задач)
Лекция 17. Модели многосвязных технических систем
17.1 Основные понятия
17.3 Источники энергии и преобразователи. Аналоги топологических уравнений
17.4 Метод получения топологических уравнений
Лекция 18. Многокритериальная оптимизация
18.1 Свойства задач принятия решения со многими критериями
18.2 Формирование множества критериев
18.3 Методология решения многокритериальных задач
18.4 Технологии отыскания эффективных решений
18.5. Методы принятия решения при нескольких критериях
Заключение
Библиографический список
Лекция 1. Понятие и основные принципы системного анализа
За блага техногенной цивилизации, с которыми человечество вступило в XXI век, к сожалению, приходится расплачиваться. Плата эта в ряде случаев оказывается предельно высокой. Речь идет о жизни конкретных людей. В большинстве же случаев происходит деградация среды, окружающей технический объект, в котором случилась авария или катастрофа. В результате - потеря материальных ценностей, разрушение природной среды, стрессы и ухудшение здоровья людей, что в итоге приводит к сокращению их продолжительности жизни.
В негативном функционировании техногенных объектов часто повинен сам человек, допустивший при управлении этим объектом какую-то ошибку или неточность. Это так называемый человеческий фактор, о котором сейчас много говорят.
Как уменьшить количество ошибочных и неточных действий людей в разных ситуациях, в повседневной жизни и особенно на производстве. Понятно - их нужно учить. Учить очень многому: и как управлять объектом, и какие действия предпринимать в разнообразных нештатных ситуациях, и как защитить себя и товарищей от последствий отказов и аварий, и т.д.
Оказывается, есть метанаука над этими конкретными знаниями, которая позволяет понять общие подходы к нахождению лучших или, по крайней мере, неошибочных действий человека в разнообразных ситуациях. Эта наука называется теорией принятия решений. Конечно, в обыденной жизни пользоваться формальными методами принятия решений не всегда оправданно (хотя и здесь они не должны полностью игнорироваться). Однако если иметь в виду производственную деятельность, то там современный специалист должен опираться на научные подходы. Особенно это касается сложных ситуаций, когда последствия неэффективного решения могут носить достаточно драматичный характер, т.е. затрагивать здоровье и жизнь людей, наносить ущерб материальным ценностям и окружающей среде.
1.1 Понятие системы. Базовые категории систем
К основным понятиям системного анализа относится понятие «система», однако в настоящее время нет единства в его определении. В первых определениях в той или иной форме говорилось о том, что система - это элементы и связи (отношения) между ними. Например, основоположник теории систем Людвиг фон Берталанфи определял систему как комплекс взаимодействующих элементов или как совокупность элементов, находящихся в определенных отношениях друг с другом и со средой. А. Холл определяет систему как множество предметов вместе со связями между предметами и между их признаками. Ведутся дискуссии, какой термин - «отношение» или «связь» - лучше употреблять.
Позднее в определениях системы появляется понятие цели. Так, в «Философском словаре» система определяется как «совокупность элементов, находящихся в отношениях и связях между собой определенным образом и образующих некоторое целостное единство».
В последнее время в определение понятия системы наряду с элементами, связями и их свойствами и целями начинают включать наблюдателя, хотя впервые на необходимость учета взаимодействия между исследователем и изучаемой системой указал один из основоположников кибернетики У.Р. Эшби.
М. Масарович и Я. Такахара в книге «Общая теория систем» считают, что система - «формальная взаимосвязь между наблюдаемыми признаками и свойствами».
Таким образом, в зависимости от количества учитываемых факторов и степени абстрактности определение понятия «система» можно представить в следующей символьной форме. Каждое определение обозначим порядковым номером, совпадающим с количеством учитываемых в определении факторов.
1. Система есть нечто целое:
S=A(1,0).
Это определение выражает факт существования и целостности. Двоичное суждение A(1,0) либо 1, либо 0 отображает наличие или отсутствие этих качеств.
2. Система есть организованное множество (Темников Ф.Е.):
S=(орг, М),
где орг - оператор организации; М - множество.
3. Система есть множество вещей, свойств и отношений (Уемов А.И.):
S=({m},{n},{r}),
где m - вещи, n- свойства, r - отношения.
4. Система есть множество элементов, образующих структуру и обеспечивающих определенное поведение в условиях окружающей среды:
S=(?, ST, BE, E),
где ? - элементы, ST - структура, ВЕ - поведение, Е - среда.
5. Система есть множество входов, множество выходов, множество состояний, характеризуемых оператором переходов и оператором выходов:
S=(X, Y, Z, H, G),
где X - входы, Y - выходы, Z - состояния, Н - оператор переходов, G - оператор выходов. Это определение учитывает все основные компоненты, рассматриваемые в автоматике.
6. Это определение соответствует уровню биосистем и учитывает генетическое (родовое) начало GN, условия существования KD, обменные явления KD, развитие EV, функционирование FC и репродукцию (воспроизведения) RP:
S= (GN, KD, MB, EF, FC, RP).
7. Это определение оперирует понятиями модели F, связи SC, пересчета R, самообучения FL, самоорганизации FO, проводимости связей СО и возбуждения моделей JN:
S=(F, SC, R, FL, FO, CO, JN).
Данное определение удобно при нейрокибернетических исследованиях.
8. Если определение 5 дополнить фактором времени и функциональными связями, то получим определение системы, которым обычно оперируют в теории автоматического управления.
S= ( T, X, Y, Z, ?, V, ?, ? )
где Т - время, Х - входы, Y - выход, Z - состояния, ? - класс операторов на выходе, V - значения операторов на выходе,? - функциональная связь в уравнении
y(t2)=?[x(t1), z(t1], t2),
? - функциональная связь в управлении z(t2)=?[x(t1), z(t1), t2].
9. Для организационных систем удобно в определении системы учитывать следующее: цели и планы, внешние и внутренние ресурсы, исполнители, процесс, помехи, контроль, управление, эффект.
S=(PL, RO, RJ, EX, PR, DT, SV, RD, EF),
где РL - цели и планы, RО - внешние ресурсы, RJ - внутренние ресурсы, EX - исполнители, PR - процесс, DT - помехи, SV - контроль, RD - управление, EF - эффект.
Последовательность определений можно продолжить и далее, которые учитывали бы такое количество элементов, связей и действий в реальной системе, которое необходимо для решаемой задачи, для достижения поставленной цели. В качестве «рабочего» определения понятия системы в литературе по теории систем часто рассматривается следующее:
Система - множество элементов, находящихся в отношениях и связях друг с другом, которое образует определенную целостность, единство.
Рассмотрим основные понятия, характеризующие строение и функционирование систем.
Элемент - простейшая неделимая часть системы (рис. 1). Ответ на вопрос, что является такой частью, может быть неоднозначным и зависит от цели рассмотрения объекта как системы, от точки зрения на него или от аспекта его изучения. Таким образом, элемент - это предел членения системы с точек зрения решения конкретной задачи и поставленной цели. Систему можно расчленить на элементы различными способами в зависимости от формулировки цели и ее уточнения в процессе исследования.
Рис. 1. Состав системы
Подсистема. Система может быть разделена на элементы не сразу, а последовательным расчленением на подсистемы, которые представляют собой компоненты более крупные, чем элементы, и в то же время более детальные, чем система в целом (рис. 1). Возможность деления системы на подсистемы связана с вычленением совокупностей взаимосвязанных элементов, способных выполнять относительно независимые функции, подцели, направленные на достижение общей цели системы. Названием «подсистема» подчеркивается, что такая часть должна обладать свойствами системы (в частности, свойством целостности). Этим подсистема отличается от простой группы элементов, для которой не сформулирована подцель и не выполняются свойства целостности (для такой группы используется название «компоненты»). Например, подсистемы автоматизированной системы управления, подсистемы пассажирского транспорта крупного города.
Структура. Это понятие происходит от латинского слова structure, означающего строение, расположение, порядок. Структура отражает наиболее существенные взаимоотношения между элементами и их группами (компонентами, подсистемами), которые мало меняются при изменениях в системе и обеспечивают существование системы и ее основных свойств. Структура - это совокупность элементов и связей между ними. Структура может быть представлена графически, в виде теоретико-множественных описаний, матриц, графов и других языков моделирования структур.
Структуру часто представляют в виде иерархии. Иерархия - это упорядоченность компонентов по степени важности (многоступенчатость, служебная лестница). Между уровнями иерархической структуры могут существовать взаимоотношения строгого подчинения компонентов (узлов) нижележащего уровня одному из компонентов вышележащего уровня, т.е. отношения, так называемого древовидного порядка. Такие иерархии называют сильными или иерархиями типа «дерева». Они имеют ряд особенностей, делающих их удобным средством представления систем управления. Однако могут быть связи и в пределах одного уровня иерархии. Один и тот же узел нижележащего уровня может быть одновременно подчинен нескольким узлам вышележащего уровня. Такие структуры называют иерархическими структурами со слабыми связями. Между уровнями иерархической структуры могут существовать и более сложные взаимоотношения, например, типа «страт», «слоев», «эшелонов». Примеры иерархических структур: энергетические системы, автоматизированные системы управления, государственный аппарат.
Связь. Понятие «связь» входит в любое определение системы наряду с понятием «элемент» и обеспечивает возникновение и сохранение структуры и целостных свойств системы. Это понятие характеризует одновременно и строение (статику), и функционирование (динамику) системы.
Связь характеризуется направлением, силой и характером (или видом). По первым двум признакам связи можно разделить на направленные и ненаправленные, сильные и слабые, а по характеру - на связи подчинения, генетические, равноправные (или безразличные), связи управления. Связи можно разделить также по месту приложения (внутренние и внешние), по направленности процессов в системе в целом или в отдельных ее подсистемах (прямые и обратные). Связи в конкретных системах могут быть одновременно охарактеризованы несколькими из названных признаков.
Важную роль в системах играет понятие «обратной связи». Это понятие, легко иллюстрируемое на примерах технических устройств, не всегда можно применить в организационных системах. Исследованию этого понятия большое внимание уделяется в кибернетике, в которой изучается возможность перенесения механизмов обратной связи, характерных для объектов одной физической природы, на объекты другой природы. Обратная связь является основой саморегулирования и развития систем, приспособления их к изменяющимся условиям существования.
Состояние. Понятием «состояние» обычно характеризуют мгновенную фотографию, «срез» системы, остановку в ее развитии. Его определяют либо через входные воздействия и выходные сигналы (результаты), либо через макропараметры, макросвойства системы (например, давление, скорость, ускорение - для физических систем; производительность, себестоимость продукции, прибыль - для экономических систем).
Более полно состояние можно определить, если рассмотреть элементы (или компоненты, функциональные блоки), определяющие состояние, учесть, что «входы» можно разделить на управляющие и и возмущающие х (неконтролируемые) и что «выходы» (выходные результаты, сигналы) зависят от , и и х, т.е. zt=f(t, ut, xt). Тогда в зависимости от задачи состояние может быть определено как {, и}, {, u, z} или {, х, u, z}.
Таким образом, состояние - это множество существенных свойств, которыми система обладает в данный момент времени.
Поведение. Если система способна переходить из одного состояния в другое (например, z1 z2 z3), то говорят, что она обладает поведением. Этим понятием пользуются, когда неизвестны закономерности переходов из одного состояния в другое. Тогда говорят, что система обладает каким-то поведением и выясняют его закономерности. С учетом введенных выше обозначений поведение можно представить как функцию zt=f(zt-1, xt, ut).
Внешняя среда - множество элементов, которые не входят в систему, но изменение их состояния вызывает изменение поведения системы (рис. 2).
Рис. 2. Взаимодействие системы S с окружающей средой (системы S1, S2, …, Sk)
Модель - описание системы, отображающее определенную группу ее свойств. Углубление описания - детализация модели. Создание модели системы позволяет предсказывать ее поведение в определенном диапазоне условий.
Модель функционирования (поведения) системы - это модель, предсказывающая изменение состояния системы во времени, например: натурные (аналоговые), электрические, машинные на ЭВМ и др.
Равновесие - это способность системы в отсутствие внешних возмущающих воздействий (или при постоянных воздействиях) сохранить свое состояние сколь угодно долго.
Устойчивость - способность системы возвращаться в состояние равновесия после того, как она была из этого состояния выведена под влиянием внешних возмущающих воздействий. Эта способность обычно присуща системам при постоянном управляющем воздействии ut, если только отклонения не превышают некоторого предела.
Состояние равновесия, в которое система способна возвращаться, по аналогии с техническими устройствами называют устойчивым состоянием равновесия. Равновесие и устойчивость в экономических и организационных системах - гораздо более сложные понятия, чем в технике, и до недавнего времени ими пользовались только для некоторого предварительного описательного представления о системе. В последнее время появились попытки формализованного отображения этих процессов и в сложных организационных системах, помогающие выявлять параметры, влияющие на их протекание и взаимосвязь.
Развитие. Исследованию процесса развития, соотношения процессов развития и устойчивости, изучению механизмов, лежащих в их основе, уделяют в кибернетике и теории систем большое внимание. Понятие развития помогает объяснить сложные термодинамические и информационные процессы в природе и обществе.
Цель. Применение понятия «цель» и связанных с ним понятий целенаправленности, целеустремленности, целесообразности сдерживается трудностью их однозначного толкования в конкретных условиях. Это связано с тем, что процесс целеобразования и соответствующий ему процесс обоснования целей в организационных системах весьма сложен и не до конца изучен. Его исследованию большое внимание уделяется в психологии, философии, кибернетике. В Большой Советской Энциклопедии цель определяется как «заранее мыслимый результат сознательной деятельности человека». В практических применениях цель - это идеальное устремление, которое позволяет увидеть перспективы или реальные возможности, обеспечивающие своевременность завершения очередного этапа на пути к идеальным устремлениям.
В настоящее время в связи с усилением программно-целевых принципов в планировании исследованию закономерностей целеобразования и представления целей в конкретных условиях уделяется все больше внимания. Например: энергетическая программа, продовольственная программа, жилищная программа, программа перехода к рыночной экономике.
1.2 Классификация систем
Системы разделяются на классы по различным признакам, и в зависимости от решаемой задачи можно выбрать разные принципы классификации. При этом систему можно охарактеризовать одним или несколькими признаками.
Классификацию систем можно осуществить по разным критериям. Её часто жестко невозможно проводить и она зависит от цели и ресурсов. Приведем основные способы классификации (возможны и другие критерии классификации систем).
По отношению системы к окружающей среде:
открытые (есть обмен ресурсами с окружающей средой);
закрытые (нет обмена ресурсами с окружающей средой).
По происхождению системы (элементов, связей, подсистем):
искусственные (орудия, механизмы, машины, автоматы, роботы и т.д.);
естественные (живые, неживые, экологические, социальные и т.д.);
виртуальные (воображаемые и, хотя они в действительности реально не существующие, но функционирующие так же, как и в случае, если бы они реально существовали);
смешанные (экономические, биотехнические, организационные и т.д.).
По описанию переменных системы:
с качественными переменными (имеющие только лишь содержательное описание);
с количественными переменными (имеющие дискретно или непрерывно описываемые количественным образом переменные);
смешанного (количественно - качественное) описания.
По типу описания закона (законов) функционирования системы:
типа “Черный ящик” (неизвестен полностью закон функционирования системы; известны только входные и выходные сообщения системы);
непараметризованные (закон не описан, описываем с помощью хотя бы неизвестных параметров, известны лишь некоторые априорные свойства закона);
параметризованные (закон известен с точностью до параметров и его возможно отнести к некоторому классу зависимостей);
типа “Белый (прозрачный) ящик” (полностью известен закон).
По способу управления системой (в системе):
управляемые извне системы (без обратной связи, регулируемые, управляемые структурно, информационно или функционально);
управляемые изнутри (самоуправляемые или саморегулируемые - программно управляемые, регулируемые автоматически, адаптируемые - приспосабливаемые с помощью управляемых изменений состояний и самоорганизующиеся - изменяющие во времени и в пространстве свою структуру наиболее оптимально, упорядочивающие свою структуру под воздействием внутренних и внешних факторов);
с комбинированным управлением (автоматические, полуавтоматические, автоматизированные, организационные).
Сложность является определяющим свойством систем и поэтому заслуживает отдельного рассмотрения. Сложность в применении к системам имеет разный смысл - структурная, динамическая или вычислительная сложность. Обычно степень сложности оценивается количеством информации, необходимой для описания реальной системы. При таком подходе сложность ставится в зависимость от наблюдателя. Например, для нейрофизиолога мозг сложен и его адекватное описание требует много информации, для мясника мозг прост, т.к. ему нужно только отличить его от других сортов мяса, для чего он использует сравнительно мало информации.
По сложности:
Малые (от 10 до 103 параметров);
Сложные (от 104 до 107 параметров);
Ультрасложные (от 108 до 1030 параметров);
Суперсистемы (от 1031 до 10200 параметров).
Мы будем различать сложность как свойство систем и сложность самих задач, и соответственно, будем говорить о сложности систем и сложности задач, последнюю называют также вычислительной сложностью. Вне зависимости от типа сложности можно выделить два принципа оценки сложности систем.
Первый принцип состоит в том, что сложность системы должна быть пропорциональна объему информации, необходимой для описания этой системы (так называемая дискриптивная сложность). Одним из способов оценки дескриптивной (описательной) сложности является оценка числа элементов, входящих в систему (переменных, состояний, компонентов), и разнообразия взаимозависимостей между ними.
Второй принцип состоит в том, что сложность системы должна быть проворциональная объему информации, необходимому для разрешения нечеткости системы. Оба типа сложности не согласуются друг с другом. Уменьшая одну сложность, мы, как правило, увеличиваем другую. Отметим, что с увеличением размерности (сложности системы) могут возрастать как первая, так и вторая сложность.
Для примера рассмотрим экологическую систему «Озеро». Это открытая, естественного происхождения система, переменные которой можно описывать смешанным образом (количественно и качественно), в частности, температура водоёма - количественно описываемая характеристика, структуру обитателей озера можно описать и качественно, и количественно, а красоту озера можно описать качественно. По типу описания закона функционирования системы, эту систему можно отнести к непараметризованным в целом, хотя возможно выделение подсистем различного типа, в частности, различного описания подсистемы «Водоросли», «Рыбы», «Впадающий ручей», «Вытекающий ручей», «Дно», «Берег» и др.
Система «Компьютер» - открытая, искусственного происхождения, смешанного описания, параметризованная, управляемая извне (программно). Система “Логический диск” - открытая, виртуальная, количественного описания, типа “Белый ящик” (при этом содержимое диска мы в эту систему не включаем!), смешанного управления. Систем “Фирма” - открытая, смешанного происхождения (организационная) и описания, управляемая изнутри (адаптируемая, в частности, система).
1.3 Общее представление о системном анализе
Термин «системный анализ» впервые появился в связи с задачами военного управления в исследованиях RAND Corporation (1948), а в отечественной литературе получил широкое распространение после выхода в 1969 г. книги С. Оптнера «Системный анализ для решения деловых и промышленных проблем».
В начале работы по системному анализу в большинстве случаев базировались на идеях теории оптимизации и исследования операций. При этом особое внимание уделялось стремлению в той или иной форме получить выражение, связывающее цель со средствами, аналогичное критерию функционирования или показателю эффективности, т.е. отобразить объект в виде хорошо организованной системы.
Так, например, в ранних руководящих материалах по разработке автоматизированных систем управления рекомендовалось цели представлять в виде набора задач и составлять матрицы, связывающие задачи с методами и средствами достижения. Правда, при практическом применении этого подхода довольно быстро выяснялась его недостаточность, и исследователи стали, прежде всего, обращать внимание на необходимость построения моделей, не просто фиксирующих цели, компоненты, связи между ними, а позволяющих накапливать информацию, вводить новые компоненты, выявлять новые связи и т.д., т.е. отображать объект в виде развивающейся системы, не всегда предлагая, как это делать.
Позднее системный анализ начинают определять как «процесс последовательного разбиения изучаемого процесса на подпроцессы» (С.Янг) и основное внимание уделяют поиску приемов позволяющих организовать решение сложной проблемы путем расчленения ее на подпроблемы и этапы, для которых становится возможным подобрать методы исследования и исполнителей. В большинстве работ стремились представить многоступенчато расчленение в виде иерархических структур типа «дерева», но в ряде случаев разрабатывались методики получения вариантов структур, определяемых временными последовательностям функций.
В настоящее время системный анализ развивается применительно к проблемам планирования и управления. В работах этого периода системы анализируются как целое, рассматривается роль процессов целеобразования в развитии целого, роль человека. При этом оказалось, что в системном анализе не хватает средств: развиты в основном средства расчленения на части, но почти нет рекомендаций, как при расчленении не утратить целое. Поэтому наблюдается усиление внимания к роли неформализованных методов при проведении системного анализа. Вопросы сочетания и взаимодействия формальных и неформальных методов при проведении системного анализа не решены. Но развитие этого научного направления идет по пути их решения.
Системный анализ (СА) - это научная стратегия достижения результата при решении сложных проблем, предполагающая комплексный учет всех основных факторов, эту проблему обусловливающих. При СА правомерно использование тех математических методов и моделей, которые позволяют получать приемлемый для практических целей результат.
В связи с активизацией кризисных процессов в окружающем нас мире возможности современной науки не всегда соответствуют сложности возникающих проблем. В таких случаях даже стратегия научного анализа на основе СА оказывается в состоянии дать весьма приближенный, порой чисто качественный, результат.
СА широко применяется в различных областях знаний. Для такой предметной области, как безопасность жизнедеятельности, применение СА особенно оправданно в связи со сложностью рассматриваемых процессов, в которых фокусируются действия людей, работа сложной техники, влияние внешней среды. Если учесть, что каждая составляющая этих процессов постоянно увеличивает амплитуду своих колебаний, то становятся понятными причины разнообразных негативных явлений (аварий, катастроф, стихийных бедствий и т.п.), частота которых заметно нарастает. Это отмечают многие известные ученые в своих трудах, в частности, наши современники - И.Р. Пригожин, Д.Н. Панин и др.
Бесперспективность попыток объяснения окружающего нас мира с чисто научных позиций заметили еще в древности. Так, в Экклезиасте сказано: 'Кто умножает знание, тот увеличивает скорбь', а швейцарский психоаналитик Карл Юнг (1875-1961 гг.), выдающийся мыслитель и философ, утверждал: 'Мы богатеем познаниями и беднеем мудростью'.
Таким образом, несмотря на все научные достижения, уменьшения негативных тенденций в окружающем нас мире не наблюдается, а все больше и больше ученых как у нас в стране, так и за рубежом предсказывают в не столь отдаленном будущем целую череду еще более острых кризисных явлений. Поэтому есть основание говорить о необходимости, хотя бы в такой предметной области, как безопасность жизнедеятельности, результаты СА подвергать осмыслению в рамках нравственной парадигмы, носителями которой являются религия, культура, традиции и т.д.
1.4 Принципы системного анализа
Принципы системного анализа - это некоторые положения общего характера, являющиеся обобщением опыта работы человека со сложными системами.
Различные авторы излагают принципы с определенными отличиями, поскольку общепринятых формулировок на настоящее время нет. Однако, так или иначе, все формулировки описывают одни и те же понятия.
Наиболее часто к системным причисляют следующие принципы: принцип конечной цели, принцип измерения, принцип эквифинальности, принцип единства, принцип связности, принцип модульного построения, принцип иерархии, принцип функциональности, принцип развития (историчности, открытости), принцип децентрализации, принцип неопределенности.
Рассмотрим их более подробно.
Принцип конечной цели. Это абсолютный приоритет конечной (глобальной) цели. Принцип имеет несколько правил:
для проведения системного анализа необходимо в первую очередь сформулировать цель исследования. Расплывчатые, не полностью определенные цели влекут за собой неверные выводы;
анализ следует вести на базе первоочередного уяснения основной цели (функции, основного назначения) исследуемой системы, что позволит определить ее основные существенные свойства, показатели качества и критерии оценки;
при синтезе систем любая попытка изменения или совершенствования должна оцениваться относительно того, помогает или мешает она достижению конечной цели;
цель функционирования искусственной системы задается, как правило, системой, в которой исследуемая система является составной частью.
Принцип измерения. О качестве функционирования какой-либо системы можно судить только применительно к системе более высокого порядка. Другими словами, для определения эффективности функционирования системы надо представить ее как часть более общей и проводить оценку внешних свойств исследуемой системы относительно целей и задач суперсистемы.
Принцип эквифинальности. Система может достигнуть требуемого конечного состояния, не зависящего от времени и определяемого исключительно собственными характеристиками системы при различных начальных условиях и различных путях развития. Это форма устойчивости по отношению к начальным и граничным условиям.
Принцип единства. Это совместное рассмотрение системы как целого и как совокупности частей (элементов). Принцип ориентирован на «взгляд внутрь» системы, на расчленение ее с сохранением целостных представлений о системе.
Принцип связности. Рассмотрение любой части совместно с ее окружением подразумевает проведение процедуры выявления связей между элементами системы и выявление связей с внешней средой (учет внешней среды). В соответствии с этим принципом систему в первую очередь следует рассматривать как часть (элемент, подсистему) другой системы, называемой суперсистемой или старшей системой.
Принцип модульного построения. Полезно выделение модулей в системе и рассмотрение ее как совокупности модулей. Принцип указывает на возможность вместо части системы исследовать совокупность ее входных и выходных воздействий (абстрагирование от излишней детализации).
Принцип иерархии. Полезно введение иерархии частей и их ранжирование, что упрощает разработку системы и устанавливает порядок рассмотрения частей.
Принцип функциональности. Это совместное рассмотрение структуры и функции с приоритетом функции над структурой. Принцип утверждает, что любая структура тесно связана с функцией системы и ее частей. В случае придания системе новых функций полезно пересматривать ее структуру, а не пытаться втиснуть новую функцию в старую схему. Поскольку выполняемые функции составляют процессы, то целесообразно рассматривать отдельно процессы, функции, структуры. В свою очередь, процессы сводятся к анализу потоков различных видов: материальный поток; поток энергии; поток информации; смена состояний. С этой точки зрения структура есть множество ограничений на потоки в пространстве и во времени.
Принцип развития. Это учет изменяемости системы, ее способности к развитию, адаптации, расширению, замене частей, накапливанию информации. В основу синтезируемой системы требуется закладывать возможность развития, наращивания, усовершенствования. Обычно расширение функций предусматривается за счет обеспечения возможности включения новых модулей, совместимых с уже имеющимися. С другой стороны, при анализе принцип развития ориентирует на необходимость учета предыстории развития системы и тенденций, имеющихся в настоящее время, для вскрытия закономерностей ее функционирования.
Одним из способов учета этого принципа разработчиками является рассмотрение системы относительно ее жизненного цикла. Условными фазами жизненного цикла информационной системы являются проектирование, изготовление, ввод в эксплуатацию, эксплуатация, наращивание возможностей (модернизация), вывод из эксплуатации (замена), уничтожение.
Отдельные авторы этот принцип называют принципом изменения (историчности) или открытости. Для того чтобы система функционировала, она должна изменяться, взаимодействовать со средой.
Принцип децентрализации. Это сочетание в сложных системах централизованного и децентрализованного управления, которое, как правило, заключается в том, что степень централизации должна быть минимальной, обеспечивающей выполнение поставленной цели.
Недостаток децентрализованного управления - увеличение времени адаптации системы. Он существенно влияет на функционирование системы в быстро меняющихся средах. То, что в централизованных системах можно сделать за короткое время, в децентрализованной системе будет осуществляться весьма медленно. Например, общее время синхронизации (перевода из состояния z1 в z2) цепи из N автоматов с п внутренними состояниями, зависящими от состояний соседних автоматов, при централизованном управлении составляет 1 такт, а для взаимодействующих только с непосредственными соседями составляет 3N такта, в зависимости от сложности автоматов.
Недостатком централизованного управления является сложность управления из-за огромного потока информации, подлежащей переработке в старшей системе управления. Поэтому в сложной системе обычно присутствуют два уровня управления. В медленно меняющейся обстановке децентрализованная часть системы успешно справляется с адаптацией поведения системы к среде и с достижением глобальной цели системы за счет оперативного управления, а при резких изменениях среды осуществляется централизованное управление по переводу системы в новое состояние.
Принцип неопределенности. Это учет неопределенностей и случайностей в системе. Принцип утверждает, что можно иметь дело с системой, в которой структура, функционирование или внешние воздействия не полностью определены. Сложные открытые системы не подчиняются вероятностным законам. В таких системах можно оценивать «наихудшие» ситуации и рассмотрение проводить для них. Этот способ обычно называют методом гарантируемого результата. Он применим, когда неопределенность не описывается аппаратом теории вероятностей. При наличии информации о вероятностных характеристиках случайностей (математическое ожидание, дисперсия и т.д.) можно определять вероятностные характеристики выходов в системе. Перечисленные принципы обладают очень высокой степенью общности. Для непосредственного применения исследователь должен наполнить их конкретным содержанием применительно к предмету исследования.
Такая интерпретация может привести к обоснованному выводу о незначимости какого-либо принципа.
Однако знание и учет принципов позволяют лучше увидеть существенные стороны решаемой проблемы, учесть весь комплекс взаимосвязей, обеспечить системную интеграцию.
Литература
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
2. Рыков А.С. Модели и методы системного анализа: принятие решений и оптимизация: учебное пособие для студентов высших учебных заведений / А.С. Рыков. - М.: Издательский дом «Руда и металлы», 2005. - 352 с.
3. Романов В.Н. Системный анализ для инженеров / В.Н. Романов. - СПб: СЗГЗТУ, 2006. - 186 с.
Лекция 2. Структурный анализ систем
2.1 Этапы анализа и синтеза
Анализ и синтез присущи человеческому мышлению. Их единство позволяет познавать мир. Суть анализа состоит в разделении целого на части, в представлении сложного в виде совокупности более простых компонент.
Примеры аналитического метода в науке:
математика (разложение функций в ряды, дифференциальное и интегральное исчисление, разбиение неоднородных областей на однородные с последующим «сшиванием» решений;
физика (фильтры, анализаторы спектров, исследование атомов и элементарных частиц). (Например, изучение частотной характеристики шума, т.е. спектра).
Синтез, т.е. обратный процесс объединения частей в целое необходим для познания целого, сложного. Для изучения и проектирования сложных систем часто бывает недостаточно интуитивных системных представлений. Анализ и синтез систем является предметом изучения СА, который рассматривает технические аспекты аналитического и синтетического методов исследования систем, а именно:
как выполняются операции разделения целого на части;
почему именно так.
(Аналитический метод в явной форме был сформулирован представителями рационализма. Р. Декарт в 17 в. писал: «Расчлените каждую изучаемую вами задачу на столько частей (…), сколько потребуется, чтобы их было легко решить.)
Однако роль синтеза не сводится только к «сборке деталей», полученных при анализе. Целостность системы нарушается при анализе, при расчленении системы утрачиваются не только существенные свойства самой системы «разобранный автомобиль не поедет, расчлененный организм не способен жить»), но исчезают и существенные свойства ее частей, оказавшихся отдельными от нее («оторванный руль не рулит, отделенный глаз не видит»). Таким образом, результатом анализа является лишь вскрытие структуры, знание о том, как система работает, но не понимание того, почему и зачем она это делает. Другими словами, синтетическое мышление требует объяснить поведение системы. Синтетическое мышление открывает не структуру, а функцию; оно открывает, почему система работает так, а не то, как она делает это.
Сочетание анализа и синтеза можно представить в виде следующей таблицы 1.
Таблица 1- Сочетание анализа и синтеза
Этап |
Анализ |
Синтез |
|
1 |
Вещь, подлежащая объяснению, расчлененная на части |
Часть рассматривается как часть большего целого |
|
2 |
Объясняются содержимые части |
Объясняется целое |
|
3 |
Знание о частях агрегируется (соединяется) в знание о целом - (1) |
Понимание содержащего целого расчленяется (дезагрегирование, декомпозиция) для объяснения частей |
И при аналитическом, и при синтетическом подходе наступает момент, когда необходимо разложить целое на части либо объединить части в целое.
Значение аналитического метода не только и не столько в том, что целое расчленяется на части (анализ, декомпозиция), а в том, что будучи соединены надлежащим образом, эти части вновь образуют единое целое (синтез, агрегирование).
Момент агрегирования частей в целое является конечным этапом анализа, поскольку лишь после этого мы можем объяснить целое через его части - в виде структуры целого.
При решении сложных системных проблем важную роль играет метод структурного анализа.
2.2 Понятие о структурном анализе
Структурным анализом называется метод исследования системы, который начинается с ее общего обзора и затем детализируется, приобретая иерархическую структуру со все большим числом уровней.
Структурный анализ предусматривает разбиение системы на уровни (уровни абстрагирования, агрегирования) с ограниченным числом элементов на каждом уровне (чаще от 3 до 6-7). На каждом уровне выделяются лишь существенные для системы детали.
Таким образом, при системных исследованиях важным моментом является разложение целого на части - структурное разбиение, а затем объединение частей в целое, т.е. использование операций декомпозиции и агрегирования.
Целесообразность этих операций заключена в следующем:
обычно легче изучать частные проблемы, чем решать сразу всю проблему в целом;
появляется возможность разделить работу между отдельными исполнителями, между специалистами в разных областях;
могут быть определены качественные взаимосвязи между компонентами системы;
уменьшение числа переменных при математическом моделировании, благодаря использованию частных моделей, описывающие отдельные компоненты системы;
декомпозиция системы позволяет легче определить, какая дополнительная информация требуется для более полного исследования и понимания системы.
Декомпозиция и моделирование не являются однозначными: существует много методов структурного разбиения проблемы, и выбор метода зависит от целей исследования. Кроме того, редко бывает, что сформулированное конкретное представление о системе будет неизменным в течение всего процесса исследования. Обычно происходит совершенствование, развитие модели от довольно грубой, упрощенной до более детальной.
2.3 Методы декомпозиции
Можно выделить несколько наиболее часто встречающихся методов декомпозиции.
1. Рассмотрение проблемы в рамках отдельных интервалов времени с принятием решений и оценками для каждого интервала. Этот метод представляется целесообразным в следующих случаях:
если относительное изменение переменных в рассматриваемом интервале времени мало, их можно считать постоянными, что облегчает моделирование;
переменные системы действительно меняются дискретно в определенные моменты времени, например, если финансирование проекта меняется каждые три года, то, вероятно, целесообразно осуществлять структурное разбиение на трехлетние интервалы времени;
появляется возможность принимать решения не сразу, а поэтапно, так как при этом число переменных на любом интервале времени.
2. Разбиение на основе научных дисциплин. Такая декомпозиция удобна тем, что позволяет легче осуществить разделение работ между различными исполнителями и руководителями. При этом следует иметь в виду, что при этом могут ослабевать контакты между представителями различных направлений, а при необходимости учета тесной взаимосвязи между различными частными проблемами это нежелательно.
3. Декомпозиция в соответствии с интересами и целями различных групп, организаций. Например, исследование транспортной проблемы может быть проведено с точки зрения интересов населения, владельцев, органов власти.
4. Разбиение проблемы на основе ее рассмотрения применительно к различным географическим областям. Такая декомпозиция удобна, если введение изменений в одну область не вызывает значительных изменений в других областях.
Таким образом, декомпозиция производится исходя из определенных представлений о системе, т.е. на основании некоторой модели системы. рассмотрению вопроса о том, какие модели брать на основании декомпозиции. Прежде всего, напомним, что при всем практически необозримом многообразии моделей формальных типов моделей немного: это модели «черного ящика», состава, структуры, структурной схемы, причем каждая из них может быть в своем статическом или динамическом варианте. Это позволяет организовать нужный перебор типов моделей, соответствующих различным методам структурного разбиения. Такие модели называют формальными моделями.
Тем не менее, основанием для декомпозиции может служить только конкретная, содержательная модель рассматриваемой системы. выбор же формальной модели лишь подсказывает, какого типа должна быть модель-основание; для того, чтобы формальная модель стала основанием для декомпозиции, ее следует наполнить содержанием, т.е. превратить в содержательную модель. При этом возникает вопрос о полноте проводимого анализа.
Полнота декомпозиции обеспечивается полнотой содержательной модели, которая строится на основе выбранной формальной модели. Это означает, что, прежде всего, следует позаботиться о полноте формальной модели. Именно благодаря формальности, абстрактности такой модели часто удается добиться ее абсолютной полноты.
Рассмотрим некоторые формальные модели.
1. Схема входов организационной системы на рисунке 1а является полной: к ней нечего добавить (перечислено все, что воздействует на систему), а изъятие любого элемента лишит ее полноты.
2. К числу полных формальных моделей относится схема любой деятельности человека, которая в «Капитале» применялась для анализа процесса труда (рисунок 3а). В схеме выделены: субъект деятельности; объект, на который направлена деятельность; средства, используемые в процессе деятельности; окружающая среда; все возможные связи между ними.
3. Формальный перечень типов ресурсов (рисунок 4а) состоит из энергии, материи, времени, информации (для социальных систем добавляются кадры и финансы). При анализе ресурсного обеспечения любой конкретной системы этот перечень не дает пропустить что-то важное.
4. Если в качестве модели жизненного цикла принять формулировку «все имеет начало, середину и конец», то такая модель также является формально полной. Разумеется, эта модель носит слишком общий характер, поэтому при рассмотрении жизненного цикла проблем (см. пример 2 ниже) приходится использовать более детальные модели.
Таким образом, полнота формальной модели должна быть предметом особого внимания. Поэтому одна из важных задач информационного обеспечения системного анализа и состоит в накоплении наборов полных формальных моделей.
При разработке моделей сложных систем важно, таким образом, учитывать следующие аспекты.
1. Полнота модели-основания, обеспечиваемая полнотой формальной модели. Следует отметить, что полнота модели основания обуславливает также целостность представления анализируемой системы на всех уровнях агрегирования.
2. Иерархичность структуры, присущая рассматриваемой системе.
3. Возможность использования количественных показателей (индикаторов) состояния на каждом уровне декомпозиции (агрегирования).
4. Возможность информационного обеспечения и состав пользователей моделей.
5. Организация работ по моделированию в виде последовательных этапов.
Примеры декомпозиции и агрегирования систем на основе различных моделей.
Пример 1. Системный анализ целей развития морского флота
Декомпозиция целей проводилась по формальной модели входов организационной системы (рис. 1а). Первый уровень дерева целей представлен на рис. 1б.
Здесь входы организационной системы соответствуют определенным подцелям:
«нижестоящие системы» (здесь клиентура) - подцель 1;
«вышестоящие системы» (здесь государство) - подцель 2;
«окружающая среда» (здесь флоты других государств) - подцели 3 и 4.
Следует подчеркнуть, что объект декомпозиции должен сопоставляться с каждым элементом модели-основания.
а) формальная модель, б) модель-основание, наполненная конкретным содержанием
Рис. 1. Декомпозиция целей развития морского флота
Пример 2. Декомпозиция процесса решения системных задач
В этом случае декомпозиция производится по модели-основанию, соответствующей формальной модели «жизненный цикл». Эта модель позволяет декомпозировать анализируемый период времени «жизни» системы от возникновения до окончания. Такая декомпозиция предполагает разбиение на этапы, которое дает представление о последовательности действий, начиная с обнаружения проблемы и кончая ее ликвидацией.
Декомпозиция жизненного цикла проблем (по Н.П.Федоренко) приведена на рисунке 2.
Рис. 2. Декомпозиция жизненного цикла проблем
Пример 3. Декомпозиция модели эргатической системы на основе формальной модели деятельности.
Для исследования и повышения уровня производственной безопасности в качестве формальной модели была выбрана модель деятельности вообще (рисунок 3а), а затем входящим в нее элементам была придана соответствующая интерпретация (рисунки 3б и 3в). Модель 3в, по-видимому, более содержательна, благодаря тому, что из элемента формальной модели «средство» выделены в отдельно учитываемый элемент не только технологии, но и продукты труда и используемое сырье. При моделировании воздействия на окружающую среду это особенно важно, поскольку позволяет рассмотреть проблемы загрязнения при переработке, хранении сырья, безопасности продукции, утилизации отходов. Здесь уместно еще раз подчеркнуть, что модели имеют целевую предназначенность, т.е. изменение целей моделирования требует изменения модели.
а) формальная модель деятельности, б, в) модели-основание для декомпозиции
Рис. 3. Модель для исследования человеко-машинных систем
Пример 4. Декомпозиция на базе источников, стоков и потоков объектов. При этом в качестве объектов могут рассматриваться деньги, материалы, люди, загрязняющие вещества, энергия и т.д. На рисунке 4 показана модель взаимодействия окружающей среды, промышленности и потребителя на основе формальной модели « источник - поток - сток ». Подобные модели, как правило, используются при составлении уравнений материального баланса.
а - формальная модель, б - содержательная модель
Рис. 4. Схема взаимодействия окружающей среды, промышленности и потребителя
2.4 Требования, предъявляемые к декомпозиции
Декомпозиция представляет собой многоступенчатый процесс от начальной декомпозиции первого, высшего уровня модели системы до последнего уровня, завершающего данный этап анализа. Обычно в результате декомпозиции получают некоторую древовидную структуру, которая должна отвечать определенным требованиям. К ним, в частности, относятся:
? целостность представления анализируемого объекта на всех уровнях;
? присущая исследуемому объекту иерархичность структуры;
? возможность использования количественных показателей - индикаторов по каждому фрагменту декомпозиции, например, состояние окружающей среды состояние воздушной среды, качество воды и т.п. оценивается соответствующими концентрациями загрязнителей по отношению к ПДК;
? возможность информационного обеспечения на каждом уровне;
? организация работ по моделированию в виде последовательности этапов.
Декомпозиция модели должна, кроме того, отвечать двум противоречивым требованиям: полноты и простоты. Проблема должна быть рассмотрена максимально всесторонне и подробно и, в то же время полученная структура должна быть максимально компактной как «вширь», так и «вглубь» Принцип простоты требует сокращать размеры дерева. Размеры «вширь» определяются числом элементов модели, служащей основанием декомпозиции, поэтому принцип простоты вынуждает брать как можно более компактные модели-основания. Наоборот, принцип полноты заставляет брать как можно более развитые, подробные модели. Компромисс достигается с помощью понятия существенности: в модель-основание включаются только компоненты, существенные по отношению к цели анализа, т.е. релевантные. При этом в алгоритме должны быть предусмотрены возможности внесения (в случае необходимости) поправок и дополнений в модель-основание. Здесь возможны следующие рекомендации:
? дополнение элементов еще одним элементом «все остальное»; он может не использоваться для декомпозиции, но будет постоянно пробуждать у эксперта сомнение в полноте предложенной им модели.
? разукрупнение отдельных элементов модели-основания в случае необходимости, которая может возникнуть на последующих стадиях анализа.
2.5 Алгоритм декомпозиции
Сколько должно быть уровней декомпозиции? Принцип простоты требует, чтобы оно было небольшим, но для удовлетворения принципа полноты необходимо предусмотреть возможность продолжения декомпозиции как угодно долго до принятия решения об ее прекращении по данной ветви (разные ветви могут иметь различную длину). Декомпозиция прекращается, когда она привела к получению результата (подцели, подфункции, подзадачи и т.п.), не требующего дальнейшего разложения, т.е. результата простого, понятного, реализуемого, обеспеченного, заведомо выполнимого, называемого элементарным.
Неэлементарный фрагмент подлежит дальнейшей декомпозиции. Возможно также введение новых элементов в модель-основание и продолжение декомпозиции по ним. Примером может служить рассмотрение системы «вуз» (рис. 5). Здесь выход «студенты» можно разделить на студентов дневного, вечернего и заочного обучения, выход «научная информация» - на выходы «монографии», «статьи», «отчеты по НИР», «заявки на изобретения и т.п. На определенной стадии можно рекомендовать выделить из «прочего» и включить в число существенных еще один элемент. Таким образом, мы получаем новые основания для его декомпозиции, а значит, и возможность продолжить анализ.
Рис. 5. Система «вуз»
Сам алгоритм декомпозиции представлен в виде блок-схемы на рисунке 6.
Рис. 6. Блок-схема алгоритма декомпозиции
2.5 Программно-целевой подход к решению системных задач
1. Область применения и этапы программно-целевого подхода
Программно-целевой подход используется при системном анализе и решении сложных социально-экономических и научно-технических проблем. Для таких проблем характерны такие особенности, как:
? высокая размерность и сложность связей между компонентами проблемы,
? перспективность, т.е. необходимость осмысления задач в долгосрочной перспективе,
? высокая капиталоемкость,
? широкий диапазон альтернатив достижений целей,
? неполнота современных научных представлений и технических достижений, обеспечивающих решение проблемы,
? неопределенность стоимостных и временных требований.
Конечным результатом применения программно-целевого подхода к решению поставленной проблемы является программа, представляющая собой комплекс всесторонне согласованных экономических, социальных, производственно-технических, организационных и научно-исследовательских мероприятий, направленных на достижение четко обозначенной цели. Такая программа, по сути, инструмент перевода глобальной цели исследования на язык «локальных» целей и задач, решаемых на уровнях отдельных компонентов системы. Например, глобальная цель - цель общественного развития, локальные - цели и задачи отдельных районов, предприятий, организаций.
Процедура формирования программ носит, в основном, неформальный, экспертный характер. При этом можно выделить несколько основных ее этапов.
1. Анализ исходного состояния и формулировка цели программы. При этом проблема рассматриваются различные аспекты проблемы, в том числе и на перспективу, создается основа для подготовки исходного задания на подготовку программы.
2. Формулировка комплекса целей программы. На этом этапе конечная (глобальная) цель структурируется, т.е. расчленяется на множество подцелей, связанных с решением поставленной проблемы, т.е. строится дерево целей программы.
3. Формирование вариантов программы и выбор наиболее эффективного из них, т.е. рассмотрение альтернатив. При этом обычно возникает несколько уровней альтернативности, выделяемых в соответствии с последовательностью решения проблем:
первый уровень - ряд целей (уровни целевых нормативов) может оказаться недостижимым из-за ограничений на ресурсы;
второй уровень - сравнение систем, реализующих ту или иную функциональную цель программы;
третий уровень - формирование способов создания этих систем, характеризующихся различной технологией, набором ресурсов и временем, требуемым для их создания. Каркасом для формирования альтернативных целереализующих систем, а также альтернативных комплексов задач, под которыми понимаются технологические способы создания систем, служит дерево целей.
4. Детализация выбранного варианта. При этом мероприятия программы детализируются в соответствии с требованиями системы управления, доводящей конкретные задания до конкретных исполнителей.
2. Дерево целей
При построении дерева целей программы используется логическое свойство конъюнктивности понятий. Конъюнкция - это отношение, устанавливаемое логическим суждением: А есть В, и С, и D, в котором В, С, D называются конъюнктами. Противоположным суждением является дизъюнкция, т.е. отношение, устанавливаемое логическим суждением: А есть В, или С, или D, в котором элементы В, С, D - дизъюнкты.
При разработке целевой системы свойство конъюнктивности позволяет построить полный комплекс целей и подцелей, отображающих желаемые функции будущих реальных объектов, которые в сумме должны удовлетворять формулируемую в общей цели потребность. Другими словами, использование принципа конъюнктивности позволяет представить исходную цель в виде суммы подцелей нижнего уровня дерева целей. На этом этапе устанавливаются целевые нормативы, т.е. количественные характеристики уровней достижения целей.
Пример дерева целей приведен на рис.7.
Рис. 7. Пример дерева целей
Чаще всего распределение ресурсов между функциональными целями программы затруднительно, и, поэтому, стыковка целей с ресурсами должна происходить на нижнем уровне дерева целей. Это характерно, в частности, для формирования эколого-экономических программ развития региона, где важно учитывать территориальные цели и различия в относительной важности их достижения. Функциональные цели нижнего уровня дерева целей называются локальными целями. Чем более дробными являются цели нижнего уровня, том точнее могут быть характеристики ресурсов (в т.ч. временных) для их реализации. При этом очередность достижения локальных целей дерева не будет нарушать одновременность в реализации крупных функциональных целей, т.е. будет обеспечено комплексное решение проблемы.
В реальных программах составление полного дерева целей является сложной задачей, которая решается с привлечением соответствующих экспертов высокой квалификации, располагающих необходимыми знаниями и сведениями. От полноты и реальности дерева целей зависит качество всей последующей работы по построению программы.
По окончании построения дерева целей последние ранжируются по относительной важности их реализации, что позволяет на следующем этапе (формирование вариантов) перейти к распределению ресурсов.
Пример. Рассмотрим построение дерева целей природоохранной программы на примере бассейна реки Дон (рис. 8). Глобальной, конечной целью здесь является сохранение и улучшение состояния природной среды в бассейне реки. На основе проведенного анализа конечная цель подвергнута декомпозиции, или, как еще говорят, последовательно дезагрегирована на подчиненные цели, реализация которых обеспечивает достижение конечной цели.
Последовательная структуризация конечной цели программы осуществляется построением конъюнктивного дерева целей. Для этого необходимо располагать конкретной информацией о региональных проблемах природопользования в рассматриваемом регионе.
Таким образом, выделение локальных целей является необходимым моментом при построении дерева целей и позволяет осуществлять распределение ресурсов между элементами нижнего уровня дерева целей по очереди, в соответствии с величинами коэффициентов относительной важности их вклада в достижение глобальной цели программы.
Конечная цель разбивается на 4 функциональных подцели первого уровня. Расчленение подцелей с индексами 1-4 приводит к формированию 2-го уровня дерева целей на примере куста, отражающего проблемы водоохранной деятельности в регионе.
Цель с индексом 2.1 - охрана водных ресурсов от истощения определена из анализа современных и перспективных проблем водного хозяйства региона. Вершина куста (цель 2.1) представляется как сумма таких подцелей как рациональное распределение и экономное использование водных ресурсов основными водопотребителями (2.1.1) и распределение поверхностного стока (2.1.2).
Рис. 8. Дерево целей природоохранной программы
Процесс построения конъюнктивного функционального дерева целей завершается территориальным делением целей и формированием локальных целей программы (цели, приведенные к административным областям).
Лекция 3. Агрегирование систем
3.1 Агрегирование системы и эмерджентность
Агрегирование, как процесс, обратный декомпозиции, предполагает объединения нескольких элементов в единое целое.
Такое появление новых качеств у систем получило название эмерджентности. Отмечается, что на признании свойства эмерджентности фактически основывается Государственная экспертиза изобретений, поскольку патентоспособным признается новое, ранее не известное соединение хорошо известных элементов, если при этом возникают новые полезные свойства.
Необходимость агрегирования может вызываться различными целями и сопровождаться разными обстоятельствами, что приводит к различным (иногда принципиально различным) способам агрегирования
Агрегирование частей в единое целое приводит к появлению новых качеств, не сводящихся к качествам частей в отдельности. Это свойство и является проявлением внутренней целостности систем, или, другими словами, системообразующим фактором.
Новые качества систем определяются в очень сильной степени характером связей между частями и могут варьироваться в весьма широком диапазоне - от полного согласования до полной независимости частей. Связи могут быть различными, что отражает многообразие и неисчерпаемость взаимодействий между элементами материального мира. Разные авторы приводят различные варианты классификации связей. Некоторые будут нами рассмотрены далее.
Уровни агрегирования. Подобно тому как можно говорить о различных уровнях декомпозиции, т.е. степени детализации модели рассматриваемого объекта, явления, проблемы, можно говорить и о различных уровнях агрегированности модели как о балансе между конкретностью и абстрактностью. При этом также необходимо учитывать иерархического структурно-функциональное строение реальных сложных систем живой и неживой природы. При агрегировании модели учитывается тот факт, что каждый структурный уровень описывается специфическими для него системообразующими законами. Естественно, что высший уровень агрегированности соответствует исходному уровню декомпозиции - модели-основанию. По мере повышения уровня агрегированности системы происходит следующее:
? изменяются законы, определяющие поведение системы, что влечет за собой изменение структуры и, возможно, типа модели;
? упрощается информационное обеспечение модели за счет уменьшения степени детализации (положительный аспект);
? из-за уменьшения степени детализации модели вне рассмотрения могут оказаться некоторые важные эффекты, представляющие интерес для пользователя;
? состав потенциальных пользователей модели изменяется;
? проще решается проблема целостности описания объекта;
? закономерности, описывающие поведение системы на высоких уровнях агрегирования все более удаляются от фундаментальных законов природы.
Последняя особенность может приводить к отрыву модели от реальной экспериментальной базы. Кроме того, переменные, используемые при модельном описании объекта, становятся более абстрактными, что вновь может увеличить трудности информационного обеспечения модели.
При создании моделей сложных систем следует иметь в виду упомянутые выше особенности, поэтому рекомендуется строить работу таким образом, чтобы на каждом этапе получать ряд завершенных моделей различного уровня агрегированности, представляющих в каждом случае целостный объект. При этом детальность проработки модели каждого уровня может быть различной и зависит от конкретной постановки практической задачи, которую предполагается решить с помощью модели. Модели высоких уровней агрегированности (соответственно, уровней декомпозиции) при этом могут играть роль логических схем, помогать обосновывать и документировать модели нижележащих уровней, проверять непротиворечивость общей логики моделирования.
3.2 Виды связей в системе
Можно выделить следующие типы связей.
Связи взаимодействия (координации):
? связи свойства (например, в формулах типа pV=сonst, F=(m1m2)/r2 ;
? связи объектов (например, связи между между отдельными нейронами в нервно-психических процессах);
? связи взаимодействия между отдельными людьми, коллективами, социальными системами; их специфика в том, что они опосредуются целями, которые преследует каждая из сторон взаимодействия. Среди них можно выделить кооперативные и конфликтные связи.
Связи порождения (генетические), когда один объект выступает как основание, вызывающее к жизни другой (например, связь типа А отец В, взрыв пожар).
Связи преобразования:
? связи преобразования, реализуемые через определенный объект, обеспечивающий это преобразование (например, такова функция химических катализаторов);
Многообразие функций в объектах различного рода определяет и многообразие связей функционирования, но общим для всех подобных связей является то, что объекты, объединяемые такой связью, совместно осуществляют определенную функцию, причем эта функция может характеризовать либо один из этих объектов (тогда другой является функционально-производным от первого, например, в функциональных системах живого организма), либо некоторое целое, по отношению к которому и имеет смысл функциональная связь рассматриваемых объектов (например, таковы связи между нейронами при осуществлении тех или иных функций центральной нервной системы).
Связи развития, которые можно рассматривать как модификацию функциональных связей состояний. Однако развитие существенно отличается от простой смены состояний. Функционирование - это движение как бы на одном уровне, связанное лишь и перераспределением элементов, функций и связей в объекте; при этом каждое последующее состояние определено предыдущим. Развитие же есть не просто самораскрытие объекта, реализация заложенных в нем потенций. Развитие - это такая смена состояний, в основе которой лежит невозможность сохранения существующих форм функционирования, т.е. объект как бы переходит на иной уровень функционирования за счет изменения самой организации объекта, т.е. его структурной перестройки.
Связи управления. Эти связи, в свою очередь, в зависимость от их конкретного вида могут образовывать либо разновидность функциональных связей, либо связей развития.
Особо выделяют следующие три вида связей:
Рекурсивная связь - связь, при которой ясно, где причина, а где следствие (например, связь между экономическими явлениями и объектами; так, затраты в экономике выступают в качестве причины, а их результаты - в качестве следствия).
Синергетическая связь - связь, которая при совместных действиях независимых элементов системы обеспечивает увеличение их общего эффекта до значения большего, чем сумма этих эффектов этих элементов, действующих независимо. Другими словами, это усиливающая связь элементов системы. Именно из синергетических связей вытекают эмерджентные свойства системы, т.е. свойства целостной системы, которые не присущи составляющим ее элементам, рассматриваемым вне системы.
Циклическая связь - сложная обратная связь. Пример: развитие науки двигает производство, а оно, в свою очередь, создает основу для расширения и углубления научных исследований.
Рассмотренная классификация имеет философско-методологическое значение и, в определенной степени условна. Для отражения специфики связей в конкретных системах используют также такие определения связей, как:
существенные и несущественные,
внутрисистемные и межсистемные,
взаимные и односторонние,
противоречивые и непротиворечивые,
полезные и вредные, прямые и обратные (положительные обратные, отрицательные обратные),
жесткие (в технике) и гибкие (в экономике, в обществе, в живой природе) и др.
Количество связей в системе ограничено. Максимальное количество связей может быть определено числом возможных сочетаний между элементами по формуле:
C = n(n-1).
3.3 Виды агрегирования
Как и в случае декомпозиции, техника агрегирования основана на использовании определенных моделей исследуемой или проектируемой системы. Агрегирование как процедура системного анализа есть объединение нескольких моделей. Объединять можно модели любого уровня абстракции и получать самые разные агрегаты. Это и получение агрегата-структуры, и агрегировани языков в конфигуратор для описания конкретной ситуации, и агрегирование нескольких переменных в виде аргументов одной функции.
Конфигуратор. Всякое действительно сложное явление требует разностороннего, многопланового описания, рассмотрения с различных точек зрения. Только совместное (агрегированное) описание в терминах нескольких качественно различающихся языков позволяет охарактеризовать явление с достаточной полнотой. Например, автомобильная катастрофа должна рассматриваться не только как физическое явление, вызванное механическими причинами (техническим состоянием автомобиля и дорожного покрытия, силами инерции, трения, ударов и т.д.), но и как явление медицинского, социального, экономического, юридического характера.
Приведенные соображения приводят к понятию конфигуратора, т.е. агрегата, состоящего из качественно различных языков описания системы и обладающего тем свойством, что число этих языков минимально, но необходимо для заданной цели..
Пример 1. Конфигуратором для задания любой точки n-мерного пространства является совокупность ее координат. Обратим внимание на эквивалентность разных систем координат (разных конфигураторов) и на предпочтительность ортогональных систем, дающие независимое описание на каждом «языке» конфигуратора.
Пример 2. Конфигуратором для описания поверхности любого трехмерного тела на «плоскостных» языках является совокупность трех ортогональных проекция, принятая в техническом черчении и начертательной геометрии. Обратим внимание на невозможность уменьшения числа проекций и на избыточность большего числа «точек зрения».
Пример 3 . В радиотехнике для одного и того же прибора используется конфигуратор: блок-схема, принципиальная схема, монтажная схема. Блок-схема может определяться теми технологическими единицами, которые выпускаются промышленностью, и тогда прибор членится на такие единицы. Принципиальная схема предполагает совершенно иное расчленение: она должна объяснить функционирование этого прибора. На ней выделены функциональные единицы, которые могут не иметь пространственно локализованных аналогов. Приборы могут иметь различные блок-схемы и одинаковые принципиальные схемы, и наоборот. Наконец, монтажная схема является результатом расчленения прибора в зависимости от геометрии объема, в пределах которого производится его монтаж. Здесь четко выявляется особенность конфигуратора: главное в конфигураторе не то, что анализ объекта должен производиться на каждом языке конфигуратора отдельно (это разумеется само собой), а то, что синтез, проектирование, производство и эксплуатация прибора возможны только при наличии всех трех его описаний. Однако этот пример дает возможность подчеркнуть еще и зависимость конфигуратора от поставленных целей. Например, если кроме целей производства мы будем преследовать и цели сбыта, то в конфигуратор радиоаппаратуры придется включить и язык рекламы, позволяющий описать внешний вид и другие потребительские качества прибора.
Пример 4. Когда обсуждаются кандидатуры на руководящую должность, каждый претендент рассматривается с учетом его профессиональных, деловых, идейно-политических, моральных качеств и состояния здоровья. Попробуйте в порядке упражнения обсудить структуру характеристики человека как конфигуратор.
Пример 5. При описании процессов, происходящих в народнохозяйственных комплексах областного масштаба, было признано необходимым для характеристики любого выходного продукта производственной или обслуживающей сферы использовать три типа показателей: натуральные (экономико-технологические), денежные (финансово-экономические) и социально-ценностные (идеологические, политические, этические и эстетические). Деятельность завода и театра, совхоза и школы, любого предприятия и организации описывается на этих трех языках, образующих конфигуратор по отношению к целям автоматизированной системы управления хозяйством области.
Пример 6. Опыт проектирования организационных систем показывает, что для синтеза оргсистемы конфигуратор состоит из описания распределения власти (структуры подчиненности), распределения ответственности (структуры функционирования) и распределения информации (организация связи и памяти системы, накопления опыта, обучения, истории). Все три структуры не обязаны совпадать топологически, хотя связывают одни и те же части системы.
Заметим, что конфигуратор является содержательной моделью высшего возможного уровня. Перечислив языки, на которых мы будем говорить о системе, мы тем самым определяем, синтезируем тип системы, фиксируем наше понимание природы системы. Как всякая модель, конфигуратор имеет целевой характер и при смене цели может утратить свойства конфигуратора.
Агрегаты-операторы. Одна из наиболее частых ситуаций, требующих агрегирования, состоит в том, что совокупность данных, с которыми приходится иметь дело, слишком многочисленна, плохо обозрима, с этими данными трудно «работать». Именно интересы работы с многочисленной совокупностью данных приводят к необходимости агрегирования. В данном случае на первый план выступает такая особенность агрегирования, как уменьшение размерности: агрегат объединяет части в нечто целое, единое, отдельное.
В этом случае простейший способ агрегирования состоит в установлении отношения эквивалентности между агрегируемыми элементами, т.е. образования классов. Это позволяет говорить не только о классе в целом, но и о каждом его элементе в отдельности, и в то же время оперировать не элементами, а классами. В этом случае полученный агрегат носит название агрегата-оператора.
Из сказанного выше следует, что классификация объектов, явлений также есть не что иное, как результат агрегирования, т.е. классификация - это тоже вид агрегата.
Другой тип агрегата-оператора возникает, если агрегируемые признаки фиксируются в числовых шкалах. Тогда появляется возможность задать отношение на множестве признаков в виде числовой функции многих переменных, которая и является агрегатом.
Важный пример агрегирования данных дает статистический анализ. Среди различных агрегатов (называемых в этом случае статистиками, т.е. функциями выборочных значений) особое место занимают достаточные статистики, т.е. такие агрегаты, которые извлекают всю полезную информацию об интересующем нас параметре из совокупности наблюдений.
Агрегаты-структуры. Важной формой агрегирования является образование структур. Как и любой вид агрегата, структура является моделью системы и, следовательно, определяется совокупностью объекта, цели, средств и среды моделирования. Это и объясняет многообразие типов структур (сети, матрицы, деревья и т.д.), возникающих при выявлении, описании структур.
При синтезе мы создаем, определяем, навязываем структуру будущей, проектируемой системе (получаем прагматические модели). Если это не абстрактная, а реальная система, то в ней вполне реально (т.е. независимо от нашего желания) возникнут, установятся и начнут «работать» не только те связи, которые мы спроектировали, но и множество других, не предусмотренных нами, вытекающих из самой природы сведенных в одну систему элементов. Поэтому при проектировании системы важно задать ее структуры во всех существенных отношениях, так как в остальных отношениях структуры сложатся сами, стихийным образом (конечно, не совсем независимо от установленных и поддерживаемых проектных структур). Совокупность же всех существенных отношений определяется конфигуратором системы, и отсюда вытекает, что проект любой системы должен содержать разработку стольких структур, сколько языков включено в ее конфигуратор. Например, проект организационной системы должен содержать структуры распределения власти, распределения ответственности и распределения информации (см. пример 6). Подчеркнем, что, хотя эти структуры могут весьма сильно отличаться топологически (например, структура подчиненности иерархична, а функционирование организовано по матричной структуре), они лишь с разных сторон описывают одну и ту же систему и, следовательно, не могут быть не связанными между собой.
Лекция 4. Понятие процесса принятия решения (ППР)
4.1 Общие свойства процесса принятия решений
Процесс принятия решения (ППР) - это особый вид человеческой деятельности, состоящий в выборе одного конкретного способа действий из нескольких возможных.
В течение всей жизни человек постоянно принимает решения. Возможность это делать - отличительная особенность людей от других живых существ, благодаря чему человек может достигать огромных 'степеней свободы', что, к сожалению, часто используется им не во благо.
Существует большое количество современных научных дисциплин, посвященных проблеме принятия решений: математическое программирование, теория игр, теория статистических решений, теория оптимального автоматического управления, исследование операций, системный анализ, экономическая кибернетика и др. Все эти дисциплины занимаются рассмотрением одной и той же проблемы -- научного анализа ряда возможных способов действия с целью нахождения такого из них, который в данных условиях был бы наилучшим. В этом смысле названные дисциплины являются составными частями единой научной дисциплины, для обозначения которой сейчас все чаще применяется термин «теория принятия решений» (ТПР). Центральным в ППР является понятие выбора. Способность сделать правильный выбор - очень ценное качество, присущее людям в разной степени. Объяснить, что такое правильный выбор непросто. Легче сказать, что такое неправильный выбор. Это действия человека, приводящие к несчастным случаям, авариям, катастрофам и другим, неприятным для людей и окружающей среды, последствиям. Каждый может привести примеры подобных решений из своей личной жизни, поступков знакомых людей, сообщений прессы и т.д.
Правильный выбор и соответственно правильное решение в дальнейшем будем рассматривать как действие, направленное на достижение наибольшего блага или наименьшего вреда для данного человека или производственного коллектива в конкретной ситуации.
СА и теория ПР - это отдельная наука, которая взаимосвязана со многими другими. На рисунке 1 указаны базовые для СА научные теории.
Рис. 1. Связь теории системного анализа и принятия решений с другими науками
Информатика - наука, изучающая общие свойства информации, а также проблемы, связанные с ее сбором, хранением, поиском, переработкой, преобразованием, распространением и использованием в различных сферах деятельности.
Кибернетика - наука об общих законах управления сложными системами.
Искусственный интеллект - область знаний, ставящая своей задачей создание технического интеллекта, не уступающего человеческому.
Психология - наука, изучающая процессы и закономерности психической деятельности человека.
Для всех ППР общим является:
1. Неполная информация, которая обусловливает неясные последствия ПР.
2. Множество факторов, которые необходимо принимать во внимание при ПР.
3. Любое решение содержит элемент субъективности, т.е. личностную составляющую лица, принимающего решение (ЛПР).
Как уже отмечалось, любая деятельность человека связана с ПР. Часто, несмотря на свою обыденность, принимаемое в данный момент решение может оказать определяющее влияние на длительный период или даже на всю последующую жизнь человека.
Каждому взрослому человеку практически ежедневно не один раз приходится переходить проезжую часть, по которой перемещаются большие потоки автотранспорта. В такие моменты любой пешеход подвергается опасности. К сожалению, ошибки в ПР с его стороны или со стороны водителя (иногда ошибки являются двухсторонними) нередко заканчиваются трагическим исходом.
Еще большие проблемы возникают, когда принимать решения человеку приходится в условиях стресса, который может быть обусловлен дефицитом времени, недостатком информации, высокой ответственностью за ПР и другими причинами. Такие ситуации возникают, например, на пульте управления сложным технологическим процессом, когда оператор замечает существенные отклонения от заданных параметров, что может предшествовать аварии. Еще более серьезным испытаниям подвергается космонавт при работе на орбитальной станции во время выхода в открытый космос. Высокую ответственность за принимаемые решения несет диспетчер службы спасения, сталкиваясь с необычной ситуацией, врач-хирург, выполняя нетрадиционную операцию и т.д.
Любой специалист и особенно специалист по БЖД должен осознавать, что в своей практической деятельности ситуации, связанные с ответственным выбором, возникать будут неизбежно. Поэтому готовить себя к подобным событиям необходимо заранее. На эти цели направлено изучение теории ПР, практические занятия, психологические тренировки.
В производственной практике специалиста по БЖД, как правило, многие проблемы для их правильного решения требуют применения соответствующих моделей и компьютерных программ. Уметь квалифицированно использовать в нужный момент соответствующие теоретические знания и программные средства поддержки ПР - задача исключительной важности.
Одним из основных понятий теории принятия решений является понятие операции. Под термином «операции» понимается организованная деятельность в любой области жизни, объединенная единым замыслом, направленная к достижению определенной цели и имеющая характер повторяемости, т.е. многократности.
Примеры различных операций:
производственная деятельность отрасли промышленности, выпускающей некоторую народнохозяйственную продукцию;
запуск группы спутников Земли для создания космической системы связи;
совокупность мероприятий;
отражение воздушного или ракетного нападения средствами систем противовоздушной или противоракетной обороны.
Второе важное понятие ТПР - оперирующая сторона как совокупность людей и техники, которые стремятся к достижению некоторой цели. В операции могут участвовать одна или несколько оперирующих сторон, преследующих различные, несовпадающие цели. Несовпадение целей оперирующих сторон создает конфликтную ситуацию.
4.2 Участники процесса принятия решения
В задачах ПР сама проблема выбора тесно связана с человеком - ее владельцем. Владельцем проблемы является человек, который должен ее решать и нести ответственность за принятые решения. Но не всегда владелец проблемы является также и ЛПР, хотя известны многочисленные примеры совмещения этих двух ролей - ЛПР и владельца проблемы.
На принятие решений в той или иной степени влияют активные группы - сообщества людей, имеющих общие интересы по отношению к проблеме, требующей решения. Так, при принятии решения о постройке атомной электростанции (АЭС) активными группами являются:
сотрудники Министерства энергетики, заинтересованные в приросте электроэнергии;
работники организации, осуществляющей постройку АЭС;
представители рядовых граждан;
представители защитников окружающей среды.
В данном случае владельцем проблемы (и иногда ЛПР) являются местные власти, которые должны дать разрешение на постройку АЭС на своей территории.
При ПР важную роль играют эксперты - люди, которые профессионально (лучше, чем ЛПР) знают отдельные аспекты рассматриваемой проблемы. К ним обычно обращаются за оценками, за прогнозами исходов тех или иных решений. Давая такие оценки, эксперты высказывают свое субъективное мнение.
Так, при ПР о постройке АЭС эксперты-физики могут дать ценные сведения о влиянии АЭС на людей и окружающую среду. Они могут произвести расчеты вероятности аварий на АЭС и их возможных последствиях. Но следует помнить, что само решение принимает ЛПР, а эксперты дают лишь часть необходимой информации.
При принятии сложных (стратегических) решений в их подготовке принимают участие консультанты по ПР. Их роль сводится к эффективной организации самого процесса ПР.
Итак, люди, участвующие в решении проблемы, могут играть одну из следующих ролей:
1) владелец проблемы;
2) ЛПР;
3) представитель активной группы;
4) эксперт;
5) консультант.
Ответственность за выбор решения может быть односторонней (индивидуальной) или многосторонней (групповой).
4.3 Схема ППР
Процессы принятия решения (ППР), реализуемые в самых различных сферах деятельности, имеют очень много общего. Поэтому, несмотря на отсутствие единой технологии ППР, определенная тенденция в этом направлении у специалистов по исследованию операций, системному анализу, управлению производством имеется. Обычно СА организуется в виде последовательности следующих этапов:
постановка задачи и ограничение степени ее сложности;
выбор целей и их ранжирование;
выбор способов решения задачи;
моделирование;
оценка получаемых результатов и их практическое использование.
Процесс принятия решения является сложной итеративной циклической процедурой. Структурная схема ППР показана на рисунке 2. Особенности ППР отображены с помощью обратных связей.
Далее рассмотрим более подробно каждый из этапов принятия решения.
Рис. 2. Структурная схема процесса принятия решений
4.4 Формулирование проблемы
Для традиционных наук начальный этап работы заключается в постановке формальной задачи, которую надо решать. В исследовании сложной системы это промежуточный результат, которому предшествует длительная работа по структурированию исходной проблемы. Начальный пункт определения целей в системном анализе связан с формулированием проблемы. Здесь следует отметить следующую особенность задач системного анализа. Необходимость системного анализа возникает тогда, когда заказчик уже сформулировал свою проблему, т.е. проблема не только существует, но и требует решения. Однако необходимо отдавать себе отчет в том, что сформулированная заказчиком проблема представляет собой приблизительный рабочий вариант, т.е. система не является изолированной, она связана с другими системами, входит как часть в состав некоторой надсистемы. Планируемые изменения затронут и подсистемы, входящие в состав данной системы, и надсистему, содержащую данную систему. Таким образом, к любой реальной проблеме следует относиться не как к отдельно взятой, а как к объекту из числа взаимосвязанных проблем.
Также при формулировании проблемной ситуации возникает элемент субъективности. В реальной жизни необходимо учитывать позиции всех заинтересованных сторон, что приводит к дополнениям, уточнениям первоначального варианта описанной проблемы. Следовательно, системное исследование проблемы должно начинаться с ее расширения до системы проблем, связанных с исследуемой, без учета которых она не может быть решена.
Для формулирования системы проблем необходимо сформировать перечень заинтересованных лиц, так или иначе связанных с работами по системному анализу (участников ППР).
При формулировании системы проблем необходимо следовать некоторым рекомендациям. Во-первых, за основу должно браться мнение владельца проблемы (заказчика). Как правило, в качестве такового выступает руководитель организации, для которой проводится системный анализ. Именно он генерирует исходную формулировку проблемы. Далее системный аналитик, ознакомившись со сформулированной проблемой, должен уяснить задачи, которые были поставлены перед руководителем, ограничения и обстоятельства, влияющие на поведение руководителя, противоречивые цели, между которыми он старается найти компромисс. Насколько это возможно, следует выяснить личные качества руководителя, его склонности и предубеждения. Далее необходимо изучить организацию, для которой проводится системный анализ. Необходимо тщательно ознакомиться с существующей иерархией управления, функциями различных групп, а также предыдущими исследованиями соответствующих вопросов, если таковые проводились. Аналитик должен воздерживаться от высказывания своего предвзятого мнения о проблеме и от попыток втиснуть ее в рамки своих прежних представлений ради того, чтобы использовать желательный для себя подход к ее решению. Наконец, аналитик не должен оставлять непроверенными утверждения и замечания руководителя. Как уже отмечалось, проблему, сформулированную руководителем, необходимо, во-первых, расширять до комплекса проблем, согласованных с над- и подсистемами, и, во-вторых, согласовывать ее со всеми заинтересованными лицами.
Следует также отметить, что каждая из заинтересованных сторон имеет свое видение проблемы, отношение к ней. Поэтому при формулировании комплекса проблем необходимо учитывать, какие изменения и почему хочет внести та или другая сторона. Кроме того, проблему необходимо рассматривать всесторонне, в том числе и во временном, историческом плане. Требуется предвидеть, как сформулированные проблемы могут измениться с течением времени или в связи с тем, что исследование заинтересует руководителей другого уровня. Формулируя комплекс проблем, необходимо дать развернутую картину того, кто заинтересован в том или ином решении.
4.5 Определение целей
После того, как сформулирована проблема, переходят к определению цели. Определить цель системного анализа - это означает ответить на вопрос, что надо сделать для снятия проблемы. Сформулировать цель - значит указать направление, в котором следует двигаться, чтобы разрешить существующую проблему, показать пути, которые уводят от существующей проблемной ситуации. Цель - это антипод проблемы (рис. 3). При формулировании проблемы определяется нечто, требующее своего изменения. Например, на некотором предприятии имеет место высокий уровень травматизма. Другой пример - на автодорожной трассе существует участок, где количество ДТП значительно превосходит средний уровень.
Рис. 3. Формулирование цели
Говоря о цели, пытаются определить направление изменения ситуации, которая нас не устраивает, это желаемый результат развития системы. Таким образом, сформулированная цель системного анализа будет определять весь дальнейший комплекс работ. Следовательно, цели должны быть реалистичны. Задание реалистичных целей направит всю деятельность по выполнению системного анализа на получение определенного полезного результата. Способов решения любой проблемы может быть много. В сложных ситуациях сразу поставить правильную цель бывает достаточно трудно, поэтому в процессе системного анализа цель может и должна уточняться. Сроки изменения представлений о целях, старения целей различны и зависят от уровня иерархии рассмотрения объекта. Цели более высоких уровней долговечнее. Динамичность целей должна учитываться в системном анализе.
При формулировании цели нужно учитывать, что на цель оказывают влияние как внешние по отношению к системе факторы, так и внутренние. При этом внутренние факторы являются такими же объективно влияющими на процесс формирования цели факторами, как и внешние.
Далее следует отметить, что даже на самом верхнем уровне иерархии системы имеет место множественность целей. Анализируя проблему, необходимо учитывать цели всех заинтересованных сторон. Среди множества целей желательно попытаться найти или сформировать глобальную цель. Если этого сделать не удается, следует проранжировать цели в порядке их предпочтения для снятия проблемы в анализируемой системе.
Исследование целей заинтересованных в проблеме лиц должно предусматривать возможность их уточнения, расширения или даже замены. Это обстоятельство является основной причиной итеративности системного анализа.
На выбор целей субъекта решающее влияние оказывает та система ценностей, которой он придерживается, поэтому при формировании целей необходимым этапом работ является выявление системы ценностей, которой придерживается лицо, принимающее решение. Так, например, различают технократическую и гуманистическую системы ценностей (таблица 1).
Таблица 1 - Альтернативные системы ценностей
Технократическая система ценностей |
Гуманистическая система ценностей |
|
Природа как источник неограниченных ресурсов |
Природные ресурсы ограничены |
|
Превосходство над природой |
Гармония с природой |
|
Природа враждебна или нейтральна |
Природа дружественна |
|
Управляемая окружающая среда |
Окружающая среда в хрупком равновесии |
|
Информационно-технологическое развитие общества |
Социокультурное развитие |
|
Рыночные отношения |
Общественные интересы |
|
Риск и выигрыш |
Гарантии безопасности |
|
Индивидуальное самообеспечение |
Коллективистская организация |
|
Разумность средств |
Разумность целей |
|
Информация, запоминание |
Знание, понимание |
|
Образование |
Культура |
Согласно первой системе природа провозглашается как источник неисчерпаемых ресурсов, человек - царь природы. Всем известен тезис: «Мы не можем ждать милостей от природы. Взять их у нее наша задача». Гуманистическая система ценностей говорит о том, что природные ресурсы ограничены, что человек должен жить в гармонии с природой и т.д. Практика развития человеческого общества показывает, что следование технократической системе ценностей приводит к пагубным последствиям. С другой стороны, полный отказ от технократических ценностей тоже не имеет оправдания. В повседневной деятельности целесообразен разумный компромисс для возможности выработки взвешенного и эффективного решения. Здесь важно мыслить системно, не ограничиваясь только узкими рамками собственной предметной области. Примером подобной ситуации является шуточное высказывание, которое встречается у врачей-хирургов: Операция прошла успешно, но пациент умер.
Необходимо не противопоставлять эти системы, а разумно дополнять их и формулировать цели развития системы с учетом обеих систем ценностей.
4.6 Генерирование альтернатив
Следующим этапом системного анализа является создание множества возможных способов достижения сформулированной цели. Иными словами, на данном этапе необходимо сгенерировать множество альтернатив, из которых затем будет осуществляться выбор наилучшего пути развития системы. Данный этап системного анализа является очень важным и трудным. Важность его заключается в том, что конечная цель системного анализа состоит в выборе наилучшей альтернативы на заданном множестве и в обосновании этого выбора. Если в сформированное множество альтернатив не попала наилучшая, то никакие самые совершенные методы анализа не помогут ее вычислить. Трудность этапа обусловлена необходимостью генерации достаточно полного множества альтернатив, включающего в себя, на первый взгляд, даже самые нереализуемые.
Для существования самой задачи ПР необходимо иметь хотя бы два варианта, поскольку только в этом случае может быть реализован выбор.
Множество альтернатив может быть дискретным (конечным) или непрерывным (континуальным). Альтернативы бывают независимыми и зависимыми. Независимыми являются те альтернативы, любые действия с которыми (удаление из рассмотрения, выделение в качестве лучшей и т.п.) не оказывают влияния на качество других альтернатив. При зависимых альтернативах решения по одним оказывают влияние на качество других.
Задачи ПР могут существенно отличаться также по числу альтернатив и их наличию на момент ПР. Встречаются задачи, когда все альтернативы уже заданы и необходим лишь выбор из этого множества. Особенностью этих задач является замкнутое и нерасширяющееся множество альтернатив. Но существуют задачи другого типа, в которых альтернативы не сформированы на момент ПР, а генерируются в процессе принятия решений.
Итак, альтернативы, присутствующие в задачах ПР, могут быть следующими:
1) независимыми или зависимыми;
2) заранее заданными или конструируемыми в ППР.
Среди набора альтернатив в некоторых задачах ПР обязательно должна присутствовать так называемая нулевая альтернатива, под которой понимается вариант 'не делать ничего'. В отдельных ситуациях, не носящих стратегического характера, именно такой выбор оказывается наилучшим.
Генерирование альтернатив, т.е. идей о возможных способах достижения цели, является настоящим творческим процессом. Существует ряд рекомендаций о возможных подходах к выполнению рассматриваемой процедуры. Необходимо сгенерировать как можно большее число альтернатив. Имеются следующие способы генерации:
- поиск альтернатив в патентной и журнальной литературе;
- привлечение нескольких экспертов, имеющих разную подготовку и опыт;
- увеличение числа альтернатив за счет их комбинации, образования промежуточных вариантов между предложенными ранее;
- модификация имеющейся альтернативы, т.е. формирование альтернатив, лишь частично отличающихся от известной;
- включение альтернатив, противоположных предложенным, в том числе и «нулевой» альтернативы (не делать ничего, т.е. рассмотреть последствия развития событий без вмешательства системотехников);
- интервьюирование заинтересованных лиц и более широкие анкетные опросы;
- включение в рассмотрение даже тех альтернатив, которые на первый взгляд кажутся надуманными;
- генерирование альтернатив, рассчитанных на различные интервалы времени (долгосрочные, краткосрочные, экстренные).
При выполнении работы по генерированию альтернатив важно создать благоприятные условия для сотрудников, выполняющих данный вид деятельности. Большое значение имеют психологические факторы, влияющие на интенсивность творческой деятельности, поэтому необходимо стремиться к созданию благоприятного климата на рабочем месте сотрудников.
Существует еще одна опасность, возникающая при выполнении работ по формированию множества альтернатив, о которой необходимо сказать. Если специально стремиться к тому, чтобы на начальной стадии было получено как можно больше альтернатив, т.е. стараться сделать множество альтернатив как можно более полным, то для некоторых проблем их количество может достичь многих десятков. Для подробного изучения каждой из них потребуются неприемлемо большие затраты времени и средств. Поэтому в данном случае необходимо провести предварительный анализ альтернатив и постараться сузить множество на ранних этапах анализа. На этом этапе анализа применяют качественные методы сравнения альтернатив, не прибегая к более точным количественным методам. Тем самым осуществляется грубое отсеивание.
При графической интерпретации задач ПР альтернативы обычно откладываются по оси Х.
4.7 Формирование критериев
В ППР часто встречается термин критерий, который конкретизирует цель. Именно критерий позволяет реализовать механизм выбора конкретного варианта из заданного множества, поскольку является способом сравнения вариантов.
После того как критерий сформирован, т.е. найдена характеристика, которая будет положена в основу сравнения вариантов решения (альтернатив), появляется возможность ставить задачи выбора и оптимизации.
Задача формирования критериев решается непосредственно после того, как сформулированы цели системного анализа. Задача системного аналитика состоит в том, чтобы формализовать проблемную ситуацию, возникающую в ходе системного анализа. Этой цели как раз и служит этап формирования критериев. Сформированные критерии в некотором смысле должны заменять цели. От критериев требуется как можно большее сходство с целями, однако полностью совпадать они не будут. Одной из причин этого является то, что критерии и цели формулируются в разных шкалах: цели в номинальных, критерии в более сильных, допускающих упорядочение. Критерий является отображением ценностей, воплощенных в целях. Определение значения критерия для данной альтернативы является косвенным измерением степени ее пригодности как средства достижения цели.
Обсуждая вопрос формирования критериев, следует сказать, что это достаточно трудная и серьезная задача. Редко бывает так, что решение лежит на поверхности. Зачастую для формирования хорошего критерия, адекватно отражающего цель системного анализа, приходится прибегать к неформализуемым процедурам. Неформализуемые, творческие, эвристические этапы играют важную роль в процессе формирования критериев. При решении задач системного анализа, возникает ситуация, когда невозможно предложить один критерий, адекватно отражающий цель исследования: даже одну цель редко удается выразить одним критерием, хотя к этому необходимо стремиться. Критерий, как и всякая модель, лишь приближенно отображает цель; адекватность одного критерия может оказаться недостаточной. Поэтому решение может состоять не обязательно в поиске более адекватного критерия, оно может выражаться в использовании нескольких критериев, описывающих одну цель по-разному и дополняющих друг друга. Еще более усложняется задача в случае, когда сформулировано несколько целей системного анализа, отражающих разные системы ценностей. В этом случае исследователь тем более вынужден формировать несколько критериев и в последующем решать многокритериальную задачу. Таким образом, можно отметить, что многокритериальность является способом повышения адекватности описания цели. Однако введение многокритериальности в задачах системного анализа не должно быть самоцелью. Качество постановки задачи заключается не только и не столько в количестве критериев, сколько в том, чтобы они достаточно адекватно описывали цель системного анализа. Критерии должны описывать по возможности все важные аспекты цели, но при этом желательно минимизировать число необходимых критериев.
Формирование критериев отражает цель, которую ставит заказчик. Но при постановке и решении задач системного анализа необходимо учитывать не только цели, на решение которых он направлен, но и возможности, которыми обладают стороны для решения поставленных задач и которые позволяют снять выявленные проблемы. В первую очередь, необходимо учитывать ресурсы, имеющиеся у сторон, и интересы окружающей среды. Хоть окружающая среда и играет пассивную роль, необходимо учитывать, что любая система существует внутри нее, взаимодействует с ней. Поэтому при постановке задачи системного анализа необходимо следовать принципу «не навредить», не предпринимать ничего, что противоречило бы законам природы. Чтобы удовлетворить условиям непревышения количества имеющихся ресурсов, в постановку задачи системного анализа вводят ограничения.
Между целевыми критериями и ограничениями имеются сходство и различия. Общее заключается в том, что и критерий, и ограничения являются математической формулировкой некоторых условий. В некоторых задачах оптимизации они могут выступать равноправно. Однако на этапе формирования целевой критерий открывает возможности для генерирования новых альтернатив в поисках лучшей из них, а ограничение заведомо уменьшает их число, запрещая некоторые из них. Одними целевыми критериями можно жертвовать ради других, ограничения же исключить нельзя, они должны четко соблюдаться. При формулировании задач системного анализа встречаются случаи, когда ограничения задаются завышенными. Это может привести к нереальности достижения целей системного анализа. В этом случае необходимо ставить вопрос об ослаблении ограничений.
При графической интерпретации задач ПР критерии откладываются по оси Y.
4.8 Физиология принятия решений
Органом, который обеспечивает мыслительную деятельность человека, и в частности отвечает за принятие решений, является головной мозг. В конце ХХ века были получены убедительные данные относительно асимметрии полушарий головного мозга, согласно которым левое полушарие отвечает за аналитическую деятельность человека, а правое обеспечивает его творческие возможности. В то же время еще ранее было доказано, что левое полушарие управляет правой частью тела человека, а правое - левой. Многие ученые убеждены, что у 'правшей' сильнее развито левое полушарие, которое доминирует в их поведении, а у 'левшей' - наоборот.
Поскольку мы живем в 'праворуком' мире, то для большинства людей более характерно рациональное логическое мышление, чему способствует доминирование левого полушария. Казалось бы, такие люди должны лучше принимать решения. Однако это не совсем так. Специальные исследования показали, что надлежащий выбор производит тот, кто способен к образному мышлению, т.е. наделен даром 'видеть' развитие ситуации до ее наступления. Для специалистов по техногенной безопасности развитие подобного качества представляется исключительно важным. Нет, видимо, более важного вида человеческой деятельности, чем обеспечение безопасности, где поговорки 'после драки кулаками не машут' и 'гром не грянет - мужик не перекрестится' были бы столь актуальны.
Таким образом, сочетание способностей логико-аналитической переработки информации и интуитивно-чувственного прогнозирования исходов альтернативных ситуаций - вот идеальный уровень мыслительных возможностей современного специалиста, выступающего в качестве ЛПР. Понятно, что функции 'слабого' полушария могут быть усилены за счет осознания данного факта и соответствующих тренировок.
4.9 Виды и особенности задач принятия решений
Требования к процедуре выбора определяют вид задач ПР. Остановимся на трех основных типах подобных задач.
1. Упорядочение альтернатив. Существуют задачи, в которых требуется определить порядок на множестве альтернатив. Так, инженер по охране труда (ОТ), планируя на определенный календарный период мероприятия по обеспечению производственной безопасности, формирует их перечень в порядке важности; выпускники вуза распределяются по общим успехам за время обучения и т.д.
2. Разделение альтернатив на упорядоченные группы. Объединение объектов в группы - очень характерное занятие для людей. Врач, обследующий больных, может выделять группы пациентов в соответствии с подозрениями на разные заболевания; куратор делит студентов на группы отличников, хорошистов, троечников и т.д.
3. Выбор лучшей альтернативы. Эта задача традиционно считается одной из основных в принятии решений. Она часто встречается на практике. С такой проблемой сталкивается абитуриент при выборе специальности при поступлении в вуз; выпускник выбирает конкретное место работы; руководитель проектной организации определяет проект будущего объекта и т.п.
Для ЛПР задача ПР может быть совершенно новой или повторяющейся. Это влияет на его степень информированности. Если ЛПР ощущает недостаток информации, то ему для получения эффективного результата целесообразно использовать поддержку эксперта.
Очень сильно на сложность выбора влияет размерность задачи, под которой понимается количество критериев и число альтернатив. Сложность существенно возрастает при переходе от одного к двум и более критериям. Количество альтернатив влияет на сложность: несколько альтернатив обычно трудностей при выборе не вызывают; эти трудности появляются, когда их число составляет несколько десятков; нередко встречаются ситуации, в которых число альтернатив достигает многих сотен или даже тысяч. Сложность выбора при этом становится значительной.
Для задач высокой размерности, как правило, требуется так называемая формализация, т.е. представление процедуры выбора в виде алгоритма, что открывает возможность применения вычислительной техники.
Опытный ЛПР в процессе принятия решений иногда использует специальные приемы, которые получили название эвристик.
Эвристика - в широком смысле слова раздел психологии, изучающий природу мыслительных операций человека при решении им различных задач; в узком смысле - приемы и методы поиска решений, основанные на интуиции и учете результатов решений сходных задач в прошлом, накопленном опыте, анализе ошибок.
Действуя в рамках эвристического набора правил, ЛПР манипулирует следующими характеристиками:
- вероятность выигрыша;
- размер выигрыша;
- вероятность проигрыша;
- размер проигрыша и некоторыми другими.
Использование эвристик не всегда гарантирует хороший результат. Однако их достоинство заключается в том, что они способны радикально упростить исходную задачу и тем самым существенно снизить ее сложность. В ряде случаев такой подход оказывается единственным способом решения задачи.
На рисунке 4 представлена классификация задач ПР, которая завершена указанием на математический аппарат, применяемый при решении задач того или иного класса.
Рис. 4. Классификация задач ПР и методов их решения
4.10 Формализация принятия решений
Формально задача ПР может быть представлена следующим образом:
где S0 - проблемная ситуация;
t - время для ПР;
R - ресурсы, потребные для ПР;
- множество целей, преследуемых при ПР;
- множество ограничений;
- множество альтернатив;
p - функция предпочтения ЛПР;
- множество критериев выбора наилучшего решения;
Х* - оптимальное решение.
Собственно процедура выбора представляется в виде:
где Ф - правило (механизм) выбора.
Существует ряд подходов к формализации ППР:
- критериальный выбор (однокритериальные, многокритериальные задачи ПР, задачи ПР в условиях неопределенности);
- выбор на основе анализа бинарных отношений (некритериальные задачи ПР);
- групповой выбор (экспертные методы).
Литература:
1. Попов Г.В. Выбор решений и безопасность: Учеб. пособие / Иван. гос. энерг. ун-т. - Иваново. 2003. - 92 с.
2. Романов В.Н. Системный анализ для инженеров / В.Н. Романов. - СПб: СЗГЗТУ, 2006. - 186 с.
Лекция 5. Информационное обеспечение ППР
5.1 Понятие информации
Информация - абстрактное понятие, которое выражается в виде данных, являющихся ее носителями. В ППР информация является основным ресурсом.
Для ПР необходимо некоторое количество информации, которое называется информационной потребностью. Обозначим это количество информации через Im (рис. 1).
Рис. 1. Удовлетворение информационной потребности
Источники информации: Д1, Д2, …, Дn - документы; Э1, Э2, …, Эm - эксперты; темным цветом показано дублирование информации, серым - востребованные части источников
Информация обладает свойством рассеивания, что может быть выражено следующей формулой:
I=Im(1-e-?N),
где Im - потенциально необходимый объем информации;
N - количество привлеченных информационных источников (документов и экспертов);
?>0 - коэффициент, характеризующий степень рассеивания и дублирования информации.
Другим свойством информации является ее старение, что выражается формулой:
C=C0e-?t,
где С0 - первоначальная ценность информации;
?>0 - коэффициент, характеризующий процесс старения;
t - время.
Еще одна из особенностей информации заключается в том, что она в отличие от других ресурсов не уменьшается при передаче и использовании.
В ППР постоянно происходит общение разных людей. При межличностной и межгрупповой коммуникациях возможны значительные потери и искажение информации, что объясняется следующими причинами:
- человек не может в процессе общения передать без каких-либо искажений всю информацию, которая содержится в его сознании и касается конкретной проблемы; в экстремальных ситуациях эти искажения особенно существенны;
- часть информации теряется из-за ограниченного словарного запаса человека, а часть - содержится на уровне подсознания и словами вообще не выражается;
- часть информации утаивается, если ее озвучивание невыгодно говорящему;
- из-за возможного дефицита времени какая-то информация не проговаривается;
- многое из сказанного не усваивается другим участником ППР из-за невнимательности или трудностей понимания (особенно в экстремальных ситуациях);
- услышанное человек обычно подвергает собственной интерпретации, что при дальнейшей коммуникации может создать ситуацию 'испорченного телефона'.
Неправильное понимание участниками ППР друг друга из-за искажения информации часто затрудняет достижение эффективного результата, что мы постоянно наблюдаем в повседневной жизни. Специалисты по безопасности жизнедеятельности в своей практической работе на эти особенности передачи информации должны обращать особое внимание.
Концептуальная схема классификации источников и способов получения информации представлена на рисунке 2. Из анализа этой схемы следует, что принципиально есть только три источника информации:
- эмпирические данные (кратко будем обозначать этот источник информации именем «ОПЫТ»);
- знания, личный опыт и интуиция ЛПР (имя источника - «ЛПР»);
- совет специалиста (краткое имя для этого источника - «ЭКСПЕРТИЗА»).
Рис. 2. Концептуальная схема классификации источников и способов получения информации
Ясно, что практически чаще всего люди черпают информацию из собственного опыта и знаний, а собственная интуиция помогает им заполнить пробелы в позитивном знании. В историческом отношении этот источник информации («ЛПР») наиболее древний. Но бывает, что само ЛПР не имеет достаточных знаний или опыта по разрешению стоящей перед ним проблемы. Вообще-то это не такой уж редкий случай. В подобной ситуации ЛПР начинает искать наиболее подходящий источник получения недостающих данных, информации или знаний. Здесь перед ним оказываются две принципиальные возможности: поискать необходимые сведения в одном из «объективных источников», где зафиксирован исторический опыт человечества, или обратиться к «субъективному источнику» к знаниям, умениям и навыкам признанных специалистов своего дела (экспертам).
По-видимому, использование для принятия решений знаний, навыков и опыта специалистов следует считать исторически следующим шагом в развитии методов управления и разработки решений. ЛПР прибегали к подобному источнику информации («ЭКСПЕРТИЗА») для принятия ответственных решений столь же часто, как и к собственным опыту и интуиции. Однако, если в обыденной жизни человек самостоятельно решает, является ли тот или иной из знакомых ему специалистов «экспертом», то, чтобы считаться экспертом в строгом, научном понимании, человек должен удовлетворять ряду особых требований.
5.2 Информационная структура процесса принятия решений
Информацию принято характеризировать с количественной и качественной стороны. Количество информации определяется как мера уменьшения неопределенности некотороый ситуации вследствие того, что становится известным исход другой ситуации. Качество информации характеризуется такими свойствами, как точность, полнота, достоверность (надежность), однозначность, согласованность и т.п.
К сожалению, в сложных больших системах приходится сталкиваться с ситуацией, когда имеющаяся информация инедостаточна либо неточна (недостоверна).
В этом случае говорят о ее неполноте или нечеткости. Таким образом, понятие информации оказывается тесно связанным с понятиями энтропия, разнообразние, ограничения.
Энтропия определяется как мера неопределенности случайной ситуации, т.е. энтропия и количество инфорации являются взаимодополнительными понятиями. Винер выразил это следующими словами: «Как количество информации в системе есть мера организованности системы, точно так же энтропия - мера дезорганизованности системы. Одно равно другому, взятому с обратным знаком». Двойственность этиих понятий можно проиллюстрировать рисунком 3.
Рис. 3. Информация противодействует тенденциям системы к дезорганизации и возрастанию энтропии
Будем оценивать информацию с точки зрения ее количества, которое обозначим как I и неопределенности (энтропии), которую будем обозначать как E.
Принимаемое решение характеризуется числом параметров n и шириной интервала lj, в котором может меняться каждый параметр (j=1, 2, …, n). Введем понятие количества альтернатив в каждом интервале (от него зависит свобода выбора):
где ?j - точность решения по j-му параметру.
Так, в нашем примере с переходом автомагистрали выбор пешехода характеризуется двумя параметрами (n=2):
- скорость движения;
- направление движения.
Очевидно, что скорость может меняться примерно от 0 до 10 км/час, т.е. l1=[0, 10]. Будем считать, что в этом интервале у пешехода четыре альтернативы (N1=4): стоять на месте, переходить дорогу очень медленно, в нормальном ритме, бегом. При этом ?1=3 км/час.
Энтропия принимаемого решения определяется по формуле:
где - вероятность, что j-й параметр при нашем выборе попадет в интервал kj из отрезка lj.
Для случая равномерного распределения вероятности предыдущая формула упрощается и принимает вид:
Чем шире исходный интервал lj, тем неопределенность больше. Зависимость энтропии от количества информации имеет вид (рис. 4):
Iп - пороговый объем информации; Iпр - информация, необходимая для ПР;
dI = Iпр - Iп - приращение информации
Рис. 4. Связь энтропии и информации при ПР
При практическом отсутствии информации, когда I<Iп (Iп - пороговый объем информации) решение принимать не имеет смысла - сделать правильный выбор невозможно. Начиная с некоторого объема информации Iпр, дальнейшее затягивание с ПР особого смысла не имеет, т.к. надеяться на существенное снижение неопределенности не приходится. Из рис. 3 также можно сделать вывод, что приращение информации dI = Iпр - Iп особенно эффективно на начальных этапах снижения неопределенности.
Анализируя сказанное, можно сформулировать так называемый принцип минимальной заблаговременности, который целесообразно использовать в некоторых ситуациях: оттягивание решения целесообразно до момента, за которым собственно ППР теряет смысл.
На этом принципе основано поведение не очень уверенного в своих силах абитуриента, подающего документы для поступления в университет. Только в последней день работы приемной комиссии он определяется с выбором специальности, тщательно анализируя любую информацию, которая хотя бы незначительно указывает на специальности с наименьшим конкурсом.
Литература:
1. Попов Г.В. Выбор решений и безопасность: Учеб. пособие / Иван. гос. энерг. ун-т. - Иваново. 2003. - 92 с.
Лекция 6. Неформальные методы принятия решений (3 часа)
6.1 Особенности группового выбора
В реальных условиях возникают ситуации, когда несколько человек с одинаковыми намерениями стремятся найти хорошее решение. Такой процесс носит название группового выбора. Пусть на множестве альтернатив задано n различных индивидуальных предпочтений R1, R2, …, Rn. Ставится задача о выработке некоторого нового отношения R, которое выражает в каком-то смысле “общее мнение» и принимается за групповой выбор.
Распространенным способом получения отношения R является процедура голосования. В этой процедуре основным принципом является правило большинства: принятой всеми считается альтернатива, получившая наибольшее число голосов. Правило большинства привлекательно своей простотой, но имеет некоторые особенности. Дело в том, что оно лишь обобщает индивидуальные предпочтения, и его результат не является критерием истины. Только дальнейшая практика показывает, правильным или ошибочным было решение, принятое большинством голосов. Большинство здесь понимается - или как простое большинство (>50 %), или как «квалифицированное» (>2/3), или как абсолютное (~100 %).
Другая особенность голосования - невозможность выбора из-за недостижения требуемого большинства. Например, пусть три эксперта большинством голосов решают вопрос, какая из двух альтернатив более предпочтительна. При такой постановке вопроса они не могут не сделать выбор.
Но, предположим, эти эксперты предлагают свои варианты развития некоторой системы a, в и с соответственно. Каждый эксперт руководствуется при этом собственным набором предпочтений. Пусть это последовательности а>в>с, в>с>а, с>а>в.
После голосования по паре (а, в) в результате получается два голоса против одного: а>в; по паре (в, с) в>с и по паре (с, а) с>а, также с перевесом двух голосов против одного. Таким образом, голосование не привело к выяснению 'общепризнанного' порядка альтернатив, поскольку в результате а>в>с>а.
Причина данного явления называется парадоксом нетранзитивности группового выбора. Она объясняется цикличностью совокупности индивидуальных предпочтений. Однако это лишь частный пример более общего явления, получившего название парадокса Эрроу, смысл которого в следующем.
Выделим требования, выражающие наше понимание того, какой выбор можно считать согласованным:
1) если в результате группового выбора предпочтение было отдано альтернативе х, то это решение не должно меняться, если кто-нибудь из ранее отвергавших х изменил свое предпочтение в ее пользу (условие монотонности);
2) если изменения индивидуальных предпочтений не коснулись определенных альтернатив, то в новом групповом упорядочении порядок этих альтернатив не должен меняться (условие независимости альтернатив);
3) для любой пары альтернатив х и y существует такой набор индивидуальных предпочтений, для которого х>y (условие суверенности);
4) не должно быть такого эксперта, для которого из его предпочтения х>y вытекает, что R=(х>y), независимо от предпочтений других экспертов (условие отсутствия диктаторства).
Парадокс Эрроу состоит в том, что первые три условия противоречат четвертому; не существует правила R, удовлетворяющего всем требованиям.
Задачи группового выбора часто все же могут быть разрешены. Во-первых, в ряде случаев циклические ранжирования могут отсутствовать либо они не охватывают «наиболее важные» альтернативы, либо принимаются меры по их обнаружению и устранению. Во-вторых, во многих ситуациях «диктаторский» принцип согласования может оказаться приемлемым. В-третьих, переход (когда это возможно) к использованию единой числовой, а не порядковых индивидуальных шкал предпочтений может вообще устранить проблему нетранзитивности.
6.2 Экспертные методы выбора
Основная идея экспертных методов состоит в том, чтобы использовать интеллект людей, их способность искать и находить решение слабо формализованных задач. В методиках организации экспертных оценок внимание уделяется созданию благоприятных условий и нейтрализации факторов, неблагоприятно влияющих на работу экспертов.
Под экспертными оценками понимают комплекс логических и математических процедур, направленных на получение от специалистов информации, ее анализ и обобщение с целью подготовки и выработки рациональных решений.
Очень важную роль при этом играют факторы психологического характера. Прежде всего, эксперты должны быть освобождены от ответственности за результат экспертизы. Дело не только в том, что ЛПР не должно возлагать ответственность на других, но и в том, что сама ответственность накладывает психологические ограничения на характер выбора, а этого на стадии оценки альтернатив желательно избежать. Приходится также учитывать, что оценка, даваемая экспертом, может зависеть от межличностных отношений с другими экспертами и иногда от того, известна ли его оценка другим лицам. На ход экспертизы может повлиять и личная заинтересованность эксперта, т.е. его необъективность.
С другой стороны, сложность проблемы обычно выходит за рамки возможностей одного человека, а коллективная деятельность обычно открывает дополнительные возможности для взаимного стимулирования экспертов.
В разных случаях используют методики экспертиз, имеющие различные степень и характер взаимного влияния экспертов друг на друга: анонимные и открытые опросы и анкетирование, совещания, дискуссии, деловые игры, мозговой штурм и т.д.
Рассмотрим простейший вариант. Экспертам раздают анкеты с просьбой оценить предлагаемые альтернативы. Заполненные анкеты собирают, обрабатывают и полученную информацию в некотором обобщенном виде передают ЛПР.
Предположим, что эксперты оценивают альтернативы в числовых шкалах. Пусть Zj(Xi) - оценка i-й альтернативы j-м экспертом (i=1,…, n; j=1, …, m). Оценки Z1(Xi), … Zm(Xi) можно рассматривать как «измерения» искомой «истинной» характеристики Z(Xi). В качестве приближения можно использовать выборочное среднее
Сложнее обстоит дело, когда альтернативы нельзя оценить сразу одним числом и экспертам предлагается дать оценки отдельно по каждому показателю. Например, оценка качества электроэнергии складывается из оценок несимметричности фаз, несинусоидальности токов, отклонений частоты от номинальной. В таких случаях имеем набор чисел Zjk (Xi), где k - номер признака. Кроме этих чисел экспертов просят оценить степень важности ?jk каждого показателя. Тогда
Естественно придать различные приоритеты («веса») мнениям экспертов, имеющих разную квалификацию. Определение коэффициента аi компетентности j-го эксперта можно поручить самим экспертам. Пусть каждый из них (l-й) оценивает компетентность других экспертов числами 0?аlj?1, при этом и свою собственную числом all .
Усреднение дает
где m - количество экспертов.
В результате получают итоговую оценку
В тех случаях, когда эксперты лишь упорядочивают альтернативы, т.е. используют только порядковую шкалу, необходимость арифметических операций отпадает.
Методы экспертных оценок можно разделить на две группы: методы коллективной работы экспертной группы и методы получения индивидуального мнения членов экспертной группы.
Методы коллективной работы экспертной группы предполагают получение общего мнения в ходе совместного обсуждения решаемой проблемы. Иногда эти методы называют методами прямого получения коллективного мнения. Основное преимущество этих методов заключается в возможности разностороннего анализа проблем. Недостатками методов является сложность процедуры получения информации, сложность формирования группового мнения по индивидуальным суждениям экспертов, возможность давления авторитетов в группе. Методы коллективной работы включают методы «мозговой атаки», «сценариев», «деловых игр», «совещаний» и «суда».
Методы получения индивидуального мнения членов экспертной группы основаны на предварительном получении информации от экспертов, опрашиваемых независимо друг от друга, с последующей обработкой полученных данных. К этим методам можно отнести методы анкетного опроса, интервью и методы «Делфи». Основные преимущества метода индивидуального экспертного оценивания состоят в их оперативности, возможности в полной мере использовать индивидуальные способности эксперта, отсутствии давления со стороны авторитетов и в низких затратах на экспертизу. Главным их недостатком является высокая степень субъективности получаемых оценок из-за ограниченности знаний одного эксперта.
Качественные методы системного анализа и принятия решений применяются, когда отсутствуют описания закономерностей систем в виде аналитических зависимостей.
Изучению возможностей и особенностей применения методов экспертных оценок посвящено много работ, в том числе имеется ряд обзоров. Термин «эксперт» происходит от латинского слова expert, означающий «опытный». Неизвестная характеристика исследуемого явления трактуется при этом обычно как случайная величина, отражением закона распределения которой является индивидуальная оценка специалиста-эксперта о достоверности и значимости того или иного события. Когда такие оценки получены от группы экспертов, предполагается, что истинное значение исследуемой характеристики находится внутри диапазона оценок и что обобщенное коллективное мнение является достоверным.
Применение классического частотного подхода к оценке вероятности при проведении экспертной оценки бывает затруднительным, а иногда и просто невозможным, так как исчисление вероятностей основано на законе больших чисел, выполнение которого предполагает массовый характер исследуемых явлений и наличия большого числа подтверждений в прошлом.
При использовании экспертных оценок обычно предполагается, что мнение группы экспертов надежнее, чем мнение отдельного эксперта. В некоторых теоретических исследованиях отмечается, что это предположение не является очевидным. Но одновременно со ссылкой на экспериментальные исследования утверждается, что при соблюдении определенных требований в большинстве случаев групповые оценки надежнее индивидуальных. К числу таких требований относится: распределение оценок, полученных от экспертов, должно быть «гладким»; две групповые оценки, данные двумя одинаковыми подгруппами, выбранными случайным образом, должны быть близки.
Все множество проблем, решаемых методами экспертных оценок, делится на два класса. К первому относятся такие, в отношении которых имеется достаточное обеспечение информацией.
При этом методы опроса и обработки основываются на использовании принципа «хорошего измерителя», т. е. эксперт - качественный источник информации; групповое мнение экспертов близко к истинному решению. Применяются формальные приемы обработки индивидуальных экспертных оценок. Ко второму классу относятся проблемы, в отношении которых знаний для уверенности в справедливости указанных гипотез недостаточно. В этом случае экспертов ухе нельзя рассматривать как «хороших измерителей» и необходимо осторожно подходить к обработке результатов экспертизы во избежание больших ошибок.
В литературе в основном рассматриваются вопросы экспертного оценивания для решения задач первого класса. Но и в этой ситуации необходимо помнить особенности экспертных оценок: они несут в себе как узкосубъективные черты, присущие каждому эксперту, так и коллективно-субъективные, присущие коллегии экспертов. И если первые устраняются в процессе обработки индивидуальных экспертных оценок, то вторые не исчезают, какие бы способы обработки ни применялись.
Для реализации методов экспертных оценок важную роль играет тщательная подготовка их проведения. Этапы организации экспертизы: формирование цели экспертизы; разработка процедуры опроса; формирование группы экспертов; опрос, анализ и обработка информации.
При формулировке цели экспертизы разработчик прогноза должен выработать четкое представление о том, кем и для каких целей будут использованы результаты прогноза. Прогноз может быть ориентирован на:
? повышение обоснованности решений, принимаемых плановыми органами;
? производство технических средств;
? оценку развития различных направлений научных исследований и технических идей и т. д.
В первом случае задача прогноза в основном состоит в определении желательности и необходимости отдельных событий и сроков их свершения. В других случаях задача прогноза должна состоять в определении принципиальной осуществимости и возможности свершения ряда событий в течение определенных промежутков времени.
Успех организации экспертизы во многом зависит от разработки рабочей программы экспертной оценки; оценки типа интервью, «докладная записка», метод комиссии, метод отнесенной оценки и др.
Решение задачи о выборе группы (коллектива) экспертов проводится в такой последовательности:
1. Составляется список вопросов, по которым желательно получить мнение экспертов.
2. Составляется список экспертов, включающий по возможности такое их число, чтобы априори можно быть более или менее уверенным в том, что эксперты могут в совокупности дать заключение по всему множеству вопросов списка.
3. Список вопросов рассылается каждому эксперту с просьбой определить свою компетентность по каждому вопросу, т.е. определить, сможет или не сможет он компетентно участвовать в рассмотрении данного вопроса при экспертизе.
4. Рассчитываются необходимые затраты времени и средств на проведение опроса каждого эксперта.
5. Ставится и решается задача об экспертах, т. е. задача осуществления такого выбора экспертов, чтобы по каждому вопросу можно было получить заключение, по крайней мере, одного эксперта и чтобы при этом затраты времени или средств на проведение опроса экспертов были минимальны.
При обработке материалов коллективной экспертной оценки используются методы теории ранговой корреляции. Для количественной оценки степени согласованности мнений экспертов применяется коэффициент конкордации
где
;
m - количество экспертов, j=; n - количество рассматриваемых свойств, i=; rij - место, которое заняло i-е свойство в ранжировке j-м экспертом; di - отклонение суммы рангов по j-му свойству от среднего арифметического сумм рангов по n свойствам.
Коэффициент конкордации W позволяет оценить, насколько согласованы между собой ряды предпочтительности, построенные каждым экспертом. Его значение находится в пределах 0?W?1; W=0 означает полную противоположность, а W= 1 -полное совпадение ранжировок. Практически достоверность считается хорошей, если W=0,7...0,8.
Небольшое значение коэффициента конкордации, свидетельствующее о слабой согласованности мнений экспертов, является следствием следующих причин: в рассматриваемой совокупности экспертов действительно отсутствует общность мнений; внутри рассматриваемой совокупности экспертов существуют группы с высокой согласованностью мнений, однако обобщенные мнения таких групп противоположны.
Для наглядности представления о степени согласованности мнений двух любых экспертов А и В служит коэффициент парной ранговой корреляции
где ?i - разность (по модулю) величин рангов оценок i-го свойства, назначенных экспертами А и В: ?i=;
TA и TB - показатели связанных рангов оценок экспертов А и В.
Коэффициент парной ранговой корреляции принимает значения - 1 ?р? +1. Значение р=+1 соответствует полному совпадению оценок в рангах двух экспертов (полная согласованность мнений двух экспертов), а р= -1 - двум взаимно противоположным ранжировкам важности свойств (мнение одного эксперта противоположно мнению другого).
Помощь экспертов при принятии решений в сложных ситуациях неоценима. Однако существуют естественные пределы человеческих способностей при восприятии и обработке информации. Работу экспертов лимитируют не только межличностные отношения, но и внутренние психологические и физиологические причины. Оказывается, человек одновременно может оперировать лишь небольшим числом операндов (понятий, идей, моделей, альтернатив и т.д.). Психологи, говоря о пределе возможностей человека, иногда называют это законом «семь плюс-минус два». Кроме того, столкнувшись с очень сложной задачей, эксперт иногда проявляет непостоянство, неуверенность, нелогичность, стремление к резкому ее упрощению. Наконец, в ряде случаев играет роль и низкое быстродействие нервной и мышечной систем человека.
Во всех этих отношениях возможности ЭВМ превосходят способности человека, и возникает простая, но очень плодотворная идея создания единой системы, которая объединила бы возможности человека и машины и компенсировала их недостатки
6.3 Методы типа мозговой атаки или коллективной генерации идей
Концепция «мозговой атаки» получила широкое распространение с начала 50-х годов как метод систематической тренировки творческого мышления, нацеленный на открытке новых идей и достижение согласия группы людей на основе интуитивного мышления. Методы этого типа известны также под названиями «мозговой штурм», «конференция идей», а в последнее время наибольшее распространение получил термин «коллективная генерация идей» (КГИ).
Обычно при проведении мозговой атаки или сессий КГИ стараются выполнять определенные правила, суть которых:
обеспечить как можно большую свободу мышления участников КГИ и высказывания ими новых идей;
приветствуются любые идеи, если вначале они кажутся сомнительными или абсурдными (обсуждение и оценка идей производится позднее);
не допускается критика, не объявляется ложной и не прекращается обсуждение ни одной идеи;
желательно высказывать как можно больше идей, особенно нетривиальных.
В зависимости от принятых правил и жесткости их выполнения различают прямую мозговую атаку, метод обмена мнениями и другие виды коллективного обсуждения идей и вариантов принятия решений. В последнее время при организации сессий КГИ стараются ввести правила, помогающие сформировать некоторую систему идей, т. е. предлагается, например, считать наиболее ценными те из них, которые связаны с ранее высказанными и представляют собой их развитие и обобщение. Участникам КГИ не разрешается зачитывать списки предложений, которые они подготовили заранее. В то же время, чтобы предварительно нацелить внимание участника на обсуждаемый вопрос, при организации сессий КГИ заранее или перед началом сессии участникам представляется некоторая предварительная информация об обсуждаемой проблеме в письменной или устной форме.
Подобием сессий КГИ можно считать разного рода совещания - конструктораты, заседания научных советов по проблемам, заседания специально создаваемых временных комиссий и другие собрания компетентных специалистов.
Так как на практике организационно трудно собрать специалистов из-за занятости по основной работе, поэтому желательно применять способы привлечения компетентных специалистов, не требующие обязательного их присутствия на общих собраниях КГИ и устного высказывания своих соображений хотя бы на первом этапе системного анализа, при формировании предварительных вариантов.
6.4 Методы типа сценариев
Методы подготовки и согласования представлений о проблеме или анализируемом объекте, изложенные в письменном виде, получили название сценария. Первоначально этот метод предполагал подготовку текста, содержащего логическую последовательность событий или возможные варианты решения проблемы, развернутые во времени. Однако позднее обязательное требование явно выраженных временных координат было снято, и сценарием стали называть любой документ, содержащий анализ рассматриваемой проблемы или предложения по ее решению, по развитию системы независимо от того, в какой форме он представлен. Как правило, предложения для подготовки подобных документов пишутся вначале индивидуально, а затем формируется согласованный текст.
Сценарий предусматривает не только содержательные рассуждения, которые помогают не упустить детали, обычно не учитываемые при формальном представлении системы (в этом собственно и заключалась первоначально основная роль сценария), но и содержит, как правило, результаты количественного технико-экономического или статистического анализа с предварительными выводами, которые можно получить на их основе. Группа экспертов, подготавливающих сценарии, пользуется обычно правом получения необходимых справок от предприятий и организаций, необходимых консультаций соответствующих специалистов. В последнее время понятие сценариев все больше расширяется как в направлениях областей применения, так и форм представления и методов их разработки: в сценарий не только вводятся количественные параметры и устанавливаются их взаимосвязи, но и предлагаются методики составления сценариев с использованием ЭВМ, методики целевого управления подготовкой сценария.
На практике по типу сценариев разрабатывались прогнозы в некоторых отраслях промышленности. В настоящее время разновидностью сценариев можно считать предложения к комплексным программам развития отраслей народного хозяйства, подготавливаемые организациями или специальными комиссиями. Существенную помощь в подготовке таких документов могут оказать ведущим специалистам (как правило, крайне занятым административной работой) специалисты по системному анализу, которые могут, опираясь на знание общих закономерностей развития систем, предварительно анализировать внешние и внутренние факторы, влияющие на развитие, определить источники этих факторов, целенаправленно проанализировать высказывания ведущих, специалистов в научных публикациях, периодической печати и других источниках научной информации. Весьма перспективной представляется разработка специализированных информационно-поисковых систем, как документальных, так и фактографического типа, накапливающих прогнозную информацию не только непосредственно по данной отрасли, но и по смежным отраслям, развитие которых может повлиять на развитие данной отрасли, на принятие решений по выбору наилучшего варианта.
Сценарий является предварительной информацией, на основе которой проводится дальнейшая работа по прогнозированию развития отрасли или по разработке вариантов проекта. Он может быть подвергнут анализу, чтобы исключить из дальнейшего рассмотрения то, что в учитываемом периоде находится на достаточном уровне развития, если речь идет о прогнозе, или, напротив, то; что не может быть обеспечено в планируемом периоде, если речь идет о проекте. Таким образом, сценарий помогает составить представление о проблеме, а затем приступить к более формализованному представлению системы в виде графиков» таблиц для проведения экспертного опроса и других методов системного анализа.
6.5 Методы типа «Делфи»
Характерный для середины XX в. бурный рост науки и техники вызвал большие перемены в отношении к оценкам будущего развития систем. Одним из результатов этого периода в развитии методов анализа сложных систем явилась разработка методов экспертной оценки, известных в литературе как «методы Дельфи». Название этих методов связано с древнегреческим городом Дельфи, где при храме Аполлона с IX в. до н. э. до IV в. н. э. по преданиям существовал Дельфийский оракул.
Суть метода Дельфи заключается в следующем. В отличие от традиционного подхода к достижению согласованности мнений экспертов путем открытой дискуссии метод Дельфи предполагает полный отказ от коллективных обсуждений. Это делается для того, чтобы уменьшить влияние таких психологических факторов, как присоединение к мнению наиболее авторитетного сцепиалиста, нежелание отказаться от публично выраженного мнения, следование за мнением большинства. В методе Дельфи прямые дебаты заменены тщательно разработанной программой последовательных индивидуальных опросов, проводимых обычно в форме анкетирования. Ответы экспертов обобщаются и вместе с новой дополнительной информацией поступают в распоряжение экспертов, после чего они уточняют свои первоначальные ответы. Такая процедура повторяется несколько раз до достижения приемлемой сходимости совокупности высказанных мнений. Результаты эксперимента показали приемлемую сходимость оценок экспертов после пяти туров опроса.
Метод Дельфи первоначально был предложен О. Хелмером как итеративная процедура при проведении мозговой атаки, которая должна помочь снизить влияние психологических факторов при проведении повторных заседаний и повысить объективность результатов. Однако почти, одновременно Дельфи-процедуры стали основным средством повышения объективности экспертных опросов с использованием количественных оценок при оценке деревьев цели и при разработке сценариев.
Основные средства повышения объективности результатов при применении Дельфи-метода: использование обратной связи, ознакомление экспертов с результатами предшествующего тура опроса и учет этих результатов при оценке значимости мнений экспертов. Процедура Дельфи-метода:
1) в упрощенном виде организуется последовательность циклов мозговой атаки;
2) в более сложном виде разрабатывается программа последовательных индивидуальных опросов обычно с помощью вопросников» исключая контакты между экспертами, но предусматривающая ознакомление их с мнениями друг друга между турами; вопросники от тура к туру могут уточняться;
3) в наиболее развитых методиках экспертам присваиваются весовые коэффициенты значимости их мнений, вычисляемые на основе предшествующих опросов» уточняемые от тура к туру и учитываемые при получении обобщенных результатов оценок.
Для повышения результативности опросов и активизации экспертов иногда сочетают процедуру Дельфи с элементами деловой операционной игры: эксперту предлагается не только проводить самооценку, но поставить себя на место конструктора, которому реально поручено выполнить проект или, по крайней мере, иметь в виду, что его оценка рассматривается одновременно и как некоторое обязательство взяться за реальное осуществление проекта.
Первое практическое применение метода Дельфи к решению некоторых задач Министерства обороны США, осуществленное RAND Corporacion во второй половине 40-х годов, показало его эффективность и целесообразность распространения на широкий класс задач, связанных с оценкой будущих событий. Так, в 1964 г.было проведено исследование возможностей долгосрочного прогнозирования методом Дельфи той же RAND Corporacion. В экспертной оценки приняли участие 82 специалиста, которые были разделены на шесть групп в соответствии с характером исследуемых проблем: научные открытия, рост народонаселения, автоматизация производства, освоение космоса, предотвращение войны, военная техника. Результаты статистической обработки мнений экспертов позволили нарисовать вероятную картину будущего мира в указанных шести аспектах. Была оценена также степень согласованности мнений экспертов, которая оказалась приемлемой после проведения четырех туров опроса.
Недостатки метода Дельфи:
значительный расход времени на проведение экспертизы, связанный с большим количеством последовательных повторений оценок;
необходимость неоднократного пересмотра экспертом своих ответов вызывает у него отрицательную реакцию, что сказывается на результатах экспертизы.
Достоинством метода Делфи является использование обратной связи в ходе опроса, что значительно повышает объективность экспертных оценок. Однако данный метод требует значительного времени на реализацию всей многоэтапной процедуры
Метод Делфи показал на практике высокую эффективность.
В 60-е годы область практического применения метода Дельфи значительно расширилась, однако присущие ему ограничения привели к возникновению других методов, использующих экспертные оценки. Среди этих методов особого внимания заслуживают методы QUEST, SEER, PATTERN.
Метод QUEST(Qualitative Utility Estimates for Science and Technology,что означает «количественные оценки полезности науки и техники») был разработан для целей повышения эффективности решений по распределению ресурсов, выделяемых на исследования и разработки. В основу метода положена идея распределения ресурсов на основе учета возможного вклада (определяемого методом экспертной оценки) различных отраслей и научных направлений в решение определенного круга задач. Особенностями применения метода QUEST являются: привлечение широкого круга высококвалифицированных специалистов в различных областях науки и техники, а также представление экспертам разнообразной достоверной и релевантной информации.
Метод SEER (System for Event Evaluation and Review) - система оценок и обзора событий. В этом методе предусмотрено всего два тура оценки. В каждом туре привлекается различный состав экспертов. Эксперты первого тура - наиболее квалифицированные специалисты из органов, принимающих решения, и специалисты в области естественных и технических наук. Эксперт каждого тура не возвращается к рассмотрению своих ответов, за исключением тех случаев, когда его ответ выпадает из некоторого интервала, в котором находится большинство оценок (например, интервала, в котором находится 90% всех оценок).
6.6 Методы типа дерева целей
Идея метода дерева целей впервые была предложена Черчменом в связи с проблемами принятия решений в промышленности. Термин «дерево цепей» подразумевает использование иерархической структуры, полученной путем разделения общей цели на подцели, а их, в свою очередь, на более детальные составляющие - новые подцели, функции и т. д. Как правило, этот термин используется для структур, имеющих отношение строгого древесного порядка, но метод дерева целей используется иногда и применительно к «слабым» иерархиям, в которых одна и та же вершина нижележащего уровня может быть одновременно подчинена двум или нескольким вершинам вышележащего уровня.
Древовидные иерархические структуры используются и при исследовании и совершенствовании организационных структур. Не всегда разрабатываемое даже для анализа целей дерево может быть представлено в терминах целей. Иногда, например, при анализе целей научных исследований удобнее говорить о дереве направлений прогнозирования. В. М. Глушковым, например, был предложен и в настоящее время широко используется термин «прогнозный граф». При использовании этого понятия появляется возможность более точно определить понятие дерева как связного ориентированного графа, не содержащего петель, каждая пара вершин которого соединяется единственной цепью.
Разновидностью методов дерева целей и Дельфи является метод PATTERN (Planni Assistance Through Technical Evaluation of Relevance Numbers, что означает «помощь планированию посредством относительных показателей технической оценки»). Метод РАТГЕRN был разработан для повышения эффективности процессов принятия решений в области долгосрочной научно-технической ориентации крупной промышленной фирмы.
Сущность метода РАТТЕRN заключается в следующем. Исходя из сформулированных (на основе всестороннего анализа перспектив социально-экономического и научно-технического развития) целей потребителей продукции фирмы на прогнозируемый период осуществляется развертывание дерева целей. Для каждого уровня дерева целей вводится ряд критериев. С помощью экспертной оценки определяются веса критериев и коэффициенты значимости, характеризующие важность вклада целей в обеспечение критериев. Значимость некоторой цели определяется коэффициентом связи, представляющим сумму произведений весов критериев на соответствующие коэффициенты значимости.
Общий коэффициент связи некоторой цели (с точки зрения достижения цели высшего уровня) определяется путем перемножения соответствующих коэффициентов связи в направлении вершины дерева.
6.7 Морфологические методы
Основная идея морфологических методов - систематически находить все «мыслимые» варианты решения проблемы или реализации системы путем комбинирования выделенных элементов или их признаков. Идеи морфологического образа мышления восходят к Аристотелю, Платону, к известной средневековой модели механизации мышления Р. Луллия. В систематизированном виде морфологический подход был разработан и применен впервые швейцарским астрономом Ф. Цвикки и долгое время был известен как метод Цвикки.
Цвикки предложил три метода морфологического исследования. Первый метод - метод систематического покрытия водя (МСПП), основанный на выделении так называемых опорных пунктов знания в любой исследуемой области и использовании для заполнения поля некоторых сформулированных принципов мышления. Второй -- метод отрицания и конструирования (МОК), базирующийся, на идее Цвикки, заключающейся в том, что на пути конструктивного прогресса стоят догмы и компромиссные ограничения, которые есть смысл отрицать, и, следовательно, сформулировав некоторые предложения, полезно заменить их затем на противоположные и использовать при проведении анализа. Третий - метод морфологического ящика (ММЯ), нашедший наиболее широкое распространение. Идея ММЯ состоит в определении всех «мыслимых» параметров, от которых может зависеть решение проблемы, и представлении их в виде матриц-строк, а затем в определении в этом морфологическом матрице-ящике всех возможных сочетаний параметров по одному из каждой строки. Полученные таким образом варианты могут затем подвергаться оценке и анализу с целью выбора наилучшего. Морфологический ящик может быть не только двумерным. Например, А. Холл использовал для исследования структуры систем трехмерный ящик.
Морфологические ящики Цвикки нашли широкое применение для анализа и разработки прогноза в технике. Для организационных же систем, систем управления такой ящик, который, по-видимому, был бы многомерным, практически невозможно построить. Поэтому, используя идею морфологического подхода для моделирования организационных систем, разрабатывают языки моделирования или языки проектирования, которые применяют для порождения возможных ситуаций в системе, возможных вариантов решения и часто - как вспомогательное средство формирования нижних уровней иерархической структуры как при моделировании структуры целей, так и при моделировании организационных структур. Примерами таких языков служат: системно-структурные языки (язык функций и видов структуры, номинально-структурный язык), язык ситуационного управления, языки структурно-лингвистического моделирования.
Литература:
1. Ильина Н.В., Лапшин Д.Д., Федянин В.И. Системный анализ и моделирование процессов в техносфере: Учеб. пособие. Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. 206 с.
2. Попов Г.В. Выбор решений и безопасность: Учеб. пособие / Иван. гос. энерг. ун-т. - Иваново. 2003. - 92 с.
Лекция 7. Теория управления
7.1 Основные положения теории управления
В теории управления принято считать, что системы с управлением создаются для достижения конкретных целей, которые определяются в рамках других наук, занимающихся исследованием конкретных систем. В зависимости от природы (люди или технические устройства) принято выделять три типа систем с управлением:
организационные (социальные) системы управления;
технические системы управления;
организационно-технические (комплексные) системы управления.
Рассмотрим основные положения по управлению в организационно-технических системах, опираясь на базовые понятия.
Общая структурная схема системы с управлением может быть представлена в виде, показанном на рис. 1.
Здесь S l - объект управления, S 2 - управляющая система, N - информация о состоянии внешней среды (внешние воздействия на объект управления), N' - информация о состоянии внешней среды, имеющаяся в управляющей системе, X - командная информация, Y - информация о состоянии объекта управления, Y' - информация о состоянии объекта управления, имеющаяся в управляющей системе.
Рис. 1. Общая структурная схема системы с управлением
Управляющая система реализует задачи целеполагания, стабилизации, выполнения программы, слежения или оптимизации и тем самым обеспечивает либо удержание выходных характеристик системы при изменениях внешней среды в требуемых пределах, либо выполнение системой действий по изменению значений ее характеристик или характеристик внешней среды.
Объект управления является исполнительным инструментом, реализующим основную функцию системы.
Система связи, являясь частью системы управления, обеспечивает обмен управляющей информацией между управляющей системой и объектом управления.
Задачами теории управления при таком рассмотрении являются:
? синтез структуры и параметров объекта управления, соответствующих цели (закону функционирования) создаваемой системы с управлением;
? синтез структуры и параметров управляющей системы, т.е. построение структуры управления с учетом ограничений по затратам различного вида (численность управленческого персонала и др.); определение мест размещения центров обработки информации; определение массивов информации, подлежащих передаче, хранению и обработке;
? синтез структуры и параметров системы связи.
Единых методов решения перечисленных задач для всех типов систем на настоящее время не существует. Однако для всех типов систем с управлением признается существование ряда аксиом и принципов управления, знание которых позволяет квалифицированно решать задачи управления.
7.2 Аксиомы теории управления
Для управления необходимо выполнение ряда естественных условий, которые сформулируем в виде аксиом.
Аксиома 1. Наличие наблюдаемости, объекта управления. В теории управления ОУ считается наблюдаемым в состоянии z(t) на множестве моментов времени Т, при входном воздействии x(t) и отсутствии возмущений, если уравнение наблюдения динамической системы, представленное в виде
где y*(t) - некоторая реализация выходного процесса, доступная для регистрации, имеет единственное решение
Если это утверждение справедливо для любого , то объект считается полностью наблюдаемым.
Это выражение означает, что определение любого из состояний ОУ (т.е. его наблюдаемость) реализуется только в том случае, если по результатам измерения выходных переменных y*(t) при известных значениях входных переменных x(t) может быть получена оценка z*(/) любой из переменных состояния z(t).
Такая задача в теории систем известна как задача наблюдения. В организационно-технических системах управления эта задача реализуется функцией контроля текущего состояния ОУ и воздействий внешней среды. Без этой информации управление или невозможно, или неэффективно.
Аксиома 2. Наличие управляемости - способности ОУ переходить в пространстве состояний Z из текущего состояния в требуемое под воздействиями управляющей системы. Под этим можно понимать перемещение в физическом пространстве, изменение скорости и направления движения в пространстве состояний, изменение структуры или свойств ОУ. Если состояние ОУ не меняется, то понятие управления теряет смысл.
Аксиома 3. Наличие цели управления. Под целью управления понимают набор значений количественных или качественных характеристик, определяющих требуемое состояние ОУ.
Если цель неизвестна, управление не имеет смысла, а изменение состояний превращается в бесцельное блуждание. Цель отображается точкой, в которую надо перевести систему из существующего состояния или траекторией перевода ОУ в требуемое состояние в виде, например, аддитивной свертки
с ограничениями типа
,
где - i-я характеристика;
- важность (вес) i-й характеристики;
- расход ресурсов на поддержание i-й характеристики в требуемом состоянии;
с - общее количество ресурсов
Аксиома 4. Свобода выбора - возможность выбора управляющих воздействий (решений) из некоторого множества допустимых альтернатив. Чем меньше это множество, тем менее эффективно управление, так как в условиях ограничений оптимальные решения часто остаются за пределами области адекватности. Если имеется единственная альтернатива, то управление не требуется. Если решения не влияют на изменение состояния ОУ, то управления не существует.
Аксиома 5. Наличие критерия эффективности управления. Обобщенным критерием эффективности управления считается степень достижения цели функционирования системы.
Кроме степени достижения цели качество управления можно оценивать по частным критериям: степени соответствия управляющих воздействий требуемым состояниям ОУ, качеству принимаемых решений, точности управления. Для оценки систем управления военного назначения вводятся требования к управлению по показателям устойчивости, непрерывности (длительности цикла управления), оперативности и скрытности.
Аксиома 6. Наличие ресурсов (материальных, финансовых, трудовых и т.д.), обеспечивающих реализацию принятых решений. Отсутствие ресурсов равносильно отсутствию свободы выбора. Управление без ресурсов невозможно
7.3 Модели основных функций организационно-технического управления
Управление заключается в преобразовании информации о состоянии объекта управления в командную информацию. Информация как любой объект обладает:
содержанием;
формой;
пространственным расположением;
временным расположением.
При таком рассмотрении управление может заключаться в преобразовании содержания (смысла) информации о состоянии объекта управления, в результате которого получают новую информацию; преобразовании формы, пространственного или временного расположения информации.
Проведем классификацию составных частей процесса управления с учетом того, что существует два принципа классификации: принцип разбиения и принцип покрытия.
Принцип разбиения состоит в том, что все исследуемое множество М разбивается на непересекающиеся подмножества Мх ,М2, ... , Мп, называемые классами эквивалентности, так, что
и .
Принцип покрытия заключается в таком задании подмножеств ,что имеется хотя бы одна пара множеств и , в которой
, но
Подмножества Мi в этом случае называются классами толерантности.
Классифицировать функции управления на основе принципа разбиения нецелесообразно, так как они связаны между собой и выполнение одной из них почти всегда ведет к одновременному выполнению других.
Поэтому, используя принцип покрытия, будем рассматривать процесс управления с учетом того, что он содержит множество функций преобразования информации, включающее три известных подмножества функций:
- подмножество функций, связанных с обменом информацией между ЛПР (передача сигналов оповещения, текстовой и графической информации, телефонные переговоры), и функция обмена данными;
- подмножество рутинных функций управления (учет, хранение, поиск, отображение, обновление, редактирование, тиражирование текста и графики, разграничение доступа к информации)
- подмножество функций преобразования содержания и формы представления информации (расчеты, решение логических задач для анализа состояния ОУ, при подготовке предложений для принятия решений, при разработке планирующих и распорядительных документов).
При этом процесс управления включает в себя функции всех подмножеств, но основным является подмножество {fc}, так как преобразования содержания обеспечивают порождение новой информации - решений по управлению.
7.4 Описание функций управления
Управление в организационно-технических системах можно представить как последовательность функций, составляющих технологический цикл управления.
Под функцией управления понимают устойчивую упорядоченную совокупность операций, основанную на разделении труда в управляющей системе.
Основоположником функционального подхода в управлении считается А. Файоль. Он выделил пять функций управления: предвидение, организация, распорядительская деятельность, координация (согласование) и контроль. Одновременно А. Файоль разделил все функции на шесть групп: производство, финансы, охрана, учет, администрирование, техника безопасности. В настоящее время к основным функциям управления относят:
? сбор данных;
? формирование сообщения;
? передачу данных по каналам связи;
? учет;
? контроль;
? анализ;
? прогнозирование;
? планирование;
? оперативное управление;
? организацию и координацию;
? доведение решений.
Для учета человеческого фактора в отдельную группу выделяют функции стимулирование и мотивация.
Рассмотрим определения и взаимосвязь основных функций в форме функциональной модели цикла управления (рис. 2).
Рис. 2 Функциональная модель цикла управления
Сбор данных - функция измерения характеристик у(, выполняемая в объекте управления вручную или автоматически. Модели процессов измерения изучаются в метрологии.
Формирование сообщения (запроса) - преобразование информации к виду, пригодному для передачи по каналам связи в управляющую систему и/или обработки в автоматизированном режиме. Модели функций формирования сообщений рассматриваются в теории информации, теории баз данных.
Передача данных по каналам связи - осуществляется разными способами, в том числе с использованием средств автоматизации. Главными требованиями к передаче данных являются: своевременность, достоверность и безопасность обмена информацией. Модели функций передачи данных рассматриваются в теории информации.
Учет - система функций, обеспечивающих хранение информации. Включает ввод-вывод, регистрацию, преобразование формы, поиск, отображение, тиражирование, классификацию, статистическую обработку, выборку, получение агрегированных данных, обеспечение конфиденциальности и целостности информации. Модели функций учета изучаются в теории баз данных.
Контроль - система функций, обеспечивающих определение состояния ОУ (измерение, сбор, уточнение данных об объекте управления) и оценку степени отклонения текущего состояния от требуемого по заданным критериям эффективности (оценку соответствия состояния системы требуемому).
С английского языка control переводится как управление и часто термин «контроль» используется вместо термина «управление». Это объясняется тем, что все функции управления включают элементы контроля. Мы будем выделять эту функцию, так как для ее автоматизации требуется формальная постановка задач наблюдения, классификации и идентификации состояния ОУ.
В зависимости от объекта контроля в эту функцию включают, например, измерение и оценку достоверности, точности, объема, своевременности представления данных, прохождения и исполнения документов; решение задач информационной безопасности.
Различают три вида контроля: предварительный, текущий и заключительный.
Предварительный, контроль проводится до начала цикла управления для оценки ресурсов ОУ и внешних воздействий.
Текущий, или оперативный, контроль осуществляется на продолжении всего цикла управления в целях обнаружения отклонений от требуемого состояния.
Заключительный контроль предназначен для оценки степени достижения цели в конце цикла управления.
Функция анализа в общем случае зависит от его цели. Мы будем понимать под этой функцией средство, обеспечивающее объяснение причин отклонений состояния системы от требуемого и обоснование решения на переход к оперативному управлению или планированию. Например, пусть объект управления характеризуется параметром , который изменяется в пределах . Если в результате анализа выяснено, что , где - допустимое отклонение, то в цикле управления осуществляется переход к оперативному управлению. Если , то осуществляется переход к функции планирования. Анализ часто в отдельную функцию не выделяется, а рассматривается совместно с контролем как составная часть других функций управления.
Функция прогнозирования - это средство снятия неопределенности относительно возможной структуры, свойств или закона функционирования системы в будущем. Типичными целями прогнозирования могут служить:
? замедление процесса «старения» принимаемых решений и предупреждение неблагоприятных ситуаций, в которых может оказаться организационно-техническая система. Решение по управлению, основанное на правильном прогнозе, не потребуется изменять в ближайшем будущем, т.е. один вопрос не потребуется решать дважды;
? повышение производительности системы с управлением, адаптация к изменяющимся условиям (предсказание ветвлений в суперскалярных микропроцессорах ЭВМ, предсказание будущих значений сигнала в системах связи).
Во всех случаях прогноз - это научно обоснованное суждение о возможных состояниях системы в будущем и/или об альтернативных путях и сроках достижения целевого состояния.
Прогноз позволяет получить совокупность возможных вариантов развития системы. Однако реализованные варианты зависят не от прогноза, а всегда определяются конкретными решениями, принимаемыми в системе управления, и имеющимися ресурсами. Так, оптимистический прогноз может не состояться, если ЛПР не предпринимает мер по его реализации. В свою очередь, правильные решения могут смягчить последствия пессимистического прогноза.
Прогнозы могут быть разделены на группы по периодам упреждения и по методам прогнозирования.
По периодам упреждения - промежутку времени, на который рассчитан прогноз, различают оперативные (текущие), кратко-, средне- и долгосрочные прогнозы. Оперативный прогноз, как правило, рассчитан на период времени, в течение которого объект управления существенно не изменяется, краткосрочный - на перспективу количественных изменений. Среднесрочный прогноз охватывает период времени, когда количественные изменения преобладают над качественными, долгосрочный - перспективу качественных изменений системы.
Функция планирования состоит в последовательном снятии неопределенности относительно требуемой структуры, свойств, закона функционирования системы или внешней среды. Включает задачу принятия решений по целеполаганию (ЗПРЦ) и задачу принятия решения по действиям (ЗПРД) - совокупность процедур по определению требуемого (целевого, оптимального) состояния системы и действий по достижению этого состояния, объединенных в единый процесс. Осуществляется при изменении условий функционирования ОУ: целей планирования, воздействий внешней среды, препятствующих оперативному управлению, и др.
В терминологии менеджмента ЗПРЦ называют стратегическим или перспективным планированием, а ЗПРД - тактическим или текущим планированием. На стадии стратегического планирования рассматривается необходимость и возможность изменения структуры, свойств или закона функционирования системы.
Тактическое планирование заключается в принятии решения по выбору траектории перевода системы в новое состояние. При этом определяются действия ОУ, порядок использования ресурсов, решается задача оптимизации с учетом предполагаемых воздействий внешней среды. Детально прорабатываются средства и способы достижения целей, использования ресурсов, необходимые процедуры и технология. Характеристики системы считаются заданными и учитываются как ограничения. Точную границу между стратегическим и тактическим планированием провести трудно. Обычно стратегическое планирование охватывает в несколько раз больший промежуток времени, чем тактическое; оно имеет гораздо более отдаленные последствия, шире влияет на функционирование управляемой системы в целом и использует более мощные ресурсы. Оперативное управление обеспечивает функционирование системы в рамках действующего плана. Заключается в решении задач стабилизации, слежения или выполнения программы управления. Иногда в эту функцию включают задачу оптимизации. Планирование и оперативное управление являются задачами содержательной обработки информации.
Математические модели функций содержательной обработки информации разрабатываются с использованием теории принятия решений. Решения, принятые при планировании или оперативном управлении, учитываются в блоке учета и доводятся до объекта управления. После этого начинается новый цикл управления, в котором текущее состояние объекта управления сравнивается с требуемым, и в зависимости от величины отклонений управляемых характеристик ,. от допустимых отклонений yiuon осуществляется переход к оперативному управлению или планированию.
Функция организации заключается в установлении постоянных и временных связей между всеми элементами системы, в определении порядка и условий их функционирования, в объединении компонентов и ресурсов системы таким образом, чтобы обеспечить эффективное достижение намеченных целей.
Функция организации выполняет:
? группировку функциональных элементов и ресурсов в организационные структуры;
? распределение степени ответственности ЛПР в иерархии подсистем управления.
Функция координации - это согласование действий подсистем в соответствии с целями системы с управлением и поддержание этого согласования на протяжении цикла управления. Наличие нескольких ОУ и подсистем управления приводит к противоречию между их частными целями. Это, в свою очередь, приводит к разобщенности действий. Устранение этих противоречий - основная задача координации. Функцию координации иногда рассматривают совместно с организацией в рамках задач оперативного управления или планирования.
Модели координации и организации разрабатываются в общей теории систем, в теории принятия решений, на основе теории расписаний, в частности, с использованием методов сетевого планирования и управления.
Литература:
1. Ильина Н.В., Лапшин Д.Д., Федянин В.И. Системный анализ и моделирование процессов в техносфере: Учеб. пособие. Ч. 2. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008.
Лекция 8. Понятие и классификация моделей
8.1 Понятие модели, моделирования
Первоначальное определение модели - некоторое вспомогательное средство, который в определенной ситуации заменяет другой объект. Вначале понятие «модель» относилось только к материальным объектам, как, например, манекен (модель человеческой фигуры, чучело (модель животного), модели автомобилей, самолетов и т.п. Возможны и другие, более точные определения, например: «модель» - это некий объект - заместитель, который в определенной степени заменяет объект - оригинал, воспроизводя интересующие нас свойства и характеристики оригинала, причем по сравнению с оригиналом модель имеет существенные преимущества для определенного вида работы с ней, а именно: наглядность, доступность испытаний и т.п.
Модель - это не абсолютная копия оригинала, она предполагает уже некоторую степень абстрагирования. Чертежи, рисунки, карты - это тоже модели, но они соответствуют более высокой степени абстрагирования от оригинала, поэтому их модельные свойства были осознаны намного позже.
В настоящее время понятие модели расширилось, оно включает и реальные и, так называемые «идеальные» модели, например, математические модели. Свойствами модели обладают такие формы научных представлений о мире как законы, гипотезы, теории.
Модели не только качественно различны, они иерархичны, т.е. могут быть модели более высокого уровня и менее высокого, как, например, в случае моделей научного знания (рис. 1).
Рис. 1. Модели научного знания
Выше было сказано, что моделирование есть неотъемлемое свойство человеческой деятельности. Можно уточнить, что это - неотъемлемый этап всякой целенаправленной деятельности.
Любая деятельность человека имеет целевой характер, а цель - не что иное, как образ ожидаемого будущего, т.е. Модель состояния, на реализацию которого направлена деятельность.
Далее: деятельность системна, т.е. она осуществляется не хаотично, а по определенному плану, или алгоритму. Следовательно, алгоритм тоже можно рассматривать как модель будущей деятельности.
Из этих рассуждений следует, что модель является не просто образом - заменителем оригинала, а целевым отображением. (Пример - роль бревна на тур. Стоянке). Т.е. модель отображает не сам по себе объект-оригинал, а то, что в нем нас интересует, т.е. то, что соответствует поставленной цели.
Поскольку модель - целевое отображение, один и тот же объект может иметь множество моделей в зависимости от целей.
8.2 Познавательные и прагматические модели
Вся деятельность человека связана с получением, переработкой и использованием информации. Модели объектов, модели деятельности целесообразно, таким образом, разделить по направленности основных информационных потоков, циркулирующих между субъектом и окружающим миром.
Познавательная модель - это форма организации и представления знаний, средство соединения новых знаний с уже имеющимися (рис. 2).
Рис. 2. Познавательная и прагматическая модели
При установлении расхождения между моделью и реальностью это рассуждение устраняется путем изменения модели (модель «подгоняется» под реальность, см. рис. 3а).
Прагматическая модель это средство управления, средство организации практических действий, способ представления образцово правильных действий или их результата.
По сути, прагматическая модель есть рабочее представление целей. Поэтому при обнаружении расхождений между моделью и реальностью прагматическая модель используется для изменения реальности, т.е. здесь реальность «подгоняется» под модель, см. рис.3б (пример: социально-политические доктрины преобразование мира, школьная педагогика изменение характеров, воздействие на личность, руководитель - коллектив).
Рис. 3. Модель и реальность
Прагматические модели являются как бы стандартом, образцом, носят нормативный характер. Под эти образцы «подгоняются» как сама деятельность, так и ее результат. Примеры: ССБТ, СНиПы, кодексы законов, уставы организаций, планы и программы действий, рабочие чертежи, шаблоны, технические допуски, экзаменационные требования и др.
Таким образом основное различие между познавательными и прагматическими моделями следующее:
Познавательные модели отражают существующее, а прагматические не существующее, но желаемое и (возможно) осуществимое. Не все модели легко классифицировать по этому признаку (например, произведения искусства, игрушки, географические карты). К тому же прагматические модели также претерпевают изменения как и познавательные.
Существуют и другие принципы классификации модели.
8.3 Статические и динамические модели
Вне зависимости от принципов, видов классификации модели в основе всегда лежит цель.
Так для одних целей необходима модель конкретного состояния объекта, своего рода его «моментальная фотография». Такие модели называются статическими. Пример: структурные модели систем.
Если наши цели связаны не с одним состоянием, а различием между состояниями, необходимо отображение процесса изменения состояния. Такие модели называются динамическими. Например, динамическими являются функциональные модели систем. Можно привести и более простой пример: фотография, характеристика - статические модели личности и биография - динамическая модель.
8.4 Классификация моделей по способу воплощения
По способу воплощения (т.е. в зависимости от того, на чем построена модель) модели делятся на:
1) идеальные и абстрактные;
2) материальные (реальные, вещественные).
Абстрактные модели. К ним относятся: модели, создаваемые средствами языка. Человеческий язык (естественный, плановый) является универсальным средством построения любых абстрактных моделей, что обеспечивается такими свойствами языка как:
возможность введения новых слов;
возможность иерархического построения языковых моделей (слово - предложение - текст - понятия - отношения - определения - конструкции…);
неоднозначность, расплывчатость, размытость.
Последнее свойство иногда используется сознательно (дипломатия, юмор, поэзия), иногда служит препятствием («мысль изреченная есть ложь…). В зависимости от целей приблизительность естественного языка преодолевается («профессиональный» язык).
2) дальнейшая дифференциация наук привела к созданию специализированных языков вплоть до моделей, имеющих максимально достижимую определенность и точность для сегодняшнего состояния данной отрасли знаний.
3) математические модели. Модели, обладающие абсолютной точностью. К.Маркс и И.Кант говорили о том, что любая отрасль знания может тем с большим основанием называется наукой, чем в большей степени в ней используется математика. Однако, чтобы зайти до использования математической модели в какой-либо области необходимо получить достаточное для этого количество знаний. Отсутствие развитого математического аппарата в какой-либо науке само по себе не означает ее «научности», а есть следствие сложности, недостаточной познанности ее предмета, т.е. временное явление.
Материальные модели
Материальная модель есть реальное, вещественное отображение объекта. Чтобы математическая модель выполняла свою функцию, т.е. замещала в каком-то отношении оригинал, она должна иметь определенное подобие по отношению к оригиналу.
Существуют различные виды подобия.
Прямое подобие - подобие, устанавливаемое в результате физического взаимодействия или последовательности взаимодействий (фотографии, модели самолетов и т.п., макеты зданий, куклы, протезы, шаблоны и т.п.). Однако никакая прямая модель не может быть абсолютной копией оригинала. Существуют проблемы переноса результатов моделирования результатов модельных экспериментов на оригинал (натурный образец). Яркий пример - гидродинамика. Отсюда возникла разветвленная, содержательная теория подобия.
Косвенное подобие. Косвенное подобие не устанавливается человеком, а объективно существует в природе, обнаруживается в виде совпадения или достаточной близости абстрактных моделей и в дальнейшем используется при моделировании.
Например, электромеханическая аналогия (одинаковые уравнения для электрических и механических процессов), шаг как аналог времени, подопытные животные - аналог человеческого организма и т.п.).
Условно подобные модели: подобие этих моделей оригиналу устанавливается в результате соглашения. Пример: деньги (модель стоимости), удостоверение личности (модель владельца), карты (модели местности), сигналы (модели сообщений и т.д.).
Условные подобные модели являются способом материального воплощения абстрактных моделей, вещественной формой, в которой абстрактные модели передаются от одного человека к другому, храниться долгое время, т.е. отчуждаются от сознания, сохраняя, тем не менее, способность возвращения в абстрактную форму. Это достигается с помощью соглашения о том, какое состояние реального объекта ставится в соответствие данному элементу абстрактной модели.
8.5 Место математического моделирования в системных исследованиях
Из рассмотренного ранее нам должно быть понятно, что системный анализ не есть какой-то конкретный метод. Это стратегия научного поиска, которая использует математические концепции, математический аппарат в рамках систематизированного научного подхода к решению сложных проблем. При этом так или иначе выделяется ряд последовательных, взаимосвязанных этапов (рис. 1). Рассмотрение вместо самой системы (т.е. явления, процесса, объекта) и модели всегда связано с упрощением. Главная проблема здесь - выделение тех особенностей, которые существенны для целей рассмотрения. К настоящему времени разработано множество удачных моделей, например, такие как:
конечноэлементная модель для решения различных прикладных задач (статика, динамика, прочность конструкций, динамика оболочек и т.п.);
генетический код;
и др.
Рис. 4. Решение проблемы
Ранее нами было выделено два основных вида моделей: материальные (макеты, физические модели, масштабированные модели и т.п.) и идеальные (вербальные, знаковые).
При построении моделей процессов в техносфере приходится прибегать как к так называемым интуитивным («ненаучным») моделям, так и к семантическим (смысловым).
Под интуитивным моделированием подразумевают моделирование, использующее представление объекта, не обоснованное с точки зрения формальной логики. Это представление может не поддаваться, или трудно поддаваться формализации или же вообще не нуждаться в ней. Такое моделирование человек осуществляет в своем сознании в форме мысленных экспериментов, сценариев и игровых ситуаций с целью подготовки к предстоящим практическим действиям. Основой для подобных моделей служит опыт - знания и умения людей, а также любое эмпирическое знание, полученное из эксперимента или процесса наблюдения без объяснения причин и механизма наблюдаемого явления.
Семантическое моделирование, в отличие от интуитивного, логически обосновано с помощью некоторого числа исходных предположений. Сами эти предположения нередко облекаются в форму гипотез. Семантическое моделирование предполагает знание внутренних механизмов явления. К методам семантического моделирования относятся вербальное (словесное) и графическое моделирование (рис. 5).
Рис. 5. Виды идеальных моделей
Семиотическое, или знаковое моделирование является, в отличие от семантического, наиболее формализованным, поскольку использует не только слова естественного языка и изображения, но и различные символы - буквы, цифры, иероглифы, нотные знаки. В последующем все они объединяются с помощью специфических правил. К этому виду моделирования относится математическое моделирование.
К знаковым моделям относятся химические и ядерные формулы, графики, схемы, графы, чертежи, топографические карты и т.п. Среди знаковых моделей выделяется их высший класс - математические модели, т.е. модели, при описании которых используется язык математики.
Математическая модель (ММ) - это описание протекания процесса, описание состояния или изменения состояния системы на языке алгоритмических действий с математическими формулами и логических переходов.
Кроме того, ММ допускает работы с таблицами, графиками, номограммами, выбор из совокупности процедур и элементов (последнее подразумевает использование операций предпочтения, частичной упорядоченности, включения, определение принадлежности и т.п.).
Различные математические правила манипулирования со связями системы позволяют делать предсказания относительно тех изменений, которые могут произойти в исследуемых системах, когда изменяются их составляющие.
Сложность формирования математической модели связана с необходимостью владения математическими методами и предметных знаний, т.е. знаний в той области, для которой создается модель. В реальности специалисту в данной практической области часто не хватает математических знаний, сведений о моделировании вообще, а для сложных задач - знания системного анализа. С другой стороны, прикладному математику трудно хорошо ориентироваться в предметной области.
Следует заметить, что деление моделей на вербальные, натурно знаковые в определенной степени условно. Так, существуют смешанные типы моделей, скажем, использующие и вербальные, и знаковые построения. Можно даже утверждать, что нет знаковой модели без сопровождающей описательной - ведь любые знаки и символы необходимо пояснять словами. Часто и отнесение модели к какому-либо типу является нетривиальным.
Общие и конкретные модели. Все типы моделей необходимо перед их применением к конкретной системе наполнить информацией, соответствующей используемым силам, макетам, общим понятиям. Наполнение информацией в большей степени свойственно знаковым моделям, в наименьшей - натурным. Так, для математической модели - это выделенные (вместо буквенных) значения физических величин коэффициентов, параметров; конкретные виды функций, определенные последовательности действий, графы структуры Наполненную информацией модель принято называть конкретной, содержательной.
Модель без наполнения информацией до уровня соответствия единичной реальной системе называется общей (теоретически абстрактной, системной).
Так, в процессе декомпозиции мы используем понятие формальной модели. Это относится ко всем типам моделей, в том числе, к математическим.
Чтобы уяснить место математической модели рассмотрим процесс формирования собственно научного знания. Принято делить науки на две группы.
а) точные - (скорее термин «точные» основан на вере, что открываемые закономерности являются абсолютно точными);
б) описательные.
Точные науки - обладают средствами предвидеть с практически достаточной точностью развитие процессов, изучаемых данной наукой на достаточно длительный (опять-таки по практическим соображениям) промежуток времени, или же предвидеть достаточно точно свойства и отношения изучаемых объектов по некоторой частичной информации о них.
Описательные науки - по сути перечень фактов об изучаемых ими объектах и процессах, иногда не связанных между собой, иногда связанных некоторыми качественными отношениями, а также порой разрозненными количественными (как правило, эмпирическими связями). К точным наукам относятся математика и науки физического цикла. Остальные науки - в большей или меньшей степени являются описательными.
Однако в Древнем Египте даже математика не могла быть в полной мере отнесена к точным наукам (так, геометрия была представлена как «сборник рецептов», например, вычислять площадь круга как ? площади описанного квадрата).
Развитие науки идет параллельными путями («руслами»). Различные русла начинаются в разное время, но раз начавшись, продолжаются.
накопление информации об объектах изучения; (научное накопление информации отличается от стихийного целеустремленностью);
процесс упорядочивания информации - классификация объектов (отличие от «наивной», «потребительской» классификации - цель: обеспечить анализ, следовательно субъективизма меньше) > находятся в постоянной взаимосвязи (процесс идентификации), т.е. каждый новый объект анализируется: принадлежит ли он к уже установленным классификационным группам, или указывает на необходимость перестройки системы классификации;
установление связей и соотношений (качественных или количественных) между объектами. Эти связи обнаруживаются в результате постоянного анализа накапливаемой и упорядоченной информации.
Эти три русла характеризуют «описательный» период развития науки, который может длиться весьма долго. Примером может служить развитие механики, геометрии.
Переход к точной науке означает попытки построения математического моделирования процессов. Но математическая модель может строиться на каких-то количественно строго определенных величинах. Отсюда - два необходимых этапа математического моделирования:
установление величины;
установление взаимосвязи.
Можно привести следующий пример: законы статики сформулировал Архимед, Аристотель ввел понятие силы, скорости, пути. Но потребовалось около 2000 лет (!) на установление связи величин. Становление механики как точной науки стало возможным, когда Ньютон понял, что силу надо связывать с ускорением, а не скоростью, как это пытались делать раньше.
Задачи математического моделирования сами имеют свою сложную структуру. Модель, описывающая широкий класс явлений (например, математическая модель механических движений - законы Ньютона) подразделяются на частные классы математических моделей: механика точки, системы материальных точек, сплошной среды, твердого тела > еще более частные модели, например, упругого тела и т.п. на самом нижнем уровне - ММ конкретных процессов.
Обычно процесс построения моделей часто осуществляется не дедуктивно, а «снизу вверх».
8.6 Типы и виды математических моделей
В рамках данного курса невозможно рассмотреть все виды математических моделей. Остановимся на некоторых из них.
Динамические модели
Динамические модели стали развиваться во многом благодаря развитию вычислительной техники, так как связаны с необходимостью решать большое число (сотни) уроавнений за котороткий промежуток времени. Эти уравнения являются более или менее сложными математическими описаниями того, как функционирует исследуемая система и даются они в форме выражений для “уровней” различных типов, “темп” изменения которых регулируется управляющими функциями. Уравнения для уровней описывают накопление в системе таких, например, величин, как вес, количество энергии, количество организмов, а уравнения для темпов управляют изменением этих уровней во времени. Управляющие функции отражают правила, регулирующие функционирование системы. В динамических моделях часто используются уравнения неразрывности - соотношения между потоками переменной в какую-то часть системы и из нее со скоростью изменения этой переменной.
Балансовые модели представляют моделируемый объект как совокупность неких потоков вещества и энергии, баланс которых рассчитывается на каждом шаге моделирования. Являются разновидностью динамических моделей. В настоящее время эти модели получили очень широкое распространение благодаря наглядности и сравнительно простой реализации. Однако применение их возможно лишь при решении, общеметодологических вопросов: баланс каких веществ является наиболее важным для рассмотрения; насколько целесообразно подробно прослеживать потоки данного вещества; как, выразить смену режимов трансформация веществ и.;т.п.
поиск равновесия. Этот подход основан на постулате о том, что любая большая система может иметь состояние равновесия. Например, в экономических системах это равновесие между спросом и предложением (по Н.Д.Кондратьеву - это равновесие «1-го порядка»), равновесие в структуре цен (равновесие 2-го порядка), равновесие основных капитальных благ» - промышленных изделий, сооружений, квалифицированной рабочей силы, технологий, источников энергии и т.д. (равновесие 3-го порядка).
В экологии может рассматриваться равновесие между определенной численностью хищников и их жертв, между загрязнением окружающей среды и ее способностью к самовосстановлению.
Поиск равновесия очень важен для исследования экономических и экологических систем. При этом следует различать динамическое и статическое равновесие.
Динамическое («подвижное») равновесие предполагает непрерывный обмен веществом и энергией между системой веществ и энергии, поглощаемых и выделяемых системой одинаковы.
При динамическом равновесии сохраняется соответствие между частями системы, все размеры которой одновременно меняются.
Статическое равновесие означает сохранение того же соответствия при неизменных размерах (величинах) частей системы и системы в целом.
Можно проиллюстрировать поиск равновесия на примере определения состояния насыщения рынка (рис. 6). Для этого было предложено уравнение
где х - количество товара, t - время, А,Р - константы.
Рис. 6. Пример
Эта функция описывается «затухающей кривой». Было показано, что она описывает ряд общественных и экономических процессов, например, насыщение рынка книгами по специальным дисциплинам и т.п., если выполняются такие условия, как
незаменимость товара,
неизменность цен;
отсутствие спекулятивных перепродаж;
приобретение каждым покупателем равного количества;
отсутствие повторных покупок товара.
Разумеется, это достаточно примитивное уравнение, которое не соответствует подвижному и динамическому равновесию. Для построения более адекватных моделей с равновесием необходимо использование обратных связей.
модели с обратной связью.
Если при составлении модели попытаться учесть внутреннюю структуру и отойти от модели «черного ящика» и поставить одни параметры («входы») в зависимость от других («выходы») получим модель с обратной связью (рис. 7).
Рис. 7. Модель с обратной связью
Если результат меньше эталона, то за счет регулирования подается сигнал, увеличивающий интенсивность входа. Если больше эталона - подается сигнал, уменьшающий интенсивность входа. Обратная связь положительна, если возрастающие результаты увеличивают интенсивность входа и отрицательна, если возрастающие результаты ослабляют интенсивность входа.
В сложных системах можно выделить несколько последовательно и параллельно связанных между собой контуров обратной связи, т.е. сложные системы являются многоконтурными.
Оптимизационные модели
Оптимизационные модели охватывают модели, математический аппарат которых позволит решать задачи оптимального управления моделируемым объектом. Они применяются при решении экономических, технических задач, проблем взаимодействия природы и общества. Их построение основано на использовании методов математического программирования (линейного, нелинейного и динамического программирования) при .исследовании систем, описанных дифференциальными уравнениями. Другим примером оптимизационных моделей являются модели, построенные с помощью теории игр. В общем случае они тоже не исключают вероятностного подхода.
4.Модели макрокинетики трансформации веществ и потоков энергии.
К этим моделям относятся модели прогнозирования зон неуправляемого распространения потоков энергии и вредных веществ, прогнозирования концентрации вредных веществ в техносфере. Подобные модели применяются также при моделировании водных экосистем, распространения загрязнителей воздушной среды. Это модели, математическим аппаратом построения которых являются уравнения диффузии. Применение этих моделей ограничено, во-первых, необходимостью при их построении делать ряд допущений в общем случае неверных в реальных ситуациях (например, допущение об отсутствии влияния примесей на скоpoсть течения воды, хотя в реальных условиях в реках, озерах движение воды сплошь и рядом вызвано именно различиями в мутности), Во-вторых, существуют и чисто математические трудности решения систем уравнений в частных производных, каковыми являются уравнения диффузии. Например, непростая проблема выбора шага моделирования (интегрирования) при существенно различных характерных временах изменения параметров системы.
Статистические модели
Статистические модели том, что исследуемый процесс случаен и исследуется статистическими методами, в частности, так называемыми методами Монте-Карло. Наиболее успешно последние применяются при неполной информации о соответствующих объектах. Существует мнение, что статистические модели эффективны именно при этих условиях. Здесь возникает вопрос, сколь подробную информацию об объекте вообще нужно учитывать в модели и в какой ситуации можно говорить о недостатке информации. При построении и использовании статистических моделей возникают следующие проблемы: во-первых, необходим обширный фактический естественный материал, позволяющий провести его корректную статистическую обработку; во-вторых, установленные зависимости; верные для одной системы не всегда будут верны для другой, Например, в экологии смена одной экосистемы другой (например, смена сукцессий) не всегда может быть передана прежней моделью.
При моделировании процессов в техносфере необходимо не только определить размер ущерба и зон поражения, но и определить вероятность определенного ущерба. Это видно из самой структуры формулы риска:
{Риск} = {вероятность события}{значимость события}.
Кроме того, и определение самого характера опасного воздействия вредного везщества или разрушительного воздействия потоков энергии связано с необходимость учета большого числа факторов и параметровю Одни из них должны отражать специфику вредного выброса, другие - состав и характеристики людских, материальных и природных ресурсов, которые определяют их стойкость по отношению к соответствующим воздействиям. При этом число таких существенных факторов велико, они имеют разную направленность и недетерминистскую природу. Здесь, таким образом, необходимо использовать накопленные к настоящему времени статистические данные.
Модели типа «хищник -- жертва» или «паразит-хозяин»
Эти модели применяются», как это видно из названия, при изучении частных случаев взаимодействия популяций нескольких видов. С помощью данных моделей, также использующих уравнения неразрывности, получен ряд интересных выводов. Однако взаимодействием двух-трех и даже более видов, которые реализуются в таких моделях, не исчерпывается динамика объектов окружающей среды, поэтому такие модели имеют прикладное значение и не являются универсальными.
При моделировании сложных систем их разбивают на подсистемы и потому их математическая модель предстает как некий комплекс подмоделей; для каждой из них может быть использован различный математический аппарат.
При этом возникают проблемы стыковки таких подмоделей. Хотя это довольно сложные вопросы, они успешно решаются.
имитационное моделирование
Начнем рассмотрение имитационного моделирования с простого примера. Пусть моделью является некоторое дифференциальное уравнение. Решим его двумя способами.
В первом получим аналитическое решение, запрограммируем найденный набор формул и просчитаем на ЭВМ ряд интересующих нас вариантов.
Во втором воспользуемся одним из численных методов решения и для тех же вариантов проследим изменения системы от начальной точки до заданной конечной.
Какой способ лучше, и с каких позиций? Если запись аналитического решения сложна, включает операции вычисления интеграла, то трудоемкость обоих способов будет вполне сравнима. Есть ли принципиальная разница между двумя этими способами? Кажется, что 1-й способ обладает известными преимуществами даже при громоздком аналитическом решении (точность, простота программирования). Но обратим внимание на то, что в первом способе решение в конечной точке дается как функция начала и постоянных коэффициентов дифференциального уравнения. Во втором для его нахождения приходится повторять путь, который система проходит от начальной до конечной точки. В ЭВМ осуществляется воспроизведение, имитация хода процесса, позволяющая в любой момент знать и при необходимости фиксировать его текущие характеристики, такие, как интегральная кривая, производные.
Мы подходим к понятию имитационного моделирования. Но чтобы лучше разобраться в смысле этого термина, рассмотрим применительно к той области, где он возник, - в системах со случайными воздействиями и процессами. Для таких систем в ….-х годах стали моделировать на ЭВМ пошаговое протекание процессов во времени с вводом в нужный момент случайных действий. При этом однократное воспроизведение хода такого процесса в системе мало что давало. Но многократное повторение с разными воздействиями уже неплохо ориентировало исследователя в общей картине, позволяло делать выводы и давать рекомендации по улучшению системы.
Метод стали распространять на классы систем, где надо учесть возможно большее разнообразие в исходных данных, меняющиеся значения внутренних параметров системы, многовариантный режим работы, выбор управления при отсутствии четкой цели и др. Общим оставались специальная организация имитации поведения системы и многократное возобновление процесса по измененным сценариям.
Теперь дадим определение имитационному моделированию.
Моделирование процессов с многократным отслеживанием хода их протекания каждый раз для различных условий называется имитационным моделированием.
Цель этого вида моделирования - получить представление о возможных границах или типах поведения системы, влиянии на нее управлений, случайных воздействий, изменений в структуре и других факторов.
Важной особенностью имитационного моделирования является удобное включение человека, его знаний, опыта, интуиции в процедуру исследования модели. Это делается между отдельными имитациями поведения системы или сериями имитации. Человек изменяет сценарий имитации, что является важным звеном этого вида моделирования. Именно исследователь по результатам проведенных имитаций формирует следующие виды, домысливая полученные сведения, эффективно познает систему, двигается в ее исследовании к поставленной цели. Правда, следует заметить, что управлять процедурой многократной интуиции может и ЭВМ. Однако наиболее полезным ее примером оказывается все-таки в сочетании с оперативным экспертным просмотром и оценкой отдельных имитаций.
Значительная роль человека в имитационном моделировании даже позволяет говорить об определенном противопоставлении методов чисто математического моделирования и имитации. Поясним это на примерах. Пусть мы имеем задачу оптимизации, которую решаем на ЭВМ при помощи некоторого запрограммированного алгоритма. В ряде сложных ситуаций алгоритм может остановиться или «зациклиться» далеко от оптимального решения. Если же учесть весь путь решения шаг за шагом будет контролироваться исследователем, то это позволит, подправляя и возобновляя работу алгоритма, достичь удовлетворительного решения. Второй пример возьмем из области систем со случайными воздействиями. Последние могут иметь такие «плохие» вероятностные свойства, что математическая оценка их влияние на систему практически невозможна. Вот тогда исследователь начинает машинные эксперименты с разными видами этих действий и постепенно получает хоть какую-то картину их влияний на систему.
Однако противопоставлять имитационное моделирование математическому в целом было бы методически неверно. Правильнее ставить вопрос об их удачном совмещении. Так, строгое решение математических задач, как правило, является составной частью имитационной модели. С другой стороны, исследование крайне редко удовлетворяется однократным решением поставленной математической задачи. Обычно он стремится решить наиболее близких задач для выяснения «чувствительности» решения, уравнения с альтернативными вариантами задания исходных данных, а это не что иное, как элементы имитации.
Есть и другая веская причина широкого распространения имитационных моделей.
Достоинством перечисленных ранее математических моделей (оптимизационные, балансовые, статистические и т.п.) является наличие развитого математического аппарата, а проблемы и трудности заключаются в выполнении допущений, налагаемых использованием данного аппарата, при формализации имеющейся информации. Другой проблемой следует считать недостаток информации. В связи с этим необходимо отметить, что имеющийся математический аппарат в основном создавался для решения специфических задач классической физики 19-го и начала 20 в. Бурное развитие естествознания в 20 в. предъявило ряд новых требований, что привело к созданию современных отраслей математики, сгруппированных вокруг кибернетики.
Следовательно, основные проблемы применения упомянутых методов моделирования в исследованиях по безопасности и в экологии связаны с неподготовленностью математического аппарата для исследования новых систем. Поэтому при разработке нового аппарата и в математике иногда идут от объекта к теории, а не наоборот. Как раз такому подходу и соответствует метод имитационного математического моделирования. Здесь можно дать еще одно определение имитационному моделированию, характеризующее его с другой стороны:
Имитационное моделирование есть попытка формализации с помощью современных ЭВМ любых эмпирических знаний о рассматриваемом объекте.
То есть, имитационная модель представляет собой полное формализованное описание в ЭВМ изучаемого явления на грани нашего понимания. Слова «на грани нашего понимания» означают, что в процессе имитационного моделирования причинно-следственные связи необязательно прослеживать «до последнего гвоздя». Для построения модели достаточно знать лишь внешнюю сторону каких-либо связей типа: «если А, то В». Для построения модели не столь важно, почему произошло событие В: то ли в результате каких-то сдвигов в балансе вещества, то ли по другим причинам. Существенно, что оно произошло после события А. Это дает возможность более результативно использовать традиционные знания наук о Земле, что было невозможно при попытках учесть все причинно-следственные связи.
В процессе имитационного моделирования при отсутствии информации о функциональных связях элементов системы необходимо шире использовать логические переключатели состояний модели, которые в определенной мере отражают эти связи. Кроме того, целесообразно членение модели на отдельные блоки, которые сами могут являться самостоятельными моделями, причем принципы построения и математический аппарат в каждом блоке могут быть свои. Например, один блок является вероятностной моделью, другой-- балансовой.
В этих условиях математический аппарат играет подчиненную роль. Гораздо большего внимания требует содержательная часть моделирования, предварительная типизация, структурирование изучаемых объектов.
Обоснованием для проведения имитационного моделирования служит массовость и стохастичность результатов функционирования исследуемых систем. В отношение моделирования процессов в техносфере, можно сказать следующее:
выполнение большинства технологических операций удобно рассматривать в виде процесса функционирования человеко-машинной системы; при этом успешное или неуспешное завершение какой-либо из них следует считать случайным исходом;
при рассмотрении конкретной производственной операции, многократно выполняемой на различных объектах промышленности, энергетики и транспорта, можно утверждать массовый характер этих работ.
Таким образом, при анализе безопасности техносферы имитационное моделирование обосновано и целесообразно.
Можно также сказать, что имитационное моделирование является одной из форм диалога человека с ЭВМ и резко повышает эффективность изучения системы. Оно является особенно незаменимым, когда невозможна строгая постановка математической задачи (полезно попробовать разные постановки), отсутствует математический метод решения задачи (можно использовать имитацию для целенаправленного перебора), имеется значительная сложность полной модели (следует имитировать поведение декомпозиционных частей). Наконец, имитацией пользуются и в тех случаях, когда невозможно реализовать математическую модель из-за недостатка квалификации исследователя.
Кроме термина «имитационное моделирование» в литературе употребляется словосочетание «машинное моделирование». В него вкладывают весьма широкий смысл - от синонима имитации до указания на то, что в исследовании для каких-либо целей используется ЭВМ. Однако некоторыми авторами [1] отмечается наш взгляд, наиболее логичным является использование этого понятия в тех случаях, когда манипуляции с моделью целиком или почти целиком выполняются вычислительной техникой и не требуют участия человека.
8.7 Процесс построения математической модели
Процесс построения математической модели не является строго формализованным (зависит от исследователя, его опыта, таланта, опирается на определенный опытный материал (феноменологическая основа моделирования, содержит предположения, определяющую роль играет и интуиция).
В разработке моделей можно выделить три основные стадии:
построение модели;
пробная работа с моделью;
корректировка и изменение модели по результатам пробной работы.
Современное математическое моделирование немыслимо без привлечения вычислительной техники (численное моделирование, численный эксперимент).
Схематически процесс создания математической модели можно разбить на следующие этапы, отражающие степень взаимодействия человека и ЭВМ:
установление возможных форм связей (человек);
составление варианта математического моделирования (человек):
определение входных и выходных переменных;
введение допущений;
установление ограничений;
формирование математических зависимостей;
решение модельных задач (машина);
сравнение результатов решения с накопленной информацией, определение несоответствий (машина, человек);
анализ возможных причин несоответствия (человек);
составление нового варианта модели (человек).
При моделировании процессов в техносфере, как при нормальном функционировании человеко-машинных систем, так и в ЧС приходится иметь дело с их большим разнообразием и высокой сложностью, что требует знания не только наиболее общих законов, но и частных закономерностей.
К числу наиболее общих законов техносферы относятся уравнения баланса массы, законы сохранения центра масс, количества движения, момента количества движения, энергии, справедливые при определенных условиях для любых материальных тел и технологических процессов, независимо от их структуры, состояния и химического состава. Эти уравнения подтверждены огромным количеством экспериментов.
Более частные соотношения в физике и механике в частности называются физическими уравнениями или уравнениями состояния. Например, закон Гука, устанавливающий связь между механическим напряжением и деформацией упругих тел, или уравнение Клапейрона - Менделеева.
Объективная сложность процессов в техносфере делает невозможным их изучения с помощью моделей какого-либо одного типа. Моделирование таких процессов предполагает их представление в виде системы взаимодействующих разнородных компонентов. Таким образом, модель таких процессов может содержать в себе несколько разнородных субмоделей. Это накладывает свой отпечаток и на само моделирование, который удобно представить в виде определенных этапов, на которых проявляются особенности процессов в человеко-машинных системах (ЧМС). Основные этапы моделирования техносферных процессов представлены на рис. 8.
Рис. 8. Основные этапы моделирования процессов в техносфере
Этап 1. Содержательная постановка
Необходимость в новых моделях возникает при выполнении проектно-конструкторских работ, создания систем управления и контроля, а также выполнения работ на стыке различных отраслей. При этом вначале следует определить, нет ли более простых решений проблемы: возможности использовать существующие модели, модифицируя их.
Конечной целью этапа 1 служит является разработка технического задания. Для достижения этой цели необходимо решить следующие задачи:
исследовать моделируемый объект или процесс с целью выявления основных его свойств, параметров и факторов;
собрать и проверить доступные экспериментальные данные об объектах-аналогах;
проанализировать литературные источники и сравнить между собой построенные ранее модели данного объекта или ему подобные;
систематизировать и обобщить накопленный ранее материал;
разработать общий план создания и использования комплекса моделей.
На данном этапе осуществляется, таким образом, содержательная постановка задачи моделирования. При этом важно правильно поставить вопросы, на которые должна ответить модель. Для этого нужны специалисты, хорошо знающие предметную область и, вместе с тем имеющие достаточно широкий научный кругозор, чтобы общаться со специалистами в различных областях знания, в частности с заказчиком модели. Это является условием успешного формулирования таких требований к создаваемой модели, которые, с одной стороны, удовлетворят заказчика, а с другой стороны - удовлетворят ограничениям на сроки и ресурсы, выделенные для создания и реализации модели. В целом выполнение этого этапа может занять до 30% времени, отпущенного на разработку модели, а с учетом возможных уточнений - и более.
Этап 2. Концептуальная постановка
В отличие от 1-го этапа этап семантического моделирования выполняется рабочей группой без привлечения заказчика. Исходной информацией здесь являются сведения, полученные на 1-м этапе сведения о моделируемом объекте и уточненные требования к будущей модели.
При формулировке гипотез, которые должны лечь в основание концептуальной модели приходится преодолевать противоречия в преставлениях о процессах и происшествиях в человеко-машинных системах. Это касается причин возникновения ошибок, отказов, нерасчетных внешних воздействий, которые могут привести к аварии, катастрофе или несчастному случаю. Зачастую различные специалисты выдвигают разные версии развития подобных ситуаций. При моделировании аварийности и травматизма семантическая модель исследуемого явления может быть представлена в виде явления, декомпозируемого на потоки случайных событий - аварий и несчастных случаев. При этом каждое из них считается результатом совокупности других событий, образующих причинно-следственную цепь. Далее явление может быть представлено в виде схем, графов. Оформление результатов моделирования в форме причинно-следственных диаграмм явится в дальнейшем исходным материалом для последующего контроля и анализа.
Этап 3. Качественный анализ
Постановка задачи моделирования должна быть подвержена всесторонней проверке а затем и предварительному качественному анализу. Цель данного этапа состоит в проверке обоснованности концептуальной постановки задачи и коррекции. Это также проводится с членами рабочей группы, иногда с привлечением не входящих в нее экспертов.
Все принятые ранее гипотезы подлежат проверке, а затем предварительному (качественному) анализу. Выявляются возможные ошибки. Например, в причинно-следственных диаграммах наиболее распространенными ошибками являются избыточные или же недостающие элементы, а также излишне произвольная трактовка учитываемых событий и связей между ними.
Иногда на данном этапе моделирования уже могут быть получены те дополнительные сведения объекте-оригинале, ради которых он подвергается моделированию. Особенно часто удается это сделать в результате качественного анализа причинно-следственных диаграмм, позволяющих учесть такое количество существенных факторов, которыми невозможно одновременно манипулировать мысленно. Среди этого множества факторов (например, влияющих на вероятность аварии или травмы) на могут быть выявлены их сочетания, включающие малое число факторов, появление и/или отсутствие которых необходимо и достаточно для возникновения или недопущения конкретного нежелательного события.
Этап 4. Построение математической модели
После завершения проверки концептуальной постановки задачи и предварительного анализа соответствующей семантической модели рабочая группа приступает к построению математической модели, а затем к выбору наиболее подходящего метода ее исследования. Наиболее предпочтительной считается аналитическая постановка и такое же решение моделируемой задачи, поскольку в этом случае используется арсенал математического анализа, включая оптимизацию. Чаще всего, это системы алгебраических уравнений, для получения которых применяются различные методы аппроксимации в имеющихся статистических данных.
Особая ценность аналитического моделирования заключается в возможности точного решения поставленной задачи, в том числе нахождения оптимальных результатов. Вместе с тем, область использования аналитических методов ограничена размерностью учитываемых факторов и зависит от уровня развития соответствующих разделов математики. Поэтому для создания математических моделей сложных систем и процессов (как в техносфере, например) требуются уже алгоритмические (численные) модели, которые могут давать лишь приближенные решения.
Степень приближения результатов, например, численного и имитационного моделирования зависит от погрешностей, обусловленных преобразованием исходных математических соотношений в численные или имитационные алгоритмы, а также от ошибок округления, возникающих при выполнении любых расчетов на ЭВМ в связи с конечной точностью представления чисел в ее памяти. Вот почему основным требованием к каждом такому алгоритму служит необходимость получения решения исходной задачи за конечное число шагов с заданной точностью.
В случае применения численного метода совокупность исходных математических соотношений заменяется конечномерным аналогом, обычно получаемым в результате замены функций непрерывных аргументов на функции дискретных параметров. После такой дискретизации составляется вычислительный алгоритм, представляющий собой последовательность арифметических и логических действий, позволяющих за конечное число шагов получить решение дискретной задачи.
При имитационном моделировании дискретизации подвергаются не математические соотношения как в предыдущем случае, а сам объект исследования, который разбивается ена отдельные компоненты. Кроме того, здесь не записываетея совокупность математическихх соотношений, описывающих поведение всего обьекта-оригинала. Вместо этого обычно составляется алгоритм, моделирующий функционирование моделируемого объекта с помощью аналитических или алгоритмических моделей.
Следует заметить, что использование математической модели, построенной с применением алгоритмических методов, аналогично проведению экспериментов с объектом, только вместо натурного эксперимента с объектом проводится так называемый машинный (вычислительный) эксперимент с его моделью.
Контроль правильности математической модели. Контроль правильности математических соотношений осуществляется с помощью следующих действий:
контроль размерностей, включающий правило, согласно которому приравниваться, складываться, перемножаться и делиться могут только величины одинаковой размерности. При переходе к вычислениям добавляется дополнительное требования соблюдения одной и той же системы единиц для значений всех параметров;
проверка порядков, состоящая в сравнении порядков складываемых или вычитаемых величин и исключении из математических соотношений малозначимых параметров;
контроль характера зависимости, предполагающий, что направление и скорость изменения выходных параметров модели должны соответствовать физическому смыслу изучаемых процессов;
проверка экстремальных ситуаций, которая заключается в наблюдении за выходными результатами модели при приближении значений ее параметров к предельно допустимым. Зачастую это делает математические соотношения более простыми и наглядными (например, при равенстве нулю какой-либо величины);
контроль физического смысла, связанный с установлением физического смысла результата и проверкой его неизменности при варьировании параметров модели от исходных до промежуточных и граничных значений;
проверка математической замкнутости, состоящая в выявлении принципиальной возможности решения системы математических соотношений и получении на ее основе однозначно интерпретируемого результата.
Математически замкнутой или «корректно поставленной» задачей принято считать такую ее постановку, при которой малым изменениям непрерывно меняющихся исходных параметров соответствуют такие же незначительные изменения выходных ее результатов.
Если это условие не удовлетворяется, численные алгоритмы не могут быть применены.
Этап 5. Разработка компьютерных программ
Использование электронно-вычислительной техники, что требует наличия соответствующих алгоритмов и компьютерных программ. Несмотря на наличие в настоящее время богатого арсенала математических алгоритмов и прикладных программ, нередко возникает потребность в самостоятельной разработке новых программ. Сам процесс создания компьютерных программ в свою очередь может быть разбит на последовательные этапы: разработка технического задания (ТЗ), проектирования структуры программ, собственно программирование (кодирование алгоритма), тестирование и отладка программ.
Само ТЗ при этом имеет следующую структуру:
название задачи - имя программы (компьютерного кода), система программирования (язык), требования к аппаратному обеспечению;
описание - содержательная и математическая постановка задачи, метод дискретизации или обработки входных данных;
управление режимами - интерфейс «пользователь-компьютер»;
входные данные - содержание параметров, пределы их изменения;
выходные данные - содержание, объем, точность и форма представления;
ошибки - возможный перечень, способы выявления и защиты;
тестовые задания - примеры, предназначенные для тестирования и отладки программного комплекса.
Общая структура компьютерного кода, как правило, содержит три части: препроцессор (подготовка и проверка исходных данных), процессор (проведение вычислений) и постпроцессор (отображение результатов.
Этап 6. Анализ и интерпретация результатов моделирования
Системное исследование предполагает качественный и количественный анализ модели и полученных результатов. Качественный анализ предназначен для выявления общих закономерностей, связанных с функционированием исследуемого объекта, осуществляется рабочей группой, иногда с привлечением представителей заказчика. Цель количественного анализа достигается решением двух задач: 1) прогнозирование характеристик моделируемого объекта; 2) априорная оценка эффективности различных стратегий его совершенствования.
Процедура количественного анализа зависит от вида полученных математических зависимостей. Для сравнительно простых аналитических выражений она может проводиться преимущественно вручную, с использованием инструментария математического анализа и принятия решений. Анализ сложных, громоздких моделей реализуется на ЭВМ с помощью численных и имитационных методов.
Проверка адекватности модели. Эта проверка проводится путем установления соответствия между результатами моделирования и какими-либо другими данными, непосредственно относящимися к решаемой задаче. Обычно используют для этого эмпирические данные (результаты натурных экспериментов, статистику), либо подобные результаты, полученные в ходе решения так называемой тестовой задачи с помощью других моделей.
Проверка адекватности должна доказать не только правомерность принятых при моделировании гипотез, но и требуемую точность моделирования.
Различают качественное и количественное согласие результатов сравнения. Качественное согласие подразумевает совпадение некоторых характерных особенностей в распределении оценочных параметров, например, их знаков, тенденций изменения, наличия экстремальных точек и т.п.
Если качественное согласие достигнуто, оценивается совпадение на количественном уровне. При этом для моделей с оценочными функциями оно может оцениваться расхождением в 10-15%, а для используемых в управляющих и контролирующих системах - в 1-2% и ниже.
Причины неадекватности модели могут быть следующие:
значения параметров модели не соответствуют области, определяемой принятой системой гипотез;
константы и параметры в определяющих соотношениях, использованных в модели, установлены неточно;
вся исходная совокупность принятых гипотез неприменима для изучаемого объекта или условий его функционирования.
Для устранения этих причин требуется проведение дополнительных исследований как модели, так и объекта-оригинала. Если модель неадекватна, следует изменить значения констант и исходных параметров. Если и при этом положительный результат не достигнут, должны быть изменены принятые гипотезы (например, о характере влияния одного параметра на другой, учет новых факторов и т.п.).
Таким образом, последний этап в разработке математической модели исключительно важен, и пренебрежение им может стоить огромных издержек в будущем. Действительно, не всегда правдоподобный результат свидетельствует об адекватности модели, и в других случаях она будет давать качественно неверные решения.
Далее показано применение поэтапного моделирования на примере исследования аварийности и травматизма.
8.8 Структура моделирования происшествий в техносфере
1. Содержательная постановка задачи
1.1 Разработать комплекс смысловых и знаковых моделей, позволяющих установить основные закономерности возникновения техногенных происшествий и количественно оценить меру возможности их появления.
1.2. Модели должны: а) выявлять условия появления и предупреждения происшествий; б) вычислять вероятность их появления.
1.3. Исходные данные: параметры производственного объекта Ч (человека), М (машины) и С (среды), проводимых на нем технологических процессов Т, а также статистические данные по состоянию этих компонентов и их аналогов - Q().
2. Концептуальная постановка задачи
2.1. Исходные гипотезы и предпосылки относительно моделируемого явления:
а) аварийность и травматизм на производстве могут быть описаны в соответствии с канонами теории случайных процессов в сложных системах;
б) объектом моделирования должен быть случайный процесс, возникающий на производственном объекте и завершающийся появлением происшествий (аварий или несчастных случаев);
в) поток таких происшествий допустимо считать простейшим, т. е. удовлетворяющим условиям стационарности, ординарности и отсутствия последействия;
г) каждое происшествие может возникать при выполнении конкретных технологических операций, из-за случайно возникших ошибок персонала, отказов техники и нерасчетных внешних воздействий.
2.2. С учетом вышеизложенного можно сформулировать концептуальную постановку задачи моделирования следующим образом:
а) представить аварийность и травматизм в виде процесса просеивания потока заявок (t) на конкретные технологические операции в выходной поток случайных происшествий с вероятностью Q(t) их появления в момент времени t;
б) изобразить данный процесс в виде потоков( графа, интерпретирующего возникновение причинной цепи происшествий из отдельных предпосылок.
3. Проверка и качественный анализ семантической модели
3.1. Проверить обоснованность гипотез относительно природы потоков моделируемых событий и необходимости учета факторов внешней среды:
а) возможность представления простейшим потоком также и входного потока требований на проведение технологических операций;
б) правомерность допущения о несущественности предпосылок к происшествию, обусловленных неблагоприятными внешними воздействиями;
3.2. Провести качественный анализ потокового графа с целью ответа на следующие вопросы:
а) какие производственные процессы можно считать относительно «безопасными»?
б) какое технологическое и производственное оборудование следует рассматривать более «безопасным» в эксплуатации.
4. Математическая постановка и выбор метода решения задачи
4.1. Сформулировать задачу моделирования в виде системы алгебраических уравнений и проверить корректность математических соотношений, полученных каким-либо образом:
а) с учетом гипотезы о простейшем характере потока требований на выполнение технологических операций использовать свойство его инвариантности после разрежения за счет исключения событий для получения зависимостей
Q(t) = f (Ч, М, С, Т, t)
4.2. Разработать процедуру априорной оценки каждого из пара метров аналитической модели и проверить корректность всех по лученных математических соотношений с применением всех соответствующих правил.
Практическая реализация рассмотренного здесь подхода может способствовать совершенствованию безопасности техносферы в целом.
Лекция 9. Теория игр
9.1 Конфликт - предмет рассмотрения теории игр
В природе и обществе часто встречаются явления, в которых те или иные участники имеют несовпадающие интересы и располагают различными путями для достижения своих целей. Такие явления называются конфликтами. Конфликты являются предметом рассмотрения теории игр.
Под конфликтом будем понимать всякое явление, применительно к которому можно говорить:
1) кто и как в этом явлении участвует;
2) каковы возможные исходы этого явления;
3) кто в этих исходах заинтересован и в чем эта заинтересованность состоит.
Рассмотрим возможные причины возникновения конфликтов.
Одна из характерных черт всякого общественного, социально-экономического явления состоит в множественности, многосторонности интересов и в наличии сторон, выражающих эти интересы.
Например:
1) продавец и покупатель, имеющие противоположные интересы;
2) несколько производителей, фигурирующих на рынке и обладающих достаточной силой воздействия на цену товара, имеющих в связи с этим как противоположные, так и совпадающие интересы;
3) объединения или коалиции лиц, участвующих в столкновении интересов, как в случаях определения ставок заработной платы союзами или объединениями рабочих и предпринимателей, голосования в парламенте и т. д.
Конфликт может возникать также из различия целей, которые отражают не только несовпадающие интересы, но многосторонние интересы одного и того же лица. Например:
- конструктор согласует противоречивые технико-экономические требования в процессе конструирования изделия: минимизация габаритов, минимизация стоимости, максимизация надежности, простота в обращении;
- разработчики экономической политики согласуют противоречивые требования, предъявляемые к ситуации: рост объемов производства, повышение доходов, снижение экологической нагрузки и т. д.
Конфликт может проявиться не только в результате сознательных действий различных участников, но и как результат действия тех или иных «стихийных сил» (случай так называемых «игр с природой»).
Прямо противоположные интересы различных сторон явно проявляются в непосредственной борьбе: военной, дипломатической, экономической, спортивной.
Наконец, примерами конфликтных ситуаций являются обычные игры: салонные, карточные, шахматные, морской бой и т. д. Для конфликта характерно следующее:
- ни один из его участников заранее не знает решений, принимаемых остальными участниками, т.е. вынужден действовать в условиях неопределенности;
- ход событий в конфликте зависит от решений, принимаемых каждой из сторон, поэтому поведение любого участника конфликта, если оно разумно, должно определяться с учетом возможного поведения всех его участников.
Подводя итог сказанному, отметим, что общим, объединяющим все конфликты, независимо от их физической и социальной природы, является:
1) столкновение интересов нескольких (двух или более) сторон, в том числе сознательных индивидуумов или природы;
2) преследование сторонами различных целей;
3) наличие наборов альтернатив для достижения этих целей, каждая из которых приводит к одному (или к одному из нескольких) возможных исходов.
9.2 Понятие игры. Классификация игр. Формальное представление игр
Игрой называется математическая модель конфликта.
Математическая модель конфликта должна отражать присущие ему черты, а значит, должна описывать:
- множество заинтересованных сторон (игроков);
- возможные действия каждой из сторон (стратегии и ходы);
- интересы сторон, представленные функциями выигрыша (платежа) для каждого из игроков.
В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков общеизвестны, т.е. каждый из игроков знает свою функцию выигрыша и набор имеющихся в его распоряжении стратегий, а так же функции выигрыша и стратегии всех остальных игроков. В соответствии с этой информацией каждый из игроков организует свое поведение.
Различные виды игр можно классифицировать следующим образом:
- по числу игроков;
- по числу стратегий;
- по свойствам функции выигрыша;
- по возможности предварительных переговоров и взаимодействия между игроками в ходе игры.
По числу игроков различают игры с двумя, тремя и более участниками. В принципе возможны так же игры с бесконечным числом игроков.
По числу стратегий различают конечные и бесконечные игры. В конечных играх игроки располагают конечным числом возможных стратегий. Например, в игре в орлянку у игроков по две стратегии - «орел» или «решка». В бесконечных играх игроки имеют бесконечное число возможных стратегий. Например, при взаимодействии продавца и покупателя каждый из игроков может назвать любую цену и любое количество продаваемого (покупаемого) товара.
По свойствам функции выигрыша различают игры:
- с нулевой суммой, когда выигрыш одного игрока равен проигрышу другого, т.е. налицо прямой конфликт между игроками;
- с постоянной разностью, в которых игроки и выигрывают, и проигрывают одновременно, так что им выгодно действовать сообща;
- с ненулевой суммой, где есть и конфликты, и согласованные действия игроков.
По возможности предварительных переговоров и взаимодействия между игроками в ходе игры различают кооперативные и некооперативные игры. Игра называется кооперативной, если до начала игры игроки образуют коалиции и принимают взаимообязывающие соглашения о своих стратегиях (например, образование коалиций в парламенте перед голосованием по некоторым вопросам).
Игра, в которой игроки не могут координировать свои стратегии подобным образом, называется некооперативной (например, все игры с нулевой суммой).
Рассмотрим примеры формального представления игр.
Обозначим через I множество всех игроков, через St - множество возможных действий игрока i , называемое множеством стратегий.
Например:
а) игра в орлянку
I = {1, 2}, Sf = {Орел, Решка};
б) голосование в парламенте
I = {1, 2, ..., n},
где n - число голосующих, Si = {За, Против, Воздержался};
в) взаимодействие на рынке двух продавцов
I = {1, 2} Si = {Pi: Pi > 0},
где Pi - цена продаваемого товара.
В партии игроки выбирают каждый свою стратегию , в результате чего складывается набор стратегий s = (s1, s2,…,sn), называемый ситуацией.
В рассмотренных выше примерах приведем возможные ситуации:
а) (Орел, Орел), (Орел, Решка), (Решка, Орел), (Решка, Решка);
б) (За, За, Против, За, Воздержался, … , Против);
в) (5 рублей, 3 рубля), (5 рублей, 7 рублей).
Заинтересованность игроков в конкретных ситуациях проявляется в том, что каждому игроку i в каждой ситуации s присваивается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается Нi(s).
Вернемся к указанным выше примерам.
В игре в орлянку.
Н1(Орел, Орел) = Н1(Решка, Решка) = 1,
Н1(Орел, Решка ) = Н1 (Решка, Орел ) = -1,
Н2(Орел, Орел) = Н2(Решка, Решка) = -1,
Н2(Орел, Решка) = Н2(Решка, Орел) = 1.
Видно, что в любой ситуации Н1 + Н2 = 0.
Запишем это в виде матрицы выигрышей, где строки будут соответствовать стратегиям 1-го игрока, столбцы - стратегиям 2-го игрока.
При этом или Н1 + Н2 = 0.
Таким образом, орлянка является примером игры с нулевой суммой.
При голосовании в парламенте считается, что вопрос прошел при большем количестве проголосовавших «За», чем «Против», в противном случае - вопрос не прошел. Получаем:
В случае взаимодействия на рынке двух продавцов предположим, что потребитель приобретет товар у фирмы, объявившей меньшую цену, или распределит свой спрос поровну между фирмами в случае, если цены равны.
Если d(p) - функция спроса в зависимости от цены на товар, то функция выигрыша.
9.3 Определение бескоалиционной игры
Бескоалиционной игрой будем называть такую игру, в которой целью каждого игрока является получение по возможности большего индивидуального выигрыша.
Обозначим.
I - множество всех игроков. Далее будем считать I конечным. Обычно принято различать игроков по номерам, т.е. считать I = {1, 2, ..., n};
Si - множество стратегий игрока , т.е. множество возможных действий, имеющихся в распоряжении игрока i. Считается, что Si содержит не менее двух возможных стратегий, иначе его действия заранее определены.
Процесс игры состоит в выборе каждым из игроков одной своей стратегии . Таким образом, в результате каждой партии игры складывается система стратегий s = (s1, s2,...,sn), которая называется ситуацией.
Множество всех ситуаций S=S1?S2?…?Sn, т.е. S является декартовым произведением множеств стратегий всех игроков. Обозначим: Hi(s) - выигрыш игрока i в ситуации s. Функция Hi, определенная на множестве всех ситуаций, называется функцией выигрыша игрока i.
Hi: S > R, т.е. каждой ситуации Hi - сопоставляет вещественное число.
Бескоалиционной игрой называется система , в которой I и Si () являются множествами, а Hi - функции на множестве S=S1?S2?…?Sn, принимающие вещественные значения.
Бескоалиционная игра называется игрой с постоянной суммой, если существует такое постоянное число C, что , т.е. сумма выигрышей игроков постоянна в любой ситуации.
9.4 Приемлемые ситуации и ситуации равновесия
Ситуацию s в игре Г естественно считать приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию на какую-либо другую, не может увеличить этим своего выигрыша.
Пусть s = (s1, s2,..., si-1, si, si+1,..., sn) - произвольная ситуация в игре, а si - некоторая стратегия игрока i.
Рассмотрим новую ситуацию , получившуюся из ситуации s заменой стратегии si игрока i на s'i . Очевидно, что s||s'i = s, если s'i совпадает с si (s'i = si).
Ситуация s в игре Г называется приемлемой для игрока i, если
Смысл названия «приемлемая» состоит в том, что, если в некоторой ситуации s для игрока i найдется такая стратегия s?i, что то игрок i в случае складывающейся ситуации s может получить больший выигрыш, выбирая s?i, вместо si. В этом смысле ситуация s для игрока может считаться неприемлемой.
Ситуация s называется ситуацией равновесия (или равновесной ситуацией), если она приемлема для всех игроков, т.е.
Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии.
Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из равновесных ситуаций игры.
Процесс нахождения ситуаций равновесия в бескоалиционной игре называется решением игры.
9.5 Примеры игровых задач
«Дилемма заключенных»
Предположим, игроками 1 и 2 являются преступники, находящиеся в предварительном заключении по подозрению в тяжком преступлении. Прямых улик против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.
Судья предложил каждому следующую сделку. Если он сознается в преступлении, а другой нет, то сознавшийся получает 1 год наказания, а несознавшийся - 10 лет. Если сознаются оба, то каждый получит по 7 лет. Заключенным известно, что если никто из них не сознается, то оба получат по 3 года.
Запишем функции выигрышей (потерь) игроков в рассмотренной игре.
Пусть П - признание, Н - непризнание, H1 - выигрыш 1-го игрока, H2 - выигрыш 2-го игрока.
H1 (П, П) = H2 (П, П) = -7,
H1 (Н, Н) = H2 (Н, Н) = -3,
H1 (П, Н) = H2 (Н, П) = -1,
H1 (Н, П) = H2 (П, Н) = -10.
Игру можно представить с помощью следующей матрицы, в клетках которой слева вверху стоит выигрыш первого заключенного, а справа внизу - второго.
Второй игрок |
||||
сознаться |
не сознаваться |
|||
Первый игрок |
сознаться |
7 7 |
1 10 |
|
не сознаваться |
10 1 |
3 3 |
Ситуацией равновесия в данной игре оказывается ситуация, в которой каждый из игроков должен признаться. Тогда каждый из игроков теряет 7, т.е. оказывается осужденным на 7 лет.
В ситуации же, когда ни один не признался, потери каждого всего 3 (каждый осужден на 3 года). Однако данная ситуация явно не устойчива, так как каждый из игроков заинтересован отклониться от выбранной стратегии и признаться, рассчитывая свалить вину на другого и избежать наказания, сведя свои потери к 1 (1 год осуждения, при этом потери партнера составят 10).
Таким образом, разумной стратегией для каждого игрока является признание, так как оно гарантирует игроку неполучение максимального срока в 10 лет. Хотя более выгодной кажется тактика непризнания, дающая возможность получения незначительного наказания (срок в год), однако чревата неожиданностью в виде максимального срока в 10 лет в случае признания со стороны соучастника.
«Обмен закрытыми сумками»
Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая -- товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.
В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игроки никогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.
В вариации, популярной у программистов и хакеров, каждый агент этой игры помнит предыдущие результаты (или имеет доступ к общественному мнению, «коллективной памяти»), и множество обменов повторяются длительное время.
Как отмечено выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, которые не будут происходить.
Программисты и математики утверждают, что стратегия «око за око» наилучшая общая стратегия
Примеры с заключёнными, карточной игрой и обменом закрытыми сумками могут показаться надуманными, но на самом деле есть множество примеров взаимодействия людей и животных, имеющие такую же матрицу выигрышей.
В политологии, к примеру, сценарий ДЗ часто используется для иллюстрации проблемы двух стран, вовлечённых в гонку вооружений. Обе будут заявлять, что у них есть две возможности: либо увеличить расходы на военные нужды, либо сокращать вооружения. Ни одна из сторон не может быть уверена, что другая будет соблюдать договорённость, следовательно, обе будут стремиться к военной экспансии. Это можно считать теоретическим объяснением политики устрашения. Похожие явления наблюдаются и в автоспорте -- «Формула-1», где последние 20 лет происходит гонка бюджетов команд. Из-за этого число машин-участников сократилось с 36 в 1990 году до 20 в 2003.
В велогонках дилемма заключённого возникает, когда два сильных гонщика оторвались от общей группы. Каждый из них может либо предоставить соседу сотрудничество, либо ехать сзади. Для обоих идеалом будет, когда они по очереди «висят» друг у друга на хвосте -- но всегда есть желание не дать соседу преимущества (тогда тот постепенно устаёт и «скатывается» в пелотон, а ты финишируешь с большим отрывом).
Случай дилеммы заключённого может быть найден в бизнесе. Две конкурирующие фирмы должны определиться, сколько средств тратить на рекламу. Эффективность рекламы и прибыль каждой фирмы уменьшается с ростом расходов на рекламу у конкурента. Обе фирмы принимают решение увеличить расходы на рекламу, при этом их доли рынка и, возможно, объёмы продаж остаются неизменными, а прибыль сокращается. Предел гонки рекламных бюджетов -- прибыль, впрочем, они могут пытаться некоторое время работать и в убыток. Фирмы могут пойти на соглашение о сокращении расходов на рекламу, но всегда есть стимул его нарушить.
В олигополистических рынках ценовая политика -- это повторяющаяся ДЗ. Обычно олигополисты сотрудничают друг с другом и не доводят ситуацию до «ценовой войны».
Уильям Паундстоун в книге о дилемме заключённого описывает ситуацию в Новой Зеландии, где газетные ящики оставляют открытыми. Газету можно взять, не заплатив за неё, но мало кто так делает, потому что большинство осознаёт вред, который был бы, если бы все воровали газеты. Поскольку ДЗ в чистом виде одновременна для всех игроков (никто не может повлиять на решения других), эта распространённая линия рассуждений называется «магическое мышление».
Теоретическое заключение ДЗ -- одна из причин, почему во многих странах сделка о признании вины запрещена. Часто сценарий ДЗ повторяется очень точно: в интересах обоих подозреваемых сознаться и свидетельствовать против другого подозреваемого, даже если оба невиновны. Возможно, наихудший случай -- когда только один виноват, в этом случае невиновный вряд ли сознаётся в чём либо, а виновный пойдёт на это и даст показания против невиновного.
Многие дилеммы в реальной жизни включают множество игроков. Хотя и метафорическую, «трагедию общин» Ардена можно рассматривать как обобщение ДЗ для множества игроков. Каждый житель общины выбирает -- пасти ли скот на общем пастбище и получить выгоду, истощая его ресурсы, либо ограничить свой доход. Коллективный результат от всеобщего (или частого) максимального использования пастбища -- низкий доход (ведущий к разрушению общины). Однако такая игра не является формальной, поскольку может быть разбита на последовательность классических игр с 2 участниками.
Лекция 10. Моделирование на основе орграфов
10.1 Граф и его виды
Первая работа по теории графов принадлежит Леонарду Эйлеру (1736 год), хотя термин «граф» впервые ввел в 1936 году венгерский математик Денеш Кениг. Графами были названы схемы, состоящие из точек (вершины графа) и соединяющих эти точки отрезков прямых или кривых (ребра графа) (рис. 1).
Рис. 1. Примеры графов
С помощью графов часто упрощалось решение задач, сформулированных в различных областях знаний: в автоматике, электронике, физике, химии и др. С помощью графов изображаются схемы дорог, газопроводов, тепло- и электросети. Помогают графы в решении математических и экономических задач.
Рассмотрим задачу.
Задача. Аркадий, Борис, Владимир, Григорий и Дмитрий при встрече обменялись рукопожатиями (каждый пожал руку каждому по одному разу). Сколько всего рукопожатий было сделано?
Рис. 2. Нулевой граф с пятью вершинами
Рис. 3. Неполный граф с пятью вершинами
Пусть каждому из пяти молодых людей соответствует определенная точка на плоскости, названная первой буквой его имени (рис.2), а производимому рукопожатию -- отрезок или часть кривой, соединяющая конкретные точки -- имена (рис. 3).
Точки А, Б, В, Г, Д называются вершинами графа, а отрезки линий, соединяющие эти точки -- ребрами графа. При изображении графов на рисунках или схемах отрезки могут быть прямолинейными или криволинейными; длины отрезков и расположение точек произвольны.
Например, все три фигуры на рис. 4 изображают один и тот же граф.
Рис. 4. Графы
Рассмотрим процесс соединения точек А, Б, В, Г, Д ребрами.
1. Ситуация, соответствующая моменту, когда рукопожатия еще не совершались, представляет собой точечную схему, изображенную на рис. 2. Такая схема, состоящая из «изолированных» вершин, называется нулевым графом.
2. Ситуация, когда совершены еще не все рукопожатия, может схематически быть изображена, например, с помощью рис. 3: пожали руки А и Б, А и Г, Д и Г, В и Д. Графы, в которых не построены все возможные ребра, называются неполными графами.
3. На рис. 5 изображен граф, соответствующий всем совершенным рукопожатиям. Этот граф является полным графом.
Рис. 5. Полный граф с пятью вершинами
Если подсчитать число ребер графа, изображенного на рисунке, то это число и будет равно количеству совершенных рукопожатий между пятью молодыми людьми. Их 10.
Заметим, что если полный граф имеет n вершин, то количество ребер будет равно n(n-1)/2.
На рисунке 4 ребра превращающие граф в полный граф изображены другим цветом, совокупность вершин графа с этими ребрами называется дополнением графа.
Степень вершины - количество ребер графа, исходящих из этой вершины.
На рис. 3 изображен граф с пятью вершинами. Степень вершины А обозначим Ст.А. На рис. 4: Ст.А = 2, Ст.Б = 1, Ст.В = 1, Ст.Г= 2, Ст.Д= 2.
Вершина называется нечетной - если степень этой вершины нечетная, четной - если степень этой вершины четная.
Если степени всех вершин графа равны, то граф называется однородным. Таким образом, любой полный граф -- однородный.
Введем понятие ориентированного графа. В таком графе дуги имеют стрелки, направленные от одной вершины к другой (рис. 6).
Рис.6. Примеры ориентированных графов
Ориентированный граф был бы полезен, например, для иллюстрации организации перевозок в транспортной задаче. В экономике дугам ориентированного или обычного графа часто приписывают числа, например, стоимость проезда или перевозки груза из пункта А (начальная вершина дуги) в пункт Б (конечная вершина дуги)
Путем в графе от одной вершины к другой называется такая последовательность ребер, по которой можно проложить маршрут между этими вершинами, при этом никакое ребро маршрута не должно встречаться более одного раза. Вершина, от которой проложен маршрут, называется началом пути, вершина в конце маршрута -- конец пути. Простой путь - путь, в котором ни одна дуга не встречается дважды. Элементарный путь - путь, в котором ни одна вершина не встречается дважды. Контур - путь, у которого конечная вершина совпадает с начальной вершиной. Длиной пути (контура) называется число дуг пути (или сумма длин его дуг, если последние заданы).
Циклом называется путь, в котором совпадают начало с концом. Если все вершины цикла разные, то такой цикл называется элементарным (или простым) циклом. Если же цикл включает в себя все ребра графа по одному разу, то такой цикл называется Эйлеровой линией. На рис. 7 приведены примеры Эйлеровых линий.
Рис. 7. Примеры Эйлеровой линии
Элементарный путь (контур), проходящий через все вершины графа, называется гамильтоновым путем (контуром).
Две вершины графа называются связными, если в графе существует путь с концами в этих вершинах. Если такого пути не существует, вершины называются не связными.
Так, на рис. 8 любая пара вершин, взятая из набора А,Б,В,Г,Д, будет связной, т.к. от любой из них к любой можно 'пройти' по ребрам графа. Пары вершин, одна из которых взята из набора А,Б,В,Г,Д, а другая из набора Е,Ж,З, не будут связными, т.к. от одной к другой 'пройти' по ребрам не удается.
Рис. 8. Примеры связных и несвязных графов
Граф называется связным, если любая пара его вершин -- связная.
Граф называется несвязным, если в нем есть хотя бы одна несвязная пара вершин.
На рис.8, очевидно, изображен несвязный граф. Если, например, на рис. 8 между вершинами Д и Е провести ребро, то граф станет связным. Такое ребро в теории графов, после удаления которого, граф из связного превращается в несвязный, называется мостом.
Примерами мостов на рис. 8 могли бы служить ребра ДЕ, AЗ, ВЖ и др., каждое из которых соединяло бы вершины «изолированных» частей графа.
Деревом называется любой связный граф, не имеющий циклов. Договорились считать «деревом» и всякий граф, состоящий из одной (изолированной) вершины.
Рис. 9. Дерево
На рисунке приведен пример графа «дерева». Вершина дерева, имеющая степень единицу, называется висячей вершиной (на рис. 9 они отмечены кружком).
Рассмотрим несколько типичных задач принятия решений, связанных с оптимизацией на графах:
1. Задача о кратчайшем пути.
2. Задача о максимальном потоке.
3. Задача коммивояжера.
10.2 Задача о кратчайшем пути
Как кратчайшим путем попасть из одной вершины графа в другую (следовательно, с наименьшим расходом топлива и времени, наиболее дешево попасть из пункта А в пункт Б)? Для решения этой задачи каждой дуге ориентированного графа должно быть сопоставлено число - время движения по этой дуге от начальной вершины до конечной (рис. 10).
Рис. 10. Исходные данные
Ситуацию можно описать не только ориентированным графом с весами, приписанными дугам, но и таблицей (табл. 1).
Табл. 1. Исходные данные к задаче о кратчайшем пути
Начало дуги |
Конец дуги |
Время в пути |
|
1 |
2 |
7 |
|
1 |
3 |
1 |
|
2 |
4 |
4 |
|
2 |
6 |
1 |
|
3 |
2 |
5 |
|
3 |
5 |
2 |
|
3 |
6 |
3 |
|
5 |
2 |
2 |
|
5 |
4 |
5 |
|
6 |
5 |
3 |
Спрашивается: как кратчайшим путем попасть из вершины 1 в вершину 4?
Решение. Введем обозначение: С(Т) - длина кратчайшего пути из вершины 1 в вершину Т. (Поскольку любой путь, который надо рассмотреть, состоит из дуг, а дуг конечное число, и каждая входит не более одного раза, то претендентов на кратчайший путь конечное число, и минимум из конечного числа элементов всегда достигается.) Рассматриваемая задача состоит в вычислении С(4) и указании пути, на котором этот минимум достигается.
Для исходных данных, представленных на рис. 10 и в табл. 1, в вершину 3 входит только одна стрелка, как раз из вершины 1, и около этой стрелки стоит ее длина, равная 1, поэтому С(3) = 1. Кроме того, очевидно, что С(1) = 0.
В вершину 4 можно попасть либо из вершины 2, пройдя путь, равный 4, либо из вершины 5, пройдя путь, равный 5. Поэтому справедливо соотношение
С(4) = min {С(2) + 4; С(5) + 5}.
Таким образом, проведена реструктуризация задачи - нахождение С(4) сведено к нахождению С(2) и С(5).
В вершину 5 можно попасть либо из вершины 3, пройдя путь, равный 2, либо из вершины 6, пройдя путь, равный 3. Поэтому справедливо соотношение
С(5) = min {С(3) + 2 ; С(6) + 3}.
Мы знаем, что С(3) = 1. Поэтому
С(5) = min {3 ; С(6) + 3}.
Поскольку очевидно, что С(6) - положительное число, то из последнего соотношения вытекает, что С(5) = 3.
В вершину 2 можно попасть либо из вершины 1, пройдя путь, равный 7, либо из вершины 3, пройдя путь, равный 5, либо из вершины 5, пройдя путь, равный 2. Поэтому справедливо соотношение
С(2) = min {С(1) + 7; С(3) + 5; С(5) + 2}.
Нам известно, что С(1) = 0, С(3) = 1, С(5) = 3. Поэтому
С(2) = min {0 + 7; 1 + 5; 3 + 2} = 5.
Теперь мы можем найти С(4):
С(4) = min {С(2) + 4; С(5) + 5} = min {5 + 4; 3 + 5} = 8.
Таким образом, длина кратчайшего пути равна 8. Из последнего соотношения ясно, что в вершину 4 надо идти через вершину 5. Возвращаясь к вычислению С(5), видим, что в вершину 5 надо идти через вершину 3. А в вершину 3 можно попасть только из вершины 1. Итак, кратчайший путь таков:
1 > 3 > 5 > 4 .
Задача о кратчайшем пути для конкретных исходных данных (рис.10 и табл. 1) полностью решена.
10.3 Задача о максимальном потоке
По каким маршрутам послать максимально возможное количество грузов из начального пункта в конечный, если пропускная способность путей между пунктами ограничена?
Для решения этой задачи каждой дуге ориентированного графа, соответствующего транспортной системе, должно быть сопоставлено число - пропускная способность этой дуги (рис. 11).
Рис. 11. Исходные данные
Исходные данные о транспортной системе, например, внутризаводской, приведенные на рис.11, можно также задать таблицей (табл. 2).
Табл. 2. Исходные данные к задаче о максимальном потоке
Пункт отправления |
Пункт назначения |
Пропускная способность |
|
0 |
1 |
2 |
|
0 |
2 |
3 |
|
0 |
3 |
1 |
|
1 |
2 |
4 |
|
1 |
3 |
1 |
|
1 |
4 |
3 |
|
2 |
3 |
1 |
|
2 |
4 |
2 |
|
3 |
4 |
2 |
Решение задачи о максимальном потоке может быть получено из следующих соображений.
Очевидно, максимальная пропускная способность транспортной системы не превышает 6, поскольку не более 6 единиц грузов можно направить из начального пункта 0, а именно, 2 единицы в пункт 1, 3 единицы в пункт 2 и 1 единицу в пункт 3.
Далее надо добиться, чтобы все 6 вышедших из пункта 0 единиц груза достигли конечного пункта 4. Очевидно, 2 единицы груза, пришедшие в пункт 1, можно непосредственно направить в пункт 4. Пришедшие в пункт 2 грузы придется разделить: 2 единицы сразу направить в пункт 4, а 1 единицу - в промежуточный пункт 3 (из-за ограниченной пропускной способности участка между пунктами 2 и 4). В пункт 3 доставлены такие грузы: 1 единица из пункта 0 и 1 единица из пункта 3. Их направляем в пункт 4.
Итак, максимальная пропускная способность рассматриваемой транспортной системы - 6 единиц груза. При этом не используются внутренние участки (ветки) между пунктами 1 и 2, а также между пунктами 1 и 3. Не догружена ветка между пунктами 1 и 4 - по ней направлены 2 единицы груза при пропускной способности в 3 единицы.
Решение можно представить в виде таблицы (табл. 2) или графа (рис. 12).
Рис. 12. Решение задачи (числа в скобках)
Табл. 3. Решение задачи о максимальном потоке
Пункт отправления |
Пункт назначения |
Пропускная способность |
План перевозок |
|
0 |
1 |
2 |
2 |
|
0 |
2 |
3 |
3 |
|
0 |
3 |
1 |
1 |
|
1 |
2 |
4 |
0 |
|
1 |
3 |
1 |
0 |
|
1 |
4 |
3 |
2 |
|
2 |
3 |
1 |
1 |
|
2 |
4 |
2 |
2 |
|
3 |
4 |
2 |
2 |
Дадим формулировку задачи о максимальном потоке в терминах линейного программирования. Пусть ХKM - объем перевозок из пункта К в пункт М. Согласно рис. 11 К = 0,1,2,3, М = 1,2,3,4, причем перевозки возможны лишь в пункт с большим номером. Значит, всего имеется 9 переменных ХKM , а именно, Х01 , Х02 , Х03 , Х12 , Х13 , Х14 , Х23 , Х24 , Х34 . Задача линейного программирования, нацеленная на максимизацию потока, имеет вид:
F > max ,
Х01 + Х02 + Х03 = F (0)
- Х01 + Х12 + Х13 + Х14 = 0 (1)
- Х02 - Х12 + Х23 + Х24 = 0 (2)
- Х03 - Х13 - Х23 + Х34 = 0 (3)
- Х14 - Х24 - Х34 = - F (4)
Х01 ? 2
Х02 ? 3
Х03 ? 1
Х12 ? 4
Х13 ? 1
Х14 ? 3
Х23 ? 1
Х24 ? 2
Х34 ? 2
ХКМ ? 0 , К, М = 0, 1, 2, 3, 4
F ? 0 .
Здесь F - целевая функция, условие (0) описывает вхождение грузов в транспортную систему. Условия (1) - (3) задают балансовые соотношения для узлов 1- 3 системы. Другими словами, для каждого из внутренних узлов входящий поток грузов равен выходящему потоку, грузы не скапливаются внутри и системы и не 'рождаются' в ней. Условие (4) - это условие 'выхода' грузов из системы. Вместе с условием (0) оно составляет балансовое соотношение для системы в целом ('вход' равен 'выходу'). Следующие девять неравенств задают ограничения на пропускную способность отдельных 'веток' транспортной системы. Затем указана неотрицательность объемов перевозок и целевой функции. Ясно, что последнее неравенство вытекает из вида целевой функции (соотношения (0) или (4)) и неотрицательности объемов перевозок. Однако последнее неравенство несет некоторую общую информацию - через систему может быть пропущен либо положительный объем грузов, либо нулевой (например, если внутри системы происходит движение по кругу), но не отрицательный (он не имеет экономического смысла, но формальная математическая модель об этом 'не знает').
Литература:
1. Белов В.В. Теория графов / В.В. Белов, Е.М. Воробьев, В.Е. Шаталов. - М.: Высшая школа, 1976. - 392 с.
2/ Электронный учебник по решению задач на графах Татарского института содействия бизнесу. URL: http://www.tisbi.ru/resource/lib/graph/cont.htm
Лекция 11. Основные положения теории планирования экспериментов
11.1 Поверхность отклика
Планирование эксперимента позволяет оптимизировать трудовые, временные и материальные затраты на проведение исследований, обеспечить их наиболее эффективное выполнение, а отсутствие соответствующего плана может существенно повысить трудоемкость исследований или сделать экспериментальную программу полностью безрезультатной.
Исторически теория планирования эксперимента начала развиваться с факторного планирования, основы которого зародились еще в 30-х годах XX столетия. Основы этой теории состоят в построении экономичных планов, по результатам экспериментальных измерений в точках которых можно делать статистические выводы о неизвестных параметрах функций регрессии, причем делать это на основе четко формализованных процедур. Факторное планирование включает построение полных и дробных факторных планов, ортогональных латинских квадратов и сбалансированных блок-схем. В отличие от классического эксперимента, в котором влияние различных значений входных переменных на результаты исследования рассматривается по одному при факторном планировании эти значения одновременно комбинируются в разных вариантах. Это позволяет дать более точные оценки неизвестных параметров регрессии при равном числе измерений.
К настоящему времени сложилась стройная теория планирования эксперимента, оперирующая с достаточно сложным математическим аппаратом, имеющая свою терминологию. Здесь мы рассмотрим лишь основные положения этой теории, позволяющие организовать процесс моделирования не очень сложных систем. При этом мы ограничимся рассмотрением двухуровневых планов, в которых влияние на результат эксперимента каждой из входных переменных изучается на двух уровнях, т.е. при наименьшем и наибольшем значениях этой переменной в пределах исследуемой области. Двухуровневые планы в силу ряда преимуществ получили наибольшее распространение при факторном планировании эксперимента.
Поскольку математические методы планирования эксперимента основаны на кибернетическом подходе, наиболее подходящей моделью эксперимента является «черный ящик», для которого известно лишь то, что подается на его вход, и то, что получается на выходе, а устройство этого ящика значения не имеет. Соответственно мы будем иметь два типа переменных (входных и выходных), которые называют факторами и откликами. Для выяснения различий между ними рассмотрим простой эксперимент, в котором рассматриваются лишь две переменные x и y и целью которого является ответ на вопрос: как при изменении x будет изменяться у В этом случае x - фактор, а у - отклик. В литературе встречаются другие термины: для фактора - режим, независимая переменная, входная переменная, экзогенная переменная; для отклика - реакция, выход, зависимая переменная, переменная состояния, эндогенная переменная. Подобная терминология возникла в связи с тем, что первые исследования с применением статистических экспериментов проводились в сельском хозяйстве, биологии, а затем стремительно вторгались в другие ниши, пополняясь там терминами, наиболее близкими и понятными читателям.
Каждый фактор xi может принимать в эксперименте одно из нескольких значений, называемых уровнями. Каждому уровню соответствует определенная точка в многомерном пространстве, а множество таких точек образует поверхность отклика. На рис. 1 показана поверхность отклика для двухфакторного эксперимента. Факторами являются переменные х1 и х2. В точках 1, 2, 3, 4 эти факторы принимают определенные значения, которым отвечают соответствующие точки на поверхности отклика.
Рис. 1. Поверхность отклика
Конфигурация поверхности отклика, следовательно, функция не известна. Целью
(1)
эксперимента является либо описание этой поверхности (хотя бы приближенное) в интересной для исследователя области варьирования факторов, либо определение экстремального значения отклика. Вторая задача может быть сведена к пошаговому выполнению первой, поэтому на начальном этапе нас будет интересовать только поиск аналитического выражения, близкого к искомой функции (1) в заданной области. Этот поиск осуществляют на основе обработки экспериментальных данных в точках 1, 2, 3, 4 (рис. 3.3) факторного пространства.
11.2 Этапы планирования эксперимента
Общая схема планирования экспериментов для решения экстремальных задач состоит из следующих этапов:
1) постановка задачи;
2) выбор параметра оптимизации;
3) выбор факторов;
4) составление линейного плана;
5) реализация линейного плана и построение линейной модели;
6) поиск области экстремума;
7) описание области экстремума;
8) интерпретация результатов.
Постановка задачи. Решение любой задачи начинается с ее формулировки. При этом необходимо иметь ясное, четкое и вполне однозначное представление о цели работы. Желательно, чтобы эта цель была сформулирована количественно, так как планирование экспериментов связано прежде всего с установлением количественных связей между входными и выходными параметрами изучаемой системы. Разумеется, объект обследования должен быть управляемым.
Выбор параметра оптимизации. Одним из наиболее ответственных этапов является выбор параметра оптимизации. Он должен быть однозначным, характеризоваться числами, действительно определять оптимум. Надо стремиться к тому, чтобы параметр был только один, имел ясный физический смысл и оценивался с максимальной статистической эффективностью (последнее позволяет сократить до минимума число параллельных опытов).
Простейший случай имеет место, когда заранее известен и сам параметр, и то его значение, к которому следует стремиться. При этом иногда приходится изменять вид параметра (например, переходить от его натуральных значений к логарифмам, обратным величинам и пр.). Если значение параметра, к которому следует стремиться, неизвестно, все же следует пытаться установить ограничения его величины хотя бы с одной стороны.
Иногда параметр оптимизации приходится изменять из-за технических трудностей, связанных, например, с отсутствием необходимых методик или достоверных методов оценки. В этих условиях можно применять параметры, дающие косвенные оценки, но поиск экстремума становится во многом интуитивным, а интерпретация результатов усложняется.
Часто возникают трудности в количественной оценке параметра оптимизации. Тогда можно использовать субъективные ранговые параметры, такие, как сорт, балл, класс и др. Некоторые методы планирования экспериментов вообще не требуют количественных оценок параметра оптимизации.
Выбор факторов. Не менее сложен этап выбора факторов, влияющих на изменение параметра оптимизации. Если при постановке задачи пропустить какой-нибудь сильно влияющий фактор, то вся работа окажется бесполезной. Поэтому при планировании экспериментов необходимо включать в план исследования все факторы, которые могут влиять на параметр оптимизации. Часто выбранных факторов оказывается очень много; если число их превышает 10, то возникает задача отсеивания незначимых факторов.
Факторы, которые по тем или иным причинам невозможно учесть в эксперименте, необходимо в течение всех опытов стабилизировать на постоянных уровнях.
Важным требованием, предъявляемым к факторам, является невозможность их взаимозаменяемости. Взаимозаменяемость не следует допускать даже для двух любых факторов из общей совокупности.
Выбирая факторы, рекомендуется учитывать область, ограничивающую их возможное варьирование. Желательно, чтобы факторы имели количественную оценку, хотя планирование экспериментов возможно, когда некоторые факторы представлены качественно.
После выбора факторов для каждого из них устанавливают основной уровень и интервалы варьирования. Последние следует выбирать таким образом, чтобы их величина не превышала удвоенной среднеквадратичной ошибки в определении данного фактора.
Составление линейного плана и определение коэффициентов регрессии производят по правилам, изложенным в первых двух разделах данной главы.
Определение доверительных интервалов коэффициентов регрессии. Если проводятся повторные серии опытов или осуществляется несколько прогонов модели на компьютере, то возникает задача статистической оценки коэффициентов регрессии. После определения таких коэффициентов следует прежде всего установить их статистическую значимость. С этой целью проверяют гипотезу об однородности выборочных дисперсий и вычисляют доверительные интервалы коэффициентов регрессии.
Статистический анализ уравнения регрессии. После вычисления коэффициентов регрессии и проверки их значимости проводят статистический анализ уравнения регрессии. С этой целью проверяют гипотезу об адекватности данного уравнения, т. е. ищут ответ на вопрос, соответствует ли полученное линейное уравнение изучаемому явлению или необходима более сложная модель.
Количественной оценкой адекватности уравнения регрессии является дисперсия неадекватности, характеризующая квадрат отклонений экспериментальных значений у от теоретических. Гипотезу адекватности обычно проверяют с помощью критерия Фишера, но возможно использование других критериев.
Адекватность линейного уравнения можно проверить и другим способом. Свободный член уравнения регрессии bо является, по сути дела, оценкой результата опыта на основном уровне, когда все остальные факторы исключены. Поэтому, сделав соответствующий опыт, можно сравнить его результат с величиной свободного члена, т.е. проверить гипотезу о равенстве нулю суммы коэффициентов при квадратичных членах (нуль-гипотезу). Нуль-гипотеза может быть принята, если разность |b0--у0| не превышает среднеквадратической ошибки эксперимента. Значимость этого различия иногда проверяют сопоставлением с критерием Стьюдента.
Выбор факторов. При проведении эксперимента факторы могут быть управляемыми и неуправляемыми, наблюдаемыми и ненаблюдаемыми, изучаемыми и неизучаемыми, количественными и качественными, фиксированными и случайными.
Фактор является управляемым, если его уровни назначаются лицом, проводящим эксперимент, в соответствии с задачами исследования. В процессе эксперимента все управляемые факторы должны поддерживаться на заданном уровне или изменяться в соответствии с заданной программой.
Не всяким наблюдаемым (т.е. фиксируемым в процессе эксперимента) фактором можно управлять. Такие наблюдаемые, но не управляемые факторы получили название сопутствующих. К ним относятся, в частности, воздействия внешней среды. Обычно сопутствующих факторов бывает довольно много, поэтому рационально учитывать влияние лишь тех из них, которые наиболее существенно воздействуют на результаты эксперимента.
После выбора факторов для каждого из них следует определить область, ограничивающую их возможное варьирование, и назначить основной уровень. Если, например, по условиям эксперимента нас интересует диапазон температуры воды от 20 до 60°С, то основной уровень (для середины интервала) составит 40°, нижний уровень 20°, верхний уровень 60°С. Разница значений между верхним и нижним уровнями фактора не может быть больше физически возможной. Например, для температуры обычной воды при нормальных условиях эта разность не может превысить 100°С. При этом интервал варьирования не должен быть меньше ошибки фиксирования уровня фактора, иначе верхний и нижний уровни окажутся Факторы, которые по тем или иным причинам невозможно учесть в эксперименте, необходимо во всех опытах стабилизировать на постоянных уровнях.
11.3 Обработка и анализ результатов моделирования
Для обработки данных эксперимента существуют различные методы, зависящие от целей исследования и вида получаемых при моделировании характеристик.
В результате эксперимента получают набор данных, между которыми может существовать или отсутствовать функциональная либо структурная связь. Если такая связь между факторами и откликом существует, то она проявляется в эксперименте в неявном виде, а для использования результатов эксперимента в практических целях неявную зависимость следует сделать явной и представить ее в виде функции, системы уравнений, номограммы, графика и т. п. Если функциональная зависимость между факторами и откликом не существует, то следует обработать их независимо друг от друга по правилам математической статистики.
Первым шагом при записи аналитического выражения, аппроксимирующего требуемую зависимость, является нанесение экспериментальных точек на график в прямоугольной системе координат, В результате будет получена диаграмма разброса (рис. 2), из которой часто удается визуально найти плавную кривую и определить соответствующую ей функциональную зависимость. Точки, изображенные на рис. 3.6, а, группируются около прямой, а точки, показанные на схеме б, соответствуют кривой. Описание точек схемы в зависит от задач эксперимента: это может быть прямая линия или некоторая периодическая функция. При построении диаграммы разброса нужно иметь в виду постоянно возникающую трудность графического изображения соотношений, связывающих большое число переменных. Частично эту трудность можно преодолеть, построив несколько графиков, каждый из которых отражает зависимость функции отклика от одной переменной при фиксированных значениях всех остальных.
Рис. 2. Диаграммы разброса
Задачу подбора вида функции, наилучшим образом соответствующей конфигурации кривой, называют подгонкой кривых по точкам. Для этой цели используют графические изображения наиболее характерных функций, некоторые из которых показаны на рис. 3.
ри подгонке кривых по точкам прежде всего следует определить количественный принцип соответствия теоретической функции экспериментальным точкам. В качестве меры такого соответствия было бы логичным принять минимальные отклонения по всем точкам, т. е. суммы всех отклонений. Но поскольку отклонения теоретических значений от экспериментальных могут быть положительными и отрицательными, то с математической точки зрения проще предварительно возвести эти отклонения в квадрат и обеспечить минимум для суммы квадратов отклонений. Этот метод, названный методом наименьших квадратов, соответствует критерию наилучшего приближения.
а)
б)
в)
Рис. 3. Различные виды регрессионных кривых
Для поиска математических зависимостей между переменными по накопленным экспериментальным данным обычно используют методы регрессионного и корреляционного анализов. Регрессионный анализ дает возможность построить по экспериментальным данным уравнение, а корреляционный анализ позволяет судить, насколько хорошо экспериментальные точки согласуются с выбранным уравнением, а также насколько тесна связь между двумя и более величинами, наблюдаемыми и фиксируемыми при моделировании.
Регрессионный анализ. Математический метод, обеспечивающий такую подгонку выбранной кривой, при которой экспериментальные точки описывают ее наилучшим образом в смысле критерия наименьших квадратов, называют регрессионным анализом.
Корреляционный анализ. Наилучшее приближение теоретической кривой к экспериментальным данным еще не означает, что реально существующая физическая зависимость соответствует именно этой кривой. Наглядный этому пример дает рис. 3, в. Описание экспериментальных точек прямой линией вполне соответствует методу наименьших квадратов, но не соответствует физической сущности явления, если мы не постулируем приближенное представление последнего в линейной постановке.
Для оценки согласованности экспериментальных точек с теоретическими прогнозами используют понятие корреляции. Если регрессия определяет эту согласованность по форме, то корреляция показывает, насколько точно она отражает действительность. Вместе с тем корреляция между переменными означает лишь то, что их изменения взаимосвязаны, однако это еще не доказывает наличие причинно-следственной связи между переменными.
Мерой корреляционной связи между переменными X a Y служит коэффициент корреляции rху, представляющий собой отношение корреляционного момента (математического ожидания произведения отклонений X и Y) к произведению средних квадратических отклонений этих величин
Для случая простой линейной регрессионной задачи (т.е. для случая, когда имеются одна зависимая и одна независимая переменные, связанные между собой линейно) коэффициент корреляции вычисляют по формуле
(2)
Коэффициент корреляции лежит в пределах от -1 до +1. Коэффициент корреляции, равный нулю, соответствует полному отсутствию корреляции (рис. 4, а). При наличии слабой (схема б) или сильной (схема в) положительной корреляции коэффициент корреляции соответственно равен +1 или близок к нему. Если этот коэффициент равен - 1, то имеет место сильная отрицательная корреляция (схема г).
Рис. 4. Виды корреляции
Литература:
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 12. Методы получения регрессионных уравнений
12.1 Полный факторный эксперимент
Изложение основ факторного планирования эксперимента начнем с простейшего примера.
Пусть имеется две входные переменные Х1 и Х2, одна из которых в интересующей нас области, заштрихованной на рис. 1, а, изменяется в пределах 0,4X10,8, а другая -- в пределах 10X230. В процессе проведения эксперимента найдены значения ординат поверхности отклика в граничных точках (рис. 1, а), приведенные в табл. 1.
Рис. 1. Полный факторный эксперимент
Поставим задачу поиска аналитического выражения функции отклика в линейной постановке, т.е. дадим приближенное представление этой функции в виде:
(1)
Таблица 1
№ точки (опыта) |
X1 |
X2 |
y |
|
1 |
0.4 |
10 |
38 |
|
2 |
0.8 |
10 |
68 |
|
3 |
0.4 |
30 |
32 |
|
4 |
0.8 |
30 |
62 |
Для формализации процедур обработки экспериментальных данных факторы удобно представлять в закодированном виде. С этой целью выберем новую систему координат x1 х2 у (рис. 1, а, 6), начало которой совместим с центром интересующей нас области, и назначим масштабы по осям факторов так, чтобы нижний уровень фактора соответствовал - 1, а верхний +1. Это легко достигается с помощью преобразований вида
(2)
где xi - кодированное значение i-ro фактора;
Хi - натуральное значение фактора;
Хо - нулевой уровень;
- интервал варьирования фактора.
Для фактора Х1 нулевой уровень и интервал варьирования будут равны
X10=(0,4+0,8)/2=0,6; X1 = (0,8-0,4)/2=0,2. Для фактора Х2 имеем: X20=(10 + 30)/2=20; X2 = (30-10)/2=10.
Кодированные значения факторов приведены в табл. 3.2.
В первом и пятом столбцах этой таблицы повторены значения табл. 1. Во втором столбце приведены значения фиктивной переменной x0, характеризующей свободный член bо в уравнении регрессии (1). Значения x0 всегда принимают равными +1. В 3 и 4 столбцах записаны искомые кодированные переменные; так, для фактора Х1 в первой точке кодированное значение будет x11=(0,4 - 0,6)/0,2= - 1. Подобные таблицы называют матрицами планирования полного факторного эксперимента.
Таблица 2
№ опыта |
X0 |
X1 |
X2 |
Y |
|
1 |
2 |
3 |
4 |
5 |
|
1 |
+1 |
-1 |
-1 |
38 |
|
2 |
+1 |
+1 |
-1 |
68 |
|
3 |
+1 |
-1 |
+1 |
32 |
|
4 |
+1 |
+1 |
+1 |
62 |
Все дальнейшие вычисления полностью формализованы. Коэффициенты регрессии уравнения (3.2) определяют по формуле
(3)
где xin - значение xi, в n-ом опыте;
N - число опытов;
уп - значение отклика в n-ом опыте.
Для вычисления коэффициентов регрессии по табличным данным достаточно перемножить данные столбцов у и соответствующих xi,сложить результаты и поделить их на число опытов.
Так, по данным табл. 2 будем иметь
Искомое линейное уравнение поверхности отклика в закодированных переменных будет:
В натуральной (не кодированной) форме это уравнение имеет вид:
(4)
Рассмотренный в примере план эксперимента соответствует двум факторам для линейной функции. Если поверхность отклика нелинейна, а вы пытаетесь представить ее приближенное выражение, то в уравнении регрессии (1) следует добавить член b12x1x2, учитывающий взаимодействие факторов х1 и х2. В нашем случае линейной исходной поверхности отклика этот член будет равен нулю, в чем нетрудно убедиться, добавив 6-й столбец, элементы которого равны произведениям элементов 3-го и 4-го столбцов.
В общем случае много факторного эксперимента уравнение регрессии имеет вид:
(5)
Параметр b0 называют общим средним, параметры bi - главными эффектами (взаимодействиями нулевого порядка), параметры bij - эффектами взаимодействия первого порядка (эффектами двухфакторных взаимодействий), параметры bijk - эффектами взаимодействий второго порядка (эффектами трехфакторных взаимодействий) и аналогично b123...n - эффектами взаимодействия порядка п-1 (эффектами n-факторных взаимодействий).
Наиболее часто используют два частных случая функции регрессии: линейную
(6)
и неполную квадратичную
(7)
Техника эксперимента с варьированием к факторов на двух уровнях сводится к проведению 2k опытов. Для построения матрицы планирования эксперимента при любом к следует дважды повторить матрицу планирования для случая к-1: один раз для нижнего уровня k-го фактора, а другой раз -- для верхнего. Последовательность достраивания матриц планирования при увеличении к от двух до пяти показана в табл. 3. Первые четыре (отчеркнутые) опыта соответствуют двухфакторному эксперименту типа 22, повторяя табл. 2. Восьмифакторный план типа 23 дважды повторяет двухфакторный эксперимент при варьировании третьего фактора сначала на нижнем, а затем на верхнем уровнях. Аналогично строят планы полных факторных экспериментов при других значениях k.
Таблица 3
№ |
X0 |
X1 |
X2 |
X3 |
X4 |
X5 |
|
1 |
+1 |
-1 |
-1 |
-1 |
-1 |
-1 |
|
2 |
+1 |
+1 |
-1 |
-1 |
-1 |
-1 |
|
3 |
+1 |
-1 |
+1 |
-1 |
-1 |
-1 |
|
4 |
+1 |
+1 |
+1 |
-1 |
-1 |
-1 |
|
5 |
+1 |
-1 |
-1 |
+1 |
-1 |
-1 |
|
6 |
+1 |
+1 |
-1 |
+1 |
-1 |
-1 |
|
7 |
+1 |
-1 |
+1 |
+1 |
-1 |
-1 |
|
8 |
+1 |
+1 |
+1 |
+1 |
-1 |
-1 |
|
9 |
+1 |
-1 |
-1 |
-1 |
+1 |
-1 |
|
10 |
+1 |
+1 |
-1 |
-1 |
+1 |
-1 |
|
11 |
+1 |
-1 |
+1 |
-1 |
+1 |
-1 |
|
12 |
+1 |
+1 |
+1 |
-1 |
+1 |
-1 |
|
13 |
+1 |
-1 |
-1 |
+1 |
+1 |
-1 |
|
14 |
+1 |
+1 |
-1 |
+1 |
+1 |
-1 |
|
15 |
+1 |
-1 |
+1 |
+1 |
+1 |
-1 |
|
16 |
+1 |
+1 |
+1 |
+1 |
+1 |
-1 |
|
17 |
+1 |
-1 |
-1 |
-1 |
-1 |
+1 |
|
18 |
+1 |
+1 |
-1 |
-1 |
-1 |
+1 |
|
19 |
+1 |
-1 |
+1 |
-1 |
-1 |
+1 |
|
20 |
+1 |
+1 |
+1 |
-1 |
-1 |
+1 |
|
21 |
+1 |
-1 |
-1 |
+1 |
-1 |
+1 |
|
22 |
+1 |
+1 |
-1 |
+1 |
-1 |
+1 |
|
23 |
+1 |
-1 |
+1 |
+1 |
-1 |
+1 |
|
24 |
+1 |
+1 |
+1 |
+1 |
-1 |
+1 |
|
25 |
+1 |
-1 |
-1 |
-1 |
+1 |
+1 |
|
26 |
+1 |
+1 |
-1 |
-1 |
+1 |
+1 |
|
27 |
+1 |
-1 |
+1 |
-1 |
+1 |
+1 |
|
28 |
+1 |
+1 |
+1 |
-1 |
+1 |
+1 |
|
29 |
+1 |
-1 |
-1 |
+1 |
+1 |
+1 |
|
30 |
+1 |
+1 |
-1 |
+1 |
+1 |
+1 |
|
31 |
+1 |
-1 |
+1 |
+1 |
+1 |
+1 |
|
32 |
+1 |
+1 |
+1 |
+1 |
+1 |
+1 |
После выбора факторов для каждого из них следует определить область, ограничивающую их возможное варьирование, и назначить основной уровень. Если, например, по условиям эксперимента нас интересует диапазон температуры воды от 20 до 60°С, то основной уровень (для середины интервала) составит 40°, нижний уровень 20°, верхний уровень 60°С. Разница значений между верхним и нижним уровнями фактора не может быть больше физически возможной. Например, для температуры обычной воды при нормальных условиях эта разность не может превысить 100°С. При этом интервал варьирования не должен быть меньше ошибки фиксирования уровня фактора, иначе верхний и нижний уровни окажутся Факторы, которые по тем или иным причинам невозможно учесть в эксперименте, необходимо во всех опытах стабилизировать на постоянных уровнях.
12.2 Дробный факторный эксперимент
Число опытов в полном факторном эксперименте быстро возрастает с ростом числа факторов. Так, при трех факторах будем иметь 23 = 8 опытов, при 5 факторах - 25 = 32 опыта, а при 8 факторах уже 28 = 256 опытов. Это вызывает необходимость разработки методов отбора части переменных, наиболее существенно влияющих на поверхность отклика. Поэтому, хотя полный факторный план 2k является удобным с точки зрения простоты проведения анализа параметров функции регрессии, тем не менее при большом числе факторов его применяют редко. 0ри трех и более факторах количество опытов можно существенно сократить за счет потери части информации, не очень существенной при построении линейных моделей. Для этого вместо плана 2* следует использовать описанный ниже дробный факторный план 2k-p (2k-pk+1), который предназначен для реализации 2k-p опытов. Для построения дробных планов (реплик) используют матрицы полного факторного эксперимента. Дробные планы создают делением числа опытов полного факторного эксперимента на число, кратное двум. Так получают 1/2 реплики (полуреплику), 1/4 реплики (четвертьреплику) и т. д.
Вначале рассмотрим линейную функцию регрессии, зависящую от трех факторов:
(8)
Для оценки четырех коэффициентов b0 , b1, b2, b3 требуется провести четыре опыта, а проведение полного факторного эксперимента, состоящего из восьми опытов, позволяет несмещенно оценить не только общее среднее b0 и главные эффекты b1,b2, b3, но также и всевозможные взаимодействия первого и второго порядков, т. е. все параметры неполной кубической модели
(9)
содержащей восемь коэффициентов. Следовательно, восемь опытов, поставленных для оценки коэффициентов линейной модели (8), будут содержать в два раза больше информации, чем требуется.
Для оценивания параметров функции регрессии (8) можно построить план, предназначенный для проведения не восьми, а четырех опытов. Для этой цели факторы х1 и х2 следует варьировать, как в плане 22, а в качестве уровня фактора х3 нужно выбрать значение взаимодействия, т.е. х3=х1х2. Получим план, определяемый матрицей, приведенной в табл. 4.
Рассмотрим вопрос построения дробных реплик более подробно. Вернемся к функции регрессии (9). Матрица плана этой модели приведена в табл. 5.
Таблица 4
№ опыта |
Матрица плана |
||||
X0 |
X1 |
X2 |
X3 |
||
1 |
+1 |
+1 |
+1 |
+1 |
|
2 |
+1 |
-1 |
+1 |
-1 |
|
3 |
+1 |
+1 |
-1 |
-1 |
|
4 |
+1 |
-1 |
-1 |
+1 |
Рассмотрите эту таблицу более внимательно и обратите внимание, что второй столбец таблицы совпадает с девятым, третий -- с восьмым, четвертый -- с седьмым, пятый -- с шестым. Следовательно, при использовании этого плана нет различий между x0 и x1x2x3; x1 и x2x3; х2 и x1x3; х3 и х1х2, т. е.
(10)
На этом основании можно утверждать, что вместо отыскания оценок восьми параметров функции регрессии (3.10) можно найти оценки лишь четырех смешанных коэффициентов:
(11)
При этом главные эффекты, включая общее среднее, оцениваются независимо друг от друга, но смешиваются соответственно с эффектами взаимодействий второго и первого порядка. Если постулируется линейная модель (8), то эффекты взаимодействий считаются незначительными, а смешанные коэффициенты (11) превращаются в параметры модели (8).
Таким образом, полный факторный эксперимент 23 при постулировании линейной модели можно рассматривать как совокупность двух полуреплик. Представленный в табл. 5 план называют полурепликой или планом 23-1 полученным из полного факторного плана 23 путем приравнивания единице произведения x1x2x3, т.е.
(12)
Это соотношение называется определяющим для данной полуреплики. Другая полуреплика 23-1 получится из определяющего соотношения x1x2x3, т. е. если уровни фактора х3 устанавливать в соответствии с равенством х3= --x1x2.
Обратите внимание на различие в структуре планов, представленных в табл. 4 и 5 (столбцы 2...4) с одной стороны, и в табл. 3 - с другой. Это различие сделало намеренно и не имеет принципиального значения. Заполнение столбцов 2--5 полного факторного плана может быть произвольным при непременном условии неповторяемости знаков в пределах одной строки. Однако при составлении полуреплик важно, чтобы выполнялось условие (12) или условие х1x2x3= - 1, т. е. для всех опытов данной полуреплики все строки в столбце для x1х2х3 имели одинаковый знак.
Для иллюстрации отмеченных положений рассмотрим конкретный пример. План полного факторного эксперимента и его результаты записаны в левой части (столбцах 1...6) табл. 5. Требуется составить уравнения регрессий для полного факторного эксперимента я для его дробных реплик, если известно, что функция отклика линейна (либо постулируется ее линейность).
Таблица 5
№ опыта |
х0 |
х1 |
х2 |
х3 |
y |
x1x2 |
x1x3 |
x2x3 |
x1x2x3 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
1 |
+1 |
-1 |
-1 |
-1 |
4 |
+1 |
+1 |
+1 |
-1 |
|
2 |
+1 |
+1 |
-1 |
-1 |
16 |
-1 |
-1 |
+1 |
+1 |
|
3 |
+1 |
-1 |
+1 |
-1 |
-4 |
-1 |
+1 |
-1 |
+1 |
|
4 |
+1 |
+1 |
+1 |
-1 |
8 |
+1 |
-1 |
-1 |
-1 |
|
5 |
+1 |
-1 |
-1 |
+1 |
8 |
+1 |
-1 |
-1 |
+1 |
|
6 |
+1 |
+1 |
-1 |
+1 |
20 |
-1 |
+1 |
-1 |
-1 |
|
7 |
+1 |
-1 |
+1 |
+1 |
0 |
-1 |
-1 |
+1 |
-1 |
|
8 |
+1 |
+1 |
+1 |
+1 |
12 |
+1 |
+1 |
+1 |
+1 |
Решение. Запишем уравнение регрессии для линейной поверхности отклика
(13)
Коэффициенты bi будем определять по формуле (3.4) в соответствии с приемами, указанными в пояснениях к этой формуле.
Вначале определим коэффициенты регрессии, используя данные полного факторного эксперимента (левую часть табл. 5). Будем иметь:
(14)
Построим дробные реплики, для чего заполним правую часть табл. 5 (столбцы 7...10) и выберем строки, у которых 10-й столбец имеет одинаковые знаки. В результате получим две полуреплики (таблица 6):
Таблица 6
№ опыта |
x0 |
x1 |
x2 |
x3 |
y |
|
1 |
2 |
3 |
4 |
5 |
6 |
|
Первая полуреплика |
||||||
2 |
+1 |
+1 |
-1 |
-1 |
16 |
|
3 |
+1 |
-1 |
+1 |
-1 |
-4 |
|
5 |
+1 |
-1 |
-1 |
+1 |
8 |
|
8 |
+1 |
+1 |
+1 |
+1 |
12 |
|
Вторая полуреплика |
||||||
1 |
+1 |
-1 |
-1 |
-1 |
4 |
|
4 |
+1 |
+1 |
+1 |
-1 |
8 |
|
6 |
+1 |
+1 |
-1 |
+1 |
20 |
|
7 |
+1 |
-1 |
+1 |
+1 |
0 |
Определим коэффициенты регрессии по дробным репликам.
Для первой полуреплики будем иметь:
b0 = (16 - 4 + 8 + 12) / 4 = 8;
b1 = (16 + 4 - 8 - 12) / 4 = 6;
b2 = (-1б - 4 - 8 + 12) / 4=-4;
b3 = (-16 + 4 + 8 + 12) / 4 = 2.
Для второй полуреплики будем иметь
b0=(4 + 8 + 20 + 0) / 4=8;
bl=(-4+8+20-0)/4=6;
b2 =(-4+8-20+0)/4=-4;
b3 = (-4-8 + 20)/4=2.
Как и следовало ожидать, во всех трех случаях для линейной поверхности отклика получены одинаковые результаты.
На рис. 2 приведена схема полного трехфакторного эксперимента и его полуреплик. Цифрами отмечены номера опытов с указанием в скобках координат факторов x1, x2,x3. Точки 2, 3, 5, 8 соответствуют первой полуреплике, а цифры I, 4, 6, 7 - второй. Обратите внимание, что каждая из полуреплик наиболее полно охватывает опытные точки факторного пространства.
Рис. 2. Схема трехфакторного эксперимента
При большом числе факторов т для оценивания параметров линейной функции регрессии (1) можно строить дробные реплики высокой степени дробности. Так, при т=7 можно построить дробную реплику из полного факторного плана 23 для первых трех факторов, приравняв четыре остававшихся фактора к двухфакторным и трехфакторному взаимодействиям трех других факторов, положив, например
(15)
Такую реплику записывают как 27-4.
В общем случае дробную реплику обозначают через 2т-p, если р факторов приравнены к произведениям остальных т--p факторов, уровни которых выбраны согласно полному факторному плану. Дробную реплику 2т-p можно строить различными способами. Для анализа системы смешивания коэффициентов пользуются понятиями генерирующих и определяющих соотношений.
Генерирующими называют соотношения, с помощью которых построена дробная реплика. Так, для реплики, представленной в табл. 5, генерирующим является соотношение х3=x1х2, а это указывает, что фактор х3 занимает в матрице столбец, соответствующий взаимодействию x1x2. Для указанной выше реплики 27-4 генерирующим является соотношение (15).
Определяющим соотношением (определяющим контрастом) называют равенство, в левой части которого стоит единица, а в правой -- какое-либо произведение факторов. Для дробной реплики 2т-p можно получить p различных определяющих соотношений из генерирующих путем умножения обеих частей последних на их левые части с последующей заменой (хi)2 на 1 (i=1, .., т). Другие определяющие соотношения получаются путем перемножения ранее полученных и выделения среди них новых. Например, для реплики (табл. 5) определяющим является соотношение (12).
Построим определяющие соотношения для реплики 27-4, задаваемой генерирующими соотношениями (15). Умножая обе части равенств (15) на их левые части, получаем четыре определяющих соотношения:
(16)
Попарное перемножение этих четырех соотношений дает шесть новых:
(17)
Перемножение каждой тройки из четырех соотношений (16) Дает еще три определяющих соотношения:
(18)
Наконец, перемножая все четыре соотношения (16), получаем
(19)
Легко понять, что кроме (16) - (19), других определяющих соотношений для рассмотренной реплики 2+7-4 нет.
Знание определяющих соотношений позволяет найти всю систему совместных оценок без изучения матрицы планирования дробной реплики. Для того чтобы определить, с какими взаимодействиями смешано данное, нужно на него умножить обе части всех определяющих соотношений.
Определим, например, с какими взаимодействиями смешан главный эффект b3 в дробной реплике 27-4, определяемой генерирующими соотношениями (15). Для этого умножим все определяющие соотношения (16) - (19) на х3. Получим
Следовательно, главный эффект b3 смешан с эффектами взаимодействий первого порядка с эффектами взаимодействий второго порядка третьего порядка четвертого порядка и пятого порядка
В конкретной практической ситуации для выбора подходящей дробной реплики полного факторного плана необходимо использовать все априорные сведения теоретического и интуитивного характера об объекте планирования с целью выделения тех факторов и произведений факторов, влияние которых на результаты измерений существенно. При этом смешивание нужно производить так, чтобы общее среднее b0 и главные эффекты b1,..., bm были смешаны с эффектами взаимодействий самого высокого порядка (так как обычно они отсутствуют) или с эффектами таких взаимодействий, о которых известно, что они оказывают несущественное влияние на результаты измерений. Отсюда следует, в частности, что недопустимо произвольное разбиение полного факторного плана 23 на две части для выделения полуреплики 23-1.
Качество дробного факторного плана иногда характеризуют с помощью разрешающей способности плана, которая равна наименьшему числу символов в правых частях определяющих соотношений. В частности, для плана разрешающей способности III ни один главный эффект не смешан ни с каким другим главным эффектом, но главные эффекты смешаны с эффектами двухфакторных взаимодействий. Для плана разрешающей способности IV главные эффекты не смешаны друг с другом и с эффектами двухфакторных взаимодействий, но последние друг с другом смешаны. Для плана разрешающей способности V главные эффекты и эффекты двухфакторных взаимодействий не смешаны, но последние смешаны с эффектами трехфакторных взаимодействий. Все три рассмотренные выше дробные реплики имеют разрешающую способность III.
12.3 Метод наименьших квадратов
Рассмотрим особенности регрессионного анализа результатов моделирования на примере построения линейной регрессионной модели.
На рис. 3.9 показаны точки (xi, yi), полученные в эксперименте. Делаем предположение, что функция отклика может быть представлена в виде прямой линии
Требуется получить такие значения коэффициентов b0 и b1, при которых сумма квадратов ошибок будет минимальной. На рисунке ошибки ei для каждой экспериментальной точки равны расстояниям по вертикали от этой точки до линии регрессии (рис. 3).
Рис. 3. К построению регрессионной модели
Обозначим (yt)i =b0+ b0xi (здесь (уt)i - величина, предсказываемая регрессионной моделью), тогда выражение для ошибок будет иметь вид а функция ошибки
Для получения коэффициентов b0 и b1 при которых функция F0 будет минимальной, приравняем нулю частные производные dF0 /db0 и dF0 /db1. Будем иметь:
(20)
Таким образом, получена система двух линейных алгебраических уравнений:
(21)
Решая систему этих уравнений, получим
(22)
где N - число реализаций при моделировании.
Мы рассмотрели частный случай для уравнения (22). В более общем случае, когда эмпирическую функцию принимают в виде полинома
(23)
система уравнений типа (22), (23) будет иметь вид
(24)
Для оценки точности совпадения теоретических и экспериментальных данных следует определить среднюю квадратичную ошибку на единицу веса
(25)
или среднее абсолютное отклонение
(26)
где r - число вычисляемых (табличных) значений;
s - число параметров.
Последовательность вычислений при построении уравнения регрессии на основе метода наименьших квадратов рассмотрим на конкретном примере.
Пусть например необходимо подобрать уравнение регрессии по экспериментальным данным, приведенным ниже.
x |
0 |
0.5 |
1.0 |
1.5 |
2.0 |
|
y |
7.0 |
4.8 |
2.8 |
1.4 |
0 |
Вначале попытаемся в качестве типа эмпирической формулы принять линейную зависимость, удерживая в формуле два первых члена:
Составим нормальные уравнения, для чего предварительно заполним таблицу В таблице предусмотрим дополнительные столбцы 4, 5 и 8, которые нам могут потребоваться в дальнейшем (таблица 7).
Таблица 7
x0 |
x |
x2 |
x3 |
x4 |
y |
xy |
x2y |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
0 |
0 |
0 |
0 |
7.0 |
0 |
0 |
|
1 |
0.5 |
0.25 |
0.125 |
0.0625 |
4.8 |
2.4 |
1.2 |
|
1 |
1.0 |
1 |
1 |
1 |
2.8 |
2.8 |
2.8 |
|
1 |
1.5 |
2.25 |
3.375 |
5.0625 |
1.4 |
2.1 |
3.15 |
|
1 |
2.0 |
4 |
8 |
16 |
0 |
0 |
0 |
|
5 |
5 |
7.5 |
12.5 |
22.125 |
16 |
7.3 |
7.15 |
Пользуясь данными столбцов 1, 2, 3, 6, 7, составим нормальные уравнения (3.26), которые применительно к нашему случаю при удержании только двух первых членов формулы будут иметь вид:
Подставляя табличные данные, получим:
Решая эти уравнения, найдем: b0 =6,68; b1 = -3,48, следовательно,
Оценим точность выполненных построений. Подставив в полученную формулу значения x (табл. 8), определим вычисленные значения уt и отклонения.
Таблица 8
x |
yt |
y-yt |
(y-yt)2 |
|
0 0.5 1.0 1.5 2.0 |
+6.68 +4.94 +3.20 +1.46 -0.28 |
+0.32 -0.14 -0.40 -0.06 +0.28 |
0.1024 0.0196 0.1600 0.0036 0.0784 |
Суммируя данные последнего столбца, будем иметь:
Средняя квадратическая ошибка на единицу веса
Среднее абсолютное отклонение (5.9) равно
Полученные величины показывают, что формула подобрана неудовлетворительно, так как исходные данные имеют точность до 0,1, а средняя квадратическая ошибка на единицу веса значительно больше 0,1.
Повторим все операции, используя более точное выражение
Для записи нормальных уравнений (7) дополним вспомогательную табл. 3.8 новыми данными, которые приведены в столбцах 4, 5, 8 и выделены курсивом. Составим нормальные уравнения:
После решения этой системы найдем b0=7.00; b1=-4.74; b2=0.63 и запишем искомую зависимость:
Для определения средней квадратической ошибки составим табл. 9.
Таблица 9
x |
yt |
y-yt |
(y-yt)2 |
|
0 0.5 1.0 1.5 2.0 |
7,0 4.79 2,89 1.30 0.04 |
0 +0.01 -0.09 +0.10 -0.04 |
0 0.0001 0.0081 0.0100 0.0016 |
Суммируя последний столбец, получим
Средняя квадратическая ошибка на единицу веса
Среднее абсолютное отклонение
Следовательно, формула вполне удовлетворительно соответствует экспериментальным данным.
Литература
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 13. Кластерный анализ
13.1 Основная цель кластерного анализа
Термин кластерный анализ (впервые ввел Tryon, 1939) в действительности включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры, т.е. развернуть таксономии. Например, биологи ставят цель разбить животных на различные виды, чтобы содержательно описать различия между ними. В соответствии с современной системой, принятой в биологии, человек принадлежит к приматам, млекопитающим, амниотам, позвоночным и животным. Заметьте, что в этой классификации, чем выше уровень агрегации, тем меньше сходства между членами в соответствующем классе. Человек имеет больше сходства с другими приматами (т.е. с обезьянами), чем с 'отдаленными' членами семейства млекопитающих (например, собаками) и т.д. Далее мы рассмотрим общие методы кластерного анализ: Объединение (древовидная кластеризация), Двувходовое объединение и Метод K средних.
Заметим, что предыдущие рассуждения ссылаются на алгоритмы кластеризации, но ничего не упоминают о проверке статистической значимости. Фактически, кластерный анализ является не столько обычным статистическим методом, сколько 'набором' различных алгоритмов распределения объектов по кластерам'. Существует точка зрения, что в отличие от многих других статистических процедур, методы кластерного анализа используются в большинстве случаев тогда, когда вы не имеете каких-либо априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования. Следует понимать, что кластерный анализ определяет 'наиболее возможно значимое решение'. Поэтому проверка статистической значимости в действительности здесь неприменима, даже в случаях, когда известны p-уровни (как, например, в методе K средних).
Техника кластеризации применяется в самых разнообразных областях. Хартиган (Hartigan, 1975) дал прекрасный обзор многих опубликованных исследований, содержащих результаты, полученные методами кластерного анализа. Например, в области медицины кластеризация заболеваний, лечения заболеваний или симптомов заболеваний приводит к широко используемым таксономиям. В области психиатрии правильная диагностика кластеров симптомов, таких как паранойя, шизофрения и т.д., является решающей для успешной терапии. В археологии с помощью кластерного анализа исследователи пытаются установить таксономии каменных орудий, похоронных объектов и т.д. Известны широкие применения кластерного анализа в маркетинговых исследованиях. В общем, всякий раз, когда необходимо классифицировать 'горы' информации к пригодным для дальнейшей обработки группам, кластерный анализ оказывается весьма полезным и эффективным.
13.2 Объединение (древовидная кластеризация)
Приведенный пример поясняет цель алгоритма объединения (древовидной кластеризации). Назначение этого алгоритма состоит в объединении объектов (например, животных) в достаточно большие кластеры, используя некоторую меру сходства или расстояние между объектами. Типичным результатом такой кластеризации является иерархическое дерево.
Иерархическое дерево
Рассмотрим горизонтальную древовидную диаграмму. Диаграмма начинается с каждого объекта в классе (в левой части диаграммы). Теперь представим себе, что постепенно (очень малыми шагами) вы 'ослабляете' ваш критерий о том, какие объекты являются уникальными, а какие нет. Другими словами, вы понижаете порог, относящийся к решению об объединении двух или более объектов в один кластер.
В результате, вы связываете вместе всё большее и большее число объектов и агрегируете (объединяете) все больше и больше кластеров, состоящих из все сильнее различающихся элементов. Окончательно, на последнем шаге все объекты объединяются вместе. На этих диаграммах горизонтальные оси представляют расстояние объединения (в вертикальных древовидных диаграммах вертикальные оси представляют расстояние объединения). Так, для каждого узла в графе (там, где формируется новый кластер) вы можете видеть величину расстояния, для которого соответствующие элементы связываются в новый единственный кластер. Когда данные имеют ясную 'структуру' в терминах кластеров объектов, сходных между собой, тогда эта структура, скорее всего, должна быть отражена в иерархическом дереве различными ветвями. В результате успешного анализа методом объединения появляется возможность обнаружить кластеры (ветви) и интерпретировать их.
Меры расстояния
Объединение или метод древовидной кластеризации используется при формировании кластеров несходства или расстояния между объектами. Эти расстояния могут определяться в одномерном или многомерном пространстве. Например, если вы должны кластеризовать типы еды в кафе, то можете принять во внимание количество содержащихся в ней калорий, цену, субъективную оценку вкуса и т.д. Наиболее прямой путь вычисления расстояний между объектами в многомерном пространстве состоит в вычислении евклидовых расстояний. Если вы имеете двух- или трёхмерное пространство, то эта мера является реальным геометрическим расстоянием между объектами в пространстве (как будто расстояния между объектами измерены рулеткой). Однако алгоритм объединения не 'заботится' о том, являются ли 'предоставленные' для этого расстояния настоящими или некоторыми другими производными мерами расстояния, что более значимо для исследователя; и задачей исследователей является подобрать правильный метод для специфических применений.
Евклидово расстояние. Это, по-видимому, наиболее общий тип расстояния. Оно попросту является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом:
расстояние(x,y) = {i (xi - yi)2 }1/2
Заметим, что евклидово расстояние (и его квадрат) вычисляется по исходным, а не по стандартизованным данным. Это обычный способ его вычисления, который имеет определенные преимущества (например, расстояние между двумя объектами не изменяется при введении в анализ нового объекта, который может оказаться выбросом). Тем не менее, на расстояния могут сильно влиять различия между осями, по координатам которых вычисляются эти расстояния. К примеру, если одна из осей измерена в сантиметрах, а вы потом переведете ее в миллиметры (умножая значения на 10), то окончательное евклидово расстояние (или квадрат евклидова расстояния), вычисляемое по координатам, сильно изменится, и, как следствие, результаты кластерного анализа могут сильно отличаться от предыдущих.
Квадрат евклидова расстояния. Иногда может возникнуть желание возвести в квадрат стандартное евклидово расстояние, чтобы придать большие веса более отдаленным друг от друга объектам. Это расстояние вычисляется следующим образом (см. также замечания в предыдущем пункте):
расстояние(x,y) = i (xi - yi)2
Расстояние городских кварталов (манхэттенское расстояние). Это расстояние является просто средним разностей по координатам. В большинстве случаев эта мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида. Однако отметим, что для этой меры влияние отдельных больших разностей (выбросов) уменьшается (так как они не возводятся в квадрат). Манхэттенское расстояние вычисляется по формуле:
расстояние(x,y) = i |xi - yi|
Расстояние Чебышева. Это расстояние может оказаться полезным, когда желают определить два объекта как 'различные', если они различаются по какой-либо одной координате (каким-либо одним измерением). Расстояние Чебышева вычисляется по формуле:
расстояние(x,y) = Максимум|xi - yi|
Степенное расстояние. Иногда желают прогрессивно увеличить или уменьшить вес, относящийся к размерности, для которой соответствующие объекты сильно отличаются. Это может быть достигнуто с использованием степенного расстояния. Степенное расстояние вычисляется по формуле:
расстояние(x,y) = (i |xi - yi|p)1/r
где r и p - параметры, определяемые пользователем. Несколько примеров вычислений могут показать, как 'работает' эта мера. Параметр p ответственен за постепенное взвешивание разностей по отдельным координатам, параметр r ответственен за прогрессивное взвешивание больших расстояний между объектами. Если оба параметра - r и p, равны двум, то это расстояние совпадает с расстоянием Евклида.
Процент несогласия. Эта мера используется в тех случаях, когда данные являются категориальными. Это расстояние вычисляется по формуле:
расстояние(x,y) = (Количество xi yi)/ i
Правила объединения или связи
На первом шаге, когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Однако когда связываются вместе несколько объектов, возникает вопрос, как следует определить расстояния между кластерами? Другими словами, необходимо правило объединения или связи для двух кластеров. Здесь имеются различные возможности: например, вы можете связать два кластера вместе, когда любые два объекта в двух кластерах ближе друг к другу, чем соответствующее расстояние связи. Другими словами, вы используете 'правило ближайшего соседа' для определения расстояния между кластерами; этот метод называется методом одиночной связи. Это правило строит 'волокнистые' кластеры, т.е. кластеры, 'сцепленные вместе' только отдельными элементами, случайно оказавшимися ближе остальных друг к другу. Как альтернативу вы можете использовать соседей в кластерах, которые находятся дальше всех остальных пар объектов друг от друга. Этот метод называется метод полной связи. Существует также множество других методов объединения кластеров, подобных тем, что были рассмотрены.
Одиночная связь (метод ближайшего соседа). Как было описано выше, в этом методе расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Это правило должно, в известном смысле, нанизывать объекты вместе для формирования кластеров, и результирующие кластеры имеют тенденцию быть представленными длинными 'цепочками'.
Полная связь (метод наиболее удаленных соседей). В этом методе расстояния между кластерами определяются наибольшим расстоянием между любыми двумя объектами в различных кластерах (т.е. 'наиболее удаленными соседями'). Этот метод обычно работает очень хорошо, когда объекты происходят на самом деле из реально различных 'рощ'. Если же кластеры имеют в некотором роде удлиненную форму или их естественный тип является 'цепочечным', то этот метод непригоден.
Невзвешенное попарное среднее. В этом методе расстояние между двумя различными кластерами вычисляется как среднее расстояние между всеми парами объектов в них. Метод эффективен, когда объекты в действительности формируют различные 'рощи', однако он работает одинаково хорошо и в случаях протяженных ('цепочного' типа) кластеров. Отметим, что в своей книге Снит и Сокэл (Sneath, Sokal, 1973) вводят аббревиатуру UPGMA для ссылки на этот метод, как на метод невзвешенного попарного арифметического среднего - unweighted pair-group method using arithmetic averages.
Взвешенное попарное среднее. Метод идентичен методу невзвешенного попарного среднего, за исключением того, что при вычислениях размер соответствующих кластеров (т.е. число объектов, содержащихся в них) используется в качестве весового коэффициента. Поэтому предлагаемый метод должен быть использован (скорее даже, чем предыдущий), когда предполагаются неравные размеры кластеров. В книге Снита и Сокэла (Sneath, Sokal, 1973) вводится аббревиатура WPGMA для ссылки на этот метод, как на метод взвешенного попарного арифметического среднего - weighted pair-group method using arithmetic averages.
Невзвешенный центроидный метод. В этом методе расстояние между двумя кластерами определяется как расстояние между их центрами тяжести. Снит и Сокэл (Sneath and Sokal (1973)) используют аббревиатуру UPGMC для ссылки на этот метод, как на метод невзвешенного попарного центроидного усреднения - unweighted pair-group method using the centroid average.
Взвешенный центроидный метод (медиана). тот метод идентичен предыдущему, за исключением того, что при вычислениях используются веса для учёта разницы между размерами кластеров (т.е. числами объектов в них). Поэтому, если имеются (или подозреваются) значительные отличия в размерах кластеров, этот метод оказывается предпочтительнее предыдущего. Снит и Сокэл (Sneath, Sokal 1973) использовали аббревиатуру WPGMC для ссылок на него, как на метод невзвешенного попарного центроидного усреднения - weighted pair-group method using the centroid average.
Метод Варда. Этот метод отличается от всех других методов, поскольку он использует методы дисперсионного анализа для оценки расстояний между кластерами. Метод минимизирует сумму квадратов (SS) для любых двух (гипотетических) кластеров, которые могут быть сформированы на каждом шаге. Подробности можно найти в работе Варда (Ward, 1963). В целом метод представляется очень эффективным, однако он стремится создавать кластеры малого размера.
13.3 Двувходовое объединение
Ранее этот метод обсуждался в терминах 'объектов', которые должны быть кластеризованы (см. Объединение (древовидная кластеризация)). Во всех других видах анализа интересующий исследователя вопрос обычно выражается в терминах наблюдений или переменных. Оказывается, что кластеризация, как по наблюдениям, так и по переменным может привести к достаточно интересным результатам. Например, представьте, что медицинский исследователь собирает данные о различных характеристиках (переменные) состояний пациентов (наблюдений), страдающих сердечными заболеваниями. Исследователь может захотеть кластеризовать наблюдения (пациентов) для определения кластеров пациентов со сходными симптомами. В то же самое время исследователь может захотеть кластеризовать переменные для определения кластеров переменных, которые связаны со сходным физическим состоянием.
После этого обсуждения, относящегося к тому, кластеризовать наблюдения или переменные, можно задать вопрос, а почему бы не проводить кластеризацию в обоих направлениях? Модуль Кластерный анализ содержит эффективную двувходовую процедуру объединения, позволяющую сделать именно это. Однако двувходовое объединение используется (относительно редко) в обстоятельствах, когда ожидается, что и наблюдения и переменные одновременно вносят вклад в обнаружение осмысленных кластеров.
Так, возвращаясь к предыдущему примеру, можно предположить, что медицинскому исследователю требуется выделить кластеры пациентов, сходных по отношению к определенным кластерам характеристик физического состояния. Трудность с интерпретацией полученных результатов возникает вследствие того, что сходства между различными кластерами могут происходить из (или быть причиной) некоторого различия подмножеств переменных. Поэтому получающиеся кластеры являются по своей природе неоднородными. Возможно это кажется вначале немного туманным; в самом деле, в сравнении с другими описанными методами кластерного анализа (Объединение (древовидная кластеризация) и Метод K средних), двувходовое объединение является, вероятно, наименее часто используемым методом. Однако некоторые исследователи полагают, что он предлагает мощное средство разведочного анализа данных (за более подробной информацией вы можете обратиться к описанию этого метода у Хартигана (Hartigan, 1975)).
13.4 Метод K средних
Этот метод кластеризации существенно отличается от таких агломеративных методов, как Объединение (древовидная кластеризация) и Двувходовое объединение. Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.
Пример
В примере с физическим состоянием (в пункте 13.3 Двувходовое объединение), медицинский исследователь может иметь 'подозрение' из своего клинического опыта, что его пациенты в основном попадают в три различные категории. Далее он может захотеть узнать, может ли его интуиция быть подтверждена численно, то есть, в самом ли деле кластерный анализ K средних даст три кластера пациентов, как ожидалось? Если это так, то средние различных мер физических параметров для каждого кластера будут давать количественный способ представления гипотез исследователя (например, пациенты в кластере 1 имеют высокий параметр 1, меньший параметр 2 и т.д.).
Вычисления
С вычислительной точки зрения вы можете рассматривать этот метод, как дисперсионный анализ 'наоборот'. Программа начинает с K случайно выбранных кластеров, а затем изменяет принадлежность объектов к ним, чтобы: (1) - минимизировать изменчивость внутри кластеров, и (2) - максимизировать изменчивостьмежду кластерами. Данный способ аналогичен методу 'дисперсионный анализ (ANOVA) наоборот' в том смысле, что критерий значимости в дисперсионном анализе сравнивает межгрупповую изменчивость с внутригрупповой при проверке гипотезы о том, что средние в группах отличаются друг от друга. В кластеризации методом K средних программа перемещает объекты (т.е. наблюдения) из одних групп (кластеров) в другие для того, чтобы получить наиболее значимый результат при проведении дисперсионного анализа (ANOVA).
Интерпретация результатов
Обычно, когда результаты кластерного анализа методом K средних получены, можно рассчитать средние для каждого кластера по каждому измерению, чтобы оценить, насколько кластеры различаются друг от друга. В идеале вы должны получить сильно различающиеся средние для большинства, если не для всех измерений, используемых в анализе. ЗначенияF-статистики, полученные для каждого измерения, являются другим индикатором того, насколько хорошо соответствующее измерение дискриминирует кластеры.
13.5 Алгоритм нечеткой кластеризации
Алгоритм нечеткой кластеризации называют FCM-алгоритмом (Fuzzy Classifier Means, Fuzzy C-Means). Целью FCM-алгоритма кластеризации является автоматическая классификация множества объектов, которые задаются векторами признаков в пространстве признаков. Другими словами, такой алгоритм определяет кластеры и соответственно классифицирует объекты. Кластеры представляются нечеткими множествами, и, кроме того, границы между кластерами также являются нечеткими.
FCM-алгоритм кластеризации предполагает, что объекты принадлежат всем кластерам с определенной ФП. Степень принадлежности определяется расстоянием от объекта до соответствующих кластерных центров. Данный алгоритм итерационно вычисляет центры кластеров и новые степени принадлежности объектов.
Для заданного множества К входных векторов и N выделяемых кластеров предполагается, что любой принадлежит любому с принадлежностью , где j - номер кластера, a k - входного вектора. Принимаются во внимание следующие условия нормирования для :
;
Цель алгоритма - минимизация суммы всех взвешенных расстояний :
где q - фиксированный параметр, задаваемый перед итерациями.
Для достижения вышеуказанной цели необходимо решить следующую систему уравнений:
, .
Совместно с условиями нормирования ид данная система дифференциальных уравнений имеет следующее решение:
(взвешенный центр гравитации) и
Алгоритм нечеткой кластеризации выполняется по шагам.
Шаг 1. Инициализация.
Выбираются следующие параметры:
необходимое количество кластеров N, ;
мера расстояний, как Евклидово расстояние;
фиксированный параметр q (обычно ~ 1,5);
начальная (на нулевой итерации) матрица принадлежности объектов xk с учетом заданных начальных центров кластеров .
Шаг 2. Регулирование позиций центров кластеров.
На t-м итерационном шаге при известной матрице вычисляется в соответствии с вышеприведенным решением системы дифференциальных уравнений.
Шаг 3. Корректировка значений принадлежности .
Учитывая известные , вычисляются , если , в противном случае:
Шаг 4. Остановка алгоритма.
Алгоритм нечеткой кластеризации останавливается при выполнении следующего условия:
где - матричная норма (например, Евклидова норма);
- заранее задаваемый уровень точности.
Литература:
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 14. Когнитивное моделирование
14.1 Понятие когнитивного моделирования
При принятии решений в неструктурированных ситуациях у субъекта (ЛПР или эксперта) возникает модель проблемной области, на основе которой он пытается объяснить происходящие в реальности процессы. При этом объективные закономерности реального мира представляются субъективными экспертными оценками. В результате образ наблюдаемой ситуации отражает не только законы и закономерности ситуации, но и мировоззрение субъекта, его систему убеждений, ценностей, уровень образования, опыт и т.д. [Checkland, 1981].
В этих условиях принятие решений - это искусство, включающее рациональные (логические) и интуитивные начала. В синтезе рационального и интуитивного возникает способность ЛПР принимать своевременные и адекватные решения.
Когнитивный подход к поддержке принятия решений ориентирован на то, чтобы активизировать интеллектуальные процессы субъекта и помочь ему зафиксировать свое представление проблемной ситуации в виде формальной модели. В качестве такой модели обычно используется так называемая когнитивная карта ситуации, которая представляет известные субъекту основные законы и закономерности наблюдаемой ситуации в виде ориентированного знакового графа, в котором вершины графа - это факторы (признаки, характеристики ситуации), а дуги между факторами - причинно-следственные связи между факторами [Робертс, 1986].
В когнитивной модели выделяют два типа причинно-следственных связей: положительные и отрицательные. При положительной связи увеличение значения фактора-причины приводит к увеличению значения фактора-следствия, а при отрицательной связи увеличение значения фактора-причины приводит к уменьшению значения фактора-следствия. Пример когнитивной карты некоторой экономической ситуации приведен на рис.1.
Рис.1. Пример когнитивной карты
Причинно-следственный граф представляет собой упрощенную субъективную модель функциональной организации наблюдаемой системы и является «сырым» материалом для дальнейших исследований и преобразований - когнитивного моделирования.
Цель когнитивного моделирования заключается в генерации и проверке гипотез о функциональной структуре наблюдаемой ситуации до получения функциональной структуры, способной объяснить поведение наблюдаемой ситуации.
Основные требования к компьютерным системам когнитивного моделирования - это открытость к любым возможным изменениям множества факторов ситуации, причинно-следственных связей, получение и объяснение качественных прогнозов развития ситуации (решение прямой задачи «Что будет, если …»), получение советов и рекомендаций по управлению ситуацией (решение обратной задачи «Что нужно, чтобы …»).
Узким местом существующих систем когнитивного моделирования ситуаций [Максимов, 1999; Кулинич, 1998; Силов, 1995] является несогласованность их пользовательского интерфейса и алгоритмов обработки с психологическими особенностями субъективного измерения значений и силы взаимовлияния факторов наблюдаемой ситуации. Эта несогласованность приводит к ошибкам и заблуждениям эксперта при определении силы взаимовлияния факторов, которые включаются в когнитивную модель ситуации. Разработка стратегии поведения субъекта на основе когнитивной модели с заблуждениями, естественно, приводит к стратегиям-заблуждениям.
В предлагаемой компьютерной системе концептуального моделирования неструктурированных ситуаций «Канва» влияние заблуждений эксперта ослабляется с помощью специальных программных модулей и подсистем, учитывающих особенности организации человеческой системы измерения, оценки и переработки субъективной информации.
Подсистемы системы концептуального моделирования «Канва» обеспечивают поддержку представления субъективной информации, извлечения предпочтений эксперта, обработку, представление результатов моделирования и поддержку аналитической деятельности эксперта.
Описание функционального назначения всех подсистем системы концептуального моделирования и их взаимодействие в процессе когнитивного анализа и моделирования плохо определенной ситуации приводится ниже.
14.2 Подсистема представления субъективной информации
Подсистема представления субъективной информации обеспечивает:
- Ввод в систему факторов, описывающих ситуацию, множество факторов - F={fi}.
- Задание числовых или лингвистических значений фактора в виде упорядоченного множества их абсолютных значений.
- Графический интерфейс для построения когнитивной модели ситуации в виде ориентированного знакового графа.
В подсистеме представления субъективной информации в качестве измерительных шкал значений наблюдаемых факторов ситуации используются порядковые шкалы, что позволяет интегрировать в единую модель ситуации факторы, имеющие числовые и лингвистические значения.
Когнитивная модель ситуации представляется в виде ориентированного знакового графа и задается матрицей смежности W={wij}, wij{-1,0,1} .
Окно графического редактора системы «Канва» для построения и редактирования орграфа ситуации приведено на рис.2.
Графический интерфейс представляет собой полноценный графический редактор, обеспечивающий: ввод нового фактора, установку причинной связи между факторами, определение направления и типа связи (положительная, отрицательная), удаление фактора, удаление связи, изменение масштаба представления графа.
Рис.2. Окно графического редактора
14.3 Подсистема извлечения предпочтений эксперта
Для определения силы взаимовлияния факторов в систему моделирования встроена подсистема извлечения предпочтений эксперта. В этой подсистеме в качестве исходной информации используется информация о числовых или лингвистических значениях факторов ситуации и знаковый граф ситуации, введенные в подсистеме представления субъективной информации. Исходная информация используется системой для порождения вопросов эксперту, из ответов на которые извлекается информация о силе причинных связей факторов ситуации.
Система обеспечивает генерацию вопросов эксперту и определение силы причинных связей между факторами в трех режимах:
Прямого оценивания. В этом режиме сила причинной связи определяется как передаточный коэффициент, вычисляемый по известным отклонениям фактора причины и фактора следствия. Задание отклонения значений факторов выполняется в двух режимах:
точное задание значений отклонений факторов причины и следствия;
задание отклонения значений факторов причины или следствия в виде нечеткого множества - функции принадлежности, заданной на множестве значений факторов.
Парного сравнения. В этом режиме с помощью процедуры парного сравнения осуществляется упорядочивание факторов причин по силе влияния на фактор следствия. В режиме парного сравнения осуществляется автоматическое обнаружение ошибок (нетранзитивных оценок) эксперта и их автоматическая или ручная корректировка.
Задание функциональной зависимости. В этом режиме значение фактора следствия определяется как функция от значений факторов причин. Этот режим используется в случае, если все значения факторов причин имеют числовые значения и известна их функциональная зависимость.
14.4 Подсистема обработки
После определения силы взаимовлияния всех связанных причинными связями факторов, знаковый орграф преобразуется во взвешенный орграф. Динамика процессов ситуации описывается системой уравнений продукций «Если, … То …». В матричном виде эта система уравнений записывается в следующем виде:
Z(t+1)=WZ(t) (1)
где, Z(t)=(zi(t)) - начальный вектор приращений значений факторов в момент времени t; Z(t+1)=(zi(t+1)) - вектор приращений значений факторов в момент времени t+1, zi(t)[_1,1]; W=|wij| - матрица смежности, wij[-1,1] - характеризует силу причинной связи.
Приращения значений факторов в последовательные дискретные моменты времени Z(t+1), … , Z(t+n) вычисляются с применением следующего правила композиции [Силов, 1995]:
zi(t)=max(zi+(t), zi-(t))
где, zi+(t)= (zj(t-1).wij) - максимальное положительное, а zi-(t) - максимальное по модулю отрицательное zi-(t)= (|zj(t-1).wij)| приращение значения фактора-следствия.
Приращение значения фактора zi(t) Z(t), t, представляется парой [Силов, 1995]: zi(t), ci(t), где, ci(t) - консонанс значения фактора, 0 ci(t) 1,
ci(t)=
Консонанс фактора характеризует уверенность субъекта в приращении значения zi(t) фактора fi. При ci(t)1, т.е. zi+(t)>>|zi-(t)| или |zi-(t)|>>zi+(t) уверенность субъекта в значении фактора zi(t) максимальна, а при ci(t) 0, т.е. zi+(t) |zi-(t)| минимальна. Интервалы значений консонанса в системе «Канва» имеют лингвистическую интерпретацию типа «Невозможно», «Возможно», «Достоверно» и т.д.
Результаты моделирования представляются в виде двумерного массива, строки которого - значения одного фактора в последовательные моменты времени, столбцы - значения всех факторов в последовательные моменты времени. Информация из двумерного массива данных избирательно используется подсистемами представления результатов моделирования и поддержки аналитической деятельности эксперта.
14.5 Подсистема представления результатов моделирования
Результаты моделирования в системе «Канва» представляются в графическом или табличном виде.
Рис.3.
Прогнозные абсолютные числовые и лингвистические значения факторов, а также отклонения значений факторов представляются в графическом виде или в таблицах на естественном и понятном эксперту языке.
На рис.3 показана форма системы «Канва» с представлениями результатов моделирования в графическом виде.
14.6 Подсистема поддержки аналитической деятельности эксперта
Подсистема поддержки аналитической деятельности эксперта является ядром системы концептуального моделирования «Канва». Функциональность и организация этой подсистемы ориентирована на стимуляцию мышления и интуиции эксперта и включает подсистемы:
1. Подсистема объяснения прогноза развития ситуации. Эта подсистема обеспечивает автоматическую генерацию отчета, включающего описание последовательных шагов (причинно-следственных цепочек) получения прогнозного значения любого фактора ситуации. Отчет включает положительную и отрицательную причинно-следственные цепочки. Положительная цепочка объясняет причину увеличения значения признака, а отрицательная его уменьшения.
Рис. 4. Форма расшифровки значения фактора
На рис. 4 Показана форма расшифровки значения фактора «Тариф на транспортные услуги» падает на 35,2%. В этой форме приведено объяснение изменение значения фактора «Тариф на транспортные услуги» при увеличении объема перевозок на 42,4 %. Правый список формы показывает причинно-следственную цепочку увеличивающую (+1,6%), а левый уменьшающую (-35,2%) значение анализируемого фактора.
2. Советующая подсистема. Эта подсистема обеспечивает интеллектуальную поддержку разработки стратегии достижения векторной цели с выдачей рекомендаций (советов) для выбора управляющих воздействий. Для получения совета эксперт из описания векторной цели (это множество факторов и их целевых значений) последовательно выбирает целевые факторы. Система, для каждого выбранного фактора предлагает два множества альтернативных управляющих воздействий. Первое множество включает факторы, значения которых для достижения целевого значения фактора необходимо увеличивать, а второе множество, соответственно, уменьшать. Эксперт, опираясь на собственные предпочтения, может выбрать любой фактор из любого предложенного множества в качестве альтернативного управляющего воздействия. Система, при этом в оперативном режиме отображает, во-первых, рекомендуемую абсолютную величину управляющего воздействия, а во-вторых, результат применения этого управляющего воздействия в графическом виде.
Таким образом, советующая подсистема поддерживает диалоговый режим разработки стратегии достижения векторной цели: эксперт выбирает целевой фактор; система дает ему советы и рекомендации по выбору управляющих факторов; эксперт выбирает управляющий фактор и величину воздействия; система оперативно отображает результаты применения этого воздействия. Советующий режим конструирования стратегии достижения векторной цели раскрепощает мышление и стимулирует интуицию эксперта, позволяет сформулировать множество различных сценариев (стратегий) достижения поставленной цели.
3. Подсистема поддержки сценарного исследования ситуации. Эта подсистема обеспечивает ввод, редактирование, просмотр и активизацию (загрузку) любого сценария. Сценарное исследование различных стратегий достижения цели осуществляется в подсистеме сравнения сценариев развития ситуации. Эта подсистема обеспечивает возможность парного сравнения и анализа двух любых сценариев развития ситуации.
Результаты моделирования: таблицы прогноза развития ситуации, графики, описание сценариев, расшифровки значений факторов в системе «Канва» могут быть распечатаны на принтере или в файл документа «Word».
Таким образом, система «Канва» может быть использована для концептуального анализа и моделирования сложных и плохо определенных политических, экономических или социальных ситуаций, разработки стратегий управления и механизмов их реализации, разработки программных документов стратегического развития страны, региона, предприятия, фирмы и т.д., а также, в качестве инструментария для непрерывного мониторинга состояния ситуации, порождения и проверки гипотез механизмов развития и механизмов управления ситуацией.
Применение системы концептуального моделирования «Канва» значительно расширяет горизонты аналитических возможностей экспертов, освобождая их интеллект от рутинной работы, стимулирует воображение и интуицию для генерации оригинальных решений и находок управления и рефлексивного поведения в запутанной ситуации.
14.7 Моделирование бизнес процессов на основе BPMN-диаграмм
Нотация моделирования бизнес процессов (Business Process Modeling Notation, BPMN) -- графическая нотация для моделирования бизнес процессов. BPMN была разработана Business Process Management Initiative (BPMI) и поддерживается Object Management Group, после слияния организаций в 2005 году. Текущая версия BPMN -- 1.2; ведётся разработка версии 2.0.
Рис. 5. Пример моделирования бизнес процесса в нотации BPMN 1.1: Обработка запроса о товарах
Спецификация BPMN описывает графическую нотацию для отображения бизнес-процессов в виде диаграмм бизнес процессов (ДБП). BPMN ориентирована как на технических специалистов, так и на бизнес пользователей. Для этого язык использует базовый набор интуитивно понятных элементов, которые позволяют определять сложные семантические конструкции. Кроме того, спецификация BPMN определяет как диаграммы, описывающие бизнес процесс, могут быть трансформированы в исполняемые модели на языке BPEL.
Основная цель BPMN -- создание стандартной нотации понятной всем бизнес пользователям. Бизнес пользователи включают в себя бизнес аналитиков, создающих и улучшающих процессы, технических разработчиков, ответственных за реализацию процессов и менеджеров, следящих за процессами и управляющих ими. Следовательно, BPMN призвана служить связующим звеном между фазой дизайна бизнес процесса и фазой его реализации.
В настоящий момент существует несколько конкурирующих стандартов для моделирования бизнес процессов. Распространение BPMN поможет унифицировать способы представления базовых концепций бизнес процессов (например, открытые и частные бизнес процессы, хореографии), а также более сложные концепции (например, обработка исключительных ситуаций, компенсация транзакций).
BPMN поддерживает лишь набор концепций, необходимых для моделирования бизнес процессов. Моделирование иных аспектов, помимо бизнес процессов, находится вне зоны внимания BPMN. Например, моделирование следующих аспектов не описывается в BPMN:
Модель данных
Организационная структура
Несмотря на то, что BPMN позволяет моделировать потоки данных и потоки сообщений, а также ассоциировать данные с действиями, она не является схемой информационных потоков.
Элементы
Моделирование в BPMN осуществляется посредством диаграмм с небольшим числом графических элементов. Это помогает пользователям быстро понимать логику процесса. Выделяют четыре основные категории элементов:
Объекты потока управления: события, действия и логические операторы
Соединяющие объекты: поток управления, поток сообщений и ассоциации
Роли: пулы и дорожки
Артефакты: данные, группы и текстовые аннотации.
Элементы этих четырёх категорий позволяют строить простейшие диаграммы бизнес процессов (ДБП). Для повышения выразительности модели спецификация разрешает создавать новые типы объектов потока управления и артефактов.
Объекты потока управления
Объекты потока управления разделяются на три основных типа: события (events), действия (activities) и логические операторы (gateways).
Рис. 6. Типы событий в BPMN 1.1
События изображаются окружностью и означают какое-либо происшествие в мире. События инициируют действия или являются их результатами. Согласно расположению в процессе события могут быть классифицированы на начальные (start), промежуточные (intermediate) и завершающие (end). Начиная с BPMN 1.1 различают события обработки и генерации. Ниже представлена категоризация событий по типам.
Простые события (plain events) это нетипизированные события, использующиеся, чаще всего, для того, чтобы показать начало или окончание процесса.
События-сообщения (message events) показывают получение и отправку сообщений в ходе выполнения процесса.
События-таймеры (timer events) моделируют события, регулярно происходящие во времени. Также позволяют моделировать моменты времени, периоды и таймауты.
События-ошибки (error events) позволяют смоделировать генерацию и обработку ошибок в процессе. Ошибки могут иметь различные типы.
События-отмены (cancel events) инициируют или реагируют на отмену транзакции.
События-компенсации (compensation events) инициируют компенсацию или выполняют действия по компенсации.
События-условия (conditional events) позволяют интегрировать бизнес правила в процесс.
События-сигналы (signal events) рассылают и принимают сигналы между несколькими процессами. Один сигнал может обрабатываться несколькими получателями. Таким образом, события-сигналы позволяют реализовать широковещательную рассылку сообщений.
Составные события (multiple events) моделирует генерацию и моделирование одного события из множества.
События-ссылки (link events) используются как межстраничные соединения. Пара соответствующих ссылок эквивалентна потоку управления.
События-остановы (terminate events) приводят к немедленному завершению всего бизнес процесса (во всей диаграмме).
Рис. 7. Типы действий в BPMN 1.1
Действия изображаются прямоугольниками со скругленными углами. Среди действий различают задания и подпроцессы. Графическое изображение свёрнутого подпроцесса снабжено знаком плюс у нижней границы прямоугольника.
Задание (task) это единица работы, элементарное действие в процессе.
Множественные экземпляры (multiple instances) действия показывают, что одно действие выполняется многократно, по одному разу для каждого объекта. Например, для каждого объекта в заказе клиента выполняется один экземпляр действия. Экземпляры действия могут выполняться параллельно или последовательно.
Циклическое действие (loop activity) выполняется, пока условие цикла верно. Условие цикла может проверяться до или после выполнения действия.
Свёрнутый подпроцесс (collapsed subprocess) является сложным действием и содержит внутри себя правильную ДБП.
Развёрнутый подпроцесс (expanded subprocess) также является составным действием, но скрывает детали реализации процесса.
Ad-hoc подпроцесс (ad-hoc subprocess) содержит задания. Задания выполняются до тех пор, пока не выполнено условие завершения подпроцесса.
Рис. 8 Типы логических операторов в BPMN 1.1
Логические операторы изображаются ромбами и представляют точки принятия решений в процессе. С помощью логических операторов организуется ветвление и синхронизация потоков управления в модели процесса.
Оператор исключающего ИЛИ управляемый данными (data-based exclusive gateway) Если оператор используется для ветвления, то поток управления направляется лишь по одной исходящей ветви. Если оператор используется для синхронизации, то он ожидает завершения выполнения одной входящей ветви и активирует выходной поток.
Оператор исключающего ИЛИ управляемый событиями (event-based exclusive gateway) направляет поток управления лишь по той исходящей ветви, на которой первой произошло событие. После оператора данного типа могут следовать только события или действия-обработчики сообщений.
Оператор И (parallel gateway), использующийся для ветвления, разделяет один поток управления на несколько параллельных. При этом все исходящие ветви активируются одновременно. Если оператор используется для синхронизации, то он ожидает завершения выполнения всех входящих ветвей и лишь затем активирует выходной поток.
Оператор включающего ИЛИ (inclusive gateway) активирует одну или более исходящих ветвей, в случае, когда осуществляется ветвление. Если оператор используется для синхронизации, то он ожидает завершения выполнения одной входящей ветви и активирует выходной поток.
Сложный оператор (complex gateway) имеет несколько условий, в зависимости от выполнения которых активируются исходящие ветви. Оператор затрудняет понимание диаграммы, так как условия, определяющие семантику оператора, графически не выражены на диаграмме. Вследствие этого использование оператора нежелательно.
Соединяющие объекты
Объекты потока управления связаны друг с другом соединяющими объектами. Существует три вида соединяющих объектов: потоки управления, потоки сообщений и ассоциации.
Рис. 9. Типы потоков управления в BPMN 1.1
Поток управления изображается сплошной линией, оканчивающейся закрашенной стрелкой. Поток управления задаёт порядок выполнения действий. Если линия потока управления перечеркнута диагональной чертой со стороны узла, из которого она исходит, то она обозначает поток, выполняемый по умолчанию.
Рис. 10. Поток сообщений в BPMN 1.1
Поток сообщений изображается штриховой линией, оканчивающейся открытой стрелкой. Поток сообщений показывает какими сообщениями обмениваются участники.
Рис. 11. Типы ассоциаций в BPMN 1.1
Ассоциации изображаются пунктирной линией, заканчивающейся стрелкой. Ассоциации используются для ассоциирования артефактов, данных или текстовых аннотаций с объектами потока управления.
Роли
Роли -- визуальный механизм организации различных действий в категории со сходной функциональностью. Существует два типа ролей:
Рис. 12. Типы ролей в BPMN 1.1
Пулы изображаются прямоугольником, который содержит несколько объектов потока управления, соединяющих объектов и артефактов.
Дорожки представляют собой часть пула. Дорожки позволяют организовать объекты потока управления, связывающие объекты и артефакты.
Артефакты
Артефакты позволяют разработчикам отображать дополнительную информацию в диаграмме. Это делает диаграмму более читабельной и насыщенной информацией. Существуют три предопределённых вида артефактов:
Данные показывают читателю какие данные необходимы действиям для выполнения и какие данные действия производят.
Группа изображается прямоугольником с закругленными углами, граница которого -- штриховая линия. Группа позволяет объединять различные действия, но не влияет на поток управления в диаграмме.
Текстовые аннотации используются для уточнения значения элементов диаграммы и повышения её информативности.
Данные |
Группа |
Текстовая аннотация |
Использование BPMN
Моделирование бизнес процессов используется для донесения широкого спектра информации до различных категорий пользователей. Диаграммы бизнес процессов позволяют описывать сквозные бизнес процессы, но в то же время помогают читателям быстро понимать процесс и легко ориентироваться в его логике. В сквозной BPMN модели можно выделить три типа подмоделей:
Частные (внутренние) бизнес процессы
Абстрактные (открытые) бизнес процессы
Процессы взаимодействия (глобальные)
Частные (внутренние) бизнес процессы
Частные бизнес процессы описывают внутреннюю деятельность организации. Они представляют бизнес процессы в общепринятом понимании (business processes или workflows). При использовании ролей частный бизнес процесс помещается в отдельный пул. Поэтому поток управления находится внутри одного пула и не может пересекать его границ. Поток сообщений, напротив, пересекает границы пулов для отображения взаимодействия между различными частными бизнес процессами.
Абстрактные (открытые) бизнес процессы
Служат для отображения взаимодействия между двумя частным бизнес процессами (то есть между двумя участниками взаимодействия) В открытом бизнес процессе показываются только те действия, которые участвуют в коммуникации с другими процессами. Все другие, «внутренние», действия частного бизнес процесса не показываются в абстрактном процессе. Таким образом абстрактный процесс показывает окружающим последовательность событий с помощью которой можно взаимодействовать с данным бизнес процессом. Абстрактные процессы помещаются в пулы и могут моделироваться как отдельно, так и внутри большей ДБП для отображения потока сообщений между действиями абстрактного процесса с другими элементами. Если абстрактный процесс и соответствующий частный процесс находятся в одной диаграмме, то действия, отображённые в обоих процессах могут быть связаны ассоциациями.
Процессы взаимодействия (глобальные)
Процесс взаимодействия отображает взаимодействия между двумя и более сущностями. Эти взаимодействия определяются последовательностью действий, обрабатывающих сообщения между участниками. Процессы взаимодействия могут помещаться в пул. Эти процессы могут моделироваться как отдельно, так и внутри большей ДБП для отображения ассоциаций между действиями и другими сущностями. Если процесс взаимодействия и соответствующий частный процесс находятся в одной диаграмме, то действия, отображённые в обоих процессах могут быть связаны ассоциациями.
Пример
Ниже рассматривается пример бизнес процесса «Регистрация на рейс». Сначала приводится словесное описание процесса, а потом один из вариантов его представления в BPMN 1.1. Данный пример не стремится быть максимально приближённым к реальному процессу, а ставит целью показать использование конструкций нотации BPMN.
Словесное описание бизнес-процесса
Когда пассажир прибывает в аэропорт, его приоритетной задачей является регистрация на рейс. Сотрудник на стойке регистрации приветствует клиента и берёт у него документы: билет на рейс и паспорт. Если документы клиента не в порядке (например, истёк срок действия паспорта), он не может быть зарегистрирован на рейс и процесс завершается. При этом клиент получает документы обратно.
Если паспорт и билет в порядке, то сотрудник авиакомпании регистрирует клиента на рейс и распечатывает посадочный талон. При этом он взаимодействует с информационной системой авиакомпании. Сотрудник отдаёт пассажиру посадочный талон и паспорт, после чего уточняет, нет ли в багаже пассажира запрещённых грузов (например, воспламеняющихся веществ). Если таковые есть, то они изымаются из багажа. Сотрудник авиакомпании забирает багаж и ручную кладь пассажира и регистрирует её. При этом сотрудник снова взаимодействует с информационной системой авиакомпании. Если выясняется, что есть перевес, то сотрудник уведомляет об этом пассажира и сообщает сколько необходимо заплатить. После получения денег от пассажира, сотрудник регистрирует оплату в системе.
В итоге, пассажир получает багажную квитанцию. Сотрудник желает пассажиру приятного полёта, и процесс завершается.
Модель бизнес процесса в BPMN
На иллюстрации, представленной ниже, показана модель бизнес процесса «Регистрация на рейс».
Рис. 13. Пример моделирования бизнес процесса в BPMN 1.1: Регистрация на рейс
BPMN 2.0
The Business Process Model and Notation -- это рабочее название BPMN версии 2.0. Концепция BPMN 2.0 подразумевает создании единой спецификации, описывающей нотацию, метамодель и формат обмена моделей, но с новым именем, которое сохранило бы бренд «BPMN». В настоящий момент опубликованы две заявки, которые рассматриваются в качестве кандидатов на спецификацию BPMN 2.0 (см. BPMN 2.0 Заявка 1 и BPMN 2.0 Заявка 2 в разделе Ссылки).
14.8 Метод анализа иерархий (МАИ): введение
Опыт использования методов математического моделирования и компьютеров в различных сферах целенаправленной человеческой деятельности привел к пониманию многих принципиальных трудностей, возникающих при их внедрении в реальную практику, сотканную из непрерывной череды актов принятия решений. Оказалось, что лицо, принимающее решение, при принятии решения учитывает огромное число разнообразных показателей, представить которые в виде единственного критерия удается только в редких случаях. Стало ясно, что методики естественных наук, успешно применявшиеся при моделировании технологического уровня социально-экономической системы, совершенно недостаточно для решения более сложных проблем, которые по сути своей многокритериальны. При поиске 'наилучшего' плана или альтернативы существенное значение имеют факторы, не поддающиеся формализации (социальные, организационные, политические, психологические и т. п.). Поэтому руководитель (ЛПР), анализирующий решение, предложенное ему специалистом по математическому моделированию, и понимающий, что неформализуемые факторы могут оказать более сильное воздействие на результат, чем, например, оптимальное распределение ресурсов, склонен отнестись скептически к такому решению, не учитывающему ясные для ЛПР возможности повышения эффективности принимаемых решений. Если, кроме того, учесть, что ЛПР обычно имеет в голове (но не в модели!) огромное число ограничений, которые он не хотел бы нарушить, то станет ясно, почему он склонен принять собственное решение, отличное от полученного с помощью компьютера.
Один из способов практического преодоления перечисленных трудностей состоит во включении ЛПР в процесс построения моделей и принятия решений на их основе. Для этого предназначены человеко-машинные (имитационные) системы. Одним из классов таких систем являются системы поддержки принятия решений (СППР), в рамках которых опыт и неформализованные знания ЛПР сочетаются с математическим исследованием.
СППР, основанная на методе анализа иерархий (МАИ), является простым и удобным средством, которое поможет структурировать проблему, построить набор альтернатив, выделить характеризующие их факторы, задать значимость этих факторов, оценить альтернативы по каждому из факторов, найти неточности и противоречия в суждениях ЛПР/эксперта, проранжировать альтернативы, провести анализ решения и обосновать полученные результаты.
СППР МАИ может использоваться при решении следующих типовых задач:
- оценка качества организационных, проектных и конструкторских решений;
- определение политики инвестиций в различных областях;
- задачи размещения (выбор места расположения вредных и опасных производств, пунктов обслуживания);
- распределение ресурсов;
- проведение анализа проблемы по методу 'стоимость-эффективность';
- стратегическое планирование;
- проектирование и выбор оборудования, товаров;
- выбор профессии, места работы, подбор кадров.
Основные положения метода анализа иерархий были разработаны известным американским математиком Т.Л.Саати и опубликованы в 1977г. Томас Саати является одним из самых ярких представителей прикладной науки. Об этом говорят не только его математическая эрудиция и глубина новых теоретических результатов, но и диапазон приложений. Он был прав, предпослав к одной из своих монографий эпиграф: 'Я люблю обе стороны математики: чистую - как возвышенный уход от реальности, прикладную - как страстное стремление к жизни'.
МАИ используется для решения слабо структуризованных и неструктуризованных проблем. Методология решения таких проблем опирается на системный подход, при котором проблема рассматривается как результат взаимодействия и, более того, взаимозависимости множества разнородных объектов, а не просто как их изолированная и автономная совокупность.
14.9 Основные принципы МАИ
Человеку присущи два характерных признака аналитического мышления: один - умение наблюдать и анализировать наблюдения, другой - способность устанавливать отношения между наблюдениями, оценивая уровень (интенсивность) взаимосвязей, а затем синтезировать эти отношения в общее восприятие наблюдаемого.
На основе этих свойств человеческого мышления были сформулированы три принципа, реализация которых и является содержанием МАИ:
- принцип идентичности и декомпозиции;
- принцип дискриминации и сравнительных суждений;
- принцип синтеза.
1. Принцип идентичности и декомпозиции
Реализация этого принципа осуществляется на первом этапе применения МАИ, в котором предусматривается структурирование проблемы в виде иерархии. Иерархия строится с вершины - это общая цель или фокус проблемы. В общем случае целей может быть несколько. За фокусом следует уровень наиболее важных критериев. Каждый из критериев может разделяться на субкритерии, за которыми следует уровень альтернатив. ЛПР при построении иерархии вынужден вникнуть в проблему. От этого этапа во многом зависят конечные результаты принятия решений.Формирование множества альтернатив и критериев осуществляется с учетом рекомендаций. Этап является неформализуемым.
Пример
При обсуждении проблемы улучшения жилищных условий семьей была сформулирована цель - покупка дома. Обсуждались и другие цели решения этой проблемы (например, ремонт имеющегося жилья). Из каталога были отобраны три наиболее предпочтительных дома (варианты А, В, С), которые и были осмотрены семьей непосредственно. Для выбора окончательного варианта она решила воспользоваться методом анализа иерархий. Итогом первого этапа МАИ, который явился результатом семейного обсуждения, стала следующая иерархия:
Рис. 14. Иерархия проблемы улучшения жилищных условий
Иерархия - есть определенный тип системы, основанный на предположении, что элементы системы могут группироваться в несвязанные множества. Элементы каждой группы находятся под влиянием элементов другой группы и в свою очередь оказывают влияние на элементы следующей группы. Считается, что элементы в каждой группе иерархии (называемые уровнем, кластером, стратой) независимые. Рассмотрим общий вид иерархии.
Рис. 15. Общий вид иерархии
Математически иерархия и ее свойства могут быть описаны следующим образом. На множестве объектов i = {1,2,...,N} определяется иерархическая структура путем задания орграфа G = (i,W), W ? i ? i, который:
a) разбивает вершины на непересекающиеся уровни :
b) (i,j)?W означает, что вес Zi объекта i непосредственно зависит от веса Zi объекта j ;
c) если (i,j) - дуга графа G, т. е. (i, j)?W, то объекты i и j находятся на смежных уровнях, т. е. найдется такое k, что i ? Vk+1, j ? Vk
d) веса Zi объекта i ? Vk+1 определяются через веса Zj вершин множества Li = {j | (i,j) ? W} ? Vk, в которые ведут дуги из вершины i с помощью феноменологически вводимой зависимости:
где ?ij - вес дуги (i,j) .
2. Принцип дискриминации и сравнительных суждений
Данный принцип реализуется на втором этапе МАИ. Суть его заключается в том, что, используя суждения ЛПР/эксперта и определенные алгоритмы их обработки, устанавливаются веса ?ij дуг (i,j)?W и веса Zj объектов первого уровня ( j ? V1 ). Если на первом уровне один объект, то вес его принимается за 1 ( Z1 = 1).
Суждения ЛПР/эксперта являются результатом исследования его структуры предпочтений. При этом исследовании применяется метод парных сравнений, содержание которого состоит в следующем. Пусть задано некоторое фиксированное множество объектов , которые сравниваются попарно с точки зрения их предпочтительности, желательности, важности и т. п. Результаты записываются в виде матрицы парных сравнений .
Результат сравнения отражает не только факт, но и степень (силу, интенсивность и т.п) превосходства. При этом используется шкала относительной важности, выбор которой зависит от следующих требований:
- шкала должна давать возможность улавливать различия в ощущениях людей, когда они проводят сравнение;
- диапазон измеряемой интенсивности шкалы должен соответствовать результатам когнитивной психологии.
Удовлетворяет этим требованиям шкала, приведенная в табл.
Шкала относительной важности
Количественная оценка интенсивности относительной важности |
Качественная оценка интенсивности относительной важности |
Пояснения |
|
1 |
Равная важность |
Равный вклад двух объектов |
|
3 |
Умеренное превосходство одного над другим |
Опыт и суждения дают легкое превосходство одного объекта над другим |
|
5 |
Существенное или сильное превосходство |
Опыт и суждения дают сильное превосходство одного объекта над другим |
|
7 |
Значительное превосходство |
Один объект имеет настолько сильное превосходство, что оно становится практически значительным |
|
9 |
Очень сильное превосходство |
Очевидность превосходства одного объекта над другим подтверждается наиболее сильно |
|
2,4,6,8 |
Промежуточные решения между двумя соседними суждениями |
Применяются в компромиссном случае |
|
Обратные величины приведенных выше чисел |
Если объекту i при сравнении с объектом j приписывается одно из приведенных выше чисел, то действию j при сравнении с i приписывается обратное значение |
Из шкалы следует свойство гомогенности (однородности) объектов. Это свойство соответствует способности людей сравнивать объекты, которые не слишком сильно отличаются друг от друга. Гомогенность существенна для сравнения объектов одного порядка, т.к. человеческий разум склонен к допущению больших ошибок при сравнении несопоставимых элементов. Когда эта несопоставимость большая, объекты располагаются в отдельные кластеры сравниваемых размеров, что выдвигает идею об уровнях и их декомпозиции.
Пример
Рассмотрим метод парных сравнений на примере покупки дома.
Рис. 16. Иллюстрация к методу парных сравнений
Допустим необходимо оценить предпочтения ЛПР/эксперта на множестве вариантов А, В, С относительно критерия - размера дома. Лучше всего эту задачу свести к заполнению таблицы:
Матрица парных сравнений
Размер дома |
Вариант А |
Вариант В |
Вариант С |
|
Вариант А |
1 |
1/3 |
5 |
|
Вариант В |
3 |
1 |
1/7 |
|
Вариант С |
1/5 |
7 |
1 |
Размерность таблицы определяется количеством дуг, которые входят в рассматриваемую вершину. Элементы таблицы rij, i, j = 1, 3 являются количественной оценкой интенсивности предпочтения i - го объекта, находящегося в i - й строке, относительно j - гo объекта, находящегося в j - м столбце, в соответствии с вышерассмотренной шкалой. При этом сравнении ЛПР/эксперту задавался следующий вопрос : насколько один вариант (например А) превосходит по размеру другой вариант (например С)? Ответом ЛПР/эксперта, как следует из таблицы, было следующее суждение: существенное или сильное превосходство.
Таким же образом осуществляется оценка предпочтений ЛПР/эксперта относительно остальных критериев путем заполнения еще пяти аналогичных матриц размерностью 3x3. После чего метод парных сравнений распространяется на множество самих критериев относительно Цели - покупки дома. В этом случае ЛПР/эксперту задается следующий вопрос: насколько важнее один критерий (например, размер дома) для Реализации цели по сравнению с другим (например, финансовые условия)? Как следует из иерархии, размерность этой таблицы 6x6.
Принимая во внимание свойство матрицы, т. е.:
и, как следствие, rii =1, количество вопросов равно n*(n-1)/2
Формализацией понятия непротиворечивости для метода парных сравнений является выполнение следующего равенства:
r*ij = r*ik ? r*kj ?i,j,k (1)
где r*ij - это элементы матрицы полученные в результате идеально согласованного эксперимента. Соотношение (1) соответствует правилу логического вывода, которое в этом случае формулируется следующим образом: если i-й объект предпочтительнее k-го объекта на r*ik и k-й объект предпочтительнее j-го объекта на r*kj , то i-й объект предпочтительней j-го объекта на r*ij, причем r*ij = r*ik ? r*kj .
Теорема. Если матрица R* обладает свойством (1), то тогда существуют такие числа ?*i > 0, что имеет место равенство:
(2)
Числа отождествляются с весами дуг (это множество W в графе G) либо с весами объектов первого уровня (это Zi, i ? V1).
Матрица R* имеет единичный ранг, , собственный вектор матрицы, где n - соответствующее ей собственное число.
Действительно,
(3)
Практически добиться полной согласованности (т.е. непротиворечивости) суждений ЛПР/эксперта далеко не всегда возможно. Поэтому в общем случае rij будут отклоняться от 'идеальных'
вследствие чего соотношения 1, 2, 3 не будут иметь место.
Для дальнейшего анализа полезными являются следующие два факта из теории матриц:
- Во-первых, если ?1, ..., ?n , являются собственными числами матрицы R и если
Согласно этому утверждению, если имеет место (3) (т.е. матрица является идеально согласованной), то все собственные числа ее - нули, за исключением одного, равного n.
- Во-вторых, если элемент положительной обратносимметричной матрицы R незначительно изменить, то собственные числа этой матрицы также изменятся незначительно, т.е. они являются непрерывными функциями ее элементов.
Объединяя эти результаты, находим, что при малых изменениях rij от r*ij наибольшее собственное число ?max (практически получаемой матрицы R при использовании метода парных сравнений) остается близким к n, a остальные собственные значения - близкими к нулю.
Отсюда можно сформулировать следующую задачу: для нахождения весов дуг или объектов первого уровня по полученной в результате метода парных сравнений матрице R необходимо определить собственный вектор , соответствующий максимальному собственному числу, т.е. решить уравнение :
(4)
Так как малые изменения в вызывают малое изменение ?max, отклонение последнего от n является мерой согласованности. Она может быть выражена с помощью индекса согласованности (ИС):
(5)
Если ИС? 0,1, то практически считается, что мера согласованности находится на приемлемом уровне.
Индекс согласованности матрицы парных сравнений, элементы которой сгенерированы случайным образом, называется случайным индексом (СИ). Ниже представлена таблица соответствия порядка и среднего значения СИ, определенная на базе 100 случайных выборок.
Таблица средних значений СИ
Порядок матрицы |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
СИ |
0,00 |
0,00 |
0,58 |
0,9 |
1,12 |
1,24 |
1,32 |
1,41 |
1,45 |
1,49 |
Отношение ИС к среднему СИ для матрицы того же порядка называется отношением согласованности (ОС). Значение ОС меньшее или равное 0,10 считается приемлемым. Обычно ИС и ОС указываются в процентах. Согласно определению, ИС можно трактовать как отклонение от идеально проведенного эксперимента (метода парных сравнений), а ОС указывает, на сколько оцениваемая степень согласованности сходится со степенью согласованности самого неидеально проведенного эксперимента.
Таким образом, МАИ допускает несогласованность (как неотъемлемую часть метода), признавая, что человеческие суждения находятся в постоянном процессе изменения и эволюции (поэтому не следует настаивать на 100% согласованности, так как суждения могут измениться после того, как проблема решена). Но надежные решения не могут быть приняты без приемлемого уровня согласованности.
Существуют два метода решения уравнения R?V = ?max?V .Это прямой и итерационный.
Рассмотрим прямой метод. Проверим алгоритм данного метода. R - идеально согласованная матрица, т. е.
1. Определим среднее геометрическое каждой строки R:
2. Вычислим сумму средних геометрических
4. Разделим среднее геометрическое каждой строки R на сумму средних геометрических строк:
5.
т. е. получили нормированное значение собственного вектора.
Для получения ?max выполним следующие шаги:
1. Определим сумму элементов для каждого столбца матрицы R:
2. Определим скалярное произведение векторов:
что соответствует максимальному собственному числу для идеально согласованной матрицы.
Итерационный метод основан на следующей теореме:
Для положительной квадратной матрицы R собственный вектор V, соответствующий максимальному собственному значению ?max, с точностью до постоянного сомножителя C определяется по формуле:
где e = (1, 1, ..., 1)T - единичный вектор
k = 1, 2, 3,… показатель степени
C - константа
Т - знак транспонирования
Вычисление собственного вектора V производится до достижения заданной точности:
eT?|V(l) - V(l-1)| ??
где l - номер итерации, такой, что l = 1 соответствует k = 1; l = 2, k = 2 и т. д.
? - допустимая погрешность
С достаточной для практики точностью принимается равной 0,01 независимо от порядка матрицы.
Максимальное собственное значение вычисляется по формуле:
?max = eT?R?V
3. Принцип синтеза
Реализация принципа синтеза составляет содержание третьего этапа. Искомые веса объектов определяются последовательно, начиная со второго уровня иерархии в соответствии с решающим правилом
(9)
Рис. 17. Фрагмент иерархии
Веса объектов, принадлежащих уровню альтернатив, можно считать как результат измерения их в шкале отношений в диапазоне [0,1].
Согласованность всей иерархии С определяется по следующему выражению:
(10)
где D = I / Vm; ИСi, СИi, - соответственно индекс согласованности и случайный индекс таблицы парных сравнений, рассмотренной относительно i-го объекта. Если i ? V1 и i > 1, то для ?i ? V1 ИСi = ИС1 и СИi = СИ1; ИС1 и СИ1 - соответствующие параметры таблицы парных сравнений, которая была сформирована для определения весов объектов первого уровня.
Приемлемым является значение С меньше или равное 10%. В противном случае качество суждений следует улучшить. Возможно, следует пересмотреть формулировку вопросов при проведении парных сравнений. Если это не поможет улучшить согласованность, то, вероятно, задачу следует более точно структурировать.
14.10 Общая оценка МАИ как метода принятия решений
Принятие решений складывается в многодисциплинарную область исследований, в которой работают психологи, математики, программисты, экономисты, инженеры. Отметим, что эта многодисциплинарность является как бы переходным этапом к появлению новой дисциплины, в рамках которой специалисты будут обладать необходимыми научными знаниями из приведенных выше дисциплин, а также новыми знаниями по проблемам, ранее не изучавшимся.
Рассмотрим, насколько удовлетворяет МАИ ряду требований к научному обоснованию методов принятия решений:
1. В МАИ способы получения информации от ЛПР/эксперта соответствуют данным когнитивной психологии о возможностях человека перерабатывать информацию. Действительно, гомогенность и принцип иерархической декомпозиции приводят в соответствие проблему получения оценок с психометрическими возможностями человека.
2. В МАИ имеется возможность проверки информации, полученной от ЛПР/эксперта на непротиворечивость, посредством индекса и отношения согласованности как для отдельных матриц, так и для всей иерархии.
3. Любые соотношения между вариантами решений в МАИ объяснимы на основе информации, полученной от ЛПР/экспертов. Так, анализ весов объектов по нисходящим уровням иерархии позволяет понять, как получено то или иное значение веса.
4. Математическая правомочность решающего правила в МАИ прозрачна и базируется на методе собственных значений и принципе иерархической композиции, имеющих четкое математическое обоснование.
Таким образом, МАИ удовлетворяет четырем основным критериям обеспечивающим всестороннюю научную обоснованность метода принятия решений.
Решающим преимуществом МАИ над большинством существующих методов оценивания альтернатив является вклад в анализ структуры проблемы и отчетливое выражение суждений.
Сложность, как было уже отмечено, характеризуется большим числом взаимодействий между многими субъективными и объективными факторами различного типа и степени важности, а также группами людей с различными целями и противоречивыми интересами. Эти факторы определяют вероятность или невозможность выбора одной из альтернатив, которая приемлема для всех с определенной степенью компромисса.
Чтобы разобраться с этой сложностью, нужна систематическая процедура для представления групп, их целей, критериев и поведения, обусловленных этими целями, альтернативных исходов и ресурсов, распределяемых по этим альтернативам. В МАИ эта процедура сводится к построению иерархии проблемы.
Общая цель (фокус) проблемы (например, выбор наилучшего автомобиля, построение наилучшей системы, распределение ресурса в соответствии с важностью) является обычно высшим уровнем иерархии. За фокусом следует уровень наиболее важных критериев (таких, как стоимость, стиль, комфортабельность и размеры автомобиля, или же в планировании - прибыльность инвестиции, конкуренция и т.д.). Каждый из критериев может разделяться на субкритерии. За субкритериями следует уровень альтернатив, число которых может быть очень большим.
Как будет показано, в некоторые иерархии может быть включен уровень действующих сил (акторов), который расположен ниже уровня общих критериев. Уровень определяет, какой из акторов наибольшим образом воздействует на исход. За этим уровнем для каждого актора следует уровень целей акторов, за которым следует уровень политик акторов, и далее уровень альтернативных исходов.
В общем, декомпозиция проблемы в иерархию зависит от хода мыслей ЛПР (его концепции решения проблемы), интуиции и опыта.
С целью иллюстрации этапов МАИ рассмотрим задачу о выборе работы.
Пример 1
Со студентом, только что получившим диплом, беседовали о трех возможных местах работы (А, Б и В). Он решил использовать МАИ для осуществления выбора. В результате первого этапа применения МАИ была получена следующая иерархия.
Рис. 17. Иерархия проблемы выбора работы
Уровень цели:
1. Удовлетворение работой.
Уровень критериев:
2. Исследовательская работа;
3. Рост;
4. Доходы;
5. Коллеги;
6. Местонахождение;
7. Репутация.
Уровень альтернатив:
8. А;
9. Б;
10. В.
Выполнение второго этапа связано с заполнением нижеприведенных таблиц по методу парных сравнений с применением шкалы относительной важности. В результате обработки таблиц получаем собственные вектора, которые определяют веса соответствующих дуг.
?max = 6,35; ИС = 0,07; ОС = 0,06
В таблице пары критериев сравниваются с точки зрения их относительного вклада в общее понятие 'удовлетворение работой'. Задавался вопрос: который из заданной пары критериев представляется вносящим больший вклад в понятие 'удовлетворение работой' и насколько? Например, число 5 в третьей строке и четвертом столбце показывает, что 'доходы' намного важнее, чем 'общество коллег'.
В следующей таблице представлены результаты парных сравнений относительно соответствующих критериев.
Результатом третьего этапа (синтеза) является определение весов согласно соотношению (9). Так как уровень 1 имеет одну цель, то Z1 = 1. Отсюда:
Z2 = ?21?Z1 = 0,16;
Z3 = ?31?Z1 = 0,19;
Z4 = ?41?Z1 = 0,19;
Z5 = ?51?Z1 = 0,05;
Z6 = ?61?Z1 = 0,12;
Z7 = ?71?Z1 = 0,30;
Вычислив веса критериев, переходим к вычислению весов альтернатив (т.е. объектов третьего уровня):
Z8 = ?82?Z2 + ?83?Z3 + ?84?Z4 + ?85?Z5 + ?86?Z6 + ?87?Z7 = 0,16?0,16 + 0,33?0,19 + 0,45?0,19 + 0,77?0,05 + 0,25?0,12 + 0,69?0,3 = 0,45
Z9 = ?92?Z2 + ?93?Z3 + ?94?Z4 + ?95?Z5 + ?96?Z6 + ?97?Z7 = 0,59?0,16 + 0,33?0,19 + 0,09?0,19 + 0,05?0,05 + 0,05?0,12 + 0,09?0,3 = 0,25
Таким образом, в конечном счете альтернатива А имеет вес 0,45, Б - 0,25 и В - 0,3.
Пример 2
Задача определения приоритетов отраслей промышленности. Она возникает при распределении энергии для нескольких крупных потребителей в соответствии с их общим вкладом в реализацию различных целей общества. Иерархия решения этой задачи имеет следующий вид:
Рис. 18. Иерархия задачи определения приоритетов отраслей промышленности
Первый уровень иерархии имеет одну цель: общее благосостояние страны (1).
Второй уровень иерархии имеет три цели: сильная экономика (2), здравоохранение (3) и национальная оборона (4). Приоритеты этих целей получаются из таблицы парных сравнений относительно цели первого уровня.
Объектами третьего уровня являются отрасли промышленности (5,6,7,8). Задача заключается в определении влияния отраслей промышленности на общее благосостояние страны через промежуточный второй уровень.
Пример 3
Применение МАИ для сравнительного анализа различных технических систем. Например, необходимо осуществить оценку четырех современных систем аккумулирования энергии на основе шести критериев. Соответствующая иерархия имеет следующий вид:
Рис. 19. Иерархия сравнительного анализа технических систем
В таблице представлены результаты парных сравнений относительно соответствующих критериев.
В качестве критериев принимались следующие:
2. Экологический.
3. Экономический.
4. Социальный.
5. Выбор места.
6. Время, требуемое для постройки.
7. Совместимость с энергосистемой.
Множество систем аккумулирования энергии включало:
8. Накопление сжатого воздуха.
9. Подземная гидроаккумуляция.
10. Электрические батареи.
11. Накопление энергии водорода.
Матрица парных сравнений к примеру 3
2 |
3 |
4 |
5 |
6 |
7 |
Собственный вектор |
||
2 |
1 |
1/5 |
2 |
1/3 |
1/2 |
2 |
0,09 |
|
3 |
5 |
1 |
7 |
2 |
3 |
7 |
0,42 |
|
4 |
1/2 |
1/7 |
1 |
1/5 |
1/2 |
1 |
0,05 |
|
5 |
3 |
1/2 |
5 |
1 |
2 |
5 |
0,25 |
|
6 |
2 |
1/3 |
2 |
1/2 |
1 |
3 |
0,14 |
|
7 |
1/2 |
1/7 |
1 |
1/5 |
1/3 |
1 |
0,05 |
?max = 6,05; ИС = 0,01; ОС = 0,01.
После проведения этапа синтеза получено следующее ранжирование аккумулирующих систем:
- электрические батареи - 0,36;
- накопление сжатого воздуха - 0,26;
- накопление энергии водорода - 0,24;
- подземная гидроаккумуляция - 0,14.
Литература
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 15. Метод конечных элементов
15.1 Общий ход решения задачи на основе метода конечных элементов
Решение задач анализа при функциональном моделировании сводится к определению вектора V, который удовлетворяет исходным уравнениям задачи и граничным условиям. Часто искомую функцию задают в виде ряда
(1)
где - базисные функции от независимых переменных,
- неизвестные постоянные коэффициенты.
Методы определения постоянных коэффициентов весьма разнообразны. Так, в методе Ритца их находят из условия минимума потенциальной энергии системы, в методе коллокаций - из условия удовлетворения дифференциальных уравнений задачи в отдельных точках и т. д. Выбор базисных функций в конечном счете определяет успех решения задачи: если эти функции подобраны удачно, решение получается простым, в противном случае приходится удерживать большое число членов ряда (9.1), что существенно затрудняет расчет и не всегда приводит к желаемым результатам. Для простых случаев разработаны рекомендации по выбору базисных функций, в сложных случаях проблема назначения этих функций может оказаться не проще решения неходкой задачи.
Идея метода конечных элементов (МКЭ) заключается в том, что вместо поиска единого аналитического представления функции v используют ее кусочно-линейную аппроксимацию, т.е. всю область решения разбивают на подобласти конечных размеров, достаточно малых, чтобы обеспечить требуемую точность линеаризации.
Рассмотрим основы МКЭ на примере одномерной задачи, точное решение которой описывается кривой, изображенной на рис. 1, а. Прежде всего разбейте область на конечные элементы и т. д. В пределах длины каждого элемента искомую функцию можно считать линейной (рис. 1, б):
. (2)
Если тем или иным способом вам удастся определить значения искомой функции в узлах, то задача будет решенной, поскольку с учетом равенства (2) вы получите возможность вычислить приближенные значения функции в любой точке. Рассмотрим, как можно определить значения искомой функции в узлах .
Рис. 1. Одномерные конечные элементы
Узловые значения функций вы можете искать различными способами, исходя из физического смысла задачи. Задача может быть задана в форме дифференциальных уравнений, либо в виде некоторого функционала . В первом случае удобно воспользоваться методом Бубнова - Галеркина, минимизируя ошибку приближенного решения, во втором - каким-нибудь вариационным принципом, обеспечивающим минимизацию функционала. Используя кусочно-линейное представление функции и записывая функционал в виде , вы обеспечите реализацию минимума энергии, приравнивая нулю частные производные:
В результате будет получена система уравнений
решение которой позволит вычислить вектор , т.е. найти значения искомой функции в узлах и тем самым решить задачу.
Унификация вычислительных процедур накладывает некоторые особенности на реализацию МКЭ, для уяснения которых вновь обратимся к решению одномерной задачи (рис. 1).
В общем случае алгоритм МКЭ состоит из четырех этапов:
выделение конечных элементов (разбиение заданной области на конечные элементы);
определение аппроксимирующей функции для отдельного конечного элемента (определение функции элемента);
объединение конечных элементов в ансамбль;
определение вектора узловых значений функции.
Первый этап. Первый этап расчета с использованием МКЭ состоит в разбиении области на конечные элементы. Такое разбиение начинают обычно от границы области, стараясь наиболее точно повторить ее конфигурацию, затем производят разбиение внутренних областей. Сначала выделяют достаточно крупные подобласти, которые отличаются по свойствам материала, геометрии, напряженному состоянию и пр. Затем каждую подобласть разбивают на конечные элементы принятой формы, чаще всего треугольные, при этом размеры конечных элементов могут быть приняты различными (рис. 2) в зависимости от требуемой точности описания. Резкого изменения размеров конечных элементов на границах подобластей стараются избегать.
Важное значение имеет нумерация узлов конечных элементов. Дело в том, что матрицы коэффициентов систем алгебраических уравнений в МКЭ представляют собой сильно разряженные матрицы ленточной структуры. Ненулевые элементы таких матриц располагаются параллельно главной диагонали, при этом ширина полосы зависит от числа степеней свободы узлов и их нумерации (от разности номеров соседних узлов). Выбор оптимальной нумерации узлов способствует существенному сокращению затрат вычислительных ресурсов компьютера.
Информация о разбиении области на конечные элементы и нумерации узлов является исходной для последующих этапов расчета. Обычно требуется указывать тип конечного элемента, его порядковый номер, номер узла сети, координаты этого узла, значения физических параметров в пределах конечного элемента и др. Такая топологическая информация обычно содержит примерно в шесть раз больше чисел, чем количество узлов сетки разбиения. Для объектов средней сложности объем такой информации измеряется сотнями тысяч. Понятно, что ручной ввод этой информации, помимо чрезвычайной утомительности, может сопровождаться ошибками.
Рис. 2. Пример разбиения подобласти на конечные элементы
Процедуры по вводу информации оптимальной нумерации узлов удается формализовать, что позволило разработать специальные программы, называемые препроцессорами, которые либо существуют в виде автономных программ, либо непосредственно включаются в состав программных комплексов, реализующих МКЭ.
В данном примере суть его понятна без пояснений: выделено шесть конечных элементов в общем случае разных по длине.
Второй этап. Рассмотрим (рис. 1, б) один из выделенных элементов (одномерный симплекс-элемент). Для определения коэффициентов а и b полинома (2) запишем граничные условия:
при
при
Подставляя эти значения в равенство (2), получим систему двух уравнений, решив которую относительно а и b, имеем
.
Подставляя эти коэффициенты в формулу (2), можно записать:
(3)
Члены уравнения (3), заключенные в скобки, называют функциями формы одномерного симплекс-элемента:
. (4)
С учетом обозначений (4) уравнение (3) принимает вид:
, (5)
или в матричной форме
, (6)
где - матрица-строка,
- вектор-столбец.
Полученные здесь формулы (4), (6) полностью характеризуют одномерный симплекс элемент. Они являются общими пригодными для решения любых задач, включающих одномерные прямолинейные конечные элементы.
Третий этап - объединение конечных элементов в ансамбль. Основу этого этапа составляет замена номеров узлов i и j в уравнении (5) на номера, присвоенные узлам в процессе разбиения рассматриваемой области. Для примера, приведенного на рис. 1, будем иметь:
Полученная система уравнений представляет собой математическую модель исследуемой задачи. Запишем эту систему в расширенной форме:
(7)
что соответствует векторной записи модели
(7а)
Четвертый этап - определение вектора узловых значений функции. Этот этап не является формальным, и мы не можем ограничиться ссылкой на рис. 5.1 абстрактного примера. Нужно знать конкретное дифференциальное уравнение или конкретный функционал исследуемого явления.
Допустим, что в нашем примере этот функционал имеет простейший вид:
(8)
Разобьем пределы интегрирования в соответствии с делением области на конечные элементы, тогда
Первый член подынтегрального выражения определим, возведя в квадрат равенство (5), второй - путем его дифференцирования с учетом обозначений (4). Выполняя интегрирование и простейшие преобразования, можем записать:
(9)
где
Для того, чтобы определить минимум функционала (9), приравняем нулю частные производные, предварительно развернув выражения сумм для всех шести конечных элементов и заменяя индексы i, j номерами соответствующих узлов:
Таким образом, получена следующая система уравнений:
или
. (10)
Матрицу С называют матрицей жесткости, а вектор - вектором нагрузок. Эти названия пришли из строительной механики. Они отвечают сущности рассматриваемых там задач, поскольку МКЭ первоначально был разработан и в основном сформировался применительно к расчетам строительных конструкций. Затем метод конечных элементов был распространен на другие предметные области, а термины строительной механики сохранились и стали общепринятыми, хотя и отражали иную физическую сущность.
Дальнейший расчет сводится к обращению матрицы С и определению вектора . Зная компоненты вектора и используя систему уравнений (7), можно вычислить значение искомой функции в любой точке. Таким образом, задача полностью решена.
Выше было отмечено, что узловые значения функции определяются дифференциальным уравнением задачи или условием минимизации некоторого функционала. В ряде случаев эти операции не требуется выполнять в явном виде. Можно использовать какой-нибудь другой принцип, отвечающий физической сущности задачи. Так, используя уравнения метода перемещений при расчете строительных конструкций, мы автоматически минимизируем функционал энергии системы, поскольку канонические уравнения указанного метода являются следствием такой минимизации.
При рассмотрении примера (рис. 1) конечная задача состояла в определении функции . Часто такая функция может быть лишь промежуточным звеном между координатой х и другой переменной, подлежащей определению. Так, уравнение изогнутой оси балки интересует нас не как геометрический объект конфигурации системы, а как функция, позволяющая вычислить изгибающие моменты и поперечные силы или нормальные и касательные напряжения. В таком случае соответствующие зависимости между этими величинами могут быть включены в состав конечных элементов и в их ансамбль.
15.2 Сети одномерных конечных элементов
На рис. 3 приведены примеры из различных предметных областей с одинаковой топологией с точки зрения теории графов, имеющие одинаковый принцип построения математической модели на основе МКЭ.
На рис. 3, а показана электрическая схема из семи резисторов. Источники питания на схеме не показаны, но их влияние характеризуется токами
Если резистор рассмотреть изолированно от системы, то с помощью закона Ома можно записать соотношение между исходящими токами и напряжениями на его концах:
(11)
или в матричной форме
(12)
(12 а)
Узлы сети и ее элементы можно нумеровать произвольно, однако при выделении каждого элемента условимся под индексом i всегда понимать меньший номер. Нетрудно видеть, что поэтому силу тока в узле i можно определять по формуле
(13)
а если рассматривается узел , то правую часть формулы (13) следует умножить на -1.
а) электрическая; б) механическая; в) гидравлическая
Рис. 3 Сети одномерных конечных элементов:
При составлении ансамбля конечных элементов запишем уравнения «равновесия» (закон Кирхгофа) поочередно для каждого узла. Для формализации процедуры будем рассматривать все элементы сети независимо от того, примыкают они к данному узлу или нет. Если элемент примыкает к рассматриваемому узлу своим началом, будем принимать равенство (13) со своим знаком, т. е. умножать его на 1. Если это окажется конец элемента, то будем вводить множитель - 1. Если элемент не примыкает к узлу, то принимать множитель 0. С целью сокращения записей условимся матрицу жесткости обозначать буквой К, снабженной индексом, указывающим номер элемента. Для первого узла (рис. 3, а) будем иметь:
для второго узла
Поступая аналогично с остальными узлами, можем записать математическую модель электрической системы:
(14)
При рассмотрении элементов анализа сетей было дано определение и указан прием построения матрицы инциденций ориентированного графа. Здесь мы получили такую матрицу, занумерованные узлы и элементы сети.
Перейдем к рассмотрению механической системы (рис. 3, 6) в виде фермы, загруженной силой Р. Предварительно отметим существенное отличие этой системы от ранее рассмотренной. В электрической системе сила тока есть скалярная величина, поэтому не имеет значения пространственное расположение резисторов, важен лишь факт их примыкания к данному узлу. Для фермы все иначе: здесь имеет значение не только топология, но и геометрия фермы, а также ориентация внешних сил и реакций связей. Для плоской фермы с шарнирными узлами каждый узел имеет две степени свободы, что определяет 10 степеней свободы для всей совокупности узлов. Однако внешние связи исключают две степени свободы в первом узле и по одной (в вертикальном направлении) - в 4 и 5 узлах. Для учета этого обстоятельства необходимо вычеркнуть соответствующие строки матрицы S, характеризующей степени свободы системы (две строки для первого узла и вторые строки - для 4 и 5 узлов):
(15)
При рассмотрении конечного элемента для электрической системы основным параметром, определяющим связь между фазовыми переменными I и U, было электрическое сопротивление резистора r, а сама связь устанавливалась законом Ома.
В случае фермы фазовыми переменными будут усилия в стержнях N и удлинения стержней, параметром - погонная жесткость, а связь переменных состояния определится законом Гука
15.3 Виды конечных элементов
Выше были рассмотрены системы, включающие одномерные симплекс-элементы, при этом функции формы элемента (4) оставались одинаковыми для задач из разных предметных областей. Физическая сущность задачи отображается матрицей жесткости. В электрических системах эта матрица зависит от сопротивлении R, емкостей С, индуктивностей L элементов, составляющих систему. В системах, характеризующих работу строительных конструкций, матрица жесткости непосредственно связана с погонными жесткостями для растянутых (сжатых) элементов, - для изгибаемых элементов и т.д. Для нелинейных систем, например, для схемы «в» (рис. 2), где связь между напором V и расходом J имеет вид , матрица жесткости будет представлять уже не массивы констант, а некоторые функции от напора жидкости.
В случае функции двух переменных х, у используют плоские конечные элементы в виде многоугольников, обычно треугольника и прямоугольника.
Рассмотрим двумерный симплекс-элемент, представляющий собой плоский треугольник (рис. 4).
Интерполяционный полином, аппроксимирующий непрерывную функцию v(x, у) внутри симплекс-элемента, имеет вид
(16)
Рис. 4. Двумерный симплекс-элемент
Для придания этому выражению вида, удобного для применения в методе конечных элементов, будем поступать так же, как это делали на втором этапе п.п. 15.1 [см. формулы (1)...(6)]. Граничные условия будут иметь вид:
при функция v(x, у) примет значение;
при функция v(x, у) примет значение.
Используя формулу (16), получим систему трех уравнений для определения коэффициентов Подставляя эти коэффициенты в полином (16) и проделав необходимые преобразования, аналогичные рассмотренным в п. 15.1, запишем аналогичную (5) формулу
(17)
где функции формы элемента имеют вид:
(18)
Здесь ? - площадь треугольника конечного элемента;
- коэффициенты, определяемые путем круговой перестановки индексов выражений:
. (19)
Формулы (16)...(19) будут одинаковыми для всех задач, где используют треугольные симплекс-элементы. Матрицы жесткостей будут зависеть от физической сущности задачи. Рассмотрим это на примере плоской задачи теории упругости. Заметим, что в этом случае каждый узел имеет две степени свободы, поэтому вектор имеет две компоненты vx и каждую из которых определяют по формуле (17).
Деформации внутри конечного элемента можно выразить через перемещения с помощью зависимостей Коши:
Выполняя дифференцирование равенства (17) с учетом обозначений (18), запишем зависимости Коши в матричной форме:
(20)
или
. (20 а)
Для перехода от деформаций тела к напряжениям используем закон Гука при плоском напряженном состоянии:
(21)
или
. (21 а)
Матрицы D и В содержат всю информацию о конечном элементе: матрица D определяет его упругие характеристики а матрица В - геометрические. Остается определить еще одну матрицу (матрицу жесткости К), которая связывает усилия, действующие в узлах конечного элемента, с перемещениями этих узлов. Для записи этой матрицы воспользуемся принципом возможных перемещений, согласно которому при равновесии тела работа внешних сил Р на возможных перемещениях узлов т. е. равна по величине работе внутренних сил на тех же перемещениях: , где - деформация, отвечающая возможным перемещениям; - объем конечного элемента. В результате преобразований получим искомую связь между усилиями в узлах конечного элемента и перемещениями этих узлов:
, (22)
где матрица жесткости К будет равна
(23)
Матрица жесткости (23) конечного элемента не зависит от действующих на элемент нагрузок и поэтому остается неизменной для всех нагружений. Элементы этой матрицы представляют собой коэффициенты канонических уравнений метода перемещений для расчета одного конечного элемента.
Рассмотрим объединение конечных элементов в ансамбль на примере простейшей сети из трех конечных элементов (рис. 5).
Для каждого конечного элемента мы можем записать формулу (17), заменяя узлы конкретными номерами. Так, для первого элемента
.
Поступая аналогично с остальными узлами, получим:
(24)
Рис.5. Ансамбль трех конечных элементов
Напомним, что узловые значения искомой функции
пока еще не известны и подлежат определению. С этой целью нужно использовать какой-нибудь принцип, выражающий физическую сущность задачи. В задачах строительной механики таким принципом могут быть уравнения равновесия с учетом совместности перемещений. Когда мы все это проделаем, задача будет решенной, поскольку формулы (20), (21), (24) с учетом обозначений (18), (19) позволяют определить в любой точке области нормальные и касательные напряжения, найти угловые и линейные деформации, вычислить перемещения данной точки в направлении осей х и у. Совокупность указанных формул, полностью определяющих поведение исследуемой системы, составляет ее математическую модель.
Перейдем к объединению конечных элементов в ансамбль.
Пусть в узлах системы конечных элементов действуют внешние силы, определяемые вектором
(25)
К каждому i-му узлу сети примыкает в общем случае конечных элементов, каждый из которых вносит свой вклад в матрицу жесткости. Поэтому для каждого i-го узла суммарная матрица жесткости будет представлять собой сумму элементов матриц жесткости всех примыкающих к узлу элементов, т.е.
, (26)
в то время, как узловые перемещения для всех этих элементов будут общими в силу совместности перемещений всех элементов, соединенных в i-м узле. Поскольку узлы имеют две степени свободы, вектор перемещения i-го узла будет содержать две компоненты перемещений точно так же, как внешняя сила [см. формулу (25)] имеет две компоненты Pxi, Pyi. Совокупность перемещений всех m неопорных узлов сети конечных элементов определится m-мерным вектором перемещений:
(27)
Общую матрицу жесткости для всей конструкции можно выразить в виде
. (28)
Окончательная зависимость между вектором сил (25) и вектором перемещений (27) будет иметь вид
. (29)
Таким образом, вектор узловых значений искомой функции будет равен
. (30)
Литература:
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 16. Аналитические модели сложных систем
16.1 Основные понятия
Математическое моделирование позволяет устанавливать зависимости выходных (y1, у2, ..., уn) переменных от входных переменных (x1, x2 ,..., хn) при целенаправленном изменении внутренних параметров (h1, h2,..., hn) с учетом в ряде случаев воздействия внешней среды. Наиболее просто эта задача решается, если известна функциональная зависимость между соответствующими многомерными векторами:
(1)
В таком виде математическую модель удается получить только для очень простых ситуаций. В обычных условиях математическое описание процессов в исследуемом объекте задают в форме системы дифференциальных уравнений. Понятно, что ЭВМ не может непосредственно оперировать даже с простейшими зависимостями типа (1), поэтому построение математических моделей подразумевает комплекс преобразований этих зависимостей до уровня, допускающего численное решение, и последующую реализацию такого решения на основе программ анализа в виде элементарных арифметических и логических операций.
В простейших ситуациях исходная задача может быть представлена системой линейных алгебраических уравнений, которая легко сводится к последовательности элементарных операций (ПЭО) на основе стандартных процедур с использованием библиотечных программ. Если модель задана системой нелинейных алгебраических уравнений, то возможны либо непосредственный переход к ПЭО, либо предварительная линеаризация с дальнейшим переходом к ПЭО (рис. 1).
Рис. 1. Преобразования уравнений при построении аналитических моделей
Наиболее типичными являются модели, в которых исследуемый процесс описывается обыкновенными дифференциальными уравнениями или дифференциальными уравнениями в частных производных. Численные решения таких уравнений основаны на дискретизации переменных или алгебраизации задачи. Дискретизация заключается в замене непрерывных переменных конечным множеством их значений в заданных для исследования интервалах, а алгебраизация - в замене производных алгебраическими соотношениями, Если дифференциальные уравнения в частных производных описывают статическое состояние, то дискретизация и алгебраизация преобразуют дифференциальные уравнения в систему алгебраических уравнений, в общем случае нелинейных. Так, если рассматриваются переменные, изменяющиеся в пространстве и во времени, то при решении задачи на первом этапе устраняются производные по пространственным координатам, что позволяет перейти к обыкновенным дифференциальным уравнениям, а затем - производные по времени с переходом к алгебраическим уравнениям. Дальнейшее решение задачи может выполняться на основе метода простых итераций, либо быть сведено к предварительной линеаризации на основе метода Ньютона с переходом к линейным алгебраическим уравнениям. Решение системы таких уравнений выполняется с помощью прямых методов, например, метода Гаусса.
Ниже рассмотрена цепочка последовательных преобразований, которая позволяет однотипными приемами решать различные задачи. За базовое принято численное решение дифференциальных уравнений первого порядка с заданными начальными условиями (задача Коши) и системы таких уравнений. К подобным уравнениям может быть приведено обыкновенное дифференциальное уравнение n-го порядка. Дифференциальное уравнение с заданными граничными условиями может быть представлено как редукция к задаче Коши и тем самым решено аналогичными способами.
16.2 Приближенное решение ОДУ при заданных начальных условиях
Математическое моделирование систем, описываемых обыкновенным дифференциальным уравнением при заданных начальных условиях, осуществляется наиболее просто, если уравнение в явном виде разрешено относительно производной:
От влияния внутренних параметров h и воздействий внешней среды v можно избавиться, повторяя решение заданного уравнения при фиксированных значениях этих параметров h=const, v=const.
Рассмотрим дифференциальное уравнение первого порядка
(2)
Если требуется найти интегральную кривую у=у (х), проходящую через заданную точку М0 (х0, у0), то формулируется задача Коши: найти решение у=у(х) уравнения, удовлетворяющее начальному условию у(х0)=у0.
Существуют различные приемы решений такой задачи: метод последовательных приближений, интегрирование уравнений с помощью степенных рядов, методы Адамса, Крылова, Милна и др. Ниже рассмотрены методы Эйлера и Рунге-Кутта, первый из которых является наиболее наглядным, а второй - наиболее популярным.
16.3 Метод Эйлера и его модификации
Принцип численного решения уравнения (2) при начальном условии у(х0)=у0, основанный на методе Эйлера, чрезвычайно прост. Он непосредственно вытекает из смысла производной. Подставляя заданное начальное значение х0 и у0 в правую часть Исходного уравнения (2), мы определим производную в этой точке: y'(х=х0)=f(х0, у0), т. е. найдем тангенс угла наклона касательной к искомой кривой. Это дает возможность определить приближенное значение функции в соседней точке при x1 =x0 + h (рис. 2). При этом приращение функции будет , а полное значение ординаты при этом составит . Таким образом, получены приближенные координаты соседней точки x1, y1, принимая которые за исходные, мы можем повторить вычисления методом Эйлера и найти следующую точку с координатами х2, у2. Аналогично вычисляются все последующие точки по формулам
(3)
где h - достаточно малый шаг приращений координаты х.
Рис. 2. К решению уравнения методом Эйлера
Для того чтобы назначить величину шага, обеспечивающую необходимую точность вычислений, расчет повторяют при шаге, в два раза меньшем первоначального. Если разница в результатах вычислений превышает требуемую точность, то шаг разбиения уменьшают еще раз и повторяют расчет.
Метод Эйлера приводит к систематическому накоплению ошибок, поэтому в практике расчетов используют модификации этого метода: метод ломаных и метод Эйлера-Коши.
В первом случае сначала вычисляют промежуточные значения
и находят направление поля интегральных кривых в средней точке
, а затем полагают .
Во втором случае грубое приближение
, уточняется следующим образом:
Дальнейшим развитием и уточнением метода Эйлера являются различные схемы метода Рунге-Кутта. Ниже рассмотрена одна из таких схем, получившая наибольшее распространение.
16.4 Метод Рунге-Кутта
Основная схема метода Рунге-Кутта имеет вид:
(4)
где
(5)
(i = 1, 2,…, n).
Для определения правильности выбора шага h выполняют двойной пересчет, как это было отмечено при рассмотрении метода Эйлера.
16.5 Приближенное решение ДУ n-го порядка при заданных начальных условиях
Для дифференциального уравнения n-го порядка
(6)
задача Коши состоит в нахождении решения
удовлетворяющего начальным условиям
; ; …;
где x0, y0, yo'… - заданные числа. Такая задача может быть приведена к решению системы дифференциальных уравнений путем подстановок
, , …, (7)
Будем иметь:
(8)
Дальнейшее решение задачи выполняют как указано выше, например, методом Рунге-Кутта.
Для примера найдем приближенное решение нелинейного дифференциального уравнения свободных колебаний маятника в среде, обладающей сопротивлением. Пусть - угол отклонения маятника от положения равновесия, t - время. Полагая, что сопротивление среды пропорционально угловой скорости маятника, имеем для = (t) нелинейное дифференциальное уравнение второго порядка
(9)
где - коэффициент затухания колебаний;
g - ускорение свободного падения;
l - длина маятника.
Принимая =0,2, g/l= 10, приходим к уравнению
(10)
с начальными условиями: угол отклонения , угловая скорость .
Выполняя подстановки типа (9), т.е. полагая , запишем уравнение (10) в виде системы уравнений
,
(11)
Приближенное решение этой системы будем искать методом Рунге-Кутта, используя зависимости (9). При этом роли и в уравнениях (9) будут исполнять их значения:
,
.
Примем: h=0,1; , . При i=0 находим:
;
;
;
;
;
;
;
;
.
Следовательно, при t1=0,1, имеем:
;
Продолжая процесс вычислений для других значений ti, последовательно можем определить все интересующие нас значения .
16.6 Приближенное решение ДУ при заданных граничных условиях (краевых задач)
Рассмотренные выше приемы решений обыкновенных дифференциальных уравнений при заданных начальных условиях в одной точке получены путем последовательного интегрирования уравнения по участкам, на которые может быть разбит весь интервал задания подынтегральной функции. В краевой задаче, когда для дифференциального уравнения заданы граничные условия в различных точках, необходимо получить решение в виде общего интеграла. Для решения таких более сложных задач существуют различные способы. Мы рассмотрим лишь некоторые из них, позволяющие свести решения краевых задач к рассмотренным выше задачам Коши.
16.6.1 Метод начальных параметров
Метод начальных параметров основан на дополнении поставленных для краевой задачи граничных условий в начале участка интегрирования некоторыми параметрами, называемыми начальными. Эти параметры выбирают так, чтобы полученная при этом совокупность начальных условий полностью определяла решение поставленной задачи.
Пусть дана краевая задача для системы n линейных дифференциальных уравнений первого порядка.
(12)
с граничными условиями на концах интервала [0, l]
;
(13)
где - вектор неизвестных у1(х), y2(х),..., уn(х);
А(х) - матрица коэффициентов при неизвестных;
- вектор свободных членов;
- векторы постоянных интегрирования.
Общий интеграл системы уравнений (3.40) запишем в следующем виде:
(14)
где - частное решение матричного уравнения (12), удовлетворяющее всем нулевым начальным условиям ;
- частное решение соответствующего уравнению (12) однородного уравнения , удовлетворяющее начальным условиям , где все элементы равны нулю, кроме i-гo, который равен единице; ci - постоянные интегрирования.
Подстановкой полученного по (12) решения в условия (13) получают систему n алгебраических уравнений для определения ci. Найденные постоянные подставляют в (14), откуда находят решение исходной краевой задачи.
16.6.2 Редукция к задаче Коши для линейного ДУ второго порядка
Найдем решение линейного дифференциального уравнения
(15)
удовлетворяющего краевым условиям
;
(16)
где p(x), q(x), f(x) -- непрерывные функции; -- заданные постоянные, причем , .
Из курса высшей математики известно, что если u=u(x) -- частное решение соответствующего однородного уравнения
(17)
то произведение cu, где c - произвольная постоянная, есть общее решение этого уравнения. Тогда общее решение исходного неоднородного уравнения (3.42) y=y(x) будет, равно сумме общего решения см однородного уравнения (17) и частного решения v=v(x) неоднородного уравнения
(18)
Таким образом, искомое решение запишем в виде комбинации
(19)
Потребуем, чтобы первое краевое условие (17) выполнялось для функции y при любом c. Для этого подставим выражение (19) в это краевое условие, в результате чего будем иметь
Такое условие возможно для произвольного c, если будут выполнены равенства
,
.
Следовательно,
; (20)
где постоянная , при этом
, , если (21)
, , если (22)
Отсюда видно, что u есть решение задачи Коши для однородного уравнения (17), удовлетворяющее начальным условиям (18), а v есть решение задачи Коши для неоднородного уравнения (18), удовлетворяющее начальным условиям (18) или (19). При этом для любого c функция (20) удовлетворяет первому краевому условию (18), т.е. при x=a.
Подберем теперь постоянную c так, чтобы функция (22) удовлетворяла второму краевому условию (20) при x=b. Будем иметь
, откуда
(23)
Литература:
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 17. Модели многосвязных технических систем
17.1 Основные понятия
Многосвязная техническая система может состоять из подсистем разной физической природы. Например, автомобиль включает в себя подсистемы питания, смазки, охлаждения, электроснабжения и др. Все эти подсистемы при функционировании тесно взаимодействуют друг с другом. Моделирование подобных систем удобно осуществлять на макроуровне. Для этой цели разработан универсальный аппарат с мощным программным обеспечением. Мы рассмотрим основные принципы моделирования систем на макроуровне, при этом будем использовать несколько устаревшие, но весьма наглядные условные обозначения элементов.
Каждый элемент технической системы выполняет вполне определенные функции. Математическое описание этой функции в форме аналитического выражения или в виде систем уравнений (алгебраических, дифференциальных, интегральных) образует математическую модель элемента. Переменные, которые фигурируют в математической модели и определяют в конечном итоге состояние или поведение элемента, принято называть переменными состояния или фазовыми переменными, а уравнения, устанавливающие связь между разнородными фазовыми переменными в пределах одного элемента - компонентными уравнениями.
Если обозначить фазовые переменные для i-го элемента через и то компонентное уравнение можно записать в виде
(1)
Для объединения элементов в ансамбль (рис. 1) для каждого узла сопряжения элементов должна быть установлена зависимость между однородными фазовыми переменными
; (2)
(3)
тех элементов i, j, ... системы, которые примыкают к данному узлу.
Рис. 1 Фрагмент системы элементов
В общем случае техническая система может состоять из элементов разной физической природы, поэтому при объединении элементов в ансамбль могут встретиться большие трудности (при попытках установить связь между фазовыми переменными различных элементов). Такие трудности будут устранены, если для всех элементов системы использовать группы однородных фазовых переменных, имеющих одинаковое математическое описание вне зависимости от типа элемента и протекающих в нем процессов. А это значит, что фазовые переменные, входящие в уравнения типа (1), должны отражать фундаментальные закономерности, присущие всем элементам системы. Примером фундаментальных закономерностей являются энергетические принципы, которые мы и будем брать за основу при рассмотрении электрических, механических, тепловых, гидравлических и пневматических подсистем.
В каждой такой подсистеме энергия может быть представлена в форме совокупностей потенциальной V и потоковой J дуальных переменных, а все многообразие элементов может быть сведено к простейшим элементам трех типов: С, L, R. На элементах С и L происходит накопление потенциальной (кинетической) энергии, а на элементе типа R - рассеивание (диссипация) энергии.
Моделирующий элемент может представлять собой (замешать) физическую единицу системы, либо отражать отдельные свойства такой единицы в форме математических образов. Поэтому при рассмотрении аналогий компонентных уравнений было бы правильно использовать понятие «компоненты», однако, в силу сложившихся традиций, мы будем называть замещающие двухполюсники элементами, имея в виду, что реальный элемент системы иногда может быть замещен двумя и более двухполюсниками.
17.2 Типы элементов
Элемент типа С. Элемент типа С характеризует емкость, инертность и другие подобные свойства моделируемой системы. Графическое изображение такого элемента (двухполюсника) показано на рис. 2, а. Для механических подсистем используют также иное условное обозначение (рис. 2, б), при этом параметру С присваивают символ т.
Компонентное уравнение (1) для элемента типа С имеет вид
(4)
где F и V - соответствующие потоковые и потенциальные фазовые переменные.
В электрических подсистемах элемент типа С определяет электрическую емкость и описывается уравнением
, (4a)
где I и U - соответственно сила тока и падение напряжения.
В механических подсистемах элемент С характеризует массу тела в уравнении второго закона Ньютона:
. (46)
Рис. 2. Элемент типа С
Аналогично для механических вращательных подсистем формулу (4) можно записать в виде
, (4в)
где М- момент силы; I - момент инерции; - угловая скорость.
В тепловых подсистемах С характеризует теплоемкость тела C=dQ/dT, где dQ --изменение количества теплоты в теле при изменении температуры на dТ.
Компонентное уравнение (4) применительно к тепловому потоку Ф и температуре Т имеет вид
(4г)
где - теплоемкость тела, зависящая от удельной теплоемкости с и массы m тела:.
В гидравлических и пневматических подсистемах значения С характеризуют степень сжимаемости жидкости (газа) при плотности ? и объеме V: C=p?V. При этом связь между давлением ? и расходом Qm определяется формулой
. (4д)
Аналогия уравнений типа (4) не является чисто формальной с точки зрения одинакового математического описания. Вероятно, за этой аналогией стоят скрытые закономерности, присущие природе в форме энергетических либо иных взаимных соответствий, тем более, что для всех рассмотренных подсистем между фазовыми переменными F и V существуют также аналогии для элементов типов L и R. Возвращаясь к элементу типа С, мы можем отметить, что С есть мера «емкости» или мера «инертности» при взаимодействии фазовых переменных в формах потока и потенциала, а точнее, при взаимосвязи потока со скоростью изменения потенциала. В механических подсистемах мерой инертности служит масса, в электрических и тепловых - емкость (теплоемкость). Изменение во времени потенциала (скорости движения в механических подсистемах, напряжения в электрической цепи, температуры при нагреве тела) приводит к изменению потока (движущей силы в механических системах, силы тока в электрических цепях, теплового потока при нагреве тел). Мерой взаимного соответствия этих изменений служит величина С. Чем больше емкость конденсатора, масса автомобиля, теплоемкость чайника с водой, тем труднее зарядить конденсатор до напряжения U, разогнать автомобиль до скорости v, нагреть воду до температуры Т.
Элемент типа L. Элемент типа L на эквивалентных схемах электрических и других подсистем изображают как катушку индуктивности (рис. 3, а). Для механических подсистем обычно используют условное обозначение пружины (рис. 3, б).
Компонентное уравнение для элемента типа L записывают в виде
(5)
где V, F - потенциальная и потоковая фазовые переменные.
В электрических подсистемах элемент типа L определяет индуктивность, при этом напряжение U связано с силой тока I зависимостью
. (5 а)
Для механических подсистем компонентное уравнение
(5 6)
может быть получено путем дифференцирования по времени уравнения пружины F= kx, где х - перемещение; k - жесткость пружины. В формуле (5, б) аналог электрической индуктивности L характеризует податливость пружины .
Рис. 3. Элемент типа L
Аналогичное компонентное уравнение можно получить для упругого стержня, используя закон Гука. При растяжении (сжатии) будем иметь
; (5 в)
при изгибе
; (5 г)
при кручении
(5 д)
где Е, G - модули упругости при растяжении и сдвиге; А - площадь поперечного сечения; J, Jk - моменты инерции при изгибе и кручении.
В гидравлических и пневматических подсистемах давление р идеальной жидкости (газа) связано с массовым расходом Q уравнением
(5 е)
где Lp - l/A зависит от длины трубопровода l и площади его поперечного сечения А. Для реальных жидкостей формула (5е) не учитывает массовые силы и гидравлическое сопротивление, которые могут быть учтены дополнительно
Элемент типа R. Условное графическое изображение элемента типа Rпоказано на рис. 4 для электрических (а) и механических (б) подсистем. Общее уравнение такого элемента имеет вид
F= V/R. (6)
В электрических подсистемах этому уравнению соответствует закон Ома
; (6 a)
в механических -- уравнение вязкого трения:
(6 б)
где -- величина, обратная коэффициенту вязкого трения;
в гидравлических -- отмеченное выше гидравлическое сопротивление:
, (6 в)
где - аналог электрического сопротивления (v - кинематическая вязкость; d, l -- диаметр и длина трубопровода);
в тепловых подсистемах:
(6 г)
где тепловой поток Ф и температура Т зависят от конвекционного сопротивления Rk.
Таким образом, во всех рассмотренных подсистемах можно установить аналогии фазовых переменных типа потока и потенциала (табл. 1).
Рис. Элемент типа R
17.3 Источники энергии и преобразователи. Аналоги топологических уравнений
Условное графическое изображение источников энергии типа Е и I показано на рис. 5.
На рис.. 6, а приведена схема трансформатора, имеющего математическую модель
(7)
где Т - коэффициент трансформации.
Рис. 5. Источники энергии
Примерами трансформаторов в механических подсистемах могут служить рычаги энергии и редукторы.
Гиратор (рис. 6, б) имеет модель
(8)
где G - коэффициент гирации.
Примером гиратора может служить гидроцилиндр, в котором давление Р преобразуется в силу F, действующую на поршень.
Рис. 6. Схемы трансформаторной (а) и гираторной (б) связи
Топологические уравнения типа (7), (8) в большинстве физических подсистем базируются на уравнениях равновесия и уравнениях неразрывности. Ниже рассмотрены аналогии топологических уравнений в подсистемах различной физической природы. Условимся снабжать индексом i элементы, примыкающие к данному узлу, а индексом j - входящие в данный контур, при этом в знаках суммы (?) обозначения «» или «», где p, q - соответственно множество ветвей, примыкающих к узлу i и входящих в контур j, будем опускать.
Электрическая подсистема
Уравнения равновесия определяют равенство нулю суммы токов в узлах сопряжения элементов; их находят по первому закону Кирхгофа:
(9)
Уравнения неразрывности соответствуют второму закону Кирхгофа. Они выражают равенство нулю суммы падений напряжений на элементах схемы, образующих контур:
. (10)
Механическая подсистема
Уравнения равновесия отражают принцип Д' Аламбера: сумма сил, действующих на тело, включая инерционные, равна нулю:
(9 а)
Для вращательных подсистем суммируются моменты сил, действующих относительно оси вращения.
Уравнения неразрывности определяются принципом сложения скоростей: абсолютная скорость является суммой относительной и переносных скоростей (которых может быть несколько: с первого тела на второе, со второго на третье и т. д.).
. (10 а)
Для вращательных подсистем следует суммировать угловые скорости.
Гидравлическая (пневматическая) подсистема
Уравнения равновесия определяют равенство нулю потоков Q, подтекающих к узлу или оттекающих от него:
(9 б)
Уравнения неразрывности соответствуют сумме падений давлений при обходе по контуру:
. (10 6)
Тепловая подсистема
Уравнения равновесия определяют равенство нулю суммы тепловых потоков ,подтекающих или оттекающих от узла, т. е.
(9 в)
Уравнения неразрывности соответствуют сумме разности температур Tj на участках, входящих в замкнутый контур:
. (10 в)
Источники энергии типа потока J и разности потенциалов Е делят на независимые и зависимые.
Независимые источники используют для моделирования постоянных воздействий на объект, например, сила тяжести может быть отражена постоянным источником силы F, напряжение питания электрической схемы - источником типа разности потенциалов.
Зависимые источники делят на две группы: источники, зависимые от времени, и источники, зависимые от фазовых переменных. Первые используют для моделирования внешних воздействий, вторые - для отражения нелинейных свойств объекта, а также для отражения взаимосвязей между подсистемами различной физической природы.
Примером взаимной зависимости двух подсистем p и q различной физической природы может служить трансформаторная связь этих подсистем (см. рис. 6). Зависимый источник разности потенциалов в одной подсистеме зависит от разности потенциалов на зависимом источнике потока другой подсистемы, который, в свою очередь, зависит от потока через первый источник.
Эквивалентные схемы технических объектов строят путем объединения в ансамбль всех элементов подсистем (в том числе различной физической природы), образующих данный технический объект. В эквивалентной схеме отражаются элементы и свойства реального объекта, оказывающие существенное влияние на его функционирование.
Двухполюсники (см. рис. 2...6), моделирующие элементы и (или) компоненты подсистем, соединяют между собой в соответствии со структурой подсистемы и с учетом функциональных связей между компонентами. В первую очередь рекомендуется объединять наиболее существенные элементы. Так, при моделировании механических подсистем вначале выделяют компоненты типа массы. Один из полюсов двухполюсника (рис. 2, б) соединяют с базовым узлом, отражающим инерциальную систему отсчета, второй полюс характеризует воздействие этой массы на некоторые элементы объекта, поэтому его следует соединить с полюсами этих элементов. Далее в механической подсистеме выделяют элементы трения и упругости. Элементы трения (рис. 4) включают между контактирующими телами, элементы упругости (рис. 3) - между телами, соединенными упругой связью. Внешние силы отображают включением источника силы между базисным и тем узлом, к которому подключен элемент массы, подверженной действию этой силы.
Построение эквивалентных схем рассмотрим на конкретных примерах.
Муфта сцепления автомобиля (рис. 7) служит для регулирования плавного соединения коленчатого вала двигателя с первичным валом коробки передач.
Рис. 7. Муфта сцепления (а) и её эквивалентная схема (б)
Крутящий момент через вал имеющий крутильную жесткость передается на маховик и диск с фрикционной накладкой. Суммарный момент инерции ведущего диска равен . Небольшая часть крутящего момента теряется в подшипнике с коэффициентом трения . Когда диски прижаты друг к другу, крутящий момент через фрикционные накладки передается на ведомый диск и далее через вал , на коробку передач.
Эквивалентная схема полностью отражает механизм передачи крутящего момента от двигателя до коробки передач. Момент моделируется током трение в подшипнике - резистором , гибкость вала - индуктивностью , масса ведущего диска - моментом инерции . Работу фрикционных накладок отражает резистор R. Дальнейшая передача момента от диска до коробки передач аналогична рассмотренной.
Примером механической поступательной системы (рис. 8) служит автомобиль массой , который перевозит груз массой и прицеп массой . В прицепе находится подпружиненный груз массой .
Рис. 8. Поступательная механическая система и её эквивалентная схема:
На рисунке F - тяга автомобиля; и - приведенные коэффициенты трения между грузами и кузовами автомобиля и прицепа; и - упругости сцепления и пружины крепления груза к прицепу
В качестве примера системы, состоящей из электрической, механической и пневматической подсистем, рассмотрим вибронасос (рис. 9). Под воздействием переменного магнитного поля, возникающего в зазоре электромагнита, приходит в движение груз массой т. Этот груз, шарнирно связанный через рычаг с насосом, действует на сильфон S, который, пульсируя, прокачивает воздух через клапаны k.
Рис. 9. Схема вибронасоса
В устройстве можно выделить конструктивно самостоятельные простые подсистемы, доказанные на эквивалентной схеме замещения (рис. 10): обмотку электромагнита 1, электромагнит 2, рычажный механизм 3, сильфон и воздушную магистраль с клапаном Связи этих подсистем осуществляются гираторами для пар 1-2 и 3-4 и трансформатором - для пары 2-3.
Рис.10. Эквивалентная схема замещения вибронасоса
17.4 Метод получения топологических уравнений
Эквивалентная схема технической системы может быть представлена в виде графа, ребра которого изображают двухполюсники, замещающие элементы (компоненты) системы. Пусть задан граф (рис. 11) некоторой технической системы. Топологические уравнения равновесия (типа уравнений первого закона Кирхгофа) могут быть записаны для каждого сечения, которое может включать один или несколько узлов. Для узлов, отмеченных на рис. 11, можем записать (принимая знак минус при направлении ребер к рассматриваемому узлу) следующие уравнения:
сечение 1 ;
сечение 1-5 ;
сечение 2 (11)
сечение 4 .
Топологические уравнения неразрывности (аналоги второго закона Кирхгофа) будут иметь вид:
(12)
Процедура получения уравнений (11), (12) может быть формализована. Для этой цели вводят матрицу контуров и сечений - М-матрицу. Такую матрицу строят с помощью ориентированного графа эквивалентной схемы и выбранного для этого графа дерева. Количество столбцов матрицы соответствует числу ветвей дерева, а количество строк - числу хорд.
Рис.11. Граф эквивалентной схемы
При формировании М-матрицы хорды поочередно включают в дерево с образованием замкнутого контура. При обходе этого контура в направлении включенной хорды формируют строку матрицы. В столбцах матрицы, соответствующих ветвям дерева, ставят +1 при совпадении направления ветви с направлением обхода и -1, если направления противоположны.
Рассмотрим построение М-матрицы (табл. 1) для графа, показанного на рис. 11. Принимая пятый узел за базовый, построим дерево графа (рис. 12). При подключении хорды 1-2 образуется контур 1-2, 2-3, 3-5, 1-5,поэтому в первой строке матрицы будем иметь - 1 (для ветви 1-5), + 1 (для ветвей 2-3, 3-5) и 0 (для ветви 3-4). Аналогично заполняют остальные строки.
Таблица 10.2
Хорды |
Ветви дерева |
||||
1 - 5 |
3 - 5 |
2 - 3 |
3 - 4 |
||
1 - 2 2 - 4 4 - 5 |
-1 0 0 |
1 0 -1 |
1 -1 0 |
0 -1 1 |
Топологические уравнения с использованием М-матрицы имеют вид:
(13)
где - векторы переменных типа разности потенциалов на ветвях дерева и хордах;
- векторы переменных типа потока для ветвей дерева и хорд.
Записывая первое уравнение (13) в развернутом виде
вы можете убедиться, что оно совпадает с системой уравнений (12). Аналогично, второе уравнение (13) совпадает с (11). Таким образом, использование М-матрицы позволяет формализовать процедуру получения математической модели. При этом сечения дерева специально выбирать не надо. Выше такие сечения приведены для наглядности.
Рис.12. К построению М-матрицы
Возможна иная формализация процедуры построения математической модели с использованием матрицы инциденций. Будем рассматривать исходный граф (см. рис, 11) как хорды некоторого фиктивного дерева (рис. 13), ветви которого на рисунке изображены пунктирными линиями.
Составим М-матрицу, поочередно включая в фиктивное дерево хорды исходного графа. Так, контур 1-5 состоит из хорды 1-5 и ветви 1-5, направление которой противоположно хорде, поэтому в М-матрице этой ветви будет отвечать значение - 1. В контуре 2-3-5 направление ветви 3-5 совпадает с направлением хорды, а для ветви 2-5 - не совпадает, поэтому будем соответственно иметь +1 и -1. Включая последовательно все хорды, получим М-матрицу (рис. 13), приведенную в табл. 2, или, выделяя содержательную часть М-матрицы.
Рис.13. Граф с фиктивным деревом
(14)
Таблица 10.3
Хорды |
Ветви дерева |
||||
1 - 5 |
2 - 5 |
3 - 5 |
4 - 5 |
||
1 - 5 3 - 5 4 - 5 3 - 4 1 - 2 2 - 4 2 - 3 |
-1 0 0 0 -1 0 0 |
0 0 0 0 1 -1 -1 |
0 -1 0 -1 0 0 1 |
0 0 -1 1 0 1 0 |
Рассмотрим второе уравнение системы (13), которое будет справедливо для М-матрицы (14), но с некоторым отличием. Это отличие связано с тем, что было построено фиктивное дерево, поэтому в ветвях его не будет токов и, следовательно, исходное уравнение примет вид . Индекс «х» у вектора J мы опустили, поскольку хордами являются все ребра исходного графа. Обратите внимание, что транспонированная М-матрица представляет собой не что иное, как матрицу инциденций исходного графа (см. рис.), записанную с обратными знаками:
(15)
Все это позволяет записать второе уравнение системы (13) в ином виде: .
Первое уравнение системы (13) изменится следующим образом. Разность потенциалов ветвей дерева Uvd есть разность потенциалов i-й и базовой точек, т. е. потенциал i-й точки . М-матрица будет равна , поэтому первое уравнение системы (13) примет вид .
Все сказанное дает возможность записать систему уравнений (13) в следующей форме:
(16)
Таким образом, возможны два способа формализации процедур построения математической модели для описания эквивалентной схемы технического объекта, в одном из которых используют систему уравнений (13) и М-матрицу, в другом - систему уравнений (16) и матрицу инциденций ориентированного графа.
В качестве примера рассмотрим механическую систему (рис. 14, а), эквивалентная схема (б) и граф (в) которой изображены на рисунке. Матрица инциденций приведена в табл. 3.
Таблица 3
Узлы графа |
Дуги графа |
|||||||||
F |
R1 |
L1 |
L2 |
R2 |
R3 |
m1 |
m2 |
m3 |
||
1 2 3 |
-1 |
1 |
1 -1 |
1 -1 |
1 |
1 |
1 |
1 |
1 |
Рис. 14. К примеру механической системы
Первое уравнение (16) в развернутой форме имеет вид:
где потоковые переменные JR, JL, Jm=Jc типов R, L, С можно записать в форме приведенных выше зависимостей между фазовыми переменными. В результате будет получена система дифференциальных уравнений. Транспонируя матрицу инциденций и используя второе уравнение системы (16), аналогично можно получить систему дифференциальных уравнений для переменных типа потенциала.
Литература:
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 18. Многокритериальная оптимизация
18.1 Свойства задач принятия решения со многими критериями
В технической практике задачи ПР с учетом нескольких критериев возникают достаточно часто. Сложность подобных задач существенно выше, чем при наличии одного критерия. Если при этом еще учитывать и неоднозначность внешних воздействий, то для получения корректного результата кроме математических знаний необходим также и опыт в соответствующей предметной области.
Теоретически можно представить случай, когда во множестве окажется одна альтернатива, для которой все r критериев (целевых функций) принимают наибольшие значения (в предположении, что все критерии максимизируются). Естественно, что данная альтернатива и будет наилучшей. К сожалению, на практике такие ситуации практически не встречаются, а типичным является случай, представленный на рис. 1, для двух целевых функций.
Рис. 1. Ситуация ПР для двух критериев
При Х* максимума достигает одна целевая функция, а при Х** - другая; нам же предстоит сделать только один выбор. Очевидно, что ППР здесь становится менее прозрачным.
Сформулируем некоторые очевидные положения для подобных ситуаций:
1. Не существует результата наилучшего в абсолютном смысле.
2. Решение может считаться лучшим лишь для конкретного ЛПР, с учетом его предпочтений.
3. Для нахождения приемлемого результата должна строиться многокритериальная модель, которая создается для уточнения предпочтений ЛПР. Она должна быть логически непротиворечивой и должна включать в себя основные свойства решаемой задачи.
Прежде чем переходить к рассмотрению многокритериальных задач, остановимся на предпосылках их постановки, т.е. укажем причины, порождающие проблему многокритериальности. Для этого обратимся к блок-схеме, приведенной на рис. 2 в лекции 2 (рис. 2). Данная схема отражает рациональную логическую последовательность этапов при подготовке и принятии решений.
С проблемой многокритериальности лицо, принимающее решение, сталкивается на этапе 7 (Выбор наиболее предпочтительного вариата решения). Вместе с тем, ЛПР на более ранних этапах (2 и 3 при формулировании цели и критериев оценки) сам предопределяет постановку многокритериальной задачи. Следовательно, предпосылкой постановки многокритериальной задачи является необходимость проведения этапа 3 (формирования системы критериев). Этот этап может и отсутствовать, если цель принятия решения четко определяется одним критерием.
В практических задачах цель - весьма сложное понятие, которое даже содержательно не всегда удастся четко определить, тем более, количественно измерить степень ее достижения. Поэтому осуществляется декомпозиция сложного понятия 'цель принятия решения' на более простые единичные критерии, каждый из которых может быть количественно измерен. В большинстве случаев в качестве единичных критериев используются общепринятые характеристики исследуемого объекта, измеряемые по шкалам интервалов или отношений.
Полное и четкое описание цели множеством критериев является основой успешного решения поставленной задачи принятия решений.
Таким образом, причинами проведения этапа 3 и, соответственно, предпосылками постановки многокритериальных задач являются сложность цели принятия решений и трудность измерения степени достижения цели различными вариантами решения задачи.
Рис. 2. Этапы подготовки и принятия решений
Следовательно, постановку многокритериальной задачи предопределяет сам исследователь (ЛПР) из-за того, что не смог сформировать в математическом виде целевую функцию, а на этапе 7 он сталкивается с необходимостью решения многокритериальной задачи.
Следует отметить, что поскольку описание цели системой критериев является неформальной процедурой, то и последующее агрегирование критериев на этапе 7 также не является формальной процедурой. Поэтому решение многокритериальной задачи не является строгой математической задачей, а представляет собой набор процедур, помогающих ЛПР разобраться и уточнить цель принятия решений, устранить ошибки в своих оценках, сделать свое поведение в процессе выбора рациональным.
Примеры постановок многокритериальных задач из разных областей деятельности:
Выбор площадок для строительства промышленных объектов. В данной задаче необходимо учитывать группы критериев: экономические, экологические, социальные, критерии безопасности и т.д.
Оценка качества продукции (технического уровня разработок) по множеству потребительских свойств. Следствием данной задачи является определение цены на продукцию на основе потребительских свойств.
Проектирование на основе принципа многовариантности. Каждый из вариантов в абсолютном большинстве оценивается множеством критериев. В этой связи следует подчеркнуть, что системы автоматизированного проектирования должны включать подсистему выбора и оценки решений по многим критериям.
Проведем классификацию многокритериальных задач (рис. 3).
Рис. 3. Классификация МКЗ
По характеру решаемой многокритериальной задачи (МКЗ) можно выделить два класса задач.
Задачи, в которых множество объектов конечно, будем называть дискретными многокритериальными задачами (ДМКЗ). В задачах этого класса множество многокритериальных объектов в пространстве критериев f1f2...fm представляет собой множество дискретных точек. Дискретные МКЗ чаще всего ставятся в экономике и квалиметрии.
Второй класс образует непрерывные многокритериальные задачи (НМКЗ), которые формулируются следующим образом:
Имеется объект исследования, характеризующийся параметрами x1,...,xn. Требуется определить оптимальные в некотором смысле значения этих параметров с учетом нескольких критериев (целевых функций) k1,...,km. При этом задана область определения параметров x1,...,xn и целевые функции k1=f1(x1,...,xn);...; km=fm(x1,...,xn).
Область определения параметров (переменных) задается обычно в виде системы ограничений, например, в многокритериальных задачах линейного программирования - система линейных неравенств. Поэтому непрерывную многокритериальную задачу можно рассматривать как задачу, в которой бесконечное множество объектов.
Так как непрерывные МКЗ, как правило, возникают при оптимизации параметров сложных объектов, то в литературе их еще называют задачами векторной оптимизации. Одной из задач векторной оптимизации является многокритериальная задача линейного программирования.
Будем называть каждый из скалярных критериев оптимальности частным критерием оптимальности. Совокупность частных критериев оптимальности будем называть векторным критерием оптимальности. Предполагаем, что ставится задача оптимизации каждого из частных критериев оптимальности в одной и той же области допустимых значений D.
Вторым признаком классификации многокритериальных задач является вид требуемого результата решения задачи. По этому признаку выделим следующие классы многокритериальных задач:
задачи, в которых необходимо выделить из множества объектов один наиболее предпочтительный объект (получить одно наиболее предпочтительное решение). В некоторых случаях может быть выделено не одно, а подмножество эквивалентных и наиболее предпочтительных объектов. Постановка задачи выделения наиболее предпочтительного объекта может быть как для дискретных, так и для непрерывных многокритериальных задач;
задачи, в которых необходимо упорядочить многокритериальные объекты. Постановка многокритериальной задачи в таком виде чаще всего имеет место для дискретных МКЗ, например, упорядочить по предпочтению варианты технических систем, по качеству - образцы продукции;
задачи, в которых требуется дать оценку полезности (качества) объектов по шкале интервалов. Другими словами, необходимо построить функцию полезности. Очевидно, что такая постановка задачи может быть как для дискретных, так и для непрерывных МКЗ;
задачи, в которых требуется выделить подмножество эффективных (конкурирующих) объектов. Такие подмножества называют оптимальными по Парето, но об этом более подробно поговорим чуть позже.
18.2. Формирование множества критериев
Количество критериев должно охватывать все особенности задачи. Число критериев считается полным и достаточным, если прибавление нового критерия не изменит результата решения, а отбрасывание критерия этот результат меняет. Все критерии не должны сильно коррелировать друг с другом. Степень корреляции между ? и ? критериями можно определить по следующей формуле:
где
где Хi - случайная альтернатива из множества, i=1, …, N; f?(Хi), f?(Хi) - критерии; N - число случайных испытаний.
Если K приближается к 1, то это свидетельствует о сильной корреляции критериев. Тогда необходимо рассмотреть вопрос об исключении одного из критериев.
Каждому критерию может быть поставлена в соответствие своя координатная ось и шкала. Последняя может быть непрерывной или дискретной, количественной или качественной (рис. 4).
Рис. 4. Выбор альтернативы с учетом двух критериев: а -- в случае непрерывной области альтернатив; б -- в случае дискретных альтернатив
Каждую ось будем обозначать буквой fk, k = 1, 2, …, r. f1 ? f2 ? ... ? fr - декартово произведение, которое формирует пространство критериев, где имеет место множество векторных оценок. Между пространством параметров и пространством критериев существует соответствие (рис. 5).
Рис. 5. Пространства параметров и критериев:
D - допустимая область, DФ - аналог допустимой области в пространстве критериев
18.3 Методология решения многокритериальных задач
При решении многокритериальных задач обычно задаются параметрические ограничения вида xi min ? xi ? xi mах, при i=1, 2, …, n, которые формируют в пространстве параметров n-мерный параллелепипед (рис. 4, а). Далее предполагается, что заданы функциональные ограничения вида pj (x) ? 0, при j=1, 2, …, m, которые вырезают в параллелепипеде некоторую часть D, состоящую из точек Х, удовлетворяющих одновременно параметрическим и функциональным ограничениям. В лекции 5 эту часть пространства мы называли допустимой областью (ДО). Множество D может оказаться весьма сложным, например, состоящим из нескольких отдельных частей (рис. 6, б, закрашенные участки).
Наконец, предполагается, что заданы соответствующие критерии fk(Хi), k =1, 2, …, r. Для определенности здесь будем считать, что критерии f1, …, fr желательно уменьшить.
Предположим, что ЛПР сумел указать разумные критериальные ограничения вида , при k =1, 2, …, r. При этом - значение для одной из линий равного уровня n-го критерия.
Очевидно, - это наихудшее значение критерия, на которое ЛПР может согласиться. Обозначим через G множество точек Х, которые удовлетворяют параметрическим, функциональным и критериальным ограничениям. Понятно, что (рис. 6, в, закрашенные области).
а)
б)
в)
Рис. 6. Формирование параметрическими (а), функциональными (б) и критериальными (в) ограничениями области поиска экстремума
Наилучшее решение целесообразнее искать среди точек множества G, а не среди точек множества D, поскольку, если точка , то значения всех критериев в этой точке приемлемы. Понятно, что завышенные требования ЛПР могут привести к G=0, т.е. область поиска решений окажется пустой.
При решении многокритериальных задач выбора основная трудность состоит в неоднозначности выбора наилучшего решения. Для ее преодоления используют две группы методов.
В методах первой группы стремятся сократить число критериев, для чего вводят дополнительные предположения, относящиеся к процедуре сопоставления критериев и построению моделей оптимизации. В методах первой группы стремятся сократить число альтернатив в исходном множестве, исключив заведомо плохие альтернативы.
К методам первой группы относятся метод свертки, метод главного критерия, метод пороговых критериев и метод расстояния.
Методы второй группы основаны на свертке в множестве альтернатив. С их помощью пытаются уменьшить число возможных вариантов решений, исключив заведомо плохие. Один из подходов, обладающий большой общностью, называется методом, основанным на принципе Парето. Для уменьшение числа альтернатив исходного множества выделяют множество Парето, являющееся подмножеством исходного.
После того, как построено множество Парето, для определения наилучшего решения (из оставшихся) применяются методы первой группы либо графические методы, например, метод диаграмм. Схема поиска наилучшего решения представлена на рис. 7.
Рис. 7. Схема поиска наилучшего решения
Подчас необходимые для определения предпочтений знания в области ТПР, умения и навыки у ЛПР отсутствуют, а требуемые для совершения этой работы активные ресурсы - время, деньги, специальное математическое обеспечение и т. п. - отсутствуют в нужных количествах. Да ведь и не все проблемы, возникающие перед ЛПР, на практике оказываются столь важными, чтобы обязательно и как можно более точно моделировать его предпочтения. Как тут быть? Во всех перечисленных случаях для отыскания, наилучшей альтернативы ТПР рекомендует ЛПР следовать принципу Родена. Когда у этого великого скульптора спросили, как ему удается создавать столь великие шедевры, Роден ответил: «Я просто беру глыбу мрамора и отсекаю от нее все лишнее!».
Прекрасная идея: последовательно отсекайте от множества альтернатив все элементы, которые «не нужны», которые являются «лишними», а то, что останется (не лишнее) - это и есть то, что вам нужно - наилучшая альтернатива (или несколько эквивалентных по предпочтительности наилучших альтернатив). Концептуальную идею, изложенную в вербальной форме Роденом, реализовал в формальном виде и превратил в одну из наиболее эффективных функций выбора видный социолог и итальянский экономист Вильфредо Парето в 1897 году.
Он рассматривал распределение богатства и доходов в Англии XIX века. Он выяснил, что большая часть доходов и материальных ценностей принадлежит меньшинству людей в исследованных группах. Возможно, что для Парето не было в этом ничего удивительного. Однако он также установил два очень примечательных, по его мнению, факта. Первым был тот, что существует неизменное математическое соотношение между численностью группы людей (в процентах от общей численности рассматриваемого населения) и долей богатства или дохода, контролируемой этой группой. Другими словами, если известно, что 20% населения владеют 80% материальных ценностей, то можно с уверенностью сказать, что 10% населения имеют приблизительно 65% материальных ценностей, а 5% населения -- 50%. Для Парето главным здесь были не цифры процентного соотношения, а тот факт, что распределение богатства среди населения предсказуемо несбалансированно.
Другой находкой Парето, восхитившей его, было то, что данная схема дисбаланса оставалась неизменной для статистических данных, относящихся к различным периодам времени и различным странам. Будь то данные по Англии за любой период ее истории или доступные Парето данные по другим странам за разные периоды времени, выяснялось, что схема снова и снова повторяется, причем с математической точностью.
Его открытие называли по-разному, в том числе принципом Парето, законом Парето, правилом 80/20, принципом наименьшего усилия, принципом Дисбаланса.
Принцип 80/20 гласит, что небольшая доля причин, вкладываемых средств или прилагаемых усилий, отвечает за большую долю результатов, получаемой продукции или заработанного вознаграждения. Например, на получение 80% результатов, достигаемых в работе, у вас уходит 20% всего затраченного времени. Выходит, что на практике 4/5 приложенных вами усилий (немалая доля) не имеют к получаемому результату почти никакого отношения. Это, кстати, расходится с тем, чего люди обычно ожидают.
Введем на множестве D отношение предпочтения (обозначим его символом ). Будем говорить, что вектор предпочтительнее вектора , и писать , если среди равенств и неравенств имеется хотя бы одно строгое неравенство (рис. 6).
Аналогично на множестве DФ введем отношение доминирования: будем говорить, что векторный критерий оптимальности доминирует векторный критерий оптимальности , и писать , если .
Другими словами, объект доминирует объект , если по всем критериям предпочтительнее или эквивалентен , и хотя бы по одному критерию строго предпочтительнее. Объект называют доминирующим, а - доминируемым.
Если исключить из исходного множества доминируемые объекты, то останутся конкурирующие (эффективные).
Введенные отношение предпочтения и отношение доминирования являются транзитивными, т.е.
если и , то ;
если и , то
Выделим из множества DФ подмножество точек, для которых нет точек, их доминирующих. Множество , соответствующее , называется множеством Парето (переговорным множеством, областью компромисса) -- рис. 7. Поскольку множество DФ на рисунке 7 является выпуклым, то множество есть часть границы множества DФ -- дуга AB, в которой точка A соответствует f1min, а точка B f2min. Среди точек
,
нет более предпочтительных, поскольку
, но .
Таким образом, если , то .
Другими словами множество Парето можно определить как множество, в котором значение любого из скалярных (частных) критериев оптимальности можно улучшить только за счет ухудшения других частных критериев - любое из решений, принадлежащее множеству Парето, не может быть улучшено одновременно по всем частным критериям.
Альтернатива принадлежит множеству Парето, если она не хуже других по всем критериям и хотя бы по одному критерию лучше.
Рис. 8. Множество Парето
Для пояснения изложенного рассмотрим простейший метод, позволяющий приближенно находить множество Парето для случая двух критериев. На рис. 8, а построена область возможных значений в плоскости двух критериев. Исключение неэффективных точек в этом случае очень наглядно. Исключению подлежат все точки, образы которых в плоскости (f1, f2) расположены одновременно правее и выше образа исходной точки. В случае многих критериев геометрическая интерпретация аналогична.
После исключения неэффективных точек осталось всего 9 приближенно эффективных точек. Соединив их, получим приближенную компромиссную кривую E, которая вместе с точной компромиссной кривой D* построена на рис. 9, б. В качестве наилучшей среди исходной совокупности точек следует выбрать одну из этих 9 точек.
а)
б)
Рис. 9. Построение области Парето
Например, Андрей лучше всех решает задачи, а по остальным критериям не выделяется. Зато Вера, Галя, Ира, Катя, Лариса имеют высокие значения остальных критериев, так что они в среднем превосходят Андрея, причем Вера лучше всех по успеваемости, а по остальным критериям не хуже других студенток. Тогда Андрей обзятельно попадает в множество Парето, т.к. он уникальный (единственный) по первому критерию, а от группы студенток в множество Парето попадает один представитель - Вера, хотя остальные студентки превосходят Андрея по нескольким критериям (число критериев здесь не имеет значения).
Таким образом, поиск оптимального решения (точки) может осуществляться в соответствии с рисунком 10.
Рис. 10. Выбор оптимальной точки
18.4 Технологии отыскания эффективных решений
Суждения об относительной важности частных критериев ЛПР может выразить как в качественной, так и в количественной шкале. Если частные критерии измеряются в различных, а тем более разных по классам шкалах (количественных и качественных), их оценки не могут быть пересчитаны в некоторую объективную шкалу оценивания (например, в универсальный денежный эквивалент), то трудно представить, как соизмерить их относительную важность. А сделать это иногда требуется как можно быстрее и как можно адекватнее, чтобы можно было сразу представить себе ценность какой-то конкретной альтернативы. В подобных ситуациях, когда информацию об относительной важности требуется получить и использовать как можно быстрее и при этом обеспечить высокую адекватность и надежность суждений, более предпочтительным представляется учет относительной важности частных критериев в качественной шкале (так называемая «качественная информация об относительной важности»). К качественной информации об относительной важности частных критериев будем относить следующие вербальные суждения:
«критерий с номером i важнее критерия с номером j»;
«критерии с номерами s и t равноценны по важности».
Напрямую использовать информацию о превосходстве или равноценности для дальнейшего сокращения размера множества эффективных альтернатив и поиска наилучшего решения среди них можно только для некоторых частных случаев. Во-первых, это случай, когда шкалы всех частных критериев, относительно которых получена информация.
Второй частной ситуацией, когда возможно прямое использование качественной информации о равноценности или превосходстве в важности одних частных критериев над другими, является такая, в рамках которой фигурируют сообщения о равноценности всех критериев между собой, об абсолютно строгом (лексикографическом) упорядочении критериев по важности, а также о симметрически-лексикографическом упорядочении частных критериев по важности.
Самая сложная в получении, но и самая действенная - это информация об относительной важности критериев в количественной форме. Это информация о величинах замещений значений критериев между собой, о значениях коэффициентов важности частных критериев, количественная информация о допустимой степени взаимной компенсации значений тех или иных критериев, а также о виде функции агрегирования частных критериев в обобщенные критерии. В некоторых случаях такая информация поступает от ЛПР сразу. Но это - скорее исключение из правил. Значительно чаще количественную информацию приходится получать по частям.
18.5 Методы принятия решения при нескольких критериях
При необходимости ПР при многих критериях на практике обычно используют следующие подходы.
1. Свертка векторного критерия
Этот метод также называют скаляризацией векторного критерия или введением суперкритерия. Суть его заключается в следующем.
Выбираются коэффициенты ?k ? 0 так, что функция
обобщила в себе' все требования частных критериев. При этом обычно
и каждый ?k характеризует степень важности критерия fk(X).
На практике обычно ЛПР выбирает какие-то ?1, …, ?r, затем отыскивает наилучшую точку Х' - например, минимум S(X') при . Если при этом оказывается, что некоторые из значений ЛПР не удовлетворяют, тогда он корректирует значения ?1, …, ?r и решает задачу заново и т.д.
Рассмотренный подход также называют аддитивной сверткой. Он имеет существенный недостаток - трудно находить коэффициенты ?k из-за разных размерностей критериев.
Этого недостатка лишена свертка вида:
или ,
где - идеальное (реально недостижимое) значение k-го критерия, которое указывается ЛПР; - наименее предпочтительное для ЛПР значение k -го критерия; ?k , ?k - весовые коэффициенты с тем же смыслом, что и ?k. В двух последних свертках каждый k-й критерий выступает своим нормализованным значением , которое изменяется в пределах от 0 до 1. Данный подход снимает проблемы, обусловленные неодинаковыми размерностями входящих в свертку критериев.
Однако существуют и другие вопросы. В частности, можно показать, что выбор вида свертки влияет на конечный результат.
Для иллюстрации данного утверждения рассмотрим случай двух критериев Ф1 и Ф2 и предположим, что они оба получили одинаковые 'веса': ?1 = ?2 =0,5 и ?1 = ?2 =0,5 . Пусть допустимая область в пространстве критериев имеет вид, представленный на рис. 11 а.
а) б)
Рис. 11 . Иллюстрация влияния вида свертки на конечный результат: а - допустимая область; б - линии равного уровня для критерия S1 (прямые) и S2 (окружности)
Для интегрального критерия типа S1 линии равного уровня представляют собой прямые, задаваемые уравнениями:
На рис. 11 б они показаны в виде линий АВ и A'B'. Для интегрального критерия типа S2 линии равного уровня - окружности с центром в точке , которые описываются уравнением вида:
Из рис. 11 б видно, что первый тип рассматриваемой свертки предполагает выбор в качестве результата точки А или В; второй - точку С. Очевидно, что все три результата существенно отличаются друг от друга.
2. Оптимизация главного из нескольких критериев
При таком подходе один из критериев, наиболее важный с точки зрения ЛПР, оставляют в качестве единственного критерия, а все остальные заменяют ограничениями.
Пусть для определенности главным критерием считается f1(X). Тогда следует выбрать ограничения и рассмотреть задачу об отыскании минимума f1(X) при дополнительных ограничениях
При таком подходе возникает проблема выбора критериальных ограничений , что может потребовать выполнения специальных предварительных расчетов.
3. Последовательная оптимизация всех критериев
Сначала определяется минимальное значение f1(X) при . Обозначим его через . Выбираем 'уступку' по этому критерию h1 и назначаем критериальное ограничение . Затем находится минимальное значение f2(Х) при и дополнительном ограничении . Получив значение и выбрав 'уступку' h2, назначаем второе критериальное ограничение . После этого определяется минимальное значение f3(Х) при , и и т.д.
На последнем шаге требуется найти минимальное значение fr(X) при , . Если реализуется в точке Х*, то эта точка считается наилучшей.
Очевидно, что точка Х* зависит и от порядка нумерации критериев, и от выбора h1, …, hr-1. Кроме того, всегда остается сомнение в том, что выбрав какую-либо из уступок несколько большей, мы смогли бы существенно улучшить значения других критериев.
Все три метода нуждаются в дополнительной информации: в первом - это коэффициенты ?1, …, ?r; во втором - номер главного критерия и значения ограничений ; в третьем - порядок выбора критериев и величины уступок h1, …, hr-1.
Литература:
1. Попов Г.В. Выбор решений и безопасность: Учеб. пособие / Иван. гос. энерг. ун-т. - Иваново. 2003. - 92 с.
2. Карпенко А.П. Методы оптимизации (базовый курс). Электронное издание. 2007 URL: http://bigor.bmstu.ru/?cnt/?doc=BaseCourse
3. Романов В.Н. Системный анализ для инженеров / В.Н. Романов. - СПб: СЗГЗТУ, 2006. - 186 с.
Заключение
Источники опасностей, воздействующие на человека, природную среду и материальные ценности имеют естественное или антропогенное происхождение. Мир опасностей в начале XXI века достиг своего наивысшего развития. Ухудшение здоровья и гибель людей требуют от государства и общества приоритетного отношения к проблемам безопасности своего населения. Для этого должен быть задействован весь научно-технический потенциал, использованы имеющиеся у государства стратегические резервы. Иначе к 2050 г. в России численность населения может сократиться почти вдвое; ей грозит утрата значительных территорий и природных богатств.
Эффективность принимаемых решений на всех уровнях руководства страны, а также каждым человеком в обыденной жизни имеет первостепенное значение. Суммируясь, негативные решения стремительно приближают страну к полному краху, в то время как решения, взвешенные и исключительно ответственные способны вывести Россию из того бедственного состояния, в котором она оказалась.
Если после ознакомления с материалом учебного пособия читатель проникнется ощущением ответственности выбора при принятии решений для себя самого, своего окружения, организации, где он учится или работает, своей страны, то автор будет считать свою задачу выполненной.
Библиографический список
1) Попов Г.В. Выбор решений и безопасность: Учеб. пособие / Иван. гос. энерг. ун-т. - Иваново. 2003. - 92 с.
2) Ильина Н.В., Лапшин Д.Д., Федянин В.И. Системный анализ и моделирование процессов в техносфере: Учеб. пособие. Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. 206 с.
3) Ильина Н.В., Лапшин Д.Д., Федянин В.И. Системный анализ и моделирование процессов в техносфере: Учеб. пособие. Ч. 2. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. 128 с.
4) Романов В.Н. Системный анализ для инженеров / В.Н. Романов. - СПб: СЗГЗТУ, 2006. - 186 с.
5) Даниловцева Е.Р. Теория игр. Основные понятия: Текст лекций / Е.Р. Даниловцева, В.Г. Фарафонов, Г.Н. Дьякова. - СПб: СПбГУАП, 2003. - 36 с. (электронный курс)
6) Белов В.В., Воробьев Е.М., Шаталов В.Е. Теория графов. - М.: Высшая школа, 1976. - 392 с.
7) Балдин К.В. Теоретические основы принятия управленческих решений: Учеб. / К.В. Балдин, С.Н. Воробьев, В.Б. Уткин. - М.: Издательство Московского психолого-социального института; Воронеж: Издательство НПО «МОДЭК», 2005. - 504 с.
8) Александров Е.А. Основы теории эвристических решений. М.: Советское радио, 1975. - 254с.
9) Белкин А.Р., Левин М.Ш. Принятие решений: комбинаторные модели аппроксимации информации. М.:, 1990. - 160с.
10) Белов П.Г. Теоретические основы системной инженерной безопасности. - М.: МИБ СТС, 1996.- 424с.
11) Воропай Н.И. Теория систем для электроэнергетиков. - Новосибирск: Наука, 2000. - 272с.
12) Киселев В.Ю. Экономико-математические методы и модели. Иваново: ИГЭУ, 1998. - 384с.
13) Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений. М.: Наука, 1996. - 208с.
14) Мушик Э., Мюллер П. Методы принятия технических решений. - М.: Мир, 1990. - 206с.
15) Руа Б. Классификация и выбор при наличии нескольких критериев (метод Электра). - В кн.: Вопросы анализа и процедуры принятия решений. М.: Мир, 1976, С. 80-107.
16) Химмельблау Д. Прикладное нелинейное программирование. - М.: Мир, 1975. - 534с.
17) Эддоус М., Стэнсфилд Р. Методы принятия решений. М.: ЮНИТИ, 1997. - 590с.
18) Экология и безопасность жизнедеятельности / Д.А. Кривошеин, Л.А. Муравей, Н.Н. Роева и др. М.: ЮНИТИ-ДАНА, 2000.- 447с.
19) Кох П., Мюллер И. Библиотека программ систематической эвристики для ученых и инженеров. / Пер. с нем.-Йошкар -Ола: Марийское кн. изд-во, 1974.
20) Ушаков К. Матрица экранирования, или метод группового выбора лучшей идеи / К. Ушаков, М. Драмбян // Журнал «Директор школы», 2002. - №2. - С. 1-3.
21) Орлов А.И. Современная прикладная статистика. - Журнал «Заводская лаборатория». 1998. Т.64. No.3. С. 52-60.