31.08.2019

Критерии вальда и сэвиджа при принятии решения в условиях неопределенности. Статистические игры и принятие решений в условиях неопределенности


Предположим, что ЛПР (лицо, принимающее решения) рассматривает несколько возможных решений: i = 1,…,m. Ситуация, в которой действует ЛПР, является неопределенной. Известно лишь, что наличествует какой-то из вариантов: j = 1,…, n. Если будет принято i -e решение, а ситуация есть j -я, то фирма, возглавляемая ЛПР, получит доход q ij . Матрица Q = (q ij) называется матрицей последствий (возможных решений). Какое же решение нужно принять ЛПР? В этой ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме?
Допустим, мы хотим оценить риск, который несет i -e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть j -я, то было бы принято решение, дающее доход q ij .
Значит, принимая i -e решение мы рискуем получить не q j , а только q ij , значит принятие i -го решения несет риск недобрать r ij = q j - q ij . Матрица R = (r ij) называется матрицей рисков.

Пример №1 . Пусть матрица последствий есть
Составим матрицу рисков. Имеем q 1 = max(q i 1) = 8, q 2 = 5, q 3 = 8, q 4 = 12.. Следовательно, матрица рисков есть

Принятие решений в условиях полной неопределенности

Не все случайное можно "измерить" вероятностью. Неопределенность – более широкое понятие. Неопределенность того, какой цифрой вверх ляжет игральный кубик отличается от неопределенности того, каково будет состояние российской экономики через 15 лет. Кратко говоря, уникальные единичные случайные явления связаны с неопределенностью, массовые случайные явления обязательно допускают некоторые закономерности вероятностного характера.
Ситуация полной неопределенности характеризуется отсутствием какой бы то ни было дополнительной информации. Какие же существуют правила-рекомендации по принятию решений в этой ситуации?

Правило Вальда (правило крайнего пессимизма). Рассматривая i -e решение будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход a i Но теперь уж выберем решение i0 с наибольшим ai0 . Итак, правило Вальда рекомендует принять решение i0 , такое что
Так, в вышеуказанном примере, имеем a 1 = 2, a 2 = 2, a 3 = 3, a 4 = 1. Из этих чисел максимальным является число 3. Значит, правило Вальда рекомендует принять 3-е решение.

Правило Сэвиджа (правило минимального риска). При применении этого правила анализируется матрица рисков R = (rij) . Рассматривая i -e решение будем полагать, что на самом деле складывается ситуация максимального риска b i = max
Но теперь уж выберем решение i0 с наименьшим bi0 . Итак, правило Сэвиджа рекомендует принять решение i0 , такое что
В рассматриваемом примере имеем b 1 = 8, b 2 = 6, b 3 = 5, b 4 = 7 . Минимальным из этих чисел является число 5. Т.е. правило Сэвиджа рекомендует принять 3-е решение.

Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение i , на котором достигается максимум
, где 0 ≤ λ ≤ 1 .
Значение λ выбирается из субъективных соображений. Если λ приближается к 1, то правило Гурвица приближается к правилу Вальда, при приближении λ к 0, правило Гурвица приближается к правилу "розового оптимизма" (догадайтесь сами, что это значит). В вышеуказанном примере при λ = 1/2 правило Гурвица рекомендует 2-е решение.

Принятие решений в условиях частичной неопределенности

Предположим, что в рассматриваемой схеме известны вероятности pj того, что реальная ситуация развивается по варианту j . Именно такое положение называется частичной неопределенностью. Как здесь принимать решение? Можно выбрать одно из следующих правил.
Правило максимизации среднего ожидаемого дохода. Доход, получаемый фирмой при реализации i -го решения, является случайной величиной Qi с рядом распределения

qi1

qi2


qin

p1

p2


pn

Математическое ожидание M и есть средний ожидаемый доход, обозначаемый . Правило рекомендует принять решение, приносящее максимальный средний ожидаемый доход.
Предположим, что в схеме из предыдущего примера вероятности есть (1/2, 1/6, 1/6, 1/6). Тогда Максимальный средний ожидаемый доход равен 7, соответствует третьему решению.
Правило минимизации среднего ожидаемого риска. Риск фирмы при реализации i -го решения, является случайной величиной R i с рядом распределения

ri1

ri2


rin

p1

p2


pn

Математическое ожидание M и есть средний ожидаемый риск, обозначаемый также . Правило рекомендует принять решение, влекущее минимальный средний ожидаемый риск.
Вычислим средние ожидаемые риски при указанных выше вероятностях. Получаем Минимальный средний ожидаемый риск равен 7/6, соответствует третьему решению.
Анализ принимаемых решений по двум критериям: среднему ожидаемому доходу и среднему ожидаемому риску и нахождение решений, оптимальных по Парето, аналогично анализу доходности и риска финансовых операций. В примере множество решений, оптимальных по Парето операций, состоит только из одного 3-его решения.
В случае, если количество Парето-оптимальных решений больше одного, то для определения лучшего решения применяется взвешивающая формула .

Правило Лапласа

Иногда в условиях полной неопределенности применяют правило Лапласа, согласно которому все вероятности p j считают равными. После этого можно выбрать какое-нибудь из двух приведенных выше правил-рекомендаций принятия решений.

Рассмотрим последовательную процедуру проверки гипотез. Все предыдущие правила проверки двух гипотез были основаны на фиксированном числе испытаний, то есть сначала проводится измерений, строится отношение правдоподобия и затем оно сравнивается с порогом. С точки зрения минимального значения среднего числа испытаний (для ускорения процесса записи выборки), А. Вальд предложил и обосновал последовательный анализ измеряемых значений, т.е. обработка данных проводится по мере поступления новых измерений.

После каждого испытания
строится отношение правдоподобия
, которое сравнивается с двумя порогамии, то есть проверяется условие

(4.23)

При выполнении условия

и
(4.24)

принимается решение о верности гипотезы
(гипотеза
отклоняется). А при выполнении условия

и
(4.25)

принимается решение о верности гипотезы
(гипотезаотклоняется).

Как видно множество разбивается на три части: подмножествопринятия гипотезы
, подмножествопринятия гипотезыи область неопределённости, где нельзя отдать предпочтение той или иной гипотезе (в этом случае измерения должны быть продолжены). Из правил проверки гипотез (4.24) и (4.25) в данном случае следует, что объём выборки
не фиксирован и зависит от конкретного значения выборки
, то есть объём выборки естьслучайная величина .

В качестве критерия разумно выбрать минимальную среднюю стоимость эксперимента . Если “цена” одного эксперимента не меняется с увеличением
, то этот критерий переходит в критерий минимума среднего числа испытаний, необходимых для принятия решенияили.

А.Вальд доказал, что среди всех правил принятия решений (последовательных и непоследовательных), для которых условные вероятности ошибок не превосходят
ипоследовательное правило принятия решения, состоящее в сравнении отношения правдоподобия
с двумя порогамии, приводит к наименьшему значению среднего числа испытаний при верности
или. При независимости выборок имеем

В случае последовательного критерия отношения правдоподобия процедура проверки строится следующим образом:

Выбираются пороги и, как функции значений
и, и проверяется неравенство (4.23) на каждом шаге испытаний
.

Если
, то в качестве пороговиможно принять величины

,
. (4.26)

Вместо сравнения
с порогамииобычно логарифмируют обе части неравенства (4.23) и при независимых испытаниях проводят проверку по правилу


. (4.27)

На рисунке 4.1 показан пример изменения значений суммы случайного числа случайных величин до принятия решения при увеличении числа испытаний. Нужно иметь в виду, что в процедуре проверки гипотез по Вальду размер выборки - величина случайная. Из теории вероятностей известно, если независимы, распределены одинаково и их дисперсия ограничена, то

.

Откуда получим математическое ожидание числа испытаний

В применении к последовательному анализу получим математическое ожидание числа испытаний при различных состояниях источника:

,
(4.28)

Математические ожидания
и
зависят от проверяемой гипотезы и границ принятия решений. Пренебрегая перескоком границ
и
значениями сумм в момент принятия решения об остановке процедуры проверки гипотез (4.27), запишем соответствующие математические ожидания сумм

, (4.29)

. (4.30)

Математические ожидания логарифма отношения правдоподобия

при состоянии источников
и
определяются как

,
,

где
- плотность распределения вероятности выборкиy при состоянии источника
, – область, на которой определена плотность распределения вероятности
.

В случае дискретного распределения выборочных значений имеем

,
,

где m – количество значений y , которое может принимать случайная величина при однократном измерении,
.

Преимуществом последовательного анализа перед всеми остальными процедурами проверки гипотез заключается в том, что последовательный анализ Вальда даёт приблизительно 48% выигрыша в числе испытаний при проведении серии процедур проверки гипотез.

Во всех правилах принятия решения, кроме минимаксного правила, используется отношение правдоподобия и решение принимается при нарушении неравенств
, гдеС – порог, зависящий от выбранного критерия. Но само отношение правдоподобия – случайная величина, имеющая плотность распределения вероятности
, зависящей от состояния источника. Запишем вероятности ошибок и вероятности правильного принятия решений, используя плотность распределения вероятности отношения правдоподобия

, (4.33)

, (4.35)

Приведённые равенства показывают, что вероятности ошибок
и, а также вероятности правильных решений
и
, можно вычислять как по многомерным областями, так и по одномерной области, определяемой плотностями вероятностей
и
, что облегчает вычисления. Сведём в одну таблицу рассмотренные критерии.

Таблица правил принятия решений

Априорные

сведения

Критерий

Примечание

,


Объём выборки

=

=

. Объём выборки фиксирован, вероятности ,  вычисляются по
и


Объём выборки

Минимаксный

=

=

Объём выборки фиксирован, вероятности ,  вычисляются по выбранным правилам

Объём выборки

Максимума апостериорной вероятности

=

, Объём выборки фиксирован, вероятности ,  вычисляются по
и

Объём выборки

Максимального

правдоподобия

1=

Объём выборки фиксирован, вероятности ,  вычисляются по
и


Объём выборки

Неймана-Пирсона

Объём выборки фиксирован,
выбирается из условия.

Последовательный анализ Вальда

Минимизирует среднее число испытаний

Краткая теория

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под природой будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.

Управление любым объектом осуществляется путем принятия последовательности управленческих решений. Для принятия решения необходима информация (совокупность сведений о состоянии объекта управления и условиях его работы). В тех случаях когда отсутствует достаточно полная информация, возникает неопределенность в принятии решения. Причины этого могут быть различны: требующаяся для полного обоснования решения информация принципиально не может быть получена (неустранимая неопределенность); информация не может быть получена своевременно, к моменту принятия решения; затраты, связанные с получением информации, слишком высоки. По мере совершенствования средств сбора, передачи и обработки информации неопределенность управленческих решении будет уменьшаться. К этому нужно стремиться. Существование неустранимой неопределенности связано со случайным характером многих явлений. Например, в торговле, случайный характер изменения спроса делает невозможным его точное прогнозирование, a, следовательно, и формирование идеально точного заказа на поставку товара. Принятие решения в этом случае связано с риском. Приемка партии товара на основании выборочного контроля также связана с риском принятия решения в условиях неопределенности. Неопределенность может быть снята путем полного контроля всей партии, однако это может оказаться слишком дорогостоящим мероприятием. В сельском хозяйстве, например, с целью получения урожая человек предпринимает ряд действии (пашет землю, вносит удобрения, борется с сорняками и т. п.). Окончательный результат (урожай) зависит от действий не только человека, но и природы (дождь, засуха, вечер и т. п.). Из приведенных примеров видно, что полностью исключить неопределенность в управлении экономической системой нельзя, хотя, повторим, к этому нужно стремиться. В каждом конкретном случае следует принимать во внимание степень риска при принятии управленческих решений, по возможности максимально учитывать имеющуюся информацию с целью уменьшения неблагоприятных последствий, которые могут возникнуть из-за ошибочных решений.

Две стороны, участвующие в игре, будем называть игрок I и игрок II. Каждый из игроков располагает конечным набором действий (чистых стратегий), которые он может применять в процессе игры. Игра имеет повторяющийся, циклический характер. о каждом цикле игроки выбирают одну из своих стратегии, что однозначно определяет платеж . Интересы игроков противоположны. Игрок I старается вести игру так, чтобы платежи были как можно большими. Для игрока II желательны как можно меньшие значения платежей (с учетом знака). Причем в каждом цикле выигрыш одного из игроков в точности совпадает с проигрышем другого. Игры такого типа называются играми с нулевой суммой.

Решить игру - значит определить оптимальное поведение игроков. Решение игр является предметом теории игр. Оптимальное поведение игрока инвариантно относительно изменения всех элементов платежной матрицы на некоторую величину.

В общем случае определение оптимального поведения игроков связано с решением двойственной пары задач линейного программирования. В отдельных случаях могут быть использованы более простые методы. Часто платежную матрицу удается упростить путем удаления из нее строк и столбцов, соответствующих доминируемым стратегиям игроков, доминируемой называется стратегия, все платежи которой не лучше соответствующих платежей некоторой другой стратегии и хотя бы один из платежей хуже соответствующего платежа этой другой стратегии, называемой доминирующей.

В обычной стратегической игре принимают участие «разумные и антагонистические» противники (противоборствующие стороны). В таких играх каждая из сторон предпринимает именно те действия, которые наиболее выгодны ей и менее выгодны противнику. Однако очень часто неопределенность, сопровождающая некоторую операцию, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Игрок II - природа - в теории статистических игр не является разумным игроком, так как рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. В исследовании операций оперирующую сторону (игрока I) часто называют статистиком, а сами операции - играми статистика с природой или статистическими играми.

Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть оперирующей стороне необходимо выполнить операцию в недостаточно известной обстановке относительно состояний которой можно сделать предположений. Эти предположения будем рассматривать как стратегии природы. Оперирующая сторона в своем распоряжении имеет возможных стратегий - . Выигрыши игрока I при каждой паре стратегий и - предполагаются известными и заданы платежной матрицей .

Задача заключается в определении такой стратегии (чистой или смешанной), которая лри ее применении обеспечила бы оперирующей стороне наибольший выигрыш.

Выше уже говорилось, что хозяйственная деятельность человека может рассматриваться как игра с природой. Основной особенностью природы как игрока является ее не заинтересованность в выигрыше.

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и заведомо невыгодных стратегий лица, играющего с природой. Что касается стратегий природы, то ни одну из них отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока I. Ввиду того что природа не противодействует игроку I, может показаться, что игра с природой проще стратегической игры. На самом деле это не так. Противоположность интересов игроков в стратегической игре в некотором смысле как бы снимает неопределенность, чего нельзя сказать о статистической игре. Оперирующей стороне в игре с природой легче в том отношении, что она скорее.всего выиграет больше, чем в игре против сознательного противника. Однако ей труднее принять обоснованное решение, так как в игре с природой неопределенность ситуации сказывается в гораздо более сильной степени.

После упрощения платежной матрицы игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

Природа меняет состояние стихийно, совершенно не заботясь о результате игры. В антагонистической игре мы предполагали, что игроки пользуются оптимальными (в определенном выше смысле) смешанными стратегиями. Можно предположить, что природа применяет наверняка не оптимальную стратегию. Тогда какую? Если бы существовал ответ на этот вопрос, то принятие решения лицом, принимающим решения (ЛПР) сводилось бы к детерминированной задаче.

Если вероятности состояний природы известны, то пользуются критерием Байеса, в соответствии с которым оптимальной считается чистая стратегия , при которой максимизируется средний выигрыш:

Критерий Байеса предполагает, что нам хотя и неизвестны условиях выполнения операций (состояния природы) , но известны их вероятности .

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Если игроку представляются в равной мере правдоподобными все состояния природы, то иногда полагают и, учитывая, «принцип недостаточного основания» Лапласа, оптимальной считают чистую стратегию , обеспечивающую:

Если же смешанная стратегия природы неизвестна, то в зависимости от гипотезы о поведении природы можно предложить ряд подходов для обоснования выбора решения ЛПР. Свою оценку характера поведения природы будем характеризовать числом , которое можно связывать со степенью активного «противодействия» природы как игрока Значение соответствует наиболее пессимистичному отношению ЛПР в смысле «содействия» природы в достижении им наилучших хозяйственных результатов. Значение соответствует наибольшему оптимизму ЛПР. Как известно, в хозяйственной деятельности указанные крайности опасны. Скорее всего, целесообразно исходить из некоторого промежуточного значения . В этом случае используется критерий Гурвица, согласно которому наилучшим решением ЛПР является чистая стратегия , соответствующая условию:

Критерий Гурвица (критерий «оптимизма-пессимизма») позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся в поле между значениями по критериям «максимакса» и «максимина» (поле между этими значениями связано посредством выпуклой линейной функции).

В случае крайнего пессимизма ЛПР указанный критерий называется критерием Вальда. Согласно этому критерию, наилучшей считается максиминная стратегия. Это критерий крайнего пессимизма. По этому критерию ЛПР выбирает ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:

Такой выбор соответствует наиболее робкому поведению ЛПР, когда он предполагает наиболее, неблагоприятное поведение природы, боится больших потерь. Можно предположить, что он не получит больших выигрышей. Согласно критерию Сэвиджа, следует выбирать чистую стратегию соответствующую условию:

где риск .

Критерий Сэвиджа (критерий потерь от «минимакса») предполагает, что из всех возможных вариантов «матрицы решений» выбирается та альтернатива, которая минимизирует размеры максимальных потерь по каждому из возможных решений. При использовании этого критерия «матрица решения» преобразуется в «матрицу риска», в которой вместо значений эффективности проставляются размеры потерь при различных вариантах развития событий.

Недостатком критериев Вальда, Сэвиджа и Гурвица является субъективная оценка поведения природы. Хотя указанные критерии и дают некоторую логическую схему принятия решений, резонно все же задать вопрос: «А почему сразу не выбрать субъективное решение, вместо того чтобы иметь дело с разными критериями?» Несомненно, определение решения по различным критериям помогает ЛПР оценить принимаемое решение с различных позиций и избежать грубых ошибок в хозяйственной деятельности.

Пример решения задачи

Условие задачи

После нескольких лет эксплуатации оборудование может оказаться в одном из трех состояний:

  1. требуется профилактический ремонт;
  2. требуется замена отдельных деталей и узлов;
  3. требуется капитальный ремонт.

В зависимости от ситуации руководство предприятия может принять следующие решения:

Требуется найти оптимальное решение данной проблемы по критерию минимизации затрат с учетом следующих предположений:

a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15

Решение задачи

Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по методам оптимальных решений с контрольными или экзаменами.

Игра парная, статистическая. В игре участвуют 2 игрока: руководство предприятия и природа.

Под природой в данном случае понимаем совокупность внешних факторов, которые определяют состояние оборудования.

Стратегия руководства:

Отремонтировать оборудование своими силами

Вызвать бригаду специалистов

Заменить оборудование новым

Стратегия природы - 3 возможных состояния оборудования.

Требуется профилактический ремонт;

Следует заменить отдельные детали и узлы;

Требуется капитальный ремонт.

Расчет платежной матрицы и матрицы рисков

Поскольку элементы матрицы - затраты, то будем считать их выигрышными но со знаком минус. Платежная матрица:

-4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15

Составляем матрицу рисков:

-4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3

Критерий Байеса

Определяем средние выигрыши:

По критерию Байеса оптимальной является стратегия - вызвать бригаду специалистов

Критерий Лапласа

Определим средние выигрыши:

По критерию Лапласа оптимальной является стратегия - вызвать бригаду специалистов

Критерий Вальда

По критерию Вальда оптимальной является стратегия - вызвать бригаду специалистов

Критерий Сэвиджа

По критерию Сэвиджа оптимальной является стратегия - заменить оборудование новым

Критерий Гурвица

По критерию Гурвица оптимальной является стратегия - вызвать бригаду специалистов

Ответ

По всем критериям, за исключением критерия Сэвиджа, оптимальной является стратегия «Вызвать бригаду специалистов». По критерию Сэвиджа, который минимизирует риски, оптимальной является стратегия «Заменить оборудование новым».


Содержит изложенные в краткой и доступной форме теоретические сведения о матричной игре без седловой точки и способе сведения такой задачи к задаче линейного программирования, для отыскания ее решения в смешанных стратегиях. Приведен пример решения задачи.

Многоканальная СМО с неограниченной очередью
Приведены необходимые теоретические сведения и образец решения задачи по теме "Многоканальная система массового обслуживания с неограниченной очередью", подробно рассмотрены показатели многоканальной системы массового обслуживания (СМО) с ожиданием обслуживания - среднее число каналов, занятых обслуживанием заявки, длина очереди, вероятность образования очереди, вероятность свободного состояния системы, среднее время ожидания в очереди.

Критический путь, критическое время и другие параметры сетевого графика работ
На примере решения задачи рассмотрены вопросы построения сетевого графика работ, нахождение критического пути и критического времени. Также показано вычисление параметров и резервов событий и работ - ранних и поздних сроков, общих (полных) и частных резервов.

Нигда сам не принимай решения, если ты сможешь сделать так, чтобы его принял кто- либо другой .

Принцип Пфайфера

Принятие решения в условиях неопределенности имеет место, когда то или иное действие (или все действия) приводит к множеству возможных исходов, вероятности которых ЛПР неизвестны .

Нередко результат решения зависит от наступления определенных внешних ситуаций, которые не только не контролируются ЛПР, но и по которым у него отсутствует информация, при какой из этих ситуаций его решение должно быть эффективным. Особая трудность появляется, когда при конкретных внешних ситуациях каждый раз оптимальной была бы другая альтернатива. Выбор решения в таких условиях и называют принятием решения в условиях неопределенности.

Рассмотрим пример.

Таблица 21. Матрица решений

А1 92 160 40 Р1 Р2 Р3
А2 100 76 120 А1 92 160 40
А3 68 80 140 А2 100 76 120
А4 62 74 105 А3 68 80 140

Левая половина — исходная матрица, правая — после исключения неэффективной альтернативы

Целью является увеличение прибыли фирмы либо за счет нового продукта (альтернатива А1), либо за счет завоевания нового рынка (А2), либо за счет кооперации с другими фирмами (А3), либо за счет увеличения активности на существующих рынках (А4). Все четыре альтернативы приводят к разным результатам в зависимости от возможной конъюнктуры и условий конкуренции (Р1, Р2, Р3) .

Для начала может быть выполнен предварительный отбор альтернатив на основе принципов принятия решений. В частности, альтернатива А4 может быть исключена, т.к. она не эффективна по сравнению с альтернативой А3 .

Для выбора альтернативы в условиях неопределенности разработан ряд стратегий:

  • правило Вальда (максимин-правило) , иногда носит название минимакс-правило; его можно было бы назвать также правилом монашки: «береженого Бог бережет»;
  • максимакс-правило , называемое иногда минимин-правилом; его можно характеризовать русской поговоркой «кто не рискует, тот не пьет шампанское»;
  • правило Гурвича , называемое иногда правилом оптимизма- пессимизма; его можно характеризовать русской поговоркой «Бог не выдаст, свинья не съест»;
  • правило Сэвиджа–Нигана , называемое иногда правилом минимакса сожаления;
  • правило Лапласа ;
  • правило Крелле .

Правило Вальда ориентируется на ЛПР, настроенное пессимистично и стремящееся минимизировать потери. Оно признает только минимальную прибыль, но не убытки и выбирает опцию, которая максимизирует минимальную прибыль.

Для каждой внешней ситуации фиксируется минимальное значение, а потом из этих худших значений выбирается максимальное (табл. 22).

Пример (продолжение)

Наиболее приемлемой альтернативой при этом подходе альтернатива А2.

Таблица 22. Правило Вальда

 Максимакс-правило ориентируется на предельно оптимистичное ЛПР, для которого определяющим является только результат, достигаемый в лучшем случае.

Пример (продолжение)

В нашем примере выбирается альтернатива А1 (табл. 23).

Таблица 23. Правило максимакса

 Правило Гурвича представляет собой компромисс между двумя рассмотренными стратегиями. При этом для каждой альтернативы учитываются два значения – максимальное и минимальное. Для этого вводится дополнительный параметр оптимизма-пессимизма α , который учитывает индивидуальный подход ЛПР к риску. У пессимиста α лежит в диапазоне от 0 до 0,5, у оптимиста – от 0,5 до 1.

Пример (продолжение)

Таблица 24. Правило Гурвича (правило оптимизма-пессимизма)

В стратегии Сэвиджа–Нигана ЛПР ориентируется не на абсолютный результат, а на минимизацию максимально плохого результата . Для этого вычисляется таблица «сожалений». В ней для каждого состояния внешней среды, по каждой альтернативе вычисляется убыток/ущерб, который получается при выборе данной альтернативы по сравнению с оптимальной альтернативой (табл. 25). Для каждой альтернативы отмечаем максимальный ущерб. Выбираем альтернативу с минимумом максимального ущерба.

Достоинство этого подхода заключается в том, что минимизируется максимально возможная ошибка. Это отражает позицию пессимистичного или по крайней мере осторожного ЛПР.

Пример (продолжение)

Таблица 25. Правило Сэвиджа-Нигано (правило минимального сожаления)

Правило Лапласа предполагает, что ЛПР имеет нейтральное отношение к риску. Оно позволяет выбрать альтернативу с максимальной суммарной пользой. Для этого каждому состоянию внешней среды приписывается равная вероятность (которая определяется как 1, деленная на число рассматриваемых состояний среды). Далее определяется сумма для каждой альтернативы.

Пример (продолжение)

Оптимальной для нашего примера оказывается альтернатива А2.

Таблица 26. Правило Лапласа

С помощью правила Крелле пытаются учесть индивидуальные предпочтения ЛПР в отношении риска. Для этого необходимо определить индивидуальную функцию предпочтений ЛПР, что представляет собой сложную задачу. Затем все значения для каждой альтернативы пересчитываются с помощью этой функции в цифры полезности в глазах ЛПР. Если бы удалось достаточно объективно определить эту функцию субъективных предпочтений ЛПР, правило Крелле могло бы быть весьма эффективным. Но поскольку возможность ее надежного определения остается спорной, правило Крелле практически не применяется.

В табл. 27 для приведенного примера сопоставлены результаты выбора альтернатив с помощью рассмотренных критериев. На первый взгляд кажется нелепым, что наилучшая альтернатива зависит от метода ее определения. На самом деле здесь нет противоречия, поскольку метод выбора учитывает индивидуальные предпочтения ЛПР .

Пример (продолжение)

Таблица 27. Сопоставление решений, полученных с использованием различных правил

Критерии основаны на анализе матрицы возможных состояний окружающей среды и альтернатив решений.

Матрица, приведенная в таблице 1, содержит: Аj - альтернативы, т.е. варианты действий, один из которых необходимо выбрать; Si - возможные варианты состояний окружающей среды; aij - элемент матрицы, обозначающий значение стоимости капитала, принимаемое альтернативой j при состоянии окружающей среды i.

Таблица 1 - Матрица решений

Для выбора оптимальной стратегии в ситуации неопределённости используются различные правила и критерии, приведенные ниже.

Правило максимин (критерий Ваальда). В соответствии с этим правилом из альтернатив aj выбирают ту, которая при самом неблагоприятном состоянии внешней среды, имеет наибольшее значение показателя. С этой целью в каждой строчке матрицы фиксируют альтернативы с минимальным значением показателя и из отмеченных минимальных выбирают максимальное. Альтернативе а* с максимальным значением из всех минимальных даётся приоритет.

Принимающий решение в этом случае минимально готов к риску, предполагая максимум негативного развития состояния внешней среды и учитывая наименее благоприятное развитие для каждой альтернативы.

По критерию Ваальда лица, принимающие решения, выбирают стратегию, гарантирующую максимальное значение наихудшего выигрыша (критерия максимина).

Правило максимакс. В соответствии с этим правилом выбирается альтернатива с наивысшим достижимым значением оцениваемого показателя. При этом лицо, принимающее решение (ЛПР) не учитывает риска от неблагоприятного изменения окружающей среды. Альтернатива находится по формуле:

(а* = {аjmaxj maxi Пij}) (1)

Используя это правило, определяют максимальное значение для каждой строки и выбирают наибольшее из них.

Большой недостаток правил максимакса и максимина - использование только одного варианта развития ситуации для каждой альтернативы при принятии решения.

Правило минимакс (критерий Севиджа). В отличие от максимина, минимакс ориентирован на минимизацию не столько потерь, сколько сожалений по поводу упущенной прибыли. Правило допускает разумный риск ради получения дополнительной прибыли. Критерий Севиджа рассчитывается по формуле:

(min max П = mini ) (2),

где mini, maxj - поиск максимума перебором соответствующих столбцов и строк.

Расчёт минимакса состоит их четырёх этапов:

  • 1. Находится лучший результат каждой графы в отдельности, то есть максимум Xij (реакции рынка).
  • 2. Определяется отклонение от лучшего результата каждой отдельной графы, то есть maxi Xij - Xij. Полученные результаты образуют матрицу отклонений (сожалений), так как её элементы - это недополученная прибыль от неудачно принятых решений, допущенных из-за ошибочной оценки возможности реакции рынка.
  • 3. Для каждой сточки сожалений находим максимальное значение.
  • 4. Выбираем решение, при котором максимальное сожаление будет меньше других.
  • 20. Критерии Лапласа и Гурвица при принятии решения в условиях неопределенности

Правило Гурвица. В соответствии с этим правилом правила максимакс и максимин сочетаются связыванием максимума минимальных значений альтернатив. Это правило называют ещё правилом оптимизма - пессимизма. Оптимальную альтернативу можно рассчитать по формуле:

(а* = maxi [(1-?) minj Пji+ ? maxj Пji]) (3),

где? - коэффициент оптимизма, ? =1…0 при? =1 альтернатива выбирается по правилу максимакс, при? =0 - по правилу максимин. Учитывая боязнь риска, целесообразно задавать? =0,3. Наибольшее значение целевой величины и определяет необходимую альтернативу.

Правило Гурвица применяют, учитывая более существенную информацию, чем при использовании правил максимин и максимакс.

Таким образом, при принятии управленческого решения в общем случае необходимо:

  • · спрогнозировать будущие условия, например, уровни спроса;
  • · разработать список возможных альтернатив
  • · оценить окупаемость всех альтернатив;
  • · определить вероятность каждого условия;
  • · оценить альтернативы по выбранному критерию решения.

Критерий Байеса-Лапласа в отличие от критерия Вальда, учитывает каждое из возможных следствий всех вариантов решений:

Соответствующее правило выбора можно интерпретировать следующим образом: матрица решений дополняется еще одним столбцом, содержащим математическое ожидание значений каждой из строк. Выбирается тот вариант, в строках которого стоит наибольшее значение Wir этого столбца.

Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение, следующие требования:

вероятность появления состояния Vj известна и не зависит от времени;

принятое решение теоретически допускает бесконечно большое

количество реализаций;

допускается некоторый риск при малых числах реализаций.