Экстремальные модели менеджмента и экономики

Скачать в pdf «Экстремальные модели менеджмента и экономики»


1.    Задачу можно рассматривать как «-шаговый процесс.


2.    Целевая функция задачи равна сумме (или произведению) целевых функций отдельных шагов.


3.    Выбор управления на k-м шаге не влияет на состояние процесса на предшествующих шагах (отсутствие обратной связи).


4.    Состояние процесса после k-го шага зависит только от предшествующего состояния Sk _1 и управления на k-м шагеXk (отсутствие последействия).


Схема решения дискретных задач динамического программирования базируется на принципе оптимальности,    сформулиро


ванном Р. Беллманом в 1953 г.: каковы бы ни были начальное состояние S0 системы и решение в начальный момент времени, последующие решения должны составлять оптимальное управление относительно состояния, полученного в результате предыдущего решения. То есть на каждом этапе принимается такое решение, которое обеспечивает оптимальность с данного этапа до конца процесса, или, что то же самое, на каждом этапе необходимо принимать решение, просматривая его последствия до самого конца процесса.


Функциональные уравнения Беллмана — это математическая формулировка принципа оптимальности Беллмана.


Будем считать, что определяется максимум целевой функции Z. Пусть на п-м шаге значение целевой функции Zп(Sп_1)=maxfп(Sп_1, ), то есть выигрыш на последнем шаге зависит только от выбора управленияХ« на этом шаге.


На (п-1)-м шаге


Z«-1(S«-2) max { fn-1(Sn-2-, Хп-1) + Z«(Sn_1)} max { fп_1(Sп_2, Хп-1) + Zn(Sn_1(Sn_2, -^^«-1)) ^,


т.е. на (п-1)-м шаге необходимо выбрать управление Хп-1 так, чтобы сумма выигрышей на п-м и (п-1)-м шагах была максимальной.


Аналогичные рассуждения будут для всех остальных шагов решения на k-м шаге:


Zk(Sk-2) = max { fk(Sk-1, Xk) + Zk+1(Sk)} =


=max { fk(Sk-1, Xk) + Zk+1(Sk(Sk-1, Xk))},


где k = п-1, п-2, п-3, …, 1.

Скачать в pdf «Экстремальные модели менеджмента и экономики»