Матричные игры: чистые и смешанные стратегии .стохастические методы управления запасами

Заказать уникальную курсовую работу
Тип работы: Курсовая работа
Предмет: Математические методы в экономике
  • 3030 страниц
  • 14 + 14 источников
  • Добавлена 14.07.2008
800 руб.
  • Содержание
  • Часть работы
  • Список литературы
  • Вопросы/Ответы
Теоретическая часть
I. Матричные игры: чистые и смешанные стратегии
1.1. Матричные игры. Двойственная задача линейного программирования
II. Стохастические методы управления запасами.
2.1. Специфика выбора критерия оптимальности
2.2. Управление запасами в условиях неопределенности
2.3. Дихотомический выбор (задача о золотодобыче)
2.4. Марковские процессы принятия решений
Практическая часть.
Заключение
Список использованной литературы
Фрагмент для ознакомления

За исключением лишь частных случаев решение такой задачи затруднительно.

2.4. Марковские процессы принятия решений
Пусть некоторая система в любой фиксированный момент t может находиться в одном из n состояний и перейти из этого состояния в любое другое. Пусть вероятность Pt(i,j) перехода в момент t из i-го состояния в j-е не зависит от предыстории системы. Такая система называется марковской.
Обозначив через Xt(i) ожидаемую вероятность того, что в момент t система находится в i -м состоянии, находим ожидаемую вероятность нахождения системы в любом состоянии в любой последующий момент:

Так, если вероятности перехода не зависят от t, определяются матрицей

и в начальный момент система находится в состоянии 1, т.е. X0(1)=1, X0(2)=0, то:

Заметим, что при вероятностях перехода, не зависящих от времени, система обладает свойством стационарности, т.е. функция Xt(j) при t®Ґ асимптотически сходится к функции X(j), удовлетворяющей уравнениям:

Для нашего примера
X(1) = 1/2X(1) + 1/3X(2), X(2) = 1/2X(1) + 2/3X(2),
откуда с учетом X(1) + X(2) = 1 получаем X(1) = 0.4, X(2)=0.6.
Предположим, что в каждый момент времени выбор вероятностей перехода зависит от некоторой политики (выбора) q и переход сопровождается получением некоторого благоприятного эффекта Rij(q).
Обозначим через Fk(i) ожидаемый эффект функционирования системы, находившейся в начальный момент в i-м состоянии, за k периодов при использовании оптимальной политики. Руководствуясь принципом оптимальности, требующим независимо от начального состояния i и от начального выбора q далее действовать оптимально, т.е. гарантировать максимум ожидаемого эффекта в последующем процессе, приходим к рекуррентным соотношениям вида:

F0(i) = 0, i = 1 . . n.
Для процессов большой длительности использование приведенных рекуррентных соотношений требует существенных затрат времени даже при машинной реализации процесса вычислений. Если учесть, что при независимости значений вероятностей и эффектов от времени процесс обладает свойством стационарности, то в предположении регулярности (возможности прямого или опосредствованного перехода из любого состояния в любое) полагаем для больших k
Fk(i)=Fi+kG, (2)
где G - средний эффект за период и Fi-составляющая суммарного эффекта, определяемая начальным состоянием.

Cистему функциональных уравнений можно решать приближением в поведениях. Приведенную систему можно получить, если записать уравнение для бесконечношагового процесса с учетом дисконтирования, положить величину дисконтированного эффекта равной Fi + G/(1-a) и принять a=1.
Для иллюстрации марковского процесса принятия решений рассмотрим "задачу о такси" .
Таксист обслуживает окрестности трех городов и может руководствоваться одним из трех выборов: ездить по городу в поисках случайного пассажира, ждать вызова по радио или поехать на стоянку и стать там в очередь.
Для каждого города (i) и каждого выбора (q) известны вероятности поездки в тот или иной город и соответствующие доходы, сведенные в таблице:

Возьмем за начальное поведение q0=(1, 1, 1), т.е. во всех городах придерживаться первого выбора. Для выбранного поведения строим систему n уравнений с n+1 неизвестными

разрешимую с точностью до константы. Для нашего примера:

Полагая, например, F3=0, получаем F1=4/3, F2=7.47 и G = 9.2, т.е. выбранная политика дает средний доход за одну поездку, равный 9.2.
Вычисляем

при всех i и q и найденных значениях Fi:

Выбирая максимальное из значений Ti(q) по q, получаем улучшенное поведение q =(1, 2, 2). Строим и решаем систему уравнений

получая F3=0, F2=-3.88, F1=12.85, G=13.15.
Попытка дальнейшего улучшения дает политику q =(2, 2, 2), для которой F3=0, F2=-1.18, F1=12.86, G=13.34. Очередная попытка улучшения приводит к той же политике, откуда напрашивается вывод о том, что оптимальная политика состоит в использовании второго выбора во всех городах и обеспечивает средний ожидаемый доход за одну поездку, равный 13.34.
Имеется алгоритм, обобщающий рассмотренный выше метод Ховарда приближения в поведениях на случай, когда сеть возможных переходов между состояниями распадается на несколько подсетей, переходы между которыми невозможны .



















Практическая часть.

При решении поставленной задачи введем следующую таблицу:
х у Запасы металл 2 5 10000 лист 5 2 10000 доход 30 40 Фонд рабочего времени 1 2 4000
Построим экономико-математическую модель, исходя из заданных условий:
2х+5у≤10000
5х+2у≤10000
х+2у≤4000
х+у≥1500
00
Целевая функция:
z=30x+40y--->max

Для применения графического метода приведем данную модель к следующему виду:
х/5000+у/2000≤1
х/2000+у/5000≤1
х/4000+у/2000≤1
х/1500+у/1500≥1
00














Построим исходную область
У




Х










Получили многоугольник ABCDEF. Используя вектор целевой функции (30,40), указываем направление в котором необходимо искать максимум. Этим максимумом оказывается точка D. Найдем ее координаты:
5х+2у=10000
х+2у=4000
х=1500
у=1250
Целевая функция приобретает свой максимум дохода при производстве 1500 деталей типа Х и 1250 деталей типа Y. При этом величина этого максимального дохода:
z=1500*30+1250*40=95000 ден.ед. Заключение

Как можно было заключить из вышеизложенного, математические методы имеют большую степень универсальности. Основой этой универсальности является язык математики. Если исследователи различных специальностей часто говорят об одной и той же проблеме совершенно по-разному, видят разные ее особенности, и не могут связать их воедино; то перевод проблемы на математический язык сразу выявляет общие закономерности, и даже может дать уже практически готовое решение, полученное ранее где-то в другой отрасли знаний и для других целей. То есть предпосылкой использования математики является формализация количественных и качественных сторон проблемы.

В то же время на применение математики в различных науках накладывают ограничения объективные законы, присущие той или иной форме движения. Изучение неживой материи стало предпосылкой для создания концепции континуума - непрерывного пространства-времени. Эта концепция стала базой для множества открытий и не теряет своей значимости и теперь. Но концепции непрерывности сопутствовали не только успехи. Одновременно возникла традиционность " непрерывного мышления", трудности преодоления которого мы начинаем понимать только теперь, с появлением и совершенствованием ЭВМ. Хотя еще и раньше детальное исследование неизбежно требовало перехода к дискретному описанию, чем демонстрировало недостаточность и ограниченность континуального мышления.

Тем более континуальное мышление пробуксовывает при попытке описания биологической формы движения, где почти все объекты различны и дискретны. Что уже тогда говорить об экономических системах, в которых дискретность доходит до максимума; когда дискретными являются не только объекты, но и их взаимодействия и даже промежутки времени, для которых надо найти оптимальный план.

То есть имеет смысл говорить о таких особенностях экономических систем, которые требуют принципиально новых методов исследования. В то же время нельзя и отмежевываться от старых, проверенных методов описания. В практике использования формализованного описания огромную роль играет апроксимация реальных и очень сложных режимов и связей относительно более простыми. Поэтому получать информацию с точностью, необходимой для практики, мы можем, оперируя с относительно простыми пространствами о объектами. Это вовсе не ставит под сомнение необходимость дальнейшего совершенствования языка математики.

Перспективными методами исследования в экономике, несомненно, следует считать теорию игр и стохастическое моделирование. Их роль возрастает с совершенствованием электронно-вычислительных машин. Переработка все больших объемов статистической информации позволит выявлять более глубокие вероятностные закономерности экономических явлений. Развитие же такого специфического рода вычислительных систем, как самообучающиеся системы или так называемый "искусственный интеллект" возможно, позволит широко использовать моделирование экономических взаимоотношений с помощью деловых компьютерных игр. Играя, самообучающиеся системы будут приобретать опыт принятия оптимальных решений в самых сложных ситуациях, не теряя при этом преимущества вычислительной техники перед человеком - большой объем памяти, прямой доступ к ней, быстродействие






Список использованной литературы

Гермейер Ю.Б. Введение в теорию исследования операций. -М.: Наука, 1971.
Гермейер Ю.Б. Игры с непротивоположными интересами.- Изд МГУ, 1972.
Дубров А.М. , Лагоша Б.А., Хрусталев Е.Ю. Моделирование рисковых ситуаций в экономике и бизнесе: Учебное пособие.- М.: Финансы и статистика, 1999.
Дюбин Г.Н., Суздаль В.Г. Введение в прикладную теорию игр.- М .: Наука, 1986.
Кукушкин Н.С., Морозов В.В. Теория неантагонистических игр. -Изд. МГУ, 1984.
Льюс Р.Д., Райфа Х. Игры и решения. –М.: ИЛ, 1961.
Мак-Кинси Дж. Введение в теорию игр.- М.: ГИФ-М литературы, 1960.
Морозов В.В., Сухарев А.Г., Федоров В.В. Исследование операций в задачах и упражнениях.- М.: Высшая школа, 1986.
Мулен Э. Теория игр (с примерами из математической экономики).- М.: Мир, 1985.
Оуэн Г. Теория игр.-М.: Мир, 1971.
Павловский Ю.Н. и др. Имитация конфликтов. –М.: Изд. ВЦ РАН, 1993.
Шерер Ф.М., Росс Д. Структура отраслевых рынков. . –М.: ИНФРО-М, 1997.
Шикин Е.В. От игр к играм. Математическое введение.-М.: Эдиториал УРРСС, 1998.
Франк Р.Х. Микроэкономика и поведение. –М.: ИНФРО-М, 2000.









1


4

1. Гермейер Ю.Б. Введение в теорию исследования операций. -М.: Наука, 1971.
2. Гермейер Ю.Б. Игры с непротивоположными интересами.- Изд МГУ, 1972.
3. Дубров А.М. , Лагоша Б.А., Хрусталев Е.Ю. Моделирование рисковых ситуаций в экономике и бизнесе: Учебное пособие.- М.: Финансы и статистика, 1999.
4. Дюбин Г.Н., Суздаль В.Г. Введение в прикладную теорию игр.- М .: Наука, 1986.
5. Кукушкин Н.С., Морозов В.В. Теория неантагонистических игр. -Изд. МГУ, 1984.
6. Льюс Р.Д., Райфа Х. Игры и решения. –М.: ИЛ, 1961.
7. Мак-Кинси Дж. Введение в теорию игр.- М.: ГИФ-М литературы, 1960.
8. Морозов В.В., Сухарев А.Г., Федоров В.В. Исследование операций в задачах и упражнениях.- М.: Высшая школа, 1986.
9. Мулен Э. Теория игр (с примерами из математической экономики).- М.: Мир, 1985.
10. Оуэн Г. Теория игр.-М.: Мир, 1971.
11. Павловский Ю.Н. и др. Имитация конфликтов. –М.: Изд. ВЦ РАН, 1993.
12. Шерер Ф.М., Росс Д. Структура отраслевых рынков. . –М.: ИНФРО-М, 1997.
13. Шикин Е.В. От игр к играм. Математическое введение.-М.: Эдиториал УРРСС, 1998.
14. Франк Р.Х. Микроэкономика и поведение. –М.: ИНФРО-М, 2000.

Вопрос-ответ:

Какие игры можно рассматривать в рамках матричных игр?

Матричные игры рассматриваются в случае, когда у каждого игрока есть конечное число стратегий, и каждый игрок выбирает одну стратегию из своего множества стратегий.

Что такое чистая стратегия в матричной игре?

Чистая стратегия в матричной игре - это тактика или план действий, при котором игрок выбирает конкретную стратегию из своего множества стратегий с вероятностью равной 1.

Какие методы используются для управления запасами?

Для управления запасами используются стохастические методы, которые учитывают случайность и неопределенность в процессе управления запасами.

Какие специфические проблемы возникают при управлении запасами в условиях неопределенности?

В условиях неопределенности возникают проблемы выбора оптимального критерия, поскольку нет четкого знания о будущих состояниях системы. Также возникают проблемы выбора наилучшей стратегии управления запасами, которая будет работать наилучшим образом в разных ситуациях.

Что такое дихотомический выбор в задаче о золотодобыче?

Дихотомический выбор в задаче о золотодобыче заключается в выборе соответствующей стратегии в зависимости от текущего состояния системы. Это позволяет эффективно управлять запасами золота при неопределенности в процессе его добычи.

Что такое матричные игры?

Матричные игры - это математическая модель принятия решений двух или более игроками, где каждый игрок выбирает свою стратегию из определенного набора и получает выигрыш в зависимости от своей стратегии и стратегии других игроков.

В чем заключается разница между чистыми и смешанными стратегиями?

Чистые стратегии - это стратегии, при которых игрок выбирает одну конкретную стратегию из набора, не используя вероятностные распределения. Смешанные стратегии - это стратегии, при которых игрок выбирает стратегию с определенной вероятностью, используя вероятностные распределения.

Какие методы используются для решения матричных игр?

Для решения матричных игр могут применяться различные методы, такие как метод седловых точек, метод симплекс-таблиц, метод Q-learning и другие. Выбор метода зависит от особенностей игры и требуемой точности решения.

Что такое стохастические методы управления запасами?

Стохастические методы управления запасами - это методы, которые учитывают случайные факторы при принятии решений о размере и заказе запасов. Они позволяют учесть неопределенность в спросе, поставках, стоимости и других параметрах, что позволяет более эффективно управлять запасами.

Какие проблемы возникают при управлении запасами в условиях неопределенности?

При управлении запасами в условиях неопределенности возникают проблемы определения оптимального размера заказа, определения необходимого уровня запасов для обеспечения спроса, определения оптимальной стратегии заказа с учетом стоимости хранения запасов и других факторов.

Что такое матричные игры?

Матричные игры - это специальный тип игр, в которых участники принимают решения на основе матрицы выигрышей, где каждая стратегия одного участника имеет соответствующую стратегию другого участника. Такие игры используются для моделирования конфликтных ситуаций и различных видов соревнований.

Какие бывают стратегии в матричных играх?

В матричных играх выделяют чистые и смешанные стратегии. Чистые стратегии предполагают выбор одной конкретной стратегии из множества возможных. Смешанные стратегии позволяют участникам игры использовать вероятностное распределение выбора стратегий, то есть выбирать стратегию случайно с определенной вероятностью.