Военные игры. Игры преследования.

Рефераты, курсовые, дипломные, контрольные (предпросмотр)

Тип: Реферат. Файл: Word (.doc) в архиве zip. Категория: Математика
Адрес этого реферата http://referat-kursovaya.repetitor.info/?essayId=19981 или
Загрузить
В режиме предпросмотра не отображаются таблицы, графики и иллюстрации. Для получения полной версии нажмите кнопку «Загрузить». Рефераты, контрольные, дипломные, курсовые работы предоставляются в ознакомительных целях, не для плагиата.
Страница 1 из 3 [Всего 3 записей]1 2 3 »

Введение.

Когда собака гонится за кроликом, то даже если она все время видит его, она не знает его дальнейшего поведения и может руководствоваться только знанием физических возможностей кролика и своих собственных. Таково своеобразие задачи преследования одного управляемого объекта другим управляемым объектом, математическому описанию которой посвящена данная работа. Конечно, здесь речь пойдет не о животных, а о технических объектах, но у этих объектов предполагается некоторая свобода действий, аналогичная свободе воли животных. Заранее нужно сказать, что рассматриваемые в работе технические объекты чрезвычайно элементарны, и весь вопрос ввиду его новизны находится на очень низком уровне развития. В работе рассматриваются игры, в которых участвуют два игрока: убегающий и преследующий. Такие игры преследования называются дифференциальными потому, что в них поведение обоих игроков описывается дифференциальными уравнениями.

Фазовые координаты и управления.

Типичными примерами дифференциальных игр являются сражения, воздушные бои, преследование судна торпедой, перехват самолета зенитной ракетой, охрана объектов. Если один из игроков выключается из игры, мы получаем обычную задачу максимизации. Она уже относится к вариационному исчислению и составляет основную часть теории управления.

Решения игроков всегда заключаются в выборе некоторых величин, называемых управлениями. Они в свою очередь определяют собой значения других величин - фазовых координат. Последние обладают тем свойством, сто знание их значений в любой момент времени полностью определяет течение игры.

Военные игры.

Фазовые координаты должны быть такими величинами, которые характеризуют положение дел в той мере, в какой по необходимости упрощенная модель задачи соответствует реальному процессу. Фазовыми координатами могут, в частности, быть число людей, самолетов, танков, судов; может оказаться целесообразным разделить их на группы по расположению в различных районах или по какому-либо другому признаку, например по удаленности от линии фронта и т.д.

Пусть армия1 - "минимизирующая" - имеет в своем распоряжении управления......; соответственно армия2 - "максимизирующая" - имеет управления .......... Выбор управлений часто обусловлен обстоятельствами. Предположим, например, что платой является разница в живой силе (или снаряжении и т.п.) в конце игры или в фиксированный момент времени Т. Пусть x1 - соответствующая координата I-той армии, тогда плата равна x2 - x1. Механизм развития подобной игры лучше всего продемонстрировать на конкретных примерах.

Пусть x1 - количество живой силы армии1 в некотором секторе; это количество может уменьшаться за счет воздушных налетов противника. Пусть x3 - число самолетов армии2 (противника), которые можно использовать для этой цели через. Через ?1 обозначим (=?1=1) обозначим долю общего числа самолетов x3 , которую противник решает использовать в некоторый момент времени. Теперь нужно из опыта или каким-либо другим образом определить, как ожидаемые потери в живой силе зависят от числа ?1x3 посланных самолетов противника. Пусть они прямопропорциональны ?1x3 и коэффициент пропорциональности равен C.

Для того чтобы иметь возможность использовать мощный аппарат математического анализа, будем предполагать, что процесс является не дискретным, а непрерывным. Это дает непрерывную аппроксимацию дискретной игры.

Представим, что армия1 получает пополнение с фиксированной скоростью r. Тогда имеем уравнение

X`1=r-c?1x3 +... (1)

Многоточие в правой части уравнения означает различные другие члены, как, например, изменения в результате других действий армии2 или маневрирования живой силой армии1. если игра полностью симметрична, то имеем такое же уравнение, только армии меняются ролями.

Пусть x4 - запас военного снаряжения армии1, который служит для ее снабжения. Пусть b - максимальная скорость такого снабжения. Пусть ?1 (0=?1=1) - доля от b, которую армия1 решает использовать в данный момент. Тогда

X`4 = - b?1. (2)

При определении пространства состояний E мы будем требовать, чтобы выполнялось условие x4?0. тогда (2) представляет собой ограничение на использование этого запаса и дает игроку возможность распоряжаться этим запасом с учетом его ограниченности.

В левых частях уравнений (1) и (2) стоят обычные производные от координат по времени. Уравнения такого типа служат основным средством описания развития дифференциальной игры. Они называются уравнениями движения и имеют вид:

X`i = fi(x1,...xn, ?i,..., ?n, ?n...?n), I=1,...n (3)

Итак, скорость изменения фазовых координат является заданной функцией от фазовых координат и управлений обоих игроков.

Игры с движущимся объектом.

Возьмем в качестве примера движущегося объекта автомобиль и рассмотрим при этом уравнение движения, фазовые координаты, управления и различия между последними. Автомобиль выбран потому, что его свойства общеизвестны. Рассуждения можно применить, лишь с малыми изменениями, к любому движущемуся объекту. Летательные аппараты движутся в трехмерном пространстве, но принцип остается тот же.

Геометрическое положение объекта, например автомобиля, описывается тремя фазовыми координатами: x1,x2 - декартовы координаты некоторой фиксированной точки автомобиля и x3 - угол, образуемый осью автомобиля с фиксированным направлением, например направлением x1. Предполагается, что движение происходит во всей плоскости x1,x2. Если автомобиль фигурирует в дифференциальной игре, то нужно знать о нем больше. Предположим, сто автомобиль управляется с помощью мотора и руля. Мотор управляет тангенциальным ускорением. Эта величина, находящаяся под контролем игрока, является управлением и будет обозначаться через ?1. Чтобы иметь простой и единообразный вид границ уравнений, мы примем ускорение равным A?1. Здесь A - максимальное возможное ускорение, и управление ?1 подчиняется теперь ограничению вида 0??1?1. Таким образом, оно является долей полного ускорения и находится под контролем водителя. Скорость x4 не находится под непосредственным контролем водителя, но ее величину, как и величины x1,x2,x3, оба игрока должны принимать в расчет. Следовательно, она должна рассматриваться как фазовая координата.

Положение руля определяет кривизну траектории автомобиля. Но нереально считать, сто водитель может менять ее произвольно. Имеет смысл принять кривизну траектории автомобиля за еще одну фазовую координату x5 (очевидно, физически это есть угол поворота передних колес), а долю скорости ее изменения - за управление ?2 . Итак , если W - максимальная скорость изменения величины x5 , то скорость, выбираемая водителем, равна W ?2, где -1 - ?2 ?1.

В этих предположениях движение автомобиля будет определяться следующими уравнениями движения.

x`1 = x4 cos x3 (1)

x`2 = x4 sin x3, (2)

x`3 = x4x5, (3)

x`4 = A ?1, 0??1?1 (4)

x5 = W ?2 , -1 - ?2 ?1 (5).

Здесь (1), (2) есть просто разложение скорости автомобиля по осям координат; (3) устанавливает, что скорость изменения направления равна скорости, умноженной на кривизну. Что касается (4), то скорость изменения скорости есть ускорение.

Резюмируя, можем сказать, что величины x1...x5 описывают те свойства автомобиля, которые существенны при его участии, скажем, в игре преследования. Они называются фазовыми координатами. Водитель управляет с помощью величин ?1 (положение педали газа) и ?1 (доля скорости вращения руля). Эти величины являются управлениями, и только они одни в каждый момент времени находятся под контролем игрока. Они, в отличие от фазовых координат, не могут быть изменены измерены противником.

Данная модель имеет недостаток - неограниченная скорость. Это можно исправить, налагая ограничения на x4, но более естественно изменить само управление (4). Во-первых, утверждение, что сила, развиваемая мотором, пропорциональна величине, на которую отжата педаль газа, следует считать сверхупрощением динамики автомобиля. Во-вторых, самое важное, эта сила пропорциональна ускорению автомобиля, только если пренебрегать трением. Если предположить, что трение пропорционально скорости и направлено в противоположном направлении, то получим улучшенный вариант уравнения (4):

RSSСтраница 1 из 3 [Всего 3 записей]1 2 3 »


При любом использовании материалов сайта обязательна гиперссылка на сайт «Репетитор».
Разработка и Дизайн компании Awelan
www.megastock.ru
Проверить аттестат