Принцип работы архитектур агентов

Курсовая работа, 23 Февраля 2014, автор: пользователь скрыл имя

Краткое описание


Современные системы логистики, обеспечивающие требуемые реакции путем оптимального перераспределения финансовых, материальных и других ресурсов, в этих условиях оказываются слишком централизованными и, как следствие, слишком жесткими, чтобы справиться с постоянно меняющимися объемами и составом внешних и внутренних потоков заказов и готовых компонент продукции. Для решения этой проблемы в настоящей время предлагаются мультиагентные системы, которые позволяют построить и промоделировать работу полностью распределенных систем производства и сбыта продукции. Целью курсовой работы является исследование архитектуры агентов, их классификации и свойств.

Прикрепленные файлы: 1 файл

КУРСАЧ.docx

— 248.56 Кб (Скачать документ)

ВВЕДЕНИЕ

 

Развитие современной  экономики приводит к существенным изменениям в организации производства и сбыта продукции. Высокую эффективность  производства сегодня могут обеспечить лишь гибкие и мобильные распределенные производства, обеспечивающие быструю  реакцию на изменяющиеся запросы  потребителей, изменения на рынках сырья и комплектующих и т.д.

 Современные системы  логистики, обеспечивающие требуемые  реакции путем оптимального перераспределения  финансовых, материальных и других  ресурсов, в этих условиях оказываются  слишком централизованными и,  как следствие, слишком жесткими, чтобы справиться с постоянно  меняющимися объемами и составом  внешних и внутренних потоков  заказов и готовых компонент  продукции.

 Для решения этой проблемы в настоящей время предлагаются мультиагентные системы, которые позволяют построить и промоделировать работу полностью распределенных систем производства и сбыта продукции.

Целью курсовой работы является исследование архитектуры агентов, их классификации и свойств.

Объектом исследования являются принципы работы архитектур агентов.

Предметом исследования являлись учебники, научные статьи, монографии и исследования в логистике и теории искусственного интеллекта.

Основными методами исследования в курсовой работе являются  аналитический, логический, системно-структурный.

Структура курсовой работы включает титульный лист, содержание, введение, три раздела с подразделами, заключение, список использованных источников.

 

1 Реагирующая  агентная архитектура

    1. Классификация агентных архитектур.

Общие принципы работы.

 

В целом, классификация архитектур агентов основывается на парадигме, лежащей в основе принятой архитектуры. Так, архитектура, которая базируется на принципах и методах систем искусственного интеллекта, основанных на знаниях, получила название консультативной или совещательной архитектуры (deliberative agent architecture). А архитектура, основанная на реакции системы на события внешнего мира (reactive architecture), получила название реактивной. Однако среди современных систем искусственного интеллекта практически не существует таких, о которых можно было бы определенно сказать, что они является чисто консулатактивными или чисто реактивными. Подавляющее большинство этих систем является по сути гибридными, имея те или иные черты архитектур обоих типов. Последний подход к построению систем искусственного интеллекта получил название — гибридной архитектуры.

Итак, в настоящее время  выделяют три основных вида агентных архитектур:

  1. реагирующая (реактивная) архитектура;
  2. консультационная (делиберативная) архитектура;
  3. гибридная (смешанная) архитектура.

Каждый вид агентной архитектуры  выражает различный подход, различную  парадигму к построению решающих систем второго рода. Многие нерешенные задачи связаны с концепцией «всезнайства». Это обстоятельство привело к смене всей парадигмы консультационного подхода, на концепцию реагирующих архитектур.

Впервые идея реагирующих (реактивных) агентов возникла у американского  профессора Родни Брукса [1,с.47]. В своих работах Брукс рассматривает две идеи:

  1. реальный интеллект не воплощен в системах типа системы доказательства теорем или ЭС. Интеллектуальное поведение может быть реализовано без символьного представления, принятого в классическом искусственном интеллекте.
  2. интеллектуальное поведение — результат взаимодействия со средой.

Итак, в значительном числе  случаев невозможно сформировать централизованную символическую модель мира и сгенерировать  полный план до начала действий агента. Обычно это обусловлено неполнотой априорной информации о среде, которой  располагает агент, и изменчивостью  среды. При реактивном планировании агент не генерирует весь план заранее  как в случае классического планирования. После выполнения одного или нескольких действий агент запускает процедуру  перегенерации плана на основе своего текущего состояния.

Другое распространённое название данного подхода — чередование планирования и выполнения. Одним из частных случаев является чередование планирования и обучения (если текущая цель агента обучение)— в этом случае действия агента между генерациями плана направлены на сбор новой информации и совершенствование модели среды. Поведение реактивных агентов можно рассматривать и как запуск некоторого правила поведения из базы знаний, или как результат выполнения априори заданных планов.

Реактивные агенты реагируют  на изменения в среде, но они не способны к целеполаганию. Целевые  установки реактивных агентов определены априори. Это означает, что описание всех ситуаций, которые могут возникнуть в среде агента, в которых от агента требуется выполнить некоторое  действие, заданы агенту до начала его  работы. На все остальные ситуации могущие возникнуть в его среде  реактивный агент реагировать не будет, они не будут побуждать  его к преследованию каких  либо целей.

Реактивные агенты не имеют  внутренней модели мира, характерной  для классического искусственного интеллекта. Внутренняя модель мира реактивных агентов представляет собой набор правил типа «ситуация- действие», каждое из которых выбирается в соответствии с текущей ситуацией. Под ситуацией понимается потенциально сложная комбинация внутренних и внешних состояний.

Таким образом, основное отличие  реагирующих агентов от консультационных состоит в том, что первые исходят из конечности знаний о среде, а вторые основаны на концепции «всезнайства».

Брукс для обоснования  своих тезисов построил множество  роботов (так называемых «моботов»), основанных на так называемой архитектуре  регулирующей затраты. Архитектура, регулирующая затраты, — иерархически упорядоченная по степени сложности (по требуемым затратам на выполнение) совокупность всех возможных действий агента. Каждое действие конкурирует с другими в целях управления агентом. Чем ниже в иерархии расположено некоторое действие тем меньше оно требует затрат и тем проще ему получить управление агентом. Так на нижних уровнях представлены более простые действия (типа ухода от препятствий), а на верхних более сложные (например, найти выход из лабиринта). Необходимо заметить, что системы, ориентированные на результат, чрезвычайно просты, если рассуждать в терминах объема необходимых вычислений, без вывода, который определен для систем символического искусственного интеллекта. Но, несмотря на эту простоту, Брукс продемонстрировал агенты, решающие такие задачи, которые и для символических систем искусственного интеллекта выглядели бы весьма внушительно.

 

2.2 Практическое применение реагирующей агентной архитектуры

 

Характерным примером мобильных  роботов Брукса (или «моботов») может  служить тараконоподобный мобот  под названием «Чингиз» [2,с.65]. «Чингиз» имеет шесть ног, но совершенно не имеет «центрального мозга». Все его двенадцать двигателей и двадцать один датчик распределены в разложимых сетях без централизованного контроллера. Каждая из шести ног Чингиза работает самостоятельно, независимо от других. Каждая нога имеет собственный управляющий узел — микропроцессор, который управлял действиями ноги. Процесс ходьбы для Чингиза является групповым проектом с участием, по крайней мере, шести отдельных решающих устройств. У данного «мобота», ходьба происходит вследствие коллективного поведения двенадцати двигателей. Два двигателя в каждой ноге поднимают или опускают её, в зависимости от того, что делают другие ноги. Когда они активизируются в правильной последовательности «мобот» движется. Например, два основных движения можно представить так: «Если я — нога, и я вверху, нужно опуститься вниз» или «Если я — нога и я спереди, другие пять должны находиться немного сзади» Эти процессы существуют независимо, происходят всегда, и возбуждаются всякий раз, когда сенсорные предварительные условия истинны. Запустить процесс ходьбы можно задав последовательность подъема ног (это — единственный пример, в котором централизованный контроль очевиден). Как только нога поднята, она автоматически продвигается вперед, и опускается. Когда нога становится на землю, всё тело продвигается вперед. Такое «существо» может идти по плоской гладкой поверхности без запинаний, Для того, чтобы Чингиз прошел через груду телефонных справочников, Брукс установил пару чувствительных контактных усиков, посылающих информацию о поверхности передней паре ног. Сигнал от контактов может приостановить действие двигателя. Правило такое: «Если контактный ус чувствует препятствие — соответствующая нога (правая либо левая) останавливается; если не чувствует, нога идёт дальше».

Брукс выделял четыре типа сущностей, обучению которым должны были быть способны его «моботы» [2,с.77].

  1. «картина мира» (например некоторые моботы запоминали расположение препятствий, потенциально облегчая себе, таким образом, повторные прохождения).
  2. численная «калибровка» параметров (причём как оценочных, т.е. отвечающих за распознавание ситуаций, так и параметров действий; например, насколько далеко необходимо шагнуть той или иной ноге «Чингиза» при его ходьбе).
  3. ситуации, в которых должны применятся те или иные действия, т.е. корректировка поведения.
  4. новые поведенческие модули (однако, введение новых поведенческих модулей осуществлялось только при доработках «моботов», т.е. извне, инженерами-разработчиками).

В этом аспекте интересны  опыты Брукса по обучению уже упоминавшегося шестиногого «мобота» Чингиз передвижению на пяти, четырёх и даже на трёх ногах. Для этого он установил на «брюшке  мобота» чувствительный датчик, срабатывающий  при его касании поверхности  и ввёл новое правило «не касаться датчиком поверхности» (т.е. не терять равновесия). Первоначально «Чингиз» пытался двигаться (а точнее каждая из его ног) так же как и с  шестью исправными ногами, что неизбежно  вело к падению и срабатыванию датчика. Однако способность к численной  калибровке параметров и к корректировке  поведения каждой из ног, в сочетании  с правилом «не терять равновесия»  вскоре привели к тому, что «Чингиз» стал способен к передвижению в ситуации отсутствия нескольких ног. Естественно, что изменились как ширина шага каждой из ног (численная калибровка), так  и последовательность перестановки ног (корректировка поведения).

Другим примером реактивного  агента может быть ситуативный автомат. Он не манипулирует с символами, и  вообще, автомат не содержит каких-либо символических описаний. Эта технология зависит от возможности представить  мир в терминах состояний автомата. Например:

Пусть Агент х содержит информацию Р о состоянии мира S, например S=K (x, P), если для всех состояний мира, в которых х имеет то же самое значение, как и в S, выражение Р истина.

Агент определен в терминах двух компонент: восприятие и действие. Затем используются две программы  для синтеза агентов: RULER используется для определения компоненты восприятия, GAPPS - для компоненты действия.

RULER имеет три входа:

  • Описание семантики агентных входов (при включении первого входа, «идёт дождь»);
  • Набор статических фактов («когда идет дождь, земля мокрая»);
  • Спецификация переходов состояний мира («если земля мокрая, она остается мокрой, пока не выйдет солнце»).

Затем определяется желаемая семантика выхода (если первый вход включен, то земля - влажна). Все декларативное  «знание» было уменьшено до очень  простого цикла.

GAPPS в качестве своего входа имеет множество правил «сжатия» цели (существенные правила, которые кодируют информацию о достигаемых целях) и цель верхнего уровня, на основе чего генерирует программу, которая может быть оттранслирована в исполняемый код достижения цели.

Генерация цикла не представляет, не манипулирует символическими выражениями, вся символическая манипуляция  выполнена во время компиляции.

По поводу реактивных систем было высказано следующее соображение: «Сила реактивных архитектур основана на их способности использовать локальные  образцы активности в окружающей их среде для генерации более  или менее внятных (hardwired action) ответов для заданного множества стимулов. Успешное использование этого метода предполагает:

  1. полный набор воздействий окружающей среды, требуемый для однозначного определения последовательности действий агента на любое воздействие среды, тогда поведение агента может быть определено ситуативно;
  2. агент не имеет глобальных ограничений по задаче, которые необходимо учитывать при ее решении;
  3. цель агента может быть представлена в структуре агента неявно.

Если согласиться с  мнением, что качество взаимодействия агента со средой определяют уровень интеллекта агента, то агенты с реактивной архитектурой в отличие от консулатактивных архитектур способны приспосабливаться к изменяющимся внешним условиям, но накапливаемые ими знания носят локальный характер типа «стимул-реакция». Взаимодействие агента реактивной архитектуры со средой носит не целевой характер: агент только отображает поведение среды, но не воздействует на неё целенаправленно. Помимо этого, обсуждаемый подход не имеет единой методологии. Вряд ли можно согласиться с представлением о том, что каждая из реактивных систем должна быть вручную настроена в результате большого объема экспериментирования.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Консультационная  агентная архитектура

2.1 Системы MCY1N и MUD

 Консультационная архитектура представляет собой классический подход к построению агентов. Его суть состоит в том, чтобы рассматривать агенты как системы, основанные на концепции всезнайства. Это означает, что все знания, необходимые агенту для решения возникающих перед ним задач, заданы агенту априори. Этих и только этих знаний достаточно агенту для разрешения любой ситуации возникающей перед ним, в его среде.

Информация о работе Принцип работы архитектур агентов