Экспертные системы

Загрузка...
Экспертные системы появились в 70-х годах, как компьютерные программы, способные к работе как человек-эксперт в определенной предметной области. Экспертные системы, также известные как системы, основанные на знаниях. Одним из важнейших качеств экспертов является их способность выражать свои знания и объяснить свою позицию. Эта способность особенно важна в экспертных системах, не только для анализа работы системы во время проектирования, но и для обоснования результата предложенного системой во время ее непосредственной работы. Действительно, эксперимент, проведенный с использованием экспертной системы MYCIN показал, что врачи неохотно соглашаются с рекомендациями системы, если не понимают, как оно было получено [54].
 
Объяснения являются эффективными, если они основаны на ожидаемом уровне знаний получателя объяснения. Например, объяснение о том, как работает автомобильный двигатель, будет существенно отличаться для студента-музыканта и студента-инженера.
 
Способность объяснения важна в экспертной системе по нескольким причинам. Самая общая причина – объяснения необходимы, чтобы оправдать рекомендации, данные системой. Объяснения также помогают пользователю признавать ограничения экспертной системы. Нечес, Мур и др. [2] отметили, что рекомендации системы могут смутить пользователей, которые неуверенны в возможностях системы. Средство объяснения позволяет пользователю исследовать рассуждение системы, чтобы определить, рассматривала ли система все факты и правила и рассуждала ли в соответствии с ними.[статья Амаева]
 

Взаимодействие пользователя с системой

 
 
В некоторых системах пользователи могут запрашивать разъяснения, выделяя определенные переменные или функции. В других системах, пользователи могут задать вопросы, например, в MYCIN имеющиеся вопросы «как система пришли к выводу» и «почему была использована именно эта информация».
В других же системах пользователь может попросить объяснений после того, как программа представила свои выводы, в то время как другие позволяют пользователю прервать процесс логического вывода, чтобы потребовать объяснений.
 
 
Можно выделить следующие способы представления объяснений для пользователя:
Устно, с помощью текста и цифр.
Графически, в двух формах:
- с помощью гистограмм, круговых диаграмм, графиков или любые другие графические инструменты, которые представляют собой отношения между значений переменных, эволюция вероятностей, соответствующих переменных в ходе доказательства распространения и др.
- с помощью собственных график байесовской сети, так что изменения в распределения вероятностей обозначаются добавление текста, чисел и знаков, или раскраска вершин и/или ссылки.
• Мультимедийные, интегрируя в них выше в гипертекстовой и мультимедийной среды, которая сочетает в себе интерактивные объяснения текст, изображения, видео и звук.
 
 

Адаптация системы и пользователя

 
 
Оодной из ключевых особенностей эффективного объяснения является способность системы взаимодействовать с каждым пользователем с учетом его конкретных потребностей и ожиданий, которые должны зависеть от знаний пользователя.
 
В настоящее время объяснительный компонент экспертной системы не учитывает уровень знаний пользователей системы. Следовательно, объяснения генерируются для всех пользователей одинаково. Таким образом, какие-то объяснения предназначены для новичков, в то время как с системой работает пользователь, являющийся экспертом. Для улучшения объяснения необходимо представлять знания пользователя о предметной области, в которой работает экспертная система.
Существуют методы, основанные на статической модели пользователя. Такие модели не учитывают, что знания увеличиваются по мере взаимодействие с системой. Альтернативой предыдущего метода является использование динамической модели пользователя, которая явно представляет его знания и фиксирует изменения в знаниях пользователя происходящие в период работы с экспертной системой. Эта модель помогает адаптировать модуль объяснения к знаниям пользователя в каждый момент времени.
 
Уровень детализации объяснений тесно связано с пользовательскими знания о предметной области. Например, это возможно для экспертной системы, которая принимает во внимание пользователя знаний для того чтобы присвоить значение коэффициента для каждого элемента (каждое правило или каждой переменной, например), и значение порога, так что объяснение модуль отображает только те элементы, превышающие порог. Путем снижения порога, пользователь может увеличить уровень детализации, и наоборот. Этот способ можно предложить различные уровни детализации, не имея модель пользователя. Очевидно, вместо того, чтобы иметь фиксированное значение коэффициента для каждого элемента, было бы желательно, чтобы динамически изменять значение факторов, как функция пользователя домена знаний, имеющихся фактических данных и взаимодействия с системой. Таким же образом, аспекты объяснения, относящиеся к рассуждению метод, должен также быть предложены на разных уровнях детализации.
 
Таким образом, объяснение включает в себя задачу нахождения информации из доступных источников знаний и организацию этих знаний в согласованный и последовательный текст. Важным требованием формирования такого объяснения является возможность варьировать содержания объяснение в соответствии с опытом и знаниями пользователя, регулируя уровень детализации базовых знаний в предметной области.
Для достижения требуемой корректировки знаний в предметной области, необходима методика, позволяющая производить систематические изменения в представлении знаний.
 
Байесовская сеть представляет собой ориентированный ациклический граф, в котором узлы представляют переменные объектов и связей стенд для причинных зависимостей между переменными (или узлы) [Жемчужина, 1988]. Узлы имеют маркировку условных вероятностей, которые дают оценки прочности зависимостей между значениями переменных. Поэтому, байесовские сети – это компактное, локализованное представление вероятностной модели, использующее качественное графическое описание причинно-следственных связей между субъектами и количественное измерение силы этих связей.
 
Для того чтобы применить байесовские сети, необходимо решение следующих задач:
• структурирование сети на основе качественной информации причинных воздействий между выбранными параметрами, т.е. определение узлов сети ;
• выявление вероятностной информации, чтобы комментировать ссылки сети, т.е. принятия решения об априорных вероятностях, связанных с сетью; (выбрать на основе опыта и имеющейся информации априорные вероятности значений переменных)
• выбор способа доказательства и сбора результатов.
Входные данные для построения модели:
• Структурное описание системы: определить ее компоненты и взаимосвязи между ними. Это делается до начала работы и остается неизменным в течение всего процесса объяснения.
• Библиотека типовых фрагментов, представленных на различных уровнях детализации. Каждый фрагмент модели, представляет собой определенный аспект структурной и поведенческой информации данного компонента системы доменов. Модель фрагменты для различных представлений конкретного компонента объединены в предположении класса компонента. Фрагменты предположение класса имеют различные и часто противоречивые условия, и, таким образом, только один фрагмент из предположения класс данного компонента может использоваться для представления компонента в модели системы.
• Требуемый уровень детализации для подмножество модели фрагменты, необходимые для построения модели системы.
• Набор объектов (элементов или процессов) проценты, полученные от запросов пользователя.
Структурное описание системы используется для построения байесовской сети. Каждый узел сети выступает за выбор или отказ от конкретной модели фрагмента и может принимать значения из множества {Да, Нет}. Ребра графа байесовской сети представляют отношения «причина-следствие» и определяют описание системы: если компонент А имеет свой выход и соединен с входом компонента B, то устанавливается связи от модели компонента А по отношению к B.
 
Учитывая структуру байесовская сеть, каждый узел сети приобретает значение «да» или «нет», когда узлам-родителям присваиваются значения. В общем, получающих такие априорные вероятности, представляет собой задачу огромной сложности [Жемчужина, 1988]. Существуют приложения, где исторические данные доступны, что позволяет в необходимой оценки, иногда просто расчета частоты возникновения значения. В менее благополучных случаях, как настоящего приложения, какие-то правила или эвристики, должны определяться на основе описание проблемы, чтобы решить априорные вероятности.
 
В этой работе логическое правило, занятых зависеть от того, насколько узел корневого узла, то есть. та, которая не имеет родительских узлов. Первый эвристический указывает, является ли фрагмент модели должны быть выбраны путем сопоставления двух важных факторов: в силу причинно-следственных связей влияния, что фрагмент получает от выбранных ее родители, и соответствие фрагмента относительно уровня детализации этих родительских узлов. Эта эвристика может быть сформулирована следующим образом.
 
Определение 1 Для каждого номера корневого узла MFji, где j = 1, …, L, представляет выбор или отказ компонента модели j от компонента Ci, i = 1, ..., М, с родительским узлом Ujk, к = 1, …, N, вероятность соответствующего компонента, когда некоторые из родительских узлов, принимают значение «да» определяется по формуле:
с
В этом определении, p диапазоны среди родителей, которые имеют значение «да» и , l принадлежит {q, r}- оценка суммы причинно-следственных связей влияния родителей Ujt на компонент MFj,когда родитель Ujt принимает значение " да". Пусть Ninfiuence число тех переменных, которые определяются последствия Ujt и которые влияют на переменные MFji, и Ntotal общее число переменных, определенных в Ujt, тогда рассчитывается как отношение Njnjiuence/Ntotal.
Как, например, эвристический, рассмотрим простой сети рис. 2, которая соединяет четыре типовых фрагментов разных уровнях детализации (для трех компонентов А, В и с). Фрагмент модели Аль-есть одна переменная, всего две переменные, которые могут влиять на переменные в его дочерний узел, фрагмент Bl, что VB1*-A1 = 0.5. “Ошибка” в деталях между фрагментами B A - DB1 - DA1 =4 - 2 = 2. Аналогично, VBH~A2 = 0.33, Vcj-t-Bj = 0.50, Dg1 - DA2 = 1 и F)Q 1 - Dg1 = 0. Применение вышеупомянутых эвристический дает, таким образом, следующие номера-нормализованные результаты:
Гораздо проще логический вывод используется, чтобы назначить априорные вероятности для корневого узла, при условии, что все компонент изначально вполне вероятно могут быть выбраны.
 
Определение 2 Для всех корневых узлов RMFr; r = 1, …, R, компонента Ci, i = 1,..., S, до возможности их выбрали, P(RMFri = да) =1/R
После этого, для корневых узлов, Al, A2 рис. 2, их вероятность выбора: P(1 = да) = P(A2 = да) = ½
Учитывая подмножеством предыдущего значения вероятностей сети корневых узлов, и для каждого номера-корневой узел в отношении отдельных его родители, вероятностей для остальных узлов комбинаций значений могут быть рассчитаны. Это достигается с помощью принципа максимума энтропии, с учетом ограничений, что сумма всех вероятностей значений узел должен быть равен " 1 " и предполагая равномерное распределение этих априорные вероятности, для которых у нас нет предыдущей оценки (см. [Жемчужина, 1988], в детали этого принципа).
 
Учитывая структуру и априорные вероятности, рассуждения осуществляется на основании свидетельства, которые фрагменты, какие компоненты являются актуальными для пользователя и на какой модели фрагментов указаны Приблизительные Рациональный. Рассуждения процесс помогает с решением какие фрагменты для выбора (см. рис. 1). Доказательств в переводе на отбор указанных фрагментов с вероятностью 1. Это распространяется по всей сети, чтобы определить апостериорные вероятности узлы, для которых существует никаких доказательств того, с помощью стандартного байесовской сети, вывод метод, как описано в [Shennoy и Шафера, 1988]. Когда рассуждения процесс завершается, апостериорные вероятности каждая модель фрагмента выделения или отклонены возвращаются.
Модель принятия по адекватности ограничений
 
Байесовский рассуждения процесс определяет наиболее вероятных представление каждого отдельного компонента в отношении квалификацию пользователя. Хотя рассуждения математически звук, который гарантирует, что только один фрагмент выбирается для каждого компонента системы, построенной модели путем простого объединения выбранной модели фрагментов через их терминал соединений не полностью гарантируется наиболее адекватной поддержки пользователей информационных потребностей. Дополнительные ограничения могут быть необходимы, чтобы изменить решения, принятые Байесовский статистический вывод исключить включение фрагментов, которые бы привели к неадекватная модель. Критерии используется в качестве адекватности ограничений, интуитивного познания человека моделистов.
 
Эти ограничения применяются при каждом фрагмент модели считается для выбора (или неприятие) по рассуждения сети. Частично сформулирована модель проверяется на адекватность, и если не все ограничения будут удовлетворены, модель фрагмента удаляются. В этом случае, следующий наиболее вероятную модель фрагмента (одного компонента) рассматривается в качестве кандидата на выбор. Фрагмент не может быть отозвано после прохождения теста адекватности ограничений. Это позволяет последовательное применение адекватности ограничения, чтобы избежать возможных циклов.
 
В настоящей статье предложена методика формулирования модели для поддержки задачи объяснение поколения. Техника подвиги рассуждения байесовской сети, структурированные на основе структурного описания домена системы, для облегчения выбора подходящей модели фрагментов. Изначально, фрагменты некоторые компоненты выбираются на основе интересов пользователя и уровня экспертизы. Bayesian рассуждение содержит предложения по модели фрагментов использовать для остальной части системы. Модель под формулировка затем проверяется на адекватность, используя набор адекватности ограничений. Конечный результат состоит в адекватной модели домена системы, на рассмотрении которых может впоследствии быть проанализированы, чтобы извлечь содержимое для объяснения быть доведено до сведения пользователей.
 
Предложенный подход был реализован и экспериментальные результаты, полученные до сих пор были очень многообещающими. Описанная методология использует простейшие режимы для решения вопросов структурирования байесовской сети, и тех, определяющий априорные вероятности в задаче фрагмент модели выбора. Хотя она функционирует удовлетворительно для простых случаев, она должна быть модернизирована, чтобы стать более общим и менее ad-hoc, применительно к использованию адекватности ограничений. Кроме того, ведется работа в попытке автоматически строить модели с помощью данного подхода для более сложных систем.
 
 
Литература
 
 
1. А.А. Тимирьянова, Р.Ф. Гимранова, Е.С. Воробьев, Х.Э. Харлампиди, Вестник Казанского технологического университета, 16, 4, 359-361 (2013).
2. R. Neches, R.William, J. Moore, IEEE Transactions on Software Engineering, 11, 11, 1337-1351 (1985).
3. R. Kass, T. Finin. The Role of User Models in Question Answering Systems. Technical Report h1S-CIS-86-63 (Linc Lab 30), 1986.
4. R. Kass. Implicit Acquisition of User Models in Cooperative Advisory Systems. Technical Report MS-CIS-87-05, 1987.
Загрузка...
Комментарии
Отправить