автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему: Вероятностный подход к решению задач диагностики в вычислительной технике
Автореферат диссертации по теме "Вероятностный подход к решению задач диагностики в вычислительной технике"
ИНСТИТУТ ЭЛЕКТРОННЫХ УПРАВЛЯЮЩИХ МАШИН
На правах рукописи УДК 681.518
ЦЫКОВ Петр Владимирович
ВЕРОЯТНОСТНЫЙ ПОДХОД К РЕШЕНИЮ ЗАДАЧ ДИАГНОСТИКИ В ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКЕ
Специальность 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов, систем и сетей
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук
Работа выполнена в Институте электронных управляющих ыашин
Официальные оппоненты - доктор технических наук,
член-корр. АН СССР Бабаян В.А.
доктор технических наук,
доктор технических наук, стерший научный сотрудник Ыаквгин В.Д.
Ведущая организация - Научно-исследовательский институт
Защита диссертации состоится " "__ 1992 г.
в ___ часов на заседании специализированного совета
ДЮЗ,56.01 по присуждению ученой степени доктора технических наук в Институте проблей информатики АН СССР по адресу: 117900, Москва, уд. Вавилова, 30/6, тел. 135-98-14. С диссертацией можно ознакомиться в библиотеке Института проблей информатики АН СССР. Тел.
Автореферат разослан " ." - 1992 г.
Ученый секретарь специализированного совета д.т.н.
..тлел | I. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Проблема диагностики является важнейшей составляющей при создании все более сложных технических объектов с большим числом структурных компонентов и выполняемых функций. Без ее решения нельзя обеспечить надежную работусягаапжобъектов, в которых, даже при очень высокой надежности отдельных компонентов, приходится иметь дело с регулярным появлением неисправностей.
Наиболее ярким примером объектов, отражающих возрастающую техническую сложность, являются ЭВМ. Проблема диагностики для.них обостряется нехваткой квалифицированного обслуживающего персонала и тяжестью возможных последствий в ряде применений из-за своевременно не обнаруженной неисправности.
Для организации быстрого и эффективного поиска неисправности надо иметь не только необходимый набор тестов, но и совершенную систему обработки получаемых результатов их выполнения. Принципиальной стороной в этом является совершенствование методологии технической диагностики в части расширения состава привлекаемой для принятия решения о месте неисправности диагностической информации и более эффективного ее использования, а также сокращения затрат на формализацию процесса обработки результатов выполнения гестов.
Традиционно формализация обеспечивалась за счет детального моделирования неисправностей, состоящего в определении реакции тестов на каждую из рассматриваемых неисправностей и построении так называемых словарей неисправностей. Однако для ЭВМ при широком использовании программных тестов, представляющих многошаговые последовательности комбинаций логических сигналов, собрать полные данные моделирования неисправностей становится практически невозможно. А без полноты данных качество получаемых решений по опреде-2 Заказ 1Р61
лению места неисправности резко падает.
С другой стороны, применяемые в последние годы для поиска неисправностей диагностические экспертные системы (ЭС) слишком полагаются на субъективный опыт специалистов (экспертов) и плохо интегрируются с традиционным моделированием. Из-за чего их построение зачастую упирается в неэффективное разрастание базы знаний или предъявляет завышенные требования к экспертам (по детальности экспертизы).
Таким образом возникает необходимость ликвидировать методологический разрыв между различными подходами к решению задач технической диагностики, чтобы справиться с возрастающей сложностью объектов диагностирования и повысить эффективность диагностирования ЭВМ.
Целью диссертационной работы является построение методологии решения задач технической диагностики для сложных объектов на основе системы обобщенных моделей объекта диагностирования (ОД) и практическая отработка на примере средств вычислительной техники СМ ЭВМ общих принципов реализации ее методов. Исходя из этого приходим к постановке следующих задач:
1. определить общий подход к решению задач диагностирования при существенной неполноте исходных данных о связях между неисправностями и исходами тестов;
2. построить систему моделей ОД, обеспечивающих решение задачи поиска неисправности при различных требованиях к объему исходных данных;
3. определить условия и границы применимости различных типов
моделей ОД, а такне условия перехода от одного типа к другому и динения их с традиционными моделями, основанных на словарях неисправностей;
4. определить требования к построению наборов тестов из условия наиболее эффективного применения.предлагаемых моделей к обработке результатов их выполнения;
5. построить критерии сравнения и оптимального выбора, в процессе диагностирования, тестов с учетом неопределенности их исходов из-за неполноты исходных данных;
■ 6. построить на основе моделей предлагаемого подхода концепцию построения экспертных диагностических систем, дающих возможность уточнения решений, получаемых с помощью моделей, и расширения состава используемой диагностической информации;
7. разработать методику построения диагностических программ для отдельных устройств и объединения их в системы для организации диагностирования ЭВМ на основе выделенных требований к построению наборов тестов;
8. разработать и довести до практической реализации общую схему автоматизации диагностирования средств вычислительной техники СМ ЭВМ, включающую локальные средсттдиагностирования, системы обеспечения удаленной диагностики и обработки результатов выполнения тестов в центре обслуживания;
9. разработать проект построения экспертной системы для автоматизации диагностирования средств вычислительной техники СМ ЭВМ на основе предложенной концепции.
Методы исследования. Для проведения исследования и решения . . теоретических задач используется аппарат теории вероятностей, теории нечетких множеств, теории информацки и теории алгебраичоскгх решеток, отдельные методы теории принятия решений и математкческо-2х
го анализа, а также общие методологические основы построения экспертных систем.
Научная новизна работы. Построена единая методология решения задач диагностики сложных технических объектов, при использовании неполных данных моделирования неисправностей и субъективных оценок экспертов, как задач принятия решения в условиях неопределенности. Это потребовало: I) перехода от детерминированного к вероятностному описанию причинно-следственных связей между возможными неисправностями (как локальными дефектами) и исходами тестов; 2) использования нечастотного субъективного подхода к интерпретации вероятности, характеризующей неопределенность, и 3) перехода к качественному вероятностному отношению предпочтения "менее вероятно, чем", когда количественно оценить нужные вероятности не удается.
Для решения задач диагностики предложена иерархическая система моделей ОД, отличающихся необходимым для построения объемом исходных данных. В эту систему входят три типа моделей: вероятностная, нечеткая и структурная (алгебраическая), которые дают вероятностное описание связей между возникающими неисправностями из фиксированных непересекающихся подмножеств и исходами тестов из фиксированного набора.
Вероятностная модель объекта диагностирования предполагает
получение статистически представительских выборок для оценки вероятностей некоторого множества 5 случайных событий, используемых для описания связей. Нечеткая модель предполагает слабое упорядочение множества £ на основе отношения предпочтения "менее вероятно, чем" с последующим построением количественной функции, сохраняющей порядок, которая обладает свойствами функции принадлежности нечеткого множества.
Вероятностная и нечеткая модели, в зависимости от трех раз--
личных вариантов операций вычисления совокупного результата выполнения тестов, подразделяется на три варианта. Для каждого из вариантов определяются условия построения наборов тестов, при которых эффективность применения моделей наибольшая.
Структурная модель ОД предполагает частичное упорядочение множества Б на основе отношения предпочтения "менее вероятно, чем" и определяет самый нианий уровень требований к объему исходных данных. Принципиальным отличием этой модели от двух предыдущих является то, что она уяе не является количественной, так как в эхом, случае из-за малого объема исходных данных не удается непротиворечиво построить общее количественное описание. Решение в структурной модели вычисляется с помощью операций теории алгебраических решеток на основе структуры данных, которая представляет собой построенный по определенным правилам ориентированный граф.
Кроме того, структурная модель позволяет построить схему наиболее эффективного пополнения исходных данных на пути построения нечеткой модели ОД, которая считается основной в предлагаемой системе моделей.
Для количественных моделей объекта диагностирования предложен (с использованием понятий теории информации) критерий сравнения и выбора тестов, позволяющих строить оптимальные, с точки зрения уменьшения неопределенности о месте неисправности, последовательности тестов. А также дано обобщение понятия глубины диагностирования, когда связи между неисправностями и исходили тестов имеют вероятностный характер.
На базе развитых методов, образующих так .ншываемый вероятностный подход к решению задач диагностики, предложена концепция . 3 Заказ №61
построения экспертных диагностических систем, определяющая условия эффективного построения и использования системы правил - продукций вида: ЕСЛИ (симптомы > , ТО ("возможные диагнозы> . При этом понятия симптома и диагноза рассматриваются как обобщение понятий исхода теста и неисправности.
Практическая ценность работы. Разработанный в диссертации вероятностный подход дает возможность формализовать решение задачи поиска неисправности, когда очень трудно или практически невозможно провести полное моделирование неисправностей. Это особенно важно при создании автоматизированных систем диагностирования сложных ОД.
Методы вероятностного подхода позволяют не только существенно сократить требуемых объемов исходных данных, но и расширить содержательно состав используемых данных..За счет предоставляемого гибкого выбора уровня разбиения множества рассматриваемых неисправностей на подмножества появляется возможность строить-многоуровневые системы диагностирования с использованием различных по технологии тестов (программных, микропрограммных и логических) с общей схемой обработки результатов их выполнения и принятия решения о месте неисправности.
Расширение состава используемых данных за счет информации имеющей не только количественный, но и качественный характер, позволяет привлечь к принятию решения в рамках единого формализма более непосредственные оценки человека-эксперта. Это оказывается весьма полезным при автоматизации программного диагностирования, поскольку качество разработки программных тестов зависит почти полностью от плохо формализуемого опыта разработчика.
Иерархическая система моделей позволяет устанавливать в ши- .
роком диапазоне объем необходимых исходных данных, проводя для одних компонентов сложнйх ОД более детальное, а для других - менее детальное моделирование неисправностей. А предлагаемая в рамках этой системы схема эффективного, пополнения данных для повышения качества принимаемых решений способствует более раннему введению в эксплуатацию автоматизированных систем диагностирования, доработка которых осуществляется уже по мере необходимости только тан, где качество решений оказалось неудовлетворительным.
Предлагаемая концепция построения экспертных диагностических систем позволяет избежать неэффективного разрастания базы знаний при учете непосредственного .опыта экспертов и обеспечить определенную устойчивость (робастность) работы таких систем, когда возникающие комбинации исходов тестов явно не закладывались в экспертную систему (выход на границу компетентности).
Методология вероятностного подхода к решению задач.диагностики последовательно реализуется в рамках общей схемы построения централизованного обслуживания СВТ СМ ЭВМ, призванного решить важную проблему автоматизации диагностирования СВТ СМ ЭВМ как класса технических средств, отличающихся определенно^сложностью и широтой распространения. Создание центра обслуживания предполагает разработку эффективной системы тестов для диагностирования обслуживаемых ЭВМ, системы удаленной диагностики для организации процесса диагностирования из центра и сбора диагностической информации, а также программного обеспечения центральной ЭВМ, обеспечивающего обработку диагностической информации с целью определения места неисправности и последующих диагностических действий..
Реализация результатов работы. Исследовании, проводимые в диссертации, осуществлялись в соответствии с планами следугаих 3*
научно-исследовательских и опытно-конструкторских работ Института электронных управляющих машин:
- "Исследование по создании на микропроцессорной основе контроллеров КАМАК с гибкой архитектурой (Гос. per. № 7S06I807);
- "Контроллер крейта с каналом прямого доступа для ИВК (измерительно-вычислительных комплексов) на базе СМ 3, СМ 4 (Гос. per. № 81079664);
- "Разработка проблемно-ориентированного комплекса для автоматизации спектральных приборов на базе средств СМ ЭВМ (Тема
- "Многоуровневая система программного диагностирования вычислительного комплекса СМ 1700 (ЫСПД)" (Тема № 0689964760);
- "Инструментальная система для проектирования программ диагностирования технических средств 32-х разрядных СМ ЭВМ (ДИС)" (Гос. per. № 7193862960);
- "Многоуровневая система программного диагностирования вычислительного комплекса Ш 1705 МСГЩ-2" (Гос. per. J? 7193860060);
- "Исследование принципов построения экспертной системы для автоматизации процесса диагностирования СВТ СМ ЭВМ (ЭСАД)" (Гос. per. № 7I938649I0);
- "Система удаленного диагностирования для 32-разрядных ВК СМ ЭВМ типа СМ 1700 (ОДУ)" (Тема № 0I00I690);
- "Экспертная система для автоматизации диагностирования СВТ СМ ЭВМ ЭСАД-Г (Тема № 0I00I790).
В^1ыполнения данных работ за период с 1977 по 1990 год получены основные результаты диссертации, которые использовались в разработках диагностического nporpai много обеспечения.
В течение этого времени разработала программа диагностирова-
ния типового устройства (контроллера крейта КАМАК с прямым доступом к памяти ККЦД СМ) с процедурой автоматической локализации неисправности на базе нечеткой модели.
Разработана многоуровневая система программного диагностирования вычислительных комплексов типа СМ 1700 и СМ 1705 в соответствии с рекомендациями вероятностного подхода по построению наборов тестов, а также единая стратегия ее использования, обеспечивающая наиболее эффективное проведение процесса диагностирования. Эта система рассчитана на работу с центром обслуживания.
' ( Разработан технический проект построения Системы удаленного диагностирования указанных вычислительных комплексов, обеспечивающий возможность построения мощных систем автоматизации обработки диагностической информации, поступающей от обслуживаемых ЭВМ.
Разработан на-базе предложенной концепции проект построения экспертной системы для автоматизации диагностирования СВТ СМ ЭВМ, которая входит в программное обеспечение центра обслуживания и является средством поддержки специалиста в принятии решения по результатам диагностирования о вероятном месте неисправности и о проведении дальнейших диагностических действий.
Главным местом внедрения диагностического программного обеспечения является завод Литовского производственного объединения "Сигма", серийно выпускающий СВТ СМ ЭВМ, где оно используется на завершающих этапах наладки и в отделе технического контроля. Кроме того, диагностические программы входят в обязательный комплект поставки соответствующих устройств и комплексов СМ ЭВМ.
Апробация работы. Основные положения работы докладывались
- Всесоюзной школе-семинаре "СМ ЭВМ", г. Минск, 1980 г.;
- Всесоюзном совещании "Перспективы развития и опыт применения мини- и микро- ЭВМ", г. Орел, 1982 г.;
'- XXXI научно-технической конференции МИРЭА, г. Москва, 1982 г.;
- Общемосковском семинаре по технической диагностике, г. Москва, 1983 г.;
- Международной выставке-семинаре "Программные и технические средства ЭВМ", г. Будапешт, 1986 г.;
- У1 Всесоюзном совещании по технической диагностике, г. Ростов на Дону, 1987 г.;
- 1У Всесоюзной школе-семинаре "Разработка и использование технических и программных средств системы малых ЭВМ (СМ ЭВМ), г. Звенигород, 1989 г.;
' - Всесоюзном совещании "Система ИНТЕР-ЭКСПЕРТ.; Опыт прикладных разработок", г. Тверь, 1990 г.;
- Всесоюзном научно-техническом семинаре "Программное обеспечение СМ ЭВМ", г. Москва, 1990 г.
Публикации. По теме диссертации опубликовано 20 печатных работ.
Структура и объем работы.'Диссертация состоит из введения, шести глав, заключения, приложения и списка литературы. Объем диссертации: всего - 312 страниц, из них основного текста - 264, список литературы из 155 наименований и 34 рисунка.
В первой главе даются основные определения, характеризуются традиционные методы построения модели ОД, анализируются СВТ как сложный объект диагностирования и формируются основные теоретические и практические задачи диссертации.
Вторая глава посвящается общей вероятностной постановке за-
дачи диагностирования, положенной в' основу всех дальнейших исследований, построению И анализу эффективности вероятностной модели ОД.
В третьей главе дается построение нечеткой модели ОД на основе более обобщенного описания данных моделирования неисправностей и анализируется условия ее применимости.
Четвертая глава посвящена дальнейшему обобщению модели ОД, , приводящему к неколичественной структурной модели ОД, которая определяет собой самый нижний уровень требований к объему исходных денных.
В пятой главе излагается концепция построения экспертной диагностической системы, взаимосвязанная с предлагаемой методологией моделирования ОД.
Шестая глава посвящена реализации отдельных методов в разработках диагностического программного обеспечения для СВТ СМ ЭВМ в рамках идеи организации их централизованного обслуживания.
В конце каудой главы даются выводы.
В приложении представляются документы, подтверждающие практическое внедрение результатов диссертационной работы.
П. СОДЕРЖАНИЕ РАБОТЫ
Первая глава вводит в основную проблематику технической диагностики, определяет и уточняет понятия, в которых формулируются задачи диссертации. Основное внимание уделяется фундаментальной проблеме диагностики, поиску неисправностей. Для формализации задачи поиска неисправности требуется построение некоторой модели объекта диагностирования (ОД), позволяющей по исходам, тестов определять место неисправности с точностью (глубиной диагностирования), необходимой для проведения ремонта.
При традиционном подходе основу такой модели представляет диагностическая таблица неисправностей (ДГН), строки которой соот-. ветствозали отдельным неисправностям, а столбцы - используемьм тестам. Элемент таблицы О,) устанавливается равнш I, если 3-ый тест обнаруживает 1-ую неисправность, и равньм 0 в противном случае. Это позволяет просто идентифицировать возникшую в ОД неисправность по результатам тестов, выполненных с ошибкой.
Для сложных технических объектов с большим числом компонентов и исполняемых функций построить ДТН становится практически нереально. В то же время опытные специалисты по обслуживанию зачастую успешно решают задачу диагностики, не обладая этими данными, а полагаясь на субъективный практический опыт. Таким образом, в проблеме автоматизации диагностирования сложных ОД возникает необходимость в создании единых методологических принципов решения, которые позволяли бы одновременно использовать объективные, но неполные, данные моделирования неисправностей с субъективными экспертными оценками.
К числу таких сложных ОД, длн которых традиционные методы формализации поиска неисправности оказываются мало применимыми, принадлежат средства вычислительной техники (СВТ) и средства малых ЭВМ (СМ ЭВМ) в частности. Обслуживание СВТ СМ ЭВМ характеризуется тем, что, с одной стороны, из-за достаточно значительной их сложности и необходимости обеспечения высокой готовности требуется квалифицированный обслуживающий персонал, а, с другой стороны, широкое их распространение не позволяет зто обеспечить. Поэтому автоматизация диагностирования СВТ СМ ЭВМ приобретает принципиальное значение в конкуренции их с другими классами СВТ и требует эффективного разрешения.
В конце главы формулируется общая цель диссертационной работы, состоящая в разработке методологии решения задач диагностики сложных технических объектов. Определяется рчд связанных с ней теоретических задач, вытекающих из принципиальных особенностей проблемы формализации описания ОД при существенной неполноте исходных данных. Все практические приложения призваны продемонстрировать эффективность примег нения разрабатываемой методологии на примере решения задачи автоматизации диагностирования СВТ СМ ЭВМ.
Вторая глава посвящена формулированию основных положений нового подхода, получившего в работе название вероятностного, которые используются в последующих построениях и определяют общую схему решения
задач диагностики при неполных исходных данных, а также построению й анализу трех различных вариантов вероятностной модели ОД.
Принципиальная особенность вероятностного подхода состоит в следующем. Традиционно (в методах словарей неисправностей для учета неполноты или ошибок исходных данных шли на "загрубление" точного результата решения задачи поиска неисправности, вьщавая в качестве допустимых решения близкие в смысле некоторого критерия к точному. В рамках вероятностного подхода предлагается в описании исходных данных учесть возникающую из-за неполноты неопределенность и построить модель, переносящую исходную неопределенность на неопределенность конечного результата решения задачи.
Вероятностная постановка задачи диагностирования исходит из априорного распределения вероятностей присутствия неисправностей в ОД