Онтологии в корпоративных системах |
Раздел: Информационные технологии | |
Автор(ы): А.Я. Гладун, Ю.В. Рогушина, журнал "Корпоративные системы" (№1, 2006) |
размещено: 05.03.2007 обращений: 59770 |
|
||||
К ключевым идеям, влияющим на современные тенденции развития корпоративных систем и бизнеса, можно отнести управление знаниями, виртуальные предприятия, реинжиниринг, организационное обучение, инновации в бизнес-процессах, комплексные системные приложения для бизнеса, самоадаптирующиеся системы, электронную коммерцию, Интернет/Интранет-стратегии, права интеллектуальной собственности, технологии аутсорсинга, информационные порталы.
Эти идеи могут быть выражены одной фразой: "радикальные непрекращающиеся изменения".
БИЗНЕС И ЗНАНИЯДля современного бизнеса характерно постоянное изменение среды, в которой работают, адаптируются и выживают общества, организации, люди. В условиях конкуренции судьба бизнеса во многом определяется скоростью и точностью реакции компании на изменение внешней среды, а это требует применения в менеджменте новых концепций, техник и инструментария. Деятельность как отдельных людей, так и организаций сейчас все в большей степени зависит от имеющихся у них знаний — одного из самых ценных ресурсов — и способности их эффективно использовать. Однако средства, предназначенные для представления знаний, еще недостаточно совершенны и часто заставляют вновь и вновь искать решения одних и тех же задач. Различные группы пользователей, занимающиеся обработкой и анализом информации, используют специальную терминологию, которая применяется другими сообществами в ином контексте. В то же время в различных сообществах часто встречаются различные обозначения для одних и тех же понятий. Все это значительно усложняет взаимопонимание, поэтому важно разрабатывать модели представления знаний, которые обеспечивали бы автоматизированную обработку информации на семантическом уровне в системах управления знаниями (СУЗ). Управление знаниями сегодня рассматривается как мощное конкурентное преимущество в фирме, ориентированной на постоянные изменения бизнес-процессов. Но ни информационные технологии (ИТ), ни данные сами по себе не могут обеспечить конкурентного преимущества на долгосрочный период. Конкурентные преимущества могут быть достигнуты только «переводом» информации в ценные, смысловые руководства к действию. Таким образом, знание состоит в действии: в эффективном представлении данных и информационных ресурсов для принятия решений, а также в самом выполнении принятого решения. Почти все компании обладают огромным исходным багажом данных и практического опыта. Но пока эта информация рассредоточена в базах данных, хранилищах документов, сообщениях электронной почты, отчетах о продажах и, разумеется, в головах сотрудников. Проблема в том, чтобы организовать доступ к этим данным, придав им форму, удобную для использования. Это не просто, а если еще требуется сделать это быстро (чтобы принять на основе анализа информации неотложное решение), задача может оказаться практически невыполнимой. Таким образом, управление знаниями — это стратегия предприятия, цель которой — выявить и обратить на пользу фирме всю имеющуюся у нее информацию, опыт и квалификацию сотрудников с тем, чтобы повысить качество обслуживания клиентов и сократить время реакции на меняющиеся рыночные условия. Одним из важнейших и перспективных направлений в области формализации знаний, которое дает возможность использования накопленных знаний для компьютерной обработки, являются онтологии. Управление знаниями (Knowledge Management) — совокупность процессов и технологий, предназначенных для выявления, создания, распространения, обработки, хранения и предоставления для использования знаний. Онтология — целостная структурная спецификация некоторой предметной области, ее формализованное представление, которое включает словарь (или имена) указателей на термины предметной области и логические выражения, описывающие, как они соотносятся друг с другом.
КОРПОРАТИВНЫЕ СИСТЕМЫ, ОСНОВАННЫЕ НА ЗНАНИЯХТермин «управление знаниями» начал использоваться еще в середине 1990-х годов в связи с проблемами, возникшими при обработке больших объемов информации в крупных корпорациях. Он связан с поддержкой процессов создания, распространения, обработки и использования знаний внутри предприятия. Можно рассматривать управление знаниями как комплексную организационно-техническую деятельность, направленную на повышение эффективности использования знания в бизнес-процессах организации (предприятия). При этом знания классифицируются и распределяются по категориям в соответствии с предопределенной, но развивающейся онтологией структурированных и слабо структурированных баз данных и баз знаний. Задачи и цели СУЗ. Задача СУЗ — накапливать не разрозненную информацию, а структурированные, формализованные знания — закономерности и принципы, позволяющие решать реальные производственные задачи. Основная цель СУЗ — сделать знания доступными и повторно используемыми на уровне всей корпорации. Онтологический подход к проектированию СУЗ как раз и позволяет создавать системы, в которых знания, накопленные внутри организации, становятся доступными для большинства пользователей. Основные преимущества этого подхода:
Например, в электронной коммерции онтологическое представление знаний используют для поддержки автоматизированного обмена данными между покупателями и продавцами, для вертикальной интеграции рынков (VerticalNet.com), а также для повторного использования описаний различными электронными торговыми точками. Механизмы поиска также применяют онтологии для выборки страниц с синтаксически различными, но семантически одинаковыми словами. Важность онтологического подхода в СУЗ обусловлена также тем, что знание, которое не описано и не тиражировано, в конечном счете становится устаревшим и бесполезным. Напротив, знание, которое распространяется, приобретается и обменивается, генерирует новое знание. В СУЗ знаниями считают всю доступную информацию (документы, сведения о заказчиках, описание технологий работы, продукции и т. д.), а также закономерности предметной области, полученные из практического опыта или внешних источников. Эти знания различаются в зависимости от отраслей индустрии и могут быть рассредоточены по всему предприятию. Одними из первых СУЗ были хранилища данных. В дальнейшем идея хранилища трансформировалась в понятие корпоративной памяти, которая содержит гетерогенную информацию из различных источников и обеспечивает доступ к ней для решения производственных задач. Корпоративная память фиксирует информацию из различных источников и делает эту информацию доступной специалистам для решения производственных задач (рис. 1).
Разработка СУЗ. При разработке СУЗ выделяют следующие этапы:
На сегодняшний день созданы индустриальные системы централизованного управления распределенными хранилищами информации, представленной в любых форматах, в том числе изображения, файлы различных офисных приложений и систем CAD/CAM. При этом возникает естественный вопрос — откуда берутся эти знания? Источники знаний. Традиционным решением, широко применявшимся в ранних экспертных системах, было извлечение знаний из памяти эксперта. При этом применяются как пассивные методы (наблюдение, анализ протоколов работы, лекционные материалы), так и активные (анкетирование, интервью, экспертные игры и т. д.). Однако широко известна парадоксальная закономерность: по мере накопления опыта эксперт все больше утрачивает способность формализовать эти знания в виде, доступном неспециалисту. Именно поэтому работа с экспертами так сложна и дорога (к ней надо привлекать квалифицированных инженеров по знаниям), а главное — крайне трудоемка и требует значительного времени. В связи с этим для создания прикладных систем, основанных на знаниях, интерес представляют методы автоматизированного извлечения знаний из потоков данных, отражающих реальную работу специалистов в какой-либо ПрО и позволяющих обобщать и формализовать их опыт.
DATA MININGData Mining (в буквальном переводе с английского — «добыча данных») — это направление в ИТ, которое связано с автоматизированным извлечением знаний (неявным образом присутствующих в обрабатываемой информации) и базируется на интеллектуальном анализе данных. Мониторинг деятельности. В связи с совершенствованием технологий записи и хранения данных в электронной форме деятельность любого предприятия стала сопровождаться регистрацией и записью всех подробностей его деятельности, вследствие чего стали доступны потоки информации в самых различных областях. Специфика таких потоков данных заключается в следующем:
Скрытые знания. В основе современной технологии Data Mining лежит концепция шаблонов, отражающих различные фрагменты взаимоотношений в данных. Важное свойство методов Data Mining — нетривиальность обнаруживаемых шаблонов, которые должны отражать неочевидные, ранее неизвестные регулярности в данных, составляющие так называемые скрытые знания (hidden knowledge). Примерами сфер приложения таких технологий являются анализ покупательской корзины в розничной торговле, прогнозирование изменений клиентуры, выявления мошенничества с кредитными карточками. Методы Data Mining позволяют выделить следующие типы закономерностей:
Text Mining. Так называется одна из подобластей Data Mining, которая ориентирована на обработку текстовой информации и широко применяется для мониторинга ресурсов Интернет. Задача Text Mining — проанализировать не синтаксис, а семантику значения текстов, выбрать из него информацию, наиболее значимую для пользователя (есть тесная связь с контент-анализом). Обычно выделяют такие приложения Text Mining:
Повторное использование. Data Mining — достаточно трудоемкий и дорогостоящий процесс, а получаемые в результате знания — ценный продукт. Поэтому одним из важных направлений является построение технологий и методов, направленных на обеспечение повторного использования этих знаний. Однако повторное использование знаний в различных контекстах невозможно без наличия механизмов, позволяющих фиксировать различное понимание этих знаний. Это связано с тем, что у каждого пользователя есть свое индивидуальное представление об окружающем его мире. Целостное представление о некоторой проблемной области позволяет дать ее онтологическая модель. Рассмотрим более детально, что такое онтология, и в каком смысле применяется этот термин сегодня в ИТ.
ЧТО ТАКОЕ ОНТОЛОГИЯ?Понятие онтология1 сейчас активно применяется в информатике и искусственном интеллекте. Этот термин пришел из философии, где обозначал часть метафизики — учение о всем сущем, о его наиболее общих философских категориях, таких как бытие, субстанция, причина, действие, явление. При этом онтология как наука претендовала на полное объяснение причин всех явлений. В инженерии знаний под онтологией понимается детальное описание некоторой проблемной области, которое используется для формального и декларативного определения ее концептуализации. Часто онтологией называют базу знаний специального вида, которую можно разделять, отчуждать и самостоятельно использовать в рамках рассматриваемой ПрО. Можно сказать, что онтология — это точная спецификация некоторой области, которая включает в себя словарь терминов этой области и множество логических связей (типа «элемент-класс», «часть-целое»), которые описывают, как эти термины соотносятся между собой2. Заметим, что при таком подходе понятие онтологии сильно пересекается с уже давно принятым в информатике и лингвистике понятием тезауруса. Онтологии позволяют представить понятия в таком виде, что они становятся пригодными для машинной обработки. Нередко онтологии используются в качестве посредника между пользователем и информационной системой, они позволяют формализовать договоренности о терминологии между членами сообщества, например между пользователями некоторого корпоративного хранилища данных. В центре большинства онтологий находятся классы, которые описывают понятия ПрО. Например, все информационные ресурсы Интернет, с одной стороны можно классифицировать как текстовые, графические, аудио, мультимедийные и т. д., а с другой — как платные либо бесплатные. Слоты (параметры) описывают свойства классов и экземпляров. Например, на уровне экземпляров классов информационные ресурсы можно описывать через такие слоты, как размер, имя, тематика, местоположение, протокол доступа и т. д. На формальном уровне онтология — система, состоящая из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории. Практически все модели онтологии содержат определенные концепты (понятия, классы), свойства концептов (атрибуты, роли), отношения между концептами (зависимости, функции) и дополнительные ограничения, которые определяются аксиомами. Концептом может быть описание задачи, функции, действия, стратегии, процесса соображения и т. п. Онтологические системы строятся на основе следующих принципов:
В отличие от обычного словаря для онтологической системы характерно внутреннее единство, логическая взаимосвязь и непротиворечивость используемых понятий.
КЛАССИФИКАЦИЯ ОНТОЛОГИЙКлассифицировать онтологии можно по различным параметрам (в зависимости от того, с какой целью их классифицируют), например:
Дополнительно к этим характеристикам можно ввести и классификации онтологии, связанные с разработкой, реализацией и сопровождением онтологии, но такая типизация более уместна при обсуждении вопросов реализации онтологических систем. По степени зависимости от конкретной задачи или предметной области обычно различают следующие онтологии (рис. 2).
Верхнего уровня. Такие онтологии описывают наиболее общие концепты (пространство, время, материя, объект, событие, действие и т. д.), которые независимы от конкретной проблемы или области. Поэтому представляется разумным (по крайней мере, в теории) унифицировать их для больших сообществ пользователей. Примером такой общей онтологии является коммерческий проект онтологии CYC. Это база знаний, содержащая все общие понятия окружающего мира, которую могут использовать самые разные программные средства. По некоторым данным, в CYC уже представлены 10 концептов и 105 аксиом. Для представления знаний в рамках этого проекта разработан специальный язык CYCL. Ориентированные на предметную область. Во многих дисциплинах сейчас разрабатываются стандартные онтологии, которые могут использоваться экспертами по предметным областям (доменам) для совместного использования и аннотирования информации в своей области. Например, в области медицины созданы большие стандартные, структурированные словари, такие как SNOMED и семантическая сеть Системы Унифицированного Медицинского Языка (the Unified Medical Language System). Также появляются обширные общецелевые онтологии. Так, программа ООН по развитию (United Nations Development Program) и компания Dun&Bradstreet объединили усилия для разработки онтологии UNSPSC, которая предоставляет терминологию товаров и услуг (www.unspsc.org). Ориентированные на задачу. Это онтология, используемая конкретной прикладной программой и содержащая термины, которые используются при разработке ПО, выполняющего конкретную задачу. Она отражает специфику приложения, но может также содержать некоторые общие термины (например, в графическом редакторе будут и специфические термины — палитра, тип заливки, наложение слоев и т. д., и общие — сохранить и загрузить файл). Онтологии ПрО и онтологии задач описывают, соответственно, словари, которые относятся к определенной ПрО (например медицина, дистанционное обучение, Интернет-технологии) или типичной задаче (например диагностика, продажа). При этом они используют специализацию терминов, представленных в онтологиях верхнего уровня. Прикладные онтологии описывают концепты, которые зависят как от онтологии задач, так и от онтологии домена. Примером может служить онтология для автомобилей, строительных материалов, вычислительной техники. Онтология ПрО обобщает понятия, использующиеся в некоторых задачах домена, абстрагируясь от самих задач (так, онтология автомобилей независима от любых особенностей конкретных марок машин).
ОНТОЛОГИЧЕСКИЙ АНАЛИЗВ основе онтологического анализа лежит описание системы (например корпорации) в терминах сущностей, отношений между ними и преобразование сущностей, которое выполняется в процессе решения определенной задачи. Основной характерной чертой этого подхода является, в частности, разделение реального мира на составляющие и классы объектов и определение их онтологий, или же совокупности фундаментальных свойств, которые определяют их изменения и поведение. Эти подходы и методологии базируются на следующих принципах проектирования и реализации онтологии. Ясность — онтология должна эффективно передавать смысл введенных терминов, ее определения должны быть объективны, а для их объективизации должен использоваться четко фиксированный формализм. Согласованность — все определения должны быть логически непротиворечивы, а те утверждения, которые выводимы в онтологии, не должны противоречить ее аксиомам. Расширяемость — необходимо проектировать онтологию так, чтобы ее словари терминов можно было расширять без ревизии уже существующих понятий. Минимум влияния кодирования — концептуализация онтологии должна быть специфицирована на уровне представления, а не символьного кодирования. Минимум онтологических обязательств — онтология должна содержать только наиболее существенные предположения о моделируемой ПрО, чтобы оставлять свободу расширения и специализации. Онтологический инжиниринг подразумевает глубокий структурный анализ предметной области. Приведем простейший алгоритм онтологического инжиниринга:
Методология построения онтологии предполагает рассмотрение следующих важных вопросов:
МОДЕЛИРОВАНИЕ БИЗНЕС-ПРОЦЕССОВПонятие онтологии и онтологического анализа вошли и в процедуры и стандарты моделирования бизнес-процессов. Ведь описание бизнес-процесса — это по сути структурирование данных и знаний. Существует много сложных формаций или систем, созданных и поддерживаемых человеком, таких как коммерческие предприятия, корпорации и т. д. Эти системы представляют собой совокупность взаимосвязанных между собой объектов и процессов, в которых определенные объекты тем или иным образом участвуют. Онтологическое исследование подобных сложных систем позволяет накопить ценную информацию об их работе, результаты анализа которой будут иметь решающее мнение при проведении процесса реорганизации существующих и построении новых систем. Для моделирования таких сложных систем разработан ряд методологий, например методологии семейства IDEF (Integrated DEFintion). IDEF содержит 14 государственных стандартов США, созданных в рамках предложенной ВВС США программы компьютеризации промышленности ICAM. Они предназначены для анализа процессов взаимодействия в производственных системах. Для поддержки онтологического анализа предназначена методология IDEF5. Онтологический анализ обычно начинается с составления словаря терминов, который используется при обсуждении и исследовании характеристик объектов и процессов, составляющих рассматриваемую систему, а также создания системы точных определений этих терминов. Кроме того, документируются основные логические взаимосвязи между соответствующими введенным терминам понятиями. Результатом этого анализа является словарь терминов, точных их определений и взаимосвязей между ними. Таким образом, онтология содержит совокупность терминов и правила, согласно которым эти термины могут быть скомбинированы для построения достоверных утверждений о состоянии рассматриваемой системы в некоторый момент времени. Кроме того, на основе этих утверждений могут быть сделаны соответствующие выводы, позволяющие вносить изменения в систему для повышения эффективности её функционирования. Процесс построения онтологии, согласно IDEF5, состоит из пяти основных действий:
В любой системе существуют две основные категории предметов восприятия: объекты, составляющие систему, и взаимосвязи между этими объектами, характеризующие состояние системы. На начальном этапе построения онтологии должны быть выполнены следующие задачи:
Для поддержания процесса построения онтологии в IDEF5 разработаны специальные онтологические языки: схематический язык (Schematic Language-SL) и язык доработок и уточнений (Elaboration Language-EL). Язык SL (рис. 3) позволяет строить разнообразные типы диаграмм и схем в IDEF5. Основная цель всех этих диаграмм — наглядно и визуально представлять основную онтологическую информацию.
Существуют четыре основных вида схем, которые используются для накопления информации об онтологии в прозрачной графической форме.
Таким образом, диаграммы состояния в IDEF5 наглядно представляют изменения состояния или класса объекта в течение всего хода процесса. При построении концептуальной модели используются предметные знания в виде набора понятий и связывающих их отношений. Каждое понятие имеет имя и может иметь атрибуты, каждый атрибут может иметь значение с учетом специфики предметной области. Строение и свойства любой системы могут быть эффективно исследованы при помощи словаря терминов, используемых при описании характеристик объектов и процессов, имеющих отношение к рассматриваемой системе, точных и однозначных определений всех терминов этого словаря и классификации логических взаимосвязей между этими терминами. Набор этих средств и является онтологией системы, а стандарт IDEF5 предоставляет структурированную методологию, с помощью которой можно наглядно и эффективно разрабатывать, поддерживать и изучать эту онтологию. ПРОДОЛЖЕНИЕ — Онтологии в корпоративных системах. Часть II Об авторах:
Рогушина Юлия Витальевна — канд. физ-мат. наук, с.н.с. Института программных систем НАНУ.
|
- Экспертные системы помогут. Но экспертом не сделают
- Великі мовні моделі: пастки, яких слід уникати
- Разговорник ERP
- Онтологии в корпоративных системах. Часть II
- Новая логика и факторы развития КИС
Отзывы |
Илья, glavatskya@yahoo.com Очень важный и интересный материал, особенно в современный период возрастания знаний в корпоративных системах. Хотелось бы побольше таких статтей (как с информативной точки зрения так и с использованием реальных результатов). 2007-03-21 10:42:37 Ответить Анатолий, glanat@ukr.net Онтологии сейчас используются повсеместно для интеллектуализации различных задач ИКТ. Нет ни одной области, где невозможно было бы применить знания об этой предметной области для улучшения различных ее задач и функций 2016-01-28 16:02:12 Ответить |
МЕТОДОЛОГИЯ: Стратегия, Маркетинг, Изменения, Финансы, Персонал, Качество, ИТ АКТУАЛЬНО: Новости, События, Тренды, Инсайты, Интервью, Бизнес-обучение, Рецензии, Консалтинг СЕРВИСЫ: Бизнес-книги, Работа, Форумы, Глоссарий, Цитаты, Рейтинги, Статьи партнеров ПРОЕКТЫ: Блог, Видео, Визия, Визионеры, Бизнес-проза, Бизнес-юмор Copyright © 2001-2023, Management.com.ua |
Менеджмент.Книги
Менеджмент.Книги — новинки, книжные обзоры, авторские тезисы и ценные мысли из бизнес-книг. Подписывайтесь на телеграм-канал @books_management