Лекции весеннего семестра 2008 г

Первые лекции - с 16 февраля 2008 года



Этот конспект дополняет полный курс, который также есть на этом сайте. В Сорбонне есть правило, что лектор должен перед лекцией раздать студентам ее конспект – но читать он должен не так, как написано в конспекте! То есть этот конспект не буквально повторяет текст курса, который есть на сайте.

Лекция 1

16 февраля 2008 года

Методика (технология) построения понятия знания - через общие места и риторические изобретения.

Определение знания.

В предыдущем курсе мы изучили три мощные парадигмы обработки знаков - семиотика (наука о знаках), теория обращения с готовыми знаковыми произведениями (ЗП) - текстами (часть общей филологии) и риторику - науку об способах эффективного построения знаковых произведений.

Мы применили эти три парадигмы (методики) для построения теории документа.

Примеры применения этих парадигм можно найти на этом сайте по ссылке "Уроки ГОСа и другое"

Стоит также посмотреть ссылки и содержание курсов за предыдущие годы

Для того, чтобы начать, нужно уточнить или определить некоторые понятия



Предварительные определения. Особенности определений в информатике и смежных науках. Их отличие от математических и физических определений (в парадигме отличий подходов в науках «атомного» и «информационного» проектов.



Необходимые предварительные сведения и определения.


1. Некоторые необходимые определения.

Понятие объекта. Существует множество определений. Это понятие первично – как понятие множества. Мы примем самое простое.

Объект – это

1. То, с чем мы имеем дело. Объект может принадлежать любому их трех миров (фундаментальных классов объектов) – то есть быть материальным, мысленным (идеальным) и знаковым..

И еще –

Объект, рассматривая объект мы неизбежно учитываем -

2. Его качества (свойства)

и

3. Его связи с другими объектами. Связь – двустороннее отношение между двумя объектами.

-----------

Также мы часто будем сталкиваться с понятием

Системный подход.

Если (пока) очень кратко – то это когда мы какой-либо изучаемый объект изучаем не изолированно, а как часть системы.

Что такое система.

Пока достаточно упрощенно – система это – когда сумма объектов приобретает свойства, не присущие ни одному из суммируемых объектов.
Итак – система – это -

1. Объекты
2. Связи между ними
3. Доминанта

Рассматривая объекты не как сумму, а как целое и новое качество (систему), которое в основном (но не только) реализуется через доминанту, мы можем получить новые результаты и скорректировать старые.

Например – стул – совокупность частей (скажем – деревянных), реализующих доминанту – чтобы можно было на нем сидеть.
В другом варианте – как куча деревянных составных частей – это уже не стул и не система.

Другой – менее тривиальный пример –

Система – законы-чиновники-общество.

Рассмотрим чиновников отдельно. Казалось бы ясно – чем менее коррумпированы чиновники – тем лучше. Это если смотреть по отдельности.
А если как часть системы? Допустим – законы несовершенны. Хорошо ли тогда некоррумпированное чиновничество? – Оно будет делать еще хуже …

Переходим к определению знания.


Понятие знания (К или З кратко в тексте). Знание как объект изучения.

Знание – один из сложнейших объектов, с которым приходится иметь дело человеку. Существует много его определений. Поэтому лучше определять его поэтапно.

Будем применять риторическую парадигму (рекурсивно) порождения знания о незнакомом объекте. Определять будем через общие места (Loci communes – LC – по-латински), применяя, по возможности риторическое изобретение (РИ). РИ можно применять в любой части парадигмы. Даже в подборе общих мест.

Итак.

LC1. Есть ли ч-л подобное, близкое З?
Есть – это данные и информация.
Можно начать с такого различения - чем отличается понятие «знание» (З) от подобных ему – понятий – информация (I), данные (D)? Какие существуют способы различить их?

LC2. Какие науки изучают З?

Затем рассмотрим науки, изучающие З – гносеология, эпистемология, онтология и вообще – теория познания (см. подробнее в след лекции).

LC3. Где находится З?

То есть -
Локализация З. –

Данные – Информация – Знание и концепция трех миров.

Диалектика соотношения.

Данные – Информация – Знание – термины и слова общеупотребительной лексики. Культура рассуждения о них и причины употребления одного слова (термина) вместо другого.

Предметная, мыслительная и знаковая деятельность.

LC4. Родовой признак знания – знание порождает новое знание.

LC5. Практические способы различения знаний и информации:

Пример 1. Извечная парадигма «Ученик – учитель».

Учитель дает прочитать классу неск. страниц учебника. На след. уроке (если он следует противопоставлению, что он учит думать – т.е. работать со знанием, а не запоминать) он задает вопросы, заставляющие ученика не воспроизводить отрывки прочитанного (зазубрил), а получать новое знание, для ответа на вопрос. То есть проверяется – совершилось ли до конца еще не разгаданное таинство – превратилась ли прочитанная информация в знание. Что и делают учителя уже тысячи лет.

Пример 2. Различия БД – БЗ на примере –

Запись 1 - Иванов учится в 225 группе
Запись 2 - Петров и Иванов учатся в одной группе

Запрос (Q) – В какой группе учится Петров?
Если ответ есть – Петров – то это БЗ – иначе – БД.

Лекция 2

1 марта 2008 года

Итак – в задачи этого курса входит –

1. Знание как объект теории познания (ТП). Более точное понимание что такое З даст нам возможность решить другие задачи курса –
2. Как заставить З работать в кибернетической системе (КС – далее будем понимать КС как неживую КС – ведь человек тоже КС). Пока мы знаем, что заведомо З «живет и работает» в человеке – его сознании (М).
3. Когнитивные системы (КС, основанные на знаниях) в практической ИТ.
Например, изучив этот курс, мы сможем увидеть –

1. Принципиальную разницу между ИТ (КС) системами, реализующими в Сети услуги класса Web 2.0 и понятием Semantic Web, также разрабатываемый для WWW.
2. Грамотно интерпретировать модную парадигму

«Четыре И» -

1. Инновации
2. Инвестиции
3. Инфраструктура
4. Институты

Многое, нужное для этого мы уже знаем из курса «Обработка нечисловой информации»



Ясно, что для этого надо знать все три части курса.

Теперь нам нужно еще расширить теоретическую базу.

Матрица переходов

Мы изучили объекты и фундаментальные классы (ФК) объектов (или три мира – R М и S ).

Теперь интересно и полезно рассмотреть матрицу 3х3, отображающую переходы между этими ФК -

…….М……….R………….S

М
R ….. …….
S … ….. ………………

Интересно и полезно рассмотреть все переходы. Это можно взять в качестве упражнения

Например R-R это любое преобразование материального объекта в другой. Лучше брать простые примеры – например – колка дров. Слева – чурбаны, справа – дрова.
Переход M-S – это речь, написание книги.
Переход M-R – создание материального объекта по задуманному плану – вылепить снеговика.

Переход S-R – изготовление детали R на станке ЧПУ по программе S.
Переход S-S – компиляция программы, составление конспекта книги.

Интересно, что переход M-М раньше считался немыслимым и запрещенным (более или менее доказано, что только Вольф Мессинг мог читать мысли). Однако, на выставке Consumer Electronics Show 2007 в Лас Вегасе уже демонстрировался робот, управляемый мыслью! Это было записано на СD, прилагемой к журналу Компьютерра. К голове любого посетителя прикреплялся электрод вместе с небольшим компьютером сзади – и робот (просто машинка) на колесиках по мысленным командам поворачивался вправо-влево! Это уже теорема существования перехода М-М!

Нетрудно заметить, что в этих переходах скрыт или неявно предполагается сам процесс перехода или преобразование. Чтобы разрубить чурбан в переходе R-R нужен топор и сам процесс можно назвать колкой дров.

Введение понятия процесс – это расширение нашего знания. Процесс – это особый вид объекта.

То есть мы имеем еще один – очень важный для нас объект, который часто удобно рассматривать отдельно. Этот объект – процесс. Проще всего его определить так.


Пусть I – множество входных объектов.
Пусть О – множество выходных объектов.

Тогда процесс – это такой объект Р, который определим как преобразование (то есть как некоторую аналогию функции в математике) между объектами множеств I и О –
<I,P,O>


Например, в процессе заварки чая входными объектами (множество I) будут пакетик чая и чашка с кипятком, а множество выходных объектов (О) будет состоять из единственного объекта – чашки заваренного чая.

Сами процессы удобно изображать графически.
Объекты I и О – в виде прямоугольников слева и справа от овала – самого преобразования. Овал вдоль разделен – вверху – кто реализует процесс (субъект) – для заварки чая – секретарша. В нижней половине название преобразования (заварка). Или – вверху – топор – внизу овала – колка.
Эту нотацию изобрели физтехи И.П. Беляев и В.М. Капустян (см. литературу!). Очень важно, что эта нотация в отличие от всех остальных сразу и быстро воспринимается неподготовленными пользователми (очень важно – заказчиками!)

Подробнее см. статью Рыкова В.В. «Коммуникация, визуализация и онтология» в ссылках (приложении)

Процессная модель позволит нам точнее и нагляднее определить что такое знание, что такое когнитивные процессы - то есть процессы так или иначе связанные со знанием или процессом познания.
Не говоря уже о бизнес процессах – это уже вклад в третью задачу курса.


Далее.

Источники знаний - это еще не знания!


Если мы считаем, что знание (К) находится во внутреннем мире человека (М) и хотим, чтобы в некотором зачаточном виде оно начало функционировать в КС (человек, строго говоря, тоже кибернетическая система, но далее для учебных целей мы будем рассматривать их отдельно), то тогда нас будут интересовать такие (когнитивные) процессы –

R – К
М – К
S - K

Нетрудно уточнить, что вместо тире должны стоять самые разные когнитивные процессы (Р), преобразующие материальные, ментальные или знаковые объекты в знание (К или З). И должны записываться в виде процессной IPO тройки.

Нетрудно видеть, что физика как наука имеет (первичным) источником З R – физический мир. Психология – М. Математика – S!
Это не значит, что, получив первичные данные от приборов, физик не пользуется другими классами когнитивных процессов.

Рабочее определение знания.

Далее уже затруднительно рассматривать знание как абстрактный объект (пусть даже и обладающий некоторыми уникальными свойствами).
Теперь можно определить З так, как часто его определяют для практических целей в информатике и рассмотреть его преимущества и недостатки. А затем, уточняя, дойти до научного определения З.

В ИТ часто говорят - З – это данные плюс процедуры их обработки.

Это совершенно нормальное определение, но (почти как в анекдоте) его нужно несколько уточнить.

1. Термин «данные» (как часто делается) употребляется как метафора или синоним информации. Данные – материальные объекты, несущие (только для тех, кто знает знаковую систему, в которой они закодированы) информацию.
2. Процедуры обработки – это очень широко. Получается, что самая простая БД, выдающая через свою СУБД информацию на простейшие запросы (типа – сколько сотрудников в конторе старше 40 лет) уже есть ИС класса КМ. Не говоря о том, что процессы чтения-записи можно причислить к процедурам обработки.
Значит – это определение неточно, но его можно доработать.

Диалектика, нашей специальности и информатики вообще в ее коммерческой ипостаси заключается в том, что если пользователь такой ИС считает, что он получил З (то есть он имеет систему класса КМ – Knowledge Management), то он имеет право так считать! Здесь мы смыкаемся с понятиями и стратегиями маркетинга и менеджмента. То есть – с этой точки зрения, определение, данное выше вполне правильное. При очень важной оговорке – если (а это далеко не всегда) покупатель или пользователь считает все это знанием. Вдруг он узнает, что его надули.

Для стоящей перед нами учебной задачи – выяснить что такое З и как заставить его работать в КС - это определение надо уточнить следующим образом.

1. Под данными в научном определении З надо понимать специальные объекты - когнитивные структуры, отражающие З.
2. Под процедурами обработки надо понимать специальные (когнитивные) процедуры (процессы!), преобразующие З и порождающие новое З.

Далее мы займемся этими проблемами.
Точное и глубинное выяснение природы этих сложных объектов и процессов можно заменить упрощенными определениями, вполне уместными для самого широкого класса прикладных задач. Они даются в широко доступных учебниках и других публикациях. Здесь можно употребить такую аналогию.
Электричество можно изучать, разбирая электроутюг (что делается в нек. школах США) и это будет эффективно для «самого широкого класса прикладных задач». А можно по схеме – заряды – закон Кулона и т.д.
Мы здесь будем придерживаться последней модели, не забывая о практической значимости первой. См опять же три задачи курса.

Поэтому снова обратимся к высокой теории.

Теория познания (ТП). Будем для определенности следовать Илларионову – физтеху (по прозвищу Градиент), ставшему профессиональным философом. О нем можно прочитать в книгах о Физтехе, его книга есть в биб-ке.

1. ТП познания стоит в центре любой философской системы (ФС). Должна стоять – если это ФС! ФС не так уж много было создано за всю историю человечества. Иногда даже говорят, что основной вопрос философии не в том, что первично – материальное или идеальное, а откуда мы знаем.
2. ТП связана с конкретизацией сложнейшего понятия – научного знания (НЗ).
3. В ТП входят (или относятся, соотносятся – сейчас нам это не важно) когнитивные науки – гносеология, эпистемология, онтология и другие. Иногда их употребляют как синонимы, иногда (в разных ФС) их различают.

ТП ставит перед собой такие задачи –

1. Источник З – откуда оно берется.
2. Как получается З (метод познания)
3. Как З обосновывается и проверяется.

То есть – простыми словами – как мы все узнаем, что такое З, можем ли мы все познать (познаваем ли мир). Например, есть такие ФС как агностицизм, который говорит, что мир не познаваем. Это есть во многих учебниках философии. Ближе всего к нам – учебник Илларионова.

Следуя учебной парадигме электроутюга удобно теперь противопоставить два вида З – обыденное З (ОЗ) и научное З - (НЗ). Внимание – здесь и далее под пока З мы понимаем и когнитивные структуры и процедуры их обработки (см. выше и далее)!

ОЗ -

ОЗ – получается как результат нашей практической деятельности.

ОЗ -

1. Нецеленаправленное
2. Случайное
3. Несистемное.

ОЗ часто предстает в форме рецептов. Делай так – получишь это. Например – поваренная книга. С точки зрение высокой теории ее перлы типа – варить до готовности есть нонсенс. Тем не менее это прекрасный пример, как и все ОЗ, которым мы постоянно

Продолжение - с окончания Лекции 2

...


Продолжение - с окончания Лекции 2


ОЗ -

ОЗ – получается как результат нашей практической деятельности.

ОЗ -

1. Нецеленаправленное
2. Случайное
3. Несистемное.

ОЗ часто предстает в форме рецептов. Делай так – получишь это. Например – поваренная книга. С точки зрение высокой теории ее перлы типа – варить до готовности есть нонсенс. Тем не менее это прекрасный пример, как и все ОЗ, которым мы постоянно пользуемся в нашей повседневной жизни.
ОЗ может быть противоречивым – и это никак не умаляет его достоинств. ОЗ дает рецепты (и часто НЗ не может их восстановить, если они утрачены) как делать булатную сталь, итальянские скрипки и т.п. Рецепты ОЗ часто невоспроизводимы. Это в корне отличает ОЗ от НЗ.

Тогда как НЗ –

1. Целенаправленное
2. Непротиворечивое
3. Системное.
4. Воспроизводимое

НЗ часто противоречит нашему здравому смыслу (ОЗ в концентрированном виде). Например – законы квантовой механики, теорема Вейерштрасса о непрерывной на отрезке функции, нигде не имеющей производной.
В НЗ тоже есть форма рецептов. Но это на 2-м плане. На 1-м плане у НЗ – свойства и законы поведения изучаемых объектов.

Проблема источника и получения З.

Разные ФС решают ее по-разному.

Есть две крайности –

Сенсуализм (эмпиризм) – все З – из чувств (шире - опыта). Ищет эмпирическое содержание в доступных нам источниках.
Рационализм – З мы получаем путем логического рассуждения.

Существуют их комбинации и другие разновидности и подходы. Убедиться в том, что это не бессмысленная схоластика можно, потрогав скрещенными пальцами теннисный шарик с закрытыми глазами. Наши чувства скажут нам, что их два. Как мы бы узнали, что это не так, не будь у нас зрения? Есть ли тогда уверенность, что наших чувств и доступных приборов достаточно, чтобы правильно построить НАУЧНУЮ картину мира?

Тогда важен научный метод (НМ)

Теперь мы можем более осмысленно рассуждать о том, что такое научный метод, который лежит в основе НЗ и которым мы пользуемся. При помощи НМ мы узнаем (должны узнать), что под нашими пальцами не 2 а 1 шарик!

НМ – отличает –
1. Целенаправленность
2. Систематичность и непротиворечивость.
3. Это способ выражения НЗ.
4. Он отличает науку от не науки.





Лекция 3

15 марта 2008 года

Повторение

Научное познание – его особенности

1. Мир существует независимо от нас.
2. Мир познаваем
3. Высший уровень познания – наука
4. Научное познание пользуется научным методом.

О научном методе см. выше.

Еще раз расширим нашу теоретическую базу.

Новый тривиум

Раньше в основе образования стоял старый тривиум наук. Речь шла о знаковой системе (ЗС), лежащей в основе основ – описании знания. Такой системой был ЕЯ. Поэтому изучались грамматика (синтактика ЕЯ), риторика и философия (богословие) – семантика и прагматика ЕЯ.

Сейчас невозможно не признавать огромного количества и массового употребления других ЗС.
Поэтому в основе образования и описания знания должен лежать новый тривиум – семиотический – синтактика, семантика и прагматика любых ЗС.

Пример получения З - Технология Абу- Грейб


Уточнение парадигмы – Знание

Расширив практическое понимание З, определим З – это

1. База знаний (КВ – по старому «данные»)

и

2. Когнитивный процессор (КР – «процедуры обработки») .

То есть мы различим еще раз статическое и динамическое З.

В какой форме хранятся З в реальных КС будем изучать позже.

А сейчас мы изучим «процедуры обработки» - то есть КР – то есть как мы получаем новое З.

Известно ли об этом и что известно.

Мы уже знаем пример различения БД – БЗ –

Петров учится в МФТИ

Петров и Иванов учатся вместе

Следовательно – Иванов учится в МФТИ

Возьмем еще проще и древнее –

(1) Все люди смертны
(2) Сократ – человек
След
(3) Сократ смертен

Это примеры простейших силлогизмов Аристотеля – 2-й из них силлогизм Barbara

Есть больше десятка других силлогизмов Celares, Darii – см на сайте и в курсе.

Здесь мы видим также уже знакомую форму представления З – «атом» З – предикат.
(1),(2),(3) – предикаты – так же как и суждения про Иванова и Петрова.

А теперь вспомним Пролог.

Тогда – предикаты – это элементы КВ – а механизм, порождающий новое З – предикат (3) – это «машина вывода» или когнитивный процессор (КР). Как видно – они часто вместе.
В Прологе ЛЗ входит в компилятор.

Различение КВ и КР фундаментально, но не всегда выражено явно в КС. Например – нейросети. В ОЗ есть слово «понимание». Это обработка того, что ты узнал – полученного фрагмента КВ. Часто в разговоре говорят – ты понял – это значит – ты обработал, превратил в З ту КВ, что тебе была сказана?

Теперь мы знаем что –

Знание – это база знаний (КВ) и когнитивный процессор (КР)

Последовательность описания знаний

Описание и кодирование
Это к вопросу о когнитивных структурах, составляющих Базу Знаний (КР).

Мы идем при описании З таким путем –


- понятия
- суждения (простейшеие предикаты)
- силлогизмы (логические выводы )

Теперь –

Простейшие когнитивные структуры для описания знаний

- предикаты (логика со времен Аристотеля, язык Пролог, ЛИСП)
- фреймы (Марвин Минский – 60-е гг)
- семантические сети (Джон Сова – 90-е гг.)

Понятие предметной области (ПО - knowledge domain – domain)

Определение ПО

ПО или domain это -

1. Объекты (относящиеся к данной ПО)
2. Их свойства (релевантные данной ПО)
3. Их взаимосвязи


Примеры –

- ПО программы GEOBASE
- ПО простейших видов деятельности (заварка чая, колка дров)
- ПО более сложных видов деятельности - индустриального строительства

Какие материальные, ментальные, знаковые объекты входят в эту ПО, какие их свойства значимы для этого вида деятельности, какие связи?

Здесь мы приходим к понятию -

Релевантность

Релевантность – это тоже просто – это то, что востребовано в данной ПО. Например – релевантные свойства кирпича – цвет, прочность, вес, форма и т.п. А запах – навряд ли релевантное свойство кирпича для строительства (если он у него есть)

Или Р признаки (свойства) для ПО транспортировки яблок - их размер, удароустойчивость

При продаже яблок Р свойства (признаки) остаются разве что 1-й признак, другими Р признаками будут вкус, запах и т.п.

Хороший пример Р признаков дает ПО семейной жизни.

Итак мы видим, что ПО – это уже некоторая связка объектов или суждение, описывающих к-л вид деятельности
например – ПО (D) географии США (программа GEOBASE), строительство

Про объекты не надо забывать, что они могут быть материальными (для ПО строительства – кирпичи, краны), понятийными (ментальными) – понятия прочность, план и знаковыми – чертежи, ведомости и т.д.

Релевантность – это тоже просто – это то, что востребовано в данной ПО. Например – релевантные свойства кирпича – цвет, прочность, вес, форма и т.п. А запах – навряд ли релевантное свойство кирпича для строительства (если он у него есть)




Формула Брукса (начало)



Лекция 4

22 марта 2008 года



Простейшие когнитивные процессы

- Понимание знака
- Процесс генерации (автогенерации) эл. единиц знания (силлогизмы)

- Более сложные когнитивные методологии

Научная теория (НТ)

Теперь удобно определить научную теорию – немного идеализированное, но полезное определение – из статьи M Matterazzi (не того, что обидел Зидана ) из статьи Why AI is not a science с сайта www.stanford.edu

НТ – это упорядоченная тройка множеств

НТ = {D,S,L}

Где D – это ПО

S – это знаковая система, именующая объекты из D
а L – это язык или логическое исчисление, оперирующие с этой знаковой системой (с объектами D) – то, что мы в КМ называем когнитивный процессор, который моделирует силлогизм.

Хорошим примером может послужить любая задача на мотоциклистов. Из условия задачи мы (ре)конструируем ПО (множество объектов D). Это непростой процесс и называется он ПОНИМАНИЕ. Например, простая фраза – молоток ударился об графин и он разбился – машине непонятна. Прежде всего потому, что ей неизвестно, что РЕЛЕВАНТНОЕ свойство объекта графин – хрупкость. Реконструировав все объекты, их свойства и связи (а объекты – не только мотоциклисты – но и скорости, расстояния, временные интервалы и их свойства в такой задаче чаще всего численные, а связи описываются арифметическими действиями), мы переходим к их обозначениям и составлению ЗС, описывающей эту ПО. Это кв. уравнение. Затем, делая знаковые (алгебраические) преобразования с этим уравнением мы узнаем новые свойства этой ПО – по сути генерируем ее ТЕОРИЮ.



Про науку в целом можно сказать, что она есть сумма (непротиворечивая) НТ.

Для того, чтобы сделать доступным для обработки КР объекты ПО, придумали КС (когнитивные структуры).

Их список открыт – но самые популярные из них -


1. Фреймы

Представление, типовое использование. Марвин Минский.

Ф – это таблица с именем и ее ячейки – слоты.

Свойства Ф хорошо себе представить, если кодировать в нем историю болезни. Тогда имя Ф – имя больного, в его слотах хранятся его вес, температура, состав крови и т.п.

Не надо забывать, Ф требует спец. программы обработки – КР.

2. Семантические сети (СС)

Представление, типовое использование. Джон Сова.

Сова начинает с такого примера

Cat on the mat
И представляет эту небольшую ПО (после понимания) как граф (СС)

(cat) ----[on]-----(mat)

D «промышленных» масштабах применяется типовой шаблон для кодирования знаний при помощи СС

Например -

Concept:
Similar things:
Things that are special case of this:
Parts of this:
Things that this is part of:
Things that generally associated with:
Things that it does:
Properties that it often has:

важное замечание - все, что перечислено наверху - это есть семантические связи.

В ледующем примере они заполнены.


Concept: ability
Similar things: talent, skill
Things that are special case of this: genius
Parts of this:
Things that this is part of:
Things that generally associated with: learning, sport, intelligence, talent, skill, expertise.
Things that it does:
Things that are done to this: enhanced, improved, developed
Properties that it often has: natural, amazing, uncanny

Понятно, что эту КС можно поместить во фрейм.

Можно попробовать закодировать другой пример – компьютер.
Конечно, тоже не надо забывать, что СС требует спец. программы обработки – КР.



3. Предикаты, силлогизмы, логические исчисления
Изобретение логики. Индуктивная и дедуктивная логика.
Представление, типовое использование. Аристотель.


Предикаты и силлогизмы.

Самый впечатляющий пример, где это реализовано - язык Пролог

Силлогизмы Аристотеля

Силлогизм Barbara и другие. Реализация в них дедуктивной
логики вывода (от общего к частному).

Еще раз о понятии.

Вспомним, что все начинается с понятия. А понятие формируется индуктивным путем – от частного к общему. Так, увидев одного, двух и т.д. медведей человек приходит к индуктивному выводу, что есть понятие «медведь». Далее – он уже формирует о нем суждения, а затем уже логические выводы.

Изобретение логики (продолжение темы Предикаты и силлогизмы).

Локальные системы обработки знаний.

Мы их будем изучать на примере экспертных систем – ЭС.

ЭС – это программа, заменяющая пользователю эксперта (его знания) в определенной ПО. Значит, ЭС содержит некоторую сумму знаний о ПО. Но, для того, чтобы их обработать, нужен КР. Все это управляется оболочкой (shell), отвечающей также и за диалог с «юзером» и за другое, что будем изучать позже.

Пока же мы отметим относительность этого определения. Для многих юзеров век назад калькулятор был бы ЭС.
Поэтому различают ЭС 1-го и 2-го рода.

ЭС 1-го рода – это по сути эл. справочник. В диалоге с пользователем ЭС выясняет какая часть справочника ему нужна и выдает ему под видом знания.

Только ЭС 2-го рода могут порождать новые знания в ответ на запрос пользователя. Они устроены гораздо сложнее.

Это не умаляет пользы и значимости ЭС 1-го рода.

Динамические и статические ЭС


Построение и функционирование ЭС

Первый шаг – определение и построение ПО, так как ЭС именно заменяет знания эксперта в определенной ПО.

Какие знания представляет пользователю ЭС – как научные (НЗ), так и обыденные (ОЗ). Действительно, про ЭС, диагностирующую неисправности автомобилей, трудно сказать, что она дает пользователю научные знания.

Типовая схема ЭС.

ЭС содержит следующие компоненты –

КВ – база знаний
И
КР – когнитивный процессор или машина вывода
Являются ее основными частями.

Этими двумя компонентами, являющимися ядром ЭС управляет управляющая программа, осуществляющая также связь этих двух главных компонент с другими блоками.
В числе этих (в общем-то вторичных) компонент следует назвать интерфейс с пользователем.

Есть еще другой интерфейс – у ЭС, отвечающий за наполнение ее базы знаний (КВ). С этим интерфейсом работают как минимум два человека – эксперт (носитель знаний, которые будет представлять для пользователя эта ЭС) и инженер знаний, который эти знания выявляет и кодирует.

Здесь мы впервые встречаемся с термином инженерия знаний, введенным Фейгенбаумом в 70-е годы ХХ века.
Способов выявления и кодирования З много и о них мы уже начали говорить и будем говорить ниже.

Можно заметить, что ЭС Мицар, которая есть лабораторная работа может рассматриваться как структурированное интервью эксперта при помощи самой ЭС.

Блок объяснений – очень важная и обязательная, но незаметная компонента ЭС.

Действительно, чем сложнее знания и ПО, тем ответственнее ответ ЭС. Не всегда он очевиден и сама ЭС может ошибаться или неправильно понять вопрос пользователя.

Поэтому пользователь через блок объяснений вправе затребовать протокол рассуждений ЭС. Который привел к данному решению.

ЭС Мицар – см. на сайте и в курсе лекций.

Функциональная классификация ЭС

см. в курсе лекций.


Лекция 5

29 марта 2008 г

ЭС - классификация


см. в курсе лекций.

Концептуализация - это процесс формирования знания, исходя из известной предметной области

Язык описания знаний KNOW

см. в курсе лекций.
...


Определения

Онтология – это точная спецификация концептуализации предметной области, позволяющая формировать модель знаний специалиста с помощью множества понятий и отношений, описывающих эту предметную область, а также правил и аксиом, определя

Лекция 6 и далее

...


Онтология – это точная спецификация концептуализации предметной области, позволяющая формировать модель знаний специалиста с помощью множества понятий и отношений, описывающих эту предметную область, а также правил и аксиом, определяющих их интерпретацию.

Подробнее см на сайте

http://dp-beg.narod.ru/stat3.html
...

Когда мы говорим КС - кибернетическая система - то подразумеваем неживую кибернетическую систему - например - компьютер. Хотя, строго говоря, человек - это тоже КС.

...

Лекция 6

5 апреля 2008 г

и


Лекция 7

12 апреля 2008 г



Итак – мы продолжаем изучать и развивать следующие тезисы –

1. Знание расположено в нашем сознании и мы пытаемся поместить его в КС.
2. Обмен знаниями и генерация новых знаний требуют определенной степени доверия и специальной программной поддержки.
3. Новые технологии развивают новые виды когнитивного поведения и новые когнитивные механизмы, работающие в КС.
4. Обмен знаниями и генерация новых знаний должны быть стимулированы и вознаграждены различными способами.
5. Необходима и важна поддержка этого процесса в форме специальных когнитивных процедур управления, программных и аппаратных ресурсов
6. Знание, генерация новых знаний, разработка процедур генерации новых знаний есть творчество и должно быть поддержано и стимулировано к развитию даже самыми неожиданными способами.

Ниже будут описаны модели, которые различным образом реализуют эти тезисы.

Темы последних двух лекций

1. Извлечение знаний из знаковых произведений (текста)

2. Локальные и глобальные когнитивные системы.

Модель 1 - локальная

Экспертная система.

На ее примере мы отработали и изучили функционирование основных элементов когнитивной системы -

КР - когнитивный процессор
и
КВ - базу знаний

Модель 2

Semantic Web - первая глобальная распределенная когнитивеая модель.

Ее особенности и проблемы, которые пришлось решить при ее реализации.


Модель 3

Web 2.0

Когнитивная социальная сеть.

Ее структура и проблемы, которые пришлось решить при ее реализации.

Модель 4

BI - Business Intelligence

Бизнес моделирование

Локальный и глобальный варианты.


Структура этой модели и проблемы, которые пришлось решить при ее реализации.

-----

Понимание знакового произведения (текста) кибернетичекой системой (КС)


Процесс понимания можно рассматривать по-разному

Мы здесь, исходя из ранее изученного материала будем его рассматривать как последовательность трех этапов (хотя это деление может быть сделано – возможно – и по другим критериям)

1. Слабый критерий понимания. Переход от знака к денотату – то есть это означает только то, о чем говорится в тексте. – Иными словами – результатом понимания будет денотатная структура, отражающая то, о чем говорится в тексте. После этого можно ответить на вопросы, ответы на которые явно сформулированы в тексте. На этом принципе работают современные «искалки» в Web 1.0. Они «выдают» только релевантные (относящиеся по их «мнению» к теме запроса) куски текста (сайта)

2. Сильный критерий понимания. Это то, что проверяют учителя после того как зададут классу читать учебник «от сих до сих». Нужно уметь ответить на вопросы, явно не сформулированные в тексте. То есть – снова - используя известный пример – если в тексте содержатся предложения – «Петров учится в МФТИ» и «Иванов и Петров учатся вместе», то считается что КС поняла этот текст в сильном смысле этого слова, если она способна ответить на вопрос – «Где учится Иванов?». Ответ на такой вопрос требует преобразования денотатной структуры текста в КВ – то есть в когнитивную базу знаний, после чего КР (когнитивный процессор), обращаясь к КВ, может генерировать свои ответы. Что-то похожее на работу с программой на Прологе- и не «что-то» - а на самом деле так.

Но! – Выдавая ответ о том где учился Иванов – КС все равно не понимает – ни что такое «учиться» ни кто такой Иванов и т п. А это бывает и не важно пользователю – как возможно и в первом случае.

3. Онтологический критерий понимания. Это когда КС понимает смысл денотатов – т е может их разъяснить. Этот критерий впервые был сформулирован в концепции Semantic Web – см ниже – модель 2. Для этого надо строить ОНТОЛОГИЮ соответствующих понятий. Подробнее об этом – в разделе про онтологии и Semantic Web.


Сейчас мы разберем подробнее слабый критерий. Сильный критерий (построение КБ и КР, их работа на примере ЭС) мы обсуждали раньше.

Основные проблемы

1. Проблемы перехода по связи «знак-денотат». Здесь переход прежде всего (это не все проблемы) не одно-однозначен в ту и другую сторону.

Самые частотные случаи –

- Полисемия – один знак- два и более денотата. Например – русское слово «решить» имеет два денотата – решить что-то делать и решить задачу. Кстати – на английский это переводится соответственно разными словами – “decision” и “solution”. Ясно, что это затрудняет переход к нужному денотату. Требуются специальные методы.
- Синонимия – наоборот – много знаков – один денотат. И попробуй понять, что денотат один, если в тексте употребляются слова «ПК», «компьютер», «ЭВМ».

2. Варьирование связи «знак-денотат».

Разберем три случая.

Метафора. Перенос значения (буквальный перевод с др. греческого). «Он получил хорошую оценку и вылетел из класса». Понятно, что он не вылетел – но как тогда установить денотат?

Метонимия. «Белый дом угрожает – Кремль молчит». Другая вариация (сдвиг) связи.

Анафора. – «Он ей это сказал» - для того, чтобы «выйти» на денотаты, на которые указывают «он», «ей», и «это», нужно обратиться к предыдущему тексту и найти сами первичные знаки, указывающие на денотаты, а это уже отдельная работа – “Anaphora resolution”.

К счастью, такие явления не часты в нехудожественных текстах и особенно на Web сайтах. И это не все проблемы, но важно знать их характер и свойства.


Более подробно о понимании см. на сайте ниже. Здесь мы обозначили только структуру и характер проблемы понимания в расчете на то, что это пригодится нам впоследствии.

Сейчас мы переходим к самому главному. Наша цель – максимально автоматизировать, сделать «умнее» и «самостоятельнее» наши бизнес процессы. Подробнее об этом смотри во Введении к курсу – о рутинной составляющей, а также о процессах без людей в основном тексте курса.

Для реализации этой идеи мы рассмотрим три наиболее распространенные (но в разной степени) модели.

В основе каждой модели (так сказать – в нижнем ее уровне – или слое) – лежит непосредственно человеческая деятельность – мы ее рассматриваем как сложную функцию трех аргументов – предметной (проходящей в реальном мире), знаковой (документы, инструкции, деньги) и ментальной (когнитивные процессы в нашем сознании).

Наша задача – максимально автоматизировать эту деятельность, сделать ее разумной.

Модель 2. Semantic Web. Мы пытаемся реализовать все это в Интернете. Хорошо, если бы мы сказали программе – «Мне нужна путевка от ... и до …и не дороже … ” запустили бы ее в Сеть (синоним слова Интернет – см синонимию – мы понимаем – а нужно чтобы понимала программа!) - и мне прислали бы наилучший вариант для подтверждения и принесли бы ее домой. – То есть проделали бы все рутинные действия.

Посмотрим – годится ли для этого современный Интернет – Web 1.0? Какая в его основе (мета)знаковая система? – HTML. Что это? - Собственно – это только язык разметки (размер, цвет и т д букв и пр). Когда-то и это было очень хорошо (хочется сказать – круто – но этот синоним несет в себе не научные коннотаты &#61514; Это не смертельно. Но тогда наша «искалка» должна будет быть настолько умной, чтобы понимать тексты сайтов, решая обе проблемы понимания, упомянутые выше. Пока таких программ нет. Значит, этот подход не годится – хотя искалки и становятся все умнее.

Для решения этой проблемы была разработана концепция Semantic Web Тимом Бернерс-Ли (создателем и первого Интернета) и др в 2001 году.

Было предложено следующее.

Собственно – создать новую знаковую систему (ЗС) как основу – с новой синтактикой, семантикой и прагматикой.

1. Синтактика. Сделать основной (мета) знаковую систему XML.
2. Семантика. Положить в основу концепцию онтологии – единого и всемирного семантического и когнитивного стандарта, основанного на XML-подобной синтактике.
3. Прагматика. Возложить реализацию потребностей пользователей на специальные мобильные и «умные» (содержащие КР процессоры для работы с сайтами, пользователями и общения между собой и КВ – онтологии, содержащие знания для выполнения этих задач) программы – агенты.


Об этом подробнее – см текст курса. - А также -

Системный анализ и Semantic Web
http://ryk-kypc1.narod.ru/swb.html

Модель 3. Социальные сети – Web 2.0. В основе – та же деятельность людей.
И мы хотим какими-то когнитивными механизмами сделать ее эффективнее.
Когнитивная составляющая проявляется здесь следующим образом.

Особенности модели. Здесь свою деятельность люди и сами знают как реализовать. И имеют уже разные средства ее автоматизации. – например – сотрудники фирмы IBM или IBS. Но они (или начальство – что не всегда одно и то же :) хотят найти способы сделать ее еще эффективнее. Это справедливо и для модели 4 – но об этом позже.

Как это здесь реализовано. В социальной сети (СС), реализованной локально (как часть КИС) – или глобально – в Интернете – почему и называется Web 2.0.

В КВ СС отражаются образы участников деятельности. Иногда люди сами не подозревают о существовании в их деятельности общего. Пример – одноклассники. КР, работающий с КВ этих образов. Модель СС очень продуктивна и «на взлете» - позволяет участникам сложной и не всегда во всем объеме известной всем участникам ее координировать.

Сейчас в Интернете есть много на эту тему – можно взять сказанное за основу и дополнить и сделать вопросом по выбору.

Модель 4. Business Intelligence – бизнес аналитика. То же что и модель 3. Но промежуточный слой – там где СС в модели 3 – «глупее». Он лежит между участниками деятельности и «начальством» (CEO, CIO …), которое видит ее через ЗС (чаще – разных моделях – разные графические нотации). Они статичны сами по себе (сами себя они менять не могут) и создаются и-или модифицируются инженерами информатиками. Но они играют роль «подзорной трубы», которая позволяет начальству видеть что происходит, реструктурировать, делать реинжиниринг этой деятельности опять же с целью ее оптимизации. Об этом хорошо написано в одном из номеров Intelligence Enterprise (см ссылку)

Опять же на эту тему у нас Лаба – а также и в Интернете есть много на эту тему – можно взять сказанное за основу и дополнить и сделать вопросом по выбору.


Специфика когнитивных (генерирующих новое знание) процессов, происходящих в изученных моделях.

В модели 2 происходят наиболее сложные и интересные когнитивные процессы. Не все их здесь стоит описывать и не все еще известны – это растущая, меняющаяся модель.
Можно указать минимум на один – который можно назвать базовым. Это когда агент, содержащий пару КВ-КР и свое целеполагание (запрос пользователя) «стыкуется» с соответствующим образом отформатированным (содержащим онтологию) SW-сайтом. Процессы, происходящие при этом подобны (или сводятся) к процессам в ЭС второго рода. То есть агент обрабатывает своим КР суммарную КВ (свою и сайта) в соответствии с запросом пользователя, получает новое знание и продолжает свою деятельность (если он считает, что запрос выполнен) – или прекращает ее.

В модели 3 когнитивные процессы происходят снова в паре КВ – КР, представляющей социальную сеть. Это, конечно, не считая мыслительных процессов, происходящих в сознании людей, участвующих в соответствующей деятельности.

В модели 4 программная часть представляет собой вспомогательную моделирующую среду. Сама она меняться не может. Но когнитивные процессы происходят в сознании людей, использующих эту модель для оптимизации деятельности других людей, участвующих в соответствующих бизнес процессах.




-----

Полезные сайты -

Понимание -


http://dp-beg.narod.ru/stat3.html

Бизнес моделирование -

http://www.iemag.ru/articles/detail.php?ID=6591

Эта и другие статьи номера очень полезны

Вот - например из этой статьи - хорошее определение бизнес процесса -

»Бизнес-процесс в стандарте ISO 9001:2000 определяется как устойчивая, целенаправленная совокупность взаимосвязанных видов деятельности (последовательность работ), которая по определенной технологии преобразует входы в выходы, представляющие ценность для потребителя «


...


Конспект этих последних двух лекций будет дополнен. Можно брать темы по извлечению знаний и модели 2-4 (кроме ЭС) как вопросы по выбору.

...


Полный курс - Рыков В.В. "Обработка нечисловой информации и управление знаниями - публикация - есть в библиотеке и в киоске МФТИ

Наша 325 группа

Системный анализ и Semantic Web

E-mail: rykov2000@hotmail.com



Hosted by uCoz