Лекции весеннего семестра 2007 года

План конспект лекций - ссылки смотрите на основном сайте - здесь только самое необходимое - Лекции 1 - 3

...

Лекция 1

17 февраля 2007 года

Определение знания


Предварительные определения. Особенности определений в информатике и смежных науках. Их отличие от математических и физических определений (в парадигме отличий подходов в науках «атомного» и «информационного» проектов.

Понятие объекта.

Объект – это

1. То, с чем мы имеем дело. Объект может принадлежать любому их трех миров (фундаментальных классов объектов).

И еще –

Объект – это

2. Его качества (свойства)

и

3. Его связи с другими объектами. Связь – двустороннее отношение между двумя объектами.

Понятие знания (К или З кратко в тексте). Знание как объект изучения.

Знание – один из сложнейших объектов, с которым приходится иметь дело человеку. Существует много его определений. Поэтому лучше определять его поэтапно.
Можно начать с такого различения - чем отличается понятие «знание» (З) от подобных ему – понятий – информация (I), данные (D)? Какие существуют способы различить их?

Затем рассмотрим науки, изучающие З – гносеология, эпистемология, онтология и вообще – теория познания (см. подробнее в след лекции).

Локализация З. Данные – Информация – Знание и концепция трех миров. Диалектика соотношения.

Данные – Информация – Знание – термины и слова общеупотребительной лексики. Культура рассуждения о них и причины употребления одного слова (термина) вместо другого.

Предметная, мыслительная и знаковая деятельность.

Родовой признак знания – знание порождает новое знание.

Практические способы различения знаний и информации:

Пример 1. Извечная парадигма «Ученик – учитель».

Учитель дает прочитать классу неск. страниц учебника. На след. уроке (если он следует противопоставлению, что он учит думать – т.е. работать со знанием, а не запоминать) он задает вопросы, заставляющие ученика не воспроизводить отрывки прочитанного (зазубрил), а получать новое знание, для ответа на вопрос. То есть проверяется – совершилось ли до конца еще не разгаданное таинство – превратилась ли прочитанная информация в знание. Что и делают учителя уже тысячи лет.

Пример 2. Различия БД – БЗ на примере –

Запись 1 - Иванов учится в 225 группе
Запись 2 - Петров и Иванов учатся в одной группе

Запрос (Q) – В какой группе учится Петров?





Лекция 2 - 24 февраля 2007 года

Матрица переходов

Мы изучили объекты и фундаментальные классы (ФК) объектов (или три мира – R М и S ).

Теперь интересно и полезно рассмотреть матрицу 3х3, отображающую переходы между этими ФК

…….М……….R………….S

М M-M M – R M – S
R ….. …….
S … ….. ………………

Интересно и полезно рассмотреть все переходы. Это можно взять в качестве упражнения

Например R-R это любое преобразование материального объекта в другой. Лучше брать простые примеры – например – колка дров. Слева – чурбаны, справа – дрова.
Переход M-S – это речь, написание книги.
Переход M-R – создание материального объекта по задуманному плану (например – детали на станке ЧПУ).
Переход S-S – компиляция программы, составление конспекта книги.
Интересно, что переход M-М раньше считался немыслимым и запрещенным (более или менее доказано, что только Вольф Мессинг мог читать мысли). Однако, на выставке Consumer Electronics Show 2007 в Лас Вегасе уже демонстрировался робот, управляемый мыслью! К голове любого посетителя прикреплялся электрод вместе с небольшим компьютером сзади – и робот на колесиках по мысленным командам поворачивался вправо-влево!

Нетрудно заметить, что в этих переходах скрыт или неявно предполагается сам процесс перехода. Чтобы разрубить чурбан в переходе R-R нужен топор и сам процесс можно назвать колкой дров. Введение понятия процесс – это расширение нашего знания. Процесс – это особый вид объекта.

То есть один объект, который часто удобно рассматривать отдельно. Этот объект – процесс. Проще всего его определить так.


Пусть I – это множество входных объектов, а О – множество выходных объектов.

Пусть I – множество входных объектов.
Пусть О – множество выходных объектов.
Тогда процесс – это такой объект Р, который определим как преобразование (то есть как некоторую аналогию функции в математике) между объектами множеств I и О –
<I,P,O>

Например, в процессе заварки чая входными объектами (множество I) будут пакетик чая и чашка с кипятком, а множество выходных объектов (О) будет состоять из единственного объекта – чашки заваренного чая.

Сами процессы удобно изображать графически.

Подробнее см. статью Рыкова В.В. «Коммуникация, визуализация и онтология» в ссылках (приложении)

Процессная модель позволит нам точнее и нагляднее определить что такое знание, что такое когнитивные процессы - то есть процессы так или иначе связанные со знанием или процессом познания.

Источники знаний - это еще не знания


Если мы считаем, что знание (К) находится во внутреннем мире человека (М) и хотим, чтобы в некотором зачаточном виде оно начало функционировать в КС (человек, строго говоря, тоже кибернетическая система, но далее для учебных целей мы будем рассматривать их отдельно), то тогда нас будут интересовать такие (когнитивные) процессы –

R – К
М – К
S - K

Нетрудно уточнить, что вместо тире должны стоять самые разные когнитивные процессы (Р), преобразующие материальные, метальные или знаковые объекты в знание (К). И должны записываться в виде процессной IPO тройки.

Рабочее определение знания.

Далее уже затруднительно рассматривать знание как абстрактный объект (пусть даже и обладающий некоторыми уникальными свойствами).
Теперь можно определить З так, как часто его определяют для практических целей в информатике и рассмотреть его преимущества и недостатки.

З – это данные плюс процедуры их обработки.

Это совершенно нормальное определение, но (почти как в анекдоте) его нужно несколько уточнить.

1. Термин «данные» (как часто делается) употребляется как метафора. Данные – материальные объекты, несущие (только для тех, кто знает знаковую систему, в которой они закодированы) информацию.
2. Процедуры обработки – это очень широко. Получается, что самая простая БД, выдающая через свою СУБД информацию на простейшие запросы (типа – сколько сотрудников в конторе старше 40 лет) уже есть ИС класса КМ. Не говоря о том, что процессы чтения-записи можно причислить к процедурам обработки.

Диалектика, нашей специальности и информатики вообще в ее коммерческой ипостаси заключается в том, что если пользователь этой ИС считает, что он получил З, то он имеет право так считать! Здесь мы смыкаемся с понятиями и стратегиями маркетинга и менеджмента. То есть – с этой точки зрения, определение, данное выше вполне правильное. При очень важной оговорке – если (а это далеко не всегда) покупатель или пользователь считает это знанием. Вдруг он узнает, что его надули.

Для стоящей перед нами учебной задачи – выяснить что такое З и как заставить его работать в КС - это определение надо уточнить следующим образом.

1. Под данными надо понимать специальные объекты - когнитивные структуры, отражающие З.
2. Под процедурами обработки надо понимать специальные (когнитивные) процедуры (процессы!), преобразующие З.

Далее мы займемся этими проблемами.
Точное и глубинное выяснение природы этих сложных объектов и процессов можно заменить упрощенными определениями, вполне уместными для самого широкого класса прикладных задач. Они даются в широко доступных учебниках и других публикациях. Здесь можно употребить такую аналогию. Электричество можно изучать, разбирая электроутюг (что делается в нек. школах США) и это будет эффективно для «самого широкого класса прикладных задач». А можно по схеме – заряды – закон Кулона и т.д.
Мы здесь будем придерживаться последней модели, не забывая о практической значимости первой.
Поэтому снова обратимся к высокой теории.

Теория познания (ТП) - по Илларионову

1. ТП познания стоит в центре любой философской системы (ФС). Должна стоять – если это ФС! ФС не так уж много было создано за всю историю человечества. Иногда даже говорят, что основной вопрос философии не в том, что первично – материальное или идеальное, а откуда мы знаем.
2. ТП связана с конкретизацией сложнейшего понятия – научного знания (НЗ).
3. В ТП входят (или относятся, соотносятся – сейчас нам это не важно) когнитивные науки – гносеология, эпистемология, онтология и другие. Иногда их употребляют как синонимы, иногда (в разных ФС) их различают.

ТП ставит перед собой такие задачи –

1. Источник З – откуда оно берется.
2. Как получается З (метод познания)
3. Как З обосновывается и проверяется.

То есть – простыми словами – как мы все узнаем, что такое З, можем ли мы все познать (познаваем ли мир). Например, есть такие ФС как агностицизм, который говорит, что мир не познаваем. Это есть во многих учебниках философии. Ближе всего к нам – учебник Илларионова.

Следуя учебной парадигме электроутюга удобно теперь противопоставить два вида З – обыденное З (ОЗ) и научное З - (НЗ). Внимание – здесь и далее под З мы понимаем и когнитивные структуры и процедуры их обработки (см. выше и далее)!

ОЗ -

ОЗ – получается как результат нашей практической деятельности.

ОЗ -

1. Нецеленаправленное
2. Случайное
3. Несистемное.

ОЗ часто предстает в форме рецептов. Делай так – получишь это. Например – поваренная книга. С точки зрение высокой теории ее перлы типа – варить до готовности есть нонсенс. Тем не менее это прекрасный пример, как и все ОЗ, которым мы постоянно пользуемся в нашей повседневной жизни.
ОЗ может быть противоречивым – и это никак не умаляет его достоинств. ОЗ дает рецепты (и часто НЗ не может их восстановить, если они утрачены) как делать булатную сталь, итальянские скрипки и т.п. Рецепты ОЗ часто невоспроизводимы. Это в корне отличает ОЗ от НЗ.

Тогда как НЗ –

1. Целенаправленное
2. Непротиворечивое
3. Системное.
4. Воспроизводимое

НЗ часто противоречит нашему здравому смыслу (ОЗ в концентрированном виде). Например – законы квантовой механики, теорема Вейерштрасса о непрерывной на отрезке функции, нигде не имеющей производной.
В НЗ тоже есть форма рецептов. Но это на 2-м плане. На 1-м плане у НЗ – свойства и законы поведения изучаемых объектов.

Проблема источника и получения З.

Разные ФС решают ее по-разному.

Есть две крайности –

Сенсуализм (эмпиризм) – все З – из чувств (шире - опыта). Ищет эмпирическое содержание в доступных нам источниках.
Рационализм – З мы получаем путем логического рассуждения.

Существуют их комбинации и другие разновидности и подходы. Убедиться в том, что это не бессмысленная схоластика можно, потрогав скрещенными пальцами теннисный шарик с закрытыми глазами. Наши чувства скажут нам, что их два. Как мы бы узнали, что это не так, не будь у нас зрения? Есть ли тогда уверенность, что наших чувств и доступных приборов достаточно, чтобы правильно построить НАУЧНУЮ картину мира?

Научный метод (НМ)

Теперь мы можем более осмысленно рассуждать о том, что такое научный метод, который лежит в основе НЗ и которым мы пользуемся.

НМ – отличает –
1. Целенаправленность
2. Систематичность и непротиворечивость.
3. Это способ выражения НЗ.
4. Он отличает науку от не науки.


Лекция 3 - 3 марта


Источники З (повторение и расширение).

Новый тривиум

Раньше в основе образования стоял старый тривиум наук. Речь шла о знаковой системе (ЗС), лежащей в основе основ – описании знания. Такой системой был ЕЯ. Поэтому изучались грамматика (синтактика ЕЯ), риторика и философия (богословие) – семантика и прагматика ЕЯ.

Сейчас невозможно не признавать огромного количества и массового употребления других ЗС.
Поэтому в основе образования и описания знания должен лежать новый тривиум – семиотический – синтактика, семантика и прагматика любых ЗС.

Технология Абу- Грейб

Последовательность описания знаний

Описание и кодирование24 марта 2007 года

- понятия
- суждения (простейшего предиката)
- силлогизма (логического вывода )


Более сложные способы приобретения, описания и генерации новых знаний.

- Математическое рассуждение
- Физический эксперимент и его научное осмысление
- Когнитивные методологии Франца Цвики

Уточнение парадигмы – знание – это база знаний (КВ) и когнитивный процессор (КР)

Простейшие когнитивные структуры для описания знаний

- предикаты (логика со времен Аристотеля, язык Пролог, ЛИСП)
- фреймы (Марвин Минский – 60-е гг)
- семантические сети (Джон Сова – 90-е гг.)


Понятие предметной области (ПО - knowledge domain – domain)

Определение ПО
Примеры –

- ПО программы GEOBASE 24 марта 2007 года
- ПО простейших видов деятельности (заварка чая, колка дров)
- ПО более сложных видов деятельности - индустриального строительства

Какие материальные, ментальные, знаковые объекты входят в эту ПО, какие их свойства значимы для этого вида деятельности, какие связи?

Простейшие когнитивные процессы

- Понимание знака
- Процесс генерации (автогенерации) эл. единиц знания (силлогизмы)

Более сложные когнитивные методологии

Научное познание – его особенности

1. Мир существует независимо от нас.
2. Мир познаваем
3. Высший уровень познания – наука
4. Научное познание пользуется научным методом.

О научном методе см. выше.


...

План конспект лекций - ссылки смотрите на основном сайте - здесь только самое необходимое - Лекции 4 -

...


Лекция 4

10 марта 2007 года

Мы по-прежнему следуем Аристотелевой парадигме – понятие – суждение - силлогизм


Рассмотрим понятие ПО (Domain – D) – предметная область

ПО – это множество –
- объектов
- их свойств (релевантных)
- связей между ними

Мы видим, что ПО – это уже некоторая связка объектов или суждение, описывающих к-л вид деятельности
например – ПО (D) географии США (программа GEOBASE), строительство

Про объекты не надо забывать, что они могут быть материальными (для ПО строительства – кирпичи, краны), понятийными (ментальными) – понятия прочность, план и знаковыми – чертежи, ведомости и т.д.

Релевантность – это тоже просто – это то, что востребовано в данной ПО. Например – релевантные свойства кирпича – цвет, прочность, вес, форма и т.п. А запах – навряд ли релевантное свойство кирпича для строительства (если он у него есть)


Научная теория (НТ)

Теперь удобно определить научную теорию – немного идеализированное, но полезное определение – из статьи M Matterazzi (не того, что обидел Зидана J Why AI is not a science с сайта www.stanford.edu

НТ – это упорядоченная тройка множеств

НТ = {D,S,L}

Где D – это ПО
S – это знаковая система, именующая объекты из В
а L – это язык или логическое исчисление, оперирующие с этой знаковой системой (с объектами D) – то, что мы в КМ называем когнитивный процессор, который моделирует силлогизм.

Хорошим примером может послужить любая задача на мотоциклистов. Из условия задачи мы (ре)конструируем ПО (множество объектов D). Это непростой процесс и называется он ПОНИМАНИЕ. Например, простая фраза – молоток ударился об графин и он разбился – машине непонятна. Прежде всего потому, что ей неизвестно, что РЕЛЕВАНТНОЕ свойство объекта графин – хрупкость. Реконструировав все объекты, их свойства и связи (а объекты – не только мотоциклисты – но и скорости, расстояния, временные интервалы и их свойства в такой задаче чаще всего численные, а связи описываются арифметическими действиями), мы переходим к их обозначениям и составлению ЗС, описывающей эту ПО. Это кв. уравнение. Затем, делая знаковые (алгебраические) преобразования с этим уравнением мы узнаем новые свойства этой ПО – по сути генерируем ее ТЕОРИЮ.



Про науку в целом можно сказать, что она есть сумма (непротиворечивая) НТ.

Простейшие когнитивные структуры

Для того, чтобы сделать доступным для обработки КР объекты ПО, придумали КС (когнитивные структуры).

Их список открыт – но самые популярные из них -


1. Фреймы

Представление, типовое использование. Марвин Минский.

Ф – это таблица с именем и ее ячейки – слоты.

Свойства Ф хорошо себе представить, если кодировать в нем историю болезни. Тогда имя Ф – имя больного, в его слотах хранятся его вес, температура, состав крови и т.п.

Не надо забывать, Ф требует спец. программы обработки – КР.

2. Семантические сети (СС)

Представление, типовое использование. Джон Сова.

Сова начинает с такого примера

Cat on the mat
И представляет эту небольшую ПО (после понимания) как граф (СС)

(cat) ----[on]-----(mat)

D «промышленных» масштабах применяется типовой шаблон для кодирования знаний при помощи СС

Например -

Concept:
Similar things:
Things that are special case of this:
Parts of this:
Things that this is part of:
Things that generally associated with:
Things that it does:
Properties that it often has:


Concept: ability
Similar things: talent, skill
Things that are special case of this: genius
Parts of this:
Things that this is part of:
Things that generally associated with: learning, sport, intelligence, talent, skill, expertise.
Things that it does:
Things that are done to this: enhanced, improved, developed
Properties that it often has: natural, amazing, uncanny

Понятно, что эту КС можно поместить во фрейм.

Можно попробовать закодировать другой пример – компьютер.
Конечно, тоже не надо забывать, что СС требует спец. программы обработки – КР.



3. Предикаты, силлогизмы, логические исчисления
Изобретение логики. Индуктивная и дедуктивная логика.
Представление, типовое использование. Аристотель.


Предикаты и силлогизмы.

Самый впечатляющий пример, где это реализовано - язык Пролог

Силлогизмы Аристотеля

Силлогизм Barbara и другие. Реализация в них дедуктивной
логики вывода (от общего к частному).

Еще раз о понятии.

Вспомним, что все начинается с понятия. А понятие формируется индуктивным путем – от частного к общему. Так, увидев одного, двух и т.д. медведей человек приходит к индуктивному выводу, что есть понятие «медведь». Далее – он уже формирует о нем суждения, а затем уже логические выводы.

Изобретение логики (продолжение темы Предикаты и силлогизмы).



Локальные системы обработки знаний.

Мы их будем изучать на примере экспертных систем – ЭС.

ЭС – это программа, заменяющая пользователю эксперта (его знания) в определенной ПО. Значит, ЭС содержит некоторую сумму знаний о ПО. Но, для того, чтобы их обработать, нужен КР. Все это управляется оболочкой (shell), отвечающей также и за диалог с «юзером» и за другое, что будем изучать позже.

Пока же мы отметим относительность этого определения. Для многих юзеров век назад калькулятор был бы ЭС.
Поэтому различают ЭС 1-го и 2-го рода.

ЭС 1-го рода – это по сути эл. справочник. В диалоге с пользователем ЭС выясняет какая часть справочника ему нужна и выдает ему под видом знания.

Только ЭС 2-го рода могут порождать новые знания в ответ на запрос пользователя. Они устроены гораздо сложнее.
Это не умаляет пользы и значимости ЭС 1-го рода.

Лекция 5

17 марта 2007 года

Повторение с углублением и расширением. Новый тривиум – XML-структура.

Когнитивные структуры.

К изученным уже фреймам, СС и силлогизмам-предикатам нужно теперь добавить суперструктуру, изобретенную совсем недавно – XML-структуру. При ее помощи можно
Описать все три предыдущие. Ее семиотические свойства реализуются особенно наглядно. Действительно – имена тегов – это знаки. То, что внутри них – их денотаты, то есть семантика. А программы, работающие с такими структурами, реализуют прагматику.

В качестве упражнения можно перекодировать фрейм, СС, предикат в XML форме.

Например –
…..
(можно взять это в качестве упражнения)

Сама суть кодирования в XML нотации довольно проста (и в этом и состоит ее преимущество).
Более подробно применение этой нотации мы будем изучать позже.
Сейчас же можно сказать, что это гибкая и мощная знаковая система. Действительно, пара тегов суть знаки, а то, что содержится между ними – денотат. Причем знаковые структуры, задаваемые тегами, могут приобретать сложный характер.

Построение и функционирование ЭС

Первый шаг – определение и построение ПО, так как ЭС именно заменяет знания эксперта в определенной ПО.

Какие знания представляет пользователю ЭС – как научные (НЗ), так и обыденные (ОЗ). Действительно, про ЭС, диагностирующую неисправности автомобилей, трудно сказать, что она дает пользователю научные знания.

Типовая схема ЭС.

ЭС содержит следующие компоненты –

КВ – база знаний
И
КР – когнитивный процессор или машина вывода
Являются ее основными частями.

Этими двумя компонентами, являющимися ядром ЭС управляет управляющая программа, осуществляющая также связь этих двух главных компонент с другими блоками.
В числе этих (в общем-то вторичных) компонент следует назвать интерфейс с пользователем.

Есть еще другой интерфейс – у ЭС, отвечающий за наполнение ее базы знаний (КВ). С этим интерфейсом работают как минимум два человека – эксперт (носитель знаний, которые будет представлять для пользователя эта ЭС) и инженер знаний, который эти знания выявляет и кодирует.

Здесь мы впервые встречаемся с термином инженерия знаний, введенным Фейгенбаумом в 70-е годы ХХ века.
Способов выявления и кодирования З много и о них мы уже начали говорить и будем говорить ниже.

Можно заметить, что ЭС Мицар, которая есть лабораторная работа может рассматриваться как структурированное интервью эксперта при помощи самой ЭС.

Блок объяснений – очень важная и обязательная, но незаметная компонента ЭС.

Действительно, чем сложнее знания и ПО, тем ответственнее ответ ЭС. Не всегда он очевиден и сама ЭС может ошибаться или неправильно понять вопрос пользователя.

Поэтому пользователь через блок объяснений вправе затребовать протокол рассуждений ЭС. Который привел к данному решению.

ЭС Мицар – см. на сайте и в курсе лекций.

Функциональная классификация ЭС
см. в курсе лекций.


Лекция 6

24 марта 2007 года

Лекция 7

7 апреля 2007 года

Semantic Web

Лекция 8

14 апреля 2007 года

Бизнес моделирование






Литература

1. Илларионов С.В. Теория познания и философия науки. – М., 2005. (автор – физтех, проф. МФТИ – книга есть на стенде у окна в нашем киоске).
2. Беляев И.П., Капустян В.М. Процессы и концепты. – М., 2000. (авторы – физтехи)
3. Рыков В.В. Обработка нечисловой информации. Управление знанием. – М. МФТИ, 2005. (есть на сайте)
4.



...


OpenCYC - настоящая база знаний - на нее уже ушли миллиарды долларов

Полный текст краткого содержания прочитанных в 2005 году лекций - годится для 2006 года и далее

Здесь смотри - Часть 3 - Статьи "Парадигма трех миров ... "

Ссылки на другие вспомогательные материалы

E-mail: rykov2000@hotmail.com



Hosted by uCoz