В чём главное отличие баз данных и баз знаний? Данные, информация и знания.

Прежде чем продолжить рассмотрение проблематики управления знаниями важно определиться с ключевыми понятиями этой области: «данные», «информация», «знания».

В литературе, посвященной управлению знаниями, представлены различные подходы к их трактовке. Не претендуя на полномасштабный анализ, попробуем обозначить некоторые важные моменты.

Под данными понимаются неупорядоченные наблюдения, числа, слова, звуки, изображения. Это – набор дискретных, объективных факторов о событиях. При этом в организационном контексте данные трактуются как структурированные записи об актах деятельности. Организации обычно хранят данные в информационных системах, в которые они поступают из различных подразделений и служб.

Когда данные организованы, упорядочены, сгруппированы категоризированы, они становятся информацией . Она трактуется как совокупность данных, упорядоченная с определенной целью, придающей им смысл.

Сообщение - это текст, цифровые данные, изображения, звук, графика, таблицы и др

Сведения – практически синоним понятия “Сообщения”. Они чаще всего носят бытовой характер.

Знание же трактуется как информация, готовая к продуктивному применению, действенная, снабженная смыслом. Оно представляет собой совокупность оформленного опыта, ценностей, контекстуальной информации, экспертного понимания, составляющих основу для оценки и интеграции нового опыта и информации. Оно формируется и применяется в умах людей, а в организациях зачастую оказывается закрепленным не только в документах и в хранилищах, но также в организационных процедурах, процессах, способах выполнения работы и нормах.

В таблице на основе обзора литературных источников приводятся различные определения знания.

В большинстве рассмотренных определений подчеркивается, что знания – понятие более широкое, глубокое и богатое по сравнению с информацией. Они представляют собой подвижное соединение разных элементов – опыта, ценностей, информации и экспертного понимания - и постоянно меняются; они интуитивны; характерны для людей и являются неотъемлемой частью человеческой сущности с ее непредсказуемостью.


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области.

Введение в инженерию знаний

Введение в инженерию знаний

2. Знания как особая форма информации. Отличие знаний от данных.

5. Подразделение знаний. Декларативная и процедурная формы представления знаний

6. Свойства знаний

7. Интенсионал и экстенсионал понятия.

8. Парадигмы представления знаний. Классификация моделей представления знаний

Теоретическими и практическими вопросами представления и обработки знаний в компьютерных системах активно занимаются исследователи, работающие в области инженерии знаний. Это понятие в 1977 г. ввел Э. Фейгенбаум, который писал: «По опыту нам известно, что большая часть знаний в конкретной предметной области остается личной собственностью эксперта. И это происходит не потому, что он не хочет разглашать своих секретов, а потому, что он не в состоянии сделать этого - ведь эксперт знает гораздо больше, чем сам осознает». Инженерия знаний - направление ИИ, которое связано с развитием теоретических и прикладных аспектов приобретения и формализации знаний специалистов, с проектированием и разработкой баз знаний.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графикии т.д.);

представление на специальных языках описания данных предназначенных для ввода и обработки исходных данных в ЭВМ;

базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания могут быть получены на основе обработки эмпирических данных. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

3. Способы наделения знаниями программных систем

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем .

Первый - поместить знания в программу, написанную на обычном языке программирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то, что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом являются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.



Второй способ базируется на концепции баз данных и заключается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. База знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограничения на структуру БЗ и операции с нею. В современных ИИС принят этот способ.

Задача представления знаний в информационных системах

Для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки интеллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ.

Знания в ИИС существуют в следующих формах:

исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.);

описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть, иерархии фреймов и т. п.);

представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ;

базы знаний на машинных носителях информации.

4. Определение понятия знание

Из толкового словаря С. И. Ожегова: 1) «Знание - постижение действительности сознанием, наука»; 2) «Знание - это совокупность сведений, познаний в какой-либо области».

Из японского толкового словаря: «Знания - это результат, полученный познанием», или, более подробно, «система суждений с принципиальной и единой организацией, основанная на объективной закономерности».

Исследователями в области ИИ даются более конкретные определения знаний.

«Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области

«Знания - это хорошо структурированные данные или данные о данных, или метаданные»

«Знания - формализованная информация, на которую ссылаются или используют в процессе логического вывода»

Знание о предметной области - это описание объектов, их окружения, необходимых явлений, фактов, а также отношений между ними.

5. Подразделение знаний

Существует множество классификаций знаний. Вместе с тем, с помощью классификаций, как правило, систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются знания, а не о классификациях.

По своей природе знания можно делятся на декларативные и процедурные.

Декларативны е знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.

Процедурные знания - это описания действий, которые возможны при манипулировании фактами и явлениями для достижения намеченных целей.

По способу приобретения знания можно разделить на факты и эвристики (правила, которые позволяют сделать выбор при отсутствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной предметной области обстоятельства. Вторая категория знаний основана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила . Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции - это знания типа «ЕСЛИ А, ТО В».

Фактические и стратегические знания . Фактические знания - основные закономерности предметной области, позволяющие решать конкретные производственные, научные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики. Стратегические знания - стратегии принятия решений в предметной области;

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффективной организации процедур логического вывода. Классическими примерами метазнаний являются народные пословицы и поговорки, каждая из которых характеризует знания (рекомендации по деятельности) в широком классе конкретных ситуаций (например, пословица "Семь раз отмерь, один - отрежь" применима не только в среде хирургов или портных. «Не зная броду не суйся в воду»).

Глубинные и поверхностные знания . В глубинных знаниях отражается понимание структуры предметной области, назначение и взаимосвязь отдельных понятий (глубинные знания в фундаментальных науках - это законы и теоретические основания). Глубинные знания образуются как результат обобщения первичных понятий в некоторые абстрактные структуры, которые могут и не иметь вербального описания Глубинные знания обладают такими важными особенностями, как гибкость и аддитивность (лат. additio - прибавление; получаемый путем сложенияПоверхностные знания представляют собой совокупность эмпирических ассоциаций и отношений между понятиями предметной области для стандартных рассуждений и ситуаций

Жесткие и мягкие знания . Жесткие знания позволяют получать однозначные рекомендации при заданных начальных условиях. Мягкие знания допускают множественные, «размытые» решения и различные варианты рекомендаций.

В практике разработки СИИ обозначилась тенденция перехода от использования поверхностных знаний к глубинным и мягким. Использование глубинных и мягких знаний позволяет создать БЗ большой мощности.).

1. В чем отличие знаний от данных.

Информация (данные) явл-ся неотъемлемой частью материального мира, характериз-его его упорядоченность или структуру в мире, обусловлена их способностью распознавать стр-ру окружающего мира и использовать рез-т распознавания (знаний о мире). Знания – это информация, воспринятая из внешнего мира. Знание субъективно. Знание уникально, и обмен знаниями м/у индивидами не происходит без потерь, в отличие от данных, в кот. закодирована информация и кот. м. передаваться без потерь. Знание передается посредством к-л метода представления знаний, типичным естественным языком.

Отличаются:

Знания более структурированы;

В знаниях наибольшее зн-ие имеют не атомарные эл-ты знаний, а взаимосвязи м/у ними;

Знания более самоинтерпритируемые, чем данные, т.е. в знаниях содержится информация о том, как их использовать;

Знания активны, в отличие от пассивных данных, т.е. м. порождать действия системы, использующей их.

2. Каковы два основных направления исследований в ИИ

1. Нейронные сети.

Идея. «Единственный объект, способный мыслить – это человеческий мир»; 10 21 нейронов в мозгу, кот. связаны м/у собой. Розенблед, Мак-Каллок – 1936 – 1965 модель percepton

Модель перцетона:

каж. точка предыдущего слоя связана со всеми точками данного слоя

1 слой 2 слой

Распределенная ВС. Индексирование БД. Это синтаксические системы, основанные на формальном подходе. (Модель нервных цепей).

2. Семантические модели.

Идея. Противоположная нейронной идеологии: «не имеет зн-ия, как устроено вычислительное устройство, главное чтобы на заданные входные действия оно реагировало как чел. мозг » - концепция «черного ящика».

Тезис Тьюринга, кот. определил семантический подход (ф-ии мозга).

Языки: Lisp, Fortran.

3. Приведите примеры нечетких знаний.

а)

Молодой б) Пусть S – множество людей. Пусть «высокий» - нечетное подмножество S, кот. ответит на вопрос: «какой человек X явл-ся высоким?». Каж. человеку из области наследования нужно назначить степень принадлежности к нечетному подмножеству «высокий». Для этого используем ф-ию принадлежности, основанную на росте человека:

0, если рост(х)<5 футов;

Высокий(х)= (рост(х) – 5ft)/2ft, если 5 футов<= рост(х) <=7 футов;

1, если рост(х) > 7 футов.

Графически:

4. Приведите пример, характеризующий поверхностные и глубинные знания.

Поверхностные знания:

Я знаю, что на авиазаводе в цехе собирают самолеты;

Y = a 0 x 0 + a 1 (x 0 *2) + a 2 (x 0 *3) + . . .

Глубинные знания:

Я знаю как, с помощью чего собирается самолет;


5. В чем отличие процедурных знаний от декларированных? Приведите примеры.

Процедурные знания – хранят информацию о том, как надо действовать, чтобы получить нужный результат. Декларированные знания – хранят в себе информацию о том, над чем надо выполнить эти действия.

Чтобы собрать самолет необходимо скрепить его основные части (проц. знания), для его сбора необходимы крылья, носовая часть, хвостовая и т.п. и их нужно соединить (декларир. знания).

Различие между декларативным и процедурным предпочтением в том, что последнее определяет не только логические связи между головой предложения и целями в его теле, но еще и порядок в котором эти цели обрабатываются.

6. Охарактеризуйте морфологический, синтаксический, семантический и прагматический анализы в естественных языковых интерфейсах.

a) Морфологический анализ – анализ слова в предложении.

b) Семантический анализ – распознавание смысла в составных частях предложения на основе некоторой предметно - ориентированной БЗ.

c) Синтаксический анализ – анализ распознавания структуры предложения.

d) Прагматический анализ – анализ смысла предложения в реальном контексте на основе собственной БЗ.

7. В чем разница интенсионала и экстенсионала. Пример.

Интенсионал – способствует связи с выделением закономерностей.

Экстенсионал – способ перечисления фактографических сторон (описание на уровне данных)

Пр. : объект (философия): 1. Высокий уровень

2. Примитивный

8. Построить фрейм для следующего примера: “Пингвин и синица- птицы, однако пингвин не умеет летать, о умеет плавать и живет в Антарктиде”.