Базы знаний и словари — прокачиваем коммуникации своими силами
Рассказываем, как собрать весь накопленный опыт в одном месте и каким образом это помогает не только сотрудникам, но и бизнесу.
Когда в компанию приходит новый сотрудник, ему приходится усвоить большое количество информации и множество правил: tone of voice и принципы коммуникации, шаблоны документов, должностные обязанности, имена клиентов. Самостоятельно сориентироваться очень сложно и первое время новый работник будет часто обращаться к коллегам за разъяснениями, отвлекая их от текущих дел.
В некоторых компаниях даже существует практика наставничества, когда за новенькими закрепляют опытного сотрудника, чтобы тот делился своим опытом и помогал адаптироваться. Но что будет, если передать часть этих функций компьютеру и создать базу знаний со всеми необходимыми справочными материалами, примерами документов и информацией по текущей работе?
База знаний — это это виртуальная площадка, на которой хранятся подсказки, документы, регламенты, руководства и ответы на распространенные вопросы по работе компании. Каждый сотрудник имеет к ней доступ и может получить нужную ему информацию в любое время.
Базу знаний можно использовать как:
- инструмент для обмена знаниями внутри отдела;
- инструмент для поиска информации, относящейся к другим отделам компании;
- внешний портал вопросов и ответов для сотрудников или клиентов
А еще базы знаний помогают не только новичкам:
- Снижение зависимости от отдельных сотрудников: База знаний позволяет сохранить знания и опыт сотрудников компании, даже если они покидают организацию или переходят на другую должность. Это помогает снизить зависимость от отдельных сотрудников и обеспечить непрерывность работы компании.
- Улучшение принятия решений: База знаний может содержать информацию о прошлых проектах, исследованиях рынка, аналитических данных и других ресурсах, которые помогают принимать более обоснованные и информированные решения. Это помогает в стратегическом планировании и прогнозировании.
- Улучшение внутренней коммуникации и совместной работы: База знаний позволяет сотрудникам компании обмениваться информацией, идеями и опытом, что способствует более эффективной коммуникации и совместной работе. Это помогает избежать дублирования работы, ускоряет процессы принятия решений и повышает производительность.
Крупные компании, такие как Google и Amazon, используют свои внутренние наработки — Knowledge Graph и Amazon Web Services. А что делать малому и среднему бизнесу, который не может позволить себе такие огромные инструменты? Да и нужны ли они вообще? Наш опыт показывает, что рабочие базы знаний можно организовать достаточно бюджетными силами.
База знаний в Molinos существовала в трех итерациях. Изначально отдельные руководители разрозненно собирали свои материалы, чек-листы и информацию для обучения исключительно в рамках своих подразделений. Все это хранилось в папках на облачных дисках.
Такой подход оказался неэффективным. Обмениваться знаниями было неудобно, не хватало мотивации вносить информацию в папки. Это подтолкнуло нас к тому, чтобы обновить базу знаний и сделать ее более централизованной.
Мы выбрали Notion — сервис для создания заметок, списков дел, баз данных, таблиц, ведения проектов и совместной работы. На этой платформе мы начали собирать полезные ссылки и материалы. Мы разграничили права на внешние материалы и внутренние, придумали теги, собрали кейсы и обучения, но сформировать системный подход опять не удалось. Сотрудник, который отвечал за базу знаний, ушел из компании. В итоге дело забросили и к справочным материалам из базы стали обращаться все реже и реже.
Третьей попыткой, которую мы считаем удачной, стало решение вести базу знаний в Битрикс 24. Мы используем Битрикс каждый день в качестве основного инструмента работы с CRM и задачами. Доступ к этой платформе есть у всех сотрудников, там же лежат все официальные регламенты, шаблоны коммерческих предложений, юридические документы.
Амбассадорами третьей базы знаний стали коммерческий директор и коммерческий отдел. Они первыми завели в Битрикс базу знаний, продумали структуру и начали складывать туда обучающие видео и внутренние процессные регламенты. База разделена на два блока: коммерческий отдел и производство. Ее заполняют руководители тим-лиды.
Теперь и отделы интернет-маркетинга вносят свой вклад. Мы заносим:
- обучения,
- инструкции,
- регламенты,
- ценности,
- материалы для сертификаций.
База знаний очень помогает нам с онбордингом и обменом информацией между всеми отделами и сотрудниками.
Какой должна быть база знаний
На наш взгляд, база знаний должна быть, во-первых, структурированной и логичной. Таким образом, любой человек сможет на интуитивном уровне разобраться в ней и найти нужную информацию.
Во-вторых, база должна хранить в себе только актуальные рабочие материалы. Старые файлы нужно своевременно убирать, новые — загружать по мере появления. Помимо этого, важно держать команду в курсе обновлений базы через рабочие чаты, рассылки или новости компании.
В-третьих, у каждого должен быть легкий доступ к базе. Так сотрудники могут узнать ответы на свои вопросы, не вставая с рабочего места.и не запрашивая дополнительные логины и пароли.
А еще у нас есть быстрая и публичная база знаний без воды и с бесплатным доступом для всех — наш канал в Telegram. Внутри — тесты, обзоры, экспертиза от маркетологов и для маркетологов. Присоединяйтесь!
Что включать в базу знаний?
Ответ на этот вопрос — все, что может пригодиться для работы. Жестких стандартов нет, поэтому каждая компания формирует базу знаний исходя из своей деятельности. Но мы расскажем о самых распространенных категориях, которые обычно есть на таких платформах.
Информация о компании
В этом разделе можно рассказать о деятельности компании, из каких отделов она состоит, чем занимаются разные департаменты и подразделения. Здесь же можно разместить файлы с должностными инструкциями и другими документами, касающимися трудовых обязанностей.
В этом разделе хранятся контакты сотрудников, клиентов, контрагентов. Так на поиск номеров телефонов и адресов электронной почты тратится гораздо меньше времени.
Шаблоны документов
Практически в любой компании используются различные типовые документы. В базе знаний можно собрать бланки для писем, шаблоны договоров, отчеты, анкеты. Теперь можно просто скачать нужный образец и использовать для работы.
Если сотрудник забыл, как выполнять то или иное действие, в базе всегда можно найти подсказку.
Обучающие уроки
С помощью базы знаний можно приобретать новые знания и повышать квалификацию. Если компания записывает обучающие видео, создает аудиоуроки, делает вебинары, или же пишет полезные статьи, база знаний станет хорошим местом для их хранения и использования.
Вопросы и ответы
На сайтах многих компаний есть раздел FAQ. Там даются ответы на часто встречающиеся вопросы. Тем самым компания помогает клиентам разобраться в своих продуктах или услугах. Можно сделать то же самое для сотрудников, собрав самые популярные “Зачем?”, “Как?” и “Почему?”.
Словари. Плюсов здесь даже больше, чем у базы знаний, потому что словари проще сделать публичными — в них чаще включают общедоступную, но главное систематизированную информацию и термины. Также они помогают:
- Словари помогают стандартизировать термины и определения, используемые в документации компании, такой как политики, процедуры, инструкции и руководства.
- Использование словарей помогает бизнесу проявить профессионализм и авторитетность в своей отрасли. Когда компания использует точную и корректную терминологию, это создает впечатление, что она хорошо разбирается в своей области и уделяет внимание деталям.
- Если бизнес работает на международном уровне, словари могут быть полезными для перевода терминов на разные языки. Это помогает обеспечить единообразие и точность перевода, а также улучшает коммуникацию и понимание сотрудников и клиентов из разных стран.
- В словарях можно хранить ключевые термины и их связи, что позволяет эффективно искать и анализировать данные внутри компании. Словари могут использоваться для категоризации информации, создания онтологий и обеспечения структурированного доступа к данным.
Мы стали использовать словари в тот момент, когда начали активно развивать направление SMM. Выяснилось, что хотя данных в интернете много, все они структурированы по-разному. Что уж говорить о терминологии, которая постоянно пополняется и трактовка меняется от ниши к нише. Так мы собрали первый словарь терминов по SMM.
Позже мы поняли, что от этого словаря выиграли не только наши сотрудники, но и другие юзеры — словарь оказался настолько востребованным, что им до сих пор пользуются даже спустя 5 лет. Следом мы сделали словарь UX и UI терминов — результат тот же. Более того, и сами страницы, и их содержание прекрасно работают на поиске. Пользователи ищут как конкретные термины, так и полные базы, и сразу попадают к нам.
В этом году мы активно взялись за работу с рекламой на маркетплейсах. Один из первых больших материалов, который мы сразу включили в свою базу знаний, — большой словарь терминов по маркетплейсам. Сегодня мы делимся им с вами.
Вспомните с ходу, что такое DBS? А чем FBO отличается от FBS? Или что такое Rich Content? Все эти термины подарили нам маркетплейсы и разработчики их рекламных кабинетов. Чтобы работать быстрее, не путаться в настройках и кнопках, важно знать эту терминологию. Выучить все и сразу сложно, и учитывая предыдущий опыт, мы сразу поняли — всем нужен словарь. Внутри вас ждет более 120 терминов — от базовых до сложных и специализированных. Объяснили простым языком даже самые страшные аббревиатуры, описали как они рассчитываются и добавили удобную сортировку по буквам. Прыгайте по кнопке ниже!
Так, аккаунты не путаются на планерках, а стажеры сразу знают куда им идти, если не знают какую нажать кнопку. Короче, сплошные плюсы. Поэтому хорошие базы знаний — важная часть внутренних и внешних коммуникаций.
Делитесь опытом создания ваших баз знаний в комментариях. А если есть вопросы по нашим вариантам или словарям, пишите — мы обязательно ответим!
Лекционный материал
1.1 Основные понятия и определения теории баз данных и знаний
Основные вопросы: Понятие «информация» и «данные». Роль информации в современном мире. Семантика данных. Понятие база данных, базы знаний, банка данных. Понятие системы управления базами данных (СУБД): назначение, возможности.
Основные компоненты архитектуры СУБД и соотношение запросов пользователей с БД.
Понятие «информация» и «данные». Роль информации в современном мире.
Информацией называют любые сведения о каких-либо явлениях, событиях, процессах, являющиеся объектами восприятия, передачи, преобразования, хранения и использования. На основе информации углубляются познания законов развития материального мира, взаимосвязываются и координируются работы, контролируются процессы и принимаются решения.
Реальный мир воспринимается как последовательность разных, хотя иногда и взаимосвязанных, явлений. Люди всегда пытались описать эти часто непонятные для них явления. Такое описание называют данными, т. е. информация, фиксируемая в определенной форме и пригодная для последующей обработки, хранения и передачи, называется данными. Данные характеризуют некоторую предметную область и являются информационной моделью некоторой части реального мира.
Предметной областью называют определенную часть реального мира, представляющую интерес для конкретного исследования или планируемых действий и соответственно для использования и отображения в информационной системе (в банке данных или знаний).
Процесс восприятия состояния системы в виде данных, описывающих состояние системы, называется фиксацией данных.
Обычно для фиксации данных применяется конкретное средство общения (естественный язык, изображения) на конкретном носителе (на камне, доске, бумаге, а в современных условиях – на магнитном или оптическом носителе).
Естественный язык достаточно гибок для представления данных и их интерпретации (семантики), поэтому обычно и то, и другое фиксируется совместно. Примером может служить утверждение «Предельная прочность разрушаемых пород 100». Здесь «100» – данное, а «Предельная прочность разрушаемых пород» – его семантика.
Семантика, в широком смысле слова, – анализ отношения между языковыми выражениями и миром, реальным или воображаемым, а также само это отношение и совокупность таких отношений. Данное отношение состоит в том, что языковые выражения (слова, словосочетания, предложения, тексты) обозначают то, что есть в мире.
Основные понятия и определения теории база данных и знаний.
Банки данных и банки знаний являются наиболее совершенной и прогрессивной формой организации информации и знаний в персональных компьютерах. Главная их задача – ответы на информационные запросы пользователей к банку данных или банку знаний с целью получения искомой информации, т. е. обеспечение пользователей требуемой информацией.
Банк данных – это автоматизированная система, включающая базу данных, лингвистические, программные, технические, организационно-методические средства, обеспечивающие централизованное накопление и коллективное многоцелевое использование информации в различных областях деятельности пользователей. В банке данных содержатся совокупности фактов о качественных и количественных характеристиках конкретных объектов предметной области.
Банк данных – это одна из форм информационных систем.
Банк данных (БнД) — это автоматизированная система, представляющая совокупность информационных, программных, технических средств и персонала, обеспечивающих хранение, накопление, обновление, поиск и выдачу данных. Главными составляющими банка данных являются база данных и программный продукт, называемый системой управления базой данных (СУБД).
База данных (БД) – совокупность данных конкретной предметной области. Они организованы по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, и не зависят от программ обработки.
Термины «банк данных» и «база данных» являются очень близкими синонимами для обозначения некоторого структурированного массива информации. Предполагается, что банки данных содержат информацию, с которой можно производить достаточно ограниченное число манипуляций (поиск, просмотр), в то время как базы данных предоставляют возможность какой-то специальной обработки информации (с помощью специально написанных программ).
Банк данных является сложной человеко-машинной системой, включающей в свой состав различные взаимосвязанные и взаимозависимые компоненты. Ядром банка данных является база данных. Информационный компонент банка данных состоит из баз данных, схем баз данных и словарей данных. Словари данных имеют особо важное значение. Метаинформация включает в себя описание структуры БД (схемы и подсхемы), модель предметной области, информацию о пользователях и их правах, описание формы входных и выходных документов. Централизованное хранилище метаинформации называется словарем данных. Особенно большое значение имеют словари данных в системах автоматизированного проектирования ИС.
Банки данных классифицируют по следующим свойствам:
скорость доступа – определяет время реакции, т.е. получение ответа на запрос пользователя;
доступность – определяет, какие данные, содержащиеся в БД, доступны данной категории пользователей;
3) гибкость – определяет возможность получить ответ на сложные запросы;
4) целостность – отвечает за снижение избыточности данных, согласованность данных при упорядочении обновления.
База знаний — это совокупность моделей, правил и факторов (данных), порождающих анализ и выводы для нахождения решений сложных задач в некоторой предметной области.
База знаний состоит из локальных библиотек данных, содержащих определения всех объектов конкретной модели, а также общей библиотеки, в которой хранятся все «встроенные» в систему описания объектов.
База знаний, БЗ (англ. Knowledge base, KB) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний.
База знаний — это» совокупность моделей, правил и факторов (данных), порождающих анализ и выводы для нахождения решений сложных задач в некоторой предметной области.
База знаний — организованная совокупность знаний, относящихся к какой-нибудь предметной области. Знанием является проверенный практикой результат познания действительности. Иначе говоря, знание — это накопленные человечеством истины, факты, принципы и прочие объекты познания. Поэтому в отличие от базы данных, в базе знаний располагаются познаваемые сведения, содержащиеся в документах, книгах, статьях, отчетах.
Базы данных – множество взаимосвязанных единиц данных, которые могут обрабатываться одной или несколькими прикладными системами.
База данных – это совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации.
База данных – это объект управления в банке данных. База данных описывает состояние объектов предметной области на определенный момент времени совокупностью предложений на некотором формализованном языке. При этом определяются значения всех факторов на данный момент в виде совокупности взаимосвязанных хранящихся вместе данных.
Особенностью базы данных является то, что она рассчитана на использование при создании различных независимых программ и приложений. В этом основное отличие базы данных от обычных файлов данных – они используется только в конкретно разработанном для них приложении.
Система управления базами данных (СУБД) состоит из языковых и программных средств, предназначенных для создания, ведения и эксплуатации баз данных.
Система управления базами знаний – это объектная БД с возможностями интеллектуального поиска и автоматического переупорядочивания структуры в зависимости от действий пользователей.
СУБД – это программное обеспечение, которое взаимодействует с прикладными программами пользователя и базой данных и обладает перечисленными ниже возможностями:
позволяет создать базу данных, что обычно осуществляется с помощью языка определения данных (DDL – Data Definition Language). Язык DDL предоставляет пользователям средства указания типа данных и их структуры, а также средства задания ограничений для информации, хранимой в базе данных;
позволяет вставлять, обновлять, удалять и извлекать информацию из базы данных, что обычно осуществляется с помощью языка манипулирования данными (DML – Data Manipulation Language). Наличие централизованного хранилища всех данных и их описаний позволяет использовать язык DML как общий инструмент организации запросов, который иногда называют языком запросов (query language). Наличие языка запросов позволяет устранить присущие файловым системам ограничения, при которых пользователям приходится иметь дело только с фиксированным набором запросов или постоянно возрастающим количеством программ, что порождает другие, более сложные проблемы управления программным обеспечением.
Наиболее распространенным типом непроцедурного языка является язык структурированных запросов (Structured Query Language – SQL), который в настоящее время определяется специальным стандартом и фактически является обязательным языком для любых реляционных СУБД:
Предоставляет контролируемый доступ к базе данных с помощью перечисленных ниже средств:
системы обеспечения защиты, предотвращающей несанкционированный доступ к базе данных со стороны пользователей;
системы поддержки целостности данных, обеспечивающей непротиворечивое состояние хранимых данных;
системы управления параллельной работой приложений, контролирующей процессы их совместного доступа к базе данных;
системы восстановления, позволяющей восстановить базу данных до предыдущего непротиворечивого состояния, нарушенного в результате сбоя аппаратного или программного обеспечения;
доступного пользователям каталога, содержащего описание хранимой в базе данных информации.
Другими словами, система управления базами данных (СУБД) – это программная система для централизованного управления данными, хранимыми в базе данных, и их поддержания в состоянии, соответствующем предметной области.
При выполнении основных из этих функций СУБД должна использовать различные описания данных. Естественно, что проект базы данных надо начинать с анализа предметной области и выявления требований к ней отдельных пользователей (сотрудников организации, для которых создается база данных). Проектирование обычно поручается человеку (группе лиц) – администратору базы данных (АБД). Им может быть как специально выделенный сотрудник организации, так и будущий пользователь БД, достаточно хорошо знакомый с машинной обработкой данных.
Объединяя частные представления о содержимом БД, полученные в результате опроса пользователей, и свои представления о данных, которые могут потребоваться в будущих приложениях, АБД сначала создает обобщенное неформальное описание создаваемой базы данных. Это описание, выполненное с использованием естественного языка, математических формул, таблиц, графиков и других средств, понятных всем людям, работающих над проектированием базы данных, называют инфологической моделью данных (рис. 1.1).
Такая человеко-ориентированная модель полностью независима от физических параметров среды хранения данных. Поэтому инфологическая модель не должна изменяться до тех пор, пока какие-то изменения в реальном мире не потребуют изменения в ней некоторого определения, чтобы эта модель продолжала отражать предметную область. Остальные модели, показанные на рис. 1.1, являются компьютеро-ориентированными. С их помощью СУБД дает возможность программам и пользователям осуществлять доступ к хранимым данным лишь по их именам, не заботясь о физическом расположении этих данных. Нужные данные отыскиваются СУБД на внешних запоминающих устройствах по физической модели данных.
Так как указанный доступ осуществляется с помощью конкретной СУБД, то модели должны быть описаны на языке описания данных этой СУБД. Такое описание, создаваемое АБД по инфологической модели данных, называют даталогической или концептуальной моделью данных.
Трехуровневая архитектура (инфологический, даталогический и физический уровни) позволяет обеспечить независимость хранимых данных от использующих их программ. АБД может при необходимости переписать хранимые данные на другие носители информации и (или) реорганизовать их физическую структуру, изменив лишь физическую модель данных. АБД может подключить к системе любое число новых пользователей (новых приложений), дополнив, если надо, даталогическую модель. Указанные изменения физической и даталогической моделей не будут замечены существующими пользователями системы (окажутся «прозрачными» для них), так же как не будут замечены и новые пользователи. Следовательно, независимость данных обеспечивает возможность развития системы баз данных без разрушения существующих приложений [Т.Ф. Лебедева, БАЗЫ ДАННЫХ, Учебное пособие, Кемерово, 2006, с. 99, с. 11-12].
С функцией обработки данных тесно связано управление транзакциями. Транзакция – это последовательность операций над БД, рассматриваемых СУБД как единое целое. В процессе функционирования СУБД транзакция либо успешно выполняется и СУБД фиксирует (commit) изменения БД, произведенные ей во внешней памяти, либо ни одно из этих изменений никак не отражается на состоянии БД.
При помощи транзакций поддерживается логическая целостность базы данных за счет объединения элементарных операций над разными файлами в одну транзакцию.
В чем различие между базой и банком данных кратко
Аннотация: В лекции рассматривается общий смысл понятий базы данных (БД) и системы управления базами данных (СУБД). Даются основные понятия, относящиеся к базе данных такие, как алгоритм, кортеж, объект, сущность. Основные требования, предъявляемые к банку данных. Определения БД и СУБД.
Цель лекции: Уяснить разницу между базой данных и системой управления базой данных. Ознакомиться с основными требованиями, которые предъявляются к банку данных и основными определениями, относящимися к БД и СУБД.
Рассмотрим общий смысл понятий базы данных (БД) и системы управления базами данных (СУБД).
С самого начала развития вычислительной техники образовались два основных направления использования ее.
Первое направление — применение вычислительной техники для выполнения численных расчетов, которые слишком долго или вообще невозможно производить вручную. Становление этого направления способствовало интенсификации методов численного решения сложных математических задач, развитию класса языков программирования, ориентированных на удобную запись численных алгоритмов, становлению обратной связи с разработчиками новых архитектур ЭВМ.
Второе направление, это использование средств вычислительной техники в автоматических или автоматизированных информационных системах . В самом широком смысле информационная система представляет собой программный комплекс, функции которого состоят в поддержке надежного хранения информации в памяти компьютера, выполнении специфических для данного приложения преобразований информации и/или вычислений, предоставлении пользователям удобного и легко осваиваемого интерфейса. Обычно объемы информации, с которыми приходится иметь дело таким системам, достаточно велики, а сама информация имеет достаточно сложную структуру. Классическими примерами информационных систем являются банковские системы , системы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т.д.
На самом деле, второе направление возникло несколько позже первого. Это связано с тем, что на заре вычислительной техники компьютеры обладали ограниченными возможностями в части памяти. Понятно, что можно говорить о надежном и долговременном хранении информации только при наличии запоминающих устройств, сохраняющих информацию после выключения электрического питания. Оперативная память этим свойством обычно не обладает. В начале, использовались два вида устройств внешней памяти: магнитные ленты и барабаны. При этом емкость магнитных лент была достаточно велика, но по своей физической природе они обеспечивали последовательный доступ к данным. Магнитные же барабаны (они больше всего похожи на современные магнитные диски с фиксированными головками) давали возможность произвольного доступа к данным, но были ограниченного размера.
Легко видеть, что указанные ограничения не очень существенны для чисто численных расчетов. Даже если программа должна обработать (или произвести) большой объем информации, при программировании можно продумать расположение этой информации во внешней памяти, чтобы программа работала как можно быстрее.
С другой стороны, для информационных систем, в которых потребность в текущих данных определяется пользователем, наличие только магнитных лент и барабанов неудовлетворительно. Представьте себе покупателя билета, который стоя у кассы должен дождаться полной перемотки магнитной ленты. Одним из естественных требований к таким системам является средняя быстрота выполнения операций.
Именно требования к вычислительной технике со стороны не численных приложений вызвали появление съемных магнитных дисков с подвижными головками , что явилось революцией в истории вычислительной техники. Эти устройства внешней памяти обладали существенно большей емкостью, чем магнитные барабаны, обеспечивали удовлетворительную скорость доступа к данным в режиме произвольной выборки, а возможность смены дискового пакета на устройстве позволяла иметь практически неограниченный архив данных.
С появлением магнитных дисков началась история систем управления данными во внешней памяти. До этого каждая прикладная программа, которой требовалось хранить данные во внешней памяти, сама определяла расположение каждой порции данных на магнитной ленте или барабане и выполняла обмены между оперативной и внешней памятью с помощью программно-аппаратных средств низкого уровня (машинных команд или вызовов соответствующих программ операционной системы). Такой режим работы не позволяет или очень затрудняет поддержание на одном внешнем носителе нескольких архивов долговременно хранимой информации. Кроме того, каждой прикладной программе приходилось решать проблемы именования частей данных и структуризации данных во внешней памяти.
Историческим шагом стал переход к использованию систем управления файлами. С точки зрения прикладной программы файл — это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные. Правила именования файлов, способ доступа к данным, хранящимся в файле, и структура этих данных зависят от конкретной системы управления файлами и, возможно, от типа файла. Система управления файлами берет на себя распределение внешней памяти, отображение имен файлов в соответствующие адреса внешней памяти и обеспечение доступа к данным.
Любая задача обработки информации и принятия решений может быть представлена в виде схемы, показанной на рис. 1.1.
Рис. 1.1. Схема решения задач обработки информации и принятия решений: x-штрих, y-штрих — входная и выходная информация; f — внутреннее операторное описание
Определение основных терминов
Дадим определения основных терминов. В качестве составных частей схемы выделяются информация (входная и выходная) и правила ее преобразования.
Правила могут быть в виде алгоритмов, процедур и эвристических последовательностей.
Последовательность операций обработки данных называют информационной технологией (ИТ). В силу значительного количества информации в современных задачах она должна быть упорядочена. Существует два подхода к упорядочению.
- Данные связаны с конкретной задачей (технология массивов) — упорядочение по использованию. Вместе с тем алгоритмы более подвижны (могут чаще меняться), чем данные. Это вызывает необходимость переупорядочения данных, которые к тому же могут повторяться в различных задачах.
- В связи с этим предложена другая, широко используемая технология баз данных, представляющая собой упорядочение по хранению.
Под базой данных (БД) понимают совокупность хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений. Целью создания баз данных , как разновидности информационной технологии и формы хранения данных, является построение системы данных, не зависящих от принятых алгоритмов (программного обеспечения), применяемых технических средств и физического расположения данных в ЭВМ; обеспечивающих непротиворечивую и целостную информацию при нерегламентируемых запросах. БД предполагает многоцелевое ее использование (несколько пользователей, множество форм документов и запросов одного пользователя).
База знаний (БЗ) представляет собой совокупность БД и используемых правил, полученных от лиц, принимающих решения ( ЛПР ).
Наряду с понятием «база данных» существует термин » банк данных «, который имеет две трактовки.
- В настоящее время данные обрабатываются децентрализовано (на рабочих местах) с помощью персональных компьютеров (ПК). Первоначально же использовалась централизованная обработка на больших ЭВМ. В силу централизации базу данных называли банком данных и потому часто не делают различия между базами и банками данных.
- Банк данных — база данных и система управления ею (СУБД). СУБД (например, FoxPro) представляет собой приложение для создания баз данных как совокупности двумерных таблиц.
Иногда в составе банка данных выделяют архивы. Основанием для этого является особый режим использования данных, когда только часть данных находится под оперативным управлением СУБД. Все остальные данные обычно располагаются на носителях, оперативно не управляемых СУБД. Одни и те же данные в разные моменты времени могут входить как в базы данных, так и в архивы. Банки данных могут не иметь архивов, но если они есть, то в состав банка данных может входить и система управления архивами.
Эффективное управление внешней памятью являются основной функцией СУБД . Эти обычно специализированные средства настолько важны с точки зрения эффективности, что при их отсутствии система просто не сможет выполнять некоторые задачи уже по тому, что их выполнение будет занимать слишком много времени. При этом ни одна из таких специализированных функций не является видимой для пользователя. Они обеспечивают независимость между логическим и физическим уровнями системы: прикладной программист не должен писать программы индексирования, распределять память на диске и т. д.
Основные требования, предъявляемые к банкам данных
Развитие теории и практики создания информационных систем, основанных на концепции баз данных, создание унифицированных методов и средств организации и поиска данных позволяют хранить и обрабатывать информацию о все более сложных объектах и их взаимосвязях, обеспечивая многоаспектные информационные потребности разных пользователей. Основные требования, предъявляемые к банкам данных, можно сформулировать так:
- Многократное использование данных: пользователи должны иметь возможность использовать данные различным образом.
- Простота: пользователи должны иметь возможность легко узнать и понять, какие данные имеются в их распоряжении.
- Легкость использования: пользователи должны иметь возможность осуществлять (процедурно) простой доступ к данным, при этом все сложности доступа к данным должны быть скрыты в самой системе управления базами данных.
- Гибкость использования: обращение к данным или их поиск должны осуществляться с помощью различных методов доступа.
- Быстрая обработка запросов на данные: запросы на данные должны обрабатываться с помощью высокоуровневого языка запросов , а не только прикладными программами, написанными с целью обработки конкретных запросов.
- Язык взаимодействия конечных пользователей с системой должен обеспечивать конечным пользователям возможность получения данных без использования прикладных программ.
База данных — это основа для будущего наращивания прикладных программ: базы данных должны обеспечивать возможность быстрой и дешевой разработки новых приложений.
- Сохранение затрат умственного труда: существующие программы и логические структуры данных не должны переделываться при внесении изменений в базу данных.
- Наличие интерфейса прикладного программирования: прикладные программы должны иметь возможность просто и эффективно выполнять запросы на данные; программы должны быть изолированными от расположения файлов и способов адресации данных.
- Распределенная обработка данных: система должна функционировать в условиях вычислительных сетей и обеспечивать эффективный доступ пользователей к любым данным распределенной БД, размещенным в любой точке сети.
- Адаптивность и расширяемость: база данных должна быть настраиваемой, причем настройка не должна вызывать перезаписи прикладных программ. Кроме того, поставляемый с СУБД набор предопределенных типов данных должен быть расширяемым — в системе должны иметься средства для определения новых типов и не должно быть различий в использовании системных и определенных пользователем типов.
- Контроль целостности данных: система должна осуществлять контроль ошибок в данных и выполнять проверку взаимного логического соответствия данных.
- Восстановление данных после сбоев: автоматическое восстановление без потери данных транзакции. В случае аппаратных или программных сбоев система должна возвращаться к некоторому согласованному состоянию данных.
- Вспомогательные средства должны позволять разработчику или администратору базы данных предсказать и оптимизировать производительность системы.
- Автоматическая реорганизация и перемещение: система должна обеспечивать возможность перемещения данных или автоматическую реорганизацию физической структуры .
Компоненты банка данных
Определение банка данных предполагает, что с функционально-организационной точки зрения банк данных является сложной человеко-машинной системой, включающей в себя все подсистемы, необходимые для надежного, эффективного и продолжительного во времени функционирования.
В структуре банка данных выделяют следующие компоненты:
- Информационная база;
- Лингвистические средства;
- Программные средства;
- Технические средства;
- Организационно-административные подсистемы и нормативно-методическое обеспечение.
Организационно-методические средства — это совокупность инструкций, методических и регламентирующих материалов, описаний структуры и процедуры работы пользователя с СУБД и БД.
Пользователи БД и СУБД
Пользователей (СУБД) можно разделить на две основные категории: конечные пользователи; администраторы баз данных.
Особо следует поговорить об администраторе базы данных (АБД). Естественно, что база данных строится для конечного пользователя (КП). Однако первоначально предполагалось, что КП не смогут работать без специалиста-программиста, которого назвали администратором базы данных. С появлением СУБД они взяли на себя значительную часть функций АБД, особенно для БД с небольшим объемом данных. Однако для крупных централизованных и распределенных баз данных потребность в АБД сохранилась. В широком плане под АБД понимают системных аналитиков, проектировщиков структур данных и информационного обеспечения, проектировщиков технологии процессов обработки, системных и прикладных программистов, операторов, специалистов в предметной области и по техническому обслуживанию. Иными словами, в крупных базах данных это могут быть коллективы специалистов. В обязанности АБД входит:
- анализ предметной области, статуса информации и пользователей;
- проектирование структуры и модификация данных;
- задание и обеспечение целостности;
- загрузка и ведение БД;
- защита данных;
- обеспечение восстановления БД;
- сбор и статистическая обработка обращений к БД, анализ эффективности функционирования БД;
- работа с пользователем.
Краткие итоги
Базы данных (БД) — это именованная совокупность данных, отображающая состояние объектов и их отношения в рассматриваемой предметной области.
Система управления базами данных (СУБД) — это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
Основные требования, предъявляемые к банкам данных: многократное использование данных, простота, легкость использования, гибкость использования, быстрая обработка запросов на данные, язык взаимодействия.
Пользователей (СУБД) можно разделить на две основные категории: конечные пользователи; администраторы баз данных.
Банк данных — база данных и система управления ею (СУБД) . СУБД (например, FoxPro) представляет собой приложение для создания баз данных как совокупности двумерных таблиц.
База данных — (БД) понимают совокупность хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений. Целью создания баз данных, как разновидности информационной технологии и формы хранения данных, является построение системы данных, не зависящих от принятых алгоритмов (программного обеспечения) , применяемых технических средств и физического расположения данных в ЭВМ; обеспечивающих непротиворечивую и целостную информацию при нерегламентируемых запросах. БД предполагает многоцелевое ее использование (несколько пользователей, множество форм документов и запросов одного пользователя).
Развитие вычислительной техники и появление емких внешних запоминающих устройств прямого доступа предопределило интенсивное развитие автоматических и автоматизированных систем разного назначения и масштаба, в первую очередь заметное в области бизнес-приложений Такие системы работают с большими объемами информации, которая обычно имеет достаточно сложную структуру, требует оперативности в обработке, часто обновляется и в то же время требует длительного хранения. Примерами таких систем являются автоматизированные системы управления предприятием, банковские системы, системы резервирования и продажи билетов и т д (рис. 1). Другими направлениями, стимулировавшими развитие, стали, с одной стороны, системы управления физическими экспериментами, обеспечивающими сверхоперативную обработку в реальном масштабе времени огромных потоков данных от датчиков, а с другой — автоматизированные библиотечные информационно-поисковые системы.
Банк данных (БнД) — это система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных.
Под базой данных (БД) обычно понимается именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области. Характерной чертой баз данных является постоянство: данные постоянно накапливаются и используются; состав и структура данных, необходимых для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных
могут меняться — но и это есть проявление постоянства — постоянная актуальность.
Система управления базами данных (СУБД) — это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
Иногда в составе банка данных выделяют архивы. Основанием для этого является особый режим использования данных, когда только часть данных находится под оперативным правлением СУБД. Все остальные данные (собственно архивы) обычно располагаются на носителях, оперативно не управляемых СУБД. Одни и те же данные в разные моменты времени могут входить как в базы данных, так и в архивы Банки данных могут не иметь архивов, но если они есть, то в состав банка данных может входить и система управления архивами.
Проблемы совместного использования данных и периферийных устройств компьютеров и рабочих станций быстро породили модель вычислений, основанную на концепции файлового сервера — сеть создает основу для коллективной обработки, сохраняя простоту работы с персональным компьютером, позволяет совместно использовать данные и периферию.
В этом смысле главной отличительной чертой баз данных является использование централизованной системы управления данными, причем как на уровне файлов, так и на уровне элементов данных. Централизованное хранение совместно используемых данных приводит не только к сокращению затрат на создание и поддержание данных в актуальном состоянии, но и к сокращению избыточности информации, упрощению процедур поддержания непротиворечивости и целостности данных
Эффективное управление внешней памятью является основной функцией СУБД. Эти обычно специализированные средства настолько важны с точки зрения эффективности, что при их отсутствии система просто не сможет выполнять некоторые задачи уже потому, что их выполнение будет занимать слишком много времени. При этом ни одна из таких специализированных функций, как построение индексов, буферизация данных, организация доступа и оптимизация запросов, не является видимой для пользователя и обеспечивает независимость между логическим и физическим уровнями системы прикладной программист не должен писать программы индексирования, распределять память на диске и т. д.
Развитие теории и практики создания информационных систем, основанных на концепции баз данных, создание унифицированных методов и средств организации и поиска данных позволяют хранить и обрабатывать информацию о все более сложных объектах и их взаимосвязях, обеспечивая многоаспектные информационные потребности различных пользователей.
Основные требования, предъявляемые к банкам данных, можно сформулировать следующим образом:
— Многократное использование данных: пользователи должны иметь возможность использовать данные различным образом
— Простота: пользователи должны иметь возможность легко узнать и понять, какие данные имеются в их распоряжении
— Легкость использования: пользователи должны иметь возможность осуществлять (процедурно) простой доступ к данным, при этом все сложности доступа к данным должны быть скрыты в самой системе управления базами данных
— Гибкость использования: обращение к данным или их поиск должны осуществляться с помощью различных методов доступа.
— Язык взаимодействия конечных пользователей с системой должен обеспечивать конечным пользователям возможность получения данных без использования прикладных программ.
— База данных — это основа для будущего наращивания прикладных программ: базы данных должны обеспечивать возможность быстрой и дешевой разработки новых приложений.
— Сохранение затрат умственного труда: существующие программы и логические структуры данных (на создание которых обычно затрачивается много человеко-лет) не должны переделываться при внесении изменений в базу данных.
— Наличие интерфейса прикладного программирования: прикладные программы должны иметь возможность просто и эффективно выполнять запросы на данные; программы должны быть изолированы от расположения файлов и способов адресации данных.
— Распределенная обработка данных: система должна функционировать в условиях вычислительных сетей и обеспечивать эффективный доступ пользователей к любым данным распределенной БД, размещенным в любой точке сети.
— Адаптивность и расширяемость: база данных должна быть настраиваемой, причем настройка не должна вызывать перезаписи прикладных программ. Кроме того, поставляемый с СУБД набор предопределенных типов данных должен быть расширяемым — в системе должны иметься средства для определения новых типов и не должно быть различий в использовании системных и определенных пользователем типов.
— Контроль за целостностью данных: система должна осуществлять контроль ошибок в данных и выполнять проверку взаимного логического соответствия данных.
— Восстановление данных после сбоев: автоматическое восстановление без потери данных транзакции. В случае аппаратных или программных сбоев система должна возвращаться к некоторому согласованному состоянию данных.
— Вспомогательные средства должны позволять разработчику или администратору базы
данных предсказать и оптимизировать производительность системы.
— Автоматическая реорганизация и перемещение: система должна обеспечивать возможность перемещения данных или автоматическую реорганизацию физической структуры.
Развитие вычислительной техники и появление емких внешних запоминающих устройств прямого доступа предопределило интенсивное развитие автоматических и автоматизированных систем разного назначения и масштаба, в первую очередь заметное в области бизнес-приложений Такие системы работают с большими объемами информации, которая обычно имеет достаточно сложную структуру, требует оперативности в обработке, часто обновляется и в то же время требует длительного хранения. Примерами таких систем являются автоматизированные системы управления предприятием, банковские системы, системы резервирования и продажи билетов и т д (рис. 1). Другими направлениями, стимулировавшими развитие, стали, с одной стороны, системы управления физическими экспериментами, обеспечивающими сверхоперативную обработку в реальном масштабе времени огромных потоков данных от датчиков, а с другой — автоматизированные библиотечные информационно-поисковые системы.
Банк данных (БнД) — это система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных.
Под базой данных (БД) обычно понимается именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области. Характерной чертой баз данных является постоянство: данные постоянно накапливаются и используются; состав и структура данных, необходимых для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных
могут меняться — но и это есть проявление постоянства — постоянная актуальность.
Система управления базами данных (СУБД) — это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
Иногда в составе банка данных выделяют архивы. Основанием для этого является особый режим использования данных, когда только часть данных находится под оперативным правлением СУБД. Все остальные данные (собственно архивы) обычно располагаются на носителях, оперативно не управляемых СУБД. Одни и те же данные в разные моменты времени могут входить как в базы данных, так и в архивы Банки данных могут не иметь архивов, но если они есть, то в состав банка данных может входить и система управления архивами.
Проблемы совместного использования данных и периферийных устройств компьютеров и рабочих станций быстро породили модель вычислений, основанную на концепции файлового сервера — сеть создает основу для коллективной обработки, сохраняя простоту работы с персональным компьютером, позволяет совместно использовать данные и периферию.
В этом смысле главной отличительной чертой баз данных является использование централизованной системы управления данными, причем как на уровне файлов, так и на уровне элементов данных. Централизованное хранение совместно используемых данных приводит не только к сокращению затрат на создание и поддержание данных в актуальном состоянии, но и к сокращению избыточности информации, упрощению процедур поддержания непротиворечивости и целостности данных
Эффективное управление внешней памятью является основной функцией СУБД. Эти обычно специализированные средства настолько важны с точки зрения эффективности, что при их отсутствии система просто не сможет выполнять некоторые задачи уже потому, что их выполнение будет занимать слишком много времени. При этом ни одна из таких специализированных функций, как построение индексов, буферизация данных, организация доступа и оптимизация запросов, не является видимой для пользователя и обеспечивает независимость между логическим и физическим уровнями системы прикладной программист не должен писать программы индексирования, распределять память на диске и т. д.
Развитие теории и практики создания информационных систем, основанных на концепции баз данных, создание унифицированных методов и средств организации и поиска данных позволяют хранить и обрабатывать информацию о все более сложных объектах и их взаимосвязях, обеспечивая многоаспектные информационные потребности различных пользователей.
Основные требования, предъявляемые к банкам данных, можно сформулировать следующим образом:
— Многократное использование данных: пользователи должны иметь возможность использовать данные различным образом
— Простота: пользователи должны иметь возможность легко узнать и понять, какие данные имеются в их распоряжении
— Легкость использования: пользователи должны иметь возможность осуществлять (процедурно) простой доступ к данным, при этом все сложности доступа к данным должны быть скрыты в самой системе управления базами данных
— Гибкость использования: обращение к данным или их поиск должны осуществляться с помощью различных методов доступа.
— Язык взаимодействия конечных пользователей с системой должен обеспечивать конечным пользователям возможность получения данных без использования прикладных программ.
— База данных — это основа для будущего наращивания прикладных программ: базы данных должны обеспечивать возможность быстрой и дешевой разработки новых приложений.
— Сохранение затрат умственного труда: существующие программы и логические структуры данных (на создание которых обычно затрачивается много человеко-лет) не должны переделываться при внесении изменений в базу данных.
— Наличие интерфейса прикладного программирования: прикладные программы должны иметь возможность просто и эффективно выполнять запросы на данные; программы должны быть изолированы от расположения файлов и способов адресации данных.
— Распределенная обработка данных: система должна функционировать в условиях вычислительных сетей и обеспечивать эффективный доступ пользователей к любым данным распределенной БД, размещенным в любой точке сети.
— Адаптивность и расширяемость: база данных должна быть настраиваемой, причем настройка не должна вызывать перезаписи прикладных программ. Кроме того, поставляемый с СУБД набор предопределенных типов данных должен быть расширяемым — в системе должны иметься средства для определения новых типов и не должно быть различий в использовании системных и определенных пользователем типов.
— Контроль за целостностью данных: система должна осуществлять контроль ошибок в данных и выполнять проверку взаимного логического соответствия данных.
— Восстановление данных после сбоев: автоматическое восстановление без потери данных транзакции. В случае аппаратных или программных сбоев система должна возвращаться к некоторому согласованному состоянию данных.
— Вспомогательные средства должны позволять разработчику или администратору базы
данных предсказать и оптимизировать производительность системы.
— Автоматическая реорганизация и перемещение: система должна обеспечивать возможность перемещения данных или автоматическую реорганизацию физической структуры.
5.1. Базы и банки данных
Термины «банк данных» и «база данных» являются очень близкими синонимами для обозначения некоторого структурированного массива информации. Предполагается, что банки данных содержат информацию, с которой можно производить достаточно ограниченное число манипуляций (поиск, просмотр), в то время как базы данных предоставляют возможность какой-то специальной обработки информации (с помощью специально написанных программ). Тем не менее, для простого пользователя не всегда очевидна закономерность выбора между этими двумя близкими терминами в том или ином случае. Поэтому банки и базы данных можно представлять как суть одно и тоже, с исторически сложившимся отнесением конкретных массивов информации либо к базам, либо к банкам данных.
Любая задача обработки информации и принятия решений может быть представлена в виде схемы, показанной на рис.5.1.
Рис. 5.1. Схема решения задач обработки информации и принятия решений:
х’ и y’ – входная и выходная информация;
f – внутреннее операторное описание.
Для нее дадим определения основных терминов. В качестве составных частей схемы выделяются информация (входная и выходная) и правила ее преобразования.
Правила могут быть в виде алгоритмов, процедур и эвристических последовательностей.
Алгоритм — последовательность правил перехода от исходных данных к результату. Правила могут выполняться компьютером или человеком.
Данные — совокупность объективных сведений.
Информация — сведения, неизвестные ранее получателю информации, пополняющие его знания, подтверждающие или опровергающие положения и соответствующие убеждения. Информация носит субъективный характер и определяется уровнем знаний субъекта и степенью его восприятия. Информация извлекается субъектом из соответствующих данных.
Знания — совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача. Последовательность операций обработки данных называют информационной технологией (ИТ). В силу значительного количества информации в современных задачах она должна быть упорядочена. Существует два подхода к упорядочению.
- Данные связаны с конкретной задачей ( технология массивов ) — упорядочение по использованию. Вместе с тем алгоритмы более подвижны (могут чаще меняться), чем данные. Это вызывает необходимость переупорядочения данных, которые к тому же могут повторяться в различных задачах.
- В связи с этим предложена другая, широко используемая технология баз данных , представляющая собой упорядочение по хранению.
Под базой данных (БД) понимают совокупность хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений. Целью создания баз данных , как разновидности информационной технологии и формы хранения данных, является построение системы данных, не зависящих от принятых алгоритмов (программного обеспечения), применяемых технических средств и физического расположения данных в ЭВМ; обеспечивающих непротиворечивую и целостную информацию при нерегламентируемых запросах. БД предполагает многоцелевое ее использование (несколько пользователей, множество форм документов и запросов одного пользователя).
База знаний (БЗ) представляет собой совокупность БД и используемых правил, полученных от лиц, принимающих решения (ЛПР).
- В настоящее время данные обрабатываются децентрализованно (на рабочих местах) с помощью персональных компьютеров (ПК). Первоначально же использовалась централизованная обработка на больших ЭВМ. В силу централизации базу данных называли банком данных и потому часто не делают различия между базами и банками данных. Банк данных – база данных и система управления ею (СУБД). СУБД (например, FoxPro) представляет собой приложение для создания баз данных как совокупности двумерных таблиц.
В силу многогранности баз данных и СУБД (комплекса технических и программных средств для хранения, поиска, защиты и использования данных) имеется множество классификационных признаков. Классификация БД по основным из них приведена на рис.5.2.
Рис. 5.2. Классификация БД.
Отдельно следует классифицировать системы управления базами данных (рис.5.3).
Базы данных могут классифицироваться и с точки зрения экономической: по условиям предоставления услуг – бесплатные и платные (бесприбыльные, коммерческие); по форме собственности – государственные, негосударственные; по степени доступности – общедоступные, с ограниченным кругом пользователей.
Рис. 5.3. Классификация СУБД.
Рис. 5.4. Структура СУБД.
Программные средства включают систему управления, обеспечивающую ввод-вывод, обработку и хранение информации, создание, модификацию и тестирование БД, трансляторы.
Базовыми внутренними языками программирования являются языки четвертого поколения. В качестве базовых языков могут использоваться C, C++, Pascal, Object Pascal. Язык C++ позволяет строить программы на языке Visual Basic с широким спектром возможностей, более близком и понятном даже пользователю-непрофессионалу, и на непроцедурном (декларативном) языке структурированных запросов SQL. Следует отметить, что исторически для системы управления базой данных сложились три языка:
2) язык манипулирования данными (ЯМД) — для заполнения БД данными и операций обновления (запись, удаление, модификация);
3) язык запросов — язык поиска наборов величин в файле в соответствии с заданной совокупностью критериев поиска и выдачи затребованных данных без изменения содержимого файлов и БД (язык преобразования критериев в систему команд).
В настоящее время функции всех трех языков выполняет язык SQL, относящийся к классу языков, базирующихся на исчислении кортежей (кортеж чаще всего является единицей информации), языки СУБД FoxPro, Visual Basic for Application (СУБД Access) и т.д.
Для работы с созданной БД пользователю или администратору БД следует иметь перечень файлов-таблиц с описанием состава их данных (структуры, схемы). Для этого создается специальный файл, называемый словарем данных (депозитарием, словарем-справочником, энциклопедией). Описание БД относится к метаинформации.
В качестве технических средств могут выступать супер- или персональные компьютеры с соответствующими периферийными устройствами.
Организационно-методические средства — это совокупность инструкций, методических и регламентирующих материалов, описаний структуры и процедуры работы пользователя с СУБД и БД.
Пользователей возможно разделить на две основные категории: конечные пользователи; администраторы баз данных.
Особо следует поговорить об администраторе базы данных (АБД). Естественно, что база данных строится для конечного пользователя (КП). Однако первоначально предполагалось, что КП не смогут работать без специалиста-программиста, которого назвали администратором базы данных. С появлением СУБД они взяли на себя значительную часть функций АБД, особенно для БД с небольшим объемом данных. Однако для крупных централизованных и распределенных баз данных потребность в АБД сохранилась. В широком плане под АБД понимают системных аналитиков, проектировщиков структур данных и информационного обеспечения, проектировщиков технологии процессов обработки, системных и прикладных программистов, операторов, специалистов в предметной области и по техническому обслуживанию. Иными словами, в крупных базах данных это могут быть коллективы специалистов. В обязанности АБД входит:
1) анализ предметной области, статус информации и пользователей;
2) проектирование структуры и модификация данных;
3) задание и обеспечение целостности;
4) загрузка и ведение БД;
5) защита данных;
6) обеспечение восстановления БД;
7) сбор и статистическая обработка обращений к БД, анализ эффективности функционирования БД;
8) работа с пользователем.
Одним из важнейших инструментов АБД является словарь.
Банк данных – автоматизированная информационная система централи-зованного хранения и коллективного использования данных. В состав банка данных входят одна или несколько баз данных, справочник баз данных, СУБД, а также библиотеки запросов и прикладных программ.
Банк данных инноваций – это база данных инноваций, реализующая одну из основных задач информационной поддержки инновационной деятельности в науке и образовании.
Банк данных законопроектов. Технология ведения банка данных законопроектов имеет много общего с ведением эталонного банка данных правовой информации. Цель его создания — совершенствование процесса подготовки и принятия законопроектов на основе формирования полной картины процесса законотворчества в республике.
Этот банк является автоматизированной системой централизованного учета, накопления и доведения до сведения заинтересованных лиц информации о законотворческой деятельности в Республике Беларусь.
Информационное наполнение компьютерного банка данных проектов законов составляют точные копии проектов законов и предусмотренных законодательством сопроводительных документов к ним. В настоящее время в компьютерном банке данных проектов законов содержится более 550 проектов законов и 8000 сопроводительных документов к ним.
Банк данных «Законодательство Российской Федерации». Банк данных «Законодательство Российской Федерации» представляет собой совместный проект Национального центра правовой информации Республики Беларусь и Научного центра правовой информации при Министерстве юстиции Российской Федерации. Банк данных включает около 60 тысяч документов. Его программное обеспечение и распространение предоставляет Национальный центр правовой информации Республики Беларусь, а информационное наполнение — Научный центр правовой информации при Министерстве юстиции Российской Федерации.
Банк данных «Международные договоры». Банк данных «Международные договоры» включает свыше 2,8 тысяч международных договоров Республики Беларусь, а также правовых актов, принятых в рамках Союзного государства, Содружества Независимых Государств и других межгосударственных образований.
Банк данных «Решения органов местного управления и самоуправления». Банк данных «Решения органов местного управления и самоуправления» включает более 3 тысяч правовых актов областных и Минского городского Советов депутатов, а также облисполкомов и Минского горисполкома.
Банк данных «Судебная практика». Банк данных «Судебная практика» включает документы, в числе которых постановления пленумов Верховного Суда и Высшего Хозяйственного Суда Республики Беларусь, разъяснения Высшего Хозяйственного Суда Республики Беларусь, определения (решения) коллегий Верховного Суда Республики Беларусь, постановления президиумов областных судов (суда г. Минска), обзоры судебной практики, подготовленные отделом обобщений судебной практики Верховного Суда Республики Беларусь.
В соответствии с распоряжением Президента Республики Беларусь от 5 апреля 2002 г. № 89рп «Об утверждении мероприятий по реализации предложений, изложенных в выступлении Президента Республики Беларусь Лукашенко А.Г., докладах руководителей судов, выступлениях участников второго съезда судей Республики Беларусь» НЦПИ при участии Верховного Суда, Высшего Хозяйственного Суда и Министерства юстиции Республики Беларусь разработан новый интегрированный банк данных «Судебная практика».
Эталонный и другие банки данных правовой информации являются неотъемлемой частью государственной системы правовой информации. Они позволяют не только быстро найти необходимый нормативный правовой акт в актуальном состоянии, но и выполнять задачи по систематизации и кодификации действующего законодательства.
Комплекс таких достоинств, как официальность информации, оперативность обновления, расширенные возможности проведения логических (поисковых) операций между и внутри поисковых полей, вывод документов на печать и в файл из рубрикатора, копирование документа (части документа) с его реквизитами и источником опубликования в Microsoft Word, возможность перехода из словаря терминов и определений на документ, содержащий толкование термина, гиперссылки и иные характеристики, делают эти банки данных поистине уникальными поисковыми системами. Программное обеспечение и поисковые возможности этих систем постоянно совершенствуются.
База данных (БД) – это упорядоченное хранение информационных ресурсов в виде объединённых структурированных данных, обеспечивающих быстрый доступ и удобное рациональное взаимодействие между данными.
Банк данных (БнД) – это автоматизированная система, обеспечивающая хранение, накопление, поиск и выдачу информации в совокупности программных и технических средств. Основными элементами банка данных являются база данных и программно-информационные продукты, называемые системой управления базой данных (СУБД).
Использование принципов банка и базы данных предусматривает хранение и использование информации в виде баз данных, где все данные собраны в едином объединённом хранилище и обеспечивается широкий доступ пользователей к различной информации.
Автоматизированные банки данных, информационные базы, их особенности. Технология базы и банка данных является главным направлением организации внутримашинных информационных технологий.
Требования к базам данных как к системе интегрированной информации следующие:
- удобство доступа к данным;
- устранение избыточной и противоречивой информации в хранилище данных;
- безопасность хранения данных в базе;
- защищённость данных;
- совместное использование для решения большого круга задач предприятия, в том числе и новых;
- независимость данных в результате развития информационного обеспечения от изменяющихся внешних условий;
- использование организационной формы эксплуатации.
Выполнение указанных требований способствует высокой производительности и эффективности работы пользователей с данными в больших объёмах.
База данных — это активный объект, меняющий информацию при изменении состояния отражаемой предметной области. Данные в базе объединяются в целостную, единую систему, это обеспечивает более производительную работу пользователей с большими объёмами данных.
Банк данных (кроме важнейших составляющих базы данных и СУБД) включает и ряд других элементов.
Технической основой банков данных являются электронно-вычислительные машины, технологии и продукты.
Языковыми средствами являются языки описания данных, языки программирования, языки запросов и др.
Методическими средствами являются рекомендации и инструкции по созданию и функционированию банков данных.
В состав обслуживающего персонала входят инженеры по техническому обслуживанию и ремонту ЭВМ, программисты, административный аппарат, администраторы баз данных. Их основные задачи – управление и контроль за функционированием банка данных, обеспечение взаимодействия и совместимости всех систем и подсистем, а также контроль за качеством информации и удовлетворение информационных потребностей потребителей.
Конечные пользователи являются основными пользователями БнД и БД,т.е. специалисты предприятия.
Банк и база данных могут быть размещены как на одном компьютере, так и распределяться между нескольких компьютеров. При объединении компьютеров в единую систему с помощью локальных сетей данные одного исполнителя будут доступны другим и наоборот.
Банк и база данных, расположенные на одном компьютере, называют локальными, а на нескольких – распределёнными, которые соединены сетями ПЭВМ.
Назначение распределённых банков и баз данных состоит в предоставлении более гибких форм обслуживания большому количеству удалённых пользователей в условиях структурной или географической разобщённости при работе со значительными объёмами информации.
Базы данных при распределённой обработке данных можно разместить в различных узлах компьютерной сети. Следовательно, каждый компонент БД располагается по месту наличия техники и её обработки.
Объективные требования необходимости распределённой формы организации данных, которые предъявляются конечными пользователями:
- повышение эффективности управления БД и БнД;
- уменьшение времени доступа к информации;
- поддержание целостности, логичности и защищённости данных;
- централизованное управление распределёнными информационными ресурсами.
Эффективность обмена информацией между базами в распределённых системах баз и банков данных имеет большую актуальность.
Требование оперативности информирования пользователей об изменениях и происходящих событиях управляемых бизнес-процессов диктует синхронизацию и параллельное исполнение во времени отдельных видов работ с информацией.
В крупных организациях, в которых применяются распределённые системы БД и БнД, являющиеся средством автоматизации данного предприятия, появляются новые проблемы. К самым распространённым можно отнести расширение географических размеров системы, увеличение числа пользователей, увеличение физических узлов сети, усложняющее администрирование. Появляется угроза несоответствия данных, которые хранятся в различных частях системы.
Для управления распределёнными БД и БнД применяется так называемое тиражирование данных. Процесс тиражированияпредставляет собой перенос изменений объектов из исходной базы данных в базы данных, которые находятся в различных узлах распределённой системы.
Разграничение доступа пользователей к данным является обязательным при организации работы с распределённой системой данных и их безопасностью, при этом усложняется администрирование в сложных системах. Наиболее удобное и полное управление доступом обеспечивает многоуровневый иерархический подход.
Этапы создания базы и банка данных. Для размещения данных в БД требуется предварительное моделирование – построение логической модели данных. Основная функция логической модели данных — группирование разнообразной информации и выражение её свойств по структуре, связям, содержанию, динамике и объёму с учётом удовлетворения информационных потребностей всех категорий пользователей.
На этапе создания логической модели построения БД вначале происходит выявление объектов, процессов или сущностей предметной области, представляющих интерес для пользователей. К примеру, к объектам можно отнести предприятия, вкладчиков, банки и т.п.
СУБД обеспечивает автоматизацию работы базы данных, которая манипулирует конкретной моделью организации данных на носителях. При построении логической модели данных выбирается один из трёх путей моделирования: реляционный, сетевой или иерархический.
Реляционной моделью называется совокупность таблиц, над которыми выполняются операции, которые формулируются в терминах реляционной алгебры. В настоящее время большое распространение получили реляционные модели, в которых все элементы связаны между собой определёнными связями. Все типы моделей имеют свои недостатки и достоинства. Простота понимания структуры реляционной модели является её основным достоинством.
Иерархической моделью называется структура в виде дерева, выражающаяся вертикальными связями (связи низшего уровня подчиняются высшему). При условии, если все запросы имеют структуру дерева, доступ к необходимой информации будет облегчён.
Сетевой моделью называется структура в виде дерева, выражающая как вертикальные, так и горизонтальные связи подчинения. Направления данных связей не являются определёнными, этот фактор усложняет модель и систему управления базами данных.
Физической моделью БД называется привязка логической модели к техническим и программным средствам. Данная модель осуществляет конечную реализацию процесса создания базы данных.
После определения конечного варианта логической модели определяется весь состав показателей и атрибутов, которые необходимы и удовлетворяют всем запросам для решения намеченной области задач. При этом устанавливаются файлы, в которых определяется ключевая сфера для взаимодействия с другими файлами. В каждой сфере формируются разрядность и тип данных, количество записей в файлах, а также и другие сопутствующие характеристики.
Понятие базы данных, банка данных (БнД), СУБД, Базы знаний. Классификация БД
БД — именованная совокупность данных, отражающая состояние объектов и их отношений в заданной предметной области.
СУБД — совокупность языковых и программных средств, предназначенных для создания, ведения и совместного применения БД многими пользователями.
Система базы данных (СБД) — СУБД с наполненной БД, управляемой ее средствами.
БнД — основанная на технологии БД система программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного использования данных.
ИС — система, реализующая автоматизированный сбор, обработку и манипулирование данными и включающая технические средства обработки данных, программное обеспечение и соответствующий персонал.
Общепринятых определений БЗ, СБЗ пока не сформировано. Существует много различных подходов, толкований, что такое “машинное знание”. Часто “знание” заменяют на “интеллект”, но знание-это результат интеллектуальной деятельности.
В реальных системах баз знаний применяется следующая классификация знаний:
Понятия (математические и нематематические); Факты; Правила, зависимости, закономерности, связи; Алгоритмы, процедуры.
Знания могут быть представлены в виде данных, в виде текста или в виде сложных моделей, например, в виде семанти-ческой сети. Знание есть более высокая степень организации данных, которая допускает их специальную интерпретацию.
Относительность понятий данных и знаний подчеркивает следующее высказывание: если для модификации достаточно клерка, то это данные, если эксперта – знания.
База данных считается БЗ, если она содержит процедурные даные, способные управлять информациоными процессами и используемые для получения новых данных. СБЗ называют систему, обеспечивающую создание и использование БЗ.
База знаний – формализованная система сведений о некоторой предметной области, содержащая данные о свойствах объектов, закономерностях процессов и явлений, правил использования в задаваемых ситуациях этих данных для принятия новых решений.
1.По характеру организации хранения данных и доступа к ним:
· Локальные (персональные); Общие (централиз. интегрированные); Распределенные БД.
2.По способу обработки: Оперативной обработки транзакции OLTP; Аналитической обработки (хранилище дан); Дедуктивная (логическая) БД.
3.По виду хранимых данных. неструктурированные (семантические) сети; частично структурир. (текст-гипертекст); структурированные.
4.Структурированные классифицируются: По типу используемой модели данных
иерархические; сетевые; реляционные; смешанные; объектные.
5.По форме представления данных
· видеоданные (изображения разл. вида); аудиосистемы; мультимедиа (сочетание разл. видов).
6.По типу хранимой информации
· фактографические БД (структурированные)
· документальные (текстовые, полнотекст., библиографические, реферативные, основные оперативные накопления и поиск);
· лексикографические (словари, классификаторы, словари основ слов и тд).
7.По экономико-организац признакам
7.1 По условиям предоставления услуг:
1) бесплатные; платные (коммерческие и бесприбыльные)
7.2 По форме собственности:
1) государственные; негосударственные.
7.3 По степени доступности:
1) общедоступные; с ограниченным кругом пользователей.
БД могут классифицироваться по предметной области.
Воспользуйтесь поиском по сайту:
studopedia.org — Студопедия.Орг — 2014-2023 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с) .