1

К оглавлению

 

32. Базы данных

Наиболее важной и перспективной составляющей информационных ресурсов современного общества являются базы данных (БД). Мировой рынок   характеризуется десятками тысяч баз данных, обеспечивающих возможность многоцелевого и многоаспектного поиска информации.

База данных – это совокупность относящихся к определенной области знания (теме, проблеме)  взаимосвязанных данных, представленных в определенном формате на машинном носителе.

В профессиональной литературе отражены различные подходы к классификации БД.

Классификация баз данных

1. Вид информации

1.1. Документальные БД

1.1.1. Документографические БД

1.1.1.1. Библиографические БД

1.1.1.2. Реферативные БД

1.1.1.3. Обзорные БД

1.1.2. Полнотекстовые БД

1.2. Фактографические БД

1.3. Лексикографические БД

2. Профиль информации

2.1. БД деловой (коммерческой) информации

2.2. БД информации для специалистов (научно-технической, производственной и др.)

2.3. БД массовой информации

3. Целевое назначение информации

3.1. БД официальной информации

3.2. БД научной информации

3.3. БД производственной информации

3 4. БД нормативной информации

3.5. БД справочной информации

3.6. БД учебной информации

3.7. БД досуговой информации

3.8. БД рекламной информации

3.9. БД статистической информации

3.10. БД коммерческой информации

4. Принадлежность к определенной области знания

4.1. БД по общественным наукам

4.2. БД по естественным и точным наукам

4.3 БД по техническим и прикладным наукам, отраслям экономики

4.4. БД по общеотраслевым и комплексным проблемам (межотраслевым проблемам)

5. Широта тематического охвата информации

5.1. Универсальные БД

5.2. Многоотраслевые БД

5.3. Межотраслевые БД

5.4. Отраслевые БД

5.5. Узкотематические БД

5.6. Проблемно-тематические БД

6. Вид документов

6.1 Поливидовые БД

6.2. Моновидовые БД (диссертаций, стандартов, препринтов, статей, материалов конференций)

7. Временной охват информации

7.1. БД текущей информации

7.2. Ретроспективные БД

8. Язык представления информации

8.1. БД на русском языке

8.2. БД на иностранных языках

9. Форма представления информации

9.1. БД символьной информации

9.1.1. Текстовые БД

9.1.2. Гипертекстовые БД

9.1.3. Тексто-числовые БД

9.1.4 Числовые БД

9.2. БД графической информации

9.2.1. БД статической информации

9.2.2. БД динамической информации

9.3. Мультимедийные БД

9.4. Гипермедийные БД

10. Уровень структурирования данных

10.1. Неструктурированные БД

10.2 Частично структурированные БД

10.3 Структурированные БД

11. Тип модели данных

11.1. Иерархические БД

11.2. Сетевые БД

11.3. Реляционные БД

11.4. Объектно-ориентированные БД

12. Формат записи данных

12.1 БД в конвертируемом формате

12.2. БД в неконвертируемом формате

13. Частота актуализации

13.1. БД обновляемые ежегодно

13.2. БД обновляемые ежеквартально

13.3. БД обновляемые ежемесячно

13.4. БД обновляемые ежедневно

14. Способ генерации

14.1. БД собственной генерации

14.2. БД с заимствованием данных

14.3. Комбинированные БД (заимствование с добавлением собственной информации)

15. Форма собственности

15.1. Государственные БД

15.1.1. Федеральные БД

15.1.1.1. БД всероссийских органов НТИ

15.1.1.2. БД отраслевых центров НТИ

15.1.1.3. БД межотраслевых территориальных центров НТИ

15.1.2. БД субъектов РФ

15.1.3. Региональные БД

15.1.4. Муниципальные БД

15.1.5. БД предприятий (организаций, ВУЗов и т.д.)

15.2. Негосударственные БД

15.2.1. БД негосударственных предприятий, организаций, ВУЗов и т.д.

15.2.2. БД общественных организаций

15.2.3. Частные БД

16. Степень доступности

16.1. Общедоступные БД

16.2. БД ограниченного доступа

17. Объем

17.1. Крупные БД (более 100 тыс. записей и 50

Мб)

17.2. Средние БД

17.3. Малые БД (менее 1000 записей и 1Мб)

18. Место создания

18.1. Внешние БД

18.1.1. Отечественные БД

18.1.2. Зарубежные БД

18.1.3. Международные БД

18.2. Внутренние БД

19. Способ организации

19.1. Локальные БД

19.2. БД Коллективного пользования (сводные)

19.2.1. Централизованные БД

19.2.2. Распределенные БД

20. Способ организации

20.1. Локальные БД

20.2. Сводные БД

21. Способ доступа

21.1. Автономные БД

21.2. Сетевые БД

21.2.1. БД локального доступа

21.2.2. БД удаленного доступа

22. Условия использования

22.1. Бесплатные БД

22.2. Платные БД

23. Режим поставки

23.1. Полная копия БД

23.2. Выборочное копирование БД

24. Режим актуализации

24.1. БД с обновлением данных

24.2. БД с заменой данных

25. Тип носителя информации

25.1. БД на магнитных дисках

25.2. БД на оптических дисках

25.3. БД на магнито-оптических дисках

26. Наличие печатного аналога

26.1. БД, имеющие печатный аналог

26.2. БД, не имеющие печатного аналога

27. Наличие защиты информации

27.1. БД с ключевой дискетой

27.2. БД с ограничением числа инсталляций

27.3. БД с кодированием данных

27.4. БД без защиты

 Наиболее важным основанием деления баз данных является характер предоставляемой пользователям информации, в соответствии с которым выделяют документальные (документографические и  полнотекстовые), фактографические и лексикографические БД.

База данных помогает систематизировать и хранить информацию из определенной предметной области, облегчает доступ к данным, поиск и предоставление необходимых сведений. Простейшей базой данных можно считать телефонный справочник или список книг в вашей домашней библиотеке. Современные базы данных оперируют информацией, представленной в самом разном формате, - от обычных чисел и текста до графических и видеоданных.

К общим характеристикам баз данных относятся следующие основные понятия:

·   Безопасность БД - содержащиеся в ней данные не причинят вреда пользователю при правильном их применении.

·   Защищенность БД - наличие средств (аппаратных, программных, организационных, технологических и т.п.) обеспечивающих предотвращение доступа к информации лиц, не получивших на то соответствующего разрешения, а также разрушения или изменения данных.

·   Гибкость БД - возможность изменения структуры и содержания, а также состава и формы предъявления данных пользователям.

·   Доступность БД - свойство автоматизированной системы, характеризующее возможность использования содержащихся в БД сведений для разных категорий пользователей.

Особое значение имеет такое свойство БД как защищенность. Существуют базы данных, от которых зависит работа банков и промышленных предприятий, движение транспорта и обслуживание населения. Существуют базы, связанные с социальными факторами (медицина, пенсионное обеспечение). Разрушение таких БД может иметь глобальные последствия

Характеристика моделей данных

Иерархическая модель предполагает использование для описания базы данных древовидных структур, состоящих из определенного числа уровней. «Дерево» представляет собой  иерархию элементов, называемых узлами. Под элементами понимается список, совокупность, набор атрибутов, элементов, описывающих объекты.

Достоинством модели является простота ее построения, легкость понимания сути принципа иерархии, наличие промышленных СУБД, поддерживающих данную модель. Недостатком является сложность операций по включению в иерархию информации о новых объектах базы данных и удалению устаревшей информации. 

Сетевая модель описывает элементарные данные и отношения между  ними  в виде ориентированной сети. Это такие отношения между объектами, когда каждый порожденный элемент имеет более одного исходного и может быть связан с любым другим элементом структуры.

Сетевые структуры могут быть многоуровневыми и иметь разную степень сложности. Схема, в которой присутствует хотя бы одна связь «многие ко многим» и которая требует для своей реализации использования сложных методов, является сложной схемой.

База данных, описываемая сетевой моделью, состоит из областей, каждая из которых состоит из записей, а последние, в свою очередь, состоят из полей. Недостатком сетевой модели является ее сложность, возможность потери независимости данных при реорганизации базы данных. При появлении новых пользователей, новых приложений и новых видов запросов происходит рост базы данных, что может привести к нарушению логического представления данных.

Реляционная модель имеет в своей основе понятие «отношения», и ее данные формируются в виде таблиц. Отношение – это двумерная таблица, имеющая сове название, в которой минимальным объектом действий, сохраняющим ее структуру, является строка таблицы (кортеж), состоящая из ячеек таблицы – полей.

Каждый столбец таблицы соответствует только одной компоненте  этого отношения. С логической точки зрения реляционная база данных представляется  множеством двумерных таблиц различного предметного наполнения.

К числу достоинств реляционной модели относятся: простота построения, доступность понимания, возможность эксплуатации базы данных без знания методов и способов ее построения, независимость данных, гибкость структуры и другие. Недостатками модели являются: низкая производительность по сравнению с иерархической и сетевой моделями,  сложность программного обеспечения, избыточность. 

Постреляционная (объектная) модель данных – логическая модель БД, в которой записи представлены многомерной табличной формой

По характеру организации хранения данных и обращения к ним различают локальные (персональные), общие (интегрированные, цен­трализованные) и распределенные базы данных.

Персональная база данных - это база данных, предназначенная для локального использования одним пользователем. Локальные БД могут создаваться каждым пользователем самостоятельно, а могут извлекаться из общей БД.

Интегрированные и распределенные БД предполагают возмож­ность одновременного обращения нескольких пользователей к одной и той же информации (многопользовательский, параллельный режим доступа). Это привносит специфические проблемы при их проекти­ровании и в процессе эксплуатации БД. Распределенные БД, кроме того, имеют характерные особенности, связанные с тем, что физи­чески разные части БД могут быть расположены на разных ЭВМ, а логически, с точки зрения пользователя, они должны представлять собой единое целое.

Технологии, которые, на первый взгляд, вроде бы находятся на разных концах спектра (локальная и распределенная обработка), на самом деле очень близки и различаются практически тем, как под­держивается связь между отдельными частями БД. В локальных си­стемах поддержание этой связи не является централизованным, а в распределенных БД связь должна поддерживаться СУБД. Совмещать идеи локальной работы и централизованного поддержания единой БД позволяет технология тиражирования, при которой средства СУБД обеспечивают тиражирование отдельных частей общей БД, локаль­ное использование их, а затем согласование отдельных фрагментов БД в рамках единой базы данных.

В многопользовательской базе данных важно, чтобы каждый пользователь имел возможность использовать собственное логическое представление о данных, конечно, при условии, что это представление будет частью общего. То есть каждый пользователь обращается к некоторому подмножеству общих данных, хранящихся в многопользовательской базе данных.

Таким образом, появляется необходимость в реализации и поддержании нескольких представлений данных – одного физического, общего логического и многих пользовательских логических.

Наиболее распространенной является трехуровневая архитектура описания базы данных. Описание данных на любом уровне называется схемой.

·   Внешний уровень – пользовательский. На этом уровне расположены описания базы данных, предназначенные для отдельных пользователей или групп пользователей.

·   Внутренний уровень – единое описание данных, предназначенное для восприятия СУБД и операционной системой (внутренняя схема). Внутренняя схема описывает реализацию базы данных. Ее главная задача – достижение максимальной производительности системы, экономия дискового пространства.

·   Концептуальный уровень – промежуточный между внешним и внутренним. Ему соответствует концептуальная схема. Схемы внешнего уровня – подсхемы концептуальной схемы. Концептуальный уровень играет роль посредника. Он решает две задачи.

Электронный каталог - машиночитаемый библиотечный каталог, работающий в реальном режиме времени и предоставленный в распоряжение читателей.

Свойства электронных каталогов:

·   многоаспектность доступа

·   возможность использования на расстоянии

·   оперативность поиска, многофункциональность.

 

К оглавлению

Hosted by uCoz