14.
Технология
обработки документов и
данных в автоматизированных информационных системах
Обработка –
воздействие на объект с целью придать
ему новые свойства.
Переработка –
преобразования чего-либо во что-либо иное.
Обработка
документов – процесс создания и
преобразования документов. Основными операциями обработки документов являются:
классификация, сортировка, преобразование, размещение в базе данных и поиск.
Обработка
информации - любое преобразование
информации из одного вида в другой, производимое по строгим формальным правилам.
Обработка данных
– процесс выполнения
последовательности операций над данными. Обработка данных может осуществляться в
интерактивном и фоновом режимах.
Процесс обработки информации
состоит в получении одних «информационных объектов» из других «информационных
объектов» путем выполнения некоторых алгоритмов и является одной из основных
операций, осуществляемых над информацией.
Типичная информационная система
выполняет набор функций, который обычно включает в себя следующие:
1. Ввод документов (с бумаги или
в электронном виде).
2. Хранение этих документов.
3. Поиск по запросам (как
предопределенным, так и незапланированным).
4. Редактирование операторами.
5. Создание выходных документов
(на бумаге или в электронном виде).
Схематично это можно изобразить так:
При числовой обработке
используются такие объекты, как переменные, векторы, матрицы, многомерные
массивы, константы и т.д.
При нечисловой обработке
объектами могут быть файлы, записи, поля, иерархии, сети, отношения и т.д.
Другое отличие заключается в том,
что при числовой обработке содержание данных не имеет большого
значения, в
то время
как при нечисловой обработке нас интересуют непосредственные сведения об
объектах, а не их совокупность в целом.
Обработка
данных представляет
собой последовательность
операций, производимых над
данными. Процедуры обработки данных могут различаться в зависимости от форм и
видов представления данных
С
точки
зрения реализации на
основе современных
достижений вычислительной
техники выделяют следующие виды обработки информации:
·
последовательная обработка,
применяемая в традиционной
фоннеймановской архитектуре ЭВМ,
располагающей одним процессором;
·
параллельная обработка,
применяемая при наличии нескольких процессоров в ЭВМ;
·
конвейерная обработка,
связанная с использованием в архитектуре ЭВМ одних и тех же ресурсов для решения
разных задач, причем если эти задачи тождественны, то это последовательный
конвейер, если задачи одинаковые - векторный конвейер.
Основные
процедуры обработки данных:
Создание данных, как процесс
обработки, предусматривает их образование в результате
выполнения некоторого
алгоритма и
дальнейшее использование
для преобразований
на более высоком уровне.
Модификация данных
связана с отображением
изменений в реальной предметной области, осуществляемых путем включения новых
данных и удаления ненужных.
Контроль,
безопасность и целостность
направлены на адекватное
отображение реального состояния
предметной области в информационной модели и обеспечивают защиту информации от
несанкционированного доступа (безопасность) и от сбоев и повреждений технических
и программных средств.
Поиск
информации, хранимой
в памяти
компьютера, осуществляется
как самостоятельное действие
при выполнении ответов на различные запросы и как вспомогательная операция при
обработке информации.
Поддержка
принятия решения
является наиболее
важным действием,
выполняемым при обработке информации. Широкая альтернатива принимаемых
решений приводит к необходимости использования разнообразных математических
моделей.
Создание
документов, сводок,
отчетов заключается
в преобразовании
информации в формы,
пригодные для
восприятия как
человеком, так
и компьютером. С
этим действием связаны и
такие операции, как обработка, считывание, сканирование и сортировка документов.
При
преобразовании информации
осуществляется ее
перевод из
одной формы
представления или существования в другую, что определяется потребностями,
возникающими в процессе реализации информационных технологий.
Реализация всех действий,
выполняемых в процессе обработки информации, осуществляется с помощью
разнообразных программных средств.
В любой предметной области в
технологическом процессе обработки информации можно выделить три основных этапа.
Первый этап
(докомпьютерная обработка) начинается со сбора первичных документов из
различных источников и подготовки их к автоматизированной обработке. На этом
этапе производятся анализ представленных для обработки документов,
систематизация имеющейся информации, составление и уточнение контрольных
сведений, которые в дальнейшем будут использованы для проверки корректности
введенных данных.
Второй этап
(компьютерная обработка) является основным и включает ввод, обработку информации
по заданному алгоритму, а также вывод результатных документов. На этом этапе
осуществляется ручной или автоматизированный ввод информации с первичных
документов, контроль корректности и полноты результатов ввода. Информация с
первичных документов переносится в информационную базу либо в электронную форму
документа и таким образом преобразуется в данные. Далее следует обработка данных
на основании алгоритма решения поставленной задачи, их преобразование в выходные
данные, формирование и печать результатных документов.
На заключительном третьем этапе (послекомпьютерная
обработка) технологического процесса обработки информации производится контроль
качества и полноты результатных документов, их тиражирование и передача
заинтересованным лицам по различным каналам связи в электронном виде или на
бумажных носителях.
Методы
обработки информации
Наименование метода |
Характеристика метода |
Разновидности |
Область применения |
Факторный анализ |
Метод многомерной
математической статистики,
направленный на выявление и
специфическое математическое выражение структур
в системах случайных явлений. Используется для измерения
взаимосвязей между признаками объектов и классификации признаков с
учетом этих взаимосвязей. |
|
Применяют в тех случаях,
когда необходимо установить и выявить скрытые для исследователя
факторы, по отношению к которым первичные эмпирические показатели
гипотетически считаются производными. Например,
при оценке полноты информации о выборке; при определении
информативности итогового набора исходных переменных; при анализе
объектов проектирования;
при проведении пилотажного исследования. |
Сравнительный анализ |
Метод анализа информации,
заключающийся в сравнении результатов исследований, проведенных на
разных объектах или в разное время одним или разными исследовательскими
коллективами с целью
обобщения информации и обеспечения надежности полученных результатов. |
|
Используется при обобщении
результатов однотипных локальных исследований с целью получения выводов,
касающихся крупных (масштабных) объектов. Например, при анализе рынка
обеспечивающих средств информационных систем (программных, технических,
лингвистических и т.п.), информационных продуктов и услуг, поисковых
средств. |
Ранжирование
|
Метод оценки переменной,
когда ее значению приписывается место в последовательности величин
(ранг), определяемое при помощи порядковой шкалы. Расположение объектов
совокупности может в порядке возрастания или убывания величины
соответствующих им вариантов.
|
|
Упорядочение первичных
данных. Например, при анализе контента сайтов, исследовании рынка
информационных продуктов и услуг, обосновании выбора конкретных
обеспечивающих средств информационных систем. Широко используется в
экспертном опросе. |
Группировка |
Метод, заключающийся в
объединении по существенным признакам единиц наблюдаемого объекта в
однородные совокупности. Группировка осуществляется как по качественным,
так и по количественным критериям.
|
Дискретная группировка; Интервальная группировка Группировка при помощи
простого суммирования однородных признаков; Ранжирование; Группировка на основе
логически выделенных признаков; Табулирование |
Обработка материалов
исследования; предварительное упорядочение
первичной информации. Например,
при анализе контента сайтов, исследовании рынка информационных
продуктов и услуг, проектировании информационного обеспечения
информационных систем. |
Классификация |
Метод, заключающийся в
распределении каких-либо объектов по классам на основе их общих
признаков (свойств, характеристик или параметров объектов), сходства и
различий, отражающих связи между классами объектов в единой системе
данной отрасли знания.
Классификация осуществляется в соответствии с выбранным основанием
деления. |
Иерархический метод Фасетный метод (метод
параллельных классификаций) |
Позволяет установить
связи между изучаемыми объектами;
служит основой для обобщающих выводов и прогнозов. Например, при
рассмотрении предприятий, учреждений, организаций как объектов
автоматизации, описании сложных объектов (информационных систем, баз и
банков данных, сайтов, автоматизированных обучающих систем и т.п.),
предполагающем установление их типов и видов. |
Прогнозирование |
Метод, предполагающий
научное исследование перспектив развития какого-либо явления или
процесса, преимущественно с количественными оценками и с указанием более
или менее определенных сроков их изменения. Направлено на определение
тенденций и перспектив развития тех или иных процессов на основе анализа
данных об их прошлом и нынешнем состоянии.
|
Глобальное
прогнозирование; Нормативное
прогнозирование; Аналитическое
прогнозирование |
Определение перспектив
развития информационных систем, сетей и технологий. |
Моделирование
|
Один из методов познания
(отображения) и преобразования
мира, сущность которого
сводится к построению и изучению некоторой модели с последующим
«переносом» полученных знаний на исследуемый объект. |
Материальное
моделирование: физическое, аналоговое Идеальное моделирование:
знаковое (графическое, логическое, математическое), интуитивное |
Применяется в качестве
универсальной формы познания при исследовании и преобразовании явлений в
любой сфере деятельности. Применяется в тех случаях,
когда объект познания недоступен непосредственному наблюдению и
изучению. Например, при моделировании предметных областей, построении
моделей баз данных, сайта и т.п. |
Эксперимент
|
Метод, в основе которого
лежит специально поставленный опыт в определенных условиях, содержащих
оптимальные возможности для
объекта исследования,
соответствующие замыслу эксперимента. |
Лабораторный эксперимент
(эксперименты, осуществляющие эмпирическую проверку гипотезы или теории;
эксперименты, в ходе которых происходит сбор необходимой эмпирической
информации для уточнения предположенного); Естественный эксперимент |
Применяют в случаях, когда
стоит задача выявления связей и зависимостей между изучаемыми явлениями.
Осуществляется на проектной и послепроектной стадиях создания
информационных систем. Например, в ходе проверки работоспособности
созданной методики, технологии, базы данных, информационной системы,
автоматизированной обучающей системы. |