1

К оглавлению

 

14. Технология обработки документов и данных в автоматизированных информационных системах

Обработка – воздействие на объект с целью придать ему новые свойства.

Переработка – преобразования чего-либо во что-либо иное.

Обработка документов – процесс создания и преобразования документов. Основными операциями обработки документов являются: классификация, сортировка, преобразование, размещение в базе данных и поиск.

Обработка информации - любое преобразование информации из одного вида в другой, производимое по строгим формальным правилам.

Обработка данных – процесс выполнения последовательности операций над данными. Обработка данных может осуществляться в интерактивном и фоновом режимах.

Процесс обработки информации состоит в получении одних «информационных объектов» из других «информационных объектов» путем выполнения некоторых алгоритмов и является одной из основных операций, осуществляемых над информацией.

Типичная информационная система выполняет набор функций, который обычно включает в себя следующие:

1. Ввод документов (с бумаги или в электронном виде).

2. Хранение этих документов.

3. Поиск по запросам (как предопределенным, так и незапланированным).

4. Редактирование операторами.

5. Создание выходных документов (на бумаге или в электронном виде).


Схематично это можно изобразить так:

 

 На самом верхнем уровне можно выделить числовую и нечисловую обработку. В указанные виды обработки вкладывается различная трактовка содержания понятия «данные».

При числовой обработке используются такие объекты, как переменные, векторы, матрицы, многомерные массивы, константы и т.д.

При нечисловой обработке объектами могут быть файлы, записи, поля, иерархии, сети, отношения и т.д.

Другое отличие заключается в том, что при числовой обработке содержание данных не имеет большого  значения,  в  то  время  как при нечисловой обработке нас интересуют непосредственные сведения об объектах, а не их совокупность в целом.

Обработка  данных  представляет  собой  последовательность  операций,  производимых над данными. Процедуры обработки данных могут различаться в зависимости от форм и видов представления данных

С  точки  зрения  реализации на  основе  современных  достижений  вычислительной  техники выделяют следующие виды обработки информации:

·   последовательная обработка, применяемая в  традиционной фоннеймановской  архитектуре ЭВМ, располагающей одним процессором; 

·  параллельная обработка, применяемая при наличии нескольких процессоров в ЭВМ; 

·  конвейерная обработка, связанная с использованием в архитектуре ЭВМ одних и тех же ресурсов для решения разных задач, причем если эти задачи тождественны, то это последовательный конвейер, если задачи одинаковые - векторный конвейер.   

Основные процедуры обработки данных:

Создание данных, как процесс обработки, предусматривает их образование в результате  выполнения  некоторого  алгоритма  и  дальнейшее  использование  для  преобразований  на более высоком уровне. 

Модификация данных  связана  с отображением изменений в реальной предметной области, осуществляемых путем включения новых данных и удаления ненужных. 

Контроль,  безопасность и  целостность  направлены на  адекватное отображение  реального состояния предметной области в информационной модели и обеспечивают защиту информации от несанкционированного доступа (безопасность) и от сбоев и повреждений технических и программных средств.

Поиск  информации,  хранимой  в  памяти  компьютера,  осуществляется  как  самостоятельное действие при выполнении ответов на различные запросы и как вспомогательная операция при обработке информации. 

Поддержка  принятия  решения  является  наиболее  важным  действием,  выполняемым при обработке информации. Широкая альтернатива принимаемых решений приводит к необходимости использования разнообразных математических моделей.

Создание  документов,  сводок,  отчетов  заключается  в  преобразовании  информации  в формы,  пригодные  для  восприятия  как  человеком,  так  и  компьютером. С  этим  действием связаны и такие операции, как обработка, считывание, сканирование и сортировка документов.

При  преобразовании  информации  осуществляется  ее  перевод  из  одной  формы  представления или существования в другую, что определяется потребностями, возникающими в процессе реализации информационных технологий.

Реализация всех действий, выполняемых в процессе обработки информации, осуществляется с помощью разнообразных программных средств.

 

В любой предметной области в технологическом процессе обработки информации можно выделить три основных этапа.

Первый этап (докомпьютерная обработка) начинается со сбора первичных документов из различных источников и подготовки их к автоматизированной обработке. На этом этапе производятся анализ представленных для обработки документов, систематизация имеющейся информации, составление и уточнение контрольных сведений, которые в дальнейшем будут использованы для проверки корректности введенных данных.

Второй этап (компьютерная обработка) является основным и включает ввод, обработку информации по заданному алгоритму, а также вывод результатных документов. На этом этапе осуществляется ручной или автоматизированный ввод информации с первичных документов, контроль корректности и полноты результатов ввода. Информация с первичных документов переносится в информационную базу либо в электронную форму документа и таким образом преобразуется в данные. Далее следует обработка данных на основании алгоритма решения поставленной задачи, их преобразование в выходные данные, формирование и печать результатных документов.

На заключительном третьем этапе (послекомпьютерная обработка) технологического процесса обработки информации производится контроль качества и полноты результатных документов, их тиражирование и передача заинтересованным лицам по различным каналам связи в электронном виде или на бумажных носителях.

 

Методы  обработки информации

Наименование метода

Характеристика метода

Разновидности

Область применения

Факторный анализ

Метод многомерной математической статистики,  направленный на выявление  и специфическое математическое выражение структур  в системах случайных явлений. Используется для измерения взаимосвязей между признаками объектов и классификации признаков с учетом этих взаимосвязей.

 

Применяют в тех случаях, когда необходимо установить и выявить скрытые для исследователя  факторы, по отношению к которым первичные эмпирические показатели гипотетически считаются производными. Например,  при оценке полноты информации о выборке; при определении информативности итогового набора исходных переменных; при анализе объектов проектирования;  при проведении пилотажного исследования.

Сравнительный анализ

Метод анализа информации, заключающийся в сравнении результатов исследований, проведенных на разных объектах или в разное время одним или разными исследовательскими  коллективами с целью  обобщения информации и обеспечения надежности полученных результатов.

 

Используется при обобщении результатов однотипных локальных исследований с целью получения выводов, касающихся крупных (масштабных) объектов. Например, при анализе рынка обеспечивающих средств информационных систем (программных, технических, лингвистических и т.п.), информационных продуктов и услуг, поисковых средств.

Ранжирование

Метод оценки переменной, когда ее значению приписывается место в последовательности величин (ранг), определяемое при помощи порядковой шкалы. Расположение объектов совокупности может в порядке возрастания или убывания величины соответствующих им вариантов. 

 

Упорядочение первичных данных. Например, при анализе контента сайтов, исследовании рынка информационных продуктов и услуг, обосновании выбора конкретных обеспечивающих средств информационных систем. Широко используется в экспертном опросе.

Группировка

Метод, заключающийся в объединении по существенным признакам единиц наблюдаемого объекта в однородные совокупности. Группировка осуществляется как по качественным, так и по количественным критериям. 

Дискретная группировка;

Интервальная группировка

Группировка при помощи простого суммирования однородных признаков;

Ранжирование;

Группировка на основе логически выделенных признаков;

Табулирование

Обработка материалов исследования; предварительное упорядочение  первичной информации. Например,  при анализе контента сайтов, исследовании рынка информационных продуктов и услуг, проектировании информационного обеспечения информационных систем.

Классификация

Метод, заключающийся в распределении каких-либо объектов по классам на основе их общих признаков (свойств, характеристик или параметров объектов), сходства и различий, отражающих связи между классами объектов в единой системе данной отрасли знания.  Классификация осуществляется в соответствии с выбранным основанием деления.

Иерархический метод

Фасетный метод (метод параллельных классификаций)

Позволяет установить  связи между изучаемыми объектами;  служит основой для обобщающих выводов и прогнозов. Например, при рассмотрении предприятий, учреждений, организаций как объектов автоматизации, описании сложных объектов (информационных систем, баз и банков данных, сайтов, автоматизированных обучающих систем и т.п.), предполагающем установление их типов и видов.

Прогнозирование

Метод, предполагающий научное исследование перспектив развития какого-либо явления или процесса, преимущественно с количественными оценками и с указанием более или менее определенных сроков их изменения. Направлено на определение тенденций и перспектив развития тех или иных процессов на основе анализа данных об их прошлом и нынешнем состоянии. 

Глобальное прогнозирование;

Нормативное прогнозирование;

Аналитическое прогнозирование

Определение перспектив развития информационных систем, сетей и технологий.

Моделирование

Один из методов познания (отображения) и преобразования   мира, сущность которого  сводится к построению и изучению некоторой модели с последующим «переносом» полученных знаний на исследуемый объект.

Материальное моделирование: физическое, аналоговое

Идеальное моделирование: знаковое (графическое, логическое, математическое), интуитивное

Применяется в качестве универсальной формы познания при исследовании и преобразовании явлений в любой сфере деятельности.

Применяется в тех случаях, когда объект познания недоступен непосредственному наблюдению и изучению. Например, при моделировании предметных областей, построении моделей баз данных, сайта и т.п.

Эксперимент

Метод, в основе которого лежит специально поставленный опыт в определенных условиях, содержащих оптимальные  возможности для объекта исследования,   соответствующие замыслу эксперимента.

Лабораторный эксперимент (эксперименты, осуществляющие эмпирическую проверку гипотезы или теории; эксперименты, в ходе которых происходит сбор необходимой эмпирической информации для уточнения предположенного);

Естественный эксперимент

Применяют в случаях, когда стоит задача выявления связей и зависимостей между изучаемыми явлениями. Осуществляется на проектной и послепроектной стадиях создания информационных систем. Например, в ходе проверки работоспособности созданной методики, технологии, базы данных, информационной системы, автоматизированной обучающей системы.

 

К оглавлению

Hosted by uCoz