1

К оглавлению

   

71. Кодирование как средство формализованного представления данных

Для полной формализации информации недо­статочно простой классификации, поэтому проводят следующую процедуру - кодирование.

Кодирование - это процесс присвое­ния условных обозначений объектам и классификационным группам по соответствующей системе кодирования.

Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов.

Код - это условное обозна­чение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определен­ном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код характеризуется следующими параметрами:

•     длиной;

•     основанием кодирования;

•     структурой кода, под которой понимают распределение зна­ков по признакам и объектам классификации;

•     степенью информативности;

•     коэффициентом избыточности, который определяется как отношение максимального количества объектов фактическому количеству объектов.

Все системы кодирования можно сгруппировать в два под­множества: регистрационные и классификационные системы кодирования.

Особенностью регистрационных систем кодирования являет­ся их независимость от применяемых систем классификации. Ре­гистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объек­та и его кода в течение длительного периода времени и защищен­ности кода от помех и ошибок.

Регистрационные коды состоят из двух частей: информаци­онной и контрольной, предназначенной для защиты передавае­мой информации от ошибок. Контрольная часть может рассчи­тываться по различным алгоритмам, в частности, наиболее упот­ребляемыми являются следующие формулы их расчета:

где М - модуль (простое число, делящееся на единицу и на само себя);

Хi - информационные разряды, i - номер разряда;

Вi - вес информационного разряда.

К регистрационным системам относятся порядковая и серий­ная системы кодирования.            

Приведенная   на рис. классификация систем кодирования может быть детализирована. Так, последовательная и параллельная системы кодирования строятся на основе  разрядной (позиционной) или комбинированной  систем кодирования. Создание систем кодирования базируется на использовании соответствующих методов кодирования. 

В заключении необходимо дать оценку соответствия спроектированного лингвистического обеспечения  требованиям к лингвистическому  обеспечению системы (подсистемы), предъявляемым нормативными документами (стандартами, руководящими документами и др.), а также техническим заданием на создание конкретной АИС.

Методы кодирования информации

Наименование метода

Сущность

Преимущества

Недостатки

Сфера (условия) применения

Регистрационные методы кодирования

Порядковый метод кодирования

метод, при котором кодами служат числа натурального ряда; в этом случае кодом каждого из объектов классифицируемого множества является его порядковый номер

- обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода;

- обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность определения каждого объекта классификации;

- обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора, т. к. каждому новому объекту присваивается следующий номер по порядку

- отсутствие в коде какой-либо конкретной информации о свойствах объекта;

-  сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками;

- не обеспечивает возможности размещения вновь появившихся объектов классификации в необходимом месте классификатора, т. к резервные коды располагаются в конце ряда

чаще всего применяется в сочетании с другими методами кодирования

 

Серийно-порядковый метод кодирования

метод, при котором кодами служат числа натурального ряда с закреплением отдельных серий этих чисел за объектами классификации с одинаковыми признаками

- наличие в  каждой серии, кроме кодов имеющихся объектов классификации, определенного  количества кодов для резерва, резерв кодов располагается в середине или в конце серии

 

 

целесообразно применять для объектов, имеющих два соподчиненных признака

В целом метод обладает всеми преимуществами и недостатками  порядкового  метода кодирования

Классификационные методы кодирования

Последовательный метод кодирования

метод кодирования, при котором код объекта классификации и (или) классификационной группировки образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе классификации; в этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к  коду вышестоящей группировки

- логичность построения кода;

-  большая емкость

- обладает всеми недостатками, присущими иерархическому методу классификации;

- ограниченные  возможности идентификации объектов;

-  невозможность применения полученного кода по частям, т.к. существует  зависимость значений последующих разрядов кода от предыдущих;

- сложность  группировки  объектов по различным сочетаниям имеющихся признаков;

-  практически невозможно вносить новые признаки и производить изменения в коде без  коренной перестройки классификатора

чаще всего используется при иерархическом методе классификации; применять метод  целесообразно в тех случаях, когда набор признаков классификации и их последовательность стабильны в течение длительного времени

Параллельный метод кодирования

метод, при котором код объекта классификации и (или) классификационной группировки образуется с использованием кодов независимых группировок, полученных при фасетном методе классификации

- гибкость структуры кода, обусловленная блочностью его построения;

- возможность использовать при решении конкретных технико-экономических и социальных задач коды только тех признаков объектов, которые необходимы, что дает возможность работать в каждом отдельном случае с кодами небольшой длины;

- возможность группировки объектов по любому сочетанию признаков;

- наглядность кодовой комбинации (легко указать, набором каких характеристик  описывается рассматриваемый объект);

- набор признаков при необходимости может легко пополняться присоединением кода нового признака

 

 хорошо приспособлен для машинной обработки информации

 

 

Общероссийские классификаторы технико-экономической и социальной информации

Важными средствами информационного обеспечения, прежде всего в таких видах деятельности, как экономика, статистика, банковское дело, таможенное деле, внешнеэкономическая дея­тельность и др., являются классификаторы технико-экономичес­кой и социальной информации, необходимые для обеспечения интегрированной обработки данных в автоматизированных ин­формационных системах.

Классификаторы ТЭиСИ являются нормативными документами. Классификатор содержит систематизированный свод наименований объектов, представленных как классификационные группировки, и присво­енные им коды.

Классификации и кодированию подлежат социальные и эко­номические объекты и их свойства, информация о которых ис­пользуется в деятельности органов власти и управления и содер­жится в унифицированных формах документов.

В настоящее время разработано и действует 37 общероссийских и продолжающих действовать общесоюзных классификаторов. Сово­купность классификаторов технико-экономической и социальной информации, а также научно-методических и нормативно-техничес­ких документов по их разработке, ведению и внедрению, а также служб, осуществляющих работы по классификации и кодированию, составляют Единую систему классификации и кодирования технико-экономической и социальной информации (ЕСКК ТЭИ).

Каждый клас­сификатор может быть предназначен для однозначной иденти­фикации объекта, передачи информации на расстояние по кана­лам связи или для поиска и логической обработки первичной информации с целью получения и выдачи результатной инфор­мации.

По сфере действия выделяют следующие виды классификато­ров: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.

Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязатель­ны для передачи информации между организациями разных стран мирового сообщества. СМЭС представляет собой множество стандартных решений по классификационным группировкам и кодированию специальной и экономической информации и фор­мированию источников этой информации. В состав СМЭС вхо­дят классификации Организации Объединенных наций (ООН) и ее специализированных образований.

Второй класс классификаторов образуют общегосударствен­ные (общесистемные) классификаторы, обязательные для орга­низации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны.

Для выполнения процедур обработки информации и переда­чи ее между организациями внутри отрасли используют отрас­левые классификаторы. В пределах отдельных предприятий ис­пользуют, как правило, локальные классификаторы.

 

 

 

К оглавлению

Hosted by uCoz