74. Формализованное свертывание текстов документов
Формализация – это процедура при которой
содержание первичного документа исследуется с помощью выявленных типовых
элементов.
Формализованное экстрагирование – метод
экстрагирования (извлечения) из текста ПД фраз, обладающих формальными
текстовыми признаками.
Реферат-экстракт (лат.
extractum - вытяжка, извлечение) - вторичный документ, полученный
методом экстрагирования, то есть извлечения из текста первичного
документа фраз, обладающих формальными текстовыми признаками (маркерами,
индикаторами, коннекторами).
Необходимость формализации заключается в следующем:
1. Масштабность процесса
реферирования
2. Субъективность процесса
анализа и синтеза информации
Научный текст является разновидностью книжного функционального
стиля, предназначен для обеспечения научной коммуникации и рассчитан на
подготовленных пользователей.
Свойства научного текста:
1. Логичность, строгая
последовательность
2. Точность научной речи,
насыщенность терминологической лексикой – это связано с представлением точной
информации в научных документах, которая прошла определенную апробацию.
3. Безэмоциональность
4. Отвлеченность и обобщенность
– почти каждое слово в научном тексте выступает как
обозначение общего понятия или абстрактного предмета.
5. Клишированность научных
текстов
Первые научные публикации появились в 13в. И до 18в. Тексты
писались на латинском языке, поэтому имеют определенные свойства, т.е.
стандартные клешированные обороты.
Структура научного текста имеет иерархический характер. В
частности выделяются: введение, основная часть, заключение. Каждая из которых
содержит более мелкие аспекты содержания.
Аспект содержания – это относительно
самостоятельная часть текста, обладающая смысловым единством, может быть
представлена в виде предложения или абзаца.
Формальные текстовые признаки в структуре научного документа.
Формальные текстовые признаки – это клешированные слова и
словосочетания.
Выделяют несколько видов формальных текстовых признаков:
1. Маркёр – устойчивое
словосочетание, т.е. часть фразы однозначно определяющая тот или иной аспект
содержания и позволяющая отличать один аспект от другого. (аспект – время
исследования: 27.06.1986)
2. Индикаторы – это устойчивый
словесный оборот, характеризующий последовательность изложения, акцентирующий
внимание читателей на отдельные фрагменты текста. Являются указателями авторской
мысли.
• Формулирующие
тему документа, а также мысль, о чем будет идти речь далее (“Данная статья
посвящена”).
• Акцентирующие
внимание (“Итак”, “следовательно” и т.д.)
• Результирующие,
подитоживающие (“Итак, таким образом, следовательно”)
3. Коннекторы – слова-связки,
предназначены для того, чтобы текст был связанным и целостным (“такой”, “выше
названный”, “упомянутый” и т.д.).
• Коннекторы,
отсылающие к предшествующей части текста (вышеуказанный, ранее
представленный, этот, тот, такой) и требующие для своего понимания
операции типа «шаг назад» в тексте;
• Коннекторы,
отсылающие к последующей части текста, (нижеприведенный, рассматриваемый
далее, характеризуемый ниже и т.п. ) и требующие для своего понимания
операции типа «шаг вперед» в тексте.
Преимущества и недостатки формализованной методики свертывания
текстов документов.
Недостатки:
-
сохранение доли субъективности, проблема осмысления первичного документа.
-
многофункциональность многих документов т.е. одновременное их отношение к
нескольким жанрам;
-
свертывание преимущественно хорошо структурированных текстов;
-
противоречие между содержательностью и краткостью;
-
неправильное истолкование первичного документа (развертывание) читателем;
Преимущества:
-
устойчивость методики;
-
облегчает и ускоряет интеллектуальные процедуры аннотирования и реферирования;
-
свертывание любого текста людьми, не являющими специалистами в данной области
знания, но владеющими основами аннотирования и реферирования;
-
возможность получения формализованных экстрактов в разных областях науки и
техники;
-
освобождает от непосредственного обращения к первичному документу для принятия
решения о необходимости его использования в работе;
-
возможность обработки специалистами большого потока информации;
-
формализация открывает перспективы широкого внедрения в процессы АСП ВТ.
Методика формализованного составления рефератов.
Методика формализованного реферирования предполагает
выполнение следующих технологических операций:
1. Составление Б.О.
2. Чтение текста и выделение
семантических блоков.
3. Анализ текста первичного
документа с целью выявления всех имеющихся аспектов с помощью маркеров.
4. Синтез текста
• Цель работы
• Вариант решения,
который предлагается (его особенности)
• Назначение этого
варианта
• Метод
исследования
• Место
исследования
• Экспериментальная
проверка
• Технические
средства или оборудование
• Результаты
• Выводы
• Рекомендация
• Преимущества
предлагаемого варианта
5. Редактирование реферата
6. Запись и оформление в
соответствии с гостом
Результатом формализованного реферирования является
реферат-экстракт.
Результатом использования методики формализованного
аннотирования является составление рекомендательной аннотации - вторичного
документа, не только характеризующего первичный документ с точки зрения
его назначения, содержания, вида, формы и других особенностей, но и дающего
оценку и рекомендации по его использованию. Цель рекомендательной
аннотации - заинтересовать читателя, показать значение и отличительные
особенности данной книги или статьи, привлечь внимание пользователя к
первичному документу. Практически рекомендательная аннотация выполняет функции
рекламы издания.
Методика формализованного составления
рекомендательной аннотации включает выполнение следующих
действий:
1. Составление библиографического описания
первичного документа.
2. Анализ текста первичного документа.
3. Анализ дополнительных источников информации.
4. Синтез текста.
5. Редактирование предложений, извлеченных из текста
первичного документа.
6. Запись и оформление аннотации.
Методика формализованного аннотирования публицистических
текстов (подготовка справочной аннотации).
Формализованная методика аннотирования включает:
1. Анализ текста:
• Определить жанр
на основе классификатора
• Выбрать
соответствующую аспектно-маркерную модель
• Пользуясь
маркерами выделить аспекты из содержания документа
2. Синтез:
• Выбрать
соответствующую данному жанру формулу
• Используя список
возвратных глаголов составить справочную аннотацию
3. Редактирование и исправление
текста справочной аннотации
• Трансформировать
предложение отражающее аспект “время”. Дата в аннотации должна иметь вид –
число.месяц.год.
• Трансформировать
предложение отражающее аспект “место”. Место должно указываться полным
географическим или административным понятием.
• Исключить
гипотетическую информацию
• Раскрыть значение
используемых аббревиатур
• Исключить
громоздкие предложения
• Оформить
аннотацию в соответствии с гостом