Как называется упорядоченный словарь дескрипторов

Дескрипторный словарь

Смотреть что такое «Дескрипторный словарь» в других словарях:

дескрипторный словарь — Словарь дескрипторного информационно поискового языка, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы без указания других отношений лексических единиц. Примечание Дескрипторный словарь является упрошенным вариантом… … Справочник технического переводчика

дескрипторный словарь — Словарь дескрипторного информационно поискового языка, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы без указания других отношений лексических единиц. Примечание Дескрипторный словарь является упрощенным вариантом… … Словарь по информации, библиотечному и издательскому делу

дескрипторный словарь — 6.2.8 дескрипторный словарь: Словарь дескрипторного информационно поискового языка, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы без указания других отношений лексических единиц. Источник … Словарь-справочник терминов нормативно-технической документации

Дескрипторный информационно-поисковый язык — информационно поисковый язык, предназначенный для координатного индексирования документов и информационных запросов посредством дескрипторов и/или ключевых слов. По английски: Descriptor language Синонимы: Информационно поисковый язык… … Финансовый словарь

дескрипторный — прил. 1. соотн. с сущ. дескриптор, связанный с ним 2. Свойственный дескриптору, характерный для него. Толковый словарь Ефремовой. Т. Ф. Ефремова. 2000 … Современный толковый словарь русского языка Ефремовой

ГОСТ 7.74-96: Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения — Терминология ГОСТ 7.74 96: Система стандартов по информации, библиотечному и издательскому делу. Информационно поисковые языки. Термины и определения оригинал документа: 7.8 автоматизированное индексирование : Индексирование, технология которого… … Словарь-справочник терминов нормативно-технической документации

Источник

дескрипторный словарь

Смотреть что такое «дескрипторный словарь» в других словарях:

Дескрипторный словарь — словарь дескрипторного информационно поискового языка, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы без указания других отношений лексических единиц. Дескрипторный словарь является упрощенным вариантом информационно… … Финансовый словарь

дескрипторный словарь — Словарь дескрипторного информационно поискового языка, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы без указания других отношений лексических единиц. Примечание Дескрипторный словарь является упрошенным вариантом… … Справочник технического переводчика

дескрипторный словарь — 6.2.8 дескрипторный словарь: Словарь дескрипторного информационно поискового языка, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы без указания других отношений лексических единиц. Источник … Словарь-справочник терминов нормативно-технической документации

Дескрипторный информационно-поисковый язык — информационно поисковый язык, предназначенный для координатного индексирования документов и информационных запросов посредством дескрипторов и/или ключевых слов. По английски: Descriptor language Синонимы: Информационно поисковый язык… … Финансовый словарь

дескрипторный — прил. 1. соотн. с сущ. дескриптор, связанный с ним 2. Свойственный дескриптору, характерный для него. Толковый словарь Ефремовой. Т. Ф. Ефремова. 2000 … Современный толковый словарь русского языка Ефремовой

ГОСТ 7.74-96: Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения — Терминология ГОСТ 7.74 96: Система стандартов по информации, библиотечному и издательскому делу. Информационно поисковые языки. Термины и определения оригинал документа: 7.8 автоматизированное индексирование : Индексирование, технология которого… … Словарь-справочник терминов нормативно-технической документации

Источник

Как называется упорядоченный словарь дескрипторов

1.6.4. ИНФОРМАЦИОННО-ПОИСКОВЫЕ ЯЗЫКИ, СЛОВАРНЫЕ СРЕДСТВА

Искусственный язык, предназначенный для формализованного описания смыслового содержания документов, данных, отдельных понятий или терминов и обеспечения последующего их поиска в информационно-поисковых массивах.

Формализация лексики и создание различных ИПЯ вызвано необходимостью устранения «избыточности» и «недостаточности» естественного языка для целей информационного поиска, а также ликвидации присутствующий в нем синонимии и омонимии (см. ниже) для реализации «однозначности» информационного поиска.

Каждый тип языковых средств включает в себя: алфавит и микро синтаксис (графические средства представления данных), лексику с парадигматикой (отражаемых словарями) и синтаксис, который для языков описания может быть представлен в виде наборов форматов.

По области или по сфере применения информационно-поисковых языков можно выделить:

ПРЕДКООРДИНАТНЫЕ ИПЯ (ИПЯ КЛАССИФИКАЦИОННОГО ТИПА )

ПОСТКООРДИНАТНЫЕ ИПЯ (ИПЯ ДЕСКРИПТОРНОГО ТИПА )

ИПЯ, построенные на принципах посткоординации (см. ниже). Эти языки представлены различного вида “тезаурусами ”, а также “ключевыми словами «.

Термины, связанные с посткоординатными ИПЯ:

1. Упорядоченный перечень слов, словосочетаний, терминов, символических имен или наименований, знаков с указанием их значений или толкований или без них. Важным требованием к словарям, используемым в автоматизированнных системах является устранение “синонимии” и “омонимии ” для обеспечения “точности” и “полноты ” поиска;

2. В автоматизированных информационных системах “словарь” это структура данных, обеспечивающая доступ к БД и отдельным записям по их текстовому имени.

Понятия и термины, связанные со словарями:

Система правил построения и описания естественного или искусственного языка, в том числе правил словообразования и построения словосочетаний (см. синтаксис) ИПЯ.

С грамматикой связаны следующие термины:

Форма связи между объектами, выражающая то что их объединяет. Различают отношения: парадигматические, синтагматические, ассоциативные, семантические и др. (см. ниже).

Виды отношений и связанные с ними термины:

1. Разновидность парадигматических отношений (см. ниже), отражающих представление пользователя о взаимосвязи понятий, которые они отображают. Часто под ассоциативными отношениями понимаются все виды парадигматических отношений кроме отношений типа: «вид-род» и «часть-целое». Так же как и парадигматические отношения они являются внетекстовыми и служат для реализации конкретных задач пользователей;

Некоторые дополнительные термины, связанные с видами ИПЯ:

1.6.5. ИНДЕКСИРОВАНИЕ И КОДИРОВАНИЕ ДАННЫХ

1. Условный знак (в т.ч. слово, словосочетание, цифра, буквенный или буквенно-цифровой код и т.п.), обозначающий определенное понятие и используемый для записи результатов классифицирования а также идентификации объектов поиска в информационно-поисковых массивах;

2. Указатель адреса ;

4. Совокупность указателей, при помощи которых можно найти запись в файле данных;

5. Уровень в иерархической структуре системы многоуровневого индекса (см. ниже).

Виды индексов, связанных с их структурой:

В зависимости от характера используемой системы знаков различают:

В зависимости от структуры и организации записи различают:

1. Индекс, образованный в результате объединения нескольких, каждый из которых сохраняет свое основное значение:

2. Индекс, в качестве которого используется комбинация атрибутов (см. «Реляционная модель «);

В вычислительных системах элементы нижнего уровня многоуровневого индекса, также как элементы т.н. одноуровневых индексов (т.е. не являющихся многоуровневыми) непосредственно указывают на отдельную запись или группу записей. Элементы верхних уровней многоуровневого индекса указывают на группу элементов более низкого уровня. Использование многоуровневых индексов производится в тех случаях, когда время поиска по одноуровневым индексам оказывается недопустимо большим;

В зависимости от уровня приоритетности различают:

В зависимости от характера индексируемых объектов и/или назначения ин декса различают:

1. Метод, обеспечивающий возможность обращения к элементу массива с помощью указания массива и выражений, определяющих местоположение этого элемента в массиве:

2. Система (совокупность) индексов, используемая для индексирования (см. ниже) и соответствующая определенной системе классификации.

Примечание: В указанных выше определениях понятия «индексация» оно ни коим образом не обозначает процесс и его нельзя смешивать с понятием «индексирование»! 1. Автоматическое определение истинного адреса путем сопоставления содержимого индексного регистра с адресной частью команды.

Различаются следующие виды индексации:

В зависимости от характера используемого ИПЯ различают предкоординатное индексирование и координатное (посткоординатное) индексирование, в т.ч. свободное индексирование (разновидность координатного индексирования производимого ключевыми словами, т.е. без использования какого-либо словаря). В зависимости от полноты учета разнородных признаков индексируемого материала (объекта индексирования) различают «одноаспектное» и «многоаспектное» индексирование (см. ниже).

Процесс индексирования включает:

1. Анализ содержания индексируемого материала и выбор из него т.н. номинативных лексических единиц, существенных для его понимания;

2. Формирование перечня ключевых слов, используемых при свободном индексировании ;

3. Нормализацию ключевых слов по форме и содержанию при помощи словаря используемого ИПЯ пред- или посткоординатного типа;

4. Избыточное индексирование (см. ниже);

5. Заполнение рабочего листа с введением в него грамматических средств.

В зависимости от объекта и содержания процесса индексирования его результатами являются: поисковый образ документа (ПОД), поисковый образ лексической единицы (ПОЛЕ), поисковый образ запроса (ПОЗ) или поисковое предписание (ПП).

Источник

Структура дескрипторного словаря и его использование в информационно-поисковой системе

Как называется упорядоченный словарь дескрипторов. 1473358176i6ki8. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-1473358176i6ki8. картинка Как называется упорядоченный словарь дескрипторов. картинка 1473358176i6ki8

СТРУКТУРА ДЕСКРИПТОРНОГО СЛОВАРЯ И ЕГО ИСПОЛЬЗОВАНИЕ В ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЕ

Краткая характеристика дескрипторного словаря

В дескрипторный словарь включены термины, выбранные на основе статистического анализа их частотного повторения в десяти тысячах документов, относящихся к различным научно-техническим дисциплинам горного дела (шахтная геология, системы разработок, рудничное крепление и управление горным давлением, проведение горных выработок, буровзрывные работы, рудничный транспорт, открытые работы, водоотлив и водоосушение, вентиляция и горноспасательное дело, обогащение и др.).

Кроме специальных терминов, в словаре имеются общетехнические и общенаучные термины, используемые в горнотехнической литературе (автоматизация, величина, коэффициент, механизм и др.). И, наконец, в словарь включены отдельные слова естественного языка (вода, воздух, земля, рабочий и т. д.), необходимые для раскрытия предметного содержания информационных документов по горному делу.

Помимо указанных слов в словарь введены обозначения различных единиц измерения, встречающихся в горном деле (ватт, вольт, градус и др.), а также все цифры от 0 до 9.

Кроме содержания, синонимы могут различаться по своей структуре. Здесь возможны следующие случаи.

1. Термин, выраженный одним словом, синонимичен термину, выраженному также одним словом (котловина – мульда, аккумуляция – накопление, гидросмесь – пульпа и т. д.).

3. Термин, выраженный сочетанием слов. Синонимичен другому термину, выраженному также сочетанием слов (аппарат газотеплозащитный – скафандр тепловой, волна взрывная – волна ударная, разубоживание истинное – коэффициент разубоживания).

Словарь снабжен двусторонней системой ссылки, позволяющей легко отыскать синонимичные слова. Все синонимы в словаре получили одинаковые кодовые обозначения, в результате этого они имеют одинаковое кодовое значение в информационно-поисковой системе.

Связанные термины – это термины не синонимичные, но близкие по значению дескрипторы, например: аварийность – авария, водопонижение – осушение, выемка – добыча, гидромеханизация – способ гидравлический.

Термины вышестоящие – обозначают родовое, более общее понятие, по отношению к которому данный дескриптор является более узким, видовым, например: комбайн добычный – вышестоящий термин – машина выемочная.

Поясняющие характеристики – перечисляют не все возможные разновидности дескриптора, а только те из них, которые представляют интерес для данной информационно-поисковой системы. Они располагаются в алфавитном порядке в конце дескрипторной ассоциации после основного дескриптора и относящихся к ним синонимов, а также связанных и вышестоящих терминов.

Наличие в дескрипторной ассоциации поясняющих характеристик дает возможность индексатору в случае надобности дополнить описание поискового образа документа характеристиками недостающими в этом документе.

Одни и те же поясняющие характеристики могут уточнить различные основные дескрипторы, например: характеристика «воздушный» используется для уточнения дескрипторов «забой», «система», «струя», «пульсатор»; характеристика «ударные» для дескрипторов «бурение», «вязкость», «механизмы» и т. д.

Включенные в словарь термины и слова естественного языка, за которыми закреплены определенные научно-технические понятия, необходимые для описания документа, названы дескрипторами.

Термины и слова естественного языка, которые обладают систематизирующими свойствами (обычно они выражены именами существительными) и имеют самостоятельное значение для поиска информации, в информационно-поисковой системе принято называть базисными или основными дескрипторами (крепь, штрек, зарядник и т. п.).

Однако основные дескрипторы, имея большие систематизирующие свойства, сами нуждаются в уточнении некоторыми характеристиками. Например, основной дескриптор – крепь – имеет 53 характеристики: анкерная, деревянная, металлическая, забивная, податливая, тюбинговая, шагающая и т. д.

Характеристики, как правило, самостоятельного значения для поиска информации не имеют. Чтобы не увеличивать объема словаря, отдельные характеристики, которые относятся ко многим основным дескрипторам, вынесены в разряд базисных, например механический, автоматический, воздушный и т. д.

Основные дескрипторы в тексте документа вступают в взаимосвязь не только между собой (крепление – штрек), но и между своими характеристиками (крепление – крепь металлическая – штрек однопутевой). В этом случае происходит образование новых дескрипторов; крепь металлическая, штрек однопутевой.

Информационно-поисковая система (ИПС) и средства ее реализации обеспечивают возможность осуществления поиска не только по основному дескриптору или их совокупности, но и по вновь образуемым дескрипторам.

Дескрипторный словарь представлен двумя частями: собственно словарь, который состоит из расположенных в алфавитном порядке дескрипторных ассоциаций, и индикаторный словарь. Каждая ассоциация в словаре может включать основной дескриптор, вышестоящий дескриптор (он указывает на родовую связь основного дескриптора с ним), связанный дескриптор, синонимы основного дескриптора, а затем его характеристики, их синонимы и базисные отношения.

Синонимы – термины, в той или иной степени равнозначные данному дескриптору или его характеристике (если они приводятся следом за ними).

Имеются несколько разновидностей синонимов. По содержанию синонимы подразделяются на полные и относительные. Полные синонимы – это термины, которые могут взаимозамещать друг друга в любых ситуациях в пределах данной информационно-поисковой системы. Например, аккумуляция – накопление, асбест – лен горный и т. д.

Относительные синонимы – термины, которые могут замещать друг друга не всегда, а только в определенных случаях, например: бункер и емкость, величина и размер.

Кодовый указатель представляет собой список расположенных в алфавитном порядке дескрипторов и поясняющих их характеристик, включенных в дескрипторный словарь. В том случае, если одна и та же характеристика входит в несколько дескрипторных ассоциаций, в индикаторном словаре она указывается только один раз.

При составлении индикаторного словаря соблюдались следующие правила словесного оформления. Имена существительные в словаре записаны в форме именительного падежа единственного числа*, имена прилагательные – в форме именительного падежа единственного числа мужского рода. Если среди слов, используемых в указателе, встречаются омонимы (т. е. два слова, одинаковых по произношению и написанию, но различных по значению), то значение этих слов поясняется соответствующими пометками, например: рабочий (сущ.), рабочий (прил.), простой (сущ.), простой (прил.).

В связи с тем, что при индексировании могут встретиться трудности в кодировании синонимов, ниже рассмотрены способы кодирования всех трех случаев структурных разновидностей синонимов.

3. Терминологические сочетания, синонимичные друг другу, в индикаторном словаре имеют одинаковые индексы, в то время как их составные компоненты имеют другие индексы, например: индекс синонимичных дескрипторов «склад дверной» и «крепь штрековая» будет 02246, а индексом составных компонентов соответственно будут 04163, 01414, 03011, 10426.

Для облегчения процесса индексирования в индикаторном словаре помещены все связанные и вышестоящие термины, относящиеся к основному дескриптору. В том случае, если связанные и вышестоящие дескрипторы относятся к дескриптору, выраженному словосочетанием, то у основного дескриптора поставлен знак «+».

Особый случай представляет кодирование относительных синонимов. Принято тот термин, который обладает более широким объемом содержания, разбивать на два термина меньшего объема содержания, один из которых синонимичен другому термину, а второй не является его синонимом. Например, термин»газ горючий» разбивается на два термина.

Термин «газ горючий», синонимичный термину, «горючее газообразное», получающий общее с ним кодовое обозначение.

* В некоторых случаях имена существительные ставятся в форме множественного числа, например: аппараты (как предметы) в отличие от аппарата (административный), чаши бегунные (употребительная форма этого термина).

2. термин «газ горючий», не синонимичный термину «горючее газообразное» и имеющий отличительный от него код.

Содержание документа описывается путем выбора из него наиболее существенных характеристик. Такими характеристиками являются слова, отражающие предметное содержание документа. К ним относится большинство имен существительных, имен прилагательных и причастий, встречающихся в следующих частных документах: а) заглавий; б) первой фразе, если она не начинается со слова «отмечается»; в) в последующих фразах, которые содержат сказуемые, указанные в списке. Причем, сказуемые приведены к одной форме глагола, одному времени и числу, в то время как в тексте могут встретиться сказуемые с другими грамматическими признаками.

Имена существительные, прилагательные и причастия, которые не связаны непосредственно с предметным содержанием документа, не выписываются.

Другие части речи (местоимения, глаголы, большинство числительных, деепричастия, наречия, предлоги и союзы) из обрабатываемого документа не выписываются, так как они обычно не отражают его предметного содержания.

В некоторых случаях может появиться необходимость выписывать другие части речи, если они нужны для отражения предметного содержания документа(например, наречия «больше», «меньше», предлог «без» и т. д.).

Имена существительные выписываются в форме именительного падежа единственного числа, имена прилагательные и причастия выписываются ниже существительных в форме именительного падежа и согласуются в роде с теми именами существительными, к которым относятся, например: «клеть подъемная», «зона обогащенная».

Если в документе встречаются неделимые терминологические сочетания (т. е. такие сочетания, которые теряют свое специальное терминологическое значение при расчленении их на отдельные слова), то они выписываются целиком, например: лен горный, мельница чилийская, единица измерения, закон Дарси, счетчик Гейгера-Мюллера, шкала профессора Протодьякова и т. д.

Встречающиеся в тексте названия бассейнов, марки комбайнов и наименования некоторых единиц измерения (а отдельных и числовые значения: мощность пласта, угол падения пласта) выделяются как характеристики документа.

Кроме того, для каждого обрабатываемого документа указываются его форма (статья, патент, обзор); характер публикации (научно-исследовательская работа, лабораторные, полупромышленные испытания, опыт, проект, теория, схема, методика); на каком языке напечатан оригинал текста и год его издания.

Не учитываются в качестве характеристики документа встречающиеся в нем названия комбинатов, трестов, шахт, моделей машин и их деталей.

Из обрабатываемого документа выписывается не более 20 характеристик, причем каждая характеристика выписывается только один раз. Предметные характеристики записываются на карту характеристик. Карта разделена на четыре поля (поля показаны на карте), в каждом из которых отмечаются следующие данные:

в I поле характеристика из текста, передающие предметное содержание документа;

во II поле – цифровые обозначения характеристик в восьмеричной системе счисления, списанные из индикаторного словаря;

Характеристики записываются в столбце в том порядке, как они встречаются в тексте. Форма публикации, ее характер, язык и год издания отмечаются в конце карты после основных характеристик. В левом верхнем углу карты проставляется инвентарный номер информационного документа. Ниже показан реферат с последующей его обработкой на карте характеристик.

На шахтах комбината «Луганскуголь» для передвижки изгибающихся конвейеров КСП-1м, СП-46, СП-48, СП-63 широко применяются переносные гидравлические домкраты ДГ-2. В качестве привода домкрата используется электросверло СЭР-19Д. Стан конвейера передвигается участками по 7-10 м. независимо от работы комбайна по мере продвижения его по лаве. При ходе поршня домкрата, равном 725 мм. И полезном захвате комбайна 1,45м. передвижка каждого участка стана конвейера выполняется в 2 этапа. Домкрат размещается со стороны выработанного пространства таким образом, чтобы выдвинутый щиток его соприкасался непосредственно с бортом конвейера, а с противоположной стороны от конвейера на специальную опору корпуса домкрата устанавливается упорная стойка. Имея небольшой вес (13 кг.), домкрат легко переносится по лаве. Использование изгибающихся конвейеров в комплексе с домкратами ДГ-2 позволяет значительно сократить продолжительность подготовительной смены или ликвидировать ее совсем, улучшить организацию работ и резко повысить производительность труда.

Источник

Словарь

Как называется упорядоченный словарь дескрипторов. dark fb.4725bc4eebdb65ca23e89e212ea8a0ea. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-dark fb.4725bc4eebdb65ca23e89e212ea8a0ea. картинка Как называется упорядоченный словарь дескрипторов. картинка dark fb.4725bc4eebdb65ca23e89e212ea8a0ea Как называется упорядоченный словарь дескрипторов. dark vk.71a586ff1b2903f7f61b0a284beb079f. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-dark vk.71a586ff1b2903f7f61b0a284beb079f. картинка Как называется упорядоченный словарь дескрипторов. картинка dark vk.71a586ff1b2903f7f61b0a284beb079f Как называется упорядоченный словарь дескрипторов. dark twitter.51e15b08a51bdf794f88684782916cc0. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-dark twitter.51e15b08a51bdf794f88684782916cc0. картинка Как называется упорядоченный словарь дескрипторов. картинка dark twitter.51e15b08a51bdf794f88684782916cc0 Как называется упорядоченный словарь дескрипторов. dark odnoklas.810a90026299a2be30475bf15c20af5b. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-dark odnoklas.810a90026299a2be30475bf15c20af5b. картинка Как называется упорядоченный словарь дескрипторов. картинка dark odnoklas.810a90026299a2be30475bf15c20af5b

Как называется упорядоченный словарь дескрипторов. caret left.c509a6ae019403bf80f96bff00cd87cd. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-caret left.c509a6ae019403bf80f96bff00cd87cd. картинка Как называется упорядоченный словарь дескрипторов. картинка caret left.c509a6ae019403bf80f96bff00cd87cd

Как называется упорядоченный словарь дескрипторов. caret right.6696d877b5de329b9afe170140b9f935. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-caret right.6696d877b5de329b9afe170140b9f935. картинка Как называется упорядоченный словарь дескрипторов. картинка caret right.6696d877b5de329b9afe170140b9f935

Словарь является основной частью всех информационно-поисковых языков. В качестве лексических единиц в дескрипторных ИПЯ выступают дескрипторы – имена понятий или классов понятий, которые явно перечисляются в дескрипторном словаре. В обычном понимании – это слова (или словосочетания), выбранные в качестве представителей классов условной эквивалентности – групп синонимичных слов и словосочетаний. Как правило, это существительные или номинативные выражения. Связь номинации с понятиями давно осознана в языкознании. То же понимание утвердилось и в информатике: “Номинативная группа как наиболее общая речевая форма представления понятия в тексте рассматривается … как фундаментальное для методов автоматической обработки текстов явление”. “Объектный характер назывных слов роднит их с понятиями. Лексические значения, как и понятия, это своего рода, умственные “концентраторы”, сгустки человеческих знаний об определенных фрагментах и сторонах окружающей нас действительности”.

Дескрипторный словарь представляет собой нормативный словарь, в котором в алфавитном порядке приведены все важнейшие ключевые слова данной предметной области с соответствующими пометами. Если в качестве имен понятий выбираются слова естественного языка, то существуют специальные способы для устранения полисемии и омонимии слов. Например, в системах с ручным (интеллектуальным) индексированием для этого используются специальные пометы: нос (орган обоняния) – нос (передняя часть судна, самолета); линь (рыба) – линь (мор. канат). Можно просто перенумеровать омонимы, оговорив в словаре их значения: нос1 – нос2; линь1 – линь2.

Дескрипторный словарь используется как инструмент лексического контроля при индексировании документов и запросов. Термин “лексический контроль” (ЛК) имеет синоним “словарный контроль”, так как для семантического нормирования ЛЕ ИПЯ используется словарь индексирования, или дескрипторный словарь, в котором в явном виде перечислены все важнейшие ключевые слова и дескрипторы, объединенные в классы условной эквивалентности. Лексический контроль – это совокупность мер, принимаемых при координатном индексировании с целью сокращения до минимума отрицательных последствий неоднозначного и неединообразного употребления слов ЕЯ.

Суть лексического контроля, осуществляемого с помощью словаря индексирования, в основном сводится к контролю синонимии и разрешению омонимии.

Кратко коснемся каждой из составляющих ЛК.

1) Контроль синонимии является главной функцией ЛК в ИПС. Он заключается в том, что все синонимы текста в ПОД и ПОЗ представляются одной и той же лексической единицей – дескриптором. В число синонимов включаются:

– полные синонимы (радар – радиолокатор, ЭВМ – компьютер);

– фонетические (графические) варианты слов ( секстан – секстант, center – centre, labor – labour, Chekhov – Tchekhov);

– аббревиатуры (ИПС – информационно-поисковая система);

– слова, близкие по смыслу (отсечка – отсечение, магнитный диск – магнитная память, ОРЗ – простуда);

– слова, совпадающие по смыслу в одном из значений (компьютер – машина, статья – работа, перепись – перезапись).

Иногда к синонимам относят и антонимы (“квазисинонимы”) (жесткость – мягкость, фокусировка – дефокусировка).

Иногда в один класс условной эквивалентности сводятся не только грамматические формы одной лексемы, но и разноосновные и относящиеся даже к разным частям речи лексемы, объединяемые общим лексическим значением, например: трелевка – трелевочный, сверло – сверление. Л.В.Сахарный назвал такие единицы “гиперлексемами”.

2) ЛК призван также обеспечить различение омонимов (омографов) и многозначных слов. Это достигается присвоением им различных цифровых кодов (в первых дескрипторных ИПЯ, лексика которых записывалась с помощью цифрового алфавита) или системой помет, например:

конденсаторы (для пара) – конденсаторы (электрические), литье (предмет) – литье (процесс), меркурий (металл) – Меркурий (планета).

Как называется упорядоченный словарь дескрипторов. 640 1. Как называется упорядоченный словарь дескрипторов фото. Как называется упорядоченный словарь дескрипторов-640 1. картинка Как называется упорядоченный словарь дескрипторов. картинка 640 1

Между лексическими единицами ИПЯ могут быть установлены различные отношения. Обычно их включают в грамматику. Однако те из них, которые не зависят от контекста и фиксируются в словаре, могут рассматриваться как семантические характеристики лексических единиц и относиться к словарю. Такие отношения называют базовыми, или парадигматическими, или аналитическими. Дескрипторный словарь (нормативный словарь индексирования) с зафиксированными в нем парадигматическими отношениями (подробнее см. следующий раздел – «Грамматика ИПЯ») называется информационно-поисковым тезаурусом (ИПТ), или просто тезаурусом. Целью создания ИПТ является повышение показателей качества поиска информации.

“Информационно-поисковый тезаурус – контролируемый словарь лексических единиц дескрипторного языка, основанный на лексике естественного языка, отображающий семантические отношения между лексическими единицами и предназначенный для организации поиска информации путем индексирования документов и/или запросов”.

В лексическом составе ИПТ выделяют дескрипторы и аскрипторы. Дескриптор – это лексическая единица ИПТ, предназначенная для использования в поисковых образах документов и/или запросов. Аскриптор (недескриптор) – лексическая единица ИПТ, которая в поисковых образах документов (запросов) подлежит замене на дескриптор при поиске или обработке информации.

Форма представления тезауруса определяется требованиями удобства пользования. Она должна обеспечивать нахождение нужной по смыслу ЛЕ и всех ЛЕ, с ней связанных.

Чаще всего ИПТ имеет две части.

Словарная часть (собственно тезаурус), представляющая собой алфавитный список дескрипторов вместе с их словарными статьями (гнездами).

Словарная статья обычно содержит:

заглавный дескриптор (прописными буквами);

ключевые слова или словосочетания, входящие в гнездо данного дескриптора (условные синонимы) (строчными буквами);

“вышестоящие” дескрипторы (находящиеся с данным в отношении “род–вид”, “часть–целое”);

“нижестоящие” дескрипторы (находящиеся с заглавным дескриптором в отношении “вид–род”, “целое–часть»);

ассоциативные (ассоциированные) дескрипторы (связанные с данным другими разнообразными отношениями, как-то: причина–следствие, сырье–продукт, процесс–объект, процесс–субъект, свойство–носитель свойства, функциональное сходство).

Указанные подмножества обычно приводятся с пометами, чаще всего:

Также встречаются и другие пометы и знаки:

«см.» – смотри (отсылка к соответствующему заглавному дескриптору);

«исп к» – использует комбинацию (в случаях замены ключевого слова сочетанием двух или более дескрипторов);

«исп а» – использует альтернативу (в случае многозначного ключевого слова, заменяемого одним из двух или более дескрипторов);

«ср» – сравни (для многозначных слов внутри дескрипторного гнезда, которые могут заменяться не только данным дескриптором);

( ) – в скобках уточняется лексическое значение дескриптора (для омонимов) или ограничение области использования.

2. Указатели различных видов, облегчающие пользование тезаурусом (алфавитный указатель всех ключевых слов, пермутационный указатель для элементов словосочетаний, частотный указатель и др.).

Пример дескрипторной статьи из Тезауруса по информатике:

с документальные информационно-поисковые системы

ср документально-фактографические ИПС

н БИБЛИОГРАФИЧЕСКИЕ ИПС

а ДОКУМЕНТАЛЬНАЯ ИНФОРМАЦИЯ

Еще один пример из двуязычного Тезауруса по сохранности документов:

Принципы построения тезауруса широко описаны в литературе и могут быть сведены к следующим:

1) ни одно редко встречающееся понятие не надо включать в тезаурус;

2) служебные (незначащие) слова в тезаурус не включаются;

3) термины слишком общего значения с высокой частотой встречаемости должны быть исключены из словаря;

4) у неоднозначных терминов должны быть закодированы только те их значения, в которых они встречаются в фонде обрабатываемых документов.

Помимо лексико-семантической нормализации, в ИПС всех типов необходима морфологическая нормализация лексических единиц текста (ИПЯ) – приведение всех словоформ одной и той же лексической единицы к некоторому стандартному, каноническому виду. В системах с ручным индексированием эта задача решается индексатором на уровне составления ПОД и ПОЗ. В остальных случаях разрабатываются автоматизированные методы учета словоизменения (см. об этом в разделе 2.4 «Языки запросов»).

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *