Главная| Трекер ▼| Поиск| Правила| FAQ| |
Автор | Сообщение |
---|---|
Анфиса
Супермодератор ![]() Сообщения: 53544 ![]() |
Тезаурусы в задачах информационного поиска
![]() Год: 2011 Автор: Лукашевич Н.В. Издательство: МГУ ISBN: 978-5-211-05926-9 Язык: Русский Формат: DjVu Качество: Отсканированные страницы Количество страниц: 495 Описание: Книга посвящена описанию опыта автора по созданию сверхбольших лингвистических ресурсов для автоматической обработки текстов в рамках современных информационно-поисковых и информационно-аналитических систем. Предложенные методы представления знаний и обработки информации подробно сопоставляются с подобными проектами, развиваемыми в мире. В книге содержится большое количество экспериментальных данных по достигнутым в настоящее время уровням качества различных технологий автоматической обработки текстов и информационного поиска. Книга предназначена для специалистов, научных работников, аспирантов и студентов, интересующихся вопросами автоматической обработки текстов, применения в информационном поиске лингвистических ресурсов, а также информационным поиском в целом, практическими вопросами применения онтологических ресурсов. Введение 9 Часть 1 ТЕЗАУРУСЫ 19 Глава 1 ИНФОРМАЦИОННО-ПОИСКОВЫЕ ТЕЗАУРУСЫ 23 1.1. Единицы информационно-поисковых тезаурусов 24 1.2. Отношения в информационно-поисковых тезаурусах 30 1.3. Основные принципы разработки тезаурусов 37 1.4. Конкретные тезаурусы 39 1.5. Правила индексирования документов дескрипторами информационно-поискового тезауруса 43 1.6. Информационно-поисковые тезаурусы в приложениях автоматической обработки документов 47 1.7. Использование информационно-поисковых тезаурусов в автоматической обработке текстов 52 1.8. Тезаурусы и рубрикаторы в информационно-поисковых системах 57 Заключение к главе 1 59 Глава 2 ТЕЗАУРУС АНГЛИЙСКОГО ЯЗЫКА WordNet 61 2.1. WordNet: основные принципы 62 2.2. Существительные в WordNet 63 2.3. Описание прилагательных в WordNet 66 2.4. Описание глаголов в WordNet 68 2.5. Проблемы представления лексической информации в WordNet 69 Заключение к главе 2 81 Глава 3 EuroWordNet И ТЕЗАУРУСЫ ТИПА WordNet ДЛЯ РАЗНЫХ ЯЗЫКОВ 83 3.1. Общие принципы организации EuroWordNet 84 3.2. Отношения в EuroWordNet 85 3.3. Ворднеты для других языков 88 3.4. Модели представления знаний в информационно-поисковых тезаурусах и тезаурусах типа WordNet 97 Заключение к главе 3 97 Часть 2 ФОРМАЛЬНЫЕ И ЛИНГВИСТИЧЕСКИЕ ОНТОЛОГИИ .... 99 Глава 4 ОНТОЛОГИИ КАК РЕСУРСЫ ДЛЯ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ О МИРЕ 101 4.1. Определения онтологии 101 4.2. Виды онтологии 103 4.3. Два основных подхода к построению онтологии 105 4.4. Принцип независимости онтологии от естественного языка. Лингвистические онтологии 108 4.5. Онтологии и автоматическая обработка текстов 110 Заключение к главе 4 118 Глава 5 ЕДИНИЦЫ ОНТОЛОГИИ: ПОНЯТИЯ 121 5.1. Понятия как единицы мышления и понятия в онтологиях 121 5.2. Критерии для ввода нового понятия 124 5.3. Понятие и значение в лингвистических онтологиях 125 5.4. Смешение понятия и его имени в Принстонском WordNet и других ворднетах 129 5.5. Квазисинонимы в Принстонском WordNet 132 5.6. Понятие и значение в онтологии MicroKosmos 133 5.7. Понятия и значения в ресурсе FrameNet 135 5.8. Понятия и значения в информационно-поисковых тезаурусах 137 Заключение к главе 5 138 Глава 6 УСТАНОВЛЕНИЕ ОТНОШЕНИЙ В ОНТОЛОГИЯХ. ОТНОШЕНИЕ класс-подкласс 141 6.1. Проблемы установления отношения класс-подкласс 141 6.2. Возможные критерии проверки правильности установления отношения класс-подкласс 143 6.3. Смешение типов и ролей 144 6.4. Смешение отношений класс-подкласс и класс-экземпляр 146 6.5. Смешение отношений класс-подкласс и часть-целое 147 6.6. Смешение отношений класс-подкласс и отношений происхождения 148 6.7. Смешение описания сущности и знака 148 Заключение к главе 6 148 Глава 7 ОПИСАНИЕ РОЛЕЙ В КОМПЬЮТЕРНЫХ РЕСУРСАХ 151 7.1. Концепция роли в онтологических исследованиях 151 7.2. Критерии распознавания ролей 152 7.3. Типы понятий-ролей 154 7.4. Роли как части контекста 155 7.5. Представление ролей в компьютерных ресурсах 156 7.6. Роли в тезаурусах 158 Заключение к главе 7 160 Глава 8 ОТНОШЕНИЯ часть-целое 161 8.1. Определение отношения часть-целое в философии и лингвистике 162 8.2. Разнообразие отношений часть-целое 163 8.3. Классификация отношений часть-целое 163 8.4. Проблема транзитивности отношения часть-целое 165 8.5. «Вертикальные» отношения между частью и целым 167 8.6. Отношение часть-целое в компьютерных ресурсах и подходах 168 Заключение к главе 8 173 Глава 9 ОТНОШЕНИЯ ОНТОЛОГИЧЕСКОЙ ЗАВИСИМОСТИ 175 9.1. Определение и свойства отношения онтологической зависимости 175 9.2. Виды отношения онтологической зависимости 176 9.3. Онтологическая зависимость в онтологиях верхнего уровня 179 9.4. Нетаксономические отношения в информационно-поисковых тезаурусах и отношение онтологической зависимости 181 9.5. Анализ отношений ассоциации в тезаурусе EUROVOC 183 Заключение к главе 9 187 Часть 3 ПРИМЕНЕНИЕ ТЕЗАУРУСОВ В ПРИЛОЖЕНИЯХ ИНФОРМАЦИОННОГО ПОИСКА 189 Глава 10 АВТОМАТИЧЕСКОЕ РАЗРЕШЕНИЕ МНОГОЗНАЧНОСТИ 191 10.1. Тестирование разрешения многозначности на конференции Senseval 191 10.2. Подходы к разрешению лексической многозначности на основе тезаурусных знаний 195 Заключение к главе 10 198 Глава 11 ТЕЗАУРУСЫ В ИНФОРМАЦИОННОМ ПОИСКЕ 201 11.1. Модели информационного поиска 202 11.2. Оценка качества информационного поиска 207 11.3. Тезаурусы типа WordNet в информационном поиске 209 Заключение к главе 11 222 Глава 12 ТЕЗАУРУСЫ В ВОПРОСНО-ОТВЕТНЫХ СИСТЕМАХ 223 12.1. Основные этапы обработки вопросов в вопросно-ответных системах 224 12.2. Роль лексических ресурсов в работе вопросно-ответных систем 227 12.3. Предметные области вопросно-ответных систем 229 12.4. Поиск ответов на вопрос в вопросно-ответных сервисах 231 Заключение к главе 12 232 Глава 13 ТЕЗАУРУСЫ В СИСТЕМАХ АВТОМАТИЧЕСКОЙ РУБРИКАЦИИ ТЕКСТОВ 233 13.1. Методы автоматической рубрикации и оценка их качества 233 13.2. Результаты автоматического рубрицирования на исследовательских коллекциях 236 13.3. Проблемы методов классификации текстов 237 13.4. Системы автоматического рубрицирования при работе с реальными коллекциями 241 13.5. Использование тезаурусов в автоматической рубрикации текстов 244 Заключение к главе 13 247 Глава 14 МОДЕЛИРОВАНИЕ СВЯЗНОСТИ ТЕКСТА 249 14.1. Типы связности в связном тексте и их моделирование 250 14.2. Моделирование лексической связности на основе тезаурусов 256 Заключение к главе 14 271 Часть 4 ТЕЗАУРУС РуТез 273 Глава 15 ТЕЗАУРУС РуТез 275 15.1. Основные принципы разработки лингвистических ресурсов для приложений информационного поиска 275 15.2. Тезаурус РуТез: общая структура 277 15.3. Соотношение лексики и терминологии. Общественно-политическая область 278 15.4. Общественно-политический тезаурус в сравнении с традиционными информационно-поисковыми тезаурусами 290 Заключение к главе 15 291 Глава 16 ЕДИНИЦЫ: ПОНЯТИЯ И ИХ ТЕКСТОВЫЕ ВХОДЫ 293 16.1. Понятия vs. синсеты как единицы тезауруса 294 16.2. Имя понятия и толкование 296 16.3. Ввод понятий для группы близких по смыслу слов 296 16.4. Ввод понятий для группы близких значений одного слова 301 16.5. Словосочетания как источники понятий в лингвистической онтологии 307 16.6. Языковые выражения как текстовые входы понятий 314 Заключение к главе 16 322 Глава 17 ОТНОШЕНИЯ МЕЖДУ ПОНЯТИЯМИ В ТЕЗАУРУСЕ РуТез 325 17.1. Принципы описания отношений 327 17.2. Описание родовидовых отношений в тезаурусе РуТез 328 17.3. Отношение часть-целое 332 17.4. Отношение онтологической зависимости в тезаурусе РуТез 339 17.5. Симметричные ассоциации в тезаурусе РуТез 344 17.6. Модификаторы отношений: нарушение условий надежности 345 17.7. Примеры описания отношений 346 17.8. Тезаурус РуТез как структура 351 Заключение к главе 17 353 Заключение к части 4 354 Часть 5 ТЕЗАУРУС РуТез В КОМПЬЮТЕРНЫХ ПРИЛОЖЕНИЯХ 357 Глава 18 ПОСТРОЕНИЕ ТЕЗАУРУСНОГО ИНДЕКСА, АВТОМАТИЧЕСКОЕ РАЗРЕШЕНИЕ ЛЕКСИЧЕСКОЙ МНОГОЗНАЧНОСТИ 359 18.1. Построение тезаурусного индекса и тезаурусной проекции 359 18.2. Автоматическое разрешение многозначности 362 18.3. Организация тестирования алгоритмов разрешения многозначности 369 Заключение к главе 18 373 Глава 19 ОБЩЕСТВЕННО-ПОЛИТИЧЕСКИЙ ТЕЗАУРУС КАК СРЕДСТВО ПОСТРОЕНИЯ ТЕМАТИЧЕСКОГО ПРЕДСТАВЛЕНИЯ ТЕКСТА 375 19.1. Проблемы автоматического построения лексических цепочек 375 19.2. Автоматическое построение тематического представления текста 379 Заключение к главе 19 392 Глава 20 ИНФОРМАЦИОННЫЙ ПОИСК С УЧЕТОМ ТЕЗАУРУСНЫХ ЗНАНИЙ 395 20.1. Концептуальный индекс, веса понятий и отношений 395 20.2. Общественно-политический тезаурус как поисковое средство в Университетской информационной системе РОССИЯ 397 20.3. Тестирование эффективности информационного поиска на основе Общественно-политического тезауруса 401 20.4. Тезаурус и векторная модель в задаче поиска по коллекции нормативно-правовых актов РОМИП 404 20.5. Поиск документов по запросам типа «формулировка проблемы» в правовой области 407 Заключение к главе 20 414 Глава 21 ОБЩЕСТВЕННО-ПОЛИТИЧЕСКИЙ ТЕЗАУРУС КАК РЕСУРС ДЛЯ АВТОМАТИЧЕСКОЙ РУБРИКАЦИИ ТЕКСТОВ 415 21.1. Технология автоматического рубрицирования на основе .тезауруса 415 21.2. Описание смысла рубрики понятиями тезауруса 416 21.3. Автоматическое рубрицирование на тематическом представлении 418 21.4. Использование информеров для составления описаний рубрик при инженерном подходе рубрикации 419 21.5. Эксперимент по автоматической рубрикации текстов в рамках семинара РОМИП 2007 422 21.6. Тезаурус как база для методов машинного обучения в рубрикации 424 Заключение к главе 21 426 Глава 22 ОБЩЕСТВЕННО-ПОЛИТИЧЕСКИЙ ТЕЗАУРУС И АВТОМАТИЧЕСКОЕ АННОТИРОВАНИЕ 429 22.1. Автоматическое аннотирование одного текста на основе тематического представления 429 22.2. Построение структурной тематической аннотации текста 433 22.3. Построение аннотации для новостного кластера на основе тематического представления текстов кластера 436 Заключение к главе 22 446 Часть 6 РАЗВИТИЕ ТЕЗАУРУСА РуТез И ДРУГИЕ ЛИНГВИСТИЧЕСКИЕ ОНТОЛОГИИ 449 Глава 23 РАЗВИТИЕ И ПОПОЛНЕНИЕ ТЕЗАУРУСА РуТез 451 23.1. Этапы развития тезауруса РуТез 451 23.2. Первичное наполнение Общественно-политического тезауруса 453 23.3. Пополнение тезауруса в результате работы в компьютерных приложениях 454 23.4. Пополнение тезауруса на основе анализа списка русскоязычных лемм 455 23.5. Пополнение Общественно-политического тезауруса за счет проникновения в профессиональные области 457 23.6. Тезаурус РуТез: создание двуязычной онтологии 458 Заключение к главе 23 462 Глава 24 ОНТОЛОГИЯ ПО ЕСТЕСТВЕННЫМ НАУКАМ И ТЕХНОЛОГИЯМ 463 24.1. Проблемы разработки онтологии в сфере естественных наук 463 24.2. Этапы создания онтологии ОЕНТ 465 24.3. Текущее состояние проекта 469 24.4. Изменения в описаниях понятий, полученных из тезауруса РуТез 469 24.5. Будущее развитие онтологии ОЕНТ 477 Заключение к главе 24 478 ЗАКЛЮЧЕНИЕ 479 ЛИТЕРАТУРА 483 Помоги нашему сайту на расходы за сервер и качай торренты НЕОГРАНИЧЕННО!Пожертвовать 100 ₽ ![]() Или 2204 1201 2214 8816, с комментарием "Помощь трекеру" Связь с администрацией |
Страница 1 из 1 |
![]() |
|