1. ПРАКТИЧЕСКИЕ АСПЕКТЫ РАЗРАБОТКИ ОНТОЛОГИЧЕСКОЙ СЕМАНТИКИ ГЛАГОЛОВ ДВИЖЕНИЯ Е.Н. Клименко Е.Ф. Силина Санкт-Петербургский экономико-математический институт РАН
2. Цель проекта Целью проекта является представление связного повествовательного текста семантической сетью отношений между упоминаемыми в тексте объектами. Проект ориентируется на анализ сравнительно простых текстов общественно-политической тематики. Решение общей задачи базируется на формальном описании лексики русского языка в семантическом словаре. Цель данной работы C практическая отработка технологии построения формальных толкований лексики.
3. Особенности отрабатываемой технологии В качестве основы для представления семантики текстов выбрана система языков RDF / OWL . Семантическая информация о естественном языке представляется совокупностью трех информационных комплексов: базовой онтологии ; информационной базы форматов толкований ; лексикона. Семантическая сеть описывается конъюнкцией RDF -триплетов. Узлами семантической сети могут быть: имена классов базовой OWL -онтологии; имена классов C лексических значений слов текста, полученные из лексикона; имена-референты , автоматически сформированные в процессе анализа текста; узлы-переменные, сформированные в соответствии с модельной семантикой RDF .
4. Процедура разработки толкований лексических значений слов Разработка в составе OWL -онтологии системы общих классов. Разработка форматов толкований. Разработка толкований для конкретных лексических значений слов лексикона.
5. Отображение времени текста Параметры времени в тексте: время текста; точка отсчета ; момент (интервал) наблюдения. Сведения о времени протекания ситуации, привносимые морфологией: ont :В_прошлом - ситуация началась в момент времени, предшествующий моменту наблюдения ; ont :В_будущем C ситуация продолжается в момент наблюдения и завершится в будущем ; ont :НачалоСитуации-значение текущего времени текста, фиксируется как ее начало ; ont :КонецСитуации - конец интервала времени существования ситуации ; ont :Кратковременная_Ситуация C точечный интервал времени .
6. Времязависимые классы СостоянияСитуации ИзменениеПараметра УвеличениеПараметра УменьшениеПараметра СостояниеОбъект НеагентивноеДвижение НемаркированныйРезультат СостояниеСовокупность Нахождение Место Событие Бросание Удар Агентивный Процесс СостояниеЗнания ФазыСостояния ДвижениеПроцесс Бег Полет Висение Контакт ПолныйОхват Ерзание Процесс с Результатом НачалоСостояния ЗавершениеСостояния . . . . . . . . .
7. < script > < header > _: X rdf : type ont :Вверх; ont :рольИточка _: Y 6; ont :рольКточка :_ Y 5; ont :рольКаузатор _: Y 1; ont :рольОбъект _: Y 2; ont :рольМесто _ Y 3; ont :рольНачало _:T1; ont :рольОкончание _:T2. </header> <body> _:X1 rdf:type ont: Нахождение _ Место - Исходная точка _: X 2 rdf : type ont :ДвижениеПроцесс _: X 2 rdf : type ont :Нахождение_Место - Место движения _: X 3 rdf : type ont :Нахождение_Место - Конечная точка _: Y 8 rdf : type ont :РазмерДистанции; _: X 2 rdf : type ont :УвеличениеПараметра </ body > </ script > Пример структуры сценария ont :Вверх
8. Форматы толкований Сценарии АгентивноеДействие Действие с Результатом ЗамедлениеПроцесс ЗамедлениеРезультат СценарийРазмещения СценарийПеремещения СНемаркРезультатом СценарийУдаления Вверх Вниз ОбъединенСовокупность РазъединенСовокупность СобытиеДвижение ОтражениеДействия УскорениеПроцесс УскорениеРезультат КраткоеДвижение СобытиеРазмещение ОтражениеСобытия Событие с Намерением ОтражениеДвижения МногократноеКраткое МногократСобытРазмещение СобытиеПеремещение МногократСобытПеремещение СобытВверх СобытВниз
9. Пример толкования видовой пары глаголов поднять/поднимать (в значении перемещения вверх) ПОДНЯТЬ20 (20-е значение слова в словаре В.А. Тузова) Синтактика: Z 1: !Им, Z 2: !Вин, Z 3: !поДат, Z 4: !Откуда, Z 5: !Куда, Z 6: !ТвнаПред Семантика : <interpret voc:input="_: X" voc:instance="_:X" > _:X rdf:type ont: Вверх ; ont: рольИточка _:Z4; ont: рольКточка _:Z5; ont: рольКаузатор _:Z1; ont: рольОбъект _:Z2; ont: рольМесто _:Z3; ont :рольНачало _:T1; ont :рольОкончание _:T2. _ T 1 rdf : type ont :НачалоСитуации. _ T 2 rdf : type ont :КонецСитуации . </ interpret >. ПОДНИМАТЬ13 Синтактика: ´ . Семантика : ´ _ T 1 rdf : type ont :В_прошлом. _ T 2 rdf : type ont :В_будущем.
10. Заключение Серьезным, если не решающим, подспорьем в решении нашей задачи явилась таксономия лексики русского языка, разработанная В.А. Тузовым. Построенные им семантические классы оказались достаточно семантически однородными, что существенно упростило разработку методов форматирования толкований. Практика показала, что для описания примерно 2000 глаголов движения (более 60% от общего количества) хватает сравнительно небольшого количества сценариев (27). Механизм форматирования толкований оказался достаточно практичным технологическим приемом, позволяющим: C формировать критерии выявления общих таксономических характеристик определяемых смысловых значений слов; C существенно автоматизировать процесс построения толкований лексики.