Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов : на базе корпусов текстов

  • автор:
  • специальность ВАК РФ: 10.02.21
  • научная степень: Кандидатская
  • год, место защиты: 2010, Санкт-Петербург
  • количество страниц: 211 с. : ил.
  • бесплатно скачать автореферат
  • стоимость: 240,00 руб.
  • нашли дешевле: сделаем скидку
  • формат: PDF + WORD
pdfdoc

действует скидка от количества
2 диссертации по 223 руб.
3, 4 диссертации по 216 руб.
5, 6 диссертаций по 204 руб.
7 и более диссертаций по 192 руб.
Титульный лист Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов : на базе корпусов текстов
Оглавление Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов : на базе корпусов текстов
Содержание Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов : на базе корпусов текстов
Вы всегда можете написать нам и мы предоставим оригиналы страниц диссертации для ознакомления
Оглавление
Введение
Глава 1. Явление синтагматической сочетаемости
1.1. Синтагматические отношения
1.2. Понятие сочетаемости и ее виды
1.3. Типы сочетаний
1.4. Явление устойчивости
1.5. Понятие коллокации
1.5.1. Понятие коллокации в рамках британского контекстуализма
1.5.2. Семантико-синтаксический подход к определению коллокации
1.5.3: Заключительные замечания к понятию коллокации
1.6. Синтаксический подход к описанию сочетаемости
1.6.1. Описание сочетаемости с помощь шаблонов
1.6.2. Валентность
1.6.3. Синтаксические типы словосочетаний
1.7. Выводы
Глава 2. Статистико-комбинаторные методы и программный аппарат для исследования сочетаемости
2.1. Основные понятия
2.2. Меры ассоциации
2.2.1. Мера MI
2.2.2. Мера T-score
2.2.3. Мера Log-likelihood
2.2.4. Мера Dice
2.2.5. Мера Z-score
2.2.6. Статистический аппарат в системе Sketch Engine
2.2.7. Выводы: лингвистическая оценка мер ассоциации
2.3. Программно-технологическое обеспечение для вычисления силы синтагматической связанности
2.3.1. Программные средства с возможностью поиска идиоматических оборотов без статистического аппарата
2.3.1.1.НКР Я
2.3.1.2. Alex/Alex +
2.3.1.3. Кросслексика
2.3.2. Программные средства со статистическим аппаратом для поиска словосочетаний
2.3.2.1. АОТ
2.3.2.2. Сервис для выявления коллокаций на базе корпусов Leeds
2.4. Система Sketch Engine
Глава 3. Эксперименты по выявлению устойчивых сочетаний статистическими методами
3.1. Материал и инструменты исследования
3.2. Методика исследования
3.3. Выявление коллокаций для слова «война»
3.4. Анализ выявления коллокаций с помощью мер LL, MI, t-score
3.4.1. Результаты для меры LL
3.4.2. Результаты для меры MI
3.4.3. Результаты для меры t-score
3.5. Выводы
Глава 4. Грамматика Word Sketch и выявление лексико-синтаксических сочетаний
4.1. Word Sketches как часть системы Sketch Engine
4.2. Язык регулярных выражений системы Sketch Engine
4.3. Грамматика Word Sketch (описание лексико-синтаксических шаблонов)
4.3.1. Общие постулаты
4.3.2. Описание лексико-синтаксических сочетаний для русского языка.
4.3.3 . Другие варианты описания лексико-синтаксических шаблонов для
русского языка
4.4. Эксперименты по выявлению коллокаций на основе лексикосинтаксических шаблонов
4.4.1. Материал для исследования
4.4.2. Подготовка корпуса
4.4.3. Результаты
4.5. Выводы
Заключение
Литература
Приложение
Набор тегов морфоанализатора TreeTagger для русского языка
Приложение
Лексико-синтаксические шаблоны для русского языка
Приложение
Лексико-синтаксические шаблоны для русского языка (вариант в рамках подхода В. Бенко)
Введение
Сочетаемость слов определяется различными факторами: лексическими, грамматическими и семантическими и представляет собой одно из проявлений языковой синтагматики. Существуют разные подходы к изучению синтагматических отношений. Значение слова зависит «от общественно осознанных и отстоявшихся контекстов его употребления, от конкретных лексических связей его с другими словами, обусловленных присущими данному языку законами сочетания словесных значений...» [Виноградов 19776: 163].
Широко распространен подход, при котором устойчивая сочетаемость определяется семантической совместимостью элементов данного словосочетания и/или конкретной синтаксической моделью. Еще один подход, получивший распространение в последние годы, заключается в выявлении статистических закономерностей при построении текста. Появилась возможность проверить применимость статистического метода на материале больших корпусов текстов, посмотреть, какие типы словосочетаний могут быть выделены. В российской лингвистике, вслед за западной, для обозначения устойчивых словосочетаний стал использоваться термин «коллокация».
В настоящей работе основной акцент делается на описании формальных механизмов лексико-синтаксической сочетаемости и выявления коллокаций. Внедрение данных методов в изучение сочетаемости имеет как теоретическое, так и практическое значение. Наше диссертационное исследование является своего рода объединением этих трех подходов к изучению сочетаемости: лексического (семантического), синтаксического и статистического.
Исследования, проводимые в этой области, базируются на использовании программного обеспечения, которое может представлять собой самостоятельный программный продукт или «надстройку» над корпусом текстов с использованием статистических методов. На данный момент для русского языка, к сожалению, доступно ограниченное количество подобных

COUNTER-CREATION COLLOCATION CO-CREATION
la route se rabougrit faire une promenade acheter une maison
'the road shrivels' ' 'to take a walk' 'to buy a house'
В работе другого лексикографа, автора монографии «English Dictionaries for Foreign Learners: A History» А. Кови, под коллокацией понимается «совместное появление двух или более лексических единиц как реализаций структурных элементов в данной синтаксической модели» [Cowie 1978: 132].
Таким образом, на шкале устойчивости словосочетаний коллокации можно расположить между свободными сочетаниями и идиомами. Как отмечают некоторые исследователи, последние представляют собой конечный результат процесса, при котором комбинации слов сначала стали постоянно воспроизводиться в речи, потом обрели переносное значение и в конце обрели застывшую форму [Cowie 1983]. При этом проводится различие между ограниченными коллокациями (restricted collocations), один из элементов которых имеет прямое, а другой — переносное значение: to jog somebody’s memory («пробудить в памяти»), и свободными коллокациями (open collocations), в которых элементы сохраняют свое прямое значение: fill the bucket («наполнить ведро»).
Этого же подхода придерживаются С. Каан и А. Полге [Kahane, Polguère 2001], называя коллокацией «языковой оборот, состоящий, по крайней мере, из двух частей: 1) основы коллокации (base) — полнозначной лексической единицы, которая выбирается говорящим произвольно; 2) коллоката (collocate) — лексической единицы или многословного выражения, которые выбираются лишь отчасти свободно, чтобы выразить данное значение и/или грамматическую структуру, зависящую от выбора основы».

counter-affine affine
Вы всегда можете написать нам и мы предоставим оригиналы страниц диссертации для ознакомления

Рекомендуемые диссертации данного раздела