Категории рода и падежа в теоретико-множественных моделях языков

Рефераты, курсовые, дипломные, контрольные (предпросмотр)

Тип: Курсовая работа. Файл: Word (.doc) в архиве zip. Категория: Культурология
Адрес этого реферата http://referat-kursovaya.repetitor.info/?essayId=21265 или
Загрузить
В режиме предпросмотра не отображаются таблицы, графики и иллюстрации. Для получения полной версии нажмите кнопку «Загрузить». Рефераты, контрольные, дипломные, курсовые работы предоставляются в ознакомительных целях, не для плагиата.
Страница 1 из 9 [Всего 9 записей]1 2 3 4 5 » ... Последняя »

Введение

Математическая лингвистика использует для изучения языков два основных типа моделей: порождающие и аналитические. Несколько упрощая ситуацию, можно сказать, что для порождающих моделей исходным пунктом является некоторая формальная грамматика, а исследуемым объектом - язык, порождаемый этой грамматикой. В аналитических моделях - наоборот: здесь исходным материалом служит язык как совокупность предложений, а цель исследования заключается в том, чтобы выявить структуру этих предложений, их составные элементы, а также отношения между этими элементами.

Порождающие модели используются, в основном, для создания искусственных языков, таких как языки программирования или алгоритмические языки, Для таких языков характерна жесткая структура, простые правила без исключений и, как следствие, ограниченность выразительных возможностей. Многочисленные попытки создать таким образом простой язык для межнационального общения заканчивались неудачей именно в силу изначальной "запрограммированной" ограниченности выразительных средств. При этом анализ языка эсперанто, имеющего наибольший успех и распространение, показывает, что его автор Л.Заменгоф, понимая разрушительную опасность простой, но жесткой грамматики, снабдил язык многочисленными лексическими исключениями (см, напр. [1]).

Аналитические модели в этом смысле более приемлемы для изучения естественных языков. Они не навязывают языку жестких правил, а изучают те законы языка, которые складываются в языке тысячелетиями, имеют исключения и могут со временем изменяться вместе с языком. Понятно, что модель - это лишь некоторое приближение к действительности. Так аналитические модели отображают не весь язык, а лишь некоторые его подмножества, удовлетворяющие данной модели. Именно поэтому приводимые в данной работе примеры часто имеют гипотетический и объяснительный, а не конкретно-языковый характер.

Данная работа посвящена категориям рода и падежа, как наиболее интересным с точки зрения грамматики и имеющим давнюю историю изучения.

Языки и грамматики

В дальнейшем нам понадобятся следующие понятия и определения лежащие в основе математической лингвистики.

Назовем конечное множество - словарем. Элементами - будут слова. Рассмотрим множество Т всех конечных последовательностей слов из ?. Подмножество Ф правильно построенных последовательностей (предложений) из Т назовем языком над ?, а содержащиеся в Ф последовательности будем называть отмеченными последовательностями. Порождающей грамматикой языка Ф называется конечное множество правил, задающее все последовательности из Ф (и только эти последовательности) и сопоставляющее каждой последовательности из Ф описание ее структуры, которое определяет, из каких элементов состоит последовательность (их порядок, иерархию и взаимозависимость), а также содержит другую грамматическую информацию, необходимую для того, чтобы определить, как используется и понимается данная последовательность. Такой подход приводит к порождающим моделям языков. Он тесно связан с теорией формальных систем и другими фундаментальными разделами современной математической логики. В данной работе мы будем придерживаться другой точки зрения на построения модели языка, а именно, точки зрения аналитической грамматики.

Аналитическая грамматика языка Ф исходит из предположения, что язык уже задан, и ставит перед собой цель получить описание последовательностей, принадлежащих множеству последовательностей из Ф "изнутри", т.е. как описание отношений между словами и подпоследовательностями в зависимости от их позиции в последовательности. Такая точка зрения тесно связана с традицией структурной лингвистики, в особенности с традицией так называемой дискриптивной лингвистики, основы которой заложены в работах [2-6].

Для того, чтобы провести ясное различие между порождающей и аналитической грамматикой, рассмотрим следующий пример. Известно, что язык с конечным числом состояний может быть задан несколькими различными способами. Если используется неоднозначная грамматика, то мы можем обнаружить так называемую структурную омонимию, которая возникает в тех случаях, когда одно и то же предложение имеет как бы несколько различных "конструкций". Вот например, омонимичное английское предложение [7]: They are flying planes, которое, в сущности, является двумя разными предложениями: 1) They (are (flying planes)) и 2) They ((are flying) planes). Грамматические структуры и смысл обоих этих предложений различны. Это различие может быть установлено с помощью грамматики с конечным числом состояний, допускающей неоднозначности. Такая ситуация является типичной для порождающей грамматики.

Рассмотрим теперь другую ситуацию. Назовем последовательности x и y эквивалентными в Ф, если для каждой пары последовательностей u, v выполняется либо uxv - Ф, uyv - Ф, либо uxv - Т - Ф, uyv - Т - Ф. Основной результат, полученный в работе [8], а так же теорема Б а р - Х и л л е л а и Ш а- м и р а [7] говорят, что Ф является языком с конечным числом состояний тогда и только тогда, когда в нем существует конечное число классов эквивалентности. Такое определение языков с конечным числом состояний, которое предполагает знание только их внутренней структуры, является основным принципом аналитической грамматики.

Приведенный выше пример показывает не только различие, но также и тесную связь между этими двумя типами грамматик. Каждая из них дополняет описание, задаваемое другой.

Парадигматика и дистрибуция

Существует много проблем, относящихся к языку Ф, которые могут успешно изучаться без какого-либо специального уточнения структуры Ф, т.е. только при том предположении, что Ф - определенное подмножество Т над ?, и мы можем сказать для каждой последовательности, принадлежит ли она Ф или нет. Однако для исследования проблем грамматического рода и падежа необходимо иметь больше информации о структуре языка. Такую информацию в аналитических моделях обычно несут разбиения.

Разбиением словаря - называется система непустых взаимно не пересекающихся подмножеств ?. Обычной лингвистической интерпретацией разбиения - является выделение парадигм, т. е. совокупностей форм одного слова, различающихся флексией. В частности, парадигма слова Buch состоит из форм {Buch, Buchs, B(cher}, а парадигма gro( - {gro(, gr((er, gr((t}.

Строго говоря, парадигмы не образуют разбиения ?, поскольку существуют отдельные парадигмы, которые "пересекаются" друг с другом. Однако такие несоответствия модели и действительности неизбежны. Парадигматическое разбиение словаря - будем обозначать буквой P. Через P(x) будем обозначать парадигму слова x - ?, то есть множество слов из ?, каждое из которых отличается от x флексией. Двусмысленности не возникнет, так как в каждом конкретном случае будет ясно, какое из обозначений используется.

Другим важным разбиением ?, которое нам понадобиться в дальнейшем, является так называемое разбиение на дистрибутивные классы. Оно определяется следующим образом. Два слова a и b принадлежат одному дистрибутивному классу, если для каждой пары последовательностей x, y из xay - Ф следует xby - Ф и обратно. Понятие дистрибутивного класса станет интуитивно более понятным, если мы введем понятие контекста. Контекст может быть определен, как упорядоченная пара последовательностей над ?. Будем обозначать контекст (x,y), где x - Т и y - Т. Будем говорить, что слово a допустимо в контексте (x,y), если существует такое слово a? - P(a), что последовательность xa?y принадлежит Ф. Слово a непосредственно допустимо в контексте (x,y), если последовательность xay принадлежит Ф. Обозначим через S(a) множество всех контекстов, в которых a непосредственно допустимо, через A(?) - множество слов, допустимых, а через B(?) - множество слов непосредственно допустимых в контексте - = (x,y). Отсюда сразу получаем, что два слова a и b принадлежат одному дистрибутивному классу тогда и только тогда, когда S(a) = S(b), то есть тогда и только тогда, когда a и b непосредственно допустимы в одних и тех же контекстах. Если мы будем интерпретировать - как словарь немецкого языка, а Ф - как множество правильно построенных немецких предложений, то слова Buch и Fenster попадут в один и тот же дистрибутивный класс, тогда как Buch и B(cher в разные.

RSSСтраница 1 из 9 [Всего 9 записей]1 2 3 4 5 » ... Последняя »


При любом использовании материалов сайта обязательна гиперссылка на сайт «Репетитор».
Разработка и Дизайн компании Awelan
www.megastock.ru
Проверить аттестат