URSS.ru - Издательская группа URSS. Научная и учебная литература
Об издательстве Интернет-магазин Контакты Оптовикам и библиотекам Вакансии Пишите нам
КНИГИ НА РУССКОМ ЯЗЫКЕ


 
Вернуться в: Каталог  
Обложка Раскин В. К теории языковых подсистем
Id: 54178
 
439 руб.

К теории языковых подсистем. Изд.2, доп.

URSS. 2008. 424 с. Мягкая обложка. ISBN 978-5-382-00523-2.

 Аннотация

В данной монографии язык исследуется как система подсистем (подъязыков), в виде которых он реализуется. Языковая подсистема понимается в работе как часть естественного языка, которая и сама используется как язык определенной группой людей в определенных целях. В книге впервые были разработаны элементы теории языковых подсистем. На этой теоретической основе определяется и подробно исследуется один из классов --- класс малых языковых подсистем, имеющих особое значение для прикладной лингвистики, поскольку, как показано в книге, он оказывается в то же время классом тех узких фрагментов естественных языков, автоматической обработкой которых в различных информационных целях занята прикладная лингвистика. В книге строится универсальный алгоритм анализа малых языковых подсистем, опирающийся на их свойства. В целях иллюстративного анализа на основе разработанных методов исследуется конкретная малая подсистема --- язык сводок погоды.

Монография представляет интерес для лингвистов, для специалистов по прикладной лингвистике и для специалистов в области автоматизации информационных работ.


 Оглавление

ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ
ВВЕДЕНИЕ

Глава первая. Проблема языковых подсистем в некоторых областях языкознания

 1. Язык, идиолект, речевая общность
 2. Традиционные подхода к изучению языковых подсистем
 3. Языковые подсистемы и социолингвистика
 3. Проблема языковых подсистем в некоторых новейших лингвистических исследованиях

Глава вторая. Понятие языковой подсистемы

 1. Языковые образования
 2. Понятие языковой подсистемы
 3. Способы задания подсистемы. Подсистема и подъязык

Глава третья. Свойства языковых подсистем

 1. Универсальные свойства языковых подсистем
 2. Дифференциальные свойства языковых подсистем.
  2.1. Множество фигур плана выражения: устность/письменность
  2.2. Словарь: свойство конечности
  2.3. Инвентарь грамматических конструкций: формальная ограниченность
  2.4. Идеальная совокупность текстов: замкнутость
  2.5. Субстанция содержания: полнота
  2.6. Структура подсистемы: тонкость
 3. Отношения между основными дифференциальными свойствами языковых подсистем. Классы языковых подсистем

Глава четвертая. Малые языковые подсистемы

 1. Малые языковые подсистемы и особенности их изучения
 2. Малые подсистемы и порождающие грамматики
 3. Алгоритм анализа в малых языковых подсистемах.
 4. Семантика малых языковых подсистем
 5. Малые языковые подсистемы и отношения человека с машиной

Глава пятая. Иллюстративный анализ одной малой подсистемы

Раздел 1. Алгоритм анализа
 1. Общая характеристика выборки
 2. Словарь подсистемы
 3. Свойства подсистемы
 4. Функциональные классы слов
 5. Функциональные типы предложений
 6. Автоматический анализ текстов и автоматическое обнаружение и восполнение эллипсиса
Раздел 2. Семантика подсистемы
 1. Основные вопросы изучения семантики малой подсистемы сводок погоды
 2. Семантика функциональных классов
 3. Использование дополнительной семантической информации в алгоритме анализа
 4. Единица семантического описания подсистемы
 5. Перераспределение значимостей
 6. Субстанция содержания подсистемы
 7. Семантическая рекурсия в подсистеме
Раздел 3. Приложения
ЗАКЛЮЧЕНИЕ
СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ
ОГЛАВЛЕНИЕ

 Предисловие ко второму изданию

Когда издатель обратилcя ко мне с предложением переиздать книгу, моя первая реакция была, что она устарела и что этого делать не нужно. И, конечно, я всегда занят миллионом других дел и обязательств. Но потом я сообразил, что, на самом-то деле, за 35 лет, прошедших со времени первого издания, книга не была "перекрыта" никакой серьезной работой, ни моей собственной, ни чьей бы то ни было другой (ср. Raskin 1987, 1990, 1998; Kittredge and Lehrberger 1982; Kittredge 1987).

"К теории языковых подсистем" -- это теоретическая часть и первый том моей кандидатской диссертации 1970-го года. Второй том, приложение этой теории к русскому военному подъязыку, был опубликован в том же 1971-ом году как половина совместной книги с Б.Ю.Городецким (Городецкий и Раскин 1971). Первая книга вызвала интерес среди тех прикладных, т.е. вычислительных лингвистов, у которых не было шапкозакидательского онтошения к языку, характерного и сейчас для программистов и статистиков: дескать, чего там знать, если я cам им владею. Через пару лет, уже в эмиграции, когда все мои книги исчезли в СССР из оборота и почти из всех ссылок, до меня дошла восхищенная рецензия новосибирского математического лингвиста Беленького. Но его московский приятель, мой преподаватель математической логики на отделении теоретической (в то время еще -- и уже -- "структурной") и прикладной лингвистики МГУ, Ю.А.Шиханович, впоследствии видный диссидент и узник, попросил устроить надо мной, его лучшим учеником, "товарищеский суд" летом 1970-го года, когда я был еще в Москве, за то, что в книге (тогда еще только что защищенной диссертации) мало математики. Я отбивался утверждением, что и безо всяких формул книга полностью формальна. Он этого принять не мог, первый, но далеко не последний. И это приводит нас к списку тех характеристик книги, которые не утратили своей актуальности и поныне.

Специалистам в смежных областях, особенно компьютерщикам, которые теперь уже не программируют алгоритмически, а ищут готовую библиотеку в удобном языке типа С++ или Перл, очень трудно, практически невозможно распознать алгоритм, готовый для программирования, если он выражен простым языком. С другой стороны, многие лингвисты боятся формализма, долго и мучительно овладевают им и в процессе впадают в формалистический гипноз. В результате, особенно на Западе, огромное количество энергии тратится впустую на споры о том, чей формализм лучше. Многие участники этих битв страдают от излишнего энтузиазма новообращенных, не понимают, что формализм -- это удобство, а не инструмент исследования и что все формализмы определенного типа, по сути дела, изоморфны. Парадоксально для новичков, но вполне понятно для людей, формально образованных, чистейший формализм может оказаться невычислимым и неосуществимым в компьютерной системе, как, например, порождающая грамматика Хомского. Для меня, как и для моих соучеников и наших студентов, мыслить формально и алгоритмично было и остается совершенно естественным, и поэтому злоупотреблять формулами и засорять ими текст нам совершенно ни к чему. Эта книга, если я не ошибаюсь (а у меня нет ни копии той тайком пересланной и, наверно, никогда не опубликованной рецензии, ни даже его имени, что просто стыдно, потому что мы были слегка знакомы), восхитила Беленького именно ее очевидной и полной формальностью без формализма.

Основная идея книги была проста -- если вы работаете над компьютерной системой для ограниченного подъязыка, полностью используйте все вытекающие из этого преимущества: ограниченный словарь, ограниченную полисемию и омонимию, ограниченный синтаксис, а также стилистическую ограниченность, характерную дла подъязыков науки и техники и делающую тонкие оттенки значения несущественными. Иными словами, поймите, представьте алгоритмически и запрограммируйте все свойства подъязыка, интуитивно очевидные и полностью используемые человеком. Это было перенесение на подъязык нашей парадигмы исследования языка в целом: если мы поймем, правильно представим и используем в нашей системе свойства языка, обнаруженные в результате полного и высококачественного лингвистического анализа, и эта система будет делать то, что она должна делать, хорошо, например, автоматический (машинный) перевод или поиск информации, то значит у нас получилась хорошая модель той части человеческого разума, которая этими операциями заведует. Казалось бы, как можно после Хомского подходить к проблеме изучения ума и языка иначе? Но в 80-х годах этот разумный подход стал лишь одним из двух альтернативных подходов. Наш подход стал называться репрезентативным, поскольку он пытался предствить значение, а альтернативный -- нерепрезентативным, потому что он не пытался ни представить ни понять что-либо о естественном языке. Последний подход стал возможным в результате гигантского прогресса в вычислительной статистике. Коннективизм рекламировал способность начать буквально с произвольного набора параметров и, прогоняя компьютер через хитрую статистическую процедуру сотни, если не тысячи раз, заставить ее "стабилизироваться" на приблизительной модели нужной операции, и сделать это без какого бы то ни было исследования или понимания умственного или языкового процесса, при помощи которого эту операцию осуществляет человек. В 90-е годы возникла мода на "таггинг": группе носителей языка дают небольшую часть корпуса и просят, например, пометить (это и есть таггинг), какое из двух альтернативных значений полисемичного слова реализуется в тексте, а потом чисто статистическая процедура прогоняется по размеченному корпусу и, перенося наблюденные статистические закономерности на неразмеченный корпус, пытается выбрать правильный смысл полисемичных слов и там. Восхищало программистов и статистиков, а также запуганных ими лингвистов, не образованных ни в описательной лингвистике полевых экспедиций, ни в семантике, ни в вычислительной лингвистике, что из ничего можно получить хоть что-то, т.е., грубо говоря, что они открыли вечный двигатель. Тот факт, что точность этих процессов была довольно низкая, достигая 80% только в специально препарированных условиях (например, когда полисемичные слова заранее выделены и сведены к выбору между двумя значениями, одно из которых подходит, а другое нет), этих людей волновал не сильно, потому что они не строили реальных систем и не знали, что клиенты требуют гораздо большей точности и просто отказываются пользоваться результатами низкокачественных систем. Удивительным (или совершенно неудивительным) образом, такие исследования продолжаются и сейчас, когда практически все правительственные фонды требуют систем, основанных на семантике, и часто только наша модель семантики, онтологическая семантика (Nirenburg and Raskin 2004), способна осуществить такую систему. Каким же тогда образом несемантики, а на самом деле, антисемантики, получают на это деньги? Убеждая правительственных администраторов програм, которые сами часто являются программистами, статистиками или даже инженерами по образованию, что таггинг и тому подобные трюки могут привести к нашим результатам. Xa! (По моему это правильно выражает на обоих языках то, что я имею в виду.)

Теоретический подход к подъязыкам на Западе не прижился. В поздние 1970-е и ранние 1980-е годы канадская исследовательская группа разработала, по всей видимости, независимо, крошечную системку на подъязыке сводок погоды (Chevalier et al. 1978), как и в этой книге. Но северо-американские прогнозы состоят из одной строчки в 5--6 слов, так что системка оказалась довольно тривиальной. Потом один из руководителей этой группы, Ричард Киттредж, хороший вычислительный лингвист и славный человек, вскоре женившийся на бывшей московской коллеге, решил издать пару сборников на тему подъязыка, обнаружил в процессе, что он пропустил эту книгу, застеснялся, поскольку он знает русский, поместил в один из них (Kittredge and Lehrberger 1982) длинную статью об этой книге, почему то написанную моим бывшим оппонентом на защите (Moskovich 1982), застеснялся еще больше и перешел к следующей теме исследования. Вообще на Западе с совмещением теоретических интересов с вычислительными дело обстоит плохо: разделение "труда" таково, что лингвистические отделения готовят теоретиков, а вычислительные "лингвисты" возникают, как указано выше, плохо подготовленными в языковом плане с компьютерных отделений. Мои работы о необходимости теоретического подхода к вычислительным проблемам всегда охотно принимались к печати и... полностью игнорировались. В результате принималось и принимается много однократных, "ад-хоковых" решений, плохо справлявшихся с непосредственной задачей и совершенно не распостранимых на подобные задачи в других системах. В нашей работе над онтологической семантикой проблема подъязыка приняла форму распространения ресурсов, т.е. oнтологии и лексикона, на новые подобласти, или регистры. Главная надежда в этой книге была разработать стандартный алгоритм построения вычислительной системы для любого небольшого подъязыка, и у нас имеется хорошо разработанная и все более автоматизированная технология расширения ресурсов на новые подобласти.


 Об авторе

Виктор РАСКИН

Известный филолог, профессор лингвистики Университета Пурдью -- одного из самых больших государственных учебных заведений США. Родился в 1944 г. на Урале. В 1966 г. закончил отделение структурной и прикладной лингвистики МГУ им. М.В.Ломоносова, в 1969 г. -- аспирантуру и в 1970 г. защитил кандидатскую диссертацию. В 1966--1973 гг. преподавал и вел научную работу в МГУ, в 1973--1978 гг. преподавал в Еврейском университете Иерусалима и в Тель-Авивском университете. С 1978 г. -- профессор Университета Пурдью, где в 1979 г. организовал лингвистическую программу и руководил ею 20 лет. В 1986 г. организовал лабораторию по обработке естественного языка, а в 1999 г. участвовал в открытии одного из научно-исследовательских центров по информационной безопасности, где в настоящее время является заместителем директора.

Основой научной деятельности В.Раскина является его интерес к семантике естественного языка. За 45 лет он развил представление о значении, которое приближается к пониманию того, как оно устроено в человеческом уме, и одновременно используется в компьютерных системах, способных заменить человека в определенных областях его деятельности. Раскин разрабатывал теорию и методологию прикладной лингвистики для все более сложных систем, основанных не на статистике и прочих нелингвистических методах, а непосредственно на глубоком анализе значения, чего большинство его коллег все еще избегает. Первый семантический поиск на Интернете, основанный на его теории и методологии, hakia.com, уже, в стадии бета, намного превосходит Гугл (google.com) по точности и релевантности ответов.

 
© URSS 2016.

Информация о Продавце