Во втором дополненном издании книги описаны результаты новейших исследований в области речевой коммуникации, речевой информации и речевого управления. Включены такие аспекты, как модели речевой коммуникации, речь в общей системе средств коммуникации, полифункциональность речевого сигнала, специфика речевого сигнала с позиций речеобразования, акустики и перцепции, речевой сигнал и новейшие способы анализа и синтеза речи, современные способы кодирования речи, экспертные системы с речевым управлением, речевая кибернетика и искусственный интеллект. Содержатся новейшие сведения и конкретные факты, позволяющие наиболее полно освещать феномен коммуникации между людьми, а также человеком и машиной. Обычно в работах, посвященных проблемам речи, генетический аспект ограничивается описанием органов речеобразования и слуха. Причем данные, как правило, отражают процесс речеобразования в статике и далеко не в современном ракурсе. Задача заключалась в том, чтобы переместить центр тяжести описания со статики на динамику, с традиционного рассмотрения механизма речеобразования на нетрадиционное с учетом процесса модификации речевых жестов в акте речеобразования. Рассматриваются механизмы контроля за речеобразованием, обратной связи, планирования и управления, а также координации речевых жестов в акте речеобразования. Специальный материал посвящен физиологии восприятия с позиций современных достижений в данной области. Описание строится по принципу: от психофизики и первичной обработки простых и сложных стимулов к восприятию сложных естественных и искусственных стимулов. Освещаются механизмы адаптации и маскировки. При описании закономерностей слухового восприятия речевых сигналов и слитной речи большое внимание уделено существенным для восприятия признакам речи, речевой избирательности, категориальности восприятия речи, моделям слухового восприятия (активным, пассивным), специфике восприятия единиц сегментного и супрасегментного уровней языка, коартикуляции, а также речи в условиях различного рода помех. Рассматриваются такие аспекты речеведения, как соотношение речи и теории информации, метаязык описания речевой информации, способы передачи информации по каналам связи, специфика акустического представления речевого сигнала и т.д. Речевая коммуникация понимается как процесс обмена языковыми сообщениями между динамическими системами. В связи с этим речевой сигнал описывается с учетом специфики сообщения, специфики получателя (адресата) и отправителя (адресанта), особенностей канала, по которому передается акустическая информация. Особое внимание уделено трудностям выделения и описания речевого сигнала в связи с комплексным характером структуры последнего. Рассматриваются базовые составляющие речевого сигнала, входящего в состав сегментных и супрасегментных единиц речевого сообщения. Представлены различные виды анализа речевого сигнала. Большое внимание уделяется различным способам акустического анализа речевого сигнала с помощью современных ПЭВМ. Описываются различные аппаратно-программные средства акустического анализа речевого сигнала. Излагаются результаты собственных исследований в данной области. Неразрывно с описанием современных методов анализа речевого акустического сигнала связано описание синтеза последнего, проводимого с помощью самых различных способов, практикуемых в разных странах мира с привлечением аппаратных и программных средств. Подробно рассматриваются такие способы синтеза речевого сигнала, как синтез по правилам, формантный синтез, синтез на базе линейного предсказания, синтез "текст-речь", артикуляторный синтез, компилятивный синтез и т.д. Подробно освещаются особенности синтеза сегментных единиц речи (дифонов, звуков, аллофонов, псевдослогов, слогов, слов, ритмических структур, синтагм, фраз, текста), а также супрасегментных единиц (ударения, мелодики, пауз, темпа и т.д.). Принципиально новым по сравнению с имеющимися работами по синтезу речи является освещение современных способов синтеза с помощью ПЭВМ. Приводятся различные программные способы решения задачи качественного синтеза речи. Описаны результаты собственных исследований, проведенных на базе различных синтезаторов. Обосновывается целесообразность введения новой отрасли науки и техники – лингвокибернетики и ее раздела – речевой кибернетики. В связи с этим определяются основной объект речевой кибернетики, аппарат исследования этого объекта, методы исследования, способы описания и классификации, основные понятия. В качестве базового понятия лингвокибернетики рассматривается естественный языковой код при условии его полиинформативного функционирования. Речевая кибернетика входит составной частью в лингвокибернетику, основываясь на речевом сигнале в его устной разновидности. Лингвокибернетика соотносится со специфической сферой деятельности человека – взаимодействием человека и машины, что порождает, в свою очередь, ряд трудностей психологического, физиологического, этического, эргономического, инженерного и информационного характера. Рассматриваются новые поколения автоматизированных распознающих речь систем. Причем представлено не только их описание, но и дан анализ положительных и отрицательных решений проблемы. При рассмотрении последних вариантов подобных систем наибольшее внимание уделяется экспертным системам США, Японии, ФРГ. Анализируются пути решения проблемы баз данных и баз знаний с позиций речевого управления системами. Речевой сигнал рассматривается не только как носитель акустической и фонетической информации, но и комплексной многоярусной лингвистической информации, что позволяет увеличить надежность автоматического распознавания и понимания речи. Соответствующее место отведено последним достижениям в области автоматического распознавания речи, передаваемой по телефонным трактам. Освещены перспективы развития систем речевого управления с элементами искусственного интеллекта, базирующихся на исследованиях автора. Намечены приоритетные направления в развитии современного речеведения и определена концепция использования новых информационных технологий в лингвистике. От автора
Учителю, Ученому, Человеку
Михаилу Андреевичу Сапожкову
В книге содержатся новейшие сведения и конкретные факты, позволяющие наиболее полно освещать феномен коммуникации между людьми, а также человеком и машиной. Акустическая коммуникация, осуществляемая человеком, является следствием длительной биологической эволюции в целом. Этот вид коммуникации существенно отличается от акустической коммуникации животных. Основное различие характеризуется прежде всего двумя чертами: степенью абстракции акустического сигнала и различной физиологической спецификой набора реализуемых в коммуникации сигналов. Средства общения в биологической среде характеризуются большим разнообразием и охватывают широкий диапазон видов сигналов: химических, тактильных, визуальных и т.д. Акустические средства коммуникации имеют ряд преимуществ перед всеми остальными средствами. Например, в отличие от химических сигналов звуковые сигналы распространяются с большей скоростью. По сравнению с оптическими – более гибки, т.е. могут огибать различного рода преграды, проникать через плотные вещества. В противоположность тактильным сигналам звуковые волны имеют разнонаправленный характер как с учетом их образования, так и с учетом их восприятия. Распространение звуковых волн не зависит от светового фактора, обусловленного вращением Земли. Все эти преимущества акустической сигнализации в процессе коммуникации привели к тому, что именно она стала широко использоваться в биологической животной среде, и прежде всего среди позвоночных. В связи с этим особое внимание уделено генетическому аспекту речевой коммуникации, к которому относятся артикуляция и фонация. Определены в рамках поставленной задачи функции дыхания, голосообразования, артикуляции; охарактеризованы основные отличия этих функций у человека и животных (приматов), освещены биологические истоки зарождения речи человека. Обычно в работах, посвященных проблемам речи, генетический аспект ограничивается описанием органов речеобразования и слуха. Причем данные, как правило, отражают процесс речеобразования в статике и далеко не в современном ракурсе. Задача заключается в том, чтобы переместить центр тяжести описания со статики на динамику, с традиционного рассмотрения механизма речеобразования на нетрадиционное с учетом процесса модификации речевых жестов в акте речеобразования. Рассматриваются механизмы контроля за речеобразованием, обратной связи, планирования и управления, а также координации речевых жестов в акте речеобразования. Специальный материал посвящен физиологии восприятия с позиций современных достижений в данной области. Описание строится по принципу: от психофизики и первичной обработки простых и сложных стимулов к восприятию сложных естественных и искусственных стимулов. Освещаются механизмы адаптации и маскировки. При описании закономерностей слухового восприятия речевых сигналов и слитной речи большое внимание уделено существенным для восприятия признакам речи, речевой избирательности, категориальности восприятия речи, моделям слухового восприятия (активным, пассивным), специфике восприятия сегментного и супрасегментного ярусов языка, коартикуляции, а также речи в норме и патологии, в условиях различного рода помех. Рассматриваются такие аспекты науки о речи, как соотношение речи и теории информации, метаязык описания речевой информации, способы передачи информации по каналам связи, специфика акустического представления речевого сигнала и т.д. Речевая коммуникация понимается как процесс взаимного обмена сообщениями между динамическими системами. В связи с этим речевой сигнал описывается с учетом специфики сообщения, специфики получателя (адресата) и отправителя (адресанта), особенностей канала, по которому передается акустическая информация. Особое внимание уделено трудностям точного выделения и описания речевого сигнала в связи с комплексным характером структуры последнего. Рассматриваются базовые составляющие речевого сигнала, входящего в состав сегментных и супрасегментных единиц речевого сообщения. Представлены различные виды анализа речевого сигнала. Большое внимание уделяется различным способам акустического анализа речевого сигнала с помощью современных ПЭВМ. Описываются различные аппаратно-программные средства акустического анализа речевого сигнала. Излагаются результаты собственных исследований в данной области. Неразрывно с описанием современных методов анализа речевого акустического сигнала связано описание синтеза последнего, проводимого с помощью самых различных способов, практикуемых в разных странах мира с привлечением аппаратных и программных средств. Подробно рассматриваются такие способы синтеза речевого сигнала, как синтез по правилам, формантный синтез, синтез на базе линейного предсказания, синтез "текст-речь", артикуляторный синтез, компилятивный синтез и т.д. Подробно освещаются особенности синтеза сегментных единиц речи (дифонов, звуков, аллофонов, псевдослогов, слогов, слов, ритмических структур, синтагм, фраз, текста), а также супрасегментных единиц (ударения, мелодики, пауз, темпа и т.д.). Принципиально новым по сравнению с имеющимися работами по синтезу речи является освещение современных способов синтеза с помощью ПЭВМ. Приводятся различные программные способы решения задачи качественного синтеза речи. Описаны результаты собственных исследований, проведенных на базе различных синтезаторов, например типа Play-back, OVE-III, а также на базе ПЭВМ IBM PS. Обосновывается целесообразность введения новой отрасли науки и техники – лингвокибернетики и ее раздела – речевой кибернетики. В связи с этим определяются основной объект речевой кибернетики, аппарат исследования этого объекта, методы исследования, способы описания и классификации, основные понятия. Базовым понятием лингвокибернетики является естественный языковой код при условии полиярусного рассмотрения его функционирования. Речевая кибернетика входит составной частью в лингвокибернетику, основываясь на речевом сигнале в его устной разновидности. Лингвокибернетика соотносится со специфической сферой деятельности человека взаимодействием человека и машины, что порождает в свою очередь ряд трудностей физического, физиологического, психологического, этического, инженерного, математического, информационного характера. Рассматриваются новые поколения автоматизированных распознающих речь систем. Причем представлено не только их описание, но и дан анализ положительных и отрицательных решений проблемы. При рассмотрении последних вариантов подобных систем наибольшее внимание уделяется экспертным системам США, Японии, ФРГ. Анализируются пути решения проблемы баз данных и баз знаний с позиций речевого управления системами. Речевой сигнал рассматривается как носитель не только чисто акустической информации, но и многоярусной лингвистической информации, что увеличивает надежность автоматического распознавания и понимания речи и еще не достаточно широко пропагандируется в работах, посвященных автоматизированным системам управления. Определенное место отведено последним достижениям в области автоматического распознавания речи, передаваемой по телефонным каналам. Указаны перспективы развития систем речевого управления с элементами искусственного интеллекта. Настоящее учебное пособие является первым пособием подобного рода, когда в рамках одного произведения увязываются лингвистические, коммуникативные, информационные и кибернетические вопросы описания речи и автоматизированных систем управления. ![]() Доктор филологических наук, профессор, заслуженный работник высшей школы Российской Федерации, член общественной организации «Международная академия информатизации», почетный вице-президент Международного общества по фонетическим наукам (ISPhS). В настоящее время — директор Института прикладной и математической лингвистики Московского государственного лингвистического университета, заведующая кафедрой прикладной и экспериментальной лингвистики, руководитель Центра фундаментального и прикладного речеведения Московского государственного лингвистического университета. Широко известный специалист в области общего и романо-германского языкознания, прикладной, экспериментальной и математической лингвистики. Победитель конкурса преподавателей вузов «Золотые Имена Высшей Школы» 2018 года.
|