Настоящая монография представляет собой обобщение результатов работы авторов в области статистического анализа литературных текстов. "Литературное" приложение математических методов имеет целью получить корректно обоснованные утверждения относительно, например, частоты употребления определенных букв (буквосочетаний), или о точности методов статистического сравнения текстов. Новизна предпринятого исследования по сравнению с традиционным приложением математических методов в теории информации и математической лингвистике состоит в привнесении в них элементов нестационарности. Именно, текст, т. е. последовательность символов, трактуется как нестационарный случайный процесс, что имеет под собой серьезные практические основания. Вследствие этого методы, развитые в кинетической теории, такие, как уравнение Лиувилля или метод зацепляющихся моментов, могут быть весьма плодотворно применены и в этой сфере. Дадим краткий обзор содержания книги по главам. Первая глава носит справочный характер. Ее назначение состоит в том, чтобы дать замкнутое изложение материала и по ходу исследования в последующих главах не углубляться в техническую часть математического инструмента, которым это исследование проводится. Поскольку результаты нашего анализа, как мы надеемся, представляют интерес для литературоведов и лингвистов, то перегружать работу математическими выкладками было бы нецелесообразно. Тем не менее книга ориентирована в том числе и на математиков, специализирующихся в области прикладной математической статистики. Поэтому математическая строгость получаемых выводов должна быть соблюдена, для чего в основных главах делаются отсылки на соответствующие разделы первой главы, где даны формулировки используемых утверждений, но без их вывода. Подчеркнем, что мы ограничивались в основном теми сведениями из классической математической статистики и теории нестационарных временных рядов, которые будут применяться в последующих главах. Все же следует отметить, что в вводной части теоретический материал дан с некоторой избыточностью. С одной стороны, это отражает интересы авторов, а с другой – способствует связности изложения. Во второй главе дается сравнение двух способов упорядочения букв – по алфавиту и по частоте встречаемости в текстах. Оказалось, что второй способ упорядочения позволяет обнаружить универсальную зависимость ранга (номера) буквы от частоты ее использования. Эта зависимость справедлива для всех широко распространенных языков индоевропейской языковой семьи. Возможно, что найденная универсальность выражает общность мышления и связанную с ним кодировку информационных сообщений. В третьей главе формулируется метод идентификации автора неизвестного литературного текста посредством близости плотности функции распределения пар букв данного текста и набора эталонов, характерных для определенных авторов. Расстояния между текстами определялись в самых разных нормах. Оказалось, что норма в пространстве суммируемых функций, а также квазинорма Кульбака–Лейблера (так называемая относительная энтропия), которая применяется в теории информации, дают наиболее точные результаты такой идентификации. Четвертая глава посвящена применению нового и достаточно сложного математического аппарата спектрального анализа несамосопряженных операторов, к каковым относится, в частности, оператор эволюции локальной (по тексту) выборочной плотности функции распределения букв. Оказалось, что спектральный портрет авторов текстов, т. е. расположение собственных значений соответствующих операторов, имеет сохраняющуюся авторскую специфику и позволяет корректно оперировать такими понятиями, как проекция инвариантных подпространств одного автора на подпространства другого. Авторы считают здесь своим приятным долгом поблагодарить канд. физ.-мат. наук О. Б. Феодоритову за проведение расчетов спектральных портретов матриц, часть которых приведена в этой главе. В пятой главе развивается подход к тексту как к многомерной динамической системе, порождающей случайный процесс, близкий к белому шуму. Случайным процессом здесь является последовательность расстояний между одинаковыми буквами. Оказалось, что эта последовательность для всех букв русского алфавита образует белый шум с одинаковым гамма-распределением, которое генерируется многомерной нелинейной динамической системой, каковой, собственно, и является автор. В этой главе мы формулируем метод построения такой динамической системы, в общем случае неавтономной, на основе анализа уравнения Лиувилля для плотности функции распределения расстояний между одинаковыми буквами, а также с использованием специальной статистики для анализа нестационарных процессов – горизонтного ряда. В шестой главе описывается метод попарной близости текстов в подходящем функциональном пространстве для задачи жанровой кластеризации. Ставится задача о вероятностной идентификации текста в многомерном фазовом пространстве "язык – эпоха – жанр – автор" и даются примеры такой идентификации. Седьмая глава показывает, как практически применять развитую в книге методику для решения конкретных задач. Рассматриваются, в частности, следующие задачи. Во-первых, дается пример проверки того, что определенный писатель является (или не является) автором определенного текста. Во-вторых, решается задача указания наиболее вероятного автора определенного анонимного произведения среди нескольких конкретных вариантов. Кроме того, метод нестационарных индикаторов применяется для такой сложной задачи, как анализ творчества писательских тандемов. В заключении формулируются некоторые интересные, на взгляд авторов, задачи, которые могли бы быть решены развитой в книге методикой. Отметим, что примеры, рассмотренные нами в этой книге, в основном были подобраны с расчетом продемонстрировать эффективность новых методов, однако надо иметь в виду, что к любому статистическому методу существует контрпример, показывающий ограниченность этого метода. Такие контрпримеры также приведены, чтобы не было неоправданных иллюзий относительно всемогущества статистики. Авторы надеются, что книга послужит полезным дополнением к методам, которые применяются специалистами по математической лингвистике, и будет востребована как профессионалами в области прикладной математической статистики, так и студентами и аспирантами соответствующих специальностей. Юрий Николаевич ОРЛОВ Доктор физико-математических наук, заведующий сектором кинетических уравнений отдела вычислительной физики и кинетических уравнений Института прикладной математики им.М.В.Келдыша РАН, профессор Московского физико-технического института (МФТИ). Окончил МФТИ в 1987 г., специалист в области математической статистики, а также классической и квантовой статистической механики.
Константин Павлович ОСМИНИН Кандидат физико-математических наук. Окончил механико-математический факультет Московского государственного университета им. М. В. Ломоносова в 2005 г. Специалист в области геометрии, топологии и теории особенностей, математической статистики и математического моделирования. |
2023. 720 с. Твердый переплет. 16.9 EUR
Книга «Зияющие высоты» – первый, главный, социологический роман, созданный интеллектуальной легендой нашего времени – Александром Александровичем Зиновьевым (1922-2006), единственным российским лауреатом Премии Алексиса де Токвиля, членом многочисленных международных академий, автором десятков логических... (Подробнее) URSS. 2024. 800 с. Мягкая обложка. 37.9 EUR
ВЕРСАЛЬ: ЖЕЛАННЫЙ МИР ИЛИ ПЛАН БУДУЩЕЙ ВОЙНЫ?. 224 стр. (ТВЁРДЫЙ ПЕРЕПЛЁТ) 11 ноября 1918 года в старом вагоне неподалеку от Компьеня было подписано перемирие, которое означало окончание Первой мировой войны. Через полгода, 28 июня 1919 года, был подписан Версальский договор — вердикт, возлагавший... (Подробнее) 2023. 696 с. Твердый переплет в суперобложке. 119.9 EUR
Опираясь на новейшие исследования, историк Кристофер Кларк предлагает свежий взгляд на Первую мировую войну, сосредотачивая внимание не на полях сражений и кровопролитии, а на сложных событиях и отношениях, которые привели группу благонамеренных лидеров к жестокому конфликту. Кларк прослеживает... (Подробнее) URSS. 2024. 704 с. Твердый переплет. 26.9 EUR
В новой книге профессора В.Н.Лексина подведены итоги многолетних исследований одной из фундаментальных проблем бытия — дихотомии естественной неминуемости и широчайшего присутствия смерти в пространстве жизни и инстинктивного неприятия всего связанного со смертью в обыденном сознании. Впервые... (Подробнее) URSS. 2024. 344 с. Мягкая обложка. 18.9 EUR
Мы очень часто сталкиваемся с чудом самоорганизации. Оно воспринимается как само собой разумеющееся, не требующее внимания, радости и удивления. Из случайно брошенного замечания на семинаре странным образом возникает новая задача. Размышления над ней вовлекают коллег, появляются новые идеи, надежды,... (Подробнее) URSS. 2023. 272 с. Мягкая обложка. 15.9 EUR
Настоящая книга посвящена рассмотрению базовых понятий и техник психологического консультирования. В ней детально представлены структура процесса консультирования, описаны основные его этапы, содержание деятельности психолога и приемы, которые могут быть использованы на каждом из них. В книге... (Подробнее) URSS. 2024. 576 с. Мягкая обложка. 23.9 EUR
Эта книга — самоучитель по военной стратегии. Прочитав её, вы получите представление о принципах военной стратегии и сможете применять их на практике — в стратегических компьютерных играх и реальном мире. Книга состоит из пяти частей. Первая вводит читателя в мир игр: что в играх... (Подробнее) URSS. 2024. 248 с. Мягкая обложка. 14.9 EUR
В книге изложены вопросы новой области современной медицины — «Anti-Ageing Medicine» (Медицина антистарения, или Антивозрастная медицина), которая совмещает глубокие фундаментальные исследования в биомедицине и широкие профилактические возможности практической медицины, а также современные общеоздоровительные... (Подробнее) URSS. 2024. 240 с. Твердый переплет. 23.9 EUR
Предлагаемая вниманию читателей книга, написанная крупным биологом и государственным деятелем Н.Н.Воронцовым, посвящена жизни и творчеству выдающегося ученого-математика, обогатившего советскую науку в области теории множеств, кибернетики и программирования — Алексея Андреевича Ляпунова. Книга написана... (Подробнее) 2023. 416 с. Твердый переплет. 19.9 EUR
Вам кажется, что экономика — это очень скучно? Тогда мы идем к вам! Вам даже не понадобится «стоп-слово», чтобы разобраться в заумных формулах — их в книге нет! Все проще, чем кажется. Автор подаст вам экономику под таким дерзким соусом, что вы проглотите ее не жуя! Вы получите необходимые... (Подробнее) |