URSS.ru - Издательская группа URSS. Научная и учебная литература
Об издательстве Интернет-магазин Контакты Оптовикам и библиотекам Вакансии Пишите нам
КНИГИ НА РУССКОМ ЯЗЫКЕ


 
Вернуться в: Каталог  
Обложка Серебряков В.А., Галочкин М.П. Основы конструирования компиляторов
Id: 1410
 
999 руб.

Основы конструирования компиляторов

URSS. 2001. 224 с. Мягкая обложка. ISBN 5-8360-0242-8. Букинист. Состояние: 4+. .

 Аннотация

Предлагаемая вниманию читателя книга основана на курсе лекций, прочитанных на факультете вычислительной математики и кибернетики Московского государственного университета и факультете управления и прикладной математики Московского физико-технического института в 1991-1999 гг. Авторы надеются, что издание книги восполнит существенный пробел в литературе на русском языке по разработке компиляторов.

Содержание книги представляет собой "классические" разделы предмета: лексический и синтаксический анализ, организация памяти транслятора (таблицы символов) и периода исполнения (магазина), генерация кода, в частности генерация арифметических и логических выражений. Рассматриваются некоторые средства автоматизации процесса разработки трансляторов, такие как LEX, YACC, СУПЕР, методы генерации оптимального кода. Сделана попытка на протяжении всего изложения провести единую "атрибутную" точку зрения на процесс разработки компилятора.

Книга будет полезна как студентам и аспирантам программистских специальностей, так и профессионалам в этих областях.


 Введение


Место компилятора в программном обеспечении

Компиляторы составляют существенную часть программного обеспечения ЭВМ. Это связано с тем, что языки высокого уровня стали основным средством разработки программ. Только очень незначительная часть программного обеспечения, требующая особой эффективности, программируется с помощью ассемблеров. В настоящее время распространено довольно много языков программирования. Наряду с традиционными языками, такими, как Фортран, широкое распространение получили так называемые "универсальные" языки (Паскаль, Си, Модула-2, Ада и другие), а также некоторые специализированные (например, язык обработки списочных структур Лисп). Кроме того, большое распространение получили языки, связанные с узкими предметными областями, такие, как входные языки пакетов прикладных программ.

Для некоторых языков имеется довольно много реализаций. Например, реализаций Паскаля, Модулы-2 или Си для ЭВМ типа IBM PC на рынке десятки.

С другой стороны, постоянно растущая потребность в новых компиляторах связана с бурным развитием архитектур ЭВМ. Это развитие идет по различным направлениям. Совершенствуются старые архитектуры, как в концептуальном отношении, так и по отдельным, конкретным линиям. Это можно проиллюстрировать на примере микропроцессора Intel-80X86. Последовательные версии этого микропроцессора 8086, 80186, 80286, 80386, 80486, 80586 отличаются не только техническими характеристиками, но и, что более важно, новыми возможностями и, значит, изменением (расширением) системы команд. Естественно, это требует новых компиляторов (или модификации старых). То же можно сказать о микропроцессорах Motorola 68010, 68020, 68030, 68040.

В рамках традиционных последовательных машин возникает большое число различных направлений архитектур. Примерами могут служить архитектуры CISC, RISC. Такие ведущие фирмы, как Intel, Motorola, Sun, начинают переходить на выпуск машин с RISC-архитектурами. Естественно, для каждой новой системы команд требуется полный набор новых компиляторов с распространенных языков.

Наконец, бурно развиваются различные параллельные архитектуры. Среди них отметим векторные, многопроцессорные, с широким командным словом (вариантом которых являются суперскалярные ЭВМ). На рынке уже имеются десятки типов ЭВМ с параллельной архитектурой, начиная от супер-ЭВМ (Cray, CDC и другие), через рабочие станции (например, IBM RS/6000) и кончая персональными (например, на основе микропроцессора I--860). Естественно, для каждой из машин создаются новые компиляторы для многих языков программирования. Здесь необходимо также отметить, что новые архитектуры требуют разработки совершенно новых подходов к созданию компиляторов, так что наряду с собственно разработкой компиляторов ведется и большая научная работа по созданию новых методов трансляции.


Структура компилятора

Обобщенная структура компилятора и основные фазы компиляции показаны на рисунке.

На фазе лексического анализа входная программа, представляющая собой поток литер, разбивается на лексемы -- слова в соответствии с определениями языка. Основными формализмами, лежащими в основе реализации лексических анализаторов, являются конечные автоматы и регулярные выражения. Лексический анализатор может работать в двух основных режимах: либо как подпрограмма, вызываемая синтаксическим анализатором для получения очередной лексемы, либо как полный проход, результатом которого является файл лексем.

В процессе выделения лексем лексический анализатор может как самостоятельно строить таблицы объектов (идентификаторов, строк, чисел и т.д.), так и выдавать значения для каждой лексемы, при очередном к нему обращении. В этом случае таблицы объектов строятся в последующих фазах (например, в процессе синтаксического анализа).

На этапе лексического анализа обнаруживаются некоторые (простейшие) ошибки (недопустимые символы, неправильная запись чисел, идентификаторов и др.).

Основная задача синтаксического анализа -- разбор структуры программы. Как правило, под структурой понимается дерево, соответствующее разбору в контекстно-свободной грамматике языка. В настоящее время чаще всего используется либо LL(1)-анализ (и его вариант -- рекурсивный спуск), либо LR(1)-анализ и его варианты (LR(0), SLR(1), LALR(1) и другие). Рекурсивный спуск чаще используется при ручном программировании синтаксического анализатора, LR(1) -- при использовании систем автоматического построения синтаксических анализаторов.

Результатом синтаксического анализа является синтаксическое дерево со ссылками на таблицы объектов. В процессе синтаксического анализа также обнаруживаются ошибки, связанные со структурой программы.

На этапе контекстного анализа выявляются зависимости между частями программы, которые не могут быть описаны контекстно-свободным синтаксисом. Это, в основном, связи "описание-использование", в частности, анализ типов объектов, анализ областей видимости, соответствие параметров, метки и другие. В процессе контекстного анализа таблицы объектов пополняются информацией об описаниях (свойствах) объектов.

Основным формализмом, использующимся при контекстном анализе, является аппарат атрибутных грамматик. Результатом контекстного анализа является атрибутированное дерево программы. Информация об объектах может быть как рассредоточена в самом дереве, так и сосредоточена в отдельных таблицах объектов. В процессе контекстного анализа также могут быть обнаружены ошибки, связанные с неправильным использованием объектов.

Затем программа может быть переведена во внутреннее представление. Это делается для целей оптимизации и/или удобства генерации кода. Еще одной целью преобразования программы во внутреннее представление является желание иметь переносимый компилятор. Тогда только последняя фаза (генерация кода) является машинно-зависимой. В качестве внутреннего представления может использоваться префиксная или постфиксная запись, ориентированный граф, тройки, четверки и другие.

Фаз оптимизации может быть несколько. Оптимизации обычно делят на машинно-зависимые и машинно-независимые, локальные и глобальные. Часть машинно-зависимой оптимизации выполняется на фазе генерации кода. Глобальная оптимизация пытается принять во внимание структуру всей программы, локальная -- только небольших ее фрагментов. Глобальная оптимизация основывается на глобальном потоковом анализе, который выполняется на графе программы и представляет, по существу, преобразование этого графа. При этом могут учитываться такие свойства программы, как межпроцедурный анализ, межмодульный анализ, анализ областей жизни переменных и т.д.

Наконец, генерация кода -- последняя фаза трансляции. Результатом ее является либо ассемблерный модуль, либо объектный (или загрузочный) модуль. В процессе генерации кода могут выполняться некоторые локальные оптимизации, такие, как распределение регистров, выбор длинных или коротких переходов, учет стоимости команд при выборе конкретной последовательности команд. Для генерации кода разработаны различные методы, такие, как таблицы решений, сопоставление образцов, включающее динамическое программирование, различные синтаксические методы.

Конечно, те или иные фазы транслятора могут либо отсутствовать совсем, либо объединяться. В простейшем случае однопроходного транслятора нет явной фазы генерации промежуточного представления и оптимизации, остальные фазы объединены в одну, причем нет и явно построенного синтаксического дерева.


 Оглавление

Предисловие
1 Введение
 1.1.Место компилятора в программном обеспечении
 1.2.Структура компилятора
2 Языки и их представление
 2.1.Алфавиты, цепочки и языки
 2.2.Представление языков
 2.3.Грамматики
  2.3.1.Формальное определение грамматики
  2.3.2.Типы грамматик и их свойства
3 Лексический анализ
 3.1.Регулярные множества и выражения
 3.2.Конечные автоматы
 3.3.Алгоритмы построения конечных автоматов
  3.3.1.Построение недетерминированного конечного автомата по регулярному выражению
  3.3.2.Построение детерминированного конечного автомата по недетерминированному
  3.3.3.Построение детерминированного конечного автомата по регулярному выражению
  3.3.4.Построение детерминированного конечного автомата с минимальным числом состояний
 3.4.Регулярные множества и их представления
 3.5.Программирование лексического анализа
 3.6.Конструктор лексических анализаторов LEX
4 Синтаксический анализ
 4.1.КС-грамматики и МП-автоматы
 4.2.Преобразования КС-грамматик
 4.3.Предсказывающий разбор сверху-вниз
  4.3.1.Алгоритм разбора сверху-вниз
  4.3.2.Функции $FIRST$ и $FOLLOW$
  4.3.3.Конструирование таблицы предсказывающего анализатора
  4.3.4.LL(1)-грамматики
  4.3.5.Удаление левой рекурсии
  4.3.6.Левая факторизация
  4.3.7.Рекурсивный спуск
  4.3.8.Восстановление после синтаксических ошибок
 4.4.Разбор снизу-вверх типа сдвиг-свертка
  4.4.1.Основа
  4.4.2.LR(1)-анализаторы
  4.4.3.Конструирование LR(1)-таблицы
  4.4.4.LR(1)-грамматики
  4.4.5.Восстановление после синтаксических ошибок
  4.4.6.Варианты LR-анализаторов
5 Элементы теории перевода
 5.1.Преобразователи с магазинной памятью
 5.2.Синтаксически управляемый перевод
  5.2.1.Схемы синтаксически управляемого перевода
  5.2.2.Обобщенные схемы синтаксически управляемого перевода
 5.3.Атрибутные грамматики
  5.3.1.Определение атрибутных грамматик
  5.3.2.Классы атрибутных грамматик и их реализация
  5.3.3.Язык описания атрибутных грамматик
6 Проверка контекстных условий
 6.1.Описание областей видимости и блочной структуры
 6.2.Занесение в среду и поиск объектов
7 Организация таблиц символов
 7.1.Таблицы идентификаторов
 7.2.Таблицы расстановки
 7.3.Таблицы расстановки со списками
 7.4.Функции расстановки
 7.5.Таблицы на деревьях
 7.6.Реализация блочной структуры
 7.7.Сравнение методов реализации таблиц
8 Промежуточное представление программы
 8.1.Представление в виде ориентированного графа
 8.2.Трехадресный код
 8.3.Линеаризованные представления
 8.4.Виртуальная машина Java
  8.4.1.Организация памяти
  8.4.2.Набор команд виртуальной машины
   Обработка исключительных ситуаций
 8.5.Организация информации в генераторе кода
 8.6.Уровень промежуточного представления
9 Генерация кода
 9.1.Модель машины
 9.2.Динамическая организация памяти
  9.2.1.Организация магазина со статической цепочкой
  9.2.2.Организация магазина с дисплеем
 9.3.Назначение адресов
 9.4.Трансляция переменных
 9.5.Трансляция целых выражений
 9.6.Трансляция арифметических выражений
 9.7.Трансляция логических выражений
 9.8.Выделение общих подвыражений
 9.9.Генерация оптимального кода методами синтаксического анализа
  9.9.1.Сопоставление образцов
  9.9.2.Синтаксический анализ для T-грамматик
  9.9.3.Выбор дерева вывода наименьшей стоимости
  9.9.4.Атрибутная схема для алгоритма сопоставления образцов
10 Системы автоматизации построения трансляторов
 10.1.Система СУПЕР
 10.2.Система Yacc
Литература
 
© URSS 2016.

Информация о Продавце