Лекции по построению компилятора на Pascal

       

СИНТАКСИЧЕСКИЙ АНАЛИЗ


К этому моменту мы распределили все подпрограммы, составляющие наш Cradle, в модули, которые мы можем вытаскивать когда они необходимы. Очевидно, они будут развиваться дальше когда мы снова продолжим процесс восстановления, но большая часть их содержимого и несомненно архитектура, которую они подразумевают, определена. Остается воплотить синтаксис языка в модуль синтаксического анализа. Мы не будем делать многого из этого в этой главе, но я хочу сделать немного просто чтобы оставить вас с хорошим чувством, что мы все еще знаем что делаем. Так что прежде, чем мы продолжим, давай сгенерируем синтаксический анализатор достаточный только для обработки одиночного показателя в выражении. В процессе мы также обнаружим, что по необходимости создали также модуль генератора кода.

Помните самую первую главу этой серии? Мы считывали целочисленное значение, скажем n, и генерировали код для его загрузки в регистр D0 через move:

MOVE #n,D0

Немного погодя, мы повторили этот процесс для переменной,

    MOVE X(PC),D0

а затем для показателя, который может быть и константой и переменной. В память о прошлом, давайте повторим этот процесс Определите следующий новый модуль:

{--------------------------------------------------------------}

unit Parser;

{--------------------------------------------------------------}

interface

uses Input, Scanner, Errors, CodeGen;

procedure Factor;

{--------------------------------------------------------------}



implementation

{--------------------------------------------------------------}

{ Parse and Translate a Factor }

procedure Factor;

begin

 LoadConstant(GetNumber);

end;

end.

{--------------------------------------------------------------}

Как вы можете видеть, этот модуль вызывает процедуру LoadConstant, которая фактически выполняет вывод ассемблерного кода. Модуль также использует новый модуль CodeGen. Этот шаг представляет последнее главное изменение в нашей архитектуре с более ранних глав: перемещение машинно-зависимого кода в отдельный модуль. Если я дойду до конца, вне CodeGen не будет ни одной строчки кода, которая указывала бы на то, что мы нацелены на процессор 68000. И это то место, которое показывает, что моя цель достижима.


Для тех из вас, кто желает, чтобы я использовал архитектуру 80x86 (или любую другую) вместо 68000, вот мой ответ: просто замените CodeGen на подходящий для вашего ЦПУ.

Пока наш генератор кода содержит только одну процедуру. Вот этот модуль:

{--------------------------------------------------------------}

unit CodeGen;

{--------------------------------------------------------------}

interface

uses Output;

procedure LoadConstant(n: string);

{--------------------------------------------------------------}

implementation

{--------------------------------------------------------------}

{ Load the Primary Register with a Constant }

procedure LoadConstant(n: string);

begin

 EmitLn('MOVE #' + n + ',D0' );

end;

end.

{--------------------------------------------------------------}

Скопируйте и откомпилируйте этот модуль и выполните следующую основную программу:

{--------------------------------------------------------------}

program Main;

uses WinCRT, Input, Output, Errors, Scanner, Parser;

begin

 Factor;

end.

{--------------------------------------------------------------}

Вот он, сгенерированный код, такой как мы и надеялись.

Теперь, я надеюсь, вы можете начать видеть преимущества модульной архитектуры нашего нового проекта. Здесь мы имеем основную программу длиной всего пять строк.   Это все, что нам нужно видеть, если мы не захотим видеть больше. И пока все эти модули сидят здесь терпеливо ожидая когда смогут послужить нам. Наше преимущество в том, что мы имеем простой и короткий код, но мощных союзников. Что остается сделать, это расширить модули до уровня возможностей более ранних глав. Мы сделаем это в следующей главе, но прежде, чем я закончу, давайте закончим синтаксический анализ показателя только для того, чтобы убедить себя, что мы знаем как. Конечная версия CodeGen включает новую процедуру LoadVariable:

{--------------------------------------------------------------}

unit CodeGen;

{--------------------------------------------------------------}



interface

uses Output;

procedure LoadConstant(n: string);

procedure LoadVariable(Name: string);

{--------------------------------------------------------------}

implementation

{--------------------------------------------------------------}

{ Load the Primary Register with a Constant }

procedure LoadConstant(n: string);

begin

 EmitLn('MOVE #' + n + ',D0' );

end;

{--------------------------------------------------------------}

{ Load a Variable to the Primary Register }

procedure LoadVariable(Name: string);

begin

 EmitLn('MOVE ' + Name + '(PC),D0');

end;

end.

{--------------------------------------------------------------}

    Сам модуль Parser не изменяется, но мы имеем  более сложную версию процедуры Factor:

{--------------------------------------------------------------}

{ Parse and Translate a Factor }

procedure Factor;

begin

 if IsDigit(Look) then

  LoadConstant(GetNumber)

 else if IsAlpha(Look)then

  LoadVariable(GetName)

 else

  Error('Unrecognized character ' + Look);

end;

{--------------------------------------------------------------}

Теперь, без изменений основной программы, вы должны обнаружить, что программа обрабатывает и переменный и постоянный показатель. К этому моменту наша архитектура почти завершена; у нас есть модули, выполняющие всю грязную работу и достаточно кода в синтаксическом анализаторе и генераторе кода, чтобы продемонстрировать что все работает. Остается расширить модули которые мы определили, в особенности синтаксический анализатор и генератор кода, для поддержки более сложных синтаксических элементов, которые составляют настоящий язык. Так как мы делали это много раз прежде в предыдущих главах, не должно занять у нас много времени вернуться назад к тому месту, где мы были до долгого перерыва. Мы продолжим этот процесс в Главе 16, которая скоро появится. Увидимся.


Содержание раздела