13. Процедуры
ВВЕДЕНИЕ
Наконец-то мы принимаемся за
хорошую главу!
К этому моменту мы изучили почти
все основные особенности компиляторов и синтаксического анализа. Мы узнали
как транслировать арифметические выражения, булевы выражения, управляющие
конструкции, объявления данных и операторы ввода/вывода. Мы определили
язык TINY 1.3, который воплощает все эти возможности, и написали элементарный
компилятор, который может их транслировать. Добавив файловый ввод/вывод
мы могли бы действительно иметь работающий компилятор, способный производить
выполнимые объектные файлы из программ, написанных на TINY. С таким компилятором
мы могли бы писать простые программы, способные считывать целочисленные
данные, выполнять над ними вычисления и выводить результаты.
Все это хорошо, но то, что у
нас есть, это все еще только игрушечный язык. Мы не можем считывать и выводить
даже одиночные символы текста и у нас все еще нет процедур.
Эти возможности, которые будут
обсуждены в следующих двух главах, так сказать отделят мужчин от игрушек.
"Настоящие" языки имеют более одного типа данных и они поддерживают вызовы
процедур. Более чем любые другие, именно эти две возможности дают языку
большую часть его характера и индивидуальности. Как только мы предоставим
их, наши языки, TINY и его преемники, перестанут быть игрушками и получат
характер настоящих языков, пригодных для серъезного программирования.
В течение нескольких предыдущих глав
я обещал вам урок по этим двум важным темам. Каждый раз появлялись другие
проблемы, которые требовали отклонения и работы с ними. Наконец у нас появилась
возможность оставить все эти проблемы в покое и вернуться в основное русло.
В этой главе я охвачу процедуры. В следующий раз мы поговорим об основных
типах данных.
ПОСЛЕДНЕЕ ОТКЛОНЕНИЕ
Эта глава была необычайно трудной для
меня. Причина не имеет никакого отношения непосредственно к теме... я знал,
о чем хотел рассказать уже какое-то время, и фактически я представил большинство
из этого на Software Development '89, в феврале. Больше это имело
отношение к подходу. Позвольте мне объяснить.
Когда я впервые начал эту серию, я
сказал вам, что мы будем использовать некоторые "приемы" чтобы упростить
себе жизнь и позволить нам получить общее представление не вдаваясь слишком
подробно в детали. Среди этих приемов была идея рассмотрения отдельных
частей компилятора в отдельные моменты времени, т.е. выполнения экспериментов,
использующих Cradle как основу. Когда, например, мы исследовали выражения
мы работали только с этой частью теории компиляции.
Когда мы исследовали управляющие структуры, мы писали различные программы,
все еще основанные на Cradle, для выполнения этой части. Мы включили эти
понятия в полный язык довольно недавно. Эти методы служили нам действительно
очень хорошо и привели нас к разработке компилятора для TINY версии 1.3.
Вначале, когда я начал этот урок,
я попытался основываться на том, что мы уже сделали и просто добавлять
новые возможности в существующий компилятор. Это оказалось немного неудобным
и сложным... слишком, чтобы удовлетворить меня.
В конце концов я выяснил почему. В
этой серии экспериментов я отказался от очень полезного метода, который
позволил нам добраться до сюда, и без особой на то нужды я переключился
на новый метод работы, который включал в себя пошаговые изменения в полной
версии компилятора TINY.
Вы долны понять, что то, чем мы здесь
занимаемся немного уникально. Существует ряд статей таких как статьи по
Small C от Кейна и Хендрикса, которые представляли законченный компилятор
для одного языка или другого. Это другое. В этой обучающей серии вы наблюдаете
за моей разработкой и реализацией и языка и компилятора в реальном режиме
времени.
В экспериментах, которые я проводил
при подготовке к этой статье, я пробовал вносить изменения в компилятор
TINY таким способом, что на каждом шаге мы бы все еще имели настоящий,
работающий компилятор. Другими словами, я сделал попытку инкрементального
расширения языка и его компилятора в то же самое время объясняя вам,
что я делал.
Это оказалось тяжелым делом! В конце-концов
я понял, что глупо было и пытаться. Достигнув столького используя
идею маленьких экспериментов, основанных на односимвольных токенах и простых,
специализированных программах, я отказался от них в пользу работы с полным
компилятором. Это не сработало.
Поэтому мы собираемся возвратиться
к своим корням, так сказать. В этой и следующей главах я буду снова использовать
односимвольные токены для исследования концепции процедур, освобожденный
от другого багажа, накопленного нами на предыдущих уроках. Фактически,
я даже не буду пытаться в конце этого урока обьединить конструкции
в компилятор TINY. Мы оставим это на потом.
В конце концов на этот раз вам
не понадобится что-то большее, так что давайте не будем больше тратить
времени зря и двинемся вперед.
ОСНОВЫ
Все современные центральные процессоры
предоставляют прямую поддержку вызовов процедур и 68000 не исключение.
Для 68000 вызов - BSR (PC-относительная версия) или JSR, и возвращение
RTS. Все что мы должны сделать это организовать для компилятора выдачу
этих команд в соответствующих местах.
В действительности есть три вещи,
которые мы должны рассмотреть. Одна из них - механизм вызова/возврата.
Вторая - механизм определения процедур. И, наконец, вопрос передачи параметров
в вызываемую процедуру. Ни одна из этих вещей не является в действительности
очень сложной и мы можем конечно позаимствовать то, что сделано в других
языках... нет необходимости заново изобретать колесо. Из этих трех вопросов
передача параметров займет большую часть нашего внимания просто потому
что здесь существует много возможностей.
ОСНОВА ДЛЯ ЭКСПЕРИМЕНТОВ
Как всегда нам понадобится некоторое
программное обеспечение, которое послужит нам как основание для того, что
мы делаем. Нам не нужна полная версия компилятора TINY но нам нужна достаточная
его часть для того, чтобы некоторые конструкции были представлены. В частности,
нам нужна по крайней мере возможность обрабатывать утверждения некоторых
видов и объявления данных.
Программа, показанная ниже является
такой основой. Это остаточная форма TINY с односимвольными токенами. Она
имеет объявления данных, но только в их самой простейшей форме... никаких
списков или инициализаторов. Имеются операции присваивания, но только вида
<ident> = <ident>
Другими словами, единственным допустимым
выражением является одиночное имя переменной. Нет никаких управляющих конструкций...
единственным допустимым утверждением является присваивание.
Большую часть программы составляют
просто подпрограммы из стандартного Cradle. Я показал ее здесь полностью
только для того, чтобы быть уверенным что все мы начинаем с одного места:
{--------------------------------------------------------------}
program Calls;
{--------------------------------------------------------------}
{ Constant Declarations }
const TAB = ^I;
CR = ^M;
LF = ^J;
{--------------------------------------------------------------}
{ Variable Declarations }
var Look: char;
{ Lookahead Character }
var ST: Array['A'..'Z'] of char;
{--------------------------------------------------------------}
{ Read New Character From Input Stream }
procedure GetChar;
begin
Read(Look);
end;
{--------------------------------------------------------------}
{ Report an Error }
procedure Error(s: string);
begin
WriteLn;
WriteLn(^G, 'Error: ', s, '.');
end;
{--------------------------------------------------------------}
{ Report Error and Halt }
procedure Abort(s: string);
begin
Error(s);
Halt;
end;
{--------------------------------------------------------------}
{ Report What Was Expected }
procedure Expected(s: string);
begin
Abort(s + ' Expected');
end;
{--------------------------------------------------------------}
{ Report an Undefined Identifier }
procedure Undefined(n: string);
begin
Abort('Undefined Identifier ' + n);
end;
{--------------------------------------------------------------}
{ Report an Duplicate Identifier }
procedure Duplicate(n: string);
begin
Abort('Duplicate Identifier
' + n);
end;
{--------------------------------------------------------------}
{ Get Type of Symbol }
function TypeOf(n: char): char;
begin
TypeOf := ST[n];
end;
{--------------------------------------------------------------}
{ Look for Symbol in Table }
function InTable(n: char): Boolean;
begin
InTable := ST[n] <> ' ';
end;
{--------------------------------------------------------------}
{ Add a New Symbol to Table }
procedure AddEntry(Name, T: char);
begin
if Intable(Name) then Duplicate(Name);
ST[Name] := T;
end;
{--------------------------------------------------------------}
{ Check an Entry to Make Sure It's a Variable }
procedure CheckVar(Name: char);
begin
if not InTable(Name) then Undefined(Name);
if TypeOf(Name)
<> 'v' then Abort(Name + '
is not a
variable');
end;
{--------------------------------------------------------------}
{ Recognize an Alpha Character }
function IsAlpha(c: char): boolean;
begin
IsAlpha := upcase(c) in ['A'..'Z'];
end;
{--------------------------------------------------------------}
{ Recognize a Decimal Digit }
function IsDigit(c: char): boolean;
begin
IsDigit := c in ['0'..'9'];
end;
{--------------------------------------------------------------}
{ Recognize an AlphaNumeric Character }
function IsAlNum(c: char): boolean;
begin
IsAlNum := IsAlpha(c) or IsDigit(c);
end;
{--------------------------------------------------------------}
{ Recognize an Addop }
function IsAddop(c: char): boolean;
begin
IsAddop := c in ['+', '-'];
end;
{--------------------------------------------------------------}
{ Recognize a Mulop }
function IsMulop(c: char): boolean;
begin
IsMulop := c in ['*', '/'];
end;
{--------------------------------------------------------------}
{ Recognize a Boolean Orop }
function IsOrop(c: char): boolean;
begin
IsOrop := c in ['|', '~'];
end;
{--------------------------------------------------------------}
{ Recognize a Relop }
function IsRelop(c: char): boolean;
begin
IsRelop := c in ['=', '#', '<', '>'];
end;
{--------------------------------------------------------------}
{ Recognize White Space }
function IsWhite(c: char): boolean;
begin
IsWhite := c in [' ', TAB];
end;
{--------------------------------------------------------------}
{ Skip Over Leading White Space }
procedure SkipWhite;
begin
while IsWhite(Look) do
GetChar;
end;
{--------------------------------------------------------------}
{ Skip Over an End-of-Line }
procedure Fin;
begin
if Look = CR then begin
GetChar;
if Look = LF then
GetChar;
end;
end;
{--------------------------------------------------------------}
{ Match a Specific Input Character }
procedure Match(x: char);
begin
if Look = x then GetChar
else Expected('''' + x + '''');
SkipWhite;
end;
{--------------------------------------------------------------}
{ Get an Identifier }
function GetName: char;
begin
if not IsAlpha(Look) then Expected('Name');
GetName := UpCase(Look);
GetChar;
SkipWhite;
end;
{--------------------------------------------------------------}
{ Get a Number }
function GetNum: char;
begin
if not IsDigit(Look) then Expected('Integer');
GetNum := Look;
GetChar;
SkipWhite;
end;
{--------------------------------------------------------------}
{ Output a String with Tab }
procedure Emit(s: string);
begin
Write(TAB, s);
end;
{--------------------------------------------------------------}
{ Output a String with Tab and CRLF }
procedure EmitLn(s: string);
begin
Emit(s);
WriteLn;
end;
{--------------------------------------------------------------}
{ Post a Label To Output }
procedure PostLabel(L: string);
begin
WriteLn(L, ':');
end;
{--------------------------------------------------------------}
{ Load a Variable to the Primary Register }
procedure LoadVar(Name: char);
begin
CheckVar(Name);
&n |