Untitled
12. АРИФМЕТИЧЕСКИЙ СОПРОЦЕССОР
12.1. Вещественные числа
12.2. Целые числа
12.3. Регистры сопроцессора
12.4. Система команд сопроцессора
12.5. Программирование сопроцессора
12.6. Обработка особых случаев
Последнее устройство, которое мы опишем в этом томе - арифметический
сопроцессор Intel 8087/80287/80387. Это устройство подключено
непосредственно к центральному процессору и предназначено для
выполнения операций над числами в формате с плавающей точкой (вещественные
числа) и длинными целыми числами.
Арифметический сопроцессор значительно (в десятки раз) ускоряет
вычисления, связанные с вещественными числами. Он может вычислять
такие функции, как синус, косинус, тангенс, логарифмы и т.д. Разумеется,
что с помощью сопроцессора можно выполнять и простейшие арифметические
операции сложения, вычитания, умножения и деления.
Основная область применения арифметического сопроцессора - научные
расчеты и машинная графика. Некоторые пакеты САПР, например, Autocad
версии 10, отказывается работать, если в машине отсутствует сопроцессор.
Более современный процессор Intel 80486 содержит встроенный арифметический
сопроцессор, совместимый с 80387 (и даже немного более мощный).
Сопроцессор запускается центральным процессором. После запуска
он выполняет все вычисления самостоятельно и параллельно с работой
центрального процессора. Если центральный процессор выдает очередную
команду сопроцессору в момент времени, когда тот еще не закончил
выполнение предыдущей команды, центральный процессор переводится
в состояние ожидания. Если же сопроцессор ничем не занят, центральный
процессор, выдав команду сопроцессору, продолжает свою работу,
не дожидаясь завершения вычисления. Впрочем, есть специальные
средства синхронизации (команда FWAIT).
Как программировать сопроцессор?
Команды, предназначенные для выполнения сопроцессором, записываются
в программе как обычные машинные команды центрального процессора.
Но все эти команды начинаются байта, соответствующего команде
центрального процессора ESC.
Встретив такую команду, процессор передает ее на выполнение сопроцессору,
а сам продолжает выполнение программы со следующей команды.
Ассемблерные мнемоники всех команд сопроцессора начинаются с буквы
F, например: FADD, FDIV, FSUB и т.д. Команды сопроцессора могут
адресоваться к операндам, аналогично обычным командам центрального
процессора. операндами могут быть либо данные, расположенные в
основной памяти компьютера, либо внутренние регистры сопроцессора.
Возможны все виды адресации данных, используемые центральным процессором.
Прежде чем начать обсуждение команд, выполняемых сопроцессором,
приведем форматы используемых данных. Как мы уже говорили, сопроцессор
может работать либо с данными в формате с плавающей точкой, либо
с целыми числами. В следующем разделе мы рассмотрим используемые
форматы чисел с плавающей точкой или форматы вещественных чисел.
Прежде чем говорить о форматах вещественных числе, используемых
сопроцессором, вспомним о числах с плавающей точкой, встречающихся
в научных расчетах.
В общем виде эти числа можно записать следующим образом:
(знак)(мантисса)*10(знак)(порядок)
Например: -1.35*105
Здесь знак - это минус, мантисса - 1.35, порядок - 5. Порядок
тоже может иметь знак. В этом представлении чисел для вас вряд
ли есть что либо новое. Вспомним также такое понятие, как норамализованное
представление чисел:
- если целая часть мантиссы числа состоит из одной, не равной
нулю, цифры, то число с плавающей точкой называется нормализованным.
В чем преимущества использования нормализованных чисел? В том,
что для фиксированной разрядной сетки числа (т.е. для фиксированного
количества цифр в числе) нормализованные числа имеют наибольшую
точность. Кроме того, нормализованное представление исключает
неоднозначность - каждое число с плавающей точкой может быть представлено
различными (ненормализованными) способами:
123.5678*105 = 12.35678*106 = 1.235678*107 = 0.1235678*108
Для тех, кто программировал на языках высокого уровня, знакомо
следующее представление чисел с плавающей точкой:
(знак)(мантисса)E(знак)(порядок)
Например, -5.35E-2 означает число -5.35*10-2. Такое представление
называется научной нотацией.
Сопроцессор 8087/80287/80387 может работать с вещественными числами
в трех форматах:
- одинарной точности;
- двойной точности;
- расширенной точности.
Эти числа занимают в памяти, соответственно, 4, 8 или 10 байтов:
Одинарная точность
1 бит 8 бит 23 бита
---T-------T--------------------¬
¦Зн¦Порядок¦ Мантисса ¦
L--+-------+---------------------
Двойная точность
1 бит 11 бит 52 бита
---T---------T--------------------------------¬
¦Зн¦ Порядок ¦ Мантисса ¦
L--+---------+---------------------------------
Расширенная точность
1 бит 15 бит 64 бита
---T-------------T------------------------------------¬
¦Зн¦ Порядок ¦ Мантисса ¦
L--+-------------+-------------------------------------
В любом представлении старший бит "Зн" определяет знак
вещественного числа:
- 0 - положительное число;
- 1 - отрицательное число.
Все равные по абсолютному значению положительные и отрицательные
числа отличаются только этим битом. В остальном числа с разным
знаком полностью симметричны. Для представления отрицательных
чисел здесь не используется дополнительный код, как это сделано
в центральном процессоре.
Арифметический сопроцессор работает с нормализованными числами,
поэтому поле мантиссы содержит мантиссу нормализованного числа.
Так как здесь используется двоичное представление чисел, сформулируем
определение нормализованного числа для двоичного представления:
- если целая часть мантисса числа в двоичном представлении равна
1, то число с плавающей точкой называется нормализованным.
Так как для нормализованного двоичного числа целая часть всегда
равна единице, то эту единицу можно не хранить. Именно так и поступили
разработчики арифметического сопроцессора - в форматах одинарной
и двойной точности целая часть мантиссы не хранится. Таким образом
экономится один бит памяти.
Для наглядности представим мантиссу числа в следующей форме:
n.nnnnnnnnnn...n
Здесь символом n обозначается либо 0, либо 1. Нормализованные
числа в самой левой позиции содержат 1, поэтому их можно изобразить
еще и в таком виде:
1.nnnnnnnnnn...n
Представление с расширенной точностью используется сопроцессором
для выполнения всех операций. И даже более - все операции с числами
сопроцессор выполняет над числами только в формате с расширенной
точностью. В этом формате хранится и "лишний" бит целой
части нормализованного числа.
Основная причина использования для вычислений расширенной точности
- предохранение программы от возможной потери точности вычислений,
связанной с большими различиями в порядках чисел, участвующих
в арифметических операциях.
Поле порядка - это степень числа 2, на которую умножается мантисса,
плюс смещение, равное 127 для одинарной точности, 1023 - для двойной
точности и 16383 - для расширенной точности.
Для того, чтобы определить абсолютное значение числа с плавающей
точкой, можно воспользоваться следующими формулами:
- одинарная точность: 1.(цифры мантиссы)*2(P-127)
- двойная точность: 1.(цифры мантиссы)*2(P-1023)
- расширенная точность: 1.(цифры мантиссы)*2(P-16383)
Знак числа, как мы уже говорили, определяется старшим битом.
Приведем конкретный пример. Пусть мы имеем число с одинарной точностью,
которое в двоичном виде выглядит следующим образом:
1 01111110 11000000000000000000000
Для этого числа знаковый бит равен 1 (отрицательное число), порядок
равен 126, мантисса - 11 (в двоичной системе счисления).
Значение этого числа равно:
1.11 * 2(126-127) = -1.75 * 2-1 = -0,875
Рассмотрим теперь различные особые случаи представления вещественных
чисел.
- Нуль - это такое число, у которого порядок и мантисса равны
нулю. Нуль может иметь положительный или отрицательный знаки,
которые игнорируются в операциях сравнения. Таким образом, имеется
два нуля - положительный и отрицательный.
- Наименьшее положительное число - это число, которое имеет
нулевой знаковый бит, значение порядка, равное 1, и значение мантиссы,
равное нулю. В зависимости от представления наименьшее положительное
число имеет следующие значения: 1,17*10-38 (одинарная точность),
2.23*10-308 (двойная точность), 3.37*10-4932 (расширенная точность).
- Наибольшее отрицательное число - полностью совпадает с наименьшим
положительным числом, но имеет бит знака, установленный в 1.
- Наибольшее положительное число -это число, которое имеет нулевой
знаковый бит, поле порядка, в котором все биты кроме самого младшего,
равны 1, и содержит единицы во всех разрядах мантиссы. В зависимости
от представления наибольшее положительное число имеет следующие
значения: 3.37*1038 (одинарная точность), 1.67*10308 (двойная
точность), 1.2*104932 (расширенная точность).
- Наименьшее отрицательное число - полностью совпадает с наибольшим
положительным числом, но имеет бит знака, установленный в 1.
- Положительная и отрицательная бесконечность - это число содержит
все единицы в поле порядка и все нули в поле мантиссы. В зависимости
от состояния знакового бита может быть положительная и отрицательная
бесконечности. Бесконечность может получиться, например, как результат
деления конечного числа на нуль.
- Нечисло - содержит все единицы в поле порядка и любое значение
в поле мантиссы. Нечисло может возникнуть в результате выполнения
неправильной операции при замаскированных особых случаях (ошибкам
при работе с сопроцессоре будет посвящен отдельный раздел этой
главы).
- Неопределенность - содержит в поле порядка все единицы, а
в поле мантиссы - число 1000..0 (для одинарной и двойной точности)
или 11000..0 (для расширенной точности, так как в этом формате
хранится старший бит мантиссы).
Для большей наглядности сведем все возможные представления вещественных
чисел в таблицу:
Положительный нуль
--T---------T------------------¬
¦0¦ 0...0 ¦ 0...0 ¦
L-+---------+-------------------
Отрицательный нуль
--T---------T------------------¬
¦1¦ 0...0 ¦ 0...0 ¦
L-+---------+-------------------
Наименьшее положительное число
--T---------T------------------¬
¦0¦ 0...01 ¦ 0...0 ¦
L-+---------+-------------------
Наибольшее отрицательное число
--T---------T------------------¬
¦1¦ 0...01 ¦ 0...0 ¦
L-+---------+-------------------
Наибольшее положительное число
--T---------T------------------¬
¦0¦ 11...10 ¦ 1...1 ¦
L-+---------+-------------------
Наименьшее отрицательное число
--T---------T------------------¬
¦1¦ 11...10 ¦ 1...1 ¦
L-+---------+-------------------
Положительная бесконечность
--T---------T------------------¬
¦0¦ 1...1 ¦ 0...0 ¦
L-+---------+-------------------
Отрицательная бесконечность
--T---------T------------------¬
¦1¦ 1...1 ¦ 0...0 ¦
L-+---------+-------------------
Нечисло
--T---------T------------------¬
¦1¦ 1...1 ¦ х...х ¦
L-+---------+-------------------
Неопределенность
--T---------T------------------¬
¦1¦ 1...1 ¦ 10...0 ¦
L-+---------+-------------------
Арифметический сопроцессор наряду с вещественными числами способен
обрабатывать и целые числа. Он имеет команды, выполняющие преобразования
целых чисел в вещественные и обратно.
Возможно четыре формата целых чисел:
- целое число;
- короткое целое число;
- длинное целое число;
- упакованное десятичное число.
Целое число занимает два байта. Его формат полностью соответствует
используемому центральным процессором. Для представления отрицательных
чисел используется дополнительный код. Короткое целое и длинное
целое имеют аналогичные форматы, но занимают, соответственно,
4 и 8 байтов.
Упакованное десятичное число занимает 10 байтов. Это число содержит
18 десятичных цифр, расположенных по две в каждом байте. Знак
упакованного десятичного числа находится в старшем бите самого
левого байта. Остальные биты старшего байта должны быть равны
0.
Существуют команды сопроцессора, которые преобразуют числа в формат
упакованных десятичных чисел из внутреннего представления в расширенном
вещественном формате. Если программа делает попытку преобразования
в упакованный формат денормализованных чисел, нечисел, бесконечности
и т.п., в результате получается неопределенность. Неопределенность
в упакованном формате представляет из себя число, в котором два
старших байта содержат единицы во всех разрядах. Содержимое остальных
восьми байтов произвольно. При попытке использовать такое упакованное
число в операциях фиксируется ошибка.
Мы подробно рассмотрели формат представления вещественных чисел
и отметили, что в этом формате для представления отрицательных
чисел используется специальный знаковый бит. Для целых чисел используется
дополнительный код.
В дополнительном коде положительные числа содержат нуль в самом
старшем бите числа:
0XXX XXXX XXXX XXXX
Для получения отрицательного числа в дополнительном коде из положительного
надо инвертировать каждый бит числа и затем прибавить к числу
единицу.
Например, число +5 в дополнительном коде выглядит следующим образом:
0000 0000 0000 0101 = +5
Для получения числа -5 вначале инвертируем значение каждого бита:
1111 1111 1111 1010
Теперь прибавим к полученному числу +1:
1111 1111 1111 1011 = -5
Приведем возможные варианты представления целых чисел:
Нуль
-------------------¬
¦ 0...0 ¦
L-------------------
Наименьшее положительное число
-------------------¬
¦ 0...1 ¦
L-------------------
Наибольшее отрицательное число
-------------------¬
¦ 1...1 ¦
L-------------------
Наибольшее положительное число
-------------------¬
¦ 01...1 ¦
L-------------------
Наименьшее отрицательное число
-------------------¬
¦ 10...01 ¦
L-------------------
Неопределенность
-------------------¬
¦ 10...00 ¦
L-------------------
Упакованное десятичное число имеет следующий вид:
¦1-й байт ¦ Девять байтов ¦
+--T------+---T---T---T---T---+
¦Зн¦000000¦n17¦n16¦...¦n1 ¦n0 ¦
L--+------+---+---+---+---+----
На этом рисунке n0...n17 означают разряды десятичного числа. Они
могут изменяться в пределах от 0000 до 1001, т.е. от 0 до 9 в
десятичной системе счисления.
Теперь, после того как мы рассмотрели форматы данных, с которыми
может работать арифметический сопроцессор, можно перейти к изучению
внутренних регистров сопроцессора.
Арифметический сопроцессор содержит восемь численных 80-битовых
регистров, предназначенных для хранения промежуточных результатов
вычислений, регистра управления, регистра состояния, регистра
тегов, регистра указателя команды и регистра указателя операнда.
12.3.1. Численные регистры
Мы будем обозначать численные регистры как ST0 - ST7. Они приведены
на следующем рисунке:
80 бит
----------------------------------------------------¬
ST0 ¦ ¦
+---------------------------------------------------+
ST1 ¦ ¦
+---------------------------------------------------+
ST2 ¦ ¦
+---------------------------------------------------+
ST3 ¦ ¦
+---------------------------------------------------+
ST4 ¦ ¦
+---------------------------------------------------+
ST5 ¦ ¦
+---------------------------------------------------+
ST6 ¦ ¦
+---------------------------------------------------+
ST7 ¦ ¦
L----------------------------------------------------
Численные регистры используются как стек. Регистр состояния в
поле ST содержит номер численного регистра, являющего вершиной
стека. При выполнении команд в качестве операнда могут выступать
численные регистры. В этом случае номер указанного в команде регистра
прибавляется к содержимому поля ST регистра состояния и таким
образом определяется используемый регистр. Большинство команд
после выполнения увеличивают поле ST регистра состояния, как бы
записывая результаты своей работы в стек численных регистров.
Вы можете использовать регистры как массив, но в этом случае необходимо
заботится о постоянстве поля ST регистра состояния, так как в
противном случае номера численных регистров будут изменяться.
12.3.2. Регистр тегов
Этот регистр разделен на восемь двухбитовых полей, которые мы
обозначим как TAG0...TAG7. Каждое поле относится к своему численному
регистру:
-----T----T----T----T----T----T----T----¬
¦TAG0¦TAG1¦TAG2¦TAG3¦TAG4¦TAG5¦TAG6¦TAG7¦
L----+----+----+----+----+----+----+-----
Поля регистра тегов классифицируют содержимое "своего"
численного регистра:
00 | регистр содержит действительное ненулевое число;
|
01 | в регистре находится нуль;
|
10 | регистр содержит недействительное число (нечисло, бесконечность, неопределенность);
|
11 | пустой неинициализированный регистр.
|
Например, если все регистры сопроцессора были пустые, а затем
в стек численных регистров было занесено одно действительное ненулевое
значение, содержимое регистра тегов будет 3FFFh.
12.3.3. Регистр управления
Регистр управления для сопроцессора 8087 показан на следующем
рисунке:
15-13 12 11-10 9-8 7 6 5 4 3 2 1 0
---------T-T-----T-----T---T---T---T---T---T---T---T---¬
¦XXXXXXXX¦IC¦ RC ¦ PC ¦IEM¦XXX¦PM ¦UM ¦OM ¦ZM ¦DM ¦IM ¦
L--------+--+-----+-----+---+---+---+---+---+---+---+----
Регистр управления сопроцессоров 80287/80387 и сопроцессора, входящего
в состав процессора 80486, имеет аналогичный формат, за исключением
того, что бит 7 в нем не используется:
15-13 12 11-10 9-8 7-6 5 4 3 2 1 0
---------T-T-----T-----T--------T---T---T---T---T---T---¬
¦XXXXXXXX¦IC¦ RC ¦ PC ¦XXXXXXXX¦PM ¦UM ¦OM ¦ZM ¦DM ¦IM ¦
L--------+--+-----+-----+--------+---+---+---+---+---+----
Биты 0...5 - маски особых случаев. Особые случаи иногда возникают
при выполнении команд сопроцессора, например, при делении на нуль,
переполнении и т.д. Если все биты масок особых случаев равны нулю,
особый случай вызывает прерывание центрального процессора INT
10h (обратите внимание, что это прерывание используется BIOS для
работы с дисплейным адаптером). Если же особые случаи замаскированы
установкой соответствующих битов в единичное состояние, прерывание
не вырабатывается, а в качестве результата возвращается особое
значение - бесконечность, нечисло и т.д.
Приведем таблицу масок особых случаев:
IM | маска недействительной операции;
|
DM | маска денормализованного результата;
|
ZM | маска деления на нуль; |
OM | маска переполнения; |
UM | маска антипереполнения;
|
PM | маска особого случая при неточном результате;
|
IEM | маскирование одновременно всех особых случаев вне зависимости от установки битов 0...5 регистра управления, этот бит действителен только для сопроцессора 8087
|
Подробнее особые случаи и условия их возникновения будут описаны
позже, когда мы займемся ошибками при выполнении команд в сопроцессоре.
Поле PC управляет точностью вычислений в сопроцессоре:
00 | использование расширенной точности, этот режим устанавливается при инициализации сопроцессора;
|
10 | округление результата до двойной точности;
|
00 | округление результата до одинарной точности.
|
Искусственное ухудшение точности вычислений не приводит к ускорению
работы программы. Режимы с пониженной точностью предназначены
для эмуляции процессоров, использующих двойную и одинарную точность,
соответственно.
Двух битовое поле RC задает режим округления при выполнении операций
с вещественными числами:
00 | округление к ближайшему числу, этот режим устанавливается при инициализации сопроцессора;
|
01 | округление в направлении к отрицательной бесконечности;
|
10 | округление в направлении к положительной бесконечности;
|
11 | округление в направлении к нулю.
|
На следующих рисунках демонстрируются перечисленные выше режимы
округления. Символами "o" обозначены точные значения
вещественных чисел, символами "x" приближенные значения.
Стрелки "<<" и ">>" указывают
направление округления. В центре линии расположен нуль числовой
оси, на ее левом и правом конце - отрицательная и положительная
бесконечности.
Округление в направлении к ближайшему числу.
-беск.<-o-<<-x-------o---- 0 -----o-----x->>-o---->+беск.
Округление в направлении к отрицательной бесконечности.
-беск.<-o-<<-x-------o---- 0 -----o--<<---x-o---->+беск.
Округление в направлении к положительной бесконечности.
-беск.<-o-x-->>-----o---- 0 -----o------x->>-o---->+беск.
Округление в направлении к нулю.
-беск.<-o-x-->>-----o---- 0 -----o--<<----x-o---->+беск.
Для наибольшего уменьшения ошибок вычислений наиболее целесообразно
использовать режим округления в направлении к ближайшему числу.
Режим округления в направлении к нулю используется при моделировании
целочисленной арифметики.
Остальные два режима округления используют в интервальной арифметике.
Для получения наиболее точного результата каждая команда (операция)
выполняется два раза - первый раз с округлением в направлении
к отрицательной бесконечности, второй раз - в направлении к положительной
бесконечности. Точный результат лежит между полученными значениями.
Заметьте, что здесь речь идет только об отелных операциях, но
не о том, чтобы выполнить всю программу вычислений вначале с одним
режимом округления, а затем с другим.
Поле IC регистра управления предназначен для управления бесконечностью:
0 проективный режим;
1 афинный режим.
В проективном режиме существует только одна бесконечность, она
не имеет знака:
Бесконечность
-----------------> <-----------------¬
¦ ¦
¦ ¦
¦ ¦
L---------------- 0 ------------------
В афинном режиме имеется две бесконечности - положительная и отрицательная:
-бесконечность + бесконечность
<-------------------------- 0 ---------------------------->
Афинный режим допускает выполнение многих операций с бесконечностями
- сложение, умножение и т.д.
12.3.4. Регистр состояния
Поля регистра состояния сопроцессора 8087 показаны на следующем
рисунке:
15 14 13-11 10 9 8 7 6 5 4 3 2 1 0
---T-T-----T-T-T-T-T-T-T---T-T-T-T--¬
¦B ¦C3¦ ST ¦C2¦C1¦C0¦IR¦XX¦PE¦UE ¦OE¦ZE¦DE¦IE¦
L--+--+-----+--+--+--+--+--+--+---+--+--+--+---
Регистр состояния сопроцессоров 80287/80387 и сопроцессора, входящего
в состав процессора 80486, имеет немного другой формат:
15 14 13-11 10 9 8 7 6 5 4 3 2 1 0
---T--T-----T--T-T-T-T-T--T--T---T---T--T-----¬
¦B ¦C3¦ ST ¦C2¦C1¦C0¦ES¦XX¦PE¦UE ¦OE¦ZE¦DE¦IE¦
L--+--+-----+--+--+--+--+--+--+---+--+--+--+---
В обоих форматах биты 0...5 - флажки особых случаев. Они устанавливаются
всегда при возникновении особых случаев, даже замаскированных
установкой в 1 соответствующих битов регистра управления.
Приведем таблицу флажков особых случаев:
IE | недействительная операция;
|
DE | денормализованный результат;
|
ZE | деление на нуль; |
OE | переполнение; |
UE | антипереполнение; |
PE | неточный результат. |
Для того, чтобы сбросить установившийся флажок, программа должна
явным образом установить его в нуль, выполнив команду записи в
регистр состояния.
Назначение бита 7 регистра состояния различно для сопроцессора
8087 и сопроцессоров 80287/80387.
Для сопроцессора 8087 этот бит обозначается IR и содержит флаг
запроса прерывания при возникновении незамаскированного особого
случая. В этом случае флаг устанавливается в 1.
Сопроцессоры 80287/80387 используют бит 7 в качестве флага суммарной
ошибки, который устанавливается в 1 при возникновении незамаскированного
особого случая.
Биты C0, C1, C2, C3 - это коды условий. Они определяются по результату
выполнения команд сравнения и команды нахождения остатка. Мы расскажем
о них при описании соответствующих команд сопроцессора.
Поле ST занимает три бита 11...13 и содержит номер численного
регистра, являющегося вершиной стека численных регистров.
Бит B - бит занятости. Он устанавливается в 1, когда процессор
выполняет команду или когда происходит прерывание от сопроцессора.
Если сопроцессор свободен, бит занятости установлен в 0.
12.3.5. Регистры указателя команды и указателя операнда
Регистры указателя команды и указателя операнда предназначены
для обработки особых случаев, возникающих при выполнении команд
в сопроцессоре.
В сопроцессоре 8087 указатель команды содержит 20-разрядный адрес
команды, вызвавшей особый случай и код выполняемой в этот момент
операции. Адрес команды здесь указывается без учета предшествующих
команде префиксов:
---------------------------------------------------¬
¦Адрес команды (0...15) ¦
+------------------------T-T-----------------------+
¦Адрес команды (16...19) ¦X¦ Код операции (0...10) ¦
L------------------------+-+------------------------
Сопроцессоры 80287/80387 в реальном режиме работы имеют такой
же формат регистра указателя команд, однако этот указатель показывает
на первый префикс команды, вызвавшей особый случай.
Защищенный режим работы центрального процессора и сопроцессора
выходит за рамки данной книги, однако для полноты изложения приведем
формат указателей и для этого режима. В защищенном режиме адрес
состоит из селектора (в какой-то степени соответствует сегментной
компоненте адреса реального режима) и смещения. Формат указателя
команды для защищенного режима представлен на следующем рисунке:
---------------------------------------------------¬
¦ Смещение команды ¦
+--------------------------------------------------+
¦ Селектор команды ¦
L---------------------------------------------------
Код операции здесь отсутствует, но его легко получить, пользуясь
адресом команды.
Если при возникновении особого случая использовался операнд, находящийся
в оперативной памяти, его адрес записывается в регистр указателя
операнда. Приведем форматы этого регистра для реального и защищенного
режимов работы.
Формат указателя операнда для реального режима:
---------------------------------------------------¬
¦ Адрес операнда (0...15) ¦
+-------------------------------T------------------+
¦ Адрес операнда (16...19) ¦XXXXXXXXXXXXXXXXXX¦
L-------------------------------+-------------------
Формат указателя операнда для защищенного режима:
---------------------------------------------------¬
¦ Смещение операнда ¦
+--------------------------------------------------+
¦ Селектор операнда ¦
L---------------------------------------------------
Возможны три формата команд сопроцессора, аналогичные форматам
команд центральных процессоров 8086/80286/80386. Это команды с
обращением к оперативной памяти, команды с обращением к одному
из численных регистров и команды без операндов, заданных явным
образом.
Команды с обращением к памяти могут занимать от двух до четырех
байтов, в зависимости от способа адресации операнда, находящегося
в памяти:
¦1 байт ¦1 байт ¦1 байт ¦1 байт ¦
+-----T----+---T----T---+-----------+-----------+
¦11011¦КОП1¦MOD¦КОП2¦R/M¦ Смещение1 ¦ Смещение2 ¦
L-----+----+---+----+---+-----------+------------
Первые пять битов соответствуют команде центрального процессора
ESC. Поля КОП1 и КОП2 определяют выполняемую команду, т.е. содержат
код операции. Поля MOD и R/M вместе с полями "Смещение1"
и "Смещение2" задают адрес операнда в памяти аналогично
тому, как это происходит в процессорах 8086/80286/80386. Однако
есть и отличия, связанные с возможностью адресации численных регистров
сопроцессора.
Приведем таблицу, показывающую зависимость способа адресации от
содержимого полей MOD и R/M:
-----T----------------------------------------------¬
¦Поле¦ Поле MOD ¦
¦R/M +---------T---------------T----------------T---+
¦ ¦ 00 ¦ 01 ¦ 10 ¦11 ¦
+----+---------+---------------+----------------+---+
¦000 ¦(bx)+(si)¦(bx)+(si)+disp8¦(bx)+(si)+disp16¦ST0¦
¦001 ¦(bx)+(di)¦(bx)+(di)+disp8¦(bx)+(di)+disp16¦ST1¦
¦010 ¦(bp)+(si)¦(bp)+(si)+disp8¦(bp)+(si)+disp16¦ST2¦
¦011 ¦(bp)+(di)¦(bp)+(di)+disp8¦(bp)+(di)+disp16¦ST3¦
¦100 ¦ (si) ¦ (si)+disp8 ¦ (si)+disp16 ¦ST4¦
¦101 ¦ (di) ¦ (di)+disp8 ¦ (di)+disp16 ¦ST5¦
¦110 ¦ disp16 ¦ (bp)+disp8 ¦ (bp)+disp16 ¦ST6¦
¦111 ¦ (bx) ¦ (bx)+disp8 ¦ (bx)+disp16 ¦ST7¦
L----+---------+---------------+----------------+----
Если в таблице указаны значения смещения disp8 или disp16, это
означает, что в команде присуствует один или два байта смещения,
соответственно.
Если поле MOD содержит значение 11, возможна адресация численных
регистров ST0...ST1. При этом команда не содержит байтов смещения.
Формат команды с обращением к численному регистру приведен на
следующем рисунке:
¦1 байт ¦1 байт ¦
+-----T----+---T----T---+
¦11011¦КОП1¦11 ¦КОП2¦STi¦
L-----+----+---+----+----
Видно, что это есть частный случай предыдущей команды, в которой
поле MOD содержит значение 11 и отсутствуют байты смещения.
Самый простой формат имеют команды без явного обращения к операндам:
¦1 байт ¦1 байт ¦
+-----T----+---T--------+
¦11011¦КОП1¦11 ¦ КОП2 ¦
L-----+----+---+---------
Разумеется, если вы пишете программу для сопроцессора на языке
ассемблера, вы можете использовать мнемоническое обозначение команд.
Все мнемоники команд сопроцесора начинаются с буквы F, поэтому
их легко отличить от команд процессоров 8086/80286/80386/80486.
Все команды сопроцессора можно разделить на несколько групп:
- команды пересылки данных;
- арифметические команды;
- команды сравнений чисел;
- трансцендентные команды;
- управляющие команды.
Команды пересылки данных предназначены для загрузки чисел из оперативной
памяти в численные регитры, записи данных из численных регистров
в операивную память, копирования данных из одного численного регистра
в другой.
Арифметические команды выполняют такие операции, как сложение,
вычитание, умножение, деление, извлечение квадратного корня, нахождение
частичного остатка, округление и т.п.
Команды сравнения сравнивают вещественные и целые числа, выполняют
анализ чисел.
Трансцендентные команды предназначены для вычисления различных
тригонометрических, логорифмических, показательных и гиперболических
функций - sin(), cos(), tg() и т.п.
Последняя группа команд - управляющие команды - обеспечивают установку
режима работы арифметического сопроцессора, его сброс и инициализацию,
перевод сопроцессора в защищенный режим работы и т.д.
Следующие разделы будут посвящены детальному описанию различных
групп команд сопроцессора.
12.4.1. Команды пересылки данных
Запись в стек
FLD ST(0) <- память, вещественный формат
FILD ST(0) <- память, целый формат
FBLD ST(0) <- память, десятичный формат
Команды FLD, FILD, FBLD загружают в вершину стека вещественное,
целое и десятичное числа, соответственно.
При выполнении этих команд операнд считывается из оперативной
памяти, преобразуется в формат с расширенной точностью. Затем
поле ST регистра состояния уменьшается на единицу и выполняется
запись операнда в численный регистр, определяемый новым значением
поля ST. Т.е. операнд записывается в стек численных регистров,
а указатель стека - поле ST - уменьшается на единицу. По своему
действию эти команды напоминают команду PUSH центрального процессора.
Непосредственно перед загрузкой численного регистра проверяется
содержимое поля TAG0. Если это содержимое не равно 11 (пустой
регистр), в регистре состояния устанавливается флаг IE (недействительная
операция) и вырабатывается прерывание (если в регистре управления
не установлена маска IM - маска недействительной операции).
Извлечение из стека
FSTP память -> ST(0), вещественный формат
FISTP память -> ST(0), целый формат
FBSTP память -> ST(0), десятичный формат
Команды извлечения чисел из стека выполняют действие, обратное
только что описанному. Содержимое численного регистра, номер которого
определяется полем ST регистра состояния, преобразуется в необходимый
формат и записывается в ячейки оперативной памяти, заданные операндом
команды.
После записи содержимое поля ST увеличивается на единицу. Эти
действия аналогичны выполняемым командой POP центрального процессора.
В зависимости от команды (FSTP, FISTP или FBSTP) производится
преобразование формата (из расширенного в вещественный, целый
или десятичный, соответственно). В процессе преобразования для
команд FSTP и FISTP выполняется округление в соответствии с содержимым
поля RC регистра управления. Для команды FBSTP округление всегда
выполняется следующим образом - прибавляется число 0.5, затем
дробная часть результата отбрасывается.
Копирование данных
FST память -> ST(0), вещественный формат
FIST память -> ST(0), целый формат
FBST память -> ST(0), десятичный формат
(только 80387, 80486)
Эти команды пересылают данные из верхушки стека в область памяти,
указанную операндом команды. При этом содержимое указателя стека
(поля ST) не изменяется.
Команда FST в качестве операнда может использовать ссылку на численный
регистр ST(i), поэтому вы можете использовать эту команду для
копирования верхушки стека в любой другой численный регистр.
При записи данных в оперативную память выполняется преобразование
формата (в вещественный для FST, в целый для FIST и в десятичный
для FBST.
Для сопроцессора 80286 вместо отсутствующей команды FBST можно
выполнить следующие две команды, которые приведут к такому же
результату:
FLD ST(0)
FBSTP dec_number
Обмен
FXCH ST(i) -> ST(0), ST(0) -> ST(i)
Команда выполняет обмен содержимым верхушки стека ST(0) и численного
регистра, указанного в качестве операнда команды.
Загрузка констант
FLDZ 0 -> ST(0) - Загрузить нуль
FLD1 1 -> ST(0) - Загрузить единицу
FLDPI "Пи" -> ST(0) - Загрузить число "пи".
FLDLG2 log102 -> ST(0) - Загрузить log102
FLDLN2 loge2 -> ST(0) - Загрузить loge2
FLDL2T loge10 -> ST(0) - Загрузить loge10
FLDL2E log2e -> ST(0) - Загрузить log2e
Гораздо быстрее загружать константы с помощью специальных команд,
чем использовать команды загрузки данных из оперативной памяти.
12.4.2. Арифметические команды
Сопроцессор использует шесть основных типов арифметических команд:
Fxxx | Первый операнд берется из верхушки стека (источник), второй - следующий элемент стека. Результат выполнения команды записывается в стек.
|
Fxxx память | Источник берется из памяти, приемником является верхушка стека ST(0). Указатель стека ST не изменяется, команда действительна только для операндов с одинарной и двойной точностью.
|
Fixxx память | Аналогично предыдущему типу команды, но операндами могут быть 16- или32-битовые целые числа.
|
Fxxx ST, ST(i) | Для этого типа регистр ST(i) является источником, а ST(0) - верхушка стека - приемником. Указатель стека не изменяется.
|
Fxxx ST(i), ST | Для этого типа регитр ST(0) является источником, а ST(i) - приемником. Указатель стека не изменяется.
|
FxxxP ST(i), ST | Регистр ST(i) - приемник, регистр ST(0) - источник. После выполнения команды источник ST(0) извлекается из стека.
|
Строка "xxx" может принимать следующие значения:
ADD Сложение
SUB Вычитание
SUBR Обратное вычитание, уменьшаемое и вычитаемое
меняются местами
MUL Умножение
DIV Деление
DIVR Обратное деление, делимое и делитель меняются
местами
Кроме основных арифметических команд имеются дополнительные арифметические
команды:
FSQRT | Извлечение квадратного корня
|
FSCALE | Масштабирование на степень числа 2
|
FPREM | Вычисление частичного остатка
|
FRNDINT | Округление до целого
|
FXTRACT | Выделение порядка числа и мантиссы
|
FABS | Вычисление абсолютной величины числа
|
FCHS | Изменение знака числа
|
По команде FSQRT вычисленное значение квадратного корня записывается
в верхушку стека ST(0).
Команда FSCALE изменяет порядок числа, находящегося в ST(0). По
этой команде значение порядка числа ST(0) складывается с масштабным
коэффициентом, который должен быть предварительно записан в ST(1).
Действие этой команды можно представить следующей формулой:
ST(0) = ST(0) * 2n, где -215 <= n <= +215
В этой формуле n - это ST(1).
Команда FPREM вычисляет остаток от деления делимого ST(0) на делитель
ST(1). Знак результата равен знаку ST(0), а сам результат получается
в вершине стека ST(0).
Действие команды заключается в сдвигах и вычитания, аналогично
"ручному" делению "в столбик". После выполнения
команды флаг C2 регистра состояния может принимать следующие значения:
0 | остаток от деления, полученный в ST(0), меньше делителя ST(1), команда завершилась полностью;
|
1 | ST(0) содержит частичный остаток, программа должна еще раз выполнить команду для получения точного значения остатка.
|
Команда RNDINT округляет ST(0) в соответствии с содержимым поля
RC управляющего регистра.
Команда FABS вычисляет абсолютное значение ST(0). Аналогично,
команда FCHS изменяет знак ST(0) на противоположный.
12.4.3. Команды сравнений чисел
В процессорах 8086/80286/80386 команды условных переходов выполняются
в соответствии с установкой отдельных битов регистра флагов процессора.
В арифметическом сопроцессоре существуют специальные команды сравнений,
по результатам выполнения которых устанавливаются биты кодов условий
в регистре состояния:
FCOM | Сравнение |
FICOM | Целочисленное сравнение
|
FCOMP | Сравнение и извлечение из стека
|
FICOMP | Целочисленное сравнение и извлечение из стека
|
FCOMPP | Сравнение и двойное извлечение из стека
|
FTST | Сравнение операнда с нулем
|
FXAM | Анализ операнда |
Команда FCOM вычитает содержимое операнда, размещенного в оперативной
памяти, из верхушки стека ST(0). Результат вычитания никуда не
записывается и указатель верхушки стека ST не изменяется.
Обозначим операнд команды сравнения как "x". В следующей
таблице приведем значения битов кодов условия после выполнения
команды "FCOM x":
C3 | C0 | Условие
|
0 | 0 | ST(0) > x
|
0 | 1 | ST(0) < x
|
1 | 0 | ST(0) = x
|
1 | 1 | ST(0) и x не сравнимы.
|
Последняя комбинация возникает при попытке сравнения нечисел,
неопределенностей или бесконечностей, а также в некоторых других
случаях.
Команда FICOM работает с 16- или 32-битовыми числами, в остальном
она аналогична команде FCOM.
Команды FCOMP и FICOMP аналогичны, соответственно, командам FCOM
и FICOM, за исключением того, что после выполнения операнд извлекается
из стека.
Команда FCOMPP выполняет те же действия, что и FCOM, но она после
выполнения извлекает из стека оба операнда, участвовавших в сравнении.
Для сравнения операнда с нулем предназначена команда FTST. После
ее выполнения коды условий устанавливаются в соответствии со следующей
таблицей:
C3 | C0 | Условие
|
0 | 0 | ST(0) > 0
|
0 | 1 | ST(0) < 0
|
1 | 0 | ST(0) = 0
|
1 | 1 | ST(0) и 0 не сравнимы.
|
Команда FXAM анализирует содержимое ST(0). После ее выполнения
устанавливаются коды условий, по которым можно судить о знаке
числа, о его конечности или бесконечности, нормализованности и
т.д.
Бит C1 содержит знак анализируемого числа:
C1 | Знак числа |
0 | положительное число; |
1 | отрицательное число. |
С помощью бита C0 можно определить, является число конечным или
бесконечным:
C0 | Конечность/бесконечность числа
|
0 | конечное число; |
1 | бесконечное число. |
Для конечных чисел дальнейшая классификация может проводиться
по содержимому кодов условий C2 и C3:
C3 | C2 | Описание числа
|
0 | 0 | Ненормализованное число
|
0 | 1 | Нормализованное число
|
1 | 0 | Нулевое число
|
1 | 1 | Число денормализовано
|
Аналогично, для бесконечных чисел коды условий C2 и C3 имеют следующее
значение:
C3 | C2 | Описание числа
|
0 | 0 | Нечисло
|
0 | 1 | Бесконечное число
|
1 | 0 | Пустое число
|
1 | 1 | Пустое число
|
С помощью команды "FSTSW AX" программа может переписать
содержимое регистра состояния сопроцессора в регистр AX центрального
процессора. Далее содержимое регистра AH можно переписать в регистр
флагов центрального процессора при помощи команды SAHF. Биты кодов
условий сопроцессора отображаются на регистр флагов центрального
процессора таким образом, что для анализа кодов условий можно
использовать команды условных переходов:
---T-T-T-T-T-T-T--¬
¦B ¦C3¦ ¦ST¦ ¦C2¦C1¦C0¦
L--+--+--+--+--+--+--+---
---T-T-T-T-T-T-T--¬
¦SF¦ZF¦ ¦AF¦ ¦PF¦ ¦CF¦
L--+--+--+--+--+--+--+---
Например, в следующем фрагменте программы выполняется переход
к метке error, если операнды несравнимы:
fcom
fstsw ax
sahf
je error
12.4.4. Трансцендентные команды
Трансцендентные команды предназначены для вычисления таких функций,
как тригонометрические (sin, cos, tg,...), обратные тригонометрические
(arcsin, arccos,...), показательные (xy, 2x, 10x, ex), гиперболические
(sh, ch, th,...), обратные гиперболические (arsh, arch, arcth,...).
В следующей таблице приведены все трансцендентные команды сопроцессора:
FPTAN | Вычисление частичного тангенса
|
FPATAN | Вычисление частичного арктангенса
|
FYL2X | Вычисление y*log2(x)
|
FYL2XP1 | Вычисление y*log2(x+1)
|
F2XM1 | Вычисление 2x-1 |
FCOS | Вычисление cos(x) (только 80387/80486)
|
FSIN | Вычисление sin(x) (только 80387/80486)
|
FSINCOS | Вычисление sin(x) и cos(x) одновременно (только 80387/80486)
|
Команда FPTAN вычисляет частичный тангенс ST(0), размещая в стеке
такие два числа x и y, что y/x = tg(ST(0)).
После выполнения команды число y располагается в ST(0), а число
x включается в стек сверху (т.е. записывается в ST(1)). Аргумент
команды FPTAN должен находится в пределах:
0 <= ST(0) <= pi/4
Пользуясь полученным значением частичного тангенса, можно вычислить
другие тригонометрические функции по следующим формулам:
sin(z) = 2*(y/x) / (1 + (y/x)2)
cos(z) = (1 - (y/x)2) / (1 + (y/x)2)
tg(z/2) = y/x;
ctg(z/2) = x/y;
cosec(z) = (1 + (y/x)2) / 2*(y/x)
sec(z) = (1 + (y/x)2) / (1 - (y/x)2)
В этой таблице z - значение, находившееся в ST(0) до выполнения
команды FPTAN, x и y - значения в регистрах ST(0) и ST(1), соответственно.
Команда FPATAN вычисляет частичный арктангенс z=arctg(ST(0)/ST(1))=arctg(x/y).
Перед выполнением команды числа x и y располагаются в ST(0) и
ST(1), сответственно. Аргументы команды FPATAN должен находится
в пределах:
0 < y < x
Результат записывается в ST(0).
Команда FYL2X вычисляет выражение y*log2(x), операнды x и y размещаются,
соответственно, в ST(0) и ST(1). Операнды извлекаются из стека,
а результат записывается в стек. параметр x должен быть положительным
числом.
Пользуясь результатом выполнения этой команды, можно вычислить
следующим образом логарифмические функции:
log2(x) = FYL2(x)
loge(x) = loge(2) * log2(x) = FYL2X(loge(2), x) =
= FYL2X(FLDLN2, x)
log2(x) = log10(2) * log2(x) = FYL2X (log10(2), x) =
= FYL2X(FLDLG2, x)
Функция FYL2XP1 вычисляет выражение y*log2(x+1), где x соответствует
ST(0), а y - ST(1). Результат записывается в ST(0), оба операнда
выталкиваются из стека и теряются.
На операнд x накладывается ограничение:
0 < x < 1 - 1/sqrt(2)
Команда F2XM1 вычисляет выражение 2x-1, где x - ST(0). Результат
записывается в ST(0), параметр должен находится в следующих пределах:
0 <= x <= 0,5
Команда FCOS вычисляет cos(x) (только для 80387/80486). Параметр
x должен находится в ST(0), туда же записывается результат выполнения
команды.
Команда FSIN аналогична команде FCOS, но вычисляет значение косинуса
ST(0).
Команда FSINCOS вычисляет одновременно значения синуса и косинуса
параметра ST(0). Значение синуса записывается в ST(1), косинуса
- в ST(0).
На этом мы закончим описание трансцендентных команд сопроцессора
и перейдем к управляющим командам.
12.4.5. Управляющие команды
Управляющие команды предназначены для работы с нечисловыми регистрами
сопроцессора. Некоторые команды имеют альтернативные варианты.
Мнемоники этих команд могут начинаться с FN или с F. Первый вариант
соответствует командам "без ожидания". Для команд "без
ожидания" процессор не проверяет, занят ли сопроцессор выполнением
команды, т.е. бит занятости B не проверяется. Численные особые
случаи также игнорируются.
Варианты команд "с ожиданием" действуют также, как и
обычные команды сопроцессора.
Приведем таблицу управляющих команд сопроцессора:
FNSTCW (FSTCW) Записать управляющее слово
FLDCW Загрузить управляющее слово
FNSTSW (FSTSW) Записать слово состояния
FNSTSW AX (FSTSW AX) Записать слово состояния в AX,
не поддерживается сопроцессором 8087
FNCLEX (FCLEX) Сбросить особые случаи
FNINIT (FINIT) Инициализировать сопроцессор
FNSTENV (FSTENV) Записать среду
FLDENV Загрузить среду
FNSAVE (FSAVE) Записать полное состояние
FRSTOR Восстановить полное состояние
FINCSTP Увеличить указатель стека на 1
FDECSTP Уменьшить указатель стека на 1
FFREE Освободить регистр
FNOP Холостая команда, нет операции
FSETPM Установить защищенный режим работы
Команда FNSTCW записывает содержимое управляющего регистра в оперативную
память.
Команда FLDCW загружает управляющий регистр данными из оперативной
памяти и обычно используется для изменения режима работы сопроцессора.
Команда FNSTSW записывает содержимое регистра состояния в оперативную
память. Команда FNSTSW AX записывает содержимое этого регистра
в регистр AX центрального процессора для его последующего анализа
командами условных переходов.
Сопроцессор 8087 не имеет варианта команды FSTSW AX, поэтому приходится
вначале записывать регистр состояния в память, а затем в регистр
флагов процессора 8086.
Команда FNCLEX сбрасывает флаги особых случаев в регистре состояния
сопроцессора. Кроме того, сбрасываются биты ES и B.
Команда FNINIT инициализирует регистр состояния, управляющий регистр
и регистр тегов в соответствии со следующей таблицей:
Регистр Устанавливаемый режим работы
Управляющий Проективная бесконечность,
округление к ближайшему,
расширенная точность,
все особые случаи замаскированы.
Состояния B=0 (бит занятости сброшен),
код условия не определен,
ST=ES=0,
флаги особых случаев установлены в нуль.
Тегов Все поля регистра тегов содержат значение
11 (пустой регистр).
Команда FNSTENV записывает в память содержимое всех регистров,
кроме численных, в следующем формате:
------------------------¬
¦ Управляющий регистр ¦
+-----------------------+
¦ Регистр состояния ¦
+-----------------------+
¦ Регистр тегов ¦
+-----------------------+
¦ ¦
+- Указатель команды -+
¦ ¦
+-----------------------+
¦ ¦
+- Указатель операнда -+
¦ ¦
L------------------------
Команда FLDENV предназначена для загрузки регистров, сохраненных
ранее командой FNSTENV. Обе эти команды полезны в программах обработки
особых случаев.
Команды FNSAVE и FRSTOR действуют аналогично командам FNSTENV
и FLDENV, но они дополнительно сохраняют и восстанавливают содержимое
численных регистров. Формат области сохранения регистров, занимающей
94 байта, приведен на следующем рисунке:
------------------------¬
¦ Управляющий регистр ¦
+-----------------------+
¦ Регистр состояния ¦
+-----------------------+
¦ Регистр тегов ¦
+-----------------------+
¦ ¦
+- Указатель команды -+
¦ ¦
+-----------------------+
¦ ¦
+- Указатель операнда -+
¦ ¦
+-----------------------+-------------------------------¬
¦ ST(0) ¦
+-------------------------------------------------------+
¦ ST(1) ¦
+-------------------------------------------------------+
¦ ST(2) ¦
+-------------------------------------------------------+
¦ ST(3) ¦
+-------------------------------------------------------+
¦ ST(4) ¦
+-------------------------------------------------------+
¦ ST(5) ¦
+-------------------------------------------------------+
¦ ST(6) ¦
+-------------------------------------------------------+
¦ ST(7) ¦
L--------------------------------------------------------
Команды FINCSTP и FDECSTP, соответственно, увеличивают и уменьшают
на 1 указатель стека SP.
Команда FFREE ST(i) помечает численный регистр ST(i) как пустой,
записывая в соответствующее поле регистра тегов значение 11.
Команда FNOP не производит никаких действий.
Команда FSETPM переводит сопроцессор в защищенный режим работы.
Подробное рассмотрение защищенного режима работы выходит за рамки
данной книги.
Используя языки высокого уровня, такие как Си или Паскаль, вы
можете даже и не знать, что созданная вами программа использует
для вычислений арифметический сопроцессор. При установке системы
программирования QuickC или C 6.0 вам предоставляется возможность
выброа одного из трех вариантов стандартной библиотеки:
- библиотека эмулятора;
- библиотека, рассчитанная на наличие сопроцессора;
- библиотека альтернативной математики.
Первый вариант (библиотека эмулятора) используется по умолчанию.
Программы, которые создаются с использованием эмулятора, будут
работать как при наличии в системе сопроцессора, так и при его
отсуствии. В последнем случае вычисления с плавающей точкой выполняются
специальными подпрограмами, которые присоединяются к вашей программе
на этапе редактирования. Ваша программа сама определит факт наличия
(или отсуствия) сопроцессора и выберет соответствующий способ
выполнения вычислений - либо с использованием сопроцесора, либо
с использованием подпрограмм эмуляции сопроцессора.
Все что вам нужно для работы с библиотекой эмуляции - это просто
выбрать ее при установке системы программирования. Это самый простой
способ программирования сопроцессора, когда вам, вообще говоря,
совсем не надо его программировать - всю работу по использоанию
сопроцессора выполнят модули библиотеки эмуляции.
Второй вариант библиотеки рассчитан на наличие сопроцессора. Если
сопроцессора нет, программа работать не будет. Но если известно,
что сопроцессор есть (например, процессор 80486 всегда содержит
блок арифметики), то вам имеет смысл использовать именно этот
вариант как самый быстродействующий.
Третий вариант не использует сопроцессор совсем. Все вычисления
выполняются специальными подпрограммами, входящими в состав библиотеки
альтернативной математики и подключающимися к вашей программе
автоматически на этапе редактирования.
К сожалению, есть программы, в которых использование библиотеки
эмуляции невозможно или крайне затруднительно:
- резидентные программы;
- драйверы;
- программы, предъявляющие жесткие требования к точности и скорости
вычислений.
В случае с резидентными программами невозможность использования
библиотеки эмулятора вызвана тем, что после оставления программы
резидентной в памяти, например, функцией _dos_keep(), она теряет
доступ к модулям эмуляции. Механизм вызова программ эмуляции основан
на использовании прерываний с номерами 34h...3Eh. Перед тем как
оставить программу резидентной, функция _dos_keep() восстанавливает
содержимое этих векторов, делая невозможным доступ резидентной
программе к модулям эмулятора. Да и самих этих модулей уже нет
в памяти - на их место может быть загружена новая программа.
Поэтому руководство по Си рекомендует для резидентных программ
использовать библиотеку альтернативной математики. Но эта библиотека,
увы, не использует сопроцессор.
Ситуация с драйверами аналогична - драйверы, как правило, составляются
на языке ассемблера, поэтому средства эмуляции библиотек Си недоступны.
Выходом может быть непосредственное программирование сопроцессора
на языке ассемблера. При этом вы можете полностью использовать
все возможности сопроцессора и добиться от программы наибольшей
эффективности вычислений.
Какие средства можно использовать для составления программ для
сопроцессора?
Обычно это или ассемблер MASM (возможно использование TASM), либо
интегрированная среда разработки QuickC версии 2.01, содержащая
встроенный Quick Assembler.
Приведем пример самой простой программы, подготовленный для трансляции
программой Quick Assemler. Эта программа выполняет вычисления
по следующей несложной формуле:
z = x + y;
Значения x и y задаются в виде констант:
.MODEL TINY
.STACK 100h
.DATA
; Здесь находятся константы с одинарной
; точностью x и y
x dd 1.0
y dd 2.0
; Резервируем четыре байта для результата
z dd ?
.CODE
.STARTUP
; Записываем в стек численных регистров
; значение x
fld x
; Складываем содержимое верхушки стека
; с константой y
fadd y
; Записываем результат в ячейку z
fstp z
; Завершаем работу программы и
; возвращаем управление операционной системе
.EXIT 0
END
Как убедиться в том, что программа работает правильно?
Для этого мы используем отладчик CodeView, содержащий очень удобные
средства отладки программ, работающих с арифметическим сопроцессором.
Запустим отладчик CodeView, передав ему в качестве параметра имя
приведенной выше программы:
cv test87.com
После того, как отладчик запустится, откройте окно регистров сопроцессора,
нажав комбинацию клавиш Alt-V-7:
После этого на в нижней части экрана появится окно регистров сопроцессора:
Пусть вас не смущает то, что в этом окне пока не показывается
состояние регистров сопроцессора. Нажмите клавишу F8, выполнив
один шаг программы. Окно сопроцессора будет содержать следующую
информацию:
Теперь вы видите содержимое регистров управления и состояния (cControl,
cStatus), регистра тегов (cTag), регистров указателей команд и
данных (Instr Ptr, Data Ptr), код выполняемой команды (Opcode).
Отображается также содержимое стека численных регистров (Stack),
но пока это поле пустое, так как все численные регистры отмечены
в регистре тегов как пустые (код 11).
Нажмите еще раз клавишу F8, выполнив следующую команду программы.
Эта команда запишет в стек численных регистров значение переменной
x:
Теперь в области регистров стека показано содержимое регистра
cST(0), причем как в двоичном виде, так и с использованием экспоненциальной
(научной) нотации.
Как и следовало ожидать, регистр ST(0) содержит величину 1.0.
Выполним еще одну команду, прибавляющую к содержимому ST(0) значение
2.0 из переменной y. Теперь регистр ST(0) содержит величину 3.0:
Последняя команда выталкивает из стека хранящееся там значение
(3.0) и записывает его в переменную z. Теперь стек численных регистров
снова пуст:
Отладчик CodeView обладает мощными средствами динамического просмотра
состояния сопроцессора. Однако этот отладчик невозможно использовать
для отладки драйверов. Мы уже говорили вам о проблемах, возникающих
при отладке драйверов, в первом томе "Библиотеки системного
программиста".
Там же нами была предложена методика отладки драйверов, основанная
на включении в исходный текст драйвера подпрограмм, выводящих
на экран содержимое регистров центрального процессора или областей
памяти. Мы привели исходный текст подпрограммы ntrace, которая
выводит на экран содержимое всех регистров центрального процессора.
Если ваш драйвер использует сопроцессор, вам, вероятно, потребуется
также содержимое регистров сопроцессора. Приведем текст подпрограммы
ntrace87, которая наряду с содержимым регистров центрального процессора,
выводит содержимое регистров арифметического сопроцессора:
include sysp.inc
.MODEL tiny
.CODE
PUBLIC ntrace87
;==========================================
; Процедура выводит на экран содержимое
; всех регистров центрального процессора
; и сопроцессора. Затем она ожидает нажатия на
; любую клавишу.
; После возвращения из процедуры
; все регистры восстанавливаются, в том
; числе регистры сопроцессора.
ntrace87 proc near
; Сохраняем в стеке регистры,
; содержимое которых будет изменяться
pushf
push ax
push bx
push cx
push dx
push ds
push bp
mov bp,sp
push cs
pop ds
; Сохраняем полное состояние сопроцессора
fsave cs:regs_87
; Выводим сообщение об останове
mov dx,offset cs:trace_msg
@@out_str
; Выводим содержимое всех регистров
mov ax,cs ; cs
call Print_word
@@out_ch ':'
mov ax,[bp]+14 ; ip
call Print_word
@@out_ch 13,10,13,10,'A','X','='
mov ax,[bp]+10
call Print_word
@@out_ch ' ','B','X','='
mov ax,[bp]+8
call Print_word
@@out_ch ' ','C','X','='
mov ax,[bp]+6
call Print_word
@@out_ch ' ','D','X','='
mov ax,[bp]+4
call Print_word
@@out_ch ' ','S','P','='
mov ax,bp
add ax,16
call Print_word
@@out_ch ' ','B','P','='
mov ax,[bp]
call Print_word
@@out_ch ' ','S','I','='
mov ax,si
call Print_word
@@out_ch ' ','D','I','='
mov ax,di
call Print_word
@@out_ch 13,10,'D','S','='
mov ax,[bp]+2
call Print_word
@@out_ch ' ','E','S','='
mov ax,es
call Print_word
@@out_ch ' ','S','S','='
mov ax,ss
call Print_word
@@out_ch ' ','F','='
mov ax,[bp]+12
call Print_word
; Выводим содержимое регистров сопроцессора
lea dx,cs:r87_msg
@@out_str
; Выводим содержимое управляющего регистра
@@out_ch 'C','N','T','R','='
mov ax, cs:regs_87.cr
call Print_word
; Выводим содержимое регистра состояния
@@out_ch ' ','S','T','A','T','E','='
mov ax, cs:regs_87.sr
call Print_word
; Выводим содержимое регситра тегов
@@out_ch ' ','T','A','G','='
mov ax, cs:regs_87.tg
call Print_word
; Выводим содержимое указателя адреса
@@out_ch ' ','C','M','D','A','D','R','='
mov ax, cs:regs_87.cmdhi
and ah, 0f0h
mov al, ah
mov cl, 4
ror al, cl
call Print_byte
mov ax, cs:regs_87.cmdlo
call Print_word
@@out_ch ' '
; Выводим содержимое указателя операнда
@@out_ch ' ','O','P','R','A','D','R','='
mov ax, cs:regs_87.oprhi
and ah, 0f0h
mov al, ah
mov cl, 4
ror al, cl
call Print_byte
mov ax, cs:regs_87.oprlo
call Print_word
; Выводим содержимое непустых численных регистров
lea dx,cs:nr_msg
@@out_str
mov cx, 8 ; количество регистров - 8
mov dx, 0 ; индекс текущего регистра
mov bx, cs:regs_87.tg ; содержимое регистра тегов
; Цикл по стеку численных регистров
nreg_loop:
; Проверяем поле регистра тегов, соответствующее
; текущему обрабатываемому численному регистру
mov ax, bx
and ax, 0c000h
cmp ax, 0c000h
; Если это поле равно 11B, считаем, что данный
; численный регистр пуст, переходим к следующему
je continue
; Выводим на экран содержимое численного регистра
call Print_numreg
continue:
; Сдвигаем содержимое регистра тегов для
; обработки поля, соответствующего следующему
; регистру.
rol bx, 1
rol bx, 1
inc dx ; увеличиваем индекс текущего регистра
loop nreg_loop
lea dx,cs:hit_msg
@@out_str
; Ожидаем нажатия на любую клавишу
mov ax,0
int 16h
; Восстанавливаем содержимое регистров
frstor cs:regs_87
pop bp
pop ds
pop dx
pop cx
pop bx
pop ax
popf
ret
trace_msg db 13,10,'>---- BREAK ----> At address ','$'
hit_msg db 13,10,'Hit any key...','$'
r87_msg db 13,10,13,10,'Coprocessor state:',13,10,'$'
nr_msg db 13,10,'Numeric Registers:',13,10,'$'
regs_87 db 94 dup(?)
ten db 10
ntrace87 endp
;==========================================
; Процедура выводит на экран содержимое
; численного регистра с номером, заданным
; в регистре al
Print_numreg proc near
push cx
push bx
; Выводим обозначение численного регистра
push dx
@@out_ch 'S','T','('
pop dx
mov al, dl
call Print_byte
push dx
@@out_ch ')','='
pop dx
; Выводим содержимое численного регистра в
; шестнадцатеричном формате
mov cx, 10 ; счетчик байтов в числе с
; расширенной точностью
mov bp, 10 ; первоначальное смещение
; к старшему байту числа
; Смещение к полю первого численного регистра
; в области сохранения
mov bx, offset cs:regs_87.st0
; Вычисляем смещение старшего байта численного
; регистра, номер которого задан в регистре DX
mov ax, dx
imul cs:ten
add bx, ax
dec bx
; Выводим в цикле 10 байтов числа
pr_lp:
push bx
add bx, bp
mov al, cs:[bx]
call Print_byte
pop bx
dec bp
loop pr_lp
push dx
@@out_ch 13,10
pop dx
pop bx
pop cx
ret
Print_numreg endp
;==========================================
; Процедура выводит на экран содержимое AL
Print_byte proc near
push ax
push bx
push dx
call Byte_to_hex
mov bx,dx
@@out_ch bh
@@out_ch bl
pop dx
pop bx
pop ax
ret
Print_byte endp
;==========================================
; Процедура выводит на экран содержимое AX
Print_word proc near
push ax
push bx
push dx
push ax
mov cl,8
rol ax,cl
call Byte_to_hex
mov bx,dx
@@out_ch bh
@@out_ch bl
pop ax
call Byte_to_hex
mov bx,dx
@@out_ch bh
@@out_ch bl
pop dx
pop bx
pop ax
ret
Print_word endp
Byte_to_hex proc near
;--------------------
; al - input byte
; dx - output hex
;--------------------
push ds
push cx
push bx
lea bx,tabl
mov dx,cs
mov ds,dx
push ax
and al,0fh
xlat
mov dl,al
pop ax
mov cl,4
shr al,cl
xlat
mov dh,al
pop bx
pop cx
pop ds
ret
tabl db '0123456789ABCDEF'
Byte_to_hex endp
end
Работа программы основана на использовании команды FSAVE, сохраняющей
в памяти содержимое всех регистров сопроцессора. Область сохранения
описывается следующей структурой, определенной в файле sysp.inc:
State87 struc
cr dw ?
sr dw ?
tg dw ?
cmdlo dw ?
cmdhi dw ?
oprlo dw ?
oprhi dw ?
st0 dt ?
st1 dt ?
st2 dt ?
st3 dt ?
st4 dt ?
st5 dt ?
st6 dt ?
st7 dt ?
State87 ends
Для демонстрации возможностей ntrace87 мы немного изменили нашу
первую программу, работающую с сопроцессором - после каждой комадны
сопроцессора вставили вызов ntrace87:
.MODEL tiny
DOSSEG
EXTRN ntrace87:NEAR
.STACK 100h
.DATA
x dd 1.0
y dd 2.0
; Резервируем четыре байта для результата
z dd ?
.CODE
.STARTUP
push cs
pop ds
; Записываем в стек численных регистров
; значение x
call ntrace87
fld x
call ntrace87
; Складываем содержимое верхушки стека
; с константой y
fadd y
call ntrace87
; Записываем результат в ячейку z
fstp z
call ntrace87
; Завершаем работу программы и
; возвращаем управление операционной системе
quit:
.EXIT 0
END
В процессе работы этой программы на каждом шаге на экран выводится
дамп содержимого регистров центрального процессора и сопроцессора
(пустые численные регистры не отображаются):
>---- BREAK ----> At address 2314:0105
AX=0000 BX=0000 CX=00FF DX=2314 SP=FFFE BP=091C SI=0100 DI=FFFE
DS=2314 ES=2314 SS=2314 F=7202
Coprocessor state:
CNTR=037F STATE=4000 TAG=FFFF CMDADR=023256 OPRADR=02365E
Numeric Registers:
Hit any key...
>---- BREAK ----> At address 2314:010D
AX=0000 BX=0000 CX=00FF DX=2314 SP=FFFE BP=091C SI=0100 DI=FFFE
DS=2314 ES=2314 SS=2314 F=7202
Coprocessor state:
CNTR=037F STATE=7800 TAG=3FFF CMDADR=023246 OPRADR=02365E
Numeric Registers:
ST(00)=3FFF8000000000000000
Hit any key...
>---- BREAK ----> At address 2314:0115
AX=0000 BX=0000 CX=00FF DX=2314 SP=FFFE BP=091C SI=0100 DI=FFFE
DS=2314 ES=2314 SS=2314 F=7202
Coprocessor state:
CNTR=037F STATE=7800 TAG=3FFF CMDADR=02324E OPRADR=023662
Numeric Registers:
ST(00)=4000C000000000000000
Hit any key...
>---- BREAK ----> At address 2314:011D
AX=0000 BX=0000 CX=00FF DX=2314 SP=FFFE BP=091C SI=0100 DI=FFFE
DS=2314 ES=2314 SS=2314 F=7202
Coprocessor state:
CNTR=037F STATE=4000 TAG=FFFF CMDADR=023256 OPRADR=023666
Numeric Registers:
Hit any key...
В арифметическом сопроцессоре имеются два механизма обработки
ошибок, возникающих при выполнении различных команд. Первый механизм
основан на генерации так называемого прерывания особого случая
(INT 10h). Это прерывание вырабатывается в том случае, когда
происходит какая-нибудь ошибка (например, деление на нуль) при
условии, что соответствующие биты масок особых случаев в регистре
управления не установлены. При втором способе обработки ошибок
все особые случаи маскируются (соответствующие биты управляющего
регистра устанавливаются в единицу) и в случае ошибки сопроцессор
в качестве результата возвращает некоторое заранее известное особое
значение (нечисло, неопределенность или бесконечность).
Программист может выбирать между этими способами обработки ошибок,
маскируя или разрешая прерывание по особому случаю. Если прерывание
особого случая замаскировано, можно предложить следующий способ
обнаружения ошибки:
- сбросить флажки особых случаев в регистре сосотояния;
- выполнить одну или несколько команд сопроцессора;
- проверить состояние флажков особых случаев в регистре состояния,
в частности, бит суммарной ошибки ES;
- если какой-либо флажок установлен, вызвать программу обработки
ошибочной ситуации;
- в программе обработки ошибочной ситуации можно сбросить флажки
особых случаев, записав соответствующее значение в регистр состояния.
Кроме того, после выполнения команды полезно проверить получившийся
результат на принадлежность к множеству особых значений.
Рассмотрим возможные особые случаи сопроцессора в реальном режиме.
12.6.1. Неточный результат
В результате выполнения некоторых операций может возникнуть такая
ситуация, когда невозможно точно представить результат. Например,
при результатом деления числа 1.0 на 3.0 является бесконечная
периодическая двоичная дробь 0.010101... Такое число не может
быть представлено точно ни в одном формате вещественных чисел.
Обычно неточный результат является результатом округления и может
не рассматриваться как ошибка.
12.6.2. Переполнение
Если результат выполнения операции слишком велик и не может быть
представлен в формате приемника результата, фиксируется особый
случай переполнения.
Этот особый случай обязательно произойдет, например, при сложении
максимального числа расширенной точности самим с собой или при
преобразовании этого числа в формат с двойной или одинарной точностью.
Так как для хранения промежуточных результатов используется 80-битовое
представление, при выполнении операций над числами с одинарной
или двойной точностью переполнения, как правило, не происходит.
Огромный диапазон чисел с расширенной точностью гарантирует правильность
представления больших по абсолютной величине результатов операций
с числами одинарной и двойной точности.
12.6.3. Антипереполнение
Антипереполнение возникает тогда, когда результат слишком мал
для его представления в формате приемника результата операции,
но все же отличен от нуля. Например, если делается попытка преобразовать
наименьшее положительное число с расширенной точностью в формат
числа с двойной или одинарной точностью.
Если вы используете числа только с двойной или одинарной точностью,
а для хранения промежуточных результатов используете формат с
расширенной точностью, особый случай антипереполнения, как правило,
не возникает.
12.6.4. Деление на нуль
Этот особый случай возникает при попытке выполнить деление конечного
ненулевого числа на нуль.
В афинном режиме при делении конечных (положительных или отрицательных)
чисел на нуль (положительный или отрицательный) в качестве результата
возвращается бесконечность. Знак этой бесконечности зависит от
знака делимого и от знака нуля. Например, при делении положительного
ненулевого числа на положительный нуль получается положительная
бесконечность, при делении положительного ненулевого числа на
отрицательный нуль - отрицательная бесконечность.
В проективном режиме, а также при попытке деления нуля на нуль
возникает особый случай недействительной операции, который будет
рассмотрен ниже.
12.6.5. Недействительная операция
Этот особый случай возникает при попытке выполнения таких запрещенных
команд, как деление нуля на нуль, извлечения корня из отрицательного
числа, обращение к несуществующему регистру сопроцессора или при
попытке использования в качестве операндов команд нечисел, неопределенностей
или бесконечности (для трансцендентных функций).
12.6.6. Денормализованный операнд
Мы уже говорили о том, что сопроцессор использует операнды в нормализованной
форме. Однако при выполнении операции может оказаться, что результат
слишком мал по абсолютной величине для представления его в нормализованной
форме. Можно было бы считать такой результат нулевым, однако это
привело бы к снижению точности вычислений или даже к грубым ошибкам.
Например, вычисляется следующее выражение:
(y-x)+x;
Если разность (y-x) вызывает антипереполнение и в качестве результата
берется нулевое значение, то после вычисления всего выражения
получится x. Если же пойти на расширение диапазона представления
чисел за счет снижения точности и сформировать результат вычисления
разности (y-x) как денормализованное число, выражение будет вычислено
правильно и в результате получится y.
Таким образом, иногда целесообразно замаскировать особый случай
денормализованного операнда и использовать денормализованные числа.
Однако при попытке деления на ненормализованное число или извлечения
из него квадратного корня фиксируется особый случай недействительной
операции.
|