Современные высокопроизводительные компьютеры - Организация ввода/вывода
Вопросы организации ввода/вывода
в вычислительной системе иногда
оказываются вне внимания
потребителей. Это привело к тому,
что при оценке производительности
системы часто используются только
оценки производительности
процессора, а оценкой системы
ввода/вывода пренебрегают. Такое
отношение к системам ввода/вывода,
как к некоторым не очень важным
понятиям, проистекает также из
термина "периферия", который
применяется к устройствам
ввода/вывода.
Однако это противоречит здравому
смыслу. Компьютер без устройств
ввода/вывода - как автомобиль без
колес - на таком автомобиле далеко
не уедешь. Очевидно одной из
наиболее правильных оценок
производительности системы
является время ответа (время между
моментом ввода пользователем
задания и получения им результата),
которое учитывает все накладные
расходы, связанные с выполнением
задания в системе, включая
ввод/вывод.
Кроме того, важность системы
ввода/вывода определяется еще и
тем, что быстрое увеличение
производительности процессоров
настолько изменило принципы
классификации компьютеров, что
именно по организации ввода/вывода
мы можем как-то грубо их отличать:
разница между мейнфреймом и
миникомпьютером заключается в том,
что мейнфрейм может поддерживать
намного больше терминалов и дисков;
разница между миникомпьютером и
рабочей станцией заключается в том,
что рабочая станция имеет экран,
клавиатуру и мышь; разница между
файл-сервером и рабочей станцией
заключается в том, что файл-сервер
имеет диски и ленточные устройства,
а экран, клавиатура и мышь
отсутствуют; разница между рабочей
станцией и персональным
компьютером заключается лишь в том,
что рабочие станции всегда
соединены друг с другом с помощью
локальной сети.
Уже сейчас мы можем наблюдать, что
в компьютерах различного ценового
класса от рабочих станций до
суперкомпьютеров (суперсерверов)
используется один и тот же тип
микропроцессора. Различия в
стоимости и производительности
определяются практически только
организацией систем памяти и
ввода/вывода (а также количеством
процессоров).
Как уже отмечалось,
производительность процессоров
растет со скоростью 50-100% в год. Если
одновременно не улучшались бы
характеристики систем ввод/вывода,
то, очевидно, разработка новых
систем зашла бы в тупик. Важность
оценки работы систем ввода/вывода
была осознана многими
пользователями компьютеров. Были
разработаны специальные тестовые
программы, позволяющие оценить
эффективность систем ввода/вывода.
В частности, такие тесты
применяются для оценки
суперкомпьютеров, систем обработки
транзакций и файл-серверов.
В вычислительной системе,
состоящей из множества подсистем,
необходим механизм для их
взаимодействия. Эти подсистемы
должны быстро и эффективно
обмениваться данными. Например,
процессор, с одной стороны, должен
быть связан с памятью, с другой
стороны, необходима связь
процессора с устройствами
ввода/вывода. Одним из простейших
механизмов, позволяющих
организовать взаимодействие
различных подсистем, является
единственная центральная шина, к
которой подсоединяются все
подсистемы. Доступ к такой шине
разделяется между всеми
подсистемами. Подобная организация
имеет два основных преимущества:
низкая стоимость и
универсальность. Поскольку такая
шина является единственным местом
подсоединения для разных
устройств, новые устройства могут
быть легко добавлены, и одни и те же
периферийные устройства можно даже
применять в разных вычислительных
системах, использующих однотипную
шину. Стоимость такой организации
получается достаточно низкой,
поскольку для реализации множества
путей передачи информации
используется единственный набор
линий шины, разделяемый множеством
устройств.
Главным недостатком организации
с единственной шиной является то,
что шина создает узкое горло,
ограничивая, возможно,
максимальную пропускную
способность ввода/вывода. Если весь
поток ввода/вывода должен
проходить через центральную шину,
такое ограничение пропускной
способности весьма реально. В
коммерческих системах, где
ввод/вывод осуществляется очень
часто, а также в суперкомпьютерах,
где необходимые скорости
ввода/вывода очень высоки из-за
высокой производительности
процессора, одним из главных
вопросов разработки является
создание системы нескольких шин,
способной удовлетворить все
запросы.
Одна из причин больших
трудностей, возникающих при
разработке шин, заключается в том,
что максимальная скорость шины
главным образом лимитируется
физическими факторами: длиной шины
и количеством подсоединяемых
устройств (и, следовательно,
нагрузкой на шину). Эти физические
ограничения не позволяют
произвольно ускорять шины.
Требования быстродействия (малой
задержки) системы ввода/вывода и
высокой пропускной способности
являются противоречивыми. В
современных крупных системах
используется целый комплекс
взаимосвязанных шин, каждая из
которых обеспечивает упрощение
взаимодействия различных
подсистем, высокую пропускную
способность, избыточность (для
увеличения отказоустойчивости) и
эффективность.
Традиционно шины делятся на шины,
обеспечивающие организацию связи
процессора с памятью, и шины
ввода/вывода. Шины ввода/вывода
могут иметь большую протяженность,
поддерживать подсоединение многих
типов устройств, и обычно следуют
одному из шинных стандартов. Шины
процессор-память, с другой стороны,
сравнительно короткие, обычно
высокоскоростные и соответствуют
организации системы памяти для
обеспечения максимальной
пропускной способности канала
память-процессор. На этапе
разработки системы, для шины
процессор-память заранее известны
все типы и параметры устройств,
которые должны соединяться между
собой, в то время как разработчик
шины ввода/вывода должен иметь дело
с устройствами, различающимися по
задержке и пропускной способности.
Как уже было отмечено, с целью
снижения стоимости некоторые
компьютеры имеют единственную шину
для памяти и устройств
ввода/вывода. Такая шина часто
называется системной. Персональные
компьютеры, как правило, строятся
на основе одной системной шины в
стандартах ISA, EISA или MCA.
Необходимость сохранения баланса
производительности по мере роста
быстродействия микропроцессоров
привела к двухуровневой
организации шин в персональных
компьютерах на основе локальной
шины. Локальной шиной называется
шина, электрически выходящая
непосредственно на контакты
микропроцессора. Она обычно
объединяет процессор, память, схемы
буферизации для системной шины и ее
контроллер, а также некоторые
вспомогательные схемы. Типичными
примерами локальных шин являются
VL-Bus и PCI.
Рассмотрим типичную транзакцию
на шине. Шинная транзакция включает
в себя две части: посылку адреса и
прием (или посылку) данных. Шинные
транзакции обычно определяются
характером взаимодействия с
памятью: транзакция типа
"Чтение" передает данные из
памяти (либо в ЦП, либо в устройство
ввода/вывода), транзакция типа
"Запись" записывает данные в
память. В транзакции типа
"Чтение" по шине сначала
посылается в память адрес вместе с
соответствующими сигналами
управления, индицирующими чтение.
Память отвечает, возвращая на шину
данные с соответствующими
сигналами управления. Транзакция
типа "Запись" требует, чтобы ЦП
или устройство в/в послало в память
адрес и данные и не ожидает
возврата данных. Обычно ЦП вынужден
простаивать во время интервала
между посылкой адреса и получением
данных при выполнении чтения, но
часто он не ожидает завершения
операции при записи данных в
память.
Разработка шины связана с
реализацией ряда дополнительных
возможностей (рис. 9.1). Решение о
выборе той или иной возможности
зависит от целевых параметров
стоимости и производительности.
Первые три возможности являются
очевидными: раздельные линии
адреса и данных, более широкие
(имеющие большую разрядность) шины
данных и режим групповых пересылок
(пересылки нескольких слов) дают
увеличение производительности за
счет увеличения стоимости.
Следующий термин, указанный в
таблице, - количество главных
устройств шины (bus master). Главное
устройство шины - это устройство,
которое может инициировать
транзакции чтения или записи. ЦП,
например, всегда является главным
устройством шины. Шина имеет
несколько главных устройств, если
имеется несколько ЦП или когда
устройства ввода/вывода могут
инициировать транзакции на шине.
Если имеется несколько таких
устройств, то требуется схема
арбитража, чтобы решить, кто
следующий захватит шину. Арбитраж
часто основан либо на схеме с
фиксированным приоритетом, либо на
более "справедливой" схеме,
которая случайным образом
выбирает, какое главное устройство
захватит шину.
В настоящее время используются
два типа шин, отличающиеся способом
коммутации: шины с коммутацией
цепей (circuit-switched bus) и шины с
коммутацией пакетов (packet-switched bus),
получившие свои названия по
аналогии со способами коммутации в
сетях передачи данных. Шина с
коммутацией пакетов при наличии
нескольких главных устройств шины
обеспечивает значительно большую
пропускную способность по
сравнению с шиной с коммутацией
цепей за счет разделения
транзакции на две логические части:
запроса шины и ответа. Такая
методика получила название
"расщепления" транзакций (split
transaction). (В некоторых системах такая
возможность называется шиной
соединения/разъединения
(connect/disconnect) или конвейерной шиной
(pipelined bus). Транзакция чтения
разбивается на транзакцию запроса
чтения, которая содержит адрес, и
транзакцию ответа памяти, которая
содержит данные. Каждая транзакция
теперь должна быть помечена
(тегирована) соответствующим
образом, чтобы ЦП и память могли
сообщить что есть что.
Шина с коммутацией цепей не
делает расщепления транзакций,
любая транзакция на ней есть
неделимая операция. Главное
устройство запрашивает шину, после
арбитража помещает на нее адрес и
блокирует шину до окончания
обслуживания запроса. Большая
часть этого времени обслуживания
при этом тратится не на выполнение
операций на шине (например, на
задержку выборки из памяти). Таким
образом, в шинах с коммутацией
цепей это время просто теряется.
Расщепленные транзакции делают
шину доступной для других главных
устройств пока память читает слово
по запрошенному адресу. Это, правда,
также означает, что ЦП должен
бороться за шину для посылки
данных, а память должна бороться за
шину, чтобы вернуть данные. Таким
образом, шина с расщеплением
транзакций имеет более высокую
пропускную способность, но обычно
она имеет и большую задержку, чем
шина, которая захватывается на все
время выполнения транзакции.
Транзакция называется
расщепленной, поскольку
произвольное количество других
пакетов или транзакций могут
использовать шину между запросом и
ответом.
Последний вопрос связан с выбором
типа синхронизации и определяет
является ли шина синхронной или
асинхронной. Если шина синхронная,
то она включает сигналы
синхронизации, которые передаются
по линиям управления шины, и
фиксированный протокол,
определяющий расположение
сигналов адреса и данных
относительно сигналов
синхронизации. Поскольку
практически никакой
дополнительной логики не требуется
для того, чтобы решить, что делать в
следующий момент времени, эти шины
могут быть и быстрыми, и дешевыми.
Однако они имеют два главных
недостатка. Все на шине должно
происходить с одной и той же
частотой синхронизации, поэтому
из-за проблемы перекоса
синхросигналов, синхронные шины не
могут быть длинными. Обычно шины
процессор-память синхронные.
Асинхронная шина, с другой
стороны, не тактируется. Вместо
этого обычно используется
старт-стопный режим передачи и
протокол "рукопожатия" (handshaking)
между источником и приемником
данных на шине. Эта схема позволяет
гораздо проще приспособить широкое
разнообразие устройств и удлинить
шину без беспокойства о перекосе
сигналов синхронизации и о системе
синхронизации. Если может
использоваться синхронная шина, то
она обычно быстрее, чем
асинхронная, из-за отсутствия
накладных расходов на
синхронизацию шины для каждой
транзакции. Выбор типа шины
(синхронной или асинхронной)
определяет не только пропускную
способность, но также
непосредственно влияет на емкость
системы ввода/вывода в терминах
физического расстояния и
количества устройств, которые
могут быть подсоединены к шине.
Асинхронные шины по мере изменения
технологии лучше масштабируются.
Шины ввода/вывода обычно
асинхронные.
Возможность |
Высокая
производительность |
Низкая
стоимость |
Общая разрядность
шины |
Отдельные линии
адреса и данных |
Мультиплексирование
линий адреса и данных |
Ширина (рязрядность)
данных |
Чем шире, тем быстрее
(например, 32 бит) |
Чем уже, тем дешевле
(например, 8 бит) |
Размер пересылки |
Пересылка нескольких
слов имеет меньшие накладные
расходы |
Пересылка одного
слова дешевле |
Главные устройства
шины |
Несколько
(требуется арбитраж) |
Одно
(арбитраж не нужен) |
Расщепленные
транзакции? |
Да - отдельные пакеты
Запроса и Ответа дают большую
полосу пропускания (нужно
несколько главных устройств) |
Нет - продолжающееся
соединение дешевле и имеет
меньшую задержку |
Тип синхронизации |
Синхронные |
Асинхронные |
Рис. 9.1. Основные
возможности шин
Стандарты шин
Обычно количество и типы
устройств ввода/вывода в
вычислительных системах не
фиксируются, что позволяет
пользователю самому подобрать
необходимую конфигурацию. Шина
ввода/вывода компьютера может
рассматриваться как шина
расширения, обеспечивающая
постепенное наращивание устройств
ввода/вывода. Поэтому стандарты
играют огромную роль, позволяя
разработчикам компьютеров и
устройств ввода/вывода работать
независимо. Появление стандартов
определяется разными
обстоятельствами.
Иногда широкое распространение и
популярность конкретных машин
становятся причиной того, что их
шина ввода/вывода становится
стандартом де факто. Примерами
таких шин могут служить PDP-11 Unibus и IBM
PC-AT Bus. Иногда стандарты появляются
также в результате определенных
достижений по стандартизации в
некотором секторе рынка устройств
ввода/вывода. Интеллектуальный
периферийный интерфейс (IPI - Intelligent
Peripheral Interface) и Ethernet являются
примерами стандартов, появившихся
в результате кооперации
производителей. Успех того или
иного стандарта в значительной
степени определяется его принятием
такими организациями как ANSI
(Национальный институт по
стандартизации США) или IEEE
(Институт инженеров по
электротехнике и
радиоэлектронике). Иногда стандарт
шины может быть прямо разработан
одним из комитетов по
стандартизации: примером такого
стандарта шины является FutureBus.
На рис. 9.2 представлены
характеристики нескольких
стандартных шин. Заметим, что
строки этой таблицы, касающиеся
пропускной способности, не указаны
в виде одной цифры для шин
процессор-память (VME, FutureBus, MultibusII).
Размер пересылки, из-за разных
накладных расходов шины, сильно
влияет на пропускную способность.
Поскольку подобные шины обычно
обеспечивают связь с памятью, то
пропускная способность шины
зависит также от быстродействия
памяти. Например, в идеальном
случае при бесконечном размере
пересылки и бесконечно быстрой
памяти (время доступа 0 нсек) шина
FutureBus на 240% быстрее шины VME, но при
пересылке одиночных слов из
150-нсекундной памяти шина FutureBus
только примерно на 20% быстрее, чем
шина VME.
|
VME bus |
FutureBus |
Multibus II |
IPI |
SCSI |
Ширина шины
(кол-во сигналов) |
128 |
96 |
96 |
16 |
8 |
Мультиплекси-рование
адреса/данных |
Нет |
Да |
Да |
( |
( |
Разрядность
данных |
16/32 бит |
32 бит |
32 бит |
16 бит |
8 бит |
Размер пересылки
(слов) |
Одиночная
или
групповая |
Одиночная
или
групповая |
Одиночная
или
групповая |
Одиночная
или
групповая |
Одиночная
или
групповая |
Количество главных
устройств шины |
Несколько |
Несколько |
Несколько |
Одно |
Несколько |
Расщепление
транзакций |
Нет |
Доп.
возможность |
Доп.
возможность |
Доп.
возможность |
Доп.
возможность |
Полоса пропускания
(время доступа -
0 нс - 1 слово) |
25.9 Мб/c |
37.0 Мб/c |
20.0 Мб/c |
25.0 Мб/c |
5.0 Мб/c |
Полоса пропускания
(время доступа -
150 нс - 1 слово) |
12.9 Мб/c |
15.5 Мб/c |
10.0 Мб/c |
25.0 Мб/c |
5.0 Мб/c |
Полоса пропускания
(время доступа - 0 нс - неогр.
размер
блока) |
27.9 Мб/c |
95.2 Мб/c |
40.0 Мб/c |
25.0 Мб/c |
5.0 Мб/c |
Полоса пропускания
(время доступа -
150 нс - неогр. размер блока) |
13.6 Мб/c |
20.8 Мб/c |
13.3 Мб/c |
25.0 Мб/c |
5.0 Мб/c |
Максимальное
количество устройств |
21 |
20 |
21 |
8 |
7 |
Максимальная
длина шины |
0.5 м |
0.5 м |
0.5 м |
50 м |
25 м |
Стандарт |
IEEE 1014 |
IEEE 896.1 |
ANSI/
IEEE 1296 |
ANSI
X3.129 |
ANSI
X3.131 |
Рис. 9.2. Примеры
стандартных шин
Одной из популярных шин
персональных компьютеров была
системная шина IBM PC/XT,
обеспечивавшая передачу 8 бит
данных. Кроме того, эта шина
включала 20 адресных линий, которые
ограничивали адресное
пространство пределом в 1 Мбайт. Для
работы с внешними устройствами в
этой шине были предусмотрены также
4 линии аппаратных прерываний (IRQ) и 4
линии для требования внешними
устройствами прямого доступа к
памяти (DMA). Для подключения плат
расширения использовались
специальные 62-контактные разъемы.
При этом системная шина и
микропроцессор синхронизировались
от одного тактового генератора с
частотой 4.77 МГц. Таким образом
теоретическая скорость передачи
данных могла достигать немногим
более 4 Мбайт/с.
Системная шина ISA (Industry Standard
Architecture) впервые стала
применяться в персональных
компьютерах IBM PC/AT на базе
процессора i286. Эта системная шина
отличалась наличием второго,
36-контактного дополнительного
разъема для соответствующих плат
расширения. За счет этого
количество адресных линий было
увеличено на 4, а данных - на 8, что
позволило передавать параллельно 16
бит данных и обращаться к 16 Мбайт
системной памяти. Количество линий
аппаратных прерываний в этой шине
было увеличено до 15, а каналов
прямого доступа - до 7. Системная
шина ISA полностью включала в себя
возможности старой 8-разрядной
шины. Шина ISA позволяет
синхронизировать работу
процессора и шины с разными
тактовыми частотами. Она работает
на частоте 8 МГц, что соответствует
максимальной скорости передачи 16
Мбайт/с.
С появлением процессоров i386, i486 и
Pentium шина ISA стала узким местом
персональных компьютеров на их
основе. Новая системная шина EISA
(Extended Industry Standard Architecture),
появившаяся в конце 1988 года,
обеспечивает адресное
пространство в 4 Гбайта, 32-битовую
передачу данных (в том числе и в
режиме DMA), улучшенную систему
прерываний и арбитраж DMA,
автоматическую конфигурацию
системы и плат расширения.
Устройства шины ISA могут работать
на шине EISA. Шина EISA предусматривает
централизованное управление
доступом к шине за счет наличия
специального устройства - арбитра
шины. Поэтому к ней может
подключаться несколько главных
устройств шины. Улучшенная система
прерываний позволяет подключать к
каждой физической линии запроса на
прерывание несколько устройств,
что снимает проблему количества
линий прерывания. Шина EISA
тактируется частотой около 8 МГц и
имеет максимальную теоретическую
скорость передачи данных 33 Мбайт/с.
Шина MCA также обеспечивает
32-разрядную передачу данных,
тактируется частотой 10 МГц, имеет
средства автоматического
конфигурирования и арбитража
запросов. В отличие от EISA она не
совместима с шиной ISA и
используется только в компьютерах
компании IBM.
Шина VL-bus, предложенная
ассоциацией VESA (Video Electronics Standard
Association), предназначалась для
увеличения быстродействия
видеоадаптеров и контроллеров
дисковых накопителей для того,
чтобы они могли работать с тактовой
частотой до 40 МГц. Шина VL-bus имеет 32
линии данных и позволяет
подключать до трех периферийных
устройств, в качестве которых
наряду с видеоадаптерами и
дисковыми контроллерами могут
выступать и сетевые адаптеры.
Максимальная скорость передачи
данных по шине VL-bus может составлять
около 130 Мбайт/с. После появления
процессора Pentium ассоциация VESA
приступила к работе над новым
стандартом VL-bus версии 2, который
предусматривает использование
64-битовой шины данных и увеличение
количества разъемов расширения.
Ожидаемая скорость передачи данных
- до 400 Мбайт/с.
Шина PCI (Peripheral Component Interconnect) также,
как и шина VL-bus, поддерживает
32-битовый канал передачи данных
между процессором и периферийными
устройствами, работает на тактовой
частоте 33 МГц и имеет максимальную
пропускную способность 120 Мбайт/с.
При работе с процессорами i486 шина PCI
дает примерно те же показатели
производительности, что и шина VL-bus.
Однако, в отличие от последней, шина
PCI является процессорно
независимой (шина VL-bus подключается
непосредственно к процессору i486 и
только к нему). Ee легко подключить к
различным центральным процессорам.
В их числе Pentium, Alpha, R4400 и PowerPC.
Шина VME приобрела большую
популярность как шина ввода/вывода
в рабочих станциях и серверах на
базе RISC-процессоров. Эта шина
высоко стандартизована, имеется
несколько версий этого стандарта. В
частности, VME32 - 32-битовая шина с
производительностью 30 Мбайт/с, а VME64
- 64-битовая шина с
производительностью 160 Мбайт/с.
В однопроцессорных и
многопроцессорных рабочих
станциях и серверах на основе
микропроцессоров SPARC одновременно
используются несколько типов шин:
SBus, MBus и XDBus, причем шина SBus
применяется в качестве шины
ввода/вывода, а MBus и XDBus - в качестве
шин для объединения большого числа
процессоров и памяти.
Шина SBus (известная также как
стандарт IEEE-1496) имеет 32-битовую и
64-битовую реализацию, работает на
частоте 20 и 25 МГц и имеет
максимальную скорость передачи
данных в 32-битовом режиме равную
соответственно 80 или 100 Мбайт/с.
Шина предусматривает режим
групповой пересылки данных с
максимальным размером пересылки до
128 байт. Она может работать в двух
режимах передачи данных: режиме
программируемого ввода/вывода и в
режиме прямого доступа к
виртуальной памяти (DVMA). Последний
режим особенно эффективен при
передаче больших блоков данных.
Шина MBus работает на тактовой
частоте 50 МГц в синхронном режиме с
мультиплексированием адреса и
данных. Общее число сигналов шины
равно 100, а разрядность шины данных
составляет 64 бит. По шине
передаются 36-битовые физические
адреса. Шина обеспечивает протокол
поддержания когерентного
состояния кэш-памяти нескольких (до
четырех) процессоров, имеет
максимальную пропускную
способность в 400 Мбайт/с, а типовая
скорость передачи составляет 125
Мбайт/с. Отличительными свойствами
шины MBus являются: возможность
увеличения числа процессорных
модулей, поддержка симметричной
мультипроцессорной обработки,
высокая пропускная способность при
обмене с памятью и подсистемой
ввода/вывода, открытые
(непатентованные) спецификации
интерфейсов.
Шина MBus была разработана для
относительно небольших систем (ее
длина ограничивается десятью
дюймами, что позволяет объединить
до четырех процессоров с
кэш-памятью второго уровня и
основной памятью). Для построения
систем с большим числом
процессоров нужна большая
масштабируемость шины. Одна из
подобного рода шин - XDBus,
используется в серверах SPARCserver 1000
(до 8 процессоров) и SPARCcenter 2000 (до 20
процессоров) компании Sun Microsystems и
SuperServer 6400 компании Cray Research (до 64
процессоров). XDBus представляет
собой шину, работающую в режиме
расщепления транзакций. Это
позволяет ей, имея пиковую
производительность в 400 Мбайт/с,
поддерживать типовую скорость
передачи на уровне более 310 Мбайт/с.
В современных компьютерах часто
применяются и фирменные
(запатентованные) шины,
обеспечивающие очень высокую
пропускную способность для
построения многопроцессорных
серверов. Одной из подобных шин
является системная шина POWERpath-2,
которая применяется в суперсервере
Chellenge компании Silicon Graphics. Она
способна поддерживать эффективную
работу до 36 процессоров MIPS R4400 (9
процессорных плат с четырьмя 150 МГц
процессорами на каждой плате) с
общей расслоенной памятью объемом
до 16 Гбайт (коэффициент расслоения
памяти равен восьми). POWERpath-2 имеет
разрядность данных 256 бит,
разрядность адреса 40 бит, и
работает на частоте 50 МГц с
пониженным напряжением питания.
Она поддерживает методику
расщепления транзакций, причем
может иметь до восьми отложенных
транзакций чтения одновременно.
При этом арбитраж шины адреса и
шины данных выполняется
независимо. POWERpath-2 поддерживает
протокол когерентного состояния
кэш-памяти каждого процессора в
системе.
Одной из наиболее популярных шин
ввода-вывода в настоящее время
является шина SCSI.
Под термином SCSI - Small Computer System Interface
(Интерфейс малых вычислительных
систем) обычно понимается набор
стандартов, разработанных
Национальным институтом
стандартов США (ANSI) и определяющих
механизм реализации магистрали
передачи данных между системной
шиной компьютера и периферийными
устройствами. На сегодняшний день
приняты два стандарта (SCSI-1 и SCSI-2).
Стандарт SCSI-3 находится в процессе
доработки.
Начальный стандарт 1986 года,
известный теперь под названием SCSI-1,
определял рабочие спецификации
протокола шины, набор команд и
электрические параметры. В 1992 году
этот стандарт был пересмотрен с
целью устранения недостатков
первоначальной спецификации
(особенно в части синхронного
режима передачи данных) и
добавления новых возможностей
повышения производительности,
таких как "быстрый режим" (fast
mode), "широкий режим" (wide mode) и
помеченные очереди. Этот
пересмотренный стандарт получил
название SCSI-2 и в настоящее время
используется большинством
поставщиков вычислительных систем.
Первоначально SCSI предназначался
для использования в небольших
дешевых системах и поэтому был
ориентирован на достижение хороших
результатов при низкой стоимости.
Характерной его чертой является
простота, особенно в части
обеспечения гибкости
конфигурирования периферийных
устройств без изменения
организации основного процессора.
Главной особенностью подсистемы SCSI
является размещение в периферийном
оборудовании интеллектуального
контроллера.
Для достижения требуемого
высокого уровня независимости от
типов периферийных устройств в
операционной системе основной
машины, устройства SCSI
представляются имеющими очень
простую архитектуру. Например,
геометрия дискового накопителя
представляется в виде линейной
последовательности одинаковых
блоков, хотя в действительности
любой диск имеет более сложную
многомерную геометрию, содержащую
поверхности, цилиндры, дорожки,
характеристики плотности, таблицу
дефектных блоков и множество
других деталей. В этом случае само
устройство или его контроллер
несут ответственность за
преобразование упрощенной SCSI
модели в данные для реального
устройства.
Стандарт SCSI-2 определяет в
частности различные режимы: Wide SCSI,
Fast SCSI и Fast-and-Wide SCSI. Стандарт SCSI-1
определяет построение
периферийной шины на основе
50-жильного экранированного кабеля,
описывает методы адресации и
электрические характеристики
сигналов. Шина данных SCSI-1 имеет
разрядность 8 бит, а максимальная
скорость передачи составляет 5
Мбайт/сек. Fast SCSI сохраняет 8-битовую
шину данных и тем самым может
использовать те же самые
физические кабели, что и SCSI-1. Он
отличается только тем, что
допускает передачи со скоростью 10
Мбайт/сек в синхронном режиме. Wide SCSI
удваивает либо учетверяет
разрядность шины данных (либо 16,
либо 32 бит), допуская
соответственно передачи со
скоростью либо 10, либо 20 Мбайт/сек. В
комбинации Fast-and-Wide SCSI возможно
достижение скоростей передачи 20 и 40
Мбайт/сек соответственно.
Однако поскольку в обычном
50-жильном кабеле просто не хватает
жил, комитет SCSI решил расширить
спецификацию вторым 66-жильным
кабелем (так называемый B-кабель).
B-кабель имеет дополнительные линии
данных и ряд других сигнальных
линий, позволяющие реализовать
режим Fast-and-Wide.
В реализации режима Wide SCSI
предложена также расширенная
адресация, допускающая
подсоединение к шине до 16 устройств
(вместо стандартных восьми). Это
значительно увеличивает гибкость
подсистемы SCSI, правда приводит к
появлению дополнительных проблем,
связанных с эффективностью ее
использования.
Реализация режимов Wide-SCSI и Fast-and-Wide
SCSI до 1994 года редко использовалась,
поскольку эффективность их
применения не была достаточно
высокой. Однако широкое
распространение дисковых массивов
и дисковых накопителей со
скоростью вращения 7200 оборотов в
минуту делают эту технологию
весьма актуальной.
Следует отметить некоторую
путаницу в терминологии. Часто
стандартный 50-контактный разъем
также называют разъемом SCSI-1, а
более новый микроразъем - разъемом
SCSI-2. Стандарт SCSI определяет только
количество жил в кабеле, и вообще не
определяет тип разъема.
Как правило периферийные
устройства компьютеров делятся на
устройства ввода, устройства
вывода и внешние запоминающие
устройства (осуществляющие как
ввод данных в машину, так и вывод
данных из компьютера). Основной
обобщающей характеристикой
устройств ввода/вывода может
служить скорость передачи данных
(максимальная скорость, с которой
данные могут передаваться между
устройством ввода/вывода и
основной памятью или процессором).
На рис. 9.3. представлены основные
устройства ввода/вывода,
применяемые в современных
компьютерах, а также указаны
примерные скорости обмена данными,
обеспечиваемые этими устройствами.
Тип
устройства |
Направление
передачи
данных |
Скорость
передачи данных (Кбайт/с) |
Клавиатура
Мышь
Голосовой ввод
Сканер
Голосовой вывод
Строчный принтер
Лазерный принтер
Графический дисплей
(ЦП (r) буфер кадра)
Оптический диск
Магнитная лента
Магнитный диск |
Ввод
Ввод
Ввод
Ввод
Вывод
Вывод
Вывод
Вывод
Вывод
ЗУ
ЗУ
ЗУ |
0.01
0.02
0.02
200.0
0.06
1.00
100.00
30000.00
200.0
500.00
2000.00
2000.00 |
Рис. 9.3. Примеры
устройств ввода/вывода
В рамках данного обзора мы
рассмотрим наиболее быстрые из
этих устройств: магнитные и
магнитооптические диски, а также
магнитные ленты.
В данном разделе мы кратко
рассмотрим основную терминологию,
применяемую при описании магнитных
дисков и контроллеров, а затем
приведем типовые характеристики
нескольких современных дисковых
подсистем.
Дисковый накопитель обычно
состоит из набора пластин,
представляющих собой
металлические диски, покрытые
магнитным материалом и соединенные
между собой при помощи
центрального шпинделя. Для записи
данных используются обе
поверхности пластины. В
современных дисковых накопителях
используется от 4 до 9 пластин.
Шпиндель вращается с высокой
постоянной скоростью (обычно 3600, 5400
или 7200 оборотов в минуту). Каждая
пластина содержит набор
концентрических записываемых
дорожек. Обычно дорожки делятся на
блоки данных объемом 512 байт, иногда
называемые секторами. Количество
блоков, записываемых на одну
дорожку зависит от физических
размеров пластины и плотности
записи.
Данные записываются или
считываются с пластин с помощью
головок записи/считывания, по одной
на каждую поверхность. Линейный
двигатель представляет собой
электро-механическое устройство,
которое позиционирует головку над
заданной дорожкой. Обычно головки
крепятся на кронштейнах, которые
приводятся в движение каретками.
Цилиндр - это набор дорожек,
соответствующих одному положению
каретки. Накопитель на магнитных
дисках (НМД) представляет собой
набор пластин, магнитных головок,
кареток, линейных двигателей плюс
воздухонепроницаемый корпус.
Дисковым устройством называется
НМД с относящимися к нему
электронными схемами.
Производительность диска
является функцией времени
обслуживания, которое включает в
себя три основных компонента: время
доступа, время ожидания и время
передачи данных. Время доступа - это
время, необходимое для
позиционирования головок на
соответствующую дорожку,
содержащую искомые данные. Оно
является функцией затрат на
начальные действия по ускорению
головки диска (порядка 6 мс), а также
функцией числа дорожек, которые
необходимо пересечь на пути к
искомой дорожке. Характерные
средние времена поиска - время,
необходимое для перемещения
головки между двумя случайно
выбранными дорожками, лежат в
диапазоне 10-20 мс. Время перехода с
дорожки на дорожку меньше 10 мс и
обычно составляет 2 мс.
Вторым компонентом времени
обслуживания является время
ожидания. Чтобы искомый сектор
повернулся до совмещения с
положением головки требуется
некоторое время. После этого данные
могут быть записаны или считаны.
Для современных дисков время
полного оборота лежит в диапазоне
8-16 мс, а среднее время ожидания
составляет 4-8 мс.
Последним компонентом является
время передачи данных, т.е. время,
необходимое для физической
передачи байтов. Время передачи
данных является функцией от числа
передаваемых байтов (размера
блока), скорости вращения,
плотности записи на дорожке и
скорости электроники. Типичная
скорость передачи равна 1-4 Мбайт/с.
В состав компьютеров часто входят
специальные устройства, называемые
дисковыми контроллерами. К каждому
дисковому контроллеру может
подключаться несколько дисковых
накопителей. Между дисковым
контроллером и основной памятью
может быть целая иерархия
контроллеров и магистралей данных,
сложность которой определяется
главным образом стоимостью
компьютера. Поскольку время
передачи часто составляет очень
небольшую часть общего времени
доступа к диску, контроллер в
высокопроизводительной системе
разъединяет магистрали данных от
диска на время позиционирования
так, что другие диски,
подсоединенные к контроллеру,
могут передавать свои данные в
основную память. Поэтому время
доступа к диску может
увеличиваться на время, связанное с
накладными расходами контроллера
на организацию операции
ввода/вывода.
Рассмотрим теперь основные
составляющие времени доступа к
диску в типичной подсистеме SCSI.
Такая подсистема включает в себя
четыре основных компонента:
основной компьютер, главный
адаптер SCSI, встроенный в дисковое
устройство контроллер и собственно
накопитель на магнитных дисках.
Когда операционная система
получает запрос от пользователя на
выполнение операции ввода/вывода,
она превращает этот запрос в набор
команд SCSI. Запрашивающий процесс
при этом блокируется и
откладывается до завершения
операции ввода/вывода (если только
это был не запрос асинхронной
передачи данных). Затем команды
пересылаются по системе шин в
главный адаптер SCSI, к которому
подключен необходимый дисковый
накопитель. После этого
ответственность за выполнение
взаимодействия с целевыми
контроллерами и их устройствами
ложится на главный адаптер.
Затем главный адаптер выбирает
целевое устройство, устанавливая
сигнал на линии управления шины SCSI
(эта операция называется фазой
выбора). Естественно, шина SCSI должна
быть доступна для этой операции.
Если целевое устройство возвращает
ответ, то главный адаптер
пересылает ему команду (это
называется фазой команды). Если
целевой контроллер может выполнить
команду немедленно, то он
пересылает в главный адаптер
запрошенные данные или состояние.
Команда может быть обслужена
немедленно, только если это запрос
состояния, или команда запрашивает
данные, которые уже находятся в
кэш-памяти целевого контроллера.
Обычно же данные не доступны, и
целевой контроллер выполняет
разъединение, освобождая шину SCSI
для других операций. Если
выполняется операция записи, то за
фазой команды на шине немедленно
следует фаза данных, и данные
помещаются в кэш-память целевого
контроллера. Подтверждение записи
обычно не происходит до тех пор,
пока данные действительно не
запишутся на поверхность диска.
После разъединения, целевой
контроллер продолжает свою
собственную работу. Если в нем не
предусмотрены возможности
буферизации команд (создание
очереди команд), ему надо только
выполнить одну команду. Однако,
если создание очереди команд
разрешено, то команда планируется в
очереди работ целевого
контроллера, при этом
обрабатывается команда, обладающая
наивысшим приоритетом в очереди.
Когда запрос станет обладать
наивысшим приоритетом, целевой
контроллер должен вычислить
физический адрес (или адреса),
необходимый для обслуживания
операции ввода/вывода. После этого
становится доступным дисковый
механизм: позиционируется каретка,
подготавливается соответствующая
головка записи/считывания и
вычисляется момент появления
данных под головкой. Наконец,
данные физически считываются или
записываются на дорожку. Считанные
данные запоминаются в кэш-памяти
целевого контроллера. Иногда
целевой контроллер может выполнить
считывание с просмотром вперед.
После завершения операции
ввода/вывода целевой контроллер в
случае свободы шины соединяется с
главным адаптером, вслед за чем
выполняется фаза данных (при
передаче данных из целевого
контроллера в главный адаптер) и
фаза состояния для указания
результата операции. Когда главный
адаптер получает фазу состояния, он
проверяет корректность завершения
физической операции в целевом
контроллере и соответствующим
образом информирует операционную
систему.
Одной из характеристик процесса
ввода/вывода SCSI является большое
количество шагов, которые обычно не
видны пользователю. Обычно на шине
SCSI происходит смена семи фаз (выбор,
команда, разъединение, повторное
соединение, данные, состояние,
разъединение). Естественно каждая
фаза выполняется за некоторое
время, расходуемое на
использование шины. Многие целевые
контроллеры (особенно медленные
устройства подобные магнитным
лентам и компакт-дискам) потребляют
значительную часть времени на
реализацию фаз выбора,
разъединения и повторного
соединения.
Варианты применения
высокопроизводительных подсистем
ввода/вывода широко варьируются в
зависимости от требований, которые
к ним предъявляются. Они охватывают
диапазон от обработки малого числа
больших массивов данных, которые
необходимо реализовать с
минимальной задержкой (ввод/вывод
суперкомпьютера), до большого числа
простых заданий, которые оперируют
с малыми объемами данных (обработка
транзакций).
Запросы на ввод/вывод заданной
рабочей нагрузки можно
характеризовать в терминах трех
метрик: производительность, время
ожидания и пропускная способность.
Производительность определяется
числом запросов на обслуживание,
получаемых в единицу времени. Время
ожидания определяет время,
необходимое на обслуживание
индивидуального запроса.
Пропускная способность определяет
количество данных, передаваемых
между устройствами, требующими
обслуживания, и устройствами,
выполняющими обслуживание.
Ввод/вывод суперкомпьютера почти
полностью определяется
последовательным механизмом.
Обычно данные передаются с диска в
память большими блоками, а
результаты записываются обратно на
диск. В таких применениях требуется
высокая пропускная способность и
минимальное время ожидания, однако
они характеризуются низкой
производительностью. В отличие от
этого обработка транзакций
характеризуется огромным числом
случайных обращений, относительно
небольшими отрезками работы и
требует умеренного времени
ожидания при очень высокой
производительности.
Так как системы обработки
транзакций тратят большую часть
времени обслуживания на поиск и
ожидание, технологические успехи,
приводящие к сокращению времени
передачи, не будут оказывать
особого влияния на
производительность таких систем. С
другой стороны, в научных
применениях на поиск данных и на их
передачу затрачивается одинаковое
время, и поэтому
производительность таких систем
оказывается очень чувствительной к
любым усовершенствованиям в
технологии изготовления дисков.
Как будет показано ниже, можно
организовать матрицу дисков таким
образом, что будет обеспечена
высокая производительность
ввода/вывода для широкого спектра
рабочих нагрузок.
В последние годы плотность записи
на жестких магнитных дисках
увеличивается на 60% в год при
ежеквартальном снижении стоимости
хранения одного Мегабайта на 12%. По
данным фирмы Dataquest такая тенденция
сохранится и в ближайшие два года.
Сейчас на рынке представлен
широкий ассортимент дисковых
накопителей емкостью до 9.1 Гбайт.
При этом среднее время доступа у
самых быстрых моделей достигает 8
мс. Например, жесткий диск компании
Seagate Technology имеет емкость 4.1 Гбайт и
среднее время доступа 8 мс при
скорости вращения 7200 оборот/мин.
Улучшаются также характеристики
дисковых контроллеров на базе
новых стандартов Fast SCSI-2 и Enhanced IDE.
Предполагается увеличение
скорости передачи данных до 13
Мбайт/с. Надежность жестких дисков
также постоянно улучшается.
Например, некоторые модели дисков
компаний Conner Peripherals Inc., Micropolis Corp. и
Hewlett-Packard имеют время наработки на
отказ от 500 тысяч до 1 миллиона
часов. На такие диски
предоставляется 5-летняя гарантия.
Дальнейшее повышение надежности
и коэффициента готовности дисковых
подсистем достигается построением
избыточных дисковых массивов RAID, о
которых речь пойдет в подразделе
9.3.3.
Другим направлением развития
систем хранения информации
являются магнитооптические диски.
Запись на магнитооптические диски
(МО-диски) выполняется при
взаимодействии лазера и магнитной
головки. Луч лазера разогревает до
точки Кюри (температуры потери
материалом магнитных свойств)
микроскопическую область
записывающего слоя, которая при
выходе из зоны действия лазера
остывает, фиксируя магнитное поле,
наведенное магнитной головкой. В
результате данные, записанные на
диск, не боятся сильных магнитных
полей и колебаний температуры. Все
функциональные свойства дисков
сохраняются в диапазоне температур
от -20 до +50 градусов Цельсия.
МО-диски уступают обычным жестким
магнитным дискам лишь по времени
доступа к данным. Предельное
достигнутое МО-дисками время
доступа составляет 19 мс.
Магнитооптический принцип записи
требует предварительного стирания
данных перед записью, и
соответственно, дополнительного
оборота МО-диска. Однако
завершенные недавно исследования в
SONY и IBM показали, что это
ограничение можно устранить, а
плотность записи на МО-дисках можно
увеличить в несколько раз. Во всех
других отношениях МО-диски
превосходят жесткие магнитные
диски.
В магнитооптическом дисководе
используются сменные диски, что
обеспечивает практически
неограниченную емкость. Стоимость
хранения единицы данных на
МО-дисках в несколько раз меньше
стоимости хранения того же объема
данных на жестких магнитных дисках.
Сегодня на рынке МО-дисков
предлагается более 150 моделей
различных фирм. Одно из лидирующих
положений на этом рынке занимает
компания Pinnacle Micro Inc. Для примера, ее
дисковод Sierra 1.3 Гбайт обеспечивает
среднее время доступа 19 мс и
среднее время наработки на отказ
80000 часов. Для серверов локальных
сетей и рабочих станций компания
Pinnacle Micro предлагает целый спектр
многодисковых систем емкостью 20, 40,
120, 186 Гбайт и даже 4 Тбайт. Для систем
высокой готовности Pinnacle Micro
выпускает дисковый массив Array Optical
Disk System, который обеспечивает
эффективное время доступа к данным
не более 11 мс при скорости передачи
данных до 10 Мбайт/с.
Одним из способов повышения
производительности ввода/вывода
является использование
параллелизма путем объединения
нескольких физических дисков в
матрицу (группу) с организацией их
работы аналогично одному
логическому диску. К сожалению,
надежность матрицы любых устройств
падает при увеличении числа
устройств. Полагая интенсивность
отказов постоянной, т.е. при
экспоненциальном законе
распределения наработки на отказ, а
также при условии, что отказы
независимы, получим, что среднее
время безотказной работы (mean time to
failure - MTTF) матрицы дисков будет
равно:
MTTF одного диска / Число дисков в
матрице
Для достижения повышенного
уровня отказоустойчивости
приходится жертвовать пропускной
способностью ввода/вывода или
емкостью памяти. Необходимо
использовать дополнительные диски,
содержащие избыточную информацию,
позволяющую восстановить исходные
данные при отказе диска. Отсюда
получают акроним для избыточных
матриц недорогих дисков RAID (redundant
array of inexpensive disks). Существует
несколько способов объединения
дисков RAID. Каждый уровень
представляет свой компромисс между
пропускной способностью
ввода/вывода и емкостью диска,
предназначенной для хранения
избыточной информации.
Когда какой-либо диск отказывает,
предполагается, что в течение
короткого интервала времени он
будет заменен и информация будет
восстановлена на новом диске с
использованием избыточной
информации. Это время называется
средним временем восстановления
(mean time to repair - MTTR). Этот показатель
можно уменьшить, если в систему
входят дополнительные диски в
качестве "горячего резерва":
при отказе диска резервный диск
подключается
аппаратно-программными средствами.
Периодически оператор вручную
заменяет все отказавшие диски.
Четыре основных этапа этого
процесса состоят в следующем:
- определение отказавшего диска,
- устранение отказа без останова
обработки;
- восстановление потерянных
данных на резервном диске;
- периодическая замена
отказавших дисков на новые.
RAID1: Зеркальные диски.
Зеркальные диски представляют
традиционный способ повышения
надежности магнитных дисков. Это
наиболее дорогостоящий из
рассматриваемых способов, так как
все диски дублируются и при каждой
записи информация записывается
также и на проверочный диск. Таким
образом, приходится идти на
некоторые жертвы в пропускной
способности ввода/вывода и емкости
памяти ради получения более
высокой надежности. Зеркальные
диски широко применяются многими
фирмами. В частности компания Tandem
Computers применяет зеркальные диски, а
также дублирует контроллеры и
магистрали ввода/вывода с целью
повышения отказоустойчивости. Эта
версия зеркальных дисков
поддерживает параллельное
считывание.
Контроллер HSC-70, используемый в
VAX-кластерах компании DEC, выполнен
по методу зеркальных дисков,
называемому методом двойников.
Содержимое отдельного диска
распределяется между членами его
группы двойников. Если группа
состоит из двух двойников, мы
получаем вариант зеркальных
дисков. Заданный сектор может быть
прочитан с любого из устройств
группы двойников. После того как
некоторый сектор записан,
необходимо обновить информацию на
всех дисках-двойниках. Контроллер
имеет возможность предсказывать
ожидаемые отказы некоторого диска
и выделять горячий резерв для
создания копии и сохранения ее на
время работы механизма создания
группы двойников. Затем отказавший
диск может быть выключен.
Дублирование всех дисков может
означать удвоение стоимости всей
системы или, иначе, использование
лишь 50% емкости диска для хранения
данных. Повышение емкости, на
которое приходится идти,
составляет 100%. Такая низкая
экономичность привела к появлению
следующего уровня RAID.
RAID 2: матрица с поразрядным
расслоением
Один из путей достижения
надежности при снижении потерь
емкости памяти может быть
подсказан организацией основной
памяти, в которой для исправления
одиночных и обнаружения двойных
ошибок используются избыточные
контрольные разряды. Такое решение
можно повторить путем поразрядного
расслоения данных и записи их на
диски группы, дополненной
достаточным количеством
контрольных дисков для обнаружения
и исправления одиночных ошибок.
Один диск контроля четности
позволяет обнаружить одиночную
ошибку, но для ее исправления
требуется больше дисков.
Такая организация обеспечивает
лишь один поток ввода/вывода для
каждой группы независимо от ее
размера. Группы большого размера
приводят к снижению избыточной
емкости, идущей на обеспечение
отказоустойчивости, тогда как при
организации меньшего числа групп
наблюдается снижение операций
ввода/вывода, которые могут
выполняться матрицей параллельно.
При записи больших массивов
данных системы уровня 2 имеют такую
же производительность, что и
системы уровня 1, хотя в них
используется меньше контрольных
дисков и, таким образом, по этому
показателю они превосходят системы
уровня 1. При передаче небольших
порций данных производительность
теряется, так как требуется
записать либо считать группу
целиком, независимо от конкретных
потребностей. Таким образом, RAID
уровня 2 предпочтительны для
суперкомпьютеров, но не подходят
для обработки транзакций. Компания
Thinking Machine использовала RAID уровня 2 в
ЭВМ Connection Machine при 32 дисках данных и
10 контрольных дисках, включая 3
диска горячего резерва.
RAID 3: аппаратное обнаружение
ошибок и четность
Большинство контрольных дисков,
используемых в RAID уровня 2, нужны
для определения положения
неисправного разряда. Эти диски
становятся полностью избыточными,
так как большинство контроллеров в
состоянии определить, когда диск
отказал при помощи специальных
сигналов, поддерживаемых дисковым
интерфейсом, либо при помощи
дополнительного кодирования
информации, записанной на диск и
используемой для исправления
случайных сбоев. По существу, если
контроллер может определить
положение ошибочного разряда, то
для восстановления данных
требуется лишь один бит четности.
Уменьшение числа контрольных
дисков до одного на группу снижает
избыточность емкости до вполне
разумных размеров. Часто
количество дисков в группе равно 5 (4
диска данных плюс 1 контрольный).
Подобные устройства выпускаются,
например, фирмами Maxtor и Micropolis.
Каждое из таких устройств
воспринимается машиной как
отдельный логический диск с
учетверенной пропускной
способностью, учетверенной
емкостью и значительно более
высокой надежностью.
RAID 4: внутригрупповой
параллелизм
RAID уровня 4 повышает
производительность передачи
небольших объемов данных за счет
параллелизма, давая возможность
выполнять более одного обращения
по вводу/выводу к группе в единицу
времени. Логические блоки передачи
в данном случае не распределяются
между отдельными дисками, вместо
этого каждый индивидуальный блок
попадает на отдельный диск.
Достоинство поразрядного
расслоения состоит в простоте
вычисления кода Хэмминга, что
необходимо для обнаружения и
исправления ошибок в системах
уровня 2. В RAID уровня 3 обнаружение
ошибок диска с точностью до сектора
осуществляется дисковым
контроллером. Следовательно, если
записывать отдельный блок передачи
в отдельный сектор, то можно
обнаружить ошибки отдельного
считывания без доступа к
дополнительным дискам. Главное
отличие между системами уровня 3 и 4
состоит в том, что в последних
расслоение выполняется на уровне
сектора, а не на уровне битов или
байтов.
В системах уровня 4 обновление
контрольной информации
реализовано достаточно просто. Для
вычисления нового значения
четности требуются лишь старый
блок данных, старый блок четности и
новый блок данных:
новая четность = (старые данные xor
новые данные) xor старая четность
В системах уровня 4 для записи
небольших массивов данных
используются два диска, которые
выполняют четыре выборки (чтение
данных плюс четности, запись данных
плюс четности). Производительность
групповых операций записи и
считывания остается прежней, но при
небольших (на один диск) записях и
считываниях производительность
существенно улучшается. К
сожалению, улучшение
производительности оказывается
недостаточной для того, чтобы этот
метод мог занять место системы
уровня 1.
RAID 5: четность вращения для
распараллеливания записей
RAID уровня 4 позволяли добиться
параллелизма при считывании
отдельных дисков, но запись
по-прежнему ограничена
возможностью выполнения одной
операции на группу, так как при
каждой операции должны выполняться
запись и чтение контрольного диска.
Система уровня 5 улучшает
возможности системы уровня 4
посредством распределения
контрольной информации между всеми
дисками группы.
Это небольшое изменение
оказывает огромное влияние на
производительность записи
небольших массивов информации.
Если операции записи могут быть
спланированы так, чтобы обращаться
за данными и соответствующими им
блоками четности к разным дискам,
появляется возможность
параллельного выполнения N/2
записей, где N - число дисков в
группе. Данная организация имеет
одинаково высокую
производительность при записи и
при считывании как небольших, так и
больших объемов информации, что
делает ее наиболее привлекательной
в случаях смешанных применений.
RAID 6: Двумерная четность для
обеспечения большей надежности
Этот пункт можно рассмотреть в
контексте соотношения
отказоустойчивость/пропускная
способность. RAID 5 предлагают, по
существу, лишь одно измерение
дисковой матрицы, вторым
измерением которой являются
секторы. Теперь рассмотрим
объединение дисков в двумерный
массив таким образом, чтобы секторы
являлись третьим измерением. Мы
можем иметь контроль четности по
строкам, как в системах уровня 5, а
также по столбцам, которые, в свою
очередь. могут расслаиваться для
обеспечения возможности
параллельной записи. При такой
организации можно преодолеть любые
отказы двух дисков и многие отказы
трех дисков. Однако при выполнении
логической записи реально
происходит шесть обращений к диску:
за старыми данными, за четностью по
строкам и по столбцам, а также для
записи новых данных и новых
значений четности. Для некоторых
применений с очень высокими
требованиями к отказоустойчивости
такая избыточность может оказаться
приемлемой, однако для
традиционных суперкомпьютеров и
для обработки транзакций данный
метод не подойдет.
В общем случае, если доминируют
короткие записи и считывания и
стоимость емкости памяти не
является определяющей, наилучшую
производительность демонстрируют
системы RAID уровня 1. Однако если
стоимость емкости памяти
существенна, либо если можно
снизить вероятность появления
коротких записей (например, при
высоком коэффициенте отношения
числа считываний к числу записей,
при эффективной буферизации
последовательностей
считывания-модификации-записи,
либо при приведении коротких
записей к длинным с использованием
стратегии кэширования файлов), RAID
уровня 5 могут обеспечить очень
высокую производительность,
особенно в терминах отношения
стоимость/производительность.
В качестве носителя для
резервного копирования информации
обычно используется магнитная
лента. Резервное копирование
предполагает использование
различных стратегий и различных
конфигураций оборудования в
зависимости от требований
пользователя. При планировании и
создании системы этим вопросам
приходится уделять большое
внимание, так как обычно требования
к системе резервного копирования
выходят далеко за рамки простого
обеспечения емкости носителя,
превышающей емкость дисковой
памяти системы, или выбора скорости
операций копирования на магнитную
ленту.
Среди этих вопросов следует
выделить, например, такие как
определение количества клиентов,
копирование данных которых должно
осуществляться одновременно;
цикличность операций копирования,
т.е. по каким дням и в какие часы
такое копирование
должно осуществляться, а также
уровень копирования (полное,
частичное или
смешанное); определение устройств
на которых должно выполняться
резервное копирование и т.д.
В настоящее время в большинстве
систем накопители на магнитных
лентах (НМЛ) обычно подсоединяются
к компьютеру с помощью шины SCSI.
Очень часто к этой же шине
подсоединяются и дисковые
накопители. К сожалению, высокий
коэффициент использования шины SCSI
практически всеми применяемыми в
настоящее время типами НМЛ
становится критическим фактором
при организации резервного
копирования и восстановления
информации особенно в больших
серверах с высокой степенью
готовности. В таблице 9.1 приведены
типичные параметры НМЛ. Очевидно
такая высокая загрузка шины SCSI (до 20
- 65 % пропускной способности шины)
при работе НМЛ накладывает
определенные ограничения как на
конфигурацию и типы применяемых
НМЛ, так и на организацию самого
резервного копирования.
Таблица 9.1
Тип НДЛ |
Емкость |
Скорость
передачи
данных |
Скорость
пересылки
по шине |
Коэффициент
использования шины SCSI |
4 мм
8 мм
8 мм
1/2" 9 дор.
1/4" QIC |
5 Гб
2.3 Гб
5 Гб
120 Мб
150 Мб |
920 Кб/c
220 Кб/c
500 Кб/c
780 Кб/c
200 Кб/c |
5 Мб/с (синх.)
1.2 Мб/с (асинх.)
3 Мб/с (асинх.)
1.2 Мб/с (асинх.)
1.0 Мб/с (асинх.) |
25 %
25 %
20 %
65-75 %
28 % |
Наиболее популярным в настоящее
время являются НМЛ с 8 и 4 мм
цифровой аудио- лентой (DAT),
использующие технологию
спирального сканирования. В
отличие от традиционных НМЛ со
стационарными головками и
ограниченным числом дорожек, эти
устройства осуществляют чтение и
запись данных на медленно
двигающуюся магнитную ленту с
помощью головок, размещаемых на
быстро вращающемся барабане. При
этом дорожки пересекают ленту с
края на край и расположены под
небольшим углом к направлению,
перпендикулярному направлению
движения ленты. Иногда эту
технологию называют "поперечной
записью". На сегодняшний день
подобные устройства дают наивысшую
поверхностную плотность записи.
Например, накопитель EXB-8200 компании
Exabyte Corp. позволяет записывать около
35 мегабит на квадратный дюйм 8 мм
ленты, а накопитель EXB-8500 - около 75
мегабит на квадратный дюйм.
Устройства DAT записывают данные на 4
мм ленту с плотностью 114 мегабит на
дюйм, что близко к теоретическому
пределу плотности записи.
Дальнейшее ее увеличение требует
смены типа носителя или
использования технологии
компрессии (сжатия) данных.
На сегодняшний день продолжают
использоваться и старые типы
катушечных НМЛ, которые используют
стандартную магнитную ленту
шириной 0.5 дюйма. Они главным
образом применяются для обмена
информацией со старыми ЭВМ и
поддерживают плотность записи 6250,
1600 и 800 бит на дюйм.
Наиболее популярными в течение
многих лет были 150-250 Мб картриджи QIC
с лентой шириной 1/4 дюйма. В
настоящее время существует 10
производственных стандартов для
картриджей конструктива 5.25" и 9
стандартов мини-картриджей
конструктива 3.5". В мае 1994 года
появился новый формат для записи 2
Гбайт (без сжатия) на
микрокартридже QIC-153 c
барий-ферритовой лентой длиной 400
футов. QIC-картриджи вмещают до 1200
футов магнитной ленты, при этом
данные записываются на дорожках,
расположенных вдоль ленты. Число
дорожек может достигать 48. В
зависимости от формата (QIC-40, QIC-80,
QIC-3GB(M) и т.д.) мини-картриджи имеют
емкость (без сжатия) от 40 Мбайт до 3 и
более Гбайт. Картриджи наибольшей
емкости позволяют записать до 13
Гбайт данных. В настоящее время
наблюдается рост числа накопителей
QIC с картриджами емкостью до 5 Гбайт
и форматом записи 5GB(M). В 1995 году
ожидается появление накопителей QIC
формата 25 Мбайт с постоянной
скоростью передачи 2.4 Мбайт/с. Такие
системы составят серьезную
конкуренцию 8 мм накопителям типа
Exabyte, которые сейчас доминируют на
рынке систем хранения большой
емкости.
Одним из сравнительно новых
направлений в области резервного
копирования является появление
устройств ленточных массивов
(аналогичных дисковым массивам),
используемых главным образом в
системах высокой готовности.
Примером такого устройства может
служить CLARiiON Series 4000 tape array компании
Data General. Оно может иметь в своем
составе до пяти 4 мм DAT накопителей
общей емкостью до 25 Гбайт.
Устройство относится к разряду
открытых систем и совместимо со
всеми UNIX-платформами компаний IBM, Sun,
Hewlett-Packard, Unisys и ICL.
[Предыдущая глава]
[Оглавление] [Следующая
глава ]
|