МПС

Транспьютер Т9000 (Тема)

 

Архитектурные и структурные особенности

На момент своего появления транспьютеры семейства Т-8 были самы­ми быстродействующими 32-разрядными микропроцессорами. Попытка фирмы Inmos сохранить лидерство перед американскими производителя­ми микропроцессоров воплотилась в разработку транспьютера Т9000. Его основные технические характеристики:

• производительность - 200 MIPS, 25 MFLOPS;

• объем внутрикристальной памяти - 16 Кбайт;

• число коммуникационных каналов - 4;

• скорость обмена по линку - 100 Мбит/с.

Основными особенностями архитектуры данного транспьютера явля­ются аппаратная поддержка механизма виртуальных каналов и аппарат­ный группировщик команд, повышающий загрузку параллельно функцио­нирующих устройств процессора.

Однако фирма Inmos не смогла выдержать обещанные сроки поставки Т-9000, а также достичь объявленной производительности. Поэтому, хотя образцы Т-9000, работающие на пониженной, по сравнению с объявленной, тактовой частоте были выпущены, коммерческого успеха они не имели.

 Виртуальные линки

Механизм виртуальных линков позволяет вести по одному физическо­му линку обмен между произвольным числом пар процессов, протекаю­щих в разных транспьютерах.

Управляет обменом встроенный в Т-9000 процессор виртуального канала (VCP). Сообщение, передаваемое от процесса-отправителя к процессу-получате­лю, VCP делит на пакеты, каждый из которых содержит 32 байта данных (последний пакет - от 1 до 32 байт), заголовок пакета и концевик (дам последнего пакета - признак конца сообщения, для остальных - признак конца пакета). При получении пакета, VCP в принимающем транспьютере передает подтверждение в виде пустого пакета содержащего только заголовок и признак конца пакета. VCP, используя информацию, содержащуюся в заголовке пакета, осуществляет маршрутизацию пакетов и сшивку сообщения. Таким образом, обмен данными для процессов выглядит так же, как и в случае транспьютеров прежних поколе­ний, что способствует преемственности программного обеспечения.

"Прозрачность" для процессов маршрутизации сообщений в сети транс­пьютеров Т9000 полностью устраняет различие между обменом в рамках одного транспьютера и обменом в транспьютерной сети. Этот свойство существенно упрощает разработку программы для мультитранспьютер­ной системы и повышает ее эффективность, поскольку не требуется до­полнительных расходов на организацию маршрутизации и коммутации.

В целях увеличения числа физических связей транспьютера Т9000 раз­работан программируемый коммутатор С 104, осуществляющий передачу сообщения с любого из 32 входов на любой из 32 выходов в соответствии с их заголовком.

Для возможности использования в системе Т9000 совместно с транс­пьютерами предшествующих поколений разработана микросхема С 100, выполняющая согласование электрических характеристик и преобразова­ние формата передаваемых по линкам данных.

 Группировщик команд

В Т-9000 полностью сохранена система команд предыдущих поколе­ний транспьютеров. Увеличение производительности достигается за счет одновременного исполнения группы, в которую входит до 8 команд.

В Т-9000 реализован аппаратный группировщик команд. Образование групп команд преследует цель достижения высокой загрузки устройств про­цессора.

Процессор за один такт извлекает из памяти 4 команды. В силу того, что некоторые команды требуют для исполнения более чем 1 такт, в про­цессоре может быть накоплено количество команд, достаточное для фор­мирования 5 групп по 8 команд каждая, что соответствует полной загруз­ке устройств процессора.

Транспьютероподобные микропроцессоры серии "Квант"

Примером отечественной разработки транспьютероподобных процес­соров являются микропроцессоры серии "Квант". Это семейство 32-разрядных микропроцессоров с оригинальной архитектурой, сочетаю­щей RISC-подход с методикой длинного командного слова. Семейство характеризуется высокой степенью внутреннего параллелизма процессов обработки, конвейерным выполнением команд, Гарвардской архитекту­рой памяти, наличием последовательных коммуникационных каналов -линков. Были выпущены две модификации микропроцессора:

• "Квант-10" по технологии 2,5 мкм на трех полузаказных матричных кристаллах 1537 ХМ2, спроектированных в НИИ "Квант" и изготовленных в НИИ точной технологии, г. Зеленоград;

• "Квант-20" по технологии 1,5 мкм на одном кристалле типа U1700 фирмы ZMD (ФРГ, Дрезден), спроектированном в НИИ "Квант" и изготовленном фирмой ZMD. Структура микропроцессора показана на рис. 80. Микропроцессор работает с внешними раздельными кэш-памятями ко­манд и данных и может использовать сопроцессор. Память данных мик­ропроцессора содержит только данные, тогда как память команд может содержать как команды, так и данные (такая архитектура памяти получи­ла название модифицированной Гарвардской).

 Устройство управления

Процессор выбирает из памяти команд 32-разрялные команды и по­мещает их сначала в первый, а затем во второй регистры команд, далее декодирует команды и формирует управляющие сигналы для всех функ­циональных блоков процессора. Блок управления прерываниями обес­печивает приоритетную схему обработки 10 типов внешних и внутрен­них прерываний. Блок ПДП прямого доступа в память позволяет вы­полнять вычисления одновременно с обменом данными по 4 коммуни­кационным каналам. Блок защиты данных предназначен для защиты фрагментов памятей команд и данных, выделяемых под операционную систему.

Рис. Структура микропроцессора "Квант"

 

Адресное устройство

В процессоре реализована концепция разнесенной" (decoupled) архи­тектуры, в соответствии с которой все вычисления адресов выполняют­ся отдельным адресным устройством, что предоставляет возможность од­новременной обработки данных в арифметическом устройстве и вычисле­ния адресов в адресном устройстве.

Адресное устройство содержит в программном счетчике адрес следую­щей команды, поддерживает в памяти стек адресов возврата из подпро­грамм (обработчиков прерываний), выполняет все вычисления адреса в 16-разрядном адресном сумматоре. Файл адресных регистров (АР) содер­жит 8 16-разрядных АР для МП "Квант-10" и 4 16-разрядных АР для МП "Квант-20".

Арифметическое устройство

Арифметический блок способен выполнять 16 логических и 14 ариф­метических операции, в том числе байтовые, пошаговое умножение 32-разрядного множимого на два разряда множителя. Логический блок мо­жет выполнять логические операции параллельно с арифметическими. Все операции выполняются над 32- разрядными операндами за один такт.

Универсальный сдвигатель способен выполнять за один такт логиче­ский, арифметический или циклический сдвиг 32-разрядного слова влево или вправо на 0 - 31 разряд, а также осуществлять циклические сдвиги внутри байтов, тетрад, пар. Схема маскирования арифметического уст­ройства позволяет маскировать результаты любой операции содержимым одного из регистров общего назначения. Файл регистров общего назначе­ния (РОН) используется для хранения операндов, результатов, масок, ад­ресов данных. В регистр флагов заносятся признаки по результатам вы­полнения операций в арифметическом устройстве.

Системное устройство

Системное устройство обеспечивает связь с 4 аналогичными процессорами по независимым каналам. Обмен осуществляется побитно блоками слов. В на­чале каждого блока задается количество передаваемых слов и адрес в памяти, в который будет записываться сообщение. В процессе передачи осуществляется контроль по четности для каждого передаваемого байта данных. В случае ошиб­ки при передаче вырабатывается соответствующее прерывание.

Регистр зашиты памяти позволяет запрещать запись в любой блок па­мяти длиной 4 Кслов.

Конвейер процессора

В процессоре реализован трехстадийный конвейер выполнения команд. На первой стадии осуществляется выборка команды из памяти команд, на второй стадии производится формирование адреса данных для последую­щего обращения в память и модификация регистров адреса, на третьей стадии выполняются ввод-вывод данных из памяти по предварительно вычисленному адресу и операции арифметики. Действия на каждом этапе выполняются за один такт, что позволяет при обеспечении высокой степе­ни загруженности конвейера выполнять команды в среднем за один такт.

 

Система команд

Команды процессора подразделяются на простые и комплексные. Пер­вые выполняют одно действие, тогда как вторые задают трехадресную арифметическую операцию над данными в регистрах одновременно с опе­рацией обмена данными с памятью и (или) модификацией адресных реги­стров.

При обращении к памяти используются следующие виды адресации:

базовая по содержимому АР, базовая по содержимому РОНа, автоинкре­ментная или автодекрементная адресация по любому АР, базово-индексная адресация по двум АР. В МП "Квант-20" добавлена базово-индексная адресация с 8-разрядным смещением, задаваемым в поле команды.

Для упрощения устройства управления и обеспечения большей гиб­кости в программах в микропроцессоре реализована следующая схема выполнения условных и безусловных переходов. В случае условного пе­рехода специальная команда проверяет соответствие флага признаков результата арифметической операции одному из 16 возможных условий перехода. Если имеет место соответствие, то следующая команда не вы­полняется, а как бы подменяется пустой операцией (NOP). Причем про­верка условия осуществляется на фоне выполнения арифметических опе­раций.

Чтобы не нарушить работу конвейера (избежать пропуска конвейер­ных циклов), безусловный переход выполняется но принципу "отложен­ного перехода". В конвейере сначала отрабатывается команда следую­щая за командой перехода, а затем выполняется переход, Так же выполня­ется и обращение к подпрограммам.

Конвейеризация внутренних процессов в осуществляется во времени вы­полнения операций в различных функциональных устройствах микропроцессора позволяют выполнять до четырех команд за один такт.

Производительность микропроцессора.

Гибкая система команд микропроцессор способствует его эффектив­ному применению как на задачах счётного характера, так и на задачах логической и символьной обработки. Коммуникационные возможности процессора позволяют строить на его базе масштабируемые системы с МРР-архитектурой.

Уникальная архитектура процессора серии "Квант" позволила обеспе­чить лучшее значение производительности по сравнению с транспьютера­ми фирмы Inmos. Производительность микропроцессора "Квант-10" с тактовой частотой 4 МГц соответствует производительности транспьюте­ра Т-800 с частотой 20 МГц. Производительность микропроцессоров "Квант-10" и "Квант-20" может быть оценена как 12-15 Моп/с и 25-30 Моп/с.