ОБЗОР DSP-ПРОЦЕССОРОВ


PDF версия

В статье сравниваются DSP-процессоры компаний Analog Devices, Freescale и Texas Instruments. Обзор охватывает недорогие DSP с фиксированной точкой, высокопроизводительные DSP с фиксированной точкой, а также DSP с плавающей точкой. Приводятся количественные оценки производительности, полученные по методике BDTImark2000.

Введение

Тенденции развития DSP-процессоров меняются: если недавно производители предлагали процессоры общего назначения, то сегодня многие семейства DSP-процессоров ориентированы в основном на конкретные приложения. На рынке присутствуют три основных производителя DSP-процессоров: Analog Devices, Freescale и Texas Instruments. В статье рассмотрены наиболее широкоиспользуемые семейства процессоров этих производителей. Процессоры сгруппированы в три категории: недорогие с фиксированной точкой, высокопроизводительные с фиксированной точкой и процессоры с плавающей точкой. Это очень примерная классификация, и многие процессоры было бы разумно поместить в две категории — мы будем отмечать те случаи, где это имеет место.

 

Недорогие процессоры с фиксированной точкой

Два производителя — Freescale и TI, предлагают множество недорогих процессоров с фиксированной точкой. ADI также выпускает семейство недорогих процессоров с фиксированной точкой ADSP-21xx, но сегодня это семейство вытеснено Blackfin и практически не развивается. Как правило, процессоры этой группы не отличаются производительностью: они работают на скромных тактовых частотах (не более 350 МГц); в их состав обычно входит один блок умножения с накоплением — MAC. Хотя пропускная способность блока MAC не основной показатель производительности DSP-процессора, эта величина все еще является важным параметром при сравнении возможностей различных процессоров.
Сегодня многие современные встраиваемые процессоры (ВП) значительно быстрее недорогих DSP с фиксированной точкой. Но в приложениях, где требуется цифровая обработка сигналов, современные ВП обычно уступают таким DSP как по ценовым показателям, так и по энергопотреблению. Им, как правило, недостаёт специализированной интегрированной периферии и средств, необходимых для разработки приложений, ориентированных на обработку сигналов и управление механизмами. Существует множество встраиваемых приложений, где скорость не является самым важным параметром, например управление двигателями. Для этих приложений недорогие DSP-процессоры с фиксированной точкой часто являются наилучшим выбором, поскольку они имеют более низкую цену, пониженное энергопотребление, а также обладают специализированной периферией и доступными средствами разработки.
Freescale DSP563xx. На данный момент процессоры семейства DSP563xx являются единственными широкораспространёнными 24-разрядными процессорами с фиксированной точкой. Основные сферы применения — аудио-приложения с высокой точностью звуковоспроизведения, где большая разрядность слова данных даёт лучшее значение тембра по сравнению с 16-разрядными микросхемами с фиксированной точкой. DSP563xx — это продолжение 24-разрядных DSP560xx, выпущенных в конце 1980 гг. 24-битное слово данных было в то время необычным явлением, впрочем как и сейчас. Это помогло внедрить семейство 5600x и 563xx во множестве схем аудио, это основная причина, по которой семейство и по сей день ориентировано на звуковое оборудование.
Самые быстрые представители семейства DSP563xx работают на частоте 275 МГц при напряжении питания 1,6 В, их стоимость от 4 до 5 долл.2 В отличие от большинства DSP с фиксированной точкой, процессоры 563xx часто сопоставимы с 32-разрядными процессорами с плавающей точкой, которые также обеспечивают высокое качество звука. Однако процессоры с плавающей точкой обычно гораздо дороже и потреб­ляют больше энергии.
Freescale DSP5685x. Эти процессоры часто применяются в автоэлектронике для управления электродвигателями и в импульсных источниках питания. Они попадают в категорию цифровых сигнальных контроллеров (Digital Signal Controller (DSC)) в том смысле, что объединяют атрибуты традиционных DSP с микроконтроллерами и имеют подходящую периферию для схем управления, например такую, как ШИМ. Термин «цифровой сигнальный контроллер» является довольно новым, но он уже введен в употребление. Представители семейства DSP5685x работают на частотах до 120 МГц и стоят от 3 до 20 долл. Компания Freescale также предлагает родственное семейство кристаллов MC56F83xx, которые построены на базе того же ядра, что и DSP5685x, но, помимо всего прочего, содержат также Flash память и работают на максимальной частоте до 60 МГц.
Texas Instruments TMS320C28x. Это 32-разрядные DSP с фиксированной точкой. C28x позиционируются как DSC. В состав семейства входят микросхемы с флэш-памятью и периферией, ориентированной на решение задач управления (например, CAN-интерфейс и ШИМ). 32-битное слово данных — необычное явление для такого класса DSP-процессоров. Это важная особенность, поскольку приложения, связанные с реализацией управления, могут требовать высокой точности и широкого динамического диапазона, но при этом быть слишком чувствительными к цене для того, чтобы использовать 32-разрядные микросхемы с плавающей точкой. Процессоры C28x применяются при управлении двигателями и в цифровых источниках питания.
C28x работают на частотах до 150 МГц, это одни из самых быстрых доступных DSС. Их цена варьируется от 3 до 14 долл. Компания TI также предлагает более дешёвые решения, обладающие меньшей производительностью и ориентированные на схемы управления, это TMS320C24x, которые используют 16-битное слово с фиксированной точкой и работают на частотах до 40 МГц.
Texas Instruments TMS320C55x. Процессоры выпускаются с 2000 г. C55x имеют два блока MAC (у предшественника C54x, а также в других процессорах из ниши недорогих DSP только один блок) и параллельно выполняют до двух инструкций за такт. Их максимальная тактовая частота 160 Мгц. Процессоры TMS320C55x позиционируются как процессоры для широкой области применений, в частности для тех приложений, которые требуют низкой цены, умеренной производительности DSP и малого энергопотребления. Это портативные аудиоплееры и другие потребительские товары.
Как и другие семейства процессоров данного класса, процессоры C55x по сути, являются традиционными DSP общего назначения, но они единственные в данной группе, которые могут выполнять две инструкции за такт. Это позволяет получать среднюю производительность при низкой цене от 4 до 17 долл. и малом энергопотреблении.
Компания TI также предлагает усовершенствованный вариант ядра C55x под названием C55x+, который работает на более высоких частотах (до 500 МГц) и имеет расширенную микроархитектуру. Ядро C55x+ доступно только в специализированных чипах для беспроводных телефонов и не предназначено для широкого круга применений. Оценки, проведенные по критерию BDTImark2000, показывают, что ядро C55x+ имеет значительно более высокую DSP-производительность, чем C55x.

 

Высокопроизводительные процессоры с фиксированной точкой

В этой нише конкурируют три основных семейства — BF5xx (Blackfin) от ADI, MSC81xx и MSC71xx от Freescale и TMS320C64x компании TI. Все они представляют собой 16-разрядные процессоры и являются более новыми и более мощными устройствами, чем процессоры из группы недорогих DSP. Все они исполняют несколько инструкций за такт, используют технологию VLIW (Very Long Instruction Word — очень длинное командное слово) и поддерживают одновременное выполнение нескольких MAC-операций в одном цикле. Следует отметить, что, хотя мы и выделяем только три семейства в данную группу, но существует также множество начинающих компаний, предлагающих высокопроизводительные DSP-процессоры с фиксированной точкой. Это многоядерные устройства, имеющие архитектуру с массовым параллелизмом.
Analog Devices ADSP-BF5xx. Это семейство сочетает в себе характеристики DSP с малым энергопотреблением и свойства, традиционно связанные с микропроцессорами общего назначения. Они используются в приложениях, где требуется выполнение функций как DSP, так и процессоров общего назначения: автоэлектроника, в приложениях, требующих мощных мультимедийных средств обработки, и других, требующих интенсивных вычислений.
Процессоры Blackfin имеют «Микросигнальную архитектуру», разработанную совместно Intel и ADI: два тракта обработки данных и ограниченная VLIW-архитектура, которая может выполнять до трёх инструкций за один такт и реализовать два 16-разрядных умножения за такт. Цены на эти процессоры варьируются от 5 до 32 долл. Поскольку в семействе присутствуют и недорогие чипы, Blackfin можно также отнести к семейству недорогих DSP, хотя их производительность значительно выше, чем у других DSP этой группы. Blackfin содержит и многоядерные чипы.
Процессоры ADSP-BF5xx имеют сложные специфические схемы управления питанием для обеспечения устойчивости при переключении режимов работы. Процессоры Blackfin не такие производительные, как два других представителя данной категории, но являются более эффективными с точки зрения потребляемой мощности. Они могут применяються не только в стационарных высокопроизводительных приложениях, но и в мобильных устройствах с пониженным энергопотреблением. Процессоры Blackfin выделяются в ряду современных архитектур, поскольку они содержат специализированную аппаратную часть и инструкции для ускорения двухмерной обработки изображений и видеоданных. Эти возможности являются значительным шагом вперёд в архитектуре DSP-процессоров, поскольку изначально они были разработаны для обработки одномерных сигналов в системах связи и аудиоаппаратуре.
Freescale MSC81xx и MSC71xx. В состав семейств MSC81xx и MSC71xx входят кристаллы, реализованные на базе трёх ядер StarCore: SC140, SC1400 и SC3400. Процессоры с ядром SC140 были выпущены в 1999 г. и, вместе с TMS320C62x, это были одни из первых процессоров на базе VLIW-архитектуры. Ядро SC140 содержит четыре модуля MAC, которые могут выполнять до 6 инструкций за цикл. Два других ядра (SC1400 и SC3400) очень похожи на SC140, но при их изготовлении используются другие технологии, а некоторые особенности архитектуры позволяют достигать большей производительности.
Наиболее производительным является ядро SC3400, которое на данный момент доступно только в составе процессора MSC8144. Этот процессор содержит четыре ядра SC3400, работающих на частоте 1 ГГц. Микросхема используется в приложениях c многоканальной инфраструктурой: базовые станции беспроводной связи, оборудование для цифровой передачи звука, маршрутизаторы, устройства видеонаб­людения и другие.
Ядро SC140 используется в различных одно- и четырёхядерных процессорах MSC81xx, самый быстрый из которых работает на частоте 500 МГц. MSC81xx применяются в коммуникационных приложениях, таких, как маршрутизаторы, используемые в сетях технологии VoIP, устройств обеспечения видеоконференций и в базовых станциях беспроводных сетей. Ядро SC1400 используется в одноядерных чипах MSC71xx, которые могут работать на частотах до 300 МГц. Эти чипы применяются при проектировании недорогих устройств, таких, как, например, дешёвые приложения для IP-телефонии. Цены на эти приборы варьируются от 13 до 84 долл. для процессоров семейств MSC71xx/81xx и от 180 до 220 долл. для MSC8144.
Texas Instruments TMS320C64x. TMS320C64x, первые представители которого были выпущены в 2000 г., являются расширением и заменой семейства TMS320C62x. Микросхемы семейства TMS320C64x применяются в приложениях, требующих высокой производительности: в беспроводной связи, в двух- и трёхмерные графических приложениях, видеоприложениях, радарных и сонарных системах. Совсем недавно TI объявили о выпуске многоядерных DSP на базе C64x, предназначенных для связи. Самые быстрые представители семейства TMS320C64x работают на частотах до 1 ГГц, напряжение питания ядра 1,2 В. Цена на одноядерные микросхемы варьируется от 15 до 208 долл.
Процессоры TMS320C64x имеют восемь блоков управления (execution unit), включая два умножителя и четыре АЛУ, таким образом обеспечивая выполнение до восьми инструкций за цикл. Процессоры семейства C64x также поддерживают инструкции SIMD, которые позволяют им одновременно выполнять четыре 16-битных умножения. Более ранние C62x выполняли только два умножения. В 2005 г. TI представили модернизированную версию архитектуры C64x, а именно C64x+, которая поддерживала ряд дополнительных инструкций и могла выполнять до 8 операций умножения 16-битных цикл параллельно.
Представители C64x+ работают при тактовой частоте 1 ГГц и за счёт дополнительных инструкций могут достигать заметно более высокой производительности, чем С64х. В отличие от C55x+, процессоры C64x+ доступны в DSP общего назначения. Кроме того, TI используют архитектуру C64x/C64x+ в различных специализированных микросхемах. Например, DSP для видеоприложений DaVinci и прикладные OMAP3430-процессоры, которые совмещают ядро CPU ARM Cortex-A8 с DSP C64x+.
На рисунке 1 приведена оценка производительности по тестовой методике BDTImark2000 для DSP из групп недорогих и высокопроизводительных процессоров с фиксированной точкой.

 

Рис. 1. Оценки BDTImark2000 для DSP с фиксированной точкой

 

Производительность процессора измеряется с помощью программного модуля BDTI DSP Kernel Benchmark. Более высокая оценка BDTImark соответствует более производительному процессору.
На рисунке 2 показано соотношение цена/производительность для некоторых DSP с фиксированной точкой в единицах BDTImark/долл (чем выше оценка, тем лучше).

 

Рис. 2. Оценки BDTImark2000 для DSP с фиксированной точкой, приведённые для самых экономически выгодных процессоров каждого семейства

 

Заметим, что некоторые более дорогие высокопроизводительные процессоры имеют лучшее соотношение цена/производительность, чем недорогие чипы. Однако производительность процессоров может оказаться ненужной для приложений, главным критерием для которых является цена.

 

DSP-процессоры с плавающей точкой

Наиболее распространены три семейства DSP с плавающей точкой: SHARC и TigerSHARC от ADI и TMS320C67x от TI. Традиционно процессоры ADI имеют ориентацию на использование в многопроцессорных системах, и заказчики ADI зачастую реализуют целые массивы процессоров SHARC для приложений, требующих высокой производительности, например, радиолокации и медицинских приборов.
Из-за схемотехнической сложности DSP с плавающей точкой обычно работают на более низких частотах, чем высокопроизводительные с фиксированной точкой, кроме того, их энергопотребление довольно велико. Основным преимуществом этих процессоров является возможность обеспечения лучшего динамического диапазона и, соответственно, более простого использования с точки зрения программного обеспечения. Гораздо проще писать программу обработки сигнала, если не надо заботиться о масштабировании сигнала.
Традиционно DSP-процессоры с плавающей точкой всегда были более дорогими, чем DSP с фиксированной точкой, но ценовое соотношение изменилось за последние годы. Как ADI, так и TI предлагают недорогие процессоры с плавающей точкой по цене от 5 до 10 долл., которые сопоставимы по цене с недорогими DSP с фиксированной точкой. Это позволило использовать DSP с плавающей точкой в таких приложениях, как потребительская аудиоаппаратура и автомобилестроение.
Analog Devices TigerSHARC. Вы­­сокопроизводительная архитек­тура TigerSHARC с плавающей точкой реализована в семействе процессоров ADSP-TSxx. TigerSHARC — это мощная (и дорогая) архитектура, которая совмещает технологии VLIW и SIMD, поддерживая параллельное выполнение до 4 операций умножения 32-разрядных чисел с плавающей точкой, что вдвое больше, чем у двух других обсуждаемых здесь DSP. Процессоры этого семейства также работают на более высоких частотах: до 600 МГц. Цена варьируется от 130 до 150 долл. ADI не объявляли о выходе новых чипов на базе TigerSHARC уже несколько лет, что наводит на мысль о том, что это семейство устарело. Недавно ADI в интервью BDTI отмечали, что они планируют выпустить новые TigerSHARC-продукты, но они не говорили, когда это произойдёт.
Процессоры ADSP-TS20x работают с данными различной разрядности и поддерживают формат как с фиксированной, так и с плавающей точкой; такая гибкость в отношении типов данных является необычным свойством. По этой причине данное семейство может быть также классифицировано и как высокопроизводительный чип с фиксированной точкой. Процессоры TigerSHARC отличаются и тем, что содержат память DRAM на кристалле.
Analog Devices ADSP-21xxx SHARC. Представители ADSP-21xxx SHARC от ADI являются менее дорогими процессорами: цены варьируются в пределах от 5 до 30 долл. Впервые ADI выпустили SHARC в 1994 г., основываясь на более ранних ADSP-21020. Изначально SHARC был SISD-машиной (одна инструкция — одни данные) и был усовершенствован для обеспечения возможностей SIMD (одна инструкция — несколько данных) в 1998-м. Возможности SIMD (которые включают второй, дублирующий путь для данных и новые инструкции) удвоили пропускную способность MAC-модуля более ранних устройств, от одной операции MAC за цикл до двух. Процессоры SHARC работают на частотах до 400 МГц.
SHARC изначально получили широкое распространение в медицинских и военных приложениях (радиолокация), но ранее ADI ориентировали свою линию продуктов SHARC в основном на аудиоприложения. Некоторые представители семейства имеют интегрированный интерфейс SDRAM, а некоторые — память ROM на кристалле, в которую предварительно помещаются аудиокодеки и программы последующей обработки.
Texas Instruments TMS320C67x. TMS320C67x — вариант оригинального VLIW DSP с фиксированной точкой, а именно TMS320C62x. Набор инструкций C67x совмещает инструкции для операций с фиксированной точкой оригинального C62x. TI изначально позиционировали C67x как средство для быстрой разработки новых приложений, которые в дальнейшем могут быть легко переносимы на недорогие и высокопроизводительные C62x (ныне C64x). В последние годы TI перестали делать акцент на совместимость C67x/C62x, возможно из-за того, что перенос из формата с плавающей точкой в формат с фиксированной точкой, как правило, требует тщательного числового анализа и изменения алгоритмов, таким образом, приводя к необходимости переработки значительной части кода несмотря на совместимость процессоров.
Семейство C67x построено на базе той же восьмитактной VLIW-архитектуры, что и C62x, но с добавлением ряда инструкций и аппаратуры для поддержки операций с плавающей точкой. C67x могут выполнять две 32-разрядные MAC-операции с плавающей точкой одновременно и работать на частотах до 300 МГц. Как и ADI свои SHARC, так и TI в последние годы ориентируют DSP с плавающей точкой на профессиональные, high-end аудиоприложения. Как и в случае с C64x/C54x+, TI также предлагают расширенную версию ядра C67x+. Ядро имеет расширенный набор регистров, специфические для аудио-обработки инструкции и работает на более высоких частотах (до 350 МГц). Эти ядра используются в чипах TMS320C672x и предназначены для приложений, требующих более высокой производительности, не достижимой с C67x.
На рисунке 3 показаны BDTImark2000- оценки для трёх DSP с плавающей точкой.

 

Рис. 3. BDTImark2000 для DSP с плавающей точкой

 

В таблице 1 сведены все микросхемы, обсуждаемые в данной статье.

 

Таблица 1. Основные характеристики DSP-процессоров
Семейство
Ценовой диапазон, долл. (для 10 тыс. шт.)
Формат данных
Основные области применения
Основные конкуренты
Примечания
ADI Blackfin
5—32
16-бит фикс.
Телекоммуникации, автомобилестроение, видео
‘C55x, ‘C64x

Доступны в многоядерных микросхемах
ADI TigerSHARC
130—150
16-бит фикс./32-бита плав.
Военная промышл., обработка граф. изображений, связь
‘C67x, SHARC, CPUs
Содержат интегрированную RAM на кристалле; гибкость формата данных
ADI SHARC
5—30
32-бита плав.
Аудио
‘C67x, CPUs
Поддержка многопроцессорности
Freescale ‘563xx
4—47
24-бита фикс.
Аудио
SHARC, ‘C67x
Единственные широкораспространённые 24-разрядные процессоры
Freescale ‘5685x
3—20
16-бит фикс.
Управление двигателями, цифр. источники питания
‘C28x
Некоторые представители имеют Flash на кристалле
Freescale MSC81xx/71xx, MSC8144
3—184
Телекоммуникации
‘C64x, Blackfin
Есть и многоядерные микросхемы
TI ‘C28x/C24x

3—14/2—8
32-бита фикс./16-бит фикс.
Управление (автомобилестроение и промышленность), цифр. источники питания
DSP5685x
‘C28x единственные серийные 32-разрядные DSP с фиксированной точкой; некоторые представители имеют Flash на кристалле
TI ‘C55x
4—17
16-бит фикс.
Портативнае аудио, потребительская техника
Blackfin
Также встречаются в узкоспециализированных микросхемах, таких, как OMAP, и в многоядерных кристаллах
TI ‘C64x/C64x+
15—208/180—260
Телекоммуникации, связь, видео
MSC81xx/71xx, MSC8144
Также доступны в узкоспециализированных чипах, таких, как DaVinci и OMAP, и в многоядерных кристаллах
TI ‘C67x/C67x+
12—30
32-бита плав.
Аудио
SHARC, SPUs
Некоторая совместимость ассемблера с ‘C62x/’C64x

 

Заключение

Процессоры, описанные в данной статье, построены на основе хорошо себя зарекомендовавших архитектурных решений. Но существуют и более необычные решения, такие, как массивы параллельных многоядерных чипов с параллельной обработкой данных. Некоторые из этих чипов обеспечивают большую производительность, чем DSP, но больше также и риск при использовании этих процессоров: производители, средства разработки и сами архитектуры ещё не доказали своей надёжности. В ближайшие годы мы ожидаем увидеть, как некоторые из этих процессоров начнут перемещаться в категорию серийно производимых, привнося с собой значительный сдвиг в стилях программирования и разработки.

 

——————————————————————

 

Обзор составлен специалистами Berkeley Design Technology Inc. (BDTI).
Все цены в статье приведены для партии 10 тыс. шт.


Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *