https://lauftex.ru/product/lf-21060-lcw-tsifrovoy-signalnyy-protsessor

Секция «Высокопроизводительные вычислительные системы» на форуме «Микроэлектроника-2025»


На форуме «Микроэлектроника-2025» состоялась секция «Высокопроизводительные вычислительные системы», в рамках которой представители основных российских разработчиков микропроцессорных систем и ПАК для ИИ представили свои результаты.

Предлагаем тезисную выжимку из выступлений докладчиков трёхдневной сессии.

Козлов Александр Владимирович, технический директор CloudBEAR:
Представляю новую разработку нашей команды — процессорный сложно-функциональный блок с внеочередным исполнением команд второго поколения, совместимый с системой команд RISC-V. По сравнению с первым поколением его производительность повышена до 60-100% за счет множества оптимизаций и новых подходов. Имплементации кристалла мы делали по технологии 28 нм у себя и по 12 нм у клиента. Оба варианта показали хорошие результаты в бенчмарках SPEC, в том числе, по сравнению с популярными чипами на ARM A55. Процессор пригоден для приложений Edge AI, промышленных компьютеров, встраиваемых и сетевых систем, телекома и мн.др.

Мякочин Юрий Олегович, директор департамента проектирования АО «Байкал Электроникс»:
На этой конференции мы представляем наш новый трёхъядерный микроконтроллер U1000 для ресурсоемких задач и систем промышленной автоматизации. Кластер ядер построен на базе микроархитектуры CloudBEAR – это два мощных ядра BR-350 с большим кэшем каждое и одно экономичное ядро BM-310. Встроенная флеш-память имеет объём 256 кбайт, ОЗУ — 192 кбайт. Наша компания официально поддерживает SDK для Windows и Linux. Отладка — через JTAG или USB. Уникальной особенностью нашего микроконтроллера является объединение всех отладочных интерфейсов в единый USB с выбором механизма через программный драйвер и возможностью трассировки. Измеренное энергопотребление — около миллиампера на мегагерц.

Маслов Максим Владимирович, директор департамента разработки спецпроектов АО «Байкал Электроникс»:
Новейшая микроархитектура высокопроизводительного GPGPU для задач ИИ от «Байкал Электроникс» основана на базе диспетчера на ядре RISC-V и многопоточных тензорных процессоров Baikal-AI для параллельных вычислений с общим кэшем второго уровня. Сравнение Baikal-AI с ядрами-конкурентами Xavier AGX от Nvidia на компиляторе CUDA показывает средний прирост скорости около 9% с заметным разбросом в зависимости от типа задачи и требует оптимизации компилятора. В дальнейшем ядра Baikal-AI планируется интегрировать в конечные решения.

Советов Пётр Николаевич, с.н.с. Лаборатории специализированных вычислительных систем РТУ МИРЭА, представил компилятор специализированных регулярных выражений для проектирования программируемой и ресурсоэффективной аппаратной архитектуры.

Миронов Сергей Эльмарович, доцент СПбГЭТУ «ЛЭТИ»:
Мы проанализировали аппаратные средства реализации нейронных сетей, кратно снижающие их время задержки и площадь на кристалле. Аппаратное распараллеливание процессов сложения позволяет существенно ускорить вычисления, но занимает много места на кристалле. Комбинирование этого подхода с уменьшением разрядности и оптимизацией топологии вычислительных ячеек Бута позволяет добиться оптимального сочетания подходов для получения наилучшего результатата для конкретных задач матричного умножения. Наши подходы мы стремимся реализовать в заказной микросхеме, поскольку стандартные ПЛИС при таком подходе не обеспечивают оптимальной конфигурации.

Фролов Михаил Алексеевич, зам. генерального директора по научной работе ООО «Хайтек»:
Мы — ведущий разработчик высокопроизводительных отечественных тензорных вычислителей для инференса нейронных сетей в реальном времени. Наши изделия внесены в реестр отечественной продукции Минпромторга. На их базе был разработан спектр ускорителей нейронных сетей LinQ. Серийное производство в России — до 10 тыс. модулей. Наши ускорители импортозамещают решения Nvidia и Huawei и предназначены для задач аналитики, безопасности и научных расчетов. Наш новый ПАК HPC выполняет инференс более 80 нейронных сетей без потери производительности на вычислительном узле.

Тарасов Илья Евгеньевич, профессор РТУ МИРЭА:
Нами разработан и испытан ускоритель специализированных вычислений массового параллелизма на базе частично динамически реконфигурируемой ПЛИС XC7A200 в составе ПАК на базе процессора «Эльбрус», где блоки реконфигурируются в зависимости от тех данных, которые надо анализировать (например, для глубокого анализа пакетов интернет-трафика в составе актуальной аппаратуры ТСПУ). Далее существует возможность аппаратной реализации данного подхода на 90-нм СБИС в НИИМЭ или на ПЛИС 5510.

Шантаев Эдуард Борисович, директор ФГАУ «ЦИТ»:
ФГАУ «ЦИТ» ежемесячно анализирует потребности федеральных органов исполнительной власти и госкорпораций — ПАК, ЭКБ для ИИ и пр. — с целью формирования потребности отрасли и помощи производителям. Сейчас рынку требуется около 4500 единиц вычислительной техники в сфере ИИ. Основная номенклатура — графические карты для ЦОД, глубокого обучения, научных исследований и высокопроизводительных вычислений. Мы также предоставляем различные ИИ-сервисы внутри нашего ЦОД, который сейчас 6-й по мощности в РФ. Планируем подключать к нему отечественных разработчиков чипов и сформировать наиболее актуальные направления для будущих разработок кристаллов под задачи отечественных заказчиков.

Недбайло Юрий Александрович, с.н.с. ИНЭУМ им. И.С.Брука:
Современные методы моделирования многоядерных процессоров имеют множество недостатков. RTL-симуляция и прототипирование на ПЛИС не позволяет полноценно оценить проект разрабатываемого процессора, особенно многоядерного. Другой подход — снятие трасс обращений с последующим их воспроизведением на модели uncore. Кластерная выборка — наиболее точный и универсальный подход, но очень ресурсоемкий. Наиболее актуальный симулятор Gem5 тоже не свободен от многих недостатков; стоит задача создать его отечественный аналог.

Молчанов Игорь Анатольевич, ведущий инженер ИНЭУМ им. И.С. Брука:
Ключевой задачей организации стабильной Wi-Fi-связи для робототехнических комплексов является выбор одноплатных компьютеров и сетевых адаптеров, способных обеспечить достаточную производительность при передаче качественного видео, организацию mesh-сети и удобство управления и конфигурирования системы. Выбор среди «одноплатников» типа Raspberry Pi, Banana Pi, Repka Pi и Orange Pi весьма неоднозначен, но оптимальным стал именно Orange Pi 5+. В качестве эталонной для него взята операционная система Armbian. Wi-Fi-адаптер – Atheros WLE600VX, только он смог обеспечить динамическую маршрутизацию в mesh-сетях на B.A.T.M.A.N.

Федоткин Алексей Сергеевич, Зам. зав. лаб. средств проектирования микроэлектроники МФТИ:
Задача создания быстрой СУБД для многослойных технических объектов (МТО) возникла при разработке САПР для корпусирования сложных чипов, но применима и для других объектов проектирования электроники — печатных плат, микросхем и др. Для отечественных разработчиков требуется кроссплатформенная реализация, не заточенная под узкую западную платформу. Нами была предложена структура и кроссплатформенная реализация СУБД SDB для обработки и хранения МТО. Время отрисовки БД, содержащей 1 млн объектов, составило менее 12 мс при использовании современных графических карт и процессоров “Эльбрус» или x86.

Аряшев Сергей Иванович, зам. директора НИЦ «Курчатовский институт» — НИИСИ:
Нами создана коммуникационная система (интерконнект) для компьютеров и серверов на базе отечественного коммуникационного ядра. Наша микросхема К1890КП38 соответствует спецификации PCI Express 3.0 x16, работает на 1 ГГц (передача до 25 Гбит/с), имеет 12 Мбайт SRAM, создается по техпроцессу 28 нм и корпусируется в России (КВГ около 10%) или в Китае (КВГ более 99%). Платы на них уже есть и используются в высокочастотных серверах на процессорах «Эльбрус» и не только.

Ларионов Александр Владимирович, зав. сектором НИЦ «Курчатовский институт» — НИИСИ:
Нами создана высокочастотная система тактирования сигнала для четырехканального мультистандартного последовательного приемопередатчика на 28 Гбит/с, изготавливаемого по КМОП-технологии 28 нм. Использование активных индуктивностей при проектировании КМОП-кристалла позволяет эффективно создавать высокочастотные схемы приемопередатчиков. По энергоэффективности (8 мВт/Гбит) наше решение превзошло непосредственные зарубежные аналоги для интерконнекта класса PCI Express 3.0.

Земков Савва Игоревич, м.н.с. НИЦ «Курчатовский институт» — НИИСИ:
Задача выбора рабочих параметров памяти DDR растет экспоненциально по мере усложения памяти и применения нестандартных режимов ее эксплуатации. Учесть всё возрастающее количество параметров настройки помогает интеллектуальная система адаптивной настройки параметров на базе машинного обучения на синтетическом массиве параметров. Нами был создан ПАК для автоматизированного перебора коэффициентов DDR3 и на базе собранного массива проведено обучение машинной модели. В дальнейшем планируется адаптация этой модели для памяти DDR4 и DDR5, где параметров оптимизации значительно больше.

Манеркин Алексей Дмитриевич, м.н.с. НИЦ «Курчатовский институт» — НИИСИ:
Применение гибридных методов машинного обучения для ускорения верификации проектов микросхем на блочном уровне позволяет эффективно решить более 95% случаев, возникающих в процессе проектирования. Нами планируется создание методики применения методов машинного обучения на различных этапах тестирования RTL-моделей.

Левченко Николай Николаевич, в.н.с. НИЦ «Курчатовский институт»:
В различных индустриальных и научно-исследовательских процессах операторам поступает огромное количество данных с различных датчиков, которые необходимо быстро и эффективно хранить и обрабатывать в реальном масштабе времени. Нами разработан программный комплекс проектирования потоковых систем, который позволяет аппаратно распределять ресурсы обработки без необходимости подготовки данных. Обработка начинается с приходом первых данных, есть аппаратное распараллеливание. Изменение вида распределения вычислений не требует изменения программы.

Ладин Олег Игоревич, руководитель направления, СБЕР:
Нами создана оптимизированная программная модель комплексных вычислительных систем с динамической настройкой для многоядерных систем с кластеризацией модулей. Важным элементом стал анализатор задач — управляющее ядро кластера; анализатор предугадывает шаблон нагрузки, вычисляет уровень детализации, здесь может быть использован ИИ. Динамический подход позволил улучшить компромиссный баланс точности моделирования и скорости работы симулятора. Прототипирование показало кратное улучшение точности при сохранении порядка скорости.

Хайдуков Данила Игоревич, Руководитель направления, СБЕР:
Целью работы является сравнение эффективности алгоритмов маршрутизации DOR и ADOR в Mesh-сети в вычислительной системе с распределенной памятью. Рассматривались конфигурации DOR с несколькими виртуальными каналами. Основым фактором роста эффективности является именно алгоритм маршрутизации. Наилучшие результаты показал алгоритм ADOR, в нём также наблюдается наболее равномерное распределение трафика в сети. Оптимальный размер пакета — 2, при этом значителен вклад коллизий wormhole.

Белянин Игорь Валерьевич, Главный эксперт по технологиям, СБЕР:
Мы предлагаем применение высокоскоростных линков CXL/UCIe для решения проблем с хранением данных в современных гетерогенных системах, объединяющих различные типы вычислителей (CPU, GPU, NPU). Препятствием к масштабированию таких систем являются «стена памяти» (ограниченная ПСП) и медленные устройства хранения информации. Для решения можно использовать промежуточную «тёплую» память на HBM с интерфейсом UCIe/CXL. Однако ПО для этого ещё очень сырое и требует доработок. Мы предложили делать расширитель памяти на ПЛИС с CXL для подкачки данных в быструю память. Это также позволяет отладить ПО. Такая система на ПЛИС нами сейчас отлаживается.

Хренов Григорий Юрьевич, д.ф.-м.н., технический директор АО «Байкал Электроникс»:
Каковы перспективы использования открытых архитектур в отечественных микропроцессорах? Среди четырех основных микроархитектур две основные (x86 и ARM) российским разработчикам сейчас практически недоступны, но мы можем работать с открытой RISC-V и самобытной E2K (МЦСТ). В кремнии для RISC-V уже доступны самые разнообразные микроконтроллеры и процессоры, за исключением, пожалуй, самого высокопроизводительного сегмента. Отечественные RISC-V-ядра уже обрели достойное воплощение в кремнии и закрывают ниши различных микроконтроллеров. А новейшие CloudBEAR уже способны заменить ARM-решения на Cortex-A57/A72 и даже превосходят их по ряду параметров. На подходе – полноценный отечественный CPU для ПК на RISC-V. Узким местом в отечественной разработке пока остаются ядра 3D GPU, без которых свои замены процессоров для ПК мы пока создать не сможем.

Сторожилов Илья Владимирович, технический руководитель компании «Объединенные квантовые технолгии»:
Для оптимизации производственных процессов часто требуется высокая скорость вычислений матричных операций. Перенос вычислений с ЦП на GPU лишь частично может решить проблему, но в условиях санкций лучшим решением является реализация этих вычислений на FPGA. Многие NP-трудные задачи сводятся к типу QUBO – это логистика и т. п. целочисленные расчеты. Алгоритмы решения QUBO — это квантовые алгоритмы, квантово-вдохновленные алгоритмы (целочисленная симуляция на ЦП) и классические методы — все они сложны в аппаратной реализации. В мире есть два успешных аппаратных «решателя» QUBO – от Fujitsu и от Toshiba, они способны успешно конкурировать с мощными ЦП, но недоступны нам в текущих условиях. Мы организовали дистанционный доступ наших разработчиков к тестовой аппаратной лицензированной FPGA-платформе Kintex-7. При этом наша CloudOS позволяет осуществлять полный цикл разработки программно-аппаратного продукта, используя штатный режим дистанционной работы персонала. Нами получены первые результаты успешной реализации «решателей» на FPGA. В дальнейшем возможен переход на более оптимальную для данных задач FPGA-платформу. 

Кашканов Артём Олегович, ведущий инженер, YADRO:
Аппаратная трассировка помогает определить джиттеры и глитчи (временнЫе выпадения) для исполняемых вычислительных процессов, критичных для работы промышленной аппаратуры в реальном времени. Такая трассировка есть для процессоров Intel и Arm. Спецификации по трассировке вводятся и в стандарты RISC-V – E-Trace, N-Trace и др. Но даже драфта спецификаций пока нет и многое, особенно в E-Trace, отдается на собственные фантазии разработчиков конкретной платформы. N-Trace – более проработанная спецификация, которая уже включена во многие реальные проекты ядер на RISC-V, в том числе, отечественный CouldBEAR.

Кирюшкин Сергей Борисович, руководитель направления, ПАО СБЕРБАНК:
Сейчас на рынке суперкомпьютеров для ИИ доминируют проприетарные решения интерконнекта от Cray и Nvidia (InfiniBand, закрытый протокол от 2001 года, несвободный от ряда существенных недостатков). Новейший Ultra Ethernet призван разрушить эту монополию, предоставив инструмент высокоскоростного сетевого интерконнекта для широкого круга разработчиков суперкомпьютеров. В 2023 году был создан консорциум Ultra Ethernet и 11 июня 2025 года представлена спецификация версии 1.0.
Ultra Ethernet — это полный стек сетевых протоколов, от аппаратного и физического до программного. В нем серьезно улучшен механизм предотвращения перегрузок. Ultra Ethernet пока нельзя назвать технологической революцией, но можно назвать революцией культурной, впитавшей все лучшее от предшественников и конкурентов. В первой референсной сетевой карте Ultra Ethernet на 400Gbe от AMD стоит 14-ядерный ARM-процессор, чтобы «разгребать» все «тонкости» работы Ultra Ethernet.

Плотко Сергей Алексеевич, коммерческий директор АО «НПП «Цифровые решения»:
Сетевые балансировщики трафика нужны для распределения нагрузки на крупные информационные ресурсы и сервисы (Госуслуги, медицина, РЖД, авиабилеты и мн. др.), повышения масштабируемости и производительности этих решений. Наша аппаратная сетевая платформа DS Proxima построена на базе ПЛИС, не использует ЦП, что позволяет добиться производительности до 1 терабита. Реализация на ПЛИС — это максимальная надежность и максимальная производительность. И компактность — мы позволяем экономить десятки юнитов в стойках по сравнению с западными реализациями на процессорах (1U против 12U). Наш балансировщик DS Proxima способен успешно импортозамещать брендовые западные решения в схемах с кластеризацией. Схема кластера NGFW с балансировщиком позволяет эффективно создавать схемы с резервированием для повышения отказоустойчивости (отказоустойчивая балансировка кластера WAF). В планах на ближайшие годы — заменить ПЛИС на собственный чип для дальнейшего повышения производительности.

Шкляев Евгений Алексеевич, менеджер продукта, АО «НПП «Цифровые решения»:
Наше новое изделие — карта microSD на отечественном контроллере собственной разработки — предназначена для снижения технологических рисков. microSD – это один из ключевых компонентов современной аппаратуры IoT и использование зарубежных microSD сопряжено с рядом рисков. Наш новый накопитель «Оникс» со скоростью до 90 Мбайт/с на чтение и запись и рабочий диапазон температур от -40 до +85 градусов Цельсия имеет формат embedded SD и microSD. Емкость — до 2 Тбайт. Заказчики — для IoT, ПЛК, ИТ-шлюзов и т.п., рынок нами оценивается в 100 тыс. устройств в год. На перспективы — рынок систем учета ресурсов.
Сердцем «Оникс» служит наш собственный контроллер на базе ядра RISC-V от «Синтакор». Наш гибридный FTL не требует использования внешней SDRAM, обеспечивая высокую скорость случайной записи. Нами реализована система выравнивания износа и исключения поврежденных блоков. Около 10% объема флеши выделено для фоновой замены поврежденных блоков. Уже есть опытные образцы, в 2026 ожидаем embedded SD в формате eMMC, а в 2027-м появятся карты в формате microSD.

Медведев Алексей Владимирович, коммерческий директор, АТРОНИК:
В условиях санкционного давления современные NPU-процессоры с интегрированными ИИ-ускорителями из КНР вполне способны удовлетворить большинство запросов наших ИИ-разработчиков. В частности, ARM-процессоры от RockChip – RK3588 и RM1688. У стандартных модулей с этими процессорами есть удобная возможность широкого увеличения функционала, в том числе, установки сертифицированных в РФ криптографических модулей. Их уже успешно используют в бортовых компьютерах, БПЛА, робототехнике, «умном» видеонаблюдении, системах доступа и контроля объектов с предобработкой информации и мн. др.

Рыбкин Сергей Владимирович, начальник отдела управления проектами, ЭРЕМЕКС:
Базируясь на популярной экосистеме для контроллеров STMicroelectronics, мы разработали единую среду для разработки на широкой номенклатуре микроконтроллеров, включая известные российские чипы от «Миландра», «Микрона», НИИЭТ и популярные китайские продукты, включая клоны STM. Чтобы снять привязку к чипам STM, мы переработали экосистему с учетом обратной связи. Это позволило вовлечь много новых разработчиков. Для упрощения перехода на разные контроллеры мы стараемся унифицировать среду. Особую сложность представляет универсальный периферийный модуль (GPIO), где от вендора к вендору существует огромный разброс параметров и подходов. Мы вышли с инициативой к отечественным дизайн-центрам — на уровне альянса договориться делать стандартные интерфейсы для микроконтроллеров, что сильно ускорит распространение отечественных микроконтроллеров среди разработчиков.

Власов Александр Владимирович, руководитель лаборатории R&D, РТК-ЦОД:
Наша R&D-лаборатория занимается испытаниями серверов, HPC, СХД, S3, маршрутизаторов и балансировщиков нагрузки, систем виртуализации, средств ИБ, профильного программного обеспечения. Мы разрабатываем методики испытаний для каждого типа объектов. Переходим с оборудования из ушедших «недружественных» стран на «дружественное». Раньше работали даже с филиалом Intel в РФ по их заказам. Мы начинали с одной стойки и трёх сотрудников и сейчас это два датацентра, несколько десятков стоек и десятки сотрудников, часть работает удаленно. Мы завершили около 100 оформленных исследований за 5 лет. На наш регулярный экспертный клуб R&D мы приглашаем вендоров для обмена опытом, скоро его сделаем как открытый вебинар. Мы разработали «квадрант РТК-ЦОД» на смену ушедшего «квадранта Гартнера» для аналитики серверов. «Лаборатория как сервис»: мы корректируем дорожные карты производителей, помогаем производителям дорабатывать продукты и техдокументацию, проводим бета-тестирование оборудования и ПО заказчика. Мы ускоряем темп импортозамещения в электронной промышленности РФ и повышаем конкурентоспособность российских ИТ-решений, формируем доверие между производителями, заказчиками и регуляторами.

Дружинин Егор Александрович, технический директор РСК:
Для современных массивов GPU/AI-ускорителей очень актуальна проблема эффективного бесперебойного охлаждения: 4 ускорителя по 600 Вт собираются в хабы по 2,5 кВт и это всё очень сильно греется, часто перегревается и выгорает. Необходимо минимизировать потоки воздуха, идущие в обход основных радиаторов ускорителей. Для этого мы применили спрямляющие конструкции и исключаем утечки воздуха. Отказы вентиляторов — бич хабов (остальное — резервируемо). Как только 1 вентилятор «сыпется», падает от перегрева весь хаб! Мы запатентовали решение для устранения этого недостатка.
Тепловой поток на современных чипах около 100 Вт/кв.см — это сравнимо с тепловым потоком на поверхности Солнца! На перспективу потребуется охлаждение 3D-чиплетов с мощностью до 4 кВт. «Медь+вода» здесь уже не работает, есть быстрая деградация теплообменников. Мы начали использовать композитные материалы на алмазной SiC-керамике с химподготовленной водой и добились охлаждения объекта с тепловым пакетом до 400 Вт/кв.см. Результаты представим на «Микроэлектронике-2026»!

Литература

«Микроэлектроника-2025»: производители ЭКБ для ИИ предложат властям РФ меры по поддержке отрасли

Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *