Nvidia разрабатывает процессор с производительностью 10 терафлопс


Руководитель исследований Nvidia в общих чертах рассказал участникам всемирной конференции по высокопроизводительным компьютерным системам Supercomputing Conference 2010 о будущем графическом кристалле для суперкомпьютера.

Помимо Nvidia над созданием такой системы к 2018 г. работают еще три коллектива. Программа UHPC (Ubiquitous High Performance Computing – глобальные высокопроизводительные вычисления) финансируется Департаментом обороны США,

Моделируемая система Nvidia под названием Echelon пока только существует на бумаге, поэтому она, скорее всего, радикально изменится к моменту своего практического воплощения. В создании компонентов будущей системы используются решения, уже реализованные в кристаллах широкой номенклатуры продукции компании, начиная от графических процессоров для переносных устройств до процессоров с высокой производительностью.

«Характеристики существующих процессоров можно использовать в системах большего масштаба, – считает Билл Дэлли (Bill Dally), руководитель проекта Echelon. – Стремясь добиться оптимального соотношения производительности к потребляемой мощности для компонентов моделируемой системы, мы используем уже найденные решения для процессоров Tegra или Tesla».

Ядро графического процессора, совершающего операции с плавающей точкой, будет потреблять всего 10 пкДж, что на 200 пкДж меньше, чем у ныне существующих кристаллов Fermi компании Nvidia. Восемь таких ядер составят единый потоковый мультипроцессор (ПМ), а 128 ПМ объединятся в один кристалл.

В результате будет создан графический кристалл с тысячами ядер, причем каждое из них будет обрабатывать четыре операции с плавающей точкой двойной точности, что эквивалентно производительности 10 терафлопс на кристалл. В процессоре Echelon будет в два раза больше ядер, чем в современных высокопроизводительных графических процессорах Nvidia. При этом современные ядра совершают всего лишь одну операцию с плавающей точкой двойной точности за цикл.

Преимущества новых кристаллов будут реализованы также за счет памяти. Процессор Echelon будет использовать 256 Мбайт динамически конфигурируемой памяти SRAM. Ее можно будет разбить на шесть уровней кэша переменного размера. На самом нижнем уровне у каждого ядра будет собственный кэш.

Перед исследователями стоит задача оптимизировать перемещение данных по кристаллу, чтобы сократить энергопотребление. Процессоры будут предоставлять результаты выполнения определенной задачи другим узлам.

Для облегчения программирования в многопроцессорной системе будет реализовано взаимное соответствие содержимого кэшей графического и центрального процессоров. На самом деле, программирование многопроцессорной системы является одной из главных трудностей при ее создании.

По мнению Дэлли, необходима эволюция программно-аппаратной архитектуры CUDA, разработанной компанией Nvidia. Можно воспользоваться и языком вычислений OpenCL, интерфейсами прикладного программирования OpenMP и DirectCompute или совершенно новым языком.

Система Echelon компании Nvidia конкурирует с разработками компания Intel, MIT и Sandia National Labs, каждая из которых применяет собственные методы построения эффективных суперкомпьютерных систем.

Программа UHPC финансируется исследовательским центром Министерства обороны США (DARPA). В соответствии с планом исследований, к 2014 г. должна будет создана модель вычислительной системы класса «петафлопс» в стоечном исполнении. Такие системы будут использоваться в качестве строительных блоков для создания суперкомпьютеров, которые появятся в 2018 г.

 

Источник: EETimes

Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *