Финансирование проекта осуществляется компанией Т-Платформы
(2008 гг.)
Процессор Cell BE – микропроцессорная архитектура, совместно
разработанная Sony, Toshiba и IBM. Процессор Cell содержит одно основное
вычислительное ядро (Power Processor Element, PPE) и восемь вспомогательных
вычислительных ядер (Synergistic Processor Element, SPE). Основную
вычислительную мощность процессора Cell составляют SPE, каждый из которых
представляет собой специализированное векторное вычислительное ядро,
обрабатывающее SIMD-инструкции. Большинство арифметических инструкций на SPE
представляют данные в виде 128-разрядных векторов, разделённых на четыре
32-битных элемента. Каждый SPE оснащён 128 регистрами, разрядность которых –
128-бит. Вместо подсистемы кэшей SPE содержит 256 Kb собственной «локальной
памяти» (local store, далее LS), а также DMA-контроллер, который предназначен
для обмена данными между основной памятью (RAM) и локальной (LS), минуя PPE.
Пиковая производительность процессора Cell составляет порядка 200 Гфлопс.
С февраля 2008 г. в ННГУ по заказу компании Т-платформы
выполняется проект по адаптации пакета для решения задач молекулярной динамики
GROMACS под процессоры Cell.
В ходе работ по проекту получены следующие основные
результаты:
-
Изучена архитектура Cell BE и особенности программирования под нее. В том
числе подготовлен ряд примеров по сравнению производительности платформы Cell
и x86.
-
Изучена архитектура пакета GROMACS и структура его исходных текстов.
-
Выполнено профилирование GROMACS, определены точки оптимизации – функции
ядра kernelXYZ.
-
Разработана последовательность шагов по адаптации функций ядра GROMACS под
архитектуру Cell.
-
Разработана и реализована на примере отдельной функции схема, позволяющая
включать в библиотеку GROMACS код, предназначенный для исполнения на SPE.
-
Разработаны и реализованы на примере выделенных функций две принципиально
различные схемы адаптации функций ядра GROMACS под архитектуру Cell.
-
Разработанные схемы демонстрируют фактически одинаковую итоговую
производительность, в 3-3.5 раза превышающую производительность
неадаптированных версий.
Текущие результаты проекта были представлены на семинаре «Линейка решений
«Т-Платформы» на базе перспективного многоядерного процессора Cell» (июнь
2008).