Neurostream — новий чіп для глибокого навчання

Високопродуктивні обчислювальні системи вже знаходять застосування для пам'яті з високою пропускною здатністю (HBM) і технології Hybrid Memory Cube (HMC). В цьому напрямку активно ведуться розробки.

Вчені з Болонського університету наприкінці січня представили архітектуру для обчислень в пам'яті (PIM), здатну ефективно працювати з глибокими згортковими нейронними мережами. Вона отримала назву Neurostream.

/ фото Ryan McMinds CC

Дизайн базується на перспективний тип комп'ютерної оперативної пам'яті HMC (Hybrid Memory Cube), який в рамках проекту отримав назву Smart Memory Cube, або SMC. Рішення доповнюється багатоядерної PIM-платформою NeuroCluster.

NeuroCluster має модульний дизайн, заснований на сопроцессорах для обчислень з плаваючою точкою NeuroStream і RISC-V. Цікаво те, що тільки 8% кристалів HMC використовуються для досягнення продуктивності 240 гігафлопс при енергоспоживанні в 2,5 вата.

«Куби пам'яті» мають дуже малим енергоспоживанням, але здатні справлятися з завданнями для згорткових мереж, говорится в статті вчених з університету. — Це дозволяє вивільнити ресурси комп'ютерної логіки для обробки інший навантаження».

Невелике збільшення енергоспоживання системи і незначне зростання займаного простору при масштабуванні роблять цю PIM-систему затрато — і енергоефективної, яка може бути легко розширена до 955 гігафлопс при включенні чотирьох SMC.

Вчені порівняли можливості нового рішення з обчислювальними потужностями GPU Nvidia Tesla K40. Tesla K40 виявився здатний реалізувати 1092 гігафлопс при енергоспоживанні 235 ват. Технологія NeuroGrid досягла 955 гігафлопс при потужності 42,8 вата — енергоефективність в 4,8 рази вище, ніж у GPU.

Зображення: SMC-мережа та блок-схема одного з «кубів»

Більш того, творці Neurostream очікують, що енергоефективність може бути підвищено з допомогою програмних рішень, а також виконання арифметичних операцій зниженою точності. За запевненнями вчених, це може знизити енергоспоживання на 70%. Докладніше про рішення можна прочитати в статті співробітників Болонського університету.

Далі в своїй роботі дослідники планують вивчити можливості реалізації системи з чотирма блоками NeuroCluster, які будуть використовуватися для моніторингу процесу навчання мереж.

P. S. А ось про що ще ми пишемо в блозі нашого проекту 1cloud:

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.