Вопрос пропускной способности памяти среди разработчиков графических ускорителей всегда стоял очень остро, ведь от этого параметра напрямую зависит производительность вывода готовых кадров на экран монитора.
Можно иметь сколь угодно быстрые геометрические процессоры, располагать массивами шейдерных вычислителей, но если подсистема памяти работает медленно, то приемлемой частоты смены кадров добиться не удастся. И чем выше разрешение, тем выше требования к пропускной способности подсистемы видеопамяти. Сейчас активно продвигается стандарт 4K, что делает этот параметр ещё более важным.
Существующие типы графической памяти практически упёрлись в предел своих возможностей — эквивалентные частоты, на которых работают чипы GDDR5 уже превышают 7 ГГц, хотя ещё пару лет назад такая цифра казалась фантастической. Резервов практически нет и частоты в последнее время растут крайне медленно. Расширять до бесконечности шину доступа тоже нельзя: уже с 384-битной шиной печатные платы становятся излишне сложными, а 512-битная поднимает себестоимость таких PCB в заоблачные выси, от чего в итоге страдают и покупатели, недовольные ростом цен на мощные графические карты. AMD совместно с SK Hynix видит выход в использовании нового типа памяти под сложным названием HBM 3D Stacked Memory. На русский это можно приблизительно перевести как «широкополосная многослойная память».
Описать словами, как работает такая память, довольно сложно для неспециалиста, но на изображениях всё гораздо проще: это очередное воплощение идеи выхода изначально плоской кремниевой микроэлектроники в трёхмерное пространство. Несколько кристаллов DRAM особым образом укладываются друг на друга и соединяются в единую систему микроскопическими 3D-структурами u-Bump, которые продолжают собой сквозные соединения в кремниевой подложке. Поскольку нет нужды укладывать кристаллы рядом друг с другом, достигается огромная экономия площади, ведь блок DRAM может располагаться прямо над основным кристаллом GPU или рядом с ним, но на одной подложке (упаковка типа 2,5D). Но главное достоинство технологии HBM 3D не в этом.
Благодаря предельно простому логическому интерфейсу и близкому расположению кристаллов памяти к использующему их ресурсы вычислительному ядру удается значительно повысить как ширину условной шины доступа, так и экономичность. К примеру, одна сборка HBM имеет 1024 линии ввода-вывода с пропускной способностью 1 Гбит/с каждая, что в сумме уже даёт 128 Гбайт/с. И это для одной сборки, эквивалентной одному чипу GDDR5, причём речь идёт о первом поколении многослойной памяти. Во втором поколении SK Hynix обещает увеличить пропускную способность каждой линии до 2 Гбит/с, а также удвоить объём каждой четырёхкристальной сборки HBM. Даже по предварительным прикидкам минимальное превосходство в скорости перед GDDR5 может быть четырёхкратным, а новом поколении — и восьмикратным. Весьма впечатляюще.
На сегодняшний день официально подтверждено, что новые модели AMD Radeon будут использовать новый тип памяти, причём не только сверхмощный Radeon R9 390X, но и куда более доступный Radeon R9 380X на базе графического ядра Fiji. Пока не ясно, как именно будет реализована поддержка широкополосной многослойной памяти в новом семействе Radeon, хотя понятно, что располагаться сборки HBM 3D должны будут на одном субстрате с GPU, либо непосредственно над основным кристаллом. Сложность реализации, возможно, и является основной причиной задержки выпуска нового поколения Radeon. Вряд ли широкополосная многослойная память сразу полностью заменит GDDR5: технология ещё молода, а себестоимость чипов HBM 3D пока довольно высока. Какое-то время эти типы памяти будут мирно сосуществовать вместе, дополняя друг друга. Мы уверены в одном — обзор нового поколения AMD Radeon обещает быть очень интересным!
В заключение отметим, что над аналогичной технологией, помимо SK Hynix, работает и компания Micron. Она называет свои чипы HMC (Hybrid Memory Cube, гибридный куб памяти). Архитектурно это подвид HBM 3D, но уже в первом поколении сборки HMC демонстрируют внушительные 160 Гбайт/с. Samsung пока остаётся в стороне, но это может означать лишь более высокий уровень секретности. Этот полупроводниковый гигант просто не в состоянии обойти столь перспективную технологию стороной.