Новое поколение графических процессоров (GPU) для мобильных устройств

Компания Imagination Technologies (IT) раскрыла подробности о выходе двух новых GPU IP ядер, которые, как ожидается, вознесут графическую производительность в мобильных устройствах на новые высоты на радость компаниям-производителям Apple, TI, Samsung и других, которые используют низкопотребляющие графические ядра.

"То, о чем мы сейчас говорим – прирост производительности вычислений в масштабе гигафлопс, при энергопотреблении в сотнях милливатт" — рассказал управляющий менеджер Imagination Technologies Тони Кинг-Смит (Tony King-Smith).

Первыми представителями линейки PowerVR Series 6 GPU IP ядер, которые были анонсированы в ходе завершившейся недавно конференции CES, стали графические процессоры PowerVR G6200 и G6400 для мобильных устройств, построенные на новой архитектуре, разработанной в Imagination Technologies, и названной "Rogue". Строго говоря, Rogue не является новой в смысле "с нуля". Как заметили представители разработчика, это скорее эволюция, но содержащая в себе множество новых особенностей.

Теперь говорят о «сдвиге в диалогах» о GPU IP ядрах, с традиционной оценки того, сколько полигонов может обработать тот или иной GPU к тому, как вычислительная мощность графических процессоров сможет помогать поддерживать уровень производительность CPU в гетерогенных системах CPU/GPU.

«Архитектура, которую мы предлагаем, состоит из кластеров, в которых массивы вычислительных элементов работают вместе» — говорит PR директор IT Дэвид Гарольд (David Harold). Графический процессор G6200 состоит из двух вычислительных кластеров, а G6400 — из четырёх.

"Внутри ядра Rogue core, комментирует Кинг-Смит, находится два или четыре кластера исполнительных элементов, а каждый исполнительный кластер представляет собой массив исполнительных юнитов. Таким образом, мы строим многослойную иерархию".

В предыдущей серии PowerVR SGX Series 5 GPU IP ядер, моделью архитектуры служили потоки, которые являлись проводником данных по процессу обработки. "Здесь же", продолжает специалист, "мы говорим об основных элементах более низкого уровня, и вместо отдельного потока прохождения данных теперь используются исполнительные кластеры. Получается как бы массив потоков в качестве строительной основы архитектуры".

Большое преимущество Series 6 GPU в том, что там реализованы реальные параллельные процессоры, а не просто параллельные потоки.

"Вот почему мы хотим отобрать часть вычислений у CPU. Если вы совершаете что-то вычислительно интенсивное, этим занимается GPU, а не CPU, потому что мощность – удельная вычислительная производительность на миллиметр площади кристалла и на каждый милливатт – очень разная", — объясняет Кинг-Смит.

Есть, конечно, некие компромиссы в кодировании, на которые нужно пойти, чтобы стало возможно использовать эту мощность. Невозможно просто взять C код и отправить на обработку в GPU. Сейчас происходит диалог производителей и программистов, которые говорят — «у нас есть инструменты, анализирующие C код, и идентифицируют степень его параллелизма». Но эксперты IT говорят, что такой подход не годится. Ведь большая часть кода в CPU так и остается в форме C, за исключением особенно сложных для обработки фрагментов. Если проводить оптимизацию непосредственно в CPU, то очень быстро можно будет увидеть — мощность будет просто пропадать «в-никуда». Вместо этого, разработчики программ должны использовать OpenCL API (интерфейс для разработки ПО) для отгрузки параллельных процессов в GPU. Компания Imagination Technologies уже разработала полный набор OpenCL драйверов.

Ну и насколько же хороша производительность этих кластерных чипов? Более чем хороша, заявляет производитель. "Когда мы говорим о ядрах на архитектуре Rogue, в частности о нашей Series 6, то мы говорим о производительности порядка от 100 гигафлопс и до масштабов, измеряемых терафлопсами, по мере увеличения числа ядер на чипе", — рассказывает Гарольд. Кинг-Смит комментирует, что производительность в несколько сотен гигафлопс вполне может быть достигнута в условиях энергопотребления на уровне мобильных устройств.

Особенно драматично звучат слова релиза IT, которые гласят: "20-кратное и более увеличение производительности относительно сегодняшнего поколения GPU ядер, направленное на рынок мобильных устройств . Что стало возможным, благодаря этому, в 5 раз более эффективной по сравнению с существующими архитектурами". Однако перед инновациями подобного масштаба непременно ещё встанет множество вопросов на пути к применению.

Просмотры: (2932)

Добавить комментарий