Kepler (мікроархітектура)

Kepler — це мікроархітектура компанії NVIDIA, яка створена для високопродуктивних обчислень з акцентом на енергоефективності.

Графічні процесори GeForce
Логотип бренду GeForce, під яким випускаються відеокарти на базі Kepler
Створено {{{created}}}

Опис

Спрямованість попередньої архітектури Fermi була продуктивність, а Kepler розрахований на енергоефективність, програмованість та продуктивність.

Енергоефективність досягнута за рахунок використання уніфікованої тактової частоти (шейдерні блоки працюють на одній частоті з ядром). Відмова від моделі з незалежною частотою шейдерних блоків, яка використовувалася в попередніх GPU NVIDIA, дозволяє знизити енергоспоживання навіть при тому, що для досягнення продуктивності на рівні попередніх розробок, потрібно використовувати більшу кількість шейдерних ядер. Зменшення енергоспоживання відбувається не тільки від того, що нова архітектура більш енергоефективна, ніж архітектура попереднього покоління (два шейдерних ядра Kepler використовують близько 90% живлення, необхідного одному ядру Fermi), але й тому, що уніфікація тактової частоти призводить до зниження частоти шейдерних блоків, що в свою чергу серйозно знижує енергоспоживання

Покращена програмованість досягнута за рахунок введення нової моделі обробки текстур, яка не вимагає прив'язки до CPU.

Покращення продуктивності досягнуто за рахунок впровадження абсолютно нових контролера пам'яті та шини. У свою чергу це дозволило підняти тактову частоту пам'яті до 6 ГГц, що все ще нижче, ніж теоретично максимальні для GDDR5 7 ГГц, але значно більше, ніж частота пам'яті в 4 ГГц при архітектурі попереднього покоління

Особливості

  • Інтерфейс PCI Express 3.0
  • DisplayPort 1.2
  • HDMI 1.4a 4K x 2K
  • Purevideo VP5
  • Підтримка до 4 -х незалежних 2D дисплеїв, або 3 стереоскопічних / 3D дисплеїв
  • Next Generation Streaming Multiprocessor (SMX)
  • GPU Boost
  • Підтримка TXAA
  • Динамічний паралелізм
  • Hyper-Q
  • NVIDIA GPUDirect (тільки для Tesla)

Архітектура Next Generation Streaming Multiprocessor (SMX)

Архітектура Kepler використовує нову потокову мультипроцесорну архітектуру під назвою «SMX». SMX є причиною енергетичної ефективності Kepler, оскільки весь графічний процесор використовує єдину уніфіковану тактову частоту. Таке використання дозволяє ядрам CUDA споживати на 90% менше енергії, ніж CUDA ядра архітектури Fermi.

GPU Boost

GPU Boost є новою функцією, яка приблизно аналогічна турбо розгону центрального процесора. Частота, при якій графічний процесор завжди гарантовано працює, називається базовою частотою. Ця тактова частота встановлена на рівні, який гарантуватиме, що графічний процесор залишається в межах специфікації TDP, навіть при максимальних навантаженнях.

Підтримка Microsoft Direct3D

Графічні процесори NVIDIA Fermi і Kepler з серії GeForce 600 підтримують специфікацію Direct3D 11.0.

Підтримка Microsoft DirectX

Графічні процесори серії GeForce 600/700 підтримують DirectX 12. NVIDIA буде підтримувати DX12 API на всіх графічних процесорах, які підтримують Directx11. Вони належать до сімейств архітектур Kepler, Maxwell та Fermi.

Підтримка TXAA

Ексклюзивом архітектури Kepler є TXAA — новий метод згладжування від Nvidia, який призначений для безпосереднього застосування в ігрових рушіях. TXAA заснований на MSAA. Він призначений для вирішення ключової проблеми в іграх, відомої як мерехтливе або тимчасове накладення.

Динамічний паралелізм

Динамічний паралелізм можливий для ядра, щоб мати можливість направляти інші ядра. В архітектурі Fermi тільки процесор може направляти ядро, яке бере на себе певну кількість накладних витрат через необхідність взаємодіяти з процесором.

Grid Management Unit

Включення динамічного паралелізму вимагає нового управління сіткою та системи диспетчерського управління. Grid Management Unit управляє пріоритетом сітки, яка повинна виконуватися. Grid Management Unit може призупинити відправлення нових мереж і черги в очікуванні, поки вони не готові виконуватись, забезпечуючи гнучкість та потужність автономної роботи.

NVIDIA GPUDirect

Технологія NVIDIA GPUDirect забезпечує більш швидку передачу даних між GPU і іншими пристроями на шині PCIe, знімаючи непотрібне навантаження з CPU. GPUDirect v1.0 дозволяє драйверам пристроїв сторонніх виробників (наприклад, для адаптерів InfiniBand) працювати безпосередньо з драйвером CUDA, уникаючи копіювання даних на CPU. GPUDirect v2.0 забезпечує peer-to-peer (P2P) з'єднання між графічними процесорами в одній системі, уникаючи додаткових витрат ресурсів процесора.

Під торговою маркою GeForce

МодельGeForce GTGeForce GTGeForce GTGeForce GTXGeForce GTXGeForce GTXGeForce GTXGeForce GTX 660GeForce GTXGeForce GTXGeForce GTXGeForce GTX 770GeForce GTXGeForce GTXGeForce GTX[1]GeForce GTX780 Ti
Технологічний процес28 nm
Код чипуGK107GK106GK1042× GK104GK110
Розмір чипу118mm²221mm²294mm²2× 294mm²569mm²
Транзисторів1,3 G2.54 G3.54 G7,1 G
Частота 3D797 MHz900 MHz950 MHz1058 MHz928 MHz980 MHz823 MHz915 MHz10061045 MHz915 MHz863 MHz837 MHz875 MHz
Частота TurboН/ДН/ДН/ДН/ДН/Д1032 MHz888 MHZ980 MHz1006 MHz1058 MHz1084 MHz1019 MHZ902 MHz876 MHz928 MHz
Частота TDP HeadroomН/ДН/ДН/ДН/ДН/Д1110 MHz927 MHz1136 MHz1084 MHz1123 MHz1136 MHz1071 MHz1006 MHz1020 MHz
Максимальна температура з Turbo94 °C94 °C80 °C80 °C80 °C80 °C
Блоків ROP1624322× 3248
Блоків TMU326480961121282× 128192224240
Кількість ядер Cuda3847689601152134415362× 1536230426882880
Кількість FP32320640800912106412162× 1216182413442280
Кількість FP644856642× 6496896120
Кількість SFU641281601922242562× 256384448480
Кількість GPC12342× 45
Кількість SMX2456782× 8121415
TDP50 Watts65 Watts75 Watts65 Watts85 Watts130 Watts140 Watts130 Watts150 Watts170 Watts195 Watts230 Watts300 Watts250 Watts250 Watts250 Watts
Тип пам'ятіDDR3GDDR5
Можливе навантаження1/2 Go1 Go1/2 Go1 Go1/2 Go2 Go1,5/3 Go2/3 Go2/4 Go3 Go6 Go3 Go
Тактова частота пам'яті1782 MHz1250 MHz1350 MHz1500 MHz14501500 MHz1750 MHz1500 MHz1750 MHz
Ширина шини пам'яті128 bits192 bits256 bits384 bits
Пропускна здатність пам'яті28,5 Go/s80 Go/s86,4 Go/s144,2 Go/s134 Go/s144,2192,3 Go/s209 Go/s250 Go/s268 Go/s
Фільтрація пікселів12,814,415,216,914,823,519,821,929,332,22× 29,327,633,542,0 Gpixels/s
TurboН/ДН/ДН/ДН/ДН/Д26,622,327,334,735,92× 34,340,240,244,54 Gpixels/s
Фільтрація текстур25,528,830,433,959,462,778,479102,5128,82× 117,1166187,5210,0 Gtexels/s
TurboН/ДН/ДН/ДН/ДН/Д7188,889127,2121,4143,7193225,3222,72 Gtexels/s
Геометрична фільтрація797 Mtriangles/s900 Mtriangles/s950 Mtriangles/s1058 Mtriangles/s1856 Mtriangles/s1960 Mtriangles/s2450 Mtriangles/s2469 Mtriangles/s3203 Mtriangles/s4024 Mtriangles/s2× 3660 Mtriangles/s5178 Mtriangles/s5859 Mtriangles/s5250 Mtriangles/s
TurboН/ДН/ДН/ДН/ДН/Д2220 Mtriangles/s2775 Mtriangles/s2781 Mtriangles/s3976 Mtriangles/s3794 Mtriangles/s4492 Mtriangles/s2× 4284 Mtriangles/s6036 Mtriangles/s7042 Mtriangles/s5555 Mtriangles/s
Розрахунок з одинарною точністю612,1691,2 Gflo/s729,6 Gflo/s812,51425,41505,3 Gflo/s1881,61896,22459,5 Gflo/s3090,42× 2810,93977 Gflo/s4500 Gflo/s ?
TurboН/ДН/ДН/ДН/ДН/Д1704,92131,22135,83053,62913,83449,92× 3290,146365408,35040 Gflo/s
Розрахунок з подвійною точністю25,7 Gflo/s28,8 Gflop/s30,4 Gflop/s33,9 Gflop/s59,4 Gflop/s62,7 Gflop/s78,4 Gflop/s79 Gflop/s102,5 Gflop/s128,8 Gflop/s2× 117,1 Gflop/s166 Gflo/s1499,9 Gflop/s ?
TurboН/ДН/ДН/ДН/ДН/Д7188,889127,2121,4143,71931523210 Gflo/s
Поточна ціна (Квітень 2013)45€79€99€119€169€179€185€255€340€450€840€650€980€700€

Під торговою маркою Quadro

МодельQuadro 410Quadro K600Quadro K2000Quadro K4000Quadro K5000Quadro K6000Quadro K7000
Технологічний процес28 nm
ЧипGK107GK106GK104GK110
Розмір чипу118mm²221mm²294mm²550mm²
Транзисторів1.27 G2.54 G3.54 milliards7.10 G
Частота GPU706 MHz876 MHz954 MHz811 MHz705 MHz735 MHz
Потоки процесорів192192384768153624962688
Кількість блоків TMU163264128208224
Кількість блоків ROP81624324048
Кількість блоків SMX12481415
Кількість GPC1245
TDP38 Watts41 Watts51 Watts80 Watts122 Watts225 Watts250 Watts
Тип пам'ятіDDR3GDDR5
Пам'ять512 Mo1 Go2 Go3 Go4 Go5 Go6 Go
Частота пам'яті891 MHz1000 MHz1404 MHz1350 MHz1300 MHz1300 MHz
Ширина шини64 Bits128 Bits192 Bits256 Bits320 Bits384 Bits
Ширина смуги13,3 Go/s26,5 Go/s59,6 Go/s125,5 Go/s160,9 Go/s193,7 Go/s232,5 Go/s
Фільтрація пікселів5,6 Gpixels/s14 Gpixels/s15,3 Gpixels/s19,5 Gpixels/s22,6 Gpixels/s28,2 Gpixels/s35,3 Gpixels/s
Фільтрація текстур11,3 Gtexels/s14 Gtexels/s30,5 Gtexels/s51,9 Gtexels/s90,2 Gtexels/s146,6 Gtexels/s164,6 Gtexels/s
Геометрична фільтрація706 Mtriangles/s876 Mtriangles/s954 Mtriangles/s1622 Mtriangles/s2820 Mtriangles/s4935 MTr/s5513 Mtriangles/s
Розрахунок з одинарною точністю271,1 Gflo/s336,4 Gflo/s732,7 GFLOP/s1245,7 Gflo/s1082,9 GFLOP/s3519,4 Gflo/s3951,4 Gflo/s
Розрахунок з подвійною точністю11,3 Gflo/s14 Gflo/s30,5 Gflo/s51,9 Gflo/s90,2 Gflo/s1173,1 Gflo/s1317,1 Gflo/s
Дата випуску7 серпня 20121 березня 20131 березня 20131 березня 201317 серпня 20121 червня 2013— 2013

Чипи Kepler

  • GK104
  • GK106
  • GK107
  • GK110
  • GK208
  • Tegra K1 включає Kepler IGP

Примітки

  1. Chris Angelini (19 février 2013). GeForce GTX Titan : le vrai Kepler haut de gamme. Tom's Hardware. Архів оригіналу за 23 лютого 2013. Процитовано 20 février 2013. Проігноровано невідомий параметр |brisé le= (довідка)

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.