SW26010
SW26010 - 260-ядерний процесор, спроектований китайським «Національним центром з проектування високопродуктивних інтегральних мікросхем» в Шанхаї[1]. У процесорі реалізована 64-бітова RISC-мікроархітектура ShenWei, розроблена в Китаї. SW26010 складається з 4 груп (званих кластерами) по 64 «обчислювально-процесорних елемента» (англ. compute-processing elements, CPE), розташованих у вигляді матриці 8 × 8 елементів. CPE виконують SIMD-інструкції і можуть виконувати за один цикл 8 операцій над числами з рухомою комою одинарної точності. Кожен кластер супроводжується більш традиційним ядром загального призначення, званим «керуючим процесорним елементом» (англ. management processing element, MPE), і забезпечує функції моніторингу та управління[1]. Кожен кластер має свій власний контролер пам'яті DDR3 SDRAM і банк пам'яті (англ. Memory bank) зі своїм власним адресним простором[2][3]. Процесор працює з тактовою частотою 1,45 ГГц[4].
Кожен CPE має внутрішню надоперативну пам'ять (англ. Scratchpad memory) розміром 64 Кб для даних і 16 КБ для інструкцій, які поєднуються за допомогою «мережі-на-кристалі» (англ. Network on a chip), замість традиційної ієрархії кеш-пам'яті (англ. Cache hierarchy)[5][6]. MPE має більш традиційну схему з 32 Кб кеш-пам'яті 1-го рівня для даних і інструкцій і 256 Кб кеш-пам'яті 2-го рівня[1]. Мережа-на-кристалі з'єднана з єдиним внутрішньосистемним інтерфейсом, який з'єднує мікросхему із зовнішнім світом.
SW26010 застосовуються в суперкомп'ютері Sunway TaihuLight, який з листопада 2016 по 8 червня 2018 року займав 1-е місце по продуктивності в рейтингу TOP500[7]. В Sunway TaihuLight використовується 40 960 процесорів SW26010, продуктивність в тесті LINPACK benchmarks досягає 93,01 PFLOPS.
Примітки
- Dongarra, Jack (20 червня 2016). Report on the Sunway TaihuLight System. www.netlib.org. Процитовано 20 червня 2016.
- Fu, H H; Liao, JF; Yang, J Z (2016). The Sunway TaihuLight Supercomputer: System and Applications. Sci. China Inf. Sci. doi:10.1007/s11432-016-5588-7. Процитовано 22 червня 2016.
- Trader, Tiffany (19 червня 2016). China Debuts 93-Petaflops ‘Sunway’ with Homegrown Processors. HPC Wire. Процитовано 21 червня 2016. «Each core of the CPE has a single floating point pipeline that can perform 8 flops per cycle per core (64-bit floating point arithmetic) and the MPE has a dual pipeline each of which can perform 8 flops per cycle per pipeline (64-bit floating point arithmetic)»
- Hemsoth, Nicole (20 червня 2016). A Look Inside China's Chart-Topping New Supercomputer. The Next Platform. Процитовано 20 червня 2016.
- Lendino, Jamie (20 червня 2016). Meet the new world’s fastest supercomputer: China’s TaihuLight. Extremetech. Процитовано 21 червня 2016. «The TOP500 report said that the chip also lacks any traditional L1-L2-L3 cache, and instead has 12KB of instruction cache and 64KB “local scratchpad” that works sort of like an L1 cache.»
- https://www.researchgate.net/profile/Yi_Chao_Wang/publication/311614249_Porting_and_Optimizing_GTC-P_on_TaihuLight_Supercomputer_with_Sunway_OpenACC/links/5850e4c708ae8f373819491e.pdf
- Top 500 The List: November 2016. TOP 500. 14 листопада 2016. Процитовано 26 листопада 2016.