FMA

У обчислювальній техніці, особливо в цифровій обробці сигналів поєднане множення-додавання (multiply-accumulate) — поширена операція, при якій множаться два числа і складаються з акумулятором.

Коли операція виконується над числами з рухомою комою, то може виконуватися подвійне округлення (типово для процесорів цифрових сигналів) або одноразове (додавання відбувається з більш точним внутрішнім поданням добутку). Версія з одноразовим округленням також називається fused multiply-add (FMA) або fused multiply-accumulate (FMAC).

Призначення

Дана інструкція дозволяє більш ефективно реалізувати операції ділення і добування квадратного кореня (при відсутності апаратної реалізації), множення векторів і матриць, обчислення поліномів за схемою Горнера.

Реалізація в процесорах

Операція включена в стандарт IEEE 754-2008. У стандарт 1999 для мови програмування Сі включена підтримка операції FMA (функція fma () з math.h).

Сучасні комп'ютери можуть мати спеціалізований блок множення-складання або MAC (multiply-accumulate), що складається з помножувача, який реалізує комбінаційну логіку, і суматора, а також акумулятор, в якому зберігається результат. Вихід акумулятора подається на один із входів суматора, і таким чином кожен такт результат з помножувача складається з акумулятором. Реалізація MAC вимагає додаткової логіки на кристалі, але обчислення відбуваються швидше, ніж при використанні методу зрушень і складань типового для перших комп'ютерів. FMA також працює з більш високою точністю .

З'явившись на сигнальних процесорах, операція (FMA) включена в системи команд процесорів: IBM POWER1 (1990), Fujitsu SPARC64 (1995), HP PA-8000 (1996), Sony Emotion Engine (1999), Intel Itanium (2001), IBM Cell (2005).

Також вона реалізована в процесорах AMD з підтримкою FMA4 (Bulldozer) і FMA3 (Trinity). Intel реалізувала FMA3 в процесорах на ядрі Haswell.

Технологія присутня в NVIDIA GPU серій GeForce 200 (GTX 200), GeForce 300 і NVIDIA Tesla GPGPU C1060 & C2050 / C2070. AMD додала FMA в лінію Radeon з серії HD 5000.

Інструкції FMA, реалізовані в процесорах Intel Sandy Bridge:

  • VFMADD
  • VFMSUB
  • VFNMADD
  • VFNMSUB
  • VFMADDSUB
  • VFMSUBADD

Джерела

    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.