Тензорний скетч

Тензорний скетч (англ. tensor sketch) — метод зменшення розмірності, що використовується у статистиці, машинному навчанні та алгоритмах обробки великих даних[1][2]. Він особливо ефективний стосовно векторів з тензорною структурою. Тензорний скетч може бути використаний для прискорення білінійного поєднання в нейронних мережах і застосовується у багатьох алгоритмах чисельної лінійної алгебри[3].

Історія

Термін тензорний скетч (ескіз) був придуманий у 2013 році[4] й описаний як метод того ж року Расмусом Пегом[5].

Спочатку відповідний метод спирався на використання швидкого перетворення Фур'є, щоб зробити швидку згортку. Пізніші науково-дослідні роботи узагальнили його до значно більшого класу методів зменшення розмірності за допомогою випадкових тензорних проєкцій.

Тензорні проєкції

В основі одного з ефективних варіантів тензорного скетча лежить використання торцевого добутку матриць, запропонованого Слюсарем В. І.[6] в 1996 р. (англ. face-splitting product)[7][8][9][10][11].

Торцевий добуток двох матриць з однаковою кількістю рядків та позначається [7][8][9][12] і має вид:

Тензорний скетч може використовуватися для зменшення кількості змінних, необхідних для реалізації білінійного пулінгу в нейронній мережі

Доцільність використання цього добутку полягає у його властивості:

де  — поелементний добуток Адамара.

На цій основі довільний тензорний скетч виду можливо подати як , де матриці та мають менший розмір, і . Оскільки операції матрично-векторних добутків і обчислюються за лінійним часом та відповідно, перехід до представлення дозволяє виконати множення на вектори тензорної структури набагато швидше, чим формується вихідний вираз , а саме за час .

Для тензорів більш високого порядку, наприклад, , економія буде ще більш значною.

Подібне перетворення задовольняє лемі Джонсона-Лінденштрауса про малі викривлення вихідних даних великої розмірності.

Див. також

Примітки

  1. Low-rank Tucker decomposition of large tensors using: Tensor Sketch. amath.colorado.edu. Boulder, Colorado: University of Colorado Boulder.
  2. Ahle, Thomas; Knudsen, Jakob (3 вересня 2019). Almost Optimal Tensor Sketch. Researchgate. Процитовано 11 липня 2020.
  3. Woodruff, David P. «Sketching as a Tool for Numerical Linear Algebra.» Theoretical Computer Science 10.1-2 (2014): 1–157.
  4. Ninh, Pham; Rasmus, Pagh (2013). Fast and scalable polynomial kernels via explicit feature maps SIGKDD international conference on Knowledge discovery and data mining. Association for Computing Machinery. doi:10.1145/2487575.2487591.
  5. Rasmus, Pagh (2013). Compressed matrix multiplication. ACM Transactions on Computation Theory, August 2013 Article No.: 9 (Association for Computing Machinery). doi:10.1145/2493252.2493254.
  6. Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics — Theory and Methods, 38:19, P. 3501
  7. Slyusar, V. I. (27 грудня 1996). End products in matrices in radar applications.. Radioelectronics and Communications Systems.– 1998, Vol. 41; Number 3: 50–53.
  8. Slyusar, V. I. Analytical model of the digital antenna array on a basis of face-splitting matrix products // Proc. ICATT- 97, Kyiv : journal. — 1997.  20 May. — С. 108—109.
  9. Slyusar, V. I. A Family of Face Products of Matrices and its Properties // Cybernetics and Systems Analysis C/C of Kibernetika I Sistemnyi Analiz : journal. — 1999. — Vol. 35,  3. — С. 379—384. DOI:10.1007/BF02733426.
  10. Slyusar, V. I. Generalized face-products of matrices in models of digital antenna arrays with nonidentical channels // Radioelectronics and Communications Systems : journal. — 2003. — Vol. 46,  10. — С. 9—17.
  11. Миночкин А.И., Рудаков В.И., Слюсар В.И. (2012). Основы военно-технических исследований. Теория и приложения. Том. 2. Синтез средств информационного обеспечения вооружения и военной техники//Под ред. А.П. Ковтуненко. - Киев: «Гранмна». – 2012. с. C. 7 – 98; 354 – 521.
  12. Slyusar, V. I. (15 вересня 1997). New operations of matrices product for applications of radars. Proc. Direct and Inverse Problems of Electromagnetic and Acoustic Wave Theory (DIPED-97), Lviv.: 73–74.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.