Річард Саттон

Річард С. Саттон — канадський науковець з інформатики. Він є видатним науковим дослідником у DeepMind і професором інформатики в Університеті Альберти. Саттон вважається одним із засновників сучасного обчислювального навчання з підкріпленням,[2] завдяки значному внеску у цю сферу, включаючи метод часових різниць і методи градієнта стратегії.

Річард Саттон
Народився 20 століття
Огайо, США
Місце проживання Канада
Країна  Канада
Діяльність інформатик, інженер, artificial intelligence researcher
Alma mater Массачусетський університет в Амгерстіd і Стенфордський університет
Галузь навчання з підкріпленням
Заклад Альбертський університет
Науковий керівник Ендрю Барто
Аспіранти, докторанти Doina Precupd[1] і Девід Сілвер (інформатик)d
Членство Асоціація з розвитку штучного інтелекту
Відомий завдяки: Метод часових різниць, Dyna, Options, GQ(λ)
Нагороди

AAAI Fellowd

Особ. сторінка incompleteideas.net

Життя і освіта

Річард Саттон народився в Огайо та виріс в Оук-Бруку, штат Іллінойс, передмісті Чикаго.

Саттон отримав ступінь бакалавра з психології в Стенфордському університеті в 1978 році, перш ніж отримати ступінь магістра (1980) та доктора філософії (1984) з інформатики в Массачусетському університеті в Амгерсті під керівництвом Ендрю Барто. Його докторська дисертація «Тимчасове призначення кредиту в навчанні з підкріпленням» (англ. Temporal Credit Assignment in Reinforcement Learning) представила архітектуру критики діяча та тимчасове призначення кредиту.[3]

Кар'єра

У 1984 році Саттон був постдокторантом Массачусетського університету.

З 1985 по 1994 рік він був головним технічним співробітником Лабораторії Комп'ютерних та Інтелектуальних Систем GTE в Уолтемі, штат Массачусетс. У 1995 році він повернувся до Массачусетського університету в ролі старшого наукового співробітника.

З 1998 по 2002 рік Саттон працював у Шеннонській лабораторії AT&T у Флохем-Парку, штат Нью-Джерсі, як головний технічний співробітник відділу штучного інтелекту.

З 2003 року він є професором обчислювальної науки в університеті Альберти. Він очолював місцеву Лабораторію Навчання з підкріпленням та Штучного Інтелекту до 2018 року.

Зберігаючи свою професорську посаду, у червні 2017 року Саттон приєднався до компанії DeepMind як видатний вчений-дослідник і співзасновник її нового офісу в Едмонтоні.[3][4]

Саттон став громадянином Канади в 2015 році і відмовився від громадянства США в 2017 році.

Обрані публікації (англ. мовою)

Нагороди та відзнаки

Саттон є членом Асоціації з Розвитку Штучного Інтелекту (AAAI) з 2001 року.[5] У 2003 році він отримав премію Президента від Міжнародного Суспільства Нейронних Мереж (англ. The International Neural Network Society),[6] а в 2013 році — премію за видатні досягнення в галузі досліджень від університету Массачусетса в Амгерсті.[7]

Номінація Саттона як члена AAAI звучить так:[5]

За значний внесок у велику кількість тем з машинного навчання, зокрема навчання з підкріпленням, методи часових різниць та нейронні мережі.

У 2021 році Саттон був обраний членом Королівського товариства.[8]

Примітки

  1. Математична генеалогія — 1997.
  2. Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. 11 січня 2018. Архів оригіналу за 11 січня 2018. Процитовано 17 грудня 2018.
  3. Brief Biography for Richard Sutton. incompleteideas.net. Процитовано 17 грудня 2018.
  4. DeepMind expands to Canada with new research office in Edmonton, Alberta. DeepMind. Процитовано 17 грудня 2018.
  5. Elected AAAI Fellows. www.aaai.org. Процитовано 17 грудня 2018.
  6. INNS Award Recipients. www.inns.org. Процитовано 17 грудня 2018.
  7. Outstanding Achievement and Advocacy Award Recipients. College of Information and Computer Sciences, University of Massachusetts Amherst (англ.). 5 жовтня 2010. Процитовано 17 грудня 2018.
  8. Royal Society elects outstanding new Fellows and Foreign Members. royalsociety.org. Процитовано 8 червня 2021.

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.