Річард Саттон
Річард С. Саттон — канадський науковець з інформатики. Він є видатним науковим дослідником у DeepMind і професором інформатики в Університеті Альберти. Саттон вважається одним із засновників сучасного обчислювального навчання з підкріпленням,[2] завдяки значному внеску у цю сферу, включаючи метод часових різниць і методи градієнта стратегії.
Річард Саттон | |
---|---|
| |
Народився |
20 століття Огайо, США |
Місце проживання | Канада |
Країна | Канада |
Діяльність | інформатик, інженер, artificial intelligence researcher |
Alma mater | Массачусетський університет в Амгерстіd і Стенфордський університет |
Галузь | навчання з підкріпленням |
Заклад | Альбертський університет |
Науковий керівник | Ендрю Барто |
Аспіранти, докторанти | Doina Precupd[1] і Девід Сілвер (інформатик)d |
Членство | Асоціація з розвитку штучного інтелекту |
Відомий завдяки: | Метод часових різниць, Dyna, Options, GQ(λ) |
Нагороди |
AAAI Fellowd |
Особ. сторінка | incompleteideas.net |
Життя і освіта
Річард Саттон народився в Огайо та виріс в Оук-Бруку, штат Іллінойс, передмісті Чикаго.
Саттон отримав ступінь бакалавра з психології в Стенфордському університеті в 1978 році, перш ніж отримати ступінь магістра (1980) та доктора філософії (1984) з інформатики в Массачусетському університеті в Амгерсті під керівництвом Ендрю Барто. Його докторська дисертація «Тимчасове призначення кредиту в навчанні з підкріпленням» (англ. Temporal Credit Assignment in Reinforcement Learning) представила архітектуру критики діяча та тимчасове призначення кредиту.[3]
Кар'єра
У 1984 році Саттон був постдокторантом Массачусетського університету.
З 1985 по 1994 рік він був головним технічним співробітником Лабораторії Комп'ютерних та Інтелектуальних Систем GTE в Уолтемі, штат Массачусетс. У 1995 році він повернувся до Массачусетського університету в ролі старшого наукового співробітника.
З 1998 по 2002 рік Саттон працював у Шеннонській лабораторії AT&T у Флохем-Парку, штат Нью-Джерсі, як головний технічний співробітник відділу штучного інтелекту.
З 2003 року він є професором обчислювальної науки в університеті Альберти. Він очолював місцеву Лабораторію Навчання з підкріпленням та Штучного Інтелекту до 2018 року.
Зберігаючи свою професорську посаду, у червні 2017 року Саттон приєднався до компанії DeepMind як видатний вчений-дослідник і співзасновник її нового офісу в Едмонтоні.[3][4]
Саттон став громадянином Канади в 2015 році і відмовився від громадянства США в 2017 році.
Обрані публікації (англ. мовою)
- Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction. MIT Press, 1998. Also translated into Japanese and Russian. Second edition MIT Press 2018.
- Miller, W. T., Sutton, R. S., Werbos, P. J. (Eds.), Neural Networks for Control. MIT Press, 1991.
- Sutton, R. S. (Ed.), Reinforcement Learning. Reprinting of a special issue of Machine Learning Journal. Kluwer Academic Press, 1992
Нагороди та відзнаки
Саттон є членом Асоціації з Розвитку Штучного Інтелекту (AAAI) з 2001 року.[5] У 2003 році він отримав премію Президента від Міжнародного Суспільства Нейронних Мереж (англ. The International Neural Network Society),[6] а в 2013 році — премію за видатні досягнення в галузі досліджень від університету Массачусетса в Амгерсті.[7]
Номінація Саттона як члена AAAI звучить так:[5]
За значний внесок у велику кількість тем з машинного навчання, зокрема навчання з підкріпленням, методи часових різниць та нейронні мережі.
У 2021 році Саттон був обраний членом Королівського товариства.[8]
Примітки
- Математична генеалогія — 1997.
- Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. 11 січня 2018. Архів оригіналу за 11 січня 2018. Процитовано 17 грудня 2018.
- Brief Biography for Richard Sutton. incompleteideas.net. Процитовано 17 грудня 2018.
- DeepMind expands to Canada with new research office in Edmonton, Alberta. DeepMind. Процитовано 17 грудня 2018.
- Elected AAAI Fellows. www.aaai.org. Процитовано 17 грудня 2018.
- INNS Award Recipients. www.inns.org. Процитовано 17 грудня 2018.
- Outstanding Achievement and Advocacy Award Recipients. College of Information and Computer Sciences, University of Massachusetts Amherst (англ.). 5 жовтня 2010. Процитовано 17 грудня 2018.
- Royal Society elects outstanding new Fellows and Foreign Members. royalsociety.org. Процитовано 8 червня 2021.