撰文:郭雪
突破技術
強化學習(Reinforcement Learning,RL)是一種人工智慧方法,能使計算機在沒有明確指導的情況下像人一樣自主學習。
重要意義
假如機器不能自主透過環境經驗磨鍊技能,自動駕駛汽車以及其他自動化領域的進展速度將受到極大的限制。
技術成熟期
1~2年
主要研究者
-Deep Mind -科大訊飛
-Mobileye -阿里巴巴
-Open AI -微軟亞洲研究院
-Google -中科院
-Uber-百度
2016年3月9日,韓國首爾的一場棋賽反響空前。從棋迷到學者,再到普通百姓,那幾日的工作之餘不知有多少人的計算機螢幕上都留了小窗,關注著這場比賽的動態。此戰可謂現象級,它不僅吸引了全球記者的長槍短炮,也順勢成了那段時間人們茶餘飯後的首要談資。
這不是一場普通的圍棋賽事,而是被貼上了“世紀大戰”標籤的人機智慧對決。對弈的雙方,一方是人類頂級棋手李世石,另一方則是誕生於英國的人工智慧程式——Alpha Go。五盤大戰最終以執黑的李世石投子認負結束,在19路圍棋盤上,Alpha Go以4比1的比分攻破了人類又一座引以為傲的智慧堡壘。此役過後,人們記住了這個被愛稱為“阿爾法狗”的人工智慧,記住了它背後的谷歌子公司Deep Mind,也記住了兩個“新”技術——深度學習(Deep Learning)和強化學習(Reinforcement Learning)。
Loading...
未載入完,嘗試【重新整理】or【退出閱讀模式】or【關閉廣告遮蔽】。
嘗試更換【Firefox瀏覽器】or【Chrome谷歌瀏覽器】開啟多多收藏!
移動流量偶爾打不開,可以切換電信、聯通、Wifi。
收藏網址:www.peakbooks.cc
(>人<;)