Slide
Slide
Slide
Hitachi_AI_HCI
Hitachi_HCI
HCI
previous arrow
next arrow

攻克AI第三度難關 AWS推增強學習工具

AWS DeepRacer
AWS DeepRacer是一部比例1/18模型車,可學習如何利用RoboMaker及SageMaker RL以增強學習,訓練DeepRacer參加巡迴賽車。AWS以此推廣增強學習概念

隨著AI應用流行,企業利用雲服務訓練AI模型。AI訓練包括了三大元素,首先是算法,其次是算力,最後是數據。

去年,AWS公佈了可以讓開發人員可快速建立、訓練、部署AI模型的SageMaker工具,並有預設多種算法作訓練,不少(Algorithm)算法亦已開源。AWS市集上,甚至己有開發人員出租訓練好AI模型,供企業快速利用AI模型作推論。

AWS上也有用於訓練Instance,解決了訓練模型時,大規模平行運算的算力要求,例如Amazon EC2 P3 instance就包括了8片NVIDIA V100 GPU,3小時可完成一項ResNet-50訓練。數據一項,則比較麻煩,即使有大量數據,設計好各項指標,亦須為數據進行「標注」(Labeling)。

AI通過深度學習,訓練不同AI模型,即使提供了訓練算法,還得要已標注的訓練數據(Training dataset),也就是AI學習的內容。

有質素的標注數據,對於訓練結果異常重要。近年,國內AI行業招聘大量的「標記員」,就是每天標注大量數據,中國有大量數據工廠,工人每天重複標注機器學習的大量「食物」,以勞動密集方式標注大量數據,訓練出不同模型。近年深度學習的網絡愈建愈大,AI模型「食物」愈多,標記質素愈好,則推論的準確度更高。

自動化標記工廠

今年AWS的Re:Invent大會上有幾項人工智能(AI)工具,正好針對開發以上開發AI難題。AWS推出了的新產品,包括可自動為訓練數據自動標記的SageMaker Ground Truth,以及供增強訓練的SageMaker RL。

去年,AWS公佈了可以讓開發人員可以快速建立、訓練、部署AI模型的SageMaker工具。AI大熱,AWS再推出了多項新產品,包括了可自動為訓練數據自動標記的SageMaker Ground Truth,以及供增強訓練的SageMaker RL。

主流的深度學習都以監督式學習(Supervised learning),利用經標注的數據訓練模型。標注的數據告訴模型那些是正確的數據,例如要教模型辨認一隻狗的影像,都必須標注大量狗的照片,讓機器學習。雖然說,機器學習也有無監督學習(Unsupervised learning),也就是不需要標注數據,讓模型學習,最典型例子是叢集分析(Cluster analysis),從數據分佈的統計,透過機器學習自動獲得結果。

不過,AI仍然以監督式學習為主流,也就是利用標注數據訓練,尤其是視覺運算和語意分析等,更大量利用監督式學習。

不過,監督學習仍然是最流行的深度學習方式,資料標記又勞動密集,AWS就推出自動化的標記工廠。AWS的SageMaker Ground Truth通過機器訓練,訓練SageMaker作為標記員,可用於影像分析,也可用於文字內容的分析,例如作影像分類、辨認影像物件、影像內容分割等。

向壁虛構AI學習

數據是AI食糧,即使現實世界沒有大量數據,電腦也可以自行產生數據;方法包括了新的監督和增強學習。

監督學習發展出不同方式。豐田汽車就是利用自我監督學習(Self-supervised learning)訓練,應用於自動駕駛。豐田以AWS的EC2 P3 instances模擬汽車在不同環境,自動駕駛學習如何應對,以訓練駕駛模型,自動駕駛在虛擬環境下,已獲數千年駕駛經驗。近年IBM則發展弱監督學習(Weak supervised learning),試圖利用數據本身的關係,去找出標注。IBM的Project Debater就是利用文章上文下理自動標注,而取得成功案例。

AWS也公佈了Amazon SageMaker RL增強學習(Reinforcement learning)。增強學習則以代理程式(Agent),自動產生大量數據(毋須人為生產數據),透過反覆試驗(Trial and error),AI模型從錯誤中學習。增強學習之中,最著名例子可數Google的DeepMind圍棋軟體AlphaGo Zero,機器自行對弈;只用了三天,AlphaGo Zero就走過幾千年的圍棋研究歷程,萌生出曠古未有的棋局,打敗棋王。增強學習的用途,比無監督學習更大,不少問題沒一定對錯標準,目標只是以最快,或者最好方式來解決問題,增強學習就大派用場。

SageMaker
AWS表示,SageMaker用戶已經過了一萬名,其中包括中國招商銀行

SageMaker RL可應用在解決電子遊戲設計、供應鏈管理、創建投資組合,甚至機器人訓練;美國初創Embodied Intelligence就是以增強學習,訓練機器自行模索如何解決問題。

SageMaker RL可產生代理程式,然後不斷通過特定的規律,自我產生大量數據,反覆試驗獲得最佳結果,情況跟AlphaGo Zero棋士一樣。

AWS也推出了以ROS作業系統為基礎的RoboMaker,開發人員可在AWS直接學習ROS,並透過模擬場景,獲悉機器人程式真實操作場景。ROS是在Linux運算,比傳統機器人以控制板開發,ROS生態系統更大,伸延能力更高,有更多函式庫。著名的Boston Dynamic就是利用了ROS。

本港機器人專家林天麟博士,也是少數ROS專家,開發ROS函式庫和教學。林天麟說,RoboMaker主要是把雲服務器的計算力,釋放給ROS開發人員,對於開發人員是好消息。開發ROS要求極多算力,可以雲服務學習、應用,甚至部署。

「西班牙很早也有一間公司有類似的網上編寫ROS程序及仿真。但主要是靠網上ROS課程收費。」

http://www.theconstructsim.com

「RoboMaker編程的機器人有不少優點,其中是可更簡單連接AI。機器人可透過視覺運算,甚至連接到語音助手,透過聲音獲得指令。」林天麟說。

RoboMaker可連接到多項AWS服務;包括Amazon Lex、Polly、Amazon Rekognition、Amazon Kinesis Video Streams、Amazon CloudWatch等,也可用SageMaker以機器學習,加強訓練機器人「大腦」。

AWS的AI、機器學習及深度學習市務主管Joel Minnick說,SageMaker RL可直接連接到RoboMaker,透過增強學習為機器人編程。一般來說,機器人每次執行新任務,都必須重新編程,增強學習甚至可讓機器人自行學習新技能。

為了推動增強學習,AWS推出了AWS DeepRacer,是一部比例1/18模型車,此模型車可通過增強學習原理,透過視像鏡頭觀察路面,開發人員首行利用RoboMaker雲端3D賽道自行學習,模擬器亦設有多個賽道,以SageMaker RL訓練完成後,下載到DeepRacer真正跑道競賽。

今屆re:Invent大會公佈AWS DeepRacer大賽,於全球各地的AWS Global Summit舉行巡迴賽車,總決賽於2019年的re:Invent大會舉行。

DeepRacer安裝了Ubuntu 16.04 LTS版本及ROS,視覺運算則利用了Intel OpenVino computer vision toolkit。DeepRacer每部售價399美元,推廣期內249美元。

不過,AI模型訓練完成,就會用於推論(Inference),從輸入的數據透過已訓練的模型以輸出結果,也就是按模型計算後的有把握的判斷。訓練模型固然必須大量GPU算力,但AI模型的推論的算力,卻佔去更大成本。以微軟為例,就推出Brainwave計畫,與HPE和DELL合作,以FPGA推出用於推論用途的伺服器,預計明年推出。

AWS也宣布推出供AI模型推論的Inferentia晶片,日後除了P3的instance作模型訓練,也會有專用晶片作推論。但是,Inferentia晶片只部署成雲服務的Instance,不會作為邊緣的設備。Minnick說,AWS仍以SakeMaker Neo,支援模型在不同硬件上執行,以作為在邊緣執行AI運算的手段。

Leave a Reply

Your email address will not be published. Required fields are marked *