Slide
Slide
Slide
Hitachi_AI_HCI
Hitachi_HCI
HCI
previous arrow
next arrow

AWS推出AI學習工具 玩轉自動駕駛音樂創作

AWS的AI設備總監Mike Miller:第二代DeepRacer具備兩個鏡頭的立體視像能力,加上光達(Lidar)裝置,探測前方障礙物,可以避障和超車。

新科技速遞

全球開發人工智能(AI),學習機會不斷增加;AI利用深度學習建立模型,最簡單是監督式學習(Supervised Learning),利用大量標記數據,透過算法訓練AI模型,不過一般人對AI比較抽象,親手實作AI玩具,就更容易明白。

為了推廣AI,AWS推出了多項學習工具,最初推出視覺運算攝影機DeepLens,訓練視覺運算。去年,AWS推出了DeepRacer,以「增強學習」(Reinforcement Learning)訓練賽車。

「增強學習」是建立AI模型的一種方法,一般以監督式學習(Supervised Learning),必須有大量數據訓練模型,「增強學習」則是自我產生數據,再訓練AI模型。簡而言之,「增強學習」就是從錯誤中學習(Trial and error),最著名例子是AlphaGo Zero,輸入圍棋規則和策略,電腦開始對弈,電腦可日以繼夜下棋,人類曠古未有的棋局也想出來,終於一舉擊敗了棋王。

「增強學習」適合沒有固定執行方式的任務,例如訓練機械人或者無人駕駛。無人駕駛可以先在虛擬環境下試駕,自行產生大量數據訓練模型,然後才到公路上驗證,節省大量訓練時間。

訓練「增強學習」以軟件的代理人(Agent),安裝到虛擬環境學習,設定執行策略和方針,就目標設定賞罸,然後反饋不斷修正AI模型。Agent和環境互動產生大量數據,訓練了AI模型,就可在現實世界執行作業。

AWS開發了於Sagemaker工具建立、訓練和部署機器學習模型,又利用ROS開發可以在虛擬環境訓練機械人的RoboMaker,兩者結合推出了DeepRacer。

DeepRacer具備視像鏡頭,開發人員可訓練DeepRacer在虛擬環境中,訓練在賽道上,根據不同指令,例如從鏡頭傳回路況,然後設定轉向和車速,以及學習時的賞罸標準,不同學習參數等,先以Agent在虛擬環境訓練AI模型。然後,AI模型下載到DeepRacer實體車試跑。

AI第一手經驗

Mike Miller是AWS的AI設備總監,曾為Amazon開發Fire TV之類Amazon消費電子終端,如今則開發AI設備,以引起開發AI的興趣,開發人員有第一手經驗開發AI,而首項視覺運算就非常成功。

去年,AWS推出了DeepRacer,也舉辦全球比賽。第一代DeepRacer只能獨自在賽道上完成賽事,再計算完成的時間決定勝負。

「DeepRacer是鼓勵更多開發人員學習增強學習,除了AWS舉辦賽事,不少企業內部也舉辦賽事,推動內部學習AI氣氛。」

第一代DeepRacer只有一部鏡頭,沒有距離感,也不可能避障。AWS推出新一代DeepRacer模型車,鏡頭從一部增加至兩部,獲得立體的視覺效果,模仿人眼作深度檢測;並且加上了光達(Lidar)裝置,全名為Light Detection And Ranging,中文稱光達或雷射雷達,以利用激光量測目標物距離,類似自動汽車輔助駕駛。

「DeepRacer人類具有兩只眼睛,可看到深度景物和附近的障礙物,是否有車輛在前方,並訓練出更複雜AI模型避障,多部車亦可能在同一車道比賽,避免碰撞或超車,DeepRacer也會舉辦新賽事,鼓勵大家訓練自動駕駛的AI模型。」

不過,DeepRacer的Lidar只是二維,並且向前傾斜,以探測前方物件。不少工業用的機械人須利用「增強學習」訓練,開發人員可測試不同參數和算法的優劣,掌握計算的原理。DeepRacer也具備HDMI介面,並且利用Ubuntu的Linux作業系統,一般人亦可登入,甚至加入新應感器。

DeepComposer是全球首個支援機器學習的音樂鍵盤,按照鍵盤輸入的音符創作,不過也可使用虛擬鍵盤取代。

AWS為了增加學習AI的樂趣,又推出了DeepComposer,以Generative AI方式,透過大量學習相同的音樂風格,

DeepComposer透過簡單的鍵盤創作出4種不同風格音樂,包括有搖、流行、爵士、古典音樂,透過Generational Adversarial Neural Network(GANN)神經網絡進行訓練。Generative AI原理是透過機器學習內容,例如文字、繪畫風格、音樂的例子,再創作出新的內容。

例如以某一畫家風格訓練的機器學習模型,可按照同一風格創作。DeepComposer可按照開發人員在音樂鍵盤彈奏的音樂,演變出新樂章。DeepComposer的GANN包含了兩個AI模型,一個稱之為Generator,另一則是Discriminator。

「前者根據用戶輸入的MIDI音效,創作出音樂的段落和音符,而Discriminator則會促使樂章切合某一種音樂風格。打個比喻,Generator有如樂團,Discriminator則有如指揮。」

Miller說,DeepRacer具備了全球的賽車,AWS也考慮舉辦全球的音樂比賽,以推廣DeepComposer。「AWS發現開發人員喜歡從玩樂學習,競賽也可以刺激起大家對於AI的興趣。」

Leave a Reply

Your email address will not be published. Required fields are marked *