Slide
Slide
Slide
Hitachi_AI_HCI
Hitachi_HCI
HCI
previous arrow
next arrow

人工智能| 生成式AI戰國時代 短兵相接各出奇謀

GoogleMaps
每日Google Maps為200億公里路線提供行程規劃,新推出沉浸實境路線圖(Immersive View)可預覽行程實景,不同時段天氣和交通,Google實況街景通過Neural Radiance Fields(NeRF)生成虛擬3D效果,幾可亂真。

[新科技速遞]

生成式AI飛躍發展的時代,一日都會嫌長。OpenAI掀開生成式AI時代序幕,Meta開源大模型,開源社群推出多項創新,Google如何回應成為焦點。 Continue reading “人工智能| 生成式AI戰國時代 短兵相接各出奇謀”

NLP| Google| AI機械人能解人意 心領神會完成任務 

PaLM-SayCan
PaLM-SayCan機械人算法,機械人就可憑隱誨不明的語言去理解人類需求,再決定如何反應

[新科技速遞]

科幻小說和電影為題材的作品,經常有人工智能AI)機械人參與太空探索任務。科幻電影《星際啟示錄》(Interstellar)搭載兩部具語言能力機械人,承擔了重要任務,還可設定「幽默度」,向人類講冷笑話,漫長枯寂的太空探索中添上生氣。

究竟AI會否講笑話?Google至少證明了AI聽得明笑話,具備幽默感。上述技術難度在於,幽默和笑話語帶雙關,必須揣摩隱誨語意,有時盡在不言,難以從表面語意解釋,必須參詳琢磨其他含意,甚至具備聯想力,才能參破其中含意。

Google自然語言處理NLP)的多項突破,最為人認識是Transformer模型,尤其是 Transformer雙向編碼表示法Bidirectional Encoder Representations from TransformersBERT),屬於近期NLP影响力最大算法之一,在SQuAD問答系統、實體識別、意圖識別、情緒分析這類基準,準確度與人類相差無幾。

去年,Google Research宣佈建立了參數超過5400億的Transformer模型PaLMPathways Language Model)。PaLM作為單一模型,可高效伸延至不同領域和任務。Google Research在29個英語處理任務測試PaLM,通過了數百個語言理解和生成任務的評估,大多數任務上都達到最先進few-shot性能,甚至理解語帶雙關內容,還可解釋笑話。

PaLM語言能力接近約六成9-12歲兒童平均解決問題的能力,可為需要多步邏輯推敲,以各種知識和深入語言理解複雜組合的語言場景,生成出明確解釋。

PaLM可以瞭解笑話的含意,也可憑語意猜度出人類的意圖,結合NLP機械人自行判斷如何執行工作,具備決策能力。Google剛公佈PaLM-SayCan機械人算法,機械人就可憑隱誨不明的語言,理解人類的需求,自行決定如何反應,完成複雜動作。Google機械人語言令人機互動,跨進一大步。

例如研究人員向機械人說:「我剛弄洒了咖啡,可以幫忙找東西清潔?」機械人馬上分析「弄洒了咖啡」代表的意思,權衡各種處理方法,經算法計算機率,決定去廚房找一塊海綿執行清潔任務。

google
一塊海綿的決定,背後包含了巨碩無朋的自然語言處理模型,Google人工智能令人機互動進入了新里程。

通過AI語言模型,機械人現在可理解人類以不清晰指令,單憑語意和情景,足以猜度人類意圖,組合一系列回應。PaLM-SayCan最大突破在於機械人終於懂得察言觀色,並推論出如何反應,

以往大多數機器人,都須在嚴格指令和條件下,才懂得執行程式預設任務,機械人只按照預計接受命令,一絲不苟執行重覆性任務,自動生成任務,更接近於從科幻小說中目睹的機械人。

不過AI機械人是否有《星際啟示錄》中機械人CASE先見之明,提前關閉了自動對接程序,令飛船免受控制拯救主人,相信乃是耐人尋味。 Continue reading “NLP| Google| AI機械人能解人意 心領神會完成任務 “

新科技速遞| 語言機器學習技術 攻關低資源語言翻譯

Meta
Meta AI 研究人員展開No Language Left Behind(NLLB)項目,致力為全世界大部分語言開發高質素的機械翻譯功能

[新科技速遞]

Facebook母公司Meta屬下Meta AI研究人員,宣佈以人工智能開發高質素機械翻譯,以NLLB-200命名的單一AI 模型,能翻譯出200種不同語言,支援多語言翻譯挑戰,包括了訓練低資源語言,也就是只有少數樣本供訓練AI模型的非主流語系。 Continue reading “新科技速遞| 語言機器學習技術 攻關低資源語言翻譯”

人工智能|感知計算| 商湯再揚威學術會議 多項奪魁顯研究實力

商湯揚威CVPR
商湯揚威CVPR,顯示在視覺運算研究領域的實力,其中Embodied AI比賽獲得冠軍,RxR-Habitat 的全名是Room-Across-Room Habitat Challenge (RxR-Habitat) 比賽由hosted by 俄勒岡州立大學、Google、Facebook AI舉辦,要求通過人為生成的指令要求機器執行導航任務。

[新科技速遞]

CVPR是IEEE國際電腦視覺與模式識別(Computer Vision and Pattern Recognition)會議,跟ICCV、ECCV 並稱為三大電腦視覺運算會議。視覺運算發展速度極快,全球學者傾向將研究結木投稿至CVPR等會議,論文錄取率極低,錄取論文又分為數級,委員會認為價值最高會入選口頭報告(Oral Presentation),可以在大會做演講報告,其餘剩下是論文海報,或者簡短演講報告(Spotlight)。本港上市的人工智能企業商湯科技一直活躍於CVPR會議,今年CVPR共接收2067篇論文,數量較去年增長了四份一,商湯科技及聯合實驗室共有71篇論文入選。 Continue reading “人工智能|感知計算| 商湯再揚威學術會議 多項奪魁顯研究實力”