855流動平台 當5G遇上AI

Gary Brotman
高通的產品管理高級總監Gary Brotman介紹Hexagon DSP,訊號處理器已變身AI平台,並加入Tensor加速,演算神經網絡更快

高通剛在夏威夷舉行的驍龍技術峰會(Snapdragon Summit)推出855流動平台,針對新一代智能手機。855連接網絡更快,支援5G和新一代Wi-Fi,也加入更多AI和XR,支援虛擬實境和擴增實境。

5G令手機電話的應用場景大增,XR技術可用於360度全場直播和遠程手術等用途。而AI則令手機變成全能助手,任何情況都可拍出完美照片。

855
本港獨角獸商湯為855加入的AI自動照片清晰化功能,此項功能是讓鏡頭較差的手機,同樣拍出清晰和亮麗照片。

高通流動平台高級副總裁Alex Katouzian說,目前AI還沒有業界公認的比較標準,855已屬於高通第4代AI架構。高通暫時傾向以Google的Inception v3估計電話執行AI功能,不過從多項展示,855可能是目前最快的AI平台,開發生態也算是最豐富。

855的AI靠三個運算組件;包括Adreno 640 GPU、Hexagon 690 DSP、Kyro 485  CPU,不同情況下執行AI運算。

Super Night
虹軟中國為855平台以深度學習開發出Super Night拍照技術,內建在855平台

除了CPU速度比上一代快了45%,GPU亦快了25%。前者令開啟APP時間更短,反應更快,瀏覽網頁更流暢,FireFox甚至開發出可以不同網頁,利用不同核心的技術。GPU則可支援更多色彩,甚至可重播4K HDR 10+影片,超過10億種色調。

高通與多家AI開發商合作,為855加入大量AI應用,即使是質素一般鏡頭,也可大有改進。從855,可見下一代手機,內建不少高階性能。

例如大量利用AI,語音助手會比以往有智慧,對語音反應更敏銳,不受環境噪音限制。文字辨識和翻譯,亦可能不用再上網,而且準確度更高;物件辨識反應也有加快。

高通副總裁Keith Kressin說,855內有多組處理器,AI引擎也進入了第4代,但演化最快是訊號處理器(DSP),差不多變成一枚通用AI處理器。

NALBI
NALBI的APP可以準確辨識用戶的頭髮,馬上變成不同顏色,以每秒30幀不斷顯示,有如特別效果。

855的Hexagon 690 DSP加進了多項AI加速性能,包括Tensor加速器,可支援語音助理。DSP配合AI,變化出有趣用途,包括了大象聲科(ELEVOC)研究的降噪技術,即使極嘈雜環境,亦可一個揚聲器作降噪,過濾清除大部分雜音。

AI過濾的寧靜

一般在飛機上使用降噪技術,只能夠辨認某類噪音;例如引擎的聲音,再產生反向聲波來抵銷噪音。大象聲科以機器學習,學習不同場合產生環境噪音,即使是身處於酒吧,音樂和人聲背景交雜,AI仍可準確辨認出背景的雜音,加以過濾和消除。大象聲科以機器學習,辨識背景噪音,通過抗噪技術消除,即使是嘈吵環境,仍可用手機對話。

大象聲科
大象聲科以機器學習,AI深度學習不同場合產生環境噪音,仍可準確辨認出背景的雜音

DSP也加入了「遠場話音辨識」(Far field voice recognition)技術,即使在遠處亦可辨識語音指令,例如從遠處叫OK google,馬上可喚醒電話,日後亦會加入Cortana和Alexa。855結合降噪和遠場兩種技術,解決了環境噪音和距離問題,可準確辨認出呼喚和指令聲音。未來,手機大量採用語音指令,DSP支援AI非常重要。

除了聲音,DSP亦用於視覺運算,包括了向量(Vector)。比對特徵向量是視覺辨識物件和人面辨識的基礎,Vector eXtensions增至4個,Hexagon處理AI影像大幅增昇。

Hexagon也加入了Tensor(張量)加速器,可更快執行神經網絡的模型。因為神經網絡代表多維度的矩陣,Tensor適合代表多維度數據,因此加快執行神經網絡。

Adreno 640 GPU比上一代快二成,內建的數學邏輯單位(ALU)增加五成,支援Half-precision (FP16)運算方式,更快的浮點運算。Adreno也更省電,運作時更少依賴CPU,以7nm製程生産之後,855比上一代省電至少二成。此外也支援Vulkan 1.1開發介面,可從GPU最底層開發出速度更快的遊戲應用。

深度支援Google

DSP深入支援向量,加上深度支援Google,支援Tensorflow和Google NN API,Android用戶體驗會完全改寫;未來不少Google APP功能,包括文字辨識會更快,因為不用再傳回雲端處理;Google文字辨別加翻譯,甚至可在手機內完成,不須要上網,旅行更方便。

Google代表Eddie Chung說,利用855平台,文字辨識會比以往快得多。GoogleLens 亦可更快辨識物件和文字,馬上進行搜尋。Google文字和圖像辦別,無須上傳至雲端運算的優點,除了速度更快,延遲性更低,圖像毋須壓縮後傳送,辨識準確度亦更高。

855支援眾多AI框架(AI Framework),也是第一枚SOC深入支援Tensorflow, Tensorflow又是全球最流行AI框架,執行不少AI模型會極快。

化腐朽為神奇

高通產品管理高級總監Gary Brotman展示數家AI利用855視覺運算之快,AI初創NALBI的APP可以準確辨識用戶的頭髮,馬上變成不同顏色,並以每秒30幀速度顯示。NALBI也可在毋須利用3D攝影機,拍照後仍可調整景深的位置,對焦錯誤亦可補救,以AI深度學習計算實現。

Brotman又展示本港商湯科技為855開發影像升級技術,原本模糊的壽司照片,經AI處理變得清晰細緻,更高的圖像解析度,也就是說,即使手機的鏡頭和感光元件不太高級,AI也可化腐朽為神奇。

高通也跟商湯合作,以人臉識別推出首個辨別準確度達支付級別(Payment Grade)支付技術,內建反欺騙技術,再加上Hexagon保安機制,人臉不單可解鎖,也可隨時網上支付。

另一家AI初創虹軟中國(ArcSoft)亦為855平台,以深度學習開發Super Night拍照技術,內建在855平台。夜拍光線不足照片,可自動調整光線、校準色彩平衡、提高清晰度和清除雜訊,完全不須補光;即使光線不足,一樣清晰亮麗。Supernight甚至可將燈泡的光暈還原光線,相當神奇。

855也加入了超聲波指紋感應器(ultrasonic fingerprint sensor),可藏在手機熒幕下,可穿透玻璃及鋁片。超聲波指紋不單比光學準確,即使手指濕水或弄污,同樣可辨認指紋。超聲波以3D辨認指紋的凹凸坑紋,極難仿偽;獲得最高級別安全ISO認證。

Leave a Reply

Your email address will not be published. Required fields are marked *