摩爾定律無以為繼 AI芯片如雨後春筍

世界人工智慧大會上顯示的寒武紀「思元」270,可應用於雲端AI訓練。如今華為和阿里都有本身AI芯片,寒武紀前景堪虞。

自主科技

中國銳意發展人工智能(AI),AI的算法跟國際不相伯仲,數據標注和數據量上佔優,但算力則仍掌握在美國芯片供應商。

全球AI訓練非常依靠NVIDIA等廠商算力作訓練,而推理則有不同選擇,近年異軍突起的FPGA,主要廠商仍以美國Xilinx和英特爾作主導。中國也有本身的廠商,不過中國也積極開發AI芯片,以求在AI龐大算力需求分一杯羹。

華為在2004年10月,自行研發了12年ASIC後成立海思半導體。2018年,海思在全球半導體IC設計公司營業額,攀上第5位,去年增長超過3成,之前4位則是博通、高通、NVIDIA、聯發科。

1991年,任正飛從港商億利達,挖走負責開發徐文偉,設計了第一枚ASIC交換機芯片後,以後開發過H.264視頻編碼芯片和巴龍(Balong)基帶芯片,甚至機頂盒晶片等。海思也曾是安防半導體市場,IP攝錄機芯片的主要供應商。2014年,海思推出Kirin 910芯片,步入通用處理器市場,外間才認識其設計實力,帶領了華為創造奇蹟,成為全球的第二大手機品牌。

HUAWEI CONNECT 2019舉行期間,華為公佈圍繞不同芯片,公佈「鯤鵬+昇騰」雙引擎正式全面啟航計算戰略,鯤鵬是基於ARM的通用處理器芯片,以確保執行各種一般運算。昇騰(Ascend)是華為完全自行開發的AI芯片,採用華為的「達芬奇架構」。

通用處理器芯片已達到7nm工藝,不少人以為通用處理芯片已走到盡頭,不可能再以每4年晶體倍翻數量,專用芯片會逐漸抬頭。故此,國內不少初創爭相投資AI芯片,華為也不例外。不過,芯片要達到一定數量才具經濟效益,所以具編程能力的FPGA,也日漸在AI推理市場受到重視。

華為針對數據中心的昇騰910採用了7nm工藝,剛剛正式宣佈商用;而主打高效計算低功耗的昇騰310則為12nm。華為亦以過千枚的昇騰910,推出了號稱全球最快用於訓練的AI叢集Atlas 900,並基於昇騰910,推出了43類「華為雲」AI服務;包括了AI Elastic Cloud Servers (ECSs),可用於推理、訓練及自動駕駛,據說效能提高了兩倍。華為又推出了Altas 300加速卡,可以加在伺服器內,用於邊緣的推理用途。

華為表示,昇騰310針對於邊沿AI推動,影像檢索(ImageSearch)和內容追蹤、標籤、評估及篩選(Content Moderation)功能,成本可降至以往的3成。近年,數學上的Graph理論,廣泛應用於社交媒體,近年Graph應用甚至可以建立更佳的檢索引擎,最明顯是Google的Knowledge Graph,從檢索建立相關答案,甚至建立聊天機械人。

除了建立聊天機械人,Knowledge Graph可用於語意搜尋、投資風險分析、內容建議引擎、建議投資意念、知識管理系統等。

Altas 300加速卡,可以用於邊際推理用途,速度達256T FLOPS FP16。

推理晶片百花齊放

阿里旗下的半導體「平頭哥」推出首款人工智能推理晶片「含光800」,不過「含光800」只是用於AI推理,跟AWS獨家推理芯片Inferentia差不多。

不過,國內研發AI芯片較著名,還有用於麒麟980和970上的寒武紀NPU。寒武紀由中科院牽頭,投資者包括了阿里巴巴和科大訊飛。不過,麒麟990上NPU已改用自家產品。

寒武紀仍然有不少合作夥伴,包括了浪潮、聯想、曙光,包括了「思元」270訓練版板卡,而且又有多項邊緣推理產品,與中國電信與中興通訊合作,加速5G、AI和邊緣智慧。寒武紀較為低調,軟件及技術支援口碑不俗。以往國內的AI訓練,不是NVIDIA就是寒武紀的芯片,只不過終端推理市場,寒武紀NPU沒太大競爭力。

寒武紀又缺乏華為的生態夥伴,如今華為推自家芯片,甚至「全場景覆蓋」,對於寒武紀來說,當然不是好消息。

其他中國初創,也紛紛推出AI芯片。去年底,中國地平線就基於人工智能專用處理器架構 BPU(Brain Processing Unit ) ,發佈第一代自動駕駛處理器「征程1.0」,可用於L2級別的高級駕駛輔助系統(ADAS)。

其他推山芯片還包括雲知聲、依圖科技、思必馳和Rokid等。

雲知聲專注於語音辨識及語言處理技術,今年預計推出三款晶片:羽量級物聯網AI芯片雨燕Lite,;智慧城市多模態AI晶片「海豚」;面向智慧出行車規級多模態芯片「雪豹」,全部針對邊際計算和處理能力。

依圖科技是全球人臉識別最頂尖的AI獨角獸,發佈自研雲端視覺推理AI晶片Questcore,為依圖和AI芯片初創團隊ThinkForce聯合開發,也是推理用途。

思必馳則是語音辨識,語音合成,語義理解,智慧對話,聲紋識別服務,發佈了TAIHANG系列AI晶片,支援6+2通道語音同步採集,支援標準音頻格式。Rokid 成立於2014 年,為專注人機交互技術和人工智能軟硬體科技,推出AI芯片KAMINO18。

以上不少芯片已宣佈出貨,獲第三方訂單。不過芯片從開發、流片、代工、封裝,成本不菲。以上AI芯片量產獲利,也非輕而易舉。

華為利用了昇騰系列用於邊緣的推理,利用人工智能加上視覺運算,可有無限應用想像空間;最重要還是華為具備開發硬件能力,向邊緣產品廠商,提供開發板和技術支援,例如華為就提供了Altas 200等AI開發套件,以開發AI產品。

假如華為可培養出國內的硬件生態,昇騰系列可能達到量產,變化出不同產品,海思說不定可再創出另一奇蹟。

Leave a Reply

Your email address will not be published. Required fields are marked *