擁抱「雲原生」應用技術 Watson突破雲平台限制

陳黎明
IBM大中華區董事長陳黎明:以設計思考的方式解決企業痛點。

IBM選址在三藩市舉行年度Think大會,而不在賭城,同時宣佈推出Watson Anywhere,可應用於任何的雲平台上運行。IBM利用Kubernetes技術,可令Watson人工智能在任何一種雲環境都可以部署。

Think大會上IBM公佈多雲部署的技術、並進一步擁抱開源。LINUX基金會以及旗下的Cloud Native Computing Foundation,CNCF(雲原生計算基金會)的總部,設於三藩市。以雲運算、容器技術、Kubernetes三者支撐的雲原生(Cloud Native)應用,已成為行業趨勢,開源軟件又令上述標準,無遠弗屆,可在任何公有雲和私有雲執行。Think大會選址三藩市,可謂別具意義。

所謂「雲原生」,非單純的技術問題,而是關乎企業未來創新和IT發展的問題。所謂「雲原生」,泛指近年圍繞「微服務」(Microservices)架構和容器技術,發展起來的技術浪潮,「微服務」甚至可建立「無服務器」(Serverless)架構,開發人員完全不用理會IT基建,可快速部署和測試,動態配置資源,IT基建會自行管理擴充和容錯等。

Kubernetes協調容器的技術,所開發的「微架構」應用,開發人員在本身機器上開發,然後放到「微服務」上執行和迭代。上述的DevOps開發環境,已經是企業追求的目標。CNCF上最重要的是項目,就是Google開源的Kubernetes(K8s)容器協調技術,雲原生應用可在不同雲端執行,全球所有重要的公有雲,包括阿里雲,都已獲Kubernetes認證。

IBM選址在三藩市舉行年度Think大會:IBM的商業研究顯示,98%企業會走向多雲的部署,但走向多雲,除了解決遷移,還有保安風險。

2014年,AWS推出了Lambda,掀起無服務器的浪潮,也就是所謂Function as a Service(FaaS);其後各公有雲相繼出現Google Cloud Function、IBM BlueMix的OpenWhisk和Azure Functions等。開發人員只要利用Function,就可開發純粹以事件觸動的應用,Amazon語音助手Alexa,就是以FaaS建立。FaaS也可結合Kubernetes,其中包括剛成CNCF的KNative,IBM亦積極參與其中。

多雲大勢所趨

多雲環境肯定是企業大勢所趨,原因是數據分散,遷移和整理數據又不容易,更可能涉及合規和規管。IBM推動Kubernetes,因為研究發展98%企業走向混合雲(Hybrid),甚至多雲(Multi Cloud)的部署,套用Rajaraman說法:「與其移動數據到應用,不如移動應用到數據去。」

AI訓練的模型凖確,必須靠3大要素,包括了算法、運算能力和數據。AI各種算法比較公開,而算力則多較利用昂貴GPU,或者新一代FPGA。

但數據則是最頭痛的問題。AI訓練不採用相關數據,不可能凖確。數據涉及大量敏感資料和監管問題,如何確保在合規的情況下利用數據分析,非常重要。

IBM在AI和深度學習訓練,均有豐富經驗。為了解決數據分散,或者未必一定位於同一地點的數據。去年,IBM推出了IBM Cloud Private(ICP),利用開源的技術,包括了容器、Kubernetes、Cloud Foundry等技術,轉化傳統應用。IBM大中華區企業與商業總裁鄭小聰說,ICP可以讓以往利用IBM中間件,例如Websphere建立的應用,以ICP變成容器化,關鍵技術就毋須重新開發,原本數據中心內Java程式,可移遷至雲端馬上成為容器;而WebSphere Liberty、DB2、MQ等中間件服務,又可以變成容器優化的版本,雲端的應用可通過API連接。企業客戶可通過ICP,以微服務方式,連接其他網上的容器服務。


IBM公佈了利用ICP和Kubernetes等容器技術,幫助企業在任何雲端環境部署AI

ICP轉化傳統應用

IBM大中華硬件系統部總經理侯森說,ICP是IBM中國研究院的成果,其後拓展到全世界。IBM又在ICP上,再加上ICP for Data功能,可連接位於任何位置的數據;從公有雲以至私有雲,ICP for Data有極豐富的連接方式,可轉化數據為Metadata,轉變和搜尋位於不同來源的數據,再利用「資料虛擬化」(Data Virtualization),授權應用程式,檢索和管理數據,完全不需要知道數據的相關技術細節,例如格式化方式或實際儲存位置。

IBM大中華區戰略業務總裁姜錫岫說,IBM並不是簡單解決AI如何訓練AI模型,因為不少企業已掌握了竅門,而集中於客戶痛點,共同設計解決應用AI的實際問題,提高AI透明度和合規性。

ICP for Data是IBM針對AI開發的開源雲原生架構,開源是ICP for Data的核心,Watson Studio則是其中關鍵部分。據IBM內部研究顯示,使用Watson服務的用戶,八成半以Python、R 和TensorFlow等開源語言和框架。

IBM先以ICP for Data,解決了數據分散的難題,再以Kubernetes,部署Watson工具在不同環境,推出了突破的Watson Anywhere。

Watson Assistant可助企業管理客戶和員工的日常查詢,而查詢內容量,通常又是較大和涉及廣泛範圍。Watson Assistant語音助手,以ICP for Data可從私有、公有、甚至多雲環境中尋找答案,以自然語言解答查詢。

Watson Assistant接收查詢時,會知道何時要求對方澄清要求,並懂得何時搜索知識庫,何時建議用戶尋求人手介入,減少誤解提升用戶體驗,已超過15個行業應用,包括汽車、銀行與金融服務、醫療健康、電信、製造業及軟體和技術等。

以往,Watson Assistant要利用IBM Cloud才能部署。不能企業內部署,一直是最大弱點,尤其不少金融機構,受合規問題束縛,數據不能離開企業作訓練。科學園內著名的AI初創「有光科技」(Fano Labs),就是憑可以在內部(On-Premise)部署的性能,短時間AI語音助手市場脫颕而出。

Kubernetes已成為所有雲平台雲原生的應用標準,甚至可在私有雲建立,Watson可部署在任何的雲平台,使用不同的深度學習框架,任何數據存儲的地方都可部署AI。

IBM資料與人工智慧部門總經理Rob Thomas說:「多數大型企業在混合雲環境中存儲資料,需要獲取應用AI技術的選擇權,無論資料存儲在何處。通過打破這種封閉的基礎系統,我們可以説明企業可通過AI加速實現轉型。」


藍色巨人收購了紅帽,未來可以開源技術幫助企業作跨雲的部署

目前,透過Kubernetes可自由部署的Watson服務,除了Watson Assistant,還有Watson OpenScale。

AI利用訓練的模型作出決策,也跟人類一樣,會出現錯誤,甚至是偏見。如何即時解釋AI如何決策,消除數據內的偏見,就是AI其中要解決的問題。例如AI否決一筆款項,是否因數據內對於種族或性別偏見,而拒絕了用戶?用戶能否真正信任AI決定?或者說AI是否公平地作出決定?

AI模型的誤差率,可通過調整數據集來糾正,而誤差率則可能要增加數據集,改善算法、或加上優化器來改變。一般數據科學家要在建立模型的 Pipeline,加入不同算法,再以實際數據測試誤率,一般AI模型都通過多次調整,減少誤差。

不過,如果數據本身帶有偏見,任何算法都不能改變結果。

AI的偏見

OpenScale可確保AI模型並不帶任何偏見,用戶可查詢AI,究竟基於何種凖則作出決定?一般的用戶可理解決定的理由,所有交易均可查核。OpenScale可支援不同AI框架所建立的模型和工具,甚至可監察Amazon Web Service (AWS) SageMaker所訓練出的AI模型。。

OpenScale也可經常查核AI模型預測的凖確性,發現執行時期,產生不合理結果,可根據企業決定的合理性屬性,自動偵測調整,也可對用於重新訓練模型的新資料集,自動提出建議,降低偏差。

IBM也推出了Neural Network Synthesis(NeuNetS),可以採用提供訓練數據(影像或文字)合成訓練模型,隨後可在 Watson Machine Learning 下載,AI模型訓練完成後,一般部署在數據附近作推理。NeuNetS可部署至內容或不同公有雲作AI推理(Inference)。

然後,IBM再利用了容器和Kubernetes技術,企業可在任何雲平台部署企業服務。據IBM雲平台的技術總監Bala Rajaraman說,IBM利用Kubernetes和ICP開放所有技術;包括中間件、DB2、Cognos應用,可通過的ICP作跨雲平台部署。

換句話說, 通過ICP更多工具,IBM中間件用戶可簡化移轉企業應用,至跨雲平台執行的過程,用戶可選擇任何公有雲,或者私有雲以Kubernetes架構,執行IBM的企業應用。

姜錫岫說:「目前的企業只有約2成應用利用了公有雲,不少是較為容易遷移的應用,但最困難是核心和關鍵應用,如何變成Cloud Native,享受快速推出原型和迭代,敏捷式開發的優點,大量應用必須重新開發,正正是IBM強項。IBM在中國Cloud Garage通過設計思考等新的方法學,降低客戶遷移關鍵應用的各項風險。」

IBM大中華區董事長陳黎明說,IBM在中國的Design studio,每日為數以千計政府和企業客戶解決不同業務數碼化問題,以設計思考的方式解決企業痛點。

IBM宣佈推出全新Watson的IBM Business Automation Intelligence,企業可將AI直接應用在應用程式和業務流程內,前線人員馬上可從AI獲得預測結果,增強員工能力,以智慧的方式實現自動化。此外,亦可衡量AI對業務結果的影響程度和有效性。

ICP for Data亦令企業可以利用Watson Studio和Watson Machine Learning等服務。今年稍徵,IBM再將為ICP for Data提供更多的Watson服務,包括Watson Knowledge Studio和Watson Natural Language Understanding。

近期發佈的Forrester Wave 企業洞察平台2019年第一季度報告中,市場調研公司Forrester Research將 ICP for Data評為「領導者」。該報告分析並評價了集合資料管理、分析洞見、應用程式發展工具等功能的企業洞察平台,可見這項IBM中國開發的技術,已臻國際水平。

Forrester Research亦提到:「IBM的預集成能力可以説明客戶在一周或更短的時間內提高生產效率。其機器學習輔助的資料目錄和治理工具也留下了深刻印象。IBM平台運用了Kubernetes,在本地或公共雲中進行部署。」

IBM亦發佈Watson Machine Learning Accelerator,以幫助IBM Watson Machine Learning實現進一步擴展,加速器能夠在Power Systems和x86系統上實現高性能的GPU集群。結合IBM POWER9的GPU記憶體頻寬,提供比競爭解決方案快10倍機器學習培訓。

Leave a Reply

Your email address will not be published. Required fields are marked *