能聽能講聊天機械人大勢所趨  難分真人對話孰真孰假

Asiabots
加上友善頭像,話音機械人與真人接待處無異。

眾創時代

早前IDC發表《全球AI支出指南》報告,指出今年AI人工智能支出以軟件與服務各佔超過整體三分之一,當中以零售業將AI,投放在聊天機械人(Chatbot)的發展最為顯著。Facebook、Google及Microsoft等科技巨頭都在近年積極發展聊天機械人,以接近人性對話為大前提。

Google於年初推出開放領域聊天機械人Meena,採用26億個參數的對話模型,能與人類就不指定的話題進行對話;另一邊廂,Facebook亦於年中推出Blender;Microsoft也於7月期間,將其AI助理小冰(Xiaoice)的業務分拆為獨立運作。科技巨擘在AI聊天機械人範疇磨拳擦掌,本港企業亦不甘落後,積極發展本地化的聊天機械人,更取得驕人佳績。

Asiabots參加「IFTA金融科技成就大獎2019」,晉身創新科技類別中的最後三強。Asiabots創辦人兼行政總裁黃梓豪Thomas表示,公司團隊早於三年前已開始發展voicebot的話音技術。他們有感目前不少企業開發chatbot或voicebot都只在應用外國技術,未必能夠切合本地企業廣東話及英語夾雜的語境所需。因此,從四面八方搜集本地話音數據,以自己一套「港式」數據庫研發地道的聊天機械人。

早於10幾年前不少本地企業,例如銀行或政府機構使用的互動話音系統(IVR)作為客戶服務,時至今日不少系統已為人詬病,例如聲調極不自然,似在模仿機械人沉悶單調的發音風格;又或者需要致電者重覆聆聽多次電話指示,然後按指示按鍵,由1聽至9已耗費了不少時間,有時也因為按錯鍵而要將整個通話取消,費時失事。

隨著企業網站及手機應用普及,企業如銀行、航空公司或電子商務也在網站加入文字式的chatbot,免卻聘請接聽電話查詢的客戶服務人員,需要全天候守候。儘管如此,大部分企業都只選用由歐美開發的聊天機械人技術,未必能完全與本地粵英混雜的文字語境相配,促使Thomas與其團隊研發廣東話自然語意系統(Cantonese Natural Language Processing,簡稱NLP),決心打造地道的話音聊天機械人。

提到voicebot,我們都會聯想到Amazon Alexa、Apple Siri、或OK Google,只限以聲音作為取決元素,缺乏按鈕、列表、建議答案和選項等文字Chatbot的元素。除此以外,voicebot與chatbot無論在使用和構造也不盡相同,前者擁有人工智能自然語意處理(natural language processing)、話音識別系統(automatic speech recognition)和話音合成系統。

Asiabots
(左起) Asiabots創辦人兼行政總裁黃梓豪,及另一創辦人兼財政總監岑潮輝與團隊積極發展地道的話音機械人。

Thomas表示,香港市場較小,要建立廣東話的詞彙庫,相比廣泛使用的英語或普通話龐大數據較為困難。發展至今,他們團隊透過「刨網頁」,解讀網上新聞、網上論壇,擷取更多本地使用的詞彙,增加其數據庫應對的「真人」程度。同時,Asiabots亦透過使用本地大學,例如中大及理大的資源進行協作。

Thomas表示,目前已在模擬人聲的像真度愈來愈高,接近自然人聲,文字上有時難以解讀,但透過話音就能夠較易掌握。不過在開發voicebots最困難之處,除了增加本地詞彙外,另一痛點就是要處理交談者談話時的語氣,因為相同句子以不同語氣表達,可以衍生千變萬化的含義。Voicebot或chatbot顧名思義是機械人,因此沒有同理心,既無法理解交談者的感受,也無法回應自己所感,只能透過訓練而理解的當下陳述,作出合適回應。

Asiabots
無人大堂除了可減免人手外,尤其適合現今亟需社交距離的商場或辦公室應用。

Asiabots運用自然語言理解(Natural Language Understanding,NLU),令voicebot也略懂「讀心術」,將語句當中關鍵字拆解,尋找整句說話的實體(entity) 和意圖(intention),從而配對最貼近的回應。不過,Thomas也表示一旦發現交談當中出現問題,會立即由voicebots轉交由真人客戶服務處理。

Asiabots另一創辦人兼財政總監岑潮輝Chris直言,AI的發展一日千里,但絕不讓歐美技術專美,國內市場尤以深圳的技術發展更是無可比擬。無論醫療方面自助式醫療服務的AI「無人診所」連接「智能藥櫃」、智能酒店的「無人大堂」等,均已經取締傳統重覆性的工作。問及本地企業對於voicebots的應受程度,目前已有不少企業如航空公司、教育機構應用,更有視障人士機構應用此技術,令其會員可以致電查詢時,毋須再透過按鍵選項。目前尚仍有不少企業管理層,未了解如何將此技術融入自己的服務當中,最困難之處更是如何將原有的系統,例如與固有的IVR互動話音系統整合。

Voicebots
航空公司使用voicebots增加雙向互動擷取資訊,比在顯示屏展示單調資料更具人性化。

話音機械人能夠在「多重訓練」下變得越來越人性化,加上有「情緒元素」,直逼真人對話。用戶與話音機械人之間不一定只做資訊交換,更可進一步產生某種程度的情感交流。再者,技術亦已發展至可以模擬指定人聲,假以時日,當日後接到某公司來電時,可能也要猜想對方交談者是真人,還是機械人? 

Leave a Reply

Your email address will not be published. Required fields are marked *