Slide
Slide
previous arrow
next arrow

Alibaba| Qwen3學術及多語言出色 開源有助中國AI全球競爭

Qwen3-235B-A22B 在多個基準測試中表現出色,尤其是在數學推理(AIME)、代碼生成(CodeForces)和多語言任務(MultiF)表現不俗。

[Alibaba]

阿里巴巴集團發佈開源大語言模型家族最新混合推理模型Qwen3,,融合了傳統大語言模型(LLM)與專家混合(MoE)技術。 Continue reading “Alibaba| Qwen3學術及多語言出色 開源有助中國AI全球競爭”

富途接入DeepSeek分析證券 算法交易飛入尋常百姓家

算法交易飛入尋常百姓家

富途
富途創辦人兼董事長李華:以安全、合規、有效三項原則為前提,推動AI簡化投資。:以安全、合規、有效三項原則為前提,推動AI簡化投資。

隨著DeepSeek全面開源,不少機構可以部署在內部,確保數據安全。富途宣佈引入DeepSeek推出牛牛AI,以生成式AI助用戶分析市況。 Continue reading “富途接入DeepSeek分析證券 算法交易飛入尋常百姓家”

企業轉型| 推低代碼多Agent平台 商湯助企業建AI應用

LazyLLM
「Lazy」意為「懶惰」,商湯命名「LazyLLM」,無需具高超技術或複雜操作,協助用戶輕鬆解決問題。

[企業轉型]

國內多家公有雲接入DeepSeek,利用Agent建立應用和知識庫,商湯提供DeepSeek推理和定制外,再推出開源Agent平台,以加快建立應用。

商湯大裝置萬象平台已提供DeepSeek-R1和DeepSeek-V3模型,免費版提供3個月內千萬Token,再正式推出企業版,完成免費版國產化適配與擴大算力容量。 Continue reading “企業轉型| 推低代碼多Agent平台 商湯助企業建AI應用”

自主科技| 理大研究大模型訓練 無限融合引領AI突破

香港理工大學楊紅霞教授
香港理工大學楊紅霞教授解釋,InfiFusion長遠意義,在於全球知識領域盈千上萬,散佈不同專家手上,目前AI訓練少數人操縱,許多人無從參與,長遠窒礙通用AI出現。

[自主科技]

中國AI晶片進口受限,科學家另闢蹊徑,DeepSeek大幅減少AI算力要求後,本港學者亦開拓研究,讓更多人參與AI。

上星期,DeepSeek再在arxiv發表論文,提出注意力機制NSA,減少超長文本訓練和推論資源算力,引起關注。另一群AI學者在arxiv則提出嶄新大模型融合策略InfiFusion,大幅減少算力需求,文章第一通訊作者為香港理工大學楊紅霞教授。 Continue reading “自主科技| 理大研究大模型訓練 無限融合引領AI突破”