3月20-21日,華為中國合作伙伴大會2025在深圳舉行。會上,恒生電子正式發布光子大模型一體機DeepSeek版,基于昇騰800I A2推理服務器,為金融機構提供“開箱即用”的全棧式金融AI引擎,助力金融機構快速完成大模型的部署落地,加速金融行業數智化轉型進程。
2025年開年,DeepSeek憑借“低成本+高性能+高開放度”的應用優勢,為金融機構提供了更智能、更高效、更低成本的基礎大模型底座。但在實際接入DeepSeek的過程中,仍存在諸多挑戰:算力選型困難、部署交付周期長、數據安全與隱私風險、缺乏標準化知識增強方案、應用效果需要持續優化等。
針對以上痛點,恒生電子聯合華為昇騰,打造全棧國產化的光子大模型一體機DeepSeek版,提供了從底層算力資源池、模型服務平臺、企業級知識庫、智能體編排生態組件到系統交付和運維的全棧開放能力,覆蓋模型調試、部署到運營全流程,具備一站式交付、成本優化、合規風險控制等優勢特點,有效降低大模型引入門檻,助力金融機構實現高性價比AI基建。
據了解,恒生光子大模型一體機DeepSeek版支持部署DeepSeek R1/V3滿血版,在2臺16卡昇騰推理服務器上可部署671B滿血版DeepSeek,基于國產開源推理引擎MindIE實現高并發高吞吐性能,在金融行業最典型的4096tokens輸入,1024tokens輸出場景下,2臺16卡昇騰推理服務器在滿足單路輸出10tokens/s體驗下,可支持超過100路并發,同時滿足了單路時延和高并發需求,性能領先業內標桿水平。
此外,恒生光子大模型一體機內置100+通用模型(如:DeepSeek蒸餾版、Qwen、Llama、GPT、GLM、圖像模型、音頻模型、視頻模型等),支持AI應用響應多樣性請求,基于大模型MaaS平臺實現多模型管理及智能調度,既滿足對于要素提取、內容審核等離線任務場景,又可以滿足長文本理解輸出、多輪對話、復雜數據等特定業務生成場景。客戶可以根據“場景+體驗+成本”選擇不同的模型底座。
一體機的軟硬一體私有化部署模式,一方面AI全棧套件的一站式交付,讓交付周期縮短40%,同時通過軟硬件協同優化與資源智能調度,減少算力冗余,縮短部署周期,助力金融機構輕資產投入高效轉型;另一方面,確保機構數據全程在本地服務器處理,保障數據主權,內置知識安全合規管控和完善的知識生命周期管理,規避敏感信息外泄風險,推動知識安全有效的累積與共享。
值得一提的是,一體機提供的AI智能體編排服務,為金融機構提供通用任務AI智能體的定制開發支持服務,賦能廣泛用戶群體,推動“AI平權”。此外,數據的質量對于大模型至關重要。恒生電子通過自主研發iKnow知識平臺,提供知識入庫支持服務,助力金融機構基于自身核心業務數據構建專屬知識庫,從而讓大模型“更懂企業、更懂業務”,釋放業務數據價值,提升AI服務質量。
恒生電子光子大模型一體機的全棧AI能力,真正打通了AI應用的“最后一公里”,可以幫助金融機構快速實現這些智能應用的開發與上線,實現降本增效和價值創造的建設目標。
目前,恒生電子已面向金融核心業務場景,推出投顧智能助手、投顧內容生成、崗前仿實戰培訓、智能投研助手、托管運營助手、內外智能審查助手、智能數據統計生成、代碼自動生成、AI測試等智能應用。
當前,大模型技術正在逐步進入產業化應用階段,以大模型一體機為代表的軟硬協同解決方案已成為推動行業智能化升級的關鍵基礎設施,助力大模型應用進入普惠階段。未來,恒生電子也將繼續攜手國內優秀的算力廠商、大模型廠商,構建性能卓越、安全可控的AI底座,共建安全、高效、普惠的金融數智化新生態,為金融行業注入最前沿的科技能力。
【免責聲明】【廣告】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
最新評論