突破大模型對齊瓶頸,北大團隊攜手昇騰打通產業應用通路
2025-11-14 10:49:38 責任編輯:
摘要:在生成式人工智能迅猛發展的背景下,多模態大模型已成為推動產業智能化升級的核心技術。然而,模型訓練與推理的高成本、多模態數據對齊的復...
在生成式人工智能迅猛發展的背景下,多模態大模型已成為推動產業智能化升級的核心技術。然而,模型訓練與推理的高成本、多模態數據對齊的復雜性,仍是制約其深入應用的瓶頸。北京大學人工智能研究院助理教授楊耀東團隊研發出一套覆蓋全模態、兼顧高效率、賦能強推理的大模型對齊框架——Align-Anything,并依托鯤鵬昇騰科教創新卓越中心(以下簡稱“卓越中心”)的算力支持成功遷移至昇騰平臺,目前,已在智慧醫療、網絡安全等多個關鍵領域實現規模化落地,展現了廣闊的應用前景,并在人才培養方面取得顯著成效。

Align-Anything以“語言反饋”(RLHF)為核心,構建了一套覆蓋文本、圖像、音頻、視頻乃至動作的全模態對齊算法,解決了傳統二元反饋信息量有限和一致性的問題。基于成熟的技術架構,團隊在Align-Anything中集成專用評估工具Eval-Anything,可追蹤并評估各類大參數模型在復雜任務中的真實能力,目前已實現開源;團隊還拓展出基于DeepSeek-671B的多模態強推理模型Align-DS-V,以模態穿透賦能智能邊界拓展。
在產學研協同方面,北大團隊與昇騰的合作從技術研發延伸至行業落地與人才培養的全鏈條。
在行業的安全治理方面,Align-Anything 深度融入智源大模型安全中心的整體安全治理框架,作為統一的安全對齊與風險干預基礎模塊。依托智源在安全評測、紅隊攻防與合規審查上的體系化能力,Align-Anything 將安全偏好建模、風險內容識別與無害化改寫串聯為閉環流程,被部署在大模型從訓練前審核、訓練中約束到推理后校驗的多級安全環節中。通過與通用模型、安全評測平臺及在線監控系統的模塊化集成,該對齊器能夠自動對潛在風險回復進行識別、攔截與規范化重寫,在顯著提升整體安全水位、降低有害內容輸出的同時,有效保持模型的通用能力與業務可用性,為智源牽頭的大模型安全治理體系持續貢獻底層技術力量。
在行業應用側,基于昇騰平臺的Align-Anything深度賦能智慧醫療場景。Align-Anything充分發揮了昇騰軟硬件平臺的技術實力,構筑了全模態醫學知識體系。在基礎設施層面,多家醫院完成了昇騰服務器的機房部署,其強大的異構計算能力與高內存帶寬,可支撐大規模參數模型的高效并行訓練,同步自研大模型推理一體機,支持科室本地化部署,快速調取算力;在算法層面Align-Anything支持圖文、文表、圖結構等多模態交互,賦能涵蓋臨床指征、心電圖、超聲心動圖等全模態數據的高效訓練。
在人才培養層面,團隊聯合昇騰在北大推出《大語言模型基礎與對齊技術》課程,并開展基于昇騰 + Torch NPU的實操體驗,同時開發兼容昇騰系列計算設備的課程作業代碼,在課程作業中讓學生在自主創新的GPU架構上進行模型的訓練和微調。
基于昇騰平臺的Align-Anything框架的發布和廣泛落地應用,標志著北大團隊與卓越中心協同攻關取得重要階段性成果。自合作以來,卓越中心在算力和技術等方面為團隊提供了全方位支持,是項目成功的重要保障。該成果不僅為學術界提供了可復用的基礎工具,也通過昇騰算力實現了高性能與高效率的統一。未來,雙方將繼續深化全模態對齊探索,攜手推進大模型技術體系建設。
聲明:
凡文章來源標明“中國智能交通網”的文章版權均為本站所有,請不要一聲不吭地來拿走,轉載請注明出處,違者本網保留追究相關法律責任的權利;所有未標明來源為“中國智能交通網”的轉載文章均不代表本網立場及觀點,“中國智能交通網”不對這些第三方內容或鏈接做出任何保證或承擔任何責任。
征稿:
為了更好的發揮中國智能交通網資訊平臺價值,促進諸位自身發展以及業務拓展,更好地為企業及個人提供服務,中國智能交通網誠征各類稿件,歡迎有實力的企業、機構、研究員、行業分析師投稿。投稿郵箱: itsshenzhen@163.com
(查看征稿詳細)