在 AI 編程能力競技的全球舞臺上,中國科技企業再次交出亮眼成績單。阿里巴巴最新研發的大語言模型 Qwen 3.6-Plus 在 Code Arena 旗下 React 專項榜單中斬獲第二名,不僅超越了 OpenAI、Google 等國際科技巨頭的同類產品,更成為該榜單中表現最優的中國大模型。
該榜單聚焦 Web 開發場景下的自主編碼能力,要求模型獨立完成從項目初始化到調試運行的全流程開發。測試標準涵蓋工程思維完整性、端到端開發能力以及復雜問題解決效率等多個維度,被業界視為衡量 AI 編程實力的 " 試金石 "。Qwen 3.6-Plus 以 1528 分的成績緊追 Anthropic 旗下 Claude-Opus-4.6-Thinking(1540 分),同時領先于 OpenAI 最新發布的 GPT-5.0-High 和 Google 的 Gemini 3.1 Pro Preview。
這款于 4 月 2 日正式發布的模型,在代碼生成質量與工程化能力方面展現出顯著優勢。測試數據顯示,其在處理多文件協同開發、第三方庫調用等復雜任務時,代碼通過率較前代提升 37%,調試效率提高 42%。特別在需要創造性解決方案的場景中,模型展現出的邏輯推理能力獲得評審團高度評價。在 Code Arena 綜合編程能力榜單中,Qwen 3.6-Plus 同樣位居中國模型榜首。
據研發團隊透露,Qwen 3.6-Plus 作為千問 3.6 系列的首發模型,后續將開源不同參數規模的版本以滿足多樣化需求。更值得期待的是,性能更強的旗艦模型 Qwen3.6-Max 已完成內部測試,預計將在近期正式發布。這款新模型在長文本處理、多模態交互等維度實現突破,有望進一步縮小中國 AI 與國際頂尖水平的差距。
來源:https://www.cnu.com.cn/industry/202604/181064.html