8 月 7 日消息,昨日(8 月 6 日),通義千問 Qwen 發布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 兩個模型,實現了性能的大幅提升。
官方指出,小型語言模型(SLM)在智能體人工智能(Agentic AI)的發展進程裡具有極高價值。而 “2507” 版本的 Qwen3-4B 模型,具備體積小巧但性能強勁的特點,尤其适合在手機等端側硬件上進行部署。
根據相關博文介紹,在非推理(non-thinking)領域,Qwen3-4B-Instruct-2507 顯著增強了通用能力,目标是成為更為全能的端側得力工具。
該模型掌握了更豐富的語言知識以及長尾知識,其上下文理解長度擴展到了 256K,即便作為小模型也能夠處理長文本。在通用能力方面,該模型超越了閉源的小尺寸模型 GPT-4.1-nano,性能與同等規模的 Qwen3-30B-A3B(non-thinking)相近。
官方表示,該模型更像是一位高效的 “執行專家”,能夠嚴格遵循指令,迅速給出響應,在内容創作、工具調用等方面更為适用。
在推理(thinking)領域,Qwen3-4B-Thinking-2507 的推理能力有了大幅提升,在 AIME25 測評中獲得了高達 81.3 分的成績。Qwen3-4B-Thinking-2507 的推理表現可與中等模型 Qwen3-30B-Thinking 相媲美,在聚焦數學能力的 AIME25 測評中,以僅 4B 的參數量取得了 81.3 分的優異成績。
官方稱此模型如同一位嚴謹的 “學術專家”,面對複雜問題時能夠逐步展開推理,完成任務的過程更加深入且可靠 。