通義千問 Qwen3-4B 新模型發布，端側性能大躍升_企業新聞稿

通義千問 Qwen3-4B 新模型發布，端側性能大躍升

2025-08-07 09:17

　　8 月 7 日消息，昨日(8 月 6 日)，通義千問 Qwen 發布公告，宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 兩個模型，實現了性能的大幅提升。

　　官方指出，小型語言模型(SLM)在智能體人工智能(Agentic AI)的發展進程裡具有極高價值。而 “2507” 版本的 Qwen3-4B 模型，具備體積小巧但性能強勁的特點，尤其适合在手機等端側硬件上進行部署。

　　根據相關博文介紹，在非推理(non-thinking)領域，Qwen3-4B-Instruct-2507 顯著增強了通用能力，目标是成為更為全能的端側得力工具。

　　該模型掌握了更豐富的語言知識以及長尾知識，其上下文理解長度擴展到了 256K，即便作為小模型也能夠處理長文本。在通用能力方面，該模型超越了閉源的小尺寸模型 GPT-4.1-nano，性能與同等規模的 Qwen3-30B-A3B(non-thinking)相近。

　　官方表示，該模型更像是一位高效的 “執行專家”，能夠嚴格遵循指令，迅速給出響應，在内容創作、工具調用等方面更為适用。

　　在推理(thinking)領域，Qwen3-4B-Thinking-2507 的推理能力有了大幅提升，在 AIME25 測評中獲得了高達 81.3 分的成績。Qwen3-4B-Thinking-2507 的推理表現可與中等模型 Qwen3-30B-Thinking 相媲美，在聚焦數學能力的 AIME25 測評中，以僅 4B 的參數量取得了 81.3 分的優異成績。

　　官方稱此模型如同一位嚴謹的 “學術專家”，面對複雜問題時能夠逐步展開推理，完成任務的過程更加深入且可靠。

消息來源: 朝聞通新聞稿發布平臺