阿里巴巴(09988.HK) -0.600 (-0.503%) 沽空 $10.88億; 比率 13.674% 通義千問於內地微訊發布更小尺寸新模型——Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 。
帖文指,今次大幅提升新模型性能。在非推理領域,Qwen3-4B-Instruct-2507 全面超越了閉源的 GPT4.1-Nano;在推理領域,Qwen3-4B-Thinking-2507能夠和中等規模的 Qwen3-30B-A3B (thinking)媲美。
相關內容《大行》瑞銀料美進口商品加權平均關稅率或升至18%以上 市場未重視風險 但重申「增持」中國市場等
通義千問相信, 小型語言模型(SLM)對代理式人工智能(Agentic AI)的發展極具價值。「2507」版本的 Qwen3-4B 模型不但體積小,而且性能強,同時有利於手機等端側硬件部署,期待更多的AI硬件採用Qwen3-4B-2507新模型系列。目前新模型已在魔搭社區、Hugging Face正式開源。(ca/u)
(港股報價延遲最少十五分鐘。沽空資料截至 2025-08-07 16:25。)
AASTOCKS新聞