AI 新創公司 OpenAI 在美西時間周四 (7 日) 發布備受期待的新一代大模型 GPT-5,並宣布向所有用戶開放使用,包括免費用戶。這是 OpenAI 近年來最受關注的一次升級,執行長奧特曼在發布會上宣稱 GPT-5 能力已從「大學生水準」躍升至「博士級專家」,並強調該模型在綜合能力上已達到全球最高。
發布會的關鍵字可以簡單概括為「專業」和「聰明」。「專業」體現在 GPT-5 在健康、程式設計、教育等多個場景中展示更強的能力,同時降低幻覺率,提升可靠性。
「聰明」則主要是 GPT-5 首次採用整合架構,能根據用戶指令的複雜度,自動調用最合適的模型,無需用戶手動切換,並支援更多個性化功能。
但外界反應卻較為平淡,部分使用者和實務工作者認為,GPT-5「缺乏驚喜」,一方面是因為先前版本發布頻繁,預期被不斷拉高。
AI 從業人員雲中江樹在 GPT-5 發布前便持觀望態度,因從過去幾輪升級來看,實際表現往往低於宣傳,但仍期待 GPT-5 這次能在推理和編程上帶來突破,真正拓寬應用場景。
儘管 GPT-5 降低了幻覺率,但發表會上出現的兩處低級錯誤仍引發爭議。一是 GPT-5 在解釋伯努利效應時,錯誤地採用被主流物理學教材已經證偽的「等時通過理論」;二是在製作圖表時,某項評分明明低於對比模型,對應的柱狀圖卻顯示更高,這也讓外界懷疑 GPT-5 的能力被誇大了。
發布會一開場,奧特曼便高度讚賞 GPT-5 的強大,強調 GPT-5 相較前代模型已經發生質變。
根據 OpenAI 公佈的基準測試結果,GPT-5 在速度、可靠性和準確性上均處於行業領先地位,尤其在複雜推理、編程、醫療健康等領域表現突出。
除了更「專業」,在使用體驗上,GPT-5 變得更聰明了。
專家指出,最大的改變是 OpenAI 採用了整合架構,首次將大語言模型 (LLM)GPT 系列和推理模型 o 系列融合。GPT-5 也變得更像人,支援客製化語音、語速調節等個人化功能,具備「助理」功能,提升使用者工作效率。
目前,GPT-5 已經對免費、Plus、Pro 等用戶開放,對企業和教育用戶下週開放,按照企業級套餐計費。免費用戶使用有額度限制,付費用戶中的 Plus 用戶可獲得更高的使用額度,Pro 用戶可專屬存取 GPT-5 Pro。
專家認為,GPT-5 發布後,業界最關心的三個問題是幻覺率降低、價格更具性價比和在程式設計領域的突破。GPT-5 在多個使用情境下的幻覺率相比前代模型有所下降,API 呼叫價格分層設置,最低的是 GPT-5 nano,比 GPT-4 最便宜的模型還要低。
OpenAI 花了近一半的時間強調 GPT-5 的程式設計實力,官方稱 GPT-5 為「迄今為止最強大的程式設計模型」。
儘管 GPT-5 實現多方升級,但多位從業人員認為,這更像是一次架構與工程優化升級,而非真正意義上的世代躍遷。
不過,石榴數位人創辦人沈仁奎指出,雖然 GPT-5 不是全產業顛覆式的升級,但在推動 AI 商業化上的作用不容小覷。OpenAI 這次也打起了 ToG 的主意,與美國總務管理局進行合作,展現出藉著 GPT-5 從「平台工具」加速轉型為「社會基礎設施」的野心。
他觀察到,目前一些垂直類企業,比如醫藥、生技等領域的企業及 Uber、Salesforce 等已部署 GPT-5,應用於科研分析、客戶服務與運營決策等環節。在部分新興工具平台如 Cursor、Windsurf 等開發平台也已集成 GPT-5,以改善自身程式設計效率與智慧交互體驗。企業們願意積極擁抱 GPT-5,除因其能力有所升級外,也在於「白菜價」的 API 策略。
他還指出,三類企業會率先吃到 GPT-5 的紅利,第一是軟體開發平台,利用 GPT-5 自動代碼生成、調試與工具鏈集成,提升開發效率;;第二類是專注於知識管理與決策系統的公司,GPT-5 能快速深入並解決金融、醫藥、法律等需複雜推理與輔助決策的場景;第三是消費級智慧服務類企業,它們涉及大量寫作助手、學習平臺與跨媒體內容創作服務,可藉助 GPT-5 的多模態與個人化提升使用體驗。
某種意義上,GPT-5 帶來的最大改變,或許不是模型本身,而是它所觸發的生態。目前,AI 的戰爭已經從模型能力比拼,走向基礎能力與商業落地的全面競賽。
新聞來源 (不包括新聞圖片): 鉅亨網