介紹 o3 和 o4-mini - ChatGPT 迄今為止最大的升級

2025年5月1 分鐘閱讀

分享給

Copy Link

OpenAI 新模型介紹
性能基準
視覺推理能力
記憶和個性化功能
編碼和問題解決能力
與舊版模型的比較
估算和假設
用戶體驗和模型選擇
教育資源和課程
結論
常見問題

OpenAI 新模型介紹

OpenAI 最近在 ChatGPT 中推出了三個新模型：03、04 Mini 和 04 Mini High。這些模型旨在增強推理能力，使其在生成回應之前能更有效地處理信息。03 模型將取代舊的 01 模型，而每月 200 美元的專業計劃也將逐步淘汰舊版的 01 Pro 模式。

性能基準

新發布的模型是 OpenAI 迄今為止最先進的，展示了可以通過各種基準進行評估的獨特能力。例如，04 Mini 的得分為 2719，使其位於全球前 200 名編碼者之中。在多模態推理方面，04 Mini 的得分為 81%，而 03 的得分略高，為 82%，這表明根據任務的不同，03 在某些情況下可能會超越 04 Mini。

視覺推理能力

04 Mini High 模型的一個突出特點是其在視覺推理方面的能力。例如，當提供一張船隻的圖片時，它可以識別該船並自主使用網絡搜索確定其下一個停靠位置。這一能力展示了該模型將視覺數據與實時信息檢索相結合的能力。

記憶和個性化功能

新的記憶功能使模型能夠回憶起先前的互動，增強了其提供個性化回應的能力。例如，當被要求根據過去的對話分享有趣的新聞時，該模型能有效利用其記憶提供相關信息，展示其先進的推理和搜索能力。

編碼和問題解決能力

這些模型在編碼任務中也表現出色。例如，當被要求創建一個簡單的 Galaga 風格遊戲時，04 Mini 能夠快速生成所需的代碼。此外，當面對涉及各種動物成本的數學問題時，04 Mini 也能高效地提供準確的解決方案，展示其強大的問題解決能力。

與舊版模型的比較

在將新模型與舊的 01 Pro 模型進行比較時，可以明顯看出新模型的速度和效率有了顯著提升。雖然 01 Pro 仍然能夠得出正確的答案，但通常需要更長的時間和更多的步驟，突顯了最新版本所取得的進步。

估算和假設

推理模型特別擅長進行估算。例如，當被要求估算紐約市的鋼琴調音師數量時，該模型根據人口假設提供了合乎邏輯的答案。這一能力得益於模型分析數據和從各種來源得出結論的能力。

用戶體驗和模型選擇

對於不熟悉最新變化的用戶來說，導航更新後的模型菜單可能會感到困惑。04 Mini High 模型推薦用於需要高級推理和視覺分析的任務，而 04 Mini 則適合一般推理任務。對於不需要推理的標準互動，用戶可能更喜歡標準的 GPT-4 模型。

教育資源和課程

對於新接觸 ChatGPT 或希望最大化使用的人，現在提供了一個初學者提示課程。這個課程涵蓋了有效使用 ChatGPT 的基本知識，並包括可下載的資源。此外，平台上還提供各種課程，滿足初學者和高級用戶的需求，並定期發布新內容。

結論

OpenAI 模型的最新更新顯著增強了其功能，特別是在推理、編碼和視覺分析方面。隨著記憶功能的引入和用戶體驗的改善，這些模型有望為用戶在各種應用中提供更大的價值。

常見問題

問：OpenAI 推出的新模型有哪些？
答：OpenAI 在 ChatGPT 中推出了三個新模型：03、04 Mini 和 04 Mini High，旨在增強推理能力。
問：新模型與舊的 01 模型相比如何？
答：03 模型將取代舊的 01 模型，而新模型的速度和效率顯著提高。
問：新模型達成了什麼性能基準？
答：04 Mini 的得分為 2719，排名全球前 200 名編碼者，而 04 Mini 在多模態推理中得分 81%，03 得分 82%。
問：04 Mini High 模型的突出特點是什麼？
答：04 Mini High 模型在視覺推理方面表現出色，能夠識別圖像中的物體並檢索實時信息。
問：新模型如何利用記憶和個性化？
答：新的記憶功能使模型能夠回憶起先前的互動，從而根據過去的對話提供個性化的回應。
問：新模型能否協助編碼任務？
答：是的，這些模型在編碼任務中表現出色，例如快速生成遊戲代碼和高效解決數學問題。
問：相較於舊版模型有什麼改進？
答：新模型比舊的 01 Pro 模型更快、更高效，而後者需要更長的時間和更多的步驟才能得出正確答案。
問：這些模型如何處理估算？
答：推理模型擅長進行估算，使用基於數據和人口假設的邏輯分析。
問：哪個模型推薦用於高級推理任務？
答：04 Mini High 模型推薦用於需要高級推理和視覺分析的任務。
問：是否有針對新用戶的教育資源？
答：是的，提供了一個初學者提示課程，以及針對初學者和高級用戶的各種課程。
問：最新更新的主要增強是什麼？
答：這些更新顯著增強了推理、編碼和視覺分析的功能，並改善了用戶體驗和記憶功能。