能夠如真人一般思考?OpenAI公布最新自然語言模型「o1」





OpenAI推出最新自然語言模型「o1」,也被認為是先前被傳聞出代號「Strawberry」的產品。


OpenAI強調,「o1」模型主要是能夠在做出反應之前花更多時間思考,它們可以透過複雜的任務進行推理,並解決比以前的科學、寫程式和數學模型更困難的問題。


「我們訓練這些模型在做出反應之前花更多的時間思考問題,就像人類一樣。而透過培訓,它們學會完善自己的思考過程、嘗試不同的策略,並意識到自己的錯誤,更從錯誤中進行修正,以增加解答的準確率。」該公司進一步指出。


在OpenAI的測試當中,「o1」模型在物理、化學、生物學、數學、寫程式等領域上的表現非常出色,像是在國際數學奧林匹克(IMO)資格考試中,GPT-4o只正確解決了13%的問題,但「o1」的正確率卻提升至83%。


與先前推出的GPT系列模型不同,「o1」本身不具備網頁瀏覽功能,也無法上傳文件和圖像,基本是都是透過模型訓練基礎來進行互動學習及成長,不過這對於複雜的推理任務來說是一個重大的進步,代表了人工智慧能力的新層次。


也因為如此,OpenAI將此模型的數字重設為1,並將該系列命名為OpenAI o1。





此外,在資訊安全方面,OpenAI提出一種新的安全培訓方法,利用它們的推理能力,使它們遵守安全準則,透過在上下文中推理安全規則來進行更有效的應用。


OpenAI解釋其衡量安全性的一種方法,就是測試模型在使用者試圖越獄時繼續遵循其安全規則的情況,而在OpenAI最難的越獄測試之一中,GPT-4o得分為22(評分範圍為0-100),而o1-preview模型得分為84。


(以上圖片取自OpenAI官網)