Anthropic發布Claude Opus 4.7:金融分析能力登頂公開模型 軟件工程、多模態全面進階

財聯社4月17日訊(編輯 史正丞)AI產業明星公司Anthropic周四推出旗艦人工智能模型Claude Opus的4.7版本,側重於軟件工程領域的提升,同時在金融分析、視覺能力和創作“品味”方面均實現了長足的進步。

Anthropic發布Claude Opus 4.7:金融分析能力登頂公開模型 軟件工程、多模態全面進階 -

(來源:公司官網)

公司也表示,Claude Opus 4.7與強悍到無法公開發布的Mythos“神話”模型存在全方位的能力差距。但後者目前僅供一小撮頂級機構先行試用,尋找應對“AI網絡浩劫”的破解之道,短期內恐無緣公開面世。

Anthropic公布的基準測試結果也印證了這種說法。在大多數AI模型“跑分”中,Opus 4.7較兩個月前發布的Opus 4.6,以及競品GPT-5.4都要高出一頭,但和Mythos明顯不在一個檔次上

Anthropic發布Claude Opus 4.7:金融分析能力登頂公開模型 軟件工程、多模態全面進階 -

當然,即便能力比不上Mythos,Claude Opus 4.7依然是地球打工人眼下能用到的最頂級大模型。

Anthropic介紹稱,Claude Opus 4.7在遵循指令方面出現顯著提升。過往的模型可能會寬鬆地“糊弄”指令或完全跳過部分指示,但Opus 4.7會嚴格按字面執行指令。

因此,Opus 4.7在高級軟件工程領域較4.6有顯著提升,特別是在“最困難的任務”上。Opus 4.7能以嚴謹和一致的方式處理複雜、長期運行的任務,精確遵循指令,並在反饋結果前想出驗證自身輸出的方法。

除了軟件工程師外,Opus 4.7對金融分析師和更廣泛的辦公室白領也能提供更強大的賦能。

Opus 4.7在“金融分析代理”測試中,取得了全球AI大模型最高的得分。相較4.6版本,能夠生成嚴謹的分析與建模、更專業的報告展示,並在各項任務間實現更緊密的整合。在衡量AI在金融、法律和其他知識性工作的GDPval AA測試中,Opus 4.7也拿到行業領先的成績。

Anthropic發布Claude Opus 4.7:金融分析能力登頂公開模型 軟件工程、多模態全面進階 -

Opus 4.7的多模態能力也迎來關鍵更新,現在能夠識別邊長最長達2576像素的圖像,是之前的三倍多。Anthropic表示,在完成專業任務時,Opus 4.7能表現得更有“品味”且更具創造力,能夠生成質量更高的界面、演示文稿和文檔

此外,Opus 4.7在使用基於文件系統的記憶方面更為出色。它能在長時間、多會話的工作中記住重要筆記,並將其用於開展新的任務,因此新任務需要更少的前置上下文。

定價方面,Opus 4.7與4.6一致,每百萬輸入詞元5美元,每百萬輸出詞元25美元。

Anthropic也提醒稱,Opus 4.7使用了一套更新的分詞器,提升了模型處理文本的方式。這導致相同輸入內容可能會被映射為更多的詞元,大約在1-1.35倍之間。

同時在高計算強度下,尤其是在智能體多輪交互場景的後續輪次中,Opus 4.7會進行更多“思考”。這提高了模型處理複雜問題的可靠性,但也會產生更多輸出詞元。所以用戶需要在模型能力和錢包深度之間進行取捨。整體而言,消耗同等詞元,模型產出的結果能夠出現正向提升。

Anthropic發布Claude Opus 4.7:金融分析能力登頂公開模型 軟件工程、多模態全面進階 -

(各努力等級下模型隨詞元使用量變化的得分)

(財聯社 史正丞)

分享你的喜愛