91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI與Anthropic對戰(zhàn),Claude Opus 4.6與GPT-5.3-Codex同日發(fā)布

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-02-06 14:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道 北京時間2月6日凌晨,Anthropic與OpenAI分別推出了新版本基礎大模型——Claude Opus 4.6和GPT-5.3-Codex。

?


Claude Opus 4.6:重大升級,表現(xiàn)卓越

Claude Opus 4.6是Anthropic對其旗艦人工智能模型的一次關鍵升級。此版本規(guī)劃更謹慎,能維持更長時間自主工作流程,在企業(yè)關鍵基準測試中超越了包括GPT-5.2在內(nèi)的眾多競爭對手。

新模型首次擁有100萬token的上下文窗口,極大提升了AI處理和推理信息的能力。同時,Anthropic在Claude Code中引入類似Kimi K2.5的“智能體團隊”研究預覽功能,允許多個AI智能體同時處理編碼項目不同方面并自主協(xié)調(diào)。

Opus 4.6可將增強功能應用于多種日常工作任務,如運行財務分析、進行研究以及使用和創(chuàng)建文檔、電子表格和演示文稿。在Cowork環(huán)境中,它能自主執(zhí)行多任務,代表人類運用各項技能。

在多項評估中,Opus 4.6成績斐然。在智能體編碼評估工具Terminal-Bench 2.0中取得最高分,在復雜多學科推理測試“人類最后的考試”中領先其他前沿模型。在GDPval-AA測試中,其表現(xiàn)比GPT-5.2高出約144個Elo分數(shù),比前代Claude Opus 4.5高出190分。此外,在衡量模型在線查找難尋信息能力的BrowseComp測試中,它也優(yōu)于其他模型。

Opus 4.6現(xiàn)已在claude.ai、API及所有主流云平臺上線,定價不變,每百萬token為5美元/25美元。針對大模型常見的“上下文腐爛”問題,Opus 4.6性能顯著優(yōu)于前代。在MRCR v2的8針1M變體測試中,Opus 4.6得分76%,而Sonnet 4.5僅18.5%,這表明其在保持性能的同時,可利用的上下文信息量大幅提升。

為證明其強大智能體能力,Anthropic研究員用16個智能體從零構建基于Rust的C語言編譯器。最終AI輸出10萬行代碼,可編譯Linux內(nèi)核,耗資2萬美元,歷經(jīng)2000多次Claude Code會話、兩周時間完成。該編譯器能在x86、ARMRISC-V上構建可啟動的Linux 6.9,通過GCC 99%的壓力測試,可編譯FFmpeg、Redis等軟件,還能編譯并運行Doom游戲。代碼可在相關GitHub鏈接查看。雖無人類編寫代碼,但研究人員在測試設計、構建CI管道等方面發(fā)揮了重要作用,這似乎預示著未來AI工作流程中人類角色的轉變。

GPT-5.3-Codex:編程強模,潛力無限

OpenAI推出的GPT-5.3-Codex號稱世界上最強大的智能體編程模型。

在編程基準測試中,GPT-5.3-Codex在SWE-Bench Pro和Terminal-Bench 2.0中取得SOTA成績,在OSWorld和GDPval等智能體能力和真實世界任務測評中,較GPT-5.2-Codex有所提升。不過,OpenAI參加的基準測試數(shù)量較少,且與Claude Opus 4.6重疊不多,得分僅供參考。在Terminal-Bench 2.0上,GPT-5.3-Codex得分比Claude Opus 4.6高11.9%。

為展示編程能力,OpenAI展示了一款由GPT-5.3-Codex打造的賽車游戲,游戲有多輛賽車比拼、8張地圖,還能用空格鍵使用道具,雖畫風簡陋但完成度高,體驗鏈接已給出。

此外,GPT-5.3-Codex是OpenAI首個在自我創(chuàng)建中發(fā)揮關鍵作用的模型,其早期版本助力團隊加速模型開發(fā)。它結合了GPT-5.2-Codex的編程能力和GPT-5.2的推理能力與專業(yè)知識儲備,速度提升25%。這意味著它不僅可用于編程,還能勝任軟件工程中的調(diào)試、部署等工作,甚至可用于制作PPT、Excel、Word等,從OpenAI分享案例看效果良好。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • OpenAI
    +關注

    關注

    9

    文章

    1245

    瀏覽量

    10048
  • AI大模型
    +關注

    關注

    0

    文章

    398

    瀏覽量

    998
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    GPT-5震撼發(fā)布:AI領域的重大飛躍

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月8日凌晨1點,OpenAI以一場長達1小時的線上發(fā)布會正式推出GPT-5。這場被業(yè)界稱為“AI進化分水嶺”的發(fā)布,終結了長達兩年的技術猜測,
    的頭像 發(fā)表于 08-09 07:44 ?1w次閱讀
    <b class='flag-5'>GPT</b>-5震撼<b class='flag-5'>發(fā)布</b>:AI領域的重大飛躍

    IT崗位天塌了!Claude 4震撼發(fā)布:AI編程大模型再進化

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)5 月 23 日凌晨,著名大模型平臺 Anthropic 召開首屆開發(fā)者大會,重磅發(fā)布最新大模型 ——Claude 4。Claude 4 包含兩個版本
    的頭像 發(fā)表于 05-26 07:52 ?5783次閱讀
    IT崗位天塌了!<b class='flag-5'>Claude</b> 4震撼<b class='flag-5'>發(fā)布</b>:AI編程大模型再進化

    大模型 ai coding 比較

    :2026-02-19排序依據(jù) :綜合能力從高到低:Claude Opus 4.6 > Kimi K2.5 > 智譜GLM-5 > Claude Sonnet 4.
    發(fā)表于 02-19 13:43

    GitHub王炸:AI編程進入&quot;多智能體時代&quot;,1.8億人徹夜未眠

    微軟旗下代碼托管平臺GitHub正式集成ClaudeCodex,開發(fā)者可在統(tǒng)一工作流中自由切換頂級AI助手 2026年2月5日,微軟旗下GitHub宣布重大戰(zhàn)略升級:正式將Anthropic
    的頭像 發(fā)表于 02-06 15:06 ?139次閱讀
    GitHub王炸:AI編程進入&quot;多智能體時代&quot;,1.8億人徹夜未眠

    Claude Code在國內(nèi)怎么使用?AI編程人員必看的完整指南!

    是什么? Claude Code是由 Anthropic 推出的新一代通用大模型產(chǎn)品,主打 安全性、可控性和復雜任務理解能力
    的頭像 發(fā)表于 01-23 14:09 ?2704次閱讀
    <b class='flag-5'>Claude</b> Code在國內(nèi)怎么使用?AI編程人員必看的完整指南!

    新突破!AI企業(yè)Anthropic將開發(fā)者工具核心能力下放至普通用戶

    電子發(fā)燒友網(wǎng)報道 當?shù)貢r間1月12日,AI巨頭Anthropic正式發(fā)布新工具“Cowork”,意圖將開發(fā)者工具的核心能力下放至普通用戶,重新定義人機協(xié)作邊界。 ? Claude Cowork:從
    的頭像 發(fā)表于 01-13 14:43 ?710次閱讀

    GPT-5.1發(fā)布 OpenAI開始拼情商

    OpenAI正式上線了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有網(wǎng)友實測發(fā)現(xiàn)OpenAI發(fā)布
    的頭像 發(fā)表于 11-13 15:49 ?701次閱讀

    IBM與Anthropic達成戰(zhàn)略合作

    近日,在面向全球開發(fā)者與技術專家的年度盛會 TechXchange 2025 期間,IBM(紐約證券交易所代碼:IBM)與Anthropic 宣布達成戰(zhàn)略合作:IBM 將 Anthropic 旗下
    的頭像 發(fā)表于 10-15 17:55 ?687次閱讀

    商湯科技為Claude API用戶提供搬家服務

    9月5日,Anthropic 宣布將禁止中資控股超過50%的公司使用Claude服務,并限制企業(yè)通過海外云服務、第三方平臺等方式間接使用。
    的頭像 發(fā)表于 09-08 10:32 ?806次閱讀
    商湯科技為<b class='flag-5'>Claude</b> API用戶提供搬家服務

    NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現(xiàn)150萬TPS推理

    ? 自 2016 年推出 NVIDIA DGX 以來,NVIDIA 與 OpenAI 便開始共同推動 AI 技術的邊界。此次 OpenAI gpt-oss-20b 和 gpt-oss-
    的頭像 發(fā)表于 08-15 20:34 ?2295次閱讀
    NVIDIA從云到邊緣加速<b class='flag-5'>OpenAI</b> <b class='flag-5'>gpt</b>-oss模型部署,實現(xiàn)150萬TPS推理

    OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價向美國政府提供ChatGPT

    外界一直在期待的OpenAI新一代大語言模型GPT-5或?qū)?b class='flag-5'>發(fā)布。據(jù)外媒的報道,GPT-5很可能在周五凌晨發(fā)布。這是
    的頭像 發(fā)表于 08-07 14:13 ?1.2w次閱讀

    亞馬遜云科技Amazon Bedrock模型再更新,Anthropic最新版Claude4模型現(xiàn)已上線

    北京2025年8月6日 /美通社/ -- 亞馬遜云科技宣布,Anthropic最新一代模型Claude Opus 4.1與Claude Sonnet 4,現(xiàn)已在Amazon Bedro
    的頭像 發(fā)表于 08-06 19:42 ?701次閱讀
    亞馬遜云科技Amazon Bedrock模型再更新,<b class='flag-5'>Anthropic</b>最新版<b class='flag-5'>Claude</b>4模型現(xiàn)已上線

    OpenAI發(fā)布2款開源模型

    OpenAI開源了兩款高性能權重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt
    的頭像 發(fā)表于 08-06 14:25 ?1026次閱讀

    Claude 現(xiàn)已能連接您的世界 支持遠程MCP服務器協(xié)作

    “ ?2025年5月2日,Anthropic公司宣布推出 Integrations 功能,Claude 終于能與網(wǎng)絡和桌面應用程序中的遠程MCP服務器協(xié)作了(之前 Claude Desktop 僅
    的頭像 發(fā)表于 05-02 11:11 ?938次閱讀

    Claude 3.7:編碼助手首選,claude api key如何申請獲取與深度解析*

    、開發(fā)者友好。 強大功能集 :支持圖像分析、20萬令牌超大上下文窗口,輕松駕馭大型項目與復雜任務。 Claude 3.7:樹立編碼助手新標桿 2025年2月24日,Anthropic 推出
    的頭像 發(fā)表于 03-24 09:43 ?1852次閱讀
    <b class='flag-5'>Claude</b> 3.7:編碼助手首選,<b class='flag-5'>claude</b> api key如何申請獲取與深度解析*