91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌Gemini 2.5模型系列更新

谷歌開發(fā)者 ? 來源:谷歌黑板報 ? 2025-05-23 14:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:谷歌黑板報

作者:

Tulsee Doshi,產(chǎn)品管理高級總監(jiān),代表 Gemini 團隊

今年 3 月,我們發(fā)布了迄今為止最智能的模型 Gemini 2.5 Pro,兩周前,我們提前為您帶來了 I/O 更新,以便開發(fā)者構(gòu)建出色的網(wǎng)絡(luò)應(yīng)用。今天,我們分享 Gemini 2.5 模型系列的更多更新:

除了 2.5 Pro 在學(xué)術(shù)基準測試中令人難以置信的性能外,它現(xiàn)在還是 WebDev Arena 和 LMArena 排行榜上的全球領(lǐng)先模型,并且在幫助人們學(xué)習(xí)方面表現(xiàn)出色。

我們正在為 2.5 Pro 和 2.5 Flash 帶來新功能: 用于更自然對話體驗的原生音頻輸出、更高的安全防護,以及 Project Mariner 的計算機使用功能。2.5 Pro 還將通過 Deep Think,一種用于高度復(fù)雜的數(shù)學(xué)和編程的實驗性增強推理模式,進一步升級。

我們繼續(xù)投資于開發(fā)者體驗,在 Gemini API 和 Vertex AI 中引入了模型推理摘要以提高透明度,將模型推理預(yù)算擴展到 2.5 Pro 以實現(xiàn)更多控制,并在 Gemini API 和 SDK 中添加了對 MCP 工具的支持,以便訪問更多開源工具。

2.5 Flash 現(xiàn)在已在 Gemini 應(yīng)用中向所有人開放,我們將在 6 月初在 Google AI Studio 中向開發(fā)者以及在 Vertex AI 中向企業(yè)全面提供更新版本,2.5 Pro 也將緊隨其后。

這一顯著進展是 Google 各團隊不懈努力的結(jié)果,旨在改進我們的技術(shù),并安全負責地開發(fā)和發(fā)布它們。下面讓我們從以下方面深入了解。

2.5 Pro 表現(xiàn)更勝以往

我們最近更新了 2.5 Pro,以幫助開發(fā)者構(gòu)建更豐富、更具交互性的網(wǎng)絡(luò)應(yīng)用。非常高興看到用戶和開發(fā)者的積極反響,同時我們正在根據(jù)用戶反饋不斷改進。

除了在學(xué)術(shù)基準測試中的出色表現(xiàn)外,新的 2.5 Pro 現(xiàn)在正領(lǐng)跑流行的編碼排行榜 WebDev Arena,ELO 分數(shù)為 1415。它還在 LMArena 排行榜的所有類別中處于領(lǐng)先地位,該排行榜評估人類在不同維度上的偏好。而且,憑借其百萬級令牌的上下文窗口,2.5 Pro 擁有最先進的長上下文和視頻理解性能。

自從融入了與教育專家合作構(gòu)建的學(xué)習(xí)模型系列 LearnLM 以來,2.5 Pro 現(xiàn)已成為領(lǐng)先的學(xué)習(xí)模型。在對其教學(xué)法和有效性進行的直接比較中,教育工作者和專家在各種場景下都更青睞 Gemini 2.5 Pro,而非其他模型。并且,在構(gòu)建用于輔助學(xué)習(xí)的 AI 系統(tǒng)的學(xué)習(xí)科學(xué)的五項原則中,它在每一項上都超越了頂級模型。

Deep Think

通過探索 Gemini 思維能力的邊界,我們開始測試 Deep Think 的增強推理模式,它采用新的研究技術(shù),使模型能夠在回應(yīng)之前考慮多種假設(shè)。

2.5 Pro Deep Think 在目前最難的數(shù)學(xué)基準之一 2025 USAMO 上取得了令人印象深刻的分數(shù)。它還在一個針對競賽級編程的難度基準 —— LiveCodeBench 上處于領(lǐng)先地位,并在測試多模態(tài)推理的 MMMU 上取得了 84.0% 的分數(shù)。

由于 2.5 Pro DeepThink 是一項非常前沿的技術(shù),我們正在額外花費時間進行更多的前沿安全評估,并從安全專家那里獲得進一步的反饋。作為其中的一部分,我們將在廣泛發(fā)布之前,通過 Gemini API 將其提供給受信任的測試人員,以獲取他們的反饋。

更優(yōu)秀的 2.5 Flash

2.5 Flash 是我們最高效的主力模型,專為速度和低成本而設(shè)計——現(xiàn)在它在很多維度上都更優(yōu)秀了。它在推理、多模態(tài)、代碼和長上下文的關(guān)鍵基準測試中都得到了改進,同時效率更高,在我們的評估中使用的令牌數(shù)量減少了 20-30%。

新的 2.5 Flash 現(xiàn)在已在 Google AI Studio 中向開發(fā)者、在 Vertex AI 中向企業(yè)用戶以及在 Gemini 應(yīng)用中向所有人提供預(yù)覽版。6 月初,它將全面上線可用。

Gemini 2.5 新功能

原生音頻輸出和 Live API 的改進

今天,Live API 正在推出視聽輸入和原生音頻輸出對話的預(yù)覽版,這樣您就可以直接構(gòu)建更自然、更富有表現(xiàn)力的 Gemini 對話體驗。

它還允許用戶控制其說話的語調(diào)、口音和風格。例如,您可以告訴模型在講故事時使用戲劇性的聲音。該模型現(xiàn)在還支持工具使用,以便能夠代表您進行搜索。

您可以體驗以下一些早期功能:

情感對話 (Affective Dialogue): 模型能夠檢測用戶聲音中的情感并作出適當回應(yīng)。

主動音頻 (Proactive Audio): 模型將忽略背景對話并知道何時回應(yīng)。

Live API 中的模型推理能力 (Thinking in the Live API): 模型利用 Gemini 的模型推理能力來支持更復(fù)雜的任務(wù)。

我們還在發(fā)布 2.5 Pro 和 2.5 Flash 的文本轉(zhuǎn)語音新預(yù)覽版。這些版本首次支持多位說話人,能夠通過原生音頻輸出實現(xiàn)兩種聲音的文本轉(zhuǎn)語音。

與原生音頻對話一樣,文本轉(zhuǎn)語音富有表現(xiàn)力,可以捕捉非常微妙的細微差別,例如耳語。它支持超過 24 種語言,并可以在它們之間無縫切換。

這項文本轉(zhuǎn)語音功能現(xiàn)已在 Gemini API 中可用。

計算機使用功能

我們正在將 Project Mariner 的計算機使用功能引入 Gemini API 和 Vertex AI。像 Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company 和 Cartwheel 這樣的公司正在探索其潛力,我們很高興能在今年夏天更廣泛地推出它,供開發(fā)者進行實驗。

更高的安全性

我們還顯著增強了對例如間接提示詞注入攻擊等安全威脅的防護。間接提示詞注入攻擊是指將惡意指令嵌入到 AI 模型檢索的數(shù)據(jù)中。我們的新安全方法有助于顯著提高 Gemini 在使用過程中對抗間接提示詞注入攻擊的防護率,使 Gemini 2.5 成為我們迄今為止最安全的模型系列。

增強的開發(fā)者體驗

模型推理摘要

2.5 Pro 和 Flash 現(xiàn)在將在 Gemini API 和 Vertex AI 中包含模型推理摘要。模型推理摘要會將模型的原始模型推理組織成清晰的格式,包含標題、關(guān)鍵細節(jié)以及有關(guān)模型操作的信息,例如何時使用工具。

我們希望通過更結(jié)構(gòu)化、更精簡的模型推理過程格式,開發(fā)者和用戶會發(fā)現(xiàn)與 Gemini 模型的交互更容易理解和調(diào)試。

模型推理預(yù)算

我們推出了帶有模型推理預(yù)算的 2.5 Flash,通過平衡延遲和質(zhì)量,讓開發(fā)者更好地控制成本。我們將此功能擴展到 2.5 Pro。這允許您控制模型在響應(yīng)前用于模型推理的令牌數(shù)量,甚至可以關(guān)閉其模型推理能力。

帶有預(yù)算功能的 Gemini 2.5 Pro 將在未來幾周內(nèi)與我們?nèi)姘l(fā)布的模型一起,正式用于穩(wěn)定生產(chǎn)環(huán)境。

MCP 支持

我們在 Gemini API 中添加了對模型上下文協(xié)議 (Model Context Protocol, MCP) 定義的原生 SDK 支持,以便更輕松地與開源工具集成。我們還在探索部署 MCP 服務(wù)器和其他托管工具的方法,讓您更容易構(gòu)建智能體應(yīng)用。

我們一直在探索新的方法來改進我們的模型和開發(fā)者體驗,包括使其更高效且性能更強,并持續(xù)響應(yīng)開發(fā)者的反饋,所以請繼續(xù)提出寶貴意見!同時,我們持續(xù)在基礎(chǔ)研究的廣度和深度上加倍投入——包括推動 Gemini 能力的邊界。更多內(nèi)容即將推出。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    8146
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301305
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52093

原文標題:Gemini 2.5: 我們最智能的模型系列再升級

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)北京時間5月21日,谷歌2025 Google I/O開發(fā)者大會正式召開,從其發(fā)布的新品來看,這可以說是一場AI盛會。 在AI大模型方面,發(fā)布了Gemini 2.
    的頭像 發(fā)表于 05-22 09:01 ?6636次閱讀
    <b class='flag-5'>谷歌</b>AI霸主歸來!多線反擊OpenAI,開啟安卓<b class='flag-5'>Gemini</b>時代

    Gemini CLI 中轉(zhuǎn)站配置使用教程

    供從提示到模型的最直接路徑。通過設(shè)置中轉(zhuǎn)站(代理),您可以在網(wǎng)絡(luò)受限的情況下正常使用 Gemini CLI 服務(wù)。 ? 為什么選擇 Gemini CLI? ? 強大的 Gemini
    發(fā)表于 02-10 17:29

    晶晨攜手谷歌,助力端側(cè)大模型Gemini的硬件落地

    AI)相關(guān)產(chǎn)品的核心芯片供應(yīng)商,雙方在人工智能領(lǐng)域緊密協(xié)作,聚焦于谷歌端側(cè)大模型Gemini的硬件生態(tài)落地。 ? 公司積極推出適配Gemini的智能音箱、智能可視化門鈴、室內(nèi)及室外智
    的頭像 發(fā)表于 01-29 10:44 ?1280次閱讀

    谷歌正式推出Gemini 3 Flash模型

    我們正式推出了 Gemini 3 Flash,這是以較低成本打造的高效前沿智能,成功地進一步擴展了 Gemini 3 模型系列。
    的頭像 發(fā)表于 01-22 16:04 ?460次閱讀

    每年10億美元,蘋果與谷歌官宣合作,Gemini模型注入Siri

    該協(xié)議,下一代蘋果基礎(chǔ)模型(Apple Foundation Models)將基于谷歌Gemini模型和云技術(shù)。 ? 蘋果:借Gemini
    的頭像 發(fā)表于 01-13 14:59 ?1543次閱讀

    谷歌正式推出最新Gemini 3 AI模型

    今天我們正式推出 Gemini 3,這是我們迄今為止最智能的模型,能夠幫助用戶實現(xiàn)任何創(chuàng)意。Gemini 3 Pro 基于最先進的推理技術(shù),與之前的版本相比,它在所有主要的 AI 基準測試中都取得了無與倫比的結(jié)果,尤其是在編程方
    的頭像 發(fā)表于 11-24 11:10 ?1214次閱讀
    <b class='flag-5'>谷歌</b>正式推出最新<b class='flag-5'>Gemini</b> 3 AI<b class='flag-5'>模型</b>

    谷歌Gemini 3模型開啟智能新紀元

    Overviews)。Gemini app 的月用戶量已突破 6.5 億,超過 70% 的 Cloud 客戶使用我們的 AI,1300 萬開發(fā)者在使用我們的生成模型進行構(gòu)建——而這只是我們所看到的巨大影響的一個縮影。
    的頭像 發(fā)表于 11-24 11:07 ?838次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> 3<b class='flag-5'>模型</b>開啟智能新紀元

    成都匯陽投資關(guān)于大模型白熱化,應(yīng)用加速分化

    Gemini 2.5 Flash Image登頂 多主流圖像榜,Meta 也從 Midjourney 授權(quán) AI 圖像模型;視頻領(lǐng)域,阿里字節(jié)等刷新能力高度 ,谷歌將視頻
    的頭像 發(fā)表于 09-09 09:30 ?911次閱讀

    谷歌Gemini 2.5模型系列全新升級

    在 AI 日新月異的浪潮中,技術(shù)不再只是算力堆疊,而是一種可以被人“感知”、與人“共創(chuàng)”的未來語言。
    的頭像 發(fā)表于 08-29 09:19 ?3293次閱讀

    Firebase Studio現(xiàn)已集成Gemini 2.5

    。近期,我們通過增強其內(nèi)置的 App Prototyping 智能體,使其采用 Google 強大的 AI 模型 Gemini 2.5。所有 Firebase Studio 預(yù)覽版用戶現(xiàn)在都可以使用升級后集成
    的頭像 發(fā)表于 07-10 18:13 ?977次閱讀

    谷歌推出Gemini 2.5 Pro預(yù)覽版(I/O版本)

    我們目睹了開發(fā)者使用 Gemini 2.5 Pro 取得了令人贊嘆的成就。因此,我們決定提前數(shù)周發(fā)布更新版本,以便開發(fā)者盡早體驗新版模型。
    的頭像 發(fā)表于 06-10 10:43 ?1172次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進的圖像生成模型 Imagen 3。該模型最初僅對付費用戶開放,不久后也將面向免費用戶推出。
    的頭像 發(fā)表于 05-14 16:53 ?1251次閱讀

    NVIDIA RTX 5880 Ada與Qwen3系列模型實測報告

    全場景的 AI 模型矩陣。其中旗艦模型 Qwen3-235B-A22B 在代碼、數(shù)學(xué)及通用能力基準測試中,展現(xiàn)出與 DeepSeek-R1、OpenAI-o1、Grok-3、Gemini-2.5-Pro 等頂級
    的頭像 發(fā)表于 05-09 15:05 ?4342次閱讀
    NVIDIA RTX 5880 Ada與Qwen3<b class='flag-5'>系列</b><b class='flag-5'>模型</b>實測報告

    谷歌Gemini API最新進展

    今年的 Cloud Next 大會上,我們推出了一系列突破性更新與強大功能,旨在賦能廣大開發(fā)者,與大家攜手共創(chuàng)人工智能的未來。本次發(fā)布亮點包括:最新的 Gemini 2.5 思考
    的頭像 發(fā)表于 04-12 16:10 ?1673次閱讀

    NVIDIA攜手谷歌云助力企業(yè)引入代理式AI

    谷歌 Gemini 模型即將支持本地部署,可通過搭載 NVIDIA Blackwell 架構(gòu)的基礎(chǔ)設(shè)施,在 Google 分布式云上運行 NVIDIA 機密計算。
    的頭像 發(fā)表于 04-11 16:32 ?1200次閱讀