91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌全新推出開放式視覺語言模型PaliGemma

谷歌開發(fā)者 ? 來源:谷歌開發(fā)者 ? 2024-10-15 17:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者 / 產(chǎn)品管理總監(jiān) Tris Warkentin;高級(jí)研究員翟曉華;產(chǎn)品經(jīng)理 Ludovic Peran

在 Google,我們相信合作和開放研究能夠推動(dòng)創(chuàng)新。我們非常感謝社區(qū)對(duì) Gemma 的支持,使其自發(fā)布短短幾個(gè)月以來就獲得了數(shù)百萬的下載量。

這種熱烈的反響非常鼓舞人心,開發(fā)者們打造了一系列多樣的項(xiàng)目,例如用于印度語言的多語言變體 Navarasa,以及設(shè)備端側(cè)動(dòng)作模型 Octopus v2。開發(fā)者們展示了 Gemma 在打造極具影響力且易于使用的 AI 解決方案方面的巨大潛力。

這種探索和創(chuàng)造精神也促使我們開發(fā)了 CodeGemma (具有強(qiáng)大的代碼補(bǔ)全和生成能力) 和 RecurrentGemma (在高效推理和研究領(lǐng)域極具潛力)。

Gemma 是先進(jìn)的輕量級(jí)開放模型系列,采用了與創(chuàng)建 Gemini 模型相同的研究和技術(shù)。今天,我們非常高興地推出強(qiáng)大的開放式視覺語言模型 (VLM) PaliGemma,進(jìn)一步擴(kuò)展 Gemma 系列。同時(shí)我們將介紹 Gemma 2 的相關(guān)信息,讓您搶先了解即將推出的全新功能。此外,我們通過更新 Responsible Generative AI 工具包,為開發(fā)者提供用于評(píng)估模型安全性和過濾有害內(nèi)容的全新和增強(qiáng)型工具,進(jìn)一步落實(shí)在負(fù)責(zé)任 AI 方面的承諾。

PaliGemma: 全新推出的

開放式視覺語言模型

PaliGemma 是一個(gè)強(qiáng)大的開放式 VLM,其靈感源自 PaLI-3。PaliGemma 基于開放式組件 (包括 SigLIP 視覺模型和 Gemma 語言模型) 構(gòu)建,可在廣泛的視覺語言任務(wù)中實(shí)現(xiàn)卓越的微調(diào)性能。這包括為圖片和短視頻描述生成、視覺問答、理解圖像中的文本、對(duì)象檢測和對(duì)象分割。

我們將提供支持多種分辨率且經(jīng)過預(yù)訓(xùn)練和微調(diào)檢查點(diǎn),以及專門針對(duì)多種任務(wù)進(jìn)行微調(diào)的檢查點(diǎn),供您立即探索。

為了促進(jìn)開放式探索和研究,PaliGemma 可通過多種平臺(tái)和資源使用。歡迎您立即通過 Kaggle 和 Colab 筆記本等免費(fèi)方式開始探索!在視覺語言研究領(lǐng)域?qū)で笸黄频膶W(xué)術(shù)研究人員還可以申請(qǐng) Google Cloud 積分,更好地開展工作。

立即開始使用 PaliGemma。您可以在 GitHub、Hugging Face 模型、Kaggle、Vertex AI Model Garden 和 ai.nvidia.com (通過 TensoRT-LLM 加速) 中找到 PaliGemma,并可通過 JAX 和 Hugging Face Transformers 輕松集成該模型。Keras 集成方式即將推出,您還可以通過此 Hugging Face Space 與該模型交互。

Gemma 2 推出:

性能和效率再上新臺(tái)階

我們非常高興地宣布,新一代 Gemma 模型 Gemma 2 即將發(fā)布。Gemma 2 將提供新的模型大小,以滿足廣泛的 AI 開發(fā)者用例的需求;此外,它還將采用全新架構(gòu)來實(shí)現(xiàn)突破性的性能和效率,帶來以下優(yōu)勢:

卓越性能: Gemma 2 具有 270 億個(gè)參數(shù),其性能可與 Llama 3 70B 相媲美,但大小卻不到 Llama 3 70B 的一半。這種突破性的效率為開放模型領(lǐng)域樹立了新的標(biāo)桿。

更低部署成本: Gemma 2 采用高效設(shè)計(jì),最低所需的計(jì)算資源不到同級(jí)別模型的一半。27B 模型經(jīng)過專門優(yōu)化,可在 NVIDIA 的 GPU 上運(yùn)行,也可在 Vertex AI 中的單個(gè) TPU 主機(jī)上高效運(yùn)行,讓更多的用戶能夠更方便、更經(jīng)濟(jì)高效地部署該模型。

多元化調(diào)優(yōu)工具鏈: Gemma 2 提供多元化的平臺(tái)和工具生態(tài)系統(tǒng),讓開發(fā)者可從中選用穩(wěn)健的調(diào)優(yōu)功能。從 Google Cloud 等云端解決方案到 Axolotl 等熱門社區(qū)工具,豐富多樣的選擇讓微調(diào) Gemma 2 變得更加簡單。此外,Gemma 2 與 Hugging Face、NVIDIA TensorRT-LLM 等眾多合作伙伴實(shí)現(xiàn)了無縫整合,同時(shí)還集成了 Google JAX 和 Keras,讓您可以優(yōu)化性能,并在各種硬件配置中實(shí)現(xiàn)高效部署。

擴(kuò)展 Responsible Generative AI 工具包

為了迎接該模型的發(fā)布,我們將開源發(fā)布 LLM Comparator 來擴(kuò)展 Responsible Generative AI 工具包,以便開發(fā)者進(jìn)行更穩(wěn)健的模型評(píng)估。LLM Comparator 是一種新的交互式視覺工具,能夠進(jìn)行有效的并排評(píng)估,以評(píng)估模型響應(yīng)的質(zhì)量和安全性。您可以查看 LLM Comparator 的實(shí)際應(yīng)用演示,了解 Gemma 1.1 和 Gemma 1.0 的對(duì)比情況。

我們希望 LLM Comparator 可以進(jìn)一步推進(jìn)該工具包的使命,助力開發(fā)者打造兼具創(chuàng)新性和安全性且負(fù)責(zé)任的 AI 應(yīng)用。

我們將不斷擴(kuò)展 Gemma 開放模型系列,并一如既往地營造協(xié)作環(huán)境,讓前沿 AI 技術(shù)與負(fù)責(zé)任的開發(fā)齊頭并進(jìn)。我們對(duì)您將利用這些新工具打造的應(yīng)用充滿期待,與您共赴 AI 美好未來!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1807

    瀏覽量

    60522
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301431
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11316

原文標(biāo)題:全新推出 PaliGemma、Gemma 2 和升級(jí)擴(kuò)展 Responsible AI 工具包

文章出處:【微信號(hào):Google_Developers,微信公眾號(hào):谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新開放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問世
    的頭像 發(fā)表于 02-26 10:22 ?507次閱讀

    從TWS紅海突圍:開放式耳機(jī)市場進(jìn)入AI重構(gòu)時(shí)代

    近年來,全球可穿戴音頻設(shè)備正經(jīng)歷一場結(jié)構(gòu)性變革。隨著用戶對(duì)健康、舒適與場景融合體驗(yàn)需求的提升,傳統(tǒng)TWS逐漸遭遇同質(zhì)化,開放式耳機(jī)憑借“不堵耳、保環(huán)境感知、全天候佩戴無負(fù)擔(dān)”等優(yōu)勢,迅速崛起為行業(yè)
    的頭像 發(fā)表于 02-12 09:18 ?5204次閱讀
    從TWS紅海突圍:<b class='flag-5'>開放式</b>耳機(jī)市場進(jìn)入AI重構(gòu)時(shí)代

    韶音CES 2026新品發(fā)布:OpenFit Pro推出開放式濾噪新方案

    2026年1月6日,全球消費(fèi)電子盛會(huì)CES在美國拉斯維加斯開幕,全球領(lǐng)先的開放式耳機(jī)品牌Shokz韶音以“重塑開放之聲”為主題,于展會(huì)首日舉辦新品發(fā)布會(huì),正式推出旗下首款搭載開放式濾噪
    的頭像 發(fā)表于 01-12 16:17 ?365次閱讀
    韶音CES 2026新品發(fā)布:OpenFit Pro<b class='flag-5'>推出</b><b class='flag-5'>開放式</b>濾噪新方案

    NVIDIA在CES 2026發(fā)布全新開放模型、數(shù)據(jù)和工具

    為擴(kuò)展開放模型生態(tài),NVIDIA 發(fā)布全新開放模型、數(shù)據(jù)和工具,推動(dòng)各行業(yè) AI 技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:42 ?543次閱讀

    NVIDIA 推出 Nemotron 3 系列開放模型

    token 數(shù)。 ● Nemotron 通過先進(jìn)的強(qiáng)化學(xué)習(xí)技術(shù)以及大規(guī)模并行多環(huán)境后訓(xùn)練,實(shí)現(xiàn)了卓越的準(zhǔn)確率。 ● NVIDIA 率先推出整套前沿的開放模型、訓(xùn)練數(shù)據(jù)集及強(qiáng)化學(xué)習(xí)環(huán)境與
    的頭像 發(fā)表于 12-16 09:27 ?631次閱讀
    NVIDIA <b class='flag-5'>推出</b> Nemotron 3 系列<b class='flag-5'>開放</b><b class='flag-5'>模型</b>

    芯原與谷歌聯(lián)合推出開源Coral NPU IP

    芯原股份近日宣布與谷歌聯(lián)合推出面向始終在線、超低能耗端側(cè)大語言模型應(yīng)用的Coral NPU IP。
    的頭像 發(fā)表于 11-13 11:24 ?599次閱讀
    芯原與<b class='flag-5'>谷歌</b>聯(lián)合<b class='flag-5'>推出</b>開源Coral NPU IP

    開放式超聲波傳感器:開啟智能感知新紀(jì)元

    在萬物互聯(lián)的智能時(shí)代,傳統(tǒng)封閉傳感器已難以滿足復(fù)雜場景的精準(zhǔn)感知需求。而開放式超聲波傳感器憑借其獨(dú)特的結(jié)構(gòu)設(shè)計(jì)與技術(shù)優(yōu)勢,正成為工業(yè)自動(dòng)化、智能家居、自動(dòng)駕駛等領(lǐng)域的“感知神經(jīng)”,重新定義著人
    的頭像 發(fā)表于 10-20 08:40 ?548次閱讀
    <b class='flag-5'>開放式</b>超聲波傳感器:開啟智能感知新紀(jì)元

    騰訊地圖推出全新時(shí)空智能開放平臺(tái)“蓋亞”

    2025年9月17日,在2025騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊地圖正式推出全新時(shí)空智能開放平臺(tái)“蓋亞”(GAIA,Geospatial Artificial Intelligence Atlas
    的頭像 發(fā)表于 09-18 10:26 ?2026次閱讀

    華為開放式耳機(jī)FreeArc搭載芯導(dǎo)科技P14C5N芯片

    近期,華為再次推出了一款耳掛設(shè)計(jì)的開放式耳機(jī)——HUAWEI FreeArc,采用140° 三角穩(wěn)固設(shè)計(jì)、大面積超柔軟液態(tài)硅膠材質(zhì)包裹,搭配IP57級(jí)防塵抗水性能,不僅滿足日常使用需求,還更加適合
    的頭像 發(fā)表于 08-15 16:43 ?1761次閱讀
    華為<b class='flag-5'>開放式</b>耳機(jī)FreeArc搭載芯導(dǎo)科技P14C5N芯片

    亞馬遜云科技現(xiàn)已上線OpenAI開放權(quán)重模型

    開放權(quán)重模型,向數(shù)百萬亞馬遜云科技客戶開放。 客戶可利用這些全新開放權(quán)重模型的先進(jìn)推理能力,支持Agentic工作流、代碼生成、科學(xué)分析和數(shù)
    的頭像 發(fā)表于 08-06 19:29 ?848次閱讀

    DC監(jiān)測技術(shù)、3+1麥開放式降噪,榮耀可穿戴新品重構(gòu)AI邊界

    電子發(fā)燒友網(wǎng)綜合報(bào)道?當(dāng)前,可穿戴設(shè)備行業(yè)的產(chǎn)品不斷迭代,特別是智能手表和耳機(jī)等消費(fèi)類可穿戴設(shè)備。就在7月2日,榮耀在榮耀Magic V5暨AI終端生態(tài)發(fā)布會(huì)上,正式發(fā)布了新一代開放式耳機(jī)——榮耀
    的頭像 發(fā)表于 07-06 10:52 ?2917次閱讀
    DC監(jiān)測技術(shù)、3+1麥<b class='flag-5'>開放式</b>降噪,榮耀可穿戴新品重構(gòu)AI邊界

    炬芯科技助力Cleer ARC 5音弧開放式AI耳機(jī)發(fā)布

    此前,2025年4月22日(第56個(gè)世界地球日),國際智能聲學(xué)品牌Cleer以「戴上Cleer AI聽新世界」為主題,在深圳國際低碳城·氣膜館舉行新品發(fā)布會(huì),重磅發(fā)布了旗艦產(chǎn)品——新一代Cleer ARC 5 音弧開放式AI耳機(jī)。
    的頭像 發(fā)表于 05-16 09:06 ?1322次閱讀

    Wi-Fi音頻傳輸+百倍AI性能飛躍!開放式耳機(jī)上新高度

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)繼小米發(fā)布小米Buds 5 Pro入耳耳機(jī)首發(fā)支持Wi-Fi技術(shù)之后,在近期Cleer也發(fā)布了旗下首款Wi-Fi耳機(jī)——新一代Cleer ARC 5 音弧開放式AI
    的頭像 發(fā)表于 04-28 00:14 ?3899次閱讀
    Wi-Fi音頻傳輸+百倍AI性能飛躍!<b class='flag-5'>開放式</b>耳機(jī)上新高度

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    、Figure AI、Skild AI 是最早采用該技術(shù)的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基礎(chǔ)模型 (WFM) 的重大更新,該模型引入了
    的頭像 發(fā)表于 03-20 19:01 ?1346次閱讀

    ?VLM(視覺語言模型)?詳細(xì)解析

    視覺語言模型(Visual Language Model, VLM)是一種結(jié)合視覺(圖像/視頻)和語言(文本)處理能力的多模態(tài)人工智能
    的頭像 發(fā)表于 03-17 15:32 ?8847次閱讀
    ?VLM(<b class='flag-5'>視覺</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>)?詳細(xì)解析