91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI正式推出GPT-4o模型,支持實時音頻、視覺和文本推理處理

微云疏影 ? 來源:綜合整理 ? 作者:綜合整理 ? 2024-05-15 10:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)報道,OpenAI于昨日凌晨推出了全新的GPT-4o模型,是對前期產(chǎn)品GPT-4的進(jìn)階改進(jìn)版。這一模型擁有實時推理處理視覺、音頻及文字信息的強(qiáng)大能力,尤其在與ChatGPT的對接使用方面表現(xiàn)出色。

緊接著,OpenAI總裁暨聯(lián)合創(chuàng)始人Greg Brockman發(fā)布了詳細(xì)演示,展示了兩部搭載GPT-4o的設(shè)備如何實現(xiàn)語音或視頻交互。

在演示前,Brockman表達(dá)了希望兩部AI聊天機(jī)器人能夠進(jìn)行有效溝通的愿望。他向A聊天機(jī)器人闡述了這一想法,并允許B聊天機(jī)器人調(diào)用攝像頭觀察周邊環(huán)境。

B聊天機(jī)器人成功調(diào)用前置攝像頭,清晰地呈現(xiàn)了用戶的著裝以及所在環(huán)境。接著,A聊天機(jī)器人與其展開對話,詢問相關(guān)問題,如調(diào)整攝像頭視角等。

在此過程中,新版ChatGPT不僅借助視覺AI技術(shù)理解攝像頭中的畫面,還能通過語音交互實現(xiàn)更豐富有趣的互動體驗,同時支持中途打斷和對話插入,并具備上下文記憶功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16871
  • 聊天機(jī)器人
    +關(guān)注

    關(guān)注

    0

    文章

    348

    瀏覽量

    13089
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10069
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    OpenAI與Anthropic對戰(zhàn),Claude Opus 4.6與GPT-5.3-Codex同日發(fā)布

    電子發(fā)燒友網(wǎng)報道 北京時間2月6日凌晨,Anthropic與OpenAI分別推出了新版本基礎(chǔ)大模型——Claude Opus 4.6和GPT-5.3-Codex。 ? ? Claude
    的頭像 發(fā)表于 02-06 14:19 ?712次閱讀
    <b class='flag-5'>OpenAI</b>與Anthropic對戰(zhàn),Claude Opus 4.6與<b class='flag-5'>GPT</b>-5.3-Codex同日發(fā)布

    LLM推理模型是如何推理的?

    過程與核心見解拆解。一、核心論點與總覽LRM(如o1,R1)的“推理”能力提升,并非源于模型學(xué)會了人類式的邏輯推理,而是通過兩類主要技術(shù)手段,優(yōu)化了生成過程,使其
    的頭像 發(fā)表于 01-19 15:33 ?488次閱讀
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    GPT-5.1發(fā)布 OpenAI開始拼情商

    -5.1 Thinking:高級推理模型,在簡單任務(wù)上更快,在復(fù)雜任務(wù)上更持久,也更容易理解。 對于新上線的GPT-5.1大模型,OpenAI?官方表示出色的 AI 不僅是要夠聰明,還
    的頭像 發(fā)表于 11-13 15:49 ?703次閱讀

    NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現(xiàn)150萬TPS推理

    ? 自 2016 年推出 NVIDIA DGX 以來,NVIDIA 與 OpenAI 便開始共同推動 AI 技術(shù)的邊界。此次 OpenAI gpt-oss-20b 和
    的頭像 發(fā)表于 08-15 20:34 ?2303次閱讀
    NVIDIA從云到邊緣加速<b class='flag-5'>OpenAI</b> <b class='flag-5'>gpt</b>-oss<b class='flag-5'>模型</b>部署,實現(xiàn)150萬TPS<b class='flag-5'>推理</b>

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機(jī)上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強(qiáng)悍”的新引擎,在本地享受企
    的頭像 發(fā)表于 08-14 11:34 ?1402次閱讀

    訊飛星辰MaaS平臺率先上線OpenAI最新開源模型

    8月6日凌晨,OpenAI 時隔六年再次回歸開源,發(fā)布兩款全新的大語言模型gpt-oss-120b和gpt-oss-20b,性能與o4-m
    的頭像 發(fā)表于 08-13 16:43 ?1567次閱讀

    OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價向美國政府提供ChatGPT

    外界一直在期待的OpenAI新一代大語言模型GPT-5或?qū)l(fā)布。據(jù)外媒的報道,GPT-5很可能在周五凌晨發(fā)布。這是OpenAI在2023年的
    的頭像 發(fā)表于 08-07 14:13 ?1.2w次閱讀

    亞馬遜云科技現(xiàn)已上線OpenAI開放權(quán)重模型

    開放權(quán)重模型,向數(shù)百萬亞馬遜云科技客戶開放。 客戶可利用這些全新開放權(quán)重模型的先進(jìn)推理能力,支持Agentic工作流、代碼生成、科學(xué)分析和數(shù)學(xué)問題求解等應(yīng)用。 開放權(quán)重
    的頭像 發(fā)表于 08-06 19:29 ?847次閱讀

    OpenAI發(fā)布2款開源模型

    o4-mini水平,并且能在高端筆記本上運(yùn)行。而且還有一個更小的版本,可以在智能手機(jī)上應(yīng)用。 據(jù)悉;OpenAI 此次開源的gpt-oss-120b 總參數(shù)量為 1170 億,激活參數(shù)為 51 億,能夠在
    的頭像 發(fā)表于 08-06 14:25 ?1028次閱讀

    模型推理顯存和計算量估計方法研究

    過程中需要占用大量顯存,導(dǎo)致推理速度變慢,甚至無法進(jìn)行。 計算量過大:大模型的計算量較大,導(dǎo)致推理速度慢,難以滿足實時性要求。 為了解決這些問題,本文將針對大
    發(fā)表于 07-03 19:43

    將Whisper大型v3 fp32模型轉(zhuǎn)換為較低精度后,推理時間增加,怎么解決?

    openai/whisper-large-v3 FP32 模型轉(zhuǎn)換為 FP16、INT8 和 INT4。 推理所花費的時間比在 FP32 上花費的時間要多
    發(fā)表于 06-24 06:23

    “天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型

    的人工智能模型均為純文本模型,新一代的 Gemini 2.5 Pro、OpenAI o4 mini、馬斯克旗下 xAI 的 Grok-3 T
    的頭像 發(fā)表于 06-15 01:56 ?5962次閱讀
    “天才”!<b class='flag-5'>OpenAI</b> <b class='flag-5'>o</b>3 成全球 IQ 最高的 AI 大<b class='flag-5'>模型</b>

    上新:小米首個推理模型開源 馬斯克:下周推出Grok 3.5

    開源新一代通義千問模型Qwen3。據(jù)悉,Qwen3模型參數(shù)量僅為DeepSeek - R1的1/3,能夠大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球頂尖
    的頭像 發(fā)表于 04-30 16:08 ?1325次閱讀

    大象機(jī)器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    RISC-V”六軸機(jī)械臂為教育場景量身定制,具備6個自由度,280mm臂展,支持250g負(fù)載,整機(jī)重量僅860克。提供豐富接口,末端兼容樂高/M4拓展接口,可自由替換筆夾、夾爪、吸泵、視覺模塊等多種
    發(fā)表于 04-25 17:59

    ?VLM(視覺語言模型)?詳細(xì)解析

    的詳細(xì)解析: 1. 核心組成與工作原理 視覺編碼器 :提取圖像特征,常用CNN(如ResNet)或視覺Transformer(ViT)。 語言模型處理
    的頭像 發(fā)表于 03-17 15:32 ?8843次閱讀
    ?VLM(<b class='flag-5'>視覺</b>語言<b class='flag-5'>模型</b>)?詳細(xì)解析