91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

單日獲客成本超20萬(wàn),國(guó)產(chǎn)大模型開(kāi)卷200萬(wàn)字以上的長(zhǎng)文本處理

E4Life ? 來(lái)源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-03-27 00:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AGI生態(tài)的蓬勃發(fā)展,各種支持多模態(tài)的大模型推陳出新,比如最近比較火的音樂(lè)大模型Suno和文生視頻大模型Sora等等。然而在傳統(tǒng)基于文本的大語(yǔ)言模型上,除了追求更快更精準(zhǔn)的推理和高并發(fā)流量以外,似乎已經(jīng)沒(méi)有太多值得廠商大肆宣傳的特性了,直到最近超長(zhǎng)文本處理的爆火。

國(guó)產(chǎn)大模型的新卷法,長(zhǎng)文本處理

當(dāng)下將大模型長(zhǎng)文本處理炒熱的,無(wú)疑是來(lái)自月之暗面的Kimi。作為去年發(fā)布的大模型,Kimi的主要賣點(diǎn)就是長(zhǎng)文本,當(dāng)時(shí)發(fā)布的初版Kimi,就已經(jīng)支持到最多20萬(wàn)漢字的輸入處理。

然而僅僅20萬(wàn)字的文本處理,還不至于給用戶帶來(lái)質(zhì)變的交互體驗(yàn),畢竟GPT-4 Turbo-128k已經(jīng)支持到約合10萬(wàn)漢字的長(zhǎng)文本處理,谷歌的Gemini pro也支持到最多70萬(wàn)個(gè)單詞的上下文,但不少長(zhǎng)篇小說(shuō)、專業(yè)書(shū)籍的字?jǐn)?shù)要遠(yuǎn)超這一數(shù)字。

wKgZomYCneCAMb8qAAM8v3nPbSs784.jpg
Kimi支持200萬(wàn)字上下文 / 月之暗面

Kimi在最近爆火源于一項(xiàng)重大迭代升級(jí),月之暗面將長(zhǎng)文本處理的字?jǐn)?shù)限制擴(kuò)展到200萬(wàn)字,遠(yuǎn)超Claude3、GPT-4 Turbo和Gemini Pro模型。在新功能推出和有效推廣下,Kimi很快涌入了一大批用戶,其app甚至短暫地沖進(jìn)了蘋果App Store前五的位置。然而這樣也對(duì)Kimi的運(yùn)營(yíng)造成了不小的壓力,Kimi在上周經(jīng)歷了多次宕機(jī),這還是在月之暗面對(duì)服務(wù)器連續(xù)擴(kuò)容的前提下。

面對(duì)競(jìng)爭(zhēng)對(duì)手Kimi的用戶量激增,阿里巴巴和360很快就坐不住了。3月22日,阿里巴巴宣布通義千問(wèn)將向所有用戶免費(fèi)開(kāi)放1000萬(wàn)字的長(zhǎng)文檔處理功能;3月23日,360智腦宣布正式內(nèi)測(cè)500萬(wàn)字長(zhǎng)文本處理功能,且該功能即將入駐360 AI瀏覽器。

除了阿里巴巴和360外,目前國(guó)內(nèi)訪問(wèn)量第一的百度文心一言據(jù)傳也會(huì)在下月開(kāi)放長(zhǎng)文本處理功能,并計(jì)劃把字?jǐn)?shù)上限提高至200萬(wàn)甚至500萬(wàn)字。

超長(zhǎng)文本實(shí)現(xiàn)的技術(shù)難點(diǎn)和商業(yè)桎梏

盡管在用戶看來(lái),阿里巴巴、360等廠商宣布支持超長(zhǎng)文本處理好像是一件無(wú)需多少時(shí)間的易事,但實(shí)際上超長(zhǎng)文本處理的實(shí)現(xiàn)存在不少技術(shù)痛點(diǎn)和商業(yè)成本問(wèn)題。要知道在2022年,絕大多數(shù)的LLM上下文長(zhǎng)度最多也只有2K,比如GPT-3。

直到GPT-4和Claude 2等,這些大模型才從架構(gòu)上對(duì)文本長(zhǎng)度進(jìn)行了優(yōu)化,可即便如此,主流的文本輸入長(zhǎng)度依然不會(huì)超過(guò)100K。這也是因?yàn)閷?duì)部分大模型而言,長(zhǎng)文本不一定代表著更好的使用體驗(yàn),尤其是在查全率和準(zhǔn)確率上。

wKgaomYCne6ABP4QAADkljohAv4132.png
Claude的上下文長(zhǎng)度和召回率關(guān)聯(lián)圖 / Anthropic


以Anthropic給出的數(shù)據(jù)為例,從上圖可以看出,隨著文本長(zhǎng)度的增加,召回率是在逐步降低的,即便是最新的Claude3也是如此,而召回率代表了檢索出相關(guān)信息量占總量的比率。至于精確度,則與上下文中的事實(shí)位置存在很大的關(guān)系,如果用戶問(wèn)題的事實(shí)存在于文本開(kāi)頭或后半部分的位置,那么更容易得到精確的結(jié)果,而位于10%到50%之間位置的文本,則精確度急劇下降。

除此之外,長(zhǎng)文本對(duì)于GPU和內(nèi)存的資源消耗太大了,即便是小規(guī)模地?cái)U(kuò)展文本長(zhǎng)度,動(dòng)輒也要消耗100塊以上的GPU或TPU,這里指代的GPU還是A100這種單卡顯存容量高達(dá)40GB或80GB的設(shè)備。

這也是Kimi在經(jīng)歷大量用戶訪問(wèn)后,需要緊急擴(kuò)容的原因。而阿里巴巴之所以能這么快開(kāi)放長(zhǎng)文本能力,也是憑借著手握龐大的服務(wù)器資源。至于Anthropic,我們從Claude3 Opus高昂的Tokens價(jià)格,也可以猜到其硬件成本絕對(duì)不低。

另外,在持續(xù)火爆一年之后,目前的大模型應(yīng)用也難以單純靠技術(shù)立足市場(chǎng)吸引用戶了,商業(yè)推廣也已經(jīng)成了必行之路。就以Kimi為例,在社交媒體上有關(guān)該應(yīng)用的推廣可謂鋪天蓋地,很明顯對(duì)于新興的大模型應(yīng)用而言,收獲第一批用戶才是至關(guān)重要的。

據(jù)傳Kimi在廣告投放上,吸引每位新用戶的花費(fèi)在10元左右,而新用戶參與到使用中帶來(lái)的額外算力開(kāi)銷在12元至13元左右。如果單單只是根據(jù)手機(jī)平臺(tái)app的下載量計(jì)算,那么Kimi的每日獲客成本至少為20萬(wàn)人民幣,而這還未計(jì)算來(lái)自網(wǎng)頁(yè)端和小程序端的用戶。

wKgZomYCnf2AOjdbAADS5hsoY5M413.png
AI產(chǎn)品國(guó)內(nèi)總榜 / AI產(chǎn)品榜


而且Kimi的推廣也不是從200萬(wàn)長(zhǎng)文本功能的推出才開(kāi)始的,早在二月份Kimi就開(kāi)始以長(zhǎng)文本這一特性加強(qiáng)商業(yè)推廣了。從AI產(chǎn)品榜中可以看出,Kimi在2月的訪問(wèn)量飆升,在國(guó)內(nèi)總榜中僅次于百度文心一言和阿里通義千問(wèn),足見(jiàn)其在商業(yè)推廣和產(chǎn)品運(yùn)營(yíng)上都下了血本。但相對(duì)ChatGPT和New Bing之類的應(yīng)用而言,其訪問(wèn)量還是存在很大的差距。

這也充分說(shuō)明了為何國(guó)外的大模型應(yīng)用沒(méi)有去卷200K以上文本長(zhǎng)度的原因,目前算力、準(zhǔn)確度和長(zhǎng)文本之間的沖突限制了他們?nèi)グl(fā)展長(zhǎng)文本。但這對(duì)于中國(guó)的大模型應(yīng)用來(lái)說(shuō),反而是一個(gè)彎道超車的機(jī)會(huì),因?yàn)榇竽P蜕系拈L(zhǎng)文本能力確實(shí)帶來(lái)了用戶體驗(yàn)上的改變。

長(zhǎng)文本對(duì)于用戶體驗(yàn)的改變

國(guó)產(chǎn)大模型為什么要去卷長(zhǎng)文本,這是一個(gè)與大模型應(yīng)用落地息息相關(guān)的問(wèn)題。在過(guò)去,正是由于長(zhǎng)文本能力不足,絕大多數(shù)大模型應(yīng)用才會(huì)給人不堪大用的感覺(jué),比如虛擬助手由于長(zhǎng)文本能力不足,會(huì)遺忘重要信息;基于大模型來(lái)設(shè)計(jì)劇本殺等游戲規(guī)則時(shí),上下文長(zhǎng)度不夠只能在規(guī)則和設(shè)定上縮水,從而簡(jiǎn)化游戲難度;在論文分析和法律法規(guī)解讀這樣的關(guān)鍵領(lǐng)域,更是因?yàn)槿狈﹂L(zhǎng)文本的支持,無(wú)法給到用戶精準(zhǔn)的答案。

這與大模型卷參數(shù)規(guī)模不同,因?yàn)橛脩粢呀?jīng)發(fā)現(xiàn)了即便是70B這個(gè)量級(jí)的大模型,在面對(duì)用戶的問(wèn)題時(shí),也會(huì)出現(xiàn)胡編亂造的問(wèn)題。反倒是長(zhǎng)文本提供了更多的上下文信息,大模型在對(duì)語(yǔ)義進(jìn)行分析判斷后,會(huì)提供更加精確的答案,所以不少用戶才會(huì)借助Kimi來(lái)分解長(zhǎng)篇小說(shuō)、總結(jié)論文等。

不過(guò)在享受長(zhǎng)文本處理帶來(lái)便利的同時(shí),我們也應(yīng)該注意下長(zhǎng)文本處理背后潛在的信息安全和版權(quán)問(wèn)題。對(duì)于過(guò)去短文本的處理,就已經(jīng)存在一些可能暴露用戶真實(shí)身份和隱私信息的問(wèn)題,隨著長(zhǎng)文本支持對(duì)于更大文件和更長(zhǎng)文本的處理,有的人可能會(huì)選擇將合同、條例或標(biāo)準(zhǔn)等包含敏感信息的專業(yè)文件上傳到大模型上,又或是引入一些盜版文檔資源。

所以國(guó)家層面也開(kāi)始出臺(tái)各種管理辦法,對(duì)于大模型語(yǔ)言模型在內(nèi)的生成式人工智能進(jìn)行規(guī)范,不能侵犯知識(shí)產(chǎn)權(quán)并保護(hù)個(gè)人隱私。如此一來(lái),對(duì)于大模型應(yīng)用本身的信息脫敏也提出了更高的要求。

寫在最后

相信經(jīng)過(guò)一年的大模型應(yīng)用轟炸后,不少用戶對(duì)于基本的AGI玩法已經(jīng)玩膩了,所以長(zhǎng)文本、文生視頻這種新的交互方式才會(huì)讓人趨之若鶩。但我們也很少看到成功的長(zhǎng)文本大模型商業(yè)化落地項(xiàng)目,畢竟在高額的獲客成本下,RAG這種外掛知識(shí)庫(kù)的方式可能更適合手中資金有限的初創(chuàng)AGI應(yīng)用開(kāi)發(fā)商。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    100

    瀏覽量

    10819
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3647

    瀏覽量

    5176
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    346

    瀏覽量

    1327
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中科曙光3套scaleX萬(wàn)集群落地國(guó)家算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)

    2月5日,由中科曙光提供的3套萬(wàn)集群系統(tǒng)在國(guó)家算互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)同時(shí)上線試運(yùn)行,成為全國(guó)首個(gè)實(shí)現(xiàn)3萬(wàn)卡部署、且實(shí)際投入運(yùn)營(yíng)的最大國(guó)產(chǎn)
    的頭像 發(fā)表于 02-09 10:32 ?458次閱讀

    Linux Shell文本處理神器合集:15個(gè)工具+實(shí)戰(zhàn)例子,效率直接翻倍

    在 Linux 系統(tǒng)中,文本是數(shù)據(jù)交互的 “通用語(yǔ)言”—— 日志文件、配置文件、數(shù)據(jù)報(bào)表、程序輸出幾乎都以文本形式存在。手動(dòng)編輯文本不僅繁瑣,還容易出錯(cuò),而掌握 Shell 文本處理
    的頭像 發(fā)表于 02-03 15:42 ?1442次閱讀
    Linux Shell<b class='flag-5'>文本處理</b>神器合集:15個(gè)工具+實(shí)戰(zhàn)例子,效率直接翻倍

    Neway微波國(guó)產(chǎn)化替代方案

    關(guān)鍵技術(shù)指標(biāo)上已與進(jìn)口產(chǎn)品持平,同時(shí)采購(gòu)成本降低30%-45%。通過(guò)優(yōu)化拓?fù)浣Y(jié)構(gòu)和散熱設(shè)計(jì),國(guó)產(chǎn)模塊在高溫老化測(cè)試中展現(xiàn)出更穩(wěn)定的性能曲線,MTBF(平均無(wú)故障時(shí)間)突破10萬(wàn)小時(shí)。電源模塊優(yōu)化降低
    發(fā)表于 01-30 08:45

    部分能力超越2027年NVL576,中科曙光發(fā)布scaleX萬(wàn)集群

    2025年12月18日,在昆山舉行的光合組織2025人工智能創(chuàng)新大會(huì)(HAIC2025)上,中科曙光發(fā)布并展出了全球領(lǐng)先的大規(guī)模智能計(jì)算系統(tǒng)——scaleX萬(wàn)集群,這也是國(guó)產(chǎn)萬(wàn)卡級(jí)
    發(fā)表于 12-18 18:30 ?1094次閱讀
    部分能力超越2027年NVL576,中科曙光發(fā)布scaleX<b class='flag-5'>萬(wàn)</b>卡<b class='flag-5'>超</b>集群

    禾賽科技激光雷達(dá)已累計(jì)交付200萬(wàn)臺(tái)

    今日,全球激光雷達(dá)領(lǐng)導(dǎo)者禾賽科技(NASDAQ: HSAI;HKEX: 2525)宣布,公司累計(jì)第 200 萬(wàn)臺(tái)激光雷達(dá)已于 11 月中旬在禾賽麥克斯韋智造中心正式量產(chǎn)下線并交付客戶。禾賽成為全球首個(gè)累計(jì)量產(chǎn)并交付
    的頭像 發(fā)表于 11-17 15:47 ?2209次閱讀

    萬(wàn)字長(zhǎng)文AI智能體:17種體架構(gòu)詳細(xì)實(shí)現(xiàn)

    數(shù)據(jù)科學(xué)AI智能體領(lǐng)域發(fā)展迅猛,但許多資源仍然過(guò)于抽象和理論化。創(chuàng)建此項(xiàng)目的目的是為開(kāi)發(fā)者、研究人員和AI愛(ài)好者提供一條結(jié)構(gòu)化、實(shí)用且深入的學(xué)習(xí)路徑,以掌握構(gòu)建智能系統(tǒng)的藝術(shù)。
    的頭像 發(fā)表于 11-07 13:16 ?548次閱讀
    <b class='flag-5'>萬(wàn)字長(zhǎng)文</b>AI智能體:17種體架構(gòu)詳細(xì)實(shí)現(xiàn)

    廣和通成功部署DeepSeek-R1-0528-Qwen3-8B模型

    近日,廣和通在MediaTek MT8893平臺(tái)上成功部署并運(yùn)行了DeepSeek-R1-0528-Qwen3-8B模型,顯著提升了端側(cè)AI設(shè)備的處理效率與智能化水平,特別是在本地化復(fù)雜文本處理
    的頭像 發(fā)表于 09-26 13:35 ?858次閱讀

    3萬(wàn)字長(zhǎng)文!深度解析大語(yǔ)言模型LLM原理

    我們正在參加全球電子成就獎(jiǎng)的評(píng)選,歡迎大家?guī)臀覀兺镀薄x謝支持本文轉(zhuǎn)自:騰訊技術(shù)工程作者:royceshao大語(yǔ)言模型LLM的精妙之處在于很好地利用數(shù)學(xué)解決了工業(yè)場(chǎng)景的問(wèn)題,筆者基于過(guò)往工程經(jīng)驗(yàn)
    的頭像 發(fā)表于 09-02 13:34 ?3447次閱讀
    3<b class='flag-5'>萬(wàn)字長(zhǎng)文</b>!深度解析大語(yǔ)言<b class='flag-5'>模型</b>LLM原理

    產(chǎn)品拆解 | 添可芙萬(wàn)“極”洗地機(jī)(上):AI 全向助力如何實(shí)現(xiàn)?

    2個(gè)滾輪電機(jī)、1個(gè)滾刷電機(jī)、1個(gè)風(fēng)機(jī)、1個(gè)水泵,5個(gè)電機(jī)的電控和主控方案應(yīng)該如何設(shè)計(jì)?“AI全向助力”怎么實(shí)現(xiàn)?元器件國(guó)產(chǎn)比例如何?本期拆解添可芙萬(wàn)8月新品極洗地機(jī)的設(shè)計(jì)方案思路,看看國(guó)產(chǎn)
    的頭像 發(fā)表于 08-25 16:24 ?3077次閱讀
    產(chǎn)品拆解 | 添可芙<b class='flag-5'>萬(wàn)</b>“極<b class='flag-5'>客</b>”洗地機(jī)(上):AI 全向助力如何實(shí)現(xiàn)?

    產(chǎn)品拆解 | 添可芙萬(wàn)“極”洗地機(jī)(下)

    收納底座如何同時(shí)完成烘干、風(fēng)干和充電三大功能?電池管理模塊在充放電控制與安全保護(hù)上采用了怎樣的設(shè)計(jì)?國(guó)產(chǎn)功率器件和控制芯片在其中的占比如何?本期拆解下篇聚焦添可芙萬(wàn)洗地機(jī)的電源與BMS方案。 在
    的頭像 發(fā)表于 08-25 16:23 ?2101次閱讀
    產(chǎn)品拆解 | 添可芙<b class='flag-5'>萬(wàn)</b>“極<b class='flag-5'>客</b>”洗地機(jī)(下)

    小馬智行L4域控制器路測(cè)200萬(wàn)公里

    近日,小馬智行宣布第七代Robotaxi所搭載的L4車規(guī)級(jí)域控制器已累計(jì)測(cè)試200萬(wàn)公里。作為全球首個(gè)L4 Robotaxi車規(guī)級(jí)量產(chǎn)域控制器,200
    的頭像 發(fā)表于 07-26 09:14 ?1112次閱讀

    萬(wàn)字全文科普:什么是IP?

    半導(dǎo)體行業(yè)在一個(gè)復(fù)雜且快速發(fā)展的生態(tài)系統(tǒng)中運(yùn)作,并由持續(xù)創(chuàng)新驅(qū)動(dòng)。該生態(tài)系統(tǒng)的核心是半導(dǎo)體價(jià)值鏈,它包含幾個(gè)關(guān)鍵階段:芯片設(shè)計(jì)、晶圓制造、最終組裝和原材料采購(gòu)。每個(gè)階段對(duì)于半導(dǎo)體器件的生產(chǎn)和功能都至關(guān)重要。IP提供商在這一框架中發(fā)揮著關(guān)鍵作用,尤其是在芯片設(shè)計(jì)階段,該階段是整個(gè)價(jià)值鏈的基礎(chǔ)。他們提供專業(yè)的尖端技術(shù),以增強(qiáng)創(chuàng)新、促進(jìn)無(wú)縫集成、確保合規(guī)性并加快產(chǎn)
    的頭像 發(fā)表于 07-21 09:53 ?1128次閱讀
    <b class='flag-5'>萬(wàn)字</b>全文科普:什么是IP?

    萬(wàn)字長(zhǎng)文】物聯(lián)網(wǎng)的激蕩二十年

    2005年11月,在突尼斯舉辦的信息社會(huì)世界峰會(huì)(WSIS)上,國(guó)際電信聯(lián)盟(ITU)發(fā)布了一份名為《ITU互聯(lián)網(wǎng)報(bào)告2005:物聯(lián)網(wǎng)》,正式向世人展示了什么是“物聯(lián)網(wǎng)(InternetofThings)”。雖然業(yè)界一致認(rèn)為,1999年,麻省理工學(xué)院的KevinAshton首次提出”物聯(lián)網(wǎng)”這一術(shù)語(yǔ),但僅僅只是一個(gè)理念,沒(méi)有成體系的解釋,也無(wú)法形成共識(shí)。而I
    的頭像 發(fā)表于 06-27 13:42 ?1596次閱讀
    【<b class='flag-5'>萬(wàn)字長(zhǎng)文</b>】物聯(lián)網(wǎng)的激蕩二十年

    Linux中文本處理命令的用法

    Linux 三劍是(grep,sed,awk)三者的簡(jiǎn)稱,熟練使用這三個(gè)工具可以提升運(yùn)維效率。Linux 三劍以正則表達(dá)式作為基礎(chǔ),而在Linux系統(tǒng)中,支持兩種正則表達(dá)式,分別為“標(biāo)準(zhǔn)正則表達(dá)式”和“擴(kuò)展正則表達(dá)式”。在掌握好正則表達(dá)式后,將具體講解三劍
    的頭像 發(fā)表于 04-15 10:22 ?759次閱讀
    Linux中<b class='flag-5'>文本處理</b>命令的用法

    國(guó)產(chǎn)首款量產(chǎn)型七位半萬(wàn)用表!青島漢泰開(kāi)啟國(guó)產(chǎn)高精度測(cè)量新篇章。

    國(guó)產(chǎn)首款量產(chǎn)型七位半萬(wàn)用表!青島漢泰開(kāi)啟國(guó)產(chǎn)高精度測(cè)量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數(shù)字萬(wàn)用表。HDM3075系列是
    發(fā)表于 04-01 13:15