91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

LangChain:為你定制一個專屬的GPT

阿爾法工場研究院 ? 來源:阿爾法工場研究院 ? 2023-04-24 11:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導語:用戶可以利用LangChain的模塊來改善大語言模型的使用,通過輸入自己的知識庫來“定制化”自己的大語言模型。

LLM(大語言模型) 是一項變革性的技術,它將人類的各類知識和邏輯能力打包進入了一個體積龐大的模型當中。

但是通常來說,包括當前公認效果最好的LLM GPT-4都會有一個問題——事實問題錯誤,也常被稱之為幻覺?;糜X(Hallucination),或者說人工智能幻覺是人工智能的自信反應。

當模型輸出欺騙性數(shù)據(jù)的傾向時,其使用的的訓練數(shù)據(jù)并不能證明輸出的合理性。人工智能幻覺的危險之處之一是模型的輸出看起來是正確的,其實它本質上是錯誤的。

基于這種前提條件下,若是直接將LLM利用于生產(chǎn)環(huán)境中(例如客服答疑,新形式文檔等)時,那么事實幻覺就可能會造成極其嚴重的影響。

但是通過LangChain,我們可以通過將其它計算資源和自有的知識庫結合。依托于當前的各類產(chǎn)品,在整合了當前的語料資源庫后,各類LLM都會進入到一個新的實用化發(fā)展階段。

LangChain介紹

LangChain是一個用于開發(fā)基于語言模型的應用程序開發(fā)框架??偟膩碚f,LangChain是一個鏈接面向用戶程序和LLM之間的一個中間層。

它在 2023 年 3 月獲得了 Benchmark Capital 的 1000 萬美元種子輪融資,在近期又拿到了紅杉2000-2500萬美金的融資,估值已經(jīng)提升到了2億美金左右。

LangChain 可以輕松管理與語言模型的交互,將多個組件鏈接在一起,并集成額外的資源,例如 API 和數(shù)據(jù)庫。其組件包括了模型(各類LLM),提示模板(Prompts),索引,代理(Agent),記憶等等。

當前GitHub上的熱門項目Auto-GPT和Babyagi所使用的鏈式思考能力都是由LangChain啟發(fā)而來。

0bb89c10-df25-11ed-bfe3-dac502259ad0.png

LangChain項目主頁圖

LangChain工作流程

本次重點介紹LangChain搭配自有的知識庫讓LLM發(fā)揮更大功能的流程。

在缺少了上下文的情況下,即使是目前公認最頂級的LLM GPT-4也無法回答部分需要特定領域的知識。

而要是想僅用自有知識庫來訓練出LLMs又是不可能的,這個時候最好的方法就是利用LangChain的模塊來改善LLM的使用,通過輸入自己的知識庫來“定制化”自己的LLM。

Question Answering over specific documents是一個寫在LangChain主頁的主推功能。翻譯過來就是 基于特定文檔的問答 。

1.準備自定義數(shù)據(jù)

準備好需要LLM學習的內容,它可以是一個純文本文件或者其他類型的文本(不同類型的文本需要不同的文檔加載器)。

2.拆分文檔

一般來講,每個文檔都是由復雜長短句、多種語法結合寫作而成的。在進行輸入之前,就必須對這些文字進行解構處理。

對于英文LangChain一般會使用RecursiveCharacterTextSplitter處理。由于中文的復雜性,會使用到jieba等處理工具預處理中文語句。

3.文本嵌入(Embeddings)

處理完文本之后,就可以對文本進行嵌入(Embeddings)了。通過調用OpenAI的Embeddings API將文本向量化。在這步處理之后,文本就已經(jīng)不再是文字,而是以向量化存儲的信息。

再使用一個開源的Embeddings數(shù)據(jù)庫ChromaDB保存Embeddings數(shù)據(jù),就可以達到使用數(shù)據(jù)長期存儲和快速調用。

0be7ed76-df25-11ed-bfe3-dac502259ad0.jpg

圖:將原文本嵌入

4.使用鏈(Chain)對矢量數(shù)據(jù)庫進行問答

在擁有了嵌入數(shù)據(jù)之后,我們就可以利用LangChain的強大鏈功能來執(zhí)行我們的問答。這時就可以通過自然語言對于文檔內容進行提問了。

0bfcdeb6-df25-11ed-bfe3-dac502259ad0.jpg

通過LangChain回答問題/完成任務

LangChain可能的應用場景

當前的AI熱潮吸引了很多人,而除了ChatGPT這類問答還有New Bing這種搜索服務外,并沒有什么可以將LLM商業(yè)化的案例。甚至可以說只有New Bing才是目前唯一一個成功的商業(yè)化案例。

LangChain為所有人提供了一個新的商業(yè)化方案。此前有將LLM導入客服軟件中應用的方案,但是由于LLM容易出現(xiàn)事實幻覺而無法實施。

同時,將所需內容通過Prompt導入LLM的想法也由于LLM的對話(Context)輸入限制而不可能實施。LangChain則通過將數(shù)據(jù)向量化避免了使用輸入限制,從而將所需內容導入LLM進行問答。

當下的人工成本逐漸提升,例如淘寶客服等人工密集型產(chǎn)業(yè)的成本逐步提升。當前的智能問答距離可用仍有較遠的距離。

通過已經(jīng)預訓練好的LLM是一個快速降本增效的方案?;诿總€產(chǎn)品的數(shù)據(jù),可以將數(shù)據(jù)引入LLM中,讓LLM接替客服工作,準確、快速的回答客戶的定制化問題,同時語氣貼合自然口吻,避免了情緒化工作。

基于文檔的工作還可以在各類公司培訓和智能化文檔方面提供作用。很多產(chǎn)品文檔隨著時間的積累變得越來越復雜,多層跳轉也會讓人學習起來效率低下且不適。

此時基于LangChain就可以將文檔重新梳理,輸出為大綱類,在使用的時候可以隨時通過問答的形式將內容輸出。類似于新員工培訓和產(chǎn)品說明書等等場景都可以有所應用。這就極大的拓寬了文字類LLM的使用場景。

0c24a89c-df25-11ed-bfe3-dac502259ad0.png

基于LangChain的問答

除了直接與人交互的方面外,還可以導入特定領域的知識庫,實時更新LLM的內容,讓LLM的知識時刻處于最新的狀態(tài)。依賴于此,LangChain除了可以完成自然語言文檔搜索外,還可以基于及時的資源進行快速開發(fā)。

0c482632-df25-11ed-bfe3-dac502259ad0.jpg

導入資源后LangChain開發(fā)出的網(wǎng)頁

當前LangChain的局限性

目前,由于整個AI生態(tài)還處于一種快速發(fā)展期,各類工具和平臺還沒有完全成熟,因此LangChain的各類鏈和模塊的定制性和功能都還不夠強大。對于有高性能場景需求和定制化任務的可能需要自己重新修改。

事實合法性也是未來需要解決的一個痛點。LLM的各類越獄層出不窮。雖然在引入了嵌入之后LLM只會對文檔內容進行問答,但是仍然需要有一套額外的監(jiān)督系統(tǒng)防止出現(xiàn)任何非法的回答。

同時當前LangChain還有使用難度較高等問題。目前的各類AI工具都面臨著普通用戶無法輕松駕馭等等的問題,而LangChain的問題更盛。

普通產(chǎn)品或者開發(fā)者的上手學習成本較高,使用起來難度很大。這一切都需要社區(qū)和商業(yè)資本的共同投入才有可能解決。

結語

LangChain是當前眾多的AGI實驗性工具的基石項目。基于鏈(Chain)的LLM調用思維勢必會貫穿未來LLM的發(fā)展生態(tài)。

提前關注AI發(fā)展動向,關注LangChain的開發(fā)進度,會對未來的AI應用落地有極大的幫助。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39795

    瀏覽量

    301460
  • 數(shù)據(jù)庫

    關注

    7

    文章

    4020

    瀏覽量

    68359
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16880

原文標題:LangChain:為你定制一個專屬的GPT

文章出處:【微信號:alpworks,微信公眾號:阿爾法工場研究院】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    GPT-5震撼發(fā)布:AI領域的重大飛躍

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月8日凌晨1點,OpenAI以場長達1小時的線上發(fā)布會正式推出GPT-5。這場被業(yè)界稱為“AI進化分水嶺”的發(fā)布,終結了長達兩年的技術猜測,更以多維度性能
    的頭像 發(fā)表于 08-09 07:44 ?1w次閱讀
    <b class='flag-5'>GPT</b>-5震撼發(fā)布:AI領域的重大飛躍

    專屬“數(shù)字員工”已到崗!迅RK3588系列適配OpenClaw

    專屬“數(shù)字員工”已到崗!迅RK3588系列適配OpenClaw
    的頭像 發(fā)表于 02-27 15:33 ?392次閱讀
    <b class='flag-5'>你</b>的<b class='flag-5'>專屬</b>“數(shù)字員工”已到崗!迅<b class='flag-5'>為</b>RK3588系列適配OpenClaw

    [工具討論] 如果有款國產(chǎn)圖形化配置工具STM32Cube,支持所有內核和廠商MCU,會用嗎?

    涉及多家廠商芯片時,要在多個工具間切換 如果有款這樣的工具 我們想和大家討論假設性問題: 如果有款國產(chǎn)的圖形化配置工具,具備以下特性,
    發(fā)表于 01-26 10:30

    定制灌封膠_特殊場景灌封膠定制化服務流程與案例

    什么是灌封膠定制化? 灌封膠定制化是指根據(jù)客戶具體的應用場景、工作環(huán)境、性能要求(如耐溫、耐腐蝕、耐老化、導熱、阻燃等)以及產(chǎn)品結構,量身研發(fā)和生產(chǎn)專屬配方的灌封膠產(chǎn)品。不同于通用型產(chǎn)品,定制
    的頭像 發(fā)表于 11-25 01:21 ?319次閱讀
    <b class='flag-5'>定制</b>灌封膠_特殊場景灌封膠<b class='flag-5'>定制</b>化服務流程與案例

    IoT設備賬號歸屬操作秘籍:專屬固件全攻略來啦!

    。 ? 、創(chuàng)建項目 首先,需要登錄,并進入IoT管理頁面。 點擊【新建項目】,創(chuàng)建項目,以便后續(xù)將設備歸屬到此項目中來管控。 二、歸屬設備 接下來開始進行歸屬操作,首先點擊【專屬
    的頭像 發(fā)表于 11-14 16:45 ?1030次閱讀
    IoT設備賬號歸屬操作秘籍:<b class='flag-5'>專屬</b>固件全攻略來啦!

    專屬固件助力IoT設備賬號歸屬變更:詳細操作說明!

    順利完成操作。 ? 、創(chuàng)建項目 首先,需要登錄,并進入IoT管理頁面。 點擊【新建項目】,創(chuàng)建項目,以便后續(xù)將設備歸屬到此項目中來管控。 二、歸屬設備 接下來開始進行歸屬操作,首先點擊【
    的頭像 發(fā)表于 11-14 16:41 ?321次閱讀
    <b class='flag-5'>專屬</b>固件助力IoT設備賬號歸屬變更:詳細操作說明!

    GPT-5.1發(fā)布 OpenAI開始拼情商

    問題。 Sam Altman 發(fā)文稱GPT-5.1是次不錯的模型升級。 GPT-5.1 Instant:ChatGPT 最常用的模型,更溫暖、更智能,也更善于遵循指令的模型。 GPT
    的頭像 發(fā)表于 11-13 15:49 ?707次閱讀

    【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出

    的信息 */ R_GPT_InfoGet(&g_timer2_ctrl, &info); /* 獲得計時器周期需要的計數(shù)次數(shù) */ uint32_t
    發(fā)表于 09-01 15:20

    杰和N150處理器體機主板,企業(yè)定制專屬出口方案

    行業(yè)背景:“不出海,就出局”,對于投身體機電腦海外業(yè)務的企業(yè)而言,精準把握市場特性,提供契合需求的產(chǎn)品解決方案,是搶占市場份額的關鍵所在。杰和科技依托深厚的技術積淀與豐富的行業(yè)經(jīng)驗,合作伙伴定制
    的頭像 發(fā)表于 07-31 13:44 ?1788次閱讀
    杰和N150處理器<b class='flag-5'>一</b>體機主板,<b class='flag-5'>為</b>企業(yè)<b class='flag-5'>定制</b><b class='flag-5'>專屬</b>出口方案

    【重磅】企業(yè)版華秋DFM&amp;華秋CAM正式發(fā)布!離線審查+定制開發(fā)+專屬護航

    深度工藝審查規(guī)則 ,且更多工藝審查規(guī)則和企業(yè)版專屬高階功能持續(xù)新增中 3、企業(yè)級專屬服務 ◆ 輕量 定制開發(fā) (最快3天交付企業(yè)專用規(guī)則庫) ◆ 代建元件庫服務:元件庫600萬+,支持代建服務
    發(fā)表于 06-11 16:02

    F1?與亞馬遜云科技聯(lián)合推出全新在線體驗 車迷可親手打造專屬賽道

    北京 ——2025 年 5 月 22 日 世界級方程式錦標賽?(以下簡稱:F1?)在其成立75周年之際,與亞馬遜云科技聯(lián)合推出了全新數(shù)字互動體驗,使其車迷可自主創(chuàng)建、定制并分享其專屬F1賽道
    發(fā)表于 05-22 11:40 ?1474次閱讀

    使用CYUSB3065制作了定制電路板,并且想要配置我的定制傳感器,遇到的幾個疑問求解

    我已經(jīng)使用 CYUSB3065 制作了定制電路板,并且想要配置我的定制傳感器,但有幾個問題。 1.I2C 時鐘 如果我想用 2 通道設置配置 AR0144 傳感器,這種情況下串行時
    發(fā)表于 05-15 08:14

    【RA-Eco-RA4M2開發(fā)板評測】RA-Eco-RA4M2 PWM輸出

    。 在瑞薩RA4M2系列 MCU 中有兩種定時器,種是通用 PWM 定時器 GPT,另外種是異步通用定時器 AGT,在這里我們使用通用定時器GPT進行PWM輸出。 Figure
    發(fā)表于 04-28 22:57

    4G控制器輕松定制恒壓供水運行頁面!

    恒壓供水定制頁面效果各位恒壓供水設備廠家們在使用博控云小程序的過程中,會不會有以下問題:能定制專屬的恒壓供水運行頁面嗎?界面同質化嚴重無法體現(xiàn)品牌差異化?無法投入過多時間精力用于設計搭建?能我提供
    的頭像 發(fā)表于 04-14 17:32 ?571次閱讀
    4G控制器輕松<b class='flag-5'>定制</b>恒壓供水運行頁面!

    樹莓派鏡像的制作、燒錄及運行

    是否想過自己動手打造專屬的操作系統(tǒng)鏡像?無論是極客項目定制開發(fā)環(huán)境,還是讓老舊設備煥發(fā)新
    的頭像 發(fā)表于 03-27 16:00 ?2571次閱讀