2023年,以基于GPT模型對(duì)話應(yīng)用為代表的生成式AI浪潮席卷全球,引起企業(yè)廣泛關(guān)注。自此,由生成式AI引導(dǎo)的企業(yè)變革序幕全面展開(kāi),企業(yè)向數(shù)智化轉(zhuǎn)型邁出了堅(jiān)實(shí)的一步。
西門(mén)子股份公司(以下簡(jiǎn)稱“西門(mén)子”)是一家專注于工業(yè)、基礎(chǔ)設(shè)施、交通和醫(yī)療領(lǐng)域的科技公司。從更高效節(jié)能的工廠、更具韌性的供應(yīng)鏈、更智能的樓宇和電網(wǎng),到更清潔、更舒適的交通以及先進(jìn)的醫(yī)療系統(tǒng),西門(mén)子致力于讓科技有為,為客戶創(chuàng)造價(jià)值。
出于企業(yè)戰(zhàn)略考慮,在結(jié)合業(yè)務(wù)具體需求的前提下,西門(mén)子中國(guó)與亞馬遜云科技合作開(kāi)發(fā)了基于生成式人工智能技術(shù)的智能會(huì)話機(jī)器人“小禹”,在生成式AI領(lǐng)域邁出了可喜的一步。目前,西門(mén)子中國(guó)使用的亞馬遜云科技服務(wù)包括:Amazon EKS、Amazon RDS、Amazon Lambda、Amazon S3、Amazon OpenSearch Service、Amazon ElastiCache、Amazon SageMaker等。
機(jī)會(huì):運(yùn)用生成式AI之力
打破數(shù)據(jù)孤島,重塑數(shù)據(jù)價(jià)值
作為一家擁有全球視野、獨(dú)具未來(lái)前瞻思考的公司,西門(mén)子中國(guó)認(rèn)為科技創(chuàng)新是企業(yè)韌性成長(zhǎng)、保持領(lǐng)先的關(guān)鍵。因此,如何運(yùn)用新興科技更好地發(fā)掘數(shù)據(jù)價(jià)值,是西門(mén)子中國(guó)持續(xù)發(fā)力的方向。西門(mén)子中國(guó)大禹團(tuán)隊(duì)?wèi)?yīng)用大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)、云技術(shù)、低代碼來(lái)組建數(shù)據(jù)分析系統(tǒng),專注于創(chuàng)新領(lǐng)域,借助AI能力更好地發(fā)揮數(shù)據(jù)的價(jià)值。
在構(gòu)建知識(shí)庫(kù)的過(guò)程中,大禹團(tuán)隊(duì)通過(guò)調(diào)研認(rèn)識(shí)到,長(zhǎng)期以來(lái)企業(yè)內(nèi)部資源的檢索和調(diào)用都存在結(jié)構(gòu)散亂、檢索速度慢、交互不便等問(wèn)題。由于橫跨多個(gè)不同領(lǐng)域、涉及多個(gè)不同業(yè)務(wù)單元,如若以傳統(tǒng)方式打造知識(shí)庫(kù),這些問(wèn)題將一直是橫亙?cè)诓块T(mén)間的長(zhǎng)久之痛。因此,大禹團(tuán)隊(duì)決定將大數(shù)據(jù)庫(kù)和生成式AI應(yīng)用于一個(gè)全新的“智能知識(shí)庫(kù)”,從根本上提升知識(shí)庫(kù)的可用性。
長(zhǎng)期以來(lái)亞馬遜云科技一直是西門(mén)子中國(guó)的重要合作伙伴,雙方在多個(gè)項(xiàng)目上有著緊密合作,因此,西門(mén)子大禹團(tuán)隊(duì)決定再度與亞馬遜云科技攜手,在亞馬遜云的技術(shù)支持下,開(kāi)發(fā)這款為西門(mén)子中國(guó)量身打造的以人工智能生成的方式進(jìn)行交互的智能聊天機(jī)器人。
解決方案:高完成度解決方案指南,
生成式對(duì)話機(jī)器人小禹敏捷落地
由于公司體量龐大,智能數(shù)據(jù)庫(kù)的構(gòu)建需面向多個(gè)不同業(yè)務(wù)部門(mén),勢(shì)必涉及大量的業(yè)務(wù)數(shù)據(jù)和文本數(shù)據(jù)。因此,智能知識(shí)庫(kù)的存儲(chǔ)架構(gòu),成為亞馬遜云科技設(shè)計(jì)智能知識(shí)庫(kù)時(shí)的首要考慮。
亞馬遜云科技認(rèn)為,智能知識(shí)庫(kù)的架構(gòu)設(shè)計(jì),實(shí)質(zhì)上是大語(yǔ)言模型(LLM,Large Language Model)在知識(shí)檢索領(lǐng)域如何得到充分利用的問(wèn)題。以往要讓LLM在特定領(lǐng)域發(fā)揮作用,通常依靠的方法是提示工程(Prompt Engineering),通過(guò)不斷完善提問(wèn)關(guān)鍵字,獲得對(duì)大語(yǔ)言模型的深入理解。但提示工程在知識(shí)庫(kù)這種相對(duì)具體的應(yīng)用場(chǎng)合,效果不甚理想,對(duì)模型進(jìn)行微調(diào)(Fine-tune)又可能導(dǎo)致成本過(guò)高。為此,亞馬遜云科技決定采取檢索增強(qiáng)生成(RAG,Retrieval Augment Generation)方式增強(qiáng)模型,使之具有來(lái)自存檔知識(shí)源的增強(qiáng)上下文的模型架構(gòu)。
通過(guò)深思熟慮,最終亞馬遜云科技為大禹團(tuán)隊(duì)提供的,是一個(gè)智能知識(shí)庫(kù)暨智能會(huì)話機(jī)器人的解決方案指南,其中包括預(yù)訓(xùn)練大語(yǔ)言模型,Amazon OpenSearch Service的向量數(shù)據(jù)服務(wù),以及相關(guān)系統(tǒng)集成等。該解決方案指南具備自然語(yǔ)言處理能力、知識(shí)庫(kù)檢索能力、甚至是以數(shù)據(jù)去訓(xùn)練大語(yǔ)言模型的能力,這些核心關(guān)鍵能力讓解決方案指南能實(shí)現(xiàn)目標(biāo)知識(shí)庫(kù)約80%功能,西門(mén)子中國(guó)根據(jù)企業(yè)內(nèi)部需求再做20%定制化開(kāi)發(fā),最終形成完整的解決方案。
整個(gè)解決方案指南中,最大的亮點(diǎn)在于“RAG架構(gòu)+向量數(shù)據(jù)庫(kù)”設(shè)計(jì):核心主體知識(shí)庫(kù)以向量方式構(gòu)建,能夠存儲(chǔ)超大規(guī)模的向量數(shù)據(jù)。通過(guò)對(duì)數(shù)據(jù)進(jìn)行向量嵌入處理,跨部門(mén)、跨業(yè)務(wù)、跨場(chǎng)景的數(shù)據(jù)之間也能夠進(jìn)行關(guān)系考量。而Amazon OpenSearch Service的k近鄰(kNN)插件為它提供了核心向量數(shù)據(jù)庫(kù)功能,現(xiàn)在向量嵌入可以與單個(gè)混合請(qǐng)求中基于文本的關(guān)鍵字組合,查詢時(shí)在幾毫秒內(nèi)就可獲得數(shù)十億向量的上下文相關(guān)響應(yīng)。
另一方面,RAG架構(gòu)極大地拓展了大模型的可用性。普通情況下當(dāng)知識(shí)庫(kù)新增內(nèi)容時(shí),相應(yīng)的大模型必須進(jìn)行微調(diào),甚至是重新訓(xùn)練。而RAG允許對(duì)新增部分使用相同的模型處理,無(wú)需調(diào)整模型。這就相當(dāng)于知識(shí)庫(kù)在不影響訪問(wèn)速度的前提下,擁有了近乎無(wú)限的可擴(kuò)展性。由向量數(shù)據(jù)庫(kù)保障的杰出性能,再加上RAG架構(gòu)提供的無(wú)限潛力,這就是智能會(huì)話機(jī)器人“小禹”能夠在用戶以簡(jiǎn)單語(yǔ)言進(jìn)行提問(wèn)的前提下,快速反饋生成式回答的秘密。
并且,由于亞馬遜云科技提供了包括向量數(shù)據(jù)庫(kù)、生成式AI在內(nèi)的一系列核心技術(shù),整個(gè)解決方案指南完成度高達(dá)80%,而Amazon OpenSearch Service的無(wú)服務(wù)器特性,讓開(kāi)發(fā)人員不需要管理集群或擔(dān)心生產(chǎn)規(guī)模,可以快速推動(dòng)部署。
Amazon SageMaker也為架構(gòu)的伸縮性以及大語(yǔ)言模型持續(xù)迭代提供了很大幫助。借助SageMaker Endpoint的彈性伸縮能力,系統(tǒng)可以自動(dòng)按照負(fù)載調(diào)整用于實(shí)時(shí)推理的資源,保證訪問(wèn)需求的同時(shí)提升整體性價(jià)比。Amazon SageMaker上提供了豐富的模型開(kāi)發(fā)和訓(xùn)練工具,保證客戶可以在云端輕松實(shí)現(xiàn)大語(yǔ)言模型的調(diào)優(yōu)以及測(cè)試更多不同類(lèi)型的開(kāi)源模型。
最終大禹團(tuán)隊(duì)完成后續(xù)開(kāi)發(fā)和整套系統(tǒng)的部署時(shí)間大大縮短,整體開(kāi)發(fā)與部署僅用三個(gè)月就圓滿完成。

大模型對(duì)于很多企業(yè)用戶而言都是新生事物,從接受、熟悉到使用大模型,往往是一個(gè)漫長(zhǎng)的過(guò)程。亞馬遜云科技不僅為企業(yè)客戶提供充裕的多樣化算力、以及包括向量數(shù)據(jù)服務(wù)在內(nèi)的數(shù)據(jù)基礎(chǔ)設(shè)施來(lái)滿足和支撐大模型,更提供解決方案指南并與企業(yè)用戶共同進(jìn)行后續(xù)開(kāi)發(fā)。這讓客戶無(wú)需再花費(fèi)時(shí)間在重復(fù)性的基礎(chǔ)建設(shè)上,從而能夠在非常短的時(shí)間內(nèi)把垂直的、定制化的企業(yè)解決方案落地并投入應(yīng)用。這在人工智能高速發(fā)展,日新月異的今天,有重要的意義。
業(yè)務(wù)成果:首周超過(guò)4000用戶使用,12000個(gè)問(wèn)題被解答
相對(duì)于傳統(tǒng)機(jī)器人,“小禹”智能會(huì)話機(jī)器人的回答內(nèi)容不僅生成速度更快,其對(duì)搜索關(guān)鍵詞的命中率也更高,整體使用體驗(yàn)遠(yuǎn)超傳統(tǒng)機(jī)器人。
西門(mén)子中國(guó)專屬智能知識(shí)庫(kù)上線后,首周就有超過(guò)4000位內(nèi)部用戶參與使用,超過(guò)12000個(gè)問(wèn)題被提出并解答。作為智能知識(shí)庫(kù),它不但解決了各業(yè)務(wù)部門(mén)之間需求相似、重復(fù)開(kāi)發(fā)的問(wèn)題,更以云上彈性資源和托管的Amazon OpenSearch Service、Amazon SageMaker等服務(wù)節(jié)約了系統(tǒng)在運(yùn)維和擴(kuò)展方面的投入成本。后續(xù)西門(mén)子大禹團(tuán)隊(duì)仍將不斷完善智能知識(shí)庫(kù)與“小禹”智能會(huì)話機(jī)器人,與亞馬遜云科技團(tuán)隊(duì)以“聯(lián)合創(chuàng)新”模式合作,共同探討產(chǎn)品所需要的功能和實(shí)現(xiàn)方法,打造更優(yōu)秀的產(chǎn)品功能與體驗(yàn)。
未來(lái),西門(mén)子中國(guó)將與亞馬遜云科技在人工智能領(lǐng)域展開(kāi)更為深度的合作,在數(shù)字孿生、工業(yè)元宇宙等多個(gè)方面進(jìn)一步發(fā)揮人工智能的作用。此前亞馬遜云科技的一些產(chǎn)品和功能已被運(yùn)用到西門(mén)子中國(guó)成都燈塔工廠,用于廢料分揀、產(chǎn)品自檢等關(guān)鍵的生產(chǎn)制造環(huán)節(jié)。可以想像在將來(lái),人工智能技術(shù)一定能夠以多種多樣的方式,發(fā)揮更大價(jià)值。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301404 -
亞馬遜
+關(guān)注
關(guān)注
8文章
2731瀏覽量
85742 -
大模型
+關(guān)注
關(guān)注
2文章
3650瀏覽量
5183
發(fā)布評(píng)論請(qǐng)先 登錄
通過(guò)西門(mén)子平臺(tái)API獲取搜索列表數(shù)據(jù)的技術(shù)實(shí)踐
西門(mén)子宣布收購(gòu)Canopus AI
???????通過(guò)西門(mén)子平臺(tái) API 接口高效獲取 XMZ 詳情數(shù)據(jù)
西門(mén)子EDA與Arm攜手合作加速系統(tǒng)設(shè)計(jì)驗(yàn)證進(jìn)程與軟件啟動(dòng)
亞馬遜云科技攜手西門(mén)子運(yùn)用生成式AI之力,打破數(shù)據(jù)孤島
評(píng)論