91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Rust編寫的首個Postgres基礎Elasticsearch開源替代品問世

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2024-02-22 11:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

YC S23 投了一個新項目ParadeDB[1], 非常有意思。他們的 Slogan 是 “Postgres for Search & Analytics —— Modern Elasticsearch Alternative built on Postgres”。就是用于搜索和分析的 PostgreSQL,旨在成為 Elasticsearch 的替代。

PostgreSQL 的生態(tài)確實越來越繁榮了,在基于 PG 的擴展與衍生中,我們已經有了基于 MongoDB 開源替代 —— FerretDB,SQL Server 開源替代 Babelfish,F(xiàn)irebase 開源替代 Supabase,AirTable 開源替代 NocoDB,等等等等,現(xiàn)在又多了 ElasticSearch 開源替代 —— ParadeDB。

96fa7832-cfd6-11ee-a297-92fbcf53809c.png

《PGSQL x Pigsty: 數(shù)據庫全能王來了》

ParadeDB 實際上是由三個 PostgreSQL 擴展組成:pg_bm25,pg_analytics,以及pg_sparse。這三個擴展都可以獨立使用了。應 ParadeDB 創(chuàng)始人所托,我已經將這幾個擴展打好包(v0.5.6),并將會在 Pigsty 的下個 Release v2.6 中默認收錄,讓用戶能夠開箱即用。

我翻譯了 ParadeDB 的官網介紹與四篇博客文章,為您介紹這個 PostgreSQL 生態(tài)的新星。今天是第一篇 —— ParadeDB 概覽

ParadeDB

我們榮幸地向您介紹 ParadeDB:針對搜索場景優(yōu)化的 PostgreSQL 數(shù)據庫。ParadeDB是第一個旨在成為 Elasticsearch 替代的 Postgres 數(shù)據庫構建,被設計為可以在PG表上進行閃電般快速的全文檢索、語義檢索、以及混合檢索。

ParadeDB解決什么問題?

對于許多組織而言,搜索依然是一個未解問題 —— 盡管有像 Elasticsearch 這樣的巨頭存在,但大多數(shù)與其打過交道的開發(fā)者都知道,運行、調優(yōu)和管理 Elasticsearch 是多么蛋疼。雖然也有其他的搜索引擎服務,但在現(xiàn)有數(shù)據庫上粘連對接這些外部服務,會引入更多重建索引和數(shù)據復制的復雜難題與成本。

那些追求統(tǒng)一權威數(shù)據源與搜索引擎的開發(fā)者轉向了 PostgreSQL,PG 已經通過tsvector提供了基本的全文檢索能力,也通過pgvector提供了向量語義檢索能力。這些工具也許對于簡單用例和中等大小的數(shù)據集來說很好使,但當表變大或查詢變得復雜時就有些不夠用了:

1.大表上的排序和關鍵詞搜索非常緩慢2.不支持 BM25 計算3.沒有混合檢索支持,將向量搜索與全文搜索的技術4.沒有實時搜索 — 數(shù)據必須手動重新索引或重新嵌入5.對復雜查詢如分面或相關性調優(yōu)的支持有限

到目前為止,我們已經目睹了許多工程團隊用很勉強的方式在 Postgres 上疊加了一套 Elasticsearch,隨即因為后者太過于臃腫、昂貴或復雜,而最終放棄。我們在想:如果 Postgres 本身就帶有 ElasticSearch 水平的搜索會發(fā)生什么?那么開發(fā)者就不會有這種兩難選擇了 —— 統(tǒng)一使用 PostgreSQL 但搜索能力受限,還是使用事實源和搜索引擎兩種獨立的服務?

ParadeDB適用于誰?

Elasticsearch 擁有廣泛的應用場景,但我們并不企圖一蹴而就地覆蓋所有場景——至少現(xiàn)階段不是。我們更傾向于專注于一些核心場景 —— 專為那些希望在 PostgreSQL 上進行搜索的用戶服務。對于以下情況,ParadeDB 會是您的理想選擇:

?希望使用單一 Postgres 作為事實來源,厭惡在多個服務之間搬運復制數(shù)據。?希望在不損害性能與可伸縮性的前提下,對存儲在 Postgres 中的海量文檔進行全文搜索。?希望 ANN/相似度搜索與全文搜索相結合,從而獲得更精準的語義匹配效果

譯者注:在 Clickbench 中,ParadeDB 的分析性能表現(xiàn)相當不錯,目前在 PG 生態(tài)的分析類插件中拔得頭籌。

97035bb4-cfd6-11ee-a297-92fbcf53809c.png

ParadeDB產品介紹

ParadeDB 是一個完全托管的 Postgres 數(shù)據庫,目前任何其他 PG 供應商都還沒有提供此類全文索引和搜索 PG 表的能力:

9716548a-cfd6-11ee-a297-92fbcf53809c.png

與 AWS RDS 等托管服務不同,ParadeDB 是一個 PostgreSQL 擴展插件,不需要任何設置,可以與整個 PG 生態(tài)集成,并完全可定制。ParadeDB 是開源的(AGPLv3),并提供了一個簡單的 Docker Compose 模板以滿足需要自建/定制的開發(fā)者的需求。

ParadeDB 的構建方式

ParadeDB 的核心是一個帶有自定義擴展的標準 Postgres 數(shù)據庫,這些擴展使用 Rust 編寫,引入了增強的搜索能力。

ParadeDB 的搜索引擎基于 Tantivy 構建,Tantivy 是受 Apache Lucene 啟發(fā)的開源 Rust 搜索庫。其索引作為原生的 PG 索引存儲在PG中,從而避免了繁瑣的數(shù)據復制/ETL工作,并同時可以確保事務 ACID。

ParadeDB 為 Postgres 生態(tài)提供了一個新擴展:pg_bm25。pg_bm25使用 BM25 評分算法在 Postgres 中實現(xiàn)了基于 Rust 的全文搜索。ParadeDB 會預裝這個擴展插件。

下一步是什么?

ParadeDB 的托管云版本目前處于 PrivateBeta 階段。我們的目標是在 2024 年初推出一個自助服務的云平臺。如果你想在此期間訪問 PrivateBeta 版本,歡迎加入我們的等待名單[2]。

我們核心團隊的重點是開發(fā) ParadeDB 的開源版本,將在 2023 年冬季推出。

我們 Build in Public,并很高興能與整個社區(qū)分享 ParadeDB。歡迎關注我們,在未來的博文中我們會進一步詳細介紹 ParadeDB 背后的有趣技術挑戰(zhàn)。

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據庫
    +關注

    關注

    7

    文章

    4018

    瀏覽量

    68329
  • SQL Server
    +關注

    關注

    0

    文章

    21

    瀏覽量

    13640

原文標題:ParadeDB:首個基于Postgres的Elasticsearch開源替代、采用Rust編寫

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    三防漆稀釋劑替代品對比:優(yōu)缺點+環(huán)保選擇 |鉻銳特實業(yè)

    鉻銳特實業(yè)|東莞廠家|三防漆稀釋劑能用什么替代?本文對比原裝稀釋劑、環(huán)保無苯型、醋酸丁酯、PMA等常見替代品的優(yōu)缺點、成本與性能影響,附行業(yè)數(shù)據和選擇建議,助您兼顧品質與成本。
    的頭像 發(fā)表于 02-26 00:12 ?87次閱讀
    三防漆稀釋劑<b class='flag-5'>替代品</b>對比:優(yōu)缺點+環(huán)保選擇 |鉻銳特實業(yè)

    Neway電機方案的替代兼容性體現(xiàn)在哪些方面

    ,某型號DC/DC轉換器輸入電壓為9-36V,輸出電壓為12V,與TI的TPS5430DDAR參數(shù)相同。輸出電流能力:Neway模塊的輸出電流能力與替代品牌產品相當,確保在相同負載條件下穩(wěn)定運行。例如
    發(fā)表于 01-15 09:22

    從0到1搭建實時日志監(jiān)控系統(tǒng):基于WebSocket + Elasticsearch的實戰(zhàn)方案

    低成本、實時性高的日志監(jiān)控系統(tǒng)。 2. 技術選型 數(shù)據存儲 :Elasticsearch(高效檢索與聚合) 實時推送 :WebSocket(全雙工通信,避免HTTP輪詢) 后端服務 :Node.js
    發(fā)表于 01-09 16:43

    2025開放原子開發(fā)者大會旋武開源社區(qū)Rust分論壇成功舉辦

    11月22日,2025開放原子開發(fā)者大會——旋武開源社區(qū)Rust分論壇在北京順利召開。論壇以“共建中國Rust生態(tài)”為核心主題,匯聚京東、華為、vivo、阿里、毛豆教育、DORA社區(qū)及南京大學等企業(yè)與學術機構技術專家,及眾多
    的頭像 發(fā)表于 11-27 14:55 ?657次閱讀

    深開鴻助力打造深圳首個面向開源鴻蒙的開發(fā)者培訓基地

    近日,由深開鴻共同推動的深圳市首個面向開源鴻蒙的開發(fā)者培訓基地在深圳龍華區(qū)數(shù)字創(chuàng)新中心正式啟用?!叭瞬派鷳B(tài)聯(lián)盟”同步成立,標志著深圳在開源鴻蒙人才培育、生態(tài)共建、創(chuàng)新培育與產業(yè)協(xié)同領域邁入全新
    的頭像 發(fā)表于 11-24 16:55 ?1475次閱讀
    深開鴻助力打造深圳<b class='flag-5'>首個</b>面向<b class='flag-5'>開源</b>鴻蒙的開發(fā)者培訓基地

    固態(tài)繼任:傾佳電子SiC MOSFET為何是現(xiàn)代電力系統(tǒng)中機械繼電器的理想替代品的分析報告

    固態(tài)繼任:傾佳電子SiC MOSFET為何是現(xiàn)代電力系統(tǒng)中機械繼電器的理想替代品的分析報告 傾佳電子(Changer Tech)是一家專注于功率半導體和新能源汽車連接器的分銷商。主要服務于中國工業(yè)
    的頭像 發(fā)表于 10-19 13:31 ?520次閱讀
    固態(tài)繼任:傾佳電子SiC MOSFET為何是現(xiàn)代電力系統(tǒng)中機械繼電器的理想<b class='flag-5'>替代品</b>的分析報告

    為什么薄硅片是一種高純度硅的替代品?# 薄硅片# 高純度# 硅

    半導體
    華林科納半導體設備制造
    發(fā)布于 :2025年09月24日 14:04:46

    RT-Thread 遇上 Rust:安全內核 RusT-Thread 的誕生

    大家好,我們是中國科學技術大學操作系統(tǒng)原理與設計(H)課oooooS小組。這個項目是我們的課程大作業(yè):參考RT-Thread架構,使用Rust搭建一個原生的嵌入式操作系統(tǒng)內核。初識Rust是因為xk
    的頭像 發(fā)表于 08-02 11:03 ?3534次閱讀
    RT-Thread 遇上 <b class='flag-5'>Rust</b>:安全內核 <b class='flag-5'>RusT</b>-Thread 的誕生

    100%開源!行業(yè)首個企業(yè)級智能體

    近日,京東云正式開源JoyAgent智能體。作為行業(yè)首個100%開源的企業(yè)級智能體,實現(xiàn)了產品級開源,包括前端、后端、框架、引擎和核心子智能體。開源
    的頭像 發(fā)表于 07-26 09:26 ?1178次閱讀

    請問OpenVINO? 是否支持 Rust 綁定?

    無法確定OpenVINO?是否支持 Rust 綁定。
    發(fā)表于 06-25 07:45

    單節(jié)點Elasticsearch+Filebeat+Kibana安裝指南

    單節(jié)點Elasticsearch+Filebeat+Kibana安裝指南
    的頭像 發(fā)表于 05-21 11:06 ?1187次閱讀
    單節(jié)點<b class='flag-5'>Elasticsearch</b>+Filebeat+Kibana安裝指南

    開源本身可以替代大型科技公司嗎?

    “ ?這是一位荷蘭學者對于開源與商業(yè)科技公司的思考。 ? ” ? 現(xiàn)在,我們越來越擔心 “大型科技公司” 的主導地位,開源技術作為一種替代技術經常被提及,尤其是現(xiàn)在我們的政府似乎正在向微軟進行全面
    的頭像 發(fā)表于 04-30 16:49 ?691次閱讀

    上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5

    開源新一代通義千問模型Qwen3。據悉,Qwen3模型參數(shù)量僅為DeepSeek - R1的1/3,能夠大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球頂尖模型,登頂全球最強開源模型。而且Qwen3還是國內首個
    的頭像 發(fā)表于 04-30 16:08 ?1317次閱讀

    英偉達GROOT N1 全球首個開源人形機器人基礎模型

    英偉達GROOT N1 全球首個開源人形機器人基礎大模型
    的頭像 發(fā)表于 03-20 11:05 ?2134次閱讀

    Techwiz LCD 1D應用:光學薄膜設計與分析

    偏光片是用二向色染料染色聚乙烯醇基薄膜,然后拉伸制成的。然后,TAC(三乙酰纖維素)附著在偏光片的頂部作為保護膜。PET(聚對苯二甲酸乙二醇酯)作為TAC薄膜的替代品,雖然性價比高,但它存在嚴重
    發(fā)表于 03-14 08:47