論文の概要: Vextra: A Unified Middleware Abstraction for Heterogeneous Vector Database Systems
- arxiv url: http://arxiv.org/abs/2601.06727v1
- Date: Sun, 11 Jan 2026 00:35:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.956168
- Title: Vextra: A Unified Middleware Abstraction for Heterogeneous Vector Database Systems
- Title(参考訳): Vextra: 異種ベクトルデータベースシステムのための統一ミドルウェア抽象化
- Authors: Chandan Suri, Gursifath Bhasin,
- Abstract要約: 本稿では,APIの断片化に対処する新しい抽象化レイヤであるVextraを紹介する。
Vextraは、データアップセレーション、類似検索、メタデータフィルタリングを含む、コアデータベース操作のための統一された高レベルAPIを提供する。
プラグイン可能なアダプタアーキテクチャを使用して、これらの統一されたAPI呼び出しをさまざまなバックエンドデータベースのネイティブプロトコルに変換する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid integration of vector search into AI applications, particularly for Retrieval Augmented Generation (RAG), has catalyzed the emergence of a diverse ecosystem of specialized vector databases. While this innovation offers a rich choice of features and performance characteristics, it has simultaneously introduced a significant challenge: severe API fragmentation. Developers face a landscape of disparate, proprietary, and often volatile API contracts, which hinders application portability, increases maintenance overhead, and leads to vendor lock-in. This paper introduces Vextra, a novel middleware abstraction layer designed to address this fragmentation. Vextra presents a unified, high-level API for core database operations, including data upsertion, similarity search, and metadata filtering. It employs a pluggable adapter architecture to translate these unified API calls into the native protocols of various backend databases. We argue that such an abstraction layer is a critical step towards maturing the vector database ecosystem, fostering interoperability, and enabling higher-level query optimization, while imposing minimal performance overhead.
- Abstract(参考訳): ベクトル探索のAIアプリケーションへの迅速な統合、特にRetrieval Augmented Generation (RAG)は、特殊なベクトルデータベースの多様なエコシステムの出現を触媒している。
このイノベーションは機能とパフォーマンス特性の豊富な選択を提供する一方で、同時に重大な課題であるAPIの断片化も導入している。
アプリケーションのポータビリティを阻害し、メンテナンスのオーバーヘッドを増大させ、ベンダーのロックインにつながる、異質でプロプライエタリで、しばしば不安定なAPI契約の状況に直面している。
本稿では、この断片化に対応するために設計された、新しいミドルウェア抽象化層であるVextraを紹介する。
Vextraは、データアップセレーション、類似検索、メタデータフィルタリングを含む、コアデータベース操作のための統一された高レベルAPIを提供する。
プラグイン可能なアダプタアーキテクチャを使用して、これらの統一されたAPI呼び出しをさまざまなバックエンドデータベースのネイティブプロトコルに変換する。
このような抽象化レイヤは、ベクタデータベースエコシステムを成熟させ、相互運用性を促進し、パフォーマンスのオーバーヘッドを最小限に抑えながら、より高いレベルのクエリ最適化を可能にするための重要なステップである、と私たちは主張する。
関連論文リスト
- UniPAR: A Unified Framework for Pedestrian Attribute Recognition [14.613498516126498]
歩行者属性認識のための統合トランスフォーマーベースのフレームワークUniPARを提案する。
統一されたデータスケジューリング戦略と動的分類ヘッドを組み込むことで、UniPARは単一のモデルで多様なデータセットを同時に処理できる。
MSP60K、DukeMTMC、EventPARなど、広く使われているベンチマークデータセットの実験結果は、UniPARが特別なSOTAメソッドに匹敵するパフォーマンスを達成することを実証している。
論文 参考訳(メタデータ) (2026-03-05T12:34:35Z) - Stacked from One: Multi-Scale Self-Injection for Context Window Extension [69.24689919827817]
Modelnameは、多粒度コンテキスト圧縮とクエリ対応情報取得に基づく新しいフレームワークである。
modelnameachievesパフォーマンスは、強いベースラインと同等か、優れている。
論文 参考訳(メタデータ) (2026-03-05T03:16:16Z) - Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。
複数の多様な実装設計を生成することで、線形パッチから切り離される。
NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文 参考訳(メタデータ) (2026-03-02T12:50:40Z) - AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.512393568258105]
大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。
本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:21:42Z) - Refer-Agent: A Collaborative Multi-Agent System with Reasoning and Reflection for Referring Video Object Segmentation [50.22481337087162]
Referring Video Object (RVOS) は、テキストクエリに基づくビデオ内のオブジェクトのセグメンテーションを目的としている。
Refer-Agent (Refer-Agent) は、共用多エージェントシステムである。
論文 参考訳(メタデータ) (2026-02-03T14:48:12Z) - SPAR: Session-based Pipeline for Adaptive Retrieval on Legacy File Systems [6.5637131627375505]
SPAR(Session-based Pipeline for Adaptive Retrieval)は、大規模言語モデルをレトリーバル拡張生成(RAG)アーキテクチャに統合する概念的なフレームワークである。
セマンティックメタデータインデックスが最初に作成され、セッション固有のベクトルデータベースが必要に応じて動的に生成される。
この設計は、透明性、制御可能性、検索の関連性を改善しながら、計算オーバーヘッドを低減する。
論文 参考訳(メタデータ) (2025-12-15T02:54:10Z) - RAGdb: A Zero-Dependency, Embeddable Architecture for Multimodal Retrieval-Augmented Generation on the Edge [0.0]
Retrieval-Augmented Generation (RAG) は、ドメイン固有の最新のデータにおいて、LLM(Large Language Models)を基盤とする標準パラダイムとして確立されている。
RAGdbは、自動マルチモーダル取り込み、ONNXベースの抽出、ハイブリッドベクトル検索を単一のポータブルコンテナに統合する。
システムは標準的なDockerベースのRAGスタックと比較してディスクフットプリントを約99.5%削減する。
論文 参考訳(メタデータ) (2025-12-09T15:12:13Z) - Towards Hyper-Efficient RAG Systems in VecDBs: Distributed Parallel Multi-Resolution Vector Search [5.216774377033164]
我々は,VecDBにおけるRAGのための新しい多分解能ベクトルインデックスフレームワークである textbfSemantic Pyramid Indexing (SPI) を提案する。
オフラインチューニングやモデルトレーニングの分離を必要とする既存の階層的手法とは異なり、SPIはドキュメントの埋め込みの上にセマンティックピラミッドを構築し、クエリ毎に最適な解像度レベルを動的に選択する。
FAISSとQdrantバックエンドのプラグインとしてSPIを実装し、MS MARCO、Natural Questions、マルチモーダル検索ベンチマークを含む複数のRAGタスクでSPIを評価する。
論文 参考訳(メタデータ) (2025-11-12T09:31:08Z) - The Hybrid Multimodal Graph Index (HMGI): A Comprehensive Framework for Integrated Relational and Vector Search [6.821769033209393]
本稿では,ベクトルデータベースとグラフデータベースのギャップを埋める新しいフレームワークであるHybrid Multimodal Graph Index (HMGI)を紹介する。
HMGIは、意味的類似性検索と関係性コンテキストを直接統合することにより、複雑な関係性の多いクエリシナリオにおいて純粋なベクトルデータベースより優れていることを目指している。
論文 参考訳(メタデータ) (2025-10-11T09:06:26Z) - HetaRAG: Hybrid Deep Retrieval-Augmented Generation across Heterogeneous Data Stores [33.795387138571286]
HetaRAGは、異種データストアからのクロスモーダルエビデンスをオーケストレーションする、ハイブリッドで深層検索可能な拡張生成フレームワークである。
HetaRAGはベクトルインデックス、知識グラフ、フルテキストエンジン、構造化データベースを単一の検索プレーンに統合する。
論文 参考訳(メタデータ) (2025-09-12T06:12:59Z) - Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [83.65386456026441]
Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがる100以上のデータ処理オペレータがバックアップするデータ処理システムである。
データ分析、合成、アノテーション、基礎モデルのポストトレーニングなど、より重要なタスクをサポートする。
このシステムは公開されており、さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文 参考訳(メタデータ) (2024-12-23T08:29:57Z) - A Collaborative Multi-Agent Approach to Retrieval-Augmented Generation Across Diverse Data [0.0]
Retrieval-Augmented Generation (RAG)はLarge Language Models (LLM)を強化する
従来のRAGシステムでは、クエリ生成、データ検索、レスポンス合成に単一エージェントアーキテクチャを使用するのが一般的である。
本稿では,これらの制約に対処するマルチエージェントRAGシステムを提案する。
論文 参考訳(メタデータ) (2024-12-08T07:18:19Z) - FANTAstic SEquences and Where to Find Them: Faithful and Efficient API Call Generation through State-tracked Constrained Decoding and Reranking [57.53742155914176]
APIコール生成は、大規模言語モデルのツール使用能力の基盤となっている。
既存の教師付きおよびコンテキスト内学習アプローチは、高いトレーニングコスト、低いデータ効率、APIドキュメントとユーザの要求に反する生成APIコールに悩まされる。
本稿では,これらの制約に対処するため,FANTASEと呼ばれる出力側最適化手法を提案する。
論文 参考訳(メタデータ) (2024-07-18T23:44:02Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - DVIS-DAQ: Improving Video Segmentation via Dynamic Anchor Queries [60.09774333024783]
動的アンカークエリ(DAQ)を導入し、アンカーとターゲットクエリ間の遷移ギャップを短くする。
また,クエリレベルのオブジェクトEmergence and Disappearance Simulation(EDS)戦略を導入する。
実験により、DVIS-DAQは5つの主流ビデオセグメンテーションベンチマーク上で、新しい最先端(SOTA)性能を達成することが示された。
論文 参考訳(メタデータ) (2024-03-29T17:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。