論文の概要: LLM-Guided ANN Index Optimization for Human-Object Interaction Retrieval
- arxiv url: http://arxiv.org/abs/2606.05489v1
- Date: Wed, 03 Jun 2026 22:28:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.428581
- Title: LLM-Guided ANN Index Optimization for Human-Object Interaction Retrieval
- Title(参考訳): LLM-Guided ANN Index Optimization for Human-Object Interaction Retrieval
- Authors: Shahrzad Esmat, Chaunte W. Lacewell, Sameh Gobriel, Nilesh Jain, Ali Jannesari,
- Abstract要約: ビジュアル検索、レコメンデーションエンジン、マルチモーダル質問応答など、現代のAIアプリケーションを支えるマルチステージ検索システム。
本稿では,この制限を相認識型大規模言語モデル (LLM) エージェントを用いて解決する。
- 参考スコア(独自算出の注目度): 10.896685094390136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval systems underpin modern AI applications -- spanning visual search, recommendation engines, and multi-modal question answering. Modern multi-stage retrieval systems require the joint optimization of highly coupled parameters, yet traditional hyperparameter optimization (HPO) methods -- including Tree-structured Parzen Estimators (TPE) and Gaussian Process Bayesian Optimization -- rely on an independence assumption that fundamentally prevents them from navigating these coupled configuration spaces. We address this limitation with a phase-aware large language model (LLM) agent that conditions each proposal on its full optimization history, navigating the coupled parameter space across phase-partitioned exploration, exploitation, and fine-tuning stages. Evaluated on the HICO-DET human-object interaction retrieval benchmark using Intel VDMS (Visual Data Management System), our agent outperforms Optuna TPE by +33.3% and VDTuner by +34.2% under SIEVE (Safeguarded Index Evaluation of Vector-search Efficiency, a quality-constrained throughput metric), delivering a 15.3x throughput gain over UniIR. Validation across three benchmarks confirms that the agent's advantage grows with the degree of parameter coupling: +33.3% on HICO-DET (high coupling), methods converge within 1% on GLDv2 (moderate coupling) and within 3.6% on SIFT1M (near-independent control). Cross-system validation on Milvus confirms the optimizer ranks first on all three datasets without modification, demonstrating transferability across vector database management system (VDBMS) platforms.
- Abstract(参考訳): 検索システムは、ビジュアル検索、レコメンデーションエンジン、マルチモーダルな質問応答など、現代のAIアプリケーションを支える。
現代の多段階検索システムは、高度に結合したパラメータを共同で最適化する必要があるが、従来のハイパーパラメータ最適化(HPO)手法(木構造パーゼン推定器(TPE)やガウスプロセスベイズ最適化など)は、これらの結合された構成空間のナビゲートを根本的に阻止する独立性の仮定に依存している。
この制限は,各提案を全最適化履歴に設定し,位相分割探索,エクスプロイト,微調整段階をまたいだパラメータ空間をナビゲートする,相認識型大規模言語モデル(LLM)エージェントを用いて対処する。
Intel VDMS (Visual Data Management System) を用いたHICO-DETヒューマンオブジェクトインタラクション評価ベンチマークで評価したところ、我々のエージェントはSIEVE (Safeguarded Index Evaluation of Vector-search efficiency, a quality-constrained throughput metric)の下でOptuna TPEを+33.3%、VDTunerを+34.2%上回り、UniIRよりも15.3倍のスループット向上を実現した。
HICO-DET(ハイカップリング)では+33.3%、GLDv2(モデレートカップリング)では1%、SIFT1M(ニア独立制御)では3.6%である。
Milvusのクロスシステム検証では、オプティマイザが修正せずに3つのデータセットで最初にランクされ、ベクタデータベース管理システム(VDBMS)プラットフォーム間での転送可能性を示す。
関連論文リスト
- optimize_anything: A Universal API for Optimizing any Text Parameter [98.42497715725356]
単一タスク検索をサポートする1つのAIベースの最適化システム、クロスプロブレム転送によるマルチタスク検索、および目に見えない入力への一般化を示す。
LLMに基づく検索によるテキストの最適化は汎用的な問題解決パラダイムであることを示す。
論文 参考訳(メタデータ) (2026-05-19T10:18:12Z) - HMACE: Heterogeneous Multi-Agent Collaborative Evolution for Combinatorial Optimization [19.90781293176099]
HMACEは異種多言語協調進化フレームワークである。
それぞれの進化生成を4つの調整されたエージェントで自律的で役割特異的なループに分解する。
冗長な評価を避けながら、多様で有望な行動への探索を導く。
論文 参考訳(メタデータ) (2026-05-08T04:02:28Z) - Relatron: Automating Relational Machine Learning over Relational Databases [50.94254514286021]
本稿では, RDL と DFS を共有設計空間に統合し, 多様な RDB タスクを対象としたアーキテクチャ中心の検索を行う。
RDLはDFSを一貫して上回り、高いタスク依存性を持つ。(2)タスク全体において単一のアーキテクチャが支配的であり、タスク認識モデル選択の必要性を強調し、精度は選択アーキテクチャの信頼性の低いガイドである。
論文 参考訳(メタデータ) (2026-02-26T02:45:22Z) - ContextEvolve: Multi-Agent Context Compression for Systems Code Optimization [8.046059974853858]
本稿では,厳密なパラメータブラインド制約の下でRLレベルの探索効率を実現するマルチエージェントフレームワークであるContextEvolveを紹介する。
ADRSベンチマークでは、ContextEvolveは最先端のベースラインを33.3%上回り、トークン消費を29.0%削減している。
論文 参考訳(メタデータ) (2026-02-01T16:50:07Z) - OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.94443394870866]
OneSearchは、eコマース検索のための最初の産業向けエンドツーエンド生成フレームワークである。
OneSearchは運用費を75.40%削減し、Model FLOPsの利用を3.26%から27.32%に改善した。
このシステムはKuaishouの複数の検索シナリオにまたがって展開され、数百万のユーザーにサービスを提供している。
論文 参考訳(メタデータ) (2025-09-03T11:50:04Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - Evaluation of Hyperparameter-Optimization Approaches in an Industrial
Federated Learning System [0.2609784101826761]
フェデレートラーニング(FL)は、データに直接アクセスする必要性からモデルのトレーニングを分離する。
本研究では,FLシステムにおける様々なパラメータ最適化手法の影響について検討した。
グリッド探索とベイズ最適化に基づいてこれらの手法を実装し,MNISTデータセットとIoT(Internet of Things)センサを用いた産業用データセットに基づくアルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2021-10-15T17:01:40Z) - DHA: End-to-End Joint Optimization of Data Augmentation Policy,
Hyper-parameter and Architecture [81.82173855071312]
本稿では,AutoMLコンポーネントを統合したエンドツーエンドソリューションを提案する。
Dhaは、様々なデータセット、特にセルベースの検索空間を持つImageNetの77.4%の精度で、最先端(SOTA)結果を達成する。
論文 参考訳(メタデータ) (2021-09-13T08:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。