論文の概要: Adaptive Selection for Homogeneous Tools: An Instantiation in the RAG Scenario
- arxiv url: http://arxiv.org/abs/2406.12429v1
- Date: Tue, 18 Jun 2024 09:24:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-06-19 19:37:08.052000
- Title: Adaptive Selection for Homogeneous Tools: An Instantiation in the RAG Scenario
- Title(参考訳): 均質ツールの適応的選択--RAGシナリオの検証
- Authors: Feiteng Mu, Yong Jiang, Liwen Zhang, Chu Liu, Wenjie Li, Pengjun Xie, Fei Huang,
- Abstract要約: ツール学習に関する現在の研究は、主に様々な選択肢から最も効果的なツールを選択することに焦点を当てており、しばしば費用対効果を見落としている。
本稿では,タスクの達成に必要な性能と関連するコストの両方を予測し,同種ツールの選択に対処する。
- 参考スコア(独自算出の注目度): 62.615210194004106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current research on tool learning primarily focuses on selecting the most effective tool from a wide array of options, often overlooking cost-effectiveness, a crucial factor in human problem-solving. In this paper, we address the selection of homogeneous tools by predicting both their performance and the associated cost required to accomplish a given task. We then assign queries to the optimal tools in a cost-effective manner. Our experimental results demonstrate that our method achieves higher performance at a lower cost compared to strong baseline approaches.
- Abstract(参考訳): ツール学習に関する現在の研究は、主に様々な選択肢から最も効果的なツールを選択することに焦点を当てている。
本稿では,タスクの達成に必要な性能と関連するコストの両方を予測し,同種ツールの選択に対処する。
次に、最適なツールに費用対効果でクエリを割り当てます。
実験結果から,本手法は強力なベースライン手法に比べて低コストで高い性能を実現することが示された。
関連論文リスト
- Distilling a Small Utility-Based Passage Selector to Enhance Retrieval-Augmented Generation [77.07879255360342]
Retrieval-augmented Generation (RAG)は、取得した情報を組み込むことで、大規模言語モデル(LLM)を強化する。
RAGでは、重要度は実用性に移行し、正確な回答を生成するためのパスの有用性を考慮している。
提案手法は、ランク付けよりもユーティリティベースの選択に重点を置いており、固定しきい値を必要とせずに、特定のクエリに合わせた動的通過選択を可能にする。
本実験は, 実用性に基づく選択により, RAGの柔軟性とコスト効率が向上し, 計算コストが大幅に低減され, 応答品質が向上することを示した。
論文 参考訳(メタデータ) (2025-07-25T09:32:29Z) - Every Rollout Counts: Optimal Resource Allocation for Efficient Test-Time Scaling [19.673388630963807]
テスト時間スケーリング(TTS)による大規模言語モデル(LLM)の性能向上
探索中に最も効果的にロールアウト予算を割り当てる方法はまだ探索されていないが、多くの場合、テスト時に計算の効率が悪くなる。
本稿では,このバイアスを緩和する最適手法として,指向性資源割当(DORA)を提案する。
論文 参考訳(メタデータ) (2025-05-30T09:05:25Z) - OTC: Optimal Tool Calls via Reinforcement Learning [87.28134636548705]
ツール統合報酬は,正しさとツール効率を共同で考慮し,高いツール生産性を向上する。
このアプローチでは,ツールコールを最大73.1%削減し,ツールの生産性を最大229.4%向上すると同時に,同等の回答精度を維持している。
論文 参考訳(メタデータ) (2025-04-21T05:40:05Z) - Navigating Intelligence: A Survey of Google OR-Tools and Machine Learning for Global Path Planning in Autonomous Vehicles [49.1574468325115]
ROMIEと呼ばれる自律的な採鉱ロボットには,グローバルパスプランニングが不可欠である。
Q-Learningは最適な戦略であり、データセット全体の最適解から平均1.2%しか逸脱せず、優れた効率を示す。
論文 参考訳(メタデータ) (2025-03-05T10:12:22Z) - Selective Use of Yannakakis' Algorithm to Improve Query Performance: Machine Learning to the Rescue [42.18649178845258]
本稿では,最適化手法を適用するか否かを判断する決定手順を設計する手法を提案する。
機械学習に基づくソリューションを提案する。
各種データベースシステムに関するいくつかのベンチマークによる実証結果から,本手法が統計的に有意な性能向上をもたらすことが示唆された。
論文 参考訳(メタデータ) (2025-02-27T16:19:54Z) - Self-Steering Optimization: Autonomous Preference Optimization for Large Language Models [79.84205827056907]
本稿では,高品質な嗜好データを自律的に生成するアルゴリズムであるセルフステアリング最適化(SSO$)を提案する。
$SSO$は、ポリシーモデル自体からデータジェネレータを構築するために、特別な最適化目標を採用しています。
評価の結果,$SSO$は人選好アライメントと報酬最適化のベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2024-10-22T16:04:03Z) - Compute-Constrained Data Selection [77.06528009072967]
コスト対応ユーティリティ関数を用いてデータ選択の問題を定式化し、その問題をトレーニングのための初期選択コストのトレーディングとしてモデル化する。
複数のタスク、微調整トークンのスケーリングによる計算予算、モデルサイズ、データ選択計算など、包括的な実験を網羅的に実施しています。
論文 参考訳(メタデータ) (2024-10-21T17:11:21Z) - Sample-Optimal Large-Scale Optimal Subset Selection [0.9558392439655016]
私たちは、現在のトップ$m$の代替品をサンプリングし続けるトップ$m$greedy選択メカニズムを設計し、トップ$m$のサンプル手段を実行します。
EFG-$m$プロシージャはサンプル最適であり、良い選択の確率の観点から一貫したものであることを示す。
驚いたことに、EFG-$m$プロシージャは、選択した代替案のサブセット内で、余分なコストで、差分ベースのランキングを達成できることを示した。
論文 参考訳(メタデータ) (2024-08-18T16:44:41Z) - Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - Budget-Constrained Tool Learning with Planning [40.52601704021853]
本稿では,予算制約ツール学習のための新しい手法を提案する。
当社のアプローチでは、ツールを利用する前に、予算制約の下で望ましいプランを作成します。
論文 参考訳(メタデータ) (2024-02-25T02:46:33Z) - Efficient Prompt Optimization Through the Lens of Best Arm Identification [50.56113809171805]
この作業は、明示的な予算制約の下でプロンプト選択を効率的に行うための、原則化されたフレームワークであるTRIPLEを提供する。
マルチアームバンディット(MAB)における即時最適化と固定予算ベストアーム識別(BAI-FB)の間に確立された新しい接続上に構築されている。
論文 参考訳(メタデータ) (2024-02-15T05:31:13Z) - Experience-Based Evolutionary Algorithms for Expensive Optimization [8.466374531816427]
我々は、関連する問題で得られる経験をよりうまく活用することで、ハード最適化の問題を効率的に扱うことができると論じる。
本稿では,コストのかかる問題の最適化効率を高めるために,経験ベースサロゲート支援進化アルゴリズム(SAEA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T05:47:14Z) - Bayesian Optimization Over Iterative Learners with Structured Responses:
A Budget-aware Planning Approach [31.918476422203412]
本稿では,HPO 問題を解決するため,Budget-Aware Planning for Iterative Learningers (BAPI) と呼ばれる新しい手法を提案する。
反復学習者のための多様なHPOベンチマークの実験では、ほとんどの場合、BAPIは最先端のベースラインよりも優れた性能を示している。
論文 参考訳(メタデータ) (2022-06-25T18:44:06Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。
本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。
この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文 参考訳(メタデータ) (2020-11-02T08:46:27Z) - Descending through a Crowded Valley - Benchmarking Deep Learning
Optimizers [29.624308090226375]
本研究は,これらの逸話を,少なくとも証拠に裏付けられた逸話に置き換えることを目的としている。
そのために、特に人気のある15のディープラーニングの、広範囲で標準化されたベンチマークを実行します。
我々のオープンソースの成果は、新しい最適化手法のより有意義な評価のために、挑戦的でよく調整されたベースラインとして利用可能である。
論文 参考訳(メタデータ) (2020-07-03T08:19:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。