論文の概要: Agentic Search for Counterfactual Recourse under Fixed LLM Budgets
- arxiv url: http://arxiv.org/abs/2606.08696v1
- Date: Sun, 07 Jun 2026 15:53:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.397063
- Title: Agentic Search for Counterfactual Recourse under Fixed LLM Budgets
- Title(参考訳): 固定 LLM 予算下における非現実的リコースのエージェント探索
- Authors: Yasuo Tabei,
- Abstract要約: Comp-MCTSは,独特なオラクル価の反事実の収量を最大化するエージェント木探索フレームワークである。
Comp-MCTSは、単一候補のLATSスタイルのベースラインよりも、独特なオラクル価の反事実の収率でかなり優れることを示す。
- 参考スコア(独自算出の注目度): 0.033842793760651545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Counterfactual recourse aims to provide actionable feature changes that would alter an unfavorable decision made by a predictive model. In practice, affected individuals often benefit from multiple feasible alternatives rather than a single optimal explanation. A natural way to produce such alternatives is to prompt large language models (LLMs). However, prompting incurs a practical constraint: the number of LLM calls is often the dominant computational and economic cost. Together, the need for multiple alternatives and this cost constraint shift the problem from finding a single high-quality counterfactual to efficiently generating a set of oracle-validated counterfactuals under a fixed LLM-call budget. In this work, we study counterfactual recourse generation in the LLM-agentic setting as a fixed-budget search problem and propose Comp-MCTS, an agentic tree-search framework that maximizes the yield of unique, oracle-validated counterfactuals under this budget while maintaining favorable quantity--quality trade-offs. Comp-MCTS allocates the budget toward novel intervention directions via LLM-based proposal generation, oracle validation, and compression-guided pruning, in a training-free, oracle-only setting. Experiments on four real-world tabular datasets show that Comp-MCTS substantially outperforms single-candidate LATS-style baselines in the yield of unique, oracle-validated counterfactuals, and offers favorable quantity--quality--efficiency trade-offs against stronger multi-candidate variants: comparable or higher yield at similar or lower oracle-evaluation cost on three of four datasets, plus competitive proximity, sparsity, and novelty.
- Abstract(参考訳): カウンターファクト・リコースは、予測モデルによって下された好ましくない決定を変える可能性のある機能変更を提供することを目的としている。
実際には、影響を受けた個人は一つの最適な説明ではなく、複数の実現可能な選択肢の恩恵を受けることが多い。
このような代替品を生産する自然な方法は、大きな言語モデル(LLM)を促すことである。
LLM呼び出しの数は、多くの場合、計算と経済的コストの支配的な部分である。
複数の代替案の必要性とコスト制約が相まって、1つの高品質なカウンターファクトを見つけることから、固定的なLCMコール予算の下で、オラクル価のカウンターファクトのセットを効率的に生成することへと、問題をシフトさせる。
本研究では, 固定予算探索問題としてのLLM-agenticセッティングにおける反ファクト・リコース生成について検討し, 最適な量品質のトレードオフを維持しつつ, この予算の下で, 独特なオアクレ価の反ファクトの収率を最大化するエージェント木探索フレームワークComp-MCTSを提案する。
Comp-MCTSは、LLMベースの提案生成、オラクル検証、圧縮誘導プルーニングによる新たな介入方向に向けた予算を、訓練不要のオラクルのみの設定で割り当てている。
実世界の4つの表層データセットの実験では、Comp-MCTSは単一候補のLATSスタイルのベースラインを、独特なオラクル価の反ファクトリクスの収量で大幅に上回り、より強力なマルチ候補に対する好ましい量-品質-効率のトレードオフを提供する。
関連論文リスト
- Mixture of Complementary Agents for Robust LLM Ensemble [28.210955621253863]
大規模言語モデル(LLM)のアンサンブルや議論のようなマルチAIコラボレーションは、情報収集とパフォーマンス向上のための有望なパラダイムである。
既存のアプローチは、主に正確性(最強のモデルを選ぶ)または多様性(多様性の保証)に焦点を当てています。
我々は、LLMの値が他と相補関係にある特徴選択に類似した選択問題として、提案者選択を再設定する。
論文 参考訳(メタデータ) (2026-05-21T21:29:05Z) - Budget-Aware Anytime Reasoning with LLM-Synthesized Preference Data [57.996437077411315]
計算予算に制限のある大規模言語モデル(LLM)の推論挙動について検討する。
我々は、任意の推論フレームワークとAnytime Indexを導入し、推論トークンが増加するにつれて、ソリューションの品質がいかに効果的に向上するかを定量化します。
NaturalPlan(Trip)、AIME、GPQAデータセットの実験では、Grok-3、GPT-oss、GPT-4.1/4o、LLaMAモデル間で一貫した利得を示している。
論文 参考訳(メタデータ) (2026-01-16T07:09:30Z) - Aligning LLMs on a Budget: Inference-Time Alignment with Heuristic Reward Models [23.37504394417425]
HIA(Heuristic-Guided Inference-time Alignment)は,軽量プロンプトを用いたチューニング不要でブラックボックス互換のアプローチである。
HIAは1つまたは2つの応答クエリの少ない低推論予算下で有効であることが判明した。
論文 参考訳(メタデータ) (2025-08-07T08:54:27Z) - Efficient LLM Collaboration via Planning [56.081879390960204]
小規模で大規模なモデルでは、プランナーと実行担当者として交代で行動し、タスクを協調的に解決するために、多段階のカスケードでプランを交換する。
私たちはCOPEが大規模プロプライエタリモデルに匹敵するパフォーマンスを実現し,推論APIのコストを大幅に削減できることを実証した。
論文 参考訳(メタデータ) (2025-06-13T08:35:50Z) - Minimax and Communication-Efficient Distributed Best Subset Selection with Oracle Property [0.358439716487063]
大規模データの爆発はシングルマシンシステムの処理能力を上回っている。
分散推論への伝統的なアプローチは、高次元データセットにおいて真の疎性を達成するのにしばしば苦労する。
そこで本稿では,これらの問題に対処する2段階分散ベストサブセット選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-30T13:22:08Z) - Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration [68.29746557968107]
本稿では,多エージェント協調のための新しいフレームワークを提案する。これは,効率的な自己調整のための強化アドバンテージフィードバック(Reinforced Advantage feedback, ReAd)を導入する。
Over-AIと難解なRoCoBenchの実験は、ReAdが成功率のベースラインを超え、エージェントの相互作用ステップを著しく減少させることを示している。
論文 参考訳(メタデータ) (2024-05-23T08:33:19Z) - Efficient Prompt Optimization Through the Lens of Best Arm Identification [50.56113809171805]
この作業は、明示的な予算制約の下でプロンプト選択を効率的に行うための、原則化されたフレームワークであるTRIPLEを提供する。
マルチアームバンディット(MAB)における即時最適化と固定予算ベストアーム識別(BAI-FB)の間に確立された新しい接続上に構築されている。
論文 参考訳(メタデータ) (2024-02-15T05:31:13Z) - On Leveraging Large Language Models for Enhancing Entity Resolution: A Cost-efficient Approach [7.996010840316654]
本稿では,Large Language Models (LLMs) を用いた不確実性低減フレームワークを提案する。
LLMは、先進的な言語能力と、広範なデータサイエンスの専門知識を持たない人々に対して大きな利点をもたらす「従量制」モデルに便乗している。
我々は,本手法が効率的かつ効果的であることを示し,実世界のタスクに有望な応用を提供する。
論文 参考訳(メタデータ) (2024-01-07T09:06:58Z) - Solving Multistage Stochastic Linear Programming via Regularized Linear
Decision Rules: An Application to Hydrothermal Dispatch Planning [77.34726150561087]
AdaSO(Adaptive least absolute shrinkage and selection operator)に基づく線形決定規則(LDR)の新しい正規化手法を提案する。
実験により、MSLPを解くために古典的な非正規化LDRを使用する場合、過度に適合する脅威は無視できないことが示された。
LHDP問題に対しては、非正規化ベンチマークと比較して、提案したフレームワークの次の利点を強調した。
論文 参考訳(メタデータ) (2021-10-07T02:36:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。