論文の概要: ACT: Agentic Classification Tree
- arxiv url: http://arxiv.org/abs/2509.26433v1
- Date: Tue, 30 Sep 2025 15:54:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.606436
- Title: ACT: Agentic Classification Tree
- Title(参考訳): ACT:エージェント分類木
- Authors: Vincent Grari, Tim Arni, Thibault Laugel, Sylvain Lamprier, James Zou, Marcin Detyniecki,
- Abstract要約: 本稿では,各分割を自然言語質問として定式化することにより,決定木手法を非構造化入力に拡張するエージェント分類木(ACT)を提案する。
テキストベンチマークの実験では、ACTは透過的で解釈可能な決定パスを生成しながら、プロンプトベースのベースラインと一致またはオーバーしている。
- 参考スコア(独自算出の注目度): 33.65390081055222
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When used in high-stakes settings, AI systems are expected to produce decisions that are transparent, interpretable, and auditable, a requirement increasingly expected by regulations. Decision trees such as CART provide clear and verifiable rules, but they are restricted to structured tabular data and cannot operate directly on unstructured inputs such as text. In practice, large language models (LLMs) are widely used for such data, yet prompting strategies such as chain-of-thought or prompt optimization still rely on free-form reasoning, limiting their ability to ensure trustworthy behaviors. We present the Agentic Classification Tree (ACT), which extends decision-tree methodology to unstructured inputs by formulating each split as a natural-language question, refined through impurity-based evaluation and LLM feedback via TextGrad. Experiments on text benchmarks show that ACT matches or surpasses prompting-based baselines while producing transparent and interpretable decision paths.
- Abstract(参考訳): ハイテイクな設定で使用すると、AIシステムは透明性、解釈可能、監査可能な決定を生成することが期待される。
CARTのような決定木は明確で検証可能なルールを提供するが、それらは構造化された表データに限定されており、テキストのような構造化されていない入力を直接操作することはできない。
実際には、大きな言語モデル(LLM)がそのようなデータに広く使われているが、チェーン・オブ・思想や迅速な最適化のような戦略は依然として自由形式の推論に依存しており、信頼できる行動を保証する能力を制限する。
我々は,不純物に基づく評価とTextGradによるLLMフィードバックにより,各分割を自然言語質問として定式化し,決定木手法を非構造化入力に拡張するエージェント分類木(ACT)を提案する。
テキストベンチマークの実験では、ACTは透過的で解釈可能な決定パスを生成しながら、プロンプトベースのベースラインと一致またはオーバーしている。
関連論文リスト
- Normalisation of SWIFT Message Counterparties with Feature Extraction and Clustering [0.0]
本稿では,取引相手のクラスタリングを容易にするために,ハイブリッド文字列類似性,トピックモデリング,階層クラスタリング,ルールベースのパイプラインを提案する。
このアプローチは、ルールベースのシステムで見られるほとんどの解釈可能性を保持しており、前者は後者に追加のレベルのクラスタリファインメントを追加する。
制裁調査など、人口のごく一部だけを調査する必要がある場合、この手法は、欠落した個体変動のリスクをよりよく制御することができる。
論文 参考訳(メタデータ) (2025-08-24T12:41:44Z) - DecisionFlow: Advancing Large Language Model as Principled Decision Maker [49.088778182807395]
DecisionFlowは、モデルにアクション、属性、制約の構造化された表現を推論するように誘導する、新しい決定モデリングフレームワークである。
プロンプトから直接回答を予測するのではなく、DecisionFlowは意味論的に根拠のある決定空間を構築し、潜在ユーティリティ関数を推論する。
実験の結果,DecisionFlowの精度は,強いプロンプトベースラインよりも最大30%向上した。
論文 参考訳(メタデータ) (2025-05-27T16:23:53Z) - AGENT-X: Adaptive Guideline-based Expert Network for Threshold-free AI-generated teXt detection [44.66668435489055]
Agent-Xは、AI生成テキスト検出のためのゼロショットマルチエージェントフレームワークである。
我々は,検出ガイドラインを意味的,スタイリスティック,構造的次元に整理し,それぞれが専門的な言語エージェントによって独立に評価される。
メタエージェントは、信頼を意識したアグリゲーションを通じてこれらのアセスメントを統合し、しきい値のない解釈可能な分類を可能にする。
多様なデータセットの実験により、Agent-Xは精度、解釈可能性、一般化において最先端の教師付きおよびゼロショットアプローチを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2025-05-21T08:39:18Z) - Transparent NLP: Using RAG and LLM Alignment for Privacy Q&A [15.86510147965235]
一般データ保護規則では、正確な処理情報を明確でアクセスしやすいものにする必要がある。
本稿では,その義務を果たすためのアライメント技術によって強化された,最先端の検索生成システムについて検討する。
論文 参考訳(メタデータ) (2025-02-10T16:42:00Z) - Decoding AI Judgment: How LLMs Assess News Credibility and Bias [33.7054351451505]
大規模言語モデル(LLM)は、評価プロセスを含む言語にますます組み込まれています。
これにより、このような評価がどのように構築されるのか、どのような仮定に依存しているのか、その戦略が人間のものとどのように異なるのかを調べる必要が生じる。
我々は、専門家評価(NewsGuardとMedia Bias/Fact Check(MBFC))と、制御された実験を通して収集された人間の判断に対する6つのLCMをベンチマークする。
論文 参考訳(メタデータ) (2025-02-06T18:52:10Z) - StructTest: Benchmarking LLMs' Reasoning through Compositional Structured Outputs [78.84060166851805]
StructTestは、大規模な言語モデル(LLM)を合成命令に従って構造化出力を生成する能力に基づいて評価する、新しいベンチマークである。
評価はルールベースの評価器を用いて決定的に行われ、新しいタスクやデータセットに容易に拡張できる。
StructTestは、Deepseek-V3/R1やGPT-4oといったトップパフォーマンスモデルでも、依然として難しいままです。
論文 参考訳(メタデータ) (2024-12-23T22:08:40Z) - Optimized Feature Generation for Tabular Data via LLMs with Decision Tree Reasoning [53.241569810013836]
本稿では,大規模言語モデル(LLM)を用いて,効率的な特徴生成ルールを同定するフレームワークを提案する。
我々は、自然言語で容易に表現できるため、この推論情報を伝達するために決定木を使用します。
OCTreeは様々なベンチマークで様々な予測モデルの性能を継続的に向上させる。
論文 参考訳(メタデータ) (2024-06-12T08:31:34Z) - Log Probabilities Are a Reliable Estimate of Semantic Plausibility in Base and Instruction-Tuned Language Models [50.15455336684986]
意味的妥当性を評価するため,LogProbsの有効性と基本的なプロンプトを評価した。
LogProbsは、直接ゼロショットプロンプトよりも、より信頼性の高いセマンティックな妥当性を提供する。
我々は,プロンプトベースの評価の時代においても,LogProbsは意味的妥当性の有用な指標である,と結論付けた。
論文 参考訳(メタデータ) (2024-03-21T22:08:44Z) - RulePrompt: Weakly Supervised Text Classification with Prompting PLMs and Self-Iterative Logical Rules [30.239044569301534]
弱教師付きテキスト分類(WSTC)は、大量のテキストを分類できるため、注目を集めている。
本稿では,ルールマイニングモジュールとルール強化擬似ラベル生成モジュールからなるWSTCタスクに対して,ルールプロンプトというPLMベースのアプローチを提案する。
提案手法は解釈可能なカテゴリー規則を導出し,難解なカテゴリを曖昧にすることの利点を証明した。
論文 参考訳(メタデータ) (2024-03-05T12:50:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。