論文の概要: Arbor: A Framework for Reliable Navigation of Critical Conversation Flows
- arxiv url: http://arxiv.org/abs/2602.14643v1
- Date: Mon, 16 Feb 2026 11:09:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.376007
- Title: Arbor: A Framework for Reliable Navigation of Critical Conversation Flows
- Title(参考訳): Arbor: クリティカルな会話フローの信頼性の高いナビゲーションフレームワーク
- Authors: Luís Silva, Diogo Gonçalves, Catarina Farinha, Clara Matos, Luís Ungaro,
- Abstract要約: 本稿では,決定木ナビゲーションを専門的なノードレベルのタスクに分解するフレームワークであるArborを紹介する。
Abortは平均ターン精度を29.4ポイント改善し、ターン毎のレイテンシを57.1%削減し、ターン毎のコストを平均14.4倍削減する。
- 参考スコア(独自算出の注目度): 0.19573380763700712
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models struggle to maintain strict adherence to structured workflows in high-stakes domains such as healthcare triage. Monolithic approaches that encode entire decision structures within a single prompt are prone to instruction-following degradation as prompt length increases, including lost-in-the-middle effects and context window overflow. To address this gap, we present Arbor, a framework that decomposes decision tree navigation into specialized, node-level tasks. Decision trees are standardized into an edge-list representation and stored for dynamic retrieval. At runtime, a directed acyclic graph (DAG)-based orchestration mechanism iteratively retrieves only the outgoing edges of the current node, evaluates valid transitions via a dedicated LLM call, and delegates response generation to a separate inference step. The framework is agnostic to the underlying decision logic and model provider. Evaluated against single-prompt baselines across 10 foundation models using annotated turns from real clinical triage conversations. Arbor improves mean turn accuracy by 29.4 percentage points, reduces per-turn latency by 57.1%, and achieves an average 14.4x reduction in per-turn cost. These results indicate that architectural decomposition reduces dependence on intrinsic model capability, enabling smaller models to match or exceed larger models operating under single-prompt baselines.
- Abstract(参考訳): 大規模言語モデルは、医療トリアージのような高度な領域における構造化ワークフローへの厳格な準拠を維持するのに苦労する。
単一のプロンプト内で決定構造全体をエンコードするモノリシックなアプローチは、インシデント・イン・ザ・ミドル効果やコンテキスト・ウィンドウのオーバーフローなど、プロンプトの長さが増加するにつれて、命令追従の劣化を引き起こす。
このギャップに対処するために、決定ツリーナビゲーションを専門のノードレベルのタスクに分解するフレームワークであるArborを紹介します。
決定木はエッジリスト表現に標準化され、動的検索のために格納される。
実行時に、有向非循環グラフ(DAG)ベースのオーケストレーションメカニズムは、現在のノードの外部エッジのみを反復的に取得し、専用のLCM呼び出しを介して有効な遷移を評価し、レスポンス生成を別の推論ステップに委譲する。
このフレームワークは下層の意思決定ロジックとモデルプロバイダに依存しない。
実際の臨床トリアージ会話からの注釈付きターンを用いた10の基礎モデルに対する単発ベースラインの評価。
Arborは平均ターン精度を29.4ポイント改善し、ターン毎のレイテンシを57.1%削減し、ターン毎のコストを平均14.4倍削減する。
これらの結果から, 構造的分解は内在モデル能力への依存を低減し, より小さなモデルでも, 単一プロンプトベースラインの下で動作している大型モデルと一致するか, あるいは超えることが示唆された。
関連論文リスト
- Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation [12.71443292660797]
堅牢なRAGのためのコンテキスト認識トラバーサルであるCatRAGを提案する。
CatRAGはHippoRAG 2アーキテクチャ上に構築され、静的なKGをクエリ適応ナビゲーション構造に変換する。
4つのマルチホップベンチマークの実験では、CatRAGはアートベースラインの状態を一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-02T11:13:38Z) - Theoretical Foundations of Prompt Engineering: From Heuristics to Expressivity [0.0]
本研究では,トランスフォーマーのバックボーンをエグゼキュータとして固定し,プロンプトのみを変化させることで得られる機能群について検討する。
一つの固定されたバックボーンがプロンプトだけで対象の行動の幅広いクラスを近似できることを示す。
論文 参考訳(メタデータ) (2025-12-14T13:42:20Z) - Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。
本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。
我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文 参考訳(メタデータ) (2025-12-11T12:20:31Z) - Tiny Recursive Models on ARC-AGI-1: Inductive Biases, Identity Conditioning, and Test-Time Compute [0.0]
我々はARC-AGI-1のARC Prize TRMチェックポイントを実験的に分析した。
テストタイムの増大と多数投票の合理化が報告された性能のかなりの部分を占めていることを示す。
また, TRMとLlama 3 8BのQLoRAファインチューンを標準ARC-AGI-1上で比較した。
論文 参考訳(メタデータ) (2025-12-04T06:20:44Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - COrAL: Order-Agnostic Language Modeling for Efficient Iterative Refinement [80.18490952057125]
反復改良は、複雑なタスクにおける大規模言語モデル(LLM)の能力を高める効果的なパラダイムとして登場した。
我々はこれらの課題を克服するために、コンテキストワイズ順序非依存言語モデリング(COrAL)を提案する。
当社のアプローチでは、管理可能なコンテキストウィンドウ内で複数のトークン依存関係をモデル化しています。
論文 参考訳(メタデータ) (2024-10-12T23:56:19Z) - DepGraph: Towards Any Structural Pruning [68.40343338847664]
我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。
本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。
本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文 参考訳(メタデータ) (2023-01-30T14:02:33Z) - Neural Transition System for End-to-End Opinion Role Labeling [13.444895891262844]
統一世論役割ラベルリング(ORL)は、意見保有者目標の可能なすべての意見構造を1ショットで検出することを目的としている。
我々は、遷移アーキテクチャを再考し、ポインタネットワーク(PointNet)で拡張することで、新しいソリューションを提案する。
このフレームワークは、線形時間複雑性におけるすべての意見構造を解析し、PointNetとの任意の項長の制限を突破する。
論文 参考訳(メタデータ) (2021-10-05T12:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。