論文の概要: Fuzzy Categorical Planning: Autonomous Goal Satisfaction with Graded Semantic Constraints
- arxiv url: http://arxiv.org/abs/2601.20021v1
- Date: Tue, 27 Jan 2026 19:56:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.641835
- Title: Fuzzy Categorical Planning: Autonomous Goal Satisfaction with Graded Semantic Constraints
- Title(参考訳): ファジィカテゴリー計画:段階的セマンティック制約による自律ゴール満足度
- Authors: Shuhui Qu,
- Abstract要約: ファジィカテゴリー理論計画(FCP)
FCP は t-norm Lukasiewicz を通じて計画品質を構成し、プルバック検証を通じて実行可能性チェックを保持する。
我々は, (i) パブリックPDDL3選好/オーバーサブスクライブベンチマークと (ii) 代替レシピプランニングベンチマークのRecipeNLG-Subsについて検討した。
- 参考スコア(独自算出の注目度): 1.8055130471307603
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Natural-language planning often involves vague predicates (e.g., suitable substitute, stable enough) whose satisfaction is inherently graded. Existing category-theoretic planners provide compositional structure and pullback-based hard-constraint verification, but treat applicability as crisp, forcing thresholding that collapses meaningful distinctions and cannot track quality degradation across multi-step plans. We propose Fuzzy Category-theoretic Planning (FCP), which annotates each action (morphism) with a degree in [0,1], composes plan quality via a t-norm Lukasiewicz, and retains crisp executability checks via pullback verification. FCP grounds graded applicability from language using an LLM with k-sample median aggregation and supports meeting-in-the-middle search using residuum-based backward requirements. We evaluate on (i) public PDDL3 preference/oversubscription benchmarks and (ii) RecipeNLG-Subs, a missing-substitute recipe-planning benchmark built from RecipeNLG with substitution candidates from Recipe1MSubs and FoodKG. FCP improves success and reduces hard-constraint violations on RecipeNLG-Subs compared to LLM-only and ReAct-style baselines, while remaining competitive with classical PDDL3 planners.
- Abstract(参考訳): 自然言語プランニングはしばしば、満足度が本質的にランク付けされている曖昧な述語(例えば、適切な代用、十分に安定)を伴う。
既存のカテゴリー理論プランナーは、構成構造とプルバックに基づくハードコントラスト検証を提供するが、適用性はクリップとして扱い、有意義な区別を崩壊させ、多段階計画における品質劣化を追跡できない閾値付けを強制する。
本稿では,Fizzy Category-theoretic Planning (FCP)を提案し,各アクション(アノテート)を[0,1]の次数でアノテートし,t-norm Lukasiewiczを用いてプラン品質を構成し,プルバック検証によるクリップ実行可能性チェックを保持する。
FCP は k-sample 中央値アグリゲーションを持つ LLM を用いて言語からのグレードされた適用性を基礎としており、residuum-based backward requirements を用いて、中間者探索を支援する。
評価
(i)パブリックPDDL3設定/オーバーサブスクライブベンチマーク
(ii)RecipeNLG-SubsはRecipeNLGで構築され、Recipe1MSubsとFoodKGの代替候補が組み込まれている。
FCP は LLM と ReAct スタイルのベースラインに対して RecipeNLG-Subs のハードコントラスト違反を低減し、古典的なPDDL3 プランナーと競合する。
関連論文リスト
- MAESTRO: Meta-learning Adaptive Estimation of Scalarization Trade-offs for Reward Optimization [56.074760766965085]
大規模言語モデル(LLM)の整合性のための効率的なパラダイムとしてグループ相対政策最適化が登場している。
我々は,報酬スカラー化を動的潜在ポリシーとして扱い,モデルの終端隠蔽状態を意味的ボトルネックとして活用するMAESTROを提案する。
本稿では,軽量コンダクタネットワークがメタリワード信号としてグループ相対的優位性を生かしてポリシと共進化する,双方向最適化フレームワークにおけるコンテキスト的帯域幅問題としてこれを定式化する。
論文 参考訳(メタデータ) (2026-01-12T05:02:48Z) - Practical RAG Evaluation: A Rarity-Aware Set-Based Metric and Cost-Latency-Quality Trade-offs [0.0]
本稿では,生産型RAGにおける推算ゲームについて述べる。
黄金のセットを構築し、監査するための標準化された再現可能な方法はありません。
Rath-gs (MIT) はプラケット=ルーシがリストワイドに改良したリーン・ゴールデンセットのパイプラインである。
論文 参考訳(メタデータ) (2025-11-12T18:49:21Z) - Automated Skill Decomposition Meets Expert Ontologies: Bridging the Granularity Gap with LLMs [1.2891210250935148]
本稿では,Large Language Models (LLM) を用いた自動スキル分解について検討する。
我々のフレームワークは、パイプラインをプロンプトと生成から正規化とオントロジーノードとのアライメントまで標準化する。
出力を評価するために、コンテンツ精度を評価するために最適な埋め込みベースのマッチングを使用するF1スコアと、粒度を評価するために構造的に正しい配置を信用する階層型F1スコアの2つの指標を導入する。
論文 参考訳(メタデータ) (2025-10-13T12:03:06Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - Linear Preference Optimization: Decoupled Gradient Control via Absolute Regularization [13.97375970293678]
DPO(Direct Preference Optimization)は、その単純さと訓練安定性から、オフライン優先最適化アルゴリズムとして広く使われている。
3つの重要なイノベーションを特徴とする新しいアライメントフレームワークであるLinear Preference Optimization (LPO)を提案する。
まず,対数シグモイド関数を絶対差分損失に置き換え,最適化力学を分離することで勾配デカップリングを導入する。
第2に、選択された応答品質を維持するために、オフセット制約と正の正則化項を組み合わせることで安定性を向上させる。
第3に、直感的な推定を伴う勾配分離と、その相対確率の降下を線形に制御する調整可能な係数を用いて、制御可能な拒絶抑制を実装した。
論文 参考訳(メタデータ) (2025-08-20T10:17:29Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Solving Multistage Stochastic Linear Programming via Regularized Linear
Decision Rules: An Application to Hydrothermal Dispatch Planning [77.34726150561087]
AdaSO(Adaptive least absolute shrinkage and selection operator)に基づく線形決定規則(LDR)の新しい正規化手法を提案する。
実験により、MSLPを解くために古典的な非正規化LDRを使用する場合、過度に適合する脅威は無視できないことが示された。
LHDP問題に対しては、非正規化ベンチマークと比較して、提案したフレームワークの次の利点を強調した。
論文 参考訳(メタデータ) (2021-10-07T02:36:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。