論文の概要: Probabilistic Modeling of Intentions in Socially Intelligent LLM Agents
- arxiv url: http://arxiv.org/abs/2510.18476v1
- Date: Tue, 21 Oct 2025 09:54:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.345135
- Title: Probabilistic Modeling of Intentions in Socially Intelligent LLM Agents
- Title(参考訳): 社会的に知能なLLMエージェントにおける意図の確率論的モデリング
- Authors: Feifan Xia, Yuyang Fang, Defang Li, Yantong Xie, Weikang Li, Yang Li, Deguo Xia, Jizhou Huang,
- Abstract要約: マルチターン社会対話における大規模言語モデル(LLM)エージェントに対する確率論的意図モデリングフレームワークを提案する。
このフレームワークは、相手の潜伏した意図に対する信念の分布を、文脈的事前から、各発話後の確率推定を通じて動的に更新する。
SOTOPIA環境における予備実験は、一貫した改善を示す。
- 参考スコア(独自算出の注目度): 9.813014047223097
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a probabilistic intent modeling framework for large language model (LLM) agents in multi-turn social dialogue. The framework maintains a belief distribution over a partner's latent intentions, initialized from contextual priors and dynamically updated through likelihood estimation after each utterance. The evolving distribution provides additional contextual grounding for the policy, enabling adaptive dialogue strategies under uncertainty. Preliminary experiments in the SOTOPIA environment show consistent improvements: the proposed framework increases the Overall score by 9.0% on SOTOPIA-All and 4.1% on SOTOPIA-Hard compared with the Qwen2.5-7B baseline, and slightly surpasses an oracle agent that directly observes partner intentions. These early results suggest that probabilistic intent modeling can contribute to the development of socially intelligent LLM agents.
- Abstract(参考訳): マルチターン社会対話における大規模言語モデル(LLM)エージェントに対する確率論的意図モデリングフレームワークを提案する。
このフレームワークは、相手の潜在意図に対する信念の分布を維持し、文脈的事前から初期化され、各発話の後、確率推定によって動的に更新される。
進化する分布は、不確実性の下で適応的な対話戦略を可能にする、ポリシーのための追加の文脈的基盤を提供する。
提案したフレームワークは、Qwen2.5-7Bベースラインと比較して、SOTOPIA-Allで9.0%、SOTOPIA-Hardで4.1%、パートナーの意図を直接観察するオラクルエージェントをわずかに上回っている。
これらの初期の結果は、確率論的意図モデリングが社会的にインテリジェントなLLMエージェントの開発に寄与することを示唆している。
関連論文リスト
- STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents [31.726927520069616]
自己進化型エボダイドエージェント(SeEA-R1)は、自己進化型エボダイドエージェント用に設計された最初の強化微細調整フレームワークである。
スパース遅延報酬をより高密度な中間信号に変換し、多段階推論を改善する。
タスクやシーンにまたがる報酬推定を一般化し、自律的な適応と報酬駆動の自己進化をサポートする。
論文 参考訳(メタデータ) (2025-06-26T18:00:07Z) - Beyond Reactive Safety: Risk-Aware LLM Alignment via Long-Horizon Simulation [69.63626052852153]
本稿では,モデル生成によるアドバイスが社会システムを通じてどのように伝播するかを示す概念実証フレームワークを提案する。
また、100の間接的な害シナリオのデータセットを導入し、害のないユーザプロンプトから有害で非有害な結果を予測するモデルの能力をテストする。
論文 参考訳(メタデータ) (2025-06-26T02:28:58Z) - A Multi-Agent Probabilistic Inference Framework Inspired by Kairanban-Style CoT System with IdoBata Conversation for Debiasing [0.0]
日本のカイランバン文化やイドバタの会話は、長年にわたり伝統的なコミュニケーションの実践として機能してきた。
これらの情報交換プロセスにインスパイアされた本研究では,マルチエージェント推論フレームワーク(KCS+IBC)を提案する。
複数の大規模言語モデル(LLM)を統合し、バイアス軽減、説明可能性の向上、感情分析の確率予測を実現している。
論文 参考訳(メタデータ) (2025-06-12T07:31:20Z) - MF-LLM: Simulating Population Decision Dynamics via a Mean-Field Large Language Model Framework [53.82097200295448]
MF-LLM(Mean-Field LLM)は,まず平均場理論を社会シミュレーションに取り入れる。
MF-LLMは反復過程を通じて個人と人口間の双方向相互作用をモデル化する。
IB-Tuneは、Information Bottleneckの原理にインスパイアされた、新しい微調整手法である。
論文 参考訳(メタデータ) (2025-04-30T12:41:51Z) - SOTOPIA-$Ω$: Dynamic Strategy Injection Learning and Social Instruction Following Evaluation for Social Agents [16.320531397370008]
本稿では,言語エージェントの社会的能力向上のための枠組みを提案する。
本稿では,ソーシャルインストラクション・フォロー(S-IF)の概念を導入し,新しい2つのS-IF評価指標を提案する。
質の高いコーパスで訓練された複数の7Bモデルが,社会目標達成において,専門家エージェント(GPT-4)をはるかに上回るだけでなく,その達成に寄与することが実証された。
論文 参考訳(メタデータ) (2025-02-21T15:40:37Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - LLM-SAP: Large Language Models Situational Awareness Based Planning [0.0]
我々は、潜在的なリスクを予測し、積極的に軽減する方法論を開発するために、マルチエージェント推論フレームワークを使用します。
提案手法は,人間中心のインタラクションの複雑さを計画プロセスに組み込むことによって,従来のオートマトン理論から分岐する。
論文 参考訳(メタデータ) (2023-12-26T17:19:09Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。