論文の概要: RLSLM: A Hybrid Reinforcement Learning Framework Aligning Rule-Based Social Locomotion Model with Human Social Norms
- arxiv url: http://arxiv.org/abs/2511.11323v1
- Date: Fri, 14 Nov 2025 13:59:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.643613
- Title: RLSLM: A Hybrid Reinforcement Learning Framework Aligning Rule-Based Social Locomotion Model with Human Social Norms
- Title(参考訳): RLSLM: ルールに基づく社会ロコモーションモデルと人間社会ノルムを組み合わせたハイブリッド強化学習フレームワーク
- Authors: Yitian Kou, Yihe Gu, Chen Zhou, DanDan Zhu, Shuguang Kuai,
- Abstract要約: 不快を生じさせることなく、人口の多い環境をナビゲートすることは、社会的に認識されるエージェントにとって重要な能力である。
本稿では,ルールに基づくソーシャルロコモーションモデルを強化学習フレームワークに統合したハイブリッド強化学習フレームワーク RLSLM を提案する。
- 参考スコア(独自算出の注目度): 1.5561226067871505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating human-populated environments without causing discomfort is a critical capability for socially-aware agents. While rule-based approaches offer interpretability through predefined psychological principles, they often lack generalizability and flexibility. Conversely, data-driven methods can learn complex behaviors from large-scale datasets, but are typically inefficient, opaque, and difficult to align with human intuitions. To bridge this gap, we propose RLSLM, a hybrid Reinforcement Learning framework that integrates a rule-based Social Locomotion Model, grounded in empirical behavioral experiments, into the reward function of a reinforcement learning framework. The social locomotion model generates an orientation-sensitive social comfort field that quantifies human comfort across space, enabling socially aligned navigation policies with minimal training. RLSLM then jointly optimizes mechanical energy and social comfort, allowing agents to avoid intrusions into personal or group space. A human-agent interaction experiment using an immersive VR-based setup demonstrates that RLSLM outperforms state-of-the-art rule-based models in user experience. Ablation and sensitivity analyses further show the model's significantly improved interpretability over conventional data-driven methods. This work presents a scalable, human-centered methodology that effectively integrates cognitive science and machine learning for real-world social navigation.
- Abstract(参考訳): 不快を生じさせることなく、人口の多い環境をナビゲートすることは、社会的に認識されるエージェントにとって重要な能力である。
ルールベースのアプローチは、事前に定義された心理的原則を通じて解釈可能性を提供するが、一般化性と柔軟性が欠けていることが多い。
逆に、データ駆動の手法は大規模なデータセットから複雑な振る舞いを学ぶことができるが、典型的には非効率で不透明で、人間の直感に合わせるのが難しい。
このギャップを埋めるために,実証的な行動実験に基づくルールベースのソーシャルロコモーションモデルを強化学習フレームワークの報酬関数に統合したハイブリッド強化学習フレームワーク RLSLM を提案する。
ソーシャル・ロコモーション・モデルは、空間を横断する人間の快適さを定量化し、最小限のトレーニングで社会的に整列したナビゲーションポリシーを可能にする、指向性に敏感な社会的快適なフィールドを生成する。
RLSLMは機械的エネルギーと社会的な快適さを共同で最適化し、エージェントは個人やグループ空間への侵入を避けることができる。
没入型VRベースのセットアップを用いた人間とエージェントのインタラクション実験は、RTSLMがユーザエクスペリエンスにおける最先端のルールベースのモデルより優れていることを示す。
アブレーションと感度分析により、従来のデータ駆動法よりも大幅に改善された解釈可能性を示す。
この研究は、現実世界のソーシャルナビゲーションに認知科学と機械学習を効果的に統合する、スケーラブルで人間中心の方法論を提示している。
関連論文リスト
- Social Simulations with Large Language Model Risk Utopian Illusion [61.358959720048354]
社会シミュレーションにおける大規模言語モデルの行動分析のための体系的枠組みを提案する。
本手法は,チャットルーム型会話を通してマルチエージェントインタラクションをシミュレートし,5つの言語的側面にわたって解析する。
以上の結果から,LSMは真の人間の行動を忠実に再現するのではなく,過度に理想化されたバージョンを反映していることが明らかとなった。
論文 参考訳(メタデータ) (2025-10-24T06:08:41Z) - Learning to Make Friends: Coaching LLM Agents toward Emergent Social Ties [3.1146704506932985]
大規模言語モデル(LLM)エージェントは、人間のオンライン行動を特徴づける複雑な社会的ダイナミクスを再現する。
エージェントが繰り返し対話し、相互に評価し、文脈内学習を通じてそれらの振る舞いを適応するマルチエージェントLLMシミュレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-22T07:00:33Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - LLM-driven Imitation of Subrational Behavior : Illusion or Reality? [3.2365468114603937]
既存の作業は、複雑な推論タスクに対処し、人間のコミュニケーションを模倣する大規模言語モデルの能力を強調している。
そこで本研究では,LLMを用いて人工人体を合成し,サブリレーショナル・エージェント・ポリシーを学習する手法を提案する。
我々は,4つの単純なシナリオを通して,サブリレータリティをモデル化するフレームワークの能力について実験的に評価した。
論文 参考訳(メタデータ) (2024-02-13T19:46:39Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Training Socially Aligned Language Models on Simulated Social
Interactions [99.39979111807388]
AIシステムにおける社会的アライメントは、確立された社会的価値に応じてこれらのモデルが振舞うことを保証することを目的としている。
現在の言語モデル(LM)は、トレーニングコーパスを独立して厳格に複製するように訓練されている。
本研究は,シミュレートされた社会的相互作用からLMを学習することのできる,新しい学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-05-26T14:17:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。