論文の概要: Thinking in Character: Advancing Role-Playing Agents with Role-Aware Reasoning
- arxiv url: http://arxiv.org/abs/2506.01748v1
- Date: Mon, 02 Jun 2025 14:55:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 04:22:50.76661
- Title: Thinking in Character: Advancing Role-Playing Agents with Role-Aware Reasoning
- Title(参考訳): キャラクター思考:ロールアウェア推論によるロールプレイングエージェントの強化
- Authors: Yihong Tang, Kehai Chen, Muyun Yang, Zhengyu Niu, Jing Li, Tiejun Zhao, Min Zhang,
- Abstract要約: 本稿では,RAR(Role Identity Activation)とRSO(Reasoning Style Optimization)の2つの重要な段階からなる新しいRole-Aware Reasoning(RAR)手法を提案する。
RIAは、アテンションディバージョンに対抗するために推論中にキャラクタープロファイルでモデルを明示的にガイドし、RSOは、LEM蒸留によるキャラクターとシーンの推論スタイルを調整し、スタイルのドリフトを緩和する。
- 参考スコア(独自算出の注目度): 46.47940531288568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advancement of Large Language Models (LLMs) has spurred significant interest in Role-Playing Agents (RPAs) for applications such as emotional companionship and virtual interaction. However, recent RPAs are often built on explicit dialogue data, lacking deep, human-like internal thought processes, resulting in superficial knowledge and style expression. While Large Reasoning Models (LRMs) can be employed to simulate character thought, their direct application is hindered by attention diversion (i.e., RPAs forget their role) and style drift (i.e., overly formal and rigid reasoning rather than character-consistent reasoning). To address these challenges, this paper introduces a novel Role-Aware Reasoning (RAR) method, which consists of two important stages: Role Identity Activation (RIA) and Reasoning Style Optimization (RSO). RIA explicitly guides the model with character profiles during reasoning to counteract attention diversion, and then RSO aligns reasoning style with the character and scene via LRM distillation to mitigate style drift. Extensive experiments demonstrate that the proposed RAR significantly enhances the performance of RPAs by effectively addressing attention diversion and style drift.
- Abstract(参考訳): LLM(Large Language Models)の進歩は、感情的な協調や仮想相互作用といった応用において、ロールプレイングエージェント(RPAs)に大きな関心を喚起している。
しかしながら、最近の RPA は、しばしば明示的な対話データに基づいて構築され、深い人間のような内的思考プロセスが欠如しており、表面的な知識とスタイル表現をもたらす。
文字思考をシミュレートするためにLarge Reasoning Models (LRM) を用いるが、その直接的な応用は注意の転換(RPAは役割を忘れる)とスタイルドリフト(すなわち、文字一貫性の推論よりも形式的かつ厳密な推論)によって妨げられる。
これらの課題に対処するために,RAR(Role-Aware Reasoning)手法を導入し,RAR(Role Identity Activation)とRSO(Reasoning Style Optimization)の2つの重要な段階からなる。
RIAは、アテンションディバージョンに対抗するために推論中にキャラクタープロファイルでモデルを明示的にガイドし、RSOはLRM蒸留によるキャラクターとシーンの推論スタイルを調整し、スタイルのドリフトを緩和する。
広汎な実験により,提案RARは注意方向転換とスタイルドリフトを効果的に解決することにより,RPAの性能を著しく向上することが示された。
関連論文リスト
- ChARM: Character-based Act-adaptive Reward Modeling for Advanced Role-Playing Language Agents [60.325553329946]
Role-Playing Language Agents (RPLA) は、現実的で魅力的な人間とコンピュータのインタラクションのために文字をシミュレートすることを目的としている。
キャラクタに基づくアクト適応リワードモデルであるChARMを提案する。
RPLAに特化した最初の大規模嗜好データセットであるRoleplayPrefを紹介する。
論文 参考訳(メタデータ) (2025-05-29T18:15:18Z) - Guess What I am Thinking: A Benchmark for Inner Thought Reasoning of Role-Playing Language Agents [48.52216655094884]
ロールプレイング言語エージェント(RPLA)の内部思考プロセスは未解明のままである。
ROLETHINKは、文字の思考生成を評価するための文献から構築された新しいベンチマークである。
記憶を抽出し、文字反応を予測し、モチベーションを合成することで、文字思考を創り出す、チェーンオブ思考アプローチであるMIRRORを提案する。
論文 参考訳(メタデータ) (2025-03-11T08:57:07Z) - ERABAL: Enhancing Role-Playing Agents through Boundary-Aware Learning [17.5855800570993]
ヒューマン・コンピュータ・インタラクション(HCI)分野におけるロールプレイング
大幅な進歩にもかかわらず、ロールプレイングエージェント(RPLA)は、会話間のロール一貫性を維持するのに依然として苦労している。
境界認識学習によるロールプレイング能力向上を目的としたフレームワークであるERABALを提案する。
論文 参考訳(メタデータ) (2024-09-23T05:12:13Z) - Capturing Minds, Not Just Words: Enhancing Role-Playing Language Models with Personality-Indicative Data [58.92110996840019]
本稿では、パーソナリティを指標としたデータを用いて、ロールプレイング言語モデル(RPLM)を強化することを提案する。
具体的には、心理学的尺度からの質問を活用し、高度なRPAを蒸留し、文字の心を把握した対話を生成する。
実験により,本データセットを用いてトレーニングしたRPLMは,一般人格関連評価と人格関連評価の両面において,高度なロールプレイング能力を示した。
論文 参考訳(メタデータ) (2024-06-27T06:24:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。