論文の概要: Stephanie2: Thinking, Waiting, and Making Decisions Like Humans in Step-by-Step AI Social Chat
- arxiv url: http://arxiv.org/abs/2601.05657v1
- Date: Fri, 09 Jan 2026 09:27:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.930538
- Title: Stephanie2: Thinking, Waiting, and Making Decisions Like Humans in Step-by-Step AI Social Chat
- Title(参考訳): Stephanie2: ステップバイステップのAIソーシャルチャットで人間のような決定を下す
- Authors: Hao Yang, Hongyuan Lu, Dingkang Yang, Wenliang Yang, Peng Sun, Xiaochuan Zhang, Jun Xiao, Kefan He, Wai Lam, Yang Liu, Xinhua Zeng,
- Abstract要約: Stephanie2は、次世代のステップワイド意思決定対話エージェントである。
Stephanie2は、アクティブな待機とメッセージペースの適応によって、各ステップで送信と待機を明示的に決定する。
実験によると、Stephanie2は自然さやエンゲージメントなどの指標で明らかにStephanie1を上回っている。
- 参考スコア(独自算出の注目度): 60.51107098103245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Instant-messaging human social chat typically progresses through a sequence of short messages. Existing step-by-step AI chatting systems typically split a one-shot generation into multiple messages and send them sequentially, but they lack an active waiting mechanism and exhibit unnatural message pacing. In order to address these issues, we propose Stephanie2, a novel next-generation step-wise decision-making dialogue agent. With active waiting and message-pace adaptation, Stephanie2 explicitly decides at each step whether to send or wait, and models latency as the sum of thinking time and typing time to achieve more natural pacing. We further introduce a time-window-based dual-agent dialogue system to generate pseudo dialogue histories for human and automatic evaluations. Experiments show that Stephanie2 clearly outperforms Stephanie1 on metrics such as naturalness and engagement, and achieves a higher pass rate on human evaluation with the role identification Turing test.
- Abstract(参考訳): インスタントメッセージの人間のソーシャルチャットは通常、短いメッセージの連続を通じて進行する。
既存のステップバイステップのAIチャットシステムは、通常、ワンショット生成を複数のメッセージに分割して順次送信するが、アクティブな待ち機構がなく、不自然なメッセージペーシングを表示する。
これらの問題に対処するため、我々は、新しいステップワイド意思決定対話エージェントであるStephanie2を提案する。
Stephanie2は、アクティブな待ち時間とメッセージペースの適応によって、各ステップで送信または待機を明示的に決定し、より自然なペーシングを達成するために、思考時間とタイピング時間の合計としてレイテンシをモデル化する。
さらに,人間と自動評価のための擬似対話履歴を生成するための,タイムウインドウに基づく二重エージェント対話システムを導入する。
実験の結果、Stephanie2は自然さやエンゲージメントなどの指標で明らかにStephanie1より優れており、Turingテストで人体評価のパスレートが高いことがわかった。
関連論文リスト
- Chronological Thinking in Full-Duplex Spoken Dialogue Language Models [66.84843878538207]
時系列思考は、完全なSDLMの応答品質を改善することを目的としている。
追加のレイテンシがない: ユーザが話すのをやめると、エージェントは考えるのをやめ、それ以上の遅延なしに話し始める。
結果: 客観的指標と人的評価の両面から, 時系列思考の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2025-10-02T10:28:11Z) - X-TURING: Towards an Enhanced and Efficient Turing Test for Long-Term Dialogue Agents [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すかどうかを調べる。
従来の設定では、各参加者は一度に1つのメッセージに制限される。
本稿では,textitburstダイアログパターンを用いて,元のテストを強化するtextbftextscX-Turingを提案する。
論文 参考訳(メタデータ) (2024-08-19T09:57:28Z) - Stephanie: Step-by-Step Dialogues for Mimicking Human Interactions in Social Conversations [50.698517967337885]
本研究では,人間の会話の動的な性質を模倣する新しいテキストbf-by-Step Dialogue Paradigm (Stephanie)を提案する。
デュアルラーニング戦略と,さらに分割した後編集手法を用いて,高品質なステップバイステップ対話データセットを作成した。
従来の単段階対話のパラダイムと比較して,その効果を評価するために,自動評価と人的評価を行った。
論文 参考訳(メタデータ) (2024-07-04T17:59:41Z) - "Wait, I'm Still Talking!" Predicting the Dialogue Interaction Behavior
Using Imagine-Then-Arbitrate Model [24.560203199376478]
実際の人間と人間の会話では、1ターンで長いメッセージではなく、可読性のためのいくつかの短いメッセージが順次送信されることが多い。
本稿では,エージェントが待機するか,直接応答するかを決定するのに役立つ,新しいImagine-then-Arbitrate(ITA)ニューラルダイアログモデルを提案する。
論文 参考訳(メタデータ) (2020-02-22T04:05:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。