Fugu-MT 論文翻訳(概要): ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions

論文の概要: ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions

arxiv url: http://arxiv.org/abs/2605.20087v1
Date: Tue, 19 May 2026 16:42:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-20 15:03:09.532338
Title: ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions
Title（参考訳）: ThoughtTrace: 現実世界のLLMインタラクションにおけるユーザ思考の理解
Authors: Chuanyang Jin, Binze Li, Haopeng Xie, Cathy Mengying Fang, Tianjian Li, Shayne Longpre, Hongxiang Gu, Maximillian Chen, Tianmin Shu,
Abstract要約: ThoughtTraceは、現実世界のマルチターンヒューマン-AI会話とユーザの自己報告された思考を組み合わせた最初の大規模データセットである。 ThoughtTraceには1,058のユーザ、2,155の会話、17,058のターン、10,174の思考アノテーションが20の言語モデルで収集されている。
参考スコア（独自算出の注目度）: 31.70995208851302
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Conversational AI has now reached billions of users, yet existing datasets capture only what people say, not what they think. We introduce ThoughtTrace, the first large-scale dataset that pairs real-world multi-turn human--AI conversations with users' self-reported thoughts: their reasons for sending prompts and reactions to assistant responses. ThoughtTrace comprises 1,058 users, 2,155 conversations, 17,058 turns, and 10,174 thought annotations collected across 20 language models. Our analysis shows that ThoughtTrace captures long-horizon, topically diverse interactions, and that thoughts are semantically distinct from messages, difficult for frontier LLMs to infer from context, diverse in content, and tied to conversation stages. We further demonstrate the utility of thoughts for downstream modeling. First, thoughts improve user-behavior prediction as inference-time context. Second, thought-guided rewrites provide fine-grained alignment signals for training personalized assistants. Together, ThoughtTrace establishes user thoughts as a new data modality for studying the cognitive dynamics behind human--AI interaction and provides a foundation for building assistants that better understand and adapt to users' latent goals, preferences, and needs.
Abstract（参考訳）: 会話型AIは今や数十億のユーザーに達したが、既存のデータセットは人々が何を言っているかだけを捉えている。 ThoughtTraceは、現実世界のマルチターンヒューマン-AI会話と、ユーザの自己報告された思考をペアリングする最初の大規模データセットである。 ThoughtTraceには1,058のユーザ、2,155の会話、17,058のターン、10,174の思考アノテーションが20の言語モデルで収集されている。我々の分析では、ThoughtTraceは長い水平なトポロジカルな相互作用を捉え、メッセージとは意味的に異なる思考であり、フロンティアのLLMが文脈から推測することが困難であり、内容が多様であり、会話の段階に結びついていることが示されている。さらに、下流モデリングにおける思考の有用性を実証する。第一に、思考はユーザーの行動予測を推論時コンテキストとして改善する。第二に、思考誘導による書き直しは、パーソナライズされたアシスタントを訓練するための微妙なアライメント信号を提供する。 ThoughtTraceは、人間のAIインタラクションの背後にある認知力学を研究するための新しいデータモダリティとしてユーザ思考を確立し、ユーザの潜在目標、好み、ニーズをよりよく理解し適応するアシスタントを構築するための基盤を提供する。

関連論文リスト

Interactive Tracking: A Human-in-the-Loop Paradigm with Memory-Augmented Adaptation [60.96010213186819]
自然言語コマンドを使用していつでもトラッカーをガイドできる新しいパラダイムであるInteractive Trackingを導入する。対話型トラッキングのための最初の大規模ベンチマークであるInteractTrackについて紹介する。第3に,ユーザからのフィードバックから学習し,トラッキング動作を更新するために動的メモリ機構を利用する新しいベースラインであるInteractive Memory-Augmented Tracking (IMAT)を導入する。
論文参考訳（メタデータ） (2026-04-02T12:33:27Z)
FronTalk: Benchmarking Front-End Development as Conversational Code Generation with Multi-Modal Feedback [92.67587639164908]
マルチモーダルフィードバックを備えたフロントエンドコード生成のベンチマークであるFronTalkを紹介する。我々は、フロントエンド開発タスクに集中し、100のマルチターン対話のコレクションであるFronTalkをキュレートする。 20モデルの評価は、文献で体系的に調査されていない2つの重要な課題を明らかにしている。
論文参考訳（メタデータ） (2025-12-05T23:28:09Z)
Human vs. Agent in Task-Oriented Conversations [22.743152820695588]
本研究は,大規模言語モデル(LLM)を模擬したユーザとタスク指向の対話における人間ユーザとの体系的比較を行った最初の事例である。本分析により,問題解決手法における2つのユーザタイプ間の行動的差異が明らかとなった。
論文参考訳（メタデータ） (2025-09-22T11:30:39Z)
Thinking Before You Speak: A Proactive Test-time Scaling Approach [54.8205006555199]
emphThinking Before You Speak (TBYS)という名前の推論フレームワークとして、私たちのアイデアを実装しています。インテリジェンス生成のためのコンテキスト内サンプルを自動的に収集・フィルタリングするパイプラインを設計する。挑戦的な数学的データセットの実験は、TBYSの有効性を検証する。
論文参考訳（メタデータ） (2025-08-26T03:43:32Z)
REALTALK: A 21-Day Real-World Dataset for Long-Term Conversation [51.97224538045096]
本稿では、21日間のメッセージアプリ対話のコーパスであるREALTALKを紹介する。 EI属性とペルソナの整合性を比較し,現実世界の対話による課題を理解する。その結果,モデルでは対話履歴のみからユーザをシミュレートすることが困難であり,特定のユーザチャットの微調整はペルソナのエミュレーションを改善することがわかった。
論文参考訳（メタデータ） (2025-02-18T20:29:01Z)
Proactive Conversational Agents with Inner Thoughts [42.34140072445951]
会話型AIにおける長年の願望の1つは、会話において自律的にイニシアティブ、すなわち積極的に行動できるようにすることである。以前のNLP研究は、主に前の会話のような文脈から次の話者を予測することに焦点を当てていた。我々は、人間と同じように、単にターンテイクの手がかりに反応するのではなく、プロアクティブなAIが会話中に自身の内的思考を定式化し、貢献する適切な瞬間を求めることを提案する。
論文参考訳（メタデータ） (2024-12-31T10:41:56Z)
UltraFeedback: Boosting Language Models with Scaled AI Feedback [99.4633351133207]
大規模で高品質で多様なAIフィードバックデータセットである textscUltraFeedback を提示する。我々の研究は、強力なオープンソースのチャット言語モデルを構築する上で、スケールしたAIフィードバックデータの有効性を検証する。
論文参考訳（メタデータ） (2023-10-02T17:40:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。