論文の概要: Descriptive History Representations: Learning Representations by Answering Questions
- arxiv url: http://arxiv.org/abs/2506.02125v1
- Date: Mon, 02 Jun 2025 18:00:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.919433
- Title: Descriptive History Representations: Learning Representations by Answering Questions
- Title(参考訳): 記述的歴史表現:質問に対する回答による学習的表現
- Authors: Guy Tennenholtz, Jihwan Jeong, Chih-Wei Hsu, Yinlam Chow, Craig Boutilier,
- Abstract要約: 本稿では,記述的歴史表現(DHRs: Descriptive History Representations)を紹介する。
DHRはタスク関連クエリに対処するために必要な情報を収集することに集中し、最適な制御のために履歴を要約する構造化された方法を提供する。
これは、効果的な意思決定に必要な、厳密な歴史的詳細と予測構造を捉えた表現をもたらす。
- 参考スコア(独自算出の注目度): 22.802988589711337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective decision making in partially observable environments requires compressing long interaction histories into informative representations. We introduce Descriptive History Representations (DHRs): sufficient statistics characterized by their capacity to answer relevant questions about past interactions and potential future outcomes. DHRs focus on capturing the information necessary to address task-relevant queries, providing a structured way to summarize a history for optimal control. We propose a multi-agent learning framework, involving representation, decision, and question-asking components, optimized using a joint objective that balances reward maximization with the representation's ability to answer informative questions. This yields representations that capture the salient historical details and predictive structures needed for effective decision making. We validate our approach on user modeling tasks with public movie and shopping datasets, generating interpretable textual user profiles which serve as sufficient statistics for predicting preference-driven behavior of users.
- Abstract(参考訳): 部分的に観測可能な環境での効果的な意思決定には、長い相互作用履歴を情報表現に圧縮する必要がある。
記述的歴史表現(DHR: Descriptive History Representations: DHR)を紹介する。
DHRはタスク関連クエリに対処するために必要な情報を収集することに集中し、最適な制御のために履歴を要約する構造化された方法を提供する。
本稿では,表現,意思決定,質問応答などを含むマルチエージェント学習フレームワークを提案し,報酬の最大化と情報的質問への回答能力のバランスをとる共同目標を用いて最適化する。
これは、効果的な意思決定に必要な、厳密な歴史的詳細と予測構造を捉えた表現をもたらす。
我々は,公開映画やショッピングデータセットを用いたユーザモデリングタスクに対するアプローチを検証するとともに,ユーザの嗜好駆動行動を予測するのに十分な統計量となる,解釈可能なテキストユーザプロファイルを生成する。
関連論文リスト
- Are We Solving a Well-Defined Problem? A Task-Centric Perspective on Recommendation Tasks [46.705107776194616]
我々はRecSysタスクの定式化を解析し、入力出力構造、時間力学、候補項目選択といった重要なコンポーネントを強調した。
本稿では,タスク特異性とモデル一般化可能性のバランスについて考察し,タスク定式化がロバストな評価と効率的なソリューション開発の基礎となることを明らかにする。
論文 参考訳(メタデータ) (2025-03-27T06:10:22Z) - Rehearse With User: Personalized Opinion Summarization via Role-Playing based on Large Language Models [29.870187698924852]
大きな言語モデルは、長いテキストを含むパーソナライズされたタスクにおいて困難に直面します。
モデルがユーザとして機能することで、モデルはユーザのパーソナライズされたニーズをよりよく理解できます。
提案手法は,大規模モデル生成サマリーにおけるパーソナライズレベルを効果的に向上させることができる。
論文 参考訳(メタデータ) (2025-03-01T11:05:01Z) - Persona-DB: Efficient Large Language Model Personalization for Response Prediction with Collaborative Data Refinement [79.2400720115588]
本稿では,タスクコンテキスト間の一般化を改善するための階層的な構築プロセスからなる,シンプルで効果的なフレームワークであるPersona-DBを紹介する。
応答予測の評価において,Persona-DB は精度を著しく低減した検索サイズで維持する上で,より優れたコンテキスト効率を示す。
我々の実験は、ユーザーが極めて少ないデータを持つ場合、コールドスタートシナリオで10%以上の顕著な改善が示されていることも示している。
論文 参考訳(メタデータ) (2024-02-16T20:20:43Z) - AVIS: Autonomous Visual Information Seeking with Large Language Model
Agent [123.75169211547149]
本稿では,視覚的質問応答フレームワークAVISを提案する。
本手法は,LLM(Large Language Model)を利用して外部ツールの利用を動的に強化する。
AVIS は Infoseek や OK-VQA などの知識集約型視覚質問応答ベンチマークの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-06-13T20:50:22Z) - AaKOS: Aspect-adaptive Knowledge-based Opinion Summarization [5.4138734778206]
インターネット上の情報の急速な増加は、様々な活動、製品、サービスに関する圧倒的な意見やコメントにつながっている。
これにより、ユーザが意思決定を行うときに利用可能なすべての情報を処理するのが難しく、時間がかかります。
本稿では,製品レビューのためのアスペクト適応型知識ベースオピニオン要約モデルを提案する。
論文 参考訳(メタデータ) (2023-05-26T03:44:35Z) - Socratic Pretraining: Question-Driven Pretraining for Controllable
Summarization [89.04537372465612]
ソクラティック事前訓練は、要約タスクにおける制御性を改善するために設計された、質問駆動で教師なし事前訓練の目的である。
以上の結果から,Socraticプレトレーニングはタスク固有のラベル付きデータ要件を半分に削減することがわかった。
論文 参考訳(メタデータ) (2022-12-20T17:27:10Z) - Adaptive Summaries: A Personalized Concept-based Summarization Approach
by Learning from Users' Feedback [0.0]
本稿では,アダプティブ・サマリー(Adaptive Summaries)と呼ばれるインタラクティブな概念に基づく要約モデルを提案する。
本システムは,反復ループでフィードバックを与えることで,システムと対話しながら,ユーザの提供した情報から徐々に学習する。
生成したサマリーでユーザ好みのコンテンツを最大化することで、ユーザの好みに基づいた高品質なサマリー作成を支援する。
論文 参考訳(メタデータ) (2020-12-24T18:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。