論文の概要: Behavior Tokens Speak Louder: Disentangled Explainable Recommendation with Behavior Vocabulary
- arxiv url: http://arxiv.org/abs/2512.15614v1
- Date: Wed, 17 Dec 2025 17:24:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:27.075594
- Title: Behavior Tokens Speak Louder: Disentangled Explainable Recommendation with Behavior Vocabulary
- Title(参考訳): ビヘイビア・トークン・スピーカー: ビヘイビア・ボキャブラリを用いたディスタングルな説明可能なレコメンデーション
- Authors: Xinshun Feng, Mingzhe Liu, Yi Qiao, Tongyu Zhu, Leilei Sun, Shuai Wang,
- Abstract要約: BEATは、ユーザとアイテムの振る舞いを個別に解釈可能なシーケンスにトークン化するフレームワークです。
BEATは、一貫性のある情報的説明を生成しながら、ゼロショットレコメンデーション性能を改善していることを示す。
- 参考スコア(独自算出の注目度): 22.925582428795437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in explainable recommendations have explored the integration of language models to analyze natural language rationales for user-item interactions. Despite their potential, existing methods often rely on ID-based representations that obscure semantic meaning and impose structural constraints on language models, thereby limiting their applicability in open-ended scenarios. These challenges are intensified by the complex nature of real-world interactions, where diverse user intents are entangled and collaborative signals rarely align with linguistic semantics. To overcome these limitations, we propose BEAT, a unified and transferable framework that tokenizes user and item behaviors into discrete, interpretable sequences. We construct a behavior vocabulary via a vector-quantized autoencoding process that disentangles macro-level interests and micro-level intentions from graph-based representations. We then introduce multi-level semantic supervision to bridge the gap between behavioral signals and language space. A semantic alignment regularization mechanism is designed to embed behavior tokens directly into the input space of frozen language models. Experiments on three public datasets show that BEAT improves zero-shot recommendation performance while generating coherent and informative explanations. Further analysis demonstrates that our behavior tokens capture fine-grained semantics and offer a plug-and-play interface for integrating complex behavior patterns into large language models.
- Abstract(参考訳): 説明可能なレコメンデーションの最近の進歩は、ユーザとイテムインタラクションのための自然言語の合理性を分析するための言語モデルの統合を探求している。
その可能性にもかかわらず、既存のメソッドは多くの場合、意味を曖昧にし、言語モデルに構造的制約を課すIDベースの表現に依存しているため、オープンなシナリオでの適用性が制限される。
これらの課題は、多様なユーザ意図が絡み合っており、協調的な信号が言語意味論とほとんど一致しない現実世界の相互作用の複雑な性質によって強化される。
これらの制限を克服するために、ユーザとアイテムの振る舞いを個別に解釈可能なシーケンスにトークン化する、統一的で転送可能なフレームワークBEATを提案する。
本研究では,グラフに基づく表現からマクロレベルの関心やマイクロレベルの意図を乱すベクトル量子化自動符号化プロセスを用いて,行動語彙を構築する。
次に,行動信号と言語空間のギャップを埋めるために,多段階のセマンティック監視を導入する。
セマンティックアライメントの正規化機構は、凍結した言語モデルの入力空間に直接振舞いトークンを埋め込むように設計されている。
3つの公開データセットの実験では、BEATは一貫性のある情報的説明を生成しながら、ゼロショットレコメンデーションのパフォーマンスを改善している。
さらに分析した結果,我々の行動トークンは細粒度のセマンティクスをキャプチャし,複雑な行動パターンを大規模言語モデルに統合するためのプラグイン・アンド・プレイインターフェースを提供することがわかった。
関連論文リスト
- Temporal Sparse Autoencoders: Leveraging the Sequential Nature of Language for Interpretability [31.30541946703775]
モデルの内部表現と計算を人間が理解できる概念に変換することが、解釈可能性の重要な目標である。
スパースオートエンコーダのような最近の辞書学習手法は、人間の解釈可能な特徴を発見するための有望な経路を提供する。
しかし、彼らは「文の始めの「The」というフレーズ」のような浅い、トークン特有の、または騒々しい特徴に偏りを呈している。
論文 参考訳(メタデータ) (2025-10-30T17:59:30Z) - SimStep: Chain-of-Abstractions for Incremental Specification and Debugging of AI-Generated Interactive Simulations [16.00479720281197]
CoA(Chain-of-Abstractions)は、プログラミングの中核的な能力を取り戻す方法である。
CoAは、合成プロセスを認知的に意味のある、タスクに沿った一連の表現に分解する。
SimStepは4つの中間抽象化を通じてシミュレーションを作成する教師のためのオーサリング環境である。
論文 参考訳(メタデータ) (2025-07-13T14:54:17Z) - CodeDiffuser: Attention-Enhanced Diffusion Policy via VLM-Generated Code for Instruction Ambiguity [23.77040677368575]
我々は,潜在的にあいまいな自然言語によって指定されたタスクを達成できる,新しいロボット操作フレームワークを導入する。
このフレームワークはVLM(Vision-Language Model)を使用して、自然言語命令の抽象概念を解釈する。
本稿では,言語あいまいさ,コンタクトリッチな操作,多目的インタラクションといった課題に対して,アプローチが優れていることを示す。
論文 参考訳(メタデータ) (2025-06-19T23:42:03Z) - Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models [55.19497659895122]
本稿ではスパース特徴回路の発見と適用方法を紹介する。
これらは言語モデルの振る舞いを説明するための人間の解釈可能な特徴の因果関係の著作である。
論文 参考訳(メタデータ) (2024-03-28T17:56:07Z) - Understanding Before Recommendation: Semantic Aspect-Aware Review Exploitation via Large Language Models [53.337728969143086]
レコメンデーションシステムは、クリックやレビューのようなユーザとイテムのインタラクションを利用して表現を学習する。
従来の研究では、様々な側面や意図にまたがるユーザの嗜好をモデル化することで、推奨精度と解釈可能性を改善する。
そこで本研究では,意味的側面と認識的相互作用を明らかにするためのチェーンベースのプロンプト手法を提案する。
論文 参考訳(メタデータ) (2023-12-26T15:44:09Z) - Neural Abstructions: Abstractions that Support Construction for Grounded
Language Learning [69.1137074774244]
言語の相互作用を効果的に活用するには、言語基底に対する2つの最も一般的なアプローチの制限に対処する必要がある。
本稿では,ラベル条件付き生成モデルの推論手順に対する制約のセットであるニューラル・アブストラクションの考え方を紹介する。
この手法により,マインクラフトにおけるオープンエンドハウスタスクのセマンティックな変更をユーザ人口が構築できることが示される。
論文 参考訳(メタデータ) (2021-07-20T07:01:15Z) - Unsupervised Speech Representation Learning for Behavior Modeling using
Triplet Enhanced Contextualized Networks [28.957236790411585]
本研究では,対話における人間の行動の定常的特性を利用して,音声から行動情報を抽出する表現学習手法を提案する。
本稿では,エンコーダ・デコーダをベースとしたDeep Contextualized Network (DCN) と,動作コンテキストをキャプチャするTriplet-Enhanced DCN (TE-DCN) フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-01T22:44:23Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - Inferring Temporal Compositions of Actions Using Probabilistic Automata [61.09176771931052]
本稿では,動作の時間的構成を意味正規表現として表現し,確率的オートマトンを用いた推論フレームワークを提案する。
我々のアプローチは、長い範囲の複雑なアクティビティを、順序のないアトミックアクションのセットとして予測するか、自然言語文を使ってビデオを取得するという既存の研究とは異なる。
論文 参考訳(メタデータ) (2020-04-28T00:15:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。