論文の概要: Enhancing Topic Extraction in Recommender Systems with Entropy
Regularization
- arxiv url: http://arxiv.org/abs/2306.07403v1
- Date: Mon, 12 Jun 2023 20:05:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 15:58:54.043846
- Title: Enhancing Topic Extraction in Recommender Systems with Entropy
Regularization
- Title(参考訳): エントロピー規則付きレコメンダシステムにおけるトピック抽出の強化
- Authors: Xuefei Jiang, Dairui Liu, Ruihai Dong
- Abstract要約: 本稿では,レコメンデータシステムの低説明可能性問題に対処するため,エントロピー正規化と呼ばれる新しい手法を提案する。
実験の結果,単語埋め込みにおけるコサイン類似性によって定量化され,トピックコヒーレンスが著しく向上したことが示された。
- 参考スコア(独自算出の注目度): 2.7286395031146062
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, many recommender systems have utilized textual data for
topic extraction to enhance interpretability. However, our findings reveal a
noticeable deficiency in the coherence of keywords within topics, resulting in
low explainability of the model. This paper introduces a novel approach called
entropy regularization to address the issue, leading to more interpretable
topics extracted from recommender systems, while ensuring that the performance
of the primary task stays competitively strong. The effectiveness of the
strategy is validated through experiments on a variation of the probabilistic
matrix factorization model that utilizes textual data to extract item
embeddings. The experiment results show a significant improvement in topic
coherence, which is quantified by cosine similarity on word embeddings.
- Abstract(参考訳): 近年、多くのレコメンダシステムがトピック抽出にテキストデータを利用して解釈性を高めている。
しかし,本研究の結果から,話題内のキーワードのコヒーレンスに顕著な欠陥がみられ,その説明可能性も低かった。
本稿では,この問題に対処するエントロピー正則化(entropy regularization)と呼ばれる新しい手法を導入する。
この戦略の有効性は、テキストデータを用いて項目埋め込みを抽出する確率行列分解モデルのバリエーションに関する実験を通じて検証される。
実験の結果,単語埋め込みにおけるコサイン類似度によって定量化されるトピックコヒーレンスが著しく改善した。
関連論文リスト
- From Words to Worth: Newborn Article Impact Prediction with LLM [69.41680520058418]
本稿は,LLMの微調整機能を活用して,新たな記事の今後の影響を予測する,有望なアプローチを提案する。
LLMを微調整するための包括的なデータセットが構築されリリースされ、対応するタイトル、抽象化、TLCSI_SPを含む12,000以上のエントリが含まれている。
論文 参考訳(メタデータ) (2024-08-07T17:52:02Z) - Coherent Entity Disambiguation via Modeling Topic and Categorical
Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。
本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。
我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-11-06T16:40:13Z) - Topic-DPR: Topic-based Prompts for Dense Passage Retrieval [6.265789210037749]
トピックベースのプロンプトを用いた高密度経路探索モデルであるTopic-DPRを提案する。
本稿では, 半構造化データを利用して高密度検索効率を向上させる, 新規な正負サンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-10-10T13:45:24Z) - Boosting Event Extraction with Denoised Structure-to-Text Augmentation [52.21703002404442]
イベント抽出は、テキストから事前に定義されたイベントトリガと引数を認識することを目的としている。
最近のデータ拡張手法は文法的誤りの問題を無視することが多い。
本稿では,イベント抽出DAEEのための記述構造からテキストへの拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-16T16:52:07Z) - Extractive Summarization via ChatGPT for Faithful Summary Generation [12.966825834765814]
本稿では,抽出要約におけるChatGPTの性能について,徹底的に評価する。
また,ChatGPTは既存の教師付きシステムと比較して,ROUGEスコアにおいて劣る抽出総和性能を示した。
ChatGPTを用いた抽出列生成パイプラインの適用は、要約忠実度の観点から抽象的ベースラインよりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2023-04-09T08:26:04Z) - A New Sentence Extraction Strategy for Unsupervised Extractive
Summarization Methods [26.326800624948344]
本稿では,情報理論の観点から,抽出テキスト要約手法の課題をモデル化する。
特徴分布の改善と要約文の相互情報の低減を目的として,新たな文抽出手法を提案する。
論文 参考訳(メタデータ) (2021-12-06T18:00:02Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Obtaining Better Static Word Embeddings Using Contextual Embedding
Models [53.86080627007695]
提案手法はCBOWをベースとした簡易な蒸留法である。
副作用として、我々の手法は文脈的および静的な埋め込みの公正な比較を可能にする。
論文 参考訳(メタデータ) (2021-06-08T12:59:32Z) - Experiments in Extractive Summarization: Integer Linear Programming,
Term/Sentence Scoring, and Title-driven Models [1.3286165491120467]
我々は,新たなフレームワークであるNewsSummについて述べる。このフレームワークには,ILPやタイトル駆動アプローチを含む,要約のための既存および新しいアプローチが多数含まれている。
本稿では,新しいタイトル駆動型リダクションのアイデアが,教師なしアプローチと教師なしアプローチの両方において,性能の向上につながることを示す。
論文 参考訳(メタデータ) (2020-08-01T01:05:55Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z) - Heavy-tailed Representations, Text Polarity Classification & Data
Augmentation [11.624944730002298]
所望の正則性を持つ重み付き埋め込みを学習するための新しい手法を開発した。
提案した埋め込みの尾部専用の分類器が得られ、性能がベースラインを上回っている。
合成および実テキストデータに関する数値実験により,提案手法の妥当性が示された。
論文 参考訳(メタデータ) (2020-03-25T19:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。