論文の概要: Generating Diversified Comments via Reader-Aware Topic Modeling and
Saliency Detection
- arxiv url: http://arxiv.org/abs/2102.06856v1
- Date: Sat, 13 Feb 2021 03:50:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:51:53.668155
- Title: Generating Diversified Comments via Reader-Aware Topic Modeling and
Saliency Detection
- Title(参考訳): Reader-Aware Topic ModelingとSaliency Detectionによる多様なコメント生成
- Authors: Wei Wang, Piji Li, Hai-Tao Zheng
- Abstract要約: 生成したコメントの質を高めるために,読者が認識するトピックモデリングとサリエンシー情報検出フレームワークを提案する。
読者対応トピックモデリングのために,読者コメントからの潜在意味学習と話題マイニングのための変分生成クラスタリングアルゴリズムを設計した。
サリエンシー情報検出のために、ニュースコンテンツを推定してサリエンシー情報を選択するBernoulli分布について紹介します。
- 参考スコア(独自算出の注目度): 25.16392119801612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic comment generation is a special and challenging task to verify the
model ability on news content comprehension and language generation. Comments
not only convey salient and interesting information in news articles, but also
imply various and different reader characteristics which we treat as the
essential clues for diversity. However, most of the comment generation
approaches only focus on saliency information extraction, while the
reader-aware factors implied by comments are neglected. To address this issue,
we propose a unified reader-aware topic modeling and saliency information
detection framework to enhance the quality of generated comments. For
reader-aware topic modeling, we design a variational generative clustering
algorithm for latent semantic learning and topic mining from reader comments.
For saliency information detection, we introduce Bernoulli distribution
estimating on news content to select saliency information. The obtained topic
representations as well as the selected saliency information are incorporated
into the decoder to generate diversified and informative comments. Experimental
results on three datasets show that our framework outperforms existing baseline
methods in terms of both automatic metrics and human evaluation. The potential
ethical issues are also discussed in detail.
- Abstract(参考訳): 自動コメント生成は、ニュースコンテンツ理解と言語生成におけるモデルの能力を検証するための特別な課題である。
コメントは、ニュース記事に有意義で興味深い情報を伝えるだけでなく、多様性の基本的な手がかりとして扱う様々な読者特性を暗示している。
しかし,コメント生成手法のほとんどでは,満足度情報抽出のみに焦点が当てられているが,コメントによって示唆される読者認識要因は無視されている。
この問題に対処するため,我々は,生成したコメントの品質を向上させるために,読者認識型トピックモデリングとサリエンシー情報検出フレームワークを提案する。
読者対応トピックモデリングのために,読者コメントからの潜在意味学習と話題マイニングのための変分生成クラスタリングアルゴリズムを設計した。
サリエンシー情報検出のために、ニュースコンテンツを推定してサリエンシー情報を選択するBernoulli分布について紹介します。
得られたトピック表現および選択されたサリエンシー情報はデコーダに組み込まれ、多種多様で有益なコメントを生成する。
3つのデータセットの実験結果から,本フレームワークは,自動メトリックとヒューマン評価の両面で既存のベースラインメソッドを上回っていることが示された。
潜在的な倫理的問題も詳細に議論されている。
関連論文リスト
- Multi-Review Fusion-in-Context [20.681734117825822]
接地テキスト生成には、コンテンツ選択とコンテンツ統合の両方が必要である。
最近の研究で、各ステップごとに別々のコンポーネントを持つモジュラーアプローチが提案されている。
本研究は,マルチドキュメント・セッティングにおけるモジュール・テキスト・ジェネレーションのさらなる探求の基盤となるものである。
論文 参考訳(メタデータ) (2024-03-22T17:06:05Z) - Topic Modelling: Going Beyond Token Outputs [3.072340427031969]
本稿では、従来のトピックモデリング手法の出力を孤立トークンのリストを超えて拡張する新しいアプローチを提案する。
従来のトピックモデリング手法と比較して提案した出力の解釈可能性を測定するため、独立アノテータは各出力を手動で評価した。
論文 参考訳(メタデータ) (2024-01-16T16:05:54Z) - JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。
公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文 参考訳(メタデータ) (2023-11-07T18:36:16Z) - Discord Questions: A Computational Approach To Diversity Analysis in
News Coverage [84.55145223950427]
本稿では,情報源の違いを識別し,ニュース報道の多様性を理解する上で,読者を支援する新しい枠組みを提案する。
このフレームワークはDiscord Questionsの生成に基づいている。
論文 参考訳(メタデータ) (2022-11-09T16:37:55Z) - Not All Comments are Equal: Insights into Comment Moderation from a
Topic-Aware Model [8.28576076054666]
トピックモデルからのセマンティックな特徴を分類決定に取り入れ、トピック認識モデルを作成する。
この結果から,トピック情報はモデルの性能を改善し,正しい出力に対する信頼性を高め,モデルの出力を理解する上で有効であることがわかった。
論文 参考訳(メタデータ) (2021-09-21T08:57:17Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Generating Pertinent and Diversified Comments with Topic-aware
Pointer-Generator Networks [5.046104800241757]
topic-aware Pointer-Generator Networks (TPGN) に基づく新しい生成モデルを提案する。
記事中の話題情報をキャプチャするためのキーワードレベルおよびトピックレベルのエンコーダアテンション機構を設計する。
トピック情報をポインタジェネレータネットワークに統合し、コメント生成をガイドする。
論文 参考訳(メタデータ) (2020-05-09T09:04:09Z) - Exploring Explainable Selection to Control Abstractive Summarization [51.74889133688111]
説明可能性を重視した新しいフレームワークを開発する。
新しいペアワイズ行列は、文の相互作用、中心性、属性スコアをキャプチャする。
コンストラクタ内の文分割アテンション機構は、最終要約が所望のコンテンツを強調することを保証する。
論文 参考訳(メタデータ) (2020-04-24T14:39:34Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z) - ORB: An Open Reading Benchmark for Comprehensive Evaluation of Machine
Reading Comprehension [53.037401638264235]
我々は,7種類の読解データセットの性能を報告する評価サーバORBを提案する。
評価サーバは、モデルのトレーニング方法に制限を課さないため、トレーニングパラダイムや表現学習の探索に適したテストベッドである。
論文 参考訳(メタデータ) (2019-12-29T07:27:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。