論文の概要: A Novel Two-stage Framework for Extracting Opinionated Sentences from
News Articles
- arxiv url: http://arxiv.org/abs/2101.09743v1
- Date: Sun, 24 Jan 2021 16:24:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 09:15:22.443185
- Title: A Novel Two-stage Framework for Extracting Opinionated Sentences from
News Articles
- Title(参考訳): ニュース記事から意見文を抽出するための新しい二段階枠組み
- Authors: Rajkumar Pujari and Swara Desai and Niloy Ganguly and Pawan Goyal
- Abstract要約: 本稿では,あるニュース記事から意見文を抽出する新しい2段階の枠組みを提案する。
最初の段階では、ローカル機能を利用してNaive Bayes分類器が各文にスコアを割り当てます。
第2段階では、HITS(Hyperlink-Induced Topic Search)スキーマ内でこの前もって、記事のグローバル構造を利用しています。
- 参考スコア(独自算出の注目度): 24.528177249269582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel two-stage framework to extract opinionated
sentences from a given news article. In the first stage, Naive Bayes classifier
by utilizing the local features assigns a score to each sentence - the score
signifies the probability of the sentence to be opinionated. In the second
stage, we use this prior within the HITS (Hyperlink-Induced Topic Search)
schema to exploit the global structure of the article and relation between the
sentences. In the HITS schema, the opinionated sentences are treated as Hubs
and the facts around these opinions are treated as the Authorities. The
algorithm is implemented and evaluated against a set of manually marked data.
We show that using HITS significantly improves the precision over the baseline
Naive Bayes classifier. We also argue that the proposed method actually
discovers the underlying structure of the article, thus extracting various
opinions, grouped with supporting facts as well as other supporting opinions
from the article.
- Abstract(参考訳): 本稿では,あるニュース記事から意見文を抽出する新しい2段階の枠組みを提案する。
第1段階では、局所的な特徴を利用したネイブベイズ分類器が各文にスコアを割り当て、スコアは意見される文の確率を示す。
第2段階では、HITS(Hyperlink-Induced Topic Search)スキーマ内で、記事のグローバル構造と文間の関係を利用するために、この前もってこれを使用します。
HITSスキーマでは、意見文はハブとして扱われ、これらの意見に関する事実は権威として扱われる。
アルゴリズムは手動でマークされたデータの集合に対して実装され評価される。
HITSを用いることで,ベースラインのNaive Bayes分類器の精度が大幅に向上することを示す。
また,提案手法は,本論文の基盤となる構造を実際に発見し,支援事実と他の支援意見とをまとめて,様々な意見を取り出すものであることも議論する。
関連論文リスト
- Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - Incremental Extractive Opinion Summarization Using Cover Trees [81.59625423421355]
オンラインマーケットプレースでは、ユーザレビューは時間とともに蓄積され、意見要約を定期的に更新する必要がある。
本研究では,漸進的な環境下での抽出的意見要約の課題について検討する。
本稿では,CentroidRankの要約をインクリメンタルな設定で正確に計算するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-16T02:00:17Z) - Content Significance Distribution of Sub-Text Blocks in Articles and Its Application to Article-Organization Assessment [3.2245324254437846]
サブテキストブロックのコンテンツ重要度分布(CSD)の概念を定式化する。
特に,Hugging FaceのSentence Transformerを利用して文脈文の埋め込みを生成する。
近似 CSD-1 は正確な CSD-1 とほぼ同一であることを示す。
論文 参考訳(メタデータ) (2023-11-03T02:43:51Z) - RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Assessing Effectiveness of Using Internal Signals for Check-Worthy Claim
Identification in Unlabeled Data for Automated Fact-Checking [6.193231258199234]
本稿では,偽ニュース記事からチェック価値のあるクレーム文を特定する手法について検討する。
我々は2つの内部監督信号(見出しと抽象的な要約)を利用して文をランク付けする。
見出しは、ファクトチェックのWebサイトがクレームを記述する方法とよく似ているが、要約ベースのパイプラインは、エンドツーエンドのファクトチェックシステムにとって最も有望である。
論文 参考訳(メタデータ) (2021-11-02T16:17:20Z) - Fine-Grained Opinion Summarization with Minimal Supervision [48.43506393052212]
FineSumは、複数のドキュメントから意見を抽出することでターゲットをプロファイルすることを目的としている。
FineSumは、生のコーパスから意見語句を自動的に識別し、異なる側面と感情に分類し、各アスペクト/感覚の下に複数のきめ細かい意見クラスタを構築する。
ベンチマークの自動評価と定量的人的評価の両方が,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-10-17T15:16:34Z) - Text Summarization of Czech News Articles Using Named Entities [0.0]
我々はチェコのニュース記事の要約に名前付きエンティティが与える影響に注目した。
本論文では, 実体と生成されたサマリ間の名前付きエンティティの重なりを計測する新しいメトリック ROUGE_NE を提案する。
要約システムが高いスコアに達することは依然として困難であることを示す。
論文 参考訳(メタデータ) (2021-04-21T10:48:14Z) - ReSCo-CC: Unsupervised Identification of Key Disinformation Sentences [3.7405995078130148]
本稿では,信頼できない文書に含まれる重要な偽情報を含む文を識別する新規な教師なしタスクを提案する。
そこで我々は,まず,タスク用に設計された特徴空間内に文を埋め込むことから始まる,3段階の統計的NLPソリューションを設計する。
本手法は, コア情報の同定を効果的に行うことができることを示す。
論文 参考訳(メタデータ) (2020-10-21T08:53:36Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。