論文の概要: Author's Sentiment Prediction
- arxiv url: http://arxiv.org/abs/2011.06128v1
- Date: Thu, 12 Nov 2020 00:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 06:23:24.681401
- Title: Author's Sentiment Prediction
- Title(参考訳): 著者の感想予測
- Authors: Mohaddeseh Bastan, Mahnaz Koupaee, Youngseo Son, Richard Sicoli, and
Niranjan Balasubramanian
- Abstract要約: PerSenTは、ニュース記事の主要なエンティティに対して著者が表現した感情のクラウドソースアノテーションのデータセットである。
データセットには段落レベルの感情アノテーションが含まれており、タスクのよりきめ細かい監視を提供する。
我々はこのデータセットを5.3kの文書と38kの段落で公開し、エンティティの感情分析の課題として3.2kのユニークなエンティティをカバーした。
- 参考スコア(独自算出の注目度): 13.459029439420872
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce PerSenT, a dataset of crowd-sourced annotations of the sentiment
expressed by the authors towards the main entities in news articles. The
dataset also includes paragraph-level sentiment annotations to provide more
fine-grained supervision for the task. Our benchmarks of multiple strong
baselines show that this is a difficult classification task. The results also
suggest that simply fine-tuning document-level representations from BERT isn't
adequate for this task. Making paragraph-level decisions and aggregating them
over the entire document is also ineffective. We present empirical and
qualitative analyses that illustrate the specific challenges posed by this
dataset. We release this dataset with 5.3k documents and 38k paragraphs
covering 3.2k unique entities as a challenge in entity sentiment analysis.
- Abstract(参考訳): 著者らがニュース記事のメインエンティティに対して表現した感情のクラウドソースアノテーションのデータセットであるpersentを紹介する。
データセットには段落レベルの感情アノテーションが含まれており、タスクのよりきめ細かい監視を提供する。
複数のベースラインのベンチマークは、これは難しい分類課題であることを示している。
また、bertによる文書レベルの表現の微調整は、このタスクには不十分であることが示唆された。
文書全体に対する段落レベルの決定や集約も有効ではない。
このデータセットによって引き起こされる特定の課題を説明する実証的・定性的な分析を行う。
我々はこのデータセットを5.3k文書と38k段落で公開し、エンティティ感情分析の課題として3.2kユニークなエンティティをカバーした。
関連論文リスト
- Rethinking the Evaluation of Pre-trained Text-and-Layout Models from an
Entity-Centric Perspective [15.222536348615087]
EC-FUNSDは、視覚的にリッチなドキュメント上での意味的エンティティ認識とエンティティリンクを評価するために設計されたエンティティ中心のベックマークである。
このデータセットには、ドキュメントレイアウトのさまざまなフォーマットと、セマンティック駆動エンティティとその関連性のアノテーションが含まれている。
実験結果から,最新のPTLMは,データセットバイアスを除去すると性能が急激に低下するため,ベンチマークに過度に適合する傾向を示した。
論文 参考訳(メタデータ) (2024-02-04T07:33:45Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - Document-Level Supervision for Multi-Aspect Sentiment Analysis Without
Fine-grained Labels [14.187425779776204]
本稿では,文書レベルの監視を用いてABSAを実行するVAEベースのトピックモデリング手法を提案する。
この手法により、文書内の複数の側面を検知し、複数の側面を通して表現された感情がどのように集まって、観察可能な文書レベルの感情を形成するのかを推論することが可能になる。
論文 参考訳(メタデータ) (2023-10-10T18:53:21Z) - Entity-Level Sentiment Analysis (ELSA): An exploratory task survey [2.191505742658975]
本稿は、文書中の自発的な実体に対して表される全体的感情を識別するタスクについて考察する。
我々のデータセットの感情は、対象として言及されるエンティティだけでなく、自発的なエンティティと感情関連のあるターゲットにも表現されている。
論文 参考訳(メタデータ) (2023-04-27T15:01:20Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Document-Level Relation Extraction with Sentences Importance Estimation
and Focusing [52.069206266557266]
文書レベルの関係抽出(DocRE)は、複数の文の文書から2つのエンティティ間の関係を決定することを目的としている。
我々はDocREのための文重要度スコアと文集中損失を設計するSIEF(Sentence Estimation and Focusing)フレームワークを提案する。
2つのドメインの実験結果から、SIEFは全体的なパフォーマンスを改善するだけでなく、DocREモデルをより堅牢にします。
論文 参考訳(メタデータ) (2022-04-27T03:20:07Z) - Augmenting Document Representations for Dense Retrieval with
Interpolation and Perturbation [49.940525611640346]
ドキュメント拡張(Document Augmentation for dense Retrieval)フレームワークは、ドキュメントの表現をDense Augmentationとperturbationsで強化する。
2つのベンチマークデータセットによる検索タスクにおけるDARの性能評価を行い、ラベル付き文書とラベルなし文書の密集検索において、提案したDARが関連するベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-03-15T09:07:38Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - YASO: A New Benchmark for Targeted Sentiment Analysis [12.60266470026856]
YASO - クラウドソースによる新たなTSA評価データセット。
データセットには、映画、ビジネス、製品レビューからの2,215の英語文と、7,415の単語とそれらの感情が含まれている。
分析はアノテーションの信頼性を検証し,収集したデータの特徴について検討する。
論文 参考訳(メタデータ) (2020-12-29T00:25:15Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。