論文の概要: Semantic Novelty Detection and Characterization in Factual Text
Involving Named Entities
- arxiv url: http://arxiv.org/abs/2210.17440v1
- Date: Mon, 31 Oct 2022 16:11:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 17:17:42.953939
- Title: Semantic Novelty Detection and Characterization in Factual Text
Involving Named Entities
- Title(参考訳): 名前付きエンティティを含む実テキストにおける意味的ノベルティ検出と特徴付け
- Authors: Nianzu Ma, Sahisnu Mazumder, Alexander Politowicz, Bing Liu, Eric
Robertson, Scott Grigsby
- Abstract要約: 既存のトピックベースのノベルティ検出手法は、この問題に対してうまく機能しない。
本稿では,この問題を解決する効果的なモデル(PAT-SND)を提案する。
PAT-SNDは10基線よりも大きなマージンで優れていた。
- 参考スコア(独自算出の注目度): 70.11383563089201
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Much of the existing work on text novelty detection has been studied at the
topic level, i.e., identifying whether the topic of a document or a sentence is
novel or not. Little work has been done at the fine-grained semantic level (or
contextual level). For example, given that we know Elon Musk is the CEO of a
technology company, the sentence "Elon Musk acted in the sitcom The Big Bang
Theory" is novel and surprising because normally a CEO would not be an actor.
Existing topic-based novelty detection methods work poorly on this problem
because they do not perform semantic reasoning involving relations between
named entities in the text and their background knowledge. This paper proposes
an effective model (called PAT-SND) to solve the problem, which can also
characterize the novelty. An annotated dataset is also created. Evaluation
shows that PAT-SND outperforms 10 baselines by large margins.
- Abstract(参考訳): テキストの新規性検出に関する既存の研究の多くは、トピックレベルで研究されている。
細かな意味レベル(あるいは文脈レベルでの作業はほとんど行われていません。
例えば、イーロン・マスクがテクノロジー企業のCEOであることを考えると、「エロン・マスクがシットコム『ビッグバン理論』で演じた」という文は、普通はCEOが俳優にならないので、新しく驚きます。
既存のトピックに基づくノベルティ検出手法は,テキスト中の名前付きエンティティとその背景知識の関係に関する意味的推論を行なわないため,この問題には不十分である。
本稿では,この問題を解決するための効果的なモデル(PAT-SND)を提案する。
注釈付きデータセットも作成される。
PAT-SNDは10基線よりも大きなマージンで優れていた。
関連論文リスト
- Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Revisiting the Roles of "Text" in Text Games [102.22750109468652]
本稿では,強化学習におけるテキストの役割について検討する。
本稿では,関連するコンテキスト情報を近似状態ハッシュに抽出する簡単な手法を提案する。
このような軽量なプラグインは最先端のテキストエージェントとの競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T21:52:39Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - CiteWorth: Cite-Worthiness Detection for Improved Scientific Document
Understanding [23.930041685595775]
本研究は,文が外部ソースを引用するか否かをラベル付けした英語における引用親和性検出の詳細な研究である。
CiteWorthは高品質で、挑戦的で、ドメイン適応のような問題の研究に適している。
論文 参考訳(メタデータ) (2021-05-23T11:08:45Z) - Word-level Human Interpretable Scoring Mechanism for Novel Text
Detection Using Tsetlin Machines [16.457778420360537]
新規性への貢献度に応じて個々の単語を評価するためのTsetlin マシンアーキテクチャを提案する。
本手法はtm節で捉えた言語パターンを用いて,新しい文書の記述を符号化する。
次に、この記述を採用し、単語がドキュメントの新規作成にどれだけ貢献しているかを測定します。
論文 参考訳(メタデータ) (2021-05-10T23:41:14Z) - My Teacher Thinks The World Is Flat! Interpreting Automatic Essay
Scoring Mechanism [71.34160809068996]
最近の研究では、自動スコアリングシステムが常識的な敵対的サンプルになりやすいことが示されています。
近年の解釈能力の進歩を活かし,コヒーレンスやコンテント,関連性といった特徴がスコアリングの自動化にどの程度重要であるかを見出す。
また、モデルが意味的に世界知識や常識に基づかないことから、世界のような虚偽の事実を追加することは、それを減らすよりもむしろスコアを増加させる。
論文 参考訳(メタデータ) (2020-12-27T06:19:20Z) - FAT ALBERT: Finding Answers in Large Texts using Semantic Similarity
Attention Layer based on BERT [0.5772546394254112]
本研究では,最先端の変圧器ネットワークであるBERTをベースとしたモデルを構築した。
私たちは、テスト精度87.79%のリーダーボードで第1位にランクされています。
論文 参考訳(メタデータ) (2020-08-22T08:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。