論文の概要: WikiContradiction: Detecting Self-Contradiction Articles on Wikipedia
- arxiv url: http://arxiv.org/abs/2111.08543v1
- Date: Tue, 16 Nov 2021 15:12:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 14:05:52.364807
- Title: WikiContradiction: Detecting Self-Contradiction Articles on Wikipedia
- Title(参考訳): WikiContradiction: Wikipediaにおける自己矛盾記事の検出
- Authors: Cheng Hsu, Cheng-Te Li, Diego Saez-Trumper, Yi-Zhan Hsu
- Abstract要約: ウィキペディアで自己比較記事を検出するタスクを提案する。
自己コントラクトリー」テンプレートに基づいて、自己コントラクション検出タスクのための新しいデータセットを作成する。
提案する最初のモデルであるPairwise Contradiction Neural Network (PCNN) は,自己矛盾項目を効果的に識別するだけでなく,矛盾文の最も矛盾するペアを強調している。
- 参考スコア(独自算出の注目度): 8.755487474723994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Wikipedia has been utilized for fact-checking and claim verification to
debunk misinformation and disinformation, it is essential to either improve
article quality and rule out noisy articles. Self-contradiction is one of the
low-quality article types in Wikipedia. In this work, we propose a task of
detecting self-contradiction articles in Wikipedia. Based on the
"self-contradictory" template, we create a novel dataset for the
self-contradiction detection task. Conventional contradiction detection focuses
on comparing pairs of sentences or claims, but self-contradiction detection
needs to further reason the semantics of an article and simultaneously learn
the contradiction-aware comparison from all pairs of sentences. Therefore, we
present the first model, Pairwise Contradiction Neural Network (PCNN), to not
only effectively identify self-contradiction articles, but also highlight the
most contradiction pairs of contradiction sentences. The main idea of PCNN is
two-fold. First, to mitigate the effect of data scarcity on self-contradiction
articles, we pre-train the module of pairwise contradiction learning using SNLI
and MNLI benchmarks. Second, we select top-K sentence pairs with the highest
contradiction probability values and model their correlation to determine
whether the corresponding article belongs to self-contradiction. Experiments
conducted on the proposed WikiContradiction dataset exhibit that PCNN can
generate promising performance and comprehensively highlight the sentence pairs
the contradiction locates.
- Abstract(参考訳): ウィキペディアは事実確認やクレーム検証で誤情報や偽情報の排除に利用されてきたが、記事の品質を改善し、ノイズの多い記事を除外することが不可欠である。
自己矛盾はウィキペディアの低品質記事タイプの一つである。
本研究では,ウィキペディアにおける自己矛盾記事の検出課題を提案する。
自己矛盾」テンプレートに基づいて、自己矛盾検出タスクのための新しいデータセットを作成する。
従来の矛盾検出は、文の対やクレームを比較することに重点を置いているが、自己矛盾検出は、記事の意味を更に推論し、すべての文から矛盾認識比較を同時に学ぶ必要がある。
そこで本研究では,第1モデルであるペアワイズ・コンフリクション・ニューラル・ネットワーク(pcnn)を提案する。
PCNNの主な考え方は2つある。
まず,データ不足が自己矛盾記事に与える影響を緩和するために,snli と mnli ベンチマークを用いて対矛盾学習のモジュールを事前学習する。
第2に、最も矛盾する確率値を持つトップk文対を選択し、それらの相関をモデル化し、対応する記事が自己矛盾に属するかどうかを判断する。
提案したWikiContradictionデータセットの実験では、PCNNは有望な性能を生み出すことができ、矛盾する箇所の文対を包括的にハイライトすることができる。
関連論文リスト
- Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。
そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - Generating Prototypes for Contradiction Detection Using Large Language
Models and Linguistic Rules [1.6497679785422956]
矛盾検出のための新しいデータ生成手法を提案する。
我々は生成モデルに、特定の矛盾型の記述に関して矛盾するステートメントを作成するよう指示する。
補助的なアプローチとして、単純な矛盾を構築するために言語規則を用いる。
論文 参考訳(メタデータ) (2023-10-23T09:07:27Z) - Self-contradictory Hallucinations of Large Language Models: Evaluation, Detection and Mitigation [5.043563227694139]
大規模な言語モデル(より大きなLM)は、幻覚的内容を含むテキストを生成できる。
各種の命令調整型LMの自己コントラクションに関する包括的調査を行う。
本稿では,自己矛盾を効果的に検出・緩和する新しいプロンプトベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-25T08:43:46Z) - CDConv: A Benchmark for Contradiction Detection in Chinese Conversations [74.78715797366395]
本稿では,中国会話におけるコントラクション検出のベンチマーク,すなわちCDConvを提案する。
12Kのマルチターン会話に3つの典型的な矛盾カテゴリ(文内コントラクション、ロールコンフュージョン、ヒストリーコントラクション)をアノテートする。
論文 参考訳(メタデータ) (2022-10-16T11:37:09Z) - Improving Bot Response Contradiction Detection via Utterance Rewriting [45.55560596440624]
本研究の目的は,すべてのボット発話を書き換えて,先行詞やエリプシを復元することで,矛盾検出を改善することである。
我々はこのモデルがボット発話をより完璧にするために十分な書き直しを生成できることを実証的に実証した。
書き直された発話を使用することで、AUPRとジョイント精度スコア(証拠とともに矛盾を検出する)がそれぞれ6.5%と4.5%向上するなど、矛盾検出性能が大幅に向上する。
論文 参考訳(メタデータ) (2022-07-25T00:54:30Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - ADC: Adversarial attacks against object Detection that evade Context
consistency checks [55.8459119462263]
文脈整合性チェックさえも、適切に構築された敵の例に対して脆弱であることを示す。
このような防御を覆す実例を生成するための適応型フレームワークを提案する。
我々の結果は、コンテキストを堅牢にモデル化し、一貫性をチェックする方法はまだ未解決の問題であることを示している。
論文 参考訳(メタデータ) (2021-10-24T00:25:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。