論文の概要: Joint Entity and Relation Extraction with Set Prediction Networks
- arxiv url: http://arxiv.org/abs/2011.01675v2
- Date: Thu, 5 Nov 2020 12:47:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 04:53:31.454526
- Title: Joint Entity and Relation Extraction with Set Prediction Networks
- Title(参考訳): 集合予測ネットワークを用いた結合エンティティと関係抽出
- Authors: Dianbo Sui, Yubo Chen, Kang Liu, Jun Zhao, Xiangrong Zeng, Shengping
Liu
- Abstract要約: 我々は,結合実体と関係抽出を直接セット予測問題として扱う。
一定の順序で三重項を一つずつ生成する自己回帰アプローチとは異なり、提案したネットワークは1ショットで三重項の最終セットを直接出力する。
2つのベンチマークデータセットによる実験により,提案モデルが現在の最先端手法よりも大幅に優れていることが示された。
- 参考スコア(独自算出の注目度): 24.01964730210045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The joint entity and relation extraction task aims to extract all relational
triples from a sentence. In essence, the relational triples contained in a
sentence are unordered. However, previous seq2seq based models require to
convert the set of triples into a sequence in the training phase. To break this
bottleneck, we treat joint entity and relation extraction as a direct set
prediction problem, so that the extraction model can get rid of the burden of
predicting the order of multiple triples. To solve this set prediction problem,
we propose networks featured by transformers with non-autoregressive parallel
decoding. Unlike autoregressive approaches that generate triples one by one in
a certain order, the proposed networks directly output the final set of triples
in one shot. Furthermore, we also design a set-based loss that forces unique
predictions via bipartite matching. Compared with cross-entropy loss that
highly penalizes small shifts in triple order, the proposed bipartite matching
loss is invariant to any permutation of predictions; thus, it can provide the
proposed networks with a more accurate training signal by ignoring triple order
and focusing on relation types and entities. Experiments on two benchmark
datasets show that our proposed model significantly outperforms current
state-of-the-art methods. Training code and trained models will be available at
http://github.com/DianboWork/SPN4RE.
- Abstract(参考訳): 関係抽出タスクは、文からすべての関係三重項を抽出することを目的としている。
本質的に、文に含まれる関係三重項は非順序である。
しかし、以前のseq2seqベースのモデルは、トレーニングフェーズでトリプルのセットをシーケンスに変換する必要がある。
このボトルネックを解消するため,我々は,結合エンティティと関係抽出を直接集合予測問題として扱い,抽出モデルは複数の三重項の順序を予測する負担を解消できる。
そこで本研究では,非自己回帰並列復号方式のトランスフォーマを特徴とするネットワークを提案する。
一定の順序で三重項を生成する自己回帰アプローチとは異なり、提案したネットワークは1ショットで三重項の最終セットを直接出力する。
さらに,両部マッチングによる一意な予測を強制するセットベース損失も設計する。
三次の小さなシフトを高いペナライズするクロスエントロピー損失と比較すると、提案された二部マッチング損失は予測のあらゆる置換に不変であり、三つの順序を無視し、関係タイプとエンティティに焦点を当てることで、より正確なトレーニング信号を提供することができる。
2つのベンチマークデータセットによる実験により,提案モデルが現在の最先端手法よりも大幅に優れていることが示された。
トレーニングコードとトレーニングされたモデルはhttp://github.com/DianboWork/SPN4REで提供される。
関連論文リスト
- Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - JANA: Jointly Amortized Neural Approximation of Complex Bayesian Models [0.5872014229110214]
難治度関数と後部密度の共振型ニューラル近似(JANA)を提案する。
JANAの忠実度を、最先端のベイズ手法に対して様々なシミュレーションモデルで評価する。
論文 参考訳(メタデータ) (2023-02-17T20:17:21Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - DenseHybrid: Hybrid Anomaly Detection for Dense Open-set Recognition [1.278093617645299]
異常検出は、正規トレーニングデータの生成的モデリングや、負のトレーニングデータに対する識別によって行うことができる。
本稿では,大きな自然画像に対して密集した開集合認識が可能なハイブリッド異常スコアを提案する。
実験では, 標準密度異常検出ベンチマークと, オープンセット性能の新たな指標であるopen-mIoUについて評価した。
論文 参考訳(メタデータ) (2022-07-06T11:48:50Z) - Deep Probabilistic Graph Matching [72.6690550634166]
本稿では,マッチング制約を伴わずに,元のQAPに適合する深層学習ベースのグラフマッチングフレームワークを提案する。
提案手法は,一般的な3つのベンチマーク(Pascal VOC,Wilow Object,SPair-71k)で評価され,すべてのベンチマークにおいて過去の最先端よりも優れていた。
論文 参考訳(メタデータ) (2022-01-05T13:37:27Z) - TDRE: A Tensor Decomposition Based Approach for Relation Extraction [6.726803950083593]
エンティティペアを非構造化テキストから関係型とともに抽出することは、情報抽出の基本的なサブタスクである。
本稿では,まず,各関係型に富んだ単語対の3次テンソルとして,最終三重項抽出結果をモデル化する。
提案手法は,既存の強いベースラインよりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-15T05:29:34Z) - Minimize Exposure Bias of Seq2Seq Models in Joint Entity and Relation
Extraction [57.22929457171352]
共同エンティティと関係抽出は、プレーンテキストから直接関係三重項を抽出することを目的としている。
本稿では、露出バイアスの影響を最小限に抑えるために、新しいSequence-to-Unordered-Multi-Tree(Seq2UMTree)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-16T06:53:34Z) - Contrastive Triple Extraction with Generative Transformer [72.21467482853232]
生成変換器を用いた新しい3重抽出モデルを提案する。
具体的には,エンコーダデコーダをベースとした1つの共有トランスフォーマモジュールを提案する。
忠実な結果を得るために,新しい三重項コントラストトレーニングオブジェクトを提案する。
論文 参考訳(メタデータ) (2020-09-14T05:29:24Z) - Calibrated Adversarial Refinement for Stochastic Semantic Segmentation [5.849736173068868]
本稿では,各予測に関連付けられた確率が,その根拠となる真偽の正しさを反映する,セマンティックマップ上の校正された予測分布を学習するための戦略を提案する。
マルチグレーダのLIDCデータセットと、注入曖昧さのあるCityscapesデータセットに対して、最先端の成果を達成し、アプローチの汎用性と堅牢性を実証する。
本研究は,おもちゃの回帰データセットを用いて実験することにより,校正された予測分布の学習を必要とする他のタスクにコア設計を適用することができることを示す。
論文 参考訳(メタデータ) (2020-06-23T16:39:59Z) - Learn to Predict Sets Using Feed-Forward Neural Networks [63.91494644881925]
本稿では、ディープフィードフォワードニューラルネットワークを用いた設定予測の課題に対処する。
未知の置換と基数を持つ集合を予測するための新しい手法を提案する。
関連視覚問題に対する集合定式化の有効性を実証する。
論文 参考訳(メタデータ) (2020-01-30T01:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。