論文の概要: $2 * n$ is better than $n^2$: Decomposing Event Coreference Resolution
into Two Tractable Problems
- arxiv url: http://arxiv.org/abs/2305.05672v1
- Date: Tue, 9 May 2023 05:33:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-11 15:41:33.617749
- Title: $2 * n$ is better than $n^2$: Decomposing Event Coreference Resolution
into Two Tractable Problems
- Title(参考訳): 2 * n$は$n^2$より優れている:イベントコリファレンスの解決を2つの扱いやすい問題に分解する
- Authors: Shafiuddin Rehan Ahmed, Abhijnan Nath, James H. Martin, Nikhil
Krishnaswamy
- Abstract要約: イベント参照解決(ECR)は、ドキュメント内またはドキュメント間で同じイベントの参照をリンクするタスクである。
2つの人気のあるECRデータセットで、アートの状況に匹敵する結果が得られることを示す。
また、コアフェレントまたは非コアフェレントを正確に分類するために、"ハード"な参照ペアも分析します。
- 参考スコア(独自算出の注目度): 3.777476692151661
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event Coreference Resolution (ECR) is the task of linking mentions of the
same event either within or across documents. Most mention pairs are not
coreferent, yet many that are coreferent can be identified through simple
techniques such as lemma matching of the event triggers or the sentences in
which they appear. Existing methods for training coreference systems sample
from a largely skewed distribution, making it difficult for the algorithm to
learn coreference beyond surface matching. Additionally, these methods are
intractable because of the quadratic operations needed. To address these
challenges, we break the problem of ECR into two parts: a) a heuristic to
efficiently filter out a large number of non-coreferent pairs, and b) a
training approach on a balanced set of coreferent and non-coreferent mention
pairs. By following this approach, we show that we get comparable results to
the state of the art on two popular ECR datasets while significantly reducing
compute requirements. We also analyze the mention pairs that are "hard" to
accurately classify as coreferent or non-coreferent. Code at
https://github.com/ahmeshaf/lemma_ce_coref
- Abstract(参考訳): イベント参照解決(ECR)は、ドキュメント内またはドキュメント間で同じイベントの参照をリンクするタスクである。
ほとんどの参照ペアはコアフェレントではないが、コアフェレントであるものの多くは、イベントトリガーのレムママッチングやそれらが現れる文のような単純なテクニックによって識別することができる。
既存のコリファレンスシステムのトレーニング方法は、ほとんど歪んだ分布からサンプルを採取するので、アルゴリズムが表面マッチングを超えてコリファレンスを学ぶことは困難である。
さらに、これらの方法は二次演算が必要なため難解である。
これらの課題に対処するため、私たちはECRの問題を2つに分けました。
a)多数の非干渉対を効率的にフィルターするヒューリスティック,及び
b) コアフェレント及び非コアフェレント参照ペアのバランスの取れたセットに対するトレーニングアプローチ
このアプローチに従うことで、計算要求を大幅に削減しつつ、2つの人気のあるECRデータセット上で、最先端の成果が得られることを示す。
また,coreferent または non-coreferent と正確に分類するために "hard" である参照ペアも分析する。
コード: https://github.com/ahmeshaf/lemma_ce_coref
関連論文リスト
- Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [65.8915778873691]
条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しい学習パラダイムを提案する。
我々のアプローチはまた、興味深いことに逆エントロピー最適輸送(OT)と結びついている。
論文 参考訳(メタデータ) (2024-10-03T16:12:59Z) - Semisupervised score based matching algorithm to evaluate the effect of public health interventions [3.221788913179251]
1対1のマッチングアルゴリズムでは、マッチする多数の"ペア"は、大きなサンプルからの情報と多数のタスクの両方を意味する可能性がある。
本稿では,2次スコア関数 $S_beta(x_i,x_j)= betaT (x_i-x_j)(x_i-x_j)T beta$ に基づく新しい1対1マッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-19T02:24:16Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - On the Sample Complexity of Representation Learning in Multi-task
Bandits with Global and Local structure [77.60508571062958]
マルチタスク・バンディット問題に対する最適アーム学習の複雑さについて検討した。
アームは2つのコンポーネントで構成されます。1つはタスク間で共有され(表現と呼ばれます)、もう1つはタスク固有のもの(予測器と呼ばれます)です。
サンプルの複雑さが下界に近づき、最大で$H(Glog(delta_G)+ Xlog(delta_H))$でスケールするアルゴリズムOSRL-SCを考案する。
論文 参考訳(メタデータ) (2022-11-28T08:40:12Z) - Efficient Nearest Neighbor Search for Cross-Encoder Models using Matrix
Factorization [60.91600465922932]
本稿では,クロスエンコーダのみに頼って,二重エンコーダによる検索を回避する手法を提案する。
我々のアプローチは、現在の広く使われている方法よりも優れたテスト時間リコール-vs計算コストトレードオフを提供する。
論文 参考訳(メタデータ) (2022-10-23T00:32:04Z) - Contrastive Representation Learning for Cross-Document Coreference
Resolution of Events and Entities [0.0]
コントラスト表現学習を利用したエンティティとイベントのコア参照解決手法を提案する。
本手法は,ECB+コーパスにおける多くの重要な指標について,最先端の結果を得る。
論文 参考訳(メタデータ) (2022-05-23T16:30:20Z) - Deep Probabilistic Graph Matching [72.6690550634166]
本稿では,マッチング制約を伴わずに,元のQAPに適合する深層学習ベースのグラフマッチングフレームワークを提案する。
提案手法は,一般的な3つのベンチマーク(Pascal VOC,Wilow Object,SPair-71k)で評価され,すべてのベンチマークにおいて過去の最先端よりも優れていた。
論文 参考訳(メタデータ) (2022-01-05T13:37:27Z) - Focus on what matters: Applying Discourse Coherence Theory to Cross
Document Coreference [22.497877069528087]
ドキュメント間でのイベントとエンティティのコア参照の解決は、候補参照の数を大幅に増加させ、完全な$n2$ペアワイズ比較を行うことを難しくする。
既存のアプローチでは、ドキュメントクラスタ内でのコア参照のみを考慮することで単純化されているが、クラスタ間のコア参照を処理できない。
我々は、談話コヒーレンス理論の洞察に基づいて、潜在的コア推論は、読者の談話焦点によって制約される。
本手法は,ECB+,ガン・バイオレンス,フットボール・コアス,クロスドメイン・クロスドキュメント・コアス・コーパスにおけるイベントとエンティティの両面での最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-10-11T15:41:47Z) - Linear-Time Gromov Wasserstein Distances using Low Rank Couplings and
Costs [45.87981728307819]
異種空間に居住する関連するデータセットを比較して整列する能力は、機械学習においてますます重要な役割を担っている。
グロモフ・ワッサーシュタイン (Gromov-Wasserstein, GW) 形式主義はこの問題に対処するのに役立つ。
論文 参考訳(メタデータ) (2021-06-02T12:50:56Z) - Learning to Accelerate Heuristic Searching for Large-Scale Maximum
Weighted b-Matching Problems in Online Advertising [51.97494906131859]
バイパルタイトbマッチングはアルゴリズム設計の基本であり、経済市場や労働市場などに広く適用されている。
既存の正確で近似的なアルゴリズムは、通常そのような設定で失敗する。
我々は、以前の事例から学んだ知識を活用して、新しい問題インスタンスを解決するtextttNeuSearcherを提案する。
論文 参考訳(メタデータ) (2020-05-09T02:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。