論文の概要: Finding Influential Instances for Distantly Supervised Relation
Extraction
- arxiv url: http://arxiv.org/abs/2009.09841v2
- Date: Tue, 25 Jan 2022 16:07:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 07:58:40.880483
- Title: Finding Influential Instances for Distantly Supervised Relation
Extraction
- Title(参考訳): 遠隔監視型関係抽出のためのインフルエンシャル・インスタンスの探索
- Authors: Zifeng Wang, Rui Wen, Xi Chen, Shao-Lun Huang, Ningyu Zhang, Yefeng
Zheng
- Abstract要約: 本研究は、影響関数(IF)による距離監視(DS)のための新しいモデル非依存型インスタンスサンプリング法を提案する。
提案手法は、IFに基づいてバッグ内の好ましくない/好ましくないインスタンスを特定し、次に動的インスタンスサンプリングを行う。
実験の結果、REIFは複雑なアーキテクチャを持つ一連のベースラインに勝てることがわかった。
- 参考スコア(独自算出の注目度): 42.94953922808431
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distant supervision (DS) is a strong way to expand the datasets for enhancing
relation extraction (RE) models but often suffers from high label noise.
Current works based on attention, reinforcement learning, or GAN are black-box
models so they neither provide meaningful interpretation of sample selection in
DS nor stability on different domains. On the contrary, this work proposes a
novel model-agnostic instance sampling method for DS by influence function
(IF), namely REIF. Our method identifies favorable/unfavorable instances in the
bag based on IF, then does dynamic instance sampling. We design a fast
influence sampling algorithm that reduces the computational complexity from
$\mathcal{O}(mn)$ to $\mathcal{O}(1)$, with analyzing its robustness on the
selected sampling function. Experiments show that by simply sampling the
favorable instances during training, REIF is able to win over a series of
baselines that have complicated architectures. We also demonstrate that REIF
can support interpretable instance selection.
- Abstract(参考訳): 距離監督(DS)は、関係抽出(RE)モデルを強化するためにデータセットを拡張する強力な方法であるが、しばしば高いラベルノイズに悩まされる。
注意、強化学習、GANに基づく現在の研究はブラックボックスモデルであるため、DSにおけるサンプル選択の意味的な解釈も、異なる領域での安定性も提供しない。
一方,本研究では,影響関数 (IF) によるDSの新しいモデルに依存しないインスタンスサンプリング手法であるREIFを提案する。
本手法では,IFに基づいてバッグ内の好ましくないインスタンスを特定し,動的インスタンスサンプリングを行う。
提案アルゴリズムは,計算複雑性を$\mathcal{O}(mn)$から$\mathcal{O}(1)$に減らし,選択したサンプリング関数のロバスト性を解析する高速影響サンプリングアルゴリズムを設計する。
実験によると、トレーニング中に好都合なインスタンスをサンプリングすることで、複雑なアーキテクチャを持つ一連のベースラインに勝つことができる。
また、REIFが解釈可能なインスタンス選択をサポートできることを示す。
関連論文リスト
- Improved Active Learning via Dependent Leverage Score Sampling [8.400581768343804]
本研究では,非依存的(逆方向雑音)環境下での能動学習手法の改善方法について述べる。
エンフェボタルサンプリングアルゴリズムに基づく簡単な実装法を提案する。
独立サンプリングと比較して,本手法は,所定の目標精度に到達するために必要なサンプル数を最大50%削減する。
論文 参考訳(メタデータ) (2023-10-08T01:51:30Z) - Sample and Predict Your Latent: Modality-free Sequential Disentanglement
via Contrastive Estimation [2.7759072740347017]
外部信号のないコントラスト推定に基づく自己教師付きシーケンシャル・アンタングルメント・フレームワークを提案する。
実際に,データのセマンティックに類似し,異種なビューに対して,統一的で効率的かつ容易にサンプリングできる手法を提案する。
提案手法は,既存の手法と比較して最先端の結果を示す。
論文 参考訳(メタデータ) (2023-05-25T10:50:30Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Example-Based Sampling with Diffusion Models [7.943023838493658]
画像生成のための拡散モデルは、例から点集合を生成する方法を学ぶのに適している。
拡散モデルを用いて既存のサンプルを模した2次元点集合を観測点集合から生成する方法を提案する。
我々は、我々のアプローチの微分可能性を用いて、特性を強制する点集合を最適化する方法を実証する。
論文 参考訳(メタデータ) (2023-02-10T08:35:17Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Online progressive instance-balanced sampling for weakly supervised
object detection [0.0]
本稿では、ハードサンプリングとソフトサンプリングに基づくオンラインプログレッシブインスタンスバランスサンプリング(OPIS)アルゴリズムを提案する。
提案手法は,既存の多くの最先端結果に匹敵するベースラインを著しく改善することができる。
論文 参考訳(メタデータ) (2022-06-21T12:48:13Z) - Sensing Cox Processes via Posterior Sampling and Positive Bases [56.82162768921196]
本研究では,空間統計学から広く用いられている点過程の適応センシングについて検討する。
我々は、この強度関数を、特別に構築された正の基底で表される、歪んだガウス過程のサンプルとしてモデル化する。
我々の適応センシングアルゴリズムはランゲヴィン力学を用いており、後続サンプリング(textscCox-Thompson)と後続サンプリング(textscTop2)の原理に基づいている。
論文 参考訳(メタデータ) (2021-10-21T14:47:06Z) - Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.47536050785886]
我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。
グループサンプリングを提案し、同じクラスのサンプルをグループに集める。
Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文 参考訳(メタデータ) (2021-07-07T05:39:58Z) - ANL: Anti-Noise Learning for Cross-Domain Person Re-Identification [25.035093667770052]
2つのモジュールを含むアンチノイズラーニング(ANL)アプローチを提案します。
FDAモジュールは、カメラ回りのコントラスト学習と逆適応を通じて、ID関連サンプルを収集し、ID非関連サンプルを分散するように設計されています。
reliable sample selection(rss)モジュールは、ノイズラベルを訂正し、メインモデルの信頼できるサンプルを選択するために補助モデルを使用する。
論文 参考訳(メタデータ) (2020-12-27T02:38:45Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。