論文の概要: When Hearst Is not Enough: Improving Hypernymy Detection from Corpus
with Distributional Models
- arxiv url: http://arxiv.org/abs/2010.04941v1
- Date: Sat, 10 Oct 2020 08:34:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 23:01:49.254744
- Title: When Hearst Is not Enough: Improving Hypernymy Detection from Corpus
with Distributional Models
- Title(参考訳): 聴覚が不十分な場合:分布モデルによるコーパスのハイパーネミー検出の改善
- Authors: Changlong Yu, Jialong Han, Peifeng Wang, Yangqiu Song, Hongming Zhang,
Wilfred Ng, Shuming Shi
- Abstract要約: 本稿では,大きなテキストコーパスの助けを借りて,単語 (x, y) 間のis-a関係が存在するかどうかを論じる。
近年の研究では、大規模なハーストペアを抽出して給餌し、目に見えない(x, y)ペアの親和性が緩和された場合、パターンベースのペアの方が優れていることが示唆されている。
本稿では,これらの特定の事例の非無視的存在を初めて定量化し,その場合の分布法がパターンベースの事例を補うのに最適であることを示す。
- 参考スコア(独自算出の注目度): 59.46552488974247
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We address hypernymy detection, i.e., whether an is-a relationship exists
between words (x, y), with the help of large textual corpora. Most conventional
approaches to this task have been categorized to be either pattern-based or
distributional. Recent studies suggest that pattern-based ones are superior, if
large-scale Hearst pairs are extracted and fed, with the sparsity of unseen (x,
y) pairs relieved. However, they become invalid in some specific sparsity
cases, where x or y is not involved in any pattern. For the first time, this
paper quantifies the non-negligible existence of those specific cases. We also
demonstrate that distributional methods are ideal to make up for pattern-based
ones in such cases. We devise a complementary framework, under which a
pattern-based and a distributional model collaborate seamlessly in cases which
they each prefer. On several benchmark datasets, our framework achieves
competitive improvements and the case study shows its better interpretability.
- Abstract(参考訳): ハイパーニーミー検出,すなわち,単語 (x,y) の間にis-a関係が存在するかどうかを,大文字コーパスの助けを借りて扱う。
この課題に対する従来のアプローチはパターンベースか分布型に分類されている。
近年の研究では、大規模なハーストペアを抽出して給餌した場合、パターンベースのペアの方が優れていることが示唆されている。
しかし、xまたはyがいかなるパターンにも関与しない特定のスパーシティーケースでは無効になる。
本稿は,これらの特定の事例の不可解な存在を初めて定量化する。
また,このような場合,分布法はパターンベースの手法を補うのに理想的であることを示す。
パターンベースと分散モデルが,それぞれが好む場合にシームレスに協調する,補完的なフレームワークを考案する。
いくつかのベンチマークデータセットで、我々のフレームワークは競争力の向上を達成し、ケーススタディでは、より優れた解釈性を示している。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Investigating Ensemble Methods for Model Robustness Improvement of Text
Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。
適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文 参考訳(メタデータ) (2022-10-28T17:52:10Z) - GAPX: Generalized Autoregressive Paraphrase-Identification X [24.331570697458954]
このパフォーマンス低下の主な原因は、ネガティブな例によって導入されたバイアスである。
我々は、推論中にどれだけの重量を与えるべきかを効果的に、かつ自動的に決定できるパープレキシティーに基づくアウト・オブ・ディストリビューション・メトリックを導入する。
論文 参考訳(メタデータ) (2022-10-05T01:23:52Z) - Uncertainty Estimation for Language Reward Models [5.33024001730262]
言語モデルは、テキストコーパスの教師なしトレーニングからさまざまな能力を学ぶことができる。
人間がラベル付きデータを提供するよりも選択肢を選択する方が簡単であり、事前の作業はそのような選好比較から報酬モデルをトレーニングすることで最先端のパフォーマンスを達成した。
能動的学習とリスク-逆強化学習を用いてサンプル効率とロバスト性を向上させる不確実性推定によるこれらの問題に対処することを模索する。
論文 参考訳(メタデータ) (2022-03-14T20:13:21Z) - Finding and Fixing Spurious Patterns with Explanations [14.591545536354621]
画像分類器のスプリアスパターンを識別・緩和するためのエンドツーエンドパイプラインを提案する。
人を隠すとテニスラケットの予測が63%の時間変化する」といったパターンが見つかる。
そして、パターンが刺激的であれば、新しい形式のデータ拡張によってそれを緩和します。
論文 参考訳(メタデータ) (2021-06-03T20:07:46Z) - An Effective Baseline for Robustness to Distributional Shift [5.627346969563955]
ディープラーニングシステムの安全なデプロイには,トレーニング中に見られるものと異なる入力のカテゴリに直面した場合,確実な予測を控えることが重要な要件である。
本論文では, 吸収の原理を用いた分布異常検出の簡便かつ高効率な手法を提案する。
論文 参考訳(メタデータ) (2021-05-15T00:46:11Z) - Unsupervised Anomaly Detection From Semantic Similarity Scores [0.0]
本稿では,意味的類似度スコアを用いて異常検出を行う,シンプルで汎用的なフレームワークSemSADを提案する。
視覚領域における異常、新規性、アウト・オブ・ディストリビューション検出に対する従来のアプローチを大きなマージンで上回ることができる。
論文 参考訳(メタデータ) (2020-12-01T13:12:31Z) - Squared $\ell_2$ Norm as Consistency Loss for Leveraging Augmented Data
to Learn Robust and Invariant Representations [76.85274970052762]
元のサンプルと拡張されたサンプルの埋め込み/表現の距離を規則化することは、ニューラルネットワークの堅牢性を改善するための一般的なテクニックである。
本稿では、これらの様々な正規化選択について検討し、埋め込みの正規化方法の理解を深める。
私たちが特定したジェネリックアプローチ(squared $ell$ regularized augmentation)は、それぞれ1つのタスクのために特別に設計されたいくつかの手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-25T22:40:09Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。