論文の概要: Domain Divergences: a Survey and Empirical Analysis
- arxiv url: http://arxiv.org/abs/2010.12198v2
- Date: Mon, 19 Apr 2021 06:47:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 22:36:07.269866
- Title: Domain Divergences: a Survey and Empirical Analysis
- Title(参考訳): ドメインの多様性: 調査と実証分析
- Authors: Abhinav Ramesh Kashyap, Devamanyu Hazarika, Min-Yen Kan, Roger
Zimmermann
- Abstract要約: 我々は,情報理論,幾何学,高次尺度の3つのクラスからなる分散尺度の分類法を開発する。
我々は,130のドメイン適応シナリオ,3つの異なるNLPタスク,12のばらつき尺度にまたがる相関分析を行った。
- 参考スコア(独自算出の注目度): 47.535524183965464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain divergence plays a significant role in estimating the performance of a
model in new domains. While there is a significant literature on divergence
measures, researchers find it hard to choose an appropriate divergence for a
given NLP application. We address this shortcoming by both surveying the
literature and through an empirical study. We develop a taxonomy of divergence
measures consisting of three classes -- Information-theoretic, Geometric, and
Higher-order measures and identify the relationships between them. Further, to
understand the common use-cases of these measures, we recognise three novel
applications -- 1) Data Selection, 2) Learning Representation, and 3) Decisions
in the Wild -- and use it to organise our literature. From this, we identify
that Information-theoretic measures are prevalent for 1) and 3), and
Higher-order measures are more common for 2). To further help researchers
choose appropriate measures to predict drop in performance -- an important
aspect of Decisions in the Wild, we perform correlation analysis spanning 130
domain adaptation scenarios, 3 varied NLP tasks and 12 divergence measures
identified from our survey. To calculate these divergences, we consider the
current contextual word representations (CWR) and contrast with the older
distributed representations. We find that traditional measures over word
distributions still serve as strong baselines, while higher-order measures with
CWR are effective.
- Abstract(参考訳): ドメインの発散は、新しいドメインにおけるモデルの性能を推定する上で重要な役割を果たす。
発散対策に関する重要な文献があるが、研究者は与えられたNLPアプリケーションに対して適切な発散を選択することは困難である。
我々はこの欠点を文献調査と経験的研究の両方を通して解決する。
我々は,情報理論,幾何学,高次測度という3つのクラスからなる分岐測度を分類し,それらの関係を同定する。
さらに,これらの手法の一般的な利用事例を理解するために,3つの新しい応用について認識する。
1)データ選択
2)表現の学習,及び
3) 野生の意思決定 -- 文学を組織化するためにそれを使用します。
このことから,情報理論の手法が普及していることが分かる。
1) と 3) より高次の措置は 2) より一般的である。
さらに、研究者がパフォーマンスの低下を予測する適切な手段を選択するのを助けるために、130のドメイン適応シナリオ、3つの異なるnlpタスク、そして12の分岐尺度にまたがる相関分析を行う。
これらの違いを計算するために、現在の文脈表現(CWR)と古い分散表現とを対比する。
我々は,cwrを用いた高次尺度が有効であるのに対し,単語分布に対する従来の尺度は依然として強固なベースラインとして機能することがわかった。
関連論文リスト
- Measuring publication relatedness using controlled vocabularies [0.0]
制御された語彙は関連性を測定するための有望な基盤を提供する。
様々な種類の研究課題に対して、その正確さと適合性に関する包括的かつ直接的なテストは存在しない。
本稿では,既存の測度をレビューし,新しい測度を開発し,TRECゲノミクスデータを用いた測度をトピックの基礎的真理として評価する。
論文 参考訳(メタデータ) (2024-08-27T12:41:37Z) - Chain-of-Thought Prompting for Demographic Inference with Large Multimodal Models [58.58594658683919]
大規模マルチモーダルモデル (LMM) は、様々な研究課題において変換可能性を示している。
以上の結果から,LMMはゼロショット学習,解釈可能性,未修正入力の処理に長所があることが示唆された。
本稿では,目標外予測問題を効果的に緩和するChain-of-Thought拡張プロンプト手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T16:26:56Z) - Statistical Correlators and Tripartite Entanglement [0.07812210699650153]
2つの測度を2つの重要な三部交絡状態のクラスに対して経験的に決定できることが示される。
このような定式化されたスキームは、初めて三部体の絡みを正確に定量化する手段を提供する。
論文 参考訳(メタデータ) (2023-08-30T18:00:07Z) - Goodhart's Law Applies to NLP's Explanation Benchmarks [57.26445915212884]
ERASER(Comprehensiveness and sufficiency)メトリクスとEVAL-X(EVAL-X)メトリクスの2つのセットを批判的に検討する。
実験結果の予測や説明を変えることなく,モデル全体の包括性と充足率を劇的に向上させることができることを示す。
我々の結果は、現在のメトリクスが説明可能性の研究をガイドする能力に疑問を呈し、これらのメトリクスが正確に捉えるものを再評価する必要性を強調します。
論文 参考訳(メタデータ) (2023-08-28T03:03:03Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Explaining Algorithmic Fairness Through Fairness-Aware Causal Path
Decomposition [37.823248189626014]
本稿では,モデルの相違点の同定問題について検討する。
特徴重要度を学習する既存の解釈方法とは異なり,特徴変数間の因果関係を考察する。
我々のフレームワークはまた、モデルに依存しないものであり、様々な量的格差の尺度に適用できる。
論文 参考訳(メタデータ) (2021-08-11T17:23:47Z) - Characterizing and comparing external measures for the assessment of
cluster analysis and community detection [1.5543116359698947]
文献では、同じ集合の2つの分割を比較するために、多くの外部評価尺度が提案されている。
これにより、与えられた状況に対して最も適切な尺度を選択することがエンドユーザの課題となる。
本稿では,この問題を解決するための新しい経験的評価フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-01T09:10:25Z) - Metric-Learning-Assisted Domain Adaptation [18.62119154143642]
多くの既存ドメインアライメント手法は、ソースとターゲットの分布のアライメントとともに、低いソースリスクが低いターゲットリスクを意味すると仮定している。
本稿では,特徴整合性向上を支援するために,新しい三重項損失を用いたメタラーニング支援ドメイン適応法(MLA-DA)を提案する。
論文 参考訳(メタデータ) (2020-04-23T04:20:02Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。