論文の概要: Confidence-Calibrated Ensemble Dense Phrase Retrieval
- arxiv url: http://arxiv.org/abs/2306.15917v1
- Date: Wed, 28 Jun 2023 04:40:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 15:45:14.459172
- Title: Confidence-Calibrated Ensemble Dense Phrase Retrieval
- Title(参考訳): 信頼度校正エンサンブルダンスフレーズ検索
- Authors: William Yang, Noah Bergam, Arnav Jain, Nima Sheikhoslami
- Abstract要約: 変換器をベースとしたDense Passage Retrieval(DPR)アルゴリズムが,事前学習なしに最適化できる範囲について検討する。
このやや徹底的なアプローチは、Google NQやSQuADといったベンチマークデータセットで、最先端の結果を達成する。
- 参考スコア(独自算出の注目度): 2.365702128814616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider the extent to which the transformer-based Dense
Passage Retrieval (DPR) algorithm, developed by (Karpukhin et. al. 2020), can
be optimized without further pre-training. Our method involves two particular
insights: we apply the DPR context encoder at various phrase lengths (e.g.
one-sentence versus five-sentence segments), and we take a
confidence-calibrated ensemble prediction over all of these different
segmentations. This somewhat exhaustive approach achieves start-of-the-art
results on benchmark datasets such as Google NQ and SQuAD. We also apply our
method to domain-specific datasets, and the results suggest how different
granularities are optimal for different domains
- Abstract(参考訳): 本稿では, (Karpukhin et al. 2020) によって開発されたトランスフォーマーを用いた Dense Passage Retrieval (DPR) アルゴリズムが, 事前学習なしに最適化できる範囲について考察する。
この手法には2つの特別な洞察が含まれている: dprコンテキストエンコーダを様々な句長(例えば、1セントと5セントのセグメント)に適用し、これら全てのセグメントに対して信頼度に合致したアンサンブル予測を行う。
このやや徹底的なアプローチは、Google NQやSQuADといったベンチマークデータセットで、最先端の結果を達成する。
また,本手法をドメイン固有のデータセットに適用し,異なるドメインに対して異なる粒度が最適であることを示す。
関連論文リスト
- Deep Active Ensemble Sampling For Image Classification [8.31483061185317]
アクティブラーニングフレームワークは、最も有益なデータポイントのラベル付けを積極的に要求することで、データアノテーションのコストを削減することを目的としている。
提案手法には、不確実性に基づく手法、幾何学的手法、不確実性に基づく手法と幾何学的手法の暗黙の組み合わせなどがある。
本稿では, サンプル選択戦略における効率的な探索・探索トレードオフを実現するために, 不確実性に基づくフレームワークと幾何学的フレームワークの両方の最近の進歩を革新的に統合する。
本フレームワークは,(1)正確な後続推定,(2)計算オーバーヘッドと高い精度のトレードオフの2つの利点を提供する。
論文 参考訳(メタデータ) (2022-10-11T20:20:20Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Assessing Data Efficiency in Task-Oriented Semantic Parsing [54.87705549021248]
我々は、ある品質バーを達成するのに、ドメイン内の「ターゲット」データがどれだけ必要であるかを近似した4段階のプロトコルを導入する。
我々は,タスク指向セマンティック解析の実践者に対して,その柔軟性と適用性を示す実世界の2つのケーススタディに適用する。
論文 参考訳(メタデータ) (2021-07-10T02:43:16Z) - Training Bi-Encoders for Word Sense Disambiguation [4.149972584899897]
Word Sense Disambiguationの最先端のアプローチは、これらのモデルからの事前訓練された埋め込みとともに語彙情報を活用し、標準評価ベンチマークにおける人間間のアノテータ合意に匹敵する結果を得る。
我々はさらに,多段階事前学習および微調整パイプラインを通じて,Word Sense Disambiguationにおける技術の現状について述べる。
論文 参考訳(メタデータ) (2021-05-21T06:06:03Z) - Gradient Matching for Domain Generalization [93.04545793814486]
機械学習システムの重要な要件は、見えないドメインに一般化する能力です。
ドメインの一般化を目標とするドメイン間勾配マッチングの目的を提案する。
我々は、その最適化を近似する単純な一階アルゴリズムfishを導出する。
論文 参考訳(メタデータ) (2021-04-20T12:55:37Z) - Latent Space Regularization for Unsupervised Domain Adaptation in
Semantic Segmentation [14.050836886292869]
セマンティックセグメンテーションにおけるドメインの不一致を減らすために、機能レベルの空間形成正規化戦略を紹介します。
このような手法の有効性を自律運転環境で検証する。
論文 参考訳(メタデータ) (2021-04-06T16:07:22Z) - Zero-Pair Image to Image Translation using Domain Conditional
Normalization [138.7878582237908]
ゼロペア画像-画像変換のためのドメイン条件正規化(DCN)に基づくアプローチを提案する。
本研究では,エンコーダ・デコーダ構造を持つ単一ジェネレータを用いて,領域条件正規化の異なる実装を解析し,所望の領域出力を得る。
論文 参考訳(メタデータ) (2020-11-11T10:20:47Z) - Dynamic Programming Encoding for Subword Segmentation in Neural Machine
Translation [80.38621085548013]
本稿では,文をサブワード単位にトークン化するための新しいセグメンテーションアルゴリズムである動的プログラミング(DPE)を提案する。
ターゲットセグメンテーションを見つけるために、正確なログ境界推定と正確なMAP推定を可能にする混合文字サブワード変換器を提案する。
論文 参考訳(メタデータ) (2020-05-03T05:00:50Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。