論文の概要: FEDS -- Filtered Edit Distance Surrogate
- arxiv url: http://arxiv.org/abs/2103.04635v1
- Date: Mon, 8 Mar 2021 09:47:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:34:32.325415
- Title: FEDS -- Filtered Edit Distance Surrogate
- Title(参考訳): FEDS -- Filtered Edit Distance Surrogate
- Authors: Yash Patel, Jiri Matas
- Abstract要約: 本稿では,編集距離の学習サーロゲートを用いて,シーンテキスト認識モデルを頑健に学習する手法を提案する。
提案手法は,自己評価学習から借用し,サロゲートに難易度の高いトレーニング例をフィルタリングする。
有効性は、様々な挑戦的なシーンテキストデータセットの改善によって示される。
- 参考スコア(独自算出の注目度): 52.85781717058057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a procedure to robustly train a scene text recognition
model using a learned surrogate of edit distance. The proposed method borrows
from self-paced learning and filters out the training examples that are hard
for the surrogate. The filtering is performed by judging the quality of the
approximation, using a ramp function, which is piece-wise differentiable,
enabling end-to-end training. Following the literature, the experiments are
conducted in a post-tuning setup, where a trained scene text recognition model
is tuned using the learned surrogate of edit distance. The efficacy is
demonstrated by improvements on various challenging scene text datasets such as
IIIT-5K, SVT, ICDAR, SVTP, and CUTE. The proposed method provides an average
improvement of $11.2 \%$ on total edit distance and an error reduction of
$9.5\%$ on accuracy.
- Abstract(参考訳): 本稿では,編集距離の学習サーロゲートを用いて,シーンテキスト認識モデルを頑健に学習する手法を提案する。
提案手法は,自己評価学習から借用し,サロゲートに難易度の高いトレーニング例をフィルタリングする。
このフィルタは、区分的に微分可能なランプ関数を用いて近似の質を判定し、エンドツーエンドのトレーニングを可能にする。
本研究は,編集距離の学習サーロゲートを用いて,訓練されたシーンテキスト認識モデルをチューニングした後チューニングによる実験である。
この効果は, IIIT-5K, SVT, ICDAR, SVTP, CUTEなどの難易度の高いシーンテキストデータセットの改善によって実証された。
提案手法は,総編集距離で平均11.2 %$,精度で9.5 %$の誤差低減を実現した。
関連論文リスト
- Test-time adaptation for geospatial point cloud semantic segmentation with distinct domain shifts [6.80671668491958]
テスト時間適応(TTA)は、ソースデータへのアクセスや追加のトレーニングなしに、推論段階でラベル付けされていないデータに事前訓練されたモデルの直接適応を可能にする。
本稿では,3つの領域シフトパラダイムを提案する。光グラムから空気中LiDAR,空気中LiDAR,合成-移動レーザー走査である。
実験の結果,分類精度は最大20%mIoUに向上し,他の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-08T15:40:28Z) - Open-Vocabulary Calibration for Fine-tuned CLIP [44.82453633696438]
微調整視覚言語モデル(VLM)の信頼性校正問題は、そのようなモデルを現実世界に展開する際の信頼性を大幅に低下させる可能性がある。
本稿では,素早い学習の文脈において,信頼度校正問題を体系的に検討することにより,ギャップを埋める。
本稿では,予測されたテキストラベルとベースクラス間の距離を誘導する手法として,温度のスケーリングに基づく,DAC(Distance-Aware)と呼ばれるシンプルで効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-07T08:42:48Z) - DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection [72.25697820290502]
この研究は、ゼロショット分類によって潜在的に新しいクラスを特定するための単純かつ効率的な戦略を導入する。
このアプローチは、アノテーションやデータセット、再学習を必要とせずに、新しいクラスのリコールと精度を高めるセルフトレーニング戦略として言及する。
LVIS、V3Det、COCOを含む3つのデータセットに対する実証的な評価は、ベースラインのパフォーマンスを大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-10-02T17:52:24Z) - Evaluation of Test-Time Adaptation Under Computational Time Constraints [80.40939405129102]
テスト時間適応(TTA)メソッドは、テスト時にラベルのないデータを活用して、分散シフトに適応する。
現在の評価プロトコルは、この余分なコストの影響を見落とし、実際の適用性に影響を与える。
本稿では,TTA手法のより現実的な評価プロトコルを提案し,一定の速度のデータストリームからデータをオンライン形式で受信する。
論文 参考訳(メタデータ) (2023-04-10T18:01:47Z) - Selective In-Context Data Augmentation for Intent Detection using
Pointwise V-Information [100.03188187735624]
PLMとPVI(pointwise V-information)に基づく新しい手法を導入し,モデル学習におけるデータポイントの有用性を計測する。
提案手法はまず,学習データの小さなシード上でPLMを微調整し,与えられた意図に対応する発話を新たに生成する。
そこで本手法は,大規模言語モデルの表現力を活用し,多様な学習データを生成する。
論文 参考訳(メタデータ) (2023-02-10T07:37:49Z) - Converge to the Truth: Factual Error Correction via Iterative
Constrained Editing [30.740281040892086]
最小限の編集で事実誤り訂正(FEC)を行う新しい手法であるVENCEを提案する。
VENCEは、FEC問題を目標密度関数に対する反復サンプリング編集動作として定式化する。
公開データセットでの実験では、VENCEは以前の最遠距離で監督された手法よりもよく測定されたSARIの基準を5.3(または11.8%の相対的な改善)改善している。
論文 参考訳(メタデータ) (2022-11-22T10:03:13Z) - TEMPERA: Test-Time Prompting via Reinforcement Learning [57.48657629588436]
強化学習(TEMPERA)を用いたテスト時間プロンプト編集を提案する。
従来のプロンプト生成手法とは対照的に、TEMPERAは事前知識を効率的に活用することができる。
本手法は従来の微調整法と比較して試料効率の平均改善率を5.33倍に向上させる。
論文 参考訳(メタデータ) (2022-11-21T22:38:20Z) - On Addressing Practical Challenges for RNN-Transduce [72.72132048437751]
オーディオデータを収集することなく、よく訓練されたRNN-Tモデルを新しいドメインに適応します。
復号時に計算された複数の特徴を利用して単語レベルの信頼度を求める。
提案手法では,平均で50ms以下の単語のタイミング差が得られる。
論文 参考訳(メタデータ) (2021-04-27T23:31:43Z) - Learning Surrogates via Deep Embedding [35.09342657626646]
本稿では,目標評価基準を近似した代理損失を最小限に抑え,ニューラルネットワークのトレーニング手法を提案する。
認識タスクでは、編集距離メートル法を近似したサロゲートを用いてモデルを調整し、編集距離の相対的な改善を39%以上達成する。
検出タスクでは、サロゲートは回転した有界箱のユニオン計量の交叉を近似し、F_1$スコアにおいて最大4.25%の相対的な改善をもたらす。
論文 参考訳(メタデータ) (2020-07-01T22:55:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。