Fugu-MT 論文翻訳(概要): CAMELL: Confidence-based Acquisition Model for Efficient Self-supervised Active Learning with Label Validation

論文の概要: CAMELL: Confidence-based Acquisition Model for Efficient Self-supervised Active Learning with Label Validation

arxiv url: http://arxiv.org/abs/2310.08944v1
Date: Fri, 13 Oct 2023 08:19:31 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-16 13:42:19.471816
Title: CAMELL: Confidence-based Acquisition Model for Efficient Self-supervised Active Learning with Label Validation
Title（参考訳）: CAMELL:ラベル検証による効果的な自己教師型能動学習のための信頼に基づく獲得モデル
Authors: Carel van Niekerk, Christian Geishauser, Michael Heck, Shutong Feng, Hsien-chin Lin, Nurul Lubis, Benjamin Ruppik and Renato Vukovic and Milica Ga\v{s}i\'c
Abstract要約: 監視されたニューラルアプローチは、大きく、細心の注意を払って注釈付けされたデータセットに依存しているため妨げられる。逐次マルチ出力問題に適したプールベースのアクティブラーニングフレームワークである textbfCAMELL を提案する。
参考スコア（独自算出の注目度）: 6.918298428336528
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Supervised neural approaches are hindered by their dependence on large, meticulously annotated datasets, a requirement that is particularly cumbersome for sequential tasks. The quality of annotations tends to deteriorate with the transition from expert-based to crowd-sourced labelling. To address these challenges, we present \textbf{CAMELL} (Confidence-based Acquisition Model for Efficient self-supervised active Learning with Label validation), a pool-based active learning framework tailored for sequential multi-output problems. CAMELL possesses three core features: (1) it requires expert annotators to label only a fraction of a chosen sequence, (2) it facilitates self-supervision for the remainder of the sequence, and (3) it employs a label validation mechanism to prevent erroneous labels from contaminating the dataset and harming model performance. We evaluate CAMELL on sequential tasks, with a special emphasis on dialogue belief tracking, a task plagued by the constraints of limited and noisy datasets. Our experiments demonstrate that CAMELL outperforms the baselines in terms of efficiency. Furthermore, the data corrections suggested by our method contribute to an overall improvement in the quality of the resulting datasets.
Abstract（参考訳）: 監視されたニューラルアプローチは、大規模で慎重に注釈付けされたデータセットに依存しているため、特にシーケンシャルなタスクには厄介な要件である。アノテーションの品質は、エキスパートベースからクラウドソースラベリングへの移行によって悪化する傾向にある。これらの課題に対処するために,我々は,逐次的マルチアウトプット問題に適したプール型アクティブラーニングフレームワークである \textbf{camell} (confidence-based acquisition model for efficient self-supervised active learning with label validation)を提案する。 CAMELLには3つの中核的な特徴がある:(1) 選択されたシーケンスのごく一部だけをラベル付けする専門家アノテータ、(2) 配列の残りの部分の自己監督を促進すること、(3) 誤ったラベルがデータセットを汚染しモデル性能を損なうことを防ぐためにラベル検証機構を使用する。対話的信念追跡を特に重視し,限られたデータとうるさいデータの制約に苦しめられた課題として,シーケンシャルタスクにおけるラクダを評価した。実験の結果,CAMELLは効率の点でベースラインを上回っていることがわかった。さらに,提案手法が提案するデータ補正は,得られたデータセットの品質の全体的な改善に寄与する。

関連論文リスト

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning [51.133569963553576]
ssTokenは自己変調されたセマンティックなToken Selectionアプローチである。自己変調の選択とセマンティック・アウェアの選択の両方が、フルデータの微調整よりも優れていることを示す。
論文参考訳（メタデータ） (2025-10-21T03:21:04Z)
DCFS: Continual Test-Time Adaptation via Dual Consistency of Feature and Sample [22.84826831249534]
連続的なテスト時間適応は、トレーニング済みのモデルを、ソースデータにアクセスすることなく、ターゲットドメインデータのストリームに継続的に適応することを目的としている。デュアルパス特徴整合性と信頼性を考慮したサンプル学習を導入した新しいCTTAフレームワークであるDCFSを提案する。
論文参考訳（メタデータ） (2025-08-28T07:57:54Z)
Stochastic Encodings for Active Feature Acquisition [100.47043816019888]
Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文参考訳（メタデータ） (2025-08-03T23:48:46Z)
Segment Concealed Objects with Incomplete Supervision [63.637733655439334]
不完全なスーパービジョン・コンセサイテッド・オブジェクト(ISCOS)は、周囲の環境にシームレスにブレンドするオブジェクトを分割する。このタスクは、不完全な注釈付きトレーニングデータによって提供される限られた監督のため、非常に難しいままである。本稿では,これらの課題に対処するためのISCOSの統一手法について紹介する。
論文参考訳（メタデータ） (2025-06-10T16:25:15Z)
Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation [5.7977777220041204]
擬似スーパービジョンの一般的な実践は、事前に定義された信頼しきい値やエントロピーに基づいて擬似ラベルをフィルタリングすることである。疑似ラベル選択のための動的フィードバック駆動しきい値決定手法であるEnsemble-of-Confidence Reinforcement (ENCORE)を提案する。提案手法は,既存の擬似スーパービジョンフレームワークにシームレスに統合され,セグメンテーション性能が大幅に向上する。
論文参考訳（メタデータ） (2025-05-12T15:58:08Z)
Privacy-Preserving Model and Preprocessing Verification for Machine Learning [9.4033740844828]
本稿では、機密データに基づいてトレーニングされたモデルに着目し、機械学習モデルのプライバシ保護検証のためのフレームワークを提案する。バイナリ分類は、適切な前処理ステップを適用してターゲットモデルが正しくトレーニングされたかどうかを検証し、特定の前処理エラーを特定するマルチクラス分類という2つの重要なタスクに対処する。その結果、検証精度はデータセットやノイズレベルによって異なるが、このフレームワークは、事前処理エラー、強力なプライバシ保証、機密データの保護のための実践的適用性を効果的に検出する。
論文参考訳（メタデータ） (2025-01-14T16:21:54Z)
Neural Machine Unranking [3.2340528215722553]
ニューラルマシン・アンランキング(NuMuR)と呼ばれる新しいタスクを導入する。既存のタスクやモデルに依存しない未学習アプローチは、2つのコア課題のため、NuMuRには最適ではない。 CoCoL は(1) 絡み合ったサンプルの性能を維持しつつ, 忘れられた集合の関連点を減少させる対照的な損失と(2) 保持集合の精度を維持する一貫した損失とからなる。
論文参考訳（メタデータ） (2024-08-09T20:36:40Z)
Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。 ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文参考訳（メタデータ） (2024-06-26T05:30:21Z)
Incremental Self-training for Semi-supervised Learning [56.57057576885672]
ISTは単純だが有効であり、既存の自己学習に基づく半教師あり学習手法に適合する。提案したISTを5つのデータセットと2種類のバックボーンで検証し,認識精度と学習速度を効果的に向上させる。
論文参考訳（メタデータ） (2024-04-14T05:02:00Z)
Evaluating Generative Language Models in Information Extraction as Subjective Question Correction [49.729908337372436]
本稿では,新しい評価手法SQC-Scoreを提案する。主観的質問訂正の原則に着想を得て,新しい評価手法SQC-Scoreを提案する。 3つの情報抽出タスクの結果から,SQC-Scoreは基準値よりもアノテータの方が好ましいことが示された。
論文参考訳（メタデータ） (2024-04-04T15:36:53Z)
Active Label Correction for Semantic Segmentation with Foundation Models [34.0733215363568]
本稿では,画素の擬似ラベルを補正する補正クエリの設計に基づく,アクティブラベル補正(ALC)の有効なフレームワークを提案する。提案手法は, (i) 擬似ラベルを用いた補正クエリのアノテータフレンドリな設計, (ii) スーパーピクセルに基づくラベル展開を先取りする取得関数の2つの重要な手法からなる。 PASCAL,Cityscapes,Kvasir-SEGデータセットの実験結果から,ALCフレームワークの有効性が示された。
論文参考訳（メタデータ） (2024-03-16T06:10:22Z)
DUEL: Duplicate Elimination on Active Memory for Self-Supervised Class-Imbalanced Learning [19.717868805172323]
新たなフレームワークであるDuplicate Elimination(DUEL)の自己教師付き事前学習におけるアクティブなデータフィルタリングプロセスを提案する。このフレームワークは、人間のワーキングメモリにインスパイアされたアクティブメモリを統合し、メモリ内のデータの多様性を測定する特異性情報を導入する。最も重複したデータを新しいサンプルに置き換えるDUELポリシは、メモリ内の特異性情報を強化し、クラス不均衡を軽減することを目的としている。
論文参考訳（メタデータ） (2024-02-14T06:09:36Z)
Uncertainty-aware Self-training for Low-resource Neural Sequence Labeling [29.744621356187764]
本稿では,ニューラルシークエンスラベリング(NSL)のための新しい未知の自己学習フレームワークSeqUSTを提案する。ベイジアンニューラルネットワーク(BNN)にモンテカルロ(MC)ドロップアウトを組み込んでトークンレベルで不確実性評価を行い、ラベルのないデータから信頼性の高い言語トークンを選択する。ノイズロスのあるマスク付きシークエンスラベリングタスクは、ノイズのある擬似ラベルの問題を抑えることを目的とした堅牢なトレーニングを支援する。
論文参考訳（メタデータ） (2023-02-17T02:40:04Z)
Adversarial Dual-Student with Differentiable Spatial Warping for Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文参考訳（メタデータ） (2022-03-05T17:36:17Z)
WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文参考訳（メタデータ） (2021-05-21T11:58:50Z)
Social Adaptive Module for Weakly-supervised Group Activity Recognition [143.68241396839062]
本稿では、弱教師付きグループ活動認識(GAR)と呼ばれる新しいタスクを提案する。従来のGARタスクとは違い、ビデオレベルラベルのみが利用可能であるが、トレーニングデータにおいても、各フレーム内の重要人物は提供されない。これにより、大規模なNBAデータセットの収集とアノテートが容易になり、GARに新たな課題が生まれます。
論文参考訳（メタデータ） (2020-07-18T16:40:55Z)
Active and Incremental Learning with Weak Supervision [7.2288756536476635]
本研究では,逐次学習方式と能動学習方式の組み合わせについて述べる。オブジェクト検出タスクは、PASCAL VOCデータセット上で連続的な探索コンテキストで評価される。また,実世界の生物多様性アプリケーションにおいて,能動的・漸進的学習に基づく弱教師付きシステムを検証する。
論文参考訳（メタデータ） (2020-01-20T13:21:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。