Fugu-MT 論文翻訳(概要): Improving ML Training Data with Gold-Standard Quality Metrics

論文の概要: Improving ML Training Data with Gold-Standard Quality Metrics

arxiv url: http://arxiv.org/abs/2512.20577v1
Date: Tue, 23 Dec 2025 18:21:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-12-24 19:17:49.966576
Title: Improving ML Training Data with Gold-Standard Quality Metrics
Title（参考訳）: ゴールドスタンダード品質メトリクスによるMLトレーニングデータの改善
Authors: Leslie Barrett, Michael W. Sherman,
Abstract要約: ハンドタグ付きトレーニングデータの品質を評価・向上する手法を提案する。複数回のタグ付けを繰り返すと、合意のメトリクスがより信頼性の高い結果をもたらすことを示す。また、各作業項目に複数のタグを必要とすることなく、タグ付けプロジェクトが高品質なトレーニングデータを収集する方法を示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Hand-tagged training data is essential to many machine learning tasks. However, training data quality control has received little attention in the literature, despite data quality varying considerably with the tagging exercise. We propose methods to evaluate and enhance the quality of hand-tagged training data using statistical approaches to measure tagging consistency and agreement. We show that agreement metrics give more reliable results if recorded over multiple iterations of tagging, where declining variance in such recordings is an indicator of increasing data quality. We also show one way a tagging project can collect high-quality training data without requiring multiple tags for every work item, and that a tagger burn-in period may not be sufficient for minimizing tagger errors.
Abstract（参考訳）: ハンドタグのトレーニングデータは、多くの機械学習タスクに不可欠である。しかし,タギング・エクササイズによってデータ品質が著しく変化するにもかかわらず,トレーニングデータ品質管理は文献にはほとんど注目されていない。本稿では,タグ付けの一貫性と一致度を統計的手法を用いて評価・向上する手法を提案する。データ品質向上の指標として,複数回のタグ付けを繰り返して記録した場合,合意基準により信頼性の高い結果が得られることを示す。また、タグ付けプロジェクトでは、作業項目毎に複数のタグを必要とせず、高品質なトレーニングデータを収集する方法を示す。

関連論文リスト

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning [29.14330314090061]
模倣学習は、人間のデモンストレーションから多様な行動の獲得を可能にすることで、ロボット能力を向上させる。既存のロボットキュレーションアプローチは、高価な手作業によるアノテーションに依存し、粗い粒度でキュレーションを行う。本稿では、低品質な状態-動作ペアをフィルタリングして模倣学習ポリシーの性能を向上させる自己教師型データキュレーションフレームワークであるSCIZORを紹介する。
論文参考訳（メタデータ） (2025-05-28T17:45:05Z)
Call for Rigor in Reporting Quality of Instruction Tuning Data [7.284192559306471]
研究は、インストラクションチューニング(IT)データの品質の重要性を強調している。この実践から生じる潜在的な問題を実証し、データ品質を検証する上で慎重に検討する必要があることを強調する。
論文参考訳（メタデータ） (2025-03-04T02:04:58Z)
Learning from Noisy Labels via Self-Taught On-the-Fly Meta Loss Rescaling [6.861041888341339]
そこで本研究では,リウェイトトレーニングサンプルに対する非教師なしメタロス再スケーリングを提案する。我々は,対話モデリングの課題を生かした,初級訓練データの再重み付けを試みている。我々の戦略は、ノイズの多いクリーンなデータに直面し、クラス不均衡を処理し、ノイズの多いラベルへの過度な適合を防ぐ。
論文参考訳（メタデータ） (2024-12-17T14:37:50Z)
Balancing Label Quantity and Quality for Scalable Elicitation [2.2143065226946423]
本研究では,NLP分類タスクにおける量品質トレードオフのミクロ経済性について検討する。教師付き微調整を用いた事前学習モデルから分類知識を抽出する3つの方法について検討した。固定ラベル付予算において,教師付き微調整の精度を最大5ポイント向上できることがわかった。
論文参考訳（メタデータ） (2024-10-17T04:39:58Z)
Text Quality-Based Pruning for Efficient Training of Language Models [66.66259229732121]
本研究では,大容量NLPデータセットのテキスト品質を数値評価する手法を提案する。テキスト品質指標を提案することにより、低品質テキストインスタンスを識別・排除する枠組みを確立する。複数のモデルやデータセットに対する実験結果から,このアプローチの有効性が示された。
論文参考訳（メタデータ） (2024-04-26T18:01:25Z)
A Novel Metric for Measuring Data Quality in Classification Applications (extended version) [0.0]
データ品質を測定するための新しい指標を紹介し説明する。この尺度は、分類性能とデータの劣化の相関した進化に基づいている。各基準の解釈と評価レベルの例を提供する。
論文参考訳（メタデータ） (2023-12-13T11:20:09Z)
Soft Curriculum for Learning Conditional GANs with Noisy-Labeled and Uncurated Unlabeled Data [70.25049762295193]
本稿では,トレーニング中にノイズラベル付きおよび未処理データを受け入れる条件付き画像生成フレームワークを提案する。本稿では,ラベルのないデータに新たなラベルを割り当てながら,逆行訓練にインスタンスワイドを割り当てるソフトカリキュラム学習を提案する。実験により,本手法は,定量および定性性能の両面において,既存の半教師付き・ラベル付きロバストな手法より優れていることが示された。
論文参考訳（メタデータ） (2023-07-17T08:31:59Z)
Analyzing Dataset Annotation Quality Management in the Wild [63.07224587146207]
最先端モデルのトレーニングと評価に使用される一般的なデータセットでさえ、誤ったアノテーションやバイアス、アーティファクトの量は無視できない。データセット作成プロジェクトに関するプラクティスやガイドラインは存在するが、品質管理の実施方法に関する大規模な分析はまだ行われていない。
論文参考訳（メタデータ） (2023-07-16T21:22:40Z)
USB: A Unified Summarization Benchmark Across Tasks and Domains [68.82726887802856]
ウィキペディア由来のベンチマークを導入し、クラウドソースアノテーションの豊富なセットを補完し、8ドルの相互関連タスクをサポートする。このベンチマークで様々な手法を比較し、複数のタスクにおいて、中程度の大きさの微調整されたモデルが、より大きな数発の言語モデルよりも一貫して優れていることを発見した。
論文参考訳（メタデータ） (2023-05-23T17:39:54Z)
SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文参考訳（メタデータ） (2023-01-26T03:53:25Z)
DAGA: Data Augmentation with a Generation Approach for Low-resource Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文参考訳（メタデータ） (2020-11-03T07:49:15Z)
Don't Wait, Just Weight: Improving Unsupervised Representations by Learning Goal-Driven Instance Weights [92.16372657233394]
自己教師付き学習技術は、役に立たないデータから有用な表現を学習することで、パフォーマンスを向上させることができる。ベイジアンのインスタンスの重み付けを学習することで、下流の分類精度を向上させることができることを示す。本研究では,STL-10 と Visual Decathlon の自己教師型回転予測タスクを用いて,BetaDataWeighter の評価を行った。
論文参考訳（メタデータ） (2020-06-22T15:59:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。