Fugu-MT 論文翻訳(概要): From Obstacles to Resources: Semi-supervised Learning Faces Synthetic Data Contamination

論文の概要: From Obstacles to Resources: Semi-supervised Learning Faces Synthetic Data Contamination

arxiv url: http://arxiv.org/abs/2405.16930v2
Date: Wed, 27 Nov 2024 05:06:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 20:28:07.260405
Title: From Obstacles to Resources: Semi-supervised Learning Faces Synthetic Data Contamination
Title（参考訳）: 障害物から資源へ:半教師付き学習顔と合成データ汚染
Authors: Zerun Wang, Jiafeng Mao, Liuyu Xiang, Toshihiko Yamasaki,
Abstract要約: 半教師付き学習(SSL)は、ラベルのない画像を活用することにより、モデルパフォーマンスを向上させることができる。本稿では,合成画像によって汚染された未ラベルデータの影響を調査するための新しいタスクであるReal-Synthetic Hybrid SSL(RS-SSL)を提案する。本稿では,RS-SSLの課題に対処するための新しいSSL手法であるRSMatchを提案する。
参考スコア（独自算出の注目度）: 24.06944957366102
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Semi-supervised learning (SSL) can improve model performance by leveraging unlabeled images, which can be collected from public image sources with low costs. In recent years, synthetic images have become increasingly common in public image sources due to rapid advances in generative models. Therefore, it is becoming inevitable to include existing synthetic images in the unlabeled data for SSL. How this kind of contamination will affect SSL remains unexplored. In this paper, we introduce a new task, Real-Synthetic Hybrid SSL (RS-SSL), to investigate the impact of unlabeled data contaminated by synthetic images for SSL. First, we set up a new RS-SSL benchmark to evaluate current SSL methods and found they struggled to improve by unlabeled synthetic images, sometimes even negatively affected. To this end, we propose RSMatch, a novel SSL method specifically designed to handle the challenges of RS-SSL. RSMatch effectively identifies unlabeled synthetic data and further utilizes them for improvement. Extensive experimental results show that RSMatch can transfer synthetic unlabeled data from `obstacles' to `resources.' The effectiveness is further verified through ablation studies and visualization.
Abstract（参考訳）: 半教師付き学習(SSL)は、公開画像ソースから低コストで収集可能なラベルなし画像を活用することにより、モデル性能を向上させることができる。近年, 合成画像は, 生成モデルの急速な進歩により, 公的な画像ソースでますます一般的になっている。そのため、SSLのラベルなしデータに既存の合成画像を含めることは避けられない。この種の汚染がSSLにどのように影響するかは、まだ解明されていない。本稿では,実合成ハイブリッドSSL(Real-Synthetic Hybrid SSL, RS-SSL)を提案する。まず、現在のSSLメソッドを評価するための新しいRS-SSLベンチマークを設定しました。そこで本研究では,RS-SSLの課題に対処するための新しいSSL手法であるRSMatchを提案する。 RSMatchは、ラベルのない合成データを効果的に識別し、さらに改善のために利用する。 RSMatchは,<obstacles>から<resources>への合成未ラベルデータ転送が可能であった。「校合研究・可視化により効果がさらに検証される。」

関連論文リスト

Towards Realistic Low-Light Image Enhancement via ISP Driven Data Modeling [61.95831392879045]
深部ニューラルネットワーク(DNN)は近年,低照度画像強調(LLIE)の先導手法となっている。大幅な進歩にもかかわらず、彼らの出力は、増幅ノイズ、誤ったホワイトバランス、または現実世界のアプリケーションに展開する際の不自然な拡張のような問題を示す可能性がある。重要な課題は、低照度条件と撮像パイプラインの複雑さを捉える多様な大規模トレーニングデータの欠如である。本稿では,この課題に対処し,無制限にペア化されたトレーニングデータを生成する,新しい画像信号処理(ISP)駆動型データ合成パイプラインを提案する。
論文参考訳（メタデータ） (2025-04-16T15:53:53Z)
Training Data Synthesis with Difficulty Controlled Diffusion Model [27.21978745638249]
半教師付き学習(SSL)は、ラベルのない画像を活用することにより、モデルパフォーマンスを向上させることができる。本稿では,合成画像によって汚染された未ラベルデータの影響を調査するための新しいタスクであるReal-Synthetic Hybrid SSL(RS-SSL)を提案する。本稿では,RS-SSLの課題に対処するための新しいSSL手法であるRSMatchを提案する。
論文参考訳（メタデータ） (2024-11-27T07:42:06Z)
Dealing with Synthetic Data Contamination in Online Continual Learning [21.55295185505081]
AI生成画像の普及は、明確に特定されていない機械学習コミュニティに副作用をもたらす可能性がある。コンピュータビジョンにおけるディープラーニングの成功は、インターネット上で収集された膨大なデータセットによって駆動される。
論文参考訳（メタデータ） (2024-11-21T05:24:35Z)
Self-Supervised Anomaly Detection in the Wild: Favor Joint Embeddings Methods [12.277762115388187]
Self-Supervised Learning (SSL)は、ラベルのないデータから堅牢な表現を学習することで、有望なアプローチを提供する。本稿では,下水道インフラに着目した実世界の異常検出のためのSSL手法の包括的評価を行う。
論文参考訳（メタデータ） (2024-10-05T21:27:47Z)
Mixing Natural and Synthetic Images for Robust Self-Supervised Representations [0.5249805590164901]
本稿では,実画像と合成画像を組み合わせた自己教師付き学習(SSL)事前学習フレームワークであるDiffMixを紹介する。実験によると、DiffMixはさまざまなデータセットやドメイン転送タスクに対してSSLメソッドSimCLR、BarlowTwins、DINOを強化する。
論文参考訳（メタデータ） (2024-06-18T07:49:11Z)
Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文参考訳（メタデータ） (2023-12-12T14:45:45Z)
Zero-Shot Learning by Harnessing Adversarial Samples [52.09717785644816]
本稿では,HAS(Harnessing Adversarial Samples)によるZSL(Zero-Shot Learning)アプローチを提案する。 HASは3つの重要な側面を考慮に入れた敵の訓練を通じてZSLを前進させる。本稿では,ZSLと一般化ゼロショット学習(GZSL)の両シナリオにおいて,敵対的サンプルアプローチの有効性を実証する。
論文参考訳（メタデータ） (2023-08-01T06:19:13Z)
Self-Supervised Learning for Improved Synthetic Aperture Sonar Target Recognition [0.0]
本研究では,合成開口ソナー(SAS)画像における目標認識向上のための自己教師付き学習(SSL)の適用について検討する。高分解能SASデータは、ディープニューラルネットワーク(DNN)をトレーニングするための重要なステップであるラベル付けに重要な課題を呈している。この研究は、バイナリ画像分類タスクにおいて、よく認識された教師付き学習モデルであるResNet18に対して、2つの著名なSSLアルゴリズムであるMoCov2とBYOLの性能を評価する。
論文参考訳（メタデータ） (2023-07-27T14:17:24Z)
ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文参考訳（メタデータ） (2023-03-20T12:06:14Z)
Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文参考訳（メタデータ） (2022-10-14T06:54:24Z)
OpenLDN: Learning to Discover Novel Classes for Open-World Semi-Supervised Learning [110.40285771431687]
半教師付き学習(SSL)は、教師付き学習のアノテーションボトルネックに対処する主要なアプローチの1つである。最近のSSLメソッドは、ラベルなしデータの大規模なリポジトリを有効活用して、ラベル付きデータの小さなセットに依存しながら、パフォーマンスを向上させることができる。この研究は、ペアワイズ類似度損失を利用して新しいクラスを発見するOpenLDNを導入している。
論文参考訳（メタデータ） (2022-07-05T18:51:05Z)
Collaborative Intelligence Orchestration: Inconsistency-Based Fusion of Semi-Supervised Learning and Active Learning [60.26659373318915]
アクティブラーニング(AL)と半教師付きラーニング(SSL)は2つの効果があるが、しばしば孤立している。本稿では、SSL-ALの潜在的な優位性をさらに調査するために、革新的な一貫性に基づく仮想aDvErialアルゴリズムを提案する。 2つの実世界のケーススタディは、提案したデータサンプリングアルゴリズムの適用と展開の実践的な産業価値を可視化する。
論文参考訳（メタデータ） (2022-06-07T13:28:43Z)
Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文参考訳（メタデータ） (2022-02-12T04:16:41Z)
Synthetic Data for Model Selection [2.4499092754102874]
合成データはモデル選択に有用であることを示す。そこで本研究では,実領域に適合する合成誤差推定をキャリブレーションする新しい手法を提案する。
論文参考訳（メタデータ） (2021-05-03T09:52:03Z)
Semi-supervised learning objectives as log-likelihoods in a generative model of data curation [32.45282187405337]
データキュレーションの生成モデルにおいて、SSLの目的をログライクな形式として定式化する。おもちゃのデータにベイジアンSSLの証明を与える。
論文参考訳（メタデータ） (2020-08-13T13:50:27Z)
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning [112.95742995816367]
FSFSLと呼ばれる新しい数発のスナップショット・ラーニング・セッティングを提案する。 FSFSLでは、ソースクラスとターゲットクラスの両方に限られたトレーニングサンプルがある。また,無関係な画像を削除するためのグラフ畳み込みネットワーク (GCN) ベースのラベルデノイング (LDN) 手法を提案する。
論文参考訳（メタデータ） (2020-02-28T10:34:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。