論文の概要: Bridging Synthetic and Real-World Domains: A Human-in-the-Loop Weakly-Supervised Framework for Industrial Toxic Emission Segmentation
- arxiv url: http://arxiv.org/abs/2507.22002v1
- Date: Tue, 29 Jul 2025 16:53:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.759091
- Title: Bridging Synthetic and Real-World Domains: A Human-in-the-Loop Weakly-Supervised Framework for Industrial Toxic Emission Segmentation
- Title(参考訳): ブリジング合成と実世界のドメイン:産業毒素排出セグメンテーションのためのヒト・イン・ザ・ループ弱監視フレームワーク
- Authors: Yida Tao, Yen-Chia Hsu,
- Abstract要約: 産業煙のセグメンテーションは大気汚染の監視と環境保護に重要であるが、現実の環境では高コストでピクセルレベルのアノテーションが不足しているため、しばしば妨げられる。
我々はCEDANetを紹介した。CEDANetは、弱い、市民が提供したビデオレベルラベルと敵対的な特徴アライメントを統合した、クラス対応のドメイン適応フレームワークである。
CEDANetは0.414のF1スコアと0.261のスモーククラスIoUを市民のフィードバックで達成し、ベースラインモデルを大幅に上回っている。
- 参考スコア(独自算出の注目度): 2.6954348706500766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial smoke segmentation is critical for air-quality monitoring and environmental protection but is often hampered by the high cost and scarcity of pixel-level annotations in real-world settings. We introduce CEDANet, a human-in-the-loop, class-aware domain adaptation framework that uniquely integrates weak, citizen-provided video-level labels with adversarial feature alignment. Specifically, we refine pseudo-labels generated by a source-trained segmentation model using citizen votes, and employ class-specific domain discriminators to transfer rich source-domain representations to the industrial domain. Comprehensive experiments on SMOKE5K and custom IJmond datasets demonstrate that CEDANet achieves an F1-score of 0.414 and a smoke-class IoU of 0.261 with citizen feedback, vastly outperforming the baseline model, which scored 0.083 and 0.043 respectively. This represents a five-fold increase in F1-score and a six-fold increase in smoke-class IoU. Notably, CEDANet with citizen-constrained pseudo-labels achieves performance comparable to the same architecture trained on limited 100 fully annotated images with F1-score of 0.418 and IoU of 0.264, demonstrating its ability to reach small-sampled fully supervised-level accuracy without target-domain annotations. Our research validates the scalability and cost-efficiency of combining citizen science with weakly supervised domain adaptation, offering a practical solution for complex, data-scarce environmental monitoring applications.
- Abstract(参考訳): 産業煙のセグメンテーションは大気汚染の監視と環境保護に重要であるが、現実の環境では高コストでピクセルレベルのアノテーションが不足しているため、しばしば妨げられる。
CEDANetは,弱い,市民が提供したビデオレベルラベルと敵対的特徴アライメントを一意に統合する,ループ型,クラス対応のドメイン適応フレームワークである。
具体的には、市民投票を用いたソース学習セグメンテーションモデルにより生成された擬似ラベルを精査し、クラス固有のドメイン識別器を用いて、リッチなソースドメイン表現を産業ドメインに転送する。
SMOKE5KとカスタムIJmondデータセットの総合的な実験により、CEDANetは0.414のF1スコアと0.261のスモーククラスIoUを実現し、それぞれ0.083と0.043のベースラインモデルを大幅に上回った。
これはF1スコアの5倍、煙クラスIoUの6倍の増加を意味する。
特に、シチズン制約付き擬似ラベルを持つCEDANetは、F1スコア0.418、IoU0.264の制限された100の完全注釈画像で訓練された同じアーキテクチャに匹敵する性能を達成し、ターゲットドメインアノテーションを使わずに、小さなサンプル付き完全教師付きレベルの精度に到達できることを実証している。
本研究は,市民科学と弱教師付きドメイン適応を組み合わせることのスケーラビリティとコスト効率を検証し,複雑なデータ共有型環境モニタリングアプリケーションのための実用的なソリューションを提供する。
関連論文リスト
- Enhancing Human-Robot Collaboration: A Sim2Real Domain Adaptation Algorithm for Point Cloud Segmentation in Industrial Environments [6.250798517067454]
本稿では、3DポイントクラウドデータのセマンティックセマンティックセグメンテーションのためのSim2Realドメイン適応における先駆的アプローチについて紹介する。
我々の焦点は、シミュレーション環境から実世界のアプリケーションへ堅牢に移行し、実用性と安全なHRCへの影響を高めるネットワークの開発である。
提案手法は実世界のHRCセットアップと産業用点雲のシミュレーションにより評価され, 最先端性能の向上, セグメンテーション精度97.76%, 既存手法に比べて堅牢性に優れていた。
論文 参考訳(メタデータ) (2025-06-11T09:36:07Z) - Robust Federated Learning on Edge Devices with Domain Heterogeneity [13.362209980631876]
Federated Learning (FL)は、分散エッジデバイス間のデータプライバシを確保しながら、協調的なトレーニングを可能にする。
本稿では,FLグローバルモデルの一般化能力を向上させることにより,この問題に対処する新しいフレームワークを提案する。
特徴の多様性とモデルロバスト性を高めるために,プロトタイプベースのFLフレームワークであるFedAPCを紹介する。
論文 参考訳(メタデータ) (2025-05-15T09:53:14Z) - Trajectory World Models for Heterogeneous Environments [67.27233466954814]
環境を横断するセンサーやアクチュエータの不均一性は、大規模な事前訓練された世界モデルを構築する上で大きな課題となる。
我々は80の環境から100万以上のトラジェクトリからなる統一データセットUniTrajを紹介した。
また,様々なセンサやアクチュエータ情報を扱える新しいアーキテクチャであるTrajWorldを提案する。
論文 参考訳(メタデータ) (2025-02-03T13:59:08Z) - A Two-Stage CAE-Based Federated Learning Framework for Efficient Jamming Detection in 5G Networks [5.715528540446773]
妨害攻撃はヘテロジニアスネットワーク(HetNet)アーキテクチャに重大なリスクをもたらす。
本稿では,5Gフェムトセルにおける検出を妨害する分散二段階連成学習(FL)フレームワークを提案する。
我々のフレームワークは、通信ラウンドを30に最小化し、ジャム信号を検出する堅牢な収束を最適クライアント数6で達成しつつ、精度0.94、リコール0.90、F1スコア0.92、精度0.92を達成する。
論文 参考訳(メタデータ) (2025-01-25T17:57:45Z) - No-Reference Image Quality Assessment with Global-Local Progressive Integration and Semantic-Aligned Quality Transfer [6.095342999639137]
視覚変換器(ViT)を用いたグローバル特徴抽出器と畳み込みニューラルネットワーク(CNN)を用いた局所特徴抽出器を組み合わせた二重測定フレームワークを開発した。
多様な画像コンテンツの品質スコアを主観的な意見スコアで自動的にラベル付けすることで、トレーニングデータを拡張するセマンティック・アライン・クオリティ・トランスファー手法を提案する。
論文 参考訳(メタデータ) (2024-08-07T16:34:32Z) - CDFL: Efficient Federated Human Activity Recognition using Contrastive Learning and Deep Clustering [12.472038137777474]
HAR(Human Activity Recognition)は、多様なセンサーからのデータを介し、人間の行動の自動化とインテリジェントな識別に不可欠である。
中央サーバー上のデータを集約し、集中処理を行うことによる従来の機械学習アプローチは、メモリ集約であり、プライバシの懸念を高める。
本研究は,画像ベースHARのための効率的なフェデレーション学習フレームワークCDFLを提案する。
論文 参考訳(メタデータ) (2024-07-17T03:17:53Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。