論文の概要: CAD Models to Real-World Images: A Practical Approach to Unsupervised
Domain Adaptation in Industrial Object Classification
- arxiv url: http://arxiv.org/abs/2310.04757v1
- Date: Sat, 7 Oct 2023 09:37:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 15:46:53.892792
- Title: CAD Models to Real-World Images: A Practical Approach to Unsupervised
Domain Adaptation in Industrial Object Classification
- Title(参考訳): 実世界画像へのcadモデル:産業オブジェクト分類における教師なし領域適応への実践的アプローチ
- Authors: Dennis Ritter, Mike Hemberger, Marc H\"onig, Volker Stopp, Erik
Rodner, Kristian Hildebrand
- Abstract要約: 本稿では,オブジェクト分類のための教師なし領域適応パイプラインを,挑戦的な産業環境下で解析する。
本結果は,カテゴリラベルCADモデルのみが利用可能であるが,実世界の画像で分類を行う必要がある場合に,最も重要な設計選択が強調される。
ドメイン適応パイプラインは、VisDAベンチマークでSoTAのパフォーマンスを達成するが、より重要なのは、102の機械部品からなる新しいオープン産業データセットにおける認識性能を大幅に改善することです。
- 参考スコア(独自算出の注目度): 2.3797027992639403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we systematically analyze unsupervised domain adaptation
pipelines for object classification in a challenging industrial setting. In
contrast to standard natural object benchmarks existing in the field, our
results highlight the most important design choices when only category-labeled
CAD models are available but classification needs to be done with real-world
images. Our domain adaptation pipeline achieves SoTA performance on the VisDA
benchmark, but more importantly, drastically improves recognition performance
on our new open industrial dataset comprised of 102 mechanical parts. We
conclude with a set of guidelines that are relevant for practitioners needing
to apply state-of-the-art unsupervised domain adaptation in practice. Our code
is available at https://github.com/dritter-bht/synthnet-transfer-learning.
- Abstract(参考訳): 本稿では,オブジェクト分類のための教師なしドメイン適応パイプラインを,挑戦的な産業環境で体系的に解析する。
この分野に存在する標準の自然オブジェクトベンチマークとは対照的に,本研究では,カテゴリラベルCADモデルのみが利用可能であるが,実世界の画像で分類を行う必要がある場合に,最も重要な設計選択を取り上げる。
ドメイン適応パイプラインは、VisDAベンチマークでSoTAのパフォーマンスを達成するが、より重要なのは、102の機械部品からなる新しいオープン産業データセットにおける認識性能を大幅に改善することです。
我々は、最先端の教師なしドメイン適応を実際に適用する必要のある実践者にとって、一連のガイドラインで締めくくります。
私たちのコードはhttps://github.com/dritter-bht/synthnet-transfer-learningで利用可能です。
関連論文リスト
- Adaptable Embeddings Network (AEN) [49.1574468325115]
我々はカーネル密度推定(KDE)を用いた新しいデュアルエンコーダアーキテクチャであるAdaptable Embeddings Networks (AEN)を紹介する。
AENは、再トレーニングせずに分類基準のランタイム適応を可能にし、非自己回帰的である。
アーキテクチャのプリプロセスとキャッシュ条件の埋め込み能力は、エッジコンピューティングアプリケーションやリアルタイム監視システムに最適である。
論文 参考訳(メタデータ) (2024-11-21T02:15:52Z) - Industrial Language-Image Dataset (ILID): Adapting Vision Foundation Models for Industrial Settings [0.0]
産業用言語画像データセット(ILID)をWebcrawledデータに基づいて生成するパイプラインを提案する。
本稿では,安価なILIDを学習した後に,効果的な自己指導型トランスファー学習と下流タスクの議論を行う。
論文 参考訳(メタデータ) (2024-06-14T00:06:52Z) - Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images [63.58800688320182]
ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
論文 参考訳(メタデータ) (2024-05-24T22:13:31Z) - DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - Investigation of the Impact of Synthetic Training Data in the Industrial
Application of Terminal Strip Object Detection [4.327763441385371]
本稿では,端末ストリップ物体検出の複雑な産業応用における標準対象検出器のシム・トゥ・リアル一般化性能について検討する。
評価のために300個の実画像に手動でアノテートを行った結果,どちらの領域でも同じ規模の興味の対象が重要であることがわかった。
論文 参考訳(メタデータ) (2024-03-06T18:33:27Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Domain Adaptive Nuclei Instance Segmentation and Classification via
Category-aware Feature Alignment and Pseudo-labelling [65.40672505658213]
本稿では, UDA 核インスタンス分割と分類のための新しいディープニューラルネットワークである Category-Aware 機能アライメントと Pseudo-Labelling Network (CAPL-Net) を提案する。
我々のアプローチは、最先端のUDA手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2022-07-04T07:05:06Z) - UDA-COPE: Unsupervised Domain Adaptation for Category-level Object Pose
Estimation [84.16372642822495]
我々は、textbfUDA-COPEと呼ばれるカテゴリレベルのオブジェクトポーズ推定のための教師なしドメイン適応(UDA)を提案する。
近年のマルチモーダルなUDA手法に触発された提案手法は,教師が指導する自己教師型学習手法を利用して,ターゲットドメインラベルを使わずにポーズ推定ネットワークを訓練する。
論文 参考訳(メタデータ) (2021-11-24T16:00:48Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。