Fugu-MT 論文翻訳(概要): G-NAS: Generalizable Neural Architecture Search for Single Domain Generalization Object Detection

論文の概要: G-NAS: Generalizable Neural Architecture Search for Single Domain Generalization Object Detection

arxiv url: http://arxiv.org/abs/2402.04672v1
Date: Wed, 7 Feb 2024 08:57:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-08 16:02:10.396798
Title: G-NAS: Generalizable Neural Architecture Search for Single Domain Generalization Object Detection
Title（参考訳）: g-nas: 単一領域一般化オブジェクト検出のための一般化ニューラルネットワーク探索
Authors: Fan Wu, Jinling Gao, Lanqing Hong, Xinbing Wang, Chenghu Zhou, Nanyang Ye
Abstract要約: 微分可能なニューラルネットワークサーチ(NAS)は、複雑なデータフィッティングの能力が高いことで知られている。一般化可能な損失(G-loss)は、OoDを意識した目的であり、NASが過度に適合することを防ぐ。 S-DGOD都市景観データセットの実験結果から,提案したG-NASはベースライン法と比較してSOTA性能が向上することが示された。
参考スコア（独自算出の注目度）: 55.86838901572496
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we focus on a realistic yet challenging task, Single Domain Generalization Object Detection (S-DGOD), where only one source domain's data can be used for training object detectors, but have to generalize multiple distinct target domains. In S-DGOD, both high-capacity fitting and generalization abilities are needed due to the task's complexity. Differentiable Neural Architecture Search (NAS) is known for its high capacity for complex data fitting and we propose to leverage Differentiable NAS to solve S-DGOD. However, it may confront severe over-fitting issues due to the feature imbalance phenomenon, where parameters optimized by gradient descent are biased to learn from the easy-to-learn features, which are usually non-causal and spuriously correlated to ground truth labels, such as the features of background in object detection data. Consequently, this leads to serious performance degradation, especially in generalizing to unseen target domains with huge domain gaps between the source domain and target domains. To address this issue, we propose the Generalizable loss (G-loss), which is an OoD-aware objective, preventing NAS from over-fitting by using gradient descent to optimize parameters not only on a subset of easy-to-learn features but also the remaining predictive features for generalization, and the overall framework is named G-NAS. Experimental results on the S-DGOD urban-scene datasets demonstrate that the proposed G-NAS achieves SOTA performance compared to baseline methods. Codes are available at https://github.com/wufan-cse/G-NAS.
Abstract（参考訳）: 本稿では,オブジェクト検出のトレーニングに1つのソースドメインのデータしか使用できないが,複数の異なるターゲットドメインを一般化しなければならない,現実的な課題であるs-dgod(single domain generalization object detection)に焦点を当てる。 S-DGODでは、タスクの複雑さのため、高いキャパシティフィッティングと一般化能力が必要である。微分可能なニューラルネットワーク探索(NAS)は、複雑なデータフィッティングに高い能力があることで知られており、微分可能なNASを活用してS-DGODを解くことを提案する。しかし、勾配降下によって最適化されたパラメータが偏り、通常、非因果的であり、オブジェクト検出データにおける背景のような基底真理ラベルに散発的に相関する、分かり易い特徴から学習される、特徴の不均衡現象によって、深刻な過剰フィッティング問題に直面する可能性がある。その結果、特にソースドメインとターゲットドメインの間に大きなドメインギャップがある未確認のターゲットドメインに一般化することで、パフォーマンスが大幅に低下する。この問題に対処するため、OoDを意識した汎用損失(G-loss)を提案し、NASが勾配降下を利用してパラメーターを最適化するだけでなく、一般化のための残りの予測的特徴を最適化し、全体フレームワークをG-NASと命名する。 S-DGOD都市景観データセットの実験結果から,提案したG-NASはベースライン法と比較してSOTA性能が向上することが示された。コードはhttps://github.com/wufan-cse/g-nasで入手できる。

関連論文リスト

Style-Adaptive Detection Transformer for Single-Source Domain Generalized Object Detection [7.768332621617199]
オブジェクト検出における単一ソースドメイン一般化(SDG)は、ソースドメインのデータのみを使用して検出器を開発することを目的としている。ドメイン不変な特徴を抽出する際,検出器を誘導するオブジェクト認識型コントラスト学習モジュールを提案する。実験は、5つの異なる気象シナリオにおけるSA-DETRの優れた性能と一般化能力を示す。
論文参考訳（メタデータ） (2025-04-29T07:38:37Z)
GBlobs: Explicit Local Structure via Gaussian Blobs for Improved Cross-Domain LiDAR-based 3D Object Detection [12.282805218676208]
ドメイン一般化は、そのようなドメインシフトに不変な検出器を訓練することによってこれを緩和することを目的としている。本稿では,特にガウスブロブ(GBlob)で点雲近傍を符号化することで,DGの明示的な局所点雲構造を利用することを提案する。提案する定式化は極めて効率的であり,追加のパラメータを必要としない。
論文参考訳（メタデータ） (2025-03-11T17:29:56Z)
Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文参考訳（メタデータ） (2024-12-18T13:03:00Z)
PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.00221501105788]
領域一般化(DG)は、最近、点雲分類の一般化性を改善するために研究されている。本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文参考訳（メタデータ） (2024-08-24T12:53:48Z)
Disentangling Masked Autoencoders for Unsupervised Domain Generalization [57.56744870106124]
教師なしの領域一般化は急速に注目されているが、まだ十分に研究されていない。 Disentangled Masked Auto (DisMAE) は、本質的な特徴を忠実に示す不整合表現を発見することを目的としている。 DisMAEは、セマンティックで軽量な変分エンコーダを備えた非対称なデュアルブランチアーキテクチャを共同で訓練する。
論文参考訳（メタデータ） (2024-07-10T11:11:36Z)
DiffusionNAG: Predictor-guided Neural Architecture Generation with Diffusion Models [56.584561770857306]
本研究では拡散モデルに基づく新しい条件付きニューラルネットワーク生成(NAG)フレームワークDiffusionNAGを提案する。具体的には、ニューラルネットワークを有向グラフとみなし、それらを生成するためのグラフ拡散モデルを提案する。本研究では,2つの予測型NAS(Transferable NAS)とベイズ最適化(BO)に基づくNAS(Bayesian Optimization)の2つのシナリオにおいて,DiffusionNAGの有効性を検証する。 BOベースのアルゴリズムに統合されると、DiffusionNAGは既存のBOベースのNASアプローチ、特にImageNet 1Kデータセット上の大規模なMobileNetV3検索スペースよりも優れている。
論文参考訳（メタデータ） (2023-05-26T13:58:18Z)
SUG: Single-dataset Unified Generalization for 3D Point Cloud Classification [44.27324696068285]
トレーニング済みのソースモデルが直面する予期せぬ領域差を軽減するために,単一データセット統一一般化(SUG)フレームワークを提案する。具体的には、まず、学習した表現をドメインに依存しない識別性に制約できるマルチグラニュアルサブドメインアライメント(MSA)法を設計する。次にSDA(Sample-level Domain-Aware Attention)戦略を示し、異なるサブドメインから簡単に適応できるサンプルを選択的に強化する。
論文参考訳（メタデータ） (2023-05-16T04:36:04Z)
GeNAS: Neural Architecture Search with Better Generalization [14.92869716323226]
最近のニューラルアーキテクチャサーチ(NAS)アプローチは、対象データに対して優れたネットワークを見つけるために、検証損失または精度に依存している。そこで本研究では,より一般化した探索型アーキテクチャのためのニューラルアーキテクチャ探索手法について検討する。
論文参考訳（メタデータ） (2023-05-15T12:44:54Z)
CLIP the Gap: A Single Domain Generalization Approach for Object Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文参考訳（メタデータ） (2023-01-13T12:01:18Z)
Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文参考訳（メタデータ） (2022-05-27T12:29:11Z)
Understanding and Accelerating Neural Architecture Search with Training-Free and Theory-Grounded Metrics [117.4281417428145]
この作業は、ニューラルネットワークサーチ(NAS)のための原則的で統一的なトレーニングフリーフレームワークの設計を目標としている。 NASは、高性能ニューラルネットワークの発見を自動化するために爆発的に研究されてきたが、資源消費に悩まされ、しばしば訓練や近似によって探索バイアスを引き起こす。我々は,検索ネットワークの「TEG」特性を解消し,NASを理解し,加速するための統一的な枠組みを提案する。
論文参考訳（メタデータ） (2021-08-26T17:52:07Z)
Generic Neural Architecture Search via Regression [27.78105839644199]
我々は、ジェネリックNAS(GenNAS)と呼ばれる新規で汎用的なニューラルアーキテクチャサーチ(NAS)フレームワークを提案する。 GenNASはタスク固有のラベルを使用せず、代わりに、アーキテクチャ評価のために手動で設計された合成信号基盤のセットにtextitregressionを採用する。次に,下流タスク固有のラベルを用いた合成信号の組み合わせを最適化するタスクの自動探索を提案する。
論文参考訳（メタデータ） (2021-08-04T08:21:12Z)
Generative Adversarial Neural Architecture Search [21.05611902967155]
理論的に証明可能な収束保証を備えたGA-NAS(Generative Adversarial NAS)を提案する。 GA-NASは、他のNAS手法によって既に最適化されているベースラインを改善するために利用できることを示す。
論文参考訳（メタデータ） (2021-05-19T18:54:44Z)
Cross-Domain Structure Preserving Projection for Heterogeneous Domain Adaptation [23.18781318003242]
Heterogeneous Domain Adaptation (HDA)は、ソースドメインとターゲットドメインのデータが異なるモダリティを持つ転送学習問題に対処する。伝統的なドメイン適応アルゴリズムは、ソースとターゲットサンプルの表現が同じ特徴空間にあると仮定する。本稿では,HDAのためのCDSPP(Cross-Domain Structure Preserving Projection)アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-04-26T16:22:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。