論文の概要: Joint Learning of Frequency and Spatial Domains for Dense Predictions
- arxiv url: http://arxiv.org/abs/2202.08991v1
- Date: Fri, 18 Feb 2022 02:53:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-21 21:35:27.979823
- Title: Joint Learning of Frequency and Spatial Domains for Dense Predictions
- Title(参考訳): 密度予測のための周波数領域と空間領域の連成学習
- Authors: Shaocheng Jia, Wei Yao
- Abstract要約: 現在の人工ニューラルネットワークは、主に空間領域での学習プロセスを実行するが、周波数領域の学習は無視する。
周波数領域と空間領域の合同学習パラダイムを提案する。
- 参考スコア(独自算出の注目度): 0.981441019058895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current artificial neural networks mainly conduct the learning process in the
spatial domain but neglect the frequency domain learning. However, the learning
course performed in the frequency domain can be more efficient than that in the
spatial domain. In this paper, we fully explore frequency domain learning and
propose a joint learning paradigm of frequency and spatial domains. This
paradigm can take full advantage of the preponderances of frequency learning
and spatial learning; specifically, frequency and spatial domain learning can
effectively capture global and local information, respectively. Exhaustive
experiments on two dense prediction tasks, i.e., self-supervised depth
estimation and semantic segmentation, demonstrate that the proposed joint
learning paradigm can 1) achieve performance competitive to those of
state-of-the-art methods in both depth estimation and semantic segmentation
tasks, even without pretraining; and 2) significantly reduce the number of
parameters compared to other state-of-the-art methods, which provides more
chance to develop real-world applications. We hope that the proposed method can
encourage more research in cross-domain learning.
- Abstract(参考訳): 現在のニューラルネットワークは、主に空間領域で学習プロセスを行うが、周波数領域学習は無視する。
しかし、周波数領域で実施した学習コースは、空間領域で実施した学習コースよりも効率的である。
本稿では,周波数領域学習を完全に検討し,周波数領域と空間領域の合同学習パラダイムを提案する。
このパラダイムは、周波数学習と空間学習の優位性をフル活用することができる。特に、周波数領域学習と空間領域学習は、それぞれ、グローバル情報とローカル情報を効果的に捉えることができる。
自己教師型深度推定とセマンティックセグメンテーションという,2つの密集予測タスクの探索実験により,提案した共同学習パラダイムが有効であることを実証した。
1)事前訓練なしでも、深さ推定と意味分節タスクの両方において最先端の手法に匹敵する性能を達成する。
2) 他の最先端手法と比較してパラメータの数を著しく減らし,現実のアプリケーションを開発する機会を増やしている。
提案手法がクロスドメイン学習のさらなる研究を促進することを期待する。
関連論文リスト
- Frequency-Spatial Entanglement Learning for Camouflaged Object Detection [34.426297468968485]
既存の手法では、複雑な設計で空間的特徴の識別能力を最大化することにより、画素類似性の影響を減らそうとしている。
本稿では,周波数領域と空間領域の表現を共同で探索し,周波数空間の絡み合い学習(FSEL)手法を提案する。
我々の実験は、広く使われている3つのデータセットにおける包括的量的および質的比較を通じて、21以上の最先端手法によるFSELの優位性を実証した。
論文 参考訳(メタデータ) (2024-09-03T07:58:47Z) - Improving Intrusion Detection with Domain-Invariant Representation Learning in Latent Space [4.871119861180455]
マルチタスク学習を用いた2相表現学習手法を提案する。
我々は、先行空間と潜時空間の間の相互情報の最小化により、潜時空間を解き放つ。
モデルの有効性を複数のサイバーセキュリティデータセットで評価する。
論文 参考訳(メタデータ) (2023-12-28T17:24:13Z) - Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.68088298632865]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Consistency and Diversity induced Human Motion Segmentation [231.36289425663702]
本稿では,CDMS(Consistency and Diversity induced Human Motion)アルゴリズムを提案する。
我々のモデルは、ソースとターゲットデータを異なる多層特徴空間に分解する。
ソースとターゲットデータ間の領域ギャップを低減するために、マルチミューチュアル学習戦略を実行する。
論文 参考訳(メタデータ) (2022-02-10T06:23:56Z) - Unsupervised Domain-adaptive Hash for Networks [81.49184987430333]
ドメイン適応型ハッシュ学習はコンピュータビジョンコミュニティでかなりの成功を収めた。
UDAHと呼ばれるネットワークのための教師なしドメイン適応型ハッシュ学習手法を開発した。
論文 参考訳(メタデータ) (2021-08-20T12:09:38Z) - Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring
Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。
3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文 参考訳(メタデータ) (2021-07-27T14:47:24Z) - Few-Shot Learning by Integrating Spatial and Frequency Representation [25.11147383752403]
本稿では,システムの識別能力を高めるために,周波数情報を学習モデルに統合することを提案する。
周波数表現を生成するために離散コサイン変換(dct)を用い,その特徴を空間領域と周波数領域の両方から統合して分類する。
論文 参考訳(メタデータ) (2021-05-11T21:44:31Z) - Collaborative Distillation in the Parameter and Spectrum Domains for
Video Action Recognition [79.60708268515293]
本稿では,行動認識のための小型かつ効率的なネットワークの訓練方法について検討する。
周波数領域における2つの蒸留戦略,すなわち特徴スペクトルとパラメータ分布蒸留を提案する。
提案手法は,同じバックボーンを持つ最先端の手法よりも高い性能を実現することができる。
論文 参考訳(メタデータ) (2020-09-15T07:29:57Z) - Auxiliary-task learning for geographic data with autoregressive
embeddings [1.4823143667165382]
本研究では,空間データの自己回帰性に関する情報を学習プロセスに直接埋め込む手法であるSXLを提案する。
局所空間自己相関の一般的な尺度である局所モランIを用いて、局所空間効果の方向と大きさを学習する。
我々は,教師なしおよび教師なしの学習タスクにおいて,ニューラルネットワークのトレーニングを継続的に改善する方法について強調する。
論文 参考訳(メタデータ) (2020-06-18T12:16:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。