論文の概要: Visual Domain Adaptation for Monocular Depth Estimation on
Resource-Constrained Hardware
- arxiv url: http://arxiv.org/abs/2108.02671v1
- Date: Thu, 5 Aug 2021 15:10:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-06 14:50:36.933889
- Title: Visual Domain Adaptation for Monocular Depth Estimation on
Resource-Constrained Hardware
- Title(参考訳): 資源制約ハードウェアにおける単眼深度推定のための視覚領域適応
- Authors: Julia Hornauer, Lazaros Nalpantidis, Vasileios Belagiannis
- Abstract要約: 我々は、ビジュアルドメイン適応の文脈において、リソース制約のあるハードウェア上でディープニューラルネットワークをトレーニングする問題に対処する。
本稿では,限られたリソースを持つデバイス上での学習に適応した逆学習手法を提案する。
実験の結果,視覚領域適応は効率的なネットワークアーキテクチャとトレーニングセットにのみ関係していることがわかった。
- 参考スコア(独自算出の注目度): 3.7399856406582086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world perception systems in many cases build on hardware with limited
resources to adhere to cost and power limitations of their carrying system.
Deploying deep neural networks on resource-constrained hardware became possible
with model compression techniques, as well as efficient and hardware-aware
architecture design. However, model adaptation is additionally required due to
the diverse operation environments. In this work, we address the problem of
training deep neural networks on resource-constrained hardware in the context
of visual domain adaptation. We select the task of monocular depth estimation
where our goal is to transform a pre-trained model to the target's domain data.
While the source domain includes labels, we assume an unlabelled target domain,
as it happens in real-world applications. Then, we present an adversarial
learning approach that is adapted for training on the device with limited
resources. Since visual domain adaptation, i.e. neural network training, has
not been previously explored for resource-constrained hardware, we present the
first feasibility study for image-based depth estimation. Our experiments show
that visual domain adaptation is relevant only for efficient network
architectures and training sets at the order of a few hundred samples. Models
and code are publicly available.
- Abstract(参考訳): 実世界の知覚システムは、輸送システムのコストと電力制限に固執するため、限られたリソースを持つハードウェア上に構築されることが多い。
リソースに制約のあるハードウェアにディープニューラルネットワークをデプロイすることは、モデル圧縮技術と効率的なハードウェア対応アーキテクチャ設計によって可能になった。
しかし、多様な運用環境のためにモデル適応も必要である。
本稿では,視覚領域適応の文脈において,リソース制約ハードウェア上でディープニューラルネットワークをトレーニングする問題に対処する。
我々は,事前学習したモデルを対象のドメインデータに変換することを目的とした単眼深度推定のタスクを選択する。
ソースドメインにはラベルが含まれているが、実際のアプリケーションで発生するように、ラベルのないターゲットドメインを仮定する。
次に,限られたリソースでデバイス上でのトレーニングに適応した,敵対的学習手法を提案する。
視覚領域適応以来、すなわち、
ニューラルネットワークトレーニングは、これまでリソース制約のあるハードウェアとして研究されていないが、画像に基づく深度推定のための最初の実現可能性研究を示す。
実験では,効率的なネットワークアーキテクチャとトレーニングセットにのみ,数百サンプルの順序で視覚領域適応が関与することを示した。
モデルとコードは公開されている。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Deep Learning Techniques for Visual Counting [0.13537117504260618]
静止画像やビデオフレーム中のオブジェクトをカウントするディープラーニング(DL)技術について検討・拡張を行った。
特に、現在のDLベースのソリューションをトレーニングするために必要なデータ不足に関する課題に取り組みました。
論文 参考訳(メタデータ) (2022-06-07T06:20:40Z) - Engineering flexible machine learning systems by traversing
functionally-invariant paths [1.4999444543328289]
ニューラルネットワークのフレキシブルかつ連続的な適応を提供する微分幾何学フレームワークを導入する。
重み空間における測地路に沿った移動として適応を定式化し,二次目的に対応するネットワークを探索する。
控えめな計算資源を用いて、FIPアルゴリズムは連続的な学習とスパーシフィケーションタスクにおけるアートパフォーマンスの状態を同等に達成する。
論文 参考訳(メタデータ) (2022-04-30T19:44:56Z) - LCS: Learning Compressible Subspaces for Adaptive Network Compression at
Inference Time [57.52251547365967]
本稿では,ニューラルネットワークの「圧縮可能な部分空間」を訓練する手法を提案する。
構造的・非構造的空間に対する推定時間における微粒な精度・効率のトレードオフを任意に達成するための結果を示す。
我々のアルゴリズムは、可変ビット幅での量子化にまで拡張し、個別に訓練されたネットワークと同等の精度を実現する。
論文 参考訳(メタデータ) (2021-10-08T17:03:34Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - Automated Search for Resource-Efficient Branched Multi-Task Networks [81.48051635183916]
我々は,多タスクニューラルネットワークにおける分岐構造を自動的に定義する,微分可能なニューラルネットワーク探索に根ざした原理的アプローチを提案する。
本手法は,限られた資源予算内で高い性能の分岐構造を見いだすことができる。
論文 参考訳(メタデータ) (2020-08-24T09:49:19Z) - Multi-task pre-training of deep neural networks for digital pathology [8.74883469030132]
私たちはまず、多くのデジタル病理データセットを22の分類タスクと約900kの画像のプールに組み立て、変換しました。
特徴抽出器として使用されるモデルは、ImageNet事前訓練されたモデルよりも大幅に改善されるか、同等のパフォーマンスを提供するかを示す。
論文 参考訳(メタデータ) (2020-05-05T08:50:17Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z) - Modality Compensation Network: Cross-Modal Adaptation for Action
Recognition [77.24983234113957]
異なるモダリティの関係を探索するためのモダリティ補償ネットワーク(MCN)を提案する。
我々のモデルは、適応表現学習を実現するために、モーダリティ適応ブロックによって、ソースおよび補助モーダリティからのデータをブリッジする。
実験の結果,MCNは4つの広く使用されている行動認識ベンチマークにおいて,最先端のアプローチよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-01-31T04:51:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。