論文の概要: CCDepth: A Lightweight Self-supervised Depth Estimation Network with Enhanced Interpretability
- arxiv url: http://arxiv.org/abs/2409.19933v1
- Date: Mon, 30 Sep 2024 04:19:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 16:47:30.392104
- Title: CCDepth: A Lightweight Self-supervised Depth Estimation Network with Enhanced Interpretability
- Title(参考訳): 軽量自己教師型深度推定ネットワークCCDepth
- Authors: Xi Zhang, Yaru Xue, Shaocheng Jia, Xin Pei,
- Abstract要約: 本研究では,畳み込みニューラルネットワーク(CNN)とホワイトボックスCRATEネットワークを組み合わせた,ハイブリッド型自己教師型深度推定ネットワークCCDepthを提案する。
このネットワークは,CNNとCRATEモジュールを用いて画像中の局所的およびグローバルな情報を抽出し,学習効率の向上とモデルサイズ削減を実現する。
- 参考スコア(独自算出の注目度): 11.076431337488973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised depth estimation, which solely requires monocular image sequence as input, has become increasingly popular and promising in recent years. Current research primarily focuses on enhancing the prediction accuracy of the models. However, the excessive number of parameters impedes the universal deployment of the model on edge devices. Moreover, the emerging neural networks, being black-box models, are difficult to analyze, leading to challenges in understanding the rationales for performance improvements. To mitigate these issues, this study proposes a novel hybrid self-supervised depth estimation network, CCDepth, comprising convolutional neural networks (CNNs) and the white-box CRATE (Coding RAte reduction TransformEr) network. This novel network uses CNNs and the CRATE modules to extract local and global information in images, respectively, thereby boosting learning efficiency and reducing model size. Furthermore, incorporating the CRATE modules into the network enables a mathematically interpretable process in capturing global features. Extensive experiments on the KITTI dataset indicate that the proposed CCDepth network can achieve performance comparable with those state-of-the-art methods, while the model size has been significantly reduced. In addition, a series of quantitative and qualitative analyses on the inner features in the CCDepth network further confirm the effectiveness of the proposed method.
- Abstract(参考訳): 近年,入力として単眼画像のみを必要とする自己監督深度推定が普及し,将来性が高まっている。
現在の研究は主にモデルの予測精度の向上に焦点を当てている。
しかし、過剰な数のパラメータは、エッジデバイスへのモデルの普遍的な展開を妨げる。
さらに、ブラックボックスモデルである新興ニューラルネットワークの分析は困難であり、パフォーマンス改善の合理性を理解する上での課題となっている。
これらの問題を緩和するために、畳み込みニューラルネットワーク(CNN)とホワイトボックスCRATE(Coding RAte reduction TransformEr)からなる新しいハイブリッド自己教師型深度推定ネットワークCCDepthを提案する。
このネットワークは,CNNとCRATEモジュールを用いて画像中の局所的およびグローバルな情報を抽出し,学習効率の向上とモデルサイズ削減を実現する。
さらに、CRATEモジュールをネットワークに組み込むことで、グローバルな特徴を捉える数学的に解釈可能なプロセスが可能になる。
KITTIデータセットの大規模な実験は、提案したCCDepthネットワークがこれらの最先端手法に匹敵する性能を達成できることを示しているが、モデルサイズは大幅に縮小されている。
さらに,CCDepthネットワークの内部特性の定量的および定性的な分析により,提案手法の有効性をさらに確認した。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Node Centrality Approximation For Large Networks Based On Inductive
Graph Neural Networks [2.4012886591705738]
ネットワーク分析において、クローズネス中央度(CC)とブロードネス中央度(BC)が重要な指標である。
大規模なネットワーク上での実践的な実装は、その高速な複雑さのため、計算的に要求される。
本稿では,CNCA-IGEモデルを提案する。CNCA-IGEモデルは,CCやBCのメトリクスに基づいてノードをランク付けするインダクティブグラフエンコーダ・デコーダモデルである。
論文 参考訳(メタデータ) (2024-03-08T01:23:12Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Enhancing Rock Image Segmentation in Digital Rock Physics: A Fusion of
Generative AI and State-of-the-Art Neural Networks [5.089732183029123]
デジタル・ロック物理学において、CTとSEMスキャンから微細構造を分析することは、ポーシティーや細孔接続性などの特性を推定するために重要である。
しきい値やCNNのような従来のセグメンテーション手法は、しばしば岩の微細構造を正確に詳細に記述するに足りず、ノイズを生じやすい。
U-Netはセグメンテーションの精度を改善したが、複雑な細孔形状のため、多くの専門家による注釈付きサンプルを必要とした。
我々の研究は、これらの制限を克服するために、高度な生成AIモデルである拡散モデルを用いていた。
TransU-Netは、デジタルロック物理学の新しい標準を設定し、将来の地球科学と工学のブレークスルーの道を開く。
論文 参考訳(メタデータ) (2023-11-10T14:24:50Z) - A New PHO-rmula for Improved Performance of Semi-Structured Networks [0.0]
本研究では,SSNにおけるモデルコンポーネントのコントリビューションを適切に識別する手法が,最適ネットワーク推定に繋がることを示す。
モデルコンポーネントの識別性を保証し,予測品質を向上する非侵襲的ポストホック化(PHO)を提案する。
我々の理論的な知見は、数値実験、ベンチマーク比較、およびCOVID-19感染症に対する現実の応用によって裏付けられている。
論文 参考訳(メタデータ) (2023-06-01T10:23:28Z) - Generalization and Estimation Error Bounds for Model-based Neural
Networks [78.88759757988761]
スパースリカバリのためのモデルベースネットワークの一般化能力は、通常のReLUネットワークよりも優れていることを示す。
我々は,高一般化を保証したモデルベースネットワークの構築を可能にする実用的な設計規則を導出する。
論文 参考訳(メタデータ) (2023-04-19T16:39:44Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Ensembles of Spiking Neural Networks [0.3007949058551534]
本稿では,最先端の結果を生み出すスパイクニューラルネットワークのアンサンブルを構築する方法について述べる。
MNIST, NMNIST, DVS Gestureデータセットの分類精度は98.71%, 100.0%, 99.09%である。
我々は、スパイキングニューラルネットワークをGLM予測器として形式化し、ターゲットドメインに適した表現を識別する。
論文 参考訳(メタデータ) (2020-10-15T17:45:18Z) - Modeling from Features: a Mean-field Framework for Over-parameterized
Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。
このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。
本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文 参考訳(メタデータ) (2020-07-03T01:37:16Z) - Iterative Network for Image Super-Resolution [69.07361550998318]
単一画像超解像(SISR)は、最近の畳み込みニューラルネットワーク(CNN)の発展により、大幅に活性化されている。
本稿では、従来のSISRアルゴリズムに関する新たな知見を提供し、反復最適化に依存するアプローチを提案する。
反復最適化の上に,新しい反復型超解像ネットワーク (ISRN) を提案する。
論文 参考訳(メタデータ) (2020-05-20T11:11:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。