論文の概要: OneNet: A Channel-Wise 1D Convolutional U-Net
- arxiv url: http://arxiv.org/abs/2411.09838v1
- Date: Thu, 14 Nov 2024 23:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-18 15:37:28.627117
- Title: OneNet: A Channel-Wise 1D Convolutional U-Net
- Title(参考訳): OneNet:Channel-Wise 1D Convolutional U-Net
- Authors: Sanghyun Byun, Kayvan Shah, Ayushi Gang, Christopher Apton, Jacob Song, Woo Seong Chung,
- Abstract要約: エッジアプリケーションへの適合性を高めつつ,精度を維持した1次元畳み込みエンコーダを提案する。
OneNetは2D畳み込みを必要とせずに空間関係をキャプチャし、パラメータを最大47%削減する。
マスク生成タスクにおけるU-Net変種に対するアプローチをベンチマークし,精度を効果的に維持できることを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Many state-of-the-art computer vision architectures leverage U-Net for its adaptability and efficient feature extraction. However, the multi-resolution convolutional design often leads to significant computational demands, limiting deployment on edge devices. We present a streamlined alternative: a 1D convolutional encoder that retains accuracy while enhancing its suitability for edge applications. Our novel encoder architecture achieves semantic segmentation through channel-wise 1D convolutions combined with pixel-unshuffle operations. By incorporating PixelShuffle, known for improving accuracy in super-resolution tasks while reducing computational load, OneNet captures spatial relationships without requiring 2D convolutions, reducing parameters by up to 47%. Additionally, we explore a fully 1D encoder-decoder that achieves a 71% reduction in size, albeit with some accuracy loss. We benchmark our approach against U-Net variants across diverse mask-generation tasks, demonstrating that it preserves accuracy effectively. Although focused on image segmentation, this architecture is adaptable to other convolutional applications. Code for the project is available at https://github.com/shbyun080/OneNet .
- Abstract(参考訳): 多くの最先端のコンピュータビジョンアーキテクチャは、その適応性と効率的な特徴抽出のためにU-Netを利用している。
しかし、マルチレゾリューションの畳み込み設計は、エッジデバイスへのデプロイメントを制限し、大きな計算要求をもたらすことが多い。
エッジアプリケーションに適した精度を維持しつつ,精度を維持する1次元畳み込みエンコーダを提案する。
チャネルワイド1次元畳み込みと画素アンシャッフル演算を組み合わせたセマンティックセマンティックセマンティックセマンティクスを実現する。
計算負荷を削減しながら超高解像度タスクの精度を向上させることで知られているPixelShuffleを導入することで、OneNetは2D畳み込みを必要とせずに空間的関係をキャプチャし、パラメータを最大47%削減する。
さらに,サイズを71%削減できる完全1次元エンコーダデコーダについても検討した。
マスク生成タスクにおけるU-Net変種に対するアプローチをベンチマークし,精度を効果的に維持できることを実証した。
イメージセグメンテーションに重点を置いているが、このアーキテクチャは他の畳み込みアプリケーションにも適応できる。
プロジェクトのコードはhttps://github.com/shbyun080/OneNetで公開されている。
関連論文リスト
- Semantic Segmentation in Satellite Hyperspectral Imagery by Deep Learning [54.094272065609815]
本稿では1D-Justo-LiuNetという軽量な1D-CNNモデルを提案する。
1D-Justo-LiuNetは、全てのテストモデルの中で最小のモデルサイズ (4,563 パラメータ) を持つ最大精度 (0.93) を達成する。
論文 参考訳(メタデータ) (2023-10-24T21:57:59Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - OMPQ: Orthogonal Mixed Precision Quantization [64.59700856607017]
混合精度量子化は、ハードウェアの多重ビット幅演算を利用して、ネットワーク量子化の全ポテンシャルを解き放つ。
本稿では、整数プログラミングの損失と高い相関関係にあるネットワーク性の概念であるプロキシメトリックを最適化することを提案する。
このアプローチは、量子化精度にほとんど妥協することなく、検索時間と必要なデータ量を桁違いに削減する。
論文 参考訳(メタデータ) (2021-09-16T10:59:33Z) - Towards Deep and Efficient: A Deep Siamese Self-Attention Fully
Efficient Convolutional Network for Change Detection in VHR Images [28.36808011351123]
EffCDNetという非常に深く効率的なCDネットワークを提示する。
EffCDNetでは、ディープワイド畳み込みとチャネルシャッフル機構によるグループ畳み込みからなる効率的な畳み込みが導入された。
難易度の高い2つのCDデータセットにおいて、本手法は他のSOTA FCN法よりも優れている。
論文 参考訳(メタデータ) (2021-08-18T14:02:38Z) - Content-Aware Convolutional Neural Networks [98.97634685964819]
畳み込みニューラルネットワーク(CNN)は、畳み込み層の強力な特徴学習能力によって大きな成功を収めている。
本研究では,スムーズなウィンドウを自動的に検出し,元の大規模カーネルを置き換えるために1x1畳み込みカーネルを適用するContent-aware Convolution (CAC)を提案する。
論文 参考訳(メタデータ) (2021-06-30T03:54:35Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - ComBiNet: Compact Convolutional Bayesian Neural Network for Image
Segmentation [0.0]
現実世界のアプリケーションにおいて畳み込みニューラルネットワークを妨げる2つの欠陥に取り組む。
我々は、精度の限界改善を実現するいくつかのパラメータコンパクトベイズ畳み込みアーキテクチャを実証します。
このアーキテクチャは、分離可能な畳み込み、双画素、マルチスケールの特徴伝播、モンテカルロ・ドロップアウトによる不確実性毎の定量化に対するベイズ推定などのパラメータ効率の演算を組み合わせる。
論文 参考訳(メタデータ) (2021-04-14T16:33:48Z) - Towards Lossless Binary Convolutional Neural Networks Using Piecewise
Approximation [4.023728681102073]
CNNは算術演算の数とメモリストレージのサイズを大幅に減らすことができる。
しかし、単一のバイナリCNNと複数のバイナリCNNの精度劣化は、現代のアーキテクチャでは受け入れられない。
完全精度の重みとアクティベーションを近似することにより、精度の低下を低減できる複数のバイナリCNNに対するPiecewise Approximationスキームを提案する。
論文 参考訳(メタデータ) (2020-08-08T13:32:33Z) - Algorithm-hardware Co-design for Deformable Convolution [40.50544352625659]
我々は、変形可能な畳み込みを改良した効率的な物体検出ネットワークを構築し、最先端の量子化手法を用いてネットワークを定量化する。
予備実験では、変形可能な畳み込みに対する設計最適化により、ほとんど精度が損なわれず、高速化が達成できることが示されている。
論文 参考訳(メタデータ) (2020-02-19T01:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。