論文の概要: Automatically Searching for U-Net Image Translator Architecture
- arxiv url: http://arxiv.org/abs/2002.11581v1
- Date: Wed, 26 Feb 2020 16:05:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 15:34:50.878721
- Title: Automatically Searching for U-Net Image Translator Architecture
- Title(参考訳): U-Net画像トランスレータアーキテクチャの自動検索
- Authors: Han Shu and Yunhe Wang
- Abstract要約: U-Netのようなイメージトランスレータの古典的なネットワークアーキテクチャは、バイオメディカルイメージセグメンテーションのような他のビジョンタスクから借用されている。
画像トランスレータのための自動アーキテクチャ探索手法を提案する。
- 参考スコア(独自算出の注目度): 30.407871061066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image translators have been successfully applied to many important low level
image processing tasks. However, classical network architecture of image
translator like U-Net, is borrowed from other vision tasks like biomedical
image segmentation. This straightforward adaptation may not be optimal and
could cause redundancy in the network structure. In this paper, we propose an
automatic architecture searching method for image translator. By utilizing
evolutionary algorithm, we investigate a more efficient network architecture
which costs less computation resources and achieves better performance than the
original one. Extensive qualitative and quantitative experiments are conducted
to demonstrate the effectiveness of the proposed method. Moreover, we
transplant the searched network architecture to other datasets which are not
involved in the architecture searching procedure. Efficiency of the searched
architecture on these datasets further demonstrates the generalization of the
method.
- Abstract(参考訳): 画像トランスレータは多くの重要な低レベル画像処理タスクにうまく適用されている。
しかし、U-Netのようなイメージトランスレータの古典的なネットワークアーキテクチャは、バイオメディカルイメージセグメンテーションのような他のビジョンタスクから借用されている。
この直接的な適応は最適ではなく、ネットワーク構造に冗長性を引き起こす可能性がある。
本稿では,画像翻訳のための自動アーキテクチャ探索手法を提案する。
進化的アルゴリズムを用いることで,計算リソースを削減し,従来のネットワークアーキテクチャよりも優れた性能を実現する,より効率的なネットワークアーキテクチャを探索する。
提案手法の有効性を実証するために, 大規模定性的および定量的実験を行った。
さらに、検索されたネットワークアーキテクチャを、アーキテクチャ検索手順にかかわらない他のデータセットに移植する。
これらのデータセットに対する探索アーキテクチャの効率性はさらに、この手法の一般化を実証している。
関連論文リスト
- EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [54.99121380536659]
眼球運動バイオメトリックスは、高い安全性の識別により注目されている。
深層学習(DL)モデルは近年,眼球運動認識に成功している。
DLアーキテクチャはまだ人間の事前知識によって決定されている。
眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
論文 参考訳(メタデータ) (2024-09-22T13:11:08Z) - Pruning-as-Search: Efficient Neural Architecture Search via Channel
Pruning and Structural Reparameterization [50.50023451369742]
プルーニング・アズ・サーチ(Pruning-as-Search、PaS)は、必要なサブネットワークを自動的に効率的に検索するエンドツーエンドのプルーニング手法である。
提案したアーキテクチャは,ImageNet-1000分類タスクにおいて,1.0%$ Top-1精度で先行技術より優れていた。
論文 参考訳(メタデータ) (2022-06-02T17:58:54Z) - HASA: Hybrid Architecture Search with Aggregation Strategy for
Echinococcosis Classification and Ovary Segmentation in Ultrasound Images [0.0]
超音波(US)画像分類と分割のためのハイブリッドNASフレームワークを提案する。
本手法は、上記の米国画像分類および分割タスクに対して、より強力で軽量なモデルを生成することができる。
論文 参考訳(メタデータ) (2022-04-14T01:43:00Z) - GLiT: Neural Architecture Search for Global and Local Image Transformer [114.8051035856023]
画像認識のためのトランスフォーマーアーキテクチャを改良するために,最初のニューラルアーキテクチャサーチ(NAS)手法を提案する。
画像分類では,ResNetファミリーやベースラインのViTよりも,より差別的で効率的なトランスフォーマー変種を見つけることができる。
論文 参考訳(メタデータ) (2021-07-07T00:48:09Z) - Towards Efficient Cross-Modal Visual Textual Retrieval using
Transformer-Encoder Deep Features [10.163477961551592]
クロスモーダル検索は、現代の検索エンジンにおいて重要な機能である。
本稿では,画像文検索に焦点をあてる。
我々は最近導入されたTERNアーキテクチャを画像文特徴抽出器として利用する。
論文 参考訳(メタデータ) (2021-06-01T10:11:46Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - NAS-DIP: Learning Deep Image Prior with Neural Architecture Search [65.79109790446257]
近年の研究では、深部畳み込みニューラルネットワークの構造が、以前に構造化された画像として利用できることが示されている。
我々は,より強い画像の先行を捉えるニューラルネットワークの探索を提案する。
既存のニューラルネットワーク探索アルゴリズムを利用して,改良されたネットワークを探索する。
論文 参考訳(メタデータ) (2020-08-26T17:59:36Z) - Stage-Wise Neural Architecture Search [65.03109178056937]
ResNetやNASNetのような現代の畳み込みネットワークは、多くのコンピュータビジョンアプリケーションで最先端の結果を得た。
これらのネットワークは、同じ解像度で表現を操作するレイヤのセットであるステージで構成されている。
各ステージにおけるレイヤー数の増加はネットワークの予測能力を向上させることが示されている。
しかし、結果として得られるアーキテクチャは、浮動小数点演算、メモリ要求、推論時間の観点から計算的に高価になる。
論文 参考訳(メタデータ) (2020-04-23T14:16:39Z) - Transformer Reasoning Network for Image-Text Matching and Retrieval [14.238818604272751]
マルチモーダルな大規模情報検索作業における画像テキストマッチングの問題点を考察する。
トランスフォーマー推論ネットワーク(TERN, Transformer Reasoning Network, TERN)は, 現代の関係認識型自己認識型トランスフォーマー(Transformer)のアーキテクチャである。
TERNは2つの異なるモダリティを別々に推論し、最終的な共通抽象概念空間を強制することができる。
論文 参考訳(メタデータ) (2020-04-20T09:09:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。