論文の概要: Magnifying Networks for Images with Billions of Pixels
- arxiv url: http://arxiv.org/abs/2112.06121v1
- Date: Sun, 12 Dec 2021 02:36:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 08:32:40.361940
- Title: Magnifying Networks for Images with Billions of Pixels
- Title(参考訳): 数十億画素の画像を拡大するネットワーク
- Authors: Neofytos Dimitriou and Ognjen Arandjelovic
- Abstract要約: 我々は,入力画像サイズとは無関係にエンドツーエンドにトレーニング可能な新しいネットワークMagnifying Network(MagNet)を導入する。
MagNetsは、畳み込みニューラルネットワークと微分可能な空間変換器を新しい方法で組み合わせて、何十億ピクセルもの画像からナビゲートし、うまく学習する。
- 参考スコア(独自算出の注目度): 19.06796946564999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The shift towards end-to-end deep learning has brought unprecedented advances
in many areas of computer vision. However, there are cases where the input
images are excessively large, deeming end-to-end approaches impossible. In this
paper, we introduce a new network, the Magnifying Network (MagNet), which can
be trained end-to-end independently of the input image size. MagNets combine
convolutional neural networks with differentiable spatial transformers, in a
new way, to navigate and successfully learn from images with billions of
pixels. Drawing inspiration from the magnifying nature of an ordinary
brightfield microscope, a MagNet processes a downsampled version of an image,
and without supervision learns how to identify areas that may carry value to
the task at hand, upsamples them, and recursively repeats this process on each
of the extracted patches. Our results on the publicly available Camelyon16 and
Camelyon17 datasets first corroborate to the effectiveness of MagNets and the
proposed optimization framework and second, demonstrate the advantage of
Magnets' built-in transparency, an attribute of utmost importance for critical
processes such as medical diagnosis.
- Abstract(参考訳): エンドツーエンドのディープラーニングへの移行は、コンピュータビジョンの多くの分野で前例のない進歩をもたらした。
しかし、入力画像が過剰に大きい場合もあり、エンドツーエンドのアプローチは不可能である。
本稿では,入力画像サイズによらず,エンドツーエンドでトレーニングできる新たなネットワークであるmagnifying network(magnet)を提案する。
MagNetは、畳み込みニューラルネットワークと微分可能な空間変換器を組み合わせることで、数十億ピクセルの画像をナビゲートし、うまく学習する。
通常の明るい視野顕微鏡の拡大特性からインスピレーションを得て、MagNetはイメージのサンプル化されたバージョンを処理し、監督なしでタスクに価値をもたらす可能性のある領域の特定方法を学び、それらをアップサンプリングし、抽出した各パッチに対して再帰的にこのプロセスを繰り返す。
camelyon16とcamlyon17データセットの公開結果から,まずマグネットの有効性と提案する最適化フレームワークにコラボレートし,次に,医療診断などの重要なプロセスにおいて最重要となるマグネットの透明性の利点を実証した。
関連論文リスト
- Mew: Multiplexed Immunofluorescence Image Analysis through an Efficient Multiplex Network [84.88767228835928]
マルチプレックスネットワークのレンズを通してmIF画像を効率的に処理する新しいフレームワークであるMewを紹介する。
Mew は、幾何学情報のための Voronoi ネットワークと、セルワイドの均一性を捉えるセル型ネットワークという、2つの異なる層からなる多重ネットワークを革新的に構築する。
このフレームワークは、トレーニング中にグラフ全体を処理できるスケーラブルで効率的なグラフニューラルネットワーク(GNN)を備えている。
論文 参考訳(メタデータ) (2024-07-25T08:22:30Z) - LMBF-Net: A Lightweight Multipath Bidirectional Focal Attention Network for Multifeatures Segmentation [15.091476025563528]
網膜疾患は、早期に診断や治療を受けなければ、両眼で不可逆的な視力喪失を引き起こす可能性がある。
多くのラベルや属性で網膜画像をセグメント化するための現在のディープラーニング技術は、検出精度と一般性に乏しい。
本稿では,多機能セグメンテーションのためのマルチパス畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-03T07:37:09Z) - Learning Multimodal Volumetric Features for Large-Scale Neuron Tracing [72.45257414889478]
オーバーセグメントニューロン間の接続を予測し,人間の作業量を削減することを目的としている。
最初はFlyTracingという名前のデータセットを構築しました。
本稿では,高密度なボリュームEM画像の埋め込みを生成するための,新しい接続性を考慮したコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-05T19:45:12Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Convolutional Neural Network with Convolutional Block Attention Module
for Finger Vein Recognition [4.035753155957698]
指静脈認識のための畳み込みブロックアテンションモジュール(CBAM)を用いた軽量畳み込みニューラルネットワークを提案する。
実験は2つの公開データベース上で実施され,本手法がマルチモーダル・フィンガー認識において安定かつ高精度で頑健な性能を実現することを示す。
論文 参考訳(メタデータ) (2022-02-14T12:59:23Z) - Leveraging Image Complexity in Macro-Level Neural Network Design for
Medical Image Segmentation [3.974175960216864]
画像の複雑さは、与えられたデータセットに最適なものを選択するためのガイドラインとして利用できることを示す。
高複雑性データセットの場合、元のイメージ上で実行される浅いネットワークは、ダウンサンプリングされたイメージ上で実行されるディープネットワークよりもセグメンテーション結果が優れている可能性がある。
論文 参考訳(メタデータ) (2021-12-21T09:49:47Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - Robust and Generalizable Visual Representation Learning via Random
Convolutions [44.62476686073595]
ニューラルネットワークのロバスト性は、ランダム畳み込みをデータ拡張として利用することにより、大幅に改善できることを示す。
我々の手法は、より堅牢な事前訓練された視覚表現を提供することで、下流タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2020-07-25T19:52:25Z) - Neural Sparse Representation for Image Restoration [116.72107034624344]
スパース符号化に基づく画像復元モデルの堅牢性と効率に触発され,深部ネットワークにおけるニューロンの空間性について検討した。
本手法は,隠れたニューロンに対する空間的制約を構造的に強制する。
実験により、複数の画像復元タスクのためのディープニューラルネットワークではスパース表現が不可欠であることが示されている。
論文 参考訳(メタデータ) (2020-06-08T05:15:17Z) - Memory-efficient Learning for Large-scale Computational Imaging [3.255705667028885]
本稿では,大規模イメージングシステムにおけるデータ駆動設計を実現するために,ネットワークの可逆性を利用したメモリ効率の学習手法を提案する。
提案手法は,小型圧縮センシングの例と,マルチチャネル磁気共鳴イメージングと超高分解能光学顕微鏡の2つの大規模実世界のシステムについて実証する。
論文 参考訳(メタデータ) (2020-03-11T23:08:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。