論文の概要: Bessel Equivariant Networks for Inversion of Transmission Effects in
Multi-Mode Optical Fibres
- arxiv url: http://arxiv.org/abs/2207.12849v1
- Date: Tue, 26 Jul 2022 12:29:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-27 13:28:41.901757
- Title: Bessel Equivariant Networks for Inversion of Transmission Effects in
Multi-Mode Optical Fibres
- Title(参考訳): 多モード光ファイバーの伝送効果インバージョンのためのベッセル等価ネットワーク
- Authors: Joshua Mitton, Simon Peter Mekhail, Miles Padgett, Daniele Faccio,
Marco Aversa, Roderick Murray-Smith
- Abstract要約: 我々は,多モード光ファイバーの伝送効果を反転させるタスクを解くための新しいタイプのモデルを開発した。
入力パターンとスペックルパターンの空間配置の違いを考慮し, ファイバースペックルパターンに存在することが知られているアジムタール相関を用いる。
このモデルは、マルチモード光ファイバーを用いて、これまで達成できなかった解像度の撮像にスケールでき、256倍256ドルピクセル画像で実証される。
- 参考スコア(独自算出の注目度): 3.2981146586835703
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop a new type of model for solving the task of inverting the
transmission effects of multi-mode optical fibres through the construction of
an $\mathrm{SO}^{+}(2,1)$-equivariant neural network. This model takes
advantage of the of the azimuthal correlations known to exist in fibre speckle
patterns and naturally accounts for the difference in spatial arrangement
between input and speckle patterns. In addition, we use a second
post-processing network to remove circular artifacts, fill gaps, and sharpen
the images, which is required due to the nature of optical fibre transmission.
This two stage approach allows for the inspection of the predicted images
produced by the more robust physically motivated equivariant model, which could
be useful in a safety-critical application, or by the output of both models,
which produces high quality images. Further, this model can scale to previously
unachievable resolutions of imaging with multi-mode optical fibres and is
demonstrated on $256 \times 256$ pixel images. This is a result of improving
the trainable parameter requirement from $\mathcal{O}(N^4)$ to
$\mathcal{O}(m)$, where $N$ is pixel size and $m$ is number of fibre modes.
Finally, this model generalises to new images, outside of the set of training
data classes, better than previous models.
- Abstract(参考訳): 本研究では, マルチモード光ファイバーの伝送効果を, $\mathrm{so}^{+}(2,1)$-equivariantニューラルネットワークの構築により反転させるという課題を解決するための新しいモデルを開発した。
このモデルは、ファイバースペックルパターンに存在することが知られている方位相関を利用して、入力とスペックルパターンの空間配置の違いを自然に考慮する。
さらに,2番目の後処理ネットワークを用いて円形のアーティファクトを除去し,ギャップを埋め,画像のシャープ化を行う。
この2段階のアプローチにより、より強固な身体的モチベーションを持つ同変モデルによって生成された予測画像の検査が可能になる。
さらに、このモデルは、マルチモードの光ファイバーでこれまで達成できなかった解像度にスケールでき、256 \times 256$のピクセルイメージで実演できる。
これは、トレーニング可能なパラメータ要件を$\mathcal{O}(N^4)$から$\mathcal{O}(m)$に改善した結果である。
最後に、このモデルは、トレーニングデータクラスのセット以外で、以前のモデルよりも優れた新しいイメージに一般化する。
関連論文リスト
- MaskBit: Embedding-free Image Generation via Bit Tokens [54.827480008982185]
我々は,VQGANの実証的,体系的な検討を行い,近代化されたVQGANを導いた。
ビットトークンを直接操作する新しい埋め込み不要な生成ネットワークは、ImageNet 256x256ベンチマークで1.52の最先端FIDを達成し、わずか305Mパラメータのコンパクトなジェネレータモデルである。
論文 参考訳(メタデータ) (2024-09-24T16:12:12Z) - Lightweight single-image super-resolution network based on dual paths [0.552480439325792]
ディープラーニングのシングルイメージ超解像(SISR)アルゴリズムには,畳み込みニューラルネットワークとTransformerに基づく2つのモデルがある。
本稿では,2方向相補的畳み込みとトランスフォーマーに基づく,軽量なマルチスケール機能融合ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2024-09-10T15:31:37Z) - I$^2$SB: Image-to-Image Schr\"odinger Bridge [87.43524087956457]
Image-to-Image Schr"odinger Bridge (I$2$SB) は条件拡散モデルの新しいクラスである。
I$2$SB は、2つの与えられた分布間の非線形拡散過程を直接学習する。
I$2$SBは、より解釈可能な生成過程を持つ標準条件拡散モデルを超えることを示す。
論文 参考訳(メタデータ) (2023-02-12T08:35:39Z) - Uncovering the Disentanglement Capability in Text-to-Image Diffusion
Models [60.63556257324894]
画像生成モデルの重要な特性は、異なる属性をアンタングルする能力である。
本稿では,2つのテキスト埋め込みの混合重みをスタイルマッチングとコンテンツ保存に最適化した,シンプルで軽量な画像編集アルゴリズムを提案する。
実験により,提案手法は拡散モデルに基づく画像編集アルゴリズムよりも優れた性能で,幅広い属性を修正可能であることが示された。
論文 参考訳(メタデータ) (2022-12-16T19:58:52Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z) - FAS-UNet: A Novel FAS-driven Unet to Learn Variational Image
Segmentation [3.741136641573471]
本稿では,そのモデルとアルゴリズムを利用してマルチスケールの特徴を抽出する新しい変動モデルインフォームドネットワーク(FAS-Unet)を提案する。
提案するネットワークは,画像データと数理モデルを統合し,いくつかの畳み込みカーネルを学習して実装する。
実験結果から,提案するFAS-Unetは,定性的,定量的,モデル複雑度評価において,他の最先端手法と非常に競合することが示された。
論文 参考訳(メタデータ) (2022-10-27T04:15:16Z) - Meta Internal Learning [88.68276505511922]
単一画像生成のための内部学習は、単一の画像に基づいて新しい画像を生成するようにジェネレータを訓練するフレームワークである。
本稿では,サンプル画像の内部統計をより効果的にモデル化するために,画像集合のトレーニングを可能にするメタラーニング手法を提案する。
以上の結果から, 得られたモデルは, 多数の共通画像アプリケーションにおいて, シングルイメージのGANと同程度に適していることがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:27:38Z) - RG-Flow: A hierarchical and explainable flow model based on
renormalization group and sparse prior [2.274915755738124]
フローベース生成モデルは、教師なし学習アプローチの重要なクラスとなっている。
本研究では, 階層型フローベース生成モデル RG-Flow の設計のために, 再正規化群 (RG) とスパース事前分布の鍵となる概念を取り入れた。
提案手法は, エッジ長が$L$の画像の描画に$O(log L)$の複雑さを伴っているが, 従来より$O(L2)$の複雑性を持つ生成モデルに比べれば, エッジ長が$L$の画像の描画には$O(log L)$の複雑さがある。
論文 参考訳(メタデータ) (2020-09-30T18:04:04Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Efficient and Model-Based Infrared and Visible Image Fusion Via
Algorithm Unrolling [24.83209572888164]
赤外線および可視画像融合(IVIF)は、赤外線画像からの熱放射情報を保持する画像と、可視画像からテクスチャの詳細を取得することを期待している。
従来のCNNベースのIVIFモデルの欠点を克服するために,モデルベース畳み込みニューラルネットワーク(CNN)モデルを提案する。
論文 参考訳(メタデータ) (2020-05-12T16:15:56Z) - A Two-step-training Deep Learning Framework for Real-time Computational
Imaging without Physics Priors [0.0]
本稿では,物理を前提としないリアルタイムな計算画像作成のための2段階学習用DL(TST-DL)フレームワークを提案する。
まず、モデルを直接学習するために、単一の完全接続層(FCL)をトレーニングする。
そして、このFCLを未訓練のU-Netアーキテクチャで固定固定し、第2ステップのトレーニングを行い、出力画像の忠実性を改善する。
論文 参考訳(メタデータ) (2020-01-10T15:05:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。