論文の概要: Biologically Inspired Hexagonal Deep Learning for Hexagonal Image Generation
- arxiv url: http://arxiv.org/abs/2101.00337v3
- Date: Fri, 7 Jun 2024 20:32:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 06:17:55.037912
- Title: Biologically Inspired Hexagonal Deep Learning for Hexagonal Image Generation
- Title(参考訳): バイオインスパイアされた六角形画像生成のための六角形深層学習
- Authors: Tobias Schlosser, Frederik Beuth, Danny Kowerko,
- Abstract要約: ヘキサゴナルディープ・ラーニング・フレームワークであるヘキサゴナルディープ・ニューラルネットワーク(H-DNN)を利用したヘキサゴナルイメージの生成に役立つ。
生成したテスト環境の結果から,提案したモデルが従来の画像生成のアプローチを超越する可能性が示唆された。
その結果、トレーニング可能なパラメータの形でモデルの複雑さが減少する一方で、正方形のパラメータと比較してテストレートが増加することがより許される。
- 参考スコア(独自算出の注目度): 0.27309692684728604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whereas conventional state-of-the-art image processing systems of recording and output devices almost exclusively utilize square arranged methods, biological models, however, suggest an alternative, evolutionarily-based structure. Inspired by the human visual perception system, hexagonal image processing in the context of machine learning offers a number of key advantages that can benefit both researchers and users alike. The hexagonal deep learning framework Hexnet leveraged in this contribution serves therefore the generation of hexagonal images by utilizing hexagonal deep neural networks (H-DNN). As the results of our created test environment show, the proposed models can surpass current approaches of conventional image generation. While resulting in a reduction of the models' complexity in the form of trainable parameters, they furthermore allow an increase of test rates in comparison to their square counterparts.
- Abstract(参考訳): 記録出力装置の従来の最先端画像処理システムでは、ほぼ正方形配置の手法しか利用していないが、生物モデルでは、代替の進化的構造が提案されている。
人間の視覚知覚システムにインスパイアされた機械学習のコンテキストにおける六角形画像処理は、研究者とユーザの両方にとって、多くの重要な利点を提供する。
ヘキサゴナルディープラーニングフレームワークであるHexnetは、ヘキサゴナルディープニューラルネットワーク(H-DNN)を利用してヘキサゴナルイメージを生成する。
生成したテスト環境の結果から,提案したモデルが従来の画像生成のアプローチを超越する可能性が示唆された。
その結果、トレーニング可能なパラメータの形でモデルの複雑さが減少する一方で、正方形のパラメータと比較してテストレートが増加することがより許される。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Part-aware Shape Generation with Latent 3D Diffusion of Neural Voxel Fields [50.12118098874321]
ニューラルボクセル場に対する潜在3次元拡散過程を導入し,高分解能で生成を可能にする。
部分符号を神経ボクセル場に統合し、正確な部分分解を導出するために、部分認識形状復号器を導入する。
その結果,既存の最先端手法よりも優れた部品認識形状生成において,提案手法の優れた生成能力を示した。
論文 参考訳(メタデータ) (2024-05-02T04:31:17Z) - Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [50.62725807357586]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - RenAIssance: A Survey into AI Text-to-Image Generation in the Era of
Large Model [93.8067369210696]
テキスト・ツー・イメージ生成(テキスト・トゥ・イメージ・ジェネレーション、英: Text-to-image Generation、TTI)とは、テキスト入力を処理し、テキスト記述に基づいて高忠実度画像を生成するモデルである。
拡散モデル (diffusion model) は、繰り返しステップによるノイズの体系的導入を通じて画像の生成に使用される顕著な生成モデルである。
大規模モデルの時代、モデルサイズを拡大し、大規模言語モデルとの統合により、TTIモデルの性能がさらに向上した。
論文 参考訳(メタデータ) (2023-09-02T03:27:20Z) - GM-NeRF: Learning Generalizable Model-based Neural Radiance Fields from
Multi-view Images [79.39247661907397]
本稿では,自由視点画像の合成に有効なフレームワークであるGeneralizable Model-based Neural Radiance Fieldsを提案する。
具体的には、多視点2D画像からの出現コードを幾何学的プロキシに登録するための幾何学誘導型アテンション機構を提案する。
論文 参考訳(メタデータ) (2023-03-24T03:32:02Z) - Multi-level Data Representation For Training Deep Helmholtz Machines [0.0]
我々は,Human Image Perception 機構を用いて,複雑な検索空間において,Helmholtz Machine と呼ばれる生物学的に妥当な生成モデルの学習を指導する。
我々は,マルチレベルデータ表現を用いて,異なる解像度の視覚的キューをネットワークの隠蔽層に提供することで,この問題を解決することを提案する。
いくつかの画像データセットの結果は、モデルがより優れた全体的な品質を得るだけでなく、生成された画像のより広範な多様性を得ることができることを示した。
論文 参考訳(メタデータ) (2022-10-26T16:55:40Z) - Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。
そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文 参考訳(メタデータ) (2022-05-25T17:59:53Z) - Comparative evaluation of CNN architectures for Image Caption Generation [1.2183405753834562]
2つの人気のある画像キャプチャ生成フレームワークで17種類の畳み込みニューラルネットワークを評価した。
我々は、畳み込みニューラルネットワークのモデルの複雑さをパラメータ数で測定し、オブジェクト認識タスクにおけるモデルの精度は、必ずしも画像キャプション生成タスクの機能抽出に対する効果と相関するとは限らないことを観察する。
論文 参考訳(メタデータ) (2021-02-23T05:43:54Z) - Interpreting Spatially Infinite Generative Models [40.453301580034804]
近年の研究では、空間ノイズベクトルを完全な畳み込みニューラルネットワークに入力することで、任意の解像度出力画像の生成と任意の解像度トレーニング画像のトレーニングが可能であることが示されている。
空間過程への接続を描画することで、無限空間生成のしっかりとした理論的解釈を提供する。
世界地図生成、パノラマ画像、テクスチャ合成の実験は、任意の大きさの画像を効率的に生成する$infty$-GANの能力を検証する。
論文 参考訳(メタデータ) (2020-07-24T09:00:41Z) - Network Bending: Expressive Manipulation of Deep Generative Models [0.2062593640149624]
ネットワーク曲げと呼ばれる深層生成モデルを操作するための新しいフレームワークを提案する。
生成過程において意味論的に意味のある側面を直接操作できるだけでなく、幅広い表現的な結果を得ることができるかを示す。
論文 参考訳(メタデータ) (2020-05-25T21:48:45Z) - Hexagonal Image Processing in the Context of Machine Learning: Conception of a Biologically Inspired Hexagonal Deep Learning Framework [0.27309692684728604]
機械学習の文脈における六角形画像処理は、生物学的モデルに基づく進化的動機付け構造の利点を組み合わせた画像処理システムの開発を扱う。
この貢献は、ヘキサゴナル画像処理フレームワークであるヘキサゴナル画像処理フレームワークを合成する一般的なアプリケーション指向のアプローチとして機能する。
生成したテスト環境の結果から,実現されたフレームワークが六角形画像処理システムの現在のアプローチを超越していることが分かる。
論文 参考訳(メタデータ) (2019-11-25T21:58:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。