論文の概要: Aesthetics and neural network image representations
- arxiv url: http://arxiv.org/abs/2109.08103v1
- Date: Thu, 16 Sep 2021 16:50:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 16:26:17.203817
- Title: Aesthetics and neural network image representations
- Title(参考訳): 美学とニューラルネットワーク画像表現
- Authors: Romuald A. Janik
- Abstract要約: 我々は,BigGANアーキテクチャの生成ネットワークによって符号化された画像の空間を解析する。
我々は、フォトリアリスティックな点から離れた一般的な乗法的摂動が、しばしば「アーティスティックな回帰」として現れる画像に繋がることを発見した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We analyze the spaces of images encoded by generative networks of the BigGAN
architecture. We find that generic multiplicative perturbations away from the
photo-realistic point often lead to images which appear as "artistic
renditions" of the corresponding objects. This demonstrates an emergence of
aesthetic properties directly from the structure of the photo-realistic
environment coupled with its neural network parametrization. Moreover,
modifying a deep semantic part of the neural network encoding leads to the
appearance of symbolic visual representations.
- Abstract(参考訳): 我々はbigganアーキテクチャの生成ネットワークで符号化された画像の空間を分析する。
フォトリアリスティックな点から離れた一般的な乗法的摂動は、しばしば対応する対象の「芸術的回帰」として現れる画像につながる。
これは、ニューラルネットワークのパラメトリゼーションと組み合わされたフォトリアリスティックな環境の構造から直接、美的特性の出現を示す。
さらに、ニューラルネットワークエンコーディングの深い意味部分を変更することで、象徴的な視覚表現の出現につながる。
関連論文リスト
- Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients [0.0]
本稿では,ニューラルネットワークの潜在空間におけるニューロンのクローズドフォーム解釈の枠組みを提案する。
解釈フレームワークは、トレーニングされたニューラルネットワークを同じ概念をエンコードする同値クラスの関数に埋め込むことに基づいている。
論文 参考訳(メタデータ) (2024-09-09T03:26:07Z) - Universal dimensions of visual representation [0.8824340350342511]
我々は、様々な構成の視覚ニューラルネットワークから数十万の表現次元の普遍性を特徴づけた。
様々なアーキテクチャを持つネットワークは、潜在次元の共有集合を用いて自然画像を表現することを学習する。
ニューラルネットワークにおける最も脳に整合した表現は、普遍的で、ネットワークの特定の特性に依存しない表現である。
論文 参考訳(メタデータ) (2024-08-23T02:48:44Z) - Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.04145324152541]
本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-03-18T18:01:01Z) - Retinotopic Mapping Enhances the Robustness of Convolutional Neural Networks [0.0]
本研究では,葉緑体視覚の重要成分であるレチノトピックマッピングが,画像分類と局所化性能を向上させることができるかどうかを検討する。
標準オフザシェルフ畳み込みニューラルネットワーク(CNN)の入力にレノトピックマッピングが組み込まれた
驚くべきことに、レチノトピー的にマッピングされたネットワークは、分類において同等のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-02-23T18:15:37Z) - Image segmentation with traveling waves in an exactly solvable recurrent
neural network [71.74150501418039]
繰り返しニューラルネットワークは、シーンの構造特性に応じて、画像をグループに効果的に分割できることを示す。
本稿では,このネットワークにおけるオブジェクトセグメンテーションのメカニズムを正確に記述する。
次に、グレースケール画像中の単純な幾何学的対象から自然画像まで、入力をまたいで一般化するオブジェクトセグメンテーションの簡単なアルゴリズムを実証する。
論文 参考訳(メタデータ) (2023-11-28T16:46:44Z) - Unleashing the Power of Depth and Pose Estimation Neural Networks by
Designing Compatible Endoscopic Images [12.412060445862842]
内視鏡画像の特性を詳細に解析し、画像とニューラルネットワークの互換性を改善する。
まず,完全な画像情報の代わりに部分的な画像情報を入力するMask Image Modelling (MIM) モジュールを導入する。
第2に、画像とニューラルネットワークの互換性を明確に向上させるために、内視鏡画像を強化する軽量ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-14T02:19:38Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Understanding the Role of Individual Units in a Deep Neural Network [85.23117441162772]
本稿では,画像分類と画像生成ネットワーク内の隠れ単位を系統的に同定する分析フレームワークを提案する。
まず、シーン分類に基づいて訓練された畳み込みニューラルネットワーク(CNN)を分析し、多様なオブジェクト概念にマッチするユニットを発見する。
第2に、シーンを生成するために訓練されたGANモデルについて、同様の分析手法を用いて分析する。
論文 参考訳(メタデータ) (2020-09-10T17:59:10Z) - Neural Sparse Representation for Image Restoration [116.72107034624344]
スパース符号化に基づく画像復元モデルの堅牢性と効率に触発され,深部ネットワークにおけるニューロンの空間性について検討した。
本手法は,隠れたニューロンに対する空間的制約を構造的に強制する。
実験により、複数の画像復元タスクのためのディープニューラルネットワークではスパース表現が不可欠であることが示されている。
論文 参考訳(メタデータ) (2020-06-08T05:15:17Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。