論文の概要: A Game-Theoretic Taxonomy of Visual Concepts in DNNs
- arxiv url: http://arxiv.org/abs/2106.10938v1
- Date: Mon, 21 Jun 2021 09:16:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:48:28.323546
- Title: A Game-Theoretic Taxonomy of Visual Concepts in DNNs
- Title(参考訳): DNNにおける視覚概念のゲーム理論分類
- Authors: Xu Cheng, Chuntung Chu, Yi Zheng, Jie Ren, Quanshi Zhang
- Abstract要約: 我々は視覚概念の新しい分類法を提供し、形状やテクスチャのエンコーディングを理解するのに役立ちます。
このようにして、DNNのテクスチャを符号化する3つの特徴的な信号処理挙動が見つかる。
- 参考スコア(独自算出の注目度): 21.560976557881492
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we rethink how a DNN encodes visual concepts of different
complexities from a new perspective, i.e. the game-theoretic multi-order
interactions between pixels in an image. Beyond the categorical taxonomy of
objects and the cognitive taxonomy of textures and shapes, we provide a new
taxonomy of visual concepts, which helps us interpret the encoding of shapes
and textures, in terms of concept complexities. In this way, based on
multi-order interactions, we find three distinctive signal-processing behaviors
of DNNs encoding textures. Besides, we also discover the flexibility for a DNN
to encode shapes is lower than the flexibility of encoding textures.
Furthermore, we analyze how DNNs encode outlier samples, and explore the
impacts of network architectures on interactions. Additionally, we clarify the
crucial role of the multi-order interactions in real-world applications. The
code will be released when the paper is accepted.
- Abstract(参考訳): 本稿では,DNNが新たな視点から,異なる複雑さの視覚概念をエンコードする方法を再考する。
画像中のピクセル間のゲーム理論的多階間相互作用
対象の分類学的分類とテクスチャと形状の認知的分類以外にも、視覚概念の新しい分類法を提供し、概念の複雑さの観点から形状とテクスチャのエンコーディングを解釈するのに役立つ。
このように、多階間相互作用に基づき、テクスチャを符号化するdnnの3つの特徴的な信号処理挙動を見出す。
また,dnnが形状をエンコードする柔軟性はテクスチャのエンコーディングの柔軟性よりも低いことを発見した。
さらに,dnnが異常サンプルをエンコードする方法を分析し,ネットワークアーキテクチャが相互作用に与える影響について検討する。
さらに,実世界のアプリケーションにおけるマルチオーダーインタラクションの重要な役割を明らかにする。
コードは、論文が受け入れられたときにリリースされる。
関連論文リスト
- On the universality of neural encodings in CNNs [5.064404027153094]
学習された固有ベクトルは、VGG型ネットワークの様々な層に対して、異なる自然画像データセットにまたがって普遍的であることを示す。
彼らは、より基本的なレベルで、トランスファーラーニングの成功を説明する。
論文 参考訳(メタデータ) (2024-09-28T21:30:25Z) - Connectivity-Inspired Network for Context-Aware Recognition [1.049712834719005]
視覚認知に対処するために,生体脳の回路モチーフを取り入れることの効果に焦点をあてる。
私たちの畳み込みアーキテクチャは、人間の皮質と皮質下の流れの接続にインスパイアされています。
我々はコンテキスト認識をモデル化するための新しいプラグイン・アンド・プレイ・モジュールを提案する。
論文 参考訳(メタデータ) (2024-09-06T15:42:10Z) - Unveiling the Unseen: Identifiable Clusters in Trained Depthwise
Convolutional Kernels [56.69755544814834]
深部分離型畳み込みニューラルネットワーク(DS-CNN)の最近の進歩は、新しいアーキテクチャをもたらす。
本稿では,DS-CNNアーキテクチャのもう一つの顕著な特性を明らかにする。
論文 参考訳(メタデータ) (2024-01-25T19:05:53Z) - Learning Multimodal Volumetric Features for Large-Scale Neuron Tracing [72.45257414889478]
オーバーセグメントニューロン間の接続を予測し,人間の作業量を削減することを目的としている。
最初はFlyTracingという名前のデータセットを構築しました。
本稿では,高密度なボリュームEM画像の埋め込みを生成するための,新しい接続性を考慮したコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-05T19:45:12Z) - Emergence of Shape Bias in Convolutional Neural Networks through
Activation Sparsity [8.54598311798543]
現在の物体認識のためのディープラーニングモデルはテクスチャに大きく偏っている。
対照的に、人間の視覚系は形状や構造に偏っていることが知られている。
脳内のユビキタスな原理であるスパースコーディングは、それ自体がネットワークに形状バイアスをもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2023-10-29T04:07:52Z) - DepWiGNN: A Depth-wise Graph Neural Network for Multi-hop Spatial
Reasoning in Text [52.699307699505646]
マルチホップ空間推論のためのDepWiGNN(Depth-Wise Graph Neural Network)を提案する。
具体的には,新しいノードメモリ方式を設計し,グラフの幅次元ではなく深さ次元の情報を集約する。
2つの挑戦的なマルチホップ空間推論データセットの実験結果から,DepWiGNNが既存の空間推論手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-10-19T08:07:22Z) - On the Transition from Neural Representation to Symbolic Knowledge [2.2528422603742304]
本稿では,EMアルゴリズムを用いてデータのトランザクショナル表現を学習するニューラルネットワークトランザクショナル辞書学習(TDL)フレームワークを提案する。
我々は,協調ゲームとしての入力の分解に関して,拡散モデルを用いてフレームワークを実装した。
さらに、マルコフモデルによって実現されたRLを用いて、学習したプロトタイプをさらに調整する。
論文 参考訳(メタデータ) (2023-08-03T19:29:35Z) - Does a Neural Network Really Encode Symbolic Concepts? [24.099892982101398]
本稿では,インタラクション概念の信頼性を4つの観点から検討する。
広範囲にわたる実証研究により、よく訓練されたDNNは、通常スパース、転送可能、差別的な概念を符号化することを示した。
論文 参考訳(メタデータ) (2023-02-25T13:58:37Z) - Discrete-Valued Neural Communication [85.3675647398994]
コンポーネント間で伝達される情報を離散表現に制限することは、有益なボトルネックであることを示す。
個人は「猫」が特定の経験に基づいて何であるかについて異なる理解を持っているが、共有された離散トークンは、個人間のコミュニケーションが内部表現の個人差によって切り離されることを可能にする。
我々は、量子化機構をベクトル量子化変分オートコーダから共有符号ブックによる多頭部離散化に拡張し、離散値ニューラル通信に利用する。
論文 参考訳(メタデータ) (2021-07-06T03:09:25Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Neural Body: Implicit Neural Representations with Structured Latent
Codes for Novel View Synthesis of Dynamic Humans [56.63912568777483]
本稿では,人間の演奏者に対する新しい視点合成の課題について,カメラビューの少なさから考察する。
異なるフレームで学習されたニューラルネットワーク表現が、変形可能なメッシュにアンカーされた同じ遅延コードセットを共有することを前提とした新しい人体表現であるNeural Bodyを提案する。
ZJU-MoCapの実験により、我々の手法は、新規なビュー合成品質において、先行研究よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-12-31T18:55:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。