Fugu-MT 論文翻訳(概要): Game Theory Meets Statistical Mechanics in Deep Learning Design

論文の概要: Game Theory Meets Statistical Mechanics in Deep Learning Design

arxiv url: http://arxiv.org/abs/2410.12264v1
Date: Wed, 16 Oct 2024 06:02:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:36.155737
Title: Game Theory Meets Statistical Mechanics in Deep Learning Design
Title（参考訳）: 深層学習設計における統計力学とゲーム理論
Authors: Djamel Bouchaffra, Fayçal Ykhlef, Bilal Faye, Hanane Azzag, Mustapha Lebbah,
Abstract要約: 本稿では,ゲーム理論の原理と統計力学の法則をシームレスに融合する新しいディープ表現を提案する。単一の学習フレームワーク内で特徴抽出、次元縮小、パターン分類を行う。
参考スコア（独自算出の注目度）: 0.06990493129893112
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present a novel deep graphical representation that seamlessly merges principles of game theory with laws of statistical mechanics. It performs feature extraction, dimensionality reduction, and pattern classification within a single learning framework. Our approach draws an analogy between neurons in a network and players in a game theory model. Furthermore, each neuron viewed as a classical particle (subject to statistical physics' laws) is mapped to a set of actions representing specific activation value, and neural network layers are conceptualized as games in a sequential cooperative game theory setting. The feed-forward process in deep learning is interpreted as a sequential game, where each game comprises a set of players. During training, neurons are iteratively evaluated and filtered based on their contributions to a payoff function, which is quantified using the Shapley value driven by an energy function. Each set of neurons that significantly contributes to the payoff function forms a strong coalition. These neurons are the only ones permitted to propagate the information forward to the next layers. We applied this methodology to the task of facial age estimation and gender classification. Experimental results demonstrate that our approach outperforms both multi-layer perceptron and convolutional neural network models in terms of efficiency and accuracy.
Abstract（参考訳）: 本稿では,ゲーム理論の原理と統計力学の法則をシームレスに融合する,新しいグラフィカル表現を提案する。単一の学習フレームワーク内で特徴抽出、次元縮小、パターン分類を行う。提案手法は,ネットワーク内のニューロンとゲーム理論モデルにおけるプレイヤー間の類似性を引き出す。さらに、古典粒子(統計物理学の法則に従う)と見なされる各ニューロンは、特定のアクティベーション値を表す一連のアクションにマッピングされ、ニューラルネットワーク層は、逐次協調ゲーム理論の設定においてゲームとして概念化される。深層学習におけるフィードフォワードプロセスは、各ゲームが一組のプレイヤーからなるシーケンシャルゲームとして解釈される。トレーニング中、ニューロンは、エネルギー関数によって駆動されるシェープリー値を用いて定量化されるペイオフ関数への寄与に基づいて反復的に評価され、フィルタリングされる。支払い関数に顕著に寄与するニューロンの集合は、強い連帯を形成する。これらのニューロンは、情報を次の層に伝播させることが許されている唯一のニューロンである。本手法を顔面年齢推定と性別分類に応用した。実験結果から,本手法は多層パーセプトロンおよび畳み込みニューラルネットワークモデルよりも効率と精度で優れていることが示された。

関連論文リスト

Don't Cut Corners: Exact Conditions for Modularity in Biologically Inspired Representations [52.48094670415497]
我々は、生物にインスパイアされた表現が、ソース変数(ソース)に関してモジュール化されるときの理論を開発する。我々は、最適な生物学的にインスパイアされたリニアオートエンコーダのニューロンがモジュラー化されるかどうかを判断する情報源のサンプルに対して、必要かつ十分な条件を導出する。我々の理論はどんなデータセットにも当てはまり、以前の研究で研究された統計的な独立性よりもはるかに長い。
論文参考訳（メタデータ） (2024-10-08T17:41:37Z)
Understanding Activation Patterns in Artificial Neural Networks by Exploring Stochastic Processes [0.0]
我々はこれまで未利用であったプロセスの枠組みを活用することを提案する。我々は、実際のニューロンスパイク列車に使用される神経科学技術を活用した、アクティベーション周波数のみに焦点をあてる。各ネットワークにおけるアクティベーションパターンを記述するパラメータを導出し、アーキテクチャとトレーニングセット間で一貫した差異を明らかにする。
論文参考訳（メタデータ） (2023-08-01T22:12:30Z)
Evaluating alignment between humans and neural network representations in image-based learning tasks [5.657101730705275]
トレーニング済みの860ドルのニューラルネットワークモデルの表現が、人間の学習軌跡にどのようにマッピングされているかテストしました。トレーニングデータセットのサイズは人間の選択に沿った中核的な決定要因であるのに対し、マルチモーダルデータ(テキストと画像)による対照的なトレーニングは、人間の一般化を予測するために現在公開されているモデルの一般的な特徴であることがわかった。結論として、事前訓練されたニューラルネットワークは、タスク間で伝達可能な認知の基本的な側面を捉えているように見えるため、認知モデルのための表現を抽出するのに役立つ。
論文参考訳（メタデータ） (2023-06-15T08:18:29Z)
Diffused Redundancy in Pre-trained Representations [98.55546694886819]
事前訓練された表現で機能がどのようにコード化されているか、より詳しく見ていきます。与えられた層における学習された表現は拡散冗長性を示す。我々の発見は、事前訓練されたディープニューラルネットワークによって学習された表現の性質に光を当てた。
論文参考訳（メタデータ） (2023-05-31T21:00:50Z)
Utility-Probability Duality of Neural Networks [4.871730595406078]
本稿では,ディープラーニングにおける標準教師あり学習手順に対するユーティリティに基づく代替的説明を提案する。基本的な考え方は、学習したニューラルネットワークを確率モデルではなく、順序付きユーティリティ関数として解釈することである。ソフトマックス出力を持つ全てのニューラルネットワークに対して、最大推定値のSGD学習ダイナミクスを反復過程と見なすことができる。
論文参考訳（メタデータ） (2023-05-24T08:09:07Z)
Cones: Concept Neurons in Diffusion Models for Customized Generation [41.212255848052514]
本稿では,特定の対象に対応する拡散モデルにおいて,ニューロンの小さな集合を見出す。概念ニューロンは、生成結果の解釈と操作において磁気特性を示す。大規模な応用においては、ニューロンは環境に優しいため、密度の高いfloat32値ではなく、sparseクラスタのintインデックスを格納するだけである。
論文参考訳（メタデータ） (2023-03-09T09:16:04Z)
Detecting Modularity in Deep Neural Networks [8.967870619902211]
ネットワークニューロンの分割によるモジュラリティ評価の問題点を考察する。本稿では,ニューロンがネットワーク性能にいかに重要かを反映した重要度と,そのニューロンが入力の特徴といかに常に関連しているかを反映したコヒーレンスという2つのプロキシを提案する。これらの分割は、重みのみに基づくものであっても、重要で一貫性のあるニューロンのグループを明らかにします。
論文参考訳（メタデータ） (2021-10-13T20:33:30Z)
Dynamic Inference with Neural Interpreters [72.90231306252007]
本稿では,モジュールシステムとしての自己アテンションネットワークにおける推論を分解するアーキテクチャであるNeural Interpretersを提案する。モデルへの入力は、エンドツーエンドの学習方法で一連の関数を通してルーティングされる。ニューラル・インタープリタは、より少ないパラメータを用いて視覚変換器と同等に動作し、サンプル効率で新しいタスクに転送可能であることを示す。
論文参考訳（メタデータ） (2021-10-12T23:22:45Z)
The Connection Between Approximation, Depth Separation and Learnability in Neural Networks [70.55686685872008]
学習可能性と近似能力の関係について検討する。対象関数の深いネットワークでの学習性は、より単純なクラスがターゲットを近似する能力に依存することを示す。
論文参考訳（メタデータ） (2021-01-31T11:32:30Z)
The Neural Coding Framework for Learning Generative Models [91.0357317238509]
本稿では,脳の予測処理理論に触発された新しい神経生成モデルを提案する。同様に、私たちの生成モデルにおける人工ニューロンは、隣接するニューロンが何をするかを予測し、予測が現実にどの程度一致するかに基づいてパラメータを調整します。
論文参考訳（メタデータ） (2020-12-07T01:20:38Z)
Neuron-based explanations of neural networks sacrifice completeness and interpretability [67.53271920386851]
我々は、ImageNetで事前訓練されたAlexNetに対して、ニューロンに基づく説明法が完全性と解釈可能性の両方を犠牲にすることを示す。我々は、最も重要な主成分が、最も重要なニューロンよりも完全で解釈可能な説明を提供することを示す。この結果から,AlexNet などのネットワークに対する説明手法は,ニューロンを埋め込みの基盤として使用するべきではないことが示唆された。
論文参考訳（メタデータ） (2020-11-05T21:26:03Z)
Compositional Explanations of Neurons [52.71742655312625]
本稿では, 合成論理的概念を同定し, 深部表現におけるニューロンの説明手順について述べる。本稿では,視覚と自然言語処理のモデルにおける解釈可能性に関するいくつかの疑問に答えるために,この手順を用いる。
論文参考訳（メタデータ） (2020-06-24T20:37:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。