論文の概要: Explaining Knowledge Distillation by Quantifying the Knowledge
- arxiv url: http://arxiv.org/abs/2003.03622v1
- Date: Sat, 7 Mar 2020 18:09:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 19:04:18.130627
- Title: Explaining Knowledge Distillation by Quantifying the Knowledge
- Title(参考訳): 知識の定量化による知識蒸留の説明
- Authors: Xu Cheng, Zhefan Rao, Yilan Chen, Quanshi Zhang
- Abstract要約: 本稿では,課題関連概念と課題関連概念を定量化し,分析することで,知識蒸留の成功を解釈する手法を提案する。
知識蒸留により、DNNは生のデータから学ぶよりも、より視覚的な概念を学ぶことができる。
- 参考スコア(独自算出の注目度): 27.98287660940717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a method to interpret the success of knowledge
distillation by quantifying and analyzing task-relevant and task-irrelevant
visual concepts that are encoded in intermediate layers of a deep neural
network (DNN). More specifically, three hypotheses are proposed as follows. 1.
Knowledge distillation makes the DNN learn more visual concepts than learning
from raw data. 2. Knowledge distillation ensures that the DNN is prone to
learning various visual concepts simultaneously. Whereas, in the scenario of
learning from raw data, the DNN learns visual concepts sequentially. 3.
Knowledge distillation yields more stable optimization directions than learning
from raw data. Accordingly, we design three types of mathematical metrics to
evaluate feature representations of the DNN. In experiments, we diagnosed
various DNNs, and above hypotheses were verified.
- Abstract(参考訳): 本稿では,深層ニューラルネットワーク(dnn)の中間層に符号化されるタスク関連およびタスク非関連視覚概念を定量化し分析することにより,知識蒸留の成功を解釈する手法を提案する。
より具体的には、以下の3つの仮説が提案されている。
1 知識蒸留は、生データから学ぶよりも視覚的な概念をdnnに学習させる。
2. 知識蒸留はDNNが様々な視覚概念を同時に学習する傾向があることを保証する。
一方、生データから学習するシナリオでは、DNNは視覚概念を逐次学習する。
3. 知識蒸留は、生データから学ぶよりも、より安定した最適化方向をもたらす。
そこで我々は,DNNの特徴表現を評価するために,3種類の数学的指標を設計する。
実験では,様々なDNNを診断し,以上の仮説を検証した。
関連論文リスト
- BKDSNN: Enhancing the Performance of Learning-based Spiking Neural Networks Training with Blurred Knowledge Distillation [20.34272550256856]
スパイキングニューラルネットワーク(SNN)は、生物学的ニューラルネットワークを模倣し、離散スパイクを介して情報を伝達する。
本研究は,静的およびニューロモルフィックなデータセット上でSNNをトレーニングするための最先端性能を実現する。
論文 参考訳(メタデータ) (2024-07-12T08:17:24Z) - Distribution Shift Matters for Knowledge Distillation with Webly
Collected Images [91.66661969598755]
異なる分布間の知識蒸留という新しい手法を提案する(KD$3$)。
まず,教師ネットワークと学生ネットワークの併用予測に基づいて,Webで収集したデータから有用なトレーニングインスタンスを動的に選択する。
また、MixDistributionと呼ばれる新しいコントラスト学習ブロックを構築して、新しい分散のインスタンスアライメントで摂動データを生成します。
論文 参考訳(メタデータ) (2023-07-21T10:08:58Z) - Quantifying the Knowledge in a DNN to Explain Knowledge Distillation for
Classification [27.98287660940717]
本稿では,情報理論に基づく知識蒸留の成功を説明するための新たな視点を提供する。
知識ポイントは入力ユニットと呼ばれ、その情報は他の入力ユニットよりもはるかに少ない。
本稿では,知識点の定量化に基づく知識蒸留の3つの仮説を提案する。
論文 参考訳(メタデータ) (2022-08-18T09:47:31Z) - Knowledge Enhanced Neural Networks for relational domains [83.9217787335878]
我々は、ニューラルネットワークに事前論理的知識を注入するニューラルネットワークアーキテクチャであるKENNに焦点を当てる。
本稿では,関係データに対するKENNの拡張を提案する。
論文 参考訳(メタデータ) (2022-05-31T13:00:34Z) - Neuro-Symbolic Learning of Answer Set Programs from Raw Data [54.56905063752427]
Neuro-Symbolic AIは、シンボリックテクニックの解釈可能性と、生データから学ぶ深層学習の能力を組み合わせることを目的としている。
本稿では,ニューラルネットワークを用いて生データから潜在概念を抽出するNSIL(Neuro-Symbolic Inductive Learner)を提案する。
NSILは表現力のある知識を学習し、計算的に複雑な問題を解き、精度とデータ効率の観点から最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-25T12:41:59Z) - Concept Embeddings for Fuzzy Logic Verification of Deep Neural Networks
in Perception Tasks [1.2246649738388387]
我々は、訓練された畳み込みニューラルネットワーク(CNN)が特定の記号的背景知識を尊重するかどうかを検証するための、単純で効果的なアプローチを提案する。
知識はファジィ述語論理則から成り立つ。
このアプローチはファジィ性と概念出力の校正の恩恵を受けていることを示す。
論文 参考訳(メタデータ) (2022-01-03T10:35:47Z) - What Do Deep Nets Learn? Class-wise Patterns Revealed in the Input Space [88.37185513453758]
本研究では,深層ニューラルネットワーク(DNN)が学習するクラスワイズな知識を,異なる環境下で可視化し,理解する手法を提案する。
本手法は,各クラスのモデルが学習した知識を表現するために,画素空間内の1つの予測パターンを探索する。
逆境環境では、逆境に訓練されたモデルはより単純化された形状パターンを学ぶ傾向がある。
論文 参考訳(メタデータ) (2021-01-18T06:38:41Z) - Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey [77.99182201815763]
ディープニューラルネットワーク(DNN)は多くの異なる問題設定において最先端の結果を達成する。
DNNはしばしばブラックボックスシステムとして扱われ、評価と検証が複雑になる。
コンピュータビジョンタスクにおける畳み込みニューラルネットワーク(CNN)の成功に触発された、有望な分野のひとつは、対称幾何学的変換に関する知識を取り入れることである。
論文 参考訳(メタデータ) (2020-06-30T14:56:05Z) - Architecture Disentanglement for Deep Neural Networks [174.16176919145377]
ディープニューラルネットワーク(DNN)の内部動作を説明するために,ニューラルアーキテクチャ・ディコンタングルメント(NAD)を導入する。
NADは、訓練済みのDNNを独立したタスクに従ってサブアーキテクチャに切り離すことを学び、推論プロセスを記述する情報フローを形成する。
その結果、誤分類された画像は、タスクサブアーキテクチャーに正しいサブアーキテクチャーに割り当てられる確率が高いことが示された。
論文 参考訳(メタデータ) (2020-03-30T08:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。