論文の概要: Structured (De)composable Representations Trained with Neural Networks
- arxiv url: http://arxiv.org/abs/2007.03325v1
- Date: Tue, 7 Jul 2020 10:20:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 18:14:04.605637
- Title: Structured (De)composable Representations Trained with Neural Networks
- Title(参考訳): ニューラルネットワークを用いた構造化(De)合成可能な表現
- Authors: Graham Spinks, Marie-Francine Moens
- Abstract要約: テンプレート表現は、クラス全体の特性をキャプチャするジェネリック表現を指す。
提案手法は、エンドツーエンドのディープラーニングを用いて、入力画像と離散ラベルから構造化および構成可能な表現を学習する。
表現には明確な構造があることを証明し、表現をクラスや環境を表す因子に分解する。
- 参考スコア(独自算出の注目度): 21.198279941828112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper proposes a novel technique for representing templates and instances
of concept classes. A template representation refers to the generic
representation that captures the characteristics of an entire class. The
proposed technique uses end-to-end deep learning to learn structured and
composable representations from input images and discrete labels. The obtained
representations are based on distance estimates between the distributions given
by the class label and those given by contextual information, which are modeled
as environments. We prove that the representations have a clear structure
allowing to decompose the representation into factors that represent classes
and environments. We evaluate our novel technique on classification and
retrieval tasks involving different modalities (visual and language data).
- Abstract(参考訳): 本稿では,概念クラスのテンプレートとインスタンスを表現する新しい手法を提案する。
テンプレート表現は、クラス全体の特性をキャプチャするジェネリック表現を指す。
提案手法は、エンドツーエンドのディープラーニングを用いて、入力画像と離散ラベルから構造化および構成可能な表現を学習する。
得られた表現は、クラスラベルによって与えられる分布と、環境としてモデル化された文脈情報によって与えられる分布との距離推定に基づいている。
表現には明確な構造があることを証明し、表現をクラスや環境を表す因子に分解する。
本稿では,異なるモダリティ(視覚データと言語データ)を含む分類と検索タスクに関する新しい手法を評価する。
関連論文リスト
- Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Leveraging Open-Vocabulary Diffusion to Camouflaged Instance
Segmentation [59.78520153338878]
テキスト・ツー・イメージ拡散技術は、テキスト記述から高品質な画像を生成する素晴らしい能力を示している。
そこで本研究では,オープン語彙を応用した最先端拡散モデルを用いて,多スケールのテキスト・視覚的特徴を学習する手法を提案する。
論文 参考訳(メタデータ) (2023-12-29T07:59:07Z) - Neural Representations Reveal Distinct Modes of Class Fitting in
Residual Convolutional Networks [5.1271832547387115]
ニューラル表現の確率モデルを利用して、残余ネットワークがクラスにどのように適合するかを調べる。
調査対象モデルのクラスは均一に適合していないことがわかった。
神経表現の未発見構造は, トレーニング例の堅牢性と, 対向記憶の相関性を示す。
論文 参考訳(メタデータ) (2022-12-01T18:55:58Z) - Not All Instances Contribute Equally: Instance-adaptive Class
Representation Learning for Few-Shot Visual Recognition [94.04041301504567]
少数ショットの視覚認識は、いくつかのラベル付きインスタンスから新しい視覚概念を認識することを指す。
本稿では,数ショットの視覚認識を実現するために,インスタンス適応型クラス表現学習ネットワーク(ICRL-Net)と呼ばれる新しいメトリックベースのメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-07T10:00:18Z) - Cross-Modal Discrete Representation Learning [73.68393416984618]
本稿では,様々なモダリティにまたがるより細かい粒度を捉える表現を学習する自己教師型学習フレームワークを提案する。
我々のフレームワークは、異なるモダリティ間で共有されるベクトル量子化によって生成される離散化された埋め込み空間に依存している。
論文 参考訳(メタデータ) (2021-06-10T00:23:33Z) - DirectProbe: Studying Representations without Classifiers [21.23284793831221]
DirectProbeは、タスクのバージョン空間の概念に基づいて表現の幾何学を研究します。
いくつかの言語的タスクと文脈的埋め込みの実験は、訓練された分類器がなくても、DirectProbeは埋め込み空間がラベルの表現方法に光を当てることができることを示している。
論文 参考訳(メタデータ) (2021-04-13T02:40:26Z) - High-dimensional distributed semantic spaces for utterances [0.2907403645801429]
本稿では,発話とテキストレベルデータの高次元表現モデルについて述べる。
言語情報を表現する数学的原理と行動学的に妥当なアプローチに基づいている。
本論文は,固定次元の共通積分フレームワークにおいて,実装モデルが言語的特徴を広範囲に表すことができるかを示す。
論文 参考訳(メタデータ) (2021-04-01T12:09:47Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - The Immersion of Directed Multi-graphs in Embedding Fields.
Generalisations [0.0]
本稿では,ハイブリッドカテゴリー,シンボル,知覚感覚,知覚潜在データを表す汎用モデルについて概説する。
この表現は、コンピュータビジョンにおける様々な機械学習モデル、NLP/NLUで現在使用されている。
これは、様々な潜在空間からの埋め込みを表す少なくともいくつかのエッジ属性を持つ有向リレーショナル型マルチグラフを提供することによって達成される。
論文 参考訳(メタデータ) (2020-04-28T09:28:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。