論文の概要: Symbolic Disentangled Representations for Images
- arxiv url: http://arxiv.org/abs/2412.19847v1
- Date: Wed, 25 Dec 2024 09:20:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:07:45.228433
- Title: Symbolic Disentangled Representations for Images
- Title(参考訳): 画像の記号的遠交表現
- Authors: Alexandr Korchemnyi, Alexey K. Kovalev, Aleksandr I. Panov,
- Abstract要約: 本稿では,ArSyD (Architecture for Disentanglement) を提案する。
我々は,dSpritesおよびCLEVRデータセットのArSyDについて検討し,学習されたシンボル不絡み表現の包括的解析を行う。
- 参考スコア(独自算出の注目度): 83.88591755871734
- License:
- Abstract: The idea of disentangled representations is to reduce the data to a set of generative factors that produce it. Typically, such representations are vectors in latent space, where each coordinate corresponds to one of the generative factors. The object can then be modified by changing the value of a particular coordinate, but it is necessary to determine which coordinate corresponds to the desired generative factor -- a difficult task if the vector representation has a high dimension. In this article, we propose ArSyD (Architecture for Symbolic Disentanglement), which represents each generative factor as a vector of the same dimension as the resulting representation. In ArSyD, the object representation is obtained as a superposition of the generative factor vector representations. We call such a representation a \textit{symbolic disentangled representation}. We use the principles of Hyperdimensional Computing (also known as Vector Symbolic Architectures), where symbols are represented as hypervectors, allowing vector operations on them. Disentanglement is achieved by construction, no additional assumptions about the underlying distributions are made during training, and the model is only trained to reconstruct images in a weakly supervised manner. We study ArSyD on the dSprites and CLEVR datasets and provide a comprehensive analysis of the learned symbolic disentangled representations. We also propose new disentanglement metrics that allow comparison of methods using latent representations of different dimensions. ArSyD allows to edit the object properties in a controlled and interpretable way, and the dimensionality of the object property representation coincides with the dimensionality of the object representation itself.
- Abstract(参考訳): アンタングル表現の考え方は、データを生成する生成因子のセットにデータを還元することである。
通常、そのような表現は、各座標が生成因子の1つに対応する潜在空間のベクトルである。
対象は特定の座標の値を変更することで修正できるが、どの座標が所望の生成因子に対応するかを決定する必要がある。
本稿では,ArSyD (Architecture for Symbolic Disentanglement)を提案する。
ArSyDでは、オブジェクト表現は生成因子ベクトル表現の重ね合わせとして得られる。
そのような表現を \textit{symbolic disentangled representation} と呼ぶ。
我々は超次元コンピューティング(ベクトル記号アーキテクチャとも呼ばれる)の原理を使い、シンボルは超ベクトルとして表現され、それらの上でベクトル演算を可能にする。
アンタングル化は構築によって達成され、基礎となる分布に関する追加の仮定は訓練中に行われず、モデルは弱い教師付きでイメージを再構築するようにのみ訓練される。
我々は,dSpritesとCLEVRデータセットのArSyDについて検討し,学習されたシンボル不絡み表現の包括的解析を行った。
また,異なる次元の潜在表現を用いた手法の比較が可能な,新しいアンタングルメント指標を提案する。
ArSyDは、オブジェクトプロパティを制御され解釈可能な方法で編集することができ、オブジェクトプロパティ表現の次元は、オブジェクト表現自体の次元と一致する。
関連論文リスト
- An Intrinsic Vector Heat Network [64.55434397799728]
本稿では,3次元に埋め込まれた接ベクトル場を学習するためのニューラルネットワークアーキテクチャを提案する。
本研究では, ベクトル値の特徴データを空間的に伝播させるために, トレーニング可能なベクトル熱拡散モジュールを提案する。
また,四面体メッシュ生成の産業的有用性に対する本手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-06-14T00:40:31Z) - AdaContour: Adaptive Contour Descriptor with Hierarchical Representation [52.381359663689004]
既存の角度ベースの輪郭記述子は、星以外の形状の損失表現に悩まされる。
AdaConは、他のディスクリプタよりも正確に形を表現できる。
論文 参考訳(メタデータ) (2024-04-12T07:30:24Z) - Object-centric architectures enable efficient causal representation
learning [51.6196391784561]
観測対象が複数の物体である場合, 生成関数はもはや注入的ではなく, 実際に乱れは生じないことを示す。
スパース摂動からの弱い監督を利用して各オブジェクトのプロパティを乱すオブジェクト中心アーキテクチャを開発する。
このアプローチはユークリッド空間にエンコードする同等のアプローチよりもはるかに少ない摂動を必要とするという意味で、よりデータ効率が高い。
論文 参考訳(メタデータ) (2023-10-29T16:01:03Z) - Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement [75.9289887536165]
基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。
本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。
この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文 参考訳(メタデータ) (2023-03-20T18:19:36Z) - Recursive Binding for Similarity-Preserving Hypervector Representations
of Sequences [4.65149292714414]
HDC/VSAソリューションを設計するための重要なステップは、入力データからそのような表現を得ることである。
ここでは, 近傍位置における同一配列要素の類似性を両立させる分散表現への変換を提案する。
単語類似性の人間の知覚をモデル化するためのシンボル文字列を用いて,提案手法を実験的に検討した。
論文 参考訳(メタデータ) (2022-01-27T17:41:28Z) - Shift-Equivariant Similarity-Preserving Hypervector Representations of
Sequences [0.8223798883838329]
本稿では,シーケンスのハイパーベクター形成のためのアプローチを提案する。
提案手法は合成ハイパーベクターによるシーケンス要素の表現である。
シンボル文字列の形でデータを用いた多種多様なタスクセットを用いて,提案した表現を実験的に検討した。
論文 参考訳(メタデータ) (2021-12-31T14:29:12Z) - Computing on Functions Using Randomized Vector Representations [4.066849397181077]
この新しい関数エンコーディングと計算フレームワーク Vector Function Architecture (VFA) と呼ぶ。
我々の分析と結果から,VFAは分散ニューラルネットワークにおける関数の表現と操作のための強力な新しいフレームワークとなっていることが示唆された。
論文 参考訳(メタデータ) (2021-09-08T04:39:48Z) - Elliptical Ordinal Embedding [0.0]
通常の埋め込みは、「item $j$ is close to item $i$ than item $k$」という形式の制約の集合からオブジェクトの低次元表現を見つけることを目的としている。
論文 参考訳(メタデータ) (2021-05-21T16:54:53Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z) - Analyzing the Capacity of Distributed Vector Representations to Encode
Spatial Information [0.0]
空間情報をエンコードする共起力を含む単純な重ね合わせとより複雑な構造表現に焦点をあてる。
2つの実験で、1つのベクトルに効率的に格納できる概念の数について上限を求める。
論文 参考訳(メタデータ) (2020-09-30T18:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。