論文の概要: Rotating Features for Object Discovery
- arxiv url: http://arxiv.org/abs/2306.00600v2
- Date: Tue, 17 Oct 2023 12:48:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 21:30:05.549967
- Title: Rotating Features for Object Discovery
- Title(参考訳): オブジェクト発見のための回転機能
- Authors: Sindy L\"owe, Phillip Lippe, Francesco Locatello, Max Welling
- Abstract要約: 本稿では,複雑な特徴を高次元に一般化した回転特徴と,分散表現からオブジェクトを抽出する新たな評価手法を提案する。
これらの進歩により、分散オブジェクト中心の表現を単純な玩具から現実世界のデータに拡張することが可能になります。
- 参考スコア(独自算出の注目度): 74.1465486264609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The binding problem in human cognition, concerning how the brain represents
and connects objects within a fixed network of neural connections, remains a
subject of intense debate. Most machine learning efforts addressing this issue
in an unsupervised setting have focused on slot-based methods, which may be
limiting due to their discrete nature and difficulty to express uncertainty.
Recently, the Complex AutoEncoder was proposed as an alternative that learns
continuous and distributed object-centric representations. However, it is only
applicable to simple toy data. In this paper, we present Rotating Features, a
generalization of complex-valued features to higher dimensions, and a new
evaluation procedure for extracting objects from distributed representations.
Additionally, we show the applicability of our approach to pre-trained
features. Together, these advancements enable us to scale distributed
object-centric representations from simple toy to real-world data. We believe
this work advances a new paradigm for addressing the binding problem in machine
learning and has the potential to inspire further innovation in the field.
- Abstract(参考訳): 人間の認知における結合問題は、脳が神経接続の固定されたネットワーク内の物体をどのように表現し接続するかに関するものであり、激しい議論の対象となっている。
教師なしの設定でこの問題に対処する機械学習の取り組みの多くは、スロットベースの手法に重点を置いている。
最近、分散オブジェクト中心の表現を連続的に学習する代替手段として、複合オートエンコーダが提案されている。
しかし、これは単純な玩具データのみに適用できる。
本稿では,回転特徴,複素値特徴の高次元への一般化,分散表現からオブジェクトを抽出するための新しい評価手法を提案する。
さらに,事前学習した機能へのアプローチの適用性を示す。
これらの進歩によって、分散オブジェクト中心の表現を単純なおもちゃから現実世界のデータにスケールできるのです。
この作業は、機械学習のバインディング問題に対処するための新しいパラダイムを前進させ、この分野のさらなるイノベーションを刺激する可能性を秘めている。
関連論文リスト
- Binding Dynamics in Rotating Features [72.80071820194273]
本稿では,特徴間のアライメントを明示的に計算し,それに応じて重みを調整する「コサイン結合」機構を提案する。
これにより、自己注意と生物学的神経プロセスに直接接続し、回転する特徴に現れるオブジェクト中心の表現の基本的なダイナミクスに光を当てることができます。
論文 参考訳(メタデータ) (2024-02-08T12:31:08Z) - Invariant Slot Attention: Object Discovery with Slot-Centric Reference
Frames [18.84636947819183]
自己組織化された方法でオブジェクトを学習するスロットベースのニューラルネットワークは、エキサイティングな進歩を遂げた。
本稿では,スロット中心参照フレームを用いた空間対称性の簡易かつ高効率な実装法を提案する。
提案手法は,CLEVR,Tetrominoes,CLEVR,Objects Room,MultiShapeNetなどの合成対象発見ベンチマークを用いて評価する。
論文 参考訳(メタデータ) (2023-02-09T23:25:28Z) - Robust and Controllable Object-Centric Learning through Energy-based
Models [95.68748828339059]
我々の研究は概念的にシンプルで一般的なアプローチであり、エネルギーベースモデルを通してオブジェクト中心の表現を学習する。
既存のアーキテクチャに容易に統合でき、高品質なオブジェクト中心表現を効果的に抽出できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:11:15Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Object Pursuit: Building a Space of Objects via Discriminative Weight
Generation [23.85039747700698]
視覚学習と理解のためのオブジェクト中心表現を継続的に学習するフレームワークを提案する。
我々は、オブジェクト中心の表現を学習しながら、オブジェクトとそれに対応するトレーニング信号の多様なバリエーションをサンプリングするために、インタラクションを活用する。
提案するフレームワークの重要な特徴について広範な研究を行い,学習した表現の特徴を分析した。
論文 参考訳(メタデータ) (2021-12-15T08:25:30Z) - Object-Centric Learning with Slot Attention [43.684193749891506]
我々は、知覚表現と相互作用するアーキテクチャコンポーネントであるSlot Attentionモジュールを提示する。
Slot Attentionは、スロットと呼ばれるタスク依存の抽象表現を生成します。
Slot Attentionがオブジェクト中心の表現を抽出し、未知の合成を一般化できることを実証的に実証する。
論文 参考訳(メタデータ) (2020-06-26T15:31:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。