論文の概要: Neurosymbolic Object-Centric Learning with Distant Supervision
- arxiv url: http://arxiv.org/abs/2506.16129v1
- Date: Thu, 19 Jun 2025 08:26:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.998123
- Title: Neurosymbolic Object-Centric Learning with Distant Supervision
- Title(参考訳): 遠隔観察によるニューロシンボリック物体中心学習
- Authors: Stefano Colamonaco, David Debot, Giuseppe Marra,
- Abstract要約: 非構造化データから直接オブジェクト中心表現を学習するためのニューロシンボリックな定式化を提案する。
このアプローチをニューロシンボリックモデルであるDeepObjectLogでインスタンス化する。
音確率論的論理推論を有効にすることにより、記号成分は、新しい学習信号を導入する。
- 参考スコア(独自算出の注目度): 5.402442420739707
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Relational learning enables models to generalize across structured domains by reasoning over objects and their interactions. While recent advances in neurosymbolic reasoning and object-centric learning bring us closer to this goal, existing systems rely either on object-level supervision or on a predefined decomposition of the input into objects. In this work, we propose a neurosymbolic formulation for learning object-centric representations directly from raw unstructured perceptual data and using only distant supervision. We instantiate this approach in DeepObjectLog, a neurosymbolic model that integrates a perceptual module, which extracts relevant object representations, with a symbolic reasoning layer based on probabilistic logic programming. By enabling sound probabilistic logical inference, the symbolic component introduces a novel learning signal that further guides the discovery of meaningful objects in the input. We evaluate our model across a diverse range of generalization settings, including unseen object compositions, unseen tasks, and unseen number of objects. Experimental results show that our method outperforms neural and neurosymbolic baselines across the tested settings.
- Abstract(参考訳): リレーショナル・ラーニング(Relational learning)は、モデルがオブジェクトとその相互作用を推論することで、構造化ドメインをまたいだ一般化を可能にする。
ニューロシンボリック推論とオブジェクト中心学習の最近の進歩は、この目標に近づきつつあるが、既存のシステムはオブジェクトレベルの監督や、オブジェクトへの入力の事前定義された分解に依存している。
本研究では,生の非構造的知覚データから直接対象中心表現を学習し,遠隔監視のみを用いてニューロシンボリックな定式化を提案する。
我々は,このアプローチを,確率論的論理プログラミングに基づくシンボリック推論層を用いて,関連するオブジェクト表現を抽出する知覚モジュールを統合するニューロシンボリックモデルであるDeepObjectLogでインスタンス化する。
音確率論的論理推論を可能にすることにより、シンボル成分は、入力中の意味のある物体の発見をさらに導く新しい学習信号を導入する。
我々は,未確認のオブジェクト構成,未確認のタスク,未確認のオブジェクト数など,多種多様な一般化設定でモデルを評価した。
実験結果から,本手法はテスト環境における神経・神経共生ベースラインよりも優れていた。
関連論文リスト
- Discovering Chunks in Neural Embeddings for Interpretability [53.80157905839065]
本稿では, チャンキングの原理を応用して, 人工神経集団活動の解釈を提案する。
まず、この概念を正則性を持つ人工シーケンスを訓練したリカレントニューラルネットワーク(RNN)で実証する。
我々は、これらの状態に対する摂動が関連する概念を活性化または阻害すると共に、入力における概念に対応する同様の繰り返し埋め込み状態を特定する。
論文 参考訳(メタデータ) (2025-02-03T20:30:46Z) - Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Neural Language of Thought Models [18.930227757853313]
我々は、LoTHにインスパイアされた表現と生成の教師なし学習のための新しいアプローチであるNeural Language of Thought Model (NLoTM)を紹介する。
NLoTMは,(1)オブジェクトとその特性に整合した階層的かつ構成可能な離散表現を学習するSemantic Vector-Quantized Variational Autoencoder,(2)意味概念トークンを合成的に生成する自動回帰変換器であるAutoregressive LoT Prior,の2つの重要なコンポーネントから構成される。
我々は、NLoTMを複数の2次元および3次元画像データセット上で評価し、下流タスクにおける優れた性能、分布外一般化、画像生成を示す。
論文 参考訳(メタデータ) (2024-02-02T08:13:18Z) - LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and
Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。
ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。
これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文 参考訳(メタデータ) (2023-09-24T05:43:19Z) - Bridging Neural and Symbolic Representations with Transitional Dictionary Learning [4.326886488307076]
本稿では,記号的知識を暗黙的に学習できる新しいトランジショナル辞書学習(TDL)フレームワークを提案する。
本稿では,期待最大化法(EM)アルゴリズムで学習した辞書を用いて,入力を視覚部分へ分解するゲーム理論拡散モデルを提案する。
3つの抽象的な合成視覚オブジェクトデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2023-08-03T19:29:35Z) - A Recursive Bateson-Inspired Model for the Generation of Semantic Formal
Concepts from Spatial Sensory Data [77.34726150561087]
本稿では,複雑な感覚データから階層構造を生成するための記号のみの手法を提案する。
このアプローチは、概念や概念の創始の鍵としてのバテソンの差異の概念に基づいている。
このモデルは、トレーニングなしでかなりリッチだが人間に読まれる概念表現を生成することができる。
論文 参考訳(メタデータ) (2023-07-16T15:59:13Z) - Capturing the objects of vision with neural networks [0.0]
人間の視覚知覚はその物理的関節でシーンを彫り、世界をオブジェクトに分解する。
対照的に、視覚物体認識のディープニューラルネットワーク(DNN)モデルは、主に感覚入力と結びついている。
両分野の関連研究をレビューし、これらの分野が相互にどのように役立つかを検討する。
論文 参考訳(メタデータ) (2021-09-07T21:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。