論文の概要: Weakly Supervised Concept Learning for Object-centric Visual Reasoning
- arxiv url: http://arxiv.org/abs/2605.08201v1
- Date: Tue, 05 May 2026 22:50:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.457926
- Title: Weakly Supervised Concept Learning for Object-centric Visual Reasoning
- Title(参考訳): オブジェクト中心の視覚推論のための弱教師付き概念学習
- Authors: Sparsh Tiwari, Bettina Finzel, Gesina Schwalbe,
- Abstract要約: ニューロシンボリックシステムは、生のセンサー入力のディープニューラルネットワーク(DNN)処理と、シンボリック人工知能のわずかなパフォーマンスを組み合わせることを約束している。
本稿では,物体中心推論タスクにおける論理的帰納のための出力シンボルを基盤として,知覚段階の効率的な弱監督手法を提案する。
- 参考スコア(独自算出の注目度): 3.6959117433332724
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neurosymbolic systems promise to combine deep neural network's (DNN) processing of raw sensor inputs with few-shot performance of symbolic artificial intelligence. Two-stage approaches explicitly decouple DNN based perception from subsequent rule based reasoning. This avoids optimization and interpretability issues of end to end differentiable approaches, but requires costly labels for the perception output. This paper introduces an efficient weak supervision scheme for the perception stage to ground its output symbols for logical induction in object-centric reasoning tasks. It combines a slot-based architecture for object-centricity with a Variational Autoencoder (VAE) for self-supervision, competing with concept guidance on latent dimensions for human interpretable grounding. The resulting predictions are translated into symbolic background knowledge for reasoning frameworks, such as Inductive Logic Programming (ILP), Decision Trees, and Bayesian Networks. Our extensive empirical evaluation on synthetic and real world datasets shows that our approach can discover complex, abstract rules for object centric reasoning whilst reducing supervision to as little as 1% of labels, and being robust even under substantial domain shift. Notably, at 1% supervision it even outperforms state of the art foundation model baselines in domain generalization
- Abstract(参考訳): ニューロシンボリックシステムは、生のセンサー入力のディープニューラルネットワーク(DNN)処理と、シンボリック人工知能のわずかなパフォーマンスを組み合わせることを約束している。
2段階のアプローチは、DNNベースの認識とその後のルールベースの推論を明示的に分離する。
これは、エンドツーエンドの微分可能なアプローチの最適化と解釈可能性の問題を避けるが、知覚出力には高価なラベルが必要である。
本稿では,物体中心推論タスクにおける論理的帰納のための出力シンボルを基盤として,知覚段階の効率的な弱監督手法を提案する。
これは、オブジェクト中心性のためのスロットベースのアーキテクチャと、自己スーパービジョンのための変分オートエンコーダ(VAE)を組み合わせることで、人間の解釈可能な接地のための潜在次元の概念ガイダンスと競合する。
結果として得られた予測は、帰納論理プログラミング(ILP)、決定木(Decision Trees)、ベイズネットワーク(Bayesian Networks)などの推論フレームワークのシンボリックな背景知識に変換される。
人工的および実世界のデータセットに対する広範な経験的評価は、我々のアプローチが、オブジェクト中心の推論のための複雑で抽象的なルールを発見できる一方で、監督を1%のラベルに減らし、ドメインシフトをかなり下回っていることを示します。
特に1%の監督下では、ドメイン一般化における最先端の基盤モデルベースラインよりも優れています。
関連論文リスト
- Symbolic Rule Extraction from Attention-Guided Sparse Representations in Vision Transformers [1.3812010983144802]
最近のニューロシンボリックアプローチは、解釈可能性を高めるためにCNNベースのモデルからシンボリック・ルールセットを抽出することに成功している。
本稿では、スパースオートエンコーダ(SAE)にインスパイアされたスパース概念層を導入し、視覚変換器(ViT)からシンボルルールを抽出するフレームワークを提案する。
本手法は,記号的推論が可能でありながら,標準のViTよりも5.14%の精度で分類できる。
論文 参考訳(メタデータ) (2025-05-10T19:45:15Z) - Semantic Loss Functions for Neuro-Symbolic Structured Prediction [74.18322585177832]
このような構造に関する知識を象徴的に定義した意味的損失をトレーニングに注入する。
記号の配置に非依存であり、それによって表現される意味論にのみ依存する。
識別型ニューラルモデルと生成型ニューラルモデルの両方と組み合わせることができる。
論文 参考訳(メタデータ) (2024-05-12T22:18:25Z) - LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and
Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。
ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。
これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文 参考訳(メタデータ) (2023-09-24T05:43:19Z) - Minding Language Models' (Lack of) Theory of Mind: A Plug-and-Play
Multi-Character Belief Tracker [72.09076317574238]
ToMは,読解における文字の信念状態を調べるためのプラグアンドプレイ方式である。
ToMは、教師付きベースラインと比較して、配電性能が堅牢でありながら、ゼロオーダー設定でのオフ・ザ・シェルフニューラルネットワーク理論の考え方を強化する。
論文 参考訳(メタデータ) (2023-06-01T17:24:35Z) - Concept Embeddings for Fuzzy Logic Verification of Deep Neural Networks
in Perception Tasks [1.2246649738388387]
我々は、訓練された畳み込みニューラルネットワーク(CNN)が特定の記号的背景知識を尊重するかどうかを検証するための、単純で効果的なアプローチを提案する。
知識はファジィ述語論理則から成り立つ。
このアプローチはファジィ性と概念出力の校正の恩恵を受けていることを示す。
論文 参考訳(メタデータ) (2022-01-03T10:35:47Z) - Neuro-Symbolic Forward Reasoning [19.417231973682366]
Neuro-Symbolic Forward Reasoner (NSFR) は、一階述語論理を用いた微分フォワードチェインを利用したタスク推論の新しいアプローチである。
鍵となるアイデアは、差別化可能なフォワードチェイン推論とオブジェクト中心(ディープ)学習を組み合わせることです。
論文 参考訳(メタデータ) (2021-10-18T15:14:58Z) - A Minimalist Dataset for Systematic Generalization of Perception,
Syntax, and Semantics [131.93113552146195]
我々は,機械が一般化可能な概念を学習する能力を調べるため,新しいデータセットであるHINT(Hand written arithmetic with INTegers)を提案する。
HINTでは、イメージなどの生信号から概念がどのように認識されるかを学ぶことが機械のタスクである。
我々は、RNN、Transformer、GPT-3など、様々なシーケンス・ツー・シーケンスモデルで広範囲に実験を行った。
論文 参考訳(メタデータ) (2021-03-02T01:32:54Z) - Logical Neural Networks [51.46602187496816]
ニューラルネットワーク(学習)と記号論理(知識と推論)の両方の重要な特性をシームレスに提供する新しいフレームワークを提案する。
すべてのニューロンは、重み付けされた実数値論理における公式の構成要素としての意味を持ち、非常に解釈不能な非絡み合い表現をもたらす。
推論は事前に定義されたターゲット変数ではなく、オムニであり、論理的推論に対応する。
論文 参考訳(メタデータ) (2020-06-23T16:55:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。