論文の概要: A neurosymbolic Approach with Epistemic Deep Learning for Hierarchical Image Classification
- arxiv url: http://arxiv.org/abs/2605.16383v1
- Date: Mon, 11 May 2026 09:43:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 23:51:08.309785
- Title: A neurosymbolic Approach with Epistemic Deep Learning for Hierarchical Image Classification
- Title(参考訳): 階層的画像分類のためのエピステマティックディープラーニングを用いたニューロシンボリックアプローチ
- Authors: Ezel Kilicdere, Shireen Kudukkil Manchingal, Fabio Cuzzolin,
- Abstract要約: 本研究では,スイニングトランスフォーマーを増強するための統合型ニューロシンボリック・エピステマティック・モデリングフレームワークを提案する。
ラベルを孤立したカテゴリとして扱うのではなく、本手法はデータ駆動型焦点セットを誘導する。
これらの焦点集合は信念理論の層の基礎を形成する。
学習可能な損失は、キャリブレーション、質量正規化、論理一貫性のバランスを保ち、モデルがデータ駆動型エビデンスでシンボル構造を適応的に取り除くことができる。
- 参考スコア(独自算出の注目度): 7.18839452757154
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Deep neural networks achieve high accuracy on image classification tasks. Yet, they often produce overconfident predictions as which fail to express epistemic uncertainty, and frequently violate logical or structural constraints present in the data. These limitations are particularly pronounced in hierarchical classification, where predictions across fine and coarse levels must remain coherent. We propose, for the first time, a unified neurosymbolic and epistemic modelling framework that augments Swin Transformers with focal set reasoning and differentiable fuzzy logic. Rather than treating labels as isolated categories, our method induces data-driven focal sets within the learnt embedding space, which helps capture epistemic uncertainty over multiple plausible fine-grained classes. These focal sets form the basis of a belief-theoretic layer that uses fuzzy membership functions and t-norm conjunctions to encourage consistency between fine- and coarse-grained predictions. A learnable loss further balances calibration, mass regularisation, and logical consistency, allowing the model to adaptively trade off symbolic structure with data-driven evidence. In experiments on hierarchical image classification, our framework maintains accuracy on par with transformer baselines while providing more calibrated and interpretable predictions, reducing overconfidence and enforcing high logical consistency across hierarchical outputs. Our experimental results show that combining focal set reasoning with fuzzy logic provides a practical step toward deep learning models that are both accurate and epistemically aware.
- Abstract(参考訳): ディープニューラルネットワークは、画像分類タスクにおいて高い精度を達成する。
しかし、彼らはしばしば、疫学の不確実性を表現するのに失敗し、しばしばデータに存在する論理的または構造的制約に違反する、過信な予測を生成する。
これらの制限は階層的な分類において特に顕著であり、細粒度と粗いレベルの予測は一貫性を保たなければならない。
本稿では,スウィントランスフォーマーに焦点設定推論とファジィ論理を付加した統合型ニューロシンボリック・エピステマティック・モデリング・フレームワークを提案する。
ラベルを独立したカテゴリとして扱うのではなく、学習した埋め込み空間内のデータ駆動型焦点集合を誘導し、複数の可塑性きめ細かいクラスに対する認識の不確かさを捉えるのに役立つ。
これらの焦点集合は、ファジィメンバシップ関数とt-ノルム結合を用いて、きめ細かい粒度の予測と粗い粒度の予測の一貫性を促進する信念-理論層の基礎を形成する。
学習可能な損失は、キャリブレーション、質量正規化、論理的整合性をさらにバランスさせ、モデルがデータ駆動型エビデンスとシンボリック構造を適応的に取り除くことを可能にする。
階層的画像分類実験において,我々のフレームワークはトランスフォーマーベースラインと同等の精度を維持しつつ,よりキャリブレーションと解釈可能な予測を提供し,過度な自信を減らし,階層的出力の論理的整合性を高める。
実験の結果,焦点集合推論とファジィ論理を組み合わせることで,正確かつ認識可能な深層学習モデルの実現が期待できることがわかった。
関連論文リスト
- From Arithmetic to Logic: The Resilience of Logic and Lookup-Based Neural Networks Under Parameter Bit-Flips [0.6868507883617846]
本研究では,ニューラルネットワークの構造特性としてのレジリエンスについて検討する。
その結果,低い精度,高い間隔,有界活性化,浅い深度が常に好まれていることが判明した。
論理ベースのアーキテクチャに特有の新しい偶数層リカバリ効果を同定する。
論文 参考訳(メタデータ) (2026-03-24T03:53:04Z) - Anatomy of a Lie: A Multi-Stage Diagnostic Framework for Tracing Hallucinations in Vision-Language Models [62.932580559941414]
VLM(Vision-Language Models)は、しばしば「ハロシン化(hallucinate)」する。
本稿では,静的な出力誤差からモデル計算認知の動的病理へ再キャストし,幻覚を診断するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2026-03-16T17:20:38Z) - An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes [55.93922317950527]
DRQ-learnerと呼ばれる新しいメタラーナーを開発した。
DRQ-learnerは離散状態空間と連続状態空間の両方の設定に適用できます。
論文 参考訳(メタデータ) (2025-09-30T15:49:29Z) - Certified Neural Approximations of Nonlinear Dynamics [51.01318247729693]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。
本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文 参考訳(メタデータ) (2025-05-21T13:22:20Z) - Pre-trained Models Succeed in Medical Imaging with Representation Similarity Degradation [6.545152478351316]
本研究は,表現類似性軌跡の定量化と解析を中心とした厳密な問題定義を確立する。
実験結果から,タスクの精度と事前学習した起源との類似性の両方を保った高性能モデルが存在する可能性が示唆された。
論文 参考訳(メタデータ) (2025-03-11T01:37:54Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Neuro-symbolic model for cantilever beams damage detection [0.0]
本稿では,新しい認知アーキテクチャに基づくカンチレバービームの損傷検出のためのニューロシンボリックモデルを提案する。
ハイブリッド識別モデルはLogic Convolutional Neural Regressorという名称で導入されている。
論文 参考訳(メタデータ) (2023-05-04T13:12:39Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - A heteroencoder architecture for prediction of failure locations in
porous metals using variational inference [1.2722697496405462]
多孔質金属張力試験片の故障箇所を予測するために,エンコーダ・デコーダ畳み込みニューラルネットワークを用いた。
故障箇所の予測の目的は、標本中のほとんどの材料が故障しないため、クラス不均衡の極端なケースを示す。
得られた予測分散は、任意の標本において最も失敗する可能性のある位置のランク付けに有効であることを示す。
論文 参考訳(メタデータ) (2022-01-31T20:26:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。