論文の概要: Rule-Based Spatial Mixture-of-Experts U-Net for Explainable Edge Detection
- arxiv url: http://arxiv.org/abs/2602.05100v1
- Date: Wed, 04 Feb 2026 22:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.650038
- Title: Rule-Based Spatial Mixture-of-Experts U-Net for Explainable Edge Detection
- Title(参考訳): 説明可能なエッジ検出のためのルールベース空間混合U-Net
- Authors: Bharadwaj Dogga, Kaaustaaub Shankar, Gibin Raju, Wilhelm Louw, Kelly Cohen,
- Abstract要約: ルールベースの空間混合U-Netは、高性能深層学習と解釈可能な論理のギャップを埋める。
提案手法をBSDS500ベンチマークで評価し, 最適データセットスケール(ODS)Fスコア0.7628を達成した。
我々のモデルは、"Rule Firing Maps"と"Strategy Maps"を通じてピクセルレベルの説明可能性を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models like U-Net and its variants, have established state-of-the-art performance in edge detection tasks and are used by Generative AI services world-wide for their image generation models. However, their decision-making processes remain opaque, operating as "black boxes" that obscure the rationale behind specific boundary predictions. This lack of transparency is a critical barrier in safety-critical applications where verification is mandatory. To bridge the gap between high-performance deep learning and interpretable logic, we propose the Rule-Based Spatial Mixture-of-Experts U-Net (sMoE U-Net). Our architecture introduces two key innovations: (1) Spatially-Adaptive Mixture-of-Experts (sMoE) blocks integrated into the decoder skip connections, which dynamically gate between "Context" (smooth) and "Boundary" (sharp) experts based on local feature statistics; and (2) a Takagi-Sugeno-Kang (TSK) Fuzzy Head that replaces the standard classification layer. This fuzzy head fuses deep semantic features with heuristic edge signals using explicit IF-THEN rules. We evaluate our method on the BSDS500 benchmark, achieving an Optimal Dataset Scale (ODS) F-score of 0.7628, effectively matching purely deep baselines like HED (0.7688) while outperforming the standard U-Net (0.7437). Crucially, our model provides pixel-level explainability through "Rule Firing Maps" and "Strategy Maps," allowing users to visualize whether an edge was detected due to strong gradients, high semantic confidence, or specific logical rule combinations.
- Abstract(参考訳): U-Netなどのディープラーニングモデルとその変種は、エッジ検出タスクで最先端のパフォーマンスを確立し、生成AIサービスによって世界中で画像生成モデルに使用されている。
しかし、それらの意思決定プロセスは依然として不透明であり、特定の境界予測の背後にある理論的根拠を曖昧にする「ブラックボックス」として機能している。
この透明性の欠如は、検証が必須となる安全クリティカルなアプリケーションにおいて重要な障壁となる。
高性能深層学習と解釈可能な論理のギャップを埋めるために,ルールベース空間混合U-Net(sMoE U-Net)を提案する。
本アーキテクチャでは,(1) 空間適応型混合比較(sMoE)ブロックをデコーダスキップ接続に統合し, 局所特徴統計に基づく"コンテキスト"(滑らか)と"境界"(シャープ)のエキスパートを動的にゲートする,(2) 標準分類層を置き換える高木スゲノカング(TSK)ファジィヘッドを導入する。
このファジィヘッドは、明示的なIF-THEN規則を用いてヒューリスティックエッジ信号と深い意味的特徴を融合する。
提案手法をBSDS500ベンチマークで評価し,最大データセットスケール(ODS)Fスコア0.7628を達成し,HED(0.7688)のような純粋に深いベースラインと一致し,標準U-Net(0.7437)よりも優れていた。
重要なことは、我々のモデルは「ルールフィリングマップ」と「ストラテジーマップ」を通じてピクセルレベルの説明可能性を提供し、ユーザーは、強い勾配、高いセマンティック信頼性、あるいは特定の論理ルールの組み合わせによってエッジが検出されたかどうかを可視化することができる。
関連論文リスト
- Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.16354555208417]
PADとFFDはそれぞれ物理メディアベースのプレゼンテーションアタックとデジタル編集ベースのDeepFakeから顔データを保護するために提案されている。
これら2つのカテゴリの攻撃を同時に処理する統一顔攻撃検出モデルがないことは、主に2つの要因に起因する。
本稿では,異なる意味空間から複数の分類基準を適応的に探索する,視覚言語モデルに基づく階層型プロンプトチューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T16:35:45Z) - FGSGT: Saliency-Guided Siamese Network Tracker Based on Key Fine-Grained Feature Information for Thermal Infrared Target Tracking [11.599952876425736]
そこで本稿では, キーきめ細かい特徴量に基づく新しいサリエンシ誘導型シームズネットワークトラッカーを提案する。
この設計は、浅い層から重要なグローバルな特徴を捉え、特徴の多様性を高め、きめ細かいインフォームの損失を最小限にする。
実験の結果,提案したトラッカーが最も精度が高く,成功率も高いことがわかった。
論文 参考訳(メタデータ) (2025-04-19T14:13:15Z) - BoundMatch: Boundary detection applied to semi-supervised segmentation [12.8995997687175]
半教師付きセマンティックセマンティックセグメンテーション(SS-SS)は,多彩なラベル付き画像を活用することで,高密度画素ラベリングの重いアノテーション負担を軽減することを目的としている。
本稿では,意味境界検出を教師と学生の整合性正規化パイプラインに明示的に統合する,新しいマルチタスクSS-SSフレームワークであるBoundMatchを提案する。
境界一貫性規則化マルチタスク学習(Bundary Consistency Regularized Multi-Task Learning)は,セグメンテーションマスクと詳細なセグメンテーション境界において,教師と生徒のモデル間の予測合意を強制する。
論文 参考訳(メタデータ) (2025-03-30T17:02:26Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。