Fugu-MT 論文翻訳(概要): Beyond Pixels: Enhancing LIME with Hierarchical Features and Segmentation Foundation Models

論文の概要: Beyond Pixels: Enhancing LIME with Hierarchical Features and Segmentation Foundation Models

arxiv url: http://arxiv.org/abs/2403.07733v4
Date: Mon, 03 Feb 2025 10:44:34 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-04 15:57:52.991392
Title: Beyond Pixels: Enhancing LIME with Hierarchical Features and Segmentation Foundation Models
Title（参考訳）: Beyond Pixels: 階層的な機能とセグメンテーションファウンデーションモデルによるLIMEの強化
Authors: Patrick Knab, Sascha Marton, Christian Bartelt,
Abstract要約: LIMEは、ビジョン機械学習モデルにおける意思決定プロセスを解き放つための人気のあるXAIフレームワークである。本稿では,DSEG-LIME(Data-Driven LIME)フレームワークについて紹介する。以上の結果から,DSEGは事前学習したImageNetモデルにおいて,XAIの指標よりも優れていた。
参考スコア（独自算出の注目度）: 2.355460994057843
License: http://creativecommons.org/licenses/by/4.0/
Abstract: LIME (Local Interpretable Model-agnostic Explanations) is a popular XAI framework for unraveling decision-making processes in vision machine-learning models. The technique utilizes image segmentation methods to identify fixed regions for calculating feature importance scores as explanations. Therefore, poor segmentation can weaken the explanation and reduce the importance of segments, ultimately affecting the overall clarity of interpretation. To address these challenges, we introduce the DSEG-LIME (Data-Driven Segmentation LIME) framework, featuring: i) a data-driven segmentation for human-recognized feature generation by foundation model integration, and ii) a user-steered granularity in the hierarchical segmentation procedure through composition. Our findings demonstrate that DSEG outperforms on several XAI metrics on pre-trained ImageNet models and improves the alignment of explanations with human-recognized concepts. The code is available under: https://github. com/patrick-knab/DSEG-LIME
Abstract（参考訳）: LIME(Local Interpretable Model-Agnostic Explanations)は、ビジョン機械学習モデルにおける意思決定プロセスの展開のための一般的なXAIフレームワークである。この手法は画像分割法を用いて特徴量スコアを説明として計算する固定領域を同定する。したがって、セグメンテーションの貧弱さは説明を弱め、セグメンテーションの重要性を減らし、最終的には解釈の全体的明瞭さに影響を及ぼす。これらの課題に対処するために、DSEG-LIME(Data-Driven Segmentation LIME)フレームワークを紹介します。一基礎モデル統合による人間認識特徴生成のためのデータ駆動セグメンテーション二構成による階層的分断手続における使用者による粒度以上の結果から,DSEGは事前学習したImageNetモデルにおけるXAI指標よりも優れており,人間の認識した概念と説明の整合性を向上させることが示唆された。コードは以下の通り。 https://aws.com/patrick-knab/DSEG-LIME

関連論文リスト

In search of truth: Evaluating concordance of AI-based anatomy segmentation models [3.740726797046942]
解剖学的セグメンテーションのためのAIベースの手法は、大規模な画像データセットのキャラクタリゼーションを自動化するのに役立つ。基礎となる真理アノテーションを含まないデータセット上で評価する実践的なフレームワークを導入する。
論文参考訳（メタデータ） (2025-12-17T19:33:56Z)
X-SAM: From Segment Anything to Any Segmentation [63.79182974315084]
大きな言語モデル(LLM)は、広い知識表現において強力な能力を示すが、本質的にはピクセルレベルの知覚的理解において不十分である。テキスト化からテキスト化まで,セグメンテーションパラダイムを拡張したマルチモーダル大規模言語モデルフレームワークであるX-SAMを提案する。インタラクティブな視覚的プロンプトで全てのインスタンスオブジェクトをセグメンテーションし、視覚的グラウンドでピクセルワイドな解釈能力を持つMLLMに権限を与える、Visual GrounDed (VGD)セグメンテーションと呼ばれる新しいセグメンテーションタスクを提案する。
論文参考訳（メタデータ） (2025-08-06T17:19:10Z)
LIRA: Inferring Segmentation in Large Multi-modal Models with Local Interleaved Region Assistance [56.474856189865946]
大規模マルチモーダルモデル(LMM)は不正確なセグメンテーションと幻覚的理解に苦しむ。視覚的理解とセグメンテーションの相補的関係を生かしたフレームワークであるLIRAを提案する。 LIRAはセグメンテーションと理解タスクの両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-07-08T07:46:26Z)
A Deep Learning Framework for Boundary-Aware Semantic Segmentation [9.680285420002516]
本研究では境界拡張機能ブリッジングモジュール(BEFBM)を用いたMask2Formerに基づくセマンティックセマンティックセマンティクスアルゴリズムを提案する。提案手法は,mIOU,mDICE,mRecallなどのメトリクスを大幅に改善する。ビジュアル分析は、きめ細かい領域におけるモデルの利点を裏付ける。
論文参考訳（メタデータ） (2025-03-28T00:00:08Z)
Underwater SONAR Image Classification and Analysis using LIME-based Explainable Artificial Intelligence [0.0]
本稿では,水中画像分類結果の解釈に,eXplainable Artificial Intelligence (XAI)ツールの適用について検討する。ベンチマーク畳み込みニューラルネットワーク(CNN)アーキテクチャを用いた画像分類のための転写学習手法の広範な解析を行う。 XAIのテクニックは、結果の解釈可能性をより人間に準拠した方法で強調することで、信頼性と信頼性を高めます。
論文参考訳（メタデータ） (2024-08-23T04:54:18Z)
SegXAL: Explainable Active Learning for Semantic Segmentation in Driving Scene Scenarios [1.2172320168050466]
XALに基づくセマンティックセグメンテーションモデル "SegXAL" を提案する。 SegXALは、(i)ラベルのないデータを効果的に活用し、(ii)"Human-in-the-loop"パラダイムを促進し、(iii)解釈可能な方法でモデル決定を強化する。特に,シーン駆動シナリオにおけるセマンティックセグメンテーションに対するSegXALモデルの適用について検討する。
論文参考訳（メタデータ） (2024-08-08T14:19:11Z)
Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文参考訳（メタデータ） (2023-12-18T18:59:51Z)
Extending CAM-based XAI methods for Remote Sensing Imagery Segmentation [7.735470452949379]
我々は,モデルの不確実性を測定するために,「エントロピー」に基づく新しいXAI評価手法とメトリクスを導入する。本研究では,Entropyを用いて,対象クラス内の画素のセグメンテーションにおけるモデル不確実性を監視することがより適切であることを示す。
論文参考訳（メタデータ） (2023-10-03T07:01:23Z)
Trainable Noise Model as an XAI evaluation method: application on Sobol for remote sensing image segmentation [0.5735035463793009]
本稿では,セマンティックセグメンテーションのためのグラデーションフリーなSobol XAI法を適用する。 3つのXAI手法の性能評価と比較のためにベンチマーク分析を行った。
論文参考訳（メタデータ） (2023-10-03T06:51:48Z)
LISA: Reasoning Segmentation via Large Language Model [68.24075852136761]
そこで我々は,新たなセグメンテーションタスク,すなわち推論セグメンテーションを提案する。このタスクは、複雑で暗黙的なクエリテキストを与えられたセグメンテーションマスクを出力するように設計されている。提案するLISA: Large Language Instructed Assistantは,マルチモーダル大規模言語モデルの言語生成能力を継承する。
論文参考訳（メタデータ） (2023-08-01T17:50:17Z)
Exploring Open-Vocabulary Semantic Segmentation without Human Labels [76.15862573035565]
我々は、既存の事前学習された視覚言語モデル(VL)を利用して意味的セグメンテーションモデルを訓練するZeroSegを提案する。 ZeroSegは、VLモデルで学んだ視覚概念をセグメントトークンの集合に蒸留することでこれを克服し、それぞれが対象画像の局所化領域を要約する。提案手法は,他のゼロショットセグメンテーション法と比較して,同じトレーニングデータを用いた場合と比較して,最先端性能を実現する。
論文参考訳（メタデータ） (2023-06-01T08:47:06Z)
Edge-aware Plug-and-play Scheme for Semantic Segmentation [4.297988192695948]
提案手法は, 改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できる。実験結果から,提案手法は改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できることが示唆された。
論文参考訳（メタデータ） (2023-03-18T02:17:37Z)
Extracting Semantic Knowledge from GANs with Unsupervised Learning [65.32631025780631]
GAN(Generative Adversarial Networks)は、特徴写像のセマンティクスを線形に分離可能な形でエンコードする。本稿では,線形分離性を利用してGANの特徴をクラスタリングする新しいクラスタリングアルゴリズムKLiSHを提案する。 KLiSHは、さまざまなオブジェクトのデータセットに基づいてトレーニングされたGANのきめ細かいセマンティクスの抽出に成功している。
論文参考訳（メタデータ） (2022-11-30T03:18:16Z)
Distilling Ensemble of Explanations for Weakly-Supervised Pre-Training of Image Segmentation Models [54.49581189337848]
本稿では,分類データセットに基づく画像分割モデルのエンドツーエンド事前学習を可能にする手法を提案する。提案手法は重み付きセグメンテーション学習法を利用して,重み付きセグメンテーションネットワークを事前訓練する。実験の結果,ImageNetにソースデータセットとしてPSSLを伴って提案されたエンドツーエンドの事前トレーニング戦略が,さまざまなセグメンテーションモデルの性能向上に成功していることがわかった。
論文参考訳（メタデータ） (2022-07-04T13:02:32Z)
Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS) 我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文参考訳（メタデータ） (2021-08-04T20:09:21Z)
GLIME: A new graphical methodology for interpretable model-agnostic explanations [0.0]
本稿では,ブラックボックスモデルのための新しいグラフィカルな説明可能性ツールの開発に寄与する。 gLIMEと呼ばれる提案されたXAI方法論は、グローバル(データセット全体)またはローカルスケール(特定のデータポイント)でグラフィカルなモデルに依存しない説明を提供する。
論文参考訳（メタデータ） (2021-07-21T08:06:40Z)
Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文参考訳（メタデータ） (2020-12-09T12:40:13Z)
Pairwise Relation Learning for Semi-supervised Gland Segmentation [90.45303394358493]
病理組織像における腺分節に対するPRS2モデルを提案する。このモデルはセグメンテーションネットワーク(S-Net)とペア関係ネットワーク(PR-Net)から構成される。我々は,GlaSデータセットの最近の5つの手法とCRAGデータセットの最近の3つの手法を比較した。
論文参考訳（メタデータ） (2020-08-06T15:02:38Z)
Unsupervised Learning Consensus Model for Dynamic Texture Videos Segmentation [12.462608802359936]
動的テクスチャのセグメンテーションのための効果的な教師なし学習コンセンサスモデルを提案する。提案モデルでは,分類対象画素の周辺部における再量子化局所2値パターン(LBP)ヒストグラムの値の集合を特徴として用いた。挑戦的なSynthDBデータセットで実施された実験は、ULCMが大幅に高速で、コーディングが簡単で、単純で、パラメータが限られていることを示している。
論文参考訳（メタデータ） (2020-06-29T16:40:59Z)
Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文参考訳（メタデータ） (2020-04-28T08:40:55Z)
Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2020-03-23T12:28:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。