論文の概要: TopoImages: Incorporating Local Topology Encoding into Deep Learning Models for Medical Image Classification
- arxiv url: http://arxiv.org/abs/2508.01574v1
- Date: Sun, 03 Aug 2025 03:48:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.944966
- Title: TopoImages: Incorporating Local Topology Encoding into Deep Learning Models for Medical Image Classification
- Title(参考訳): Topo Images:医療画像分類のための深層学習モデルへのローカルトポロジエンコードの導入
- Authors: Pengfei Gu, Hongxiao Wang, Yejia Zhang, Huimin Li, Chaoli Wang, Danny Chen,
- Abstract要約: 連結成分やループなどの画像データのトポロジ構造は、画像の内容を理解する上で重要な役割を果たす。
TopoImagesは、パッチの局所的なトポロジを符号化することで、入力画像の新たな表現を計算する。
- 参考スコア(独自算出の注目度): 5.028712558880225
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Topological structures in image data, such as connected components and loops, play a crucial role in understanding image content (e.g., biomedical objects). % Despite remarkable successes of numerous image processing methods that rely on appearance information, these methods often lack sensitivity to topological structures when used in general deep learning (DL) frameworks. % In this paper, we introduce a new general approach, called TopoImages (for Topology Images), which computes a new representation of input images by encoding local topology of patches. % In TopoImages, we leverage persistent homology (PH) to encode geometric and topological features inherent in image patches. % Our main objective is to capture topological information in local patches of an input image into a vectorized form. % Specifically, we first compute persistence diagrams (PDs) of the patches, % and then vectorize and arrange these PDs into long vectors for pixels of the patches. % The resulting multi-channel image-form representation is called a TopoImage. % TopoImages offers a new perspective for data analysis. % To garner diverse and significant topological features in image data and ensure a more comprehensive and enriched representation, we further generate multiple TopoImages of the input image using various filtration functions, which we call multi-view TopoImages. % The multi-view TopoImages are fused with the input image for DL-based classification, with considerable improvement. % Our TopoImages approach is highly versatile and can be seamlessly integrated into common DL frameworks. Experiments on three public medical image classification datasets demonstrate noticeably improved accuracy over state-of-the-art methods.
- Abstract(参考訳): 連結成分やループなどの画像データのトポロジ構造は、画像の内容(例えば、生物医学的対象)を理解する上で重要な役割を果たす。
%) は, 外観情報に依存した画像処理手法の顕著な成功にもかかわらず, 一般的な深層学習(DL)フレームワークでは, トポロジ的構造に対する感受性に欠けることが多かった。
% 本稿では,パッチの局所的トポロジを符号化することで,入力画像の新たな表現を演算するTopo Images(トポロジ画像)という新しい一般手法を提案する。
% Topo Imagesでは、画像パッチに固有の幾何学的特徴と位相的特徴をエンコードするために、永続的ホモロジー(PH)を利用する。
%)の目的は,入力画像の局所パッチ中の位相情報をベクトル化形式にキャプチャすることである。
具体的には、まずパッチの永続化ダイアグラム(PD)を計算し、次にこれらのPDをベクトル化し、パッチのピクセルに対して長いベクターに配置する。
% 多チャンネル画像形式の表現をTopoImageと呼ぶ。
% TopoImagesはデータ分析の新しい視点を提供する。
% 画像データの多彩で重要なトポロジ的特徴とより包括的でリッチな表現を確保するため,多視点トポイメージと呼ぶ様々なフィルタ関数を用いて,入力画像の複数のトポイメージを生成する。
%,多視点トポ画像はDL分類の入力画像と融合しており,かなり改善されている。
% TopoImagesアプローチは非常に汎用的で、共通DLフレームワークにシームレスに統合することができます。
3つの公開医用画像分類データセットの実験では、最先端の手法よりも顕著に精度が向上した。
関連論文リスト
- Feature Engineering is Not Dead: Reviving Classical Machine Learning with Entropy, HOG, and LBP Feature Fusion for Image Classification [0.13194391758295113]
我々は、置換エントロピー(PE)を中心とした新しいアプローチにより、古典的機械学習に基づく画像分類を再考する。
PEを2次元画像に拡張し,マルチスケール・マルチ指向エントロピーに基づく特徴抽出手法を提案する。
この結果から,PEとHOGとLBPの融合は,計算コストが高く,解釈可能な限定的なディープラーニングモデルに対して,コンパクトで,解釈可能な,効果的な代替手段を提供することが示された。
論文 参考訳(メタデータ) (2025-07-18T09:29:03Z) - Progressive Retinal Image Registration via Global and Local Deformable Transformations [49.032894312826244]
我々はHybridRetinaと呼ばれるハイブリッド登録フレームワークを提案する。
キーポイント検出器とGAMorphと呼ばれる変形ネットワークを用いて、大域的な変換と局所的な変形可能な変換を推定する。
FIREとFLoRI21という2つの広く使われているデータセットの実験により、提案したHybridRetinaは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-09-02T08:43:50Z) - Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - Patch-Wise Self-Supervised Visual Representation Learning: A Fine-Grained Approach [4.9204263448542465]
本研究は、パッチレベルの識別を自己教師付き視覚表現学習に組み込むことにより、革新的できめ細かな次元を導入する。
それぞれのパッチは個別に拡張され、同じビュー内の他のパッチとは独立している。
我々は、拡張ビュー全体にわたって対応するパッチを見つけるための、単純で効果的なパッチマッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-28T09:35:30Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Joint Learning of Deep Texture and High-Frequency Features for
Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。
セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。
原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文 参考訳(メタデータ) (2022-09-07T17:30:40Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Multi-scale Sparse Representation-Based Shadow Inpainting for Retinal
OCT Images [0.261990490798442]
網膜光コヒーレンス断層撮影(OCT)画像における表面血管による陰影領域の塗布は,正確で堅牢な機械解析と臨床診断に重要である。
近隣情報を伝播して徐々に行方不明地域を埋めるといった従来のシーケンスベースのアプローチは費用対効果が高い。
エンコーダ・デコーダネットワークのような深層学習に基づく手法は、自然な画像の描画タスクにおいて有望な結果を示している。
スパース表現と深層学習を相乗的に適用することにより,OCT画像のマルチスケールシャドウ塗装フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-23T09:37:14Z) - Cross-Modality Sub-Image Retrieval using Contrastive Multimodal Image
Representations [3.3754780158324564]
異なるモダリティによってキャプチャされた類似(または同じ)コンテンツのイメージは、共通の構造をほとんど共有しないため、モダリティ間の画像検索は困難である。
本稿では,モダリティ間の逆(サブ)画像検索のためのアプリケーション非依存のコンテンツベース画像検索システムを提案する。
論文 参考訳(メタデータ) (2022-01-10T19:04:28Z) - Gigapixel Histopathological Image Analysis using Attention-based Neural
Networks [7.1715252990097325]
圧縮経路と学習経路からなるCNN構造を提案する。
本手法は,グローバル情報とローカル情報の両方を統合し,入力画像のサイズに関して柔軟であり,弱い画像レベルラベルのみを必要とする。
論文 参考訳(メタデータ) (2021-01-25T10:18:52Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。