論文の概要: Transformation Behavior of Images in Latent Space
- arxiv url: http://arxiv.org/abs/2606.24430v1
- Date: Tue, 23 Jun 2026 11:06:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.912678
- Title: Transformation Behavior of Images in Latent Space
- Title(参考訳): 潜時空間における画像の変換挙動
- Authors: Christian Zöllner, Mozzam Motiwala, Aysel Ahadova, Gerrit Anders, Robert Hüneburg, Jacob Nattermann, Matthias Kloor,
- Abstract要約: 病理組織分類タスクのためのニューラルネットワークのトレーニングは、潜在空間へのデータエンコーディングに依存する。
本稿では,古典的画像変換が潜在空間に与える影響について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training of neural networks for histopathology classification tasks typically relies on data encoding into latent space, which reduces complexity and improves performance. There are several encoder networks available, either pretrained on general image datasets such as ImageNET, or specifically on histopathological images. Training of encoder networks should be adapted to downstream tasks, allowing encoding of biologic/diagnostic content while rendering networks invariant to label-irrelevant transformations. This paper investigates the effect of classical image transformation on the latent space, using networks provided by Lunit Inc. and Bioptimus, both focusing on pathological images, and by Meta Research Team. We assess variance of embeddings resulting from standard data transformations by comparing original and transformed image embeddings and by contrasting them with random, unrelated embeddings, using image tiles from hematoxylin/eosin-stained sections available in a colorectal tissue dataset and the publicly accessible TCGA dataset. Our findings show that embeddings of original and transformed images are closer to each other than to random embeddings, indicating robustness to transformations. However, they are not fully invariant, revealing that the encoder networks do not completely neutralize transformation effects in latent space, explaining why transformation-mediated augmentation of datasets can improve performance. Significant differences were observed between general and histopathology-specific encoder networks.
- Abstract(参考訳): 病理組織分類タスクのためのニューラルネットワークのトレーニングは、典型的には遅延空間へのデータエンコーディングに依存しており、複雑さを減らし、パフォーマンスを向上させる。
エンコーダネットワークはいくつかあり、ImageNETのような一般的な画像データセットで事前訓練されているか、特に病理画像で利用できる。
エンコーダネットワークのトレーニングは下流のタスクに適応し、生物学的・診断的コンテンツのエンコーディングを可能にし、ネットワークはラベル非関連変換に不変である。
本稿では,Lunit Inc. と Bioptimus が提供するネットワークを用いて,古典的画像変換が潜伏空間に与える影響について検討する。
大腸組織データセットおよび一般公開TGAデータセットで利用可能なヘマトキシリン/エオシン含有領域の画像タイルを用いて,オリジナルおよびトランスフォーメーション画像の埋め込みと無関係な埋め込みを対比することにより,標準データ変換による埋め込みのばらつきを評価した。
この結果から,オリジナル画像とトランスフォーメーション画像の埋め込みは,ランダムな埋め込みよりも近接しており,変換に対する堅牢性を示している。
しかし、それらは完全に不変ではなく、エンコーダネットワークが潜在空間における変換効果を完全に中和しないことを明らかにし、なぜ変換によるデータセットの増大がパフォーマンスを向上させるのかを説明する。
病理組織学的エンコーダネットワークと病理組織学的エンコーダネットワークとの間に有意な差異が認められた。
関連論文リスト
- Transferring Styles for Reduced Texture Bias and Improved Robustness in Semantic Segmentation Networks [4.5127516760754425]
最近の研究では、画像分類におけるディープニューラルネットワーク(DNN)の形状とテクスチャバイアスについて研究している。
本研究では, 画像分類におけるテクスチャバイアスを低減し, 画像劣化に対するロバスト性を向上することを示す。
本研究では, セマンティックセグメンテーションにおいて, テクスチャの偏りを低減し, 画像の汚損や敵の攻撃に対して強固に頑健さを増すことを示した。
論文 参考訳(メタデータ) (2025-07-14T13:02:19Z) - Scaling Federated Learning Solutions with Kubernetes for Synthesizing Histopathology Images [1.232097230344824]
組織学的領域では、組織像は機密医療情報を取得し、構成するのに高価である。
ビジョントランスフォーマーは最先端のコンピュータビジョンモデルであり、画像分類を含む多くのタスクで有用であることが証明されている。
論文 参考訳(メタデータ) (2025-04-05T10:32:56Z) - Progressive Retinal Image Registration via Global and Local Deformable Transformations [49.032894312826244]
我々はHybridRetinaと呼ばれるハイブリッド登録フレームワークを提案する。
キーポイント検出器とGAMorphと呼ばれる変形ネットワークを用いて、大域的な変換と局所的な変形可能な変換を推定する。
FIREとFLoRI21という2つの広く使われているデータセットの実験により、提案したHybridRetinaは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-09-02T08:43:50Z) - Magnification Invariant Medical Image Analysis: A Comparison of
Convolutional Networks, Vision Transformers, and Token Mixers [2.3859625728972484]
畳み込みニューラルネットワーク(CNN)は医用画像解析に広く用いられている。
テスト画像の倍率がトレーニング画像と異なる場合、その性能は低下する。
本研究の目的は,様々なディープラーニングアーキテクチャの堅牢性を評価することである。
論文 参考訳(メタデータ) (2023-02-22T16:44:41Z) - Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation [63.46694853953092]
Swin-Unetは、医用画像セグメンテーション用のUnetライクなトランスフォーマーである。
トークン化されたイメージパッチは、TransformerベースのU字型デコーダデコーダアーキテクチャに供給される。
論文 参考訳(メタデータ) (2021-05-12T09:30:26Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - Segmentation-Renormalized Deep Feature Modulation for Unpaired Image
Harmonization [0.43012765978447565]
サイクル一貫性のある生成共役ネットワークは、ソースとターゲットドメイン間のイメージセットの調和に使われてきた。
これらの手法は、不安定性、コントラストの逆転、病理の難治性操作、および実際の医用画像における信頼性を制限したステガノグラフィーマッピングの傾向が強い。
解剖学的レイアウトを維持しながらスキャナ間の調和を低減するセグメンテーション正規化画像翻訳フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-11T23:53:51Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。