論文の概要: X-ray transferable polyrepresentation learning
- arxiv url: http://arxiv.org/abs/2507.06264v1
- Date: Mon, 07 Jul 2025 22:05:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.32954
- Title: X-ray transferable polyrepresentation learning
- Title(参考訳): X線伝達可能な多表現学習
- Authors: Weronika Hryniewska-Guzik, Przemyslaw Biecek,
- Abstract要約: ポリ表現は、異なるソースから抽出された同じモダリティの複数の表現を統合する。
X線画像の文脈では、生成されたポリ表現がより小さなデータセットに転送可能であることを示す。
- 参考スコア(独自算出の注目度): 5.524804393257921
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of machine learning algorithms is inherently related to the extraction of meaningful features, as they play a pivotal role in the performance of these algorithms. Central to this challenge is the quality of data representation. However, the ability to generalize and extract these features effectively from unseen datasets is also crucial. In light of this, we introduce a novel concept: the polyrepresentation. Polyrepresentation integrates multiple representations of the same modality extracted from distinct sources, for example, vector embeddings from the Siamese Network, self-supervised models, and interpretable radiomic features. This approach yields better performance metrics compared to relying on a single representation. Additionally, in the context of X-ray images, we demonstrate the transferability of the created polyrepresentation to a smaller dataset, underscoring its potential as a pragmatic and resource-efficient approach in various image-related solutions. It is worth noting that the concept of polyprepresentation on the example of medical data can also be applied to other domains, showcasing its versatility and broad potential impact.
- Abstract(参考訳): 機械学習アルゴリズムの成功は、これらのアルゴリズムのパフォーマンスにおいて重要な役割を果たすため、本質的に意味のある特徴の抽出に関係している。
この課題の中心は、データ表現の質である。
しかし、見えないデータセットからこれらの特徴を効果的に一般化し、抽出する能力も重要である。
これを踏まえて、我々は新しい概念であるポリ表現を導入する。
ポリ表現は、例えば、シームズネットワークからのベクトル埋め込み、自己教師付きモデル、解釈可能な放射能の特徴など、異なるソースから抽出された同じモダリティの複数の表現を統合する。
このアプローチは、単一の表現に依存するよりもパフォーマンス指標が優れている。
さらに、X線画像の文脈において、生成したポリ表現のより小さなデータセットへの転送可能性を示し、様々な画像関連ソリューションにおける実用的で資源効率の高いアプローチとしての可能性を示す。
医療データの例における多面的表現の概念は他の領域にも適用でき、その汎用性と幅広い潜在的影響を示すことに注意する必要がある。
関連論文リスト
- MultiFIX: An XAI-friendly feature inducing approach to building models
from multimodal data [0.0]
MultiFIXは、新しい解釈可能性にフォーカスしたマルチモーダルデータ融合パイプラインである。
エンドツーエンドのディープラーニングアーキテクチャは、予測モデルをトレーニングするために使用されます。
悪性皮膚病変の検出のために,MultiFIXを公開データセットに適用した。
論文 参考訳(メタデータ) (2024-02-19T14:45:46Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - Flow Factorized Representation Learning [109.51947536586677]
本稿では、異なる入力変換を定義する潜在確率パスの別個のセットを規定する生成モデルを提案する。
本モデルは,ほぼ同変モデルに近づきながら,標準表現学習ベンチマークにおいて高い確率を達成することを示す。
論文 参考訳(メタデータ) (2023-09-22T20:15:37Z) - StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - Augmentation Invariant Manifold Learning [0.5827521884806071]
本稿では,拡張不変多様体学習と呼ばれる新しい表現学習手法を提案する。
既存の自己教師付き手法と比較して、新しい手法は多様体の幾何学的構造と拡張データの不変性を同時に活用する。
提案手法におけるデータ拡張の役割を理論的研究により明らかにし, 下流解析において, 拡張データから得られたデータ表現が$k$-nearestの隣人を改善できる理由と方法を明らかにした。
論文 参考訳(メタデータ) (2022-11-01T13:42:44Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Invariant Causal Mechanisms through Distribution Matching [86.07327840293894]
本研究では、因果的視点と不変表現を学習するための新しいアルゴリズムを提供する。
実験により,このアルゴリズムは様々なタスク群でうまく動作し,特にドメインの一般化における最先端のパフォーマンスを観察する。
論文 参考訳(メタデータ) (2022-06-23T12:06:54Z) - Probabilistic Tracking with Deep Factors [8.030212474745879]
因子グラフに基づく確率的追跡フレームワークにおける特徴量に対する生成密度と組み合わせたディープ・フィーチャー・エンコーディングの使い方を示す。
本稿では,学習した特徴エンコーダと生成密度を組み合わせる可能性モデルを提案する。
論文 参考訳(メタデータ) (2021-12-02T21:31:51Z) - GLOWin: A Flow-based Invertible Generative Framework for Learning
Disentangled Feature Representations in Medical Images [40.58581577183134]
可逆関数によるデータ分布を直接モデル化することにより,現実的な画像を生成するフローベースの生成モデルが提案されている。
本稿では, エンドツーエンドのインバータブルで, 絡み合った表現を学習できる, フローベースの生成モデルフレームワーク glowin を提案する。
論文 参考訳(メタデータ) (2021-03-19T15:47:01Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Two-Level Adversarial Visual-Semantic Coupling for Generalized Zero-shot
Learning [21.89909688056478]
トレーニング中に推論ネットワークを用いて生成ネットワークを増強する2段階のジョイントアイデアを提案する。
これにより、ビジュアルドメインとセマンティックドメイン間の効果的な知識伝達のための強力な相互モーダル相互作用が提供される。
提案手法は,4つのベンチマークデータセットに対して,いくつかの最先端手法に対して評価し,その性能を示す。
論文 参考訳(メタデータ) (2020-07-15T15:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。