論文の概要: SetFlow: Generating Structured Sets of Representations for Multiple Instance Learning
- arxiv url: http://arxiv.org/abs/2604.16362v1
- Date: Fri, 20 Mar 2026 13:29:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.927267
- Title: SetFlow: Generating Structured Sets of Representations for Multiple Instance Learning
- Title(参考訳): SetFlow: 複数のインスタンス学習のための構造化された表現セットの生成
- Authors: Nikola Jovišić, Milica Škipina, Vanja Švenda,
- Abstract要約: 表現空間内で直接、複数のインスタンス学習バッグ全体をモデル化する生成アーキテクチャであるSetFlowを紹介します。
最新のMIL-PF分類パイプラインを用いて,大規模なマンモグラフィーベンチマークでSetFlowを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Data scarcity and weak supervision continue to limit the performance of machine learning models in many real-world applications, such as mammography, where Multiple Instance Learning (MIL) often offers the best formulation. While recent foundation models provide strong semantic representations out of the box, effective augmentation of such representations of MIL data remains limited, as existing methods operate at the instance level and fail to capture intra-bag dependencies. In this work, we introduce SetFlow, a generative architecture that models entire MIL bags (i.e., sets) directly in the representation space. Our approach leverages the flow matching paradigm combined with a Set Transformer-inspired design, enabling it to handle permutation-invariant inputs while capturing interactions between instances within each bag. The model is conditioned on both class labels and input scale, allowing it to generate coherent and semantically consistent sets of representations. We evaluate SetFlow on a large-scale mammography benchmark using a state-of-the-art MIL-PF classification pipeline. The generated samples are shown to closely match the original data distribution and even improve downstream performance when used for augmentation. Furthermore, training on synthetic data alone shows competitive results, demonstrating the effectiveness of representation-space generative modeling for data-scarce and privacy-sensitive tasks.
- Abstract(参考訳): データ不足と弱い監視は、マルチプルインスタンス学習(MIL)がしばしば最適な定式化を提供する、マンモグラフィなど、多くの実世界のアプリケーションにおける機械学習モデルのパフォーマンスを制限し続けている。
最近の基盤モデルは、最初から強力なセマンティック表現を提供するが、既存のメソッドがインスタンスレベルで動作し、バッグ内の依存関係をキャプチャできないため、MILデータのこのような表現を効果的に拡張することは制限されている。
本研究では,MIL バッグ全体 (すなわち,集合) を直接表現空間にモデル化する生成アーキテクチャである SetFlow を紹介する。
提案手法では,フローマッチングのパラダイムと,Set Transformerにインスパイアされた設計を組み合わせることで,各バッグ内のインスタンス間のインタラクションをキャプチャしながら,置換不変入力を処理する。
モデルはクラスラベルと入力スケールの両方で条件付けされており、一貫性とセマンティックに整合した表現セットを生成することができる。
最新のMIL-PF分類パイプラインを用いて,大規模なマンモグラフィーベンチマークでSetFlowを評価する。
生成されたサンプルは、元のデータ分布と密に一致し、拡張に使用する場合のダウンストリームパフォーマンスも向上する。
さらに、合成データのみのトレーニングは、データスカースおよびプライバシに敏感なタスクに対する表現空間生成モデルの有効性を示す競争結果を示す。
関連論文リスト
- Sample Is Feature: Beyond Item-Level, Toward Sample-Level Tokens for Unified Large Recommender Models [14.332200648147863]
textbfSIF (emphSample Is Feature) を提案する。
textbfSample Tokenizerは、各歴史的なRawサンプルを階層的なグループ適応量子化によってTokenサンプルに量子化する。
textbfSIF-Mixerは、トークンレベルとサンプルレベルの混合を通じて、同種サンプル表現に対する深い特徴相互作用を行い、モデルの表現能力を完全に解放する。
論文 参考訳(メタデータ) (2026-04-17T02:47:31Z) - Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文 参考訳(メタデータ) (2025-10-16T03:37:16Z) - FissionFusion: Fast Geometric Generation and Hierarchical Souping for Medical Image Analysis [0.7751705157998379]
十分に注釈付けされた医療データセットの不足は、ImageNetのような広範なデータセットやCLIPのような事前訓練されたモデルからの移行学習を活用する必要がある。
モデルスープは、In-Domain(ID)タスクのパフォーマンスを改善し、out-of-Distribution(OOD)データセットに対する堅牢性を高めることを目的とした、複数の微調整されたモデルの平均である。
本稿では,様々なレベルのモデルの局所的および大域的集約を伴う階層的統合手法を提案する。
論文 参考訳(メタデータ) (2024-03-20T06:48:48Z) - MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation [104.03166324080917]
MosaicFusionは、大語彙のインスタンスセグメンテーションのための、単純で効果的な拡散に基づくデータ拡張手法である。
本手法はトレーニングフリーであり,ラベル管理に依存しない。
LVISロングテールおよびオープンボキャブラリベンチマークの実験結果は、MosaicFusionが既存のインスタンスセグメンテーションモデルの性能を大幅に改善できることを示した。
論文 参考訳(メタデータ) (2023-09-22T17:59:42Z) - EnfoMax: Domain Entropy and Mutual Information Maximization for Domain
Generalized Face Anti-spoofing [0.0]
Face Anti-Spoofing (FAS) 法はドメイン内の設定でよく機能する。
ドメイン一般化(DG)法はFASにおいて注目されている。
本稿では,情報理論を用いてドメイン間FASタスクを解析するEnfoMaxフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-17T03:54:18Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - Feature Re-calibration based MIL for Whole Slide Image Classification [7.92885032436243]
全スライド画像(WSI)分類は疾患の診断と治療の基本的な課題である。
本稿では,WSI バッグ (インスタンス) の分布を,最大インスタンス (クリティカル) 特性の統計値を用いて再校正することを提案する。
位置符号化モジュール(PEM)を用いて空間・形態情報をモデル化し,マルチヘッド自己アテンション(PSMA)をトランスフォーマーエンコーダでプーリングする。
論文 参考訳(メタデータ) (2022-06-22T07:00:39Z) - Dual-stream Maximum Self-attention Multi-instance Learning [11.685285490589981]
MIL(Multi-Instance Learning)は、インスタンスレベルのラベルが利用できない間に単一のクラスラベルがインスタンスのバッグに割り当てられる弱い教師付き学習の一種である。
ニューラルネットワークによりパラメータ化されたDSMILモデル(Dual-stream maximum self-attention MIL model)を提案する。
提案手法は,最高のMIL手法と比較して優れた性能を示し,ベンチマークMILデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2020-06-09T22:44:58Z) - Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文 参考訳(メタデータ) (2020-04-08T09:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。