論文の概要: One-Shot Data Selection for Medical Image Classification via Graph Coverage
- arxiv url: http://arxiv.org/abs/2606.22002v1
- Date: Sat, 20 Jun 2026 11:54:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 23:16:16.255108
- Title: One-Shot Data Selection for Medical Image Classification via Graph Coverage
- Title(参考訳): グラフ被覆による医用画像分類のためのワンショットデータ選択
- Authors: Zahiriddin Rustamov, Nadia Badawi, Rafat Damseh, Nazar Zaki,
- Abstract要約: そこで本研究では,凍結基礎モデルの埋め込みに完全に依存するグラフベースのワンショット選択法を提案する。
病理組織学,放射線学,顕微鏡の5つのMedMNISTデータセットについて検討した。
- 参考スコア(独自算出の注目度): 1.7518795691624354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training medical image classifiers on entire datasets is wasteful when annotation budgets are limited: not all samples contribute equally, yet acquiring expert labels is expensive. Active learning reduces annotation cost through iterative querying, but assumes repeated access to an oracle and requires multiple rounds of model training. One-shot geometry-based methods such as facility location avoid retraining but operate on pairwise distances that ignore the local structure of the data manifold. We propose a graph-based one-shot selection method that operates entirely on frozen foundation model embeddings. Given embeddings from a pretrained encoder, we construct a k-nearest neighbor graph over all training samples and derive a two-term coverage kernel from the heat diffusion kernel, capturing both direct and two-hop neighborhood relationships. Greedy facility location on this kernel selects class-balanced subsets that maximize coverage of the data manifold. The two-term kernel matches the full spectral heat kernel in selection behavior while reducing computation to sparse matrix operations with a single hyperparameter. We evaluate on five MedMNIST datasets spanning histopathology, radiology, and microscopy, comparing against both training-dynamics and geometry-based baselines. Our method achieves the highest balanced accuracy on nine of ten dataset-ratio conditions, with the largest gains on class-imbalanced datasets where global graph construction captures cross-class structure that per-class methods miss, all without any model training during selection. Code is available at https://github.com/zahiriddin-rustamov/graph-coverage-selection.
- Abstract(参考訳): データセット全体の医療画像分類器のトレーニングは、アノテーション予算が制限されている場合、無駄である。
アクティブラーニングは反復的なクエリによってアノテーションのコストを削減するが、オラクルへの繰り返しアクセスを前提とし、複数のモデルのトレーニングを必要とする。
施設位置のようなワンショット幾何学に基づく手法は再訓練を避けるが、データ多様体の局所構造を無視したペアワイズ距離で動作する。
そこで本研究では,凍結基礎モデルの埋め込みに完全に依存するグラフベースのワンショット選択法を提案する。
事前学習したエンコーダからの埋め込みを考慮し、すべてのトレーニングサンプルに k-nearest 近傍グラフを構築し、熱拡散カーネルから2長期被覆カーネルを導出し、直接および2ホップ近傍の関係を捉える。
このカーネル上のグレディな施設位置は、データ多様体のカバレッジを最大化するクラスバランスのサブセットを選択する。
2項のカーネルは、選択行動において全スペクトル熱カーネルと一致し、計算を1つのハイパーパラメータでスパース行列演算に還元する。
病理組織学,放射線学,顕微鏡にまたがる5つのMedMNISTデータセットについて,トレーニング力学と幾何学ベースラインの比較を行った。
提案手法は10のデータセット比条件のうち9つの条件において最も高いバランスの取れた精度を達成し,グローバルグラフ構造がクラス毎のメソッドが欠落するクラス間構造を捕捉するクラス不均衡データセットにおいて,選択中のモデルトレーニングを伴わずに最大ゲインを得る。
コードはhttps://github.com/zahiriddin-rustamov/graph-coverage-selectionで公開されている。
関連論文リスト
- Active Learning with Low-Rank Structure for Data Selection [85.43185363043362]
低ランク近似と残差に基づくサンプリングに基づく新しいデータ選択フレームワークを提案する。
平均損失がデータセット全体の平均損失を近似した$tildeOleft(k + frac1varepsilon2right)$データポイントの重み付きサブセットを選択することができることを示す。
論文 参考訳(メタデータ) (2026-06-14T22:29:59Z) - Covariate-assisted graph matching [1.4466802614938332]
そこで我々は,シードと呼ばれるノードの集合の部分的アライメントが知られている2つの新しいグラフマッチング法を提案する。
本手法の有効性は,数値実験および統計学系譜と協調ネットワークのマッチングへの応用を通じて実証された。
論文 参考訳(メタデータ) (2025-12-12T18:12:56Z) - Kernel Representation and Similarity Measure for Incomplete Data [55.62595187178638]
不完全データの類似性を測定することは、Webマイニング、レコメンデーションシステム、ユーザー行動分析において基本的な課題である。
従来のアプローチでは、不完全なデータを破棄するか、事前処理のステップとして計算を実行するかのいずれかであり、情報損失と類似性のバイアスが生じる。
本稿では,カーネルの特徴空間における不完全データ間の類似性を,元の空間における明示的な計算なしで直接計算する,新しい類似度尺度を提案する。
論文 参考訳(メタデータ) (2025-10-15T09:41:23Z) - Heterogeneous LLM Methods for Ontology Learning (Few-Shot Prompting, Ensemble Typing, and Attention-Based Taxonomies) [46.54026795022501]
LLMs4OL 2025チャレンジのタスクA,B,Cに対処する包括的システムを提案する。
提案手法は、検索強化プロンプト、ゼロショット分類、アテンションに基づくグラフモデリングを組み合わせたものである。
これらのモジュラーでタスク固有のソリューションによって、公式のリーダーボードで上位の成果を得られるようになりました。
論文 参考訳(メタデータ) (2025-08-26T20:50:16Z) - SpaRG: Sparsely Reconstructed Graphs for Generalizable fMRI Analysis [8.489318619991534]
深層学習は、精神疾患や個人の特徴に関連する静止状態機能型磁気共鳴イメージング(rsfMRI)のパターンを明らかにするのに役立つ。
しかし、深層学習の発見を解釈する問題は、fMRIによる分析よりも明らかではない。
スパーシフィケーションと自己超越に基づくこれらの課題を緩和するための簡単なアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-24T18:35:57Z) - Federated Classification in Hyperbolic Spaces via Secure Aggregation of
Convex Hulls [35.327709607897944]
我々は,Poincareディスク用の凸SVM分類器の分散バージョンを開発した。
双曲空間における凸殻の複雑さを計算し,データ漏洩の程度を評価する。
本手法は, 階層的な単一細胞RNA-seqデータを含む, 多様なデータ集合を用いて, 異なるレポジトリに分散した患者から抽出した。
論文 参考訳(メタデータ) (2023-08-14T02:25:48Z) - Learnable Graph Matching: A Practical Paradigm for Data Association [74.28753343714858]
これらの問題に対処するための一般的な学習可能なグラフマッチング法を提案する。
提案手法は,複数のMOTデータセット上での最先端性能を実現する。
画像マッチングでは,一般的な屋内データセットであるScanNetで最先端の手法より優れている。
論文 参考訳(メタデータ) (2023-03-27T17:39:00Z) - Condensing Graphs via One-Step Gradient Matching [50.07587238142548]
ネットワーク重みを訓練せずに1ステップのみの勾配マッチングを行う1ステップ勾配マッチング方式を提案する。
我々の理論的分析は、この戦略が実際のグラフの分類損失を減少させる合成グラフを生成することができることを示している。
特に、元のパフォーマンスの最大98%を近似しながら、データセットサイズを90%削減することが可能です。
論文 参考訳(メタデータ) (2022-06-15T18:20:01Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。