論文の概要: Accelerating Benchmarking of Functional Connectivity Modeling via Structure-aware Core-set Selection
- arxiv url: http://arxiv.org/abs/2602.05667v1
- Date: Thu, 05 Feb 2026 13:50:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.957799
- Title: Accelerating Benchmarking of Functional Connectivity Modeling via Structure-aware Core-set Selection
- Title(参考訳): 構造対応コアセット選択による機能接続モデルのベンチマークの高速化
- Authors: Ling Zhan, Zhen Li, Junjie Huang, Tao Jia,
- Abstract要約: そこで我々は,SCLCS (Contrastive Learning for Core-set Selection) をランキングサブセット選択問題として定式化する。
SCLCSは、トップkランキング、構造摂動スコア、密度バランスサンプリング戦略を通じて安定したサンプルを識別する。
大規模なREST-meta-MDDデータセットでは、SCLCSはデータの10%しかデータに基幹モデルランキングを保持しておらず、ランキング一貫性(nDCG@k)が最大23.2%向上するSOTA(State-of-the-art)コアセット選択方法よりも優れています。
- 参考スコア(独自算出の注目度): 8.347306013377041
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Benchmarking the hundreds of functional connectivity (FC) modeling methods on large-scale fMRI datasets is critical for reproducible neuroscience. However, the combinatorial explosion of model-data pairings makes exhaustive evaluation computationally prohibitive, preventing such assessments from becoming a routine pre-analysis step. To break this bottleneck, we reframe the challenge of FC benchmarking by selecting a small, representative core-set whose sole purpose is to preserve the relative performance ranking of FC operators. We formalize this as a ranking-preserving subset selection problem and propose Structure-aware Contrastive Learning for Core-set Selection (SCLCS), a self-supervised framework to select these core-sets. SCLCS first uses an adaptive Transformer to learn each sample's unique FC structure. It then introduces a novel Structural Perturbation Score (SPS) to quantify the stability of these learned structures during training, identifying samples that represent foundational connectivity archetypes. Finally, while SCLCS identifies stable samples via a top-k ranking, we further introduce a density-balanced sampling strategy as a necessary correction to promote diversity, ensuring the final core-set is both structurally robust and distributionally representative. On the large-scale REST-meta-MDD dataset, SCLCS preserves the ground-truth model ranking with just 10% of the data, outperforming state-of-the-art (SOTA) core-set selection methods by up to 23.2% in ranking consistency (nDCG@k). To our knowledge, this is the first work to formalize core-set selection for FC operator benchmarking, thereby making large-scale operators comparisons a feasible and integral part of computational neuroscience. Code is publicly available on https://github.com/lzhan94swu/SCLCS
- Abstract(参考訳): 大規模なfMRIデータセット上で数百の機能接続(FC)モデリング手法をベンチマークすることは、再現可能な神経科学にとって重要である。
しかし、モデルデータペアリングの組合せ的爆発は、徹底的な評価を計算的に禁止し、そのような評価が日常的な事前分析ステップになることを防ぐ。
このボトルネックを克服するために,我々は,FC演算子の相対的性能ランキングを維持することを目的とした,小さな代表コアセットを選択することで,FCベンチマークの課題を再考した。
我々はこれをランキング保存サブセット選択問題として定式化し、これらのコアセットを選択するための自己教師型フレームワークであるSCLCS(Structure-aware Contrastive Learning for Core-set Selection)を提案する。
SCLCSはまずアダプティブトランスフォーマーを使用して各サンプルのユニークなFC構造を学習する。
次に、トレーニング中にこれらの学習された構造の安定性を定量化するための新しい構造摂動スコア(Structure Perturbation Score, SPS)を導入し、基礎的な接続アーチタイプを表すサンプルを特定した。
最後に、SCLCSは、トップkランキングで安定したサンプルを識別する一方で、多様性を促進するために必要な修正として密度バランスサンプリング戦略を導入し、最終コアセットが構造的に堅牢かつ分布的に代表的であることを保証する。
大規模なREST-meta-MDDデータセットでは、SCLCSはデータの10%しかデータに基幹モデルランキングを保持せず、ランキング一貫性(nDCG@k)が最大23.2%向上するSOTA(State-of-the-art)コアセット選択方法よりも優れています。
我々の知る限り、これはFC演算子ベンチマークのコアセット選択を形式化し、大規模演算子を計算神経科学において実現可能かつ不可欠な部分と比較する最初の試みである。
コードはhttps://github.com/lzhan94swu/SCLCSで公開されている。
関連論文リスト
- Efficient Content-based Recommendation Model Training via Noise-aware Coreset Selection [43.57971566335706]
ノイズ対応コアセット選択(NaCS)は、コンテンツベースのレコメンデーションシステムのための特殊なフレームワークである。
NaCSは、トレーニング勾配に基づいてサブモジュール最適化によってコアセットを構築し、ノイズラベルを同時に修正する。
我々は,NACSが既存のコアセット選択技術よりも優れた効率を実現しつつ,CRSの高品質なコアセットを生成することを示す。
論文 参考訳(メタデータ) (2026-01-15T04:46:28Z) - Learning Discrete Bayesian Networks with Hierarchical Dirichlet Shrinkage [52.914168158222765]
我々はDBNを学習するための包括的なベイズ的フレームワークについて詳述する。
我々は、並列ランゲヴィン提案を用いてマルコフ連鎖モンテカルロ(MCMC)アルゴリズムを新たに提案し、正確な後続サンプルを生成する。
原発性乳癌検体から予後ネットワーク構造を明らかにするために本手法を適用した。
論文 参考訳(メタデータ) (2025-09-16T17:24:35Z) - Improving Model Classification by Optimizing the Training Dataset [3.987352341101438]
Coresetsはデータ削減に対する原則的なアプローチを提供し、大規模なデータセットでの効率的な学習を可能にする。
下流の分類品質を向上させるために,コアセット生成プロセスを調整するための体系的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-22T16:10:11Z) - Federated Learning for ICD Classification with Lightweight Models and Pretrained Embeddings [0.9668407688201359]
本研究では,多ラベルICD符号分類におけるフェデレート学習の有効性と性能について検討した。
本稿では, シンプルな多層パーセプトロン(MLP)分類器と凍結したテキスト埋め込みを組み合わせたスケーラブルなパイプラインを提案する。
論文 参考訳(メタデータ) (2025-07-03T18:58:36Z) - Non-Uniform Class-Wise Coreset Selection: Characterizing Category Difficulty for Data-Efficient Transfer Learning [19.152700266277247]
Non-Uniform Class-Wise Coreset Selection (NUCS)は、クラスレベルとインスタンスレベルの両方の基準を統合する新しいフレームワークである。
我々の研究は、コアセット選択におけるカテゴリの難しさを特徴づけることの重要性を強調し、転送学習のための堅牢でデータ効率のよいソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-17T15:40:51Z) - MOKD: Cross-domain Finetuning for Few-shot Classification via Maximizing Optimized Kernel Dependence [97.93517982908007]
NCCは、ドメイン間数ショットの分類において、少数ショットの分類が可能なメートル法空間を構築するために表現を学ぶことを目的としている。
本稿では,異なるクラスから得られた2つの標本の NCC 学習表現に高い類似性があることを見出した。
ラベル付きデータによって示されるクラスタ構造にマッチするクラス固有の表現の集合を学習するために、最適化されたカーネル依存(MOKD)を最大化する二段階最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-29T05:59:52Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Prompt Tuning for Parameter-efficient Medical Image Segmentation [79.09285179181225]
2つの医用画像データセットのセマンティックセグメンテーションにパラメータ効率が良いが効果的な適応を実現するために,いくつかのコントリビューションを提案し,検討する。
我々はこのアーキテクチャを、オンライン生成プロトタイプへの割り当てに基づく専用密集型セルフスーパービジョンスキームで事前訓練する。
得られたニューラルネットワークモデルにより、完全に微調整されたモデルとパラメータに適応したモデルとのギャップを緩和できることを実証する。
論文 参考訳(メタデータ) (2022-11-16T21:55:05Z) - Fed-CBS: A Heterogeneity-Aware Client Sampling Mechanism for Federated
Learning via Class-Imbalance Reduction [76.26710990597498]
本研究では,ランダムに選択したクライアントからのグループデータのクラス不均衡が,性能の大幅な低下につながることを示す。
我々のキーとなる観測に基づいて、我々は効率的なクライアントサンプリング機構、すなわちフェデレートクラスバランスサンプリング(Fed-CBS)を設計する。
特に、クラス不均衡の尺度を提案し、その後、同型暗号化を用いてプライバシー保護方式でこの尺度を導出する。
論文 参考訳(メタデータ) (2022-09-30T05:42:56Z) - Adaptive Name Entity Recognition under Highly Unbalanced Data [5.575448433529451]
我々は,2方向LSTM (BI-LSTM) 上に積み重ねた条件付きランダムフィールド (CRF) 層からなるニューラルアーキテクチャについて実験を行った。
WeakクラスとStrongクラスを2つの異なるセットに分割し、各セットのパフォーマンスを最適化するために2つのBi-LSTM-CRFモデルを適切に設計するアドオン分類モデルを提案する。
論文 参考訳(メタデータ) (2020-03-10T06:56:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。