論文の概要: A Highly Efficient Diversity-based Input Selection for DNN Improvement Using VLMs
- arxiv url: http://arxiv.org/abs/2601.08024v1
- Date: Mon, 12 Jan 2026 21:57:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:18.961739
- Title: A Highly Efficient Diversity-based Input Selection for DNN Improvement Using VLMs
- Title(参考訳): VLMを用いたDNN改善のための高効率ダイバーシティベース入力選択法
- Authors: Amin Abbasishahkoo, Mahboubeh Dadkhah, Lionel Briand,
- Abstract要約: 概念ベース多様性(CBD)は視覚言語モデル(VLM)を利用した画像入力のための高効率な指標である
CBDは幾何多様性度(Geometric Diversity, GD)と強い相関を示しており、その期間はわずかである。
本稿では,CBDと単純な不確実性指標であるMarginを組み合わせたハイブリッド入力選択手法を提案する。
- 参考スコア(独自算出の注目度): 0.09332987715848712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Maintaining or improving the performance of Deep Neural Networks (DNNs) through fine-tuning requires labeling newly collected inputs, a process that is often costly and time-consuming. To alleviate this problem, input selection approaches have been developed in recent years to identify small, yet highly informative subsets for labeling. Diversity-based selection is one of the most effective approaches for this purpose. However, they are often computationally intensive and lack scalability for large input sets, limiting their practical applicability. To address this challenge, we introduce Concept-Based Diversity (CBD), a highly efficient metric for image inputs that leverages Vision-Language Models (VLM). Our results show that CBD exhibits a strong correlation with Geometric Diversity (GD), an established diversity metric, while requiring only a fraction of its computation time. Building on this finding, we propose a hybrid input selection approach that combines CBD with Margin, a simple uncertainty metric. We conduct a comprehensive evaluation across a diverse set of DNN models, input sets, selection budgets, and five most effective state-of-the-art selection baselines. The results demonstrate that the CBD-based selection consistently outperforms all baselines at guiding input selection to improve the DNN model. Furthermore, the CBD-based selection approach remains highly efficient, requiring selection times close to those of simple uncertainty-based methods such as Margin, even on larger input sets like ImageNet. These results confirm not only the effectiveness and computational advantage of the CBD-based approach, particularly compared to hybrid baselines, but also its scalability in repetitive and extensive input selection scenarios.
- Abstract(参考訳): 微調整によってディープニューラルネットワーク(DNN)のパフォーマンスを維持または改善するには、新しく収集された入力をラベル付けする必要がある。
この問題を軽減するため、近年、ラベル付けのための小さいが、非常に有意義なサブセットを特定するために、入力選択アプローチが開発されている。
多様性に基づく選択は、この目的のために最も効果的なアプローチの1つである。
しかし、それらはしばしば計算集約的で、大きな入力セットのスケーラビリティが欠如しており、実用性に限界がある。
この課題に対処するために、視覚言語モデル(VLM)を利用した画像入力のための高効率なメトリックである概念ベース多様性(CBD)を紹介する。
以上の結果から, CBDは, 計算時間のごく一部しか必要とせず, 確立された多様性指標である幾何多様性(Geometric Diversity, GD)と強く相関していることがわかった。
そこで本研究では,CBDと単純な不確実性指標であるMarginを組み合わせたハイブリッド入力選択手法を提案する。
我々は多種多様なDNNモデル、入力セット、選択予算、そして5つの最も効果的な技術選択ベースラインを総合的に評価する。
その結果、CBDに基づく選択は、DNNモデルを改善するために入力選択の誘導において、全てのベースラインを一貫して上回ることを示した。
さらに、CBDベースの選択アプローチは非常に効率的であり、ImageNetのような大きな入力セットであっても、Marginのような単純な不確実性ベースの方法に近い選択時間を必要とする。
これらの結果は、CBDベースのアプローチの有効性と計算上の優位性、特にハイブリッドベースラインとの比較だけでなく、反復的および広範囲な入力選択シナリオにおけるスケーラビリティも確認する。
関連論文リスト
- On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - Less is More: Efficient Black-box Attribution via Minimal Interpretable Subset Selection [52.716143424856185]
部分モジュラー部分集合選択の最適化問題として重要領域の帰属を再構成するLiMA(Less input is more faithful for Attribution)を提案する。
LiMAは、エラーを最小限に抑える最適な帰属境界を確保しながら、最も重要かつ最も重要でないサンプルを識別する。
また, 帰属効率が1.6倍に向上し, 帰属効率が向上した。
論文 参考訳(メタデータ) (2025-04-01T06:58:15Z) - Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction [3.3739429143238784]
近年の研究では,外部ラベル付き・合成データを用いた半教師付き対人訓練(SSAT)手法が提案されている。
SSATは、高い堅牢性を達成するためにかなりのデータを必要とするため、トレーニング時間が長くなり、メモリ使用量が増加する。
SSATの効率を改善するためのラベルなしデータ削減戦略を提案する。
論文 参考訳(メタデータ) (2025-01-15T15:47:49Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Model-based feature selection for neural networks: A mixed-integer
programming approach [0.9281671380673306]
我々は、ReLUに基づくディープニューラルネットワーク(DNN)のための新しい入力特徴選択フレームワークを開発する。
提示の明確化のための画像分類のための入力特徴の発見に焦点をあてる。
提案した入力特徴選択により,適切な分類精度を維持しつつ,入力のサイズを$sim$15%に劇的に削減できることを示す。
論文 参考訳(メタデータ) (2023-02-20T22:19:50Z) - Data-Driven Evolutionary Multi-Objective Optimization Based on
Multiple-Gradient Descent for Disconnected Pareto Fronts [6.560512252982714]
本稿では,データ駆動型進化的多目的最適化(EMO)アルゴリズムを提案する。
そのインフィル基準は、高価な客観的関数評価を行うための、有望な候補ソリューションのバッチを推奨している。
論文 参考訳(メタデータ) (2022-05-28T06:01:41Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - RoMA: Robust Model Adaptation for Offline Model-based Optimization [115.02677045518692]
入力出力クエリの静的データセットからブラックボックス目的関数を最大化する入力を探索する問題を考える。
この問題を解決するための一般的なアプローチは、真の客観的関数を近似するプロキシモデルを維持することである。
ここでの大きな課題は、検索中に逆最適化された入力を避ける方法である。
論文 参考訳(メタデータ) (2021-10-27T05:37:12Z) - Sparse Bayesian Deep Learning for Dynamic System Identification [14.040914364617418]
本稿では,システム同定のためのディープニューラルネットワーク(DNN)の疎ベイズ処理を提案する。
提案されたベイズ的アプローチは、限界確率/モデル証拠近似による課題を緩和する原則的な方法を提供する。
提案手法の有効性を線形および非線形システム同定ベンチマークで示す。
論文 参考訳(メタデータ) (2021-07-27T16:09:48Z) - Automatic selection of basis-adaptive sparse polynomial chaos expansions
for engineering applications [0.0]
スパースカオス展開のための3つの最新技術に基づく基礎適応的アプローチについて述べる。
我々は,大規模な計算モデルに対して,大域的近似精度の観点から広範なベンチマークを行う。
クロスバリデーションエラーによって導かれる新しい解法と基底適応性選択スキームを導入する。
論文 参考訳(メタデータ) (2020-09-10T12:13:57Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。