論文の概要: Objective-Induced Bias and Search Dynamics in Multiobjective Unsupervised Feature Selection
- arxiv url: http://arxiv.org/abs/2605.21561v1
- Date: Wed, 20 May 2026 15:14:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:41.941851
- Title: Objective-Induced Bias and Search Dynamics in Multiobjective Unsupervised Feature Selection
- Title(参考訳): 多目的非教師付き特徴選択における目的誘発バイアスと探索ダイナミクス
- Authors: Mathieu Cherpitel, Thomas Bäck, Martijn R. Tannemaat, Anna V. Kononova,
- Abstract要約: 評価対象の選択、サブセットサイズ正規化の方向性、初期化戦略について検討する。
客観的デザインは, 効果的な多目的的非教師付き特徴選択の中心であることを示す。
- 参考スコア(独自算出の注目度): 2.2282508171588806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised feature selection is commonly formulated as a multiobjective optimisation problem that jointly optimises subset quality and subset size. Yet the behaviour of this formulation depends critically on the choice of evaluation objective, the direction of subset-size regularisation, and the initialisation strategy. We study these factors in a controlled setting using a synthetic dataset with known informative, redundant, and irrelevant feature types. Six formulations are compared by combining three evaluation objectives: accuracy, silhouette score, and PCA reconstruction loss with subset-size minimisation or maximisation. The results show that formulation strongly affects both search dynamics and the quality of the resulting Pareto front. Silhouette-based formulations exhibit a strong bias toward trivial low-cardinality solutions and remain weak proxies for predictive performance. In contrast, the proposed PCA loss objective produces compact subsets with test accuracy comparable to subsets obtained by directly optimising supervised accuracy. Overall, the study shows that objective design is central to effective multiobjective unsupervised feature selection.
- Abstract(参考訳): 教師なし特徴選択は、一般に、サブセットの品質とサブセットサイズを共同最適化する多目的最適化問題として定式化される。
しかし、この定式化の振る舞いは、評価対象の選択、サブセットサイズ正規化の方向性、初期化戦略に大きく依存する。
本研究では,これらの要因を,情報的・冗長的・無関係な特徴型を持つ合成データセットを用いて制御した環境で検討する。
6つの定式化は, 精度, シルエットスコア, PCA再構成損失とサブセットサイズの最小化, 最大化の3つの評価目標を組み合わせて比較した。
その結果,定式化は探索力学と結果のパレートフロントの品質の両方に強く影響を及ぼすことがわかった。
シルエットに基づく定式化は、自明な低心性解に対する強いバイアスを示し、予測性能の弱いプロキシを保っている。
対照的に、提案したPCA損失目的は、教師付き精度を直接最適化することによって得られるサブセットに匹敵する、テスト精度のコンパクトなサブセットを生成する。
本研究は, 客観的デザインが, 効果的な多目的的非教師付き特徴選択の中心であることを示す。
関連論文リスト
- Stochastic set-valued optimization and its application to robust learning [0.0]
我々は、堅牢な機械学習に適したセット値最適化(SVO)フレームワークを開発する。
SVO設定では、各決定変数は対象値のセットにマッピングされ、最適性はセット関係によって定義される。
論文 参考訳(メタデータ) (2026-03-18T13:07:53Z) - Structural bias in multi-objective optimisation [5.869782631289138]
構造バイアス (Structure bias, SB) とは、探索空間の特定の領域に対して最適化アルゴリズムを体系的に選好することを指す。
SBは単目的最適化において広範囲に研究されているが、多目的最適化におけるその役割はほとんど解明されていない。
本稿では、構造バイアスの概念を多目的設定に拡張し、フィットネス駆動誘導から分離して研究する手法を提案する。
論文 参考訳(メタデータ) (2026-02-06T14:43:28Z) - Enhanced Ideal Objective Vector Estimation for Evolutionary Multi-Objective Optimization [24.71649541757315]
理想目的ベクトルは、$m$オブジェクト最適化問題における$m$オブジェクト最適化関数の最適値を構成するもので、進化的多目的最適化において重要な概念である。
本稿では, 人口推定法は単純な問題にのみ適用可能であるが, 重大なバイアスのある問題には適用できないことを明らかにする。
多目的進化アルゴリズムには、拡張理想主観的ベクトル推定(EIE)と呼ばれるプラグアンドプレイコンポーネントが導入された。
論文 参考訳(メタデータ) (2025-05-28T02:36:45Z) - Pareto Optimization with Robust Evaluation for Noisy Subset Selection [34.83487850400559]
サブセット選択は最適化の基本的な問題であり、影響やスパース回帰といった幅広い応用がある。
欲求アルゴリズムや進化進化的POSSを含む従来のアルゴリズムは、ノイズの多い環境で苦労するか、過剰な計算資源を消費する。
本稿では,頑健な評価関数を最大化し,同時にサブセットサイズを最小化する,雑音性サブセット選択(PORE)のためのロバスト評価を用いたパレート最適化に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-12T14:04:20Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Controllable Preference Optimization: Toward Controllable Multi-Objective Alignment [103.12563033438715]
人工知能におけるアライメントは、モデル応答と人間の好みと値の一貫性を追求する。
既存のアライメント技術は、主に一方向であり、様々な目的に対して、最適以下のトレードオフと柔軟性の低下につながる。
制御可能な選好最適化(CPO)を導入し、異なる目的に対する選好スコアを明確に指定する。
論文 参考訳(メタデータ) (2024-02-29T12:12:30Z) - Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.15923939406772]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Bi-objective Ranking and Selection Using Stochastic Kriging [0.0]
両目的のランク付けと選択の問題について検討し,その2つの目的が不確実性をもって観測された。
そこで本研究では,競合する解に対して逐次サンプルを割り当てるバイーシアン双対象ランクと選別法を提案する。
実験結果から,提案手法は標準的なアロケーション手法よりも優れており,また,よく知られた最先端のアルゴリズムも優れていることがわかった。
論文 参考訳(メタデータ) (2022-09-05T23:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。