論文の概要: Enhancing Neural Subset Selection: Integrating Background Information
into Set Representations
- arxiv url: http://arxiv.org/abs/2402.03139v1
- Date: Mon, 5 Feb 2024 16:09:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 15:05:52.654915
- Title: Enhancing Neural Subset Selection: Integrating Background Information
into Set Representations
- Title(参考訳): ニューラルネットワークサブセット選択の強化:背景情報を集合表現に統合する
- Authors: Binghui Xie, Yatao Bian, Kaiwen zhou, Yongqiang Chen, Peilin Zhao, Bo
Han, Wei Meng, James Cheng
- Abstract要約: 対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
- 参考スコア(独自算出の注目度): 55.44881879377666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning neural subset selection tasks, such as compound selection in
AI-aided drug discovery, have become increasingly pivotal across diverse
applications. The existing methodologies in the field primarily concentrate on
constructing models that capture the relationship between utility function
values and subsets within their respective supersets. However, these approaches
tend to overlook the valuable information contained within the superset when
utilizing neural networks to model set functions. In this work, we address this
oversight by adopting a probabilistic perspective. Our theoretical findings
demonstrate that when the target value is conditioned on both the input set and
subset, it is essential to incorporate an \textit{invariant sufficient
statistic} of the superset into the subset of interest for effective learning.
This ensures that the output value remains invariant to permutations of the
subset and its corresponding superset, enabling identification of the specific
superset from which the subset originated. Motivated by these insights, we
propose a simple yet effective information aggregation module designed to merge
the representations of subsets and supersets from a permutation invariance
perspective. Comprehensive empirical evaluations across diverse tasks and
datasets validate the enhanced efficacy of our approach over conventional
methods, underscoring the practicality and potency of our proposed strategies
in real-world contexts.
- Abstract(参考訳): AIを用いた薬物発見における複合選択などのニューラルネットワークサブセット選択タスクの学習は、さまざまなアプリケーションにおいてますます重要になっている。
この分野の既存の方法論は主に、各スーパーセット内のユーティリティ関数値とサブセットの関係をキャプチャするモデルの構築に集中している。
しかし、これらのアプローチは、ニューラルネットワークを使って集合関数をモデル化する際にスーパーセットに含まれる貴重な情報を見落としがちである。
本研究では,確率的視点を採用することで,この見落としに対処した。
我々の理論的な知見は、ターゲット値が入力セットとサブセットの両方に条件付けされている場合、スーパーセットの \textit{invariant enough statistic} を有効学習のためのサブセットに組み込むことが不可欠であることを示している。
これにより、出力値が部分集合とその対応する超集合の置換に不変であり続けることが保証され、部分集合が原点となる特定の超集合の識別が可能になる。
これらの知見に触発されて、置換不変の観点からサブセットとスーパーセットの表現をマージする、単純で効果的な情報集約モジュールを提案する。
多様なタスクやデータセットにまたがる総合的な経験的評価は,従来の手法に対するアプローチの強化効果を検証し,提案手法の実践性と実世界の文脈における有効性を裏付けるものである。
関連論文リスト
- Neuro-Symbolic Embedding for Short and Effective Feature Selection via Autoregressive Generation [22.87577374767465]
ニューロシンボリックレンズを用いて特徴選択を再構成し、短時間かつ効果的な特徴サブセットを特定することを目的とした新しい生成フレームワークを導入する。
本稿ではまず,特徴IDトークン,モデル性能,特徴サブセットの冗長度測定などからなる多数の特徴選択サンプルを自動的に収集するデータ収集手法を提案する。
収集したデータに基づいて,効率的な探索のために,特徴選択の知性を連続的な埋め込み空間に保存するエンコーダ・デコーダ・評価学習パラダイムを開発した。
論文 参考訳(メタデータ) (2024-04-26T05:01:08Z) - Out-of-Distribution Detection via Deep Multi-Comprehension Ensemble [11.542472900306745]
マルチComprehension (MC) Ensemble は,OOD (Out-of-Distribution) 特徴表現を拡大するための戦略として提案されている。
OOD検出におけるMC Ensemble戦略の優れた性能を示す実験結果を得た。
これにより,提案手法がトレーニング分布外のインスタンスを検出できるモデルの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2024-03-24T18:43:04Z) - Leveraging sparse and shared feature activations for disentangled
representation learning [112.22699167017471]
本稿では,教師付きタスクの多種多様な集合から抽出した知識を活用し,共通不整合表現を学習することを提案する。
我々は6つの実世界分布シフトベンチマークと異なるデータモダリティに対するアプローチを検証する。
論文 参考訳(メタデータ) (2023-04-17T01:33:24Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Feature Selection via the Intervened Interpolative Decomposition and its
Application in Diversifying Quantitative Strategies [4.913248451323163]
本稿では,観測行列の各列がそれぞれの優先度や重要性を持つ補間分解(ID)を計算するための確率論的モデルを提案する。
提案したモデルを,中国A株10株を含む実世界のデータセット上で評価した。
論文 参考訳(メタデータ) (2022-09-29T03:36:56Z) - Low-rank Dictionary Learning for Unsupervised Feature Selection [11.634317251468968]
低ランク表現に辞書学習のアイデアを適用することで、教師なしの新たな特徴選択手法を導入する。
非教師付き特徴選択のための統一目的関数は、$ell_2,1$-norm正規化によってスパースな方法で提案される。
実験の結果,提案手法は最先端のアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-06-21T13:39:10Z) - Exploring Multi-dimensional Data via Subset Embedding [13.092303047029311]
サブセットパターンを探索する視覚分析手法を提案する。
アプローチの中核はサブセット埋め込みネットワーク(SEN)であり、サブセットの群を一様に変形した埋め込みとして表現する。
この設計により、任意のサブセットを処理し、単一の機能でサブセットの類似性をキャプチャできる。
論文 参考訳(メタデータ) (2021-04-24T03:08:08Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Learn to Predict Sets Using Feed-Forward Neural Networks [63.91494644881925]
本稿では、ディープフィードフォワードニューラルネットワークを用いた設定予測の課題に対処する。
未知の置換と基数を持つ集合を予測するための新しい手法を提案する。
関連視覚問題に対する集合定式化の有効性を実証する。
論文 参考訳(メタデータ) (2020-01-30T01:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。