論文の概要: Oxytrees: Model Trees for Bipartite Learning
- arxiv url: http://arxiv.org/abs/2511.12713v1
- Date: Sun, 16 Nov 2025 17:57:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.498944
- Title: Oxytrees: Model Trees for Bipartite Learning
- Title(参考訳): Oxytrees: 双方向学習のためのモデルツリー
- Authors: Pedro Ilídio, Felipe Kenji Nakano, Alireza Gharahighehi, Robbe D'hondt, Ricardo Cerri, Celine Vens,
- Abstract要約: Oxytreesはプロキシベースのビクラスタリングモデルツリーで、相互作用行列を行および列のプロキシ行列に圧縮する。
Oxytrees は Kronecker の製品カーネルを葉に用いた線形モデルを採用しており、結果としてより浅い木が生まれ、より高速な訓練が行われている。
我々は、最先端の二群林と比較して、訓練時間の最大30倍の改善を実現した。
- 参考スコア(独自算出の注目度): 1.3854111346209868
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bipartite learning is a machine learning task that aims to predict interactions between pairs of instances. It has been applied to various domains, including drug-target interactions, RNA-disease associations, and regulatory network inference. Despite being widely investigated, current methods still present drawbacks, as they are often designed for a specific application and thus do not generalize to other problems or present scalability issues. To address these challenges, we propose Oxytrees: proxy-based biclustering model trees. Oxytrees compress the interaction matrix into row- and column-wise proxy matrices, significantly reducing training time without compromising predictive performance. We also propose a new leaf-assignment algorithm that significantly reduces the time taken for prediction. Finally, Oxytrees employ linear models using the Kronecker product kernel in their leaves, resulting in shallower trees and thus even faster training. Using 15 datasets, we compared the predictive performance of ensembles of Oxytrees with that of the current state-of-the-art. We achieved up to 30-fold improvement in training times compared to state-of-the-art biclustering forests, while demonstrating competitive or superior performance in most evaluation settings, particularly in the inductive setting. Finally, we provide an intuitive Python API to access all datasets, methods and evaluation measures used in this work, thus enabling reproducible research in this field.
- Abstract(参考訳): Bipartite Learningは、インスタンスのペア間のインタラクションを予測することを目的とした、機械学習タスクである。
薬物標的相互作用、RNA放出関連、制御ネットワーク推論など、様々な領域に応用されている。
広く研究されているにもかかわらず、現在の手法では、特定のアプリケーション用に設計されることが多いため、他の問題やスケーラビリティの問題に一般化しないため、依然として欠点がある。
これらの課題に対処するため、プロキシベースのビクラスタリングモデルツリーであるOxytreesを提案する。
Oxytreesは相互作用行列を行および列ワイドのプロキシ行列に圧縮し、予測性能を損なうことなくトレーニング時間を著しく短縮する。
また,予測に要する時間を大幅に削減する新しい葉配置アルゴリズムを提案する。
最後に、Oxytrees は Kronecker の製品カーネルを葉に用いた線形モデルを採用しており、結果としてより浅い木が生まれ、より高速な訓練が行われている。
15のデータセットを用いて,Oxytreeのアンサンブルの予測性能と現在の最先端のアンサンブルの予測性能を比較した。
両群集林と比較して,訓練時間の最大30倍の改善を実現し,特に帰納的環境において,ほとんどの評価条件において,競争力や優れた性能を示した。
最後に、この研究で使用されるすべてのデータセット、メソッド、評価尺度にアクセスするための直感的なPython APIを提供し、この分野で再現可能な研究を可能にする。
関連論文リスト
- Evaluating Double Descent in Machine Learning: Insights from Tree-Based Models Applied to a Genomic Prediction Task [0.0]
最近の研究は、いわゆる二重降下現象のしきい値上昇を超えて、テストエラーの第2降下の概念を導入している。
二重降着は、2つの軸をまたいだ複雑さが共同でスケールする場合にのみ、一貫して現れることを示す。
本研究は,一般化行動の解析において,モデル複雑性を多次元構造として扱うことの重要性を強調した。
論文 参考訳(メタデータ) (2025-09-22T16:41:31Z) - A Closer Look at Deep Learning Methods on Tabular Datasets [78.61845513154502]
広い範囲にまたがる300以上のデータセットの集合であるTALENTについて広範な研究を行った。
我々の評価では、アンサンブルは木に基づくアプローチとニューラルアプローチの両方に効果があることが示されている。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - DyG2Vec: Efficient Representation Learning for Dynamic Graphs [26.792732615703372]
時間グラフニューラルネットワークは、時間パターンを自動的に抽出することで、帰納的表現の学習において有望な結果を示している。
時間的エッジエンコーディングとウィンドウベースのサブグラフサンプリングを利用してタスクに依存しない埋め込みを生成する。
論文 参考訳(メタデータ) (2022-10-30T18:13:04Z) - On the Robustness of Random Forest Against Untargeted Data Poisoning: An
Ensemble-Based Approach [42.81632484264218]
機械学習モデルでは、トレーニングセット(中毒)の分画の摂動が、モデルの精度を著しく損なう可能性がある。
本研究の目的は、ランダムな森林を標的のない無作為な毒殺攻撃から保護する、新しいハッシュベースのアンサンブルアプローチを実現することである。
論文 参考訳(メタデータ) (2022-09-28T11:41:38Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Kronecker Decomposition for Knowledge Graph Embeddings [5.49810117202384]
知識グラフ埋め込みモデルにおけるパラメータ数を削減するために,Kronecker分解に基づく手法を提案する。
この分解により、3つの埋め込みベクトル間の要素的相互作用が各埋め込みベクトル内の相互作用によって拡張されることが保証される。
実験により,Kronecker分解を埋め込み行列に適用すると,全てのベンチマークデータセットのパラメータ効率が向上することが示唆された。
論文 参考訳(メタデータ) (2022-05-13T11:11:03Z) - A cautionary tale on fitting decision trees to data from additive
models: generalization lower bounds [9.546094657606178]
本研究では,異なる回帰モデルに対する決定木の一般化性能について検討する。
これにより、アルゴリズムが新しいデータに一般化するために(あるいは作らない)仮定する帰納的バイアスが引き起こされる。
スパース加法モデルに適合する大規模な決定木アルゴリズムに対して、シャープな2乗誤差一般化を低い境界で証明する。
論文 参考訳(メタデータ) (2021-10-18T21:22:40Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。