Fugu-MT 論文翻訳(概要): Cross-Cluster Weighted Forests

論文の概要: Cross-Cluster Weighted Forests

arxiv url: http://arxiv.org/abs/2105.07610v3
Date: Tue, 29 Oct 2024 02:51:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:28.127605
Title: Cross-Cluster Weighted Forests
Title（参考訳）: クロスクラスター重林
Authors: Maya Ramchandran, Rajarshi Mukherjee, Giovanni Parmigiani,
Abstract要約: 本稿では,特徴分布に不均一性をもつ単一データセット内のクラスタ上で学習したランダムフォレスト学習者のアンサンブル効果について考察する。従来のランダムフォレストアルゴリズムに比べて,k平均等のアルゴリズムによって決定されたクラスタ上で訓練された森林のアンサンブルの構築精度と一般化性が著しく向上することがわかった。
参考スコア（独自算出の注目度）: 4.9873153106566575
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Adapting machine learning algorithms to better handle the presence of clusters or batch effects within training datasets is important across a wide variety of biological applications. This article considers the effect of ensembling Random Forest learners trained on clusters within a single dataset with heterogeneity in the distribution of the features. We find that constructing ensembles of forests trained on clusters determined by algorithms such as k-means results in significant improvements in accuracy and generalizability over the traditional Random Forest algorithm. We begin with a theoretical exploration of the benefits of our novel approach, denoted as the Cross-Cluster Weighted Forest, and subsequently empirically examine its robustness to various data-generating scenarios and outcome models. Furthermore, we explore the influence of the data-partitioning and ensemble weighting strategies the benefits of our method over the existing paradigm. Finally, we apply our approach to cancer molecular profiling and gene expression datasets that are naturally divisible into clusters and illustrate that our approach outperforms the classic Random Forest. The code and supplementary material are available at https://github.com/m-ramchandran/cross-cluster.
Abstract（参考訳）: 機械学習アルゴリズムをトレーニングデータセット内のクラスタやバッチエフェクトの存在をよりよく扱うように適応させることは、さまざまな生物学的アプリケーションにおいて重要である。本稿では,特徴分布に不均一性をもつ単一データセット内のクラスタ上で学習したランダムフォレスト学習者のアンサンブル効果について考察する。従来のランダムフォレストアルゴリズムに比べて,k平均等のアルゴリズムによって決定されたクラスタ上で訓練された森林のアンサンブルの構築精度と一般化性が著しく向上することがわかった。まず,新たなアプローチのメリットを理論的に探求し,それをクロス・クラスタ・ウェイト・フォレスト(Cross-Cluster Weighted Forest)と表現し,その後,様々なデータ生成シナリオや結果モデルに対するロバスト性を実証的に検証する。さらに,データ分割とアンサンブルの重み付け戦略が既存パラダイムに対する手法の利点に与える影響についても検討する。最後に,本研究のアプローチを,自然にクラスタに分割可能ながん分子プロファイリングと遺伝子発現データセットに適用し,従来のランダムフォレストよりも優れていることを示す。コードと補足資料はhttps://github.com/m-ramchandran/cross-cluster.comで公開されている。

関連論文リスト

Learning Order Forest for Qualitative-Attribute Data Clustering [52.612779710298526]
本稿では,属性内定性値間の局所的な順序関係を柔軟に表現する木のような距離構造を探索する。より適切な木構造とクラスタを反復的に獲得するために,共同学習機構を提案する。実験により、共同学習は森林をクラスタリングタスクに適応させ、正確な結果を得ることを示した。
論文参考訳（メタデータ） (2026-03-03T07:49:50Z)
Weighted Sum-of-Trees Model for Clustered Data [0.0]
そこで本研究では,サンプル群毎に決定木を学習する軽量な要約木モデルを提案する。我々は,様々なシミュレーション環境において,従来の決定木や無作為林よりも優れたモデルを示す。 The Cancer Genome Atlasの肉腫コホートから得られた実世界のデータについて紹介する。
論文参考訳（メタデータ） (2026-02-03T00:04:49Z)
Mixed Data Clustering Survey and Challenges [0.0]
本稿では,前位相空間におけるクラスタリング手法を提案する。古典的数値クラスタリングアルゴリズムに対するベンチマークは,提案手法の性能と有効性に関する洞察を与える。
論文参考訳（メタデータ） (2025-11-27T08:20:05Z)
Forest-Guided Clustering -- Shedding Light into the Random Forest Black Box [0.6652172511473786]
本研究では、ランダムフォレストにおける局所構造とグローバル構造の両方を、共有決定経路に従ってグループ化するモデル固有の説明可能性手法であるフォレストガイドクラスタリング(FGC)を提案する。 FGCは、モデルの内部ロジックに整合した人間解釈可能なクラスタを生成し、クラスタ固有の、グローバルな特徴重要度スコアを計算して、RF予測に基づく決定ルールを導出する。 AML転写データセットに適用されたFGCは、生物学的にコヒーレントなサブポピュレーションを発見し、共同設立者による疾患関連シグナルを切断し、既知の新しい遺伝子発現パターンを復元した。
論文参考訳（メタデータ） (2025-07-25T17:41:39Z)
Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文参考訳（メタデータ） (2025-05-07T11:37:23Z)
Variational phylogenetic inference with products over bipartitions [48.2982114295171]
単一連鎖クラスタリングの合体時間に基づく新しい変分族を示し,木上の分布の閉形式密度を導出する。我々の手法はすべての木空間に対して推論を行い、マルコフ連鎖モンテカルロ部分ルーチンは不要であり、我々の変分族は微分可能である。
論文参考訳（メタデータ） (2025-02-21T00:06:57Z)
Dynamic Post-Hoc Neural Ensemblers [55.15643209328513]
本研究では,ニューラルネットワークをアンサンブル手法として活用することを検討する。低多様性のアンサンブルを学習するリスクを動機として,ベースモデル予測をランダムにドロップすることでモデルの正規化を提案する。このアプローチはアンサンブル内の多様性を低くし、オーバーフィッティングを減らし、一般化能力を向上させる。
論文参考訳（メタデータ） (2024-10-06T15:25:39Z)
Enabling Mixed Effects Neural Networks for Diverse, Clustered Data Using Monte Carlo Methods [9.035959289139102]
混合効果ニューラルネットワーク(MENN)はクラスタ固有の「ランダム効果」とクラスタ不変の「固定効果」を分離する本稿では,モンテカルロ法による一般化混合効果ニューラルネットワークの学習手法であるMC-GMENNを提案する。
論文参考訳（メタデータ） (2024-07-01T09:24:04Z)
Feature graphs for interpretable unsupervised tree ensembles: centrality, interaction, and application in disease subtyping [0.24578723416255746]
特徴の選択は、モデルの解釈可能性を高める上で重要な役割を担います。決定木を集約することで得られる精度は、解釈可能性の犠牲となる。この研究では、教師なしランダムな森林から特徴グラフを構築するための新しい手法を紹介した。
論文参考訳（メタデータ） (2024-04-27T12:47:37Z)
GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文参考訳（メタデータ） (2024-04-14T01:51:11Z)
Federated unsupervised random forest for privacy-preserving patient stratification [0.4499833362998487]
教師なしランダムフォレストを用いた新しいマルチオミクスクラスタリング手法を提案する。我々は、機械学習ベンチマークデータセットとThe Cancer Genome Atlasのがんデータに対するアプローチを検証する。本手法は病気のサブタイプに関して最先端の手法と競合するが,同時にクラスタの解釈可能性も大幅に向上する。
論文参考訳（メタデータ） (2024-01-29T12:04:14Z)
Improving Link Prediction in Social Networks Using Local and Global Features: A Clustering-based Approach [0.0]
本稿では,リンク予測問題に対処するため,第1グループと第2グループを組み合わせた手法を提案する。提案手法は,まずノードの位置と動的挙動に関連する特徴を同定する。そして、計算された類似度尺度に基づいて、サブスペースクラスタリングアルゴリズムをグループ社会オブジェクトに適用する。
論文参考訳（メタデータ） (2023-05-17T14:45:02Z)
Unified Multi-View Orthonormal Non-Negative Graph Based Clustering Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文参考訳（メタデータ） (2022-11-03T08:18:27Z)
Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文参考訳（メタデータ） (2022-10-09T02:31:32Z)
Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文参考訳（メタデータ） (2021-09-06T13:10:37Z)
Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文参考訳（メタデータ） (2020-10-22T15:58:35Z)
Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。 5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文参考訳（メタデータ） (2020-08-23T08:25:06Z)
Siloed Federated Learning for Multi-Centric Histopathology Datasets [0.17842332554022694]
本稿では,医学領域における深層学習アーキテクチャのための新しいフェデレーション学習手法を提案する。局所統計バッチ正規化(BN)層が導入され、協調的に訓練されるが中心に固有のモデルが作られる。本研究では,Camelyon16およびCamelyon17データセットから抽出した腫瘍組織像の分類法についてベンチマークを行った。
論文参考訳（メタデータ） (2020-08-17T15:49:30Z)
Elastic Coupled Co-clustering for Single-Cell Genomic Data [0.0]
シングルセル技術により、前例のない解像度でゲノム機能をプロファイルできるようになった。データ統合はクラスタリングアルゴリズムのパフォーマンスを向上させる可能性がある。本研究では,教師なしの移動学習フレームワークで問題を定式化する。
論文参考訳（メタデータ） (2020-03-29T08:21:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。