論文の概要: MLCBART: Multilabel Classification with Bayesian Additive Regression Trees
- arxiv url: http://arxiv.org/abs/2601.08964v1
- Date: Tue, 13 Jan 2026 20:17:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.157966
- Title: MLCBART: Multilabel Classification with Bayesian Additive Regression Trees
- Title(参考訳): MLCBART:ベイジアン付加回帰木を用いたマルチラベル分類
- Authors: Jiahao Tian, Hugh Chipman, Thomas Loughin,
- Abstract要約: マルチラベル分類は、複数のバイナリラベルの同時分類を扱う。
BARTは、データ内の複雑な関係を明らかにすることができる非パラメトリックで柔軟なモデル構造である。
我々の適応であるMLCBARTは、ラベルが基礎となる数値スケールの閾値付けから生じると仮定する。
- 参考スコア(独自算出の注目度): 0.6117371161379209
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multilabel Classification (MLC) deals with the simultaneous classification of multiple binary labels. The task is challenging because, not only may there be arbitrarily different and complex relationships between predictor variables and each label, but associations among labels may exist even after accounting for effects of predictor variables. In this paper, we present a Bayesian additive regression tree (BART) framework to model the problem. BART is a nonparametric and flexible model structure capable of uncovering complex relationships within the data. Our adaptation, MLCBART, assumes that labels arise from thresholding an underlying numeric scale, where a multivariate normal model allows explicit estimation of the correlation structure among labels. This enables the discovery of complicated relationships in various forms and improves MLC predictive performance. Our Bayesian framework not only enables uncertainty quantification for each predicted label, but our MCMC draws produce an estimated conditional probability distribution of label combinations for any predictor values. Simulation experiments demonstrate the effectiveness of the proposed model by comparing its performance with a set of models, including the oracle model with the correct functional form. Results show that our model predicts vectors of labels more accurately than other contenders and its performance is close to the oracle model. An example highlights how the method's ability to produce measures of uncertainty on predictions provides nuanced understanding of classification results.
- Abstract(参考訳): マルチラベル分類(MLC)は、複数のバイナリラベルの同時分類を扱う。
このタスクは、予測変数と各ラベルの間に任意に異なる複雑な関係があるだけでなく、予測変数の効果を考慮に入れた後にラベル間の関連が存在しているため、難しい。
本稿では,この問題をモデル化するためのベイズ加法回帰木(BART)フレームワークを提案する。
BARTは、データ内の複雑な関係を明らかにすることができる非パラメトリックで柔軟なモデル構造である。
我々の適応であるMLCBARTは、ラベル間の相関構造を明示的に推定できる多変量正規モデルにおいて、ラベルが基礎となる数値スケールの閾値付けから生じると仮定する。
これにより、様々な形式の複雑な関係の発見が可能になり、LCC予測性能が向上する。
我々のベイズフレームワークは、予測されたラベルごとに不確実な定量化を可能にするだけでなく、MCMCの描画により、任意の予測値に対するラベルの組み合わせの条件付き確率分布が推定される。
シミュレーション実験により,提案モデルの性能をオラクルモデルと正しい機能形式を含む一連のモデルと比較することにより,提案モデルの有効性を実証した。
結果から,本モデルでは,ラベルのベクターを他の競合者よりも正確に予測し,その性能はオラクルモデルに近いことがわかった。
例として、予測の不確実性を測定する手法の能力が、分類結果の微妙な理解をいかにもたらすかを強調している。
関連論文リスト
- SSLfmm: An R Package for Semi-Supervised Learning with a Mixed-Missingness Mechanism in Finite Mixture Models [2.0253523660913664]
半教師付き学習(SSL)は、観測のサブセットのみをラベル付けしたデータセットから分類器を構築する。
観察が損なわれない可能性は、その特徴ベクトルのあいまいさに依存する可能性があるため、不足過程は有益なものとなる。
このパッケージにはモデリングの実用的なツールが含まれており、シミュレートされた例を通してそのパフォーマンスを説明している。
論文 参考訳(メタデータ) (2025-12-03T00:14:33Z) - Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot
Text Classification Tasks [75.42002070547267]
テキスト分類におけるデータ拡張のための自己進化学習(SE)に基づくミックスアップ手法を提案する。
モデル出力と原サンプルの1つのホットラベルを線形に補間して,新しい軟質なラベル混在を生成する,新しいインスタンス固有ラベル平滑化手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T23:43:23Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - Active Learning by Feature Mixing [52.16150629234465]
本稿では,ALFA-Mixと呼ばれるバッチ能動学習手法を提案する。
予測の不整合を求めることにより,不整合な特徴を持つインスタンスを同定する。
これらの予測の不整合は、モデルが未認識のインスタンスで認識できない特徴を発見するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-14T12:20:54Z) - Gaussian Mixture Variational Autoencoder with Contrastive Learning for
Multi-Label Classification [27.043136219527767]
本稿では,新しいコントラスト学習促進型マルチラベル予測モデルを提案する。
教師付き環境でのコントラスト学習を用いることで,ラベル情報を効果的に活用することができる。
学習した埋め込みがラベルとラベルの相互作用の解釈に洞察を与えることを示す。
論文 参考訳(メタデータ) (2021-12-02T04:23:34Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。