論文の概要: Boltzmann Classifier: A Thermodynamic-Inspired Approach to Supervised Learning
- arxiv url: http://arxiv.org/abs/2505.06753v2
- Date: Fri, 20 Jun 2025 08:01:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 14:57:51.813537
- Title: Boltzmann Classifier: A Thermodynamic-Inspired Approach to Supervised Learning
- Title(参考訳): Boltzmann Classifier: 教師付き学習に対する熱力学に着想を得たアプローチ
- Authors: Muhamed Amin, Bernard R. Brooks,
- Abstract要約: 本稿ではボルツマン分布に着想を得た距離に基づく確率的分類アルゴリズムを提案する。
本手法は, 分子活性予測, 遷移金属錯体の酸化状態分類, 乳癌診断の3分野にまたがって評価された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Boltzmann classifier, a novel distance based probabilistic classification algorithm inspired by the Boltzmann distribution. Unlike traditional classifiers that produce hard decisions or uncalibrated probabilities, the Boltzmann classifier assigns class probabilities based on the average distance to the nearest neighbors within each class, providing interpretable, physically meaningful outputs. We evaluate the performance of the method across three application domains: molecular activity prediction, oxidation state classification of transition metal complexes, and breast cancer diagnosis. In the molecular activity task, the classifier achieved the highest accuracy in predicting active compounds against two protein targets, with strong correlations observed between the predicted probabilities and experimental pIC50 values. For metal complexes, the classifier accurately distinguished between oxidation states II and III for Fe, Mn, and Co, using only metal-ligand bond lengths extracted from crystallographic data, and demonstrated high consistency with known chemical trends. In the breast cancer dataset, the classifier achieved 97% accuracy, with low confidence predictions concentrated in inherently ambiguous cases. Across all tasks, the Boltzmann classifier performed competitively or better than standard models such as logistic regression, support vector machines, random forests, and k-nearest neighbors. Its probabilistic outputs were found to correlate with continuous physical or biological properties, highlighting its potential utility in both classification and regression contexts. The results suggest that the Boltzmann classifier is a robust and interpretable alternative to conventional machine learning approaches, particularly in scientific domains where underlying structure property relationships are important.
- Abstract(参考訳): ボルツマン分布に着想を得た新しい距離に基づく確率的分類アルゴリズムであるボルツマン分類器を提案する。
ボルツマン分類器(ボルツマン分類器、Boltzmann classifier)は、ハードな決定や未定の確率を生成する伝統的な分類器とは異なり、各クラス内の最も近い隣人に平均距離に基づいてクラス確率を割り当て、解釈可能で物理的に意味のある出力を提供する。
本手法は, 分子活性予測, 遷移金属錯体の酸化状態分類, 乳癌診断の3分野にまたがって評価された。
分子活性タスクでは, 2つのタンパク質標的に対する活性化合物の予測において最も高い精度を達成し, 予測確率とpIC50値との間に強い相関が認められた。
金属錯体では,Fe,Mn,Coの酸化状態II,IIIを,結晶データから抽出した金属-配位子結合長のみを用いて正確に識別し,化学的傾向と高い整合性を示した。
乳がんデータセットでは, 本分類法は97%の精度を達成し, 信頼性の低い予測は本質的に曖昧な症例に集中していた。
すべてのタスクにおいて、ボルツマン分類器は、ロジスティック回帰、サポートベクトルマシン、ランダムフォレスト、k-ネアレスト隣人といった標準モデルよりも競合的に、あるいはそれ以上に実行された。
その確率的出力は、連続的な物理的または生物学的性質と相関し、分類と回帰の両方の文脈における潜在的有用性を強調した。
結果から,ボルツマン分類器は従来の機械学習手法,特に基礎となる構造特性の関係が重要である科学領域に対して,頑健で解釈可能な代替手段であることが示唆された。
関連論文リスト
- Probabilistic Consistency in Machine Learning and Its Connection to Uncertainty Quantification [0.0]
ある種の自己整合MLモデルは,クラス条件付き確率分布と等価であることを示す。
この情報は、マルチクラスベイズ最適化の構築や、クラス割り当てにおける固有の不確実性を推定するタスクに十分である。
論文 参考訳(メタデータ) (2025-07-29T10:27:04Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Equation Discovery with Bayesian Spike-and-Slab Priors and Efficient Kernels [57.46832672991433]
ケルネル学習とBayesian Spike-and-Slab pres (KBASS)に基づく新しい方程式探索法を提案する。
カーネルレグレッションを用いてターゲット関数を推定する。これはフレキシブルで表現力があり、データ空間やノイズに対してより堅牢である。
我々は,効率的な後部推論と関数推定のための予測伝搬予測最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-09T03:55:09Z) - Analysis of Diagnostics (Part I): Prevalence, Uncertainty Quantification, and Machine Learning [0.0]
この写本は、分類理論と有病率のより深い関係を研究する二部作の最初のものである。
そこで本稿では,有病率重み付き経験誤差を最小化することにより,Bstar (q)$を推定する数値ホモトピーアルゴリズムを提案する。
合成データとSARS-CoV-2酵素結合免疫測定法(ELISA)を用いて本法の有効性を検証した。
論文 参考訳(メタデータ) (2023-08-30T13:26:49Z) - Equivariant flow matching [0.9208007322096533]
等変連続正規化流(CNF)の新しい訓練目標である等変フローマッチングを導入する。
等変流マッチングは、標的エネルギーの物理対称性を利用して、同変CNFの効率的でシミュレーションなしな訓練を行う。
この結果から,同変フローマッチングの対象は,従来の手法に比べて,より短い積分経路,サンプリング効率の向上,スケーラビリティの向上を図っている。
論文 参考訳(メタデータ) (2023-06-26T19:40:10Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Gaussian Latent Dirichlet Allocation for Discrete Human State Discovery [1.057079240576682]
離散状態発見問題に対する教師なし確率モデルであるGaussian Latent Dirichlet Allocation (GLDA)を提案する。
GLDAは、自然言語処理において人気のあるトピックモデルであるLatent Dirichlet Allocation (LDA)から個々の混合構造を借りている。
両データセットにおいて,GLDAを学習したクラスウェイトは,臨床評価したうつ病,不安,ストレススコアと,ベースラインのGMMよりも有意に高い相関性を示した。
論文 参考訳(メタデータ) (2022-06-28T18:33:46Z) - A Stochastic Newton Algorithm for Distributed Convex Optimization [62.20732134991661]
均質な分散凸最適化のためのNewtonアルゴリズムを解析し、各マシンが同じ人口目標の勾配を計算する。
提案手法は,既存の手法と比較して,性能を損なうことなく,必要な通信ラウンドの数,頻度を低減できることを示す。
論文 参考訳(メタデータ) (2021-10-07T17:51:10Z) - Learning Gaussian Mixtures with Generalised Linear Models: Precise
Asymptotics in High-dimensions [79.35722941720734]
多クラス分類問題に対する一般化線形モデルは、現代の機械学習タスクの基本的な構成要素の1つである。
実験的リスク最小化による高次元推定器の精度を実証する。
合成データの範囲を超えて我々の理論をどのように適用できるかを論じる。
論文 参考訳(メタデータ) (2021-06-07T16:53:56Z) - Learning with Density Matrices and Random Features [44.98964870180375]
密度行列は、量子系の統計状態を記述する。
量子系の量子的不確実性と古典的不確実性の両方を表現することは強力な形式主義である。
本稿では,機械学習モデルのビルディングブロックとして密度行列をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2021-02-08T17:54:59Z) - Binary Classification of Gaussian Mixtures: Abundance of Support
Vectors, Benign Overfitting and Regularization [39.35822033674126]
生成ガウス混合モデルに基づく二項線形分類について検討する。
後者の分類誤差に関する新しい非漸近境界を導出する。
この結果は, 確率が一定である雑音モデルに拡張される。
論文 参考訳(メタデータ) (2020-11-18T07:59:55Z) - Learning Discrete Energy-based Models via Auxiliary-variable Local
Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。
エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。
本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2020-11-10T19:31:29Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Physics-constrained Bayesian inference of state functions in classical
density-functional theory [0.6445605125467573]
我々は,古典統計力学の逆問題に対する新しいデータ駆動手法を開発した。
我々は, 近似自由エネルギー関数の構成を特徴付ける効率的な学習アルゴリズムを開発した。
我々は、自由エネルギーの観点からモデリングする上で非常に困難である一方、自然界においてユビキタスな体積粒子相互作用を除外することを検討する。
論文 参考訳(メタデータ) (2020-10-07T12:43:42Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Boltzmann machine learning with a variational quantum algorithm [0.0]
ボルツマンマシンは、トレーニングデータを管理する確率分布をモデル化するための強力なツールである。
本稿では,ノイズ中間スケール量子(NISQ)デバイスを用いてボルツマン機械学習を実現する手法を提案する。
論文 参考訳(メタデータ) (2020-07-02T04:45:02Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Consistency Regularization for Certified Robustness of Smoothed
Classifiers [89.72878906950208]
最近のランダムな平滑化技術は、最悪の$ell$-robustnessを平均ケースのロバストネスに変換することができることを示している。
その結果,スムーズな分類器の精度と信頼性の高いロバスト性とのトレードオフは,ノイズに対する予測一貫性の規則化によって大きく制御できることが判明した。
論文 参考訳(メタデータ) (2020-06-07T06:57:43Z) - Entropy, Free Energy, and Work of Restricted Boltzmann Machines [0.08594140167290096]
我々は統計物理学の文脈で制限されたボルツマンマシンの訓練過程を分析する。
トレーニングが進むにつれて,エントロピーのサブ付加性を通じて,可視層と隠蔽層との相関関係が成長することを示す。
本稿では,作業の指数関数の経路平均と学習前後の自由エネルギーの差を結合するジャージンスキー等式について論じる。
論文 参考訳(メタデータ) (2020-04-10T04:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。