論文の概要: Matrix Factorization for Inferring Associations and Missing Links
- arxiv url: http://arxiv.org/abs/2503.04680v1
- Date: Thu, 06 Mar 2025 18:22:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 16:00:35.929569
- Title: Matrix Factorization for Inferring Associations and Missing Links
- Title(参考訳): 推論アソシエーションと欠落リンクの行列因子化
- Authors: Ryan Barron, Maksim E. Eren, Duc P. Truong, Cynthia Matuszek, James Wendelberger, Mary F. Dorn, Boian Alexandrov,
- Abstract要約: リンク予測の欠如は、ネットワーク内の見えないが潜在的に存在するコネクションを特定する。
増殖検出においては、国家および非国家アクターによる核兵器獲得の試みを特定し、特徴付ける努力を支援する。
本稿では,新しい重み付き (WNMFk), Boolean (BNMFk), およびRecommender (RNMFk) 行列因数分解法と,ロジスティック因数分解を組み込んだアンサンブル変種をリンク予測のために導入する。
- 参考スコア(独自算出の注目度): 5.700773330654261
- License:
- Abstract: Missing link prediction is a method for network analysis, with applications in recommender systems, biology, social sciences, cybersecurity, information retrieval, and Artificial Intelligence (AI) reasoning in Knowledge Graphs. Missing link prediction identifies unseen but potentially existing connections in a network by analyzing the observed patterns and relationships. In proliferation detection, this supports efforts to identify and characterize attempts by state and non-state actors to acquire nuclear weapons or associated technology - a notoriously challenging but vital mission for global security. Dimensionality reduction techniques like Non-Negative Matrix Factorization (NMF) and Logistic Matrix Factorization (LMF) are effective but require selection of the matrix rank parameter, that is, of the number of hidden features, k, to avoid over/under-fitting. We introduce novel Weighted (WNMFk), Boolean (BNMFk), and Recommender (RNMFk) matrix factorization methods, along with ensemble variants incorporating logistic factorization, for link prediction. Our methods integrate automatic model determination for rank estimation by evaluating stability and accuracy using a modified bootstrap methodology and uncertainty quantification (UQ), assessing prediction reliability under random perturbations. We incorporate Otsu threshold selection and k-means clustering for Boolean matrix factorization, comparing them to coordinate descent-based Boolean thresholding. Our experiments highlight the impact of rank k selection, evaluate model performance under varying test-set sizes, and demonstrate the benefits of UQ for reliable predictions using abstention. We validate our methods on three synthetic datasets (Boolean and uniformly distributed) and benchmark them against LMF and symmetric LMF (symLMF) on five real-world protein-protein interaction networks, showcasing an improved prediction performance.
- Abstract(参考訳): ミスリンク予測はネットワーク分析の手法であり、リコメンデータシステム、生物学、社会科学、サイバーセキュリティ、情報検索、人工知能(AI)推論に応用されている。
欠落リンク予測は、観測されたパターンと関係を分析することによって、ネットワーク内の見えないが潜在的に存在するコネクションを特定する。
増殖の検出において、これは、核兵器や関連する技術を取得するための国家や非国家のアクターによる試みを識別し、特徴付ける努力を支援する。
非負行列因子化(NMF)やロジスティック行列因子化(LMF)のような次元減少技術は有効であるが、過度な適合を避けるためには行列ランクパラメータ、すなわち隠れた特徴数kの選択が必要である。
Weighted (WNMFk), Boolean (BNMFk), Recommender (RNMFk) 行列因数分解法, およびロジスティック因数分解を組み込んだアンサンブル変種をリンク予測のために導入する。
改良型ブートストラップ法と不確実性定量化(UQ)を用いて、安定性と精度を評価し、ランダムな摂動下での予測信頼性を評価することで、ランク推定の自動モデル決定を統合する。
ブール行列因数分解のための大津しきい値選択とk平均クラスタリングを導入し、降下に基づくブールしきい値の座標と比較した。
実験では,ランクk選択の影響を強調し,異なるテストセットサイズでのモデル性能を評価し,留意点を用いた信頼性予測に対するUQの利点を実証した。
提案手法を3つの合成データセット(ブールおよび均一分散)上で検証し,実世界のタンパク質-タンパク質相互作用ネットワーク上でのLMFおよび対称LMF(symLMF)と比較し,予測性能の向上を示す。
関連論文リスト
- A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Addressing Uncertainty in LLMs to Enhance Reliability in Generative AI [47.64301863399763]
中国レストランプロセスに触発された動的セマンティッククラスタリング手法を提案する。
生成したセマンティッククラスタのエントロピーを計算することにより,あるクエリ上でのLarge Language Model(LLM)の不確実性を定量化する。
本稿では,これらのクラスタの(負の)確率を,コンフォーマル予測フレームワーク内の(非)整合性スコアとして活用することを提案する。
論文 参考訳(メタデータ) (2024-11-04T18:49:46Z) - Bayesian Estimation and Tuning-Free Rank Detection for Probability Mass Function Tensors [17.640500920466984]
本稿では,関節のPMFを推定し,そのランクを観測データから自動的に推定する新しい枠組みを提案する。
我々は、様々なモデルパラメータの後方分布を近似するために、変分推論(VI)に基づく決定論的解を導出し、さらに、変分推論(SVI)を利用して、VVIベースのアプローチのスケーラブルバージョンを開発する。
合成データと実映画レコメンデーションデータの両方を含む実験は、推定精度、自動ランク検出、計算効率の点で、VVIおよびSVIベースの手法の利点を示している。
論文 参考訳(メタデータ) (2024-10-08T20:07:49Z) - The Misclassification Likelihood Matrix: Some Classes Are More Likely To Be Misclassified Than Others [1.654278807602897]
本研究では、分散シフト下でのニューラルネットワーク予測の信頼性を定量化するための新しいツールとして、MLM(Misclassification Likelihood Matrix)を紹介した。
この研究の意味は、画像の分類を超えて、自動運転車などの自動運転システムで進行中の応用に及んでいる。
論文 参考訳(メタデータ) (2024-07-10T16:43:14Z) - LoRA-Ensemble: Efficient Uncertainty Modelling for Self-attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率の高いディープアンサンブル手法であるLoRA-Ensembleを紹介する。
全メンバー間で重みを共有できる1つの事前学習型自己注意ネットワークを利用することで、注意投影のために、メンバー固有の低ランク行列を訓練する。
提案手法は明示的なアンサンブルよりも優れたキャリブレーションを示し,様々な予測タスクやデータセットに対して類似あるいは良好な精度を実現する。
論文 参考訳(メタデータ) (2024-05-23T11:10:32Z) - Weakly supervised covariance matrices alignment through Stiefel matrices
estimation for MEG applications [64.20396555814513]
本稿では,Mixing Model Stiefel Adaptation (MSA)と呼ばれる時系列データに対する新しいドメイン適応手法を提案する。
我々は、ドメイン間の等価な信号分散とペアの対応を確立することにより、ターゲット領域における豊富なラベルのないデータを利用して効果的な予測を行う。
MSAは、Cam-CANデータセットのMEG信号を用いて、タスクの変動を伴う脳年齢回帰の最近の手法より優れている。
論文 参考訳(メタデータ) (2024-01-24T19:04:49Z) - Supervised Class-pairwise NMF for Data Representation and Classification [2.7320863258816512]
非負行列分解(NMF)に基づく手法は、特定のタスクにモデルを適応させるためにコスト関数に新しい用語を追加する。
NMF法は、因子化行列を推定するための教師なしアプローチを採用する。
論文 参考訳(メタデータ) (2022-09-28T04:33:03Z) - Algorithmic Fairness Verification with Graphical Models [24.8005399877574]
本稿では,ベイズネットワークのような特徴間の相関を符号化する,FVGMと呼ばれる効率の良いフェアネス検証手法を提案する。
FVGMは、より多様なフェアネス向上アルゴリズムのファミリーに対して、正確でスケーラブルな評価をもたらすことを示す。
論文 参考訳(メタデータ) (2021-09-20T12:05:14Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Providing reliability in Recommender Systems through Bernoulli Matrix
Factorization [63.732639864601914]
本稿では,予測値と信頼性値の両方を提供するためにBernoulli Matrix Factorization (BeMF)を提案する。
BeMFはメモリベースのフィルタリングではなく、モデルベースの協調フィルタリングに作用する。
予測の信頼性が高ければ高いほど、それが間違っているという責任は少なくなる。
論文 参考訳(メタデータ) (2020-06-05T14:24:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。