論文の概要: GreCon3: Mitigating High Resource Utilization of GreCon Algorithms for Boolean Matrix Factorization
- arxiv url: http://arxiv.org/abs/2603.13772v1
- Date: Sat, 14 Mar 2026 05:47:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.396381
- Title: GreCon3: Mitigating High Resource Utilization of GreCon Algorithms for Boolean Matrix Factorization
- Title(参考訳): GreCon3: ブール行列分解のためのGreConアルゴリズムの高資源利用の軽減
- Authors: Petr Krajča, Martin Trnecka,
- Abstract要約: 形式的概念分析(FCA)はBMFとアルゴリズムの設計に不可欠な洞察を与えてくれる。
GreConとGreCon2のアルゴリズムは、高メモリ消費と長時間実行のコストで、高品質な因数分解を提供する。
我々はこれらのアルゴリズムの大幅な改訂であるGreCon3を導入し、計算効率とメモリ使用量の両方を大幅に改善した。
- 参考スコア(独自算出の注目度): 0.12891210250935145
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Boolean matrix factorization (BMF) is a fundamental tool for analyzing binary data and discovering latent information hidden in the data. Formal Concept Analysis (FCA) provides us with an essential insight into BMF and the design of algorithms. Due to FCA, we have the GreCon and GreCon2 algorithms providing high-quality factorizations at the cost of high memory consumption and long running times. In this paper, we introduce GreCon3, a substantial revision of these algorithms, significantly improving both computational efficiency and memory usage. These improvements are achieved with a novel space-efficient data structure that tracks unprocessed data. Further, a novel strategy incrementally initializing this data structure is proposed. This strategy reduces memory consumption and omits data irrelevant to the remainder of the computation. Moreover, we show that the first factors can be discovered with less effort. Since the first factors tend to describe large portions of the data, this optimization, along with others, significantly contributes to the overall improvement of the algorithm's performance. An experimental evaluation shows that GreCon3 substantially outperforms its predecessor GreCon2. The proposed algorithm thus advances the state of the art in BMF based on FCA and enables efficient factorization of datasets previously infeasible for the GreCon algorithm.
- Abstract(参考訳): ブール行列分解(BMF)は、バイナリデータを解析し、データに隠された潜伏情報を発見するための基本的なツールである。
形式的概念分析(FCA)はBMFとアルゴリズムの設計に不可欠な洞察を与えてくれる。
FCAのため、GreConとGreCon2アルゴリズムは、高メモリ消費と長時間実行のコストで高品質な因数分解を提供する。
本稿では,これらのアルゴリズムの大幅な改訂であるGreCon3を導入し,計算効率とメモリ使用量を大幅に改善する。
これらの改善は、未処理のデータを追跡する新しい空間効率のデータ構造によって達成される。
さらに、このデータ構造を漸進的に初期化する新しい戦略を提案する。
この戦略はメモリ消費を減らし、残りの計算とは無関係にデータを省略する。
さらに、最初の要因は少ない労力で発見できることが示される。
最初の要素がデータの大部分を記述する傾向があるため、この最適化は他の要素とともに、アルゴリズムの性能の全体的な改善に大きく貢献する。
実験的評価によると、GreCon3は前任のGreCon2より大幅に上回っている。
提案アルゴリズムは、FCAに基づくBMFの最先端性を向上し、GreConアルゴリズムで以前は実現できなかったデータセットの効率的な因数分解を可能にする。
関連論文リスト
- Efficient Differentiable Causal Discovery via Reliable Super-Structure Learning [51.20606796019663]
本稿では,新たな因果発見パイプラインであるALVGLを提案する。
ALVGLはスパース分解とローランク分解を用いてデータの精度行列を学習する。
ALVGLは最先端の精度を達成するだけでなく、最適化効率を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2026-01-09T02:18:59Z) - Efficient Graph Condensation via Gaussian Process [8.099774846541438]
グラフ凝縮は、性能を維持しながら大きなグラフのサイズを減らす。
既存の手法はしばしば二段階最適化に依存しており、広範囲なGNNトレーニングとスケーラビリティの制限を必要とする。
本稿では,ガウス過程を用いたグラフ凝縮法(GCGP)を提案する。
論文 参考訳(メタデータ) (2025-01-05T14:43:07Z) - Accelerating spherical K-means clustering for large-scale sparse document data [0.7366405857677226]
本稿では,大規模かつ高次元のスパース文書データセットを対象とした球面K平均クラスタリングアルゴリズムを提案する。
提案手法は, 大規模文書において, 最先端技術を用いたアルゴリズムと比較して, 高速性能を効果的に達成できることを実験的に実証した。
論文 参考訳(メタデータ) (2024-11-18T05:50:58Z) - Randomized Dimension Reduction with Statistical Guarantees [0.27195102129095]
この論文は、高速な実行と効率的なデータ利用のためのアルゴリズムをいくつか探求している。
一般化と分散性を向上する様々なデータ拡張を組み込んだ学習アルゴリズムに着目する。
具体的には、第4章では、データ拡張整合正則化のための複雑性分析のサンプルを提示する。
論文 参考訳(メタデータ) (2023-10-03T02:01:39Z) - Using Knowledge Graphs for Performance Prediction of Modular
Optimization Algorithms [4.060078409841919]
我々は知識グラフ埋め込み手法を用いて性能予測モデルを構築した。
与えられたアルゴリズムのインスタンスが特定の目標精度を達成できるかどうかを正確に予測できる3つの分類手法を示す。
論文 参考訳(メタデータ) (2023-01-24T09:28:57Z) - Towards Better Out-of-Distribution Generalization of Neural Algorithmic
Reasoning Tasks [51.8723187709964]
ニューラルネットワーク推論タスクのOOD一般化について検討する。
目標は、ディープニューラルネットワークを使用して入出力ペアからアルゴリズムを学ぶことである。
論文 参考訳(メタデータ) (2022-11-01T18:33:20Z) - An Improved Reinforcement Learning Algorithm for Learning to Branch [12.27934038849211]
ブランチ・アンド・バウンド(B&B)は最適化の一般的な方法である。
本稿では,新しい強化学習に基づくB&Bアルゴリズムを提案する。
提案アルゴリズムの性能を3つの公開研究ベンチマークで評価した。
論文 参考訳(メタデータ) (2022-01-17T04:50:11Z) - Gradient Boosted Binary Histogram Ensemble for Large-scale Regression [60.16351608335641]
本研究では,2値ヒストグラム分割とアンサンブル学習に基づくテキストグラディエント2値ヒストグラムアンサンブル(GBBHE)と呼ばれる大規模回帰問題に対する勾配向上アルゴリズムを提案する。
実験では, 勾配向上回帰木 (GBRT) などの他の最先端アルゴリズムと比較して, GBBHEアルゴリズムは大規模データセット上での実行時間が少なく, 有望な性能を示す。
論文 参考訳(メタデータ) (2021-06-03T17:05:40Z) - New Oracle-Efficient Algorithms for Private Synthetic Data Release [52.33506193761153]
微分プライベートな合成データを構築するための3つの新しいアルゴリズムを提案する。
アルゴリズムは最悪の場合でも差分プライバシーを満たす。
現状の手法である高次元行列機構 citeMcKennaMHM18 と比較すると,我々のアルゴリズムは大規模作業負荷の精度が向上する。
論文 参考訳(メタデータ) (2020-07-10T15:46:05Z) - RNA Secondary Structure Prediction By Learning Unrolled Algorithms [70.09461537906319]
本稿では,RNA二次構造予測のためのエンド・ツー・エンドのディープラーニングモデルであるE2Efoldを提案する。
E2Efoldの鍵となる考え方は、RNA塩基対行列を直接予測し、制約のないプログラミングを、制約を強制するための深いアーキテクチャのテンプレートとして使うことである。
ベンチマークデータセットに関する包括的な実験により、E2Efoldの優れた性能を実証する。
論文 参考訳(メタデータ) (2020-02-13T23:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。