論文の概要: EBIC.JL -- an Efficient Implementation of Evolutionary Biclustering
Algorithm in Julia
- arxiv url: http://arxiv.org/abs/2105.01196v1
- Date: Mon, 3 May 2021 22:30:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 13:01:43.260052
- Title: EBIC.JL -- an Efficient Implementation of Evolutionary Biclustering
Algorithm in Julia
- Title(参考訳): EBIC.JL - Juliaにおける進化的ビクラスタリングアルゴリズムの効率的な実装
- Authors: Pawe{\l} Renc, Patryk Orzechowski, Aleksander Byrski, Jaros{\l}aw
W\k{a}s, and Jason H. Moore
- Abstract要約: 本稿では, Julia における最も正確なビクラスタリングアルゴリズムの実装である EBIC.JL を紹介する。
新たなバージョンでは,既存のEBICと同等の精度を維持しつつ,ほとんどの問題に対してより高速に収束することを示す。
- 参考スコア(独自算出の注目度): 59.422301529692454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biclustering is a data mining technique which searches for local patterns in
numeric tabular data with main application in bioinformatics. This technique
has shown promise in multiple areas, including development of biomarkers for
cancer, disease subtype identification, or gene-drug interactions among others.
In this paper we introduce EBIC.JL - an implementation of one of the most
accurate biclustering algorithms in Julia, a modern highly parallelizable
programming language for data science. We show that the new version maintains
comparable accuracy to its predecessor EBIC while converging faster for the
majority of the problems. We hope that this open source software in a
high-level programming language will foster research in this promising field of
bioinformatics and expedite development of new biclustering methods for big
data.
- Abstract(参考訳): biclusteringは、バイオインフォマティクスにおける主な応用として、数値表データ内のローカルパターンを検索するデータマイニング手法である。
この手法は、がんのバイオマーカーの開発、疾患のサブタイプ同定、遺伝子と薬物の相互作用など、様々な領域で期待されている。
本稿では,データサイエンスのための並列化可能な現代プログラミング言語である Julia において,最も正確なビクラスタリングアルゴリズムの実装である EBIC.JL を紹介する。
新たなバージョンでは,既存のEBICと同等の精度を維持しつつ,ほとんどの問題に対してより高速に収束することを示す。
ハイレベルなプログラミング言語におけるこのオープンソースソフトウェアが、バイオインフォマティクスの有望な分野の研究を後押しし、ビッグデータのための新しいビクラスタリング手法の開発を迅速化することを願っている。
関連論文リスト
- MEC-IP: Efficient Discovery of Markov Equivalent Classes via Integer Programming [3.2513035377783717]
本稿では,ベイジアンネットワーク(BN)のマルコフ等価クラス(MEC)を発見するための新しいプログラミング(IP)手法を提案する。
我々の数値計算結果から,計算時間の大幅な削減はアルゴリズムによって達成されるだけでなく,多様なデータセットで因果発見精度の向上が見られた。
論文 参考訳(メタデータ) (2024-10-22T22:56:33Z) - RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation [54.707460684650584]
大きな言語モデル(LLM)は対話、推論、知識保持における人間レベルの能力を示す。
現在の研究は、LLMに外部知識を組み込むことによって、このボトルネックに対処している。
RAGLABはモジュール的で研究指向のオープンソースライブラリで、6つの既存のアルゴリズムを再現し、RAGアルゴリズムを調査するための包括的なエコシステムを提供する。
論文 参考訳(メタデータ) (2024-08-21T07:20:48Z) - From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models [63.188607839223046]
この調査は、推論中に計算をスケールするメリットに焦点を当てている。
我々はトークンレベルの生成アルゴリズム、メタジェネレーションアルゴリズム、効率的な生成という3つの領域を統一的な数学的定式化の下で探索する。
論文 参考訳(メタデータ) (2024-06-24T17:45:59Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - ParlayANN: Scalable and Deterministic Parallel Graph-Based Approximate
Nearest Neighbor Search Algorithms [5.478671305092084]
本稿では,ParlayANNについて紹介する。ParlayANNは決定論的および並列グラフに基づく近接探索アルゴリズムのライブラリである。
我々は、数十億のデータセットにスケールする4つの最先端グラフベースのANNSアルゴリズムに対して、新しい並列実装を開発する。
論文 参考訳(メタデータ) (2023-05-07T19:28:23Z) - Clustering with minimum spanning trees: How good can it be? [1.9999259391104391]
低次元分割データクラスタリングタスクにおいて、最小分散木が意味のある範囲を定量化する。
我々は、既存の最先端のMSTベースの分割スキームをレビューし、研究し、拡張し、一般化する。
全体として、Genieと情報理論の手法は、MST以外のアルゴリズムよりも優れていることが多い。
論文 参考訳(メタデータ) (2023-03-10T03:18:03Z) - 2021 BEETL Competition: Advancing Transfer Learning for Subject
Independence & Heterogenous EEG Data Sets [89.84774119537087]
我々は、診断とBCI(Brain-Computer-Interface)に関する2つの伝達学習課題を設計する。
第1タスクは、患者全体にわたる自動睡眠ステージアノテーションに対処する医療診断に重点を置いている。
タスク2はBrain-Computer Interface (BCI)に集中しており、被験者とデータセットの両方にわたる運動画像のデコードに対処する。
論文 参考訳(メタデータ) (2022-02-14T12:12:20Z) - Bioinspired Cortex-based Fast Codebook Generation [0.09449650062296822]
脳内の知覚皮質ネットワークにインスパイアされた特徴抽出法を提案する。
バイオインスパイアされた大脳皮質と呼ばれるこのアルゴリズムは、より優れた計算効率を持つストリーミング信号の特徴に収束する。
ここでは、クラスタリングおよびベクトル量子化における大脳皮質モデルの優れた性能を示す。
論文 参考訳(メタデータ) (2022-01-28T18:37:43Z) - EBIC: an open source software for high-dimensional and big data biclustering analyses [2.863279092948239]
本稿では,遺伝データをマイニングする次世代ビクラスタリングアルゴリズムであるEBICの最新のリリースを紹介する。
この論文の主な貢献は、ビッグデータのサポートを追加し、大規模なゲノムデータマイニング分析を効率的に実行できるようにすることである。
EBICは、436,444行のDNAメチル化データセットを含む、さまざまなサイズのデータセットに適用された。
論文 参考訳(メタデータ) (2018-07-26T02:57:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。