論文の概要: EBIC.JL -- an Efficient Implementation of Evolutionary Biclustering
Algorithm in Julia
- arxiv url: http://arxiv.org/abs/2105.01196v1
- Date: Mon, 3 May 2021 22:30:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 13:01:43.260052
- Title: EBIC.JL -- an Efficient Implementation of Evolutionary Biclustering
Algorithm in Julia
- Title(参考訳): EBIC.JL - Juliaにおける進化的ビクラスタリングアルゴリズムの効率的な実装
- Authors: Pawe{\l} Renc, Patryk Orzechowski, Aleksander Byrski, Jaros{\l}aw
W\k{a}s, and Jason H. Moore
- Abstract要約: 本稿では, Julia における最も正確なビクラスタリングアルゴリズムの実装である EBIC.JL を紹介する。
新たなバージョンでは,既存のEBICと同等の精度を維持しつつ,ほとんどの問題に対してより高速に収束することを示す。
- 参考スコア(独自算出の注目度): 59.422301529692454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biclustering is a data mining technique which searches for local patterns in
numeric tabular data with main application in bioinformatics. This technique
has shown promise in multiple areas, including development of biomarkers for
cancer, disease subtype identification, or gene-drug interactions among others.
In this paper we introduce EBIC.JL - an implementation of one of the most
accurate biclustering algorithms in Julia, a modern highly parallelizable
programming language for data science. We show that the new version maintains
comparable accuracy to its predecessor EBIC while converging faster for the
majority of the problems. We hope that this open source software in a
high-level programming language will foster research in this promising field of
bioinformatics and expedite development of new biclustering methods for big
data.
- Abstract(参考訳): biclusteringは、バイオインフォマティクスにおける主な応用として、数値表データ内のローカルパターンを検索するデータマイニング手法である。
この手法は、がんのバイオマーカーの開発、疾患のサブタイプ同定、遺伝子と薬物の相互作用など、様々な領域で期待されている。
本稿では,データサイエンスのための並列化可能な現代プログラミング言語である Julia において,最も正確なビクラスタリングアルゴリズムの実装である EBIC.JL を紹介する。
新たなバージョンでは,既存のEBICと同等の精度を維持しつつ,ほとんどの問題に対してより高速に収束することを示す。
ハイレベルなプログラミング言語におけるこのオープンソースソフトウェアが、バイオインフォマティクスの有望な分野の研究を後押しし、ビッグデータのための新しいビクラスタリング手法の開発を迅速化することを願っている。
関連論文リスト
- Hyperdimensional computing: a fast, robust and interpretable paradigm
for biological data [9.094234519404907]
多様な生物学的データソースを処理するための新しいアルゴリズムは、バイオインフォマティクスに革命をもたらした。
深層学習は、バイオインフォマティクス、アドレス配列、構造、機能解析を大きく変えてきた。
超次元コンピューティングは興味深い代替手段として登場した。
論文 参考訳(メタデータ) (2024-02-27T15:09:20Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - ParlayANN: Scalable and Deterministic Parallel Graph-Based Approximate
Nearest Neighbor Search Algorithms [5.478671305092084]
本稿では,ParlayANNについて紹介する。ParlayANNは決定論的および並列グラフに基づく近接探索アルゴリズムのライブラリである。
我々は、数十億のデータセットにスケールする4つの最先端グラフベースのANNSアルゴリズムに対して、新しい並列実装を開発する。
論文 参考訳(メタデータ) (2023-05-07T19:28:23Z) - Clustering with minimum spanning trees: How good can it be? [2.184775414778289]
最小スパンニングツリー(MST)は、パターン認識活動におけるデータセットの便利な表現を提供する。
本稿では,低次元空間における分割データクラスタリングタスクにおいて,それらが意味を持つ範囲を定量化する。
論文 参考訳(メタデータ) (2023-03-10T03:18:03Z) - 2021 BEETL Competition: Advancing Transfer Learning for Subject
Independence & Heterogenous EEG Data Sets [89.84774119537087]
我々は、診断とBCI(Brain-Computer-Interface)に関する2つの伝達学習課題を設計する。
第1タスクは、患者全体にわたる自動睡眠ステージアノテーションに対処する医療診断に重点を置いている。
タスク2はBrain-Computer Interface (BCI)に集中しており、被験者とデータセットの両方にわたる運動画像のデコードに対処する。
論文 参考訳(メタデータ) (2022-02-14T12:12:20Z) - Bioinspired Cortex-based Fast Codebook Generation [0.09449650062296822]
脳内の知覚皮質ネットワークにインスパイアされた特徴抽出法を提案する。
バイオインスパイアされた大脳皮質と呼ばれるこのアルゴリズムは、より優れた計算効率を持つストリーミング信号の特徴に収束する。
ここでは、クラスタリングおよびベクトル量子化における大脳皮質モデルの優れた性能を示す。
論文 参考訳(メタデータ) (2022-01-28T18:37:43Z) - Improving EEG Decoding via Clustering-based Multi-task Feature Learning [27.318646122939537]
機械学習は、EEGパターンをより良い復号精度に最適化する有望な技術を提供します。
既存のアルゴリズムは、真のEEGサンプル分布を捕捉する基礎となるデータ構造を効果的に探索しない。
クラスタリングに基づく脳波パターン復号のためのマルチタスク機能学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-12T13:31:53Z) - Improved Code Summarization via a Graph Neural Network [96.03715569092523]
一般に、ソースコード要約技術はソースコードを入力として使用し、自然言語記述を出力する。
これらの要約を生成するために、ASTのデフォルト構造によくマッチするグラフベースのニューラルアーキテクチャを使用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。