論文の概要: Hyperdimensional computing: a fast, robust and interpretable paradigm
for biological data
- arxiv url: http://arxiv.org/abs/2402.17572v1
- Date: Tue, 27 Feb 2024 15:09:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 15:42:28.749723
- Title: Hyperdimensional computing: a fast, robust and interpretable paradigm
for biological data
- Title(参考訳): 超次元計算 : 生物データのための高速で堅牢で解釈可能なパラダイム
- Authors: Michiel Stock, Dimitri Boeckaerts, Pieter Dewulf, Steff Taelman,
Maxime Van Haeverbeke, Wim Van Criekinge, Bernard De Baets
- Abstract要約: 多様な生物学的データソースを処理するための新しいアルゴリズムは、バイオインフォマティクスに革命をもたらした。
深層学習は、バイオインフォマティクス、アドレス配列、構造、機能解析を大きく変えてきた。
超次元コンピューティングは興味深い代替手段として登場した。
- 参考スコア(独自算出の注目度): 9.094234519404907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advances in bioinformatics are primarily due to new algorithms for processing
diverse biological data sources. While sophisticated alignment algorithms have
been pivotal in analyzing biological sequences, deep learning has substantially
transformed bioinformatics, addressing sequence, structure, and functional
analyses. However, these methods are incredibly data-hungry, compute-intensive
and hard to interpret. Hyperdimensional computing (HDC) has recently emerged as
an intriguing alternative. The key idea is that random vectors of high
dimensionality can represent concepts such as sequence identity or phylogeny.
These vectors can then be combined using simple operators for learning,
reasoning or querying by exploiting the peculiar properties of high-dimensional
spaces. Our work reviews and explores the potential of HDC for bioinformatics,
emphasizing its efficiency, interpretability, and adeptness in handling
multimodal and structured data. HDC holds a lot of potential for various omics
data searching, biosignal analysis and health applications.
- Abstract(参考訳): バイオインフォマティクスの進歩は、主に多様な生物学的データソースを処理する新しいアルゴリズムによるものである。
高度なアライメントアルゴリズムは生物学的配列の分析において重要であるが、ディープラーニングはバイオインフォマティクス、アドレス配列、構造、機能解析を大きく変えてきた。
しかし、これらの手法は驚くほどデータ不足であり、計算集約的で解釈が難しい。
超次元コンピューティング(HDC)は近年、興味深い代替手段として登場した。
鍵となる考え方は、高次元のランダムベクトルは、シーケンスアイデンティティや系統学のような概念を表現できるということである。
これらのベクトルは、高次元空間の特異な性質を利用して学習、推論、問合せのための単純な演算子を使って結合することができる。
本研究は,バイオインフォマティクスにおけるhdcの可能性について検討し,その効率性,解釈性,多モード・構造化データの扱いにおける適性を強調した。
HDCは、様々なオミクスデータ検索、バイオシグナル分析、健康アプリケーションに多くの可能性を秘めている。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - BioAgents: Democratizing Bioinformatics Analysis with Multi-Agent Systems [6.668992155393883]
我々は,小言語モデルに基づくマルチエージェントシステムを提案し,バイオインフォマティクスデータに基づいて微調整し,検索拡張生成(RAG)により拡張した。
当社のシステムであるBioAgentsは,プロプライエタリなデータを用いたローカル操作とパーソナライズを可能にする。
我々は、概念ゲノミクスのタスクにおいて、人間の専門家に匹敵するパフォーマンスを観察し、コード生成能力を高めるための次のステップを提案する。
論文 参考訳(メタデータ) (2025-01-10T19:30:59Z) - Biology Instructions: A Dataset and Benchmark for Multi-Omics Sequence Understanding Capability of Large Language Models [51.316001071698224]
本稿では,生物配列関連命令チューニングデータセットであるBiology-Instructionsを紹介する。
このデータセットは、大きな言語モデル(LLM)と複雑な生物学的シーケンスに関連するタスクのギャップを埋めることができます。
また、新たな3段階トレーニングパイプラインを備えたChatMultiOmicsという強力なベースラインも開発しています。
論文 参考訳(メタデータ) (2024-12-26T12:12:23Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - GeoTop: Advancing Image Classification with Geometric-Topological
Analysis [0.0]
トポロジカルデータ解析とリプシッツ・キリング曲線は特徴抽出と分類のための強力なツールとして使用される。
両手法を組み合わせて分類精度を向上させる可能性について検討する。
このアプローチは、様々な生体医学応用における複雑な生物学的プロセスの理解を深める可能性がある。
論文 参考訳(メタデータ) (2023-11-08T23:38:32Z) - Criticality Analysis: Bio-inspired Nonlinear Data Representation [0.0]
臨界分析(英語:Criticality Analysis、CA)は、制御された自己組織的臨界システム内の情報表現のバイオインスパイアされた方法である。
入力は、全体データの特徴を保持する射影出力に次元的に還元できるが、より単純な動的応答を持つ。
CA法は、生体システムへの任意の入力の生物学的に関連性のあるエンコーディング機構を可能にし、生物の様々な複雑さにおける情報処理に適したモデルを作成する。
論文 参考訳(メタデータ) (2023-05-11T19:02:09Z) - Classical-to-Quantum Sequence Encoding in Genomics [0.0]
本稿では,様々な数学的分野にインスパイアされた古典的量子データエンコーディングを行う新しい手法を提案する。
本稿では,電気・電子工学,情報理論,微分幾何学,ニューラルネットワークアーキテクチャなどの多様な分野からインスピレーションを得るアルゴリズムを紹介する。
本稿では,Quantum Boltzmann Machinesを用いてエンコードされたDNA配列を検査する方法を提案する。
論文 参考訳(メタデータ) (2023-04-21T07:35:49Z) - RandomSCM: interpretable ensembles of sparse classifiers tailored for
omics data [59.4141628321618]
決定規則の結合や解離に基づくアンサンブル学習アルゴリズムを提案する。
モデルの解釈可能性により、高次元データのバイオマーカー発見やパターン発見に有用である。
論文 参考訳(メタデータ) (2022-08-11T13:55:04Z) - EBIC.JL -- an Efficient Implementation of Evolutionary Biclustering
Algorithm in Julia [59.422301529692454]
本稿では, Julia における最も正確なビクラスタリングアルゴリズムの実装である EBIC.JL を紹介する。
新たなバージョンでは,既存のEBICと同等の精度を維持しつつ,ほとんどの問題に対してより高速に収束することを示す。
論文 参考訳(メタデータ) (2021-05-03T22:30:38Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。