論文の概要: regulAS: A Bioinformatics Tool for the Integrative Analysis of
Alternative Splicing Regulome using RNA-Seq data
- arxiv url: http://arxiv.org/abs/2307.08800v1
- Date: Mon, 17 Jul 2023 19:33:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 17:29:50.734235
- Title: regulAS: A Bioinformatics Tool for the Integrative Analysis of
Alternative Splicing Regulome using RNA-Seq data
- Title(参考訳): regulAS:RNA-Seqデータを用いた代替スプライシングレギュロームの統合解析のためのバイオインフォマティクスツール
- Authors: Sofya Lipnitskaya
- Abstract要約: regulAS(regulAS)は、コンピュータ生物学研究者がスプライシングの制御機構を研究するのを支援するために設計されたバイオインフォマティクスツールである。
regulASのコア機能は、計算実験の自動化、効率的な結果の保存と処理、ワークフロー管理の効率化を可能にする。
統合ベーシックモジュールはregulASを拡張し、パブリックマルチオミクスUCSC XenaデータリポジトリからのRNA-Seqデータ検索、予測モデリング、機能ランキング機能などを備えている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The regulAS software package is a bioinformatics tool designed to support
computational biology researchers in investigating regulatory mechanisms of
splicing alterations through integrative analysis of large-scale RNA-Seq data
from cancer and healthy human donors, characterized by TCGA and GTEx projects.
This technical report provides a comprehensive overview of regulAS, focusing on
its core functionality, basic modules, experiment configuration, further
extensibility and customisation.
The core functionality of regulAS enables the automation of computational
experiments, efficient results storage and processing, and streamlined workflow
management. Integrated basic modules extend regulAS with features such as
RNA-Seq data retrieval from the public multi-omics UCSC Xena data repository,
predictive modeling and feature ranking capabilities using the scikit-learn
package, and flexible reporting generation for analysing gene expression
profiles and relevant modulations of alternative splicing aberrations across
tissues and cancer types. Experiment configuration is handled through YAML
files with the Hydra and OmegaConf libraries, offering a user-friendly
approach. Additionally, regulAS allows for the development and integration of
custom modules to handle specialized tasks.
In conclusion, regulAS provides an automated solution for alternative
splicing and cancer biology studies, enhancing efficiency, reproducibility, and
customization of experimental design, while the extensibility of the pipeline
enables researchers to further tailor the software package to their specific
needs. Source code is available under the MIT license at
https://github.com/slipnitskaya/regulAS.
- Abstract(参考訳): regulasソフトウェアパッケージは、がんや健康なヒトドナーからの大規模なrna-seqデータの統合分析を通じて、スプライシング変化の制御機構を調査するために、計算生物学研究者を支援するために設計されたバイオインフォマティクスツールである。
このテクニカルレポートは、コア機能、基本モジュール、実験構成、さらなる拡張性とカスタマイズに焦点を当てた、regulASの包括的な概要を提供する。
regulASのコア機能は、計算実験の自動化、効率的な結果の保存と処理、ワークフロー管理の効率化を可能にする。
統合基本モジュールはregulaを拡張し、パブリックマルチオミクスのucsc xenaデータリポジトリからのrna-seqデータ検索、scikit-learnパッケージを用いた予測モデリングと機能ランキング機能、遺伝子発現プロファイルの解析のためのフレキシブルレポーティング生成、組織とがんタイプにまたがる代替スプライシング収差の関連する変調といった機能を備えている。
実験構成はHydraとOmegaConfライブラリでYAMLファイルを通じて処理され、ユーザフレンドリなアプローチを提供する。
さらにregulasは、特別なタスクを処理するカスタムモジュールの開発と統合を可能にする。
結論として、regulasは代替スプライシングとがん生物学の研究のための自動化ソリューションを提供し、効率の向上、再現性、実験設計のカスタマイズを可能にし、パイプラインの拡張性により研究者は特定のニーズに合わせてソフトウェアパッケージをさらに調整することができる。
ソースコードはMITライセンスでhttps://github.com/slipnitskaya/regulASで入手できる。
関連論文リスト
- Exploring the Feasibility of Automated Data Standardization using Large Language Models for Seamless Positioning [10.200170217746136]
大規模言語モデル(LLM)を利用したリアルタイム自動データ標準化の実現可能性について検討する。
我々の研究は、拡張カルマンフィルタ(EKF)によるデータの互換性を確保し、位置決め精度を向上させる。
本研究は,センサデータ統合の複雑さを克服する上で,高度なLCMの可能性を示すものである。
論文 参考訳(メタデータ) (2024-08-22T02:40:21Z) - CellAgent: An LLM-driven Multi-Agent Framework for Automated Single-cell Data Analysis [35.61361183175167]
単細胞RNAシークエンシング (scRNA-seq) データ解析は生物学的研究に不可欠である。
しかし、望ましい結果を得るために様々なツールを手動で操作することは、研究者にとって労働集約的である。
本稿では,ScRNA-seqデータ解析タスクの自動処理と実行のためのLLM駆動型マルチエージェントフレームワークであるCellAgentを紹介する。
論文 参考訳(メタデータ) (2024-07-13T09:14:50Z) - SeqMate: A Novel Large Language Model Pipeline for Automating RNA Sequencing [0.0]
SeqMateは、大規模言語モデル(LLM)のパワーを活用してワンクリック分析を可能にするツールで、データ準備と分析の両方を自動化する。
生成AIの力を利用することで、SeqMateはこれらの発見を分析し、制御/制御/ユーザプロンプトされた遺伝子について書かれたレポートを作成することができる。
論文 参考訳(メタデータ) (2024-07-02T20:28:30Z) - UniGen: A Unified Framework for Textual Dataset Generation Using Large Language Models [88.16197692794707]
UniGenは、多様で正確で高度に制御可能なデータセットを作成するように設計された包括的なフレームワークである。
データ多様性を強化するため、UniGenは属性誘導生成モジュールとグループチェック機能を備えている。
大規模な実験は、UniGenによって生成されたデータの優れた品質を示す。
論文 参考訳(メタデータ) (2024-06-27T07:56:44Z) - CRISPR-GPT: An LLM Agent for Automated Design of Gene-Editing Experiments [51.41735920759667]
大規模言語モデル(LLM)は様々なタスクにおいて有望であるが、しばしば特定の知識が欠如し、生物学的設計の問題を正確に解くのに苦労する。
本研究では,CRISPRに基づく遺伝子編集実験の設計プロセスを自動化するために,ドメイン知識と外部ツールを付加したLCMエージェントであるCRISPR-GPTを紹介する。
論文 参考訳(メタデータ) (2024-04-27T22:59:17Z) - RigLSTM: Recurrent Independent Grid LSTM for Generalizable Sequence
Learning [75.61681328968714]
本稿では,対象タスクの基盤となるモジュール構造を利用するために,リカレントな独立したGrid LSTM(RigLSTM)を提案する。
本モデルでは, セル選択, 入力特徴選択, 隠れ状態選択, ソフト状態更新を採用し, より優れた一般化を実現する。
論文 参考訳(メタデータ) (2023-11-03T07:40:06Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Synthetic Data Generator for Adaptive Interventions in Global Health [0.0]
我々は、強化学習アルゴリズムをテストするために、ユーザの行動のオープンソース合成データジェネレータHealthSynを紹介する。
HealthSynは、パーソナライズされた介入に反応して変化する個々のユーザー行動パターンで、多様なユーザーアクションを生成する。
生成されたデータは、研究におけるMLアルゴリズムの開発とテスト、評価、およびエンドツーエンドのRLベースの介入配信フレームワークの両方に使用することができる。
論文 参考訳(メタデータ) (2023-03-03T14:28:45Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - PHOTONAI -- A Python API for Rapid Machine Learning Model Development [2.414341608751139]
PHOTONAIは、機械学習モデル開発の簡素化と高速化を目的とした、ハイレベルなPython APIである。
これは統一フレームワークとして機能し、ユーザーは異なるツールボックスからのアルゴリズムをカスタムのアルゴリズムシーケンスに簡単にアクセスし、組み合わせることができる。
論文 参考訳(メタデータ) (2020-02-13T10:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。