論文の概要: Peptipedia: a comprehensive database for peptide research supported by
Assembled predictive models and Data Mining approaches
- arxiv url: http://arxiv.org/abs/2101.12210v1
- Date: Thu, 28 Jan 2021 10:59:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 11:20:02.504791
- Title: Peptipedia: a comprehensive database for peptide research supported by
Assembled predictive models and Data Mining approaches
- Title(参考訳): Peptipedia: 集合予測モデルとデータマイニングアプローチがサポートするペプチド研究のための総合データベース
- Authors: Cristofer Quiroz, Yasna Barrera Saavedra, Benjam\'in Armijo-Galdames,
Juan Amado-Hinojosa, \'Alvaro Olivera-Nappa, Anamaria Sanchez-Daza, and David
Medina-Ortiz
- Abstract要約: Peptipediaは、ペプチド配列を検索、解析、分析するためのユーザフレンドリーなデータベースおよびWebアプリケーションである。
本ツールでは,これまでに報告された30のデータベースから情報を統合し,これまでに記録された活動を持つペプチドのリポジトリとして最大である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivation: Peptides have attracted the attention in this century due to
their remarkable therapeutic properties. Computational tools are being
developed to take advantage of existing information, encapsulating knowledge
and making it available in a simple way for general public use. However, these
are property-specific redundant data systems, and usually do not display the
data in a clear way. In some cases, information download is not even possible.
This data needs to be available in a simple form for drug design and other
biotechnological applications.
Results: We developed Peptipedia, a user-friendly database and web
application to search, characterise and analyse peptide sequences. Our tool
integrates the information from thirty previously reported databases, making it
the largest repository of peptides with recorded activities so far. Besides, we
implemented a variety of services to increase our tool's usability. The
significant differences of our tools with other existing alternatives becomes a
substantial contribution to develop biotechnological and bioengineering
applications for peptides.
Availability: Peptipedia is available for non-commercial use as an
open-access software, licensed under the GNU General Public License, version
GPL 3.0. The web platform is publicly available at pesb2.cl/peptipedia. Both
the source code and sample datasets are available in the GitHub repository
https://github.com/CristoferQ/PeptideDatabase.
Contact: david.medina@cebib.cl, ana.sanchez@ing.uchile.cl
- Abstract(参考訳): モチベーション: ペプチドは、その優れた治療的性質から、今世紀において注目を集めてきた。
既存の情報を活用するために計算ツールが開発されており、知識をカプセル化し、一般向けに簡単に利用できるようにしている。
しかしながら、これらはプロパティ固有の冗長データシステムであり、通常は明確な方法でデータを表示しない。
場合によっては、情報のダウンロードすら不可能である。
このデータは、ドラッグデザインやその他のバイオテクノロジーの応用のために、簡単な形で利用できる必要がある。
結果: Peptipediaは,ペプチド配列を検索,解析,解析するためのユーザフレンドリーなデータベースおよびWebアプリケーションである。
これまでに報告された30のデータベースから情報を統合し,これまでに記録された活動を持つペプチドのリポジトリとしては最大である。
さらに、ツールのユーザビリティを高めるために、さまざまなサービスを実装しました。
我々のツールと既存の他の代替品との大きな違いは、ペプチドのバイオテクノロジーおよびバイオエンジニアリング応用の開発に大きく貢献する。
可用性: Peptipediaはオープンアクセスソフトウェアとして非商用で利用可能であり、GNU General Public License、GPL 3.0でライセンスされている。
WebプラットフォームはPesb2.cl/peptipediaで公開されている。
ソースコードとサンプルデータセットは、GitHubリポジトリ https://github.com/CristoferQ/PeptideDatabaseで入手できる。
コンタクト: david.medina@cebib.cl, ana.sanchez@ing.uchile.cl
関連論文リスト
- Pennsieve: A Collaborative Platform for Translational Neuroscience and Beyond [0.5130659559809153]
Pennsieveはオープンソースでクラウドベースの科学データ管理プラットフォームである。
複雑なマルチモーダルデータセットをサポートし、データの視覚化と分析のためのツールを提供する。
Pennsieveは125TB以上の科学的データを格納し、350以上のハイインパクトデータセットで35TB以上のデータを公開している。
論文 参考訳(メタデータ) (2024-09-16T17:55:58Z) - MedPix 2.0: A Comprehensive Multimodal Biomedical Dataset for Advanced AI Applications [0.0]
本稿では、データセットMedPix 2.0を構築するためのワークフロー全体について説明する。
データセットとともに、MongoDBインスタンスを効率的にナビゲートするためのGUIを開発しました。
また、分類タスクをスキャンするために、MedPix 2.0でトレーニングされたCLIPベースのモデルを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:49:21Z) - A large dataset curation and benchmark for drug target interaction [0.7699646945563469]
生物活性データは、薬物の発見と再資源化において重要な役割を担っている。
複数の公開ソースからキュレートされた非常に大きなデータセットを標準化し、効率的に表現する方法を提案する。
論文 参考訳(メタデータ) (2024-01-30T17:06:25Z) - PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding [21.126660909515607]
本研究は、配列に基づくペプチド符号化タスクのための、新しいマルチビューコントラスト学習フレームワークであるPepHarmonyを紹介する。
タンパク質データバンク(PDB)とAlphaFoldデータベースから、幅広いペプチド配列と構造を含むデータセットを慎重に選択する。
実験データではペプハーモニーのペプチド配列と構造の間の複雑な関係を捉える能力が強調されている。
論文 参考訳(メタデータ) (2024-01-21T01:16:53Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - Synthcity: facilitating innovative use cases of synthetic data in
different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文 参考訳(メタデータ) (2023-01-18T14:49:54Z) - BigBIO: A Framework for Data-Centric Biomedical Natural Language
Processing [13.30221348538759]
バイオメディカルNLPデータセット126以上のコミュニティライブラリであるBigBIOを紹介する。
BigBIOは、データセットとそのメタデータへのプログラムアクセスを通じて、再現可能なメタデータキュレーションを容易にする。
本稿では,タスクスキーマ,データ監査,コントリビューションガイドライン,および2つの実証的ユースケースの概要について論じる。
論文 参考訳(メタデータ) (2022-06-30T07:15:45Z) - DataLab: A Platform for Data Analysis and Intervention [96.75253335629534]
DataLabは統一されたデータ指向プラットフォームであり、ユーザはデータの特徴をインタラクティブに分析することができる。
ツールネームには、データセットレコメンデーションとグローバルビジョン分析のための機能がある。
これまでのところ、DataLabは1,715のデータセットと3,583の変換バージョンをカバーしている。
論文 参考訳(メタデータ) (2022-02-25T18:32:19Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。