論文の概要: An Efficient Consolidation of Word Embedding and Deep Learning
Techniques for Classifying Anticancer Peptides: FastText+BiLSTM
- arxiv url: http://arxiv.org/abs/2309.12058v1
- Date: Thu, 21 Sep 2023 13:25:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 15:08:50.836353
- Title: An Efficient Consolidation of Word Embedding and Deep Learning
Techniques for Classifying Anticancer Peptides: FastText+BiLSTM
- Title(参考訳): 抗がんペプチド分類のための単語埋め込みとディープラーニング技術の効率的な統合:fasttext+bilstm
- Authors: Onur Karakaya and Zeynep Hilal Kilimci
- Abstract要約: 抗がんペプチド(英語: Anticancer peptides、ACP)は、より高い選択性と安全性を有するペプチドである。
近年の科学的進歩はペプチドベースの治療法への関心を生んでいる。
ACPは、正常な細胞に悪影響を及ぼすことなく、目的の細胞を効率的に治療する利点を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Anticancer peptides (ACPs) are a group of peptides that exhibite
antineoplastic properties. The utilization of ACPs in cancer prevention can
present a viable substitute for conventional cancer therapeutics, as they
possess a higher degree of selectivity and safety. Recent scientific
advancements generate an interest in peptide-based therapies which offer the
advantage of efficiently treating intended cells without negatively impacting
normal cells. However, as the number of peptide sequences continues to increase
rapidly, developing a reliable and precise prediction model becomes a
challenging task. In this work, our motivation is to advance an efficient model
for categorizing anticancer peptides employing the consolidation of word
embedding and deep learning models. First, Word2Vec and FastText are evaluated
as word embedding techniques for the purpose of extracting peptide sequences.
Then, the output of word embedding models are fed into deep learning approaches
CNN, LSTM, BiLSTM. To demonstrate the contribution of proposed framework,
extensive experiments are carried on widely-used datasets in the literature,
ACPs250 and Independent. Experiment results show the usage of proposed model
enhances classification accuracy when compared to the state-of-the-art studies.
The proposed combination, FastText+BiLSTM, exhibits 92.50% of accuracy for
ACPs250 dataset, and 96.15% of accuracy for Independent dataset, thence
determining new state-of-the-art.
- Abstract(参考訳): 抗癌ペプチド(anticancer peptides、acps)は、抗腫瘍作用を示すペプチド群である。
がん予防におけるACPの利用は、より高い選択性と安全性を有する従来のがん治療の代替となる可能性がある。
近年の科学的進歩は、正常な細胞に悪影響を及ぼすことなく目的の細胞を効率的に治療できるペプチドベースの治療法への関心を生んでいる。
しかし、ペプチド配列の数が急速に増加するにつれて、信頼できる正確な予測モデルの開発が困難な課題となっている。
本研究の動機は,単語埋め込みとディープラーニングモデルの統合を用いた抗癌ペプチドの分類のための効率的なモデルの開発である。
まず,Word2VecとFastTextを,ペプチド配列抽出のための単語埋め込み技術として評価した。
次に、単語埋め込みモデルの出力を、CNN、LSTM、BiLSTMといったディープラーニングアプローチに入力する。
提案フレームワークの貢献を実証するために,文献,ACPs250,Independentで広く利用されているデータセットについて広範な実験を行った。
実験の結果, 提案モデルの利用は, 最新の研究と比較して分類精度を高めることが示された。
提案された組み合わせであるfasttext+bilstmは、apcs250データセットの92.50%の精度を示し、独立データセットの96.15%の精度を示し、新しい最先端を決定する。
関連論文リスト
- Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction [0.0]
抗がんペプチド予測のためのトポロジー強化機械学習モデル(Top-ML)を提案する。
我々のTop-MLモデルは、広く使われている2つのAntiCP 2.0ベンチマークデータセットで検証され、最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-07-12T04:04:54Z) - A large language model for predicting T cell receptor-antigen binding specificity [4.120928123714289]
本稿では,モデル一般化の限界を克服するMasked Language Model (MLM)を提案する。
具体的には、ランダムにシーケンスセグメントをマスキングし、tcrLMをトレーニングしてマスクセグメントを推論し、TCRシーケンスから表現的特徴を抽出する。
実験の結果,tcrLM は独立テストセットと外部検証セットで 0.937 と 0.933 の AUC 値を達成できた。
論文 参考訳(メタデータ) (2024-06-24T08:36:40Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Contrastive learning of T cell receptor representations [11.053778245621544]
データ効率のよい転送学習が可能なTCR言語モデルSCEPTRを導入する。
本稿では,自己コントラスト学習とマスク付き言語モデリングを組み合わせた新しい事前学習戦略を提案する。
コントラスト学習は,TCRの特異性のルールを復号化するための有用なパラダイムとして期待できる。
論文 参考訳(メタデータ) (2024-06-10T15:50:45Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - ACP-ESM: A novel framework for classification of anticancer peptides
using protein-oriented transformer approach [0.0]
抗がんペプチド (ACP) は、がん研究や治療の分野で大きな注目を集めている分子である。
ACPはアミノ酸の短鎖であり、タンパク質の構成要素であり、がん細胞を選択的に標的にし、殺傷する能力を持っている。
ACPは癌治療の候補として検討されている。
論文 参考訳(メタデータ) (2024-01-04T08:19:27Z) - BeeTLe: A Framework for Linear B-Cell Epitope Prediction and
Classification [0.43512163406551996]
本稿では, 線形B細胞予測と抗体型特異的分類のための, 深層学習に基づく新しいフレームワークを提案する。
そこで本研究では, モデルが抗体の表現を学習するのを助けるために, 固有分解に基づくアミノ酸符号化法を提案する。
最大の公開データベースからキュレートしたデータに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-09-05T09:18:29Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - An Interpretable End-to-end Fine-tuning Approach for Long Clinical Text [72.62848911347466]
EHRにおける非構造化臨床テキストには、意思決定支援、トライアルマッチング、振り返り研究を含むアプリケーションにとって重要な情報が含まれている。
最近の研究は、これらのモデルが他のNLPドメインにおける最先端の性能を考慮し、BERTベースのモデルを臨床情報抽出およびテキスト分類に応用している。
本稿では,SnipBERTという新しい微調整手法を提案する。SnipBERTは全音符を使用する代わりに,重要なスニペットを識別し,階層的に切り刻まれたBERTベースのモデルに供給する。
論文 参考訳(メタデータ) (2020-11-12T17:14:32Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。