論文の概要: Predicting O-GlcNAcylation Sites in Mammalian Proteins with Transformers
and RNNs Trained with a New Loss Function
- arxiv url: http://arxiv.org/abs/2402.17131v1
- Date: Tue, 27 Feb 2024 01:53:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-02-28 18:13:52.872561
- Title: Predicting O-GlcNAcylation Sites in Mammalian Proteins with Transformers
and RNNs Trained with a New Loss Function
- Title(参考訳): 新しい損失機能を持つトランスフォーマーとrnnを用いた哺乳類タンパク質のo-glcnacylation部位の予測
- Authors: Pedro Seber
- Abstract要約: O-Glc Nacylationサイトを確実に予測する方法は、2023年まで利用できなかった。
この記事はまず、トランスフォーマーエンコーダを使ってこれらのメトリクスを改善することを試みた。
そこで我々は、重み付き焦点微分可能MCCと呼ばれる新しい損失関数を作成し、分類モデルの性能を向上させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Glycosylation, a protein modification, has multiple essential functional and
structural roles. O-GlcNAcylation, a subtype of glycosylation, has the
potential to be an important target for therapeutics, but methods to reliably
predict O-GlcNAcylation sites had not been available until 2023; a 2021 review
correctly noted that published models were insufficient and failed to
generalize. Moreover, many are no longer usable. In 2023, a considerably better
RNN model with an F$_1$ score of 36.17% and an MCC of 34.57% on a large dataset
was published. This article first sought to improve these metrics using
transformer encoders. While transformers displayed high performance on this
dataset, their performance was inferior to that of the previously published
RNN. We then created a new loss function, which we call the weighted focal
differentiable MCC, to improve the performance of classification models. RNN
models trained with this new function display superior performance to models
trained using the weighted cross-entropy loss; this new function can also be
used to fine-tune trained models. A two-cell RNN trained with this loss
achieves state-of-the-art performance in O-GlcNAcylation site prediction with
an F$_1$ score of 38.82% and an MCC of 38.21% on that large dataset.
- Abstract(参考訳): タンパク質修飾であるグリコシル化は、複数の必須機能および構造的役割を持つ。
グリコシル化のサブタイプであるo-glcnacylationは、治療の重要な標的となる可能性があるが、o-glcnacylationサイトを確実に予測する手法は2023年まで存在しなかった。
さらに、多くはもはや使用できない。
2023年、f$_1$スコアのかなり優れたrnnモデルが36.17%、大規模なデータセット上のmccが34.57%出版された。
この記事はまず、トランスフォーマーエンコーダを使ってこれらのメトリクスを改善しようとした。
トランスフォーマーはこのデータセットで高いパフォーマンスを示したが、その性能は以前公開されたRNNよりも劣っていた。
そこで我々は、重み付き焦点微分可能MCCと呼ばれる新しい損失関数を作成し、分類モデルの性能を向上させる。
この新しい関数でトレーニングされたrnnモデルは、重み付きクロスエントロピー損失を使用してトレーニングされたモデルよりも優れたパフォーマンスを示す。
この損失でトレーニングされた2セルRNNは、O-GlcNAcylationサイトの予測において、F$_1$スコア38.82%、MCC38.21%の最先端のパフォーマンスを達成する。
関連論文リスト
- Attention-gated U-Net model for semantic segmentation of brain tumors and feature extraction for survival prognosis [0.815557531820863]
グリオーマは、最も一般的な原発性脳腫瘍の1つで、攻撃性、予後、組織学的に大きく異なる。
本研究では,脳腫瘍のセグメンテーションを改善するために,R2U-NetをベースとしたTriplanar(2.5D)モデルを提案する。
論文 参考訳(メタデータ) (2026-02-14T07:48:58Z) - Learning a Generative Meta-Model of LLM Activations [75.30161960337892]
ネットワークの内部状態の分布を学習する"メタモデル"を作成します。
ステアリング介入前に学んだメタモデルを適用することで、損失が減少するにつれて、流速が向上する。
これらの結果は、生成的メタモデルが制限的な構造的仮定を伴わずに、解釈可能性へのスケーラブルな経路を提供することを示唆している。
論文 参考訳(メタデータ) (2026-02-06T18:59:56Z) - Evaluating New AI Cell Foundation Models on Challenging Kidney Pathology Cases Unaddressed by Previous Foundation Models [7.770106550946461]
正確な細胞核のセグメンテーションは、腎病理における下流のタスクに重要である。
我々は、2024年以前に開発された3つの広く使われている細胞基盤モデルに対して、高度なAI細胞基盤モデルをベンチマークした。
CellViT++ [Virchow] は,2,091個の試行錯誤サンプルに対して "Good" と評価された40.3%の予測で,スタンドアローンのパフォーマンスが最も高い。
論文 参考訳(メタデータ) (2025-10-01T00:38:36Z) - Output Scaling: YingLong-Delayed Chain of Thought in a Large Pretrained Time Series Forecasting Model [55.25659103706409]
このフレームワークは,設計した基盤モデルであるYingLongの最先端性能を実現する。
YingLongは、マスク付きトークンリカバリによってトレーニングされた非因果的双方向アテンションエンコーダのみのトランスフォーマーである。
我々は、6Mから3Mパラメータの4つの基礎モデルをリリースし、ゼロショットタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2025-05-20T14:31:06Z) - Improved Brain Tumor Detection in MRI: Fuzzy Sigmoid Convolution in Deep Learning [5.350541719319564]
ファジィシグモイド・コンボリューション(FSC)は、最上位モジュールと中間モジュールの2つの追加モジュールと共に導入された。
新たな畳み込み演算子がこのアプローチの中心であり、入力データの整合性を保ちながら受容場を効果的に拡張する。
この研究は、医用イメージング応用のための軽量で高性能なディープラーニングモデルを提供する。
論文 参考訳(メタデータ) (2025-05-08T13:02:44Z) - Learning Transformer-based World Models with Contrastive Predictive Coding [58.0159270859475]
変換器の表現能力を十分に活用するには,次の状態予測目標が不十分であることを示す。
本稿では,行動条件のContrastive Predictive Codingを用いた世界モデルであるTWISTERを導入することで,世界モデル予測をより長い時間的地平線まで拡張することを提案する。
TWISTERは、Atari 100kベンチマークで162%の人間正規化平均スコアを達成し、ルックアヘッド検索を使用しない最先端のメソッドの中で、新しい記録を樹立した。
論文 参考訳(メタデータ) (2025-03-06T13:18:37Z) - Revolutionizing Personalized Cancer Vaccines with NEO: Novel Epitope Optimization Using an Aggregated Feed Forward and Recurrent Neural Network with LSTM Architecture [0.0]
このプロジェクトは、Feed Forward Neural Networks(FFNN)とRecurrent Neural Networks(RNN)を使用して、より速く、より安く、より正確なネオエピトープバインディング予測を促進することを目的としている。
NEOは次世代のシークエンシングデータを必要とし、最先端モデルのスコア(Flurry 1.6、NetMHCstabpan 1.0、IEDB)を計算して積み重ねアンサンブル法を用いる。
このモデルを用いて、パーソナライズされたがんワクチンを改良された結果(AUC = 0.9166、リコール = 91.67パーセント)で製造することができる。
論文 参考訳(メタデータ) (2024-10-31T18:11:57Z) - PredFormer: Transformers Are Effective Spatial-Temporal Predictive Learners [65.93130697098658]
本稿では、予測学習のための純粋なトランスフォーマーベースのフレームワークであるPredFormerを提案する。
PredFormerは、リカレントフリーでトランスフォーマーベースの設計で、シンプルかつ効率的である。
合成および実世界のデータセットに関する実験は、PredFormerが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-10-07T03:52:06Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Predicting Critical Heat Flux with Uncertainty Quantification and Domain Generalization Using Conditional Variational Autoencoders and Deep Neural Networks [2.517043342442487]
我々は,2006年のGroeneveldルックアップテーブルで用いられる臨界熱流束データを拡張する条件付き変分オートエンコーダ(CVAE)を開発した。
従来の手法と比較するため、同じデータセット上で微調整深層ニューラルネットワーク(DNN)回帰モデルを評価した。
論文 参考訳(メタデータ) (2024-09-09T16:50:41Z) - Hybrid Deep Convolutional Neural Networks Combined with Autoencoders And Augmented Data To Predict The Look-Up Table 2006 [2.082445711353476]
本研究では、自己エンコーダとデータ拡張技術により強化されたハイブリッドディープ畳み込みニューラルネットワーク(DCNN)モデルの開発について検討する。
オリジナルの入力機能を3つの異なるオートエンコーダ構成で拡張することにより、モデルの予測能力は大幅に改善された。
論文 参考訳(メタデータ) (2024-08-26T20:45:07Z) - Hard-Attention Gates with Gradient Routing for Endoscopic Image Computing [3.146247125118741]
本稿では,動的特徴選択のためのFeatureSelection Gates (FSG) やHard-Attention Gates (HAG) を紹介する。
この技術は、スパース接続を促進することにより、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)を強化することを目的としている。
本稿では,HAGを拡張したネットワークが,ポリプサイズに関連する二分分類タスクと三分分類タスクの両方において,性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-07-05T10:20:24Z) - Cascade Generalization-based Classifiers for Software Defect Prediction [3.8129869459937455]
本研究では,機械学習に基づくSDPモデルの予測性能を高めるために,カスケード一般化(CG)関数の展開を提案する。
CGに基づくNa"ive Bayes(NB)、Decision Tree(DT)、k-Nearest Neighbor(kNN)モデルの有効性をNASAのソフトウェア欠陥データセット上で検討した。
論文 参考訳(メタデータ) (2024-06-24T20:14:23Z) - Next Generation Loss Function for Image Classification [0.0]
我々は、遺伝的プログラミング(GP)アプローチを利用して、クロスエントロピー(CE)損失を含むよく知られた損失関数に挑戦する。
NGL(Next Generation Loss)と呼ばれる1つの関数は、テストされたすべてのデータセットで、同じか、より優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-04-19T15:26:36Z) - Test-Time Adaptation Induces Stronger Accuracy and Agreement-on-the-Line [65.14099135546594]
最近のテスト時間適応 (TTA) 法は, モデルに非常に弱い相関関係を示すシフトであっても, ACL と AGL の傾向を大幅に強化する。
この結果から,TTAとAGLに基づく推定手法を組み合わせることで,より広い分布シフトの集合に対する高精度なモデルOOD性能を推定できることが示唆された。
論文 参考訳(メタデータ) (2023-10-07T23:21:25Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - A Meta-GNN approach to personalized seizure detection and classification [53.906130332172324]
本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。
トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。
本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-11-01T14:12:58Z) - Improving Feature Extraction from Histopathological Images Through A
Fine-tuning ImageNet Model [4.976419880800879]
大腸癌(CRC)には10万点の注釈画像パッチを用い,2段階的アプローチで術前Xceptionモデルを精査した。
微細なFTX2048から抽出した特徴は,CRCの歯列型を予測する精度が有意に高かった。
FTX2048はストーマの精度を87%から94%に改善した。
論文 参考訳(メタデータ) (2022-01-03T13:19:45Z) - Danish Fungi 2020 -- Not Just Another Image Recognition Dataset [0.0]
デンマークのFungi 2020(DF20)という新しいきめ細かいデータセットとベンチマークを紹介します。
データセットはデンマークの菌類アトラスに提出された観測結果から構築されている。
df20はimagenetと重複しないため、imagenetの公開チェックポイントから微調整されたモデルの偏りのない比較が可能になる。
論文 参考訳(メタデータ) (2021-03-18T09:33:11Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z) - RNN-T Models Fail to Generalize to Out-of-Domain Audio: Causes and
Solutions [73.45995446500312]
ストリーミングおよび非ストリーミングリカレントニューラルネットワークトランスデューサ(RNN-T)のエンド・ツー・エンドモデルにおける一般化特性を解析した。
トレーニング中に複数の正規化手法を組み合わせる方法と,動的重複推論を用いる方法を提案する。
論文 参考訳(メタデータ) (2020-05-07T06:24:47Z) - Assessing Graph-based Deep Learning Models for Predicting Flash Point [52.931492216239995]
グラフベースのディープラーニング(GBDL)モデルは初めてフラッシュポイントを予測するために実装された。
MPNNの平均R2と平均絶対誤差(MAE)は、それぞれ2.3%低、2.0K高である。
論文 参考訳(メタデータ) (2020-02-26T06:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。