論文の概要: Language modelling techniques for analysing the impact of human genetic variation
- arxiv url: http://arxiv.org/abs/2503.10655v1
- Date: Fri, 07 Mar 2025 21:34:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-23 06:38:24.210930
- Title: Language modelling techniques for analysing the impact of human genetic variation
- Title(参考訳): 言語モデリングによるヒト遺伝子変異の影響の解析
- Authors: Megha Hegde, Jean-Christophe Nebel, Farzana Rahman,
- Abstract要約: 本稿では,過去10年間の計算変量効果予測における言語モデルの利用について検討する。
自然言語の構造と遺伝的配列との本質的な類似性のため、自然言語処理技術は計算変量効果予測において大きな適用性を示している。
- 参考スコア(独自算出の注目度): 1.4132765964347058
- License:
- Abstract: Interpreting the effects of variants within the human genome and proteome is essential for analysing disease risk, predicting medication response, and developing personalised health interventions. Due to the intrinsic similarities between the structure of natural languages and genetic sequences, natural language processing techniques have demonstrated great applicability in computational variant effect prediction. In particular, the advent of the Transformer has led to significant advancements in the field. However, Transformer-based models are not without their limitations, and a number of extensions and alternatives have been developed to improve results and enhance computational efficiency. This review explores the use of language models for computational variant effect prediction over the past decade, analysing the main architectures, and identifying key trends and future directions.
- Abstract(参考訳): ヒトゲノムとプロテオーム内の変異体の影響を解釈することは、病気のリスクを分析し、薬物反応を予測し、パーソナライズされた健康介入を開発するために不可欠である。
自然言語の構造と遺伝的配列との本質的な類似性のため、自然言語処理技術は計算変量効果予測において大きな適用性を示している。
特にトランスフォーマーの出現は、この分野に大きな進歩をもたらした。
しかし、Transformerベースのモデルには制限がなく、多くの拡張や代替手段が開発され、結果の改善と計算効率の向上が図られている。
本稿では,過去10年間の計算変量効果予測における言語モデルの利用,主要アーキテクチャの解析,重要トレンドと今後の方向性について考察する。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - On Uncertainty In Natural Language Processing [2.5076643086429993]
この論文は、自然言語処理における不確実性が言語的、統計的、神経的な観点からどのように特徴づけられるかを研究する。
本研究では,非交換不能な共形予測に基づく自然言語生成における校正サンプリング手法を提案する。
最後に,補助予測器を用いた大規模ブラックボックス言語モデルの信頼性の定量化手法を開発した。
論文 参考訳(メタデータ) (2024-10-04T14:08:02Z) - Language Models are Few-shot Learners for Prognostic Prediction [0.4254099382808599]
実際の患者の臨床データと分子プロファイルを用いた免疫療法の予後予測におけるトランスフォーマーと言語モデルの利用について検討する。
この研究は、複数のがんタイプにわたる予後予測におけるベースラインと言語モデルの有効性をベンチマークし、数発の条件下で異なる事前訓練された言語モデルの影響を調査する。
論文 参考訳(メタデータ) (2023-02-24T15:35:36Z) - CausalDialogue: Modeling Utterance-level Causality in Conversations [83.03604651485327]
クラウドソーシングを通じて、CausalDialogueという新しいデータセットをコンパイルし、拡張しました。
このデータセットは、有向非巡回グラフ(DAG)構造内に複数の因果効果対を含む。
ニューラル会話モデルの訓練における発話レベルにおける因果性の影響を高めるために,Exponential Average Treatment Effect (ExMATE) と呼ばれる因果性強化手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T18:31:50Z) - Protein language model rescue mutations highlight variant effects and
structure in clinically relevant genes [1.7970523486905976]
我々は、培養された医療作用のある遺伝子において既知の病原体変異を特徴付けるために、タンパク質言語モデルの使用を疑問視する。
これらの補償突然変異の予測された効果の体系的解析は、タンパク質の構造的特徴が未承認であることを明らかにする。
我々は、より洗練された共同作業戦略の設計を通知するために、救助突然変異実験を作成、キュレートすることをコミュニティに奨励する。
論文 参考訳(メタデータ) (2022-11-18T03:00:52Z) - Causal Inference via Nonlinear Variable Decorrelation for Healthcare
Applications [60.26261850082012]
線形および非線形共振の両方を扱う可変デコリレーション正規化器を用いた新しい手法を提案する。
我々は、モデル解釈可能性を高めるために、元の特徴に基づくアソシエーションルールマイニングを用いた新しい表現として、アソシエーションルールを採用する。
論文 参考訳(メタデータ) (2022-09-29T17:44:14Z) - The Role of Morphological Variation in Evolutionary Robotics: Maximizing
Performance and Robustness [0.0]
形態変化の影響を計測する手法を提案する。
我々は,変化の振幅,それらが導入されたモダリティ,および進化するエージェントの性能とロバスト性の関係を解析した。
以上の結果から, 形態的変動は, 様々な条件および非変動条件において, より優れた結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2022-08-04T17:58:15Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。
提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。
本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文 参考訳(メタデータ) (2022-05-14T11:47:58Z) - Factorized Neural Transducer for Efficient Language Model Adaptation [51.81097243306204]
空白および語彙予測を分解し,ニューラルトランスデューサの因子化モデルを提案する。
この因子化は、音声認識のためのトランスデューサにスタンドアロン言語モデルの改善を移すことが期待できる。
提案した因子化ニューラルトランスデューサは、言語モデル適応にドメイン外テキストデータを使用する場合、15%から20%のWER改善が得られることを示す。
論文 参考訳(メタデータ) (2021-09-27T15:04:00Z) - Anatomical Predictions using Subject-Specific Medical Data [7.635279671482444]
個人の脳MRIが時間とともにどのように変化するかを予測する手法を提案する。
予測変形場が与えられると、ベースラインスキャンをワープして、将来脳スキャンの予測を行うことができる。
論文 参考訳(メタデータ) (2020-05-29T21:30:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。