論文の概要: Mining Functionally Related Genes with Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2011.03089v1
- Date: Thu, 5 Nov 2020 20:34:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 11:48:39.933673
- Title: Mining Functionally Related Genes with Semi-Supervised Learning
- Title(参考訳): 半教師付き学習を伴う機能関連遺伝子マイニング
- Authors: Kaiyu Shen, Razvan Bunescu and Sarah E. Wyatt
- Abstract要約: 我々は、豊富な機能セットを導入し、半教師付き学習アプローチとともにそれらを使用する。
正およびラベルなし例(LPU)による学習の枠組みは機能的関連遺伝子のマイニングに特に適していることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The study of biological processes can greatly benefit from tools that
automatically predict gene functions or directly cluster genes based on shared
functionality. Existing data mining methods predict protein functionality by
exploiting data obtained from high-throughput experiments or meta-scale
information from public databases. Most existing prediction tools are targeted
at predicting protein functions that are described in the gene ontology (GO).
However, in many cases biologists wish to discover functionally related genes
for which GO terms are inadequate. In this paper, we introduce a rich set of
features and use them in conjunction with semisupervised learning approaches in
order to expand an initial set of seed genes to a larger cluster of
functionally related genes. Among all the semi-supervised methods that were
evaluated, the framework of learning with positive and unlabeled examples (LPU)
is shown to be especially appropriate for mining functionally related genes.
When evaluated on experimentally validated benchmark data, the LPU approaches1
significantly outperform a standard supervised learning algorithm as well as an
established state-of-the-art method. Given an initial set of seed genes, our
best performing approach could be used to mine functionally related genes in a
wide range of organisms.
- Abstract(参考訳): 生物学的プロセスの研究は、遺伝子機能を自動的に予測したり、共有機能に基づいて遺伝子を直接クラスタリングするツールの恩恵を受けることができる。
既存のデータマイニング手法は、高スループット実験や公開データベースからのメタスケール情報から得られたデータを活用してタンパク質の機能を予測する。
ほとんどの既存の予測ツールは、遺伝子オントロジー(go)に記述されたタンパク質の機能を予測することを目的としている。
しかし、多くの場合、生物学者はGO用語が不十分な機能関連遺伝子を発見したいと考えている。
本稿では,種遺伝子の初期セットをより大きな機能関連遺伝子群に拡張するために,半教師付き学習手法と併用して,豊富な特徴セットを紹介する。
評価された全ての半教師付き手法の中で、正およびラベルなし例(LPU)による学習の枠組みは機能的関連遺伝子をマイニングするのに特に適していることが示されている。
実験的に検証されたベンチマークデータで評価すると、LPU Approach1は標準的な教師付き学習アルゴリズムと確立された最先端の手法を著しく上回っている。
種遺伝子の初期セットが与えられた場合、機能的関連遺伝子を広範囲の生物でマイニングするために、我々の最も優れた方法が利用できる。
関連論文リスト
- BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Gene Set Summarization using Large Language Models [1.312659265502151]
我々はGPTモデルを用いて遺伝子セット関数の要約を行う手法を開発した。
これらの手法は,遺伝子セットのGO項リストを,有用かつ生物学的に有効に作成できることを示す。
しかし、GPTベースのアプローチでは、信頼できるスコアやp値が得られず、統計的に重要でない項を返すこともしばしばある。
論文 参考訳(メタデータ) (2023-05-21T02:06:33Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Natural language processing for clusterization of genes according to
their functions [62.997667081978825]
本稿では,数千の遺伝子の解析を減らし,複数のクラスタの解析を行うアプローチを提案する。
これらの記述は、事前訓練された言語モデル(BERT)といくつかのテキスト処理アプローチを用いてベクトルとして符号化される。
論文 参考訳(メタデータ) (2022-07-17T12:59:34Z) - Hierarchy exploitation to detect missing annotations on hierarchical
multi-label classification [0.1749935196721634]
階層型マルチラベル分類データセットにおけるアノテーションの欠落を検出する手法を提案する。
本稿では,各インスタンスの葉から根へのクラスパスに対する集約確率を計算することによって,クラス階層を利用する手法を提案する。
様々な米であるOriza sativa Japonicaの実験では、クラスの階層をこの方法に組み込むことで、予測性能が向上することが示された。
論文 参考訳(メタデータ) (2022-07-13T14:32:50Z) - Gene Function Prediction with Gene Interaction Networks: A Context Graph
Kernel Approach [24.234645183601998]
そこで本研究では,焦点遺伝子に関連付けられた遺伝子相互作用ネットワークとして,遺伝子コンテキストグラフを用いた機能推定を提案する。
カーネルベースの機械学習フレームワークでは、コンテキストグラフで情報をキャプチャするコンテキストグラフカーネルを設計する。
論文 参考訳(メタデータ) (2022-04-22T02:54:01Z) - Feature extraction using Spectral Clustering for Gene Function
Prediction [0.4492444446637856]
本稿では,クラスタ分析と階層的マルチラベル分類を組み合わせたアノテーション問題に対する,シリコアプローチの新たなアプローチを提案する。
提案手法は、世界で最も支配的かつ生産的な作物であるゼア・メイズ(Zia mays)のケーススタディに適用される。
論文 参考訳(メタデータ) (2022-03-25T10:17:36Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。