Fugu-MT 論文翻訳(概要): Redundancy-aware unsupervised ranking based on game theory -- application to gene enrichment analysis

論文の概要: Redundancy-aware unsupervised ranking based on game theory -- application to gene enrichment analysis

arxiv url: http://arxiv.org/abs/2207.12184v1
Date: Fri, 22 Jul 2022 08:57:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-26 16:03:58.377848
Title: Redundancy-aware unsupervised ranking based on game theory -- application to gene enrichment analysis
Title（参考訳）: 冗長性に着目したゲーム理論に基づく教師なしランキング -遺伝子エンリッチメント解析への応用-
Authors: Chiara Balestra, Carlo Maj, Emmanuel Mueller, Andreas Mayr
Abstract要約: シングルトンの分布とそのサイズに基づいて,集合の族内の集合をランク付けする手法を提案する。本研究は, 遺伝子集合コレクションに対するアプローチの評価であり, 得られたランクは, 冗長性が低く, 高いカバレッジを示す。
参考スコア（独自算出の注目度）: 0.28675177318965034
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Gene set collections are a common ground to study the enrichment of genes for specific phenotypic traits. Gene set enrichment analysis aims to identify genes that are over-represented in gene sets collections and might be associated with a specific phenotypic trait. However, as this involves a massive number of hypothesis testing, it is often questionable whether a pre-processing step to reduce gene sets collections' sizes is helpful. Moreover, the often highly overlapping gene sets and the consequent low interpretability of gene sets' collections demand for a reduction of the included gene sets. Inspired by this bioinformatics context, we propose a method to rank sets within a family of sets based on the distribution of the singletons and their size. We obtain sets' importance scores by computing Shapley values without incurring into the usual exponential number of evaluations of the value function. Moreover, we address the challenge of including a redundancy awareness in the rankings obtained where, in our case, sets are redundant if they show prominent intersections. We finally evaluate our approach for gene sets collections; the rankings obtained show low redundancy and high coverage of the genes. The unsupervised nature of the proposed ranking does not allow for an evident increase in the number of significant gene sets for specific phenotypic traits when reducing the size of the collections. However, we believe that the rankings proposed are of use in bioinformatics to increase interpretability of the gene sets collections and a step forward to include redundancy into Shapley values computations.
Abstract（参考訳）: 遺伝子集合集は、特定の表現型形質の遺伝子富化を研究する共通の基盤である。遺伝子セットエンリッチメント分析は、遺伝子セットコレクションに過剰に発現し、特定の表現形質に関連付けられる遺伝子を同定することを目的としている。しかし、これは膨大な数の仮説検証を伴うため、遺伝子集合のサイズを減らす前処理ステップが有用かどうか疑問視されることが多い。さらに、しばしば重なり合う遺伝子セットと、それに伴う遺伝子セットのコレクションの低解釈性は、含まれた遺伝子セットの減少を要求する。このバイオインフォマティクスの文脈に触発され、シングルトンの分布とその大きさに基づいて集合群内の集合をランク付けする方法を提案する。値関数の指数関数的評価数を伴わずにshapley値を計算することにより,集合の重要度スコアを得る。さらに,集合が顕著な交点を示す場合,集合が冗長であるようなランキングに冗長性意識を含めることの課題にも対処する。最終的に,遺伝子集合コレクションに対する我々のアプローチを評価し,得られた分類値から,遺伝子の冗長性が低く,高いカバレッジが得られた。提案されたランキングの教師なしの性質は、コレクションのサイズを減らす際に特定の表現型の特徴に対して重要な遺伝子セットの数を明らかに増加させることを許さない。しかし,提案するランキングは,遺伝子集合の解釈可能性を高めるためにバイオインフォマティクスで利用されており,シェープリー値の計算に冗長性を含める方向に進んでいると考えられる。

関連論文リスト

Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文参考訳（メタデータ） (2025-06-26T09:05:38Z)
GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文参考訳（メタデータ） (2025-05-06T03:35:24Z)
Learning to Discover Regulatory Elements for Gene Expression Prediction [59.470991831978516]
Seq2Expは、ターゲット遺伝子発現を駆動する制御要素を発見し、抽出するために設計されたSequence to Expressionネットワークである。本手法は, エピジェノミックシグナル, DNA 配列とその関連因子の因果関係を捉える。
論文参考訳（メタデータ） (2025-02-19T03:25:49Z)
BOLIMES: Boruta and LIME optiMized fEature Selection for Gene Expression Classification [0.0937465283958018]
BOLIMESは、遺伝子発現の分類を強化するために設計された、新しい特徴選択アルゴリズムである。包括的特徴選択と解釈可能性による洗練を組み合わせ、高次元遺伝子発現解析のための強力なソリューションを提供する。
論文参考訳（メタデータ） (2025-02-18T17:33:41Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文参考訳（メタデータ） (2025-01-30T23:03:03Z)
Cross-Attention Graph Neural Networks for Inferring Gene Regulatory Networks with Skewed Degree Distribution [9.919024883502322]
クロスアテンション複合デュアルグラフ埋め込みモデル(XATGRN) 我々のモデルは、様々なデータセットで既存の最先端メソッドよりも一貫して優れています。
論文参考訳（メタデータ） (2024-12-18T10:56:40Z)
GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images [41.732831871866516]
全スライディングヘマトキシリンとエオシン染色組織像は容易にアクセスでき、顕微鏡レベルで組織構造と組成を詳細に調べることができる。近年の進歩は、これらの組織像を利用して、空間的に解決された遺伝子発現プロファイルを予測している。 GeneQueryは、この遺伝子発現予測タスクを質問応答(QA)方式で解決し、より汎用性と柔軟性を向上させることを目的としている。
論文参考訳（メタデータ） (2024-11-27T14:33:13Z)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳（メタデータ） (2024-07-03T10:31:30Z)
Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。 BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。 BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文参考訳（メタデータ） (2024-06-05T06:42:27Z)
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文参考訳（メタデータ） (2024-05-13T20:15:03Z)
Single-Cell Deep Clustering Method Assisted by Exogenous Gene Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文参考訳（メタデータ） (2023-11-28T09:14:55Z)
Redundancy-aware unsupervised rankings for collections of gene sets [0.28675177318965034]
本稿では,重要度スコアを用いて,集合的包括的視点からコンテキストを研究するコレクションの経路をランク付けすることを提案する。提案手法は,遺伝子集合の集合の解釈可能性を高めるためにバイオインフォマティクスにおける実用的有用性を示す。
論文参考訳（メタデータ） (2023-07-30T09:39:42Z)
Feature extraction using Spectral Clustering for Gene Function Prediction [0.4492444446637856]
本稿では,クラスタ分析と階層的マルチラベル分類を組み合わせたアノテーション問題に対する,シリコアプローチの新たなアプローチを提案する。提案手法は、世界で最も支配的かつ生産的な作物であるゼア・メイズ(Zia mays)のケーススタディに適用される。
論文参考訳（メタデータ） (2022-03-25T10:17:36Z)
Multi-modal Self-supervised Pre-training for Regulatory Genome Across Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文参考訳（メタデータ） (2021-10-11T12:48:44Z)
Mining Functionally Related Genes with Semi-Supervised Learning [0.0]
我々は、豊富な機能セットを導入し、半教師付き学習アプローチとともにそれらを使用する。正およびラベルなし例(LPU)による学習の枠組みは機能的関連遺伝子のマイニングに特に適していることが示されている。
論文参考訳（メタデータ） (2020-11-05T20:34:09Z)
Identifying Stress Responsive Genes using Overlapping Communities in Co-expression Networks [0.0]
本論文は、植物の特定の治療に応答する遺伝子を同定するワークフローを提案する。米(Oryza sativa)は、塩ストレスに敏感な主要な食品である。
論文参考訳（メタデータ） (2020-10-23T21:14:59Z)
A Novel Granular-Based Bi-Clustering Method of Deep Mining the Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文参考訳（メタデータ） (2020-05-12T02:04:40Z)
Learn to Predict Sets Using Feed-Forward Neural Networks [63.91494644881925]
本稿では、ディープフィードフォワードニューラルネットワークを用いた設定予測の課題に対処する。未知の置換と基数を持つ集合を予測するための新しい手法を提案する。関連視覚問題に対する集合定式化の有効性を実証する。
論文参考訳（メタデータ） (2020-01-30T01:52:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。