論文の概要: A Novel Fuzzy Bi-Clustering Algorithm with AFS for Identification of
Co-Regulated Genes
- arxiv url: http://arxiv.org/abs/2302.01596v1
- Date: Fri, 3 Feb 2023 08:35:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-06 16:55:31.707941
- Title: A Novel Fuzzy Bi-Clustering Algorithm with AFS for Identification of
Co-Regulated Genes
- Title(参考訳): 共制御遺伝子同定のためのAFSを用いたファジィ二クラスタリングアルゴリズム
- Authors: Kaijie Xu
- Abstract要約: 本稿では,共制御遺伝子を同定するファジィ・ビクラスタリングアルゴリズムを提案する。
提案アルゴリズムは、遺伝子発現データの事前知識なしに、協調制御された遺伝子を効果的に検出することができる。
- 参考スコア(独自算出の注目度): 0.799536002595393
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The identification of co-regulated genes and their transcription-factor
binding sites (TFBS) are the key steps toward understanding transcription
regulation. In addition to effective laboratory assays, various bi-clustering
algorithms for detection of the co-expressed genes have been developed.
Bi-clustering methods are used to discover subgroups of genes with similar
expression patterns under to-be-identified subsets of experimental conditions
when applied to gene expression data. By building two fuzzy partition matrices
of the gene expression data with the Axiomatic Fuzzy Set (AFS) theory, this
paper proposes a novel fuzzy bi-clustering algorithm for identification of
co-regulated genes. Specifically, the gene expression data is transformed into
two fuzzy partition matrices via sub-preference relations theory of AFS at
first. One of the matrices is considering the genes as the universe and the
conditions as the concept, the other one is considering the genes as the
concept and the conditions as the universe. The identification of the
co-regulated genes (bi-clusters) is carried out on the two partition matrices
at the same time. Then, a novel fuzzy-based similarity criterion is defined
based on the partition matrixes, and a cyclic optimization algorithm is
designed to discover the significant bi-clusters at expression level. The above
procedures guarantee that the generated bi-clusters have more significant
expression values than that of extracted by the traditional bi-clustering
methods. Finally, the performance of the proposed method is evaluated with the
performance of the three well-known bi-clustering algorithms on publicly
available real microarray datasets. The experimental results are in agreement
with the theoretical analysis and show that the proposed algorithm can
effectively detect the co-regulated genes without any prior knowledge of the
gene expression data.
- Abstract(参考訳): 転写調節機構を理解するための重要なステップは、共調節遺伝子とその転写因子結合部位(TFBS)の同定である。
効果的な実験室アッセイに加え、共発現遺伝子の検出のための様々な二クラスターアルゴリズムが開発されている。
バイクラスター法(bi-clustering method)は、遺伝子発現データに適用された場合、実験条件の特定サブセットの下で類似した発現パターンを持つ遺伝子のサブグループを発見するために用いられる。
axiomatic fuzzy set (afs) 理論を用いて、遺伝子発現データのファジィ分割行列を2つ構築することにより、共調節遺伝子を同定するための新しいファジィバイクラスター化アルゴリズムを提案する。
具体的には、AFSのサブ参照関係理論により、遺伝子発現データを2つのファジィ分割行列に変換する。
行列の1つは、遺伝子を宇宙として、条件を概念として、もう1つは遺伝子を概念として、条件を宇宙として考える。
共調節遺伝子(bi-clusters)の同定は2つの分配行列上で同時に行われる。
次に、分割行列に基づいてファジィに基づく新しい類似度基準を定義し、循環最適化アルゴリズムにより、表現レベルで重要な二クラスタを発見する。
上記の手順により、生成されたbiクラスタは従来のbiクラスタ法で抽出されたものよりも重要な表現値を持つことが保証される。
最後に,一般に利用可能な実マイクロアレイデータセット上での3つのよく知られたバイクラスタ化アルゴリズムの性能評価を行った。
実験結果は理論解析と一致し,提案手法は遺伝子発現データを事前に知ることなく,共調節遺伝子を効果的に検出できることを示した。
関連論文リスト
- Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Feature Selection via Robust Weighted Score for High Dimensional Binary
Class-Imbalanced Gene Expression Data [1.2891210250935148]
非平衡データに対する頑健な重み付けスコア (ROWSU) は, クラス不均衡問題を用いた高次元遺伝子発現二項分類における最も識別性の高い特徴を選択するために提案される。
ROWSU法の性能を6ドルの遺伝子発現データセットで評価した。
論文 参考訳(メタデータ) (2024-01-23T11:22:03Z) - Accelerated Discovery of Machine-Learned Symmetries: Deriving the
Exceptional Lie Groups G2, F4 and E6 [55.41644538483948]
このレターでは、対称性変換の発見を著しく高速化する2つの改良されたアルゴリズムを紹介している。
例外的リー群の複雑性を考えると,この機械学習手法は完全に汎用的であり,多種多様なラベル付きデータセットに適用可能であることを示す。
論文 参考訳(メタデータ) (2023-07-10T20:25:44Z) - DynGFN: Towards Bayesian Inference of Gene Regulatory Networks with
GFlowNets [81.75973217676986]
遺伝子調節ネットワーク(GRN)は、遺伝子発現と細胞機能を制御する遺伝子とその産物間の相互作用を記述する。
既存の方法は、チャレンジ(1)、ダイナミックスから循環構造を識別すること、あるいはチャレンジ(2)、DAGよりも複雑なベイズ後部を学習することに焦点を当てるが、両方ではない。
本稿では、RNAベロシティ技術を用いて遺伝子発現の「速度」を推定できるという事実を活用し、両方の課題に対処するアプローチを開発する。
論文 参考訳(メタデータ) (2023-02-08T16:36:40Z) - Multiscale methods for signal selection in single-cell data [2.683475550237718]
教師なし特徴選択のための3つのトポロジカルな数学的手法を提案する。
単細胞転写学データセットにこれらの手法を適用することで,これらの手法の有用性を実証する。
論文 参考訳(メタデータ) (2022-06-15T18:42:26Z) - Hybrid gene selection approach using XGBoost and multi-objective genetic
algorithm for cancer classification [6.781877756322586]
マイクロアレイデータセットにおける癌分類のための極勾配増強(XGBoost)と多目的最適化遺伝的アルゴリズム(XGBoost-MOGA)を組み合わせた2段階遺伝子選択手法を提案する。
XGBoost-MOGAは、精度、Fスコア、精度、リコールなどの様々な評価基準の観点から、従来の最先端アルゴリズムよりもはるかに優れた結果が得られる。
論文 参考訳(メタデータ) (2021-05-30T03:43:22Z) - Object-Attribute Biclustering for Elimination of Missing Genotypes in
Ischemic Stroke Genome-Wide Data [2.0236506875465863]
欠落した遺伝子型は、一般的な疾患や形質の遺伝的変異を識別するための機械学習アプローチの有効性に影響を与える可能性がある。
この問題は、異なるDNAマイクロアレイで異なる実験から遺伝子型データを収集する際に起こり、それぞれが無名(欠失)遺伝子型のパターンによって特徴づけられる。
我々は、オブジェクト-属性・ビクラスタのよく発達した概念と、二項関係の密接な部分関係に対応する形式的概念を用いる。
論文 参考訳(メタデータ) (2020-10-22T12:27:43Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。