論文の概要: Hierarchy exploitation to detect missing annotations on hierarchical
multi-label classification
- arxiv url: http://arxiv.org/abs/2207.06237v1
- Date: Wed, 13 Jul 2022 14:32:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 18:03:48.381546
- Title: Hierarchy exploitation to detect missing annotations on hierarchical
multi-label classification
- Title(参考訳): 階層的マルチラベル分類における欠落アノテーション検出のための階層的利用
- Authors: Miguel Romero, Felipe Kenji Nakano, Jorge Finke, Camilo Rocha, Celine
Vens
- Abstract要約: 階層型マルチラベル分類データセットにおけるアノテーションの欠落を検出する手法を提案する。
本稿では,各インスタンスの葉から根へのクラスパスに対する集約確率を計算することによって,クラス階層を利用する手法を提案する。
様々な米であるOriza sativa Japonicaの実験では、クラスの階層をこの方法に組み込むことで、予測性能が向上することが示された。
- 参考スコア(独自算出の注目度): 0.1749935196721634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The availability of genomic data has grown exponentially in the last decade,
mainly due to the development of new sequencing technologies. Based on the
interactions between genes (and gene products) extracted from the increasing
genomic data, numerous studies have focused on the identification of
associations between genes and functions. While these studies have shown great
promise, the problem of annotating genes with functions remains an open
challenge. In this work, we present a method to detect missing annotations in
hierarchical multi-label classification datasets. We propose a method that
exploits the class hierarchy by computing aggregated probabilities to the paths
of classes from the leaves to the root for each instance. The proposed method
is presented in the context of predicting missing gene function annotations,
where these aggregated probabilities are further used to select a set of
annotations to be verified through in vivo experiments. The experiments on
Oriza sativa Japonica, a variety of rice, showcase that incorporating the
hierarchy of classes into the method often improves the predictive performance
and our proposed method yields superior results when compared to competitor
methods from the literature.
- Abstract(参考訳): ゲノムデータの入手は、主に新しいシークエンシング技術の開発により、過去10年間で指数関数的に増加している。
ゲノムデータから抽出される遺伝子(および遺伝子産物)間の相互作用に基づいて、多くの研究が遺伝子と機能の関係の同定に重点を置いている。
これらの研究は大きな可能性を秘めているが、機能を持つ遺伝子をアノテートする問題はいまだに未解決の課題である。
本稿では,階層型マルチラベル分類データセットにおけるアノテーションの欠落を検出する手法を提案する。
本稿では,各インスタンスの葉から根までのクラスパスへの集約確率を計算することで,クラス階層を利用する手法を提案する。
提案手法は遺伝子機能アノテーションの欠如を予測する文脈において提示され, それらの集約確率はin vivo実験で検証されるアノテーションのセットを選択するためにさらに用いられる。
イネ品種であるオリザ・サティバ・ジャポニカの実験では,この手法にクラス階層を組み込むことで予測性能が向上し,本手法が文献の競合手法と比較して優れた結果が得られることが示されている。
関連論文リスト
- Robust Multi-view Co-expression Network Inference [8.697303234009528]
トランスクリプトームデータから遺伝子共発現ネットワークを推定することは、多くの課題をもたらす。
複数の独立研究から高次元グラフ推論のためのロバストな手法を提案する。
論文 参考訳(メタデータ) (2024-09-30T06:30:09Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - A Comparative Analysis of Gene Expression Profiling by Statistical and
Machine Learning Approaches [1.8954222800767324]
がん検体を分類する機械学習モデルの生物学的および方法論的限界について論じる。
遺伝子ランキングはこれらのモデルに適応した説明可能性法から得られる。
ブラックボックスニューラルネットワークによって学習された情報は、微分表現の概念と関連している。
論文 参考訳(メタデータ) (2024-02-01T18:17:36Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Feature extraction using Spectral Clustering for Gene Function
Prediction [0.4492444446637856]
本稿では,クラスタ分析と階層的マルチラベル分類を組み合わせたアノテーション問題に対する,シリコアプローチの新たなアプローチを提案する。
提案手法は、世界で最も支配的かつ生産的な作物であるゼア・メイズ(Zia mays)のケーススタディに適用される。
論文 参考訳(メタデータ) (2022-03-25T10:17:36Z) - Self-Supervised Graph Representation Learning for Neuronal Morphologies [75.38832711445421]
ラベルのないデータセットから3次元神経形態の低次元表現を学習するためのデータ駆動型アプローチであるGraphDINOを提案する。
2つの異なる種と複数の脳領域において、この方法では、専門家による手動の特徴に基づく分類と同程度に形態学的細胞型クラスタリングが得られることを示す。
提案手法は,大規模データセットにおける新しい形態的特徴や細胞型の発見を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Discriminative Attribution from Counterfactuals [64.94009515033984]
本稿では,特徴属性と反実的説明を組み合わせたニューラルネットワークの解釈可能性について述べる。
本手法は,特徴属性法の性能を客観的に評価するために有効であることを示す。
論文 参考訳(メタデータ) (2021-09-28T00:53:34Z) - Data-Driven Logistic Regression Ensembles With Applications in Genomics [0.0]
本稿では,正規化とアンサンブルのアイデアを組み合わせた高次元二項分類問題に対する新しいアプローチを提案する。
がん,多発性硬化症,乾皮症などの共通疾患を含むいくつかの医学的データセットを用いて,バイオマーカーの予測精度と同定の点で,本手法の優れた性能を実証した。
論文 参考訳(メタデータ) (2021-02-17T05:57:26Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A New Gene Selection Algorithm using Fuzzy-Rough Set Theory for Tumor
Classification [0.0]
本稿では,ファジィ・ルー集合の識別行列を用いた新しい遺伝子選択手法を提案する。
提案手法は、遺伝子選択結果を改善するために、同一のクラスラベルと異なるクラスラベルを持つインスタンスの類似性を考慮に入れている。
実験により, この手法は最先端の手法に比べて効率が良いことを示した。
論文 参考訳(メタデータ) (2020-03-26T13:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。