論文の概要: Easy Semantification of Bioassays
- arxiv url: http://arxiv.org/abs/2111.15182v1
- Date: Tue, 30 Nov 2021 07:46:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 02:11:31.441980
- Title: Easy Semantification of Bioassays
- Title(参考訳): バイオアッセイの簡易セマンティフィケーション
- Authors: Marco Anteghini, Jennifer D'Souza, Vitor A.P. Martins dos Santos,
S\"oren Auer
- Abstract要約: 本稿では, バイオアッセイを自動分離する手法を提案する。
我々のソリューションは、自動セマンティフィケーションの問題を分類とクラスタリングの両立を図っている。
クラスタリングソリューションは、最先端の分類アプローチよりもはるかに優れています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Biological data and knowledge bases increasingly rely on Semantic Web
technologies and the use of knowledge graphs for data integration, retrieval
and federated queries. We propose a solution for automatically semantifying
biological assays. Our solution juxtaposes the problem of automated
semantification as classification versus clustering where the two methods are
on opposite ends of the method complexity spectrum. Characteristically modeling
our problem, we find the clustering solution significantly outperforms a deep
neural network state-of-the-art classification approach. This novel
contribution is based on two factors: 1) a learning objective closely modeled
after the data outperforms an alternative approach with sophisticated semantic
modeling; 2) automatically semantifying biological assays achieves a high
performance F1 of nearly 83%, which to our knowledge is the first reported
standardized evaluation of the task offering a strong benchmark model.
- Abstract(参考訳): 生物学的データと知識基盤は、セマンティックウェブ技術とデータ統合、検索、フェデレーションドクエリのための知識グラフの利用にますます依存している。
生体アッセイを自動的に分離する手法を提案する。
我々の解は,2つの手法が手法複雑性スペクトルの両端にある場合の分類とクラスタリングの区別として,自動セマンティフィケーションの問題を解くものである。
我々の問題の特徴をモデル化すると、クラスタリングソリューションはディープニューラルネットワークの最先端の分類手法を大きく上回っていることが分かる。
この新しい貢献は2つの要因に基づいている。
1) データの後に密にモデル化された学習目的は、洗練されたセマンティックモデリングによる代替アプローチより優れている。
2)生体アッセイを自動分離することで,83%近い高性能なf1が得られる。
関連論文リスト
- NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering [0.14999444543328289]
本稿では,最適化されたトピックモデリングフレームワークであるOVB-LDAとBI-POP CMA-ES最適化技術を統合し,学術文書の抽象分類を強化した新しい手法を提案する。
我々は、ドメイン固有データに基づいて微調整された蒸留MiniLMモデルを用いて、高精度な回答抽出を行う。
論文 参考訳(メタデータ) (2024-10-29T14:45:12Z) - Investigating the Impact of Hard Samples on Accuracy Reveals In-class Data Imbalance [4.291589126905706]
AutoMLドメインでは、モデルの有効性を評価するための重要な指標として、テスト精度が宣言される。
しかし、主性能指標としての試験精度の信頼性は疑問視されている。
トレーニングセットとテストセット間のハードサンプルの分布は、これらのセットの難易度に影響を与える。
本稿では,ハードサンプル識別法を比較するためのベンチマーク手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T11:38:14Z) - Uncertainty in Automated Ontology Matching: Lessons Learned from an
Empirical Experimentation [6.491645162078057]
オントロジは、相互運用によるデータセットのリンクとセマンティック統合において重要な役割を果たす。
本稿では、オントロジーマッチングに基づく手法を用いて、アプリケーションの観点からデータ統合にアプローチする。
論文 参考訳(メタデータ) (2023-10-18T05:42:51Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Smart(Sampling)Augment: Optimal and Efficient Data Augmentation for
Semantic Segmentation [68.8204255655161]
セマンティックイメージセグメンテーションに関する最初の研究を行い、textitSmartAugment と textitSmartSamplingAugment の2つの新しいアプローチを紹介した。
SmartAugmentはベイジアン最適化を使用して、拡張戦略の豊富なスペースを探索し、私たちが考慮しているすべてのセマンティックセグメンテーションタスクにおいて、新しい最先端のパフォーマンスを達成する。
SmartSamplingAugmentは、固定的な拡張戦略を備えたシンプルなパラメータフリーのアプローチで、既存のリソース集約型アプローチとパフォーマンスを競い合い、安価な最先端データ拡張手法を上回っている。
論文 参考訳(メタデータ) (2021-10-31T13:04:45Z) - High Dimensional Level Set Estimation with Bayesian Neural Network [58.684954492439424]
本稿では,ベイズニューラルネットワークを用いた高次元レベル集合推定問題を解く新しい手法を提案する。
各問題に対して対応する理論情報に基づく取得関数を導出してデータポイントをサンプリングする。
合成データセットと実世界データセットの数値実験により,提案手法は既存手法よりも優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2020-12-17T23:21:53Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z) - FocusLiteNN: High Efficiency Focus Quality Assessment for Digital
Pathology [42.531674974834544]
本稿では,ハードウェアの過剰な要求を伴わずに,知識駆動方式と同様の高速な計算を行うCNNベースのモデルを提案する。
FocusPathを使って、9つの異なる色の組織スライドを含むトレーニングデータセットを作成します。
CNNの複雑さを減らそうとする試みでは、CNNを最小レベルまで縮小しても、競争力の高いパフォーマンスを実現しているのが驚きです。
論文 参考訳(メタデータ) (2020-07-11T20:52:01Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。