論文の概要: An Empirical Meta-analysis of the Life Sciences (Linked?) Open Data on
the Web
- arxiv url: http://arxiv.org/abs/2006.04161v1
- Date: Sun, 7 Jun 2020 14:26:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 08:15:32.742769
- Title: An Empirical Meta-analysis of the Life Sciences (Linked?) Open Data on
the Web
- Title(参考訳): Web上の生命科学(リンク?)オープンデータに関する実証メタ分析
- Authors: Maulik R. Kamdar and Mark A. Musen
- Abstract要約: LSLOD(Life Sciences Linked Open Data)クラウドについて検討する。
80以上の公開バイオメディカルリンクデータグラフからスキーマを抽出する。
我々は,複数のSLODソースが,他のソースと相互接続されていないスタンドアロンデータソースとして存在していることを観察した。
- 参考スコア(独自算出の注目度): 1.2964393302157287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While the biomedical community has published several "open data" sources in
the last decade, most researchers still endure severe logistical and technical
challenges to discover, query, and integrate heterogeneous data and knowledge
from multiple sources. To tackle these challenges, the community has
experimented with Semantic Web and linked data technologies to create the Life
Sciences Linked Open Data (LSLOD) cloud. In this paper, we extract schemas from
more than 80 publicly available biomedical linked data graphs into an LSLOD
schema graph and conduct an empirical meta-analysis to evaluate the extent of
semantic heterogeneity across the LSLOD cloud. We observe that several LSLOD
sources exist as stand-alone data sources that are not inter-linked with other
sources, use unpublished schemas with minimal reuse or mappings, and have
elements that are not useful for data integration from a biomedical
perspective. We envision that the LSLOD schema graph and the findings from this
research will aid researchers who wish to query and integrate data and
knowledge from multiple biomedical sources simultaneously on the Web.
- Abstract(参考訳): バイオメディカルコミュニティは過去10年間にいくつかの「オープンデータ」ソースを公開してきたが、ほとんどの研究者は依然として、複数のソースからの異種データと知識を発見し、クエリし、統合するための厳しい技術的課題を抱えている。
これらの課題に取り組むため、コミュニティはSemantic Webとリンクデータ技術を使って、Life Sciences Linked Open Data (LSLOD)クラウドを作成しました。
本稿では, LSLODスキーマグラフに公開されている80以上のバイオメディカルリンクデータグラフからスキーマを抽出し, LSLODクラウド全体にわたる意味的不均一性の程度を評価するために, 経験的メタ分析を行う。
いくつかのLCLODソースは、他のソースと相互にリンクしないスタンドアロンのデータソースとして存在し、最小限の再利用やマッピングを伴う未公開スキーマを使用し、バイオメディカルの観点からのデータ統合に役立たない要素を持つ。
LSLODスキーマグラフと本研究の成果は,Web上で複数のバイオメディカルソースからのデータと知識を同時にクエリし,統合したい研究者を支援することを期待する。
関連論文リスト
- Graph-Based Retriever Captures the Long Tail of Biomedical Knowledge [2.2814097119704058]
大規模言語モデル(LLM)は、膨大な知識を要約して提示することで、情報の検索方法を変えつつある。
LLMはトレーニングセットから最も頻繁に見られる情報を強調し、まれな情報を無視する傾向があります。
本稿では,これらのクラスタをダウンサンプリングし,情報過負荷問題を緩和するために知識グラフを活用する新しい情報検索手法を提案する。
論文 参考訳(メタデータ) (2024-02-19T18:31:11Z) - A deep learning pipeline for cross-sectional and longitudinal multiview
data integration [7.424942475653412]
複数のソースからの断面データと縦データを統合するパイプラインを開発した。
線形および非線形手法を用いた変数選択/ランク付け、機能主成分分析とオイラー特性を用いた特徴抽出、高密度フィードフォワードネットワークと繰り返しニューラルネットワークを用いた結合積分と分類を含む。
炎症性腸疾患 (IBD) 研究から, このパイプラインを横断的および縦断的マルチオミクスデータ(メタゲノミクス, トランスクリプトミクス, メタボロミクス)に応用し, IBDの状態を識別する微生物経路, 代謝産物, 遺伝子を同定した。
論文 参考訳(メタデータ) (2023-12-02T22:24:35Z) - CARE: Extracting Experimental Findings From Clinical Literature [31.932111815835412]
CAREは文献から臨床所見を抽出するためのIEデータセットである。
我々は,エンティティと属性間のn-ary関係として微細な発見をキャプチャする新しいアノテーションスキーマを開発した。
我々は、データセット上で様々な最先端のIEシステムの性能をベンチマークする。
論文 参考訳(メタデータ) (2023-11-16T10:06:19Z) - The SourceData-NLP dataset: integrating curation into scientific
publishing for training large language models [1.0423199374671421]
本稿では,出版過程における論文の定期的なキュレーションを通じて生成したSourceData-NLPデータセットについて述べる。
このデータセットは、分子生物学と細胞生物学の3,223の論文で18,689個の数字から算出された、620,000以上の注釈付き生物医学的な実体を含んでいる。
論文 参考訳(メタデータ) (2023-10-31T13:22:38Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Synthetic data generation for a longitudinal cohort study -- Evaluation,
method extension and reproduction of published data analysis results [0.32593385688760446]
医療分野では、プライバシー上の懸念から個人レベルのデータへのアクセスは困難であることが多い。
有望な代替手段は、完全な合成データの生成である。
本研究では,最先端の合成データ生成手法を用いる。
論文 参考訳(メタデータ) (2023-05-12T13:13:55Z) - Synthcity: facilitating innovative use cases of synthetic data in
different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文 参考訳(メタデータ) (2023-01-18T14:49:54Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - Challenges in biomarker discovery and biorepository for Gulf-war-disease
studies: a novel data platform solution [48.7576911714538]
ROSALINDという新しいデータプラットフォームを導入し、課題を克服し、健全で重要なコラボレーションを育み、科学的調査を進めます。
ROSALINDは、自己管理されたアクセシビリティ、リンク性、可積分性、中立性、信頼性を持つリソース有機体を指します。
過去12ヶ月のGWI研究におけるROSALINDの展開により、データ実験と分析のペースが加速し、多数のエラーソースが削除され、研究品質と生産性が向上しました。
論文 参考訳(メタデータ) (2021-02-04T20:38:30Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。