Fugu-MT 論文翻訳(概要): An Empirical Meta-analysis of the Life Sciences (Linked?) Open Data on the Web

論文の概要: An Empirical Meta-analysis of the Life Sciences (Linked?) Open Data on the Web

arxiv url: http://arxiv.org/abs/2006.04161v1
Date: Sun, 7 Jun 2020 14:26:32 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-24 08:15:32.742769
Title: An Empirical Meta-analysis of the Life Sciences (Linked?) Open Data on the Web
Title（参考訳）: Web上の生命科学(リンク?)オープンデータに関する実証メタ分析
Authors: Maulik R. Kamdar and Mark A. Musen
Abstract要約: LSLOD(Life Sciences Linked Open Data)クラウドについて検討する。 80以上の公開バイオメディカルリンクデータグラフからスキーマを抽出する。我々は,複数のSLODソースが,他のソースと相互接続されていないスタンドアロンデータソースとして存在していることを観察した。
参考スコア（独自算出の注目度）: 1.2964393302157287
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While the biomedical community has published several "open data" sources in the last decade, most researchers still endure severe logistical and technical challenges to discover, query, and integrate heterogeneous data and knowledge from multiple sources. To tackle these challenges, the community has experimented with Semantic Web and linked data technologies to create the Life Sciences Linked Open Data (LSLOD) cloud. In this paper, we extract schemas from more than 80 publicly available biomedical linked data graphs into an LSLOD schema graph and conduct an empirical meta-analysis to evaluate the extent of semantic heterogeneity across the LSLOD cloud. We observe that several LSLOD sources exist as stand-alone data sources that are not inter-linked with other sources, use unpublished schemas with minimal reuse or mappings, and have elements that are not useful for data integration from a biomedical perspective. We envision that the LSLOD schema graph and the findings from this research will aid researchers who wish to query and integrate data and knowledge from multiple biomedical sources simultaneously on the Web.
Abstract（参考訳）: バイオメディカルコミュニティは過去10年間にいくつかの「オープンデータ」ソースを公開してきたが、ほとんどの研究者は依然として、複数のソースからの異種データと知識を発見し、クエリし、統合するための厳しい技術的課題を抱えている。これらの課題に取り組むため、コミュニティはSemantic Webとリンクデータ技術を使って、Life Sciences Linked Open Data (LSLOD)クラウドを作成しました。本稿では, LSLODスキーマグラフに公開されている80以上のバイオメディカルリンクデータグラフからスキーマを抽出し, LSLODクラウド全体にわたる意味的不均一性の程度を評価するために, 経験的メタ分析を行う。いくつかのLCLODソースは、他のソースと相互にリンクしないスタンドアロンのデータソースとして存在し、最小限の再利用やマッピングを伴う未公開スキーマを使用し、バイオメディカルの観点からのデータ統合に役立たない要素を持つ。 LSLODスキーマグラフと本研究の成果は,Web上で複数のバイオメディカルソースからのデータと知識を同時にクエリし,統合したい研究者を支援することを期待する。

関連論文リスト

A Comprehensive Survey of Synthetic Tabular Data Generation [27.112327373017457]
タブラルデータ(Tabular data)は、様々な現実世界のアプリケーションにまたがる最も一般的かつ重要なデータフォーマットの1つである。データ不足、プライバシーの懸念、クラス不均衡といった問題によって制約されることが多い。合成データ生成は、生成モデルを利用して実際のデータセットの分布を学習する、有望なソリューションとして登場した。
論文参考訳（メタデータ） (2025-04-23T08:33:34Z)
BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.39593644054865]
BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。 BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文参考訳（メタデータ） (2025-01-13T09:58:03Z)
iASiS: Towards Heterogeneous Big Data Analysis for Personalized Medicine [28.917691563659467]
iASiSインフラストラクチャは、臨床ノートを使用可能なデータに変換することができる。データの意味的な統合を使用することで、リッチで監査可能で信頼性の高い情報を生成する機会が得られる。 iASiSのユースケース,認知症,肺癌の2つの異なる疾患カテゴリのデータ資源について検討した。
論文参考訳（メタデータ） (2024-07-09T10:52:19Z)
Graph-Based Retriever Captures the Long Tail of Biomedical Knowledge [2.2814097119704058]
大規模言語モデル(LLM)は、膨大な知識を要約して提示することで、情報の検索方法を変えつつある。 LLMはトレーニングセットから最も頻繁に見られる情報を強調し、まれな情報を無視する傾向があります。本稿では,これらのクラスタをダウンサンプリングし,情報過負荷問題を緩和するために知識グラフを活用する新しい情報検索手法を提案する。
論文参考訳（メタデータ） (2024-02-19T18:31:11Z)
Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process [8.207427766052044]
提案手法は,2つの数学的および2つの材料科学ケーススタディを用いて実証および解析を行った。シングルソースおよびソースを意識しない機械学習モデルと比較して、提案したマルチソースデータ融合フレームワークはスパースデータ問題に対してより良い予測を提供することができる。
論文参考訳（メタデータ） (2024-02-06T16:54:59Z)
CARE: Extracting Experimental Findings From Clinical Literature [29.763929941107616]
本研究は,臨床所見抽出のための新しいIEデータセットであるCAREを提示する。我々は,エンティティと属性間のn-ary関係として微細な発見をキャプチャする新しいアノテーションスキーマを開発した。臨床治験と症例報告の2つの資料から,700件の要約の広範な注釈を収集した。
論文参考訳（メタデータ） (2023-11-16T10:06:19Z)
Source-Free Collaborative Domain Adaptation via Multi-Perspective Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文参考訳（メタデータ） (2023-08-24T01:30:18Z)
Synthetic data generation for a longitudinal cohort study -- Evaluation, method extension and reproduction of published data analysis results [0.32593385688760446]
医療分野では、プライバシー上の懸念から個人レベルのデータへのアクセスは困難であることが多い。有望な代替手段は、完全な合成データの生成である。本研究では,最先端の合成データ生成手法を用いる。
論文参考訳（メタデータ） (2023-05-12T13:13:55Z)
Synthcity: facilitating innovative use cases of synthetic data in different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。 Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文参考訳（メタデータ） (2023-01-18T14:49:54Z)
EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。 DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文参考訳（メタデータ） (2022-08-01T18:47:03Z)
DeepShovel: An Online Collaborative Platform for Data Extraction in Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。 DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。 14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文参考訳（メタデータ） (2022-02-21T12:18:08Z)
Challenges in biomarker discovery and biorepository for Gulf-war-disease studies: a novel data platform solution [48.7576911714538]
ROSALINDという新しいデータプラットフォームを導入し、課題を克服し、健全で重要なコラボレーションを育み、科学的調査を進めます。 ROSALINDは、自己管理されたアクセシビリティ、リンク性、可積分性、中立性、信頼性を持つリソース有機体を指します。過去12ヶ月のGWI研究におけるROSALINDの展開により、データ実験と分析のペースが加速し、多数のエラーソースが削除され、研究品質と生産性が向上しました。
論文参考訳（メタデータ） (2021-02-04T20:38:30Z)
Opportunities and Challenges of Deep Learning Methods for Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文参考訳（メタデータ） (2019-12-28T02:44:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。