論文の概要: Making Sense of Metadata Mess: Alignment & Risk Assessment for Diatom Data Use Case
- arxiv url: http://arxiv.org/abs/2411.00677v1
- Date: Fri, 01 Nov 2024 15:36:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 11:30:27.096940
- Title: Making Sense of Metadata Mess: Alignment & Risk Assessment for Diatom Data Use Case
- Title(参考訳): メタデータのメトリクスを理解する:珪藻データ利用事例のアライメントとリスクアセスメント
- Authors: Kio Polson, Marina Potapova, Uttam Meena, Chad Peiper, Joshua Brown, Joshua Agar, Jane Greenberg,
- Abstract要約: 本稿では,Drexel大学自然科学アカデミーのダイアトム・ハーバリウム(Diaatom Herbarium)のデジタル部分へのアクセスを目的としたメタデータ研究について報告する。
本稿では,1) 関連メタデータ標準のレビュー,2) ハマー等が共有する顕微鏡メタデータフレームワーク,2) 標準メタデータのメタデータ特性を標準メタデータタイプにマッピングするベースラインメタデータアライメント,3) 標準データキュレーションの実施過程に関連するメタデータリスク分析の結果について報告する。
- 参考スコア(独自算出の注目度): 0.18846515534317265
- License:
- Abstract: Biologists study Diatoms, a fundamental algae, to assess the health of aquatic systems. Diatom specimens have traditionally been preserved on analog slides, where a single slide can contain thousands of these microscopic organisms. Digitization of these collections presents both metadata challenges and opportunities. This paper reports on metadata research aimed at providing access to a digital portion of the Academy of Natural Sciences' Diatom Herbarium, Drexel University. We report results of a 3-part study covering 1) a review of relevant metadata standards and a microscopy metadata framework shared by Hammer et al., 2) a baseline metadata alignment mapping current diatom metadata properties to standard metadata types, and 3) a metadata risk analysis associated with the course of standard data curation practices. This research is part of an effort involving the transfer of these digital slides to an new system, DataFed, to support global accessible. The final section of this paper includes a conclusion and discusses next steps.
- Abstract(参考訳): 生物学者は、水生システムの健康を評価するために、基本的な藻である珪藻を研究する。
珪藻の標本は伝統的にアナログスライド上に保存されており、単一のスライドには数千の顕微鏡生物が含まれている。
これらのコレクションのデジタル化は、メタデータの課題と機会の両方を示します。
本稿では,Drexel大学自然科学アカデミーのダイアトム・ハーバリウム(Diaatom Herbarium)のデジタル部分へのアクセスを目的としたメタデータ研究について報告する。
第3部研究報告の結果について報告する。
1)関連メタデータ標準のレビューとHammerらが共有する顕微鏡メタデータフレームワーク、2)現在の珪藻メタデータ特性を標準メタデータタイプにマッピングするベースラインメタデータアライメント。
3)標準データキュレーションの行程に関連するメタデータリスク分析。
この研究は、グローバルアクセスをサポートするために、これらのデジタルスライドを新しいシステムであるDataFedに転送する作業の一部である。
本稿の最終節では、結論と次のステップについて論じる。
関連論文リスト
- UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - CSMeD: Bridging the Dataset Gap in Automated Citation Screening for
Systematic Literature Reviews [10.207938863784829]
CSMeDは9つの公開コレクションを統合したメタデータセットである。
CSMeDは自動引用スクリーニングモデルの性能を訓練し評価するための総合的なリソースとして機能する。
我々はCSMeD-FTを導入した。CSMeD-FTは、全文パブリッシュスクリーニングタスクを明示的に評価するために設計された新しいデータセットである。
論文 参考訳(メタデータ) (2023-11-21T09:36:11Z) - Making Metadata More FAIR Using Large Language Models [2.61630828688114]
この作業では、メタデータを比較するFAIRMetaTextと呼ばれる自然言語処理(NLP)情報を提供する。
特に、FAIRMetaTextはメタデータの自然言語記述を分析し、2項間の数学的類似度尺度を提供する。
このソフトウェアは、同じトピックに関するいくつかの実験データセットを使用しながら、さまざまな自然言語メタデータを精査する際の人的労力を大幅に削減することができる。
論文 参考訳(メタデータ) (2023-07-24T19:14:38Z) - PGB: A PubMed Graph Benchmark for Heterogeneous Network Representation
Learning [5.747361083768407]
バイオメディカル文献のための異種グラフ埋め込み評価のための新しいベンチマークであるPubMed Graph Benchmark (PGB)を紹介する。
ベンチマークには、抽象的な著者、引用、MeSH階層、MeSH階層、その他の情報を含む豊富なメタデータが含まれている。
論文 参考訳(メタデータ) (2023-05-04T10:09:08Z) - Toward a Flexible Metadata Pipeline for Fish Specimen Images [1.0838759597899268]
本稿では,30万枚以上のデジタル魚の標本画像を含むコレクションのためのフレキシブルなメタデータパイプラインの開発を目的としたイニシアチブについて報告する。
画像とその関連メタデータは、自動種識別、セグメンテーション、形質抽出を含むAI関連科学研究に使用されている。
論文 参考訳(メタデータ) (2022-11-18T23:25:17Z) - Recent Few-Shot Object Detection Algorithms: A Survey with Performance
Comparison [54.357707168883024]
Few-Shot Object Detection (FSOD)は、人間の学習能力を模倣する。
FSODは、学習した汎用オブジェクトの知識を共通のヘビーテールから新しいロングテールオブジェクトクラスにインテリジェントに転送する。
本稿では,問題定義,共通データセット,評価プロトコルなどを含むFSODの概要を紹介する。
論文 参考訳(メタデータ) (2022-03-27T04:11:28Z) - Multimodal Approach for Metadata Extraction from German Scientific
Publications [0.0]
ドイツ語の科学論文からメタデータを抽出するための多モーダル深層学習手法を提案する。
本稿では,自然言語処理と画像ビジョン処理を組み合わせることで,複数の入力データについて考察する。
提案手法は,約8800の文書からなるデータセットを用いて学習し,F1スコアの0.923を得ることができた。
論文 参考訳(メタデータ) (2021-11-10T15:19:04Z) - Weakly-supervised Graph Meta-learning for Few-shot Node Classification [53.36828125138149]
新しいグラフメタ学習フレームワーク - Graph Hallucination Networks (Meta-GHN) を提案する。
新たなロバストネス強化エピソードトレーニングに基づいて、Meta-GHNは、弱いラベル付きデータからクリーンノード表現を幻覚させるメタ学習を行う。
大規模な実験は、既存のグラフメタ学習研究よりもMeta-GHNの方が優れていることを示す。
論文 参考訳(メタデータ) (2021-06-12T22:22:10Z) - Graph-based Semi-supervised Learning: A Comprehensive Review [51.26862262550445]
半教師付き学習(ssl)はラベル付きデータとラベルなしデータの両方を利用する能力があるため、実際非常に価値があります。
重要なSSLメソッドのクラスは、グラフベースの半教師付き学習(GSSL)メソッドに対応するグラフとしてデータを自然に表現することです。
GSSLメソッドは、構造のユニークさ、アプリケーションの普遍性、大規模データへのスケーラビリティのために、さまざまなドメインでその利点を実証しています。
論文 参考訳(メタデータ) (2021-02-26T05:11:09Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。