論文の概要: Decoding MIE: A Novel Dataset Approach Using Topic Extraction and Affiliation Parsing
- arxiv url: http://arxiv.org/abs/2410.04602v1
- Date: Sun, 06 Oct 2024 19:34:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 14:01:52.380369
- Title: Decoding MIE: A Novel Dataset Approach Using Topic Extraction and Affiliation Parsing
- Title(参考訳): MIEデコード: トピック抽出とアフィリエイトパーシングを用いた新しいデータセットアプローチ
- Authors: Ehsan Bitaraf, Maryam Jafarpour,
- Abstract要約: 本研究は,医療情報学ヨーロッパ(MIE)会議の手続きから得られた新しいデータセットを紹介する。
我々は,「健康技術・情報学研究」誌の4,606論文からメタデータと要約を抽出し,分析した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The rapid expansion of medical informatics literature presents significant challenges in synthesizing and analyzing research trends. This study introduces a novel dataset derived from the Medical Informatics Europe (MIE) Conference proceedings, addressing the need for sophisticated analytical tools in the field. Utilizing the Triple-A software, we extracted and processed metadata and abstract from 4,606 articles published in the "Studies in Health Technology and Informatics" journal series, focusing on MIE conferences from 1996 onwards. Our methodology incorporated advanced techniques such as affiliation parsing using the TextRank algorithm. The resulting dataset, available in JSON format, offers a comprehensive view of bibliometric details, extracted topics, and standardized affiliation information. Analysis of this data revealed interesting patterns in Digital Object Identifier usage, citation trends, and authorship attribution across the years. Notably, we observed inconsistencies in author data and a brief period of linguistic diversity in publications. This dataset represents a significant contribution to the medical informatics community, enabling longitudinal studies of research trends, collaboration network analyses, and in-depth bibliometric investigations. By providing this enriched, structured resource spanning nearly three decades of conference proceedings, we aim to facilitate novel insights and advancements in the rapidly evolving field of medical informatics.
- Abstract(参考訳): 医学情報学文学の急速な拡大は、研究トレンドの合成と分析において大きな課題を呈している。
本研究は,医学情報学ヨーロッパ(MIE)会議の手続きから得られた新しいデータセットを紹介し,その分野における高度な分析ツールの必要性に対処する。
我々は, トリプルAソフトウェアを利用して, 1996年以降のMIEカンファレンスを中心に, 「健康技術・情報学研究」誌シリーズ4,606記事からメタデータと要約を抽出し, 処理した。
提案手法は,TextRankアルゴリズムを用いたアフィリエイト解析などの高度な手法を取り入れた。
結果として得られたデータセットはJSON形式で利用可能で、バイオメトリックスの詳細、抽出されたトピック、標準化されたアフィリエイト情報に関する包括的なビューを提供する。
このデータから、デジタルオブジェクト識別器の使用状況、引用傾向、著者の帰属に関する興味深いパターンを明らかにした。
特に著者データの不整合と出版物における言語多様性の短い期間を観察した。
このデータセットは、医学情報学コミュニティへの重要な貢献であり、研究動向の縦断的研究、協調ネットワーク分析、詳細な文献調査を可能にしている。
我々は,30年近くにわたる会議手続にまたがるこの豊かな構造化資源を提供することによって,急速に発展する医療情報学分野における新たな洞察と進歩を促進することを目指す。
関連論文リスト
- A Review on Generative AI Models for Synthetic Medical Text, Time Series, and Longitudinal Data [0.3374875022248865]
本稿では3種類の合成健康記録(SHR)を作成するための実用モデルに関する新しいスコーピングレビューの結果について述べる。
52の出版物が医療時系列(22件)、縦断データ(17件)、医用テキスト(13件)を生成するための適格基準を満たした。
プライバシー保護は研究論文の主要な研究目的であり,他の目的として,クラス不均衡,データ不足,データ改ざんなどがあった。
論文 参考訳(メタデータ) (2024-11-19T06:53:54Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - CARE: Extracting Experimental Findings From Clinical Literature [29.763929941107616]
本研究は,臨床所見抽出のための新しいIEデータセットであるCAREを提示する。
我々は,エンティティと属性間のn-ary関係として微細な発見をキャプチャする新しいアノテーションスキーマを開発した。
臨床治験と症例報告の2つの資料から,700件の要約の広範な注釈を収集した。
論文 参考訳(メタデータ) (2023-11-16T10:06:19Z) - Leveraging text data for causal inference using electronic health records [1.4182510510164876]
本稿では,電子健康データによる因果推論を支援するためにテキストデータを活用する統一的なフレームワークを提案する。
従来のマッチング分析にテキストデータを組み込むことで、推定処理効果の妥当性を高めることができることを示す。
これらの手法は、臨床データの二次解析範囲を、構造化ERHデータに制限された領域にまで広げる可能性があると考えている。
論文 参考訳(メタデータ) (2023-06-09T16:06:02Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Multimodal Machine Learning in Precision Health [10.068890037410316]
本総説は, この分野を要約し, 今後の研究に欠かせない話題を特定するものである。
コンテンツ分析と文献検索を組み合わせて,2011年から2021年にかけてPubMed, Google Scholar, IEEEXploreの検索文字列とデータベースを構築した。
情報融合の最も一般的な形態は、初期の融合であり、特に、異種データ融合を行う予測性能の改善があった。
論文 参考訳(メタデータ) (2022-04-10T21:56:07Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Visual Exploration and Knowledge Discovery from Biomedical Dark Data [0.0]
我々は、バイオメディカルダークデータから知識を発見するために、自然言語処理ベースのパイプラインを使用している。
我々は、膨大な量の情報を解析する問題を克服する潜在的な解決策を得ることを目的としている。
論文 参考訳(メタデータ) (2020-09-28T04:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。