論文の概要: Visual Exploration and Knowledge Discovery from Biomedical Dark Data
- arxiv url: http://arxiv.org/abs/2009.13059v1
- Date: Mon, 28 Sep 2020 04:27:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 21:23:55.122195
- Title: Visual Exploration and Knowledge Discovery from Biomedical Dark Data
- Title(参考訳): 生物医学的暗黒データによる視覚探索と知識発見
- Authors: Shashwat Aggarwal, Ramesh Singh
- Abstract要約: 我々は、バイオメディカルダークデータから知識を発見するために、自然言語処理ベースのパイプラインを使用している。
我々は、膨大な量の情報を解析する問題を克服する潜在的な解決策を得ることを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data visualization techniques proffer efficient means to organize and present
data in graphically appealing formats, which not only speeds up the process of
decision making and pattern recognition but also enables decision-makers to
fully understand data insights and make informed decisions. Over time, with the
rise in technological and computational resources, there has been an
exponential increase in the world's scientific knowledge. However, most of it
lacks structure and cannot be easily categorized and imported into regular
databases. This type of data is often termed as Dark Data. Data visualization
techniques provide a promising solution to explore such data by allowing quick
comprehension of information, the discovery of emerging trends, identification
of relationships and patterns, etc. In this empirical research study, we use
the rich corpus of PubMed comprising of more than 30 million citations from
biomedical literature to visually explore and understand the underlying
key-insights using various information visualization techniques. We employ a
natural language processing based pipeline to discover knowledge out of the
biomedical dark data. The pipeline comprises of different lexical analysis
techniques like Topic Modeling to extract inherent topics and major focus
areas, Network Graphs to study the relationships between various entities like
scientific documents and journals, researchers, and, keywords and terms, etc.
With this analytical research, we aim to proffer a potential solution to
overcome the problem of analyzing overwhelming amounts of information and
diminish the limitation of human cognition and perception in handling and
examining such large volumes of data.
- Abstract(参考訳): データビジュアライゼーション技術は、意思決定とパターン認識のプロセスを高速化するだけでなく、意思決定者がデータの洞察を完全に理解し、情報的な決定を行えるように、グラフィカルに魅力的なフォーマットでデータを整理し提示する手段を提供する。
時間が経つにつれて、技術と計算資源の増大とともに、世界の科学知識は指数関数的に増加した。
しかし、そのほとんどは構造が欠けており、簡単に分類や正規データベースへのインポートはできない。
このタイプのデータは、しばしばダークデータと呼ばれる。
データ可視化技術は、情報の迅速な理解、新たなトレンドの発見、関係とパターンの識別などを可能にすることで、このようなデータを探索するための有望なソリューションを提供する。
本研究では,バイオメディカル文献からの3000万以上の引用を含むPubMedのリッチコーパスを用いて,様々な情報可視化技術を用いて,基礎となるキーインサイトを視覚的に探索し,理解する。
我々は,自然言語処理に基づくパイプラインを用いて,生物医学的暗黒データから知識を発見する。
このパイプラインは、固有のトピックや主要な焦点領域を抽出するトピックモデリングや、科学文書やジャーナル、研究者、キーワードや用語など、さまざまなエンティティの関係を研究するネットワークグラフなど、さまざまな語彙分析技術で構成されている。
そこで本研究では,膨大な量の情報を分析し,その処理・分析における人間の認識・認識の限界を減少させる潜在的な解決法を提示することを目的とする。
関連論文リスト
- Decoding MIE: A Novel Dataset Approach Using Topic Extraction and Affiliation Parsing [0.0]
本研究は,医療情報学ヨーロッパ(MIE)会議の手続きから得られた新しいデータセットを紹介する。
我々は,「健康技術・情報学研究」誌の4,606論文からメタデータと要約を抽出し,分析した。
論文 参考訳(メタデータ) (2024-10-06T19:34:23Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Enhancing Biomedical Lay Summarisation with External Knowledge Graphs [28.956500948255677]
そこで本研究では,知識グラフをレイ・サマリゼーション・モデルに組み込むための3つのアプローチの有効性について検討する。
この結果から,グラフベースのドメイン知識の統合は,生成したテキストの可読性を大幅に向上させることで,レイ・サマライズを著しく向上させることが可能であることが確認された。
論文 参考訳(メタデータ) (2023-10-24T10:25:21Z) - Vision+X: A Survey on Multimodal Learning in the Light of Data [64.03266872103835]
様々なソースからのデータを組み込んだマルチモーダル機械学習が,ますます普及している研究分野となっている。
我々は、視覚、音声、テキスト、動きなど、各データフォーマットの共通点と特異点を分析する。
本稿では,表現学習と下流アプリケーションレベルの両方から,マルチモーダル学習に関する既存の文献を考察する。
論文 参考訳(メタデータ) (2022-10-05T13:14:57Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Graph-Based Deep Learning for Medical Diagnosis and Analysis: Past,
Present and Future [36.58189530598098]
医療データを分析するために、機械学習、特にディープラーニングメソッドをどのように活用するかを検討することが重要になっている。
既存のメソッドの大きな制限は、グリッドのようなデータにフォーカスすることです。
グラフニューラルネットワークは、生物学的システムに存在する暗黙の情報を利用することによって、大きな注目を集めている。
論文 参考訳(メタデータ) (2021-05-27T13:32:45Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - A Literature Review of Recent Graph Embedding Techniques for Biomedical
Data [36.446560017794845]
このようなデータを分析するために,グラフに基づく学習法が数多く提案されている。
主な困難は、バイオメディカルグラフの高次元性と空間性を扱う方法である。
グラフ埋め込みメソッドは、上記の問題に対処するための効率的かつ効率的な方法を提供する。
論文 参考訳(メタデータ) (2021-01-17T01:53:50Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - A Survey on Knowledge Graphs: Representation, Acquisition and
Applications [89.78089494738002]
我々は,1)知識グラフ表現学習,2)知識獲得と完成,3)時間的知識グラフ,および4)知識認識アプリケーションに関する研究トピックをレビューする。
知識獲得、特に知識グラフの完成、埋め込み方法、経路推論、論理ルール推論について概観する。
メタラーニング、コモンセンス推論、時間的知識グラフなど、いくつかの新しいトピックを探求する。
論文 参考訳(メタデータ) (2020-02-02T13:17:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。