論文の概要: A Cross-lingual Natural Language Processing Framework for Infodemic
Management
- arxiv url: http://arxiv.org/abs/2010.16357v1
- Date: Fri, 30 Oct 2020 16:26:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 15:51:04.676796
- Title: A Cross-lingual Natural Language Processing Framework for Infodemic
Management
- Title(参考訳): インフォデミック管理のための言語間自然言語処理フレームワーク
- Authors: Ridam Pal, Rohan Pandey, Vaibhav Gautam, Kanav Bhagat, Tavpritesh
Sethi
- Abstract要約: 新型コロナウイルス(COVID-19)のパンデミックは、医療システムに多大な圧力をかけている。
我々は,一般大衆に散布する必要がある関連情報を特定するために,自然言語処理の可能性を利用した。
我々は,世界保健機関の信頼できるガイドラインと日々のニュースを一致させて,関連情報を提供する,新たな言語間自然言語処理フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.6606016007748989
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The COVID-19 pandemic has put immense pressure on health systems which are
further strained due to the misinformation surrounding it. Under such a
situation, providing the right information at the right time is crucial. There
is a growing demand for the management of information spread using Artificial
Intelligence. Hence, we have exploited the potential of Natural Language
Processing for identifying relevant information that needs to be disseminated
amongst the masses. In this work, we present a novel Cross-lingual Natural
Language Processing framework to provide relevant information by matching daily
news with trusted guidelines from the World Health Organization. The proposed
pipeline deploys various techniques of NLP such as summarizers, word
embeddings, and similarity metrics to provide users with news articles along
with a corresponding healthcare guideline. A total of 36 models were evaluated
and a combination of LexRank based summarizer on Word2Vec embedding with Word
Mover distance metric outperformed all other models. This novel open-source
approach can be used as a template for proactive dissemination of relevant
healthcare information in the midst of misinformation spread associated with
epidemics.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックは、医療システムに多大な圧力をかけている。
このような状況下では、適切なタイミングで適切な情報を提供することが重要です。
人工知能を利用して拡散する情報の管理に対する需要が高まっている。
そこで我々は,自然言語処理の可能性を生かして,広範に広める必要のある関連情報を同定した。
本研究では,世界保健機関(WHO)の信頼できるガイドラインと日々のニュースを一致させて関連情報を提供する,新たな言語間自然言語処理フレームワークを提案する。
提案するパイプラインは,要約語,単語埋め込み,類似度など,NLPのさまざまなテクニックをデプロイし,ニュース記事と対応する医療ガイドラインを提供する。
合計36モデルの評価を行い,word2vec埋め込みのlexrank based summaryrとword mover distance metricの組み合わせは,他のすべてのモデルよりも優れていた。
この新たなオープンソースアプローチは、流行に伴う誤報が広まる中で、関連する医療情報を積極的に広めるためのテンプレートとして使用できる。
関連論文リスト
- A Survey of Medical Vision-and-Language Applications and Their Techniques [48.268198631277315]
医療ビジョン・アンド・ランゲージモデル(MVLM)は、複雑な医療データを解釈するための自然言語インタフェースを提供する能力から、大きな関心を集めている。
本稿では,MVLMの概要と適用した各種医療課題について概観する。
また、これらのタスクに使用するデータセットについても検討し、標準化された評価指標に基づいて異なるモデルの性能を比較した。
論文 参考訳(メタデータ) (2024-11-19T03:27:05Z) - MediFact at MEDIQA-CORR 2024: Why AI Needs a Human Touch [0.0]
MEDIQA-CORR 2024共有タスクに提案する新しい手法を提案する。
本手法は,臨床テキストデータからコンテキスト関連情報を抽出することを強調する。
ドメインの専門知識を統合し、意味のある情報抽出を優先順位付けすることで、私たちのアプローチは、医療にAIを適用する上で、人間中心の戦略の重要性を強調します。
論文 参考訳(メタデータ) (2024-04-27T20:28:38Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Advancing Italian Biomedical Information Extraction with
Transformers-based Models: Methodological Insights and Multicenter Practical
Application [0.27027468002793437]
インフォメーション抽出は、自動化されたテキストマイニングパイプラインを使用することで、臨床実践者が限界を克服するのに役立つ。
我々は、最初のイタリアの神経心理学的名前付きエンティティ認識データセットであるPsyNITを作成し、それをトランスフォーマーベースのモデルの開発に利用した。
i)一貫性のあるアノテーションプロセスの重要な役割と(ii)古典的なメソッドと“低リソース”なアプローチを組み合わせた微調整戦略です。
論文 参考訳(メタデータ) (2023-06-08T16:15:46Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - SMedBERT: A Knowledge-Enhanced Pre-trained Language Model with
Structured Semantics for Medical Text Mining [15.809776934712147]
SMedBERTは大規模医療コーパスで訓練された医療用PLMである。
SMedBERTでは、異種関係の情報を学習するために、隣り合うハイブリットアテンションが提案されている。
SMedBERTは、様々な知識集約的な中国の医療タスクにおいて、強いベースラインを著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-08-20T03:32:01Z) - Automated Lay Language Summarization of Biomedical Scientific Reviews [16.01452242066412]
健康リテラシーは適切な健康判断と治療結果の確保において重要な要素として浮上している。
医療用語とこのドメインの専門言語の複雑な構造は、健康情報を解釈するのが特に困難にします。
本稿では,生物医学的レビューの要約を自動生成する新しい課題について紹介する。
論文 参考訳(メタデータ) (2020-12-23T10:01:18Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。