論文の概要: Advancing Biomedical Text Mining with Community Challenges
- arxiv url: http://arxiv.org/abs/2403.04261v1
- Date: Thu, 7 Mar 2024 06:52:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 14:54:47.412622
- Title: Advancing Biomedical Text Mining with Community Challenges
- Title(参考訳): コミュニティチャレンジによる生物医学テキストマイニングの進展
- Authors: Hui Zong, Rongrong Wu, Jiaxue Cha, Erman Wu, Jiakun Li, Liang Tao,
Zuofeng Li, Buzhou Tang, Bairong Shen
- Abstract要約: 生物医学研究の分野は、大量のテキストデータの蓄積が著しく増加したことを目撃している。
バイオメディカルテキストマイニングは、バイオメディカル自然言語処理としても知られており、注目を集めている。
コミュニティの課題評価コンペティションは、技術革新を促進する上で重要な役割を担っている。
- 参考スコア(独自算出の注目度): 5.955528108993928
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The field of biomedical research has witnessed a significant increase in the
accumulation of vast amounts of textual data from various sources such as
scientific literatures, electronic health records, clinical trial reports, and
social media. However, manually processing and analyzing these extensive and
complex resources is time-consuming and inefficient. To address this challenge,
biomedical text mining, also known as biomedical natural language processing,
has garnered great attention. Community challenge evaluation competitions have
played an important role in promoting technology innovation and
interdisciplinary collaboration in biomedical text mining research. These
challenges provide platforms for researchers to develop state-of-the-art
solutions for data mining and information processing in biomedical research. In
this article, we review the recent advances in community challenges specific to
Chinese biomedical text mining. Firstly, we collect the information of these
evaluation tasks, such as data sources and task types. Secondly, we conduct
systematic summary and comparative analysis, including named entity
recognition, entity normalization, attribute extraction, relation extraction,
event extraction, text classification, text similarity, knowledge graph
construction, question answering, text generation, and large language model
evaluation. Then, we summarize the potential clinical applications of these
community challenge tasks from translational informatics perspective. Finally,
we discuss the contributions and limitations of these community challenges,
while highlighting future directions in the era of large language models.
- Abstract(参考訳): 生物医学研究の分野は、科学文献、電子健康記録、臨床試験報告、ソーシャルメディアなど、様々な情報源からの膨大なテキストデータの蓄積が著しく増加している。
しかし、これらの広範囲で複雑なリソースを手動で処理し分析することは、時間がかかり非効率である。
この課題に対処するため、バイオメディカル自然言語処理として知られるバイオメディカルテキストマイニングが注目されている。
バイオメディカルテキストマイニング研究における技術革新と学際的コラボレーションを促進する上で,コミュニティの課題評価競技が重要な役割を担っている。
これらの課題は、研究者が生物医学研究におけるデータマイニングと情報処理のための最先端のソリューションを開発するためのプラットフォームを提供する。
本稿では,中国の生物医学的テキストマイニングに特有なコミュニティ・チャレンジの最近の進歩を概観する。
まず,データソースやタスクタイプなど,これらの評価タスクに関する情報を収集する。
第2に、名前付きエンティティ認識、エンティティ正規化、属性抽出、関係抽出、イベント抽出、テキスト分類、テキスト類似性、知識グラフ構築、質問応答、テキスト生成、大規模言語モデル評価を含む、系統的な要約と比較分析を行う。
次に,これらのコミュニティチャレンジ課題の潜在的な臨床応用について,翻訳情報学の観点から概説する。
最後に,大きな言語モデルの時代における今後の方向性を強調しながら,コミュニティの課題に対する貢献と限界について論じる。
関連論文リスト
- Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges [7.140449861888235]
このレビューでは、テキスト生成の作業を5つの主要なタスクに分類する。
各タスクについて、関連する特徴、サブタスク、および特定の課題についてレビューする。
近年のテキスト生成論文では,タスクやサブタスクに共通する9つの顕著な課題が報告されている。
論文 参考訳(メタデータ) (2024-05-24T14:38:11Z) - A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data [41.8344712915454]
自動放射線診断レポート生成は、医師の作業負荷を軽減し、医療資源の地域格差を最小限にすることができる。
マルチモーダル入力データから情報を得るためには、医師を模倣する計算モデルが必要であるため、これは難しい課題である。
近年, トランスフォーマー, コントラスト学習, 知識ベース構築など, 深層学習に基づく手法を用いてこの問題に対処する研究が進められている。
本調査では,最新の研究で開発された重要な手法を要約し,ディープラーニングに基づくレポート生成のための一般的なワークフローを提案する。
論文 参考訳(メタデータ) (2024-05-21T14:37:35Z) - Computational analysis of the language of pain: a systematic review [0.19999259391104385]
本研究の目的は、痛みの言語の計算処理に関する文献を体系的にレビューすることである。
データ抽出と合成を行い、その目的と結果に応じて選択された研究を分類した。
論文 参考訳(メタデータ) (2024-04-24T21:59:40Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - An Analysis on Large Language Models in Healthcare: A Case Study of
BioBERT [0.0]
本稿では,大規模言語モデル,特にBioBERTを医療に応用するための包括的調査を行う。
この分析は、医療領域のユニークなニーズを満たすために、BioBERTを微調整するための体系的な方法論を概説している。
本論文は、倫理的考察、特に患者のプライバシーとデータセキュリティを徹底的に検討する。
論文 参考訳(メタデータ) (2023-10-11T08:16:35Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Machine Learning Applications for Therapeutic Tasks with Genomics Data [49.98249191161107]
ゲノム学の機械学習応用に関する文献を、治療開発のレンズでレビューします。
治療パイプライン全体にわたるゲノミクス応用における22の機械学習を同定する。
この分野における7つの重要な課題を、拡大と影響の機会として挙げる。
論文 参考訳(メタデータ) (2021-05-03T21:20:20Z) - Automated Lay Language Summarization of Biomedical Scientific Reviews [16.01452242066412]
健康リテラシーは適切な健康判断と治療結果の確保において重要な要素として浮上している。
医療用語とこのドメインの専門言語の複雑な構造は、健康情報を解釈するのが特に困難にします。
本稿では,生物医学的レビューの要約を自動生成する新しい課題について紹介する。
論文 参考訳(メタデータ) (2020-12-23T10:01:18Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。