論文の概要: Advancing Biomedical Text Mining with Community Challenges
- arxiv url: http://arxiv.org/abs/2403.04261v1
- Date: Thu, 7 Mar 2024 06:52:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 14:54:47.412622
- Title: Advancing Biomedical Text Mining with Community Challenges
- Title(参考訳): コミュニティチャレンジによる生物医学テキストマイニングの進展
- Authors: Hui Zong, Rongrong Wu, Jiaxue Cha, Erman Wu, Jiakun Li, Liang Tao,
Zuofeng Li, Buzhou Tang, Bairong Shen
- Abstract要約: 生物医学研究の分野は、大量のテキストデータの蓄積が著しく増加したことを目撃している。
バイオメディカルテキストマイニングは、バイオメディカル自然言語処理としても知られており、注目を集めている。
コミュニティの課題評価コンペティションは、技術革新を促進する上で重要な役割を担っている。
- 参考スコア(独自算出の注目度): 5.955528108993928
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The field of biomedical research has witnessed a significant increase in the
accumulation of vast amounts of textual data from various sources such as
scientific literatures, electronic health records, clinical trial reports, and
social media. However, manually processing and analyzing these extensive and
complex resources is time-consuming and inefficient. To address this challenge,
biomedical text mining, also known as biomedical natural language processing,
has garnered great attention. Community challenge evaluation competitions have
played an important role in promoting technology innovation and
interdisciplinary collaboration in biomedical text mining research. These
challenges provide platforms for researchers to develop state-of-the-art
solutions for data mining and information processing in biomedical research. In
this article, we review the recent advances in community challenges specific to
Chinese biomedical text mining. Firstly, we collect the information of these
evaluation tasks, such as data sources and task types. Secondly, we conduct
systematic summary and comparative analysis, including named entity
recognition, entity normalization, attribute extraction, relation extraction,
event extraction, text classification, text similarity, knowledge graph
construction, question answering, text generation, and large language model
evaluation. Then, we summarize the potential clinical applications of these
community challenge tasks from translational informatics perspective. Finally,
we discuss the contributions and limitations of these community challenges,
while highlighting future directions in the era of large language models.
- Abstract(参考訳): 生物医学研究の分野は、科学文献、電子健康記録、臨床試験報告、ソーシャルメディアなど、様々な情報源からの膨大なテキストデータの蓄積が著しく増加している。
しかし、これらの広範囲で複雑なリソースを手動で処理し分析することは、時間がかかり非効率である。
この課題に対処するため、バイオメディカル自然言語処理として知られるバイオメディカルテキストマイニングが注目されている。
バイオメディカルテキストマイニング研究における技術革新と学際的コラボレーションを促進する上で,コミュニティの課題評価競技が重要な役割を担っている。
これらの課題は、研究者が生物医学研究におけるデータマイニングと情報処理のための最先端のソリューションを開発するためのプラットフォームを提供する。
本稿では,中国の生物医学的テキストマイニングに特有なコミュニティ・チャレンジの最近の進歩を概観する。
まず,データソースやタスクタイプなど,これらの評価タスクに関する情報を収集する。
第2に、名前付きエンティティ認識、エンティティ正規化、属性抽出、関係抽出、イベント抽出、テキスト分類、テキスト類似性、知識グラフ構築、質問応答、テキスト生成、大規模言語モデル評価を含む、系統的な要約と比較分析を行う。
次に,これらのコミュニティチャレンジ課題の潜在的な臨床応用について,翻訳情報学の観点から概説する。
最後に,大きな言語モデルの時代における今後の方向性を強調しながら,コミュニティの課題に対する貢献と限界について論じる。
関連論文リスト
- Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - An Analysis on Large Language Models in Healthcare: A Case Study of
BioBERT [0.0]
本稿では,大規模言語モデル,特にBioBERTを医療に応用するための包括的調査を行う。
この分析は、医療領域のユニークなニーズを満たすために、BioBERTを微調整するための体系的な方法論を概説している。
本論文は、倫理的考察、特に患者のプライバシーとデータセキュリティを徹底的に検討する。
論文 参考訳(メタデータ) (2023-10-11T08:16:35Z) - Opportunities and Challenges for ChatGPT and Large Language Models in
Biomedicine and Health [22.858424132819795]
チャットGPTは、バイオメディシンと健康の分野における多様な応用の出現につながっている。
生体情報検索,質問応答,医用テキスト要約,医学教育の分野について検討する。
テキスト生成タスクの分野では,従来の最先端手法を超越した大きな進歩が見られた。
論文 参考訳(メタデータ) (2023-06-15T20:19:08Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - BioIE: Biomedical Information Extraction with Multi-head Attention
Enhanced Graph Convolutional Network [9.227487525657901]
本稿では,バイオメディカルテキストと非構造化医療報告から関係を抽出するハイブリッドニューラルネットワークであるバイオメディカル情報抽出を提案する。
本研究は,2つの主要な生医学的関係抽出タスク,化学物質とタンパク質の相互作用,およびクロスホスピタル・パン・カンノロジー報告コーパスについて検討した。
論文 参考訳(メタデータ) (2021-10-26T13:19:28Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Machine Learning Applications for Therapeutic Tasks with Genomics Data [49.98249191161107]
ゲノム学の機械学習応用に関する文献を、治療開発のレンズでレビューします。
治療パイプライン全体にわたるゲノミクス応用における22の機械学習を同定する。
この分野における7つの重要な課題を、拡大と影響の機会として挙げる。
論文 参考訳(メタデータ) (2021-05-03T21:20:20Z) - Automated Lay Language Summarization of Biomedical Scientific Reviews [16.01452242066412]
健康リテラシーは適切な健康判断と治療結果の確保において重要な要素として浮上している。
医療用語とこのドメインの専門言語の複雑な構造は、健康情報を解釈するのが特に困難にします。
本稿では,生物医学的レビューの要約を自動生成する新しい課題について紹介する。
論文 参考訳(メタデータ) (2020-12-23T10:01:18Z) - Visual Exploration and Knowledge Discovery from Biomedical Dark Data [0.0]
我々は、バイオメディカルダークデータから知識を発見するために、自然言語処理ベースのパイプラインを使用している。
我々は、膨大な量の情報を解析する問題を克服する潜在的な解決策を得ることを目的としている。
論文 参考訳(メタデータ) (2020-09-28T04:27:05Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。