論文の概要: LASIGE and UNICAGE solution to the NASA LitCoin NLP Competition
- arxiv url: http://arxiv.org/abs/2308.05609v1
- Date: Thu, 10 Aug 2023 14:41:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-11 12:10:27.186220
- Title: LASIGE and UNICAGE solution to the NASA LitCoin NLP Competition
- Title(参考訳): NASA LitCoin NLPコンペティションにおけるLASIGEとUNICAGEソリューション
- Authors: Pedro Ruas, Diana F. Sousa, Andr\'e Neves, Carlos Cruz, Francisco M.
Couto
- Abstract要約: 本研究では,効率的なデータ処理のための産業データ工学ソリューションと学術システムの統合について述べる。
2022年のLitCoin NLP Challengeでは、約200の参加チームからLasigeUnicage氏が第7回受賞しました。
- 参考スコア(独自算出の注目度): 4.052849915607304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biomedical Natural Language Processing (NLP) tends to become cumbersome for
most researchers, frequently due to the amount and heterogeneity of text to be
processed. To address this challenge, the industry is continuously developing
highly efficient tools and creating more flexible engineering solutions. This
work presents the integration between industry data engineering solutions for
efficient data processing and academic systems developed for Named Entity
Recognition (LasigeUnicage\_NER) and Relation Extraction (BiOnt). Our design
reflects an integration of those components with external knowledge in the form
of additional training data from other datasets and biomedical ontologies. We
used this pipeline in the 2022 LitCoin NLP Challenge, where our team
LasigeUnicage was awarded the 7th Prize out of approximately 200 participating
teams, reflecting a successful collaboration between the academia (LASIGE) and
the industry (Unicage). The software supporting this work is available at
\url{https://github.com/lasigeBioTM/Litcoin-Lasige_Unicage}.
- Abstract(参考訳): バイオメディカル自然言語処理(NLP)は、処理されるテキストの量と不均一性のため、ほとんどの研究者にとって面倒になる傾向がある。
この課題に対処するため、業界は高度に効率的なツールを開発し、より柔軟なエンジニアリングソリューションを作成しています。
本研究では,効率的なデータ処理のための産業データ工学ソリューションと,名前付きエンティティ認識(LasigeUnicage\_NER)と関係抽出(BiOnt)のために開発された学術システムを統合する。
我々の設計は、これらのコンポーネントと外部知識の統合を、他のデータセットや生物医学のオントロジーから追加のトレーニングデータとして反映している。
このパイプラインを2022年のlitcoin nlp challengeで使用し、私たちのチームlasigeunicageは、約200の参加チームから第7位を獲得し、アカデミア(lasige)と業界(unicage)の協力が成功したことを反映しました。
この作業をサポートするソフトウェアは \url{https://github.com/lasigeBioTM/Litcoin-Lasige_Unicage} で入手できる。
関連論文リスト
- MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - Solving the Right Problem is Key for Translational NLP: A Case Study in
UMLS Vocabulary Insertion [12.855898113768998]
UMLSに数十万の新しい用語が加えられる重要な実世界の課題であるUMLS語彙挿入の事例について検討する。
現実世界のタスクを反映したUMLS語彙挿入の新しい定式化を導入する。
また、重要な新しいモデル行動を可能にする効果的なルール強化バイオメディカル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-11-25T19:35:53Z) - Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data
Generation with Large Language Models [48.07083163501746]
臨床自然言語処理には、ドメイン固有の課題に対処できる方法が必要である。
我々は,そのプロセスに知識を注入する,革新的で資源効率のよいアプローチであるClinGenを提案する。
7つのNLPタスクと16のデータセットを比較検討した結果,ClinGenはさまざまなタスクのパフォーマンスを継続的に向上させることがわかった。
論文 参考訳(メタデータ) (2023-11-01T04:37:28Z) - Mining Healthcare Procurement Data Using Text Mining and Natural
Language Processing -- Reflection From An Industrial Project [8.092450321868004]
我々は、医療分野における何百万もの異質な調達文書を採掘するテキストマイニングとNLPソリューションを開発する産業プロジェクトについて述べる。
ドメイン知識を効果的に活用し、複数のテキストマイニングやNLPタスクや言語に一般化する手法を用いる。
この手法を適用して数百万の調達文書をマイニングし,最初の構造化された調達契約データベースを開発する。
論文 参考訳(メタデータ) (2023-01-09T15:59:55Z) - Collaborating Heterogeneous Natural Language Processing Tasks via
Federated Learning [55.99444047920231]
提案するATCフレームワークは, 各種ベースライン手法と比較して, 大幅な改善を実現している。
自然言語理解(NLU)タスクと自然言語生成(NLG)タスクを対象とする,広く使用されている6つのデータセットについて,広範な実験を行った。
論文 参考訳(メタデータ) (2022-12-12T09:27:50Z) - Biomedical NER for the Enterprise with Distillated BERN2 and the Kazu
Framework [12.641531861117086]
Kazuは、バイオNLPをサポートするために設計された、非常にスケーラブルなオープンソースフレームワークである。
BERN2 NERモデル(TinyBERN2)の計算効率の良いバージョンを中心に構築され、他のBioNLP技術を1つのコヒーレントシステムにラップする。
論文 参考訳(メタデータ) (2022-12-01T02:07:55Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Distributed Deep Learning in Open Collaborations [49.240611132653456]
協調学習に特化して設計された新しいアルゴリズムフレームワークを提案する。
現実的な条件下でのSwaVとALBERTの事前学習に対するアプローチの有効性を実証し,コストのごく一部で従来の設定に匹敵する性能を実現する。
論文 参考訳(メタデータ) (2021-06-18T16:23:13Z) - Artificial Intelligence for IT Operations (AIOPS) Workshop White Paper [50.25428141435537]
AIOps(Artificial Intelligence for IT Operations)は、マシンラーニング、ビッグデータ、ストリーミング分析、IT運用管理の交差点で発生する、新たな学際分野である。
AIOPSワークショップの主な目的は、アカデミアと産業界の両方の研究者が集まり、この分野での経験、成果、作業について発表することです。
論文 参考訳(メタデータ) (2021-01-15T10:43:10Z) - The Relational Data Borg is Learning [3.228602524766158]
本稿では,データベース問題として計算データよりも機械学習に対処するアプローチを概説する。
このアプローチはすでに多くの教師なしおよび教師なしの学習タスクに対して研究されている。
論文 参考訳(メタデータ) (2020-08-18T11:25:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。