論文の概要: Multilingual enrichment of disease biomedical ontologies
- arxiv url: http://arxiv.org/abs/2004.03181v1
- Date: Tue, 7 Apr 2020 08:04:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 00:44:55.487475
- Title: Multilingual enrichment of disease biomedical ontologies
- Title(参考訳): 生体医学的オントロジーの多言語化
- Authors: L\'eo Bouscarrat (QARMA, TALEP), Antoine Bonnefoy, C\'ecile Capponi
(LIF, QARMA), Carlos Ramisch (TALEP)
- Abstract要約: バイオメディカル・ナレッジ・ベースを翻訳するためにオープンソース・ナレッジ・ベースを利用する可能性について検討する。
我々は、9つのヨーロッパ言語におけるウィキデータに関する2つの病気のカバレッジについて考察する。
Wikidataのおかげで得られた翻訳の質を、商用機械翻訳ツールと比較する。
- 参考スコア(独自算出の注目度): 0.7340017786387767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Translating biomedical ontologies is an important challenge, but doing it
manually requires much time and money. We study the possibility to use
open-source knowledge bases to translate biomedical ontologies. We focus on two
aspects: coverage and quality. We look at the coverage of two biomedical
ontologies focusing on diseases with respect to Wikidata for 9 European
languages (Czech, Dutch, English, French, German, Italian, Polish, Portuguese
and Spanish) for both ontologies, plus Arabic, Chinese and Russian for the
second one. We first use direct links between Wikidata and the studied
ontologies and then use second-order links by going through other intermediate
ontologies. We then compare the quality of the translations obtained thanks to
Wikidata with a commercial machine translation tool, here Google Cloud
Translation.
- Abstract(参考訳): 生物医学的オントロジーの翻訳は重要な課題であるが、手動で行うには多くの時間とお金が必要である。
バイオメディカルオントロジーの翻訳にオープンソース知識ベースを用いる可能性を検討する。
カバレッジと品質の2つの側面に重点を置いています。
我々は,9つのヨーロッパ言語(チェコ語,オランダ語,英語,フランス語,ドイツ語,イタリア語,ポーランド語,ポルトガル語,スペイン語)のWikidataに関する疾患に焦点を当てた2つの生物医学的オントロジーと,第2のオントロジーについて述べる。
まず、Wikidataと研究オントロジーの直接リンクを使用し、次に他の中間オントロジーを経由して2階リンクを使用する。
そして、Wikidataのおかげで得られた翻訳の質を、商用の機械翻訳ツールと比較する。
関連論文リスト
- Medical mT5: An Open-Source Multilingual Text-to-Text LLM for The Medical Domain [19.58987478434808]
我々は、医療領域における最初のオープンソーステキストからテキストへの多言語モデルであるMedical mT5を提示する。
包括的な評価では、Medical mT5はエンコーダと、スペイン語、フランス語、イタリア語のベンチマークで同等の大きさのテキスト・テキスト・モデルの両方を上回っている。
論文 参考訳(メタデータ) (2024-04-11T10:01:32Z) - BiMediX: Bilingual Medical Mixture of Experts LLM [94.85518237963535]
英語とアラビア語の両方でシームレスに相互作用するように設計された、最初のバイリンガル医療混合物であるBiMediXを紹介する。
我々のモデルは、英語とアラビア語の幅広い医学的相互作用を促進し、さらに詳細を問い合わせるマルチターンチャットを含む。
そこで我々は,高品質な翻訳を保証するために,人間の洗練を図った英語からアラビア語への半自動翻訳パイプラインを提案する。
論文 参考訳(メタデータ) (2024-02-20T18:59:26Z) - Mitigating Data Imbalance and Representation Degeneration in
Multilingual Machine Translation [103.90963418039473]
Bi-ACLは、MNMTモデルの性能を向上させるために、ターゲット側モノリンガルデータとバイリンガル辞書のみを使用するフレームワークである。
Bi-ACLは、長い尾の言語でも、高リソースの言語でも、より効果的であることを示す。
論文 参考訳(メタデータ) (2023-05-22T07:31:08Z) - Enriching Biomedical Knowledge for Low-resource Language Through
Translation [1.6347851388527643]
我々は、英語・ベトナム語における最先端翻訳モデルを用いて、事前訓練されたデータとバイオメディカル領域における教師付きデータの両方を翻訳し、生成する。
このような大規模な翻訳のおかげで、高品質な公開コーパスから2000万の抽象化に基づいてトレーニングされた、事前訓練されたデコーダ変換モデルであるViPubmedT5を導入する。
論文 参考訳(メタデータ) (2022-10-11T16:35:10Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Extremely low-resource machine translation for closely related languages [0.0]
この研究は、エストニア語とフィンランド語というウラル語族の近縁言語に焦点を当てている。
多言語学習と合成コーパスにより,各言語対の翻訳品質が向上することがわかった。
転送学習と微調整は低リソースの機械翻訳に非常に効果的であり、最良の結果が得られることを示す。
論文 参考訳(メタデータ) (2021-05-27T11:27:06Z) - Conceptualized Representation Learning for Chinese Biomedical Text
Mining [14.77516568767045]
本稿では,最近導入された言語モデルBERTが,中国のバイオメディカルコーパスにどのように適応できるかを検討する。
漢文では、その複雑な構造と多種多様な句の組み合わせにより、より困難である。
論文 参考訳(メタデータ) (2020-08-25T04:41:35Z) - A Multilingual Neural Machine Translation Model for Biomedical Data [84.17747489525794]
生物医学領域におけるテキストの翻訳に使用できる多言語ニューラルマシン翻訳モデルをリリースする。
このモデルは5つの言語(フランス語、ドイツ語、イタリア語、韓国語、スペイン語)から英語に翻訳できる。
ドメインタグを使用して、大量のジェネリックおよびバイオメディカルデータをトレーニングする。
論文 参考訳(メタデータ) (2020-08-06T21:26:43Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。