論文の概要: Open Terminology Management and Sharing Toolkit for Federation of
Terminology Databases
- arxiv url: http://arxiv.org/abs/2207.06729v1
- Date: Thu, 14 Jul 2022 08:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-15 23:40:23.035402
- Title: Open Terminology Management and Sharing Toolkit for Federation of
Terminology Databases
- Title(参考訳): 用語データベースフェデレーションのためのオープン用語管理と共有ツールキット
- Authors: Andis Lagzdi\c{n}\v{s} and Uldis Sili\c{n}\v{s} and M\=arcis Pinnis
and Toms Bergmanis and Art\=urs Vasi\c{l}evskis and Andrejs Vasi\c{l}jevs
- Abstract要約: EuroTermBank Toolkitはオープンな用語管理ソリューションである。
組織は、用語を管理して検索し、用語コレクションを作成し、組織内外で共有することができる。
連合データベースで収集されたデータは、ヨーロッパ最大の多言語用語資源であるEuroTermBankと自動的に共有される。
- 参考スコア(独自算出の注目度): 2.5200727733264663
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Consolidated access to current and reliable terms from different subject
fields and languages is necessary for content creators and translators.
Terminology is also needed in AI applications such as machine translation,
speech recognition, information extraction, and other natural language
processing tools. In this work, we facilitate standards-based sharing and
management of terminology resources by providing an open terminology management
solution - the EuroTermBank Toolkit. It allows organisations to manage and
search their terms, create term collections, and share them within and outside
the organisation by participating in the network of federated databases. The
data curated in the federated databases are automatically shared with
EuroTermBank, the largest multilingual terminology resource in Europe, allowing
translators and language service providers as well as researchers and students
to access terminology resources in their most current version.
- Abstract(参考訳): コンテンツ制作者や翻訳者にとって、異なる分野や言語から現在および信頼できる用語への統合アクセスが必要である。
用語学は、機械翻訳、音声認識、情報抽出、その他の自然言語処理ツールなどのAIアプリケーションにも必要である。
本研究では,オープンな用語管理ソリューションであるEuroTermBank Toolkitを提供することで,用語資源の標準的共有と管理を容易にする。
組織は、フェデレーションされたデータベースのネットワークに参加することで、用語の管理と検索、用語コレクションの作成、組織内外の共有が可能になる。
連合データベースで収集されたデータは、ヨーロッパ最大の多言語用語リソースであるEuroTermBankと自動的に共有され、翻訳者や言語サービスプロバイダ、研究者や学生が最新のバージョンで用語リソースにアクセスできるようになる。
関連論文リスト
- Vocab-Expander: A System for Creating Domain-Specific Vocabularies Based
on Word Embeddings [0.0]
Vocab-Expanderは、エンドユーザ(例えば技術スカウト)が自身の関心領域の語彙を作成し拡張できるオンラインツールである。
それは、Webテキストと常識知識ベースであるConceptNetに基づいて、最先端の単語埋め込みテクニックのアンサンブルを利用する。
論文 参考訳(メタデータ) (2023-08-07T12:13:25Z) - LAVIS: A Library for Language-Vision Intelligence [98.88477610704938]
LAVISは、LAnguage-VISionの研究と応用のためのオープンソースライブラリである。
最先端の画像言語、ビデオ言語モデル、一般的なデータセットに容易にアクセスできる統一インターフェースを備えている。
論文 参考訳(メタデータ) (2022-09-15T18:04:10Z) - Data Governance in the Age of Large-Scale Data-Driven Language
Technology [79.92626780294258]
この研究は、利害関係者、価値観、権利間のデータ管理を組織化しようとする、グローバル言語データガバナンスへのアプローチを提案する。
現在提案するフレームワークは、言語データに焦点を当てた多政党の国際ガバナンス構造であり、その作業を支援するために必要な技術および組織ツールを取り入れています。
論文 参考訳(メタデータ) (2022-05-04T00:44:35Z) - CUNI systems for WMT21: Terminology translation Shared Task [0.0]
本研究の目的は、提供された用語データベースに基づいて特定の用語を翻訳するシステムを設計することである。
提案手法は,入力文とともに所望の翻訳を提供し,提案した用語を使用するようにモデルを訓練することに基づいている。
トレーニング中も推論中も用語を補足し、モデルが単語の表面形状を正しく生成する方法を学習できるようにする。
論文 参考訳(メタデータ) (2021-09-20T08:05:39Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - Learning Domain-Specialised Representations for Cross-Lingual Biomedical
Entity Linking [66.76141128555099]
言語横断型バイオメディカルエンティティリンクタスク(XL-BEL)を提案する。
まず、標準単言語英語BELタスクを超えて、標準単言語および多言語LMと同様に、標準的な知識に依存しない能力について検討する。
次に、リソースに富んだ言語からリソースに乏しい言語にドメイン固有の知識を移すことの課題に対処する。
論文 参考訳(メタデータ) (2021-05-30T00:50:00Z) - Named Entity Recognition and Linking Augmented with Large-Scale
Structured Data [3.211619859724085]
BSNLP 2019とBSNLP 2021で開かれた第2回と第3回SlavNER共有タスクへの提出について述べる。
タスクは、スラブ語の多言語web文書における名前付きエンティティの分析に焦点を当てた。
私たちのソリューションは、非構造化文書と構造化文書の両方の大規模なコレクションを利用します。
論文 参考訳(メタデータ) (2021-04-27T20:10:18Z) - UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual
Embeddings Using the Unified Medical Language System Metathesaurus [73.86656026386038]
事前学習プロセス中にドメイン知識を統合するコンテキスト埋め込みモデルであるUmlsBERTを紹介する。
これらの2つの戦略を適用することで、UmlsBERTは、臨床領域の知識を単語埋め込みにエンコードし、既存のドメイン固有モデルより優れている。
論文 参考訳(メタデータ) (2020-10-20T15:56:31Z) - Global Attention for Name Tagging [56.62059996864408]
ローカル、文書レベル、コーパスレベルのコンテキスト情報を活用することで、名前タグを改善するための新しいフレームワークを提案する。
本研究では,グローバルな注意を介し,文書レベルのコンテキスト情報とコーパスレベルのコンテキスト情報と,局所的なコンテキスト情報とを組み込むことを学習するモデルを提案する。
ベンチマークデータセットの実験は、我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-10-19T07:27:15Z) - Coupled intrinsic and extrinsic human language resource-based query
expansion [0.0]
本稿では,クエリ構成エンコーディングや拡張概念抽出,概念重み付けといった言語特性を活かしたクエリ拡張フレームワークを提案する。
実世界のデータセットに対する徹底的な経験的評価は、ユニグラム言語モデル、関連モデル、逐次依存に基づく手法に対する我々のアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-23T11:22:38Z) - Making Metadata Fit for Next Generation Language Technology Platforms:
The Metadata Schema of the European Language Grid [0.8074509995682542]
メタデータは、デジタル資産の要素管理と利用を促進する重要な要素として現れてきた。
European Language Grid Platformは、ヨーロッパにおけるLanguage Technologyの主要なマーケットプレースとハブを目指している。
論文 参考訳(メタデータ) (2020-03-30T06:46:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。