論文の概要: BoAT v2 -- A Web-Based Dependency Annotation Tool with Focus on
Agglutinative Languages
- arxiv url: http://arxiv.org/abs/2207.01327v2
- Date: Sat, 3 Feb 2024 15:22:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 07:31:54.973107
- Title: BoAT v2 -- A Web-Based Dependency Annotation Tool with Focus on
Agglutinative Languages
- Title(参考訳): BoAT v2 - 凝集型言語に焦点を当てたWebベースの依存性アノテーションツール
- Authors: Salih Furkan Akkurt and B\"u\c{s}ra Mar\c{s}an and Susan Uskudarli
- Abstract要約: BoAT v1 は依存性関係のアノテーションとして開発され、その後手動で BOUN Treebank (UD_Turkish-BOUN) を作成した。
BoAT v2はマルチユーザおよびWebベースの依存性アノテーションツールで、アノテータのユーザエクスペリエンスを重視して設計され、有効なアノテーションを提供する。
- 参考スコア(独自算出の注目度): 0.0657714808721181
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The value of quality treebanks is steadily increasing due to the crucial role
they play in the development of natural language processing tools. The creation
of such treebanks is enormously labor-intensive and time-consuming. Especially
when the size of treebanks is considered, tools that support the annotation
process are essential. Various annotation tools have been proposed, however,
they are often not suitable for agglutinative languages such as Turkish. BoAT
v1 was developed for annotating dependency relations and was subsequently used
to create the manually annotated BOUN Treebank (UD_Turkish-BOUN). In this work,
we report on the design and implementation of a dependency annotation tool BoAT
v2 based on the experiences gained from the use of BoAT v1, which revealed
several opportunities for improvement. BoAT v2 is a multi-user and web-based
dependency annotation tool that is designed with a focus on the annotator user
experience to yield valid annotations. The main objectives of the tool are to:
(1) support creating valid and consistent annotations with increased speed, (2)
significantly improve the user experience of the annotator, (3) support
collaboration among annotators, and (4) provide an open-source and easily
deployable web-based annotation tool with a flexible application programming
interface (API) to benefit the scientific community. This paper discusses the
requirements elicitation, design, and implementation of BoAT v2 along with
examples.
- Abstract(参考訳): 自然言語処理ツールの開発で重要な役割を担っているため、品質の高い木銀行の価値は着実に高まっている。
このような木バンクの作成は労働集約的で時間を要する。
特に、ツリーバンクのサイズを考慮すれば、アノテーションプロセスをサポートするツールが不可欠です。
様々なアノテーションツールが提案されているが、トルコ語のような凝集言語には適さないことが多い。
BoAT v1 は依存性関係を注釈付けするために開発され、その後手動で BOUN Treebank (UD_Turkish-BOUN) を作成した。
本稿では,BoAT v1の使用経験をもとに,依存性アノテーションツールBoAT v2の設計と実装について報告する。
BoAT v2はマルチユーザおよびWebベースの依存性アノテーションツールで、アノテータのユーザエクスペリエンスを重視して、有効なアノテーションを提供する。
ツールの主な目的は、(1)有効で一貫性のあるアノテーションの作成を支援すること、(2)アノテータのユーザエクスペリエンスを大幅に改善すること、(3)アノテータ間のコラボレーションをサポートすること、(4)フレキシブルなアプリケーションプログラミングインタフェース(api)を備えた、オープンソースでデプロイしやすいwebベースのアノテーションツールを提供することである。
本稿では,BoAT v2の要件適用,設計,実装を事例とともに論じる。
関連論文リスト
- TOOLVERIFIER: Generalization to New Tools via Self-Verification [69.85190990517184]
本稿では,ツール選択中にコントラスト質問を自己問合せすることで,近接候補を識別する自己検証手法を提案する。
ToolBenchベンチマークによる4つのタスクの実験では、17の見えないツールで構成されており、数ショットのベースラインよりも平均22%改善されている。
論文 参考訳(メタデータ) (2024-02-21T22:41:38Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - Bidirectional Trained Tree-Structured Decoder for Handwritten
Mathematical Expression Recognition [51.66383337087724]
Handwriting Mathematical Expression Recognition (HMER) タスクは、OCRの分野における重要な分岐である。
近年の研究では、双方向コンテキスト情報の導入により、HMERモデルの性能が大幅に向上することが示されている。
本稿では,MF-SLT と双方向非同期トレーニング (BAT) 構造を提案する。
論文 参考訳(メタデータ) (2023-12-31T09:24:21Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - Antarlekhaka: A Comprehensive Tool for Multi-task Natural Language
Annotation [0.0]
Antarlekhakaは自然言語処理に関連する一連のタスクを手作業でアノテーションするツールである。
このツールはUnicode互換で、言語に依存しない、Webデプロイ可能で、複数の同時アノテータによる分散アノテーションをサポートする。
サンスクリット語とベンガル語という2つの異なる言語での2つの実生活のアノテーションタスクに使用されている。
論文 参考訳(メタデータ) (2023-10-11T19:09:07Z) - ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world
APIs [104.37772295581088]
オープンソースの大規模言語モデル(LLM)、例えばLLaMAは、ツール使用能力に大きく制限されている。
データ構築、モデルトレーニング、評価を含む汎用ツールであるToolLLMを紹介する。
ツール使用のためのインストラクションチューニングフレームワークであるToolBenchを,ChatGPTを使って自動構築する。
論文 参考訳(メタデータ) (2023-07-31T15:56:53Z) - POTATO: The Portable Text Annotation Tool [8.924906491840119]
本稿では,フリーで完全にオープンソースなアノテーションシステムPOTATOを紹介する。
多くのタイプのテキストとマルチモーダルデータのラベル付けをサポートする。
デプロイとアノテータの生産性を最大化するために、簡単に設定できる機能を提供する。
論文 参考訳(メタデータ) (2022-12-16T17:57:41Z) - Entity Aware Syntax Tree Based Data Augmentation for Natural Language
Understanding [5.02493891738617]
本研究では,木構造,エンティティ・アウェア・シンタクス・ツリー (EAST) を応用した新しいNLPデータ拡張手法を提案する。
我々のEADA技術は、少量の注釈付きデータからEASTを自動的に構築し、インテント検出とスロットフィリングのための多数のトレーニングインスタンスを生成する。
4つのデータセットに対する実験結果から,提案手法は,精度と一般化能力の両方の観点から,既存のデータ拡張手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2022-09-06T07:34:10Z) - EXPATS: A Toolkit for Explainable Automated Text Scoring [2.299617836036273]
ユーザが様々なATSモデルを迅速に開発、実験できるオープンソースフレームワークであるEXPATSについて紹介する。
また、このツールキットはLanguage Interpretability Tool(LIT)とシームレスに統合できるため、モデルとその予測を解釈および視覚化できます。
論文 参考訳(メタデータ) (2021-04-07T19:29:06Z) - Reasoning Over Virtual Knowledge Bases With Open Predicate Relations [85.19305347984515]
Open Predicate Query Language (OPQL) を紹介します。
OPQLは、テキストから完全にトレーニングされた仮想知識ベース(VKB)を構築する方法である。
OPQLは2つの異なるKB推論タスクにおいて、以前のVKBメソッドよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-14T01:29:54Z) - Resources for Turkish Dependency Parsing: Introducing the BOUN Treebank
and the BoAT Annotation Tool [0.0]
トルコの係り受け解析のために開発した資源について紹介し,手作業による注釈付きツリーバンク(BOUN Treebank)について紹介する。
BOUNツリーバンクのアノテーションに関する決定は、Universal Dependencies (UD)フレームワークに従って行われた。
BOUNツリーバンクおよびトルコの他の2つのツリーバンク上で得られた最先端の依存性アノテーションの結果を報告する。
論文 参考訳(メタデータ) (2020-02-24T17:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。