論文の概要: LightTag: Text Annotation Platform
- arxiv url: http://arxiv.org/abs/2109.02320v1
- Date: Mon, 6 Sep 2021 09:41:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-07 16:58:59.477156
- Title: LightTag: Text Annotation Platform
- Title(参考訳): LightTag: テキストアノテーションプラットフォーム
- Authors: Tal Perry
- Abstract要約: LightTagは、その原則に基づいて設計、構築されたテキストアノテーションツールである。
この記事では、設計の根拠、データモデリングの選択、ユーザーインターフェースの決定を共有し、それらの選択がNLPライフサイクル全体をどのように果たすかを説明します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Text annotation tools assume that their user's goal is to create a labeled
corpus. However, users view annotation as a necessary evil on the way to
deliver business value through NLP. Thus an annotation tool should optimize for
the throughput of the global NLP process, not only the productivity of
individual annotators. LightTag is a text annotation tool designed and built on
that principle. This paper shares our design rationale, data modeling choices,
and user interface decisions then illustrates how those choices serve the full
NLP lifecycle.
- Abstract(参考訳): テキストアノテーションツールは、ユーザの目標はラベル付きコーパスを作成することだと仮定する。
しかし、ユーザはアノテーションをnlpを通じてビジネス価値を提供する上で必要悪と捉えています。
したがってアノテーションツールは、個々のアノテーションの生産性だけでなく、グローバルnlpプロセスのスループットを最適化する必要がある。
LightTagは、その原則に基づいて設計、構築されたテキストアノテーションツールである。
本稿では、設計の理論的根拠、データモデリングの選択、ユーザーインターフェースの決定について紹介し、それらの選択が完全なnlpライフサイクルにどのように役立つかを説明します。
関連論文リスト
- EEVEE: An Easy Annotation Tool for Natural Language Processing [32.111061774093]
簡便さ,効率,使いやすさを重視したアノテーションツールであるEEVEEを提案する。
ブラウザ上で直接動作し(セットアップ不要)、(文字オフセットやタスク固有のフォーマットとは対照的に)タブ分離されたファイルをアノテーションに使用する。
論文 参考訳(メタデータ) (2024-02-05T10:24:40Z) - ICL Markup: Structuring In-Context Learning using Soft-Token Tags [8.211752085441923]
大規模事前訓練言語モデル(LLM)は、テキストからテキストへのアプローチによって、幅広いタスクに迅速に適応することができる。
HTMLのようなマークアップ言語にインスパイアされた我々は、プロンプトテンプレートを構成するためにソフトトークンタグを使用する方法に貢献する。
本手法はICLのためのメタラーニングの一種であり,パラメータ効率の良い微調整ウォームアッププロセスにおいて,事前にこれらのタグを学習する。
論文 参考訳(メタデータ) (2023-12-12T16:25:05Z) - Tell Your Model Where to Attend: Post-hoc Attention Steering for LLMs [83.95261728440984]
PASTAは、大きな言語モデルでユーザーが指定した強調マークでテキストを読むことができる方法である。
LLMのユーザ命令に従う能力を大幅に強化したり、ユーザ入力から新たな知識を統合することができる。
論文 参考訳(メタデータ) (2023-11-03T22:56:43Z) - IDEAL: Influence-Driven Selective Annotations Empower In-Context
Learners in Large Language Models [66.32043210237768]
本稿では,影響駆動型選択的アノテーション手法を提案する。
アノテーションのコストを最小限に抑えつつ、コンテキスト内サンプルの品質を向上させることを目的としている。
様々なベンチマークで提案手法の優位性を確認する実験を行った。
論文 参考訳(メタデータ) (2023-10-16T22:53:54Z) - Symbol tuning improves in-context learning in language models [144.58397538701803]
In-context input-label pairs におけるシンボルチューニング - 言語モデルを微調整する。
記号チューニングは、モデルが命令や自然言語ラベルを使ってタスクを把握できない場合、代わりに入力ラベルのマッピングを学習しなければならないという直感を利用する。
シンボルチューニングは、目に見えないコンテキスト内学習タスクのパフォーマンスを向上し、不特定なプロンプトに対してより堅牢であることを示す。
論文 参考訳(メタデータ) (2023-05-15T01:59:58Z) - Semantic Role Labeling Meets Definition Modeling: Using Natural Language
to Describe Predicate-Argument Structures [104.32063681736349]
本稿では,離散ラベルの代わりに自然言語定義を用いて述語-代名詞構造を記述する手法を提案する。
PropBankスタイルおよびFrameNetスタイル、依存性ベースおよびスパンベースSRLに関する実験と分析は、解釈可能な出力を持つフレキシブルモデルが必ずしも性能を犠牲にしないことを示す。
論文 参考訳(メタデータ) (2022-12-02T11:19:16Z) - SciAnnotate: A Tool for Integrating Weak Labeling Sources for Sequence
Labeling [55.71459234749639]
SciAnnotateはSciAnnotateという名前のテキストアノテーションのためのウェブベースのツールで、科学的なアノテーションツールを指す。
我々のツールは、弱いラベルを作成するために複数のユーザフレンドリーなインターフェースを提供する。
本研究では,Bertifying Conditional Hidden Markov Modelを用いて,ツールが生成する弱いラベルを識別する手法を提案する。
論文 参考訳(メタデータ) (2022-08-07T19:18:13Z) - SenTag: a Web-based Tool for Semantic Annotation of Textual Documents [4.910379177401659]
SenTagはテキスト文書のセマンティックアノテーションに焦点を当てたウェブベースのツールである。
アプリケーションの主な目標は、タグ付けプロセスの容易化と、出力ドキュメントのエラーの削減と回避である。
また、テキストコーパスに係わるアノテータの合意のレベルを評価することもできる。
論文 参考訳(メタデータ) (2021-09-16T08:39:33Z) - ProsoBeast Prosody Annotation Tool [2.789492275721704]
ProsoBeast Toolは、音声コーパスのラベル付けの容易化と高速化を目的としている。
データの韻律的景観のインタラクティブな2D表現を提供する。
このツールは、寸法低減と機能埋め込みのためのいくつかの最先端の方法を統合します。
論文 参考訳(メタデータ) (2021-04-06T10:04:48Z) - Active Learning for Coreference Resolution using Discrete Annotation [76.36423696634584]
我々は、コア参照解決におけるアクティブラーニングのためのペアワイズアノテーションを改善した。
提案された参照ペアがコアフェレントでないと判断された場合、アノテータに参照アンテセントを識別するよう依頼する。
既存のベンチマークコアベンチマークデータセットを用いた実験では、この追加質問からの信号が人間のアノテーション時間当たりの大幅なパフォーマンス向上につながることが示された。
論文 参考訳(メタデータ) (2020-04-28T17:17:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。