論文の概要: Observations on Annotations
- arxiv url: http://arxiv.org/abs/2004.10283v1
- Date: Tue, 21 Apr 2020 20:29:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 06:56:09.730699
- Title: Observations on Annotations
- Title(参考訳): アノテーションの観察
- Authors: Georg Rehm
- Abstract要約: Hypertext、Computational Linguistics、Language Technology、Artificial Intelligence、Open Scienceなどだ。
複雑さの観点では、それらは自明なものから高度に洗練されたものまで、成熟度の観点からは実験的なものから標準化されたものまで様々である。
例えば、テキストドキュメントのような主要な研究データは、異なるレイヤに同時にアノテートすることができる。
- 参考スコア(独自算出の注目度): 0.5175994976508882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The annotation of textual information is a fundamental activity in
Linguistics and Computational Linguistics. This article presents various
observations on annotations. It approaches the topic from several angles
including Hypertext, Computational Linguistics and Language Technology,
Artificial Intelligence and Open Science. Annotations can be examined along
different dimensions. In terms of complexity, they can range from trivial to
highly sophisticated, in terms of maturity from experimental to standardised.
Annotations can be annotated themselves using more abstract annotations.
Primary research data such as, e.g., text documents can be annotated on
different layers concurrently, which are independent but can be exploited using
multi-layer querying. Standards guarantee interoperability and reusability of
data sets. The chapter concludes with four final observations, formulated as
research questions or rather provocative remarks on the current state of
annotation research.
- Abstract(参考訳): テキスト情報の注釈は言語学と計算言語学の基本的な活動である。
本稿ではアノテーションに関する様々な観察について述べる。
ハイパーテキスト、計算言語学、言語技術、人工知能、オープンサイエンスなど、いくつかの角度からこのトピックにアプローチしている。
アノテーションは異なる次元で調べることができる。
複雑さの観点では、実験から標準化までの成熟度の観点から、それらは自明なものから高度に洗練されたものまで様々である。
アノテーションはもっと抽象的なアノテーションを使ってアノテートすることができる。
テキスト文書のような一次研究データは、独立したが多層クエリを使って活用できる異なる層に同時に注釈を付けることができる。
標準はデータセットの相互運用性と再利用性を保証する。
この章は4つの最終的な観察で締めくくられ、研究疑問やむしろアノテーション研究の現状に関する挑発的な発言として定式化されている。
関連論文リスト
- Variationist: Exploring Multifaceted Variation and Bias in Written Language Data [3.666781404469562]
言語データの探索と理解は、人間の言語を扱うあらゆる分野において、基本的な段階である。
しかし現時点では、言語の変化とバイアスをシームレスに検査し視覚化する、統一的でカスタマイズ可能なツールが欠如している。
本稿では、このギャップを埋める高度にモジュラーで記述的でタスクに依存しないツールである「変分主義」を紹介する。
論文 参考訳(メタデータ) (2024-06-25T15:41:07Z) - SPACE-IDEAS: A Dataset for Salient Information Detection in Space Innovation [0.3017070810884304]
本研究では,空間領域に関連するイノベーションのアイデアから情報を検出するためのデータセットであるSPACE-IDEASを紹介する。
SPACE-IDEASのテキストは大きく異なり、非公式、技術的、学術的、ビジネス指向の書き込みスタイルを含んでいる。
手動でアノテートしたデータセットに加えて、大きな生成言語モデルを使ってアノテートされた拡張バージョンをリリースします。
論文 参考訳(メタデータ) (2024-03-25T17:04:02Z) - Putting Context in Context: the Impact of Discussion Structure on Text
Classification [13.15873889847739]
本稿では,英語における姿勢検出のための大規模データセットに関する一連の実験を提案する。
異なる種類の文脈情報の寄与を評価する。
構造情報はテキスト分類には非常に有用であるが,特定の状況下でのみ有用であることを示す。
論文 参考訳(メタデータ) (2024-02-05T12:56:22Z) - Studying Socially Unacceptable Discourse Classification (SUD) through
different eyes: "Are we on the same page ?" [4.87717454493713]
まず、さまざまなオンラインソースから手書きの注釈付きテキストを多種多様に含む新しいコーパスを構築、提示する。
このグローバルコンテキストにより、SUD分類器の一般化能力をテストすることができる。
この観点から、異なるアノテーションのモダリティがSUD学習にどのように影響するかを分析することができる。
論文 参考訳(メタデータ) (2023-08-08T10:42:33Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - Provenance for Linguistic Corpora Through Nanopublications [0.22940141855172028]
計算言語学の研究は、新しいツールや方法論を訓練し、テストするためのテキストコーパスに依存している。
注釈付き言語情報が多く存在するが、これらのコーパスは重要な手作業なしでは相互運用できないことが多い。
本稿では、イベントアノテートコーパスのケーススタディと、ナノパブリケーションの形で、より相互運用可能な新しいデータ表現を作成することで、この問題に対処する。
論文 参考訳(メタデータ) (2020-06-11T11:30:30Z) - ORB: An Open Reading Benchmark for Comprehensive Evaluation of Machine
Reading Comprehension [53.037401638264235]
我々は,7種類の読解データセットの性能を報告する評価サーバORBを提案する。
評価サーバは、モデルのトレーニング方法に制限を課さないため、トレーニングパラダイムや表現学習の探索に適したテストベッドである。
論文 参考訳(メタデータ) (2019-12-29T07:27:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。