論文の概要: Let Guidelines Guide You: A Prescriptive Guideline-Centered Data Annotation Methodology
- arxiv url: http://arxiv.org/abs/2406.14099v3
- Date: Tue, 10 Dec 2024 14:05:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-11 14:34:05.577139
- Title: Let Guidelines Guide You: A Prescriptive Guideline-Centered Data Annotation Methodology
- Title(参考訳): Let Guidelines Guide You: A Prescriptive Guideline-Centered Data Annotation Methodology
- Authors: Federico Ruggeri, Eleonora Misino, Arianna Muti, Katerina Korre, Paolo Torroni, Alberto Barrón-Cedeño,
- Abstract要約: 本稿では,各データサンプルに関連付けられたガイドラインを報告するための新しいデータアノテーション手法を提案する。
提案手法は標準的な規範的アノテーション手法の3つの重要な制限に対処する。
GCAMは、複数のタスクでアノテーション付きデータの効率的な再利用を可能にする。
- 参考スコア(独自算出の注目度): 14.48549682361803
- License:
- Abstract: We introduce the Guideline-Centered Annotation Methodology (GCAM), a novel data annotation methodology designed to report the annotation guidelines associated with each data sample. Our approach addresses three key limitations of the standard prescriptive annotation methodology by reducing the information loss during annotation and ensuring adherence to guidelines. Furthermore, GCAM enables the efficient reuse of annotated data across multiple tasks. We evaluate GCAM in two ways: (i) through a human annotation study and (ii) an experimental evaluation with several machine learning models. Our results highlight the advantages of GCAM from multiple perspectives, demonstrating its potential to improve annotation quality and error analysis.
- Abstract(参考訳): 本稿では, ガイドライン中心アノテーション方法論 (GCAM) について紹介する。
提案手法は,アノテーション中の情報損失を低減し,ガイドラインの遵守を確保することで,標準的な規範的アノテーション方法論の3つの重要な制約に対処する。
さらに、GCAMは複数のタスクにまたがるアノテートデータの効率的な再利用を可能にする。
我々はGCAMを2つの方法で評価する。
(i)人間の注釈研究を通じて
(II)複数の機械学習モデルによる実験的評価。
本結果は,GCAMの利点を多面的に強調し,アノテーションの品質向上とエラー解析の可能性を示した。
関連論文リスト
- A review on discriminative self-supervised learning methods [6.24302896438145]
ラベルのないデータからロバストな特徴を抽出する手法として自己教師付き学習が登場した。
本稿では,コンピュータビジョン分野における自己教師型学習の差別的アプローチについて概説する。
論文 参考訳(メタデータ) (2024-05-08T11:15:20Z) - A review on data-driven constitutive laws for solids [0.0]
この記事では、法律を発見し、エンコードし、代理し、エミュレートするための最先端のデータ駆動技術を強調します。
我々の目標は、過去数十年で開発された幅広い方法論に組織化された分類を提供することである。
論文 参考訳(メタデータ) (2024-05-06T17:33:58Z) - Learning to Ground Instructional Articles in Videos through Narrations [50.3463147014498]
ナレーションされたハウツービデオにおける手続き的活動の段階をローカライズするためのアプローチを提案する。
本稿では,教科記事を含む言語知識ベース(wikiHow)からステップ記述を抽出する。
本モデルは,3つのモダリティをマッチングすることにより,プロシージャ記事のステップをハウツービデオに時間的に基礎付けることを学習する。
論文 参考訳(メタデータ) (2023-06-06T15:45:53Z) - A comprehensive review of automatic text summarization techniques:
method, data, evaluation and coding [1.9241821314180376]
本稿では,ATS(Automatic Text Summarization)システムに関する文献レビューを行う。
我々は、引用に基づくアプローチを検討し、それらが要約を生成するメカニズムによって導かれるATSに対する多様なアプローチを示す。
また、要約タスクに利用可能なデータセットの広範なレビューと、要約の品質を評価する方法についても紹介する。
論文 参考訳(メタデータ) (2023-01-04T19:20:18Z) - Chinese Discourse Annotation Reference Manual [9.367612782346207]
この文書は、中国語における修辞構造論(RST)の注釈に関する広範なガイドラインと例を提供している。
まず、RSTアノテーションのためのデータ準備のための前処理手順を紹介する。
第二に、テキストを初等談話単位(EDU)に分割するための統語的基準について議論する。
最後に、異なるジャンルにおける談話関係を定義し、区別する例を示す。
論文 参考訳(メタデータ) (2022-10-11T11:02:42Z) - Re-Examining Human Annotations for Interpretable NLP [80.81532239566992]
我々は、Interpretable NLPで広く使われている2つのデータセット上で、クラウドソースのウェブサイトを用いて制御実験を行う。
我々は,異なる資格レベルを満たす人材の募集から得られた注釈結果を比較した。
以上の結果から,アノテーションの品質は労働者の資格に高い影響を受けており,労働者は指示によって特定のアノテーションを提供するように指導することができることがわかった。
論文 参考訳(メタデータ) (2022-04-10T02:27:30Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Unsupervised Reference-Free Summary Quality Evaluation via Contrastive
Learning [66.30909748400023]
教師なしコントラスト学習により,参照要約を使わずに要約品質を評価することを提案する。
具体的には、BERTに基づく言語的品質と意味情報の両方をカバーする新しい指標を設計する。
ニューズルームとCNN/デイリーメールの実験では,新たな評価手法が参照サマリーを使わずに他の指標よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-05T05:04:14Z) - Summary-Source Proposition-level Alignment: Task, Datasets and
Supervised Baseline [94.0601799665342]
資料の参照要約における文のアライメントは,補助的な要約作業として有用であった。
本稿では,2つの重要な新機能を導入しながら,要約ソースアライメントを明示的なタスクとして確立することを提案する。
我々は提案レベルのアライメントのための新しいトレーニングデータセットを作成し、利用可能な要約評価データから自動的に抽出する。
教師なしアプローチよりも優れたアライメント品質を示す教師付き命題アライメントベースラインモデルを提案する。
論文 参考訳(メタデータ) (2020-09-01T17:27:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。