論文の概要: Guidelines for the Creation of an Annotated Corpus
- arxiv url: http://arxiv.org/abs/2601.13353v1
- Date: Mon, 19 Jan 2026 19:42:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.038952
- Title: Guidelines for the Creation of an Annotated Corpus
- Title(参考訳): 注釈付きコーパスの作成ガイドライン
- Authors: Bahdja Boudoua, Nadia Guiffant, Mathieu Roche, Maguelonne Teisseire, Annelise Tran,
- Abstract要約: この文書は、UMR TETISメンバーと科学文献からのフィードバックに基づいている。
データの保存、共有、バリデーションだけでなく、方法論的な側面もカバーしている。
- 参考スコア(独自算出の注目度): 2.4684207963111455
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This document, based on feedback from UMR TETIS members and the scientific literature, provides a generic methodology for creating annotation guidelines and annotated textual datasets (corpora). It covers methodological aspects, as well as storage, sharing, and valorization of the data. It includes definitions and examples to clearly illustrate each step of the process, thus providing a comprehensive framework to support the creation and use of corpora in various research contexts.
- Abstract(参考訳): この文書は、UMR TETISメンバーと科学文献からのフィードバックに基づいて、アノテーションガイドラインと注釈付きテキストデータセット(コーパス)を作成するための一般的な方法論を提供する。
データの保存、共有、バリデーションだけでなく、方法論的な側面もカバーしている。
プロセスの各ステップを明確に説明するための定義と例が含まれており、様々な研究文脈におけるコーパスの作成と使用をサポートする包括的なフレームワークを提供する。
関連論文リスト
- DREAM: Document Reconstruction via End-to-end Autoregressive Model [53.51754520966657]
本稿では、文書再構成に特化した革新的な自己回帰モデルについて述べる。
文書再構成タスクの標準化定義を確立し,文書類似度基準(DSM)とDocRec1Kデータセットを導入し,タスクの性能を評価する。
論文 参考訳(メタデータ) (2025-07-08T09:24:07Z) - Concept Navigation and Classification via Open-Source Large Language Model Processing [0.0]
本稿では,オープンソースのLarge Language Models (LLMs) を用いたテキストデータから潜在構造を検出・分類するための新しい手法を提案する。
提案手法は,自動要約とループ内検証を組み合わせることで,構造同定の精度と解釈性を向上させる。
論文 参考訳(メタデータ) (2025-02-07T08:42:34Z) - A Rhetorical Relations-Based Framework for Tailored Multimedia Document Summarization [0.0]
本稿では,マルチメディア文書要約のための新しいフレームワークを提案する。
このフレームワークは文書の固有の構造を利用して、一貫性と簡潔な要約を作成できる。
重み付けアルゴリズムを用いて文書単位に重み付けを行い、関連コンテンツの効果的なランク付けと選択を可能にする。
論文 参考訳(メタデータ) (2024-12-26T09:29:59Z) - Re3: A Holistic Framework and Dataset for Modeling Collaborative Document Revision [62.12545440385489]
共同文書リビジョンを共同で分析するためのフレームワークであるRe3を紹介する。
本稿では,Re3-Sciについて紹介する。Re3-Sciは,その行動と意図に応じて手動でラベル付けされた科学的論文の大規模なコーパスである。
我々は,新しいデータを用いて,学術領域における共同文書改訂に関する実証的研究を行った。
論文 参考訳(メタデータ) (2024-05-31T21:19:09Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - A comprehensive review of automatic text summarization techniques:
method, data, evaluation and coding [1.9241821314180376]
本稿では,ATS(Automatic Text Summarization)システムに関する文献レビューを行う。
我々は、引用に基づくアプローチを検討し、それらが要約を生成するメカニズムによって導かれるATSに対する多様なアプローチを示す。
また、要約タスクに利用可能なデータセットの広範なレビューと、要約の品質を評価する方法についても紹介する。
論文 参考訳(メタデータ) (2023-01-04T19:20:18Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Summarizing Text on Any Aspects: A Knowledge-Informed Weakly-Supervised
Approach [89.56158561087209]
文書に関連する任意の側面を要約する。
監視データがないため、我々は新しい弱い監督構築法とアスペクト・モデリング・スキームを開発した。
実験により,本手法は実文書と合成文書の両方を要約することで,性能の向上を図っている。
論文 参考訳(メタデータ) (2020-10-14T03:20:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。