論文の概要: ACAT: A Collaborative Platform for Efficient Aspect-Based Sentiment Dataset Annotation
- arxiv url: http://arxiv.org/abs/2606.04189v1
- Date: Tue, 02 Jun 2026 20:16:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.368513
- Title: ACAT: A Collaborative Platform for Efficient Aspect-Based Sentiment Dataset Annotation
- Title(参考訳): ACAT: 効率的なアスペクトベースのセンチメントデータセットアノテーションのための協調プラットフォーム
- Authors: Ana-Maria Luisa Mocanu, Ciprian-Octavian Truica, Elena-Simona Apostol,
- Abstract要約: ACAT(Aspect-based sentiment analysis Collaborative Tool)は、4つのABSAシナリオをサポートするWebベースのプラットフォームである。
コアコントリビューションは、共同アノテーションを調整するETL(Extract, Transform, Load)パイプラインの自動化だ。
ACATは、すべてのタスクで31.58秒、生のIAAが0.78から0.86までの平均的なアノテーションタイムを達成している。
- 参考スコア(独自算出の注目度): 2.2798212772395616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aspect-Based Sentiment Analysis (ABSA) requires high-quality datasets to train reliable models. However, existing annotation tools treat output as flat files, leaving researchers to manually consolidate multi-annotator data, reconstruct relational structures, and compute reliability metrics through custom scripts. This paper introduces ACAT (Aspect-based sentiment analysis Collaborative Annotation Tool), a web-based platform natively supporting four ABSA workflows: (1) Aspect-Category Sentiment Analysis, (2) Clause-Level Segmentation, (3) Aspect-Term Sentiment Analysis with character-level position tracking, and (4) Aspect Sentiment Triplet Extraction with dual span offset preservation. Its core contribution is an automated Extract, Transform, Load (ETL) pipeline that aligns collaborative annotations and computes Inter-Annotator Agreement (IAA) metrics directly at export, yielding training-ready datasets. In a preliminary validation on 1,002 restaurant reviews with two annotators of differing expertise, ACAT achieves a median annotation time of 31.58 seconds and a raw IAA ranging from 0.78 to 0.86 across all tasks.
- Abstract(参考訳): Aspect-Based Sentiment Analysis (ABSA)は、信頼性のあるモデルをトレーニングするために高品質なデータセットを必要とする。
しかし、既存のアノテーションツールは出力をフラットファイルとして扱い、研究者は複数のアノテーションデータを手動で統合し、リレーショナル構造を再構築し、カスタムスクリプトを通じて信頼性メトリクスを計算する。
本稿では,(1)Aspect-Category Sentiment Analysis, (2) Clause-Level Segmentation, (3)Aspect-Term Sentiment Analysis with character-level position tracking, (4)Aspect Sentiment Triplet extract with dual offset storageという4つのABSAワークフローをネイティブにサポートするWebベースのプラットフォームであるACAT(Aspect-based sentiment analysis Collaborative Annotation Tool)を紹介する。
コアコントリビューションは、コラボレーティブアノテーションの整合と、エクスポート時のIAA(Inter-Annotator Agreement)メトリクスを直接計算して、トレーニング可能なデータセットを生成する、自動抽出、変換、ロード(ETL)パイプラインである。
異なる専門知識を持つ2つのアノテータによる1,002レストランレビューの予備検証では、ACATは31.58秒、生のIAAは0.78から0.86の範囲で、中央値は31.58秒である。
関連論文リスト
- SmartIterator: Visual Analytics Workflows for Supervising Unsupervised Data Grouping [0.0]
emphSmartIterator(SI)は、グループ化結果を一級分析対象として扱う視覚分析手法である。
emphIteraScope(IS)は、品質メトリックチャートとカラーエンコーディングを組み合わせたコーディネートされたビジュアルディスプレイであり、Sankeyスタイルのトランジションフローを埋め込んだ1Dグループと、HDBSCAN検出されたリカレントアーチタイプを埋め込んだ2Dグループである。
論文 参考訳(メタデータ) (2026-05-27T09:35:32Z) - SSP-based construction of evaluation-annotated data for fine-grained aspect-based sentiment analysis [0.0]
韓国評価注釈コーパスの構築について報告する。
感情や非感傷的言語パターンを含むeコマースレビューをカバーしています。
評価のために、KoBERTとKcBERTモデルはアノテーション付きデータセットでトレーニングされ、F1 0.88とF1 0.90の堅牢なパフォーマンスを示す。
論文 参考訳(メタデータ) (2026-05-08T08:52:37Z) - COVTrack++: Learning Open-Vocabulary Multi-Object Tracking from Continuous Videos via a Synergistic Paradigm [59.26203051651017]
C-TAOはOpen-Vocabulary Multi-Object Tracking (OVMOT)のための最初の連続アノテーション付きトレーニングセットである
フレームワークボトルネックに対するCOVTrack++は,3つのモジュールによる検出とアソシエーションの双方向相互機構を実現するための相乗的フレームワークである。
TAOの実験では、新しいTAAは検証とテストセットで35.4%、30.5%に達し、新しいAssocAは4.8%、新しいLocAは5.8%向上した。
論文 参考訳(メタデータ) (2026-03-25T07:20:27Z) - A2P-Vis: an Analyzer-to-Presenter Agentic Pipeline for Visual Insights Generation and Reporting [18.60614431401904]
A2P-Visは、生のデータセットを高品質なデータビジュアライゼーションレポートに変換する、2部構成のマルチエージェントパイプラインである。
Data Analyzerはプロファイリングを編成し、多様な視覚化方向を提案し、プロットコードを生成し、実行し、チェッカーで低品質のフィギュアをフィルタリングし、候補者の洞察を引き出す。
その後、プレゼンターはトピックを注文し、トップランクの洞察からグラフで構築された物語を作成し、正当化された遷移を書き、明確さと一貫性のために文書を改訂する。
論文 参考訳(メタデータ) (2025-12-26T18:02:12Z) - ABCD-LINK: Annotation Bootstrapping for Cross-Document Fine-Grained Links [57.514511353084565]
我々は、最高のパフォーマンスのアプローチを選択し、文書間リンクに注釈を付けるための新しいドメインに依存しないフレームワークを提案する。
当社のフレームワークを2つの異なるドメイン – ピアレビューとニュース – に適用しています。
結果として得られた新しいデータセットは、メディアフレーミングやピアレビューなど、数多くのクロスドキュメントタスクの基礎を築いた。
論文 参考訳(メタデータ) (2025-09-01T11:32:24Z) - Czech Dataset for Complex Aspect-Based Sentiment Analysis Tasks [0.7874708385247352]
本稿ではアスペクトベース感情分析(ABSA)のための新しいデータセットを提案する。
レストランドメインからの注釈付きレビューが手作業で3.1Kである。
教師なし学習に適したアノテーションを使わずに2400万のレビューを提供する。
論文 参考訳(メタデータ) (2025-08-11T16:03:28Z) - AIR: A Systematic Analysis of Annotations, Instructions, and Response Pairs in Preference Dataset [89.37514696019484]
嗜好学習は、大きな言語モデルと人間の価値の整合に不可欠である。
私たちの作業は、好みのデータセット設計をアドホックなスケーリングからコンポーネント対応の最適化にシフトします。
論文 参考訳(メタデータ) (2025-04-04T17:33:07Z) - Deep Content Understanding Toward Entity and Aspect Target Sentiment Analysis on Foundation Models [0.8602553195689513]
Entity-Aspect Sentiment Triplet extract (EASTE)は、Aspect-Based Sentiment Analysisタスクである。
本研究は,EASTEタスクにおける高性能化を目標とし,モデルサイズ,タイプ,適応技術がタスクパフォーマンスに与える影響について検討する。
最終的には、複雑な感情分析における詳細な洞察と最先端の成果を提供する。
論文 参考訳(メタデータ) (2024-07-04T16:48:14Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z) - Exploring and Evaluating Attributes, Values, and Structures for Entity
Alignment [100.19568734815732]
エンティティアライメント(EA)は、さまざまなKGから等価なエンティティをリンクすることで、リッチコンテンツの統合知識グラフ(KG)を構築することを目的としている。
属性・トリプルは重要なアライメント信号も提供できますが、まだ十分に調査されていません。
本稿では,属性値エンコーダを用いてKGをサブグラフに分割し,属性の様々なタイプを効率的にモデル化することを提案する。
論文 参考訳(メタデータ) (2020-10-07T08:03:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。