論文の概要: AIANO: Enhancing Information Retrieval with AI-Augmented Annotation
- arxiv url: http://arxiv.org/abs/2602.04579v1
- Date: Wed, 04 Feb 2026 14:05:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.560381
- Title: AIANO: Enhancing Information Retrieval with AI-Augmented Annotation
- Title(参考訳): AIANO:AI拡張アノテーションによる情報検索の強化
- Authors: Sameh Khattab, Marie Bauer, Lukas Heine, Till Rostalski, Jens Kleesiek, Julian Friedrich,
- Abstract要約: オフザシェルフツールは、アノテーションプロセスが複雑で非効率になる。
我々はAI拡張アノテーションツールであるAIANOを開発し、人間の専門知識とLLM支援を密に統合した。
AIANOのAI強化アプローチは、情報検索タスクのためのデータセット作成を加速し、強化する。
- 参考スコア(独自算出の注目度): 5.257471991948221
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) has rapidly increased the need for high-quality, curated information retrieval datasets. These datasets, however, are currently created with off-the-shelf annotation tools that make the annotation process complex and inefficient. To streamline this process, we developed a specialized annotation tool - AIANO. By adopting an AI-augmented annotation workflow that tightly integrates human expertise with LLM assistance, AIANO enables annotators to leverage AI suggestions while retaining full control over annotation decisions. In a within-subject user study ($n = 15$), participants created question-answering datasets using both a baseline tool and AIANO. AIANO nearly doubled annotation speed compared to the baseline while being easier to use and improving retrieval accuracy. These results demonstrate that AIANO's AI-augmented approach accelerates and enhances dataset creation for information retrieval tasks, advancing annotation capabilities in retrieval-intensive domains.
- Abstract(参考訳): LLM(Large Language Models)とRAG(Retrieval-Augmented Generation)の台頭は、高品質でキュレートされた情報検索データセットの必要性を急速に高めている。
しかし、これらのデータセットは現在、アノテーションプロセスが複雑で非効率になるように、既製のアノテーションツールで作成されています。
このプロセスを合理化するため、私たちはAIANOという特殊なアノテーションツールを開発しました。
AI拡張されたアノテーションワークフローを採用して、人間の専門知識をLLMアシストと密に統合することにより、AIANOは、アノテーション決定を完全にコントロールしながら、AI提案を活用することができる。
参加者はベースラインツールとAIANOの両方を使用して質問回答データセットを作成しました。
AIANOはベースラインに比べてアノテーションの速度をほぼ倍にし、使いやすく、精度も向上した。
これらの結果から,AI強化アプローチは情報検索タスクのデータセット作成を加速し,強化し,検索集約領域におけるアノテーション機能の向上を図っている。
関連論文リスト
- AI-Boosted Video Annotation: Assessing the Process Enhancement [0.4893345190925178]
この研究は、アノテーションプロセスの実践的意味、AIコンポーネントの統合、そしてその成果の評価を掘り下げている。
Label Studio と AI を利用したゼロショット事前アノテーションを用いたシングルイテレーション方式を実装した。
また,類似のアノテーションを持つアノテーションの70%に対して,アノテーション時間を35%短縮した。
論文 参考訳(メタデータ) (2025-10-20T16:10:11Z) - Efficacy of AI RAG Tools for Complex Information Extraction and Data Annotation Tasks: A Case Study Using Banks Public Disclosures [0.0]
我々は、何千ページもの公開公開文書の複雑なマルチパート基準で、既存の、挑戦的な実世界のアノテーションタスクを再現する。
完全なタスクに外挿すると、人間のみのアプローチに比べて最大268時間節約できることがわかった。
論文 参考訳(メタデータ) (2025-07-28T22:06:11Z) - DeepNote: Note-Centric Deep Retrieval-Augmented Generation [72.70046559930555]
Retrieval-Augmented Generation (RAG)は質問応答のための大規模言語モデル(LLM)における事実誤りと幻覚を緩和する
我々は、ノート中心の適応検索により、知識ソースの奥深くで堅牢な探索を実現する適応RAGフレームワークであるDeepNoteを開発した。
論文 参考訳(メタデータ) (2024-10-11T14:03:29Z) - AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning [93.96463520716759]
大規模言語モデル(LLM)エージェントは、精度と幻覚を高めるために外部ツールと知識を活用する際、印象的な能力を示した。
本稿では、LLMエージェントを最適化して提供されたツールを効果的に活用し、与えられたタスクのパフォーマンスを向上させる新しい自動化フレームワークであるAvaTaRを紹介する。
論文 参考訳(メタデータ) (2024-06-17T04:20:02Z) - Active Learning for Abstractive Text Summarization [50.79416783266641]
本稿では,抽象テキスト要約におけるアクティブラーニングのための最初の効果的なクエリ戦略を提案する。
ALアノテーションにおける私たちの戦略は、ROUGEと一貫性スコアの点からモデル性能を向上させるのに役立ちます。
論文 参考訳(メタデータ) (2023-01-09T10:33:14Z) - Gradient Imitation Reinforcement Learning for General Low-Resource
Information Extraction [80.64518530825801]
本研究では,ラベル付きデータに対する勾配降下方向を模倣するために擬似ラベル付きデータを奨励するグラディエント強化学習法(GIRL)を開発した。
GIRLを利用して、低リソース設定ですべてのIEサブタスク(エンティティ認識、関係抽出、イベント抽出)を解決します。
論文 参考訳(メタデータ) (2022-11-11T05:37:19Z) - Entity Aware Syntax Tree Based Data Augmentation for Natural Language
Understanding [5.02493891738617]
本研究では,木構造,エンティティ・アウェア・シンタクス・ツリー (EAST) を応用した新しいNLPデータ拡張手法を提案する。
我々のEADA技術は、少量の注釈付きデータからEASTを自動的に構築し、インテント検出とスロットフィリングのための多数のトレーニングインスタンスを生成する。
4つのデータセットに対する実験結果から,提案手法は,精度と一般化能力の両方の観点から,既存のデータ拡張手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2022-09-06T07:34:10Z) - LiDAR dataset distillation within bayesian active learning framework:
Understanding the effect of data augmentation [63.20765930558542]
アクティブラーニング(AL)は、アノテーションコストとデータセットサイズの削減に対処するため、最近再び注目されている。
本稿では,大規模なセマンティックKITTIデータセットの1/4分の1でALベースのデータセット蒸留を原理的に評価する。
我々は、選択したデータセット構成からのサンプルの60%のみを使用して、データ拡張が完全なデータセット精度を達成することを観察した。
論文 参考訳(メタデータ) (2022-02-06T00:04:21Z) - Assisted Text Annotation Using Active Learning to Achieve High Quality
with Little Effort [9.379650501033465]
研究者は、手動の注釈だけで、大規模で高品質な注釈付きデータセットを作成できるツールを提案する。
我々は、アクティブラーニング(AL)アプローチと事前訓練された言語モデルを組み合わせて、アノテーションカテゴリを半自動で識別する。
予備的な結果から,ALを用いることで,複雑なフレームや微妙なフレームを正しく分類するアノテーションの数が大幅に削減されることがわかった。
論文 参考訳(メタデータ) (2021-12-15T13:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。