論文の概要: Co-DETECT: Collaborative Discovery of Edge Cases in Text Classification
- arxiv url: http://arxiv.org/abs/2507.05010v1
- Date: Mon, 07 Jul 2025 13:48:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.443535
- Title: Co-DETECT: Collaborative Discovery of Edge Cases in Text Classification
- Title(参考訳): Co-DETECT:テキスト分類におけるエッジケースの協調的発見
- Authors: Chenfei Xiong, Jingwei Ni, Yu Fan, Vilém Zouhar, Donya Rooein, Lorena Calvo-Bartolomé, Alexander Hoyle, Zhijing Jin, Mrinmaya Sachan, Markus Leippold, Dirk Hovy, Mennatallah El-Assady, Elliott Ash,
- Abstract要約: Co-DETECT (Collaborative Discovery of Edge Case in TExt ClassificaTion)は、新しい混合開始型アノテーションフレームワークである。
人間の専門知識と、大きな言語モデルでガイドされた自動アノテーションを統合する。
- 参考スコア(独自算出の注目度): 89.62851347390959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Co-DETECT (Collaborative Discovery of Edge cases in TExt ClassificaTion), a novel mixed-initiative annotation framework that integrates human expertise with automatic annotation guided by large language models (LLMs). Co-DETECT starts with an initial, sketch-level codebook and dataset provided by a domain expert, then leverages the LLM to annotate the data and identify edge cases that are not well described by the initial codebook. Specifically, Co-DETECT flags challenging examples, induces high-level, generalizable descriptions of edge cases, and assists user in incorporating edge case handling rules to improve the codebook. This iterative process enables more effective handling of nuanced phenomena through compact, generalizable annotation rules. Extensive user study, qualitative and quantitative analyses prove the effectiveness of Co-DETECT.
- Abstract(参考訳): 大規模言語モデル(LLM)でガイドされた自動アノテーションと人間の専門知識を統合する新しい混合開始アノテーションフレームワークであるCo-DETECT (Collaborative Discovery of Edge Case in TExt ClassificaTion)を紹介する。
Co-DETECTは、ドメインの専門家が提供した初期スケッチレベルのコードブックとデータセットから始まり、LLMを活用して、初期コードブックでよく説明されていないエッジケースをアノテートする。
特に、Co-DETECTは、挑戦的な例を示し、エッジケースの高レベルで一般化可能な記述を誘導し、コードブックを改善するためにエッジケースハンドリングルールをユーザを支援する。
この反復過程は、コンパクトで一般化可能なアノテーション規則を通じて、ニュアンス現象のより効率的な処理を可能にする。
大規模ユーザスタディ、質的、定量的分析により、Co-DETECTの有効性が証明された。
関連論文リスト
- Bridging Textual-Collaborative Gap through Semantic Codes for Sequential Recommendation [91.13055384151897]
CCFRecは、シーケンシャルレコメンデーションのための新しいコードベースのテキストおよび協調的セマンティックフュージョン法である。
ベクトル量子化手法を用いて,多視点テキスト埋め込みから細粒度セマンティックコードを生成する。
テキスト・コラボレーティブ・セマンティクスの融合をさらに促進するために,最適化戦略を導入する。
論文 参考訳(メタデータ) (2025-03-15T15:54:44Z) - DesCLIP: Robust Continual Adaptation via General Attribute Descriptions for Pretrained Vision-Language Models [13.917530818500481]
視覚言語モデル(VLM)の継続的な適応は、下流タスクやデータセットの拡張に漸進的に適応するために、モーダルな事前訓練された知識を活用することに焦点を当てている。
既存の研究はしばしば、一般的な知識と専門知識の潜伏した関係を見越して、下流のタスクで特定のクラステキストと視覚的特徴を結びつけることに焦点を当てている。
汎用属性(GA)記述を利用して,特定のクラスオブジェクトの理解を導くDesCLIPを提案する。
論文 参考訳(メタデータ) (2025-02-02T01:06:02Z) - Hierarchical Repository-Level Code Summarization for Business Applications Using Local LLMs [1.4932549821542682]
既存のメソッドは主に関数のような小さなコードユニットにフォーカスし、ファイルやパッケージのような大きなコードアーティファクトと競合する。
本稿では,ビジネスアプリケーションに適した,リポジトリレベルのコード要約のための2段階階層的アプローチを提案する。
論文 参考訳(メタデータ) (2025-01-14T05:48:27Z) - LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - Neural Entity Summarization with Joint Encoding and Weak Supervision [29.26714907483851]
知識グラフでは、実体はしばしば多くの三つの事実によって記述される。
既存の実体化ソリューションは、主に教師なしである。
本稿では,新しいニューラルモデルに基づく教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-01T00:14:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。