論文の概要: Authors Should Annotate
- arxiv url: http://arxiv.org/abs/2512.12976v1
- Date: Mon, 15 Dec 2025 04:45:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.533591
- Title: Authors Should Annotate
- Title(参考訳): 著者は注釈を書かなければならない
- Authors: Marcus Ma, Cole Johnson, Nolan Bridges, Jackson Trager, Georgios Chochlakis, Shrikanth Narayanan,
- Abstract要約: 著者ラベル付けは、ドキュメントの作者自身が作成時にデータに注釈を付けるアノテーション技術である。
プロダクトレコメンデーションに関連する主観的な機能のために,著者ラベルシステムを展開するために,1万人以上のユーザが参加する商用ボットと連携する。
本システムは,タスク関連クエリを特定し,オンザフライラベリング質問を生成し,著者の回答をリアルタイムで記録する。
- 参考スコア(独自算出の注目度): 33.31119791459376
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The status quo for labeling text is third-party annotation, but there are many cases where information directly from the document's source would be preferable over a third-person proxy, especially for egocentric features like sentiment and belief. We introduce author labeling, an annotation technique where the writer of the document itself annotates the data at the moment of creation. We collaborate with a commercial chatbot with over 10,000 users to deploy an author labeling annotation system for subjective features related to product recommendation. This system identifies task-relevant queries, generates on-the-fly labeling questions, and records authors' answers in real time. We train and deploy an online-learning model architecture for product recommendation that continuously improves from author labeling and find it achieved a 534% increase in click-through rate compared to an industry advertising baseline running concurrently. We then compare the quality and practicality of author labeling to three traditional annotation approaches for sentiment analysis and find author labeling to be higher quality, faster to acquire, and cheaper. These findings reinforce existing literature that annotations, especially for egocentric and subjective beliefs, are significantly higher quality when labeled by the author rather than a third party. To facilitate broader scientific adoption, we release an author labeling service for the research community at academic.echollm.io.
- Abstract(参考訳): テキストをラベル付けするためのステータスクオは、サードパーティのアノテーションであるが、特に感情や信念のような自我中心的な特徴のために、文書のソースから直接の情報が第三者のプロキシよりも好まれるケースが多い。
本稿では、作成時に文書の作者自身がデータに注釈を付けるアノテーション技術である著者ラベリングを紹介する。
我々は,製品レコメンデーションに関連する主観的機能に対して,著者ラベル付けアノテーションシステムを展開するために,1万人以上のユーザと商用チャットボットと連携する。
本システムは,タスク関連クエリを特定し,オンザフライラベリング質問を生成し,著者の回答をリアルタイムで記録する。
著者のラベル付けから継続的に改善されるオンライン学習モデルアーキテクチャをトレーニングし、製品レコメンデーションのためにデプロイし、業界広告ベースラインが同時に実行されているのに対して、クリックスルーレートは534%向上した。
次に、著者ラベルの質と実用性を、感情分析のための従来の3つのアノテーションアプローチと比較し、著者ラベルの質がより高く、より速く、より安価であることを示す。
これらの知見は、特に自我中心的および主観的信念に対するアノテーションは、第三者よりも著者によってラベル付けされた場合、著しく高品質である、という既存の文献を補強する。
より広範な科学的採用を促進するため,学術研究コミュニティ向けの著者ラベリングサービス「echollm.io」をリリースする。
関連論文リスト
- Can Third-parties Read Our Emotions? [6.619315067108542]
本研究では,サードパーティのアノテーションと第三者の感情ラベルを直接比較する感情認識タスクの実験を行う。
その結果,サードパーティのアノテーションには大きな制限が認められた。
また,第1の著者と第3のアノテータとの人口統計学的類似性により,アノテーション性能が向上することを見出した。
論文 参考訳(メタデータ) (2025-04-25T19:52:21Z) - Efficient Online Crowdsourcing with Complex Annotations [15.063652909543887]
本稿では,オンラインのクラウドソーシング環境において機能する汎用アノテーション(バウンディングボックスや分類パスなど)の新たなアプローチを提案する。
我々は、ラベルの予測平均類似性が、報告されたラベルの正確性において線形であることを証明した。
これにより、報告されたラベルの精度を幅広いシナリオで推測できる。
論文 参考訳(メタデータ) (2024-01-25T22:38:03Z) - Cracking Double-Blind Review: Authorship Attribution with Deep Learning [43.483063713471935]
本稿では、匿名の原稿を著者に属性付けるトランスフォーマーベースのニューラルネットワークアーキテクチャを提案する。
我々は、arXivで公開されているすべての研究論文を200万冊以上の原稿に活用する。
本手法は, 論文の最大73%を正解する, 前代未聞の著者帰属精度を実現する。
論文 参考訳(メタデータ) (2022-11-14T15:50:24Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - LG4AV: Combining Language Models and Graph Neural Networks for Author
Verification [0.11421942894219898]
本稿では,著者検証のための言語モデルとグラフニューラルネットワークを組み合わせたLG4AVを提案する。
トレーニング済みのトランスフォーマーアーキテクチャで利用可能なテキストを直接供給することで、我々のモデルは手作りのスタイル幾何学的特徴を一切必要としない。
我々のモデルは、検証プロセスに関して意味のある著者間の関係から恩恵を受けることができる。
論文 参考訳(メタデータ) (2021-09-03T12:45:28Z) - Abstractive Opinion Tagging [65.47649273721679]
eコマースでは、意見タグは、アイテムのレビューの特徴を反映したEコマースプラットフォームが提供するタグのランクリストを指す。
意見タグを生成するための現在のメカニズムは、手作業またはラベル付け方法に依存します。
AOT-Net と呼ばれる抽象的な意見タグフレームワークを提案し、多数のレビューからランク付けされた意見タグのリストを生成します。
論文 参考訳(メタデータ) (2021-01-18T05:08:15Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Re-ranking for Writer Identification and Writer Retrieval [8.53463698903858]
我々は,k-相反的近傍関係に基づく再ランクステップが,著者識別に有利であることを示す。
これらの相互関係は、もともと提案されたような新しいベクトルにエンコードするか、クエリ拡張の観点でそれらを統合するかの2つの方法で利用します。
論文 参考訳(メタデータ) (2020-07-14T15:21:17Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。