論文の概要: GitSearch: Enhancing Community Notes Generation with Gap-Informed Targeted Search
- arxiv url: http://arxiv.org/abs/2602.08945v1
- Date: Mon, 09 Feb 2026 17:42:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.403113
- Title: GitSearch: Enhancing Community Notes Generation with Gap-Informed Targeted Search
- Title(参考訳): GitSearch: ギャップインフォームされたターゲット検索でコミュニティノートの生成を促進する
- Authors: Sahajpreet Singh, Kokil Jaidka, Min-Yen Kan,
- Abstract要約: 人間の知覚する品質ギャップを第一級信号として扱うフレームワークであるGitSearchを紹介します。
GitSearchには3段階のパイプラインがあり、情報不足を特定し、それを解決するためにリアルタイムにターゲットとするWeb検索を実行し、プラットフォーム準拠のノートを合成する。
GitSearchは99%のカバレッジを実現しており、最先端のカバレッジをほぼ倍増しています。
- 参考スコア(独自算出の注目度): 31.919509718762885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Community-based moderation offers a scalable alternative to centralized fact-checking, yet it faces significant structural challenges, and existing AI-based methods fail in "cold start" scenarios. To tackle these challenges, we introduce GitSearch (Gap-Informed Targeted Search), a framework that treats human-perceived quality gaps, such as missing context, etc., as first-class signals. GitSearch has a three-stage pipeline: identifying information deficits, executing real-time targeted web-retrieval to resolve them, and synthesizing platform-compliant notes. To facilitate evaluation, we present PolBench, a benchmark of 78,698 U.S. political tweets with their associated Community Notes. We find GitSearch achieves 99% coverage, almost doubling coverage over the state-of-the-art. GitSearch surpasses human-authored helpful notes with a 69% win rate and superior helpfulness scores (3.87 vs. 3.36), demonstrating retrieval effectiveness that balanced the trade-off between scale and quality.
- Abstract(参考訳): コミュニティベースのモデレーションは、集中的なファクトチェックに代わるスケーラブルな代替手段を提供するが、大きな構造上の課題に直面し、既存のAIベースのメソッドは“コールドスタート”シナリオで失敗する。
これらの課題に対処するため、第1級信号としてGitSearch(Gap-Informed Targeted Search)を導入しました。
GitSearchには3段階のパイプラインがあり、情報不足を特定し、それを解決するためにリアルタイムにターゲットとするWeb検索を実行し、プラットフォーム準拠のノートを合成する。
評価を容易にするため、米国政治ツイート78,698件を関連するコミュニティノートでベンチマークしたPollBenchを紹介する。
GitSearchは99%のカバレッジを実現しており、最先端のカバレッジをほぼ倍増しています。
GitSearchは、69%の勝利率と優れた有効性スコア(3.87 vs. 3.36)で、人間によって書かれた有用なノートを超え、スケールと品質のトレードオフをバランスさせる検索の有効性を示している。
関連論文リスト
- Improving Diffusion Language Model Decoding through Joint Search in Generation Order and Token Space [110.80564213032729]
拡散言語モデル(DLM)は、多くの可能なデコード軌道を探索できる順序に依存しない生成を提供する。
生成順序とトークン値を共同で検索することで,この空間を探索する。
論文 参考訳(メタデータ) (2026-01-28T07:55:07Z) - BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent [74.10138164281618]
BrowseComp-Plus(BrowseComp-Plus)は、BrowseCompから派生したベンチマークである。
このベンチマークは、ディープリサーチエージェントと検索方法の総合的な評価とアンタングル解析を可能にする。
論文 参考訳(メタデータ) (2025-08-08T17:55:11Z) - GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search [5.195873909474138]
埋め込みベースのテキスト検索x2013$retrieval from corporax2013$は、ディープラーニングを実現する強力なメソッドステートとして登場した。
しかし、埋め込みベースの検索は、悪意のあるコンテンツを宣伝する検索エンジンの敵に受け入れられる可能性がある。
論文 参考訳(メタデータ) (2024-12-30T13:49:28Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [70.45113777449373]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
既存のアルゴリズムを比較し、より良いアルゴリズムを開発する上で重要な課題は、公開された金標準データの欠如である。
研究コミュニティにリリースした類似度スコアの新しいデータセットを収集します。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - A Study of the Quality of Wikidata [0.7449724123186383]
Wikidataで低品質な文を検出し解析するフレームワークを開発した。
本研究は,Wikidataコミュニティによるデータ品質向上に向けた継続的な取り組みを補完するものである。
論文 参考訳(メタデータ) (2021-07-01T00:19:02Z) - Exploring Visual Context for Weakly Supervised Person Search [155.46727990750227]
人探索は、歩行者の検出と人物の再識別を共同で扱う、困難なタスクとして最近登場した。
既存のアプローチは、バウンディングボックスとIDアノテーションの両方が利用可能な完全に教師付き設定に従っている。
本稿では,ボックスアノテーションのみを用いた弱教師付き人物検索について実験的に考察する。
論文 参考訳(メタデータ) (2021-06-19T14:47:13Z) - Automated Mapping of Vulnerability Advisories onto their Fix Commits in
Open Source Repositories [7.629717457706326]
実践経験と機械学習(ML)を組み合わせたアプローチを提案する。
アドバイザリから脆弱性に関する鍵情報を含むアドバイザリレコードを抽出する。
影響を受けるプロジェクトのソースコードリポジトリから、候補となる修正コミットのサブセットを取得する。
論文 参考訳(メタデータ) (2021-03-24T17:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。