論文の概要: HalluCiteChecker: A Lightweight Toolkit for Hallucinated Citation Detection and Verification in the Era of AI Scientists
- arxiv url: http://arxiv.org/abs/2604.26835v1
- Date: Wed, 29 Apr 2026 16:01:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.478749
- Title: HalluCiteChecker: A Lightweight Toolkit for Hallucinated Citation Detection and Verification in the Era of AI Scientists
- Title(参考訳): HalluCiteChecker:AI科学者の時代におけるハロシンクレーション検出と検証のための軽量ツールキット
- Authors: Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe,
- Abstract要約: HalluCiteCheckerは、科学論文の幻覚的引用を検出し検証するためのツールキットである。
私たちのコードはGitHubのApache 2.0ライセンスでリリースされており、PyPI経由でインストール可能なパッケージとして配布されています。
- 参考スコア(独自算出の注目度): 58.87954687016989
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce HalluCiteChecker, a toolkit for detecting and verifying hallucinated citations in scientific papers. While AI assistant technologies have transformed the academic writing process, including citation recommendation, they have also led to the emergence of hallucinated citations that do not correspond to any existing work. Such citations not only undermine the credibility of scientific papers but also impose an additional burden on reviewers and authors, who must manually verify their validity during the review process. In this study, we formalize hallucinated citation detection as an NLP task and provide a corresponding toolkit as a practical foundation for addressing this problem. Our package is lightweight and can perform verification in seconds on a standard laptop. It can also be executed entirely offline and runs efficiently using only CPUs. We hope that HalluCiteChecker will help reduce reviewer workload and support organizers by enabling systematic pre-review and publication checks. Our code is released under the Apache 2.0 license on GitHub and is distributed as an installable package via PyPI. A demonstration video is available on YouTube.
- Abstract(参考訳): 本稿では,科学論文における幻覚励起の検出と検証のためのツールキットであるHaluCiteCheckerを紹介する。
AIアシスタント技術は、引用レコメンデーションを含む学術的な執筆プロセスを変えてきたが、既存の作品に対応しない幻覚的引用の出現につながった。
このような引用は、科学論文の信頼性を損なうだけでなく、レビュープロセス中に手動で妥当性を検証する必要のあるレビュアーや著者にさらなる負担を課す。
本研究では,NLPタスクとして幻覚励起検出を形式化し,この問題に対処するための実用的な基礎として対応するツールキットを提供する。
私たちのパッケージは軽量で、標準のラップトップで数秒で検証を実行できます。
完全にオフラインでも実行でき、CPUのみを使用して効率的に実行できる。
HalluCiteCheckerは、体系的な事前レビューとパブリッシュチェックを可能にすることで、レビュアの作業量を削減し、オーガナイザをサポートすることを願っています。
私たちのコードはGitHubのApache 2.0ライセンスでリリースされており、PyPI経由でインストール可能なパッケージとして配布されています。
デモビデオはYouTubeで公開されている。
関連論文リスト
- When AI reviews science: Can we trust the referee? [73.47745294608072]
私たちは、トレーニングとデータ検索、デスクレビュー、深いレビュー、反論、システムレベルといった、レビューライフサイクル全体のアタックをマップします。
評価スコアに高名度フレーミング, 断定力, 反抗薬効, 文脈中毒の因果効果を分離するために, 2つの高度なLCMベースの審判を用いた。
論文 参考訳(メタデータ) (2026-04-26T08:03:32Z) - Peerispect: Claim Verification in Scientific Peer Reviews [12.340116689292726]
Peerispectは、ピアレビューでクレームレベルの検証を運用するインタラクティブシステムである。
結果は、論文のエビデンスを直接ハイライトするビジュアルインターフェースを通じて提示される。
論文 参考訳(メタデータ) (2026-04-19T23:40:26Z) - sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing [0.0]
現在、科学は品質保証に2つの選択肢を提供しているが、どちらも不十分である。
論文自体を測る第3の選択肢を提案する。
sciwrite-lintは、研究者のマシンで完全に動作する科学写本のためのオープンソースライブラリである。
arXivとbioRxivの未確認論文30件について, 誤り注入とLCM適応偽陽性解析を用いてパイプラインの評価を行った。
論文 参考訳(メタデータ) (2026-04-09T17:46:44Z) - FactReview: Evidence-Grounded Reviews with Literature Positioning and Execution-Based Claim Verification [57.196748998757954]
本稿では,クレーム抽出,文献位置決定,実行に基づくクレーム検証を組み合わせたエビデンスベースレビューシステムであるFactReviewを紹介する。
FactReviewは論文を提出すると、主要なクレームを特定し、その結果を報告し、論文の技術的な位置を明らかにするために近くの作業を取り出し、コードが利用可能であれば、リリースされたリポジトリを実行する。
その後、簡潔なレビューと、主要な請求を5つのラベルのうち1つに割り当てるエビデンスレポートを生成する。
論文 参考訳(メタデータ) (2026-04-05T11:45:22Z) - CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era [51.63024682584688]
大規模言語モデル (LLM) は新たなリスクを導入している。
本稿では,科学文献における幻覚的引用のための総合的なベンチマークおよび検出フレームワークについて紹介する。
我々のフレームワークは、精度と解釈可能性の両方において、先行手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-26T19:17:39Z) - CheckIfExist: Detecting Citation Hallucinations in the Era of AI-Generated Content [0.0]
CheckIfExistは学術データベースに対する参照の即時検証を提供するオープンソースツールである。
提案手法は,文字列類似性アルゴリズムを用いて多次元マッチング信頼度を求めることで,このギャップを埋める。
このシステムはBibエントリの単一参照検証とバッチ処理の両方を統一インターフェースでサポートする。
論文 参考訳(メタデータ) (2026-01-27T20:26:24Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - ACM-CR: A Manually Annotated Test Collection for Citation Recommendation [6.599344783327053]
扇動勧告は、研究者が引用する関連論文を探す過程を支援することを目的としている。
このタスクの既存のテストコレクションは、解析されたPDF文書から自動的に構築されるため、ノイズが多く信頼できない。
我々は、引用レコメンデーションのために、手動で手動で公開されているテストコレクションを作成するための継続的な取り組みを提示する。
論文 参考訳(メタデータ) (2021-08-17T11:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。