論文の概要: How unique are hallucinated citations offered by generative Artificial Intelligence models?
- arxiv url: http://arxiv.org/abs/2604.16407v1
- Date: Tue, 31 Mar 2026 21:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.971184
- Title: How unique are hallucinated citations offered by generative Artificial Intelligence models?
- Title(参考訳): 生成人工知能モデルによる幻覚的引用は、どの程度ユニークか?
- Authors: Dirk HR Spennemann,
- Abstract要約: 本稿では,生成型AIがハロゲン化された学術文献を生成・伝播する方法について検討する。
ベン・ウィリアムソンとネッリ・ピアトエヴァによる「教育のガバナンスとデータフィケーション」の反復的な引用に焦点を当てている。
これは、幻覚的引用はランダムな発明ではなく、実際の著者、雑誌、日付、キーワードのパターン化された組換えであることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper investigates how generative AI produces and propagates hallucinated academic references, focusing on the recurring non-existent citation 'Education Governance and Datafication' attributed to Ben Williamson and Nelli Piattoeva. Drawing on 137 accessible source papers identified through Google Scholar and Google searches, the study analyses the structure, recurrence, and onward citation of this phantom reference. It shows that hallucinated citations are not random inventions but patterned recombinations of real authors, journals, dates, and keywords, with duplication occurring in nearly 30% of cases. The paper also reports a structured interrogation of ChatGPT 5-mini about how it generates citations and finds that, absent verification, the model reconstructs plausible references from learned patterns rather than factual recall. Finally, ten AI-generated essays on datafication and school governance were examined: while most references were genuine or partly accurate, 9.2% remained hallucinated, including an exact match to the most common phantom citation. The findings highlight ongoing risks to academic integrity and show that web-enabled AI still does not fully eliminate fabricated references.
- Abstract(参考訳): 本稿では,Ben Williamson と Nelli Piattoeva による非存在的引用 "教育ガバナンスとデータフィケーション" に焦点をあてた。
この研究は、Google ScholarとGoogle検索で特定された137のアクセス可能なソース資料に基づいて、このファントム参照の構造、再発、およびその後の引用を分析した。
これは、幻覚的引用はランダムな発明ではなく、実際の著者、雑誌、日付、キーワードのパターン化された組換えであり、重複はおよそ30%のケースで起こることを示している。
また,ChatGPT 5-miniの引用生成方法に関する構造化された尋問を報告し,検証の欠如により,実際のリコールではなく,学習パターンからの妥当な参照を再構成することを確認した。
最後に、データフィケーションと学校のガバナンスに関する10のAI生成エッセイが調査され、ほとんどの文献は本物か部分的に正確であったものの、9.2%は幻想的な引用と正確に一致していた。
この発見は、学術的完全性に対する継続的なリスクを強調し、Web対応AIが依然として製造された参照を完全に排除していないことを示す。
関連論文リスト
- CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era [51.63024682584688]
大規模言語モデル (LLM) は新たなリスクを導入している。
本稿では,科学文献における幻覚的引用のための総合的なベンチマークおよび検出フレームワークについて紹介する。
我々のフレームワークは、精度と解釈可能性の両方において、先行手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-26T19:17:39Z) - Compound Deception in Elite Peer Review: A Failure Mode Taxonomy of 100 Fabricated Citations at NeurIPS 2025 [0.0]
大規模言語モデル (LLM) は学術的著作においてますます使われてきているが、それらが存在しない情報源への引用を生成することで、しばしば幻覚を引き起こす。
本研究は,2025年ニューラル情報処理システム学会が受理した論文に現れる100個のAI生成幻覚励起を解析する。
1紙あたり3-5人の専門家によるレビューにもかかわらず、これらの引用は検出を回避し、53の論文に現れた。
論文 参考訳(メタデータ) (2026-02-05T17:43:35Z) - The 17% Gap: Quantifying Epistemic Decay in AI-Assisted Survey Papers [0.0]
『廃紙』は既知の人工物であるが、有効な引用鎖の系統的な劣化はいまだに不明である。
我々は,2024年9月から2026年1月までに発行された人工知能に関する50の最近の調査論文の法医学的な監査を行った。
我々は、攻撃的な法医学的回復にもかかわらず、いかなるデジタルオブジェクトにも解決できない、永続的な17.0%のファントムレートを検出する。
論文 参考訳(メタデータ) (2026-01-24T12:00:55Z) - Hallucinate or Memorize? The Two Sides of Probabilistic Learning in Large Language Models [0.0]
大規模言語モデル(LLM)は、自然言語理解からコード生成に至るまで、幅広いタスクにますます適用されてきた。
引用の推薦にも使われてきたが、現存しない論文の幻覚は依然として大きな問題である。
この研究は、LLMがレコードを正しく生成する能力は、基礎となる知識が生成されるか記憶されるかに依存すると仮定する。
論文 参考訳(メタデータ) (2025-11-12T01:29:12Z) - Hallucinations in Bibliographic Recommendation: Citation Frequency as a Proxy for Training Data Redundancy [0.0]
大型幻覚モデル (LLMs) は幅広いタスクに適用されてきている。
この研究は、LLMが情報を正しく生成する能力は、基礎となる知識が生成されるか記憶されるかに依存すると仮定する。
論文 参考訳(メタデータ) (2025-10-29T10:51:35Z) - Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models [44.31597857713689]
最初の段階でActive Indexingを導入し、一般化可能なソースアンコールバインディングを作成します。
Qwen-2.5-7B&3Bの実験は、アクティブインデックスがパッシブインデックスのベースラインを一貫して上回っていることを示している。
内部の引用は、モデルを検索ノイズに対してより堅牢にすることで、外部の引用を補完する。
論文 参考訳(メタデータ) (2025-06-21T04:48:05Z) - Guarding against artificial intelligence--hallucinated citations: the case for full-text reference deposit [0.0]
ジャーナルは、著者が引用されたソースの完全なテキストと原稿を提出する必要がある。
この解決策は、著者や編集者の一部に限定的な追加作業を必要とする一方で、幻覚された参照に対して効果的にジャーナリズムを免疫する。
論文 参考訳(メタデータ) (2025-03-25T17:12:38Z) - Improving Wikipedia Verifiability with AI [116.69749668874493]
私たちはSideと呼ばれるニューラルネットワークベースのシステムを開発し、彼らの主張を支持できないWikipediaの引用を識別する。
本誌の最初の引用レコメンデーションは、既存のWikipediaの引用よりも60%多い選好を集めている。
以上の結果から,Wikipediaの妥当性を高めるために,AIベースのシステムを人間と共同で活用できることが示唆された。
論文 参考訳(メタデータ) (2022-07-08T15:23:29Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。