論文の概要: Writing literature reviews with AI: principles, hurdles and some lessons learned
- arxiv url: http://arxiv.org/abs/2603.20235v1
- Date: Sun, 08 Mar 2026 18:02:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.927202
- Title: Writing literature reviews with AI: principles, hurdles and some lessons learned
- Title(参考訳): AIで文学レビューを書く: 原則、ハードル、学んだ教訓
- Authors: Saadi Lahlou, Annabelle Gouttebroze, Atrina Oraee, Julian Madera,
- Abstract要約: 私たちは、さまざまなレベルのAIアシストで作成された文献レビューを比較します。
6つのバージョンを比較すると、一連の落とし穴が示され、文献をレビューするためにAIアシストを使用する際に必要となる注意点が示唆されている。
全体として、AIはレビューの幅と品質を改善することができるが、時間の増加は期待するほど大きくはない。
- 参考スコア(独自算出の注目度): 0.15554979526414522
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We qualitatively compared literature reviews produced with varying degrees of AI assistance. The same LLM, given the same corpus of 280 papers but different selections, produced dramatically different reviews, from mainstream and politically neutral to critical and post-colonial, though neither orientation was intended. LLM outputs always appear at first glance to be well written, well informed and thought out, but closer reading reveals gaps, biases and lack of depth. Our comparison of six versions shows a series of pitfalls and suggests precautions necessary when using AI assistance to make a literature review. Main issues are: (1) The bias of ignorance (you do not know what you do not get) in the selection of relevant papers. (2) Alignment and digital sycophancy: commercial AI models slavishly take you further in the direction they understand you give them, reinforcing biases. (3) Mainstreaming: because of their statistical nature, LLM productions tend to favor mainstream perspectives and content; in our case there was only 20% overlap between paper selections by humans and the LLM. (4) Limited capacity for creative restructuring, with vague and ambiguous statements. (5) Lack of critical perspective, coming from distant reading and political correctness. Most pitfalls can be addressed by prompting, but only if the user knows the domain well enough to detect them. There is a paradox: producing a good AI-assisted review requires expertise that comes from reading the literature, which is precisely what AI was meant to reduce. Overall, AI can improve the span and quality of the review, but the gain of time is not as massive as one would expect, and a press-button strategy leaving AI to do the work is a recipe for disaster. We conclude with recommendations for those who write, or assess, such LLM-augmented reviews.
- Abstract(参考訳): 我々は、さまざまなレベルのAI支援で作成された文学レビューを質的に比較した。
同じLLMは280の論文のコーパスを与えられたが、異なる選考によって、主流から政治的に中立なものから批判的かつポストコロニアルなものまで、劇的に異なるレビューを生み出した。
LLMのアウトプットは、常によく書かれ、よく知られ、よく考えられているように見えますが、より近い読みでは、ギャップ、バイアス、深さの欠如が明らかになります。
6つのバージョンを比較すると、一連の落とし穴が示され、文献をレビューするためにAIアシストを使用する際に必要となる注意点が示唆されている。
1) 関連論文の選択において無知(何が得られないのかわからない)のバイアス。
2)アライメントとデジタルサイコファシー: 商用AIモデルは、自分が与えていることを理解し、バイアスを補強する方向に、厳格に導いてくれる。
主ストリーム化: LLMの製作は, 統計的特徴から, 主流の視点と内容が好まれる傾向にあり, 本稿では, 紙選択とLLMの重複が20%に過ぎなかった。
(4)クリエイティビティ・リストラクチャリングの能力は、曖昧であいまいな文で制限される。
(5) 遠い読書と政治的正当性から生じる批判的視点の欠如。
ほとんどの落とし穴はプロンプトによって対処できますが、ユーザがドメインを十分に知れば検出できます。
優れたAI支援レビューを作成するには、文献を読むことから得られる専門知識が必要です。
全体として、AIはレビューの幅と品質を改善することができるが、時間の増加は期待するほど大きくはない。
我々は、このようなLCM強化されたレビューを書いたり、評価したりするための推奨事項で締めくくります。
関連論文リスト
- Assessing LLMs in Art Contexts: Critique Generation and Theory of Mind Evaluation [0.3359875577705537]
本研究では,大きな言語モデル (LLM) が芸術に関連する2つの領域でどのように機能するかを考察する。
批判生成部分には,ノエル・キャロルの評価枠組みと幅広い美術批評理論を組み合わせるシステムを構築した。
これらの批判は、チューリングテストスタイルの評価において、人間の専門家によって書かれたものと比較された。
第2部では、解釈、感情、道徳的緊張を含む状況に基づいた、新しいシンプルなToMタスクを導入した。
論文 参考訳(メタデータ) (2025-04-17T10:10:25Z) - Could AI Trace and Explain the Origins of AI-Generated Images and Text? [53.11173194293537]
AI生成コンテンツは、現実の世界ではますます普及している。
敵は、大規模なマルチモーダルモデルを利用して、倫理的または法的基準に違反した画像を作成するかもしれない。
ペーパーレビュアーは、大きな言語モデルを誤用して、真の知的努力なしにレビューを生成する。
論文 参考訳(メタデータ) (2025-04-05T20:51:54Z) - Are We There Yet? Revealing the Risks of Utilizing Large Language Models in Scholarly Peer Review [66.73247554182376]
大規模言語モデル(LLM)がピアレビューに統合された。
未確認のLLMの採用は、ピアレビューシステムの完全性に重大なリスクをもたらす。
5%のレビューを操作すれば、論文の12%が上位30%のランキングでその地位を失う可能性がある。
論文 参考訳(メタデータ) (2024-12-02T16:55:03Z) - LLMs Assist NLP Researchers: Critique Paper (Meta-)Reviewing [106.45895712717612]
大規模言語モデル(LLM)は、様々な生成タスクにおいて顕著な汎用性を示している。
本研究は,NLP研究者を支援するLLMの話題に焦点を当てる。
私たちの知る限りでは、このような包括的な分析を提供するのはこれが初めてです。
論文 参考訳(メタデータ) (2024-06-24T01:30:22Z) - Large Language Models' Detection of Political Orientation in Newspapers [0.0]
新聞の立場をよりよく理解するための様々な方法が開発されている。
LLM(Large Language Models)の出現は、研究者や市民を補助する破壊的な可能性を秘めている。
我々は,広く採用されている4つのLCMが新聞の位置づけを評価する方法を比較し,その回答が相互に一致しているかどうかを比較する。
膨大なデータセットを通じて、新聞の記事は単一のLCMによって著しく異なる位置に配置され、アルゴリズムの一貫性のないトレーニングや過度なランダム性を示唆している。
論文 参考訳(メタデータ) (2024-05-23T06:18:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。