論文の概要: Large Language Models and Scientific Discourse: Where's the Intelligence?
- arxiv url: http://arxiv.org/abs/2603.23543v1
- Date: Fri, 13 Mar 2026 14:23:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:13.027043
- Title: Large Language Models and Scientific Discourse: Where's the Intelligence?
- Title(参考訳): 大規模言語モデルと科学談話 : インテリジェンスはどこにあるのか?
- Authors: Harry Collins, Simon Thorne,
- Abstract要約: 科学的知識の作り方について検討し,それを大規模言語モデルと比較する。
LLMはそのような言説にはアクセスできない、あるいはアクセスできない、と論じられている。
次に、新しいモンティホールプロンプトを発明し、LCMのパネルと人間のパネルの反応を比較します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We explore the capabilities of Large Language Models (LLMs) by comparing the way they gather data with the way humans build knowledge. Here we examine how scientific knowledge is made and compare it with LLMs. The argument is structured by reference to two figures, one representing scientific knowledge and the other LLMs. In a 2014 study, scientists explain how they choose to ignore a 'fringe science' paper in the domain of gravitational wave physics: the decisions are made largely as a result of tacit knowledge built up in social discourse, most spoken discourse, within closed groups of experts. It is argued that LLMs cannot or do not currently access such discourse, but it is typical of the early formation of scientific knowledge. LLMs 'understanding' builds on written literatures and is therefore insecure in the case of the initial stages of knowledge building. We refer to Colin Fraser's 'Dumb Monty Hall problem' where in 2023 ChatGPT failed though a year later or so later LLMs were succeeding. We argue that this is not a matter of improvement in LLMs ability to reason but in the change in the body of human written discourse on which they can draw (or changes being put in by humans 'by hand'). We then invent a new Monty Hall prompt and compare the responses of a panel of LLMs and a panel of humans: they are starkly different but we explain that the previous mechanisms will soon allow the LLMs to align themselves to humans once more. Finally, we look at 'overshadowing' where a settled body of discourse becomes so dominant that LLMs fail to respond to small variations in prompts which render the old answers nonsensical. The 'intelligence' we argue is in the humans not the LLMs
- Abstract(参考訳): 大規模言語モデル(LLM)の能力について、人間の知識構築方法とデータ収集方法を比較して検討する。
ここでは、科学的知識の作り方について検討し、LLMと比較する。
この議論は、科学的知識を表す2つの図と、他の LLM を参照して構成されている。
2014年の研究では、重力波物理学の分野における「フリンジ・サイエンス」の論文を無視する方法が説明されている。
LLMはそのような言説に現在アクセスできない、あるいはアクセスしていないと論じられているが、これは科学知識の初期形成の典型である。
LLMは文献に基づいて構築されており、知識構築の初期段階では安全ではない。
コリン・フレーザーの「ダムブ・モンティホール問題」に言及し、2023年にはChatGPTが失敗したが、その1年後にはLSMが成功した。
我々は、LLMの推論能力の改善の問題ではなく、人間の記述した言説の身体の変化(あるいは人間によって「手で」入れられること)の問題であると主張している。
私たちは新しいモンティホールのプロンプトを発明し、LLMのパネルと人間のパネルの反応を比較しました。
最後に、落ち着いた談話の体が支配的になるような「オーバーシャドウイング」に注目し、LLMは古い答えを無意味なものにするプロンプトの小さなバリエーションに反応しない。
我々が主張する「知性」はLLMではなく人間にある
関連論文リスト
- How LLMs Distort Our Written Language [11.98582470524476]
大規模言語モデル(LLM)は世界中で10億人以上が利用しており、多くの場合、執筆支援に使われている。
我々はLLMが人間の文章の音声やトーンを変えるだけでなく、意図した意味を一貫して変えることを実証した。
論文 参考訳(メタデータ) (2026-03-18T18:01:52Z) - Unveiling Causal Reasoning in Large Language Models: Reality or Mirage? [62.17959154852391]
因果推論能力は、強力な人工知能に向けて大きな言語モデルを進める上で重要である。
大規模言語モデル (LLM) は, 浅い (レベル-1) 因果推論しか実行できないことを示す。
本稿では,LLMの因果推論プロセスに一般知識と目標指向のプロンプトを組み込んだG2-Reasonerを提案する。
論文 参考訳(メタデータ) (2025-06-26T13:11:01Z) - Large Language Models are overconfident and amplify human bias [1.014221700787766]
我々は,大規模言語モデル(LLM)が最も広く普及している人間のバイアスの1つ、過信を継承するかどうかを評価する。
私たちが研究している5つのLCMは、すべて過信であり、答えが20%から60%の間正しい確率を過信しています。
人間はより高度なLSMと同様の精度を持つが、過信ははるかに低い。
論文 参考訳(メタデータ) (2025-05-04T15:21:34Z) - When Do LLMs Need Retrieval Augmentation? Mitigating LLMs' Overconfidence Helps Retrieval Augmentation [66.01754585188739]
大規模言語モデル(LLM)は、特定の知識を持っていないことを知るのが困難であることが判明した。
Retrieval Augmentation (RA)はLLMの幻覚を緩和するために広く研究されている。
本稿では,LLMの知識境界に対する認識を高めるためのいくつかの手法を提案する。
論文 参考訳(メタデータ) (2024-02-18T04:57:19Z) - How should the advent of large language models affect the practice of
science? [51.62881233954798]
大規模言語モデルの出現は科学の実践にどのように影響を与えるべきか?
我々は4つの科学者グループを招待し、この質問を反映し、彼らの見解を共有し、議論をおこなった。
論文 参考訳(メタデータ) (2023-12-05T10:45:12Z) - Do Large Language Models Know about Facts? [60.501902866946]
大規模言語モデル(LLM)は、最近、さまざまな自然言語処理タスクにおいて、大幅なパフォーマンス改善を推進している。
我々は,ベンチマークPinocchioを設計し,LLM内の事実知識の範囲と範囲を評価することを目的とする。
Pinocchioには、異なるソース、タイムライン、ドメイン、リージョン、言語にまたがる20万のさまざまな事実質問が含まれている。
論文 参考訳(メタデータ) (2023-10-08T14:26:55Z) - Head-to-Tail: How Knowledgeable are Large Language Models (LLMs)? A.K.A. Will LLMs Replace Knowledge Graphs? [24.931467926497152]
Head-to-Tailは、ヘッド、トーソ、テールファクトに関する18Kの質問対で構成されるベンチマークである。
既存のLSMは、特に胴体と尾部の実体の事実において、事実知識の把握の観点からはまだ完璧ではないことを示す。
論文 参考訳(メタデータ) (2023-08-20T05:31:03Z) - Event knowledge in large language models: the gap between the impossible
and the unlikely [46.540380831486125]
我々は,事前学習された大規模言語モデル (LLM) がイベント知識を持つことを示す。
彼らはほぼ常に、不可能な事象に対して高い確率を割り当てる。
しかし、おそらくは起こりそうもない出来事に対して、一貫性のない選好を示す。
論文 参考訳(メタデータ) (2022-12-02T23:43:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。