Fugu-MT 論文翻訳(概要): Unlearning as Ablation: Toward a Falsifiable Benchmark for Generative Scientific Discovery

論文の概要: Unlearning as Ablation: Toward a Falsifiable Benchmark for Generative Scientific Discovery

arxiv url: http://arxiv.org/abs/2508.17681v3
Date: Tue, 23 Sep 2025 15:40:35 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-24 18:29:14.51061
Title: Unlearning as Ablation: Toward a Falsifiable Benchmark for Generative Scientific Discovery
Title（参考訳）: アブレーションとしてのアンラーニング : 生成科学的発見のためのFalsibility Benchmarkを目指して
Authors: Robert Yang,
Abstract要約: 大きな言語モデル(LLM)は本当に新しい知識を生成するのか、それとも単に記憶された断片をリミックスするだけなのか? 建設科学的発見のフレーバーとして,非学習的アズ・アブレーションを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Bold claims about AI's role in science-from "AGI will cure all diseases" to promises of radically accelerated discovery-raise a central epistemic question: do large language models (LLMs) truly generate new knowledge, or do they merely remix memorized fragments? We propose unlearning-as-ablation as a falsifiable probe of constructive scientific discovery. The idea is to systematically remove a target result together with its forget-closure (supporting lemmas, paraphrases, and multi-hop entailments) and then evaluate whether the model can re-derive the result from only permitted axioms and tools. Success would indicate generative capability beyond recall; failure would expose current limits. Unlike prevailing motivations for unlearning-privacy, copyright, or safety-our framing repositions it as an epistemic probe for AI-for-Science. We outline a minimal pilot in mathematics and algorithms to illustrate feasibility, and sketch how the same approach could later be extended to domains such as physics or chemistry. This is a position paper: our contribution is conceptual and methodological, not empirical. We aim to stimulate discussion on how principled ablation tests could help distinguish models that reconstruct knowledge from those that merely retrieve it, and how such probes might guide the next generation of AI-for-Science benchmarks.
Abstract（参考訳）: 大規模な言語モデル(LLM)は本当に新しい知識を生成するのか、あるいは単に記憶された断片をリミックスするのだろうか? 建設科学的発見のフレーバーとして,非学習的アズ・アブレーションを提案する。その考え方は、目標とする結果と、その忘れられたクロージャ(補題、パラフレーズ、マルチホップを含む)を体系的に取り除き、モデルが許容される公理とツールのみから結果を導出できるかどうかを評価することである。成功はリコール以上の生成能力を示し、障害は現在の限界を露呈する。未学習のプライバシ、著作権、安全のためのフレーミングといった一般的なモチベーションとは違って、AIの科学への探究の手段として位置づけられている。我々は、実現可能性を説明するために、数学とアルゴリズムの最小限のパイロットを概説し、同じアプローチが後に物理学や化学のような領域に拡張される可能性についてスケッチした。私たちの貢献は概念的で方法論的であり、経験的ではありません。我々は、原理的アブレーションテストが、知識を単に取得するモデルと、それを再構築するモデルとを区別する上でどのように役立つか、そしてそのようなプローブが、次世代のAI科学ベンチマークをどのように導くか、という議論を刺激することを目指している。

関連論文リスト

Alien Science: Sampling Coherent but Cognitively Unavailable Research Directions from Idea Atoms [53.907293349123506]
大規模な言語モデルは、しばしば、現在のコミュニティにとって一貫性があり、無関心なアイデアを生み出すのに失敗する。我々は、このギャップを認知的可用性によって形式化し、研究の方向性が典型的な研究者によって自然に提案される可能性について述べる。我々は、原子の集合が実行可能な方向を構成するかどうかをスコアするコヒーレンスモデルと、その方向が生成される確率をスコアするアベイラビリティモデルという2つの補完モデルを学ぶ。
論文参考訳（メタデータ） (2026-03-01T13:05:19Z)
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques [105.15622072347811]
大規模言語モデル(LLM)は、科学研究を加速するための新たな道を開いた。先進的なAIモデルとどのように協力したかを示すケーススタディのコレクションを提示する。
論文参考訳（メタデータ） (2026-02-03T18:56:17Z)
Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs [78.18336140706471]
Sci-LLMは、生物発見を加速するための有望なフロンティアとして登場した。現在の戦略では生の生体分子配列を処理する際にSci-LLMの推論能力を制限する。より効果的な戦略は、Sci-LLMに高レベルな構造化コンテキストを提供することである。
論文参考訳（メタデータ） (2025-10-27T09:03:21Z)
NewtonBench: Benchmarking Generalizable Scientific Law Discovery in LLM Agents [65.85967483058705]
科学法発見のための強力なツールとして、大規模な言語モデルが登場している。このタスクの既存のベンチマークは、基本的な方法論のトリレンマに悩まされている。 12の物理領域にわたる324の科学法発見タスクからなるベンチマークであるNewtonBenchを紹介する。
論文参考訳（メタデータ） (2025-10-08T16:12:11Z)
Newton to Einstein: Axiom-Based Discovery via Game Design [55.30047000068118]
本稿では,ルール進化システムとして科学調査を再放送するゲームデザインフレームワークを提案する。固定された仮定内で動作する従来のMLアプローチとは異なり、本手法は新たな理論構造の発見を可能にする。
論文参考訳（メタデータ） (2025-09-05T18:59:18Z)
The Need for Verification in AI-Driven Scientific Discovery [9.887965168376311]
機械学習と大規模言語モデルは、従来の手法をはるかに超えたスケールと速度で仮説を生成することができる。検証のためのスケーラブルで信頼性の高いメカニズムがなければ、科学的進歩のリスクは先進的ではなく妨げられる、と我々は主張する。
論文参考訳（メタデータ） (2025-09-01T11:50:04Z)
Active Inference AI Systems for Scientific Discovery [1.450405446885067]
この観点では、進歩は抽象論、推論、経験的根拠の3つのギャップを互いに強化する。デザイン原則は、想像空間を推論し、世界から学ぶシステムのために提案されている。
論文参考訳（メタデータ） (2025-06-26T14:43:04Z)
Position: Intelligent Science Laboratory Requires the Integration of Cognitive and Embodied AI [98.19195693735487]
知的科学研究所(ISL)のパラダイムを提案する。 ISLは、認知と具体的知性を深く統合した多層クローズドループフレームワークである。このようなシステムは、現在の科学的発見の限界を克服するために不可欠である、と我々は主張する。
論文参考訳（メタデータ） (2025-06-24T13:31:44Z)
Artificial Scientific Discovery [5.241773225218436]
この論文はAlphaGoからChatGPTにまたがって、人工科学者のビジョンを実現するために必要な概念を実証的に検証している。人工科学者は、その発見を説明するために使われる言語を独自の解釈で理解し、厳格な既存の通訳に依存してはならない。これは、解釈と知覚が明示的にアンタングル化されているCLIPのようなモデルを構築するという単純なアイデアに終止符を打つ。
論文参考訳（メタデータ） (2024-11-18T15:51:45Z)
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery [14.465756130099091]
本稿では,完全自動科学的発見のための最初の包括的枠組みについて述べる。我々は、新しい研究アイデアを生成し、コードを書き、実験を実行し、結果を視覚化し、その結果を説明するThe AI Scientistを紹介します。原則として、このプロセスは、人間の科学コミュニティのように行動しながら、オープンな方法でアイデアを反復的に発展させることができる。
論文参考訳（メタデータ） (2024-08-12T16:58:11Z)
Towards a Science Exocortex [0.5687661359570725]
我々はエージェントAIシステムにおける技術の現状をレビューし、これらの手法をどのように拡張して科学により大きな影響を与えるかについて論じる。科学の外食はAIエージェントの群れとして設計することができ、各エージェントは特定の研究者のタスクを個別に合理化することができる。
論文参考訳（メタデータ） (2024-06-24T14:32:32Z)
SciInstruct: a Self-Reflective Instruction Annotated Dataset for Training Scientific Language Models [57.96527452844273]
我々はSciInstructを紹介した。SciInstructは、大学レベルの科学的推論が可能な科学言語モデルを訓練するための科学指導スイートである。我々は、物理学、化学、数学、公式な証明を含む多種多様な高品質なデータセットをキュレートした。 SciInstructの有効性を検証するため、SciInstruct、すなわちChatGLM3(6Bと32B)、Llama3-8B-Instruct、Mistral-7B: MetaMathを用いて言語モデルを微調整した。
論文参考訳（メタデータ） (2024-01-15T20:22:21Z)
SciMON: Scientific Inspiration Machines Optimized for Novelty [68.46036589035539]
文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文参考訳（メタデータ） (2023-05-23T17:12:08Z)
I2D2: Inductive Knowledge Distillation with NeuroLogic and Self-Imitation [89.38161262164586]
本稿では,ジェネリック生成の課題に着目し,コモンセンス知識の生成モデルについて検討する。我々は,西欧の記号的知識蒸留を緩やかに追従する新しいコモンセンス蒸留フレームワークであるI2D2を紹介する。我々の研究はジェネリックの新たなコーパス、Gen-A-tomicに繋がる。
論文参考訳（メタデータ） (2022-12-19T04:47:49Z)
Principled Knowledge Extrapolation with GANs [92.62635018136476]
我々は,知識外挿の新たな視点から,対実合成を研究する。本稿では, 知識外挿問題に対処するために, クローズド形式判別器を用いた対角ゲームが利用可能であることを示す。提案手法は,多くのシナリオにおいて,エレガントな理論的保証と優れた性能の両方を享受する。
論文参考訳（メタデータ） (2022-05-21T08:39:42Z)
AI Research Associate for Early-Stage Scientific Discovery [1.6861004263551447]
人工知能(AI)は科学活動に何十年も使われ続けている。我々は、最小バイアスの物理に基づくモデリングに基づく、初期段階の科学的発見のためのAI研究アソシエイトを提案する。
論文参考訳（メタデータ） (2022-02-02T17:05:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。