Fugu-MT 論文翻訳(概要): More Than Can Be Said: A Benchmark and Framework for Pre-Question Scientific Ideation

論文の概要: More Than Can Be Said: A Benchmark and Framework for Pre-Question Scientific Ideation

arxiv url: http://arxiv.org/abs/2605.06345v1
Date: Thu, 07 May 2026 14:30:03 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-08 22:27:11.903439
Title: More Than Can Be Said: A Benchmark and Framework for Pre-Question Scientific Ideation
Title（参考訳）: 以上のことはあり得ない - 事前の科学思想のためのベンチマークとフレームワーク
Authors: Jie Yu, Song Qiu,
Abstract要約: InciteResearchは、研究者の暗黙の理解を明示的で、検査可能で、実行可能なものにするために設計されたフレームワークである。 TF-Benchは暗黙的な研究支援のための最初のベンチマークである。私たちの研究は、AIが単に下流の実行を自動化するのではなく、思考そのものの拡張として機能することを実証しています。
参考スコア（独自算出の注目度）: 3.6157969644896912
License: http://creativecommons.org/licenses/by/4.0/
Abstract: AI research agents have shown strong potential in automating literature search and manuscript refinement, yet most assume a clear and actionable initial input, operating only after a research question has been made explicit. In contrast, human research often begins with tacit friction, a sense of misalignment before a question can be formed. We introduce InciteResearch, a multi-agent framework designed to make a researcher's implicit understanding explicit, inspectable, and actionable. InciteResearch decomposes the logical chain of Socratic questioning and distributes it across the entire pipeline that: (1) Elicits a structured five-dimensional researcher profile state anchored by specific friction points from vague, even domain-unrelated inputs; (2) Violates hidden assumptions by maximizing the feasibility-novelty product with enforcing a 7-stage causal derivation trace; and (3) check whether the proposed method is a Necessary consequence of the reframed insight. We further introduce TF-Bench, the first benchmark for tacit-to-explicit research assistance that distinguishes domain-related from domain-unrelated inspirations across four scientific modes. On TF-Bench, InciteResearch achieves leapfrogging gains over a prompt-based baseline (novelty/impact from 3.671/3.806 to 4.250/4.397), shifting generated proposals from recombination to architectural insight. Our work demonstrates that AI can serve as an extension of thinking itself, rather than merely automating downstream execution.
Abstract（参考訳）: AI研究エージェントは、文学の検索と原稿の改訂を自動化する可能性を示しているが、ほとんどの人は、研究の疑問が明確化されてからのみ、明確で実行可能な初期入力を前提としている。対照的に、人間の研究は暗黙の摩擦から始まることが多い。 InciteResearchは、研究者の暗黙的な理解を明確化し、検査可能で、実行可能にするために設計されたマルチエージェントフレームワークである。 InciteResearchは、ソクラテス質問の論理的連鎖を分解し、パイプライン全体にわたって配布する: 1) 特定の摩擦点によって固定された5次元の研究者プロファイル状態が曖昧で、ドメインに依存しない入力から取り除かれること、(2) 7段階の因果導出トレースを強制することによって、実現不可能な積を最大化すること、(3) 提案手法が再配置された洞察の必然的な結果であるかどうかを確認する。さらに、TF-Benchは、4つの科学的モードにまたがるドメイン関係のインスピレーションとドメイン関係のインスピレーションを区別する、暗黙から明示的な研究支援のための最初のベンチマークである。 TF-Bench では、InciteResearch はプロンプトベースのベースライン(novelty/impact から 3.671/3.806 から 4.250/4.397 へ)を上回り、再結合からアーキテクチャの洞察に移行した。私たちの研究は、AIが単に下流の実行を自動化するのではなく、思考そのものの拡張として機能することを実証しています。

関連論文リスト

AutoResearchBench: Benchmarking AI Agents on Complex Scientific Literature Discovery [55.70879973230979]
AutoResearchBenchは、自律的な科学文献発見のためのベンチマークである。エージェントWebブラウジングに関する以前のベンチマークと比較すると、AutoResearchBenchは研究指向である。最も強力なLCMでさえ、BrowseCompのような一般的なエージェントによるWebブラウジングベンチマークをほとんど征服したにもかかわらず、Deep Researchでは9.39%、Wide Researchでは9.31%の精度しか達成していない。
論文参考訳（メタデータ） (2026-04-28T06:05:17Z)
The Last Human-Written Paper: Agent-Native Research Artifacts [106.47848184955576]
本稿では,物語紙を機械処理可能な研究パッケージに置き換えるプロトコルであるAgent-Native Research Artifact(ARA)を紹介する。通常の開発において決定と終了をキャプチャするLive Research Manager、レガシPDFとリポジトリをARAに変換するARAコンパイラ、人間レビュアーが重要性、ノベルティ、味にフォーカスできるように客観的チェックを自動化するARAネイティブレビューシステムである。
論文参考訳（メタデータ） (2026-04-27T16:23:09Z)
AwesomeLit: Towards Hypothesis Generation with Agent-Supported Literature Research [6.5171198649015265]
AwesomeLitは、人間とエージェントによる協調的な視覚化システムである。ユーザーが馴染みのないトピックを探索し、有望な研究方向を特定し、研究結果の信頼性を向上させるのに役立つ。
論文参考訳（メタデータ） (2026-03-23T23:51:14Z)
OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment [63.662126457336534]
OpenNoveltyは、透明で証拠に基づく新規性分析のためのエージェントシステムである。回収された実論文のすべての評価を根拠にし、検証可能な判断を確実にする。 OpenNoveltyは、公正で一貫性があり、エビデンスに支えられたピアレビューを促進するスケーラブルなツールで、研究コミュニティに力を与えることを目指している。
論文参考訳（メタデータ） (2026-01-04T15:48:51Z)
Evaluating Novelty in AI-Generated Research Plans Using Multi-Workflow LLM Pipelines [1.3986052226424095]
本稿では, 反復的推論, 進化的探索, 分解を用いたエージェントシステムが, より斬新で実現可能な研究計画を創出できるかどうかを考察する。我々は、リフレクションベースの反復リフレクション、サカナAI v2進化アルゴリズム、Googleコサイディストマルチエージェントフレームワーク、GPT Deep Research、Gemini3 Proマルチモーダルロングコンテキストパイプラインの5つの理由付けアーキテクチャをベンチマークした。その結果, 創造性を犠牲にすることなく, 高い達成性を維持しつつ, 研究領域にまたがる様々なパフォーマンスが明らかとなった。
論文参考訳（メタデータ） (2025-12-24T12:41:31Z)
Thinking Forward and Backward: Multi-Objective Reinforcement Learning for Retrieval-Augmented Reasoning [137.33138614095435]
Retrieval-augmented Generation (RAG) は、大規模言語モデルにおける幻覚の緩和に有効であることが証明されている。近年、検索に基づく対話をRAGに組み込んで、リアルタイム検索による反復推論を可能にしている。提案するBi-RARは,各中間ステップを前方方向と後方方向の両方で共同で評価する,新たな検索拡張推論フレームワークである。
論文参考訳（メタデータ） (2025-11-12T08:29:39Z)
Unifying Deductive and Abductive Reasoning in Knowledge Graphs with Masked Diffusion Model [64.31242163019242]
帰納的推論と帰納的推論は知識グラフを解析するための重要なパラダイムである。 DARKと呼ばれる知識グラフにおける帰納的・帰納的推論のための統一的なフレームワークを提案する。 DARKは, 帰納的推論タスクと帰納的推論タスクの両方において, 最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-10-13T14:34:57Z)
Unifying Tree Search Algorithm and Reward Design for LLM Reasoning: A Survey [92.71325249013535]
線形木探索はLarge Language Model (LLM) 研究の基盤となっている。本稿では,検索アルゴリズムを3つのコアコンポーネントに分解する統合フレームワークを提案する。
論文参考訳（メタデータ） (2025-10-11T03:29:18Z)
Speculative Exploration on the Concept of Artificial Agents Conducting Autonomous Research [5.439020425819001]
本稿では,そのようなエージェントを創出することの意味を議論するための出発点として,研究の行為が概念的にどう特徴づけられるかを検討する。次に焦点は、質問の定式化、仮説生成、仮説検証といった研究のコアコンポーネントにシフトする。この議論は、マシンがこれらのタスクを自律的に実行可能にすることに関連する可能性と課題について考察する。
論文参考訳（メタデータ） (2023-12-06T13:46:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。