Fugu-MT 論文翻訳(概要): Large Language Models for Automated Open-domain Scientific Hypotheses Discovery

論文の概要: Large Language Models for Automated Open-domain Scientific Hypotheses Discovery

arxiv url: http://arxiv.org/abs/2309.02726v2
Date: Fri, 16 Feb 2024 14:26:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-19 20:31:34.368368
Title: Large Language Models for Automated Open-domain Scientific Hypotheses Discovery
Title（参考訳）: オープンドメイン科学仮説発見のための大規模言語モデル
Authors: Zonglin Yang, Xinya Du, Junxian Li, Jie Zheng, Soujanya Poria, Erik Cambria
Abstract要約: 本研究は,社会科学の学術的仮説発見のための最初のNLPデータセットを提案する。最近のトップ50の社会科学出版物と生のウェブコーパスで構成されている。最後の目標は、有効で斬新で有用な科学的仮説を自動的に生成するシステムを作ることだ。
参考スコア（独自算出の注目度）: 53.40975887946237
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Hypothetical induction is recognized as the main reasoning type when scientists make observations about the world and try to propose hypotheses to explain those observations. Past research on hypothetical induction is under a constrained setting: (1) the observation annotations in the dataset are carefully manually handpicked sentences (resulting in a close-domain setting); and (2) the ground truth hypotheses are mostly commonsense knowledge, making the task less challenging. In this work, we tackle these problems by proposing the first NLP dataset for social science academic hypotheses discovery, consisting of 50 recent top social science publications; and a raw web corpus that contains enough information to make it possible to develop all the research hypotheses in the 50 papers. The final goal is to create systems that automatically generate valid, novel, and helpful scientific hypotheses, given only a pile of raw web corpus. Different from the previous settings, the new dataset requires (1) using open-domain data (raw web corpus) as observations; and (2) proposing hypotheses even new to humanity. A multi-module framework is developed for the task, as well as three different feedback mechanisms that empirically show performance gain over the base framework. Finally, our framework exhibits superior performance in terms of both GPT-4 based evaluation and expert-based evaluation.To the best of our knowledge, this is the first work showing that LLMs are able to generate novel ("not existing in the literature") and valid ("reflecting reality") scientific hypotheses.
Abstract（参考訳）: 仮説的帰納は、科学者が世界を観察し、それらの観察を説明する仮説を提案しようとするときに、主要な推論タイプとして認識される。過去の仮説的帰納法の研究は、(1)データセットにおける観察的注釈は手動で選択した文(近接ドメイン設定で記述)であり、(2)基礎的真理仮説は、ほとんど常識的な知識であり、課題の難易度を低下させる。本稿では,最近の50の社会科学出版物からなる社会科学学術的仮説発見のための最初のnlpデータセットと,研究仮説を50の論文で開発可能な十分な情報を含む生のウェブコーパスを提案することで,これらの課題に取り組む。最後のゴールは、生のウェブコーパスの山だけで、有効で斬新で有用な科学的仮説を自動的に生成するシステムを作ることです。以前の設定とは異なり、新しいデータセットは(1)観察としてopen-domain data(raw web corpus)を使用する必要があり、(2)人間にさらに新しい仮説を提案する。タスク用にマルチモジュールフレームワークが開発され、ベースフレームワークのパフォーマンス向上を実証的に示す3つのフィードバックメカニズムが開発されている。最後に,本フレームワークは,gpt-4に基づく評価と専門家による評価の両方において優れた性能を示す。我々の知る限りでは,llmが「文学に存在しない」かつ「現実を反映する」科学的仮説を生成することができることを示す最初の研究である。

関連論文リスト

Open-ended Scientific Discovery via Bayesian Surprise [63.26412847240136]
AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
論文参考訳（メタデータ） (2025-06-30T22:53:59Z)
MOOSE-Chem2: Exploring LLM Limits in Fine-Grained Scientific Hypothesis Discovery via Hierarchical Search [93.64235254640967]
大規模言語モデル (LLM) は科学的仮説生成の自動化において有望であることを示している。詳細な科学的仮説発見の新たな課題を定めている。本稿では,仮説に詳細を漸進的に提案・統合する階層探索手法を提案する。
論文参考訳（メタデータ） (2025-05-25T16:13:46Z)
MOOSE-Chem3: Toward Experiment-Guided Hypothesis Ranking via Simulated Experimental Feedback [128.2992631982687]
本研究では,事前試験の結果に基づいて仮説を優先順位付けすることを目的とした,実験誘導ランキングの課題について紹介する。本稿では,3つのドメインインフォームド仮定に基づいて,仮説性能を既知の基底的真理仮説に類似した関数としてモデル化するシミュレータを提案する。実験結果を用いて,124の化学仮説のデータセットをキュレートし,シミュレーションの有効性を検証した。
論文参考訳（メタデータ） (2025-05-23T13:24:50Z)
Sparks of Science: Hypothesis Generation Using Structured Paper Data [1.250723303641055]
我々は,最上位のコンピュータサイエンスカンファレンスから抽出された約5500の構造化問題と仮説のペアの最初のデータセットであるHypoGenを紹介する。我々は,Bit-Flip-SparkとChain-of-Reasoningをモデルとして,フレーミング仮説の生成を条件付き言語モデリングとして示す。得られた仮説の新規性、実現可能性、および全体的な品質を改善するために、私たちのHypoGenデータセットを微調整することで、その妥当性が向上することを示す。
論文参考訳（メタデータ） (2025-04-17T14:29:18Z)
HypoBench: Towards Systematic and Principled Benchmarking for Hypothesis Generation [24.656083479331645]
仮説生成手法を複数の側面にわたって評価するための新しいベンチマークである hypoBench を紹介する。既存の6つの仮説生成手法と組み合わせた4つの最先端LCMの評価を行った。結果は、現在の仮説生成手法がすべての関連するパターンや意味のあるパターンを完全には明らかにしていないため、改善の余地がまだ大きいことを示している。
論文参考訳（メタデータ） (2025-04-15T18:00:00Z)
ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition [67.26124739345332]
大規模言語モデル(LLM)は科学的研究を支援する可能性を示しているが、高品質な研究仮説を発見する能力はいまだ検討されていない。我々は,LLMを科学的発見のサブタスクのほぼ十分セットで評価するための,最初の大規模ベンチマークを紹介する。学術論文から重要コンポーネント(研究質問、背景調査、インスピレーション、仮説)を抽出する自動フレームワークを開発する。
論文参考訳（メタデータ） (2025-03-27T08:09:15Z)
Improving Scientific Hypothesis Generation with Knowledge Grounded Large Language Models [20.648157071328807]
大規模言語モデル(LLM)は、既存の知識を分析することによって、新しい研究の方向性を特定することができる。 LLMは幻覚を発生させる傾向がある。我々は,知識グラフから外部構造的知識を統合することで,LLM仮説の生成を促進するシステムKG-CoIを提案する。
論文参考訳（メタデータ） (2024-11-04T18:50:00Z)
Graph Stochastic Neural Process for Inductive Few-shot Knowledge Graph Completion [63.68647582680998]
I-FKGC(inductive few-shot knowledge graph completion)と呼ばれる課題に焦点をあてる。帰納的推論(inductive reasoning)の概念に着想を得て,I-FKGCを帰納的推論問題とした。本稿では,仮説の連成分布をモデル化したニューラルプロセスに基づく仮説抽出器を提案する。第2のモジュールでは、この仮説に基づいて、クエリセットのトリプルが抽出された仮説と一致するかどうかをテストするグラフアテンションベースの予測器を提案する。
論文参考訳（メタデータ） (2024-08-03T13:37:40Z)
LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文参考訳（メタデータ） (2024-05-16T03:04:10Z)
Hypothesis Generation with Large Language Models [28.73562677221476]
データに基づく仮説生成(ラベル付き例)に焦点を当てる。マルチアームの盗賊にインスパイアされた我々は、更新プロセスにおけるエクスプロイト探索のトレードオフを通知する報酬関数を設計する。我々のアルゴリズムは、分類タスクにおいて、数発のプロンプトよりもずっと優れた予測性能を実現する仮説を生成することができる。
論文参考訳（メタデータ） (2024-04-05T18:00:07Z)
Large Language Models are Zero Shot Hypothesis Proposers [17.612235393984744]
大規模言語モデル(LLM)は、情報障壁を断ち切ることを約束する、グローバルかつ学際的な知識の豊富なものである。バイオメディカル文献から背景知識と仮説ペアからなるデータセットを構築した。ゼロショット, 少数ショット, 微調整設定において, 最上位モデルの仮説生成能力を評価する。
論文参考訳（メタデータ） (2023-11-10T10:03:49Z)
Can Large Language Models Discern Evidence for Scientific Hypotheses? Case Studies in the Social Sciences [3.9985385067438344]
強い仮説は、既存の証拠に基づく最良の推理であり、関連する文献の包括的な見解によって知らされる。毎年発行される科学論文の数が指数関数的に増加すると、ある仮説に関連する証拠の手作業による集約と合成は困難である。我々は,社会科学における研究のコミュニティ主導のアノテーションを用いた科学的仮説の課題のための新しいデータセットを共有する。
論文参考訳（メタデータ） (2023-09-07T04:15:17Z)
SciMON: Scientific Inspiration Machines Optimized for Novelty [68.46036589035539]
文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文参考訳（メタデータ） (2023-05-23T17:12:08Z)
The role of prior information and computational power in Machine Learning [0.0]
本稿では,事前情報と計算能力を用いて学習問題を解決する方法について論じる。我々は高い計算能力を利用することは高い性能の利点があると主張している。
論文参考訳（メタデータ） (2022-10-31T20:39:53Z)
SciFact-Open: Towards open-domain scientific claim verification [61.288725621156864]
本稿では,科学的クレーム検証システムの性能評価を目的とした新しいテストコレクションであるSciFact-Openを提案する。我々は、4つの最先端の科学的クレーム検証モデルの上位予測をプールし、注釈付けすることで、科学的クレームの証拠を収集する。その結果,SciFact-Openへの一般化に苦慮する小形コーパス上で開発されたシステムは,少なくとも15F1の性能低下を示すことがわかった。
論文参考訳（メタデータ） (2022-10-25T05:45:00Z)
L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。 ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文参考訳（メタデータ） (2020-05-22T15:01:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。