Fugu-MT 論文翻訳(概要): SciMON: Scientific Inspiration Machines Optimized for Novelty

論文の概要: SciMON: Scientific Inspiration Machines Optimized for Novelty

arxiv url: http://arxiv.org/abs/2305.14259v5
Date: Sat, 17 Feb 2024 06:28:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 07:00:58.792496
Title: SciMON: Scientific Inspiration Machines Optimized for Novelty
Title（参考訳）: SciMON:新奇性に最適化された科学機器
Authors: Qingyun Wang, Doug Downey, Heng Ji, Tom Hope
Abstract要約: 文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
参考スコア（独自算出の注目度）: 74.78803157606083
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We explore and enhance the ability of neural language models to generate novel scientific directions grounded in literature. Work on literature-based hypothesis generation has traditionally focused on binary link prediction -- severely limiting the expressivity of hypotheses. This line of work also does not focus on optimizing novelty. We take a dramatic departure with a novel setting in which models use as input background contexts (e.g., problems, experimental settings, goals), and output natural language ideas grounded in literature. We present SciMON, a modeling framework that uses retrieval of "inspirations" from past scientific papers, and explicitly optimizes for novelty by iteratively comparing to prior papers and updating idea suggestions until sufficient novelty is achieved. Comprehensive evaluations reveal that GPT-4 tends to generate ideas with overall low technical depth and novelty, while our methods partially mitigate this issue. Our work represents a first step toward evaluating and developing language models that generate new ideas derived from the scientific literature.
Abstract（参考訳）: 文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。文献に基づく仮説生成の研究は、伝統的に二進的リンク予測に焦点を当ててきた。この作品は、新規性を最適化することにも焦点を当てていない。モデルが入力背景の文脈(例えば、問題、実験的な設定、目標)として使用される新しい設定で劇的な出発点を取り、文学に基づいた自然言語アイデアを出力します。我々は,過去の論文から「インスパイア」を検索し,先行論文と比較し,十分な新規性が得られるまでアイデア提案の更新を行うことにより,ノベルティを明示的に最適化するモデリングフレームワークであるscimonを提案する。包括的評価の結果,GPT-4は全体的に低い技術深度と新規性を持つアイデアを産み出す傾向にあることがわかった。私たちの研究は、科学文献から新たなアイデアを生み出す言語モデルの評価と開発のための第一歩です。

関連論文リスト

Predicting New Research Directions in Materials Science using Large Language Models and Concept Graphs [30.813288388998256]
大規模言語モデル(LLM)は,自動キーワード抽出法よりも効率的に概念を抽出できることを示す。機械学習モデルは、歴史的データに基づいて、概念の新たな組み合わせを予測するために訓練される。本モデルは,まだ研究されていないトピックの革新的な組み合わせを予測することによって,材料科学者の創造的思考プロセスに刺激を与えることができることを示す。
論文参考訳（メタデータ） (2025-06-20T08:26:12Z)
Harnessing Large Language Models for Scientific Novelty Detection [49.10608128661251]
科学的ノベルティ検出(ND)のための大規模言語モデル(LLM)を提案する。そこで本研究では,LLMからアイデアレベルの知識を抽出し,ライトウェイトなレトリバーを訓練することを提案する。実験の結果,提案手法は,アイデア検索やNDタスクのためのベンチマークデータセットにおいて,常に他よりも優れていた。
論文参考訳（メタデータ） (2025-05-30T14:08:13Z)
Self-reflecting Large Language Models: A Hegelian Dialectical Approach [13.910371970437708]
哲学的なレンズによるNLPの探索は、計算手法と古典的な哲学の学派を結びつけることで、研究者の目を引くようになった。本稿では, LLMの自己回帰に対するヘーゲル弁証法に触発された哲学的アプローチを紹介し, 自己弁証的アプローチを用いて内的批判をエミュレートし, 矛盾点を解消して新たなアイデアを合成する。我々の実験は、新しいアイデアを生み出すことを約束し、将来の研究の足場を提供する。
論文参考訳（メタデータ） (2025-01-24T20:54:29Z)
Good Idea or Not, Representation of LLM Could Tell [86.36317971482755]
我々は、大規模言語モデルの知識を活用し、科学的アイデアのメリットを評価することを目的としたアイデアアセスメントに焦点をあてる。我々は、このタスクに対する様々なアプローチのパフォーマンスを訓練し評価するために、細心の注意を払って設計された、フルテキストを持つ約4万の原稿からベンチマークデータセットをリリースする。その結果, 大規模言語モデルの表現は, 生成出力よりもアイデアの価値を定量化する可能性が高いことが示唆された。
論文参考訳（メタデータ） (2024-09-07T02:07:22Z)
A Survey on Natural Language Counterfactual Generation [7.022371235308068]
自然言語のカウンターファクト生成は、修正されたテキストが別のクラスに分類されるように、与えられたテキストを最小限に修正することを目的としている。生成手法を4つのグループに体系的に分類し、生成品質を評価するための指標を要約する新しい分類法を提案する。
論文参考訳（メタデータ） (2024-07-04T15:13:59Z)
Information Theoretic Text-to-Image Alignment [49.396917351264655]
本稿では,ステア画像生成のための情報理論アライメント尺度を用いた新しい手法を提案する。提案手法は最先端の手法よりも優れているが,MIを推定するためには事前学習されたデノナイジングネットワークを必要としない。
論文参考訳（メタデータ） (2024-05-31T12:20:02Z)
ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、大規模言語モデルによる研究アイデア作成エージェントである。科学文献に基づいて繰り返し精製しながら、問題、方法、実験設計を生成する。我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文参考訳（メタデータ） (2024-04-11T13:36:29Z)
Grounded Intuition of GPT-Vision's Abilities with Scientific Images [44.44139684561664]
我々は、GPT-Visionの「接地された直観」を開発するために、多くの人が直感的に試みてきた過程を定式化する。本稿では,GPT-Visionが特にプロンプトに敏感であることを示す。我々の手法と分析は、GPT-Visionがいかにして情報にアクセスしやすくできるかを明らかにしながら、研究者が新しいモデルの基盤となる直感を高めるのに役立つことを目的としている。
論文参考訳（メタデータ） (2023-11-03T17:53:43Z)
Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.40483334131271]
本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文参考訳（メタデータ） (2023-09-06T05:19:41Z)
Exploring and Verbalizing Academic Ideas by Concept Co-occurrence [42.16213986603552]
本研究は,学術的アイデアインスピレーションのための概念共起に基づく枠組みを考案する。我々は20の分野やトピックから概念の共起関係に基づき、進化する概念グラフを構築する。我々は、共起励磁法と呼ばれる新しいデータ構造に基づくアイデアの記述を生成する。
論文参考訳（メタデータ） (2023-06-04T07:01:30Z)
A Survey on Non-Autoregressive Generation for Neural Machine Translation and Beyond [145.43029264191543]
非自己回帰(NAR)生成は推論を高速化するために機械翻訳(NMT)で最初に提案される。 NAR生成は機械翻訳を著しく加速させるが、自己回帰(AR)生成の推論は翻訳精度を犠牲にする。 NAR生成とAR生成の精度ギャップを埋めるために、多くの新しいモデルとアルゴリズムが設計/提案されている。
論文参考訳（メタデータ） (2022-04-20T07:25:22Z)
The Rediscovery Hypothesis: Language Models Need to Meet Linguistics [8.293055016429863]
現代言語モデルの性能向上に言語知識が必須条件であるかどうかを検討する。その結果, 言語構造を探索した場合, かなり圧縮されるが, 事前学習目的によく適合する言語モデルは, 良好なスコアを保っていることがわかった。この結果は再発見仮説を支持し,本論文の第2の貢献である言語モデル目標と言語情報との関連性に関する情報論的枠組みを導出する。
論文参考訳（メタデータ） (2021-03-02T15:57:39Z)
Improving Adversarial Text Generation by Modeling the Distant Future [155.83051741029732]
テキスト計画手法を考察し、上記の問題を緩和するためのモデルに基づく模倣学習手法を提案する。本稿では,より長い地平線上の生成過程に焦点をあてる新しいガイドネットワークを提案する。
論文参考訳（メタデータ） (2020-05-04T05:45:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。