Fugu-MT 論文翻訳(概要): Learning to Generate Novel Scientific Directions with Contextualized Literature-based Discovery

論文の概要: Learning to Generate Novel Scientific Directions with Contextualized Literature-based Discovery

arxiv url: http://arxiv.org/abs/2305.14259v1
Date: Tue, 23 May 2023 17:12:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-24 14:13:14.872352
Title: Learning to Generate Novel Scientific Directions with Contextualized Literature-based Discovery
Title（参考訳）: 文脈化文学に基づく発見による新しい科学的方向の学習
Authors: Qingyun Wang, Doug Downey, Heng Ji, Tom Hope
Abstract要約: 文学に基づく発見(LBD)は、論文の採掘と仮説の生成によって新しい科学的知識を発見することを目的としている。我々は、引用と知識グラフの関係のヘテロジニアスなネットワークからインスピレーションの検索を利用した新しいモデリングフレームワークを提案する。
参考スコア（独自算出の注目度）: 61.70193762068848
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Literature-Based Discovery (LBD) aims to discover new scientific knowledge by mining papers and generating hypotheses. Standard LBD is limited to predicting pairwise relations between discrete concepts (e.g., drug-disease links). LBD also ignores critical contexts like experimental settings (e.g., a specific patient population where a drug is evaluated) and background knowledge and motivations that human scientists consider (e.g., to find a drug candidate without specific side effects). We address these limitations with a novel formulation of contextualized-LBD (C-LBD): generating scientific hypotheses in natural language, while grounding them in a context that controls the hypothesis search space. We present a new modeling framework using retrieval of ``inspirations'' from a heterogeneous network of citations and knowledge graph relations, and create a new dataset derived from papers. In automated and human evaluations, our models improve over baselines, including powerful large language models (LLMs), but also reveal challenges on the road to building machines that generate new scientific knowledge.
Abstract（参考訳）: 文学に基づく発見(LBD)は、論文の採掘と仮説の生成によって新しい科学的知識を発見することを目的としている。標準LBDは、離散概念(例えば、薬物放出リンク)間のペアワイズ関係の予測に限られる。 LBDはまた、実験的な状況(例えば、薬物が評価される特定の患者集団)や、人間の科学者が考える背景知識や動機(例えば、特定の副作用のない薬物候補を見つけるなど)を無視する。これらの制約を文脈化されたLBD (C-LBD) の新たな定式化によって解決し、仮説探索空間を制御するコンテキストに基礎を置いている。本稿では,引用と知識グラフ関係のヘテロジニアスネットワークから ‘inspirations'' を検索する新しいモデリングフレームワークを提案し,論文から得られた新しいデータセットを作成する。自動化と人間による評価では、強力な大規模言語モデル(llm)を含むベースラインよりも改善していますが、新たな科学的知識を生み出すマシン構築の課題も明らかにしています。

関連論文リスト

What Is Novel? A Knowledge-Driven Framework for Bias-Aware Literature Originality Evaluation [4.14197005718384]
文献を意識したノベルティ評価フレームワークを導入し、ピアレビューレポートから人間がノベルティを判断する方法を学習する。トップレベルのAIカンファレンスから80K近いノベルティ注釈付きレビューを使用することで、レビュアーによるノベルティ評価の振る舞いを捉えるために、大きな言語モデルを微調整します。
論文参考訳（メタデータ） (2026-01-14T16:49:39Z)
NoveltyRank: Estimating Conceptual Novelty of AI Papers [8.218640708170119]
このプロジェクトの目的は、AI論文の概念的新奇性を推定し、ランク付けするモデルを開発することである。本稿では,論文の題名,抽象的,意味的類似性から新奇性を評価する。両タスクに対してQwen3-4B-Instruct-2507とSciBERTを微調整し、GPT-5.1に対してベンチマークを行い、タスクの定式化とモデリングの選択がパフォーマンスに与える影響を分析する。
論文参考訳（メタデータ） (2025-12-12T03:33:32Z)
Deep Ideation: Designing LLM Agents to Generate Novel Research Ideas on Scientific Concept Network [9.317340414316446]
本稿では,キーワード共起関係と文脈関係をキャプチャする科学ネットワークを統合する枠組みを提案する。現実のレビュアーのフィードバックに基づいて訓練された批評家エンジンは、アイデアの新規性と実現可能性に関する継続的なフィードバックを提供することによって、プロセスをガイドする。当社のアプローチでは,他の手法に比べて10.67%の品質向上を実現しています。
論文参考訳（メタデータ） (2025-11-04T04:00:20Z)
Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity [29.58419742230708]
N-gramノベルティは、トレーニングデータ以外のテキストを生成する言語モデルの能力を評価するために広く利用されている。我々は,この創造性の概念とn-gramの新規性との関係を,人間とAIが生成したテキストの密読を通して検討する。我々は,n-gramの新規性は,専門家が判断する創造性と肯定的に関連しているのに対し,n-gramの新規性によるトップクァアタイル表現の91%は創造性とは判断されないことがわかった。
論文参考訳（メタデータ） (2025-09-26T17:59:05Z)
Predicting New Research Directions in Materials Science using Large Language Models and Concept Graphs [30.813288388998256]
大規模言語モデル(LLM)は,自動キーワード抽出法よりも効率的に概念を抽出できることを示す。機械学習モデルは、歴史的データに基づいて、概念の新たな組み合わせを予測するために訓練される。本モデルは,まだ研究されていないトピックの革新的な組み合わせを予測することによって,材料科学者の創造的思考プロセスに刺激を与えることができることを示す。
論文参考訳（メタデータ） (2025-06-20T08:26:12Z)
Harnessing Large Language Models for Scientific Novelty Detection [49.10608128661251]
科学的ノベルティ検出(ND)のための大規模言語モデル(LLM)を提案する。そこで本研究では,LLMからアイデアレベルの知識を抽出し,ライトウェイトなレトリバーを訓練することを提案する。実験の結果,提案手法は,アイデア検索やNDタスクのためのベンチマークデータセットにおいて,常に他よりも優れていた。
論文参考訳（メタデータ） (2025-05-30T14:08:13Z)
Self-reflecting Large Language Models: A Hegelian Dialectical Approach [13.910371970437708]
哲学的なレンズによるNLPの探索は、計算手法と古典的な哲学の学派を結びつけることで、研究者の目を引くようになった。本稿では, LLMの自己回帰に対するヘーゲル弁証法に触発された哲学的アプローチを紹介し, 自己弁証的アプローチを用いて内的批判をエミュレートし, 矛盾点を解消して新たなアイデアを合成する。我々の実験は、新しいアイデアを生み出すことを約束し、将来の研究の足場を提供する。
論文参考訳（メタデータ） (2025-01-24T20:54:29Z)
Good Idea or Not, Representation of LLM Could Tell [86.36317971482755]
我々は、大規模言語モデルの知識を活用し、科学的アイデアのメリットを評価することを目的としたアイデアアセスメントに焦点をあてる。我々は、このタスクに対する様々なアプローチのパフォーマンスを訓練し評価するために、細心の注意を払って設計された、フルテキストを持つ約4万の原稿からベンチマークデータセットをリリースする。その結果, 大規模言語モデルの表現は, 生成出力よりもアイデアの価値を定量化する可能性が高いことが示唆された。
論文参考訳（メタデータ） (2024-09-07T02:07:22Z)
A Survey on Natural Language Counterfactual Generation [7.022371235308068]
自然言語のカウンターファクト生成は、修正されたテキストが別のクラスに分類されるように、与えられたテキストを最小限に修正することを目的としている。生成手法を4つのグループに体系的に分類し、生成品質を評価するための指標を要約する新しい分類法を提案する。
論文参考訳（メタデータ） (2024-07-04T15:13:59Z)
Information Theoretic Text-to-Image Alignment [49.396917351264655]
本稿では,ステア画像生成のための情報理論アライメント尺度を用いた新しい手法を提案する。提案手法は最先端の手法よりも優れているが,MIを推定するためには事前学習されたデノナイジングネットワークを必要としない。
論文参考訳（メタデータ） (2024-05-31T12:20:02Z)
ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、大規模言語モデルによる研究アイデア作成エージェントである。科学文献に基づいて繰り返し精製しながら、問題、方法、実験設計を生成する。我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文参考訳（メタデータ） (2024-04-11T13:36:29Z)
Grounded Intuition of GPT-Vision's Abilities with Scientific Images [44.44139684561664]
我々は、GPT-Visionの「接地された直観」を開発するために、多くの人が直感的に試みてきた過程を定式化する。本稿では,GPT-Visionが特にプロンプトに敏感であることを示す。我々の手法と分析は、GPT-Visionがいかにして情報にアクセスしやすくできるかを明らかにしながら、研究者が新しいモデルの基盤となる直感を高めるのに役立つことを目的としている。
論文参考訳（メタデータ） (2023-11-03T17:53:43Z)
Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.40483334131271]
本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文参考訳（メタデータ） (2023-09-06T05:19:41Z)
Exploring and Verbalizing Academic Ideas by Concept Co-occurrence [42.16213986603552]
本研究は,学術的アイデアインスピレーションのための概念共起に基づく枠組みを考案する。我々は20の分野やトピックから概念の共起関係に基づき、進化する概念グラフを構築する。我々は、共起励磁法と呼ばれる新しいデータ構造に基づくアイデアの記述を生成する。
論文参考訳（メタデータ） (2023-06-04T07:01:30Z)
A Survey on Non-Autoregressive Generation for Neural Machine Translation and Beyond [145.43029264191543]
非自己回帰(NAR)生成は推論を高速化するために機械翻訳(NMT)で最初に提案される。 NAR生成は機械翻訳を著しく加速させるが、自己回帰(AR)生成の推論は翻訳精度を犠牲にする。 NAR生成とAR生成の精度ギャップを埋めるために、多くの新しいモデルとアルゴリズムが設計/提案されている。
論文参考訳（メタデータ） (2022-04-20T07:25:22Z)
The Rediscovery Hypothesis: Language Models Need to Meet Linguistics [8.293055016429863]
現代言語モデルの性能向上に言語知識が必須条件であるかどうかを検討する。その結果, 言語構造を探索した場合, かなり圧縮されるが, 事前学習目的によく適合する言語モデルは, 良好なスコアを保っていることがわかった。この結果は再発見仮説を支持し,本論文の第2の貢献である言語モデル目標と言語情報との関連性に関する情報論的枠組みを導出する。
論文参考訳（メタデータ） (2021-03-02T15:57:39Z)
Improving Adversarial Text Generation by Modeling the Distant Future [155.83051741029732]
テキスト計画手法を考察し、上記の問題を緩和するためのモデルに基づく模倣学習手法を提案する。本稿では,より長い地平線上の生成過程に焦点をあてる新しいガイドネットワークを提案する。
論文参考訳（メタデータ） (2020-05-04T05:45:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。