論文の概要: CHIMERA: A Knowledge Base of Scientific Idea Recombinations for Research Analysis and Ideation
- arxiv url: http://arxiv.org/abs/2505.20779v4
- Date: Tue, 29 Jul 2025 15:30:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 14:59:51.171006
- Title: CHIMERA: A Knowledge Base of Scientific Idea Recombinations for Research Analysis and Ideation
- Title(参考訳): CHIMERA:研究分析と思考のための科学思想再結合の知識ベース
- Authors: Noy Sternlicht, Tom Hope,
- Abstract要約: CHIMERAは28K以上の組換え例の大規模な知識ベースである。
ChiMERAは、科学者がどのように概念を再結合し、異なる領域からインスピレーションを引き出すかを実証分析することを可能にする。
我々は2つの応用を通してCHIMERAの実用性を示す。
- 参考スコア(独自算出の注目度): 7.086262532457526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A hallmark of human innovation is recombination -- the creation of novel ideas by integrating elements from existing concepts and mechanisms. In this work, we introduce CHIMERA, a large-scale Knowledge Base (KB) of over 28K recombination examples automatically mined from the scientific literature. CHIMERA enables large-scale empirical analysis of how scientists recombine concepts and draw inspiration from different areas, and enables training models that propose novel, cross-disciplinary research directions. To construct this KB, we define a new information extraction task: identifying recombination instances in scientific abstracts. We curate a high-quality, expert-annotated dataset and use it to fine-tune a large language model, which we apply to a broad corpus of AI papers. We showcase the utility of CHIMERA through two applications. First, we analyze patterns of recombination across AI subfields. Second, we train a scientific hypothesis generation model using the KB, showing that it can propose novel research directions that researchers rate as inspiring. We release our data and code at https://github.com/noy-sternlicht/CHIMERA-KB.
- Abstract(参考訳): 人間の革新の目印は再結合(recombination)であり、既存の概念やメカニズムから要素を統合することで、新しいアイデアを創造する。
本研究では,科学文献から自動的に抽出された28K以上の組換え例の大規模知識ベース(KB)であるCHIMERAを紹介する。
CHIMERAは、科学者が概念を再結合し、異なる領域からインスピレーションを引き出す方法の大規模な実証分析を可能にし、新しい学際的な研究方向を提案するトレーニングモデルを可能にする。
このKBを構築するために、我々は新しい情報抽出タスク、すなわち科学的な抽象論における組換えのインスタンスを識別するタスクを定義した。
高品質で専門家による注釈付きデータセットをキュレートし、それを大きな言語モデルを微調整するために使用し、AI論文の幅広いコーパスに適用します。
我々は2つの応用を通してCHIMERAの実用性を示す。
まず、AIサブフィールド間の組換えパターンを分析する。
第2に、KBを用いて科学的仮説生成モデルを訓練し、研究者がインスピレーションとして評価する新たな研究方向性を提案する。
データとコードはhttps://github.com/noy-sternlicht/CHIMERA-KBで公開しています。
関連論文リスト
- The Discovery Engine: A Framework for AI-Driven Synthesis and Navigation of Scientific Knowledge Landscapes [0.0]
本稿では,文献を科学的領域の統一的,計算的に抽出可能な表現に変換するフレームワークであるDiscovery Engineを紹介する。
Discovery Engineは、AIが強化した科学調査と発見の加速のための新しいパラダイムを提供する。
論文 参考訳(メタデータ) (2025-05-23T05:51:34Z) - A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.43992456058541]
画像復元(IR)とは、ノイズ、ぼかし、気象効果などの劣化を除去しながら、画像の視覚的品質を改善する過程である。
従来のIR手法は、一般的に特定の種類の劣化をターゲットとしており、複雑な歪みを伴う現実のシナリオにおいて、その効果を制限している。
オールインワン画像復元(AiOIR)パラダイムが登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-10-19T11:11:09Z) - Mitigating Copy Bias in In-Context Learning through Neuron Pruning [74.91243772654519]
大規模言語モデル(LLM)は、コンテキスト内学習能力に目を見張るものはほとんどない。
それらは、基礎となるパターンを学ぶ代わりに、提供された例から回答をコピーする。
このような複写バイアスを軽減するための,新しい簡易な手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T07:18:16Z) - Scideator: Human-LLM Scientific Idea Generation Grounded in Research-Paper Facet Recombination [23.48126633604684]
Scideatorは、大きな言語モデルに基づいた混合開始型アイデアツールである。
科学論文からファセットをインタラクティブに組み換えることで、アイデアスペースを探索することができる。
また、重複する文献を検索し、アイデアの新規性を評価することで、アイデアの独創性を評価するのにも役立ちます。
論文 参考訳(メタデータ) (2024-09-23T00:09:34Z) - Automatic Discovery of Visual Circuits [66.99553804855931]
本稿では,視覚モデルにおける視覚的概念の認識の基盤となる計算グラフのサブグラフを抽出するスケーラブルな手法について検討する。
提案手法は, モデル出力に因果的に影響を及ぼす回路を抽出し, これらの回路を編集することで, 敵攻撃から大きな事前学習モデルを守ることができることがわかった。
論文 参考訳(メタデータ) (2024-04-22T17:00:57Z) - BertNet: Harvesting Knowledge Graphs with Arbitrary Relations from
Pretrained Language Models [65.51390418485207]
本稿では,事前学習したLMから任意の関係を持つ大規模KGを抽出する手法を提案する。
関係定義の最小限の入力により、アプローチは膨大な実体対空間を効率的に探索し、多様な正確な知識を抽出する。
我々は、異なるLMから400以上の新しい関係を持つKGを収穫するためのアプローチを展開している。
論文 参考訳(メタデータ) (2022-06-28T19:46:29Z) - AIGenC: An AI generalisation model via creativity [1.933681537640272]
本稿では,創造性に関する認知理論に触発された計算モデル(AIGenC)を紹介する。
人工エージェントが変換可能な表現を学習、使用、生成するために必要なコンポーネントを配置する。
本稿では, 人工エージェントの配当効率を向上するモデルの有効性について論じる。
論文 参考訳(メタデータ) (2022-05-19T17:43:31Z) - Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks [53.09649785009528]
本稿では,新しいモデルを得るためのトレーニングを必要としないパラダイムについて検討する。
生体視覚系における受容野にインスパイアされたCNNの誕生と同様、モデル分解と組み立てを提案する。
モデル組立には、特定のタスクに適した新しいモデルを構築するために、アライメントパディング戦略とパラメータスケーリング戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T05:27:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。