論文の概要: CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature
- arxiv url: http://arxiv.org/abs/2505.20779v2
- Date: Wed, 28 May 2025 08:41:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 12:33:41.767407
- Title: CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature
- Title(参考訳): CHIMERA:科学文献におけるアイデア再結合の知識基盤
- Authors: Noy Sternlicht, Tom Hope,
- Abstract要約: 組換え例の大規模知識ベース(KB)であるCHIMERAを構築した。
ChiMERAは、科学者がどのようにして概念を再結合し、異なる領域からインスピレーションを得るかを探索するために使用することができる。
我々はCHIMERAを分析し、AIの異なるサブ領域における組換えの性質を探索する。
- 参考スコア(独自算出の注目度): 7.086262532457526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A hallmark of human innovation is the process of recombination -- creating original ideas by integrating elements of existing mechanisms and concepts. In this work, we automatically mine the scientific literature and build CHIMERA: a large-scale knowledge base (KB) of recombination examples. CHIMERA can be used to empirically explore at scale how scientists recombine concepts and take inspiration from different areas, or to train supervised machine learning models that learn to predict new creative cross-domain directions. To build this KB, we present a novel information extraction task of extracting recombination from scientific paper abstracts, collect a high-quality corpus of hundreds of manually annotated abstracts, and use it to train an LLM-based extraction model. The model is applied to a large corpus of papers in the AI domain, yielding a KB of over 28K recombination examples. We analyze CHIMERA to explore the properties of recombination in different subareas of AI. Finally, we train a scientific hypothesis generation model using the KB, which predicts new recombination directions that real-world researchers find inspiring. Our data and code are available at https://github.com/noy-sternlicht/CHIMERA-KB
- Abstract(参考訳): 人間の革新の目印は、再結合のプロセスであり、既存のメカニズムと概念の要素を統合することによって、独自のアイデアを生み出す。
本研究では,科学文献を自動的にマイニングし,組換え事例の大規模知識ベース(KB)であるCHIMERAを構築する。
CHIMERAは、科学者が概念を再結合し、異なる領域からインスピレーションを得る方法や、新しい創造的なクロスドメインの方向を予測することを学ぶ教師付き機械学習モデルを訓練するために、経験的に使用することができる。
このKBを構築するために、科学論文の要約から組換えを抽出し、数百の注釈付き要約の高品質なコーパスを収集し、LLMに基づく抽出モデルを訓練する新しい情報抽出タスクを提案する。
このモデルは、AIドメイン内の大量の論文に応用され、28K以上の組換え例のKBが生成される。
我々はCHIMERAを分析し、AIの異なるサブ領域における組換えの性質を探索する。
最後に、KBを用いて科学的仮説生成モデルを訓練し、現実の研究者が刺激する新たな組換え方向を予測する。
私たちのデータとコードはhttps://github.com/noy-sternlicht/CHIMERA-KBで公開されています。
関連論文リスト
- The Discovery Engine: A Framework for AI-Driven Synthesis and Navigation of Scientific Knowledge Landscapes [0.0]
本稿では,文献を科学的領域の統一的,計算的に抽出可能な表現に変換するフレームワークであるDiscovery Engineを紹介する。
Discovery Engineは、AIが強化した科学調査と発見の加速のための新しいパラダイムを提供する。
論文 参考訳(メタデータ) (2025-05-23T05:51:34Z) - A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.43992456058541]
画像復元(IR)とは、ノイズ、ぼかし、気象効果などの劣化を除去しながら、画像の視覚的品質を改善する過程である。
従来のIR手法は、一般的に特定の種類の劣化をターゲットとしており、複雑な歪みを伴う現実のシナリオにおいて、その効果を制限している。
オールインワン画像復元(AiOIR)パラダイムが登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-10-19T11:11:09Z) - Mitigating Copy Bias in In-Context Learning through Neuron Pruning [74.91243772654519]
大規模言語モデル(LLM)は、コンテキスト内学習能力に目を見張るものはほとんどない。
それらは、基礎となるパターンを学ぶ代わりに、提供された例から回答をコピーする。
このような複写バイアスを軽減するための,新しい簡易な手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T07:18:16Z) - Scideator: Human-LLM Scientific Idea Generation Grounded in Research-Paper Facet Recombination [23.48126633604684]
Scideatorは、大きな言語モデルに基づいた混合開始型アイデアツールである。
科学論文からファセットをインタラクティブに組み換えることで、アイデアスペースを探索することができる。
また、重複する文献を検索し、アイデアの新規性を評価することで、アイデアの独創性を評価するのにも役立ちます。
論文 参考訳(メタデータ) (2024-09-23T00:09:34Z) - Automatic Discovery of Visual Circuits [66.99553804855931]
本稿では,視覚モデルにおける視覚的概念の認識の基盤となる計算グラフのサブグラフを抽出するスケーラブルな手法について検討する。
提案手法は, モデル出力に因果的に影響を及ぼす回路を抽出し, これらの回路を編集することで, 敵攻撃から大きな事前学習モデルを守ることができることがわかった。
論文 参考訳(メタデータ) (2024-04-22T17:00:57Z) - BertNet: Harvesting Knowledge Graphs with Arbitrary Relations from
Pretrained Language Models [65.51390418485207]
本稿では,事前学習したLMから任意の関係を持つ大規模KGを抽出する手法を提案する。
関係定義の最小限の入力により、アプローチは膨大な実体対空間を効率的に探索し、多様な正確な知識を抽出する。
我々は、異なるLMから400以上の新しい関係を持つKGを収穫するためのアプローチを展開している。
論文 参考訳(メタデータ) (2022-06-28T19:46:29Z) - AIGenC: An AI generalisation model via creativity [1.933681537640272]
本稿では,創造性に関する認知理論に触発された計算モデル(AIGenC)を紹介する。
人工エージェントが変換可能な表現を学習、使用、生成するために必要なコンポーネントを配置する。
本稿では, 人工エージェントの配当効率を向上するモデルの有効性について論じる。
論文 参考訳(メタデータ) (2022-05-19T17:43:31Z) - Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks [53.09649785009528]
本稿では,新しいモデルを得るためのトレーニングを必要としないパラダイムについて検討する。
生体視覚系における受容野にインスパイアされたCNNの誕生と同様、モデル分解と組み立てを提案する。
モデル組立には、特定のタスクに適した新しいモデルを構築するために、アライメントパディング戦略とパラメータスケーリング戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T05:27:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。