論文の概要: SCI-IDEA: Context-Aware Scientific Ideation Using Token and Sentence Embeddings
- arxiv url: http://arxiv.org/abs/2503.19257v1
- Date: Tue, 25 Mar 2025 01:37:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 16:54:40.642892
- Title: SCI-IDEA: Context-Aware Scientific Ideation Using Token and Sentence Embeddings
- Title(参考訳): SCI-IDEA:TokenとSentence Embeddingを用いた文脈認識科学思想
- Authors: Farhana Keya, Gollam Rabby, Prasenjit Mitra, Sahar Vahdati, Sören Auer, Yaser Jaradeh,
- Abstract要約: SCI-IDEA は LLM のプロンプト戦略と Aha Moment 検出を, アイデアの洗練に活用するフレームワークである。
実験では、SCI-IDEAの有効性を評価し、6.84、6.86、6.89、および6.84(新規性、興奮、実現可能性、有効性)の平均スコアを達成した。
また、知的信用、潜在的な誤用、人間の創造性とAIによる思考のバランスといった倫理的考察にも取り組んでいます。
- 参考スコア(独自算出の注目度): 3.8267663001364847
- License:
- Abstract: Every scientific discovery starts with an idea inspired by prior work, interdisciplinary concepts, and emerging challenges. Recent advancements in large language models (LLMs) trained on scientific corpora have driven interest in AI-supported idea generation. However, generating context-aware, high-quality, and innovative ideas remains challenging. We introduce SCI-IDEA, a framework that uses LLM prompting strategies and Aha Moment detection for iterative idea refinement. SCI-IDEA extracts essential facets from research publications, assessing generated ideas on novelty, excitement, feasibility, and effectiveness. Comprehensive experiments validate SCI-IDEA's effectiveness, achieving average scores of 6.84, 6.86, 6.89, and 6.84 (on a 1-10 scale) across novelty, excitement, feasibility, and effectiveness, respectively. Evaluations employed GPT-4o, GPT-4.5, DeepSeek-32B (each under 2-shot prompting), and DeepSeek-70B (3-shot prompting), with token-level embeddings used for Aha Moment detection. Similarly, it achieves scores of 6.87, 6.86, 6.83, and 6.87 using GPT-4o under 5-shot prompting, GPT-4.5 under 3-shot prompting, DeepSeek-32B under zero-shot chain-of-thought prompting, and DeepSeek-70B under 5-shot prompting with sentence-level embeddings. We also address ethical considerations such as intellectual credit, potential misuse, and balancing human creativity with AI-driven ideation. Our results highlight SCI-IDEA's potential to facilitate the structured and flexible exploration of context-aware scientific ideas, supporting innovation while maintaining ethical standards.
- Abstract(参考訳): すべての科学的発見は、先行研究、学際的概念、そして新たな課題にインスパイアされたアイデアから始まります。
科学コーパスで訓練された大規模言語モデル(LLM)の最近の進歩は、AIによるアイデア生成への関心を喚起している。
しかし、コンテキスト対応、高品質、革新的なアイデアを生み出すことは依然として困難である。
SCI-IDEA は LLM のプロンプト戦略と Aha Moment 検出を反復的アイデアの洗練に利用するフレームワークである。
SCI-IDEAは研究出版物から必須のファセットを抽出し、新規性、興奮、実現可能性、有効性に関する創発的アイデアを評価する。
総合的な実験により、SCI-IDEAの有効性が検証され、それぞれ6.84、6.86、6.89、および6.84(それぞれ1-10スケール)が新規性、興奮性、実現可能性、有効性で達成された。
GPT-4o、GPT-4.5、DeepSeek-32B(いずれも2ショットプロンプト)、DeepSeek-70B(3ショットプロンプト)、トークンレベルの埋め込みをAha Moment検出に使用した。
同様に、5ショットプロンプトで6.87, 6.86, 6.83, 6.87, 5ショットプロンプトでGPT-4o, 3ショットプロンプトでGPT-4.5, ゼロショットチェインオブシントプロンプトでDeepSeek-32B, 文レベルの埋め込みで5ショットプロンプトでDeepSeek-70Bを達成している。
また、知的信用、潜在的な誤用、人間の創造性とAIによる思考のバランスといった倫理的考察にも取り組んでいます。
本研究は,SCI-IDEAが環境に配慮した科学的概念の構造化・柔軟な探索を促進し,倫理基準を維持しつつイノベーションを支援する可能性を強調した。
関連論文リスト
- Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation [58.064940977804596]
多くの新しいAIモデルとツールが提案され、世界中の研究者や学者が研究をより効果的かつ効率的に実施できるようにすることを約束している。
これらのツールの欠点と誤用の可能性に関する倫理的懸念は、議論の中で特に顕著な位置を占める。
論文 参考訳(メタデータ) (2025-02-07T18:26:45Z) - Can Large Language Models Unlock Novel Scientific Research Ideas? [21.225042379570365]
大規模言語モデル(LLM)と公開可能なChatGPTは、人工知能を人々の日常生活に組み込む上で、大きな転換点となっている。
本研究は,研究論文からの情報に基づく新たな研究アイデアを創出する上でのLLMの能力について考察する。
論文 参考訳(メタデータ) (2024-09-10T03:26:42Z) - Good Idea or Not, Representation of LLM Could Tell [86.36317971482755]
我々は、大規模言語モデルの知識を活用し、科学的アイデアのメリットを評価することを目的としたアイデアアセスメントに焦点をあてる。
我々は、このタスクに対する様々なアプローチのパフォーマンスを訓練し評価するために、細心の注意を払って設計された、フルテキストを持つ約4万の原稿からベンチマークデータセットをリリースする。
その結果, 大規模言語モデルの表現は, 生成出力よりもアイデアの価値を定量化する可能性が高いことが示唆された。
論文 参考訳(メタデータ) (2024-09-07T02:07:22Z) - The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery [14.465756130099091]
本稿では,完全自動科学的発見のための最初の包括的枠組みについて述べる。
我々は、新しい研究アイデアを生成し、コードを書き、実験を実行し、結果を視覚化し、その結果を説明するThe AI Scientistを紹介します。
原則として、このプロセスは、人間の科学コミュニティのように行動しながら、オープンな方法でアイデアを反復的に発展させることができる。
論文 参考訳(メタデータ) (2024-08-12T16:58:11Z) - DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.74065769505137]
本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文 参考訳(メタデータ) (2024-06-10T20:08:44Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - Interesting Scientific Idea Generation using Knowledge Graphs and LLMs: Evaluations with 100 Research Group Leaders [0.6906005491572401]
我々は,5800万件の研究論文と大規模言語モデルを用いて研究アイデアを生成するSciMuseを紹介した。
我々は、100以上の研究グループのリーダーが興味に基づいて4,400以上のパーソナライズされたアイデアをランク付けする大規模な評価を行う。
このデータにより,(1)人間の評価に基づいて訓練された教師付きニューラルネットワーク,(2)大規模言語モデルを用いた教師なしゼロショットランキングを用いて,研究の関心を予測できる。
論文 参考訳(メタデータ) (2024-05-27T11:00:51Z) - Prompting Diverse Ideas: Increasing AI Idea Variance [0.0]
この論文は、アイデア生成プロセスの生産性と品質を高めるために、人工知能を活用することへの新たな関心を掘り下げるものである。
これまでの研究によると、AIのアイデアの平均品質は非常に高い。
以前の研究では、AIベースのブレインストーミングが、アイデアの十分な分散を生み出すことができないことも指摘されている。
論文 参考訳(メタデータ) (2024-01-27T21:02:50Z) - Can GPT-4 Perform Neural Architecture Search? [56.98363718371614]
ニューラルアーキテクチャサーチ(NAS)におけるGPT-4の可能性について検討する。
提案手法である textbfGPT-4 textbfEnhanced textbfNeural archtextbfItecttextbfUre textbfSearch (GENIUS)
我々は、いくつかのベンチマークでGENIUSを評価し、既存のNAS技術と比較し、その効果を実証した。
論文 参考訳(メタデータ) (2023-04-21T14:06:44Z) - Sparks of Artificial General Intelligence: Early experiments with GPT-4 [66.1188263570629]
OpenAIが開発したGPT-4は、前例のない規模の計算とデータを使って訓練された。
我々は, GPT-4が数学, コーディング, ビジョン, 医学, 法学, 心理学などにまたがる, 新規で困難な課題を解くことを実証した。
我々は、GPT-4を人工知能(AGI)システムの早期(まだ未完成)版と見なすことができると信じている。
論文 参考訳(メタデータ) (2023-03-22T16:51:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。