論文の概要: LLMs as Potential Brainstorming Partners for Math and Science Problems
- arxiv url: http://arxiv.org/abs/2310.10677v1
- Date: Tue, 10 Oct 2023 21:16:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 02:20:48.240549
- Title: LLMs as Potential Brainstorming Partners for Math and Science Problems
- Title(参考訳): 数学と科学問題のためのブレインストーミングパートナーとしてのLSM
- Authors: Sophia Gu
- Abstract要約: 現在の人間と機械の知的なコラボレーションと複雑な数学と科学の問題の解決の間には、依然として大きな亀裂がある。
これは、Large Language Models (LLMs) の最近の進歩によるものである。
我々は、人間との集団脳卒中において、現在最先端のLDM(特にGPT-4)の能力と限界を探求する包括的ケーススタディを実施している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the recent rise of widely successful deep learning models, there is
emerging interest among professionals in various math and science communities
to see and evaluate the state-of-the-art models' abilities to collaborate on
finding or solving problems that often require creativity and thus
brainstorming. While a significant chasm still exists between current
human-machine intellectual collaborations and the resolution of complex math
and science problems, such as the six unsolved Millennium Prize Problems, our
initial investigation into this matter reveals a promising step towards
bridging the divide. This is due to the recent advancements in Large Language
Models (LLMs). More specifically, we conduct comprehensive case studies to
explore both the capabilities and limitations of the current state-of-the-art
LLM, notably GPT-4, in collective brainstorming with humans.
- Abstract(参考訳): 近年のディープラーニングモデルの普及に伴い、様々な数学や科学の分野の専門家の間で、創造性やブレインストーミングを必要とする問題の発見や解決に協力する最先端のモデルの能力を見極め、評価することへの関心が高まっている。
現在の人間と機械の知的コラボレーションと、6つの未解決ミレニアム賞問題のような複雑な数学と科学の問題の解決との間には、大きな亀裂が残っているが、この問題に関する初期の調査は、分割を橋渡しするための有望なステップを示している。
これは、最近のLarge Language Models (LLM) の進歩によるものである。
より具体的には、人間との集団ブレインストーミングにおいて、現在最先端のLCM(特にGPT-4)の能力と限界を探求する包括的ケーススタディを実施している。
関連論文リスト
- Assessing the Creativity of LLMs in Proposing Novel Solutions to Mathematical Problems [9.162206328913237]
本研究では,Large Language Models (LLMs) の数学的推論における創造的可能性について検討する。
本稿では,中学のカリキュラムからオリンピックレベルの競技までを含む新しいフレームワークとベンチマークであるCreativeMathを紹介する。
実験の結果, LLMは標準的な数学的なタスクではうまく機能するが, 創造的な問題解決能力は著しく異なることがわかった。
論文 参考訳(メタデータ) (2024-10-24T00:12:49Z) - MathOdyssey: Benchmarking Mathematical Problem-Solving Skills in Large Language Models Using Odyssey Math Data [20.31528845718877]
大規模言語モデル(LLM)は、非常に高度な自然言語理解を持ち、強力な問題解決能力を示した。
本稿では,新たに開発された"MathOdyssey"データセットを用いて,LLMの数学的問題解決能力について検討する。
論文 参考訳(メタデータ) (2024-06-26T13:02:35Z) - Evaluating Large Vision-and-Language Models on Children's Mathematical Olympiads [74.54183505245553]
ジョイントビジョンとテキスト推論のためのAI能力の体系的分析は、現在の科学文献に欠けている。
我々は,子どものオリンピアードからのビジュオ言語問題を用いて,その数学的およびアルゴリズム的推論能力に基づいて,最先端のLVLMを評価した。
以上の結果から,近代のLVLMは,高学年の問題解決において,より強力な推論能力を示す一方で,幼児向けの問題に正しく答える基盤が欠如していることが示唆された。
論文 参考訳(メタデータ) (2024-06-22T05:04:39Z) - Beyond Lines and Circles: Unveiling the Geometric Reasoning Gap in Large
Language Models [28.819559978685806]
大規模言語モデル(LLM)は、数学的およびアルゴリズム的なタスクにおいて、絶え間なく増加する能力を示すが、その幾何学的推論スキルは過小評価されている。
構成的幾何学的問題解決におけるLLMの能力について検討する。
我々の研究は、同様の分野での多くの成功にもかかわらず、最先端のLLMがこの分野で直面している顕著な課題を明らかにします。
論文 参考訳(メタデータ) (2024-02-06T10:37:21Z) - Large Language Models for Mathematical Reasoning: Progresses and Challenges [15.925641169201747]
大規模言語モデル (LLM) は数学問題の自動解法を指向している。
この調査は4つの重要な次元に対処する試みである。
これは、この急速に発展する分野における現在の状況、成果、将来の課題に関する全体論的な視点を提供する。
論文 参考訳(メタデータ) (2024-01-31T20:26:32Z) - Adapting Large Language Models for Education: Foundational Capabilities, Potentials, and Challenges [60.62904929065257]
大規模言語モデル(LLM)は、個々の要求を解釈することでこの問題を解決する可能性を提供する。
本稿では, 数学, 文章, プログラミング, 推論, 知識に基づく質問応答など, 教育能力に関する最近のLLM研究を概観する。
論文 参考訳(メタデータ) (2023-12-27T14:37:32Z) - MacGyver: Are Large Language Models Creative Problem Solvers? [87.70522322728581]
本稿では, 現代LLMの創造的問題解決能力について, 制約付き環境下で検討する。
我々は1,600以上の実世界の問題からなる自動生成データセットであるMACGYVERを作成する。
我々はLLMと人間の両方にコレクションを提示し、それらの問題解決能力を比較して比較する。
論文 参考訳(メタデータ) (2023-11-16T08:52:27Z) - SciBench: Evaluating College-Level Scientific Problem-Solving Abilities of Large Language Models [70.5763210869525]
拡張ベンチマークスイートSciBench for Large Language Model (LLM)を導入する。
SciBenchには、数学、化学、物理学の分野から、さまざまな大学レベルの科学的問題を含むデータセットが含まれている。
その結果、現在のLLMは満足のいく性能を達成できないことが判明し、全体のスコアは43.22%に過ぎなかった。
論文 参考訳(メタデータ) (2023-07-20T07:01:57Z) - Scientia Potentia Est -- On the Role of Knowledge in Computational
Argumentation [52.903665881174845]
本稿では,計算議論に必要な知識のピラミッドを提案する。
この分野におけるこれらのタイプの役割と統合について,その技術の現状を簡潔に論じる。
論文 参考訳(メタデータ) (2021-07-01T08:12:41Z) - Understanding the Usability Challenges of Machine Learning In
High-Stakes Decision Making [67.72855777115772]
機械学習(ML)は、多種多様な成長を続ける一連のドメインに適用されている。
多くの場合、MLやデータサイエンスの専門知識を持たないドメインの専門家は、ML予測を使用してハイステークな意思決定を行うように求められます。
児童福祉スクリーニングにおけるMLユーザビリティの課題について,児童福祉スクリーニング者との一連のコラボレーションを通じて検討する。
論文 参考訳(メタデータ) (2021-03-02T22:50:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。