論文の概要: Small Language Models Offer Significant Potential for Science Community
- arxiv url: http://arxiv.org/abs/2510.18890v1
- Date: Sat, 18 Oct 2025 07:25:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:14.139447
- Title: Small Language Models Offer Significant Potential for Science Community
- Title(参考訳): 小さな言語モデルが科学コミュニティに重要な可能性をもたらす
- Authors: Jian Zhang,
- Abstract要約: MiniLMは、広範な地学文献から正確で、迅速で、費用対効果の高い情報検索の実現可能性を評価するためのフレームワークである。
約7700万の高品質な文のキュレートされたコーパスは、95の先進的な査読された地球科学雑誌から抽出された。
MiniLMは、事実検索や画像検索、トレンド分析、矛盾分析、教育目的など、地球科学コミュニティにおいて大きな可能性を秘めている。
- 参考スコア(独自算出の注目度): 5.061460306853287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in natural language processing, particularly with large language models (LLMs), are transforming how scientists engage with the literature. While the adoption of LLMs is increasing, concerns remain regarding potential information biases and computational costs. Rather than LLMs, I developed a framework to evaluate the feasibility of precise, rapid, and cost-effective information retrieval from extensive geoscience literature using freely available small language models (MiniLMs). A curated corpus of approximately 77 million high-quality sentences, extracted from 95 leading peer-reviewed geoscience journals such as Geophysical Research Letters and Earth and Planetary Science Letters published during years 2000 to 2024, was constructed. MiniLMs enable a computationally efficient approach for extracting relevant domain-specific information from these corpora through semantic search techniques and sentence-level indexing. This approach, unlike LLMs such as ChatGPT-4 that often produces generalized responses, excels at identifying substantial amounts of expert-verified information with established, multi-disciplinary sources, especially for information with quantitative findings. Furthermore, by analyzing emotional tone via sentiment analysis and topical clusters through unsupervised clustering within sentences, MiniLM provides a powerful tool for tracking the evolution of conclusions, research priorities, advancements, and emerging questions within geoscience communities. Overall, MiniLM holds significant potential within the geoscience community for applications such as fact and image retrievals, trend analyses, contradiction analyses, and educational purposes.
- Abstract(参考訳): 近年の自然言語処理,特に大規模言語モデル(LLM)の進歩は,科学者の文学への関わり方を変えつつある。
LLMの採用は増加しているが、潜在的な情報バイアスや計算コストに関する懸念は残っている。
LLM ではなく,自由な小言語モデル (MiniLMs) を用いて,広い地学文献から正確かつ迅速かつ費用対効果の高い情報検索の実現可能性を評価する枠組みを開発した。
2000年から2024年にかけて出版された地球物理研究レターや地球惑星科学レターといった、95の査読された地球科学ジャーナルから抽出された、約7700万件の高品質な文のキュレーションコーパスが作られた。
MiniLMは、セマンティックサーチ技術と文レベルの索引付けを通じて、これらのコーパスから関連するドメイン固有情報を抽出する、計算的に効率的なアプローチを可能にする。
このアプローチは、一般化された応答をしばしば生成するChatGPT-4のようなLCMとは異なり、確立された複数の学際的な情報源、特に定量的な知見を持つ情報に対して、相当量の専門家が検証した情報を特定するのに優れている。
さらに、感情分析や、文章内の教師なしのクラスタリングを通じて、感情的トーンや話題的クラスタを分析することにより、MiniLMは、結論の進化、研究の優先順位、進歩、地学コミュニティ内の新たな疑問を追跡する強力なツールを提供する。
全体として、MiniLMは、事実検索や画像検索、トレンド分析、矛盾分析、教育目的など、地球科学コミュニティにおいて大きな可能性を秘めている。
関連論文リスト
- OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。
我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文 参考訳(メタデータ) (2024-06-16T08:03:24Z) - SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [97.31347312130119]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning)は、トレーニングと評価のための137K命令フォローインスタンスのデータセットで、54のタスクをカバーする。
これらのタスクは、情報抽出、要約、質問応答、クレーム検証、分類の5つの中核的な科学文献理解能力にまたがる。
SciRIFFは、さまざまな科学分野にわたる研究文献から情報を抽出し、合成するための、完全に専門家によって書かれた高品質な命令追跡データセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - SciAssess: Benchmarking LLM Proficiency in Scientific Literature Analysis [26.111514038691837]
SciAssessは、科学文献分析におけるLarge Language Models(LLM)の総合的な評価のためのベンチマークである。
記憶機能評価(L1)、記憶機能評価(L2)、分析・推論機能評価(L3)により,LLMの有効性を徹底的に評価することを目的とする。
それは、生物学、化学、材料、医学など、様々な科学分野から引き出された様々なタスクを含んでいる。
論文 参考訳(メタデータ) (2024-03-04T12:19:28Z) - Had enough of experts? Quantitative knowledge retrieval from large language models [4.091195951668217]
大規模言語モデル(LLM)は、説得力のある自然言語配列を生成する能力について広く研究されている。
我々は、専門家のような事前知識を抽出し、欠落したデータを出力することで、LLMを活用してベイズモデルを強化するフレームワークを導入する。
論文 参考訳(メタデータ) (2024-02-12T16:32:37Z) - Scientific Large Language Models: A Survey on Biological & Chemical Domains [47.97810890521825]
大規模言語モデル(LLM)は、自然言語理解の強化において、変革的な力として現れてきた。
LLMの応用は従来の言語境界を超えて、様々な科学分野で開発された専門的な言語システムを含んでいる。
AI for Science(AI for Science)のコミュニティで急成長している分野として、科学LLMは包括的な探査を義務付けている。
論文 参考訳(メタデータ) (2024-01-26T05:33:34Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。