論文の概要: An LLM Driven Agent Framework for Automated Infrared Spectral Multi Task Reasoning
- arxiv url: http://arxiv.org/abs/2507.21471v1
- Date: Tue, 29 Jul 2025 03:20:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.566926
- Title: An LLM Driven Agent Framework for Automated Infrared Spectral Multi Task Reasoning
- Title(参考訳): 自動赤外分光マルチタスク推論のためのLCM駆動エージェントフレームワーク
- Authors: Zujie Xie, Zixuan Chen, Jiheng Liang, Xiangyang Yu, Ziru Yu,
- Abstract要約: 大規模言語モデル(LLM)は複雑な科学的推論に有望な可能性を提供する。
本研究は,低データ条件下での精度,自動赤外スペクトル解釈を実現することの課題に対処する。
本稿では、構造化文献知識ベース、自動スペクトル前処理、マルチタスク推論を統合したエンドツーエンドの大規模言語モデル駆動エージェントフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.934622388454071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared spectroscopy offers rapid, non destructive measurement of chemical and material properties but suffers from high dimensional, overlapping spectral bands that challenge conventional chemometric approaches. Emerging large language models (LLMs), with their capacity for generalization and reasoning, offer promising potential for automating complex scientific workflows. Despite this promise, their application in IR spectral analysis remains largely unexplored. This study addresses the critical challenge of achieving accurate, automated infrared spectral interpretation under low-data conditions using an LLM-driven framework. We introduce an end-to-end, large language model driven agent framework that integrates a structured literature knowledge base, automated spectral preprocessing, feature extraction, and multi task reasoning in a unified pipeline. By querying a curated corpus of peer reviewed IR publications, the agent selects scientifically validated routines. The selected methods transform each spectrum into low dimensional feature sets, which are fed into few shot prompt templates for classification, regression, and anomaly detection. A closed loop, multi turn protocol iteratively appends mispredicted samples to the prompt, enabling dynamic refinement of predictions. Across diverse materials: stamp pad ink, Chinese medicine, Pu'er tea, Citri Reticulatae Pericarpium and waste water COD datasets, the multi turn LLM consistently outperforms single turn inference, rivaling or exceeding machine learning and deep learning models under low data regimes.
- Abstract(参考訳): 赤外線分光法は化学的、物質的特性を迅速かつ非破壊的に測定するが、従来の化学的なアプローチに挑戦する高次元の重なり合ったスペクトルバンドに悩まされている。
一般化と推論の能力を備えた大規模言語モデル(LLM)の進化は、複雑な科学的ワークフローを自動化するための有望な可能性を提供する。
この約束にもかかわらず、IRスペクトル分析におけるそれらの応用はほとんど未解明のままである。
本研究は、LLM駆動のフレームワークを用いて、低データ条件下での高精度で自動化された赤外スペクトル解釈を実現するための重要な課題に対処する。
本稿では、構造化文献知識ベース、自動スペクトル前処理、特徴抽出、マルチタスク推論を統合パイプラインで統合したエンドツーエンドの大規模言語モデル駆動エージェントフレームワークを提案する。
ピアレビューIR出版物のキュレートされたコーパスをクエリすることで、エージェントは科学的に検証されたルーチンを選択する。
選択した手法は、各スペクトルを低次元の特徴集合に変換し、分類、回帰、異常検出のためのほとんどショットプロンプトテンプレートに入力する。
クローズドループ、マルチターンプロトコルは、誤って予測されたサンプルをプロンプトに繰り返し付加することで、予測の動的洗練を可能にする。
スタンプパッドインク、中国医学、Pu'er tea、Citri Reticulatae Pericarpium、および廃水CODデータセットなど、さまざまな素材で、マルチターンLLMは、低データ体制下での機械学習やディープラーニングモデルに匹敵する、あるいは超越した、シングルターン推論を一貫して上回ります。
関連論文リスト
- From Static Spectra to Operando Infrared Dynamics: Physics Informed Flow Modeling and a Benchmark [67.29937933325849]
Operando IR Predictionは、1つの静的スペクトルからスペクトル指紋の時間分解進化を予測することを目的としている。
OpIRSpec-7Kは、10の異なるバッテリーシステムにわたる7,118の高品質なサンプルで構成されている。
ABCCは最先端の静的、シーケンシャル、および生成的ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-20T18:58:43Z) - How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.286853421822705]
大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。
我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。
SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文 参考訳(メタデータ) (2026-01-09T20:08:42Z) - Unmasking Airborne Threats: Guided-Transformers for Portable Aerosol Mass Spectrometry [2.743898388459522]
MALDI-MS (Matrix Assisted Laser Desorption/Ionization Mass Spectrometry) は生体分子分析の基盤であり、独自の質量スペクトルによる病原体の正確な同定を提供する。
しかし、労働集約型試料調製とマルチショットスペクトル平均化に依存しているため、実験室の環境設定に制限されるため、リアルタイムの環境モニタリングには実用的ではない。
これらの制限は、新しいエアロゾルMALDI-MSシステムにおいて特に顕著であり、自律的なサンプリングは未知のエアロゾル分析のためにノイズスペクトルを生成する。
スペクトルを再定義するデータ駆動型フレームワークであるMass Spectral Dictionary-Guided Transformer(MS-DGFormer)を提案する。
論文 参考訳(メタデータ) (2025-11-21T17:45:00Z) - OASIS: A Deep Learning Framework for Universal Spectroscopic Analysis Driven by Novel Loss Functions [4.0097349146966925]
技術に依存しない自動スペクトル分析のための機械学習(ML)フレームワークを提案する。
OASISは、戦略的に設計された合成データセットでトレーニングされたモデルを通じて、その汎用性を達成する。
本研究は、高性能MLモデルを開発するための重要な資源効率戦略として、損失関数の最適化を強調した。
論文 参考訳(メタデータ) (2025-09-15T01:28:51Z) - IR-Agent: Expert-Inspired LLM Agents for Structure Elucidation from Infrared Spectra [27.70589578306254]
我々は、IRスペクトルから分子構造を解明するための新しいマルチエージェントフレームワークIR-Agentを提案する。
このフレームワークは、専門家主導のIR分析手順をエミュレートするために設計されており、本質的にはそうである。各エージェントは、IR解釈の特定の側面を専門とし、それらの補完的な役割は統合推論を可能にする。
論文 参考訳(メタデータ) (2025-08-22T06:07:28Z) - An Auditable Agent Platform For Automated Molecular Optimisation [0.0]
薬物発見は、データ、専門知識、ツールが散在すると、しばしば勢いを失う。
このループを短くするため、分子最適化を自動化するエージェントフレームワークを使用した階層的なツールを構築しました。
論文 参考訳(メタデータ) (2025-08-05T13:41:32Z) - SpectrumFM: Redefining Spectrum Cognition via Foundation Modeling [65.65474629224558]
本稿ではスペクトル認識のための新しいパラダイムを提供するスペクトルFMと呼ばれるスペクトル基盤モデルを提案する。
畳み込みニューラルネットワークを利用した革新的なスペクトルエンコーダを提案し、スペクトルデータにおける微細な局所信号構造と高レベルのグローバルな依存関係の両方を効果的に捕捉する。
2つの新しい自己教師型学習タスク、すなわちマスク付き再構成と次のスロット信号予測が、SpectrumFMの事前学習のために開発され、モデルがリッチで伝達可能な表現を学習できるようにする。
論文 参考訳(メタデータ) (2025-08-02T14:40:50Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization [80.09112808413133]
Mujicaは、質問をサブクエストの非循環グラフに分解するプランナーであり、検索と推論を通じて質問を解決するワーカーである。
MyGOは、従来のポリシー更新を勾配的いいねりの最大推定に置き換える、新しい強化学習手法である。
複数のデータセットにまたがる実験結果から,マルチホップQA性能向上における MujicaMyGO の有効性が示された。
論文 参考訳(メタデータ) (2025-05-20T18:33:03Z) - DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [54.79763887844838]
大規模言語モデル(LLM)と自律エージェントの統合は、自動推論とタスク実行を通じて科学的発見を促進する大きな可能性を秘めている。
本稿では,薬物発見におけるエンドツーエンド科学のために設計されたパラメータ化推論アーキテクチャを備えたLSMベースのエージェントシステムであるDrarmPilotを紹介する。
DrugPilot は ReAct や LoT のような最先端のエージェントよりも優れており、タスク完了率は98.0%、93.5%、64.0%である。
論文 参考訳(メタデータ) (2025-05-20T05:18:15Z) - A Multimodal Multi-Agent Framework for Radiology Report Generation [2.1477122604204433]
放射線診断レポート生成(RRG)は、医療画像から診断レポートを自動生成することを目的としている。
本稿では,段階的臨床推論ワークフローに適合するRRG用マルチモーダルマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-14T20:28:04Z) - LLM Agent Swarm for Hypothesis-Driven Drug Discovery [2.7036595757881323]
ファーマシュワーム(PharmaSwarm)は、新規な薬物標的および鉛化合物の仮説を提唱し、検証し、洗練するために、特殊な「エージェント」を編成する統合マルチエージェントフレームワークである。
PharmaSwarmはAIの副操縦士として機能することで、翻訳研究を加速し、従来のパイプラインよりも効率的に高信頼の仮説を提供することができる。
論文 参考訳(メタデータ) (2025-04-24T22:27:50Z) - Artificial Intelligence in Spectroscopy: Advancing Chemistry from Prediction to Generation and Beyond [38.32974480709081]
機械学習(ML)と人工知能(AI)の急速な出現は、化学に大きな変革をもたらした。
分光・分光データへのこれらの手法の適用は、分光機械学習(SpectraML)と呼ばれるが、いまだに研究が進んでいない。
我々はSpectraMLの統一的なレビューを行い、フォワードタスクと逆タスクの両方に対する最先端のアプローチを体系的に検証する。
論文 参考訳(メタデータ) (2025-02-14T04:07:25Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - Explainable Predictive Modeling for Limited Spectral Data [0.0]
本稿では、高次元および限られたスペクトルデータの予測結果を解釈するために、最近の説明可能なAI技術を適用する。
機器の解像度制限のため、分光データの重要な領域をピンポイントすると、データ収集プロセスを最適化する経路が生成される。
具体的には,MLモデルの評価がリアルタイムの実践に堅牢であることを保証するために,3つの異なるシナリオを設計する。
論文 参考訳(メタデータ) (2022-02-09T15:46:17Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。