論文の概要: LUMIR: an LLM-Driven Unified Agent Framework for Multi-task Infrared Spectroscopy Reasoning
- arxiv url: http://arxiv.org/abs/2507.21471v2
- Date: Sun, 31 Aug 2025 04:55:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-03 14:24:52.551455
- Title: LUMIR: an LLM-Driven Unified Agent Framework for Multi-task Infrared Spectroscopy Reasoning
- Title(参考訳): LUMIR:マルチタスク赤外分光共鳴のためのLLM駆動統合エージェントフレームワーク
- Authors: Zujie Xie, Zixuan Chen, Jiheng Liang, Xiangyang Yu, Ziru Yu,
- Abstract要約: 本研究では,低データ条件下での正確な赤外分光分析を実現するためのフレームワークであるLUMIRを紹介する。
LUMIRは構造化文学知識ベース、自動前処理、特徴抽出、予測モデリングを統合パイプラインに統合する。
利用可能なミルク近赤外データセット、中国の薬草、貯蔵期間の異なるCitri Reticulatae Pericarpium(CRP)、産業排水CODデータセット、Tecator、Cornなど、さまざまなデータセットで検証された。
- 参考スコア(独自算出の注目度): 12.138903544219724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared spectroscopy enables rapid, non destructive analysis of chemical and material properties, yet high dimensional signals and overlapping bands hinder conventional chemometric methods. Large language models (LLMs), with strong generalization and reasoning capabilities, offer new opportunities for automated spectral interpretation, but their potential in this domain remains largely untapped. This study introduces LUMIR (LLM-driven Unified agent framework for Multi-task Infrared spectroscopy Reasoning), an agent based framework designed to achieve accurate infrared spectral analysis under low data conditions. LUMIR integrates a structured literature knowledge base, automated preprocessing, feature extraction, and predictive modeling into a unified pipeline. By mining peer reviewed spectroscopy studies, it identifies validated preprocessing and feature derivation strategies, transforms spectra into low dimensional representations, and applies few-shot prompts for classification, regression, and anomaly detection. The framework was validated on diverse datasets, including the publicly available Milk near-infrared dataset, Chinese medicinal herbs, Citri Reticulatae Pericarpium(CRP) with different storage durations, an industrial wastewater COD dataset, and two additional public benchmarks, Tecator and Corn. Across these tasks, LUMIR achieved performance comparable to or surpassing established machine learning and deep learning models, particularly in resource limited settings. This work demonstrates that combining structured literature guidance with few-shot learning enables robust, scalable, and automated spectral interpretation. LUMIR establishes a new paradigm for applying LLMs to infrared spectroscopy, offering high accuracy with minimal labeled data and broad applicability across scientific and industrial domains.
- Abstract(参考訳): 赤外線分光法は、化学特性や材料特性の迅速かつ非破壊的な分析を可能にするが、高次元信号と重なり合うバンドは、従来の化学測定法を妨げている。
強力な一般化と推論能力を持つ大規模言語モデル(LLM)は、自動スペクトル解釈の新たな機会を提供するが、この領域におけるそれらのポテンシャルは、ほとんど未解決のままである。
LUMIR(LLM-driven Unified agent framework for Multi-task Infrared spectroscopy Reasoning)は、低データ条件下で正確な赤外スペクトル分析を実現するために設計されたエージェントベースのフレームワークである。
LUMIRは構造化文学知識ベース、自動前処理、特徴抽出、予測モデリングを統合パイプラインに統合する。
ピアレビュー分光法の研究により、検証済みの事前処理と特徴導出戦略を特定し、スペクトルを低次元の表現に変換するとともに、分類、回帰、異常検出にわずかなプロンプトを適用する。
このフレームワークは、公開されているミルク近赤外データセット、中国の薬草、貯蔵期間が異なるCitri Reticulatae Pericarpium(CRP)、産業排水CODデータセット、さらに2つの公開ベンチマークなど、さまざまなデータセットで検証された。
これらのタスク全体で、LUMIRは、特にリソース制限された設定において、既存の機械学習モデルやディープラーニングモデルに匹敵するパフォーマンスを達成した。
この研究は構造化文学指導と数ショットの学習を組み合わせることで、堅牢でスケーラブルで自動的なスペクトル解釈を可能にすることを実証している。
LUMIRは、LLMを赤外線分光法に適用するための新しいパラダイムを確立し、最小限のラベル付きデータと、科学的および工業的領域にまたがる幅広い適用性を提供する。
関連論文リスト
- From Static Spectra to Operando Infrared Dynamics: Physics Informed Flow Modeling and a Benchmark [67.29937933325849]
Operando IR Predictionは、1つの静的スペクトルからスペクトル指紋の時間分解進化を予測することを目的としている。
OpIRSpec-7Kは、10の異なるバッテリーシステムにわたる7,118の高品質なサンプルで構成されている。
ABCCは最先端の静的、シーケンシャル、および生成的ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-20T18:58:43Z) - How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.286853421822705]
大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。
我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。
SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文 参考訳(メタデータ) (2026-01-09T20:08:42Z) - Unmasking Airborne Threats: Guided-Transformers for Portable Aerosol Mass Spectrometry [2.743898388459522]
MALDI-MS (Matrix Assisted Laser Desorption/Ionization Mass Spectrometry) は生体分子分析の基盤であり、独自の質量スペクトルによる病原体の正確な同定を提供する。
しかし、労働集約型試料調製とマルチショットスペクトル平均化に依存しているため、実験室の環境設定に制限されるため、リアルタイムの環境モニタリングには実用的ではない。
これらの制限は、新しいエアロゾルMALDI-MSシステムにおいて特に顕著であり、自律的なサンプリングは未知のエアロゾル分析のためにノイズスペクトルを生成する。
スペクトルを再定義するデータ駆動型フレームワークであるMass Spectral Dictionary-Guided Transformer(MS-DGFormer)を提案する。
論文 参考訳(メタデータ) (2025-11-21T17:45:00Z) - OASIS: A Deep Learning Framework for Universal Spectroscopic Analysis Driven by Novel Loss Functions [4.0097349146966925]
技術に依存しない自動スペクトル分析のための機械学習(ML)フレームワークを提案する。
OASISは、戦略的に設計された合成データセットでトレーニングされたモデルを通じて、その汎用性を達成する。
本研究は、高性能MLモデルを開発するための重要な資源効率戦略として、損失関数の最適化を強調した。
論文 参考訳(メタデータ) (2025-09-15T01:28:51Z) - IR-Agent: Expert-Inspired LLM Agents for Structure Elucidation from Infrared Spectra [27.70589578306254]
我々は、IRスペクトルから分子構造を解明するための新しいマルチエージェントフレームワークIR-Agentを提案する。
このフレームワークは、専門家主導のIR分析手順をエミュレートするために設計されており、本質的にはそうである。各エージェントは、IR解釈の特定の側面を専門とし、それらの補完的な役割は統合推論を可能にする。
論文 参考訳(メタデータ) (2025-08-22T06:07:28Z) - An Auditable Agent Platform For Automated Molecular Optimisation [0.0]
薬物発見は、データ、専門知識、ツールが散在すると、しばしば勢いを失う。
このループを短くするため、分子最適化を自動化するエージェントフレームワークを使用した階層的なツールを構築しました。
論文 参考訳(メタデータ) (2025-08-05T13:41:32Z) - SpectrumFM: Redefining Spectrum Cognition via Foundation Modeling [65.65474629224558]
本稿ではスペクトル認識のための新しいパラダイムを提供するスペクトルFMと呼ばれるスペクトル基盤モデルを提案する。
畳み込みニューラルネットワークを利用した革新的なスペクトルエンコーダを提案し、スペクトルデータにおける微細な局所信号構造と高レベルのグローバルな依存関係の両方を効果的に捕捉する。
2つの新しい自己教師型学習タスク、すなわちマスク付き再構成と次のスロット信号予測が、SpectrumFMの事前学習のために開発され、モデルがリッチで伝達可能な表現を学習できるようにする。
論文 参考訳(メタデータ) (2025-08-02T14:40:50Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Reinforcing Question Answering Agents with Minimalist Policy Gradient Optimization [80.09112808413133]
Mujicaは、質問をサブクエストの非循環グラフに分解するプランナーであり、検索と推論を通じて質問を解決するワーカーである。
MyGOは、従来のポリシー更新を勾配的いいねりの最大推定に置き換える、新しい強化学習手法である。
複数のデータセットにまたがる実験結果から,マルチホップQA性能向上における MujicaMyGO の有効性が示された。
論文 参考訳(メタデータ) (2025-05-20T18:33:03Z) - DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [54.79763887844838]
大規模言語モデル(LLM)と自律エージェントの統合は、自動推論とタスク実行を通じて科学的発見を促進する大きな可能性を秘めている。
本稿では,薬物発見におけるエンドツーエンド科学のために設計されたパラメータ化推論アーキテクチャを備えたLSMベースのエージェントシステムであるDrarmPilotを紹介する。
DrugPilot は ReAct や LoT のような最先端のエージェントよりも優れており、タスク完了率は98.0%、93.5%、64.0%である。
論文 参考訳(メタデータ) (2025-05-20T05:18:15Z) - A Multimodal Multi-Agent Framework for Radiology Report Generation [2.1477122604204433]
放射線診断レポート生成(RRG)は、医療画像から診断レポートを自動生成することを目的としている。
本稿では,段階的臨床推論ワークフローに適合するRRG用マルチモーダルマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-14T20:28:04Z) - LLM Agent Swarm for Hypothesis-Driven Drug Discovery [2.7036595757881323]
ファーマシュワーム(PharmaSwarm)は、新規な薬物標的および鉛化合物の仮説を提唱し、検証し、洗練するために、特殊な「エージェント」を編成する統合マルチエージェントフレームワークである。
PharmaSwarmはAIの副操縦士として機能することで、翻訳研究を加速し、従来のパイプラインよりも効率的に高信頼の仮説を提供することができる。
論文 参考訳(メタデータ) (2025-04-24T22:27:50Z) - Artificial Intelligence in Spectroscopy: Advancing Chemistry from Prediction to Generation and Beyond [38.32974480709081]
機械学習(ML)と人工知能(AI)の急速な出現は、化学に大きな変革をもたらした。
分光・分光データへのこれらの手法の適用は、分光機械学習(SpectraML)と呼ばれるが、いまだに研究が進んでいない。
我々はSpectraMLの統一的なレビューを行い、フォワードタスクと逆タスクの両方に対する最先端のアプローチを体系的に検証する。
論文 参考訳(メタデータ) (2025-02-14T04:07:25Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - Explainable Predictive Modeling for Limited Spectral Data [0.0]
本稿では、高次元および限られたスペクトルデータの予測結果を解釈するために、最近の説明可能なAI技術を適用する。
機器の解像度制限のため、分光データの重要な領域をピンポイントすると、データ収集プロセスを最適化する経路が生成される。
具体的には,MLモデルの評価がリアルタイムの実践に堅牢であることを保証するために,3つの異なるシナリオを設計する。
論文 参考訳(メタデータ) (2022-02-09T15:46:17Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。