Fugu-MT 論文翻訳(概要): Language Native Lightly Structured Databases for Large Language Model Driven Composite Materials Research

論文の概要: Language Native Lightly Structured Databases for Large Language Model Driven Composite Materials Research

arxiv url: http://arxiv.org/abs/2509.06093v1
Date: Sun, 07 Sep 2025 15:15:55 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-09 14:07:03.853404
Title: Language Native Lightly Structured Databases for Large Language Model Driven Composite Materials Research
Title（参考訳）: 大規模言語モデル駆動複合材料研究のための言語ネイティブ軽量構造化データベース
Authors: Yuze Liu, Zhaoyuan Zhang, Xiangsheng Zeng, Yihe Zhang, Leping Yu, Lejia Wang, Xi Yu,
Abstract要約: 本稿では, 窒化ホウ素ナノシート (BNNS) ポリマー熱伝導性複合材料の言語ネイティブデータベースを提案する。このシステムは、文学を正確な、検証可能な、専門家のスタイルのガイダンスに合成することができる。
参考スコア（独自算出の注目度）: 6.31777560888658
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Chemical and materials research has traditionally relied heavily on knowledge narrative, with progress often driven by language-based descriptions of principles, mechanisms, and experimental experiences, rather than tables, limiting what conventional databases and ML can exploit. We present a language-native database for boron nitride nanosheet (BNNS) polymer thermally conductive composites that captures lightly structured information from papers across preparation, characterization, theory-computation, and mechanistic reasoning, with evidence-linked snippets. Records are organized in a heterogeneous database and queried via composite retrieval with semantics, key words and value filters. The system can synthesizes literature into accurate, verifiable, and expert style guidance. This substrate enables high fidelity efficient Retrieval Augmented Generation (RAG) and tool augmented agents to interleave retrieval with reasoning and deliver actionable SOP. The framework supplies the language rich foundation required for LLM-driven materials discovery.
Abstract（参考訳）: 化学と材料の研究は伝統的にナレッジ・ナラティブに大きく依存しており、しばしば進歩は、従来のデータベースやMLが活用できるものを制限することよりも、原則、メカニズム、実験的な経験の言語ベースの記述によって引き起こされている。本稿では, 窒化ホウ素ナノシート (BNNS) ポリマー熱伝導性複合材料の言語ネイティブデータベースについて述べる。レコードは異種データベースに整理され、セマンティクス、キーワード、バリューフィルタによる合成検索によってクエリされる。このシステムは、文学を正確な、検証可能な、専門家のスタイルのガイダンスに合成することができる。本発明の基板は、高忠実性効率のレトリーバル拡張生成(RAG)とツール強化剤により、検索を推論してインターリーブし、実行可能なSOPを提供する。このフレームワークは、LLM駆動の材料発見に必要な言語豊富な基盤を提供する。

関連論文リスト

LeMat-Synth: a multi-modal toolbox to curate broad synthesis procedure databases from scientific literature [60.879220305044726]
本稿では,大規模言語モデル (LLM) と視覚言語モデル (VLM) を用いて合成手順と性能データを自動抽出・整理するマルチモーダルツールボックスを提案する。 LeMat-Synth (v 1.0):35種類の合成法と16種類の材料クラスにまたがる合成手順を含むデータセット。我々は,新しいコーパスと合成ドメインへのコミュニティ主導の拡張をサポートするために設計された,モジュール形式のオープンソースライブラリをリリースする。
論文参考訳（メタデータ） (2025-10-28T17:58:18Z)
Struc-EMB: The Potential of Structure-Aware Encoding in Language Embeddings [16.728984584960738]
本稿では,構造認識テキストの埋め込み生成のための新しいパラダイムを,体系的に導入し,評価する。本稿では,逐次連結と並列キャッシングという2つのプロセス内手法について検討する。並列キャッシングは、長い高信号のコンテキストに対してより効果的にスケールするが、気晴らしにはより敏感である。
論文参考訳（メタデータ） (2025-10-09T19:45:54Z)
Who Gets Cited Most? Benchmarking Long-Context Language Models on Scientific Articles [81.89404347890662]
SciTrekは、科学論文を用いた大規模言語モデル(LLM)の長文推論能力を評価するために設計された、新しい質問応答ベンチマークである。本分析により,モデルの基本的数値演算を行ない,特定の情報を長い文脈で正確に特定する能力において,系統的な欠点が明らかとなった。
論文参考訳（メタデータ） (2025-09-25T11:36:09Z)
Exploring Reasoning-Infused Text Embedding with Large Language Models for Zero-Shot Dense Retrieval [24.53573526375476]
Reasoning-Infused Text Embeddingは、埋め込みを計算する前に中間的推論テキストを生成することによって、既存の言語モデル埋め込み技術に基づいている。推論集約型検索ベンチマークBRIGHTの結果、RITEは多様な領域にわたるゼロショット検索性能を大幅に向上することを示した。
論文参考訳（メタデータ） (2025-08-29T23:22:34Z)
How Do LLM-Generated Texts Impact Term-Based Retrieval Models? [76.92519309816008]
本稿では,大規模言語モデル(LLM)が項ベース検索モデルに与える影響について検討する。言語学的解析により,LLM生成テキストはよりスムーズで低周波なZipf勾配を示すことが明らかとなった。本研究は,項分布がクエリと密接に一致した文書を優先して,項ベース検索モデルがソースバイアスを示すかどうかを考察する。
論文参考訳（メタデータ） (2025-08-25T06:43:27Z)
Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。 AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文参考訳（メタデータ） (2025-07-22T06:37:51Z)
Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文参考訳（メタデータ） (2025-06-06T04:07:55Z)
Needle: A Generative AI-Powered Multi-modal Database for Answering Complex Natural Language Queries [8.779871128906787]
マルチモーダルデータセットは、各項目にエンコードされたリッチな情報を適切にキャプチャする詳細な記述を見逃すことが多い。このドメインでは、複雑な自然言語クエリに答えることが大きな課題になります。本稿では, 基礎モデルを用いて合成サンプルを生成するモンテカルロ法を提案する。当社のシステムはオープンソースであり,研究者や開発者が容易に採用できるように設計されている。
論文参考訳（メタデータ） (2024-12-01T01:36:41Z)
From Text to Insight: Large Language Models for Materials Science Data Extraction [4.08853418443192]
科学知識の大部分は、構造化されていない自然言語に存在する。構造化データは革新的で体系的な材料設計に不可欠である。大きな言語モデル(LLM)の出現は、大きな変化を示している。
論文参考訳（メタデータ） (2024-07-23T22:23:47Z)
STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文参考訳（メタデータ） (2024-04-19T22:54:54Z)
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文参考訳（メタデータ） (2023-10-31T04:37:57Z)
Synergistic Interplay between Search and Large Language Models for Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。 InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文参考訳（メタデータ） (2023-05-12T11:58:15Z)
Leveraging Language Representation for Material Recommendation, Ranking, and Exploration [0.0]
本稿では,言語モデルから派生した自然言語埋め込みを,構成的特徴と構造的特徴の表現として利用する材料発見フレームワークを提案する。この枠組みを熱電学に適用することにより, 試作構造物の多種多様な推薦を行い, 未検討の高性能材料空間を同定する。
論文参考訳（メタデータ） (2023-05-01T21:58:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。