論文の概要: From Word2Vec to Transformers: Text-Derived Composition Embeddings for Filtering Combinatorial Electrocatalysts
- arxiv url: http://arxiv.org/abs/2603.08881v1
- Date: Mon, 09 Mar 2026 19:46:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.803945
- Title: From Word2Vec to Transformers: Text-Derived Composition Embeddings for Filtering Combinatorial Electrocatalysts
- Title(参考訳): Word2Vecからトランスフォーマーへ:組合せ電気触媒をフィルタリングするためのテキスト駆動型合成埋め込み
- Authors: Lei Zhang, Markus Stricker,
- Abstract要約: 学術文献からの埋め込みを用いて,各構成を表現したラベルフリースクリーニング戦略を評価する。
コーパス学習したWord2Vecベースラインとトランスフォーマーベースの埋め込みを比較した。
貴金属合金や多成分酸化物を含む15の材料ライブラリの性能評価を行った。
- 参考スコア(独自算出の注目度): 4.731771934553726
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Compositionally complex solid solution electrocatalysts span vast composition spaces, and even one materials system can contain more candidate compositions than can be measured exhaustively. Here we evaluate a label-free screening strategy that represents each composition using embeddings derived from scientific texts and prioritizes candidates based on similarity to two property concepts. We compare a corpus-trained Word2Vec baseline with transformer-based embeddings, where compositions are encoded either by linear element-wise mixing or by short composition prompts. Similarities to `concept directions', the terms conductivity and dielectric, define a 2-dimensional descriptor space, and a symmetric Pareto-front selection is used to filter candidate subsets without using electrochemical labels. Performance is assessed on 15 materials libraries including noble metal alloys and multicomponent oxides. In this setting, the lightweight Word2Vec baseline, which uses a simple linear combination of element embeddings, often achieves the highest number of reductions of possible candidate compositions while staying close to the best measured performance.
- Abstract(参考訳): 組成複雑な固体溶液電解質は、広大な組成空間にまたがり、1つの材料系でさえ、総じて測定できるよりも多くの候補組成を含むことができる。
ここでは,2つのプロパティ概念との類似性に基づいて,各構成を科学的テキストから導出した埋め込みを用いて表現し,候補を優先するラベルフリースクリーニング戦略を評価する。
コーパス学習したWord2Vecベースラインとトランスフォーマーベースの埋め込みを比較し,構成を線形要素混合あるいは短い合成プロンプトで符号化する。
導電率と誘電率という用語は「概念方向」と類似しており、2次元の記述子空間を定義し、対称なパレートフロント選択は電気化学ラベルを使わずに候補部分集合をフィルタリングするために用いられる。
貴金属合金や多成分酸化物を含む15の材料ライブラリの性能評価を行った。
この設定では、要素埋め込みの単純な線形結合を利用する軽量のWord2Vecベースラインは、最高の測定性能に近づきながら、可能な合成量を最大に減らすことができる。
関連論文リスト
- Disentangling Latent Embeddings with Sparse Linear Concept Subspaces (SLiCS) [2.7255100506777894]
CLIPのようなビジョン言語の共同埋め込みネットワークは、セマンティック情報を備えた潜在的な埋め込み空間を提供する。
本稿では,ベクトル群の疎結合,非負結合からなる線形合成モデルを推定するための教師付き辞書学習手法を提案する。
スパース線形概念部分空間(SLiCS)によって提供される不整合埋め込みにより,概念フィルタリング画像の検索が可能となることを示す。
論文 参考訳(メタデータ) (2025-08-27T23:39:42Z) - Iterative Corpus Refinement for Materials Property Prediction Based on Scientific Texts [5.592360872268223]
本稿では、最も多様な文書を戦略的に選択し、Word2Vecモデルを訓練し、組込み空間における合成-プロパティ相関の収束をモニタリングすることにより、与えられた科学的コーパスを洗練する反復的フレームワークを提案する。
提案手法は, 酸素還元反応 (ORR) , 水素進化反応 (HER) および酸素進化反応 (OER) に関する高効率材料を, 多くの候補成分に対して予測するために適用した。
論文 参考訳(メタデータ) (2025-05-27T18:20:58Z) - Consistency of Compositional Generalization across Multiple Levels [31.77432446850103]
複数のレベルにまたがる一貫した構成一般化を実現するためのメタラーニングベースのフレームワークを提案する。
一貫性を定量的に評価するGQA-CCGデータセットを構築した。
論文 参考訳(メタデータ) (2024-12-18T09:09:41Z) - Graph-guided Cross-composition Feature Disentanglement for Compositional Zero-shot Learning [54.08741382593959]
合成ゼロショット学習(CZSL)において、プリミティブ(属性とオブジェクト)の視覚的特徴の歪みは例外的な結果を示した。
異なる構成にまたがる一般的な非絡み合った原始的特徴を学ぶことは困難である。
本稿では,複数のプリミティブ共有合成を入力として利用するクロスコンポジション特徴分散の解を提案する。
論文 参考訳(メタデータ) (2024-08-19T08:23:09Z) - Compositional Representation of Polymorphic Crystalline Materials [56.80318252233511]
PCRLは,構成の確率論的モデリングを用いて,利用可能な構造情報から多型を抽出する手法である。
16のデータセットに対する広範囲な評価は、構成表現の学習におけるPCRLの有効性を示す。
論文 参考訳(メタデータ) (2023-11-17T20:34:28Z) - Linear Spaces of Meanings: Compositional Structures in Vision-Language
Models [110.00434385712786]
事前学習された視覚言語モデル(VLM)からのデータ埋め込みにおける構成構造について検討する。
まず,幾何学的観点から構成構造を理解するための枠組みを提案する。
次に、これらの構造がVLM埋め込みの場合の確率論的に持つものを説明し、実際に発生する理由の直観を提供する。
論文 参考訳(メタデータ) (2023-02-28T08:11:56Z) - StyleT2I: Toward Compositional and High-Fidelity Text-to-Image Synthesis [52.341186561026724]
構成性の欠如は、堅牢性と公正性に深刻な影響を及ぼす可能性がある。
テキスト対画像合成の合成性を改善するための新しいフレームワークであるStyleT2Iを導入する。
その結果,StyleT2Iは入力テキストと合成画像との整合性という点で従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-03-29T17:59:50Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。