論文の概要: AdditiveLLM2: A Multi-modal Large Language Model for Additive Manufacturing
- arxiv url: http://arxiv.org/abs/2603.22017v1
- Date: Mon, 23 Mar 2026 14:28:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.711175
- Title: AdditiveLLM2: A Multi-modal Large Language Model for Additive Manufacturing
- Title(参考訳): AdditiveLLM2: 付加生産のための多モード大言語モデル
- Authors: Peter Pak, Amir Barati Farimani,
- Abstract要約: この研究は、Gemma 3モデルの命令チューニング版に基づいて構築されたドメイン適応の大規模言語モデルであるAdditiveLLM2を提示する。
データセット(AdditiveLLM2-OA)は、ドメイン適応型事前学習および視覚的命令チューニングプロセスのために抽出されたデータを含むオープンアクセス付加的な製造ジャーナル記事からなる。
開発したモデルは、言語と視覚に基づくタスクの習熟度を示し、一般的な添加性製造知識の90%以上を達成している。
- 参考スコア(独自算出の注目度): 11.69314618713792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work presents AdditiveLLM2 a multi-modal, domain adapted large language model built upon the instruction tuned variant of the Gemma 3 model using a relatively small dataset of around 50 million tokens. The dataset (AdditiveLLM2-OA) consists of open-access additive manufacturing journal articles with data extracted for the domain adaptive pretraining and visual instruction tuning processes. Various stages of the developed model are evaluated with the Additive-Manufacturing-Benchmark which consists of additive manufacturing domain specific tasks compiled published resources. AdditiveLLM2 exhibits proficiency in both language and vision based tasks, achieving accuracies upwards of 90% in general additive manufacturing knowledge. This domain adaptive pretraining and instruction tuning strategy outline an accessible specialization method for large language models to a domain such as additive manufacturing.
- Abstract(参考訳): この研究により、AdditiveLLM2はGemma 3モデルの命令チューニング版に基づいて構築され、約5000万トークンの比較的小さなデータセットを使用するマルチモーダルなドメイン適応型大規模言語モデルである。
データセット(AdditiveLLM2-OA)は、ドメイン適応型事前学習および視覚的命令チューニングプロセスのために抽出されたデータを含むオープンアクセス付加的な製造ジャーナル記事からなる。
開発モデルの各種段階を,出版リソースを集約した追加製造ドメイン特化タスクからなるAdditive-Manufacturing-Benchmarkを用いて評価する。
AdditiveLLM2は、言語と視覚に基づくタスクの両方に習熟性を示し、一般的な添加性製造知識の90%以上を達成している。
このドメイン適応型事前学習および命令チューニング戦略は、大規模言語モデルのアクセシブルな特殊化手法を添加物製造などの領域に概説する。
関連論文リスト
- KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model [27.25688303240741]
KaLM-Embeddingは、よりクリーンで、より多様な、ドメイン固有のトレーニングデータを活用する一般的な多言語埋め込みモデルである。
我々のモデルは、性能を向上させることが証明された重要な技術で訓練されている。
論文 参考訳(メタデータ) (2025-01-02T03:17:51Z) - On Domain-Adaptive Post-Training for Multimodal Large Language Models [78.65220510401045]
本稿では,MLLMのドメイン適応をポストトレーニングにより体系的に検討する。
データ合成、トレーニングパイプライン、タスク評価に重点を置いています。
バイオメディシン、食品、リモートセンシングなどの高インパクト領域で実験を行う。
論文 参考訳(メタデータ) (2024-11-29T18:42:28Z) - EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models [50.459861376459656]
EMMA-500は546言語にわたるテキストで継続訓練された大規模多言語言語モデルである。
本結果は,大規模言語モデルの言語能力拡大における継続事前学習の有効性を強調した。
論文 参考訳(メタデータ) (2024-09-26T14:40:45Z) - PolyLM: An Open Source Polyglot Large Language Model [57.64420154135178]
我々は6400億(B)トークンでトレーニングされた多言語大言語モデル(LLM)であるPolyLMについて述べる。
その多言語的能力を高めるために,1) バイリンガルデータをトレーニングデータに統合し,2) 事前学習中に英語以外のデータの比率を30%から60%に引き上げるカリキュラム学習戦略を採用する。
さらに,モデル微調整のために,132.7Kの多言語命令を自動的に生成する多言語自己指示手法を提案する。
論文 参考訳(メタデータ) (2023-07-12T09:00:37Z) - Unsupervised Paraphrasing with Pretrained Language Models [85.03373221588707]
教師なし環境で,事前学習した言語モデルを用いて高品質なパラフレーズを生成する訓練パイプラインを提案する。
提案手法は,タスク適応,自己スーパービジョン,動的ブロッキング(Dynamic Blocking)という新しい復号アルゴリズムから構成される。
提案手法は,Quora Question PairとParaNMTの両方のデータセット上で,最先端の性能を達成できることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。