Fugu-MT 論文翻訳(概要): AdditiveLLM: Large Language Models Predict Defects in Additive Manufacturing

論文の概要: AdditiveLLM: Large Language Models Predict Defects in Additive Manufacturing

arxiv url: http://arxiv.org/abs/2501.17784v1
Date: Wed, 29 Jan 2025 17:18:01 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-30 22:32:42.666085
Title: AdditiveLLM: Large Language Models Predict Defects in Additive Manufacturing
Title（参考訳）: AdditiveLLM: 付加生産における欠陥を予測する大規模言語モデル
Authors: Peter Pak, Amir Barati Farimani,
Abstract要約: 本研究では, 大規模言語モデルによる付加的製造欠陥の予測能力について検討する。プロセスパラメータ欠陥データセットを使用して、AdditiveLLMというモデル集合を微調整します。このモデルは堅牢な予測能力を示し、一連のプロセスパラメータに関連する欠陥状態を提供するよう要求されたときの精度は93%に達する。
参考スコア（独自算出の注目度）: 7.136205674624813
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this work we investigate the ability of large language models to predict additive manufacturing defect regimes given a set of process parameter inputs. For this task we utilize a process parameter defect dataset to fine-tune a collection of models, titled AdditiveLLM, for the purpose of predicting potential defect regimes including Keyholing, Lack of Fusion, and Balling. We compare different methods of input formatting in order to gauge the model's performance to correctly predict defect regimes on our sparse Baseline dataset and our natural language Prompt dataset. The model displays robust predictive capability, achieving an accuracy of 93\% when asked to provide the defect regimes associated with a set of process parameters. The incorporation of natural language input further simplifies the task of process parameters selection, enabling users to identify optimal settings specific to their build.
Abstract（参考訳）: そこで本研究では,プロセスパラメータの入力が与えられた場合,大規模言語モデルによる付加的製造欠陥の予測能力について検討する。このタスクでは、プロセスパラメータ欠陥データセットを使用して、Keyholing、Lack of Fusion、Ballingといった潜在的な欠陥状態を予測するために、AdditiveLLMというタイトルのモデル集合を微調整します。入力フォーマッティングの異なる手法を比較して、モデルの性能を評価し、スパースベースラインデータセットと自然言語のPromptデータセットの欠陥状態を正確に予測する。このモデルは堅牢な予測能力を示し、一連のプロセスパラメータに関連する欠陥状態を提供するよう要求されたときの精度は93%に達する。自然言語入力の組み込みにより、プロセスパラメータ選択のタスクはさらに単純化され、ユーザはビルド固有の最適な設定を特定できる。

関連論文リスト

A General Bayesian Framework for Informative Input Design in System Identification [86.05414211113627]
システム識別のための情報入力設計の問題に取り組む。入力を選択し、真のシステムから対応する出力を観測し、モデルのパラメータを最適化し、データに最も合うようにします。本手法は, 線形および非線形の様々なダイナミクスを用いて, モデルフリーベースラインより優れる。
論文参考訳（メタデータ） (2025-01-28T01:57:51Z)
RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language Models [4.085425430499285]
本稿では,パラメータ効率のよい微調整手法と合わせて,元のタスクの入力テキストを変更することの影響について検討する。入力テキストの書き直しを効果的に行うため,最大辺縁類似度を目標とした数発のパラフレーズモデルを訓練する。本研究では, パラメータ効率のよい微調整だけで達成できることを超えて, 列車におけるパラフレーズとテスト時間によるデータ豊か化により, 性能が向上することを示す。
論文参考訳（メタデータ） (2024-03-04T17:58:09Z)
Spurious Feature Eraser: Stabilizing Test-Time Adaptation for Vision-Language Foundation Model [86.9619638550683]
視覚言語基礎モデルは、画像とテキストのペアデータに拡張性があるため、多数の下流タスクで顕著な成功を収めている。しかし、これらのモデルは、決定ショートカットの結果、きめ細かな画像分類などの下流タスクに適用した場合に重大な制限を呈する」。
論文参考訳（メタデータ） (2024-03-01T09:01:53Z)
Controlled Randomness Improves the Performance of Transformer Models [4.678970068275123]
制御されたランダム性、すなわちノイズを訓練プロセスに導入し、微調整言語モデルを改善する。このようなノイズを加えることで、結合したエンティティ認識と関係抽出とテキスト要約という2つの下流タスクのパフォーマンスが向上することがわかった。
論文参考訳（メタデータ） (2023-10-20T14:12:55Z)
Instruction Position Matters in Sequence Generation with Large Language Models [67.87516654892343]
大規模言語モデル(LLM)は、翻訳や要約といった条件付きシーケンス生成タスクを実行することができる。入力文の後にタスク命令の位置をシフトさせることにより,LLMの指示追従能力を向上させることを提案する。
論文参考訳（メタデータ） (2023-08-23T12:36:57Z)
Preserving Pre-trained Features Helps Calibrate Fine-tuned Language Models [23.881825575095945]
大規模事前学習型言語モデル(PLM)は、微調整により自然言語理解(NLU)タスクに強い性能を示す。しかし、微調整されたモデルは、特にドメイン外設定において、過度に自信過剰な予測に悩まされている。本研究では,PLMがマスキング言語モデリングタスクにおいて,ドメインシフトの下で頑健な予測信頼度を有することを実証する。事前学習した特徴の保存は、微調整言語モデルの校正を改善することができることを示す。
論文参考訳（メタデータ） (2023-05-30T17:35:31Z)
Out-of-sample scoring and automatic selection of causal estimators [0.0]
本稿では,CATEの場合と器楽変数問題の重要な部分集合に対する新しいスコアリング手法を提案する。私たちはそれを、DoWhyとEconMLライブラリに依存するオープンソースパッケージで実装しています。
論文参考訳（メタデータ） (2022-12-20T08:29:18Z)
Robust self-healing prediction model for high dimensional data [0.685316573653194]
本研究は、ロバスト自己治癒(RSH)ハイブリッド予測モデルを提案する。それは、データを捨てるのではなく、エラーや不整合を取り除くことによって、データ全体を活用することによって機能する。提案手法は,既存のハイパフォーマンスモデルと比較し,解析を行った。
論文参考訳（メタデータ） (2022-10-04T17:55:50Z)
Bridging the Gap Between Training and Inference of Bayesian Controllable Language Models [58.990214815032495]
大規模事前学習型言語モデルは、自然言語生成タスクにおいて大きな成功を収めている。 BCLMは制御可能な言語生成において効率的であることが示されている。本稿では,ミスマッチ問題を少ない計算コストで軽減する制御可能な言語生成のための"Gemini Discriminator"を提案する。
論文参考訳（メタデータ） (2022-06-11T12:52:32Z)
A Generative Language Model for Few-shot Aspect-Based Sentiment Analysis [90.24921443175514]
我々は、アスペクト項、カテゴリを抽出し、対応する極性を予測するアスペクトベースの感情分析に焦点を当てる。本稿では,一方向の注意を伴う生成言語モデルを用いて,抽出タスクと予測タスクをシーケンス生成タスクに再構成することを提案する。提案手法は,従来の最先端(BERTをベースとした)の性能を,数ショットとフルショットの設定において,大きなマージンで上回ります。
論文参考訳（メタデータ） (2022-04-11T18:31:53Z)
Automatic Mixed-Precision Quantization Search of BERT [62.65905462141319]
BERTのような事前訓練された言語モデルは、様々な自然言語処理タスクにおいて顕著な効果を示している。これらのモデルは通常、数百万のパラメータを含んでおり、リソースに制約のあるデバイスへの実践的なデプロイを妨げている。本稿では,サブグループレベルでの量子化とプルーニングを同時に行うことができるBERT用に設計された混合精密量子化フレームワークを提案する。
論文参考訳（メタデータ） (2021-12-30T06:32:47Z)
NLI Data Sanity Check: Assessing the Effect of Data Corruption on Model Performance [3.7024660695776066]
データセットがモデルの意味理解能力を評価するための良いテストベッドを構成するかどうかを評価することができる新しい診断テストスイートを提案します。特に,広く使用されているベンチマーク(mnliおよびanli)に制御された腐敗変換を適用する。モデル精度の大幅な低下は、元のデータセットがモデルの推論能力に適切な挑戦を提供することを示している。
論文参考訳（メタデータ） (2021-04-10T12:28:07Z)
Parameter Space Factorization for Zero-Shot Learning across Tasks and Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文参考訳（メタデータ） (2020-01-30T16:58:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。