Fugu-MT 論文翻訳(概要): From Images to Decisions: Assistive Computer Vision for Non-Metallic Content Estimation in Scrap Metal

論文の概要: From Images to Decisions: Assistive Computer Vision for Non-Metallic Content Estimation in Scrap Metal

arxiv url: http://arxiv.org/abs/2602.07062v1
Date: Thu, 05 Feb 2026 13:24:34 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-10 20:26:24.414182
Title: From Images to Decisions: Assistive Computer Vision for Non-Metallic Content Estimation in Scrap Metal
Title（参考訳）: 画像から判断へ:スラップメタル中の非金属コンテンツ推定のための補助的コンピュータビジョン
Authors: Daniil Storonkin, Ilia Dziub, Maksim Golyadkin, Ilya Makarov,
Abstract要約: スクラップの品質は製鋼におけるエネルギー使用、排出、安全性に直接影響を及ぼす。鉄道車両の降ろし時に撮影された画像から汚染を推定し,またスクラップタイプを分類する補助型コンピュータビジョンパイプラインを提案する。
参考スコア（独自算出の注目度）: 6.1766608542372685
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Scrap quality directly affects energy use, emissions, and safety in steelmaking. Today, the share of non-metallic inclusions (contamination) is judged visually by inspectors - an approach that is subjective and hazardous due to dust and moving machinery. We present an assistive computer vision pipeline that estimates contamination (per percent) from images captured during railcar unloading and also classifies scrap type. The method formulates contamination assessment as a regression task at the railcar level and leverages sequential data through multi-instance learning (MIL) and multi-task learning (MTL). Best results include MAE 0.27 and R2 0.83 by MIL; and an MTL setup reaches MAE 0.36 with F1 0.79 for scrap class. Also we present the system in near real time within the acceptance workflow: magnet/railcar detection segments temporal layers, a versioned inference service produces railcar-level estimates with confidence scores, and results are reviewed by operators with structured overrides; corrections and uncertain cases feed an active-learning loop for continual improvement. The pipeline reduces subjective variability, improves human safety, and enables integration into acceptance and melt-planning workflows.
Abstract（参考訳）: スクラップの品質は製鋼におけるエネルギー使用、排出、安全性に直接影響を及ぼす。今日では、非金属介在物(汚染)のシェアは検査官によって視覚的に判断され、塵や移動機械による主観的で有害なアプローチである。鉄道車両の降ろし時に撮影された画像から汚染を推定し,またスクラップタイプを分類する補助型コンピュータビジョンパイプラインを提案する。鉄道車両レベルでの汚染評価を回帰タスクとして定式化し、MIL(Multi-instance Learning)とMTL(Multi-task Learning)を通じて逐次データを活用する。 MIL による MAE 0.27 と R2 0.83 が最適であり、MTL のセットアップは MAE 0.36 に達し、スクラップクラスは F1 0.79 となる。磁石/レールカー検出セグメントは時間的階層であり、バージョン付き推論サービスは信頼度のあるレールカーレベルの推定結果を生成し、構造化オーバーライド演算子によって結果がレビューされ、修正や不確実なケースは継続的な改善のためにアクティブラーニングループを提供する。このパイプラインは、主観的多様性を低減し、人間の安全を改善し、受け入れと融解計画ワークフローとの統合を可能にする。

関連論文リスト

What Does Flow Matching Bring To TD Learning? [28.717975688380488]
強化学習(RL)におけるスカラーQ値関数推定にフローマッチングが有効であるこれらの結果から, 分布 RL ではその成功は説明されず, リターン分布を明示的にモデル化することで, 性能が低下することを示した。我々は,この統合プロセスの各ステップにおける値の読み出しと高密度な速度管理に積分を用いることで,2つのメカニズムによるTD学習が向上すると主張している。
論文参考訳（メタデータ） (2026-03-04T17:51:30Z)
Automated Wildfire Damage Assessment from Multi view Ground level Imagery Via Vision Language Models [8.161606587494903]
本研究では、事前学習された視覚言語モデル(VLM)を利用して、地上レベルの画像から損傷を分類する新しいゼロショットフレームワークを提案する。カリフォルニア州の2025年イートン火災とパリセード火災に適用される2つのパイプライン,VLM (Pipeline A) と VLM + large language model (LLM) アプローチを提案し,評価した。
論文参考訳（メタデータ） (2025-09-02T02:34:22Z)
Overtake Detection in Trucks Using CAN Bus Signals: A Comparative Study of Machine Learning Methods [51.28632782308621]
ボルボグループが提供する5台の車載トラックから収集した制御エリアネットワーク(CAN)バスデータを用いたオーバーテイク検出に焦点を当てた。車両操作検出、ニューラルネットワーク(ANN)、ランダムフォレスト(RF)、サポートベクトルマシン(SVM)の3つの共通分類器の評価を行った。当社のパートラック分析では、特にオーバーテイクにおいて、車両毎のトレーニングデータの量に依存する分類精度も明らかにしています。
論文参考訳（メタデータ） (2025-07-01T09:20:41Z)
Backdoor Cleaning without External Guidance in MLLM Fine-tuning [76.82121084745785]
Believe Your Eyes (BYE)は、アテンションエントロピーパターンを自己教師信号として活用して、バックドアサンプルを特定してフィルタリングするデータフィルタリングフレームワークである。クリーンタスクのパフォーマンスを維持しながら、ほぼゼロの攻撃成功率を達成する。
論文参考訳（メタデータ） (2025-05-22T17:11:58Z)
Both Text and Images Leaked! A Systematic Analysis of Data Contamination in Multimodal LLM [53.05486269607166]
マルチモーダルな大言語モデル (MLLM) はベンチマーク間で大幅に性能が向上した。マルチモーダルデータ複雑性とマルチフェーズトレーニングのため,既存のLLM検出手法はMLLMでは不十分である。我々は分析フレームワークMM-Detectを用いてマルチモーダルデータの汚染を分析する。
論文参考訳（メタデータ） (2024-11-06T10:44:15Z)
An Experimental Study on Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training [51.622652121580394]
Masked Image Modeling (MIM) Pre-training for Large-scale Vision Transformer (ViTs) は、学習した自己教師型ViT機能に加えて、下流での有望なパフォーマンスを実現する。本稿では,テキストテキストレメリーで軽量なViTの微調整性能が,この事前学習パラダイムの恩恵を受けるかどうかを問う。バニラ/階層設計(5.7M$/6.5M$)による純軽量ViTの蒸留による事前トレーニングは、ImageNet-1で79.4%$/78.9%の精度で達成できる。
論文参考訳（メタデータ） (2024-04-18T14:14:44Z)
Investigating Data Contamination for Pre-training Language Models [46.335755305642564]
我々は,一連のGPT-2モデルを事前学習することで,事前学習段階におけるデータ汚染の影響について検討する。評価データから,テキスト汚染 (テキスト, 評価サンプルの入力テキスト) と接地トラス汚染 (テキスト, 入力に要求されるプロンプトと所望の出力) の両方の効果を強調した。
論文参考訳（メタデータ） (2024-01-11T17:24:49Z)
Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文参考訳（メタデータ） (2023-12-27T09:03:43Z)
Wooden Sleeper Deterioration Detection for Rural Railway Prognostics Using Unsupervised Deeper FCDDs [0.0]
本研究では, 鉄道部品の欠陥に対する深いFCDDを用いた一級損傷分類を自動化するための識別器パイプラインを考案した。畳み込みニューラルネットワーク(CNN)を用いた深部骨のアブレーション研究も行った。曇りの日当たりの後方から鉄道線路の映像取得データセットを用いた鉄道検査への適用を実演した。
論文参考訳（メタデータ） (2023-05-09T00:16:49Z)
Driver Profiling and Bayesian Workload Estimation Using Naturalistic Peripheral Detection Study Data [40.43737902900321]
性能データを駆動する作業負荷推定の問題に対処する。心的負荷を誘発する主要な環境要因をビデオ解析により同定する。教師付き学習フレームワークは、彼らが経験した平均的なワークロードに基づいて、プロファイルドライバに導入される。ベイズフィルタリング手法は、ドライバーの即時作業負荷である(ほぼ)リアルタイムに逐次推定するために提案される。
論文参考訳（メタデータ） (2023-03-26T13:15:44Z)
Detecting train driveshaft damages using accelerometer signals and Differential Convolutional Neural Networks [67.60224656603823]
本稿では,高度2次元畳み込みニューラルネットワーク(CNN)アーキテクチャに基づく鉄道軸状態監視システムの開発を提案する。その結果,鉄道軸受振動信号を時間周波数領域表現,すなわち分光図に変換し,そのひび割れに応じて2次元CNNを訓練する。
論文参考訳（メタデータ） (2022-11-15T15:04:06Z)
Automatic Detection of Rail Components via A Deep Convolutional Transformer Network [7.557470133155959]
レール,クリップ,ボルトを含む多種鉄道部品を検出するための深層畳み込み変圧器ネットワーク方式を提案する。提案手法は,アンカーボックス,アスペクト比,デフォルト座標,後処理などの事前設定を不要にすることで,検出パイプラインを単純化する。総合的な計算結果から,提案手法は既存の最先端手法よりも大きなマージンを持つことを示す。
論文参考訳（メタデータ） (2021-08-05T07:38:04Z)
Towards Image-based Automatic Meter Reading in Unconstrained Scenarios: A Robust and Efficient Approach [60.63996472100845]
本稿では,制約のないシナリオに着目したAMR(Automatic Meter Reading)のエンドツーエンドアプローチを提案する。我々の主な貢献は、コーナー検出とカウンタ分類と呼ばれる新しいステージをAMRパイプラインに挿入することである。信頼度が低い読みを拒絶した場合,AMRシステムは印象的な認識率(すなわち99%)を達成することを示す。
論文参考訳（メタデータ） (2020-09-21T21:21:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。