論文の概要: Latent Factorization of Tensors with Threshold Distance Weighted Loss for Traffic Data Estimation
- arxiv url: http://arxiv.org/abs/2506.22441v1
- Date: Wed, 11 Jun 2025 05:36:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-07 02:47:44.341637
- Title: Latent Factorization of Tensors with Threshold Distance Weighted Loss for Traffic Data Estimation
- Title(参考訳): 交通データ推定のための閾値距離重み付きテンソルの潜在因子化
- Authors: Lei Yang,
- Abstract要約: リアルタイムトラフィックデータ収集プロセスでは、通信障害などの問題が不完全あるいは破損したデータセットにつながることが多い。
外れ値モデル (LFT) の潜在因子化は広く採用され, 有効解となっている。
本稿では,オフリヤモデル(TDFTWL)の閾値距離重み付け(TDW)損失感度依存性の潜在因子化を提案する。
提案したTDFTWLモデルは、精度と計算効率の両面で、最先端のアプローチを一貫して上回っている。
- 参考スコア(独自算出の注目度): 4.079031335530995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent transportation systems (ITS) rely heavily on complete and high-quality spatiotemporal traffic data to achieve optimal performance. Nevertheless, in real-word traffic data collection processes, issues such as communication failures and sensor malfunctions often lead to incomplete or corrupted datasets, thereby posing significant challenges to the advancement of ITS. Among various methods for imputing missing spatiotemporal traffic data, the latent factorization of tensors (LFT) model has emerged as a widely adopted and effective solution. However, conventional LFT models typically employ the standard L2-norm in their learning objective, which makes them vulnerable to the influence of outliers. To overcome this limitation, this paper proposes a threshold distance weighted (TDW) loss-incorporated Latent Factorization of Tensors (TDWLFT) model. The proposed loss function effectively reduces the model's sensitivity to outliers by assigning differentiated weights to individual samples. Extensive experiments conducted on two traffic speed datasets sourced from diverse urban environments confirm that the proposed TDWLFT model consistently outperforms state-of-the-art approaches in terms of both in both prediction accuracy and computational efficiency.
- Abstract(参考訳): インテリジェントトランスポートシステム(ITS)は、最適な性能を達成するために、完全かつ高品質な時空間トラフィックデータに大きく依存している。
それでも、リアルタイムのトラフィックデータ収集プロセスでは、通信障害やセンサーの故障といった問題によって、不完全あるいは破損したデータセットがしばしば発生し、ITSの進歩に重大な課題が生じる。
時空間トラヒックデータを出力する様々な方法の中で、テンソル(LFT)モデルの潜在因子化が広く採用され、有効な解となっている。
しかし、従来のLFTモデルは学習目的に標準L2ノルムを用いるのが一般的である。
そこで本研究では,TDWLFTモデルを用いた閾値距離重み付け(TDW)モデルを提案する。
提案した損失関数は,個々のサンプルに差分重みを割り当てることで,モデルから外れ値への感度を効果的に低減する。
多様な都市環境から得られた2つの交通速度データセットに対する大規模な実験により、提案したTDWLFTモデルは、予測精度と計算効率の両方の観点から、最先端のアプローチを一貫して上回っていることを確認した。
関連論文リスト
- Robust Tensor Completion via Gradient Tensor Nulclear L1-L2 Norm for Traffic Data Recovery [14.96194593196997]
本稿では,L1-L2ノルム(RTC-NL)モデルによるロバスト・コンプリートを提案する。
論文 参考訳(メタデータ) (2025-06-28T02:38:01Z) - Lightweight Task-Oriented Semantic Communication Empowered by Large-Scale AI Models [66.57755931421285]
大規模人工知能(LAI)モデルは、リアルタイム通信シナリオにおいて重大な課題を提起する。
本稿では,LAIモデルから知識を抽出・凝縮するために知識蒸留(KD)技術を活用することを提案する。
本稿では,反復推論の必要性を排除したプレストア圧縮機構を備えた高速蒸留法を提案する。
論文 参考訳(メタデータ) (2025-06-16T08:42:16Z) - A Semantic-Loss Function Modeling Framework With Task-Oriented Machine Learning Perspectives [26.82506860792313]
データ駆動型地球観測(EO)アプリケーションの性能は、データ収集と送信プロセスに大きく影響されている。
セマンティック・コミュニケーション(SC)の概念を採用することで、生の情報に対する本質的なデータセマンティクスの伝達を優先順位付けすることで、有望なソリューションを提供する。
本研究では、実世界のEOデータセットとドメイン固有の洞察を用いて、セマンティック損失を経験的にモデル化する新しいデータ適合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-12T23:45:11Z) - A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.07063067759609]
高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。
モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。
一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文 参考訳(メタデータ) (2025-02-26T06:18:13Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - Low-rank finetuning for LLMs: A fairness perspective [54.13240282850982]
低ランク近似技術は、微調整された大規模言語モデルのデファクトスタンダードとなっている。
本稿では,これらの手法が初期訓練済みデータ分布から微調整データセットのシフトを捉える上での有効性について検討する。
低ランク微調整は好ましくない偏見や有害な振る舞いを必然的に保存することを示す。
論文 参考訳(メタデータ) (2024-05-28T20:43:53Z) - An Incomplete Tensor Tucker decomposition based Traffic Speed Prediction
Method [0.0]
この研究は、比例積分微分(PID)コントローラのユニークな利点をタッカー分解に基づくLFTモデルに統合する。
2つの主要都市交通道路速度データセットによる実験により,提案モデルが高い効率向上と高い競合予測精度を実現することを示す。
論文 参考訳(メタデータ) (2023-04-21T13:59:28Z) - Truncated tensor Schatten p-norm based approach for spatiotemporal
traffic data imputation with complicated missing patterns [77.34726150561087]
本研究は, モード駆動繊維による3症例の欠失を含む, 4症例の欠失パターンについて紹介する。
本モデルでは, 目的関数の非性にもかかわらず, 乗算器の交互データ演算法を統合することにより, 最適解を導出する。
論文 参考訳(メタデータ) (2022-05-19T08:37:56Z) - Physics-Informed Deep Learning for Traffic State Estimation [3.779860024918729]
交通状態推定(TSE)は、部分的に観測されたデータを用いて道路セグメント上の交通変数(例えば密度)を再構築する。
本論文では,少量の観測データを用いて高品質なTSEを効率的に実行するための物理情報深層学習(PIDL)フレームワークについて紹介する。
論文 参考訳(メタデータ) (2021-01-17T03:28:32Z) - Robust Optimal Transport with Applications in Generative Modeling and
Domain Adaptation [120.69747175899421]
ワッサーシュタインのような最適輸送(OT)距離は、GANやドメイン適応のようないくつかの領域で使用されている。
本稿では,現代のディープラーニングアプリケーションに適用可能な,ロバストなOT最適化の計算効率のよい2つの形式を提案する。
提案手法では, ノイズの多いデータセット上で, 外部分布で劣化したGANモデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2020-10-12T17:13:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。