論文の概要: Towards Cross-Modal Error Detection with Tables and Images
- arxiv url: http://arxiv.org/abs/2510.12383v1
- Date: Tue, 14 Oct 2025 10:59:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 21:19:14.983738
- Title: Towards Cross-Modal Error Detection with Tables and Images
- Title(参考訳): 表と画像を用いたクロスモーダル誤差検出に向けて
- Authors: Olga Ovcharenko, Sebastian Schelter,
- Abstract要約: クロスモーダルなエラー検出は、eコマースやヘルスケアのようなドメインで一般的である。
従来のエラー検出手法は単一のモダリティ(典型的にはテーブル)に集中する傾向にある。
CleanlabとDataScopeは、強力なAutoMLフレームワークと組み合わせてベストを尽くします。
- 参考スコア(独自算出の注目度): 8.843472543333979
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ensuring data quality at scale remains a persistent challenge for large organizations. Despite recent advances, maintaining accurate and consistent data is still complex, especially when dealing with multiple data modalities. Traditional error detection and correction methods tend to focus on a single modality, typically a table, and often miss cross-modal errors that are common in domains like e-Commerce and healthcare, where image, tabular, and text data co-exist. To address this gap, we take an initial step towards cross-modal error detection in tabular data, by benchmarking several methods. Our evaluation spans four datasets and five baseline approaches. Among them, Cleanlab, a label error detection framework, and DataScope, a data valuation method, perform the best when paired with a strong AutoML framework, achieving the highest F1 scores. Our findings indicate that current methods remain limited, particularly when applied to heavy-tailed real-world data, motivating further research in this area.
- Abstract(参考訳): 大規模にデータ品質を確保することは、大きな組織にとって永続的な課題です。
最近の進歩にもかかわらず、正確で一貫性のあるデータを維持することは、特に複数のデータモダリティを扱う場合、依然として複雑である。
従来のエラー検出と修正方法は、通常テーブルのような単一のモダリティに集中する傾向があり、画像、表、テキストデータが共存する電子商取引や医療といった領域でよく見られるクロスモーダルなエラーを見逃すことが多い。
このギャップに対処するため、いくつかの手法をベンチマークすることで、表形式のデータのクロスモーダルなエラー検出に向けた最初の一歩を踏み出した。
評価は4つのデータセットと5つのベースラインアプローチにまたがる。
中でも、ラベルエラー検出フレームワークであるCleanlabと、データバリュエーションメソッドであるDataScopeは、強力なAutoMLフレームワークと組み合わせることで、最高のF1スコアを達成している。
以上の結果から,現状の手法は限定的であり,特に実世界の重み付きデータに適用した場合は,この分野におけるさらなる研究の動機となることが示唆された。
関連論文リスト
- Deep Context-Conditioned Anomaly Detection for Tabular Data [9.58464841713335]
異常検出は、サイバーセキュリティやファイナンスといった分野において重要である。
本稿では,文脈条件の異常検出フレームワークを提案する。
提案手法は,コンテキストの特徴を自動的に識別し,条件付きデータ分布をモデル化する。
論文 参考訳(メタデータ) (2025-09-10T22:01:11Z) - A Transfer Learning Framework for Anomaly Detection in Multivariate IoT Traffic Data [6.229535970620059]
本稿では,時系列データセットにおける異常検出のための移動学習モデルを提案する。
従来の手法とは異なり、我々の手法はソースまたはターゲットドメインのラベル付きデータを必要としない。
新たな侵入検出データセットの実証評価は,我々のモデルが既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-01-26T02:03:49Z) - Enhancing Modality Representation and Alignment for Multimodal Cold-start Active Learning [17.954883799795155]
MMCSAL(Multi-Modal Cold-Start Active Learning)のための2段階の手法を開発した。
まず、モーダル間のペアリング情報のみを自己超越信号として用いる場合、異なるモーダルからの表現のセントロイド間の有意な距離であるモダリティギャップを観測する。
次に、正規化によるクロスモーダルアライメントの強化を提案し、MMCSALにおける選択したマルチモーダルデータペアの品質を向上させる。
論文 参考訳(メタデータ) (2024-12-12T10:03:46Z) - TVDiag: A Task-oriented and View-invariant Failure Diagnosis Framework with Multimodal Data [11.373761837547852]
マイクロサービスベースのシステムは、複雑なインタラクションとスケールの拡大によって、信頼性上の問題に悩まされることが多い。
単一モードのデータを使用する従来の障害診断方法は、制限された情報のため、すべての障害シナリオをほとんどカバーできない。
我々は,マルチモーダルな障害診断フレームワークである textitTVDiag を提案する。
論文 参考訳(メタデータ) (2024-07-29T05:26:57Z) - Automating Dataset Updates Towards Reliable and Timely Evaluation of Large Language Models [81.27391252152199]
大規模言語モデル(LLM)は、さまざまな自然言語ベンチマークで素晴らしいパフォーマンスを実現している。
本稿では、データセットの自動更新と、その有効性に関する体系的な分析を提案する。
1) 類似したサンプルを生成するための戦略を模倣すること,2) 既存のサンプルをさらに拡張する戦略を拡張すること,である。
論文 参考訳(メタデータ) (2024-02-19T07:15:59Z) - Robust Domain Misinformation Detection via Multi-modal Feature Alignment [49.89164555394584]
マルチモーダルな誤情報検出のための頑健なドメインとクロスモーダルなアプローチを提案する。
テキストと視覚の共役分布を整列させることにより、ドメインシフトを低減する。
また,ドメイン一般化のアプリケーションシナリオを同時に検討するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-24T07:06:16Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。