論文の概要: ReTabAD: A Benchmark for Restoring Semantic Context in Tabular Anomaly Detection
- arxiv url: http://arxiv.org/abs/2510.02060v1
- Date: Thu, 02 Oct 2025 14:28:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.166271
- Title: ReTabAD: A Benchmark for Restoring Semantic Context in Tabular Anomaly Detection
- Title(参考訳): ReTabAD: 喉頭異常検出における意味的文脈の復元のためのベンチマーク
- Authors: Sanghyu Yoon, Dongmin Kim, Suhee Yoon, Ye Seul Sim, Seungdong Yoa, Hye-Seung Cho, Soonyoung Lee, Hankook Lee, Woohyung Lim,
- Abstract要約: 本稿では,コンテキスト認識型異常検出のためのベンチマークとしてReTabADを紹介する。
意味的コンテキストによって検出性能が向上し,解釈可能性も向上することを示す。
これらの知見は、文脈認識ADの体系的な探索のベンチマークとしてReTabADを確立した。
- 参考スコア(独自算出の注目度): 17.504994754856735
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In tabular anomaly detection (AD), textual semantics often carry critical signals, as the definition of an anomaly is closely tied to domain-specific context. However, existing benchmarks provide only raw data points without semantic context, overlooking rich textual metadata such as feature descriptions and domain knowledge that experts rely on in practice. This limitation restricts research flexibility and prevents models from fully leveraging domain knowledge for detection. ReTabAD addresses this gap by restoring textual semantics to enable context-aware tabular AD research. We provide (1) 20 carefully curated tabular datasets enriched with structured textual metadata, together with implementations of state-of-the-art AD algorithms including classical, deep learning, and LLM-based approaches, and (2) a zero-shot LLM framework that leverages semantic context without task-specific training, establishing a strong baseline for future research. Furthermore, this work provides insights into the role and utility of textual metadata in AD through experiments and analysis. Results show that semantic context improves detection performance and enhances interpretability by supporting domain-aware reasoning. These findings establish ReTabAD as a benchmark for systematic exploration of context-aware AD.
- Abstract(参考訳): 表状異常検出(AD)では、テキスト意味論はしばしば重要な信号を持ち、異常の定義はドメイン固有の文脈と密接に結びついている。
しかし、既存のベンチマークは意味のない生のデータポイントのみを提供し、専門家が実際に依存している特徴記述やドメイン知識のようなリッチなテキストメタデータを見渡す。
この制限は研究の柔軟性を制限し、モデルが検出にドメイン知識を完全に活用することを防ぐ。
ReTabADはこのギャップに対処し、コンテキスト対応の表AD研究を可能にするためにテキストセマンティクスを復元する。
我々は,(1)構造化されたテキストメタデータに富んだ20個のテーブル状データセットを,古典的,深層学習,LSMベースのアプローチを含む最先端ADアルゴリズムの実装とともに,慎重にキュレートし,(2)タスク固有のトレーニングを伴わずにセマンティックコンテキストを活用するゼロショットLLMフレームワークを提供し,将来の研究の強力なベースラインを確立する。
さらに、本研究は実験と分析を通じて、ADにおけるテキストメタデータの役割と有用性に関する洞察を提供する。
その結果、意味コンテキストは検出性能を改善し、ドメイン認識推論をサポートすることにより解釈可能性を高めることが示された。
これらの知見は、文脈認識型ADの体系的探索のベンチマークとしてReTabADを確立した。
関連論文リスト
- METER: Multi-modal Evidence-based Thinking and Explainable Reasoning -- Algorithm and Benchmark [48.78602579128459]
本稿では,画像,ビデオ,音声,映像コンテンツにまたがる偽造検出のための統合ベンチマークMETERを紹介する。
我々のデータセットは4つのトラックから構成されており、それぞれのトラックは実際のvsフェイク分類だけでなく、エビデンスチェーンに基づく説明も必要である。
論文 参考訳(メタデータ) (2025-07-22T03:42:51Z) - Semantic Consistency Regularization with Large Language Models for Semi-supervised Sentiment Analysis [20.503153899462323]
本稿では,半教師付き感情分析のためのフレームワークを提案する。
テキストを意味的に拡張する2つのプロンプト戦略を導入する。
実験により,従来の半教師付き手法よりも優れた性能が得られた。
論文 参考訳(メタデータ) (2025-01-29T12:03:11Z) - A Reality Check on Context Utilisation for Retrieval-Augmented Generation [44.54803681476863]
DRUID (Dataset of Retrieved Untrieved Unliable, Insufficient and Difficult-to-understand contexts) を導入し、実世界のクエリやコンテキストを手動でアノテートする。
このデータセットは、現実世界の証拠の自動検索が不可欠である自動クレーム検証のタスクに基づいている。
合成データセットは、実検索データで稀な文脈特性を誇張し、拡張された文脈利用結果をもたらすことを示す。
論文 参考訳(メタデータ) (2024-12-22T14:16:38Z) - Sequential Visual and Semantic Consistency for Semi-supervised Text
Recognition [56.968108142307976]
Scene Text Recognition (STR) は、大規模なアノテートデータを必要とする課題である。
既存のSTR法の多くは、STRモデルの性能を低下させ、ドメイン差を生じさせる合成データに頼っている。
本稿では,視覚的・意味的両面から単語レベルの整合性正則化を取り入れたSTRの半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-24T13:00:54Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Towards Novel Target Discovery Through Open-Set Domain Adaptation [73.81537683043206]
オープンソースドメイン適応(OSDA)は、ターゲットドメインが外部のソースドメインでは観察できない新しいカテゴリのサンプルを含むと考えている。
対象領域に見られるカテゴリを正確に識別し,未知のカテゴリのセマンティクス特性を効果的に回復するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-06T04:22:29Z) - Towards Accurate Scene Text Recognition with Semantic Reasoning Networks [52.86058031919856]
本稿では,シーンテキスト認識のための意味推論ネットワーク(SRN)という,エンドツーエンドのトレーニング可能な新しいフレームワークを提案する。
GSRMはマルチウェイ並列伝送によってグローバルセマンティックコンテキストをキャプチャするために導入された。
正規テキスト,不規則テキスト,非ラテン語長文を含む7つの公開ベンチマークの結果,提案手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2020-03-27T09:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。