論文の概要: SilIF: Silhouette-Augmented Isolation Forest for Unsupervised Transaction Fraud Detection
- arxiv url: http://arxiv.org/abs/2605.26135v1
- Date: Thu, 21 May 2026 15:01:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.192786
- Title: SilIF: Silhouette-Augmented Isolation Forest for Unsupervised Transaction Fraud Detection
- Title(参考訳): SilIF:Silhouette-Augmented isolated Forest for Unsupervised Transaction Fraud Detection (特集:ユビキタス・バイオサイバネティックス)
- Authors: Venkatakrishnan Gopalakrishnan,
- Abstract要約: 教師なし異常検出は、ラベルが不足しているトランザクション不正検出に広く用いられている。
我々は,森林の樹木によって誘導される表現空間で計算されたシルエットに基づくスコアリング層を付加する,孤立林の拡張であるSilIFを提案する。
IEEE-CIS Fraud Detectionベンチマークでは、アルファ=1.0のSiIFは5つの種で平均0.0080 AUC-PRを改良した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised anomaly detection is widely used in transaction fraud detection where labels are scarce. Isolation Forest (IF) is among the most popular classical methods due to its scalability and ease of deployment. We propose SilIF, an augmentation of Isolation Forest that adds a silhouette-based scoring layer computed in a representation space induced by the trees of the forest. For each point, we extract a vector of per-tree path lengths, cluster these "fingerprints" into structural groups, and compute a silhouette score that measures how well the point fits its assigned group versus the nearest alternative. The silhouette signal is combined with the base IF score via a single hyperparameter alpha. On the IEEE-CIS Fraud Detection benchmark (~590K transactions, 3.5% fraud), SilIF with alpha=1.0 improves over plain Isolation Forest by +0.0080 AUC-PR on average across five seeds, with SilIF winning on all five seeds (paired t-test p=0.046). We also report results on a synthetic credit-card dataset (Sparkov) where the silhouette augmentation does not improve over plain IF, and we characterize the conditions that distinguish the two outcomes. The paper presents SilIF as a tunable, easy-to-deploy enhancement to Isolation Forest with honest reporting of when it helps and when it does not. Code at https://github.com/venkat15vk/silif-anomaly-detection.
- Abstract(参考訳): 教師なし異常検出は、ラベルが不足しているトランザクション不正検出に広く用いられている。
アイソレーションフォレスト(IF)は、そのスケーラビリティと展開の容易さから、最もポピュラーな古典的手法の1つである。
我々は,森林の樹木によって誘導される表現空間で計算されたシルエットに基づくスコアリング層を付加する,孤立林の拡張であるSilIFを提案する。
各点について、木ごとの長さのベクトルを抽出し、これらの「フィンガープリント」を構造群にクラスタリングし、その点が割り当てられた群と最も近い代替品とにどの程度合うかを測定するシルエットスコアを計算する。
シルエット信号は、ベースIFスコアと1つのハイパーパラメータアルファを介して結合される。
IEEE-CIS Fraud Detectionベンチマーク(約590Kのトランザクション、3.5%の不正)では、アルファ=1.0のSiIFは5つの種に平均して+0.0080 AUC-PRで改善し、SilIFは5つの種すべて(ペアリングt-test p=0.046)で勝利した。
また, 合成クレジットカードデータセット (Sparkov) の結果を報告し, シルエット増大は通常のIFよりも改善せず, 両者を区別する条件を特徴付ける。
本論文は,SilIFを,いつ,いつ,いつ,それが有効で,いつ,そうでないかを正直に報告して,隔離林に適応し易い拡張手法として提示する。
コードネームはhttps://github.com/venkat15vk/silif-anomaly-detection。
関連論文リスト
- OVS-DINO: Open-Vocabulary Segmentation via Structure-Aligned SAM-DINO with Language Guidance [53.45125687428705]
Open-Vocabularyは、セマンティック記述を活用することで、定義済みのカテゴリセットを超えてイメージ領域を分割することを目的としている。
近年の取り組みは、これらの制限を軽減するために、DINOのようなVision Foundation Models (VFM) を取り入れている。
我々は,構造アライメントを通じてDINOの潜在エッジ感度を活性化する新しいフレームワークであるOVS-DINOを提案する。
論文 参考訳(メタデータ) (2026-04-09T16:57:11Z) - Preference Isolation Forest for Structure-based Anomaly Detection [32.552683403904]
選好隔離林(PIF)と呼ばれる一般的な異常検出フレームワークを考案する。
PIFは、適応的な分離に基づく手法の利点と、好みの埋め込みの柔軟性を組み合わせる。
本稿では,最も一般的な解である Voronoi-iForest と RuzHash-iForest と Sliding-PIF の3つの分離手法を提案する。
論文 参考訳(メタデータ) (2025-05-16T05:32:25Z) - Manual Labelling Artificially Inflates Deep Learning-Based Segmentation Performance on RGB Images of Closed Canopy: Validation Using TLS [0.0]
フィールドベースの森林在庫に依存する伝統的な方法は、労働集約的であり、空間的範囲に限られている。
我々は、地上レーザー走査(TLS)データから、ボレアルと地中海の森林のドローン画像の高忠実性検証ラベルを生成する。
我々は、広く使われている2つのディープラーニングITCセグメンテーションモデル、DeepForest (RetinaNet) と Detectree2 (マスクR-CNN) の性能を評価する。
両モデルとも, 樹冠木に制限された場合でも, 厳密なIoUしきい値において, 局所化精度が極めて低かった。
論文 参考訳(メタデータ) (2025-03-18T14:09:00Z) - Don't Get Lost in the Trees: Streamlining LLM Reasoning by Overcoming Tree Search Exploration Pitfalls [83.89771461061903]
検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。
検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。
意味論的に等価なコンテンツを持つ冗長な状態による$textitover-Exploration$と、検証器のスコアリングにおける高いばらつきに起因する$textitunder-Exploration$である。
各種木探索アルゴリズムに適合するフレキシブルなプラグアンドプレイシステムであるFETCHを提案する。
論文 参考訳(メタデータ) (2025-02-16T16:12:01Z) - Detecting Anomalies Using Rotated Isolation Forest [10.850101961203748]
我々は,iForestで観測された軸方向のゴーストクラスタと,EIFで観測されたゴーストクラスタの両方を効果的に処理する,回転孤立林 (RIF) アルゴリズムを導入する。
我々の実験は、RIFアルゴリズムがiForestとEIFより優れており、人工データセットと実世界のデータセットの両方から得られた結果から証明されている。
論文 参考訳(メタデータ) (2025-01-29T17:26:31Z) - Neuroevolution-based Classifiers for Deforestation Detection in Tropical
Forests [62.997667081978825]
森林破壊や荒廃により、毎年何百万ヘクタールもの熱帯林が失われる。
監視・森林破壊検知プログラムは、犯罪者の予防・処罰のための公共政策に加えて、使用されている。
本稿では,熱帯林の森林破壊検出作業におけるニューロ進化技術(NEAT)に基づくパターン分類器の利用を提案する。
論文 参考訳(メタデータ) (2022-08-23T16:04:12Z) - Tree Energy Loss: Towards Sparsely Annotated Semantic Segmentation [141.16965264264195]
Sparsely Annotated semantic segmentation (SASS) は、粗い粒度の監督によるセグメンテーションネットワークのトレーニングを目的としている。
ラベルなし画素のセマンティックガイダンスを提供することにより,SASSの新たなツリーエネルギー損失を提案する。
論文 参考訳(メタデータ) (2022-03-21T05:16:23Z) - Country-wide Retrieval of Forest Structure From Optical and SAR
Satellite Imagery With Bayesian Deep Learning [74.94436509364554]
本研究では,10mの解像度で森林構造変数を高密度に推定するベイズ深層学習手法を提案する。
本手法は,Sentinel-2光画像とSentinel-1合成開口レーダ画像を5種類の森林構造変数のマップに変換する。
ノルウェーを横断する41の空中レーザー走査ミッションの基準データに基づいて、我々のモデルを訓練し、テストする。
論文 参考訳(メタデータ) (2021-11-25T16:21:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。