論文の概要: PRISM-CAFO: Prior-conditioned Remote-sensing Infrastructure Segmentation and Mapping for CAFOs
- arxiv url: http://arxiv.org/abs/2601.11451v1
- Date: Fri, 16 Jan 2026 17:16:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.581906
- Title: PRISM-CAFO: Prior-conditioned Remote-sensing Infrastructure Segmentation and Mapping for CAFOs
- Title(参考訳): PRISM-CAFO:CAFOのための事前条件付きリモートセンシングインフラストラクチャセグメンテーションとマッピング
- Authors: Oishee Bintey Hoque, Nibir Chandra Mandal, Kyle Luong, Amanda Wilson, Samarth Swarup, Madhav Marathe, Abhijin Adiga,
- Abstract要約: 大規模な家畜の飼育は、人間の健康と環境に重大なリスクをもたらす。
本稿では,航空画像と衛星画像から,集中型動物給餌操作を識別・特徴付けるための,インフラストラクチャファーストで説明可能なパイプラインを提案する。
- 参考スコア(独自算出の注目度): 8.991143286122615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale livestock operations pose significant risks to human health and the environment, while also being vulnerable to threats such as infectious diseases and extreme weather events. As the number of such operations continues to grow, accurate and scalable mapping has become increasingly important. In this work, we present an infrastructure-first, explainable pipeline for identifying and characterizing Concentrated Animal Feeding Operations (CAFOs) from aerial and satellite imagery. Our method (1) detects candidate infrastructure (e.g., barns, feedlots, manure lagoons, silos) with a domain-tuned YOLOv8 detector, then derives SAM2 masks from these boxes and filters component-specific criteria, (2) extracts structured descriptors (e.g., counts, areas, orientations, and spatial relations) and fuses them with deep visual features using a lightweight spatial cross-attention classifier, and (3) outputs both CAFO type predictions and mask-level attributions that link decisions to visible infrastructure. Through comprehensive evaluation, we show that our approach achieves state-of-the-art performance, with Swin-B+PRISM-CAFO surpassing the best performing baseline by up to 15\%. Beyond strong predictive performance across diverse U.S. regions, we run systematic gradient--activation analyses that quantify the impact of domain priors and show ho
- Abstract(参考訳): 大規模な畜産作業は人間の健康と環境に重大なリスクをもたらし、また感染症や極端な気象イベントのような脅威にも脆弱である。
このようなオペレーションの数が増え続けるにつれて、正確でスケーラブルなマッピングがますます重要になっています。
本研究では,航空画像と衛星画像から,集中型動物給餌行動(CAFO)を識別・特徴付けるための,インフラストラクチャファーストで説明可能なパイプラインを提案する。
提案手法は,(1) 候補インフラストラクチャ(例えば, バー, フィードロット, マニキュアラグーン, サイロ)をドメイン調整された YOLOv8 検出器で検出し, 次にこれらのボックスからSAM2マスクを抽出し, 構成記述子(例えば, カウント, エリア, 向き, 空間関係)を抽出し, 軽量な空間空間的横断型分類器を用いて深い視覚的特徴と融合させ, (3) CAFO 型予測とマスクレベルの属性の両方を可視的インフラストラクチャにリンクさせる。
総合評価の結果,Swin-B+PRISM-CAFOが最高性能を最大15倍に超える結果を得た。
様々な米国地域での強い予測性能の他に、ドメイン先行の影響を定量化し、ホーを示す体系的な勾配-アクティベーション分析を実行します。
関連論文リスト
- Habitat Classification from Ground-Level Imagery Using Deep Neural Networks [1.3408365072149797]
本研究では、現在最先端の深層ニューラルネットワークアーキテクチャを地上レベルの生息地画像に適用する。
我々は、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)の2つのモデルのファミリーを評価する。
我々の結果は、ViTsがキー分類基準の最先端CNNベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-07-05T12:07:13Z) - Backdoor Cleaning without External Guidance in MLLM Fine-tuning [76.82121084745785]
Believe Your Eyes (BYE)は、アテンションエントロピーパターンを自己教師信号として活用して、バックドアサンプルを特定してフィルタリングするデータフィルタリングフレームワークである。
クリーンタスクのパフォーマンスを維持しながら、ほぼゼロの攻撃成功率を達成する。
論文 参考訳(メタデータ) (2025-05-22T17:11:58Z) - Cyclic Contrastive Knowledge Transfer for Open-Vocabulary Object Detection [11.497620257835964]
我々は、余分な監督なしに訓練されたCCKT-Detを提案する。
提案フレームワークは,視覚言語モデル(VLM)から抽出した言語クエリと視覚領域の特徴から,循環的かつ動的に知識を伝達する。
CCKT-Detは、VLMの規模が大きくなるにつれて常に性能を向上させることができる。
論文 参考訳(メタデータ) (2025-03-14T02:04:28Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - FLOGA: A machine learning ready dataset, a benchmark and a novel deep
learning model for burnt area mapping with Sentinel-2 [41.28284355136163]
森林火災は人間や動物の生活、生態系、社会経済の安定に重大な脅威をもたらす。
本研究では、FLOGA(Forest wiLdfire Observations for the Greek Area)と名付けた機械学習可能なデータセットを作成し、導入する。
このデータセットは、山火事の前後に取得された衛星画像からなるため、ユニークなものである。
我々はFLOGAを用いて、複数の機械学習アルゴリズムとディープラーニングアルゴリズムの徹底的な比較を行い、バーント領域の自動抽出を行う。
論文 参考訳(メタデータ) (2023-11-06T18:42:05Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Prior Knowledge-Guided Attention in Self-Supervised Vision Transformers [79.60022233109397]
本研究では、未ラベル画像データセットにおける一貫した空間的・意味的構造を利用するフレームワークである空間的事前注意(SPAN)を提案する。
SPANは、アテンションマスクを別個のトランスフォーマーヘッドから正規化し、セマンティック領域の様々な先導に従う。
その結果,アテンションマスクは,ドメインに依存しない事前学習から得られるマスクよりも解釈可能であることが判明した。
論文 参考訳(メタデータ) (2022-09-07T02:30:36Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。