Fugu-MT 論文翻訳(概要): Learning Visual Information Utility with PIXER

論文の概要: Learning Visual Information Utility with PIXER

arxiv url: http://arxiv.org/abs/2409.13151v1
Date: Fri, 20 Sep 2024 01:31:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-07 11:41:13.398022
Title: Learning Visual Information Utility with PIXER
Title（参考訳）: PIXERによる視覚情報ユーティリティの学習
Authors: Yash Turkar, Timothy Chase Jr, Christo Aluckal, Karthik Dantu,
Abstract要約: 我々はPIXERと「機能性」の概念を導入し、視覚情報の本質的な関心と信頼性を反映して、ロバストな認識を行う。提案手法は, 単一撮影プロセスにおいて, 画素が頑健な視覚的有用性に寄与する確率と不確実性の両方を定量化する。 PIXERを特徴量選択性のある視覚的オドメトリーで評価し, RMSE軌道における平均31%の改善を実現し, 特徴量が49%減少した。
参考スコア（独自算出の注目度）: 3.9723528965581094
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Accurate feature detection is fundamental for various computer vision tasks, including autonomous robotics, 3D reconstruction, medical imaging, and remote sensing. Despite advancements in enhancing the robustness of visual features, no existing method measures the utility of visual information before processing by specific feature-type algorithms. To address this gap, we introduce PIXER and the concept of "Featureness," which reflects the inherent interest and reliability of visual information for robust recognition, independent of any specific feature type. Leveraging a generalization on Bayesian learning, our approach quantifies both the probability and uncertainty of a pixel's contribution to robust visual utility in a single-shot process, avoiding costly operations such as Monte Carlo sampling and permitting customizable featureness definitions adaptable to a wide range of applications. We evaluate PIXER on visual odometry with featureness selectivity, achieving an average of 31% improvement in RMSE trajectory with 49% fewer features.
Abstract（参考訳）: 正確な特徴検出は、自律ロボット工学、3D再構成、医療画像、リモートセンシングなど、様々なコンピュータビジョンタスクに欠かせない。視覚特徴の堅牢性向上の進歩にもかかわらず、特定の特徴型アルゴリズムによって処理される前の視覚情報の有用性を計測する手法は存在しない。このギャップに対処するために,PIXER と "Featureness" の概念を導入する。ベイズ学習の一般化を活用することで,モンテカルロサンプリングのようなコストのかかる操作を回避し,広範囲のアプリケーションに適応可能なカスタマイズ可能な特徴定義を許容し,画素の高機能化への寄与の確率と不確実性の両方を定量化する。 PIXERを特徴量選択性のある視覚的オドメトリーで評価し, RMSE軌道における平均31%の改善を実現し, 特徴量が49%減少した。

関連論文リスト

Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images [0.5825410941577593]
テキスト検出,テキスト抽出,テキスト解析という3つの重要なモジュールからなる,PHI検出のためのAIベースのパイプラインを提案する。これらの結果から,各モジュールに専用の視覚モデルと言語モデルを用いることで,最適な設定を実現することが示唆された。
論文参考訳（メタデータ） (2025-01-16T14:12:33Z)
PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion [80.79938369319152]
我々は,PCF(Probabilis-tic Contrastive Fusion)に基づくPCF-Liftという新しいパイプラインを設計する。私たちのPCFリフトは、ScanNetデータセットやMessy Roomデータセット(シーンレベルのPQが4.4%改善)など、広く使用されているベンチマークにおいて、最先端の手法よりも大幅に優れています。
論文参考訳（メタデータ） (2024-10-14T16:06:59Z)
OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System [7.1083241462091165]
我々は,光学的文字認識(OCR)を基本とする外部モダリティ誘導データマイニングフレームワークを導入し,画像から統計的特徴を抽出する。提案手法の重要な側面は、単一のモーダル認識モデルを用いて抽出された外部モーダル特徴のアライメントであり、畳み込みニューラルネットワークによって符号化された画像特徴である。本手法は欠陥検出モデルのリコール率を大幅に向上させ,挑戦シナリオにおいても高い堅牢性を維持する。
論文参考訳（メタデータ） (2024-03-18T07:41:39Z)
V2X-AHD:Vehicle-to-Everything Cooperation Perception via Asymmetric Heterogenous Distillation Network [13.248981195106069]
車両間協調認識システム(V2X-AHD)を提案する。この研究によると、V2X-AHDは3次元物体検出の精度を効果的に向上し、ネットワークパラメータの数を削減できる。
論文参考訳（メタデータ） (2023-10-10T13:12:03Z)
Learning from Multi-Perception Features for Real-Word Image Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文参考訳（メタデータ） (2023-05-26T07:35:49Z)
Assessor360: Multi-sequence Network for Blind Omnidirectional Image Quality Assessment [50.82681686110528]
Blind Omnidirectional Image Quality Assessment (BOIQA)は、全方位画像(ODI)の人間の知覚品質を客観的に評価することを目的としている。 ODIの品質評価は、既存のBOIQAパイプラインがオブザーバのブラウジングプロセスのモデリングを欠いているという事実によって著しく妨げられている。 Assessor360と呼ばれるBOIQAのための新しいマルチシーケンスネットワークを提案する。
論文参考訳（メタデータ） (2023-05-18T13:55:28Z)
Toward an ImageNet Library of Functions for Global Optimization Benchmarking [0.0]
本研究では,認識問題を画像認識問題に変換することを提案する。教師付きマルチクラス画像認識問題として対処し、基本的ニューラルネットワークモデルを適用して解決する。この明らかに成功した学習は、自動特徴抽出とBBO問題の局所構造推論への別のステップである。
論文参考訳（メタデータ） (2022-06-27T21:05:00Z)
Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文参考訳（メタデータ） (2022-03-11T02:37:35Z)
Deep Collaborative Multi-Modal Learning for Unsupervised Kinship Estimation [53.62256887837659]
キンシップ検証は、コンピュータビジョンにおける長年の研究課題である。本稿では,顔特性に表される基礎情報を統合するために,新しい協調型多モーダル学習(DCML)を提案する。我々のDCML法は、常に最先端のキンシップ検証法よりも優れている。
論文参考訳（メタデータ） (2021-09-07T01:34:51Z)
Understanding Failures of Deep Networks via Robust Feature Extraction [44.204907883776045]
本研究では,視覚的特徴を識別し,不在や不在がパフォーマンスの低下を招き,失敗を特徴づけ,説明することを目的とした手法を紹介し,検討する。我々は、分離されたロバストモデルの表現を活用して、解釈可能な特徴を抽出し、これらの特徴を利用して障害モードを特定します。
論文参考訳（メタデータ） (2020-12-03T08:33:29Z)
Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。 CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文参考訳（メタデータ） (2020-02-03T02:24:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。