Fugu-MT 論文翻訳(概要): More precise edge detections

論文の概要: More precise edge detections

arxiv url: http://arxiv.org/abs/2407.19992v1
Date: Mon, 29 Jul 2024 13:24:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-30 13:46:37.870657
Title: More precise edge detections
Title（参考訳）: より精密なエッジ検出
Authors: Hao Shu, Guo-Ping Qiu,
Abstract要約: エッジ検出 (ED) はコンピュータビジョンの基本的なタスクである。現在のモデルは相変わらず不満足な精度に悩まされている。より正確な予測のためのモデルアーキテクチャはまだ調査が必要である。
参考スコア（独自算出の注目度）: 13.889182854034752
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image Edge detection (ED) is a base task in computer vision. While the performance of the ED algorithm has been improved greatly by introducing CNN-based models, current models still suffer from unsatisfactory precision rates especially when only a low error toleration distance is allowed. Therefore, model architecture for more precise predictions still needs an investigation. On the other hand, the unavoidable noise training data provided by humans would lead to unsatisfactory model predictions even when inputs are edge maps themselves, which also needs improvement. In this paper, more precise ED models are presented with cascaded skipping density blocks (CSDB). Our models obtain state-of-the-art(SOTA) predictions in several datasets, especially in average precision rate (AP), which is confirmed by extensive experiments. Moreover, our models do not include down-sample operations, demonstrating those widely believed operations are not necessary. Also, a novel modification on data augmentation for training is employed, which allows noiseless data to be employed in model training and thus improves the performance of models predicting on edge maps themselves.
Abstract（参考訳）: Image Edge Detection (ED) はコンピュータビジョンの基本的なタスクである。 EDアルゴリズムの性能はCNNモデルの導入によって大幅に改善されているが、現在のモデルでは特に低誤差許容距離しか許容されない場合、不満足な精度で悩まされている。したがって、より正確な予測のためのモデルアーキテクチャは依然として調査が必要である。一方、人間によって提供される避けられない騒音訓練データは、入力がエッジマップ自身であっても満足のいくモデル予測につながり、改善も必要となる。本稿では,より精密なEDモデルにカスケードスキップ密度ブロック(CSDB)を提案する。我々のモデルはいくつかのデータセット、特に実験により確認された平均精度(AP)において、最先端(SOTA)予測を得る。さらに、我々のモデルはダウンサンプル操作を含まないので、広く信じられている操作は不要であることを示す。また、モデルトレーニングにノイズのないデータを用いることで、エッジマップ自体で予測されるモデルの性能を向上させることができる。

関連論文リスト

Advancing Metallic Surface Defect Detection via Anomaly-Guided Pretraining on a Large Industrial Dataset [10.37449551492674]
AGSSP(Anomaly-Guided Self-Supervised Pretraining)は、異常事前学習を導く新しいパラダイムである。我々は,高品質な異常マップを生成するための知識向上手法を開発し,12万枚の画像の大規模産業データセットを収集する。 AGSSPは、ImageNetベースのモデルと比較して、mAP@0.5で10%、mAP@0.5:0.95で11.4%改善された。
論文参考訳（メタデータ） (2025-09-23T12:35:32Z)
From Editor to Dense Geometry Estimator [77.21804448599009]
密度幾何予測のための拡散変換器(DiT)アーキテクチャに基づく高度な編集モデルを適用するフレームワークである textbfFE2E を紹介する。 FE2EはETH3Dデータセットで35%以上のパフォーマンス向上を実現し、100$times$データでトレーニングされたDepthAnythingシリーズを上回っている。
論文参考訳（メタデータ） (2025-09-04T15:58:50Z)
What Really Matters for Robust Multi-Sensor HD Map Construction? [9.108124985480046]
高精度かつ包括的な静的環境情報の提供には,HDマップ構築法が不可欠である。既存のアプローチは主にモデルの精度の向上に重点を置いており、知覚モデルの堅牢性を無視していることが多い。高精度を維持しつつ,HDマップ構築のためのマルチモーダル融合法のロバスト性を高める戦略を提案する。
論文参考訳（メタデータ） (2025-07-02T08:46:27Z)
Efficient Detection Framework Adaptation for Edge Computing: A Plug-and-play Neural Network Toolbox Enabling Edge Deployment [59.61554561979589]
エッジコンピューティングは、時間に敏感なシナリオでディープラーニングベースのオブジェクト検出をデプロイするための重要なパラダイムとして登場した。既存のエッジ検出手法では、軽量モデルによる検出精度のバランスの難しさ、適応性の制限、現実の検証の不十分といった課題に直面している。本稿では,汎用的なプラグイン・アンド・プレイコンポーネントを用いてエッジ環境にオブジェクト検出モデルを適用するエッジ検出ツールボックス(ED-TOOLBOX)を提案する。
論文参考訳（メタデータ） (2024-12-24T07:28:10Z)
RealTraj: Towards Real-World Pedestrian Trajectory Forecasting [10.332817296500533]
本稿では,軌道予測の現実的適用性を高める新しいフレームワークであるRealTrajを提案する。 Det2TrajFormerは、過去の検出を入力として使用することで、ノイズの追跡に不変なモデルである。従来のトラジェクトリ予測手法とは異なり,本手法は地平線検出のみを用いてモデルを微調整し,コストのかかる人体IDアノテーションの必要性を低減させる。
論文参考訳（メタデータ） (2024-11-26T12:35:26Z)
Truncated Consistency Models [57.50243901368328]
トレーニング一貫性モデルは、PF ODE 軌道に沿ったすべての中間点を対応するエンドポイントにマッピングする学習を必要とする。このトレーニングパラダイムが一貫性モデルの1ステップ生成性能を制限することを実証的に見出した。整合性関数の新しいパラメータ化と2段階の訓練手順を提案し,時間外学習が崩壊することを防ぐ。
論文参考訳（メタデータ） (2024-10-18T22:38:08Z)
Erase then Rectify: A Training-Free Parameter Editing Approach for Cost-Effective Graph Unlearning [17.85404473268992]
グラフアンラーニングは、訓練されたグラフニューラルネットワーク(GNN)からノード、エッジ、属性の影響を排除することを目的としている。既存のグラフアンラーニング技術は、しばしば残りのデータに対する追加のトレーニングを必要とし、かなりの計算コストをもたらす。本稿では,2段階の学習自由アプローチであるETR(Erase then Rectify)を提案する。
論文参考訳（メタデータ） (2024-09-25T07:20:59Z)
UdeerLID+: Integrating LiDAR, Image, and Relative Depth with Semi-Supervised [12.440461420762265]
道路分割は自動運転システムにとって重要な課題である。我々の研究は、LiDARポイントクラウドデータ、ビジュアルイメージ、および相対深度マップを統合する革新的なアプローチを導入している。主な課題の1つは、大規模で正確にラベル付けされたデータセットの不足である。
論文参考訳（メタデータ） (2024-09-10T03:57:30Z)
NUDGE: Lightweight Non-Parametric Fine-Tuning of Embeddings for Retrieval [0.7646713951724011]
既存のアプローチは、事前訓練されたモデル自体を微調整するか、より効率的に、事前訓練されたモデルの出力を変換するためにアダプタモデルを訓練する。 NUDGEは、新しい非パラメトリック埋め込みファインチューニングアプローチのファミリーである。 NUDGEは、$k$-NN検索の精度を最大化するために、データレコードの埋め込みを直接修正する。
論文参考訳（メタデータ） (2024-09-04T00:10:36Z)
Source-Free Test-Time Adaptation For Online Surface-Defect Detection [29.69030283193086]
テスト時間適応型表面欠陥検出手法を提案する。推論中にトレーニング済みのモデルを新しいドメインやクラスに適応させる。実験では、最先端の技術よりも優れています。
論文参考訳（メタデータ） (2024-08-18T14:24:05Z)
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文参考訳（メタデータ） (2024-03-20T04:58:03Z)
Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文参考訳（メタデータ） (2024-03-11T16:22:41Z)
Real-Time Object Detection in Occluded Environment with Background Cluttering Effects Using Deep Learning [0.8192907805418583]
混在した環境下での車やタンクのリアルタイム検出のためのディープラーニングモデルに集中する。開発した手法は、カスタムデータセットを作成し、ノイズの多いデータセットをきれいにするために前処理技術を使用する。 SSD-Mobilenet v2モデルの精度とフレームは、YOLO V3やYOLO V4よりも高い。
論文参考訳（メタデータ） (2024-01-02T01:30:03Z)
Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。このようなモデルは大きい傾向があり、訓練データの総量を必要とする。人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文参考訳（メタデータ） (2023-11-02T01:51:43Z)
Practical Edge Detection via Robust Collaborative Learning [11.176517889212015]
エッジ検出は、幅広いビジョン指向タスクのコアコンポーネントである。目標を達成するためには,2つの重要な問題に対処する必要がある。非効率なトレーニング済みバックボーンからディープエッジモデルを緩和する方法。トレーニングデータにおいて、ノイズや間違ったラベルからネガティブな影響を解放する方法。
論文参考訳（メタデータ） (2023-08-27T12:12:27Z)
Exploring the Effectiveness of Dataset Synthesis: An application of Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文参考訳（メタデータ） (2023-06-20T09:46:01Z)
Incremental Outlier Detection Modelling Using Streaming Analytics in Finance & Health Care [0.0]
私たちは、ストリーミングデータに取り組むためにストリーミングモデルを持つことが極めて必要であることを確認しました。本研究の目的は,実環境に適用可能なストリーミングモデルの研究と分析である。
論文参考訳（メタデータ） (2023-05-17T02:30:28Z)
Learning Sample Difficulty from Pre-trained Models for Reliable Prediction [55.77136037458667]
本稿では,大規模事前学習モデルを用いて,サンプル難易度を考慮したエントロピー正規化による下流モデルトレーニングを指導する。我々は、挑戦的なベンチマークで精度と不確実性の校正を同時に改善する。
論文参考訳（メタデータ） (2023-04-20T07:29:23Z)
ALUM: Adversarial Data Uncertainty Modeling from Latent Model Uncertainty Compensation [25.67258563807856]
本稿では,モデル不確実性とデータ不確実性を扱うALUMという新しい手法を提案する。提案するALUMはモデルに依存しないため,オーバーヘッドの少ない既存のディープモデルに容易に実装できる。
論文参考訳（メタデータ） (2023-03-29T17:24:12Z)
Real-time Human Detection Model for Edge Devices [0.0]
畳み込みニューラルネットワーク(CNN)は、検出と分類タスクにおいて、従来の特徴抽出と機械学習モデルを置き換える。最近、リアルタイムタスクのために軽量CNNモデルが導入されている。本稿では,Raspberry Piのような限られたエッジデバイスに適合するCNNベースの軽量モデルを提案する。
論文参考訳（メタデータ） (2021-11-20T18:42:17Z)
Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文参考訳（メタデータ） (2021-07-05T12:44:39Z)
Churn Reduction via Distillation [54.5952282395487]
本研究は, 基礎モデルを教師として用いた蒸留によるトレーニングと, 予測的チャーンに対する明示的な制約によるトレーニングとの等価性を示す。次に, 蒸留が近年の多くのベースラインに対する低チャーン訓練に有効であることを示す。
論文参考訳（メタデータ） (2021-06-04T18:03:31Z)
Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文参考訳（メタデータ） (2021-01-18T03:24:48Z)
Evaluating Prediction-Time Batch Normalization for Robustness under Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文参考訳（メタデータ） (2020-06-19T05:08:43Z)
Extrapolation for Large-batch Training in Deep Learning [72.61259487233214]
我々は、バリエーションのホストが、我々が提案する統一されたフレームワークでカバー可能であることを示す。本稿では,この手法の収束性を証明し,ResNet,LSTM,Transformer上での経験的性能を厳格に評価する。
論文参考訳（メタデータ） (2020-06-10T08:22:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。