論文の概要: Evaluation of Attention Mechanisms in U-Net Architectures for Semantic Segmentation of Brazilian Rock Art Petroglyphs
- arxiv url: http://arxiv.org/abs/2511.11959v1
- Date: Sat, 15 Nov 2025 00:12:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.420735
- Title: Evaluation of Attention Mechanisms in U-Net Architectures for Semantic Segmentation of Brazilian Rock Art Petroglyphs
- Title(参考訳): ブラジルのロックアートペトログリフのセマンティックセグメンテーションのためのU-Netアーキテクチャの注意機構の評価
- Authors: Leonardi Melo, Luís Gustavo, Dimmy Magalhães, Lucciani Vieira, Mauro Araújo,
- Abstract要約: ブラジルの考古学遺跡から得られた岩石アートペトログリフのセマンティックセマンティックセグメンテーションのための3つのU-Netアーキテクチャについて検討した。
ブラジルのピオウにあるポオ・ダ・ベビディンハ考古学複合体(Poo da Bebidinha Archaeological Complex)の5倍のクロスバリデーションを用いて、実験を行った。
Attention-Residual BEGL-UNetは、Dice Scoreで0.710、バリデーション損失0.067、リコール率0.854で最高のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study presents a comparative analysis of three U-Net-based architectures for semantic segmentation of rock art petroglyphs from Brazilian archaeological sites. The investigated architectures were: (1) BEGL-UNet with Border-Enhanced Gaussian Loss function; (2) Attention-Residual BEGL-UNet, incorporating residual blocks and gated attention mechanisms; and (3) Spatial Channel Attention BEGL-UNet, which employs spatial-channel attention modules based on Convolutional Block Attention Module. All implementations employed the BEGL loss function combining binary cross-entropy with Gaussian edge enhancement. Experiments were conducted on images from the Poço da Bebidinha Archaeological Complex, Piauí, Brazil, using 5-fold cross-validation. Among the architectures, Attention-Residual BEGL-UNet achieved the best overall performance with Dice Score of 0.710, validation loss of 0.067, and highest recall of 0.854. Spatial Channel Attention BEGL-UNet obtained comparable performance with DSC of 0.707 and recall of 0.857. The baseline BEGL-UNet registered DSC of 0.690. These results demonstrate the effectiveness of attention mechanisms for archaeological heritage digital preservation, with Dice Score improvements of 2.5-2.9% over the baseline.
- Abstract(参考訳): 本研究では,ブラジルの考古学遺跡から得られた岩石アートペトログリフのセマンティックセグメンテーションのための3つのU-Netアーキテクチャの比較分析を行った。
本研究では,(1)境界強調ガウス関数を用いたBEGL-UNet,(2)残留ブロックとゲートアテンション機構を組み込んだBEGL-UNet,(3)コンボリューショナルブロックアテンションモジュールに基づく空間チャネルアテンションモジュールを用いた空間チャネルアテンションBEGL-UNetについて検討した。
すべての実装では、バイナリクロスエントロピーとガウスエッジ拡張を組み合わせたBEGL損失関数が採用された。
ブラジルのピオウイにあるポチョ・ダ・ベビディンハ考古学複合体(Poço da Bebidinha Archaeological Complex)の5倍のクロスバリデーションを用いて、実験を行った。
アーキテクチャの中で、Attention-Residual BEGL-UNetは、Dice Scoreの0.710、バリデーションの損失0.067、最大0.854で最高のパフォーマンスを達成した。
空間チャネル注意 BEGL-UNet は DSC が 0.707 で、リコールが 0.857 であった。
BEGL-UNet のベースラインは DSC を 0.690 として登録した。
これらの結果は、考古学遺産のデジタル保存における注意機構の有効性を示し、Dice Scoreはベースラインよりも2.5-2.9%向上した。
関連論文リスト
- Spatially-Aware Mixture of Experts with Log-Logistic Survival Modeling for Whole-Slide Images [6.825656149756289]
4つの相補的な革新を通じて制限に対処する包括的計算病理学フレームワークを導入する。
大規模TCGAコホートでは, LUADでは0.644, KIRCでは0.751, BRCAでは0.752の時間依存一致指数が得られた。
このフレームワークはさらにキャリブレーションと解釈性を改善し、パーソナライズされたがん予後のためのWSIsの使用を推進している。
論文 参考訳(メタデータ) (2025-11-09T08:02:15Z) - GRID: Graph-based Reasoning for Intervention and Discovery in Built Environments [0.31096636737010974]
商業ビルにおける手動のHVAC故障診断には、インシデント毎に8~12時間かかり、診断精度は60%に過ぎません。
本稿では,制約に基づく探索,ニューラル構造方程式モデリング,言語モデルなどを組み合わせた3段階の因果探索パイプラインGRIDについて述べる。
このフレームワークは制約ベースの手法、ニューラルアーキテクチャ、ドメイン固有の言語モデルを統合し、分析を構築する際の観察と因果的なギャップに対処する。
論文 参考訳(メタデータ) (2025-09-19T20:19:48Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Graph-Structured Data Analysis of Component Failure in Autonomous Cargo Ships Based on Feature Fusion [20.287188044863925]
本稿では,障害モードのグラフ構造化データセットを構築するためのハイブリッド機能融合フレームワークを提案する。
サブシステム/コンポーネント機能のエンコードにWord2Vecエンコーディング、障害モード/領域の処理にBERT-KPCA、障害影響と緊急意思決定のセマンティックな関連を定量化するSentence-BERTを用いて階層的特徴融合フレームワークを構築する。
論文 参考訳(メタデータ) (2025-07-18T08:02:49Z) - Pix2Geomodel: A Next-Generation Reservoir Geomodeling with Property-to-Property Translation [2.004012818482403]
本研究では、Pix2Pixをベースとした新しい条件付き生成対向ネットワーク(cGAN)フレームワークであるPix2Geomodelを紹介する。
グローニンゲンガス田のロトリーゲンド貯水池から貯水池特性(空洞、ポーシティ、透水性、飽和度)を予測するように設計されている。
その結果, 病状 (PA 0.88, FWIoU 0.85) と水飽和 (PA 0.96, FWIoU 0.95) の精度が高く, 気孔率 (PA 0.70, FWIoU 0.55) と透過性 (PA 0.74, FWIoU 0.60) が適度に向上し, 翻訳性能も良好であった。
論文 参考訳(メタデータ) (2025-06-21T15:58:27Z) - Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。
これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。
提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文 参考訳(メタデータ) (2024-09-04T16:47:16Z) - Cycle-YOLO: A Efficient and Robust Framework for Pavement Damage Detection [13.221462950649467]
本稿では,CycleGANと改良YOLOv5アルゴリズムを用いた舗装損傷検出手法を提案する。
本アルゴリズムは, 3種類の舗装損傷(き裂, 穴, パッチ)を検出する場合, 0.872, 0.854, 平均精度@0.5, 0.882, 平均精度@0.5を達成した。
論文 参考訳(メタデータ) (2024-05-28T07:27:42Z) - Combating Bilateral Edge Noise for Robust Link Prediction [56.43882298843564]
本稿では,RGIB(Robust Graph Information Bottleneck)という情報理論の原則を提案し,信頼性の高い監視信号を抽出し,表現の崩壊を回避する。
RGIB-SSLとRGIB-REPの2つのインスタンス化は、異なる手法の利点を活用するために検討されている。
6つのデータセットと3つのGNNの様々なノイズシナリオによる実験は、我々のRGIBインスタンスの有効性を検証する。
論文 参考訳(メタデータ) (2023-11-02T12:47:49Z) - Attention-based Saliency Maps Improve Interpretability of Pneumothorax
Classification [52.77024349608834]
視覚変換器(ViT)の胸部X線撮影(CXR)分類性能と注意ベース唾液の解釈可能性について検討する。
ViTは、CheXpert、Chest X-Ray 14、MIMIC CXR、VinBigDataの4つの公開データセットを用いて、肺疾患分類のために微調整された。
ViTsは最先端のCNNと比べてCXR分類AUCに匹敵するものであった。
論文 参考訳(メタデータ) (2023-03-03T12:05:41Z) - G-DetKD: Towards General Distillation Framework for Object Detectors via
Contrastive and Semantic-guided Feature Imitation [49.421099172544196]
そこで本研究では,すべてのピラミッドレベルにまたがる特徴ペア間のソフトマッチングを自動的に行う,意味誘導型特徴模倣手法を提案する。
また,異なる特徴領域間の関係で符号化された情報を効果的に捉えるために,コントラスト蒸留を導入する。
本手法は,(1)フレームワークのコンポーネントを別々に使用した場合に,既存の検出KD技術よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-08-17T07:44:27Z) - Performance of Dual-Augmented Lagrangian Method and Common Spatial
Patterns applied in classification of Motor-Imagery BCI [68.8204255655161]
運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は、神経リハビリテーションのための画期的な技術になる可能性がある。
使用する脳波信号のノイズの性質のため、信頼性の高いBCIシステムは特徴の最適化と抽出のために特別な手順を必要とする。
論文 参考訳(メタデータ) (2020-10-13T20:50:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。