論文の概要: Sparse Kronecker Product Decomposition: A General Framework of Signal
Region Detection in Image Regression
- arxiv url: http://arxiv.org/abs/2210.09128v1
- Date: Mon, 17 Oct 2022 14:22:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 16:01:33.242886
- Title: Sparse Kronecker Product Decomposition: A General Framework of Signal
Region Detection in Image Regression
- Title(参考訳): Sparse Kronecker Product Decomposition:画像回帰における信号領域検出の一般的なフレームワーク
- Authors: Sanyou Wu, Long Feng
- Abstract要約: 本稿では,高分解能画像回帰問題における信号領域検出のための最初のFrequentistフレームワークを提案する。
本フレームワークは,1)一項SKPD,2)多項SKPD,3)非線形SKPDを含む。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper aims to present the first Frequentist framework on signal region
detection in high-resolution and high-order image regression problems. Image
data and scalar-on-image regression are intensively studied in recent years.
However, most existing studies on such topics focused on outcome prediction,
while the research on image region detection is rather limited, even though the
latter is often more important. In this paper, we develop a general framework
named Sparse Kronecker Product Decomposition (SKPD) to tackle this issue. The
SKPD framework is general in the sense that it works for both matrices (e.g.,
2D grayscale images) and (high-order) tensors (e.g., 2D colored images, brain
MRI/fMRI data) represented image data. Moreover, unlike many Bayesian
approaches, our framework is computationally scalable for high-resolution image
problems. Specifically, our framework includes: 1) the one-term SKPD; 2) the
multi-term SKPD; and 3) the nonlinear SKPD. We propose nonconvex optimization
problems to estimate the one-term and multi-term SKPDs and develop
path-following algorithms for the nonconvex optimization. The computed
solutions of the path-following algorithm are guaranteed to converge to the
truth with a particularly chosen initialization even though the optimization is
nonconvex. Moreover, the region detection consistency could also be guaranteed
by the one-term and multi-term SKPD. The nonlinear SKPD is highly connected to
shallow convolutional neural networks (CNN), particular to CNN with one
convolutional layer and one fully connected layer. Effectiveness of SKPDs is
validated by real brain imaging data in the UK Biobank database.
- Abstract(参考訳): 本稿では,高分解能・高次画像回帰問題における信号領域検出のための最初のFrequentistフレームワークを提案する。
近年,画像データとスカラー・オン・イメージ・レグレッションの研究が盛んに行われている。
しかし、これらのトピックに関する既存の研究は結果予測に重点を置いているが、画像領域検出の研究は比較的限られている。
本稿では,Sparse Kronecker Product Decomposition (SKPD) というフレームワークを開発し,この問題に対処する。
SKPDフレームワークは、行列(例えば、2Dグレースケール画像)と(高階テンソル(例えば、2Dカラー画像、脳MRI/fMRIデータ)の両方で画像データを表すという意味で一般的なものである。
さらに,多くのベイズ的手法と異なり,高分解能画像問題に対する計算スケーラブルな手法である。
具体的には、我々のフレームワークには、
1) 1期SKPD
2) 複数長期SKPD,及び
3)非線形SKPD。
非凸最適化問題を提案し、一項および複数項のSKPDを推定し、非凸最適化のための経路追従アルゴリズムを開発する。
経路追従アルゴリズムの計算解は、最適化が非凸であるにもかかわらず、特に選択された初期化で真実に収束することが保証される。
さらに、領域検出一貫性は、一項および複数項のSKPDによって保証される。
非線形SKPDは、浅い畳み込みニューラルネットワーク(CNN)、特に1つの畳み込み層と1つの完全連結層を持つCNNに高結合である。
skpdsの有効性は、イギリスバイオバンクデータベースの脳画像データによって検証される。
関連論文リスト
- Learning to utilize image second-order derivative information for crisp edge detection [13.848361661516595]
エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文 参考訳(メタデータ) (2024-06-09T13:25:02Z) - Two Approaches to Supervised Image Segmentation [55.616364225463066]
本研究は、深層学習とマルチセットニューロンのアプローチの比較実験を開発する。
ディープラーニングアプローチは、画像セグメンテーションの実行の可能性を確認した。
代替のマルチセット手法では、計算資源をほとんど必要とせずに精度を向上することができた。
論文 参考訳(メタデータ) (2023-07-19T16:42:52Z) - A Novel Algorithm for Exact Concave Hull Extraction [0.0]
領域抽出は、自律運転における物体検出から細胞生物学における細胞内形態解析まで、幅広い用途で必要とされる。
2つの主要なアプローチがある: 凸殻抽出(convex hull extract)は、正確で効率的なアルゴリズムが存在し、実世界の形状を捉えるのに優れているが、単一の解を持たない。
本研究では,コンケーブ内包を最大分解能(ピクセル完全)で提供し,速度効率のトレードオフを調整可能な新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-23T05:26:48Z) - Direct Dense Pose Estimation [138.56533828316833]
複雑な人間のポーズ推定は、RGB画像と人体の表面との密接な対応を学習する問題である。
従来より密集したポーズ推定手法は、すべてMask R-CNNフレームワークに基づいており、まず各人物のバウンディングボックスを識別しようとするトップダウン方式で動作している。
そこで我々は,DDP (Direct Dense Pose) という,高密度ポーズ推定問題の解法を提案する。
論文 参考訳(メタデータ) (2022-04-04T06:14:38Z) - STRIDE along Spectrahedral Vertices for Solving Large-Scale Rank-One
Semidefinite Relaxations [27.353023427198806]
我々は、制約のない最適化問題(POP)の高次半定値プログラミング緩和を考察する。
POPから独立してSDPを解く既存のアプローチは、そのようなSDPの典型的な非エネルギー性のため、大きな問題にスケールできないか、あるいは緩やかな収束に苦しむことができない。
我々は SpecTrahedral vErtices (STRIDE) と呼ばれる新しいアルゴリズムフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T18:07:16Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z) - Convolutional Neural Networks with Intermediate Loss for 3D
Super-Resolution of CT and MRI Scans [25.089517950882527]
3次元CTやMRIの単一画像超解像へのアプローチを提案する。
提案手法は,10層からなる深層畳み込みニューラルネットワーク(CNN)に基づく。
2つのデータベースからのCTとMRIの2次元および3次元超解像の文脈において,本手法の評価を行った。
論文 参考訳(メタデータ) (2020-01-05T23:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。