論文の概要: A Recursive Pyramidal Algorithm for Solving the Image Registration Problem
- arxiv url: http://arxiv.org/abs/2510.04231v1
- Date: Sun, 05 Oct 2025 14:44:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.531954
- Title: A Recursive Pyramidal Algorithm for Solving the Image Registration Problem
- Title(参考訳): 画像登録問題の解法のための再帰的ピラミッドアルゴリズム
- Authors: Stefan Dirnstorfer,
- Abstract要約: 本稿では,数行のPythonコードで実装可能な,シンプルでエンドツーエンドのトレーニング可能なアルゴリズムを提案する。
ステレオビジョンの例は、19x15入力ウィンドウ上の74の画像から訓練された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of image registration is finding a transformation that aligns two images, such that the corresponding points are in the same location. This paper introduces a simple, end-to-end trainable algorithm that is implementable in a few lines of Python code. The approach is shown to work with very little training data and training time, while achieving accurate results in some settings. An example application to stereo vision was trained from 74 images on a 19x15 input window. With just a dozen lines of Python code this algorithm excels in brevity and may serve as a good start in related scenarios with limitations to training data, training time or code complexity.
- Abstract(参考訳): 画像登録の問題は、対応する点が同じ位置にあるように、2つの画像を整列させる変換を見つけることである。
本稿では,数行のPythonコードで実装可能な,シンプルでエンドツーエンドのトレーニング可能なアルゴリズムを提案する。
このアプローチは非常に少ないトレーニングデータとトレーニング時間で動作し、いくつかの設定で正確な結果を達成することが示されている。
ステレオビジョンの例は、19x15入力ウィンドウ上の74の画像から訓練された。
たった10行のPythonコードで、このアルゴリズムは簡潔さに優れており、データトレーニングやトレーニング時間、コードの複雑さに制限のある関連するシナリオにおいて、良いスタートとなる可能性がある。
関連論文リスト
- Procedural Image Programs for Representation Learning [62.557911005179946]
我々は,2万プログラムからなる大規模なデータセットを用いて,多様な合成画像を生成する訓練を提案する。
これらのプログラムは短いコードスニペットであり、変更が容易で、高速に実行することができる。
提案したデータセットは、教師付きおよび教師なしの表現学習の両方に使用することができ、実際の画像と手続き的に生成された画像との事前学習のギャップを38%削減する。
論文 参考訳(メタデータ) (2022-11-29T17:34:22Z) - EfficientTrain: Exploring Generalized Curriculum Learning for Training
Visual Backbones [80.662250618795]
本稿では視覚バックボーン(例えば視覚変換器)の効率的なトレーニングのための新しいカリキュラム学習手法を提案する。
オフザシェルフ方式として、様々な人気モデルのウォールタイムトレーニングコストを、精度を犠牲にすることなく、ImageNet-1K/22Kで1.5倍に削減する。
論文 参考訳(メタデータ) (2022-11-17T17:38:55Z) - Visual Prompting via Image Inpainting [104.98602202198668]
そこで本研究では,NLPにインスパイアされた新しいタスクの入力出力画像例と新しい入力画像の視覚的プロンプトについて検討する。
事前学習したモデルに視覚的プロンプトを適用し、様々なダウンストリームイメージ・ツー・イメージタスクで結果を示す。
論文 参考訳(メタデータ) (2022-09-01T17:59:33Z) - PyramidCLIP: Hierarchical Feature Alignment for Vision-language Model
Pretraining [68.84339672878066]
意味レベルが異なる入力ピラミッドを構築し,視覚的要素と言語的要素を階層構造として整列させる。
ゼロショット画像分類、ゼロショット画像テキスト検索、画像オブジェクト検出を含む3つの下流タスクの実験は、提案したピラミドCLIPの有効性を検証する。
論文 参考訳(メタデータ) (2022-04-29T13:38:42Z) - Generating natural images with direct Patch Distributions Matching [7.99536002595393]
2つの画像におけるパッチ分布間の距離を明示的にかつ効率的に最小化するアルゴリズムを開発した。
我々の結果は、シングルイメージGANよりも優れていることが多く、トレーニングを必要とせず、数秒で高品質な画像を生成することができる。
論文 参考訳(メタデータ) (2022-03-22T16:38:52Z) - AugNet: End-to-End Unsupervised Visual Representation Learning with
Image Augmentation [3.6790362352712873]
我々は、未ラベル画像の集合から画像特徴を学習するための新しいディープラーニングトレーニングパラダイムであるAugNetを提案する。
実験により,低次元空間における画像の表現が可能であることを実証した。
多くのディープラーニングベースの画像検索アルゴリズムとは異なり、我々のアプローチは外部アノテーション付きデータセットへのアクセスを必要としない。
論文 参考訳(メタデータ) (2021-06-11T09:02:30Z) - Attention for Image Registration (AiR): an unsupervised Transformer
approach [7.443843354775884]
変形可能な画像登録問題に注意機構を導入する。
提案手法は,GPGPUデバイス上で効率的にトレーニング可能なTransformerフレームワークであるAiRをベースとしている。
この方法は教師なしの変形マップを学習し、2つのベンチマークデータセットでテストする。
論文 参考訳(メタデータ) (2021-05-05T18:49:32Z) - Contrastive Learning for Unpaired Image-to-Image Translation [64.47477071705866]
画像から画像への変換では、出力の各パッチは、入力中の対応するパッチの内容を、ドメインに依存しない形で反映すべきである。
本研究では,両者の相互情報を最大化するために,コントラスト学習に基づく枠組みを提案する。
筆者らのフレームワークは、画質の向上とトレーニング時間の短縮を図りながら、画像から画像への翻訳設定の一方的な翻訳を可能にすることを実証している。
論文 参考訳(メタデータ) (2020-07-30T17:59:58Z) - Pyramidal Convolution: Rethinking Convolutional Neural Networks for
Visual Recognition [98.10703825716142]
この研究は、複数のフィルタスケールで入力を処理できるピラミッド畳み込み(PyConv)を導入している。
PyConvをベースとした,画像分類,映像行動分類/認識,オブジェクト検出,意味的画像分割/パーシングの4つの主要なタスクについて,異なるアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-06-20T10:19:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。