論文の概要: Non-Separable Multi-Dimensional Network Flows for Visual Computing
- arxiv url: http://arxiv.org/abs/2305.08628v1
- Date: Mon, 15 May 2023 13:21:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 14:35:12.815258
- Title: Non-Separable Multi-Dimensional Network Flows for Visual Computing
- Title(参考訳): ビジュアルコンピューティングのための非分離型多次元ネットワークフロー
- Authors: Viktoria Ehm, Daniel Cremers, Florian Bernard
- Abstract要約: 本研究では,非分離型多次元ネットワークフローに対する新しい定式化法を提案する。
フローは次元ごとに定義されるので、最大化フローは自動的に最適な特徴次元を選択する。
概念実証として,マルチオブジェクト追跡問題にフォーマリズムを適用し,ノイズに対するロバスト性の観点からMOT16ベンチマークのスカラー定式化よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 62.50191141358778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flows in networks (or graphs) play a significant role in numerous computer
vision tasks. The scalar-valued edges in these graphs often lead to a loss of
information and thereby to limitations in terms of expressiveness. For example,
oftentimes high-dimensional data (e.g. feature descriptors) are mapped to a
single scalar value (e.g. the similarity between two feature descriptors). To
overcome this limitation, we propose a novel formalism for non-separable
multi-dimensional network flows. By doing so, we enable an automatic and
adaptive feature selection strategy - since the flow is defined on a
per-dimension basis, the maximizing flow automatically chooses the best
matching feature dimensions. As a proof of concept, we apply our formalism to
the multi-object tracking problem and demonstrate that our approach outperforms
scalar formulations on the MOT16 benchmark in terms of robustness to noise.
- Abstract(参考訳): ネットワーク内のフロー(またはグラフ)は多くのコンピュータビジョンタスクにおいて重要な役割を果たす。
これらのグラフのスカラー値の辺はしばしば情報の損失につながり、表現力の面での制限につながる。
例えば、しばしば高次元のデータ(例えば特徴記述子)は単一のスカラー値にマッピングされる(例えば、2つの特徴記述子間の類似性)。
この制限を克服するために,非分離型多次元ネットワークフローの新たな形式化を提案する。
これによって、自動的かつ適応的な特徴選択戦略が実現される。フローは次元ごとに定義されているので、最大化フローは最適な特徴次元を自動的に選択する。
概念実証として,マルチオブジェクト追跡問題に適用し,提案手法が雑音に対するロバスト性の観点から,mot16ベンチマークにおけるスカラー定式化よりも優れていることを示す。
関連論文リスト
- Sequence Modeling with Multiresolution Convolutional Memory [27.218134279968062]
我々は、MultiresLayerと呼ばれるシーケンスモデリングのための新しいビルディングブロックを構築します。
我々のモデルの主要な構成要素はマルチレゾリューション・コンボリューションであり、入力シーケンスにおけるマルチスケールトレンドをキャプチャする。
本モデルでは,多数のシーケンス分類と自己回帰密度推定タスクについて,最先端の性能を示す。
論文 参考訳(メタデータ) (2023-05-02T17:50:54Z) - MultiScale MeshGraphNets [65.26373813797409]
我々はMeshGraphNetsからフレームワークを改善するための2つの補完的なアプローチを提案する。
まず、より粗いメッシュ上で高解像度システムの正確なサロゲートダイナミクスを学習できることを実証する。
次に、2つの異なる解像度でメッセージを渡す階層的アプローチ(MultiScale MeshGraphNets)を導入する。
論文 参考訳(メタデータ) (2022-10-02T20:16:20Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - A Lightweight, Efficient and Explainable-by-Design Convolutional Neural
Network for Internet Traffic Classification [9.365794791156972]
本稿では、インターネットトラフィック分類のための新しい軽量・効率的・eXplainable-by-design畳み込みニューラルネットワーク(LEXNet)を提案する。
LEXNetは(軽量で効率の良い目的のために)新しい残留ブロックと(説明可能性のために)プロトタイプ層に依存している。
商用グレードのデータセットに基づいて、LEXNetは最先端のニューラルネットワークと同じ精度を維持することに成功した。
論文 参考訳(メタデータ) (2022-02-11T10:21:34Z) - PDFNet: Pointwise Dense Flow Network for Urban-Scene Segmentation [0.0]
我々はポイントワイド高密度フローネットワーク(PDFNet)という新しい軽量アーキテクチャを提案する。
PDFNetでは、ネットワークのすべての部分へのスムーズな勾配流を可能にするために、密集、残留、複数ショートカット接続を使用します。
提案手法は,小規模なクラスや少数のデータレギュレーションにおいて,ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2021-09-21T10:39:46Z) - Temporal Graph Network Embedding with Causal Anonymous Walks
Representations [54.05212871508062]
本稿では,時間グラフネットワークに基づく動的ネットワーク表現学習のための新しいアプローチを提案する。
評価のために、時間的ネットワーク埋め込みの評価のためのベンチマークパイプラインを提供する。
欧州の大手銀行が提供した実世界のダウンストリームグラフ機械学習タスクにおいて、我々のモデルの適用性と優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T15:39:52Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Multiscale Deep Equilibrium Models [162.15362280927476]
マルチスケールディープ均衡モデル(MDEQ)を新たに提案する。
MDEQは、複数の特徴分解の平衡点を直接解き、同時に伝播する。
本稿では,Cityscapesデータセットの高解像度画像に対するイメージネット分類とセマンティックセグメンテーションの2つの大規模ビジョンタスクにおけるこのアプローチの有効性について述べる。
論文 参考訳(メタデータ) (2020-06-15T18:07:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。