Fugu-MT 論文翻訳(概要): Gaussian Mixture Proposals with Pull-Push Learning Scheme to Capture Diverse Events for Weakly Supervised Temporal Video Grounding

論文の概要: Gaussian Mixture Proposals with Pull-Push Learning Scheme to Capture Diverse Events for Weakly Supervised Temporal Video Grounding

arxiv url: http://arxiv.org/abs/2312.16388v1
Date: Wed, 27 Dec 2023 03:29:01 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-29 19:38:39.350754
Title: Gaussian Mixture Proposals with Pull-Push Learning Scheme to Capture Diverse Events for Weakly Supervised Temporal Video Grounding
Title（参考訳）: 極端に監督された時間的ビデオグラウンドにおける多様なイベントをキャプチャするためのプルプッシュ学習方式によるガウス混合の提案
Authors: Sunoh Kim, Jungchan Cho, Joonsang Yu, YoungJoon Yoo, Jin Young Choi
Abstract要約: 任意の形状を表現できるガウス混合提案法(GMP)を提案する。 GMPの学習において、各ガウスは特徴空間で訓練されるのではなく、時間的位置で実装される。本稿では,引き抜きと押し込みによるプルプッシュ学習手法を提案する。
参考スコア（独自算出の注目度）: 14.357650293676482
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the weakly supervised temporal video grounding study, previous methods use predetermined single Gaussian proposals which lack the ability to express diverse events described by the sentence query. To enhance the expression ability of a proposal, we propose a Gaussian mixture proposal (GMP) that can depict arbitrary shapes by learning importance, centroid, and range of every Gaussian in the mixture. In learning GMP, each Gaussian is not trained in a feature space but is implemented over a temporal location. Thus the conventional feature-based learning for Gaussian mixture model is not valid for our case. In our special setting, to learn moderately coupled Gaussian mixture capturing diverse events, we newly propose a pull-push learning scheme using pulling and pushing losses, each of which plays an opposite role to the other. The effects of components in our scheme are verified in-depth with extensive ablation studies and the overall scheme achieves state-of-the-art performance. Our code is available at https://github.com/sunoh-kim/pps.
Abstract（参考訳）: 弱教師付き時間的ビデオグラウンドング研究では、従来の手法では、文クエリによって記述された多様なイベントを表現する能力のない、所定の単一のガウス的提案を用いる。提案の表現能力を高めるために, 混合中のガウスの重要度, 遠心性, 範囲を学習することで任意の形状を表現できるガウス混合提案 (gmp) を提案する。 GMPの学習において、各ガウスは特徴空間で訓練されるのではなく、時間的位置で実装される。したがって,ガウス混合モデルの従来の特徴ベース学習は有効ではない。本稿では,多種多様な事象を収集するガウス混合を適度に結合した学習を行うために,損失の引き抜きと押し込みを用いたプルプッシュ学習方式を提案する。本手法における成分の影響を広範囲なアブレーション研究により詳細に検証し,その総合的な評価結果を得た。私たちのコードはhttps://github.com/sunoh-kim/ppsで利用可能です。

関連論文リスト

ADGaussian: Generalizable Gaussian Splatting for Autonomous Driving with Multi-modal Inputs [32.896888952578806]
本稿では,ADGaussianと呼ばれる新しいアプローチを提案する。提案手法は,シングルビュー入力による高品質なレンダリングを実現する。
論文参考訳（メタデータ） (2025-04-01T05:40:23Z)
Gaussian Graph Network: Learning Efficient and Generalizable Gaussian Representations from Multi-view Images [12.274418254425019]
3D Gaussian Splatting (3DGS) は印象的なビュー合成性能を示した。本稿ではガウスグラフネットワーク(GGN)を提案し,効率よく一般化可能なガウスグラフを生成する。我々は大規模なRealEstate10KとACIDデータセットの実験を行い、本手法の効率性と一般化を実証した。
論文参考訳（メタデータ） (2025-03-20T16:56:13Z)
GaussianFormer-2: Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction [55.60972844777044]
3Dセマンティック占有予測は、堅牢な視覚中心の自律運転において重要な課題である。既存のほとんどの手法は、密度の高いグリッドベースのシーン表現を利用しており、運転シーンの空間的空間性を見渡している。本稿では,各ガウス分布をその周辺領域の確率分布として解釈する確率論的ガウス重ね合わせモデルを提案する。
論文参考訳（メタデータ） (2024-12-05T17:59:58Z)
SmileSplat: Generalizable Gaussian Splats for Unconstrained Sparse Images [91.28365943547703]
SmileSplatという新しい一般化可能なガウス格子法が提案され,様々なシナリオに対して画素整列ガウス波を再構成する。提案手法は,様々な3次元視覚タスクにおける最先端性能を実現する。
論文参考訳（メタデータ） (2024-11-27T05:52:28Z)
PixelGaussian: Generalizable 3D Gaussian Reconstruction from Arbitrary Views [116.10577967146762]
PixelGaussianは、任意の視点から一般化可能な3Dガウス再構成を学習するための効率的なフレームワークである。提案手法は,様々な視点によく一般化した最先端性能を実現する。
論文参考訳（メタデータ） (2024-10-24T17:59:58Z)
Dynamic Gaussian Marbles for Novel View Synthesis of Casual Monocular Videos [58.22272760132996]
既存の4次元ガウス法は単分子配置が制約されていないため、この設定で劇的に失敗することを示す。単分子配置の難易度を目標とした3つのコア修正からなる動的ガウス大理石を提案する。 Nvidia Dynamic ScenesデータセットとDyCheck iPhoneデータセットを評価し,Gaussian Marblesが他のGaussianベースラインを著しく上回っていることを示す。
論文参考訳（メタデータ） (2024-06-26T19:37:07Z)
Learning general Gaussian mixtures with efficient score matching [16.06356123715737]
我々は、$d$次元で$k$ガウシアンの混合を学習する問題を研究する。我々は、下層の混合成分について分離を前提としない。我々は、ターゲット混合物から$dmathrmpoly(k/varepsilon)$サンプルを抽出し、サンプル-ポリノミカル時間で実行し、サンプリング器を構築するアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-04-29T17:30:36Z)
MGF: Mixed Gaussian Flow for Diverse Trajectory Prediction [72.70572835589158]
本稿では,軌道予測のための正規化フローモデルに対して,混合ガウス前駆体を構築することを提案する。提案手法は,一般的な UCY/ETH および SDD データセットにおける軌道アライメントと多様性の評価において,最先端の性能を実現する。
論文参考訳（メタデータ） (2024-02-19T15:48:55Z)
Cramer Type Distances for Learning Gaussian Mixture Models by Gradient Descent [0.0]
今日まで、ガウス混合モデルに適合または学習できる既知のアルゴリズムはほとんどない。一般多変量GMM学習のためのスライスクラマー2距離関数を提案する。これらの機能は、分散強化学習とディープQネットワークに特に有用である。
論文参考訳（メタデータ） (2023-07-13T13:43:02Z)
Learning Representations on the Unit Sphere: Investigating Angular Gaussian and von Mises-Fisher Distributions for Online Continual Learning [7.145581090959242]
本稿では,新たな損失関数を備えたメモリベース表現学習手法を提案する。提案手法は,タスク境界がぼやけた標準的な評価シナリオと現実的なシナリオの両方において,現状の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2023-06-06T02:38:01Z)
Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。提案手法は,画像分類における既存の手法よりも優れている。
論文参考訳（メタデータ） (2022-12-02T07:31:39Z)
Gaussian Mixture Convolution Networks [13.493166990188278]
本稿では,多次元ガウス混合の解析的畳み込みに基づく新しい深層学習法を提案する。このアーキテクチャに基づくネットワークは,MNIST と ModelNet のデータセットに適合したガウス混合の競合精度に達することを示す。
論文参考訳（メタデータ） (2022-02-18T12:07:52Z)
Non-Gaussian Gaussian Processes for Few-Shot Regression [71.33730039795921]
乱変数ベクトルの各成分上で動作し,パラメータを全て共有する可逆なODEベースのマッピングを提案する。 NGGPは、様々なベンチマークとアプリケーションに対する競合する最先端のアプローチよりも優れています。
論文参考訳（メタデータ） (2021-10-26T10:45:25Z)
Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文参考訳（メタデータ） (2020-11-18T16:40:45Z)
Mat\'ern Gaussian Processes on Graphs [67.13902825728718]
我々は、マタン・ガウス過程の偏微分方程式のキャラクタリゼーションを利用して、そのアナログを無向グラフに対して研究する。得られたガウス過程がユークリッドアナログやユークリッドアナログの様々な魅力的な性質を継承することを示す。これにより、グラフのMat'ern Gaussianプロセスがミニバッチや非共役設定に使用できる。
論文参考訳（メタデータ） (2020-10-29T13:08:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。