論文の概要: OpenInst: A Simple Query-Based Method for Open-World Instance
Segmentation
- arxiv url: http://arxiv.org/abs/2303.15859v1
- Date: Tue, 28 Mar 2023 10:03:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 15:36:24.565736
- Title: OpenInst: A Simple Query-Based Method for Open-World Instance
Segmentation
- Title(参考訳): openinst: オープンワールドインスタンスセグメンテーションのための単純なクエリベースメソッド
- Authors: Cheng Wang, Guoli Wang, Qian Zhang, Peng Guo, Wenyu Liu, Xinggang Wang
- Abstract要約: オープンワールドインスタンスセグメンテーションのための単純なクエリベース手法OpenInstを提案する。
COCO$to$UVOのシナリオでは、OpenInstは53.3のマスクARを達成する。
- 参考スコア(独自算出の注目度): 42.94775439130406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-world instance segmentation has recently gained significant
popularitydue to its importance in many real-world applications, such as
autonomous driving, robot perception, and remote sensing. However, previous
methods have either produced unsatisfactory results or relied on complex
systems and paradigms. We wonder if there is a simple way to obtain
state-of-the-art results. Fortunately, we have identified two observations that
help us achieve the best of both worlds: 1) query-based methods demonstrate
superiority over dense proposal-based methods in open-world instance
segmentation, and 2) learning localization cues is sufficient for open world
instance segmentation. Based on these observations, we propose a simple
query-based method named OpenInst for open world instance segmentation.
OpenInst leverages advanced query-based methods like QueryInst and focuses on
learning localization cues. Notably, OpenInst is an extremely simple and
straightforward framework without any auxiliary modules or post-processing, yet
achieves state-of-the-art results on multiple benchmarks. Specifically, in the
COCO$\to$UVO scenario, OpenInst achieves a mask AR of 53.3, outperforming the
previous best methods by 2.0 AR with a simpler structure. We hope that OpenInst
can serve as a solid baselines for future research in this area.
- Abstract(参考訳): オープンワールドのインスタンスセグメンテーションは、自動運転、ロボット認識、リモートセンシングなど、多くの現実のアプリケーションでの重要性のおかげで、最近大きな人気を得ている。
しかし、従来の手法では不十分な結果が得られたか、複雑なシステムやパラダイムに依存していた。
最先端の結果を得る簡単な方法があるのだろうか。
幸いなことに、私たちは両方の世界のベストを達成するのに役立つ2つの観察を特定しました。
1)クエリベースの手法は,オープンワールドインスタンスセグメンテーションにおける高密度な提案ベースの手法よりも優れていることを示す。
2)オープンワールドのインスタンスセグメンテーションには,ローカライゼーションの習得が十分である。
これらの観察に基づいて,openworldインスタンスセグメンテーションのための単純なクエリベース手法openinstを提案する。
OpenInstはQueryInstのような高度なクエリベースのメソッドを活用し、ローカライゼーションの学習に重点を置いている。
特にopeninstは、補助モジュールやポストプロセッシングなしで非常にシンプルで簡単なフレームワークですが、複数のベンチマークで最先端の結果を達成しています。
具体的には、coco$\to$uvo のシナリオでは、openinst は 53.3 のマスク ar を達成し、より単純な構造を持つ2.0 ar で以前のベストメソッドを上回っている。
OpenInstが今後の研究の確かなベースラインになることを期待しています。
関連論文リスト
- OpenR: An Open Source Framework for Advanced Reasoning with Large Language Models [61.14336781917986]
大規模言語モデル(LLM)の推論能力を高めるためのオープンソースのフレームワークであるOpenRを紹介する。
OpenRは、データ取得、強化学習トレーニング、非自己回帰デコーディングを凝集性ソフトウェアプラットフォームに統合する。
私たちの研究は、OpenAIのo1モデルのコア技術と強化学習を探求する、オープンソースのフレームワークを初めて提供するものです。
論文 参考訳(メタデータ) (2024-10-12T23:42:16Z) - Open-Set Facial Expression Recognition [42.62439125553367]
顔表情認識(FER)モデルは一般的に、7つの基本クラスを固定したデータセットで訓練される。
最近の研究では、基本的なものよりもはるかに多くの表現が存在することが指摘されている。
オープンセットFERタスクを初めて提案する。
論文 参考訳(メタデータ) (2024-01-23T05:57:50Z) - ElC-OIS: Ellipsoidal Clustering for Open-World Instance Segmentation on
LiDAR Data [13.978966783993146]
オープンワールドインスタンス(OIS)は、現在の観察に現れるすべてのオブジェクトインスタンスを正確に分割することを目的とした、難しいタスクである。
これは、堅牢な自律ナビゲーションのような安全クリティカルなアプリケーションにとって重要である。
我々は、LiDARポイントクラウドのための柔軟で効果的なOISフレームワークを提案し、既知のインスタンスと未知のインスタンスの両方を正確に分割できる。
論文 参考訳(メタデータ) (2023-03-08T03:22:11Z) - Towards Generalized Open Information Extraction [74.20080376460947]
我々は、ソーストレーニングドメインと異なるデータ分布を持つ未確認対象ドメインを一般化する、より現実的なシナリオを提案する。
DragonIEは、ドメイン内設定とドメイン外設定の両方で、F1スコアの6.4%を絶対的に上回っている。
論文 参考訳(メタデータ) (2022-11-29T07:33:44Z) - OpenXAI: Towards a Transparent Evaluation of Model Explanations [41.37573216839717]
我々は,ポストホックな説明手法の評価とベンチマークを行う,包括的でオープンソースなフレームワークであるOpenXAIを紹介する。
柔軟性のある合成データジェネレータと多様な実世界のデータセットのコレクション、事前訓練されたモデル、最先端の機能属性メソッド、および(ii)忠実性、安定性(ロバスト性)、説明方法の公正性を評価するための11の定量的メトリクスのオープンソース実装。
論文 参考訳(メタデータ) (2022-06-22T14:01:34Z) - MORE: A Metric Learning Based Framework for Open-domain Relation
Extraction [25.149590577718996]
オープンリレーション抽出(OpenRE)は、オープンドメインコーパスからリレーションスキームを抽出するタスクである。
我々はMORE(Metric Learning-based Open Relation extract)という新しい学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-01T07:51:20Z) - Bayesian Embeddings for Few-Shot Open World Recognition [60.39866770427436]
埋め込みベースの数ショット学習アルゴリズムをオープンワールド認識設定に拡張する。
当社のフレームワークは,MiniImageNetとTieredImageNetによる数ショット学習データセットのオープンワールド拡張をベンチマークする。
論文 参考訳(メタデータ) (2021-07-29T00:38:47Z) - OpenGAN: Open-Set Recognition via Open Data Generation [76.00714592984552]
実世界の機械学習システムは、トレーニングデータとは異なる新しいテストデータを分析する必要がある。
オープンセット識別のための概念的にエレガントな2つのアイデアは、1) オープンvs閉鎖二元判別器を識別的に学習し、2) GAN を用いてクローズドセットデータ分布を教師なし学習する。
OpenGANは、それぞれのアプローチの限界をいくつかの技術的な洞察と組み合わせて解決します。
論文 参考訳(メタデータ) (2021-04-07T06:19:24Z) - Dense Passage Retrieval for Open-Domain Question Answering [49.028342823838486]
本研究では,高密度表現のみを用いて検索を実践可能であることを示す。
我々の高密度レトリバーは、上位20経路の精度で9%-19%の絶対値で強力なルセンゼ-BM25システムより優れています。
論文 参考訳(メタデータ) (2020-04-10T04:53:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。