論文の概要: On knot detection via picture recognition
- arxiv url: http://arxiv.org/abs/2510.06284v1
- Date: Mon, 06 Oct 2025 22:36:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.097195
- Title: On knot detection via picture recognition
- Title(参考訳): 画像認識による結び目検出について
- Authors: Anne Dranowski, Yura Kabkov, Daniel Tubbenhauer,
- Abstract要約: 本稿では、現代の機械学習手法と従来のアルゴリズムを組み合わせて、この目標を近似する戦略を説明する。
画像から直接交差数を予測する単純なベースラインを提示し、軽量CNNやトランスフォーマーアーキテクチャでさえ意味のある構造情報を復元できることを示す。
長期的な目的は、これらの知覚モジュールと記号的再構成をプラナー量子ダイアグラム(PD)コードに組み合わせ、ロバスト結び目分類のための下流不変計算を可能にすることである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our goal is to one day take a photo of a knot and have a phone automatically recognize it. In this expository work, we explain a strategy to approximate this goal, using a mixture of modern machine learning methods (in particular convolutional neural networks and transformers for image recognition) and traditional algorithms (to compute quantum invariants like the Jones polynomial). We present simple baselines that predict crossing number directly from images, showing that even lightweight CNN and transformer architectures can recover meaningful structural information. The longer-term aim is to combine these perception modules with symbolic reconstruction into planar diagram (PD) codes, enabling downstream invariant computation for robust knot classification. This two-stage approach highlights the complementarity between machine learning, which handles noisy visual data, and invariants, which enforce rigorous topological distinctions.
- Abstract(参考訳): 私たちのゴールは、いつかノットの写真を撮って、スマートフォンに自動的に認識させることです。
本稿では、現代の機械学習手法(特に画像認識のための畳み込みニューラルネットワークとトランスフォーマー)と従来のアルゴリズム(ジョーンズ多項式のような量子不変量を計算する)の混合を用いて、この目標を近似する戦略を説明する。
画像から直接交差数を予測する単純なベースラインを提示し、軽量CNNやトランスフォーマーアーキテクチャでさえ意味のある構造情報を復元できることを示す。
長期的な目的は、これらの知覚モジュールと記号的再構成をプラナーダイアグラム(PD)コードに組み合わせることであり、ロバストノット分類のための下流不変計算を可能にする。
この2段階のアプローチは、ノイズの多い視覚データを扱う機械学習と、厳密な位相的区別を強制する不変性の間の相補性を強調している。
関連論文リスト
- Visual Explanation via Similar Feature Activation for Metric Learning [23.559106251249872]
クラスアクティベーションマップ(CAM)はソフトマックスベースの畳み込みニューラルネットワークの解釈可能性を調べるために広く利用されている。
類似特徴活性化マップ(SFAM)と呼ばれる新しい視覚的説明法を提案する。
SFAMは、ユークリッド距離またはコサイン類似度を類似度計量として用いて、CNNモデルに対して非常に有望な解釈可能な視覚的説明を提供する。
論文 参考訳(メタデータ) (2025-06-02T13:14:37Z) - Understanding Transformer-based Vision Models through Inversion [0.8124699127636158]
本研究では,本手法のより効率的な適用を可能にする新しいモジュラー変動を導入することにより,特徴の逆転を再考する。
本研究では,大規模変換器を用いた視覚モデル,検出変換器,視覚変換器に対して,我々の手法を体系的に適用する方法を実証する。
我々の分析では、これらのモデルがどのようにコンテキスト形状と画像の詳細をエンコードするか、それらの層がどのように相関し、色摂動に対する堅牢性を示す。
論文 参考訳(メタデータ) (2024-12-09T14:43:06Z) - Image segmentation with traveling waves in an exactly solvable recurrent
neural network [71.74150501418039]
繰り返しニューラルネットワークは、シーンの構造特性に応じて、画像をグループに効果的に分割できることを示す。
本稿では,このネットワークにおけるオブジェクトセグメンテーションのメカニズムを正確に記述する。
次に、グレースケール画像中の単純な幾何学的対象から自然画像まで、入力をまたいで一般化するオブジェクトセグメンテーションの簡単なアルゴリズムを実証する。
論文 参考訳(メタデータ) (2023-11-28T16:46:44Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Unsupervised Learning of Invariance Transformations [105.54048699217668]
近似グラフ自己同型を見つけるためのアルゴリズムフレームワークを開発する。
重み付きグラフにおける近似自己同型を見つけるために、このフレームワークをどのように利用できるかについて議論する。
論文 参考訳(メタデータ) (2023-07-24T17:03:28Z) - Modeling Image Composition for Complex Scene Generation [77.10533862854706]
本稿では,レイアウト・ツー・イメージ生成タスクにおける最先端結果を実現する手法を提案する。
本稿では,RGB画像をパッチトークンに圧縮した後,オブジェクト・トゥ・オブジェクト,オブジェクト・トゥ・パッチ,パッチ・トゥ・パッチの依存関係を探索するTransformer with Focal Attention (TwFA)を提案する。
論文 参考訳(メタデータ) (2022-06-02T08:34:25Z) - Ablation study of self-supervised learning for image classification [0.0]
このプロジェクトは、画像認識のタスクのための畳み込みニューラルネットワーク(CNN)とトランスフォーマーネットワークの自己教師型トレーニングに焦点を当てている。
同じソース画像からの2つの拡張変換画像の類似性を最大化するために、異なるバックボーンを持つ単純なシアムネットワークを使用する。
論文 参考訳(メタデータ) (2021-12-04T09:59:01Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - Image-to-image Mapping with Many Domains by Sparse Attribute Transfer [71.28847881318013]
教師なし画像と画像の変換は、2つの領域間の一対のマッピングを、ポイント間の既知のペアワイズ対応なしで学習することで構成される。
現在の慣例は、サイクル一貫性のあるGANでこのタスクにアプローチすることです。
そこで本研究では,ジェネレータを直接,潜在層における単純なスパース変換に制限する代替手法を提案する。
論文 参考訳(メタデータ) (2020-06-23T19:52:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。