An Empirical Study of End-to-End Video-Language Transformers with Masked
Visual Modeling [152.8] Masked Visual Modeling (MVM) は視覚前トレーニングに有効であることが最近証明されている。
VidL学習におけるMVMの可能性について,系統的に検討した。
我々は、MVMで事前トレーニングされたVIOLETv2が、13のVidLベンチマークで顕著な改善を実現していることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:34:40 GMT)
Adiabatic replay for continual learning [138.8] 生成的リプレイは、すでに知られていることを再学習するだけで、より多くの時間を費やします。
我々は、アディバティック・リプレイ(AR)と呼ぶリプレイベースのCL戦略を提案する。
VAEを用いた最先端の深層再生よりもARの方が優れていることを実験的に検証した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:18:06 GMT)
Don't FREAK Out: A Frequency-Inspired Approach to Detecting Backdoor
Poisoned Samples in DNNs [131.0] 本稿では, 深部ニューラルネットワーク(DNN)の周波数感度について, クリーンサンプルと有毒試料との比較検討を行った。
本稿では, 簡易かつ有効である周波数ベースの有毒試料検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:11:24 GMT)
Unlearnable Clusters: Towards Label-agnostic Unlearnable Examples [128.3] インターネット上の視覚的プライバシー漏洩に対して、未学習の例(UE)を開発することへの関心が高まっている。
UEは、目に見えないが学習不可能なノイズを付加したトレーニングサンプルであり、機械学習モデルの不正なトレーニングを防ぐことができる。
本稿では,無学習クラスタ (UC) と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:29:03 GMT)
Task-Oriented Human-Object Interactions Generation with Implicit Neural
Representations [125.8] TOHO: 命令型ニューラル表現を用いたタスク指向型ヒューマンオブジェクトインタラクション生成
本手法は時間座標のみでパラメータ化される連続運動を生成する。
この研究は、一般的なヒューマン・シーンの相互作用シミュレーションに向けて一歩前進する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:31:56 GMT)
Position-Guided Point Cloud Panoptic Segmentation Transformer [118.2] この作業は、LiDARベースのポイントクラウドセグメンテーションにこの魅力的なパラダイムを適用し、シンプルだが効果的なベースラインを得ることから始まります。
スパース点雲のインスタンスはシーン全体に対して比較的小さく、しばしば類似した形状を持つが、画像領域では珍しいセグメンテーションの外観が欠如している。
position-guided Point cloud Panoptic segmentation transFormer (P3Former) と名付けられたこの手法は、Semantic KITTI と nuScenes のベンチマークでそれぞれ3.4%、そして 1.2%の性能をそれぞれ上回っている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:02 GMT)
A Gold Standard Dataset for the Reviewer Assignment Problem [117.6] 類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:15:03 GMT)
TAPS3D: Text-Guided 3D Textured Shape Generation from Pseudo Supervision [114.6] テキスト誘導型3次元形状生成器を疑似キャプションで訓練するための新しいフレームワークTAPS3Dを提案する。
レンダリングされた2D画像に基づいて,CLIP語彙から関連する単語を検索し,テンプレートを用いて擬似キャプションを構築する。
構築したキャプションは、生成された3次元形状の高レベルなセマンティック管理を提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:53:16 GMT)
CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained
or Not [109.7] ゼロショットスケッチに基づく画像検索(ZS-SBIR)におけるCLIPの利用
私たちはこのシナジーを達成するのにいかに最適かという新しいデザインを提唱した。
これまでの最先端技術よりも26.9%の領域で顕著なパフォーマンス向上が観察された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:02:00 GMT)
Real-Time Evaluation in Online Continual Learning: A New Hope [104.5] 計算コストに関して,現在の継続学習(CL)手法を評価した。
簡単なベースラインは、この評価の下で最先端のCL法より優れている。
これは、既存のCL文献の大部分は、実用的でない特定の種類のストリームに適合していることを驚くほど示唆している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:30:35 GMT)
FlexiViT: One Model for All Patch Sizes [100.5] ビジョントランスフォーマーは、それらをパッチにスライスすることで、画像をシーケンスに変換する。
これらのパッチのサイズは速度/精度のトレードオフを制御し、より小さなパッチはより高い計算コストで高い精度に繋がる。
トレーニング時にパッチサイズをランダムにすると、一組の重み付けが発生し、広範囲のパッチサイズでうまく機能することを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:38:16 GMT)
Sketch2Saliency: Learning to Detect Salient Objects from Human Drawings [100.0] 本研究では,スケッチを弱いラベルとして使用して,画像中の有能な物体を検出する方法について検討する。
これを実現するために,与えられた視覚写真に対応する逐次スケッチ座標を生成することを目的としたフォト・ツー・スケッチ生成モデルを提案する。
テストは、私たちの仮説を証明し、スケッチベースの唾液度検出モデルが、最先端技術と比較して、競争力のあるパフォーマンスを提供する方法を明確にします。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 22:14:11 GMT)
On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [96.4] 時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:49:44 GMT)
Visual-Language Prompt Tuning with Knowledge-guided Context Optimization [96.3] 代表的CoOpベースの作業は、学習可能なテキストトークンとクラストークンを組み合わせて、特定のテキスト知識を得る。
我々は,未知のクラスに対する学習可能なプロンプトの一般化能力を高めるために,新しい知識誘導コンテキスト最適化(KgCoOp)を導入する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:04:23 GMT)
Fairness-guided Few-shot Prompting for Large Language Models [93.1] インコンテキスト学習は、トレーニング例、例えば順、プロンプトフォーマットのバリエーションによって、高い不安定性に悩まされる可能性がある。
ラベルや属性に対する固定的なプロンプトの予測バイアスを評価するための指標を導入する。
そこで本研究では,テキスト内学習の性能向上のための最寄りのプロンプトを特定するための,欲求探索に基づく新しい探索手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:28:25 GMT)
Robust Generalization against Photon-Limited Corruptions via Worst-Case
Sharpness Minimization [89.9] ロバスト一般化は、トレーニングセットで稀であり、厳しいノイズを含む最も困難なデータ分散に取り組むことを目的としている。
分散ロバスト最適化(DRO)のような一般的なソリューションは、低いトレーニングエラーを保証するための最悪の経験的リスクに焦点を当てている。
本稿では,学習パラメータの近傍における損失変化を計測し,最悪ケース分布の鋭さをペナルティ化し,シャープDROを提案する。
シャープDROは、汚職に対する強力な一般化能力を示し、高い性能向上を有するよく知られたベースライン法を超えることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:58:48 GMT)
Three ways to improve feature alignment for open vocabulary detection [88.7] ゼロショットオープンボキャブラリ検出の鍵となる問題は、視覚的特徴とテキスト的特徴の整合性である。
以前のアプローチでは、特徴ピラミッドと検出ヘッドをゼロからトレーニングし、事前トレーニング中に確立された視覚テキストの特徴アライメントを壊す。
本稿では,これらの問題を緩和する3つの方法を提案する。まず,テキストの埋め込みを強化するための簡単なスキームを用いて,学習中に見られる少数のクラスへの過度な適合を防止する。
次に、特徴ピラミッドネットワークと検出ヘッドをトレーニング可能なショートカットを含むように変更する。
最後に、より大きなコーパスを活用するために、自己学習アプローチが使用される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:53 GMT)
Temperature Schedules for Self-Supervised Contrastive Methods on
Long-Tail Data [87.8] 本稿では,ロングテールデータ上での自己教師付き学習(SSL)の行動分析を行う。
大きな$tau$はグループ的な差別を強調するのに対し、小さな$tau$はより高いインスタンスの差別をもたらす。
動的$tau$を用いて、簡単なコサインスケジュールが学習表現に大きな改善をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:37:25 GMT)
Efficient Meshy Neural Fields for Animatable Human Avatars [87.7] 高忠実でアニマブルな人間のアバターをビデオから効果的にデジタル化することは、挑戦的で活発な研究課題である。
最近のレンダリングベースのニューラル表現は、フレンドリーなユーザビリティと光変化の再現性を備えた、人間のデジタル化の新しい方法を開く。
アニマタブルなヒトアバターを再構築するために,メッシュニューラルネットワークを効果的に学習する手法であるEMAを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:15:34 GMT)
Top-Down Visual Attention from Analysis by Synthesis [87.5] 我々は、古典的分析・合成(AbS)の視覚的視点からトップダウンの注意を考察する。
本稿では,AbSを変動的に近似したトップダウン変調ViTモデルであるAbSViT(Analytic-by-Synthesis Vision Transformer)を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:17:05 GMT)
Learning and Verification of Task Structure in Instructional Videos [85.5] 本稿では,教師ビデオのセマンティクスと構造を表現することに焦点を当てた,事前学習型ビデオモデルVideoTaskformerを紹介する。
ステップ表現をローカルに学習する以前の作業と比較して,私たちのアプローチは,それらをグローバルに学習するものです。
命令ビデオにおける誤り検出のための2つの新しいベンチマークを導入し,異常なステップが存在するか,ステップが正しい順序で実行されるかを確認する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:54 GMT)
Keypoint-Guided Optimal Transport [85.4] 最適マッチングを探索するリレーション保存(KPG-RL)によるキーポイント誘導モデルを提案する。
提案した KPG-RL モデルはシンクホーンのアルゴリズムで解くことができ、異なる空間で分布がサポートされている場合でも適用可能である。
二重KPG-RLからの学習された輸送計画に基づき、ターゲット領域にソースデータを転送する新しい多様体バリ中心射影を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:35:56 GMT)
A Unified Arbitrary Style Transfer Framework via Adaptive Contrastive
Learning [84.9] Unified Contrastive Arbitrary Style Transfer (UCAST)は、新しいスタイルの学習・伝達フレームワークである。
入力依存温度を導入することで,スタイル伝達のための適応型コントラスト学習方式を提案する。
本フレームワークは,スタイル表現とスタイル伝達のための並列コントラスト学習方式,スタイル分布を効果的に学習するためのドメイン拡張モジュール,スタイル伝達のための生成ネットワークという,3つの重要なコンポーネントから構成される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:13:05 GMT)
Masked Motion Encoding for Self-Supervised Video Representation Learning [84.2] Masked Motion MMEは、外観情報と動作情報の両方を再構成し、時間的手がかりを探索する新しい事前学習パラダイムである。
物体の位置変化や形状変化を追跡することで、人間が行動を認識することができるという事実を動機として、マスク領域におけるこれらの2種類の変化を表す運動軌跡を再構築することを提案する。
我々のMMEパラダイムで事前訓練されたモデルでは、長期的かつきめ細かな動きの詳細を予測できる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:50:55 GMT)
Automated Federated Learning in Mobile Edge Networks -- Fast Adaptation
and Convergence [83.6] フェデレートラーニング(FL)は、モバイルエッジネットワークで機械学習モデルを分散的にトレーニングするために使用することができる。
最近のFLは、モデルに依存しないメタラーニング(MAML)フレームワークで解釈されている。
本稿は,MAMLがFLにもたらすメリットと,モバイルエッジネットワーク上でのメリットの最大化について論じる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:42:10 GMT)
Correlational Image Modeling for Self-Supervised Visual Pre-Training [81.8] 相関画像モデリング(Relational Image Modeling)は、自己監督型視覚前訓練における、新しくて驚くほど効果的なアプローチである。
3つの重要な設計は、相関画像モデリングを非自明で有意義な自己監督タスクとして実現している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:41:37 GMT)
Diffusion Models in Vision: A Survey [80.8] 拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。
拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:42:58 GMT)
Semantic Image Attack for Visual Model Diagnosis [80.4] 実際には、特定の列車およびテストデータセットに関する計量分析は、信頼性や公正なMLモデルを保証しない。
本稿では,セマンティック・イメージ・アタック(SIA)を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:13:04 GMT)
Fully Self-Supervised Depth Estimation from Defocus Clue [79.6] スパース焦点スタックから深度を純粋に推定する自己教師型フレームワークを提案する。
筆者らのフレームワークは,深度とAIF画像の接地構造の必要性を回避し,より優れた予測を得られることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:47:10 GMT)
Versatile Diffusion: Text, Images and Variations All in One Diffusion
Model [79.5] Versatile Diffusionは、テキスト・ツー・イメージ、画像・ツー・テキスト、バリエーションの複数のフローを1つの統一モデルで処理する。
私たちのコードとモデルはhttps://github.com/SHI-Labs/Versatile-Diffusion.comでオープンソース化されています。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:13:25 GMT)
Secure Federated Learning for Cognitive Radio Sensing [79.4] 本稿では、フェデレートラーニング(FL)に基づく信頼性とセキュアなスペクトルセンシング(SS)について考察する。
SSにおけるFLのモチベーション、アーキテクチャ、アルゴリズムについて論じる。
これらのアルゴリズムに対するセキュリティとプライバシの脅威を概観するとともに、このような攻撃に対する対策も考えられる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:06:58 GMT)
OFA$^2$: A Multi-Objective Perspective for the Once-for-All Neural
Architecture Search [79.4] once-for-All(OFA)は、異なるリソース制約を持つデバイスのための効率的なアーキテクチャを探索する問題に対処するために設計された、ニューラルネットワーク検索(NAS)フレームワークである。
我々は,探索段階を多目的最適化問題として明示的に考えることにより,効率の追求を一歩進めることを目指している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:30:29 GMT)
Plug-and-Play Regulators for Image-Text Matching [76.3] 微細な対応と視覚的セマンティックなアライメントの爆発は、画像とテキストのマッチングにおいて大きな可能性を秘めている。
我々は、メッセージ出力を効率的にエンコードして、コンテキストを自動生成し、モーダル表現を集約する、シンプルだが非常に効果的な2つのレギュレータを開発した。
MSCOCOとFlickr30Kデータセットの実験は、複数のモデルで印象的で一貫したR@1ゲインをもたらすことができることを実証している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:42:05 GMT)
NOPE: Novel Object Pose Estimation from a Single Image [75.6] 本稿では,新しいオブジェクトの1つのイメージを入力として取り込んで,オブジェクトの3Dモデルに関する事前知識を必要とせずに,新しいイメージにおけるオブジェクトの相対的なポーズを予測するアプローチを提案する。
我々は、オブジェクトを取り巻く視点に対する識別的埋め込みを直接予測するモデルを訓練することで、これを実現する。
この予測は単純なU-Netアーキテクチャを用いて行われ、要求されたポーズに注意を向け、条件を定め、非常に高速な推論をもたらす。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:55:43 GMT)
Unsupervised Deep Probabilistic Approach for Partial Point Cloud
Registration [74.5] ディープポイントクラウド登録手法は、部分的に重複し、ラベル付きデータに依存するという課題に直面している。
部分的な重なりを持つ点雲に対する教師なしの深い確率的登録フレームワークであるUDPRegを提案する。
UDPRegは3DMatch/3DLoMatchとModelNet/ModelLoNetベンチマークの競合性能を実現しています。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:18:06 GMT)
Persistent Nature: A Generative Model of Unbounded 3D Worlds [74.5] 任意のカメラポーズから3Dデコーダとボリュームレンダリングによって描画できる拡張可能な平面配置グリッドを提案する。
この表現に基づいて、単一視点のインターネット写真のみから生成的世界モデルを学ぶ。
提案手法は,現在の3次元生成モデルの固定境界を超えるシーン外挿を可能にするとともに,永続的でカメラに依存しない世界表現をサポートする。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:40 GMT)
Pseudo-Euclidean Attract-Repel Embeddings for Undirected Graphs [73.0] ドット積埋め込みはグラフをとり、2つのベクトル間のドット積がエッジの強さを与えるようなノードのベクトルを構成する。
ノードを擬ユークリッド空間に埋め込むことにより、推移性仮定を除去する。
Pseudo-Euclidean 埋め込みはネットワークを効率よく圧縮でき、近接する隣人の複数の概念をそれぞれ独自の解釈で解釈でき、既存のモデルに'スロットできる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:45:19 GMT)
Low-cost Efficient Wireless Intelligent Sensor (LEWIS) for Engineering,
Research, and Education [72.3] センサによって決定を下すスマートシティのビジョンは、これまで実現されていない。
土木技術者はセンサー技術に関する知識を欠いている。
センサーに関連する電気部品とコンピュータの知識は、土木技術者にとって依然として課題である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:49:26 GMT)
CoBIT: A Contrastive Bi-directional Image-Text Generation Model [72.2] CoBITは、新しいユニコーダ・デコーダ構造を採用しており、これは1つのフレームワークで3つの事前学習対象を統一しようとするものである。
CoBITは画像理解、画像テキスト理解(検索、キャプション、VQA、SNLI-VE)、テキストベースのコンテンツ生成、特にゼロショットシナリオにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:24:31 GMT)
Human Behavior in the Time of COVID-19: Learning from Big Data [71.3] 2020年3月以降、新型コロナウイルスの感染者は6億人を超え、600万人以上が死亡している。
パンデミックはあらゆる面で人間の行動に影響を与え、変化をもたらした。
研究者は自然言語処理、コンピュータビジョン、音声信号処理、頻繁なパターンマイニング、機械学習といったビッグデータ技術を採用してきた。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:19:26 GMT)
Better Teacher Better Student: Dynamic Prior Knowledge for Knowledge
Distillation [70.9] 本研究では,教師の持つ特徴の一部を,特徴蒸留前の先行知識として統合した動的事前知識(DPK)を提案する。
DPKは,教員モデルと生徒モデルのパフォーマンスを正に相関させ,より大きな教員を適用することで生徒の精度をさらに高めることができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:17:31 GMT)
VADER: Video Alignment Differencing and Retrieval [70.9] VADERは、堅牢なビジュアル記述子と、チャンクされたビデオコンテンツに対するスケーラブルな検索を使用して、部分的なビデオフラグメントを候補ビデオにマッチし、調整する。
時空間コンパレータモジュールは、コンテンツ間の操作の領域を識別する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:50:44 GMT)
Policy Evaluation in Distributional LQR [70.6] ランダムリターンの分布を閉形式で表現する。
この分布は有限個の確率変数で近似できることを示す。
近似回帰分布を用いて,リスク・アバースLQRに対するゼロ階ポリシー勾配アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:27:40 GMT)
Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video
Generators [70.2] 最近のテキスト・ビデオ生成アプローチは、計算的に重いトレーニングに依存し、大規模なビデオデータセットを必要とする。
既存のテキスト・画像合成手法を用いたゼロショットテキスト・ビデオ生成の課題を提案する。
本手法は,ビデオデータ追加の訓練を受けていないにも関わらず,近年の手法よりも多種多種多種多種多種多種多種多種多種多様である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:01:59 GMT)
A* Search Without Expansions: Learning Heuristic Functions with Deep
Q-Networks [70.0] Q*検索は,ノードの子どもの移動コストと値の和を利用するために,深いQ-networksを用いて探索をガイドする検索アルゴリズムである。
我々は1872のメタアクションを含む大きなアクション空間で定式化された場合、Q*探索を用いてルービックキューブを解く。
Q*検索は最大129倍速く、A*検索の最大1288倍のノードを生成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:38:09 GMT)
From Goldilocks to Twin Peaks: multiple optimal regimes for quantum
transport in disordered networks [68.8] オープン量子システム理論は、環境ノイズ支援量子輸送の存在を予測するためにうまく応用されている。
本稿では、物理的にモデル化された輸送ネットワークの一貫したサブセットが、その定常輸送効率において少なくとも2つのENAQTピークを持つことを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:09:56 GMT)
Learning 3D-aware Image Synthesis with Unknown Pose Distribution [68.6] 既存の3D画像合成法は、トレーニングセットに基づいて事前に推定された3Dポーズ分布に依存する。
本研究は3次元ポーズ先行条件から生成放射場を解放するPoF3Dを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:25:12 GMT)
DepGraph: Towards Any Structural Pruning [68.4] 我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。
本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。
本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:55:02 GMT)
Set-the-Scene: Global-Local Training for Generating Controllable NeRF
Scenes [68.1] オブジェクトプロキシを用いて3Dシーンを合成するための新しいGlobalLocalトレーニングフレームワークを提案する。
プロキシを使うことで、個々の独立オブジェクトの配置を調整するなど、さまざまな編集オプションが実現可能であることを示す。
その結果,Set-the-Sceneはシーンの合成と操作に強力なソリューションを提供することがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:17:29 GMT)
ScanERU: Interactive 3D Visual Grounding based on Embodied Reference
Understanding [67.2] Embodied Reference Understanding (ERU) はこの懸念に対して最初に設計されている。
ScanERUと呼ばれる新しいデータセットは、このアイデアの有効性を評価するために構築されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:36:14 GMT)
Shifted Diffusion for Text-to-image Generation [65.5] Corgiは,提案したシフト拡散モデルに基づいて,入力テキストからより優れた画像埋め込み生成を実現する。
Corgiはまた、ダウンストリーム言語フリーのテキスト画像生成タスク上で、さまざまなデータセットにまたがる最先端の新たな結果も達成している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 22:21:20 GMT)
Compositional Zero-Shot Domain Transfer with Text-to-Text Models [65.3] ゼロショットドメイン転送のための新しい合成転写学習フレームワーク(DoT5)を提案する。
ドメイン内のラベルにアクセスすることなく、DoT5はドメイン知識とタスク知識をマルチタスクで共同で学習する。
DoT5はマルチタスク学習による合成伝達学習の有効性を示す。
特にDoT5は、現在のSOTAを7以上の絶対点の精度でゼロショット転送で上回る。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:58:41 GMT)
Audio Diffusion Model for Speech Synthesis: A Survey on Text To Speech
and Speech Enhancement in Generative AI [64.7] 生成AIは様々な分野で印象的な性能を示しており、音声合成は興味深い方向である。
拡散モデルを最も一般的な生成モデルとし、テキストから音声への拡張と音声への拡張という2つのアクティブなタスクを試みている。
本研究は,既存の調査を補完する音声拡散モデルに関する調査を行う。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:17:15 GMT)
CTCNet: A CNN-Transformer Cooperation Network for Face Image
Super-Resolution [64.1] 超解像課題に対する効率的なCNN-Transformer Cooperation Network (CTCNet)を提案する。
本稿ではまず,FSAUとTransformerブロックから構成されるLGCM(Local-Global Feature Cooperation Module)を考案した。
次に、エンコードされた機能を強化するために、効率的な機能リファインメントモジュール(FRM)を設計する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:44:22 GMT)
Understanding and Improving Visual Prompting: A Label-Mapping
Perspective [63.9] 我々は視覚タスクの入力プロンプト技術である視覚プロンプト(VP)を再検討し前進する。
ILM-VPと呼ばれる新しいVPフレームワークを提案し、ソースラベルをターゲットラベルに自動的に再マップする。
提案手法は最先端のVP法よりも優れている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:02:21 GMT)
SPARTAN: Self-supervised Spatiotemporal Transformers Approach to Group
Activity Recognition [62.4] 本稿では, グループ活動認識(GAR)に対する, ラベル付きビデオデータを用いた新しい, 単純で効果的な自己監督型時空間変換器(TAN)を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:28:23 GMT)
FS-Real: Towards Real-World Cross-Device Federated Learning [60.9] Federated Learning (FL)は、ローカルデータをアップロードすることなく、分散クライアントと協調して高品質なモデルをトレーニングすることを目的としている。
FL研究と実世界のシナリオの間には依然としてかなりのギャップがあり、主に異種デバイスの特徴とそのスケールによって引き起こされている。
本稿では,実世界横断デバイスFL,FS-Realのための効率的でスケーラブルなプロトタイピングシステムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:37:17 GMT)
Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.7] 不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルにおける画像とラベルの対応を探究している。
本稿では,ラベルとラベルの対応に関する構造化されたセマンティックを,セマンティックな事前プロンプトによって導出することを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:39:20 GMT)
Artificial-intelligence-based molecular classification of diffuse
gliomas using rapid, label-free optical imaging [59.8] DeepGliomaは人工知能に基づく診断スクリーニングシステムである。
ディープグリオーマは、世界保健機関が成人型びまん性グリオーマ分類を定義するために使用する分子変化を予測することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:50:18 GMT)
Plotting Behind the Scenes: Towards Learnable Game Engines [59.7] 単分子アノテーション付きビデオのみを用いて,ゲームエンジンのようなニューラルモデルをトレーニングするためのフレームワークを提案する。
学習可能なゲームエンジン(Learnerable Game Engine, LGE)は、シーン、オブジェクト、エージェントの状態を保持し、制御可能な視点から環境をレンダリングする。
本手法は,既存のニューラルビデオゲームシミュレータよりもレンダリング品質が優れている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:43:17 GMT)
Multi-modal Gated Mixture of Local-to-Global Experts for Dynamic Image
Fusion [59.2] 赤外線と可視画像の融合は,複数の情報源からの包括的情報を統合して,様々な作業において優れた性能を実現することを目的としている。
局所-言語の専門家によるマルチモーダルゲート混合を用いた動的画像融合フレームワークを提案する。
本モデルは,Mixture of Local Experts (MoLE) とMixture of Global Experts (MoGE) から構成される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:15:53 GMT)
ReBotNet: Fast Real-time Video Enhancement [59.1] ほとんどの復元ネットワークは遅く、高い計算ボトルネックがあり、リアルタイムビデオ拡張には使用できない。
本研究では,ライブビデオ通話やビデオストリームなどの実用的なユースケースをリアルタイムに拡張するための,効率的かつ高速なフレームワークを設計する。
提案手法を評価するために,実世界のビデオ通話とストリーミングのシナリオを示す2つの新しいデータセットをエミュレートし,ReBotNetがより少ない計算,メモリ要求の低減,より高速な推論時間で既存手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:58:05 GMT)
Calculating the many-body density of states on a digital quantum
computer [58.7] ディジタル量子コンピュータ上で状態の密度を推定する量子アルゴリズムを実装した。
我々は,量子H1-1トラップイオンチップ上での非可積分ハミルトニアン状態の密度を18ビットの制御レジスタに対して推定する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:46:28 GMT)
MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.1] Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:02 GMT)
Backdoor Defense via Adaptively Splitting Poisoned Dataset [57.7] バックドアの防御は、ディープニューラルネットワーク(DNN)がバックドアを攻撃され、悪意ある変更を受けていることの脅威を軽減するために研究されている。
トレーニング時間防衛の核心は, 有毒な試料を選別し, 適切な処理を行うことである。
本フレームワークでは,適応的分割型データセットベースディフェンス(ASD)を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:16:38 GMT)
Learning Low Dimensional State Spaces with Overparameterized Recurrent
Neural Nets [57.1] 我々は、長期記憶をモデル化できる低次元状態空間を学習するための理論的証拠を提供する。
実験は、線形RNNと非線形RNNの両方で低次元状態空間を学習することで、我々の理論を裏付けるものである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:45:41 GMT)
Transforming Radiance Field with Lipschitz Network for Photorealistic 3D
Scene Stylization [56.9] LipRF は、Lipschitz マッピングを用いて、事前訓練された NeRF の外観表現を変換するためのフレームワークである。
光リアルな3Dスタイリゼーションとオブジェクトの外観編集の両方において、LipRFの高品質で堅牢な性能を示すため、広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:05:57 GMT)
Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.9] 文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:21:16 GMT)
Decentralized Adversarial Training over Graphs [55.3] 機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。
この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:05:16 GMT)
Visually-Prompted Language Model for Fine-Grained Scene Graph Generation
in an Open World [54.7] SGG(Scene Graph Generation)は、視覚理解のための画像中の主観的、述語的、対象的な関係を抽出することを目的としている。
既存の再バランス戦略は、以前のルールを通したハドリングを試みるが、まだ事前に定義された条件に制限されている。
そこで我々は,多種多様な粒度の述語を生成するために,視覚的にプロンプトされた言語モデルを学習するクロスモーダルプレディケイトブースティング(CaCao)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:06:38 GMT)
ECON: Explicit Clothed humans Optimized via Normal integration [54.5] ゆるい衣服で3D人間を作る方法であるECONについて述べる。
布を被った人の正面と後方の詳細な2Dマップを推測する。
d-BiNI曲面の間の欠測幾何を「塗装」する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:27:38 GMT)
A Simple Multi-Modality Transfer Learning Baseline for Sign Language
Translation [54.3] 既存の手話データセットには、約10K-20Kの手話ビデオ、グロスアノテーション、テキストが含まれています。
したがって、データは効果的な手話翻訳モデルの訓練のボトルネックとなる。
この単純なベースラインは、2つの手話翻訳ベンチマークで過去の最先端の結果を上回っている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:54:23 GMT)
Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.8] この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:17:46 GMT)
Benchmarking the Reliability of Post-training Quantization: a Particular
Focus on Worst-case Performance [53.5] ポストトレーニング量子化(PTQ)は、独自のアーキテクチャやトレーニング手順を変更することなく、ディープニューラルネットワーク(DNN)を圧縮するための一般的な方法である。
その有効性と利便性にもかかわらず、分散シフトやデータノイズといった極端ケースの存在下でのPTQ手法の信頼性は明らかにされていない。
そこで本研究では,様々なPTQ手法を用いてこの問題について検討する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:55:50 GMT)
Web 3.0: The Future of Internet [53.2] Web 3.0は分散化されたWebアーキテクチャであり、以前よりもインテリジェントで安全である。
Web 3.0は、分散テクノロジに従って、Webデータのオーナシップに対処できる。
経済、文化、テクノロジーの観点から、インターネットの世界を最適化する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:37:42 GMT)
Masked Image Training for Generalizable Deep Image Denoising [53.0] 本稿では,デノナイジングネットワークの一般化性能を高めるための新しい手法を提案する。
提案手法では,入力画像のランダムなピクセルをマスキングし,学習中に欠落した情報を再構成する。
提案手法は,他のディープラーニングモデルよりも優れた一般化能力を示し,実世界のシナリオに直接適用可能である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:33:44 GMT)
SPeC: A Soft Prompt-Based Calibration on Mitigating Performance
Variability in Clinical Notes Summarization [50.0] 本稿では,ソフトプロンプトを用いたモデルに依存しないパイプラインを導入し,確率に基づく要約の利点を保ちながら分散を減少させる。
実験結果から,本手法は性能を向上するだけでなく,様々な言語モデルの分散を効果的に抑制することが明らかとなった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:47:46 GMT)
Ablating Concepts in Text-to-Image Diffusion Models [49.7] 大規模テキスト・画像拡散モデルでは、強力な構成能力を持つ高忠実度画像を生成することができる。
これらのモデルは典型的には膨大な量のインターネットデータに基づいて訓練されており、しばしば著作権のある資料、ライセンスされた画像、個人写真を含んでいる。
本稿では,事前訓練されたモデルにおいて,目標概念の生成を防止し,効率的に概念を宣言する手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:42 GMT)
Collaboration Helps Camera Overtake LiDAR in 3D Detection [49.6] カメラのみの3D検出は、LiDARベースの検出システムと比較して、オブジェクトを3D空間にローカライズするための簡単なソリューションを提供する。
提案するコラボレーティブカメラのみの3D検出(CoCa3D)により,エージェントは通信を通じて相互に補完情報を共有できる。
その結果、CoCa3Dは従来のSOTA性能をDAIR-V2Xで44.21%改善し、OPV2V+で30.60%、AP@70でCoPerception-UAVs+で12.59%向上した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:50:41 GMT)
Compositional 3D Scene Generation using Locally Conditioned Diffusion [49.6] 合成シーン拡散へのアプローチとして,テクスブフォローカライズ条件付き拡散を導入する。
本研究では, スコア蒸留によるテキスト・ツー・3D合成パイプラインを試作し, 関連するベースラインよりも高忠実度で合成3Dシーンを生成できることを示した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:29:24 GMT)
DDT: A Diffusion-Driven Transformer-based Framework for Human Mesh
Recovery from a Video [48.9] ビデオベースのヒューマンメッシュリカバリのための拡散駆動トランスフォーマーベースフレームワーク(DDT)を紹介する。
DDTは入力シーケンスから特定の動きパターンをデコードし、動きの滑らかさと時間的一貫性を高めるように設計されている。
DDTのデコーダは、多対多のアプローチとして、すべてのフレームのヒューマンメッシュを出力します。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:15:18 GMT)
Efficient Symbolic Reasoning for Neural-Network Verification [48.4] 本稿では,ニューラルネットワーク検証のための新しいプログラム推論フレームワークを提案する。
我々のフレームワークの主要な構成要素は、記号領域と二次関係の利用である。
我々のフレームワークは、ニューラルネットワークの検証問題に新しい理論的洞察と実践的なツールをもたらすことができると信じている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:08:11 GMT)
A Coupled Design of Exploiting Record Similarity for Practical Vertical
Federated Learning [47.8] フェデレートドラーニング(Federated Learning)は、生データを明らかにすることなく、さまざまなパーティ間で協調学習を可能にする学習パラダイムである。
垂直連合学習における既存の研究は「記録リンク」プロセスを無視している。
トレーニングプロセスに1対多のリンケージを統合する新しい複合トレーニングパラダイムであるFedSimを設計する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:19:38 GMT)
The effectiveness of MAE pre-pretraining for billion-scale pretraining [47.6] 本稿では,コンピュータビジョンにおける視覚認識タスクに使用される標準の訓練前ファイントゥンパラダイムを再検討する。
モデルの初期化には自己教師付きMAE技術を用いる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:56:12 GMT)
Box-Level Active Detection [47.4] ボックスベース1サイクル当たりの予算を制御する,ボックスレベルのアクティブ検出フレームワークを導入する。
我々は,人間のアノテーションとモデルインテリジェンスの両方を活用するために,補完的擬似アクティブストラテジー(ComPAS)を提案する。
ComPASは、統一された設定で4つの設定で10の競争相手を上回っている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:06:10 GMT)
The Low-Rank Simplicity Bias in Deep Networks [46.8] 我々は、ディープネットワークが帰納的にバイアスを受けているという仮説を調査し、拡張する実験的な観察を行い、低い有効ランク埋め込みの解を見つける。
我々の主張は、実践的な学習パラダイム上の有限幅線形および非線形モデルに真であることを示すとともに、自然データ上では、これらがよく一般化される解であることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:21:02 GMT)
Neural Preset for Color Style Transfer [46.7] 本稿では,既存のカラースタイル転送手法の限界に対処するニューラルプレセット手法を提案する。
提案手法は2つのコア設計に基づいており,まず,各画素に対して連続的に動作する決定論的ニューラルカラーマッピング(DNCM)を提案する。
第2に、タスクをカラー正規化とスタイル化に分割することで、2段階のパイプラインを構築する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:10 GMT)
FeatER: An Efficient Network for Human Reconstruction via Feature
Map-Based TransformER [46.2] FeatERは、注意をモデリングする際に特徴マップ表現の本質的な構造を保存する新しいトランスフォーマー設計である。
特徴マップ再構成モジュールを適用し、推定された人間のポーズとメッシュの性能を向上させる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:48:05 GMT)
Weakly-Supervised Text Instance Segmentation [44.2] テキスト認識とテキストセグメンテーションをブリッジすることで、弱教師付きテキストインスタンスセグメンテーションを初めて実施する。
提案手法は, ICDAR13-FST(18.95$%$改善)ベンチマークとTextSeg (17.80$%$改善)ベンチマークにおいて, 弱教師付きインスタンスセグメンテーション法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:56:07 GMT)
Taking A Closer Look at Visual Relation: Unbiased Video Scene Graph
Generation with Decoupled Label Learning [43.7] 述語をよく見て、ほとんどの視覚的関係が行動的パターン(sit)と空間的パターンの両方に関係していることを特定します。
本稿では,パターンレベルの観点からの難解な視覚関係予測に対処するために,分離ラベル学習(DLL)パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:08:10 GMT)
POTTER: Pooling Attention Transformer for Efficient Human Mesh Recovery [43.5] トランスフォーマーアーキテクチャは、モノクル画像からのヒューマンメッシュリカバリ(HMR)におけるSOTA性能を達成している。
現実世界のアプリケーションには、正確なヒューマンメッシュを再構築するための軽量で効率的なモデルが必要である。
本稿では,単一画像からのHMRタスクに対して,Pooling aTtention TransformER (POTTER) という純粋変換器アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:36:12 GMT)
Federated Uncertainty-Aware Aggregation for Fundus Diabetic Retinopathy
Staging [42.9] 本稿では,糖尿病網膜症(DR)ステージリングモデルのトレーニングのための新しいフェデレート不確実性認識集約パラダイム(FedUAA)を提案する。
FedUAAは各クライアントの信頼性を考慮し、DRステージングに対する信頼度を推定する。
実験の結果,FedUAAは,他のフェデレート学習法と比較して,信頼性の高いDRステージング性能が向上していることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:41:44 GMT)
A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2] コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:02:33 GMT)
CVT-SLR: Contrastive Visual-Textual Transformation for Sign Language
Recognition with Variational Alignment [42.1] 手話認識(SLR)は、手話ビデオにテキストグルースとして注釈をつける弱い教師付きタスクである。
近年の研究では、大規模手話データセットの欠如による訓練不足がSLRの主なボトルネックとなっている。
視覚と言語の両方のモダリティの事前訓練された知識を十分に探求するために,SLR,-SLRのための新しいコントラッシブ・ビジュアル・トランスフォーメーションを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:00:33 GMT)
Edge Deep Learning Model Protection via Neuron Authorization [42.0] エッジデバイスモデルは、盗まれたり違法にコピーされたりする大きなリスクがある。
We propose a light-weight, practical, general Edge device model Pro tection method at neuron level, represented as EdgePro。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:47:28 GMT)
Revisiting Transformer for Point Cloud-based 3D Scene Graph Generation [41.9] 3次元シーングラフ生成のための意味グラフ変換器(SGT)を提案する。
我々のSGTはTransformerレイヤをベースビルディングブロックとして使用し、グローバルな情報転送を可能にしています。
我々は、確立された3DSSGベンチマークでSGTをベンチマークし、関係予測のR@50の35.9%の絶対的な改善を達成した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:21:43 GMT)
PlaneDepth: Self-supervised Depth Estimation via Orthogonal Planes [41.5] 複数の前頭平行面に基づく深度推定は、自己教師付き単眼深度推定(MDE)において顕著な結果を示した
本研究では,垂直面と接地面を含む新しい平面ベースプレゼンテーションであるPlaneDepthを提案する。
本手法は, 自律走行において重要な, 教師なしの方法で地上面を抽出することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:01:33 GMT)
Paraphrasing evades detectors of AI-generated text, but retrieval is an
effective defense [39.9] DIPPERによる3つの大きな言語モデル(GPT3.5-davinci-003)で生成されたパラフレーズテキストは、いくつかの検出器を回避した。
我々は,言語モデルAPIプロバイダによって維持されなければならない,意味論的に類似した世代を検索するシンプルなディフェンスを導入する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:29:27 GMT)
When and why vision-language models behave like bags-of-words, and what
to do about it? [39.9] 我々は、VLMが様々な種類の関係、属性、順序を理解する能力を評価するために、属性、関係、順序のベンチマークを作成します。
AROは、以前の構成性のベンチマークよりも桁違いに大きく、5万以上のテストケースがある。
我々は、最先端のVLMが、リレーショナル理解が不十分で、オブジェクトを属性にリンクする場合に、ブルンダーが可能であることを示し、注文感度の深刻な欠如を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:21:38 GMT)
Adversarially Contrastive Estimation of Conditional Neural Processes [39.8] 条件付きニューラルプロセス(CNP)は関数上の分布を定式化し、正確な条件付き確率で関数観測を生成する。
我々は,正規最大推定値以外の逆トレーニング方式でCNPを校正する手法を提案する。
生成関数再構成から下流回帰および分類タスクに至るまで,本手法が主流のCNPメンバーに適合することが実証された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:58:14 GMT)
Prior-free Category-level Pose Estimation with Implicit Space
Transformation [39.6] カテゴリーレベルの6Dポーズ推定は、特定のカテゴリから見えないオブジェクトのポーズとサイズを予測することを目的としている。
与えられたオブジェクトインスタンスの前にカテゴリ固有の3Dを明示的に適応する事前変形のおかげで、事前ベースの手法は大きな成功を収め、主要な研究ストリームとなった。
カメラ空間の機能を世界空間に変換し、3D先行を頼らずに暗黙的に対応性を構築するための、単純な事前自由な暗黙空間変換ネットワーク、IST-Netを導入する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:48:12 GMT)
Using Context-to-Vector with Graph Retrofitting to Improve Word
Embeddings [39.3] より文脈的な情報をSkip-gramフレームワークに組み込むことで、単語の埋め込みを改善することを目指している。
我々の手法は、基準線を大きなマージンで上回ることがよく証明されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:35:30 GMT)
Adaptive Similarity Bootstrapping for Self-Distillation [39.1] NNCLRは、コントラスト的な設定で隣人のブートストラップを介して得られる異なる画像の正のペアを使用する。
負のサンプルに依存する対照的な学習環境とは対照的に, 自己蒸留方式に隣接したブートストラップを組み込むことで, 性能低下や崩壊を招く可能性があることを実証的に示す。
本稿では,潜在空間の品質の推定値に基づいて,近隣住民を適応的にブートストラップする手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:40:17 GMT)
CrOC: Cross-View Online Clustering for Dense Visual Representation
Learning [39.1] 本稿では,オンラインクラスタリング機構(CrOC)を用いて,ビューのセマンティクスを発見し,セグメンテーションするクロスビュー整合性目標を提案する。
手作りの事前処理がなければ、結果の方法はより一般化可能であり、面倒な前処理ステップを必要としない。
各種データセット上での線形および教師なしセグメンテーション伝達タスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:24:16 GMT)
Stochastic Submodular Bandits with Delayed Composite Anonymous Bandit
Feedback [39.1] 本稿では,過度な(期待している)報酬と全帯域遅延フィードバックを伴うマルチアームバンドの問題について検討する。
遅延したフィードバックは過去のアクションからの報酬のコンポーネントで構成されており、サブコンポーネント間で未知の分割がある。
提案アルゴリズムは,合成匿名フィードバックの遅延により,他の全帯域アプローチより優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:38:33 GMT)
LABRAD-OR: Lightweight Memory Scene Graphs for Accurate Bimodal
Reasoning in Dynamic Operating Rooms [39.1] 手術室(OR)の全体モデリングは難しいが必須課題である。
本稿では,過去の時間ステップのシーングラフが時間的表現として機能し,現在の予測を導くメモリシーングラフを紹介する。
我々は、私たちの軽量メモリシーングラフの時間情報をポイントクラウドや画像からの視覚情報とインテリジェントに融合するエンドツーエンドアーキテクチャを設計する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:26:16 GMT)
Two-Stream Network for Sign Language Recognition and Translation [38.4] 本稿では、生ビデオとキーポイントシーケンスの両方をモデル化するために、2つの別々のストリームを含むデュアルビジュアルエンコーダを提案する。
結果として得られるモデルはTwoStream-SLRと呼ばれ、手話認識に適している。
TwoStream-SLTは、単に追加の翻訳ネットワークをアタッチするだけで、手話変換モデルであるTwoStream-SLTに拡張される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:49:35 GMT)
Multi-Antenna Dual-Blind Deconvolution for Joint Radar-Communications
via SoMAN Minimization [38.2] 電磁スペクトルを効率的に利用するための有望な技術として、合同レーダー通信(JRC)が登場している。
セキュアな軍事受信機などのJRCアプリケーションでは、受信信号にレーダーや通信信号がオーバーレイされることが多い。
オーバーレイド信号から全ての信号とチャネルパラメータを復元する問題は、二重盲検畳み込み (DBD) という用語である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:49:48 GMT)
MaskingDepth: Masked Consistency Regularization for Semi-supervised
Monocular Depth Estimation [38.1] MaskingDepthは単眼深度推定のための新しい半教師付き学習フレームワークである。
強く拡張された未ラベルデータと、弱い拡張された未ラベルデータから派生した擬似ラベルとの間の一貫性を強制する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:05:20 GMT)
Multi-granularity Interaction Simulation for Unsupervised Interactive
Segmentation [38.1] 我々は、教師なし対話的セグメンテーションのための有望な方向を開くために、MIS(Multi-granularity Interaction Simulation)アプローチを導入する。
我々のMISは、非深層学習の非教師付き手法よりも優れており、アノテーションを使わずに従来の深層教師付き手法と同等である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:19:43 GMT)
SINE: Semantic-driven Image-based NeRF Editing with Prior-guided Editing
Field [37.8] 我々は,1つの画像でニューラルラディアンスフィールドを編集できる,新しい意味駆動型NeRF編集手法を提案する。
本手法は,1枚の編集画像のみを用いた写真リアルな3D編集を実現し,実世界の3Dシーンにおけるセマンティックな編集の限界を押し上げる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:58:11 GMT)
Watch Out for the Confusing Faces: Detecting Face Swapping with the
Probability Distribution of Face Identification Models [37.5] 顔識別確率分布に基づく顔交換検出手法を提案する。
IdP_FSDは、有限集合に属するスワップされた顔を検出するために特別に設計されている。
IdP_FSDは、顔交換に関わる2つの顔の同一性は、顔交換の共通性を利用する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:33:10 GMT)
NAR-Former: Neural Architecture Representation Learning towards Holistic
Attributes Prediction [37.4] 本稿では,属性の全体的推定に使用できるニューラルネットワーク表現モデルを提案する。
実験の結果,提案するフレームワークは,セルアーキテクチャとディープニューラルネットワーク全体の遅延特性と精度特性を予測できることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:03:56 GMT)
Aerial-Ground Person Re-ID [36.7] 我々は,航空カメラと地上カメラをまたいで,人による再IDマッチングを行う新しいベンチマークデータセット AG-ReID を提案する。
データセットには、388のアイデンティティの21,983のイメージと、各IDに対する15のソフト属性が含まれている。
データは、高度15~45mのUAVと、大学のキャンパスで地上のCCTVカメラによって収集されました。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:36:08 GMT)
Xplainer: From X-Ray Observations to Explainable Zero-Shot Diagnosis [36.5] 臨床現場でのゼロショット診断のためのフレームワークであるXplainerを紹介した。
Xplainerは、コントラッシブ・ビジョン言語モデルの分類・記述アプローチをマルチラベル診断タスクに適用する。
我々の結果は、Xplainerが意思決定プロセスをより詳細に理解していることを示唆している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:07:31 GMT)
CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting
and Anchor Pre-Matching [36.3] 領域プロンプトとアンカー事前マッチングによる開語彙検出にCLIPを適用したフレームワークを提案する。
CORAはCOCO OVDベンチマークで41.7 AP50、LVIS OVDベンチマークで28.1 APrを達成した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:13:57 GMT)
SwissBERT: The Multilingual Language Model for Switzerland [35.9] SwissBERTは、スイス関連のテキストを処理するために特別に作られたマスク付き言語モデルである。
SwissBERTはトレーニング済みのモデルで、スイスの国語で書かれたニュース記事に適用しました。
スイスバーティ語は言語アダプターを使用しているため、将来の研究でスイスドイツ語の方言に拡張される可能性がある。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:44:47 GMT)
Rethinking Domain Generalization for Face Anti-spoofing: Separability
and Alignment [35.7] 本研究は,画像の解像度,ぼやけ度,センサの変動といった領域ギャップに対する対面アンチ・スプーフィング(FAS)モデルの一般化問題について検討する。
我々は、不変リスク最小化(IRM)の問題として、分離性と整合性(SA-FAS)のこのFAS戦略を定式化する。
ドメイン間FASデータセットに対するSA-FASの有効性を実証し、最先端の性能を確立する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:34:27 GMT)
Towards Better Dynamic Graph Learning: New Architecture and Unified
Library [35.7] DyGFormerは、動的グラフ学習のためのTransformerベースのアーキテクチャである。
DyGLibは、標準のトレーニングパイプライン、コーディングインターフェース、包括的な評価プロトコルを備えた統一ライブラリである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:27:32 GMT)
A Simple and Generic Framework for Feature Distillation via Channel-wise
Transformation [35.2] 学習可能な非線形チャネルワイズ変換を提案し,教師モデルと生徒の特徴を一致させる。
本手法は,様々なコンピュータビジョンタスクにおいて,大幅な性能向上を実現する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:13:29 GMT)
Calibrated Out-of-Distribution Detection with a Generic Representation [34.6] アウト・オブ・ディストリビューション検出(Out-of-distriion detection)は、視覚モデルを実際にデプロイする際の一般的な問題である。
本稿では,優れた性能を実現する新しいOOD手法であるGROODを提案する。
この手法は多くのOODベンチマークで最先端の性能を達成し、いくつかのベンチマークでほぼ完璧な性能を達成した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:03:12 GMT)
A Closer Look at Scoring Functions and Generalization Prediction [33.2] 一般化誤差予測器(GEP)は,サンプルレベルのスコアからデータセットレベルの誤差推定を導出することにより,未知分布のモデル性能を予測することを目的としている。
機構選択に依存しない一般的なスコアリング関数(自信,局所多様体の滑らかさ,モデル適合性)の有効性を厳密に研究する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:08:44 GMT)
A Closer Look at Model Adaptation using Feature Distortion and
Simplicity Bias [33.2] 適応プロトコルの簡易バイアス(SB)に対する感受性について検討する。
SBは近年、ロバストな一般化においていくつかの問題を解くことが示されている。
我々は,SBを緩和する改良線形プローブを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:57:09 GMT)
CP$^3$: Channel Pruning Plug-in for Point-based Networks [32.7] CP$3$は、ポイントベースのネットワークのためのチャンネルプルーニングプラグインである。
次元情報と個々のチャネル特徴の相関を反映する座標強調チャネル重要度尺度を示す。
様々なPNNアーキテクチャの実験では、CP$3$は最先端の2D CNNプルーニングアプローチを常に改善している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:25:46 GMT)
DiffMIC: Dual-Guidance Diffusion Network for Medical Image
Classification [32.7] 一般医用画像分類のための拡散モデル(DiffMIC)を提案する。
実験の結果,DiffMICは最先端の手法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:12:48 GMT)
Improving Generalization with Domain Convex Game [32.1] ドメインの一般化は、複数のソースドメインを持つモデルを学習することで、ディープニューラルネットワークの貧弱な一般化能力を緩和する傾向がある。
DG の古典的な解は領域拡大であり、その一般的な信念は、ソース領域の多様化は分布外一般化に導かれるということである。
モデル一般化と領域の多様性の相関は厳密には正ではなく,ドメイン拡張の有効性を制限している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:27:49 GMT)
Paint by Word [32.1] ゼロショット・セマンティック・イメージ・ペインティングの問題点について検討する。
具体的な色やセマンティックな概念の有限セットのみを用いて画像に修正を描き込む代わりに、オープンなフルテキスト記述に基づいてセマンティックペイントを作成する方法について尋ねる。
本手法は,現実的な画像の最先端生成モデルと,最先端のテキスト画像意味的類似性ネットワークを組み合わせる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:31:18 GMT)
Retrieval-Augmented Classification with Decoupled Representation [31.7] 文字と単語の両方を考慮した混合粒度中国語 BERT (MigBERT) を提案する。
提案するMigBERTだけでなく,既存のPLMを評価するために,中国における様々なNLPタスクについて広範な実験を行った。
MigBERTは、これらすべてのタスクで新しいSOTAパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:33:06 GMT)
ReVersion: Diffusion-Based Relation Inversion from Images [31.6] ReVersion for the Relation Inversion task, which aimed to learn a specific relationship from exemplar image。
我々は、凍結した事前学習されたテキスト-画像拡散モデルから関係のプロンプトを学習する。
学習した関係プロンプトを適用して、新しいオブジェクト、バックグラウンド、スタイルで関係固有の画像を生成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:56:10 GMT)
I2Edit: Towards Multi-turn Interactive Image Editing via Dialogue [30.8] 本稿では、対話による顔画像編集に焦点を当て、新しいベンチマークデータセットであるMulti-turn Interactive Image Editing (I2Edit)を導入する。
データセットはCelebA-HQデータセット上に構築され、ユーザ編集要求に対応するマルチターンダイアログでアノテートされたイメージを持つ。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:32:29 GMT)
Is ChatGPT A Good Keyphrase Generator? A Preliminary Study [30.7] キーフレーズ生成プロンプト,キーフレーズ生成の多様性,マルチドメインキーフレーズ生成,長い文書理解のためのChatGPTの評価を行った。
その結果、ChatGPTは6つのプロンプトすべてに対して非常によく機能し、データセット間で小さなパフォーマンス差が観測されていることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:50:38 GMT)
Adaptive Endpointing with Deep Contextual Multi-armed Bandits [30.1] オンライン環境における発話レベルの音声特徴を最適に設定するための効率的な手法を提案する。
提案手法では,アノテートラベルを必要とせず,アノテートラベルを必要とせず,報奨信号からのオンライン学習のみを用いる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:28:26 GMT)
Marching-Primitives: Shape Abstraction from Signed Distance Function [29.8] 本稿では,SDF から直接原始的抽象化を得るために,マーチング・プリミティブと呼ばれる新しい手法を提案する。
本手法は, ボクセルの接続性を解析することにより, 幾何的プリミティブを反復的に成長させる。
合成および実世界の両方のデータセットにおいて,本手法の性能を評価する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:42:35 GMT)
Low-frequency Image Deep Steganography: Manipulate the Frequency
Distribution to Hide Secrets with Tenacious Robustness [29.6] 低周波画像深部ステレオグラフィ(LIDS)は埋め込み過程における周波数分布の操作を可能にする。
LIDSは、コンテナイメージの高周波成分を歪ませる攻撃に対する堅牢性を改善する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:41:01 GMT)
A Permutable Hybrid Network for Volumetric Medical Image Segmentation [29.0] マルチ層パーセプトロン(MLP)ネットワークは、ViTに匹敵する結果により、研究者の間で人気を取り戻している。
本稿では医療画像セグメンテーションのための可変ハイブリッドネットワークPHNetを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:59:09 GMT)
Precise Location Matching Improves Dense Contrastive Learning in Digital
Pathology [28.6] 本研究では,2つの拡張領域を正確にマッチングする位置ベースマッチング機構を提案する。
本手法は,従来の密マッチング手法よりも,検出平均精度が7.2%,インスタンスセグメンテーション平均精度が5.6%向上した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:26:35 GMT)
On the Importance and Applicability of Pre-Training for Federated
Learning [28.2] 我々は,連合学習のための事前学習を体系的に研究する。
事前学習はFLを改善するだけでなく,その精度のギャップを集中学習に埋めることもできる。
本論文は,FLに対する事前学習の効果を解明する試みとしてまとめる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:27:40 GMT)
Disguise without Disruption: Utility-Preserving Face De-Identification [28.1] 本研究では,変化したデータのユーザビリティを確保しつつ,顔画像をシームレスに識別する新しいアルゴリズムを提案する。
提案手法は, 難読化と非可逆性を最大化するために, 変分機構を用いて合成した偽の識別情報を抽出する。
提案手法を複数のデータセット上で広範囲に評価し,先行技術w.r.t.の様々な下流タスクよりも高い非識別率と一貫性を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:50:46 GMT)
Human Guided Ground-truth Generation for Realistic Image
Super-resolution [27.7] GT画像を生成する方法は、現実的な画像超解像(Real-ISR)モデルをトレーニングする上で重要な問題である。
既存の手法は主に高分解能(HR)画像をGTとして取り、低分解能(LR)画像をシミュレートするために様々な劣化を適用している。
本稿では,人間誘導型GT生成手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:53:14 GMT)
Explore the Power of Synthetic Data on Few-shot Object Detection [27.3] Few-shot Object Detection (FSOD) は、トレーニングのいくつかの例に限って、新しいカテゴリのオブジェクト検出器を拡張することを目的としている。
近年のテキスト・画像生成モデルでは,高品質な画像を生成する上で有望な結果が得られている。
この研究は、最先端のテキスト・ツー・イメージ・ジェネレータから生成された合成画像がFSODタスクにどのように貢献するかを幅広く研究している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:34:52 GMT)
First Session Adaptation: A Strong Replay-Free Baseline for
Class-Incremental Learning [26.8] First Session Adaptation (FSA)は、トレーニング済みのニューラルネットワーク本体を最初の学習セッションのみに適応させ、その後修正する。
FSAは検討された16項目のうち15項目において、最先端よりも大幅に改善されている。
本稿では,身体適応の利点を予測できる非ラベル入力の集合に適用可能な尺度を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:54:41 GMT)
Towards Global Optimality in Cooperative MARL with the Transformation
And Distillation Framework [26.6] 分散実行は協調型マルチエージェント強化学習(MARL)における中核的要求である
本稿では,マルチエージェントポリシー勾配法と値分解法という,分散ポリシを用いた2つの一般的なアルゴリズムのクラスを理論的に解析する。
我々は,TAD-PPO が有限マルチエージェント MDP において最適政策学習を理論的に行うことができることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:42:26 GMT)
CMG-Net: An End-to-End Contact-Based Multi-Finger Dexterous Grasping
Network [25.9] 乱雑な環境下で未知の物体を把握するための有効なエンドツーエンドネットワークであるCMG-Netを提案する。
5万の散らばったシーン、80のオブジェクトカテゴリ、2000万のアノテーションからなる、総合的な把握データセットを作成します。
私たちの研究は、3本指のロボットハンドの最先端技術を大きく上回っている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:29:31 GMT)
Boosting Reinforcement Learning and Planning with Demonstrations: A
Survey [25.8] シーケンシャルな意思決定にデモを使うことの利点について論じる。
我々は,最近提案されたManiSkillロボット学習ベンチマークにおいて,デモの生成と活用のための実用的なパイプラインを実演する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:53:44 GMT)
Judicial Intelligent Assistant System: Extracting Events from Divorce
Cases to Detect Disputes for the Judge [25.7] 本稿では,2ラウンドのイベント抽出技術を用いて,離婚事例から紛争を検出する手法を提案する。
提案手法に従って, 司法知能アシスタント(JIA)システムを実装した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:58:49 GMT)
A Survey of Historical Learning: Learning Models with Learning History [25.6] 歴史型(何)、機能部(どこに)、保存形式(方法)について研究する。
リカレント/メモリネットワーク、アンサンブル学習、強化学習など、関連するトピックに関する議論が示されている。
我々はまた、このトピックの今後の課題を明らかにし、アルゴリズムを設計する際の歴史的学習原則の考え方にコミュニティが注意を払うように促します。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:09:18 GMT)
Correspondence-Free Domain Alignment for Unsupervised Cross-Domain Image
Retrieval [25.4] クロスドメイン画像検索は、異なるドメインにまたがる画像を取得して、クロスドメインの分類や対応関係を探索することを目的としている。
ドメイン間の通信を使わずに、異なるドメインを整列し、ブリッジすることは困難である。
クロスドメインギャップを解消するために,新しい対応ドメインフリーアライメント(CoDA)法を提案する。
本手法は,教師なしクロスドメイン画像検索のための領域不変な埋め込み空間への識別を符号化する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:38:53 GMT)
TransPoser: Transformer as an Optimizer for Joint Object Shape and Pose
Estimation [25.4] 連続観察されたRGB-D画像から剛体物体の形状と姿勢の結合推定法を提案する。
本稿では、カメラの視点と視線方向が与えられた物体の深度画像を直接出力するニューラルネットワークであるDeep Directional Distance Function(DeepDDF)を紹介する。
結合推定自体をTransPoserと呼ぶTransformerとして定式化する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:46:54 GMT)
A Deliberation-based Joint Acoustic and Text Decoder [25.4] 本稿では,ペア化データと未ペア化テキストデータの組み合わせによるトレーニングにより,ASRの性能を向上させる2パスE2E音声認識モデルを提案する。
提案手法は,Dreliberation-JATDとJATDの非ペアテキストデータを用いたスペル訂正機能を組み合わせて,さらなる性能向上を図る。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:02:23 GMT)
Exploring Visual Prompts for Whole Slide Image Classification with
Multiple Instance Learning [25.1] 本稿では,事前学習したモデルから病理組織像へのドメイン固有知識変換を学習するための,新しい,シンプルで効果的な手法を提案する。
提案手法では,事前学習したデータセットと対象の病理組織学データセットの違いを識別する上で,事前学習したモデルを支援するために,プロンプトコンポーネントを使用する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:23:52 GMT)
Detecting Backdoors in Pre-trained Encoders [25.1] プリトレーニングエンコーダの最初のバックドア検出手法であるDECREEを提案する。
我々は,ImageNetとOpenAIのCLIP 4億画像テキストペアで事前学習した画像エンコーダに対する提案手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:04:40 GMT)
A Bag-of-Prototypes Representation for Dataset-Level Applications [24.6] 本研究では,データセットレベルの2つのタスクに対するデータセットベクトル化について検討する。
本稿では,パッチ記述子からなるイメージレベルバッグを,セマンティックプロトタイプからなるデータセットレベルバッグに拡張する,Bop-of-prototypes(BoP)データセット表現を提案する。
BoPは、2つのデータセットレベルのタスクに対する一連のベンチマークにおいて、既存の表現に対する優位性を一貫して示している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:33:58 GMT)
Planning for Complex Non-prehensile Manipulation Among Movable Objects
by Interleaving Multi-Agent Pathfinding and Physics-Based Simulation [23.6] 重いクラッタにおける現実世界の操作問題は、ロボットが環境内の物体との潜在的な接触を推論する必要がある。
そこで我々は,対象物を棚から取り出すためのピック・アンド・プレイス・スタイルのタスクに焦点を合わせ,そのタスクを解決するために移動可能なオブジェクトを並べ替える必要がある。
特に、我々のモチベーションは、ロボットが複雑なロボットオブジェクトとオブジェクトオブジェクトの相互作用を引き起こす非包括的再配置動作を推論し、検討できるようにすることである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:29:27 GMT)
From Knowledge Distillation to Self-Knowledge Distillation: A Unified
Approach with Normalized Loss and Customized Soft Labels [23.6] 自己知識蒸留(Self-Knowledge Distillation, KD)は、教師の予測ロジットをソフトラベルとして使用して生徒を指導する。
Universal Self-Knowledge Distillation (USKD)は、教師がいないターゲットクラスと非ターゲットクラスの両方にカスタマイズされたソフトラベルを生成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:59:36 GMT)
NS3D: Neuro-Symbolic Grounding of 3D Objects and Relations [23.4] NS3Dは3Dグラウンドリングのための神経シンボリックな枠組みである。
言語を階層構造を持つプログラムに翻訳し、大きな言語からコードへのモデルを活用する。
データ効率と一般化の設定では、パフォーマンスが大幅に向上した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:50:40 GMT)
Improving Monte Carlo Evaluation with Offline Data [23.3] モンテカルロ (MC) の手法は、関心のある政策を前提として、この方針を繰り返し実行し、サンプルを収集し、結果の平均を採点することで見積を行う。
正確な推定を得るために、MCメソッドは大量のオンラインサンプルを消費する。
我々は、行動政策と呼ばれる異なる政策を実行することによって、関心のある政策を評価する、政治以外のMC手法を用いる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:42:20 GMT)
Take 5: Interpretable Image Classification with a Handful of Features [23.2] ディープニューラルネットワークにおいて,解釈可能なスパースと低次元決定層を提案する。
本研究では,SLDDモデルの方が高次元の高次元決定層よりも局所的・グローバル的に解釈しやすいことを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:36:10 GMT)
Graph Tensor Networks: An Intuitive Framework for Designing Large-Scale
Neural Learning Systems on Multiple Domains [23.0] 本稿では,大規模ニューラルネットワークシステムの設計と実装のためのグラフネットワーク(GTN)フレームワークを紹介する。
提案されたフレームワークは、多くの一般的なアーキテクチャを特別なケースとして含めるのに十分な一般性があり、あらゆるデータドメイン上のデータを扱うのに十分な柔軟性がある。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:05:35 GMT)
6D Object Pose Estimation from Approximate 3D Models for Orbital
Robotics [22.7] 単一画像から物体の6次元ポーズを推定する新しい手法を提案する。
画素毎に3次元モデル座標を回帰する高密度な2次元から3次元対応予測器を用いる。
提案手法は,SPEED+データセット上での最先端性能を実現し,SPEC2021ポストモーテムコンペティションで優勝した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:18:05 GMT)
Chordal Averaging on Flag Manifolds and Its Applications [22.4] 本稿では, 弦韻法の下でのフラグ多様体上の点集合のフラグ平均とフラグ中間値を計算するための, 証明可能な新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:57:28 GMT)
Uncertainty Calibration for Counterfactual Propensity Estimation in
Recommendation [22.3] レコメンデーションシステムでは、選択バイアスのために評価の大部分が欠落している。
反事実逆確率スコア (IPS) は, 観測された各評価値の計算誤差の重み付けに用いられた。
複数のシナリオにおいて有効であるが,不確実性推定の不確かさによりIPS推定の性能は制限されていると論じる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:42:48 GMT)
Efficient Feature Distillation for Zero-shot Detection [22.2] ゼロショット検出(EZSD)のための効率的な特徴蒸留法を提案する。
EZSDはCLIPの機能空間をターゲット検出ドメインに適応させ、CLIPを再正規化し、ドメインギャップを埋める。
EZSDは、COCOゼロショットベンチマークにおいて、より短いトレーニングスケジュールで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:54:28 GMT)
Planning Goals for Exploration [22.0] Planning Exploratory Goals(PEG)は,本質的な探索報酬を直接最適化する訓練エピソード毎の目標を設定する手法である。
PEGは世界モデルを学び、サンプリングベースの計画アルゴリズムを適用して"目標コマンドを計画"する
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:51:50 GMT)
Spatially Selective Deep Non-linear Filters for Speaker Extraction [21.4] 我々は任意の目標方向に操ることのできる深部結合型空間スペクトル非線形フィルタを開発した。
本研究では,本方式がベースライン方式よりも有効であることを示し,フィルタの柔軟性を性能的に向上させる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:31:34 GMT)
Realization of Causal Representation Learning to Adjust Confounding Bias
in Latent Space [21.2] 因果DAG (Directed Acyclic Graphs) は通常、2次元平面において考慮される。
本稿では,変数の値がもはや時間スタンプに依存しておらず,時系列を軸と見なすことができるEmphdo-DAGとして因果DAGを再定義する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:41:06 GMT)
Edit-A-Video: Single Video Editing with Object-Aware Consistency [21.0] 本稿では,事前訓練されたTTIモデルと単一のテキスト,ビデオ>ペアのみを付与したビデオ編集フレームワークを提案する。
本フレームワークは,(1)時間モジュールチューニングを付加して2Dモデルを3Dモデルに膨らませること,(2)原動画をノイズに反転させ,対象のテキストプロンプトとアテンションマップインジェクションで編集すること,の2段階からなる。
各種のテキスト・ビデオに対して広範な実験結果を示し,背景整合性,テキストアライメント,ビデオ編集品質の点で,ベースラインに比べて提案手法の優位性を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:04:45 GMT)
Memotion 3: Dataset on Sentiment and Emotion Analysis of Codemixed
Hindi-English Memes [20.9] 私たちは、10,000の注釈付きミームを持つ新しいデータセットであるMemotion 3を紹介します。
Memotion 3ではHindi-English Codemixedミームが導入されている。
本稿では,Memotionタスク,データ収集,データセット作成手法について述べる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:52:05 GMT)
Towards Solving Fuzzy Tasks with Human Feedback: A Retrospective of the
MineRL BASALT 2022 Competition [20.9] BASALTチャレンジでは、Minecraftの難易度の高い報酬関数でタスクを解くアルゴリズムを開発するために、チームに競うように求めている。
競合について説明し、トップソリューションの概要を提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:17 GMT)
DICNet: Deep Instance-Level Contrastive Network for Double Incomplete
Multi-View Multi-Label Classification [20.9] 実世界におけるマルチビューマルチラベルデータは、データ収集や手動アノテーションの不確実性のため、一般的に不完全である。
本稿では,DICNetという深層インスタンスレベルのコントラストネットワークを提案し,二重不完全なマルチラベル分類問題に対処する。
我々のDICNetは、マルチビュー多ラベルデータの一貫した識別的表現を捉え、欠落したビューと欠落したラベルの負の影響を避けることに長けている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:09:11 GMT)
MonoATT: Online Monocular 3D Object Detection with Adaptive Token
Transformer [20.8] 我々はMonoATTと呼ばれるオンラインMono3Dフレームワークを提案する。これは、様々な形状と大きさの異質なトークンを持つ新しいビジョントランスフォーマーを活用して、モバイルMono3Dを容易にする。
MonoATTは最先端の手法と比較して大きなマージンで最高のパフォーマンスを示し、KITTI 3Dベンチマークで第1位にランクされている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:45:03 GMT)
Instant Volumetric Head Avatars [20.8] Instant Volumetric Head Avatars (INSTA)を提案する。
我々のパイプラインは、異なる表現とビューで対象を観察する単一の単眼のRGBポートレートビデオに基づいて訓練されている。
INSTAは、最新のGPUハードウェア上で10分未満でデジタルアバターを再構築する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:16:06 GMT)
GETT-QA: Graph Embedding based T2T Transformer for Knowledge Graph
Question Answering [20.7] 本稿では GETT-QA というエンド・ツー・エンドの知識グラフ質問応答システムを提案する。
GETT-QAは、人気のあるテキストからテキストまでの事前訓練言語モデルであるT5を使用している。
その結果,T5 は損失関数の変化を伴わずに絡み合った KG 埋め込みを学習でき,KGQA 性能が向上することがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:06:26 GMT)
DBLP-QuAD: A Question Answering Dataset over the DBLP Scholarly
Knowledge Graph [20.7] 本研究では,DBLP学術知識グラフ(KG)上に質問データセットを作成する。
我々のデータセットは1万の質問応答対と対応するSPARQLクエリで構成されており、DBLP KG上で実行して正しい回答を取得することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:29:21 GMT)
MoGDE: Boosting Mobile Monocular 3D Object Detection with Ground Depth
Estimation [20.7] 画像の基底深度を常に推定する新しいMono3DフレームワークであるMoGDEを提案する。
MoGDEは最先端の手法と比較して大きなマージンで最高の性能を示し、KITTI 3Dベンチマークで第1位にランクされている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:06:01 GMT)
Modeling Inter-Class and Intra-Class Constraints in Novel Class
Discovery [20.7] 新たなクラス発見(NCD)は、クラス非結合なラベル付きデータセットから別の非ラベル付きデータセットへ共通の知識を転送するモデルを学ぶことを目的としている。
対称KKLD(Kullback-Leibler divergence)に基づくNCDにおけるクラス間制約とクラス内制約の両方をモデル化する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:15:27 GMT)
Symmetries, flat minima, and the conserved quantities of gradient flow [20.1] パラメータ空間における連続対称性を見つけるための枠組みについて述べる。
この枠組みを非線形ニューラルネットワークに一般化するために,非線形・データ依存対称性の新たな集合を導入する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:10:19 GMT)
ShadowNeuS: Neural SDF Reconstruction by Shadow Ray Supervision [19.4] そこで我々は,光線に沿った試料と光線位置の両方を最適化する新しいシャドウ線監視手法を提案する。
複数の照明条件下で単視点画像からシーンのニューラルSDFを再構成することに成功した。
さらに画像色と影線の相関関係をモデル化することにより,RGB入力に効果的に拡張することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:21:24 GMT)
TrojViT: Trojan Insertion in Vision Transformers [19.3] 視覚変換器(ViT)は、様々な視覚関連タスクにおける最先端の性能を実証している。
CNN固有のViTに対するバックドア攻撃は、クリーンなデータの精度が低く、攻撃の成功率が低いだけである。
ステルスで実用的なViT固有のバックドア攻撃をTrojViT$で提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:15:21 GMT)
CLIP is Also an Efficient Segmenter: A Text-Driven Approach for Weakly
Supervised Semantic Segmentation [19.2] 本稿では,コントラスト言語-画像事前学習モデル(CLIP)が,画像レベルラベルのみを用いて異なるカテゴリをローカライズする可能性について検討する。
高品質なセグメンテーションマスクをCLIPから効率的に生成するために,CLIP-ESと呼ばれる新しいWSSSフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:18:12 GMT)
Renderable Neural Radiance Map for Visual Navigation [18.9] 視覚ナビゲーションのための新しいタイプのニューラルラディアンスマップ(RNR-Map)を提案する。
RNR-Mapはグリッド形式であり、各ピクセルの遅延符号で構成されている。
記録された潜伏符号には環境に関する情報が暗黙的に含まれており、RNR-Mapは視覚的に記述される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:59:24 GMT)
Bringing Inputs to Shared Domains for 3D Interacting Hands Recovery in
the Wild [18.7] 1)手指の3次元回復と,2)手指間の3次元相対的翻訳回復の2つのサブプロブレムから構成される。
われわれは、MoCapとITWサンプルを共有ドメインにもたらすInterWildを紹介した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:19:34 GMT)
Normalizing Flows for Interventional Density Estimation [18.6] 我々は、インターベンショナル正規化フローと呼ばれる、新しい完全にパラメトリックなディープラーニング手法を提案する。
我々は,2つの正規化フロー,すなわち (i) ニュアンスパラメータを推定するためのニュアンスフローと (ii) 潜在結果の密度をパラメトリックで推定するターゲットフローを組み合わせる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:29:28 GMT)
ChatGPT for Shaping the Future of Dentistry: The Potential of
Multi-Modal Large Language Model [18.6] ChatGPT は OpenAI が開発した GPT-4 (Generative Pretrained Transformer 4) のエレガントで対話的なバリエーションである。
本稿では,歯学におけるLarge Language Models(LLMs)の今後の応用について論じる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:34:26 GMT)
Fine-Grained Face Swapping via Regional GAN Inversion [18.5] 所望の微妙な幾何やテクスチャの詳細を忠実に保存する,高忠実な顔交換のための新しいパラダイムを提案する。
顔成分の形状とテクスチャの明示的な乱れに基づく枠組みを提案する。
我々のシステムの中核には、形状とテクスチャの明示的な切り離しを可能にする、新しいRegional GAN Inversion (RGI) 手法がある。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:05:52 GMT)
Semantic Ray: Learning a Generalizable Semantic Field with
Cross-Reprojection Attention [18.5] 我々は,正確で効率的で一般化可能な複数のシーンから意味的放射場を学習することを目指している。
本稿では,その多視点再計画から線方向のセマンティック情報を完全に活用するセマンティック・レイを提案する。
実験により、S線は複数のシーンから学習できることが示され、見えないシーンに適応する強力な一般化能力を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:33:20 GMT)
Lower Bound on the Bayesian Risk via Information Measures [17.7] マルコフの不等式を介して双対を上界にすることで、あらゆる情報測度でリスクを低くすることができることを示す。
サンプル数における下位境界の挙動は、情報尺度の選択によって影響される。
観測結果が民営化される場合、強いデータ・プロシーシングの不等式により、強い不合理性が得られる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:49:14 GMT)
Planning for Manipulation among Movable Objects: Deciding Which Objects
Go Where, in What Order, and How [17.5] 最近提案されたアルゴリズムであるM4Mは、どのオブジェクトを移動する必要があるかを決定し、この問題のマルチエージェントパスフィニングMAPFの抽象化を解く。
我々はM4Mを拡張して、可動オブジェクトに対するプッシュの順序を探索する、グラフ検索に基づく体系的な解法であるEnhanced-M4Mを提示する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:55:19 GMT)
PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360$^{\circ}$ [17.4] 3次元頭部合成のための既存の3次元生成対向ネットワーク(GAN)は、正面近傍のビューに限られるか、大きなビュー角で3次元の一貫性を維持するのが困難である。
パノヘッド(PanoHead)は、360ドル(約3万3000円)で高画質のフルヘッド画像合成を可能にする最初の3D認識生成モデルである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:54:34 GMT)
AutoLink: Self-supervised Learning of Human Skeletons and Object
Outlines by Linking Keypoints [16.5] 本研究では,オブジェクト構造を外見から切り離すことを学習する自己教師型手法を提案する。
キーポイントの位置と両辺の重みはどちらも学習され、同じオブジェクトクラスを描いている画像の集合のみを考慮に入れられる。
結果のグラフは解釈可能で、例えばAutoLinkは、人を示す画像に適用すると、人間の骨格のトポロジーを復元する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:31:48 GMT)
Predicting the Initial Conditions of the Universe using Deep Learning [16.5] 我々は、N体系の線形変位を出力するV-Netベースの畳み込みニューラルネットワークを訓練する。
このニューラルネットワークは, 広範囲にわたる初期線形変位場を正確に復元することを示した。
提案手法の結果から,ニューラルネットワークモデルが線形状態の近似として有効である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:04:36 GMT)
SCADE: NeRFs from Space Carving with Ambiguity-Aware Depth Estimates [16.3] SCADEは、スパースで制約のない入力ビューにおけるNeRF再構成品質を改善する新しい技術である。
本研究では,各視点に対して,深度推定の連続的マルチモーダル分布を予測する新しい手法を提案する。
実験により,本手法はスパースビューから高忠実度ノベルビューの合成を可能にすることが示された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:00:07 GMT)
FedGH: Heterogeneous Federated Learning with Generalized Global Header [16.3] フェデレートラーニング(FL)は、複数のパーティが共同で共有モデルをトレーニングできる、新興の機械学習パラダイムである。
我々はフェデレート・グローバル予測ヘッダー(FedGH)アプローチを提案する。
共有一般化グローバル予測ヘッダーを訓練する通信および計算効率のモデル不均一FLである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:38:52 GMT)
Multi-View Zero-Shot Open Intent Induction from Dialogues: Multi Domain
Batch and Proxy Gradient Transfer [16.3] タスク指向対話(TOD)システムでは,新たな意図の検出と誘導が,実世界でシステムを適用する上で大きな課題である。
これら2つの課題を解決するために,セマンティック・マルチビュー・モデルを提案する。
本稿では,クラスタリング手法を用いてモデルを微調整するために,Siameseネットワークを用いた新しいPGTを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:30:35 GMT)
DiffPattern: Layout Pattern Generation via Discrete Diffusion [16.1] 信頼性の高いレイアウトパターンを生成するツールDiffPatternを提案する。
いくつかのベンチマーク設定の実験では、ToolDiffPatternが既存のベースラインを大幅に上回っていることが示されています。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:16:14 GMT)
Connected Superlevel Set in (Deep) Reinforcement Learning and its
Application to Minimax Theorems [16.1] 政策パラメータに関する目的関数の超レベル集合は、常に連結集合であることを示す。
本稿では,政策パラメータと報酬の関数としての最適化目標が,より強い「等価性」特性を満たすことを示す。
このような結果が文献に現れるのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:14:36 GMT)
MMFormer: Multimodal Transformer Using Multiscale Self-Attention for
Remote Sensing Image Classification [16.0] ハイパースペクトル画像(HSI)と光検出・ランドング(LiDAR)などのデータソースを用いた、リモートセンシング(RS)画像分類のための新しいマルチモーダルトランス (MMFormer) を提案する。
畳み込みの帰納バイアスを欠く従来のビジョントランスフォーマー(ViT)と比較して、まず、HSIとLiDARのマルチモーダルデータからパッチをトークン化するために、MMFormerに畳み込み層を導入します。
提案したMSMHSAモジュールは、HSIをLiDARデータに粗い方法で組み込むことで、きめ細かい表現を学べる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:34:24 GMT)
Efficient and Direct Inference of Heart Rate Variability using Both
Signal Processing and Machine Learning [15.9] 心拍変動(Heart Rate Variability、HRV)は、連続する心拍間の時間の変化を測定し、身体的および精神的な健康の指標である。
近年の研究では、光胸腺画像センサを用いてHRVを推定できることが示されている。
しかし、多くの先行研究では、信号処理や機械学習(ML)しか使わなかったため、高い誤差があった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:47:53 GMT)
MSFA-Frequency-Aware Transformer for Hyperspectral Images Demosaicing [15.8] 本稿では,MSFA対応変圧器ネットワーク(FDM-Net)を新たに提案する。
Maformerの利点は、データに存在するMSFA情報と非ローカル依存関係を活用することができることである。
実験の結果、FDM-Netは6dB PSNRで最先端の手法より優れており、高忠実度の詳細を再構築することに成功した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:27:30 GMT)
ActMAD: Activation Matching to Align Distributions for
Test-Time-Training [15.7] Test-Time-Training (TTT)は、テスト時に発生する分散シフトにトレーニングされたモデルを適用することで、アウト・オブ・ディストリビューション(OOD)データに対処するアプローチである。
我々は,この適応をアクティベーションマッチング (ActMAD): モデルのアクティベーションを分析し,OODテストデータのアクティベーション統計をトレーニングデータと照合する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:29:04 GMT)
Quality-aware Pre-trained Models for Blind Image Quality Assessment [15.6] ブラインド画像品質評価(BIQA)は,画像の知覚品質を自動的に評価することを目的としている。
本稿では,BIQA用にカスタマイズされたプレテキストタスクを用いて,自己教師型学習方式でこの問題を解決することを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:57:56 GMT)
Dissipative Pairing Interactions: Quantum Instabilities, Topological
Light, and Volume-Law Entanglement [15.2] 完全に安定な散逸対の相互作用は、単純なホッピングやビーム・スプリッター相互作用と組み合わせて不安定性を生成することができることを示す。
これらの不安定性はまた、波動関数の局在に対する非常に顕著な感度を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:03:14 GMT)
TactoFind: A Tactile Only System for Object Retrieval [14.7] 視覚感覚が欠如しているシナリオにおけるオブジェクト検索の問題について検討する。
カメラがシーン全体を観察できる視覚とは異なり、タッチセンサーは局所的であり、マニピュレータに接触しているシーンの一部のみを観察する。
本稿では,指先触覚センサによる触覚フィードバックを,視覚的フィードバックを伴わずに,新たな物体の局所化,識別,把握を行うシステムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:50:09 GMT)
Hierarchical Semantic Contrast for Scene-aware Video Anomaly Detection [14.7] 本研究では,通常のビデオからシーン認識型VADモデルを学習するための階層的意味コントラスト(HSC)手法を提案する。
この階層的なセマンティックコントラスト戦略は、通常のパターンの多様性に対処し、識別能力を高めるのに役立つ。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:53:34 GMT)
PointGame: Geometrically and Adaptively Masked Auto-Encoder on Point
Clouds [14.4] ポイントクラウド上での自己教師型学習のための,幾何学的かつ適応的にマスク付きオートエンコーダ(textitPointGame)を提案する。
Gateは幾何学的かつ適応的なトークン埋め込みモジュールの略で、表面の形状を効果的に捉えた幾何学的記述子の従来の知恵を吸収するだけでなく、適応的な塩分を利用して点雲の塩分部分にフォーカスする。EATは、線形計算複雑性を持つ外部の注意ベースのTransformerエンコーダの略で、パイプライン全体の効率を高める。
PointGameは、グローバルとローカルの両方の微調整戦略の下で、さまざまなダウンストリームタスクで競合相手に対して明確な優位性を示す
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:32:10 GMT)
Generative Image Inpainting with Segmentation Confusion Adversarial
Training and Contrastive Learning [14.4] 本稿では,画像インパインティングのための新しい対角的学習フレームワークについて述べる。
SCATは、画素レベルの局所的なトレーニング信号を提供する、インペイントジェネレータとセグメンテーションネットワークの間の対角ゲームを行う。
2つのベンチマークデータセットに対して広範な実験を行い、質的かつ定量的にモデルの有効性と優越性を実証した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:34:17 GMT)
FER-former: Multi-modal Transformer for Facial Expression Recognition [14.2] 本稿では,表情認識のための多孔性監視ステアリングトランスを提案する。
提案手法は,多粒性埋め込み統合,ハイブリッド自己アテンション方式,及びヘテロジニアス・ドメイン・ステアリング・インスペクションを特徴とする。
人気のあるベンチマークの実験では、既存の最先端技術よりも提案されたFER-formerの方が優れていることが示されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:29:53 GMT)
Utilising the CLT Structure in Stochastic Gradient based Sampling :
Improved Analysis and Faster Algorithms [14.2] 粒子ダイナミック(IPD)に対するグラディエント・ランゲヴィン・ダイナミクス(SGLD)やランダムバッチ法(RBM)などのサンプリングアルゴリズムの近似を考察する。
近似によって生じる雑音は中央極限定理(CLT)によりほぼガウス的であるが、ブラウン運動はまさにガウス的である。
この構造を利用して拡散過程内の近似誤差を吸収し、これらのアルゴリズムの収束保証を改善する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:02:44 GMT)
QDP: Learning to Sequentially Optimise Quasi-Static and Dynamic
Manipulation Primitives for Robotic Cloth Manipulation [13.9] Quasi-Dynamic isable (QDP) 法は運動速度などのパラメータを最適化する。
逐次強化学習(Sequential Reinforcement Learning)の枠組みを利用して、プリミティブを構成するパラメータを分離する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:54:01 GMT)
Considerations on the Evaluation of Biometric Quality Assessment
Algorithms [13.7] 品質評価アルゴリズムを用いて生体認証のための生体試料の有用性を推定することができる。
曲線の「誤差対特性」プロットと「部分曲線」(pAUC)値は、一般にそのような品質評価アルゴリズムを評価するために研究者によって用いられている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:26:21 GMT)
OCELOT: Overlapped Cell on Tissue Dataset for Histopathology [13.7] 組織学における細胞検出のための細胞間関係研究のためのデータセットであるOCELOTをリリースする。
細胞と組織の両方のタスクを同時に学習できるマルチタスク学習手法を提案する。
特にOCELOTテストセットでは、F1スコアが最大6.79改善されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:57:11 GMT)
Hypothesis Testing for Unknown Dynamical Systems and System Anomaly
Detection via Autoencoders [13.6] 未知の力学系に対する仮説テスト問題について検討する。
異常検出を仮説検定として定式化し, 代替仮説を用いて異常を定式化する。
その結果、仮説テストアルゴリズムは、ロボット、天気、エネルギーシステム、株式市場などの現実世界のシステムにおける障害を検出することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:16:42 GMT)
Sliced Optimal Partial Transport [13.6] 1次元の2つの非負測度間の最適部分輸送問題を計算するための効率的なアルゴリズムを提案する。
種々の数値実験において,スライス OPT 方式の計算と精度の利点を実証した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:26:44 GMT)
Improved Regret Bounds for Online Kernel Selection under Bandit Feedback [13.5] 過去の限界を改善する2種類の後悔境界を証明します。
2つのアルゴリズムを時間とともにオンラインカーネル選択に適用し、以前の$O(sqrtTlnK +Vert fVert2_mathcalH_imaxsqrtT,fracTsqrtmathcalR)$ expected bound ここで$mathcalR$は時間予算であることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:20:34 GMT)
Failure-tolerant Distributed Learning for Anomaly Detection in Wireless
Networks [13.1] 「Tol-FL」法は、フラットトポロジとスタートポロジを組み合わせて、両方の性能と信頼性の利点を組み合わせたものである。
提案手法は,AUROCの異常検出において,従来手法よりも最大8%高い精度でデバイス故障リスクを抑える。
この性能は、特に無線ネットワークの領域において、Tol-FLが異常検出のための分散モデルトレーニングに非常に適していることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:39:12 GMT)
Real-time event simulation with frame-based cameras [13.0] イベントシミュレータは、新しいアルゴリズムを開発するための実際のイベントカメラの必要性を最小限にする。
本研究では,イベントシミュレーションの性能を2桁に向上させるシミュレーション手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:31:25 GMT)
The Probabilistic Stability of Stochastic Gradient Descent [12.9] ディープラーニング理論における基本的なオープン問題は、勾配降下(SGD)の安定性を定義し、理解する方法である。
確率安定性のレンズの下でのみ、SGDは学習のリッチで実践的なフェーズを示すことを示す。
我々の研究は、学習アルゴリズムがディープラーニングの学習結果にどのように影響するかという根本的な問題に対処するための新たな場所を開く可能性がある。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:17:10 GMT)
Controllable Inversion of Black-Box Face-Recognition Models via
Diffusion [11.9] 我々は,事前学習した顔認識モデルの潜在空間を,完全なモデルアクセスなしで反転させる作業に取り組む。
本手法は,生成過程を直感的に制御できる最初のブラックボックス顔認識モデル逆変換法である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:02:09 GMT)
Containing a spread through sequential learning: to exploit or to
explore? [11.9] 我々は、所定の試験予算の下で、累積感染を抑えるためのテストおよび隔離戦略を設計する。
ネットワークや拡散のパラメータによって,様々な合成データネットワークや実データネットワークにおけるエクスプロイトよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:26:19 GMT)
Policy Gradient Converges to the Globally Optimal Policy for Nearly
Linear-Quadratic Regulators [11.8] 準線形2次制御系における最適速度について検討する。
本稿では、勾配アルゴリズムを用いて、グローバルな最適レートで保証されるポリシーを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:02:17 GMT)
A Comprehensive Analysis of AI Biases in DeepFake Detection With
Massively Annotated Databases [11.4] 本研究は,5つの人気のDeepfakeデータセットに対して,47の属性の大規模な人口統計学的および非デコグラフィ的アノテーションを提供する。
調査は、人口統計(年齢、性別、民族)や非人口統計(髪、肌、アクセサリーなど)情報など、様々な特徴が検出性能に与える影響を分析した。
その結果, データベースには多様性が欠如しており, さらに重要な点として, 利用済みのDeepfake検出バックボーンモデルが多くの属性に対して強く偏りがあることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:56:52 GMT)
MSAT: Biologically Inspired Multi-Stage Adaptive Threshold for
Conversion of Spiking Neural Networks [11.4] スパイキングニューラルネットワーク(SNN)はそのスパイク間隔のために低消費電力で推測できる。
ANN-SNN変換は、よく訓練されたニューラルネットワーク(ANN)を変換することでディープSNNを実現する効率的な方法である
既存の方法は、ニューロンがより深い層にスパイクを素早く届けるのを防ぐ変換に一定の閾値を使用するのが一般的である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:18:08 GMT)
A Large-scale Study of Spatiotemporal Representation Learning with a New
Benchmark on Action Recognition [11.3] BEARは5つのカテゴリ(異常、ジェスチャー、毎日、スポーツ、教育)に分類される18のビデオデータセットのコレクションである。
教師付き学習と自己指導型学習の両方によって事前訓練された6つの共通時間モデルについて、徹底的に評価した。
我々の観察では、現在の最先端技術は、実世界のアプリケーションに近いデータセット上でのハイパフォーマンスを確実に保証できないことを示唆している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:58:05 GMT)
Multiple Appropriate Facial Reaction Generation in Dyadic Interaction
Settings: What, Why and How? [11.1] 本稿では,本論文で初めて,多目的反応生成タスクを定義した。
次に、生成した反応の妥当性を評価するために、新しい客観的評価指標を提案する。
その後、複数の適切な顔反応を予測、生成、評価するための枠組みを紹介した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:58:41 GMT)
Efficient Neural Architecture Search for Emotion Recognition [10.9] 本稿では,マクロおよびマイクロ圧縮認識のための高効率で堅牢なニューラルアーキテクチャを提案する。
勾配に基づくアーキテクチャ探索アルゴリズムを用いて軽量モデルを作成する。
提案したモデルは、既存の最先端手法よりも優れ、速度と空間の複雑さの点で非常によく機能する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:21:26 GMT)
A Unified Pyramid Recurrent Network for Video Frame Interpolation [10.9] フレーム合成のための統一ピラミッドリカレントネットワークであるUPR-Netを提案する。
本研究では,我々の反復合成戦略により,大規模運動症例におけるフレームのロバスト性を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:14:45 GMT)
Improving the Performance of Spiking Neural Networks on Event-based
Datasets with Knowledge Transfer [10.8] スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックなイベントベースのデータを処理するのに適した、豊富な時空間ダイナミクスを持つ。
小規模なデータスケールにより、SNNはSNNの性能を過度に調整し制限する傾向にある。
本稿では,静的画像を利用してニューロモルフィックデータセットのトレーニングを支援する知識伝達フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:14:48 GMT)
NEWTON: Neural View-Centric Mapping for On-the-Fly Large-Scale SLAM [10.8] Newtonは、リアルタイム観測に基づいて動的にニューラルネットワークを構築するビュー中心のマッピング手法である。
本手法は,複数のニューラルネットワークを用いてシーンを表現することで,ループクロージャとシーン境界更新を用いたカメラポーズ更新を可能にする。
実験の結果,既存の世界中心型ニューラルネットワークSLAMシステムよりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:22:01 GMT)
Inheriting Bayer's Legacy-Joint Remosaicing and Denoising for Quad Bayer
Image Sensor [10.4] ピクセルビンニングをベースとしたQuadセンサーは、低照度撮像におけるコンパクトカメラのハードウェア制限を克服する、有望なソリューションとして登場した。
そこで本稿では,ノイズフリーベイアパターンとノイズフリーベイアパターンの変換が可能なデュアルヘッド継手消音ネットワーク(DJRD)を提案する。
提案手法は,ハードウェアやソフトウェアの複雑さを伴わずに,約3dBの競合モデルよりも優れている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:16:50 GMT)
Optimization and Optimizers for Adversarial Robustness [10.3] 本稿では,汎用的制約最適化解法と制約Foldingを融合した新しいフレームワークを提案する。
信頼性に関して、PWCFは、ソリューションの品質を評価するための定常度測定と実現可能性テストのソリューションを提供する。
さらに、損失、摂動モデル、最適化アルゴリズムの様々な組み合わせを用いて、これらの問題を解決するための解の異なるパターンについて検討する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:22:59 GMT)
MELTR: Meta Loss Transformer for Learning to Fine-tune Video Foundation
Models [10.1] 本稿では,様々な損失関数を自動かつ非線形に組み合わせて,補助学習による目標タスクの学習を支援するプラグインモジュールであるMeta Loss TRansformerを提案する。
評価のために、我々のフレームワークを様々なビデオ基盤モデル(UniVL、Violet、All-in-one)に適用し、4つのダウンストリームタスクにおいて大きなパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:06:44 GMT)
Prompting Large Language Models to Generate Code-Mixed Texts: The Case
of South East Asian Languages [9.9] 東南アジアの5カ国語でコードミキシングされたデータを作成するために、Large Language Modelsの推進について検討する。
ChatGPTは、コードミキシング(code-mixing)という言葉が明示的に定義されている時間の68%をコードミキシング(code-mixing)で生成できる可能性が最も高いことを示している。
BLOOMZやFlan-T5-XXLのような他の多言語モデルは、コードミキシングされたテキストを全く生成できない。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:16:30 GMT)
An Operational Perspective to Fairness Interventions: Where and How to
Intervene [9.8] フェアネス介入の評価と文脈化のための包括的枠組みを提案する。
予測パリティに関するケーススタディで、我々のフレームワークを実証する。
グループデータを使わずに予測パリティを実現することは困難である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:20:38 GMT)
Zero-guidance Segmentation Using Zero Segment Labels [9.6] CLIPとDINOを用いた新規なゼロ誘導分割問題を提案する。
一般的な考え方は、まずイメージを小さなオーバーセグメントに分割し、それらをCLIPの視覚言語空間にエンコードし、テキストラベルに変換し、意味論的に類似したセグメントをまとめることである。
私たちの主な貢献は、CLIP内のアテンション層を分析することによって、2つのコンテキストのバランスをとる新しいアテンションマスキング技術です。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:15:07 GMT)
CroSel: Cross Selection of Confident Pseudo Labels for Partial-Label
Learning [9.5] 部分ラベル学習(Partial-label Learning, PLL)は, 弱い教師付き学習問題である。
モデルからの履歴予測情報を利用して,ほとんどのトレーニング例で真のラベルを識別する「クロセル」と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:19:56 GMT)
A Confident Labelling Strategy Based on Deep Learning for Improving
Early Detection of Knee OsteoArthritis [9.4] Knee osteoArthritis (KOA) は高齢者の運動能力低下を引き起こす筋骨格障害である。
本稿では,新しいシームズネットワークを提案するとともに,KOAの早期検出のためのハイブリッド損失戦略を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:57:50 GMT)
GiveMeLabeledIssues: An Open Source Issue Recommendation System [9.3] 開発者はしばしば、オープンソースソフトウェア(OSS)プロジェクトのイシュートラッキングシステムをナビゲートして、適切なタスクを見つけるのに苦労します。
本稿では,プロジェクトリポジトリをマイニングし,課題を解決に必要なスキルに基づいてラベル付けするツールを提案する。
GiveMeLabeledIssuesは開発者のスキルとタスクのマッチングを容易にし、プロジェクトのメンテナの負担を軽減する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:39:31 GMT)
BlockFW -- Towards Blockchain-based Rule-Sharing Firewall [9.3] 中央管理型のセキュリティメカニズムは、多くの組織でよく利用されるが、そのようなサーバはセキュリティのブレークポイントである。
これは、サーバがセキュリティ保護を共有するすべてのノードの権限を持っているためです。
私たちはブロックチェーンベースのルール共有ファイアウォールであるBlockFWを開発し、管理されたセキュリティメカニズムを作成します。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:08:02 GMT)
ENVIDR: Implicit Differentiable Renderer with Neural Environment
Lighting [9.1] ENVIDRは、高精細な反射を伴う表面の高精細なレンダリングと再構成のためのレンダリングとモデリングのためのフレームワークである。
まず、表面光と環境光の相互作用を学習するために、分解レンダリングを用いた新しいニューラルネットワークを提案する。
次に、この学習されたニューラルサーフェスを利用して一般的なシーンを表現するSDFベースのニューラルサーフェスモデルを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:12:07 GMT)
Federated Learning for Metaverse: A Survey [9.1] メタバースのためのフェデレートラーニング(FL4M)は強力なツールになるだろう。
FLは、エッジデバイスが自身のデータ、計算能力、モデル構築能力を使用して、ローカルにトレーニングタスクに参加することを可能にする。
FLをメタバースに適用することは、参加者のデータプライバシを保護するだけでなく、高いコンピューティングパワーとサーバ上の高メモリの必要性を低減する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:15:40 GMT)
POTATO: The Portable Text Annotation Tool [8.9] 本稿では,フリーで完全にオープンソースなアノテーションシステムPOTATOを紹介する。
多くのタイプのテキストとマルチモーダルデータのラベル付けをサポートする。
デプロイとアノテータの生産性を最大化するために、簡単に設定できる機能を提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:45:37 GMT)
Sample-Efficient Multi-Objective Learning via Generalized Policy
Improvement Prioritization [8.8] マルチオブジェクト強化学習(MORL)アルゴリズムは、エージェントが異なる好みを持つ可能性のあるシーケンシャルな決定問題に対処する。
本稿では、一般化政策改善(GPI)を用いて、原則的、正式に派生した優先順位付けスキームを定義する新しいアルゴリズムを提案する。
実験により,本手法は多目的タスクの挑戦において,最先端のMORLアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:29:23 GMT)
Low-Light Image Enhancement by Learning Contrastive Representations in
Spatial and Frequency Domains [8.7] 照度補正ネットワークにコントラスト学習を組み込んで,抽象表現を学習し,様々な低照度条件を識別することを提案する。
光条件が画像の周波数成分を変化させることを考えると、空間領域と周波数領域の両方で表現が学習され比較される。
その結果,提案手法は,他の最先端技術と比較して質的,定量的な結果が得られることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:32:49 GMT)
Optimal Synthesis of Multi-Controlled Qudit Gates [8.7] クアディット上の多制御トフォリゲートの線形サイズ合成を,少なくとも1つの借用アンシラを用いて提案する。
我々の合成は、キューディットに実装された様々な量子アルゴリズムの改善につながる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:05:54 GMT)
Self-Supervised Clustering of Multivariate Time-Series Data for
Identifying TBI Physiological States [8.5] SLAC-Timeは、イミューテーションやアグリゲーションを回避してデータの整合性を維持する革新的なセルフスーパービジョンベースのアプローチである。
大規模な研究データセットにSLAC-Timeを用いてデータをクラスタリングすることにより,3つの異なるTBI生理状態が同定された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:16:00 GMT)
A Case Study on AI Engineering Practices: Developing an Autonomous Stock
Trading System [8.2] プロダクション対応のAIベースのシステムの品質を保証するためには、ソリッドAIエンジニアリングプラクティスが必要である。
AIベースのシステムを開発するためのいくつかのプラクティスがすでに提案されているが、これらのプラクティスを適用するための詳細な実践経験は稀である。
文献から10のAIエンジニアリングプラクティスを選択し、開発中に体系的に適用しました。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:27:27 GMT)
Multi-modal Facial Action Unit Detection with Large Pre-trained Models
for the 5th Competition on Affective Behavior Analysis in-the-wild [7.9] 本稿では,AU検出のためのABAW(Affective Behavior Analysis in-wild)2023コンペティションについて述べる。
本稿では,大規模な事前学習モデルから抽出した視覚的,音響的,語彙的特徴を用いた顔動作単位検出のための多モード手法を提案する。
第5回ABAWチャレンジの公式検証セットでは,F1スコアが52.3%に達している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:35:40 GMT)
Adaptive Regularization for Class-Incremental Learning [7.7] ニューラルネットワーク重み付けの正規化は、新しいものを学びながら、以前に学んだクラスを忘れないようにするための一般的な方法である。
既存の正則化器は学習セッションを通して一定等級を使用し、漸進的な学習で遭遇するタスクの難しさのレベルを反映していない可能性がある。
本研究では,手作業の複雑度に応じて適応正則化強度を動的に調整するクラスインクリメンタルラーニングにおける適応正則化の必要性について検討する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:00:38 GMT)
Increasing Textual Context Size Boosts Medical Image-Text Matching [7.4] 我々は、一般的な画像テキストマッチングモデルであるOpenAIのCLIPの使用を分析し、CLIPの限られたテキスト入力サイズが下流のパフォーマンスに悪影響を与えることを観察する。
そこで我々は,テキストキャプションをエンコードするシンプルなスライディングウインドウ技術を用いて,ClipMDを訓練・リリースする。
その結果、ClipMDは両方のデータセット上の他のモデルよりも大きなマージンで優れていることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:20:05 GMT)
Random Inverse Problems Over Graphs: Decentralized Online Learning [7.1] グラフ上の実時間観測によるランダムな逆問題の枠組みを確立する。
非次元および非独立なオンラインデータストリームに基づく分散オンライン学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:05:07 GMT)
Exploring Discontinuity for Video Frame Interpolation [7.1] 本稿では,既存のディープラーニングベースのVFIアーキテクチャを不連続動作に対して堅牢にするための3つの手法を提案する。
まず、フィギュア・テキスト・ミキシング(FTM)と呼ばれる新しいデータ拡張戦略によって、モデルが不連続な動きを学習できるようにする。
第二に,連続した動きと不連続な動きの領域を密に区別する不連続写像 (D-map) と呼ばれる写像を予測する,単純だが効果的なモジュールを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:44:42 GMT)
Distributed Random Reshuffling over Networks [7.0] 凸関数と滑らかな対象関数の問題を解くために分散resh-upr (D-RR) アルゴリズムを提案する。
特に、滑らかな凸対象関数に対して、D-RRはD-T収束率(T がエポック数を数える)を大域ドライブ間の距離で達成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:44:25 GMT)
Laplacian Segmentation Networks: Improved Epistemic Uncertainty from
Spatial Aleatoric Uncertainty [7.0] オフ・オブ・ディストリビューション(OOD)の医療画像は、サイトやスキャナの違いや画像の破損などにより、しばしば堅牢性に遭遇する。
OOD画像は、誤った画像セグメンテーションのリスクを伴い、下流の診断や治療に悪影響を及ぼす可能性がある。
画像セグメンテーションにおけるアレタリック(データ)の不確実性を共同でモデル化するLaplacian La Network (LSN)を提案する。
モデル不確実性を示すため,重み付け後部の1位近似法を提案する。
経験的に、空間的モデリングの画素相関が実現できることを実証する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:23:57 GMT)
Clustering based on Mixtures of Sparse Gaussian Processes [6.9] 低次元の組込み空間を使ってデータをクラスタする方法は、マシンラーニングにおいて依然として難しい問題である。
本稿では,クラスタリングと次元還元の両立を目的とした共同定式化を提案する。
我々のアルゴリズムはスパースガウス過程の混合に基づいており、スパースガウス過程混合クラスタリング(SGP-MIC)と呼ばれる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:44:36 GMT)
Mechanism Design for Ad Auctions with Display Prices [6.9] 本稿では,メカニズム設計の観点から,ディスプレイ価格による広告オークションについて検討する。
我々は、価格プロファイルの実現に向け、福祉最大化と収益最大化のオークションを導出する。
以上の結果から,ディスプレイ価格は広告オークションのデザインに影響を及ぼし,プラットフォームは広告配信性能を最適化するためにこのような情報を活用することができることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:46:48 GMT)
Source-independent quantum random number generator against tailored
detector blinding attacks [6.9] 本稿では,原因の脆弱性に対処する量子乱数生成プロトコルを提案する。
本研究では, パルスあたり0.1ビットの生成速度で2次元計測を行うために, ランダム数を生成するプロトコルの有効性を実験的に実証した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:54:17 GMT)
Implicit Bias of Large Depth Networks: a Notion of Rank for Nonlinear
Functions [6.6] ネットワークの深さが無限に近づくにつれて、均一な非線形性を持つ完全連結ニューラルネットワークの表現コストが収束することを示す。
次に、損失のグローバルな最小値がデータの真のランクを回復する条件を問う。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:14:14 GMT)
Neural Interpretation of Generic Source Code [6.5] 汎用ソースコードを抽象的に実行する最初のニューラルモデルであるNeural Interpretationを導入する。
可変誤動作の局所化と修復のための具体的な入力を使わずに,ホワイトボックスの実行を実証する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:56:45 GMT)
Adjust Sample Imbalance and Exclude Similar Object in Underwater Object
Tracking [6.4] UOSTrackを提案する。UOHT(Hybrid Training)とMBPP(Motion-based Post Processing)で構成されている。
UOHTは、サンプルの不均衡な水中トラッカーを調整するように設計されている。
MBPPは、ターゲット周辺の類似したオブジェクトを除外するために提案されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:34:15 GMT)
Kernel Methods for Unobserved Confounding: Negative Controls, Proxies,
and Instruments [6.4] 負の制御は、未測定のコンファウンディングの存在下で、治療と結果の因果関係を学ぶための戦略である。
非パラメトリックな処理効果を負の制御で学習するためのカーネルリッジ回帰に基づくアルゴリズム群を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:48:40 GMT)
Offensive Language and Hate Speech Detection for Danish [6.4] textitReddit と textitFacebook からユーザ生成したコメントを含むデンマークのデータセットを構築した。
さまざまなソーシャルメディアプラットフォームからユーザ生成されたコメントが含まれており、私たちの知る限り、この種のものとしては初めてのものだ。
我々は4つの自動分類システムを開発しており、それぞれが英語とデンマーク語の両方に対応できるように設計されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:24:09 GMT)
Discriminating Between Similar Nordic Languages [6.4] 本論文では,北欧語の自動言語識別のための機械学習手法を提案する。
デンマーク語、スウェーデン語、ノルウェー語(ノルウェー語)、ノルウェー語(ボクマール語)、フェロー語、アイスランド語(アイスランド語)の6つの言語間の差別に焦点を当てる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:22:08 GMT)
Enhancing Embedding Representations of Biomedical Data using Logic
Knowledge [6.3] 本稿では,PharmKGデータセット上の知識グラフモデルの埋め込み表現を強化するために,論理ルールを利用する。
R2Nは利用可能なロジックルールを使用して、KGE潜在表現を前提としたニューラルネットワークを構築する。
実験の結果,本手法はPharmKGデータセットの最先端性を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:38:21 GMT)
Frame-Level Multi-Label Playing Technique Detection Using Multi-Scale
Network and Self-Attention Mechanism [6.3] フレームレベルのマルチラベル分類問題を定式化し,それを中国の弦楽器Guzhengに適用する。
異なるIPTの長さが異なるため,マルチスケールネットワークと自己注意を用いた新しい手法を提案する。
提案手法は, IPT検出における有効性を示すとともに, 既存の成果よりも高い性能を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:52:42 GMT)
Initial-state dependent quantum speed limit for dissipative state
preparation: Framework and optimization [6.2] 我々は、エネルギー固有状態の1つであるマルコフ散逸状態準備スキームに焦点をあてる。
我々は、実際の進化時間のより洗練された測定値を提供する初期状態依存量子速度制限(QSL)を導出する。
本稿では,ベル状態作成のための散逸型Rydberg原子系において,我々の戦略の有効性を実証する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:19:32 GMT)
Design Patterns for AI-based Systems: A Multivocal Literature Review and
Pattern Repository [6.2] 本稿では,AIに基づくシステムの設計パターンについて概説する。
AIベースのシステムのための新しいパターンが登場しつつあるが、既存のパターンもこの新しいコンテキストに適応している。
我々の結果は、研究者がフォローアップ研究の基盤として、そして実践者がAIベースのシステムの設計を伝えるための関連するパターンを発見するために利用することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:57:11 GMT)
PPG-based Heart Rate Estimation with Efficient Sensor Sampling and
Learning Models [6.2] ウェアラブルデバイスに埋め込まれた光胸部センサーは、心拍数(HR)を高精度に推定することができる。
しかしながら, PPGセンサを用いたHR推定を組込みデバイスに適用することは, エネルギー集中型高周波PSGサンプリングによる課題に直面している。
本研究では,低消費電力・資源制約の組込みデバイスに適したHR推定手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:47:36 GMT)
An elementary belief function logic [6.1] 可能性と必要性の尺度、信念と妥当性の関数と不正確な確率の双対性は、モーダル論理と共通の特徴を共有している。
本稿では,MEL上にLukasiewicz論理を追加することにより,より単純な信念関数論理を考案できることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:39:18 GMT)
Efficient decentralized multi-agent learning in asymmetric bipartite
queueing systems [6.1] 双方向待ち行列システムにおける分散マルチエージェント学習について検討する。
特にNエージェントは、完全に分散された方法でKサーバからのサービスを要求する。
我々は、各エージェントが分散的に実行すると、キューシステムに効率的なパフォーマンスをもたらす簡単な学習アルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 22:13:46 GMT)
Flopping-mode spin qubit in a Si-MOS quantum dot [6.1] シリコン金属酸化物半導体(Si-MOS)量子ドット(QD)に基づくスピン量子ビットは、大規模量子コンピュータにとって有望なプラットフォームである。
電気双極子スピン共鳴(EDSR)は近年、QDのスピン量子ビットを制御するために最も一般的に用いられている。
電子を二重量子ドットの電荷状態に非局在化することにより、フリップモードEDSRはSi/SiGe QDで実現されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:51:19 GMT)
Simultaneous estimation of multiple eigenvalues with short-depth quantum
circuit on early fault-tolerant quantum computers [6.0] 量子ハミルトニアンの複数の固有値を同時に推定する多段量子複素指数最小二乗法(MM-QCELS)を提案する。
回路深さと総コストはハイゼンベルクに制限されたスケーリングを示す。
この方法は初期のフォールトトレラント量子コンピュータに適している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:58:50 GMT)
Reckoning with the Disagreement Problem: Explanation Consensus as a
Training Objective [5.9] ポストホック特徴属性(Post hoc feature attribution)は、入力中の各特徴にモデル出力への影響に対応するスコアを与える一連の方法である。
この種類の説明者の大きな制限は、どの特徴が他のものよりも重要であるかについて意見が一致しないことである。
本稿では,2つの説明者間の特徴属性の差を計測する,精度に対応する標準的な用語とともに,損失項を導入する。
3つのデータセットから、この損失項を用いてモデルをトレーニングし、未知のデータに関する説明コンセンサスを改善するとともに、損失項で使用されるもの以外の説明コンセンサスの改善したコンセンサスを確認する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:35:37 GMT)
Mordecai 3: A Neural Geoparser and Event Geocoder [5.7] Mordecai3は、新しいエンドツーエンドのテキストジオパーザとイベントジオロケーションシステムである。
新しいニューラルランキングモデルを使用して、文書から抽出された地名をGeonames gatteerへのエントリに解決する。
また、テキストで報告されたイベントと、報告される場所名とをリンクするイベントジオコーディングも行う。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:10:04 GMT)
NVAutoNet: Fast and Accurate 360$^{\circ}$ 3D Perception For Self
Driving [5.6] 我々は、自動運転のためのエンドツーエンドのサラウンドカメラ認識システムを導入する。
我々の知覚システムは、新しいマルチタスク・マルチカメラネットワークである。
大きさ、方向、障害物の位置、駐車場、自由空間などの3D信号の豊富なコレクションを生成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:55:48 GMT)
Decision-aid or Controller? Steering Human Decision Makers with
Algorithms [5.4] 人間の意思決定者について学習し、最終決定に影響を与えるために「個人化された推薦」を提供する意思決定支援アルゴリズムについて検討する。
このようなアルゴリズムの潜在的な応用とその社会的意味について論じる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:24:26 GMT)
Joint Multi-Scale Tone Mapping and Denoising for HDR Image Enhancement [5.3] 本稿では,HDR画像のマルチスケールデノジングとトーンマッピングを併用するフレームワークを提案する。
本モデルでは,既存のHDR復調演算子やトーンマッピング演算子よりも定量的,定性的に優れる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:12:35 GMT)
Omnigrok: Grokking Beyond Algorithmic Data [5.2] ニューラルネットワークのロスランドスケープを解析することで、グルーキングを理解することを目指している。
トレーニングとテストの損失(モデルウェイト基準)は典型的には"L"と"U"に似ているので、このことを"LUメカニズム"と呼んでいる。
逆方向では、アルゴリズムデータセットのグラッキングを排除できます。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:42:27 GMT)
SIEDOB: Semantic Image Editing by Disentangling Object and Background [5.1] 本稿では,セマンティック画像編集のための新しいパラダイムを提案する。
textbfSIEDOB(サイト・英語)は、オブジェクトと背景に対していくつかの異種ワークを明示的に活用する。
我々はCityscapesとADE20K-Roomデータセットに関する広範な実験を行い、本手法がベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:17:23 GMT)
Adaptive Multi-scale Online Likelihood Network for AI-assisted
Interactive Segmentation [5.1] 既存の対話的セグメンテーション手法はラベルリファインメントに自動セグメンテーションとユーザインタラクションを利用する。
データ効率の良いオンライン環境で適応的に学習する適応型マルチスケールオンライン可能性ネットワーク(MONET)を提案する。
我々のアプローチは、Diceのスコアが5.86%高く、NASA-TLXのワークロードスコアが最先端のものよりも24.67%低かった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 22:20:56 GMT)
Complementary Pseudo Multimodal Feature for Point Cloud Anomaly
Detection [5.1] ポイントクラウド(PCD)異常検出は、将来性のある研究領域として着実に現れる。
本研究では,局所幾何学情報を3次元モードに組み込んだ補足的擬似多重モーダル特徴 (CPMF) を提案する。
実験では、95.15%のイメージレベルのAU-ROCと92.93%のピクセルレベルのProが2Dと3Dのモダリティの特徴を補完する能力を示している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:52:17 GMT)
Parameter-Efficient Sparse Retrievers and Rerankers using Adapters [5.0] 本研究では,スパースレトリバーであるSPLADEのアダプタについて検討する。
また、クロスドメインBEIRデータセットとTripClickのアダプタにより、ニューラルネットワークのドメイン適応にも対処する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:34:30 GMT)
The Quantization Model of Neural Scaling [4.6] 使用頻度を減少させるために量子が学習されると、使用中の電力法則が観測された損失のスケーリングを説明する。
言語モデルの内部構造を用いて、自然文の予測における対応するサブプロブレムの分布が、我々の理論から予測されるニューラルスケーリング指数から予測されるパワー法と互換性があることを仮証する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:58:43 GMT)
Logistic Regression Equivalence: A Framework for Comparing Logistic
Regression Models Across Populations [4.5] 本研究は, 個体群差に対する既定寛容レベルの同値試験が, 推論の精度を高めることを論じる。
診断データについては、等価モデルと等価でないモデルの例を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:12:52 GMT)
Continuous Indeterminate Probability Neural Network [4.2] 本稿では,CIPNN-Continuous Indeterminate Probability Neural Networkと呼ばれる一般モデルを提案する。
CIPNNはIPNNをベースとしている。
そこで我々は,N次元潜在変数の1つをデコーダとして用いて,潜在確率変数を可視化する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:11:17 GMT)
A Hierarchical Hybrid Learning Framework for Multi-agent Trajectory
Prediction [4.2] 深層学習(DL)と強化学習(RL)の階層的ハイブリッドフレームワークを提案する。
DLの段階では、トラフィックシーンは、トランスフォーマースタイルのGNNが異種相互作用を符号化するために採用される複数の中間スケールの異種グラフに分割される。
RLの段階では、DLの段階で予測される重要な将来点を利用して、交通シーンを局所的なサブシーンに分割する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:17:51 GMT)
Patch-Mix Transformer for Unsupervised Domain Adaptation: A Game
Perspective [4.2] 本稿では、ソースドメインとターゲットドメインを中間ドメインでブリッジするPMTransモデルを提案する。
具体的には、中間ドメインを効果的に構築するPatchMixと呼ばれる新しいViTベースのモジュールを提案する。
その結果,PMTrans は Office-Home では +3.6%,Office-31 では +1.4%,DomainNet では +17.7% である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:56:01 GMT)
DetOFA: Efficient Training of Once-for-All Networks for Object Detection
by Using Pre-trained Supernet and Path Filter [4.2] 本稿では,トランスファーラーニングと探索空間プルーニングを併用した,効率的なスーパーネットベースニューラルネットワーク探索手法を提案する。
提案手法は,最適ネットワークアーキテクチャの計算コストを30%と63%削減し,精度の高い浮動小数点演算を行う。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:23:11 GMT)
Innovation Slowdown: Decelerating Concept Creation and Declining
Originality in New Technological Concepts [4.1] 特許文書から400万以上の概念からなる大規模技術セマンティックネットワークを解析する。
概念創造のペースの持続的な減速と、新しく作られた概念の独創性低下の証拠を見いだす。
これらの傾向は、人類の知能の限界が、先行技術が拡大する領域を超えて革新することに起因する可能性がある。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:37:35 GMT)
Physics Symbolic Learner for Discovering Ground-Motion Models Via
NGA-West2 Database [4.1] 地動モデル(GMM)は多くの地震工学研究の基礎となっている。
本研究では,数式演算子を記号として自動的に発見するために,新しい物理インフォームド記号学習法(PISL)を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:14:05 GMT)
Learning a Practical SDR-to-HDRTV Up-conversion using New Dataset and
Degradation Models [4.0] メディア業界では、HDR-WCG(ハイダイナミックレンジワイドカラーガム)を使用すると、SDR-TVアップコンバージョンが要求される。
現在の手法では、薄暗く不飽和な結果をもたらす傾向があり、視聴体験をほとんど改善しない。
我々は,新しいHDRTVデータセット(HDRTV4K)と新しいHDR-to-SDRモデルを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:40:33 GMT)
A Simple Explanation for the Phase Transition in Large Language Models
with List Decoding [3.9] 大規模言語モデル(LLM)は,小モデルに存在しない創発的能力を示す。
各ステップに候補シーケンスのリストを保持するリストデコーダを使用し、最後に出力シーケンスを生成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:00:07 GMT)
Evaluating the Robustness of Deep Reinforcement Learning for Autonomous
Policies in a Multi-agent Urban Driving Environment [3.8] 視覚に基づく自律運転における深層強化学習の比較のためのベンチマークフレームワークを提案する。
この実験は、視覚のみの高忠実度都市運転模擬環境で実施する。
その結果, 深層強化学習アルゴリズムのいくつかは, シングルエージェントとマルチエージェントのシナリオで一貫した性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:03:23 GMT)
Predicting the Future of the CMS Detector: Crystal Radiation Damage and
Machine Learning at the LHC [3.5] CMS実験は75,848個の鉛タングステート結晶を用いて、陽子-陽子衝突で生じる電子と光子のエネルギーを測定する。
各結晶の透明性は、衝突生成物からの放射による結晶の光学特性の変化を追跡するレーザー監視システムによって監視される。
2016年から2018年にかけてのCMSコラボレーションによって収集された結晶モニタリングデータの公開データのリリースについて説明する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:14:15 GMT)
GesGPT: Speech Gesture Synthesis With Text Parsing from GPT [3.5] 本稿では,Large Language Models (LLM) のセマンティック分析機能を活用したジェスチャ生成手法であるGesGPTを提案する。
本手法は,ジェスチャ生成をGPTに基づく意図的分類問題に変換する素早い原理の開発を必要とする。
実験結果から,GesGPTは文脈的に適切かつ表現力のあるジェスチャーを効果的に生成することが示された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:30:30 GMT)
Multiphoton non-local quantum interference controlled by an undetected
photon [3.3] 単一クォータ干渉の多部一般化は、複数の量子が共有する状態のコヒーレントな重ね合わせである絡み合いを生み出す。
絡み合いは通常、マルチパーティイト干渉によって表される非局所的な相関を作るのに欠かせないと考えられている。
これはそうではなく、光子の固有の性質の絡み合わずに多光子非局所量子干渉を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:20:14 GMT)
Open-Vocabulary Object Detection using Pseudo Caption Labels [3.3] よりきめ細かいラベルは、新しいオブジェクトに関するより豊かな知識を引き出すために必要である、と我々は主張する。
分離されたVisualGenomeデータセットでトレーニングされた最良のモデルは、APが34.5、APrが30.6で、最先端のパフォーマンスに匹敵する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:10:22 GMT)
The Shrinkage-Delinkage Trade-off: An Analysis of Factorized Gaussian
Approximations for Variational Inference [3.2] 変分推論の不確かさを測る2つの一般的な方法を考える(VI)
我々は、$q$は常に成分的分散と$p$のエントロピーの両方を過小評価していることを証明している。
特に,問題の大きさが大きくなるにつれて,各成分のエントロピーギャップは消滅する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:06:17 GMT)
Confidence-Aware and Self-Supervised Image Anomaly Localisation [3.1] 本稿では,ゆるやかな特徴的局所性制約による確率的推論の近似を支援する,自己教師付きシングルクラストレーニング戦略について論じる。
提案手法は,複数のオフ・オブ・ディストリビューション(OOD)検出モデルに統合されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:48:47 GMT)
Applications of statistical causal inference in software engineering [3.0] 本稿では,統計的因果推論手法を適用したソフトウェア工学における既存の研究を概観する。
その結果,統計的因果推論手法の適用は比較的最近であり,それに対応する研究コミュニティは比較的断片的であることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:25:51 GMT)
Learning and generalization of compositional representations of visual
scenes [3.0] オブジェクト属性の分散表現とベクトルシンボルアーキテクチャにおけるベクトル演算を用いてシーンの完全な構成記述を作成する。
シーン構成を制御するために、複数の、翻訳された、色付きMNIST桁からなる人工画像を使用する。
ディープネットワークの出力はVSA共振器ネットワークによって解釈され、オブジェクトの同一性やその他のオブジェクトの特性を抽出する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 22:03:42 GMT)
TinyML: Tools, Applications, Challenges, and Future Research Directions [2.9] TinyMLは、安価でリソースに制約のあるデバイス上でのMLアプリケーションを可能にする、組み込み機械学習技術である。
この記事では、TinyML実装で利用可能なさまざまな方法についてレビューする。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:29:48 GMT)
IoT trust and reputation: a survey and taxonomy [2.9] IoTは急速に成長している技術の1つで、2030年末までに10億以上のデバイスが世界中で利用できるようになると推定されている。
これらの接続エンティティの能力を最大化するためには、IoTエンティティ間の信頼と評価が不可欠である。
我々は,信頼管理の方法に基づいた信頼モデルと評価モデルを構築するため,新たな分類体系,すなわち新しい分類体系を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:29:41 GMT)
A robust estimator of mutual information for deep learning
interpretability [2.6] 本稿では,離散的かつ連続的な設定にも適用可能なアルゴリズムGMM-MIを提案する。
我々は,GMM-MIを具体的真理MIが知られている玩具データに基づいて広範囲に検証する。
次に、表現学習の文脈におけるMI推定器の使用例を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:18:11 GMT)
Beyond Universal Transformer: block reusing with adaptor in Transformer
for automatic speech recognit [2.6] 本稿では,エッジデバイスへのASRの適用のために,Transformerモデルのブロックを再利用可能なソリューションを提案する。
具体的には、パラメータの有効性を高めるために、音声変換器(BRST)の新しいブロック再利用戦略を設計する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:54:37 GMT)
Practical X-ray Gastric Cancer Screening Using Refined Stochastic Data
Augmentation and Hard Boundary Box Training [2.4] 胃癌検診では、X線はX線撮影者が行うことができ、内視鏡検査よりも多くの患者を見ることができる。
胃X線の感度は85.5%に過ぎず、胃癌を直接標的とする自動診断補助についてはほとんど研究されていない。
本稿では,現実的な臨床画像撮影条件下でのX線画像の実用的な胃癌検診システムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:44:18 GMT)
Mid-infrared spectrally-pure single-photon states generation from 22
nonlinear optical crystals [2.4] 14個の複屈折結晶からの純状態単一光子源の合成を理論的に検討した。
各結晶について, 3種類の群速度整合(GVM)条件, 相整合条件, スペクトル純度, およびHong-Ou-Mandel干渉を算出する。
この研究は、中赤外波長域における量子センシング、量子イメージング、および量子通信アプリケーションのための高品質な単一光子源を提供するかもしれない。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:49:49 GMT)
Optimization Dynamics of Equivariant and Augmented Neural Networks [2.3] 対称データに基づく多層パーセプトロンの最適化について検討する。
損失と非線形性に関する自然な仮定の下では、同変定常点の集合は2つの戦略に対して同一であることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:26:12 GMT)
Feature-Conditioned Cascaded Video Diffusion Models for Precise
Echocardiogram Synthesis [2.2] 我々は、ビデオモデリングのための解明された拡散モデルを拡張し、単一の画像から可視なビデオシーケンスを生成する。
我々の画像からシーケンスへのアプローチは、最近提案されたシーケンスからシーケンス生成手法よりも38ポイント高い93%のR2$スコアを達成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:17:22 GMT)
Contextual Integrity of A Virtual (Reality) Classroom [2.2] 没入型VRのマルチコンテキスト特性は,VR生成情報フローのコンテキスト整合性の確保を困難にしている。
我々は、HCIコミュニティに対して、長期にわたる開示とパーミッションモデルを廃止し、コンテキスト整合性理論に根ざしたプライバシーメカニズムを受け入れるよう呼びかけている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:32:01 GMT)
TriPlaneNet: An Encoder for EG3D Inversion [1.8] 本稿では,EG3D生成モデルの3面表現を直接利用することにより,両者のギャップを埋めるリアルタイム手法を提案する。
レンダリングは最適化ベースの手法と品質が似ており、新しいビューのベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:56:20 GMT)
Associated Random Neural Networks for Collective Classification of Nodes
in Botnet Attacks [1.5] ボットネット攻撃はネットワーク化されたシステムにとって大きな脅威である。
本研究は,nノードIPネットワークからのトラフィックを動作させる集合Botnet攻撃分類手法を導入し,不正なノードを識別する新しいAssociated Random Neural Network(ARNN)を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:32:31 GMT)
Enhancing Unsupervised Speech Recognition with Diffusion GANs [1.5] 拡散GANによる教師なし自動音声認識(ASR)のためのバニラ対向訓練法を強化する。
我々のモデルは、生成元の出力とラベルなし参照テキストに様々な強度のインスタンスノイズを注入する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 02:54:00 GMT)
Geometric and holonomic quantum computation [1.5] 幾何位相と量子ホロノミーに基づく量子ゲートは、ある種のエラーに対するレジリエンスを内蔵している。
このレビューは、幾何学的およびホロノミック量子ゲートを構築するための理論的および実験的進歩の概要と、このトピックの紹介を提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:44:32 GMT)
Exponential quantum speedup in simulating coupled classical oscillators [1.4] 2n$結合振動子の古典力学に対する量子アルゴリズム(ばねで結合された2n$質量など)を提案する。
我々のアプローチは、調和ポテンシャルに対するシュル「オーディンガー方程式」とニュートン方程式の間の写像を利用する。
提案手法は,より一般的な調和系を2n$モードで効率的にシミュレートできることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:24:03 GMT)
Data thinning for convolution-closed distributions [1.4] 本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:23:40 GMT)
SC-MIL: Supervised Contrastive Multiple Instance Learning for Imbalanced
Classification in Pathology [1.4] 医療画像における機械学習の問題は、しばしば稀な疾患に対処する。
これらの不均衡は、モデルが現実世界にデプロイされたときに、アウト・オブ・ディストリビューション(OOD)データセットで発生する可能性がある。
ラベル不均衡の存在下での協調学習型MILフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:28:15 GMT)
Presenting Multiagent Challenges in Team Sports Analytics [1.4] 我々は、MASは侵入ゲームの研究に適しており、MASとスポーツアナリティクスの両方に利益をもたらすと論じている。
我々は,MASの実施と,短期的なゲーム内戦略(コーチング)と長期チーム計画(マネジメント)という,2つの軸に沿った開発領域を強調した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:29:32 GMT)
Planning as Theorem Proving with Heuristics [1.4] 状況計算で証明された定理としての計画は50年前に不可能なプロジェクトとして放棄された。
我々は,A*探索を用いて,状況のツリー内のプランを探索するTheorem Proving Lifted Heuristic Plannerを開発した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:52:30 GMT)
Clinically Relevant Latent Space Embedding of Cancer Histopathology
Slides through Variational Autoencoder Based Image Compression [1.3] 本研究では, がんの病態スライドを1:512の圧縮比で圧縮・圧縮できるVAEベースのトレーニング手法を提案する。
圧縮された潜伏空間から埋め込みを生成,可視化し,データの臨床的解釈にどのように有用かを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:13:04 GMT)
High-fidelity interconversion between Greenberger-Horne-Zeilinger and
$W$ states through Floquet-Lindblad engineering in Rydberg atom arrays [1.3] グリーンバーガー・ホーネ・ザイリンガーと3つの中性87ドルRb原子のW$状態の間の決定論的相互変換のための散逸プロトコルを提案する。
本手法は,レーザー位相ノイズや原子配列の幾何学的不完全性など,典型的な雑音に対して頑健であることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:06:18 GMT)
Perturbation Theory for Quantum Information [1.3] 量子状態摂動、元の状態のベクトル的支持を保存する摂動、元の状態を超えて支持を広げる摂動の2つのクラスの理論を発展させる。
我々は摂動理論を適用し、量子情報理論において最も重要な量のうち4つの単純な式を求める。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:26:10 GMT)
It is all Connected: A New Graph Formulation for Spatio-Temporal
Forecasting [1.3] グラフニューラルネットワーク(GNN)ネットワークを用いて時間的および空間的依存関係を学習するためのフレームワークを提案する。
GNNは、すべてのサンプルをグラフ内の独自のノードとして表現する。
このフレームワークは時間次元に沿った測定を必要としないため、データサンプリングの計算を必要とせずに、不規則な時系列、異なる周波数、または欠落データを容易にする。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:16:33 GMT)
Explaining Exchange Rate Forecasts with Macroeconomic Fundamentals Using
Interpretive Machine Learning [1.2] 我々は、解釈的枠組みの中でカナダとアメリカのドル為替レートの基本的なモデルを開発する。
本稿では,機械学習を用いて為替レートを予測し,マクロ経済変数間の関係を正確に解析するための解釈可能性手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:40:23 GMT)
3D-POP -- An automated annotation approach to facilitate markerless
2D-3D tracking of freely moving birds with marker-based motion capture [1.1] 本研究では,モーションキャプチャ(mo-cap)システムを用いて,動物の動きや姿勢のアノテートデータを半自動で取得する手法を提案する。
本手法は, 動物に付着するマーカーの位置に関して, 形態的キーポイントの3次元位置を抽出する手法である。
この手法を用いて、ビデオ形式で約300万の注釈付きフレーム(400万インスタンス)を持つ3D-POPという新しいデータセットを得た。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:03:18 GMT)
Convex and Nonconvex Sublinear Regression with Application to
Data-driven Learning of Reach Sets [1.1] 部分回帰によって設定される関数関数を近似することにより、有限データのコンパクトな集合を推定することを検討する。
サブ線形回帰を行うための2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:32:44 GMT)
Fault Prognosis of Turbofan Engines: Eventual Failure Prediction and
Remaining Useful Life Estimation [1.1] ターボファンエンジンユニットの残余寿命を予測するための深層学習手法は、ラベル付き故障モード情報を利用していない。
新しい予後学的なアプローチは、現在の状態、最終的に失敗したコンポーネント、そして残りの有用な生活を同時に予測するために、カスタマイズされた損失関数で定式化される。
最も高性能なアルゴリズムであるANN-FluxはAUROCとAUPRのスコアを各分類で0.95を超えている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:19:41 GMT)
Leveraging the Potential of Novel Data in Power Line Communication of
Electricity Grids [1.0] 電力網は、日常生活において気づかないことが多いとしても、日常生活において不可欠な部分となっている。
本稿では、ブロードバンド電力線通信インフラにおける計測に基づく2つの第一種データセットを提案する。
両方のデータセットFiN-1とFiN-2は、約440万人を供給しているドイツの低電圧グリッドの一部で実運用中に収集された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:17:22 GMT)
Investigating the fast spectral diffusion of a quantum emitter in hBN
using resonant excitation and photon correlations [1.0] 共振器型レーザー励起と2次光子相関の組み合わせにより,高速なダイナミックスにアクセスできることを示す。
本研究では,2次元材料窒化ホウ素中の電子ビームによって生じる色中心の高速スペクトル拡散を実験的に検討する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:12:48 GMT)
Federated Learning on Heterogenous Data using Chest CT [1.0] フェデレーション・ラーニング(FL)は、データ共有なしに病院間での学習を可能にするAI開発のための潜在的経路の1つである。
本研究では,最大かつ多種多様な胸部CTデータセットの1つであるFL戦略について検討した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:38:29 GMT)
Exploring postselection-induced quantum phenomena with
time-bidirectional state formalism [0.9] 時間2方向状態と呼ばれる量子粒子の状態は、反対の時間方向に伝播する2つの粒子の結合状態と等価である。
ポストセレクションや一般化された2状態(密度)ベクトルが存在しない特別な場合において,得られた表現が既知の表現にどのように還元されるかを示す。
我々は,クラウドアクセス可能な雑音量子プロセッサを用いて実現した量子テレポーテーションプロトコルにおいて,量子ビットの時間反転経路を追跡する手法を開発した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:05:26 GMT)
Skip Connections in Spiking Neural Networks: An Analysis of Their Effect
on Network Training [0.9] 従来の人工ニューラルネットワーク(ANN)の代替として、スパイキングニューラルネットワーク(SNN)が注目を集めている。
本稿では,SNNにおけるスキップ接続の影響について検討し,ANNからSNNへのモデル適応を行うハイパーパラメータ最適化手法を提案する。
本研究では,SNNの位置,タイプ,回数を最適化することで,SNNの精度と効率を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:57:32 GMT)
Leveraging hardware-control imperfections for error mitigation via
generalized quantum subspace [0.8] 完全フォールトトレランスのない量子コンピューティングの時代には、量子エラー緩和技術を通じてノイズ効果を抑え、量子デバイスの計算能力を高めることが不可欠である。
最も効果的なノイズ非依存誤差緩和スキームの1つは、一般化量子部分空間展開(GSE)法である。
本稿では,異なるノイズレベルを持つ量子状態のコピーを用いた誤り緩和量子状態を構成するフォールト・サブスペース法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:02:15 GMT)
Variational Approach to Quantum Spin Liquid in a Rydberg Atom Simulator [0.8] このモデルにおけるスピン液体状態のBCS型変動波動関数の研究を報告する。
我々の変動波動関数は、この系における量子スピン液体の単純で直感的な画像を提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:05:19 GMT)
Optimal Hamiltonian simulation for time-periodic systems [0.8] 我々は、Floquetシステムとして知られる時間周期を持つ汎用時間依存システムに対して、最適かつ近似的なハミルトンシミュレーションを確立する。
我々の結果は、凝縮物質物理学や量子化学における非平衡現象や、量子計算における時間依存性をもたらす量子タスクに光を当てることになる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 06:17:58 GMT)
Multi PILOT: Learned Feasible Multiple Acquisition Trajectories for
Dynamic MRI [0.8] 本研究では,ダイナミックイメージング環境における獲得学習について考察する。
複数のフレーム単位の取得軌跡の協調最適化のためのエンドツーエンドパイプラインを設計する。
より短い取得時間で画像再構成精度を向上した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:49:39 GMT)
Reimagining Application User Interface (UI) Design using Deep Learning
Methods: Challenges and Opportunities [0.8] この調査は、ユーザインターフェースアプリケーションの設計に広く使用されている、よく知られたディープラーニング技術とデータセットを含んでいる。
ユーザインタフェース設計自動化タスクにおけるディープラーニングの利用は、ソフトウェア開発産業の進歩の潜在的な分野の1つだと考えています。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:59:56 GMT)
Online search is more likely to lead students to validate true news than
to refute false ones [0.7] この研究は、若者が偽情報をどのように認識し、扱うかを理解することに焦点を当てている。
261名の学生を対象に実験を行い,6つのニュース項目について紹介した。
以上の結果から,オンライン検索は偽ニュースを否定するよりも,学生に真ニュースを検証させる傾向が示唆された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:43:32 GMT)
Interacting Particle Langevin Algorithm for Maximum Marginal Likelihood
Estimation [0.6] 本稿では,潜在変数モデルのパラメータを最適化する限界最大推定法 (MLE) を実装した相互作用粒子系のクラスについて検討する。
粒子系の粒子数, アルゴリズムの繰り返し数, 時間離散化解析のためのステップサイズパラメータの観点から, 最大限界確率推定器の有界誤差に対する漸近濃度を証明した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:50:08 GMT)
Revocation and Reconstruction of Shared Quantum Secrets [0.6] 既存のプロトコルでは、ディーラーが株式保有者がすべて半正直であることを知ったら、秘密を取り戻せる手段はない。
この作業では、半正直で不正ではない株主を明示的に扱います。
我々のプロトコルは、最悪の状況で秘密を取り戻そうという戦略を設計することで、この問題の解決に大きな進歩をもたらします。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:57:05 GMT)
Partially Fault-tolerant Quantum Computing Architecture with
Error-corrected Clifford Gates and Space-time Efficient Analog Rotations [0.6] NISQとFTQCのギャップを埋めるための量子コンピューティングアーキテクチャを提案する。
初期のFTQCデバイスでは、約1.72ドル 107ドル クリフォード演算と3.75ドル 104ドル 任意の回転を64個の論理量子ビット上で行うことができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:21:41 GMT)
Tailoring potentials by simulation-aided design of gate layouts for spin
qubit applications [0.4] スピン量子ビットデバイスのゲートは、通常、以前の成功したデバイスから適応される。
本稿では、新しいスピン量子ビットデバイスレイアウトを静電気的にモデル化するための一般的な手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:36:32 GMT)
GPTs are GPTs: An Early Look at the Labor Market Impact Potential of
Large Language Models [0.4] 米国労働市場における大規模言語モデル(LLM)の可能性について検討する。
調査の結果、米国の労働力の約80%が、少なくとも10%の作業タスクに影響を及ぼす可能性があることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 21:54:09 GMT)
Learning Subgrid-scale Models with Neural Ordinary Differential
Equations [0.4] 偏微分方程式(PDE)をシミュレートする際のサブグリッドスケールモデル学習のための新しい手法を提案する。
このアプローチでは、ニューラルネットワークは粗大から細小のグリッドマップを学習するために使用され、これはサブグリッドスケールのパラメータ化と見なすことができる。
提案手法はNODEの利点を継承し,サブグリッドスケールのパラメータ化,近似結合演算子,低次解法の効率向上に利用することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:53:13 GMT)
Universal and ultrafast quantum computation based on
free-electron-polariton blockade [0.3] 空飛ぶクビットとして働く自由荷電粒子である空洞QEDに新しい要素を導入する。
我々は,超高速,決定論的,普遍的な離散変数量子計算が可能であることを実証した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:55:11 GMT)
Quantum Circuit Components for Cognitive Decision-Making [0.1] 本稿では、量子コンピュータ上の回路として、人間の意思決定の古典的でないモデルがうまく動作できることを実証する。
この主張は、人間の脳が量子ビットと量子回路を明示的に用いているのではなく、量子認知と量子コンピューティングの間で共有された数学が、量子コンピュータの探索を動機付けているというものである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 19:55:55 GMT)
Unravelling the dynamics of entanglement in a non-Markovian bath [0.1] 分離可能な状態から始まるキュービット共起のダイナミクスについて検討する。
我々は、クビット鎖結合の強さに依存する3つの関連するレギュレーションを同定する。
本研究では,オープンシステムの量子コヒーレントダイナミクスを実現する環境の資源を明らかにする。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:38:47 GMT)
Vortices in dipolar Bose-Einstein condensates [0.0] 量子化された渦は超流動の目印であり、新しい超流動系における最初の観測可能な特徴である。
平均場外効果が安定性に欠かせない3次元双極子系における渦特性について, 徹底的に検討した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:43:25 GMT)
Universal Linear Intensity Transformations Using Spatially-Incoherent
Diffractive Processors [0.0] 空間的不整合光の下では、微分光学ネットワークは任意の複素値線形変換を行うように設計されている。
空間的非コヒーレントな拡散ネットワークは任意の線形強度変換を全光的に行うことができることを数値的に示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 04:51:01 GMT)
Une comparaison des algorithmes d'apprentissage pour la survie avec
donn\'ees manquantes [0.0] いずれの場合も,1つの計算方法が他の方法よりも優れていることは明らかである。
提案手法は、他の欠落したデータパターンや生存モデルを比較するのに利用できる。
Pythonコードはパッケージサバイバルシムを通じてアクセス可能である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:10:06 GMT)
Typical Macroscopic Long-Time Behavior for Random Hamiltonians [0.0] 一元的に進化する純粋状態$psi_t$のマクロ量子系を考える。
我々は特に、$H$ の固有ベクトルがこの基底で非局在化されていることを悪用する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:18:28 GMT)
Text Semantics to Image Generation: A method of building facades design
base on Stable Diffusion model [0.0] 本研究では,マルチネットワーク合成によるファサード画像生成手法を提案する。
LoRAアプローチを用いて,CMP Fa-cadesデータセット上で安定拡散モデルを微調整した。
ControlNetモデルの追加により、ファサードイメージを構築するためのテキスト生成の制御性が向上する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:20:55 GMT)
Surrogate-based optimization for variational quantum algorithms [0.0] 変分量子アルゴリズム(英: Variational quantum algorithm)は、短期量子コンピュータで使用される技術の一種である。
実験的な測定をほとんど行わない変分回路のサロゲートモデルの学習について紹介する。
次に、元のデータとは対照的に、これらのモデルを用いてパラメータ最適化を行う。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:26:38 GMT)
Student Engagement Detection Using Emotion Analysis, Eye Tracking and
Head Movement with Machine Learning [0.0] 学生のエンゲージメントレベルを検出するシステムを提案する。
ノートパソコンに内蔵されている一般的なウェブカメラが提供する情報のみを使用する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:43:29 GMT)
Spatial and temporal characteristics of spontaneous parametric
down-conversion with varying focal planes of interacting beams [0.0] 自然パラメトリックダウンコンバージョン(SPDC)は、絡み合った光子対を作るために広く用いられるプロセスである。
検出モードと比較してポンプビームの正確な焦点面位置は実実験では決定が難しい。
本研究では、焦点面の変動位置を考察し、焦点面の変化が光子対の空間的および時間的特性に与える影響について考察する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:09:46 GMT)
Severity classification of ground-glass opacity via 2-D convolutional
neural network and lung CT scans: a 3-day exploration [0.0] 本稿では、3日間にわたって実装およびテストされた概念実証フレームワークの実験結果を示す。
AI-Enabled Medical Image Analysis Workshop of the 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023) で開催されている「COVID-19コンペティション」という第3の挑戦によって推進された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 22:35:37 GMT)
Scaled Quantization for the Vision Transformer [0.0] 少数のビットを使用した量子化は、ディープニューラルネットワークにおけるレイテンシとメモリ使用量の削減を約束している。
本稿では、中間浮動小数点演算を必要とせずに、視覚変換器ネットワークの完全整数量子化のためのロバストな手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:31:21 GMT)
SLD Fisher information for kinetic uncertainty relations [0.0] オープン量子系の運動的不確実性関係(KUR)に対する対称対数微分(SLD)フィッシャー情報について検討する。
SLD Fisher 情報は Mandelstam-Tamm 関係に基づいて速度限界に現れる。
ジャンプ作用素がハミルトニアン系の固有状態を接続すると、バーズ角が短時間で力学活性の平方根によって上界であることが示される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:39:19 GMT)
Return of the RNN: Residual Recurrent Networks for Invertible Sentence
Embeddings [0.0] 本研究では、教師なし符号化タスクで訓練された残効再帰ネットワークを用いて、非可逆文埋め込みのための新しいモデルを提案する。
ニューラルネットワーク翻訳モデルに共通する確率的出力ではなく、回帰に基づく出力層を用いて入力シーケンスのワードベクトルを再構成する。
RNNはLSTMや2次最適化法などのメモリユニットを必要とすることを考えると、このモデルはADAMによる高精度かつ高速なトレーニングを実現している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:59:06 GMT)
Relativistic quantum communication between harmonic oscillator detectors [0.0] 検出器とフィールドの相互作用が切替された後、古典的な容量の時間における進化について検討する。
古典的メッセージの通信を最適化するパラメータの有限値を求める。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:29:15 GMT)
RLOR: A Flexible Framework of Deep Reinforcement Learning for Operation
Research [0.0] 本稿では, 深層強化学習のための柔軟なフレームワークであるRLORを紹介する。
車両経路問題に対するエンドツーエンドの自己回帰モデルの解析を行い、これらのモデルが近年の強化学習の進歩の恩恵を受けることを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:07:30 GMT)
Quantum search in a non-Markovian environment [0.0] この論文は、オープン量子系の力学における「記憶を持つノイズ」の効果と起源を探求する。
マルコフ相関雑音は時間相関のない雑音よりもアルゴリズムの効率を高めることができることを示す。
開放系のノイズ進化を正確に再現する「衝突モデル」が構築されている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:17:42 GMT)
Quantum rotation sensor with real-time readout based on an atom-cavity
system [0.0] 我々は、回転中性原子の有効ゲージ位相と超放射相遷移を組み合わせて、高感度で高速な量子回転センサを構築することを提案する。
ボース=アインシュタイン凝縮体のよく制御された配列の原子は、光学キャビティの単一の光モードに結合される。
キャビティからの光子放射は、慣性航法に欠かせない回転周波数の変化を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:42:05 GMT)
Quantum Dot Source-Drain Transport Response at Microwave Frequencies [0.0] 我々は、オンチップコプレーナー導波路共振器を用いて、2つの量子ドットの6GHzの周波数でソース・ドレイン輸送応答を測定する。
大きなトンネル結合の場合、応答はランダウアー・B・ウーティカー理論に従って低周波伝導によって制御される。
より小さな結合では、高周波応答が低周波限界から逸脱する2つの状態を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 05:38:05 GMT)
Quantized relativistic time-of-arrival operators for spin-0 particles
and the quantum tunneling time problem [0.0] その結果, 相対論的スピン-0粒子のトンネル時間は, バリア高さ$V_o$が残りの質量エネルギーよりも低い条件下で瞬時であることがわかった。
これは、瞬時トンネルが到着時間の文脈で固有の量子効果であることを意味する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:39:47 GMT)
Probing dressed states and quantum nonlinearities in a strongly coupled
three-qubit waveguide system under optical pumping [0.0] 光ポンピングにおける3ビット導波路システムについて検討する。
ミラー量子ビットの相対減衰率を変化させることで、リッチ非線形スペクトルがどのように得られるかを示す。
また、励起三量子系は、強い結合状態において、非線形状態に入ると、Jaynes-Cummingsモデルから大きく逸脱することを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:23:18 GMT)
Predicting the performance of hybrid ventilation in buildings using a
multivariate attention-based biLSTM Encoder-Decoder neural network [0.0] 本稿では,窓の開閉時の室内空気温度を予測するディープニューラルネットワーク(DNN)の機能について検討する。
その結果,DNNは窓の開閉時に5つのゾーンの室内空気温度を正確に予測できることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:45:10 GMT)
Photonic entanglement during a zero-g flight [0.0] パラボリック飛行中のベル実験では,微小重力から1.8gの超重力へ遷移した。
Bell-CHSHパラメータが$S=-2.6202$と$2.7323$の間で、平均は$overlineS = -2.680$、平均標準偏差は$overlineDeltaS = 0.014$である。
この実験は共に、宇宙ベースアプリケーションにおける現在の量子通信プラットフォームの安定性を実証し、非慣性運動と量子情報の相互作用をテストするための重要な基準点を追加する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:31:55 GMT)
Performance Analysis and Evaluation of Cloud Vision Emotion APIs [0.0] 顔の感情の980イメージの公開データセットを用いて、よく知られた2つのAPIのパフォーマンスを比較した。
その結果,各感情の予測精度はクラウドサービスによって異なることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:47:43 GMT)
Patch of Invisibility: Naturalistic Black-Box Adversarial Attacks on
Object Detectors [0.0] 近年,ディープラーニングモデルに対する敵対的攻撃が注目されている。
本研究では,GAN (Pretrained Generative Adversarial Network) の学習画像多様体を用いて,物体検出器の自然な物理的逆襲パッチを生成する勾配のない手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:49:30 GMT)
Particle track reconstruction with noisy intermediate-scale quantum
computers [0.0] 荷電粒子の軌道の再構成は、現在および将来のコライダー実験における重要な計算課題である。
この問題は2次非制約バイナリ最適化(QUBO)として定式化することができ、変分量子固有解法(VQE)アルゴリズムを用いて解かれる。
この研究は、VQEが粒子追跡に使用できるという原理の証明となり、VQEの最適化にもっと適するように、VQEの修正を調査した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:29:20 GMT)
Optimizing QAOA on Bipotent Architectures [0.0] 本稿では,二元量子アーキテクチャにおけるハードウェアレベルとアルゴリズムレベルの改善のトレードオフについて検討する。
その結果、パルスレベルの最適化の利点は、鮮やかに最適化されたモノリシックゲートによる改善よりも優れていることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 08:57:06 GMT)
Optimal and tight Bell inequalities for state-independent contextuality
sets [0.0] 非局所性と文脈性という2つの基本的な量子資源はベルの不等式を通して接続することができる。
既存のベルの不等式に対して、SI-C集合が生成する非局所性はノイズに非常に敏感である。
いずれの場合も、非局所性は実験に十分耐性があることが示される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:16:50 GMT)
On the stability of solutions to Schr\"{o}dinger's equation short of the
adiabatic limit [0.0] 我々は、断熱極限より短い時間スケールで適用される断熱定理を証明した。
摂動のクロスサブスペース効果を特徴付けるが、これは典型的には摂動の作用素ノルムによって示唆されるよりもはるかに少ない。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:47:05 GMT)
On the exact quantum query complexity of $\text{MOD}_m^n$ and
$\text{EXACT}_{k,l}^n$ [0.0] 我々は、$textMOD_mn$を計算するための正確な量子アルゴリズムを示す。
我々は、0,1n$ を有限集合 $X$ が$n$ 未満であるような対称関数の広いクラスの正確な量子クエリ複雑性を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:59:43 GMT)
Non-asymptotic analysis of Langevin-type Monte Carlo algorithms [0.0] 我々は、ギブズ分布に対するランゲヴィン型アルゴリズムについて、ポテンシャルが散逸し、その弱勾配が連続性の有限モジュラーを持つように研究する。
我々の主な結果は、ギブス分布と一般ランゲヴィン型アルゴリズムの法則の間の2-ワッサーシュタイン距離の漸近上界である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:27:36 GMT)
Non-Local Multi-Qubit Quantum Gates via a Driven Cavity [0.0] 共振器モードに結合した量子ビット上に非局所的マルチキュービット量子ゲートを実装するための2つのプロトコルを提案する。
プロトコルはキャビティモードの古典的なドライブのみに依存し、キュービットの外部ドライブは不要である。
我々は、光学的およびマイクロ波的空洞に結合した原子および分子量子ビットのゲート忠実度と持続時間の推定を行う。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:30:42 GMT)
Noise impact on recurrent neural network with linear activation function [0.0] エコー状態ネットワーク(ESN)の例に基づく繰り返しANNにおける内部雑音伝搬の特異性について検討する。
ここでは、人工ニューロンが傾斜係数の異なる線形活性化関数を持つ場合について考察する。
ESN出力信号の分散と信号-雑音比の一般的な見方は1つのニューロンに類似していることが判明した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:43:05 GMT)
Multi-view object pose estimation from correspondence distributions and
epipolar geometry [0.0] 本稿では,学習した2D-3D分布を,初期推定と任意修正の両方のために複数の視点から集約する多視点ポーズ推定手法を提案する。
提案手法は,最も優れた単一視点法と比較して,ポーズ推定誤差を80~91%削減する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:02:42 GMT)
More assistance of entanglement, less rounds of classical communication [0.0] 円数と純二分項直交量子状態の局所的識別の関係を示す。
識別タスクに必要なLOCCラウンドの数は、絡み合い支援の量に依存する可能性があることを示すことができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:09:18 GMT)
Mid-circuit measurements on a neutral atom quantum processor [0.0] 保護された超微粒子-ゼーマン準状態におけるデータ量子ビットのシェルビングによる中性原子配列の中間回路計測を実演する。
測定時のアンシラのマイクロ波ポンピングにより測定精度が向上した。
本稿では、この手法を4重極再帰法とマイクロ波ベースの量子状態リセットを用いた繰り返し量子誤り訂正に拡張することについて議論する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:22:32 GMT)
Meson Instability of Quantum Many-body Scars in a 1D Lattice Gauge
Theory [0.0] 1D$mathbbZ$格子ゲージ理論の量子多体散乱における中間子励起の安定性について検討する。
我々の結果は、格子ゲージ理論における量子多体傷の物理学を拡張し、非メソニック状態がエルゴード性破壊を示すことも明らかにした。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:16:34 GMT)
Medical diffusion on a budget: textual inversion for medical image
generation [0.0] テキスト・画像生成のための拡散モデルは非常に人気がある。
それらをスクラッチからトレーニングするには、大きなデータセットと重要な計算リソースにアクセスする必要がある。
本研究は,テキストインバージョンによるテキスト埋め込みをトレーニングすることにより,事前学習した安定拡散モデルが様々な医用画像モダリティに適応できることを実証する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:50:19 GMT)
Majorana-Magnon Interactions in Topological Shiba Chains [0.0] 超伝導体表面に堆積した磁気不純物の連鎖は、マヨラナゼロモードをサポートするトポロジカルシババンドを形成することができる。
本稿では、磁気不純物の本質的ダイナミクスを活用して、非局所的文字にアクセスすることを提案する。
このモードは原子の連鎖全体に広がり、基底状態のパリティで印字される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:59:32 GMT)
Lee-Yang theory of Bose-Einstein condensation [0.0] 少数のボソンのエネルギー変動からボース気体の凝縮温度を予測する方法を示す。
100ボソン未満のボソンを用いて、2次元と3次元の高調波ポテンシャルでボース気体の凝縮温度を推定できる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:19:32 GMT)
Learning unidirectional coupling using echo-state network [0.0] エコー状態ネットワークモデルは,システムの時系列データから一方向結合方式を学習させる。
ドライブ-レスポンスシステムのいくつかの例をトレーニングすると、同じ結合を持つ任意のドライバ信号に対して、マシンが応答システムのダイナミクスを予測できることが示される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:18:52 GMT)
Kupczynski's Contextual Locally Causal Probabilistic Models are
constrained by Bell's theorem [0.0] Kupczynski は、ベルの定理は測定器を記述する文脈に依存したパラメータを正しく考慮すれば回避できると主張した。
これは事実ではないことを示す。たとえ彼が示唆しているような文脈性を考慮していても、ベル-CHSHの不等式は導出可能である。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:34:46 GMT)
Investigating the efficiency of the Asian handicap football betting
market with ratings and Bayesian networks [0.0] 本稿では,アジアハンディキャップ・ベッティング市場の効率を予測・評価するために開発された最初のモデルについて述べる。
結果は13のイングランド・プレミアリーグのシーズンに基づいており、伝統的な市場と比較される。
AH市場は従来の市場の非効率性を共有していることがわかったが、この調査結果は興味深い相違点と両者の類似点の両方を明らかにしている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:25:05 GMT)
Interpreting learning in biological neural networks as zero-order
optimization method [0.0] 本研究では,脳を教師あり学習の統計的方法とみなす。
主な貢献は、BNNにおける接続パラメータの局所的な更新規則をゼロ階最適化法に関連付けることである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:28:58 GMT)
Interplay between charge and spin noise in the near-surface theory of
decoherence and relaxation of $C_{3v}$ symmetry qutrit spin-1 centers [0.0] 完全理論は、欠陥の点群対称性によって許されるすべてのハミルトン項を含む、デコヒーレンスと緩和のための形式主義を必要とする。
この形式は、ダイヤモンド、ケイ素、または類似のホストにおけるスピン-1欠陥の対称性の$C_3v$対称性のために提示され、リンドブラッドの力学方程式に依存している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:41:42 GMT)
Interface and electromagnetic effects in the valley splitting of Si
quantum dots [0.0] 電磁界と界面幅がSi/SiGeヘテロ構造における量子ドットの谷分割に及ぼす影響について検討する。
谷分割計算のための有効質量論における新しい3次元理論モデルを提案する。
上述のスピン量子ビットの最良の選択肢は、可能な限り広義のインタフェースを考えることである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:30:53 GMT)
Improvement of Color Image Analysis Using a New Hybrid Face Recognition
Algorithm based on Discrete Wavelets and Chebyshev Polynomials [0.0] この研究は、第2種と第3種のチェビシェフ進化から作られた、または派生した離散ウェーブレットの使用に特有である。
カラー画像の解析には、フィルタ離散第3チェビシェフウェーブレット変換(FDTCWT)を用いる。
最良の結果は正確さと最小限の時間で達成された。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:20:19 GMT)
How to determine the local unitary equivalence of sets of generalized
Bell states in $\mathbb{C}^{p^\alpha}\otimes \mathbb{C}^{p^\alpha}$ [0.0] 局所ユニタリ同値 (LU-equivalence) は効果的な分類ツールである。
二部量子系における一般化ベル状態(GBS)の集合のLU等価性を決定する方法を示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:39:46 GMT)
High Fidelity Image Synthesis With Deep VAEs In Latent Space [0.0] 階層的変動オートエンコーダ(VAE)を用いた高解像度マルチモーダルデータセットに高速でリアルな画像生成を提案する。
この2段階のセットアップでは、オートエンコーダがイメージをセマンティックな特徴に圧縮し、深いVAEでモデル化する。
我々は、BigGANに匹敵するImageNet-256データセット上で、FID9.34を達成する2段階アプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 23:45:19 GMT)
Hayden-Preskill Recovery in Hamiltonian Systems [0.0] 情報スクランブル(Information scrambling)とは、システム全体に分散し、小さなサブシステムからアクセス可能な局所的な情報を指す。
本稿では,Sachdev-Ye-Kitaev(SYK)モデルやカオススピン鎖など,時間に依存しないハミルトン系の情報回復について検討する。
これは情報スクランブルと量子カオスの違いを強調し、情報回復を新しい複雑な量子力学の顕在化のための完全に動作するプローブとして提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:08:12 GMT)
HAC-Net: A Hybrid Attention-Based Convolutional Neural Network for
Highly Accurate Protein-Ligand Binding Affinity Prediction [0.0] 本稿では,3次元畳み込みニューラルネットワークと2つのグラフ畳み込みニューラルネットワークからなる新しいディープラーニングアーキテクチャを提案する。
HAC-NetはPDBbind v.2016コアセットの最先端結果を取得する。
我々は,このモデルを,構造に基づく生体分子特性予測に関連する幅広い教師付き学習問題に拡張できると考えている。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 01:07:14 GMT)
Global quantum discord and von Neumann entropy in multipartite two-level
atomic systems [0.0] このようなシステムにおいて、量子相関と量子絡み合いが時間とともにどのように進化するかを探索してきた。
グローバル量子不協和とフォン・ノイマンエントロピーは系の力学において互いに線形な振る舞いを示す。
システム上の大きな光子数の結果を外挿した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:08:37 GMT)
Generalization with quantum geometry for learning unitaries [0.0] 一般化とは、トレーニングデータから学習することで、新しいデータに対して正確な予測を行う量子機械学習モデルの能力である。
モデルが一般化できる時期を決定するために、DQFIM(Data Quantum Fisher Information Metrics)を導入する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:32:20 GMT)
Fundamental properties of beam-splitters in classical and quantum optics [0.0] ビームスプリッターは、入射光子を2つの可能な方向のいずれかに送信する(複素値の)確率振幅を有する。
古典光学および量子光学の基本法則を用いて、これらの確率振幅の大きさと位相の間の一般的な関係を求める。
ファインマン法(Feynman method)の簡単な応用は、よく知られた公式で暗黙的にボース拡張を正当化する形式を提供する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 22:45:32 GMT)
Free-electron interactions with photonic GKP states: universal control
and quantum error correction [0.0] 自由電子と光子のコヒーレント相互作用は、ゴッテマン・キタエフ・プレスキル量子ビットの形で連続可変フォトニック量子状態の普遍的な制御に利用できる。
電子エネルギーコムはフォトニック状態の非破壊的な測定を可能にし、任意のゲートを誘導することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 13:21:04 GMT)
Forecast-Aware Model Driven LSTM [0.0] 粗悪な空気質は人間の健康に大きな影響を及ぼす可能性がある。
モデルバイアスを補正するために使われる伝統的な手法は、線形性や基礎となる分布について仮定する。
ディープラーニングは、極端な空気質のイベントが存在する場合に、空気質の予測を約束する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:03:07 GMT)
Fiber-coupled Diamond Magnetometry with an Unshielded 30
pT/$\sqrt{\textrm{Hz}}$ Sensitivity [0.0] ファイバカップリング型NVC磁力計の感度は (30$pm$10) pT/$sqrttextrmHz$ (10 - 500)-Hz である。
この感度は、比較的高い緑から赤への光子変換効率、[100]バイアス場アライメント、マイクロ波およびロックイン増幅器(LIA)パラメータ最適化、およびバランスの取れた超微細励起スキームによって実現される。
磁力計は、真空ポンプのような源からの信号を最大2m離れたところで検出することができる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:47:50 GMT)
Fermionic one-body entanglement as a thermodynamic resource [0.0] 2モードのフェルミオン状態の絡み合いは、オープンシステム熱力学プロセスにおける真の量子資源として利用できることを示す。
したがって、量子熱力学はフェルミオンの絡み合いの性質とそれを定義するために使われる異なる概念の操作的意味に光を放つことができることを示した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:33:28 GMT)
Extracting real estate values of rental apartment floor plans using
graph convolutional networks [0.0] アクセスグラフのためのグラフ畳み込みネットワーク(GCN)を実装し,アクセスグラフの不動産価値をフロアプラン値として推定するモデルを提案する。
その結果,提案手法は従来のモデルと比較して家賃推定の精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:38:34 GMT)
Extended High Utility Pattern Mining: An Answer Set Programming Based
Framework and Applications [0.0] ASPのようなルールベースの言語は、パターンユーティリティを評価するためのユーザが提供する基準を指定するのに適しているようだ。
本稿では,従来の文献では考慮されていない実用基準の新たなクラスを実現するためのフレームワークを提案する。
新型コロナウイルス患者のICU入院を予測するための革新的な方法の定義のために,ビルディングブロックとして活用する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:42:57 GMT)
Experimental implementation of the optical fractional Fourier transform
in the time-frequency domain [0.0] 原子量子光メモリシステムを用いた時間周波数領域における分数フーリエ変換の実験的実現について述べる。
FrFTは, ショットノイズ制限ホモダイン検出器を用いて測定した時間周期ウィグナー関数の解析により検証した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:39:52 GMT)
Examining Cashless Payment Services in a Post-Pandemic Environment [0.0] 多くの企業は緊急健康規定に従うために無接触注文と無現金支払い政策を採用した。
2023年5月、国民と公衆の健康上の緊急事態宣言が期限切れになっているにもかかわらず、キャッシュレス決済サービスは成長を続けている。
デザイナーや政策立案者は、キャッシュレス決済サービスの社会経済的政治に対処しなければならない。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 00:29:04 GMT)
Entropy-Area Law from Interior Semi-classical Degrees of Freedom [0.0] 我々は、内部に一様に存在する、最大重力を持つ多くの半古典的自由度からなる球形静的重力境界状態を考える。
我々は、任意の自由度に対して、エントロピーがベケンシュタイン・ホーキングの公式に従うように、自己一貫性のある内部計量を構築する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:55:41 GMT)
Entanglement Trajectory and its Boundary [0.0] 量子コンピューティングから生じる絡み合いを調べるための新しいアプローチを提供する。
我々は支配的固有値を表し、グラフ上のフォン・ノイマンエントロピーは「絡み道」を形成する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:01:02 GMT)
Enriching Neural Network Training Dataset to Improve Worst-Case
Performance Guarantees [0.0] トレーニング中にNNトレーニングデータセットを適用することで、NNのパフォーマンスが向上し、最悪の場合の違反を大幅に低減できることを示す。
本稿では、最悪のケース違反を低減し、最悪のケース性能保証を改善したニューラルネットワークを提供するために、トレーニングデータセットを重要なデータポイントで識別し、強化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:59:37 GMT)
Enhancement of theColor Image Compression Using a New Algorithm based on
Discrete Hermite Wavelet Transform [0.0] 画像ビットを削減し、圧縮形式でデータを表現するためには、新しいアルゴリズムが必要である。
画像圧縮は、大きなファイルや画像を転送するための重要なアプリケーションである。
離散ヘルミットウェーブレット変換(DHWT)に基づく新しいアルゴリズム
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:11:41 GMT)
Effective description of a suspended mirror coupled to cavity light
-Limitations of Q-enhancement due to normal mode splitting by an optical
spring- [0.0] 我々は、ビーム(吊り鏡、振り子)と光ばねを用いて吊り下げられたシリンダーとからなり、通常のモード分割を考慮したシステムを分析する。
本分析により, リアル振り子システムのための光ばねを用いて, 低散布(高品質)を達成できることが判明した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 14:10:27 GMT)
Detecting Bell correlations in multipartite non-Gaussian spin states [0.0] 少体相関器を含む多変量不変ベル不等式(PIBI)を導入する。
既知の不等式と比較すると、これらは高いノイズロバスト、または非ガウススピン状態におけるベル相関を検出する能力を示す。
我々は、この探索問題を、所望の形式のPIBIを探すのに必要な制約を埋め込んだ半定プログラムとして定式化する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 17:57:05 GMT)
Delay Mitigation in Air Traffic Flow Management [0.0] 本研究では,最適なバッファ時間を生成するために,遅延コストとフライトバッファモデルを提案する。
目的は、ATFMの遅延を軽減し、利害関係者の福祉を増大させる最適な公平かつ効率的なバッファ選択を得ることである。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 11:34:16 GMT)
Defining Quality Requirements for a Trustworthy AI Wildflower Monitoring
Platform [0.0] プロダクション対応のAIシステムは、高品質な信頼性を持つ必要がある。
本稿では,野生の花をモニタリングする深層学習プラットフォームである実生ケーススタディに,そのような品質モデルを適用した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 10:06:18 GMT)
Deep Generative Multi-Agent Imitation Model as a Computational Benchmark
for Evaluating Human Performance in Complex Interactive Tasks: A Case Study
in Football [0.0] 本研究では,大人数選手と球追跡データセットに基づいて,条件付き変動リカレントニューラルネットワーク(VRNN)モデルに基づく生成モデルを訓練する。
トレーニング済みのConditional VRNN Modelは、チームのパフォーマンスを評価するベンチマークとして使用される。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:01:52 GMT)
Bridging closed and dissipative discrete time crystals in spin systems
with infinite-range interactions [0.0] 位相図を、ゼロから無限強度まで、様々な散逸強度にマップアウトする。
閉系と散逸系の両方において時間結晶相のシグネチャが見つかる。
スピンの数と相互作用強度に関して、有限サイズの挙動と時間結晶の寿命のスケーリングを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:15:26 GMT)
Beyond transcoherent states: Field states for effecting optimal coherent
rotations on single or multiple qubits [0.0] 我々は、原子が基底あるいは励起状態からブロッホ球上の任意の点へ、残留原子場絡みを伴わずに変換する場状態を導入する。
角度$theta$による回転を行うための最良の強いパルスは、$rmsinctheta$の係数で光子数分散で圧縮される。
我々はこれらの研究を複数の原子と同時に相互作用する場にまで拡張し、同時に$tfracpi2$の数値が全ての原子上で$tfracpi2$のパルスを実行するのに最適であることを再び発見した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:25:29 GMT)
Average entanglement entropy of midspectrum eigenstates of
quantum-chaotic interacting Hamiltonians [0.0] 負の$O(1)$項の大きさは、ランダムな純粋状態に対して予測されるものよりもわずかに大きい。
スペクトルの中央では、負の$O(1)$項の大きさがランダムな純粋状態の予測値よりもわずかに大きいことを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:00:02 GMT)
Automatic hermiticity for mixed states [0.0] 同様の機構は密度行列を導入することで混合状態に対しても有効であることを示す。
特に後者では、初期時刻の過去状態が$T_A$だけでなく、最終時刻の将来の状態が$T_B$である場合、いくつかの候補を調査する。
我々は、現在$I_Q$で定義されるスキュー密度行列が、大きめの$T_B-t$と大きめの$T-T_A$に対して$t$と定義されており、これは過去の状態のアンサンブルのみからなる別の密度行列とほぼ一致すると主張している。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 12:35:51 GMT)
An embedding for EEG signals learned using a triplet loss [0.0] 脳-コンピュータインタフェース(BCI)では、デコードされた脳状態情報を最小の時間遅延で使用することができる。
このようなデコードタスクの課題は、小さなデータセットサイズによって引き起こされる。
神経生理学的データのための新しいドメイン特異的埋め込みを提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 09:05:20 GMT)
Almost Sure Convergence of Dropout Algorithms for Neural Networks [0.0] 我々は、Dropout(on et al., 2012)にインスパイアされたニューラルネットワーク(NN)の乗算学習アルゴリズムの収束と速度について検討する。
本稿では,完全連結定常NNに対して,有意な有界なアクティベーション関数を持つ確率論的証明を提案する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 15:13:14 GMT)
All this for one qubit? Bounds on local circuit cutting schemes [0.0] 局所的に作用する回路切断方式は,回路の残りの部分から1量子ビットでも効率的に分割可能であることを示す。
また、各回路切断方式は、単位チャネルのみを適用するだけでは機能しないことを示す。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:44:38 GMT)
Adversarial Robustness and Feature Impact Analysis for Driver Drowsiness
Detection [0.0] 眠気運転は道路事故の主要な原因であるが、ドライバーは疲労が反応時間に与える影響を否定している。
障害が発生する前に眠気を検出するには、機械学習(ML)を使用して心拍変動(HRV)信号を監視するという、有望な戦略がある。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 20:13:44 GMT)
A hierarchy of thermal processes collapses under catalysis [0.0] 熱浴のリサイクルにより, 連続した基本熱操作に熱操作を分解できることを示す。
このようなスキームは、基本的な熱操作の触媒バージョンと等価である。
異なる熱過程の階層構造が熱操作の階層構造に収束することを証明する。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 03:59:06 GMT)
A distribution testing oracle separation between QMA and QCMA [0.0] 量子複雑性理論において、$textitnon-deterministic$ 量子計算の定義が量子証人を必要とするかどうかという長い議論である。
本稿では,各計算複雑性クラスを分離したランダム化された古典オラクルを構築することにより,この問題を進展させる。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:48:09 GMT)
A biological sequence comparison algorithm using quantum computers [0.0] 本稿では,2つのゲノム配列間の類似性を量子コンピュータ上に表示し,解析する手法を提案する。
量子コンピュータ上での視覚の人間の知覚と画像のピクセル表現に触発され、これらの技術を利用してペアワイズシーケンス解析を実装した。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 18:45:56 GMT)
A Quantum Theory with Non-collapsing Measurements [0.0] 量子論の崩壊のないバージョンは、射影仮説の役割を研究するために導入された。
我々は、測定結果がまだ確率的に起こる間、量子状態を更新しない「パッシブ」測定を仮定する。
結果として生じる量子的理論は、一つの種類の力学、すなわちユニタリ進化しか持たない。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 16:32:29 GMT)
A Novel Patent Similarity Measurement Methodology: Semantic Distance and
Technological Distance [0.0] 本稿では,特許間の類似性を測定するためのハイブリッド手法を提案する。
BERTを用いて特許文書に基づいて意味的類似度を測定し,Jaccardの類似度を用いてIPCコードとの技術的類似度を計算し,2つの類似度に重みを割り当ててハイブリダイゼーションを行う。
論文参考訳(メタデータ) (Thu, 23 Mar 2023 07:55:31 GMT)