Generalizing Few-Shot NAS with Gradient Matching [165.6] One-Shotメソッドは、1つのスーパーネットをトレーニングし、ウェイトシェアリングを通じて検索空間内の全てのアーキテクチャのパフォーマンスを近似する。
Few-Shot NASは、One-Shotスーパーネットを複数のサブスーパーネットに分割することで、ウェイトシェアリングのレベルを下げる。
Few-Shotよりも優れており、派生したアーキテクチャの精度という点では、従来の同等の手法をはるかに上回っている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:06:16 GMT)
LinkBERT: Pretraining Language Models with Document Links [151.6] 言語モデル(LM)事前学習はテキストコーパスから様々な知識を学習し、下流のタスクを支援する。
本稿では,文書間のリンク,例えばハイパーリンクを利用するLM事前学習手法であるLinkBERTを提案する。
LinkBERTは、2つのドメインにわたる様々な下流タスクにおいてBERTよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:01:24 GMT)
ObjectFormer for Image Manipulation Detection and Localization [118.9] 画像操作の検出とローカライズを行うObjectFormerを提案する。
画像の高周波特徴を抽出し,マルチモーダルパッチの埋め込みとしてRGB特徴と組み合わせる。
各種データセットについて広範な実験を行い,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 23:58:10 GMT)
Robust Optimization as Data Augmentation for Large-scale Graphs [117.2] 学習中に勾配に基づく逆方向摂動を伴うノード特徴を反復的に拡張するFLAG(Free Large-scale Adversarial Augmentation on Graphs)を提案する。
FLAGはグラフデータに対する汎用的なアプローチであり、ノード分類、リンク予測、グラフ分類タスクで普遍的に機能する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:06:47 GMT)
Audio-Adaptive Activity Recognition Across Video Domains [112.5] ドメイン間のばらつきが少なく、どのアクティビティが起こっていないかを確実に示すことができるので、ドメイン適応のためにアクティビティサウンドを活用します。
視覚特徴表現を識別的に調整するオーディオ適応型エンコーダと学習方法を提案する。
また、アクターシフトという新たなタスクを対応するオーディオ・ビジュアル・データセットで導入し、アクターの出現が劇的に変化する状況において、我々の手法に挑戦する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:03:19 GMT)
Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.1] 本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:46:59 GMT)
PoseTriplet: Co-evolving 3D Human Pose Estimation, Imitation, and
Hallucination under Self-supervision [102.5] 既存の自己監督型3次元ポーズ推定スキームは、学習を導くための弱い監督に大きく依存している。
そこで我々は,2D-3Dのポーズペアを明示的に生成し,監督を増強する,新しい自己監督手法を提案する。
これは、ポーズ推定器とポーズ幻覚器を併用して学習する強化学習ベースの模倣器を導入することで可能となる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:45:53 GMT)
Cross-Modality High-Frequency Transformer for MR Image Super-Resolution [100.5] 我々はTransformerベースのMR画像超解像フレームワークを構築するための初期の取り組みを構築した。
我々は、高周波構造とモード間コンテキストを含む2つの領域先行について考察する。
我々は,Cross-modality High- frequency Transformer (Cohf-T)と呼ばれる新しいTransformerアーキテクチャを構築し,低解像度画像の超解像化を実現する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:56:55 GMT)
EnvEdit: Environment Editing for Vision-and-Language Navigation [98.3] Vision-and-Language Navigation (VLN)では、エージェントは自然言語命令に基づいて環境をナビゲートする必要がある。
本研究では,既存の環境を編集して新しい環境を作成するデータ拡張手法であるEnvEditを提案する。
提案手法は,事前学習および未学習のVLNエージェントにおいて,すべての指標において有意な改善が得られたことを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:44:32 GMT)
Image Animation with Perturbed Masks [95.9] 我々は,同じタイプのオブジェクトを描画する駆動ビデオにより,ソースイメージの画像アニメーションのための新しいアプローチを提案する。
我々はポーズモデルの存在を前提とせず、オブジェクトの構造を知ることなく任意のオブジェクトをアニメーション化することができる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:30:26 GMT)
Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.6] 画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:11:04 GMT)
Zero-Query Transfer Attacks on Context-Aware Object Detectors [95.2] 敵は、ディープニューラルネットワークが誤った分類結果を生成するような摂動画像を攻撃する。
自然の多目的シーンに対する敵対的攻撃を防御するための有望なアプローチは、文脈整合性チェックを課すことである。
本稿では,コンテキスト整合性チェックを回避可能な,コンテキスト整合性攻撃を生成するための最初のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:33:06 GMT)
Long-term Video Frame Interpolation via Feature Propagation [95.2] ビデオフレーム(VFI)は、まず入力間の動きを推定し、次に推定された動きで入力を目標時間にワープすることで、中間フレーム(s)を予測する。
入力シーケンス間の時間的距離が増加すると、このアプローチは最適ではない。
本稿では,従来の特徴レベルの予測を新しいモーション・トゥ・フェース・アプローチで拡張した伝搬ネットワーク(PNet)を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:47:06 GMT)
Disentangled3D: Learning a 3D Generative Model with Disentangled
Geometry and Appearance from Monocular Images [94.5] 最先端の3D生成モデルは、合成に神経的な3Dボリューム表現を使用するGANである。
本稿では,単分子観察だけで物体の絡み合ったモデルを学ぶことができる3D GANを設計する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:03:18 GMT)
In-N-Out Generative Learning for Dense Unsupervised Video Segmentation [89.2] 本稿では,ラベルなしビデオから視覚的対応を学習する,教師なしビデオオブジェクト(VOS)タスクに焦点を当てる。
In-aNd-Out(INO)生成学習を純粋に生成的観点から提案する。
我々のINOは、最先端の手法をかなりのマージンで上回っている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:56:21 GMT)
Integrate Lattice-Free MMI into End-to-End Speech Recognition [87.0] 音声認識(ASR)研究において、識別基準はDNN-HMMシステムにおいて優れた性能を達成している。
このモチベーションにより、差別的基準の採用は、エンドツーエンド(E2E)のASRシステムの性能を高めることを約束している。
これまでの研究は、最小ベイズリスク(MBR、差別基準の一つ)をE2E ASRシステムに導入してきた。
本研究では,他の広く使われている識別基準であるLF-MMIをE2Eに統合する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:32:46 GMT)
Nearly Minimax Algorithms for Linear Bandits with Shared Representation [86.8] 我々は、次元が$d$で、それぞれ$T$のラウンドで$M$リニアバンディットをプレイする設定を考え、これらの$M$リニアバンディットタスクは共通の$k(ll d)$次元リニア表現を共有する。
我々は$widetildeOleft(dsqrtkMT + kMsqrtTright)$ regret boundsを達成する新しいアルゴリズムを考案した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:27:13 GMT)
Spoofing-Aware Speaker Verification by Multi-Level Fusion [86.2] 自覚的話者検証(SASV)課題は、統合CMモデルとASVモデルの研究を促進することを目的としている。
本稿では,SASVタスクに対処する新しいマルチモデルとマルチレベル融合戦略を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:16:38 GMT)
Best Arm Identification in Restless Markov Multi-Armed Bandits [85.6] マルチアームバンディット環境における最適な腕を特定することの問題点について検討する。
決定エンティティは、上限誤差確率を条件として、ベストアームのインデックスをできるだけ早く見つけることを希望する。
このポリシーは、$R$に依存する上限を達成し、$Rtoinfty$として単調に増加しないことを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:58:04 GMT)
Hybrid Routing Transformer for Zero-Shot Learning [83.6] 本稿ではハイブリッド・ルーティング・トランス (HRT) と呼ばれる新しいトランス・デコーダモデルを提案する。
ボトムアップとトップダウンの動的ルーティング経路の両方で構築されたアクティブアテンションを組み込んで,属性に整合した視覚的特徴を生成する。
HRTデコーダでは,属性対応の視覚特徴,対応する属性セマンティクス,およびクラス属性ベクトル間の相関関係を静的なルーティングで計算し,最終クラスラベルの予測を生成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:55:08 GMT)
Transformer Inertial Poser: Attention-based Real-time Human Motion
Reconstruction from Sparse IMUs [79.7] 本研究では,6つのIMUセンサからリアルタイムに全体動作を再構築する,注意に基づく深層学習手法を提案する。
提案手法は, 実装が簡単で, 小型でありながら, 定量的かつ質的に新しい結果が得られる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:24:52 GMT)
MAT: Mask-Aware Transformer for Large Hole Image Inpainting [79.7] 本稿では, 変圧器と畳み込みの利点を統一する, 大穴塗装の新しいモデルを提案する。
実験では、複数のベンチマークデータセット上で、新しいモデルの最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:36:17 GMT)
Deep Hierarchical Semantic Segmentation [76.4] 階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:36:05 GMT)
A Fast Post-Training Pruning Framework for Transformers [74.6] プルーニングは、大きなTransformerモデルの巨大な推論コストを削減する効果的な方法である。
モデルプルーニングの以前の作業では、モデルの再トレーニングが必要だった。
本稿では,再学習を必要としないトランスフォーマーのための高速な訓練後プルーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:41:11 GMT)
Does Monocular Depth Estimation Provide Better Pre-training than
Classification for Semantic Segmentation? [74.2] ラベルなしビデオからの深度推定が事前学習に役立てる可能性があるという仮説を検証した。
分類に基づく事前学習よりも5.7% mIoU と4.1% の精度が向上する事前学習方式を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 20:13:52 GMT)
HardVis: Visual Analytics to Handle Instance Hardness Using
Undersampling and Oversampling Techniques [74.1] HardVisは、主に不均衡な分類シナリオでインスタンスの硬さを処理するために設計されたビジュアル分析システムである。
ユーザはさまざまな視点からデータのサブセットを探索して、これらのパラメータをすべて決定できる。
HardVisの有効性と有効性は仮説的利用シナリオとユースケースで実証される。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:04:16 GMT)
Locality-Aware Inter-and Intra-Video Reconstruction for Self-Supervised
Correspondence Learning [74.0] 局所性を考慮した映像間再構成フレームワークLIIRを開発した。
クロスビデオ親和性は、統合されたビデオ間およびビデオ内再構成方式において、追加の負のサンプルとして活用する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:35:54 GMT)
Tuning Particle Accelerators with Safety Constraints using Bayesian
Optimization [73.9] 粒子加速器の機械パラメータのチューニングは反復的で時間を要する作業である。
我々は、安全なベイズ最適化のステップサイズ制限版を提案し、評価する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:05:18 GMT)
SPAct: Self-supervised Privacy Preservation for Action Recognition [73.8] アクション認識におけるプライバシー漏洩を緩和するための既存のアプローチは、ビデオデータセットのアクションラベルとともに、プライバシラベルを必要とする。
自己教師付き学習(SSL)の最近の進歩は、未ラベルデータの未発見の可能性を解き放ちつつある。
本稿では、プライバシーラベルを必要とせず、自己管理的な方法で、入力ビデオからプライバシー情報を除去する新しいトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:56:40 GMT)
Target and Task specific Source-Free Domain Adaptive Image Segmentation [73.8] ソースフリー領域適応画像分割のための2段階のアプローチを提案する。
我々は,高エントロピー領域を抑えつつ,ターゲット固有の擬似ラベルを生成することに注力する。
第2段階では、タスク固有の表現にネットワークを適用することに重点を置いている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:50:22 GMT)
On Decoding Strategies for Neural Text Generators [73.5] 言語生成タスクと復号化戦略の相互作用について検討する。
生成したテキストの属性の変化をデコード戦略とタスクの両方の関数として測定する。
以上の結果から,これまで観察された結果と意外な結果の両方が明らかとなった。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:25:30 GMT)
Deep Equilibrium Assisted Block Sparse Coding of Inter-dependent
Signals: Application to Hyperspectral Imaging [71.6] 相互依存信号のデータセットは、列が強い依存を示す行列として定義される。
ニューラルネットワークは、事前に構造として機能し、基礎となる信号相互依存性を明らかにするために使用される。
ディープ・アンローリングとディープ・平衡に基づくアルゴリズムが開発され、高度に解釈可能で簡潔なディープ・ラーニング・ベース・アーキテクチャを形成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 21:00:39 GMT)
Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.3] 本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:14:58 GMT)
LightHuBERT: Lightweight and Configurable Speech Representation Learning
with Once-for-All Hidden-Unit BERT [69.8] 本稿では,一度限りのTransformer圧縮フレームワークであるLightHuBERTを提案する。
自動音声認識(ASR)とSUPERBベンチマークの実験は、提案されたLightHuBERTが109ドル以上のアーキテクチャを実現することを示している。
LightHuBERTは、ほとんどのタスクにおいて、29%のパラメータを削減して、教師モデルに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:20:55 GMT)
Dressing in the Wild by Watching Dance Videos [69.8] 本稿では,現実の場面における仮想試行に参画し,現実性と自然性の向上をもたらす。
我々は,衣服の移動をより効果的に進める,wFlowと呼ばれる新しい生成ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:05:45 GMT)
Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5] そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:41:17 GMT)
Treatment Learning Transformer for Noisy Image Classification [68.5] 本研究では,この2値情報「ノイズの存在」を画像分類タスクに組み込んで予測精度を向上させる。
雑音画像分類のための頑健な特徴表現を潜在生成モデルを用いて推定する,トランスフォーマに基づく処理学習変換(TLT)を提案する。
また、パフォーマンスベンチマークのための幅広いノイズ要素を取り入れた、新しいノイズの多い画像データセットも作成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:07:53 GMT)
Pretraining Graph Neural Networks for few-shot Analog Circuit Modeling
and Design [68.2] 本稿では、新しい未知のトポロジや未知の予測タスクに適応可能な回路表現を学習するための教師付き事前学習手法を提案する。
異なる回路の変動位相構造に対処するため、各回路をグラフとして記述し、グラフニューラルネットワーク(GNN)を用いてノード埋め込みを学習する。
出力ノード電圧の予測における事前学習GNNは、新しい未知のトポロジや新しい回路レベル特性の予測に適応可能な学習表現を促進することができることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 21:18:47 GMT)
SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.6] 画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:49:51 GMT)
BARC: Learning to Regress 3D Dog Shape from Images by Exploiting Breed
Information [66.8] 私たちのゴールは、1枚の画像から犬の3D形状とポーズを復元することです。
近年の研究では、画像から手足のスケールパラメータを追加してSMAL動物モデルを直接回帰する研究が提案されている。
我々の手法はBARC(Breed-Augmented Regression using Classification)と呼ばれ、いくつかの重要な方法で先行作業を越えています。
この研究は、a-prioriの遺伝子類似性に関する情報が、3Dトレーニングデータの欠如を補うのに役立つことを示している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:16:06 GMT)
Accelerating Code Search with Deep Hashing and Code Classification [64.4] コード検索とは、自然言語クエリに基づいてソースコードコーパスから再利用可能なコードスニペットを検索することである。
深層ハッシュとコード分類を用いたコード検索を高速化する新しい手法CoSHCを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:05:30 GMT)
Quantum verification and estimation with few copies [63.7] 大規模絡み合ったシステムの検証と推定は、信頼性の高い量子情報処理にそのようなシステムを用いる際の大きな課題の1つである。
本稿では,資源の一定数(サンプリング複雑性)に着目し,任意の次元のシステムに適していることを示す。
具体的には、量子状態トモグラフィー(quantum state tomography)の概念とともに、エンタングルメント検出のために少なくとも1つのコピーだけを必要とする確率的フレームワークをレビューする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:56:23 GMT)
Short-Term Word-Learning in a Dynamically Changing Environment [63.0] 本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:05:39 GMT)
3D Shape Reconstruction from 2D Images with Disentangled Attribute Flow [61.6] 単一の2D画像から3D形状を再構築することは難しい作業だ。
従来の手法の多くは3次元再構成作業における意味的属性の抽出に苦慮している。
本稿では,3DAttriFlowを用いて,入力画像の異なる意味レベルから意味的属性を抽出する手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:03:31 GMT)
Group Testing with a Graph Infection Spread Model [61.5] 感染は個人間のつながりを通じて広がり、その結果、確率的クラスター形成構造と、個人に対する非i.d.感染状態が生じる。
そこで本研究では,既知の確率的感染拡散モデルを利用する2段階のサンプルグループテストアルゴリズムを提案する。
その結果, 感染率が高い場合でも, 集団検査により必要な検査数を大幅に削減できることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:41:24 GMT)
Unsupervised Text-to-Speech Synthesis by Unsupervised Automatic Speech
Recognition [60.8] 教師なし音声合成システム(TTS)は、言語中の任意の文章に対応する音声波形を生成することを学習する。
本稿では、教師なし自動音声認識(ASR)の最近の進歩を活用して、教師なしTSシステムを提案する。
教師なしシステムでは、7つの言語で約10~20時間の音声で教師付きシステムに匹敵する性能を達成できる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:57:53 GMT)
Learning to Detect Mobile Objects from LiDAR Scans Without Labels [60.5] 現在、自動運転のための3Dオブジェクト検出器は、ほとんど完全に人間の注釈付きデータに基づいて訓練されている。
本稿では,地球上のほぼどこでも,安価かつ多量に収集できるラベルなしデータに基づく代替手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 20:05:24 GMT)
Quality Assurance of Generative Dialog Models in an Evolving
Conversational Agent Used for Swedish Language Practice [59.7] 提案する1つのソリューションは、人中心の対話型言語実践のためのAI対応の会話エージェントである。
仮想面接のために訓練された独自の生成ダイアログモデルの品質保証を目標とした行動研究の成果を報告する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:25:13 GMT)
Exploring Frequency Adversarial Attacks for Face Forgery Detection [59.1] フェースフォージェリ検出器に対する周波数対向攻撃法を提案する。
また,メタラーニングの概念に触発されて,空間領域と周波数領域の両方で攻撃を行うハイブリッド逆攻撃を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:34:13 GMT)
Synthesis and Execution of Communicative Robotic Movements with
Generative Adversarial Networks [59.1] 我々は、繊細な物体を操作する際に人間が採用するのと同じキネマティクス変調を2つの異なるロボットプラットフォームに転送する方法に焦点を当てる。
我々は、ロボットのエンドエフェクターが採用する速度プロファイルを、異なる特徴を持つ物体を輸送する際に人間が何をするかに触発されて調整する。
我々は、人体キネマティクスの例を用いて訓練され、それらを一般化し、新しい有意義な速度プロファイルを生成する、新しいジェネレーティブ・アドバイサル・ネットワークアーキテクチャを利用する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:03:05 GMT)
Exploring Intra- and Inter-Video Relation for Surgical Semantic Scene
Segmentation [58.7] セグメンテーション性能を高めるために,映像内および映像間関係を補完する新しいフレームワークSTswinCLを提案する。
本研究では,EndoVis18 ChallengeとCaDISデータセットを含む2つの公開手術ビデオベンチマークに対するアプローチを広く検証する。
実験により,従来の最先端手法を一貫して超越した提案手法の有望な性能を示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:52:23 GMT)
Pop-Out Motion: 3D-Aware Image Deformation via Learning the Shape
Laplacian [58.7] 形状分類と変形型に最小限の制約を課した3次元画像変形法を提案する。
点雲として表される3次元再構成の基底体積のラプラシアン形状を予測するために,教師付き学習に基づくアプローチを採用する。
実験では,2次元キャラクタと人間の衣料画像の変形実験を行った。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:57:18 GMT)
SimT: Handling Open-set Noise for Domain Adaptive Semantic Segmentation [58.6] 本稿では,ブラックボックスモデルを用いて,擬似ラベル付きターゲットデータのみにアクセス可能な実用的なドメイン適応(DA)セマンティックセマンティックセマンティクス問題について検討する。
ドメインギャップと2つのドメイン間のラベルシフトのため、擬似ラベル付きターゲットデータには、クローズドセットとオープンセットのラベルノイズが混在している。
DAセマンティックセグメンテーションにおける混合雑音分布をモデル化し、SimTの推定として問題を定式化するための単純なノイズ遷移行列(SimT)を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:48:08 GMT)
Investigating Data Variance in Evaluations of Automatic Machine
Translation Metrics [58.5] 本稿では,メトリクスのパフォーマンスがデータに敏感であることを示す。
メトリクスのランキングは、異なるデータセットで評価が行われると異なる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:58:28 GMT)
On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.8] ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:11:54 GMT)
WAVPROMPT: Towards Few-Shot Spoken Language Understanding with Frozen
Language Models [57.6] 大量のテキストで事前訓練された大規模自動回帰言語モデルは、新しい自然言語タスクを実行するという印象的な能力を示している。
近年の研究では、エンコーダを訓練し、画像のエンコードを埋め込みにすることで、このような数発の学習能力をテキスト画像設定にまで拡張できることが示されている。
そこで我々は,wav2vecモデルを微調整して,言語モデルによって理解された音声埋め込みのシーケンスを生成する,新しい音声理解フレームワークWavPromptを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:08:55 GMT)
Light Field Depth Estimation Based on Stitched-EPI [56.7] 本研究では,非閉塞領域と閉塞領域に対する縫合EPIアルゴリズムと半安定EPIアルゴリズムを提案する。
アルゴリズムは、異なるEPIで線をシフト・連結することで斜面の計算を改善するが、3Dシーンでは同じ点に関連し、ハーフスティッチ付きEPIは行の非閉塞部分のみを使用する。
テクスチャのない地域での深度推定を改善するため, エッジからインテリアまで, 正確な領域から粗い領域まで, 深度を推定する深度伝搬戦略を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:43:40 GMT)
Learning-based Point Cloud Registration for 6D Object Pose Estimation in
the Real World [55.7] 我々は、ポイントクラウドデータからオブジェクトの6Dポーズを推定するタスクに取り組む。
この課題に対処する最近の学習ベースのアプローチは、合成データセットにおいて大きな成功を収めている。
これらの障害の原因を分析し、ソースとターゲットポイントの雲の特徴分布の違いに遡る。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:55:04 GMT)
Training Compute-Optimal Large Language Models [54.0] 私たちは、500億から500億のトークンに対して、7000万から160億以上のパラメータの言語モデルをトレーニングしています。
計算最適トレーニングでは、モデルのサイズとトレーニングトークンの数が等しくスケールする必要がある。
チンチラはGopher(280B)、GPT-3(175B)、Jurassic-1(178B)、Megatron-Turing NLG(530B)を均一かつ著しく上回る
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:38:03 GMT)
OdontoAI: A human-in-the-loop labeled data set and an online platform to
boost research on dental panoramic radiographs [53.7] 本研究では, 歯科用パノラマX線画像の公開データセットの構築について述べる。
我々はHuman-in-the-loop(HITL)の概念の恩恵を受け、ラベリング手順を高速化する。
その結果,HITLによるラベル付け時間短縮率は51%であり,連続作業時間390時間以上節約できた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:57:23 GMT)
Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.3] 本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:54:06 GMT)
Visualizing the Relationship Between Encoded Linguistic Information and
Task Performance [53.2] 本稿では,Pareto Optimalityの観点から,符号化言語情報とタスクパフォーマンスの動的関係について検討する。
我々は、機械翻訳と言語モデリングという2つの一般的なNLPタスクの実験を行い、様々な言語情報とタスクパフォーマンスの関係について検討する。
実験結果から,NLPタスクには構文情報が有用であるのに対して,より構文情報の符号化が必ずしも優れたパフォーマンスをもたらすとは限らないことが示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:03:10 GMT)
StyleT2I: Toward Compositional and High-Fidelity Text-to-Image Synthesis [52.3] 構成性の欠如は、堅牢性と公正性に深刻な影響を及ぼす可能性がある。
テキスト対画像合成の合成性を改善するための新しいフレームワークであるStyleT2Iを導入する。
その結果,StyleT2Iは入力テキストと合成画像との整合性という点で従来の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:59:50 GMT)
mc-BEiT: Multi-choice Discretization for Image BERT Pre-training [52.0] Image BERT pre-training with masked image modeling (MIM)は、自己教師付き表現学習に対処する一般的な実践である。
改良されたBERTスタイルの画像事前学習手法であるmc-BEiTを導入する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:08:18 GMT)
Efficient Virtual View Selection for 3D Hand Pose Estimation [50.9] 単一深度からの3次元手ポーズ推定のための仮想ビュー選択と融合モジュールを提案する。
提案する仮想ビュー選択と融合モジュールはどちらも3次元手ポーズ推定に有効である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:57:53 GMT)
Self-Supervised Image Representation Learning with Geometric Set
Consistency [50.1] 本稿では,3次元幾何整合性に基づく自己教師付き画像表現学習法を提案する。
具体的には、画像ビュー内の特徴整合性を強化するために、コントラスト学習フレームワークに3次元幾何学的整合性を導入する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:57:33 GMT)
Improving Generalization of Deep Neural Network Acoustic Models with
Length Perturbation and N-best Based Label Smoothing [49.8] 音声認識(ASR)のためのディープニューラルネットワーク(DNN)音響モデルの一般化を改善する2つの手法を提案する。
長さ摂動 (Longth perturbation) は、音声特徴系列の長さを変更するために音声のフレームをランダムにドロップして挿入するデータ拡張アルゴリズムである。
N-bestに基づくラベルスムーシングは、n-best仮説からノイズラベルが生成される過度な適合を避けるために、トレーニング中にグラウンド・真理ラベルにランダムにノイズを注入する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:40:22 GMT)
A single speaker is almost all you need for automatic speech recognition [49.6] 我々のアプローチは、最先端技術(SOTA)と比較して結果が得られることを示す。
本研究では,ASRモデルのトレーニングにおける有望な結果が,データ拡張法と,異なるターゲット言語における1つの実話者のみによって得られることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:55:30 GMT)
LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.8] テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:44:57 GMT)
Learning a Structured Latent Space for Unsupervised Point Cloud
Completion [48.8] 部分点雲と完全点雲の両方を符号化する統一的で構造化された潜在空間を学習する新しいフレームワークを提案する。
提案手法は、合成ShapeNetと実世界のKITTI、ScanNet、Matterport3Dデータセットの両方において、最先端の教師なし手法を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:58:44 GMT)
Panoptic NeRF: 3D-to-2D Label Transfer for Panoptic Urban Scene
Segmentation [48.7] そこで本研究では,画素ごとの2Dセマンティックスとインスタンスラベルの取得を目的とした,新しい3D-to-2Dラベル転送手法であるPanoptic NeRFを提案する。
3D空間内での推論と2Dラベルへのレンダリングにより、我々の2Dセマンティクスとインスタンスラベルは、設計によって複数ビューに一貫性がある。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:16:40 GMT)
Few Could Be Better Than All: Feature Sampling and Grouping for Scene
Text Detection [47.8] 本稿では,シーンテキスト検出のためのトランスフォーマーアーキテクチャを提案する。
まず、フォアグラウンドテキストに非常に関係のある、あらゆるスケールでいくつかの代表的特徴を選択します。
各特徴群がテキストインスタンスに対応するため、そのバウンディングボックスは後処理操作なしで容易に得ることができる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:02:31 GMT)
CHEX: CHannel EXploration for CNN Model Compression [47.4] 本稿では,これらの問題を是正するために,CHEXと呼ばれる新しいチャネル探索手法を提案する。
CheXはトレーニングプロセスを通じてチャネルを繰り返しプーンして再成長させ、重要なチャネルを早期にプルーニングするリスクを低減させる。
CHEXは様々なコンピュータビジョンタスクにおいて,多様なCNNアーキテクチャのFLOPを効果的に削減できることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:52:41 GMT)
Parameter-efficient Fine-tuning for Vision Transformers [45.3] 視覚タスクにおける視覚変換器のパラメータ効率の良い微調整方略について検討する。
本稿では,局所固有次元を測定することで,まずサブモジュールを選択するパラメータ効率のよい微調整フレームワークを提案する。
提案手法は,3つの画像分類データセットの精度とパラメータ効率のトレードオフを最良とする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:30:09 GMT)
Semantic Line Detection Using Mirror Attention and Comparative Ranking
and Matching [44.1] 本稿では,意味線を検出する新しいアルゴリズムを提案する。
ミラーアテンション付き検出ネットワーク(D-Net)、比較ランキングとマッチングネットワーク(R-NetとM-Net)の3つのネットワークを開発する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:00:29 GMT)
Signing at Scale: Learning to Co-Articulate Signs for Large-Scale
Photo-Realistic Sign Language Production [43.5] 手話は視覚言語であり、語彙は話し言葉と同じくらい豊かである。
現在の深層学習に基づく手話生成(SLP)モデルでは、アンダーアーティキュレートされたスケルトンポーズシーケンスが生成される。
我々は,辞書記号間の協調処理を学習することで,大規模SLPに取り組む。
また,ポーズ条件付き人間の合成モデルであるSignGANを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:51:38 GMT)
OrphicX: A Causality-Inspired Latent Variable Model for Interpreting
Graph Neural Networks [42.5] 本稿では、グラフニューラルネットワーク(GNN)の因果説明を生成するための新しいeXplanationフレームワークOrphicXを提案する。
本研究では, 個別な生成モデルを構築し, 因果的, コンパクト, 忠実な説明を生成モデルに推奨する目的関数を設計する。
OrphicXは因果的説明を生成するための因果的意味論を効果的に識別できることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:08:33 GMT)
OakInk: A Large-scale Knowledge Repository for Understanding Hand-Object
Interaction [42.0] 本研究は,多モード・リッチアノテーション付き知識リポジトリであるOakInkを提案し,手-物体相互作用の視覚的および認知的理解を実現する。
オークで選択された100のオブジェクトとのリッチなヒューマンインタラクションを記録し、そのインタラクションをTinkを介して仮想オブジェクトに転送する。
OakInkには、5万の異なる可視性と意図指向のハンドオブジェクトインタラクションが含まれている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:13:07 GMT)
AnyFace: Free-style Text-to-Face Synthesis and Manipulation [41.6] 本稿では,AnyFaceという無料のテキスト・ツー・フェイス方式を提案する。
AnyFaceは、メタバース、ソーシャルメディア、化粧品、鑑識など、より広範なオープンワールドアプリケーションを可能にする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:27:38 GMT)
Visualizations of Complex Sequences of Family-Infant Vocalizations Using
Bag-of-Audio-Words Approach Based on Wav2vec 2.0 Features [41.1] 米国では、2-8歳の子供の約15-17%が、少なくとも1つの精神、行動、発達障害を診断していると推定されている。
これまでの研究では、携帯電話、ビデオ、LENAのような音声のみの記録装置を用いて収集された幼児および/または親の発声の分類において、高度なMLモデルが優れていることが示されている。
我々は、wav2vec 2.0機能を持つbaba-of-audio-words法を用いて、家族と幼児の発声相互作用を理解するための高レベルな可視化を作成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:46:14 GMT)
Eigencontours: Novel Contour Descriptors Based on Low-Rank Approximation [40.1] 等角行列を最高階数-M近似により固有等角行列に分解する。
M 固有輪郭の線形結合により対象境界を表現する。
提案アルゴリズムは,インスタンスセグメンテーションデータセット上で有意義な性能を示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:14:38 GMT)
A Simple Yet Effective Pretraining Strategy for Graph Few-shot Learning [38.7] 本稿では,グラフ数ショット学習のための新しいパラダイムとして,シンプルなトランスダクティブな微調整型フレームワークを提案する。
事前学習のために,数発のノード分類に特有なデータ拡張戦略を持つ教師付きコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:30:00 GMT)
Temporal Feature Alignment and Mutual Information Maximization for
Video-Based Human Pose Estimation [38.6] マルチフレーム人間のポーズ推定のための新しい階層的アライメントフレームワークを提案する。
ベンチマークデータセットのPoseTrack 2017では、マルチフレームPerson Pose Estimation Challengeの1位にランクインし、ベンチマークのSub-JHMDBとPose-Track 2018では最先端のパフォーマンスを得ています。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:29:16 GMT)
Task-specific Inconsistency Alignment for Domain Adaptive Object
Detection [38.0] 大量のラベル付きデータでトレーニングされた検出器は、データ分散ギャップのある特定のシナリオで劇的なパフォーマンス劣化を示すことが多い。
本稿では,タスク固有の不整合アライメント(TIA)を提案する。
TIAは,従来の最先端手法よりも,様々なシナリオにおいて優れた結果を示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:36:33 GMT)
Over-the-Air Federated Learning via Second-Order Optimization [37.6] フェデレートラーニング(FL)は、無線ネットワーク上でのタスク指向のデータトラフィックを、限られた無線リソースによって引き起こす可能性がある。
本稿では,通信ラウンドを同時に削減し,低レイテンシなグローバルモデルアグリゲーションを実現するために,空対2次フェデレーション最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:39:23 GMT)
Benchmarking Deep AUROC Optimization: Loss Functions and Algorithmic
Choices [37.6] 我々は、深いAUROC最適化問題に対するアルゴリズム選択の異なる様々な損失関数をベンチマークする。
正のサンプリング率、正規化、正規化/アクティベーション、重みなどの重要な選択を強調した。
以上の結果から,Adam-type法はトレーニングの面では競争力が高いが,テストの面では他よりも優れていないことが示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:39:26 GMT)
Integrative Few-Shot Learning for Classification and Segmentation [37.5] 少数ショット分類とセグメンテーション(FS-CS)の統合タスクについて紹介する。
FS-CSは、ターゲットクラスがいくつかの例で与えられるとき、クエリイメージでターゲットオブジェクトを分類し、セグメントすることを目的としている。
本稿では,FS-CSのための統合的数ショット学習フレームワークを提案し,学習者がクラスワイドな前景マップを構築するように訓練する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:14:40 GMT)
Semi-Supervised Image-to-Image Translation using Latent Space Mapping [37.2] 半教師付き画像翻訳のための一般的なフレームワークを提案する。
私たちの一番の考え方は、画像空間ではなく、潜在機能空間の翻訳を学ぶことです。
低次元の特徴空間のおかげで、所望の写像関数を見つけるのが容易である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:14:26 GMT)
Few-shot Structured Radiology Report Generation Using Natural Language
Prompts [37.2] 自然言語処理を用いたフリーテキストレポートの臨床精度の定量化の有効性は困難である。
構造化レポートは一貫性を確保し、品質保証ツールとしてより簡単に使用できる。
本報告では, 臨床所見と解剖学的位置の予測方法について述べる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:31:39 GMT)
Eigenlanes: Data-Driven Lane Descriptors for Structurally Diverse Lanes [37.1] 固有レーン空間における道路車線検出のための新しいアルゴリズムを提案する。
固有レーン(英: Eigenlanes)は、曲線や直線線を含む、構造的に多様なレーンのためのデータ駆動ディスクリプタである。
提案アルゴリズムは、構造的に多様な車線に対する優れた検出性能を提供する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:45:23 GMT)
Towards Spatio-Temporal Aware Traffic Time Series Forecasting--Full
Version [37.1] トラフィックの時系列パターンは時間によって異なり、例えば1日を通してより強い時間パターンを示す特定の期間が存在する。
ディープラーニングベースのモデルは有望な結果を示すが、彼らは無知に苦しむ。
本研究では,認識時間モデルから非認識モデルへの変換を目的としたフレームワークを提案する。
提案手法は,4つの交通時系列データセットに対して強い実証的証拠を示し,その精度と効率の点で,時間的注意が最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:44:56 GMT)
Disentangling Object Motion and Occlusion for Unsupervised Multi-frame
Monocular Depth [37.0] 既存の動的対象に焦点をあてた手法は、トレーニング損失レベルのミスマッチ問題を部分的に解決しただけである。
本稿では,これらの問題を予測レベルと監督損失レベルの両方で解くために,新しい多フレーム単眼深度予測法を提案する。
我々の手法はDynamicDepthと呼ばれ、自己教師付きサイクル一貫性学習スキームによって訓練された新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:36:11 GMT)
ASM-Loc: Action-aware Segment Modeling for Weakly-Supervised Temporal
Action Localization [36.9] 微弱に監督された時間的アクションローカライゼーションは、トレーニングのためにビデオレベルのアクションラベルのみを与えられた未トリミングビデオ中のアクションセグメントを認識し、ローカライズすることを目的としている。
我々は,標準のMIL法を超越した,明示的でアクション対応のセグメントモデリングを可能にする WTAL フレームワークである System を提案する。
本フレームワークでは, 短時間動作の寄与を補う動的セグメントサンプリング, (ii) 動作のダイナミクスをモデル化し, 時間的依存性を捉えるためのセグメント間注意, (iii) 動作境界予測を改善するための擬似インスタンスレベルの監視の3つの要素を包含する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:59:26 GMT)
FaceVerse: a Fine-grained and Detail-controllable 3D Face Morphable
Model from a Hybrid Dataset [36.7] FaceVerseは60Kの融合RGB-D画像と2Kの高忠実度3Dヘッドスキャンモデルを含むハイブリッド東アジアの顔データセットから構築されている。
粗いモジュールでは、大規模なRGB-D画像からベースパラメトリックモデルを生成し、性別や年齢などによって正確な3D顔モデルを予測することができる。
高忠実度スキャンモデルで訓練された条件付きスタイルGANアーキテクチャを導入し、精巧な顔の幾何学的およびテクスチャ的詳細を表現した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:13:33 GMT)
OSOP: A Multi-Stage One Shot Object Pose Estimation Framework [35.9] 対象物検出のための新しいワンショット手法と,対象物に対する訓練を必要としない6DoFポーズ推定を提案する。
テスト時には、ターゲット画像とテクスチャ化された3Dクエリモデルを入力する。
The method on LineMOD, Occlusion, Homebrewed, YCB-V and TLESS datasets。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:12:00 GMT)
Shifting More Attention to Visual Backbone: Query-modulated Refinement
Networks for End-to-End Visual Grounding [35.4] 既存の方法は、事前訓練されたクエリに依存しない視覚的バックボーンを使用して、視覚的特徴マップを独立して抽出する。
視覚的バックボーンから抽出される視覚的特徴とマルチモーダル推論に必要な特徴は矛盾する。
不整合問題に対処するクエリ変調リファインメントネットワーク(QRNet)を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:17:23 GMT)
MAP-Gen: An Automated 3D-Box Annotation Flow with Multimodal Attention
Point Generator [33.4] 本研究では,弱い2Dボックスから高品質な3Dラベルを生成するマルチモーダルアテンションポイントジェネレータ(MAP-Gen)を提案する。
MAP-Genを用いて、2Dボックスで弱制御されたオブジェクト検出ネットワークは、3Dアノテーションで完全に教師されたオブジェクトの9499%のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:02:16 GMT)
Mel Frequency Spectral Domain Defenses against Adversarial Attacks on
Speech Recognition Systems [33.2] 本稿では,メルスペクトル領域を用いた音声特異的防音について検討し,新しい防音法「メル領域ノイズフラッディング(MDNF)」を提案する。
MDNFは音声信号の再合成に先立って音声のメルスペクトルに付加雑音を適用する。
プロジェクテッド勾配降下(PGD)やカルリーニ・ワグナー(CW)攻撃などの強力なホワイトボックス攻撃に対する防御実験を行った。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:58:26 GMT)
Feature Selective Transformer for Semantic Image Segmentation [31.9] セマンティックセグメンテーションのためのTransformerベースのバックボーンからマルチスケール機能を融合することに重点を置いている。
本稿では,各クエリ機能のすべてのスケール(あるいはレベル)から機能を集約するFeSeFormerを提案する。
提案したSFSおよびFFFモジュールに基づいてFeSeFormer(FeSeFormer)を開発し、4つの挑戦的なセマンティックセマンティックセマンティクスベンチマークでFeSeFormerを評価する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:57:01 GMT)
End-to-End Compressed Video Representation Learning for Generic Event
Boundary Detection [31.3] イベント境界検出のためのエンドツーエンド圧縮ビデオ表現学習を提案する。
まず最初にConvNetを使って、GOPのIフレームの特徴を抽出します。
その後、Pフレームの特徴表現を計算するために、軽量な空間チャネル圧縮エンコーダが設計された。
ビデオシーケンスのイベント境界を決定するために,時間的コントラストモジュールを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:27:48 GMT)
FisherMatch: Semi-Supervised Rotation Regression via Entropy-based
Filtering [30.6] 半教師付き回転回帰のための一般的なフレームワークFisherMatchを提案する。
一般的な半教師付きアプローチであるFixMatchにヒントを得て、擬似ラベルフィルタリングを活用することを提案する。
ラベル付きデータ比が極めて低い場合でも,本手法は良好に動作可能である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:23:04 GMT)
Modeling Users' Contextualized Page-wise Feedback for Click-Through Rate
Prediction in E-commerce Search [29.7] 本稿では,ページワイズ製品全体を含め,コンテキスト認識型ユーザ行動モデリングの新しい視点を提案する。
ページ内コンテキスト情報とページ間関心の進化をキャプチャして、より具体的なユーザの好みを学習することができる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:26:55 GMT)
Recent improvements of ASR models in the face of adversarial attacks [28.9] 音声認識モデルは敵攻撃に対して脆弱である。
異なる攻撃アルゴリズムの相対的強度は、モデルアーキテクチャを変更する際に大きく異なることを示す。
ソースコードをパッケージとしてリリースし、将来の攻撃と防御の評価に役立ちます。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:40:37 GMT)
Improving Mispronunciation Detection with Wav2vec2-based Momentum
Pseudo-Labeling for Accentedness and Intelligibility Assessment [28.8] 現在の誤発音検出・診断システム(MDD)は、エンド・ツー・エンドの音素認識によって有望な性能を達成する。
このようなエンドツーエンドソリューションの課題の1つは、自然なL2音声における人間の注釈付き音素の不足である。
擬似ラベル処理(PL)によるラベルなしL2音声の活用と,事前学習型自己教師付き学習(SSL)モデルに基づく微調整手法の拡張を行う。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:40:31 GMT)
MFSNet: A Multi Focus Segmentation Network for Skin Lesion Segmentation [28.7] 本研究は,皮膚病変の制御のための人工知能(AI)フレームワークを開発する。
MFSNetは3つの公開データセットで評価され、最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:38:36 GMT)
Enabling hand gesture customization on wrist-worn devices [28.6] 既存のジェスチャーセットの性能を劣化させることなく、ユーザから最小限のサンプルを必要とするジェスチャーカスタマイズのためのフレームワークを提案する。
われわれのアプローチは、ユーザーが既存のジェスチャーに縛られない未来への道を切り拓き、自分の好みや能力に合わせた新しいジェスチャーを創造的に導入することを可能にする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:12:32 GMT)
MatteFormer: Transformer-Based Image Matting via Prior-Tokens [27.9] 本稿では,MatteFormer というトランスフォーマーベースの画像マッチングモデルを提案する。
提案手法はまず,各トリマップ領域のグローバルな表現である事前トークンを導入する。
提案手法は,最先端の性能を高いマージンで達成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:25:56 GMT)
Robust Structured Declarative Classifiers for 3D Point Clouds: Defending
Adversarial Attacks with Implicit Gradients [27.7] 現在のディフェンダーは、しばしば、復元によって敵の点雲を飾ることを学び、入力として敵の点雲に給餌する。
本稿では, 内部制約最適化機構が敵攻撃を効果的に防御することのできる, ポイントクラウド分類のためのロバストな構造化宣言のファミリーを提案する。
我々は,ModelNet40とScanNetのクラウド分類性能を,7つの異なる攻撃条件下で実証した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:35:51 GMT)
Abstract Flow for Temporal Semantic Segmentation on the Permutohedral
Lattice [27.4] バックボーンのLatticeNetを拡張して、時間的ポイントクラウドデータを処理します。
我々は,ネットワークがシーンの一部に類似した抽象的な特徴を持たせるための抽象フローという新しいモジュールを提案する。
我々は,実都市環境からのLiDARスキャンを含むSemantic KITTIデータセットの最先端結果を得た。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:14:31 GMT)
Learning to Synthesize Volumetric Meshes from Vision-based Tactile
Imprints [26.1] 視覚ベースの触覚センサーは、通常、変形可能なエラストマーと上に取り付けられたカメラを使用して、コンタクトの高解像度な画像観察を行う。
本稿では,視覚に基づく触覚センサから得られた画像インプリントに基づいてエラストマーのメッシュを合成する学習に焦点を当てた。
グラフニューラルネットワーク(GNN)を導入し、教師付き学習で画像とメシュのマッピングを学習する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 00:24:10 GMT)
Contrasting the landscape of contrastive and non-contrastive learning [25.8] 単純なデータモデルであっても,非競合性損失は非衝突性悪い最小値の前提となることを示す。
トレーニングプロセスがこれらのミニマを避けるものではないことを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:08:31 GMT)
Interactive Audio-text Representation for Automated Audio Captioning
with Contrastive Learning [25.1] インタラクティブなモダリティ表現を学習するための,CLIP-AACと呼ばれる新しいAACシステムを提案する。
提案するCLIP-AACでは,事前学習エンコーダにオーディオヘッドとテキストヘッドを導入し,音声テキスト情報を抽出する。
また、音声信号と2つの字幕の対応を学習することで、ドメイン差を狭めるためにコントラスト学習を適用する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:06:46 GMT)
Towards Flexible Sparsity-Aware Modeling: Automatic Tensor Rank Learning
Using The Generalized Hyperbolic Prior [24.8] 正準多進分解(CPD)のためのランク学習は、長い間必須だが難しい問題とみなされてきた。
テンソルランクの最適決定は、非決定論的時間ハード(NP-hard)タスクであることが知られている。
本稿では,確率論的モデリングモデルに先立って,より高度な一般化双曲型(GH)を導入する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:22:08 GMT)
Camera-Conditioned Stable Feature Generation for Isolated Camera
Supervised Person Re-IDentification [24.6] クロスカメラ画像は、ISolated Camera Supervised 設定下では利用できない可能性がある。
新しいパイプラインは、モデルトレーニングのためにフィーチャースペース内のクロスカメラサンプルを合成することによって導入される。
2つのISCS人物Re-IDデータセットの実験は、競合相手に対するCCSFGの優位性を実証している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:10:24 GMT)
Noise-robust Speech Recognition with 10 Minutes Unparalleled In-domain
Data [24.5] クリーンスペクトル(Simu-GAN)からノイズスペクトルをシミュレートする生成逆ネットワークを提案する。
また、雑音条件下でのシステムの堅牢性を改善するために、デュアルパス音声認識システムを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:06:01 GMT)
Audio-text Retrieval in Context [24.4] そこで本研究では,音声・テキストのアライメントを改善するために,複数のオーディオ機能とシーケンスアグリゲーション手法について検討する。
我々は,事前学習した音声特徴と記述子に基づくアグリゲーション法を用いた文脈音声テキスト検索システムを構築した。
提案システムでは、リコール、中央値、平均値を含むすべての指標において、双方向音声テキスト検索において顕著な改善が達成されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:32:47 GMT)
Quantifying Societal Bias Amplification in Image Captioning [24.1] 画像キャプションでは,保護属性の正しい予測に焦点を合わせるだけでは十分ではない。
従来の画像キャプションモデルと最先端画像キャプションモデルについて広範な評価を行い、保護属性予測のみに着目して、バイアス緩和モデルが予想外にバイアスを増幅していることに驚きを感じた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:42:11 GMT)
Gaze-based Object Detection in the Wild [23.9] 人間とロボットのコラボレーションでは、ロボットに新しい未知の物体を教えることが難しい。
視線データから対象物(対象物または対象物なし)を検出し、その境界ボックスパラメータを決定することができるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:10:17 GMT)
A Passive Similarity based CNN Filter Pruning for Efficient Acoustic
Scene Classification [23.7] 音響シーン分類(ASC)のための低複雑さ畳み込みニューラルネットワーク(CNN)の開発手法を提案する。
本稿では,CNNからの畳み込みフィルタを除去し,圧縮したCNNを生成するパッシブ・フィルタ・プルーニング・フレームワークを提案する。
提案手法は単純で,パラメータが25%少なく,精度が1%以下で,推論当たりの計算量を27%削減する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:00:06 GMT)
Streaming parallel transducer beam search with fast-slow cascaded
encoders [23.4] RNNトランスデューサのストリーミングおよび非ストリーミングASRは、因果エンコーダと非因果エンコーダをカスケードすることで統一することができる。
高速スローエンコーダから復号するトランスデューサのための並列時間同期ビーム探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:29:39 GMT)
Image Retrieval from Contextual Descriptions [22.1] 文脈記述による画像検索(ImageCoDe)
文脈記述に基づく10の最小限のコントラスト候補から正しい画像を取得するためのモデル。
ビデオフレームでは20.9、静的画像では59.4の精度で、人間では90.8である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:18:12 GMT)
Improved Knowledge Distillation via Full Kernel Matrix Transfer [21.5] 知識蒸留は深層学習におけるモデル圧縮に有効な方法である。
元の完全行列をNystr"om法で分解する。
完全行列と比較して、部分行列のサイズは例の数で線型である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:14:55 GMT)
Speech Emotion Recognition with Co-Attention based Multi-level Acoustic
Information [21.5] 音声感情認識は、人間の主観的感情を音声情報のみから理解することを目的としている。
マルチレベル音響情報を用いたエンドツーエンドの音声感情認識システムを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:17:28 GMT)
Synergizing Physics/Model-based and Data-driven Methods for Low-Dose CT [21.4] 2016年には、特に低線量CT(LDCT)画像において、高度なトモグラフィーが成功している。
LDCTはビッグデータによって駆動されるが、純粋なエンドツーエンド再構築ネットワークはブラックボックスの性質や不安定性などの大きな問題に悩まされることが多い。
新たなトレンドは、イメージング物理学とモデルをディープネットワークに統合し、物理/モデルベースおよびデータ駆動要素のハイブリッド化を可能にすることだ。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:36:51 GMT)
ARCS: Accurate Rotation and Correspondence Search [21.0] 本論文は,「同時回転・対応探索」と呼ばれる,より汎用的な古いワフバ問題について述べる。
まず最初に、例えば$m,napprox 106$ を 0.1$ 秒で解けるように、$O(mlog m)$ time と $O(m)$ space, iv) を用いる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:57:42 GMT)
WeNet 2.0: More Productive End-to-End Speech Recognition Toolkit [20.3] WeNetは製品指向のエンドツーエンド音声認識ツールキットである。
本稿では,WeNet 2.0を4つの重要なアップデートで紹介する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:54:34 GMT)
Kernel Modulation: A Parameter-Efficient Method for Training
Convolutional Neural Networks [19.6] 本研究は,階層のサブセットではなく,ベースネットワークのすべてのパラメータを適応する,新しいパラメータ効率の高いカーネル変調(KM)手法を提案する。
KMは軽量なタスク特化カーネル変調器を使用し、ベースネットワークパラメータの1.4%しか必要としない。
以上の結果から,KMはTransfer Learningベンチマークの他のパラメータ効率の高い手法よりも最大9%高い精度を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:28:50 GMT)
Autoregressive Co-Training for Learning Discrete Speech Representations [19.4] 音声の離散表現を学習する離散潜在変数を持つ生成モデルを考える。
提案手法は音素単位と高い相関関係を持つ離散表現を学習する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:17:18 GMT)
Near-optimality for infinite-horizon restless bandits with many arms [19.1] レスト・バンディットは、レコメンデーター・システム、アクティブ・ラーニング、収益管理などの分野での応用に関する問題である。
我々は、$O(sqrtN)$Optimity gapを持つ流体均衡政策と呼ばれる政策のクラスを導出する。
また,流体バランスポリシが特定の問題に対して最先端のパフォーマンスを実現することを実証的に示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:49:21 GMT)
Clean Implicit 3D Structure from Noisy 2D STEM Images [19.0] 本研究では,STEMにおける2次元センサノイズのジョイントモデルを暗黙の3次元モデルとともに学習することができることを示す。
これらのモデルを組み合わせることで,3次元信号とノイズを監視せずに解離させることができ,同時に,合成データと実データに基づくいくつかのベースラインを達成できることが示される。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:00:28 GMT)
Ternary Compression for Communication-Efficient Federated Learning [18.0] フェデレートされた学習は、プライバシ保護とセキュアな機械学習に対する潜在的なソリューションを提供する。
本稿では,第3次フェデレーション平均化プロトコル(T-FedAvg)を提案する。
その結果,提案したT-FedAvgは通信コストの低減に有効であり,非IIDデータの性能も若干向上できることがわかった。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:50:30 GMT)
Disentangling speech from surroundings in a neural audio codec [18.0] 本稿では,ニューラルオーディオの圧縮領域における雑音環境から音声信号を分離する手法を提案する。
本稿では,ベクトルを埋め込んだ音声波形の構造化符号化を実現するための新しいトレーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:58:33 GMT)
AutoPoly: Predicting a Polygonal Mesh Construction Sequence from a
Silhouette Image [17.9] AutoPolyはシルエット画像から多角形メッシュ構築シーケンスを生成するハイブリッド手法である。
提案手法はトポロジを修正できるが,最近提案された微分可能レンダリングを用いた逆形状推定法は固定トポロジのみを処理できる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:48:47 GMT)
Invariance Learning based on Label Hierarchy [17.5] Deep Neural Networksは、トレーニングデータに埋め込まれた急激な相関関係を継承する。
Invariance Learning (IL) はこの欠点を克服するために最近開発されている。
本稿では,複数の領域におけるデータトレーニングの要件を克服する新しいILフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:31:21 GMT)
Online Continual Learning on a Contaminated Data Stream with Blurry Task
Boundaries [17.4] 大量の連続学習(CL)手法は、クリーンなラベルを持つデータストリームを前提としており、ノイズの多いデータストリームの下でのオンライン学習シナリオはまだ探索されていない。
我々は、既存のCLメソッドが苦労しているラベル付きぼやけたデータストリームからオンライン学習のより実践的なCLタスク設定について検討する。
本稿では,ラベルノイズを意識した多様なサンプリングと,半教師付き学習による頑健な学習の統一的アプローチにより,メモリの管理と利用を行う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:52:45 GMT)
Efficient Reflectance Capture with a Deep Gated Mixture-of-Experts [17.3] 画素非依存の方法で近平面異方性反射率を効率的に取得する新しい枠組みを提案する。
入力帯域幅は同じで改善され、帯域幅は均等な結果に対して約1/3に削減できる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:14:23 GMT)
Finding Structure and Causality in Linear Programs [17.1] 一般, 最短経路, エネルギー系LPの系統的, 実証的研究を行う。
本稿では,LP 成分の構造内および構造間関係が興味深いことを明らかにする基礎的,因果的視点を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:39:58 GMT)
Seq-2-Seq based Refinement of ASR Output for Spoken Name Capture [16.8] 発声者の発声者から人名を抽出する手法を提案する。
そこで本研究では,スペル修正や不規則除去,テキスト正規化などの作業から着想を得た軽量なSeq-2-Seqシステムを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:04:51 GMT)
Speech Segmentation Optimization using Segmented Bilingual Speech Corpus
for End-to-end Speech Translation [16.6] セグメント化バイリンガル音声コーパスを用いて訓練された二分分類モデルを用いた音声セグメント化手法を提案する。
実験の結果,提案手法は従来のセグメンテーション法よりもカスケードおよびエンド・ツー・エンドのSTシステムに適していることがわかった。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:26:56 GMT)
A Sparsity-promoting Dictionary Model for Variational Autoencoders [16.6] 深層生成モデルにおける潜伏空間の構造化は、より表現力のあるモデルと解釈可能な表現を得るために重要である。
本稿では,空間の空間構造をスパーシティ・プロモーティング・辞書・モデルを用いて簡易かつ効果的に構築する手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:13:11 GMT)
An Unbiased Symmetric Matrix Estimator for Topology Inference under
Partial Observability [16.6] 本稿では,部分観測可能性の枠組みに基づくネットワークトポロジ推論の問題について考察する。
本稿では、ガウス雑音とラプラシアン結合則を持つ対称ネットワークトポロジーのための新しい非バイアス推定器を提案する。
ネットワーク構造を推定するために、ネットワーク推論ガウスアルゴリズムと呼ばれる効果的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:49:25 GMT)
xAI-GAN: Enhancing Generative Adversarial Networks via Explainable AI
Systems [16.4] Generative Adversarial Networks (GAN) は、現実的な画像、音楽、テキスト、その他のデータの生成に成功しているディープニューラルネットワーク(DNN)の革命的なクラスである。
本稿では、AI(xAI)システムにおける最近の進歩を活用して、識別器からジェネレータへの「よりリッチな」修正フィードバックを提供する新しいGANクラスを提案する。
我々は、xAI-GANが標準GANよりも、MNISTとFMNISTの両方のデータセットで生成された画像の品質を最大23.18%向上させるのを観察する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:59:29 GMT)
On Kernelized Multi-Armed Bandits with Constraints [16.1] 一般に未知の報酬関数と一般未知の制約関数を併用した帯域幅問題について検討する。
本稿では,アルゴリズムの性能解析のための一般的なフレームワークを提案する。
本稿では,数値実験により提案アルゴリズムの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:02:03 GMT)
Graph similarity learning for change-point detection in dynamic networks [15.7] グラフスナップショットの時間的シーケンスである動的ネットワークについて考察する。
このタスクは、しばしばネットワーク変更点検出と呼ばれ、不正検出や物理モーションモニタリングといった多くの応用がある。
我々は、特定のネットワーク領域に適応し、変更を遅延なくローカライズできるオンラインネットワーク変更点検出法を設計する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:16:38 GMT)
Quantum Advantage from Any Non-Local Game [14.9] 我々は,任意の$k$プロデューサ非ローカルゲームを単一プロデューサインタラクティブゲームにコンパイルする一般的な方法を示す。
我々のコンパイラは任意の量子同型暗号スキームを使用する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:45:44 GMT)
VPTR: Efficient Transformers for Video Prediction [14.7] 本稿では,効率的な局所的空間的時間的分離注意機構に基づく,映像の将来のフレーム予測のためのトランスフォーマーブロックを提案する。
この新しいトランスフォーマーブロックに基づいて,トランスフォーマーの完全自己回帰映像フレーム予測を提案する。
自動回帰ビデオ予測変換器も提案され、推論速度を向上し、自己回帰ビデオの累積推論誤差を低減する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:09:09 GMT)
Learning neural audio features without supervision [14.5] 本稿では、下流分類のための主要なアーキテクチャと協調して、事前学習可能な両方のアプローチを組み合わせる可能性について検討する。
教師付きおよび自己教師型設定で使用する場合,学習コンポーネントの特性の重大な違いを明らかにする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:59:08 GMT)
Fine-tuning Image Transformers using Learnable Memory [14.5] 学習可能なメモリトークンを用いた視覚変換器モデルの拡張を提案する。
当社のアプローチでは,パラメータの少ないモデルで,新たなタスクに適応することが可能です。
層ごとのトークン数が少ないモデルの拡張は精度を著しく向上させることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:26:20 GMT)
Neural Face Video Compression using Multiple Views [14.4] 深部生成モデルの最近の進歩は、ニューラルフェイスビデオ圧縮コーデックの開発につながった。
これらのニューラルコーデックは、ソースフレームをワープし、生成モデルを使用して、歪んだソースフレームの欠陥を補うことにより、現在のフレームを再構築する。
ここでは、複数のソースフレーム(顔のビュー)に依存して、奨励的な結果を提供することにより、この問題に対処することを目指している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:56:51 GMT)
Self-Supervised Leaf Segmentation under Complex Lighting Conditions [14.3] 葉のセグメンテーションはイメージベース植物表現において必須の前提条件である。
本稿では,自己教師付きセマンティックセマンティックセマンティクスモデル,色に基づくリーフセマンティクスアルゴリズム,および自己教師型色補正モデルからなる自己教師型リーフセマンティクスフレームワークを提案する。
異なる植物種のデータセットに対する実験結果は、提案された自己管理フレームワークの可能性を示している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:59:02 GMT)
Robust, Automated, and Accurate Black-box Variational Inference [14.1] Black-box Variational Inference (BBVI)は、機械学習と統計学で広く使われている。
信頼性のあるBBVI最適化のためのフレームワークであるRSABBVIを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 23:05:40 GMT)
4-bit Conformer with Native Quantization Aware Training for Speech
Recognition [14.0] そこで本研究では,ネイティブ整数演算を応用し,学習と推論の両方を効果的に最適化する,ネイティブ量子化を考慮した4ビットASRモデルを提案する。
提案した量子化手法を評価するために,最先端のコンフォーマーベースASRモデルに関する2つの実験を行った。
大規模データセットでトレーニングされた実用的なASRシステムにおいて、4ビット量子化が実現可能であることを初めて調査し明らかにした。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 23:57:15 GMT)
Shallow Fusion of Weighted Finite-State Transducer and Language Model
for Text Normalization [13.9] ルールベースとニューラルシステムの利点を組み合わせた新しいハイブリッドアプローチを提案する。
まず、非決定論的WFSTはすべての正規化候補を出力し、次にニューラルネットワークモデルが最良の候補を選択する。
既存の最先端のTNモデルに匹敵する、あるいは優れた結果が得られる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 21:34:35 GMT)
An EEG-Based Multi-Modal Emotion Database with Both Posed and Authentic
Facial Actions for Emotion Analysis [13.4] 本稿では,表情,行動単位,脳波を同時に収集し,新しいデータベースを構築することを提案する。
データベースは研究コミュニティに公開され、自動感情認識のための最先端の技術を推進します。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:02:12 GMT)
Periocular Biometrics and its Relevance to Partially Masked Faces: A
Survey [13.4] 顔認識システムは、マスクやその他の種類の顔カバーの存在に悪影響を及ぼす可能性がある。
このような場合、人間の顔の周囲の領域は重要な生体認証のキューとなる。
まず、顔マスクを装着した人間を認識するために特別に設計された様々な顔・近眼技術について検討する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:52:42 GMT)
Self-Supervised Light Field Depth Estimation Using Epipolar Plane Images [13.1] 光深度推定のための自己教師付き学習フレームワークを提案する。
提案手法は,他の最先端手法と比較して,実世界のシナリオにおいて高品質な結果を得ることができる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:18:59 GMT)
Heuristic-based Inter-training to Improve Few-shot Multi-perspective
Dialog Summarization [13.1] サポートエージェントと顧客間のカスタマーケア会話の多面的要約について検討する。
提案手法は,アノテートデータの少ない多視点要約を生成するモデルをサポートすることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:02:40 GMT)
Algebraic Reasoning of Quantum Programs via Non-idempotent Kleene
Algebra [11.1] クリーネ代数に基づく古典的プログラム解析の成功に触発された量子プログラムの推論について検討する。
等等法則や古典的テストの優れた性質を含むKATの重要な特徴は、量子プログラムの文脈において保持されない。
本論文は,NKAの完全・音声意味モデルを特定するための自然な代替案として,NKA(Non-idempotent Kleene Algebra)を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:27:57 GMT)
Photographic Visualization of Weather Forecasts with Generative
Adversarial Networks [11.0] 本研究では,将来的な気象状況の可視化に写真画像を用いた新しい手法を提案する。
数値気象予測(NWP)モデルの解析と予測状態に基づいて、ジェネレータネットワークは、現在のカメライメージを未来へと変換する。
実写画像と実写画像とを区別することが困難であることを示し、ランダムに推測した場合よりも性能が良くないことを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:10:29 GMT)
Multi-Agent Asynchronous Cooperation with Hierarchical Reinforcement
Learning [10.9] 非同期マルチエージェントオプションに対してポリシー勾配を最適化する数学的枠組みを提案する。
本手法は, 相互依存レベルが異なる多エージェント協調構成の集合を用いて検討する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:02:28 GMT)
Balanced Multimodal Learning via On-the-fly Gradient Modulation [10.6] マルチモーダル学習は、異なる感覚を統合することで、世界を包括的に理解するのに役立つ。
学習目標に対する貢献の相違をモニタリングすることで,各モードの最適化を適応的に制御するオンザフライ勾配変調を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:26:38 GMT)
Image Segmentation with Adaptive Spatial Priors from Joint Registration [10.5] 大腿筋画像では、異なる筋肉が束ねられ、その間に明確な境界が存在しないことが多い。
関節登録から適応的な空間的先行性を持つセグメンテーションモデルを提案する。
人工大腿筋MR画像の合成モデルと大腿筋MR画像について検討した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:29:59 GMT)
A Style-aware Discriminator for Controllable Image Translation [10.3] 現在の画像から画像への変換は、トレーニング中に使用されるクラス以外の出力領域を制御しない。
本稿では,批判的かつ条件を提供するスタイルとして機能するスタイル認識型識別器を提案する。
複数のデータセットの実験では、提案モデルが現在の最先端画像から画像への変換方法より優れていることが確認されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:13:33 GMT)
Zero-shot meta-learning for small-scale data from human subjects [10.3] 我々は,サンプル外テストデータに対する限られたトレーニングデータを用いて,新しい予測タスクに迅速に適応するフレームワークを開発した。
本モデルでは, 介入による遅延処理効果を学習し, 設計上はマルチタスク予測を自然に処理できる。
我々のモデルは、より広い人口への小型人間研究の一般化を向上するために重要である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:42:04 GMT)
Neural representation of a time optimal, constant acceleration
rendezvous [10.2] 我々は、最適政策(すなわち最適な推力方向)と値関数(すなわち飛行時間)の両方を表現するために、時間最適で一定加速度の低推力ランデブーをニューラルネットワークで訓練する。
あらゆるケースにおいて、アキュラシーはランデブーと飛行予測の時間に成功する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:40:50 GMT)
Transfer Learning Framework for Low-Resource Text-to-Speech using a
Large-Scale Unlabeled Speech Corpus [10.2] テキスト音声(TTS)モデルのトレーニングには,大規模テキストラベル付き音声コーパスが必要となる。
本稿では、事前学習に大量のラベルなし音声データセットを利用するTSの転送学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:26:56 GMT)
Representing `how you say' with `what you say': English corpus of
focused speech and text reflecting corresponding implications [10.1] 音声通信では、何かが語られる方法(パラ言語情報)は、何を言うか(言語情報)と同じくらい重要である
現在の音声翻訳システムは、発話が言語的に同一であれば、同じ翻訳を返す。
本稿では,語彙・文法機器を用いて,言語領域にパラ言語情報をマッピングする手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:29:22 GMT)
Learning Structured Gaussians to Approximate Deep Ensembles [10.1] 本稿では,スパース構造多変量ガウシアンを用いて,高密度画像予測タスクのための閉形式近似器を提案する。
正規分布における予測の不確かさと構造的相関を、サンプリング単独で暗黙的にではなく、明示的に捉える。
単分子深度推定におけるアプローチの利点を実証し,本手法の利点が同等の定量的性能で得られることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:34:43 GMT)
Coarse to Fine: Image Restoration Boosted by Multi-Scale Low-Rank Tensor
Completion [10.0] 本稿では,部分的に観察されたテンソルを粗い方法で復元する画像復元手法を提案する。
提案したC2F方式の優位性を実証するために実験を行った。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:01:57 GMT)
Agreement or Disagreement in Noise-tolerant Mutual Learning? [9.9] 本稿では,MLCという耐雑音性フレームワークをエンドツーエンドに提案する。
二重ネットワークを分岐正則化で調整し、機構の有効性を保証する。
提案手法は,ノイズデータを用いてネットワークの精度,一般化,堅牢性を向上させる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:00:51 GMT)
Auditing Privacy Defenses in Federated Learning via Generative Gradient
Leakage [9.8] Federated Learning (FL)フレームワークは、分散学習システムにプライバシーの利点をもたらす。
近年の研究では、共有情報を通じて個人情報を漏洩させることが報告されている。
我々は,GGL(Generative Gradient Leakage)と呼ばれる新しいタイプのリーク手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:59:59 GMT)
Thin-Plate Spline Motion Model for Image Animation [9.6] イメージアニメーションは、ドライビングビデオに従って、ソースイメージ内の静的オブジェクトに生命をもたらす。
近年の研究では、事前知識を使わずに、教師なし手法による任意の物体の移動を試みている。
ソース内のオブジェクトと駆動イメージの間に大きなポーズギャップがある場合、現在の教師なしメソッドにとって、これは依然として重要な課題である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:06:26 GMT)
Graph Neural Networks in IoT: A Survey [9.3] IoT(Internet of Things)ブームは、人々の日常生活のほぼすべての部分に革命をもたらした。
ディープラーニングモデルは、IoTタスクの解決に広く採用されている。
グラフニューラルネットワーク(GNN)は、多くのIoT学習タスクで最先端の結果を達成するために実証されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:27:59 GMT)
Causal de Finetti: On the Identification of Invariant Causal Structure
in Exchangeable Data [9.3] 不変因果構造を学習するには、条件付き独立テストと独立および同一の分散データの仮定に依存することが多い。
これらのアプローチは、原因機構が与えられた原因機構から独立であることを示す独立因果機構(ICM)原理に基づいている。
ここでは、ICMの原理を初めて統計的に定式化したCausal de Finettiを紹介する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:10:39 GMT)
Efficient Hybrid Network: Inducting Scattering Features [9.1] 効率的なハイブリッドネットワーク(E-HybridNet)を導入する。
さまざまなデータセットにおいて、従来よりも一貫してパフォーマンスが向上している。
我々の手法は、学習した特徴の柔軟性とパワー、散乱表現の安定性と予測可能性という2つの世界のベストをうまく組み合わせている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:33:59 GMT)
An Overview & Analysis of Sequence-to-Sequence Emotional Voice
Conversion [8.9] EVCの課題を克服するための競争パラダイムとして、シーケンス・ツー・シーケンス・モデリングが登場しています。
近年のシークエンス・ツー・シークエンスECV論文を6つの視点から検討・レビューした。
この情報は、研究コミュニティに現在の最先端の分かりやすい概要を提供するために組織されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:41:34 GMT)
Efficient Localness Transformer for Smart Sensor-Based Energy
Disaggregation [8.8] 非侵襲負荷モニタリング(NILM)のための効率的な局所性変換器を提案する。
具体的には正規化関数を利用し、行列乗算の順序を近似自己アテンションに切り替える。
提案するELTransformerの有効性と有効性は,最先端のベースラインと比較して著しく向上した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:58:39 GMT)
UnShadowNet: Illumination Critic Guided Contrastive Learning For Shadow
Removal [8.8] 弱教師付きシャドウ除去フレームワークUnShadowNetを導入する。
イルミネーションネットワークの誘導の下で抽出された影を除去するDeShadowerネットワークで構成されている。
完全に教師された設定に容易に拡張でき、利用可能な場合の地平を活用できる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:17:02 GMT)
Stochastic Conservative Contextual Linear Bandits [8.7] 不確実性の下での安全なリアルタイム意思決定の問題について検討する。
我々は、リアルタイム意思決定のための保守的な文脈的帯域幅の定式化を定式化する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:50:50 GMT)
Infrared and Visible Image Fusion via Interactive Compensatory Attention
Adversarial Learning [8.0] 本稿では, 融合バランスを改善するために, 生成的対角訓練に基づく新しいエンド・ツー・エンド・モードを提案する。
特にジェネレータでは、トリプルパスを持つマルチレベルエンコーダデコーダネットワークを構築し、赤外線および可視経路を採用し、さらなる強度と情報勾配を提供する。
さらに、二重判別器は、融合した結果とソース画像の類似した分布を特定するように設計されており、生成器はよりバランスの取れた結果を生成するように最適化されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:28:14 GMT)
Gaussian Control Barrier Functions : A Non-Parametric Paradigm to Safety [7.9] ガウス過程(GP)を用いたCBFのオンライン合成のための非パラメトリック手法を提案する。
GPは解析的トラクタビリティやロバストな不確実性推定などの非パラメトリック性に加えて、好ましい性質を持つ。
固定的かつ任意の安全な集合に対する安全な制御を実証することにより、クワッド上で実験により検証する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:21:28 GMT)
Shifted Chunk Encoder for Transformer Based Streaming End-to-End ASR [7.8] E2E ASRをストリーミングするための3つの側面の利点を享受するために、単一のモデルを構築します。
我々は、Shifted Chunk Transformer と Conformer をそれぞれ SChunk-Transofromer と SChunk-Conformer と命名した。
実験の結果、SChunk-TransformerとSChunk-ConformerはそれぞれCER 6.43%と5.77%を達成した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:02:35 GMT)
CAT-Net: A Cross-Slice Attention Transformer Model for Prostate Zonal
Segmentation in MRI [7.8] 本稿では,トランスフォーマーモジュールを用いて,異なるスケールでクロススライス関係を体系的に学習する,新しいクロススライスアテンション機構を提案する。
実験により, 前立腺領域分割におけるクロススライス情報の収集が可能であることが確認された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 00:50:54 GMT)
Applying Syntax$\unicode{x2013}$Prosody Mapping Hypothesis and Prosodic
Well-Formedness Constraints to Neural Sequence-to-Sequence Speech Synthesis [7.6] エンドツーエンドのテキスト音声(TTS)は、テキストや音素の文字列から直接音声を生成する。
本研究は,音韻的制約に基づき,リズミカル言語学を再現できるかどうかを考察する。
学習データに明示的に含まれていない試験データ中の音韻現象を効率よく合成するモデルを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:45:28 GMT)
Convergence and Complexity of Stochastic Subgradient Methods with
Dependent Data for Nonconvex Optimization [7.5] 一般データサンプリング方式では,弱凸関数に対する古典的および近位下降法が最悪のケース収束率を有することを示す。
最適収束保証率と適応的なステップサイズを持つ投影勾配法に基づく従属データに対する最初のオンライン非行列分解アルゴリズムを得る。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:59:10 GMT)
SAR-ShipNet: SAR-Ship Detection Neural Network via Bidirectional
Coordinate Attention and Multi-resolution Feature Fusion [7.3] 本稿では,ニューラルネットワークによる合成開口レーダ(SAR)画像から,事実上有意義な船舶検出問題について検討する。
本稿では,CentralNetに基づく双方向協調注意(BCA)とMRF(Multi- resolution Feature Fusion)を新たに開発したSAR-ShipNet(略してSAR-ShipNet)を提案する。
パブリックなSAR-Shipデータセットの実験結果から,SAR-ShipNetは速度と精度の両面で競争上の優位性を達成していることがわかった。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:27:04 GMT)
When to Go, and When to Explore: The Benefit of Post-Exploration in
Intrinsic Motivation [7.0] Go-Exploreは、低報酬の強化学習(RL)タスクにおいて画期的なパフォーマンスを達成した。
目標達成後の探査を「後探査」と呼ぶ。
我々は,いつまで,いつまで,いつまで,いつまで,いつまでかかるかを適応的に決定する新しい手法を導入する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:50:12 GMT)
Exact Community Recovery in Correlated Stochastic Block Models [6.7] 複数の相関ネットワークから潜在コミュニティ構造を学習する問題について検討する。
本研究の主な成果は,複数の相関グラフを用いた正確なコミュニティ回復のための正確な情報理論しきい値の導出である。
コミュニティリカバリとグラフマッチング文献からアルゴリズムを慎重に合成する新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:44:38 GMT)
Category Guided Attention Network for Brain Tumor Segmentation in MRI [6.7] カテゴリー案内注意U-Net(CGA U-Net)という新しいセグメンテーションネットワークを提案する。
本モデルでは,より正確かつ安定した特徴写像の長距離依存性を計算コストを伴わずに捉えることのできる,注目機構に基づくスーパービジョンアテンションモジュール(SAM)を設計する。
BraTS 2019データセットの実験的結果は、提案手法がセグメント化性能と計算複雑性の両方において最先端のアルゴリズムより優れていることを示している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:22:29 GMT)
Noise assisted quantum coherence protection in hierarchical environment [6.5] 雑音を利用した階層環境に結合した量子系のコヒーレンス保護について検討する。
コヒーレンス保護の数学的メカニズムを解析することにより、より長い記憶時間を持つ非マルコフノイズによるデコヒーレンスを、より短い記憶時間を持つ別のマルコフノイズによって抑制できることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:42:49 GMT)
AnoDFDNet: A Deep Feature Difference Network for Anomaly Detection [6.5] 本稿では,畳み込みニューラルネットワークと視覚変換器を用いた高速列車画像の新たな異常検出(AD)手法を提案する。
提案手法は,同じ領域の異なる時間に撮影された2つの画像の異常な差を検出する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 02:24:58 GMT)
Universal control of superexchange in linear triple quantum dots with an
empty mediator [6.2] 超交換は、量子コンピューティングのための遠方スピン間の長距離相互作用を実現するための重要な資源である。
左点と右点をそれぞれ1つの電子で占有する線形三量子ドットデバイスについて検討した。
線形三量子ドットデバイスにおける非局在化二電子状態の簡単な構成でさえ、非自明な振る舞いで超交換エネルギーを示すことを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:01:48 GMT)
Text-Driven Video Acceleration: A Weakly-Supervised Reinforcement
Learning Method [6.2] 本稿では,テキストを用いた指導ビデオの高速化を目的とした,弱教師付き手法を提案する。
新たな共同報酬関数がエージェントを誘導し、どのフレームから入力ビデオを取り除き、ターゲット長に減らすかを選択する。
また,高度に識別可能な埋め込み空間を生成可能な拡張視覚誘導型文書注意ネットワーク(VDAN+)を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:43:01 GMT)
Topological Atomic Spinwave Lattices by Dissipative Couplings [6.1] 散逸結合の最近の実験的進歩は、工学的エキゾチック格子システムのための新しい経路を提供する。
我々はSu-Schrieffer-Heeger(SSH)モデルの散逸版を実験的に実現した。
我々は電磁誘導透明性分光法(EIT)を用いてトポロジカル格子あるいは自明格子の散逸スペクトルを構築する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:05:35 GMT)
A Principle-based Ethical Assurance Argument for AI and Autonomous
Systems [6.1] 保証事例手法と目標構造化表記法(GSN)について検討する。
AI/ASの設計と展開を導くための4つの中核的な倫理原則について説明する。
私たちはこれを原則に基づく倫理保証のパターンと呼んでいる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:08:03 GMT)
Machine Composition of Korean Music via Topological Data Analysis and
Artificial Neural Network [6.1] 楽曲を直接供給するのではなく、所定の音楽データに埋め込まれた作曲原理を機械に教える機械合成法を提案する。
ColorblackOverlap行列は、新しい楽曲をアルゴリズムで合成し、目的の人工ニューラルネットワークに向けてシード音楽を提供する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:11:31 GMT)
Pareto Set Learning for Neural Multi-objective Combinatorial
Optimization [6.1] 多目的最適化(MOCO)の問題は、現実世界の多くのアプリケーションで見られる。
我々は,与えられたMOCO問題に対するパレート集合全体を,探索手順を伴わずに近似する学習ベースアプローチを開発した。
提案手法は,多目的走行セールスマン問題,マルチコンディショニング車両ルーティング問題,複数クナップサック問題において,ソリューションの品質,速度,モデル効率の面で,他の方法よりも優れていた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:26:22 GMT)
Self-Contrastive Learning based Semi-Supervised Radio Modulation
Classification [6.1] 本稿では,自動変調分類(AMC)のための半教師付き学習フレームワークを提案する。
自己教師付きコントラスト学習事前学習ステップを用いてラベル付き信号データを慎重に利用することにより,少ないラベル付きデータに対して高い性能を実現する。
公開データセットを用いた半教師付きフレームワークの性能評価を行った。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:21:14 GMT)
Floquet topological properties in the Non-Hermitian long-range system
with complex hopping amplitudes [6.0] 近年、浮き彫りの段階が注目されている。
ホッピング振幅の位相変化はトポロジカル位相遷移を引き起こす。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:04:44 GMT)
A Multi-size Kernel based Adaptive Convolutional Neural Network for
Bearing Fault Diagnosis [5.8] マルチサイズカーネルを用いた適応畳み込みニューラルネットワーク(MSKACNN)と呼ばれる軸受振動特性に基づくデータ駆動型診断アルゴリズムを提案する。
MSKACNNは振動特徴学習と信号分類機能を提供し、ベアリング障害を特定し解析する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:43:30 GMT)
A Framework for Quantum Ray Tracing [5.3] レイトレーシングアルゴリズムは、大量のレイの物理的な動きをシミュレートし、高品質な画像を描画する。
本稿では,古典的経路追跡よりも2次高速化された量子線トレーシングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:45:11 GMT)
Domain Invariant Siamese Attention Mask for Small Object Change
Detection via Everyday Indoor Robot Navigation [5.2] 日常的な屋内ロボットナビゲーションによる画像変化検出の課題を,新しい視点から検討する。
本研究では,教師なしのオンザフライドメイン適応機能を備えた新たな自己注意手法を提案する。
実験により,我々の注目技術は最先端の画像変化検出モデルを大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:57:56 GMT)
AutoCoMet: Smart Neural Architecture Search via Co-Regulated Shaping
Reinforcement [5.0] AutoCoMetは、さまざまなタイプのデバイスハードウェアとタスクコンテキストに最適化された最も適切なディープモデルアーキテクチャを3倍高速に学習する。
我々は,高忠実度ハードウェアメタビヘイビア予測器と協調して,スマートで高速なNASフレームワークを構築した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:11:22 GMT)
Nix-TTS: An Incredibly Lightweight End-to-End Text-to-Speech Model via
Non End-to-End Distillation [5.0] 我々は,軽量なニューラルTS(Text-to-Speech)モデルであるNix-TTSを提案する。
我々は、知識蒸留を、強力ながら大規模なTTS教師モデルに適用する。
Nix-TTSはエンド・ツー・エンド(ヴォコーダフリー)で、5.23Mのパラメータしか持たない。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:04:26 GMT)
Transformer Network-based Reinforcement Learning Method for Power
Distribution Network (PDN) Optimization of High Bandwidth Memory (HBM) [4.8] 高帯域メモリ(HBM)の電力分散ネットワーク(PDN)最適化のための変圧器ネットワークに基づく強化学習(RL)手法を提案する。
提案手法は,複数のポートで見られるPDN自己転送の低減を最大化するために,最適なデカップリングコンデンサ(デキャップ)設計を提供する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:27:54 GMT)
Improved Counting and Localization from Density Maps for Object
Detection in 2D and 3D Microscopy Imaging [4.7] 密度マップから対象をカウント・ローカライズする別の方法を提案する。
その結果,2次元および3次元顕微鏡データにおけるオブジェクトのカウントとローカライゼーションの性能が向上した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:54:19 GMT)
Analysis of EEG frequency bands for Envisioned Speech Recognition [4.7] 脳波の周波数帯と脳の異なる葉から得られる信号の意義を分析することを目的としている。
分類精度は, それぞれ85.93%, 87.27%, 87.51%である。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:50:09 GMT)
TransGAN: a Transductive Adversarial Model for Novelty Detection [4.6] ノベルティ検出の一般的な設定は、トレーニング期間中に負のクラスの例のみが利用可能となる誘導的である。
一方、トランスダクティブノベルティ検出は、最近の関心の高まりを目撃したばかりでなく、トレーニング中に負のクラスを利用するだけでなく、新しい例を検出するための(ラベルのない)テストセットも組み込んでいる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:08:07 GMT)
Learning to act: a Reinforcement Learning approach to recommend the best
next activities [4.5] 本稿では,過去の実行を観察する上で最適な政策である強化学習を用いて学習するアプローチについて検討する。
このアプローチの可能性は、実生活データから得られた2つのシナリオで実証されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:43:39 GMT)
Identification and classification of exfoliated graphene flakes from
microscopy images using a hierarchical deep convolutional neural network [4.5] 本稿では,Si/SiO2基板上に剥離したグラフェンフレークの厚さを自動的に同定し,分類する深層学習手法を提案する。
提案手法は階層的な深部畳み込みニューラルネットワークを用いて,従来の画像からの知識を保ちながら,新たなイメージを学習することができる。
その結果, 深層学習モデルでは, 抽出したグラフェンフレークの識別と分類に最大99%の精度が得られた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:54:06 GMT)
Efficiently Evolving Swarm Behaviors Using Grammatical Evolution With
PPA-style Behavior Trees [4.1] 人工エージェントによるSwarmの動作の進化は、計算コストが高く、困難である。
本稿では, PPA(Postcondition-Precondition-Action)標準行動木(BT)と文法的進化(BT)を体系的に組み合わせることで, 群集の挙動を進化させる。
進化するアルゴリズムは、前回の作業よりも8倍改善された、飼料と巣のメンテナンスタスクの学習試行の75%に成功しました。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:36:50 GMT)
Smooth Robust Tensor Completion for Background/Foreground Separation
with Missing Pixels: Novel Algorithm with Convergence Guarantee [4.1] 本研究の目的は,画素不足による背景・地上分離の問題に対処することである。
これを実現するために、スムーズなテンソルロバスト補完(SRTC)モデルを提案し、データを静的な背景と滑らかな前景に分解する。
実データを用いた実験により, 提案手法は, 背景・地上分離と画素の欠落に対して, 最先端の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:28:27 GMT)
A Multi-Stage Duplex Fusion ConvNet for Aerial Scene Classification [4.1] マルチステージ二重核融合ネットワーク (MSDF-Net) を開発した。
MSDF-NetはDFblockを備えた多段構造で構成されている。
広範に使用されている3つの航空シーン分類ベンチマークで実験が行われた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:27:53 GMT)
Revisiting Neighborhood-based Link Prediction for Collaborative
Filtering [3.7] 協調フィルタリングはレコメンデーションシステムにおいて最も成功し基礎的な手法の1つである。
両部グラフの新しいリンク(接続性)スコアを提案し、複数の標準リンク予測手法を一般化する。
提案手法は,既存のGNNベースのCFアプローチを,広く使用されている4つのベンチマークで大幅に上回っている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:48:05 GMT)
Alignment-Uniformity aware Representation Learning for Zero-shot Video
Classification [3.7] 本稿では,目に見えるクラスと目に見えないクラスの両方の表現に対して,アライメントと均一性を保ったエンドツーエンドフレームワークを提案する。
実験の結果,UCF101では28.1%,HMDB51では27.0%,SOTAでは28.1%が有意に向上した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:21:22 GMT)
Parameterized Consistency Learning-based Deep Polynomial Chaos Neural
Network Method for Reliability Analysis in Aerospace Engineering [3.5] ポリノミアルカオス展開(PCE)は航空宇宙工学における強力な代理モデル信頼性解析手法である。
そこで本研究では,パラメータ化された一貫性学習に基づく深層カオスニューラルネットワーク(Deep PCNN)手法を提案する。
Deep PCNN法は、高次PCEモデルを構築する際のトレーニングデータコストを大幅に削減することができる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:15:12 GMT)
SurvCaus : Representation Balancing for Survival Causal Inference [3.4] 多くの病理学では、関心の結果は(おそらく検閲された)生存時間である。
本稿では,生存環境における現実的推論に適用可能な表現バランスフレームワークの理論的保証を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:33:55 GMT)
Requirements Elicitation in Cognitive Service for Recommendation [3.3] 本稿では,ユーザ要求適応フレームワーク(URef)と,注意に基づく応答生成モデルSaRSNetを提案する。
オープンデータセットemphDuRecDialの実験結果は,ベースラインと比較して大幅に改善されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:44:59 GMT)
Assessing Evolutionary Terrain Generation Methods for Curriculum
Reinforcement Learning [3.2] CPPN と GAN の2つの間接符号化との比較を行った。
生成した地形メッシュから直接メトリクスを計算するMAP-Elites特徴記述子の影響を評価する。
結果は,カリキュラム学習における利用を通知するジェネレータ間の重要な違いを解説し,コミュニティの獲得に有用な特徴記述器を提示する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:26:15 GMT)
An Evaluation Dataset for Legal Word Embedding: A Case Study On Chinese
Codex [3.2] 単語埋め込みは、多くの自然言語処理タスクで広く使われている現代の分散語表現である。
本稿では,5種類の法的関係を利用して,2,388の中国語コーパスから1,134の法的アナロジカル推論質問セット(LARQS)を確立することを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:26:26 GMT)
Sparse Image based Navigation Architecture to Mitigate the need of
precise Localization in Mobile Robots [3.2] 本稿では,スパース画像を用いた自律走行を追求する移動ロボットの正確な位置決めの必要性を軽減することに焦点を当てる。
提案手法は,教師なし学習のためのモデルアーキテクチャであるRoomNetで構成され,環境の粗い同定を行う。
後者はスパース画像マッチングを用いて、マッピングおよびトレーニング段階においてロボットが見たフレームをvis-a-visで達成したフレームの類似性を特徴付ける。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:38:18 GMT)
ReIL: A Framework for Reinforced Intervention-based Imitation Learning [3.1] Reinforced Intervention-based Learning (ReIL) は、一般的な介入に基づく学習アルゴリズムとマルチタスク模倣学習モデルからなるフレームワークである。
実世界の移動ロボットナビゲーションの課題による実験結果から、ReILは性能の劣化に悩まされることなく、緩やかな監督補正から素早く学習できることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:30:26 GMT)
syslrn: Learning What to Monitor for Efficient Anomaly Detection [3.1] syslrnは、まずターゲットシステムの理解をオフラインで構築し、学習した通常の振る舞いの識別子に基づいてオンライン監視機器を調整するシステムである。
本稿では,障害のモニタリングを行うケーススタディにおいて,オーバーヘッドが少なく,最先端のログ分析システムより優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:10:06 GMT)
Cross-Media Scientific Research Achievements Retrieval Based on Deep
Language Model [2.9] 本稿では,深層言語モデル(CARDL)に基づくマルチメディア科学研究成果検索手法を提案する。
異なるモーダルデータ間のセマンティックアソシエーションを学習することにより、統合されたメディア間セマンティック表現を実現する。
異なるモーダルデータ間のセマンティックな類似性マッチングにより、クロスメディア検索を実現する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:04:53 GMT)
SuperMVS: Non-Uniform Cost Volume For High-Resolution Multi-View Stereo [2.6] 本研究では, 広い深度範囲における動的および非一様サンプリングのための自由移動仮説平面法を提案する。
非均一なコストボリュームを持つマルチビューステレオを実現するために,スーパーMVSネットワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:19:59 GMT)
ACR Loss: Adaptive Coordinate-based Regression Loss for Face Alignment [2.5] 顔アライメントのためのCBRの精度を向上させるために,適応コーディネートベース回帰(ACR)損失を提案する。
ACRロスは、顔の各ランドマークポイントを予測する難易度に基づいて、その曲率と損失の影響を適応的に修正することができる。
顔画像における顔のランドマーク点の予測におけるACRロスの有効性について検討した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:08:46 GMT)
Constructing Effective Customer Feedback Systems -- A Design Science
Study Leveraging Blockchain Technology [2.0] この作業は、顧客フィードバックシステム(CFS)の設計原則に貢献する。
特定の組織的目的に応じてコンテキスト化されたフィードバックによって、現在のシステムを進化させるCFSを実装している。
また、ブロックチェーンベースのインセンティブを使用して、CFSの使用をサポートする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:59:16 GMT)
CNN Filter DB: An Empirical Investigation of Trained Convolutional
Filters [2.0] モデル事前学習は、サイズと分散条件を満たす場合、任意のデータセットで成功することを示す。
事前学習された多くのモデルには、劣化したフィルタが含まれており、それによって、より堅牢で、ターゲットアプリケーションの微調整に適さないことが示される。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:25:42 GMT)
Indoor SLAM Using a Foot-mounted IMU and the local Magnetic Field [2.0] このアルゴリズムは、モーションマップと磁場マップという2つのマップを使用する。
モーションマップは、廊下やドアで制約された建物内の歩行者の典型的な動きパターンをキャプチャする。
その結果,屋内環境における歩行者の局所化におけるアルゴリズムの有効性が示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:18:02 GMT)
A Naturalistic Database of Thermal Emotional Facial Expressions and
Effects of Induced Emotions on Memory [1.8] 本研究は、感情的内容の高い映画抜粋の視覚を通して、自然に誘発される感情的表情を収集する手順を定義する。
引き起こされた感情状態には、悲しみ、嫌悪、幸福、驚きの4つの基本的な感情が含まれる。
得られたデータベースは、熱的および可視的な感情的表情の両方を含む。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:17:35 GMT)
Can NMT Understand Me? Towards Perturbation-based Evaluation of NMT
Models for Code Generation [1.8] NMTモデルの堅牢性を検証するための重要なステップは、その性能を逆入力で評価することである。
本研究では,そのようなモデルのロバスト性評価に適した摂動と測定値のセットを同定する。
モデルにどのような摂動が最も影響を与えるかを示す予備実験を行った。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:01:39 GMT)
Photon-pair blockade in a Josephson-photonics circuit with two
nondegenerate microwave resonators [1.8] ジョゼフソンフォトニクス回路において光子対封鎖を生成することを提案する。
本研究は、光子対の明るいマイクロ波源を製造するための実用的な方法を提供する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:11:51 GMT)
Classification of Hyperspectral Images Using SVM with Shape-adaptive
Reconstruction and Smoothed Total Variation [1.7] ハイパースペクトル画像の分類のために,形状適応再構成と平滑化トータル変分(SaR-SVM-STV)を用いたSVMという新しいアルゴリズムを導入した。
SaR-SVM-STVは、SVM-STV法よりもいくつかのトレーニングラベルで優れている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:39:21 GMT)
The Inefficiency of Language Models in Scholarly Retrieval: An
Experimental Walk-through [1.6] 本稿では,短文処理における科学言語モデルの評価を行う。
我々は、元のテキストに小さな摂動によって生成されたテキスト隣り合いを活用し、すべての摂動が埋め込み空間に近接する隣人をもたらすわけではないことを実証する。
検索性能はテキストのセマンティクスよりも表面形状の影響を受けやすいことが判明した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:01:26 GMT)
Semantic properties of English nominal pluralization: Insights from word
embeddings [1.6] 英名多重化は意味クラスタを示すことを示す。
CosClassAvgと呼ばれるセマンティックインフォームドメソッドは、分散セマンティクスにおいて多重化メソッドより優れている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:42:47 GMT)
NNLander-VeriF: A Neural Network Formal Verification Framework for
Vision-Based Autonomous Aircraft Landing [1.5] ビジョンベースのNNコントローラは、滑走路に近づきながら、カメラから画像を処理して航空機を誘導する。
NNLander-VeriFは、自律着陸に使用されるビジョンベースのNNコントローラを検証するフレームワークである。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 18:18:53 GMT)
End-to-End Transformer Based Model for Image Captioning [1.4] Transformerベースのモデルはイメージキャプションをひとつのステージに統合し、エンドツーエンドのトレーニングを実現する。
モデルは138.2%(シングルモデル)と141.0%(4モデルのアンサンブル)の新しい最先端性能を達成する
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:47:46 GMT)
Towards Everyday Virtual Reality through Eye Tracking [1.3] 視線追跡は、人間の行動をリアルタイムで非侵襲的に評価する新しい技術である。
日常的なバーチャルリアリティーへの重要な科学的推進は、3つの主要な研究貢献によって完了した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:09:37 GMT)
Circuit encapsulation for efficient quantum computing based on
controlled many-body dynamics [1.0] 相互作用するスピンシステムの時間進化を制御することは、量子コンピューティングを実装するための重要なアプローチである。
量子回路カプセル化(QCE)を提案する。
QCEは、回路を物理的に実行可能な形式に変換する代替のコンパイルスキームを提供する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:53:19 GMT)
Stabilized Neural Ordinary Differential Equations for Long-Time
Forecasting of Dynamical Systems [1.0] 衝撃やカオス力学を正確に捉えたデータ駆動モデリング手法を提案する。
我々は、線形項と非線形項を学習する2つのNNの出力を加えることで、ODEの右辺(SRH)を学習する。
具体的には、疎線形畳み込みNNを訓練して線形項と高密度完全連結非線形NNを学習し、非線形項を学習する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:10:34 GMT)
Vision Transformers in Medical Computer Vision -- A Contemplative
Retrospection [1.0] ビジョントランスフォーマーは、コンピュータビジョンの分野で使われている最も現代的で支配的なアーキテクチャの1つとして進化している。
画像ベース疾患分類,解剖学的構造区分,登録,領域ベース病変検出,キャプション,レポート生成など,医療コンピュータビジョンのさまざまな領域におけるビジョントランスフォーマーの適用について調査した。
また、利用可能なデータセット、採用方法論、パフォーマンス対策、課題、ソリューションについても、議論の形で光を当てています。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:32:43 GMT)
Forecasting with Economic News [0.9] 我々は、関心の期間に意味的に依存する記事のテキストのみを考慮する。
経済センチメントのいくつかの指標が、ビジネスサイクルのゆらぎを密に追跡していることがわかった。
また、いくつかのマクロ経済変数の確率分布のテールを説明する上で、感情が重要であることも確認した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:46:42 GMT)
A Wavelet, AR and SVM based hybrid method for short-term wind speed
prediction [0.9] 風速時系列をウェーブレット分解法を用いて各種周波数成分に分割する。
周波数域に付随する成分は性質を示すため,自己回帰(AR)法でモデル化した。
その結果,単体ARモデルやSVMモデルと比較して風速予測の精度が向上した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:31:16 GMT)
Earnings-22: A Practical Benchmark for Accents in the Wild [0.8] Earnings-22は125のファイルで、119時間に119回の英語による決算報告を世界企業から集めています。
個々の単語誤り率(IWER)を調べることで、重要な音声特徴が特定のアクセントに対して、他のアクセントよりもモデル性能に影響を及ぼすことが分かる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:02:57 GMT)
Diffusion Models for Counterfactual Explanations [0.7] 本稿では,近年の拡散モデルを用いた対実画像生成手法であるDMEを提案する。
提案手法は, 誘導生成拡散過程を利用して, 対象分類器の勾配を用いて入力インスタンスの反実的説明を生成する方法を示す。
実験により,提案アルゴリズムはCelebAの6つの指標のうち5つに対して,前回のState-of-the-Art結果を上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:59:31 GMT)
Practical Aspects of Zero-Shot Learning [0.7] 複数の最先端のゼロショット学習手法を標準ベンチマークデータセットと比較する。
複数のメタ分類器が提案され、実験的に比較された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 00:34:55 GMT)
Local variational quantum compilation of a large-scale Hamiltonian
dynamics [0.6] 大規模量子システム上で時間進化演算子を正確にコンパイルできる局所変分量子コンパイル(LVQC)アルゴリズムを提案する。
LVQCは、そのような小さな量子システムを扱うことができる限定サイズの量子コンピュータや古典的なシミュレータで動作する。
1次元システムに対するLVQCアルゴリズムを数値的に示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:29:55 GMT)
Multiclass classification using quantum convolutional neural networks
with hybrid quantum-classical learning [0.6] 本稿では,量子畳み込みニューラルネットワークに基づく量子機械学習手法を提案する。
提案手法を用いて,MNISTデータセットの4クラス分類を,データエンコーディングの8つのキュービットと4つのアクニラキュービットを用いて実証する。
この結果から,学習可能なパラメータの数に匹敵する古典的畳み込みニューラルネットワークによる解の精度が示された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:07:18 GMT)
Protein language models trained on multiple sequence alignments learn
phylogenetic relationships [0.6] MSAトランスフォーマーの行アテンションの単純な組み合わせは、最先端の非教師なし構造接触予測に繋がった。
同様に単純で普遍的なMSAトランスフォーマーのカラムアテンションの組み合わせは、MSAのシーケンス間のハミング距離と強く相関していることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:07:45 GMT)
Dynamic Latency for CTC-Based Streaming Automatic Speech Recognition
With Emformer [0.5] 効率的な拡張メモリ変換器ブロックと動的遅延学習法を用いたフレームレベルモデルを用いて音声認識のストリーミングを行う。
平均レイテンシは640msであり,テストクリーンでは6.4%,他では3.0%,チャンクワイドトランスでは3.0%の相対的なWER削減を実現している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:31:06 GMT)
Efficient, ever-ready quantum memory at room temperature for single
photons [0.4] 量子メモリは大規模ネットワーク量子システムの重要な構成要素である。
50%以上のメモリ効率は、量子非閉鎖限界以上で動作する必要がある。
本稿では,共振器付き自発パラメトリックダウンコンバージョンからの単一光子の超低帯域帯域源とガスアンサンブル原子メモリの組み合わせについて検討する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:50:46 GMT)
Worldwide city transport typology prediction with sentence-BERT based
supervised learning via Wikipedia [0.0] 世界の人口の大半は都市部や都市に住んでいる。
市の類型学を理解する価値はあるものの、ラベル付きデータ(都市とその類型学)は乏しい。
ウィキペディアのページにある情報をもとに,都市の類型を予測するための教師付き機械学習手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 00:09:55 GMT)
Unraveling the temperature dynamics and hot electron generation in
tunable gap-plasmon metasurface absorbers [0.0] 極薄の金属ナノギャップで形成される局在プラズモンは、入射光の強い吸収を引き起こす。
この効果に基づくプラズモン準曲面は、熱電子としても知られるエネルギー的荷電担体を効率的に生成することができる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 20:51:14 GMT)
The variance of relative surprisal as single-shot quantifier [0.0] 我々は、(相対的な)前提条件が、単発設定における量子状態のペア間の近似状態遷移に十分な条件を与えることを示す。
さらに、(相対的な)エントロピーの、単純で物理的に魅力的な単一ショットのキャラクタリゼーションを導出する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:51:46 GMT)
Texture based Prototypical Network for Few-Shot Semantic Segmentation of
Forest Cover: Generalizing for Different Geographical Regions [0.0] 提案手法は,南アジアの熱帯林を同定し,中央ヨーロッパの温帯林を決定するために適応する。
1-way 1-shot) の森林群に対する0.62のIoUを提案手法を用いて取得し, 従来の少数ショットセマンティックセグメンテーション手法よりも有意に高い値(PANetは0.46)を示した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:48:17 GMT)
Spatiotemporal Patterns in Neurobiology: An Overview for Future
Artificial Intelligence [0.0] 我々は,ネットワーク相互作用から生じる機能を明らかにする上で,計算モデルが重要なツールであると主張している。
ここでは、スパイキングニューロン、統合ニューロン、発火ニューロンを含むいくつかのモデルのクラスについてレビューする。
これらの研究は、人工知能アルゴリズムの今後の発展と、脳のプロセスの理解の検証に役立つことを願っている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:28:01 GMT)
Simulating challenging correlated molecules and materials on the
Sycamore quantum processor [0.0] 複雑な分子や物質をシミュレーションすることは、量子デバイスに期待される応用である。
超伝導量子プロセッサ上での静的および動的電子構造をシミュレートする。
我々の研究は、量子優位性の人工的な測度を物理的に関連する設定に変換するのに役立ちます。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:11:40 GMT)
Selective inference for k-means clustering [0.0] k平均クラスタリングを用いて得られた一対のクラスタ間の差分に対する選択型I誤差を制御する有限サンプルp値を提案する。
提案手法をシミュレーションや手書き桁データ,シングルセルRNAシークエンシングデータに適用する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:28:12 GMT)
SHOP: A Deep Learning Based Pipeline for near Real-Time Detection of
Small Handheld Objects Present in Blurry Video [0.0] ハンドヘルドオブジェクトを含むぼやけた画像を確実に解釈するパイプラインであるSHOP(Small Handheld Object Pipeline)を提案する。
パイプラインの各段階で使用される具体的なモデルはフレキシブルで、パフォーマンス要件に基づいて変更可能である。
また、ハンドヘルドオブジェクトのみからなるMS COCOのサブセットを提示し、ハンドヘルドオブジェクト検出手法の開発を継続する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:31:30 GMT)
Restricted Boltzmann Machine Flows and The Critical Temperature of Ising
models [0.0] Boltzmann Machines (RBM) からの反復サンプリング(フロー)のための代替実験装置について検討する。
このフレームワークは、RBMベースのディープニューラルネットワークとRenormalization Group(RG)の間の接続を探索するために導入された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:56:50 GMT)
Radial Autoencoders for Enhanced Anomaly Detection [0.0] 異常や不正検出のような二段階の分類タスクでは、教師なしの手法はさらに改善される可能性がある。
異常検出の直感的なアプローチは、2つのクラスの質量の中心からの距離に基づいている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 20:07:30 GMT)
Quantum Computing with $\mathbb{Z}_2$ Abelian anyon system [0.0] トポロジカル量子コンピュータは、エキゾチックな交換統計を用いてトポロジカルな欠陥を操る。
本稿では,$mathbb$abelian anyonシステムに基づくトポロジカル量子コンピュータのプロトタイプについて報告する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:59:18 GMT)
Proposal for room-temperature quantum repeaters with nitrogen-vacancy
centers and optomechanics [0.0] 環境条件下で動作可能な 量子リピータアーキテクチャです
窒素空孔中心に基づく非低温スピン光子界面は室温でも優れたスピンコヒーレンス時間を有する。
オプトロメカニクスは、フォノン関連のデコヒーレンスを回避し、放出された光子が通信バンドに入ることを可能にする。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 00:36:55 GMT)
Physics-informed deep-learning applications to experimental fluid
mechanics [0.0] 低分解能および雑音測定による流れ場データの高分解能再構成は実験流体力学において重要である。
ディープラーニングのアプローチは、このような超高解像度なタスクに適していることが示されている。
本研究では,物理インフォームドニューラルネットワーク(PINN)を時間空間における流れ場データの超解像に適用する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:58:30 GMT)
Periodic orbit evaluation of a spectral statistic of quantum graphs
without the semiclassical limit [0.0] 半古典的極限のない周期軌道からカオス 4-正則量子グラフのスペクトル統計量を評価する。
半古典的な結果と、その構造に関係なく全軌道数とを結びつけるメカニズムを観察する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:20:30 GMT)
Optimizing the Production of Test Vehicles using Hybrid Constrained
Quantum Annealing [0.0] 本稿では,D-Wave によるハイブリッド制約2次モデル (CQM) の解法を用いて,満足度という枠組みの問題をモデル化し,その解法を提案する。
我々は、CQMソルバの性能は、テスト車両の数を最適化する古典的なソルバに匹敵するものであると結論付けた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:36:20 GMT)
Optical-force-mediated coupling between levitated nanospheres can go
ultrastrong [0.0] 隣接する2つの光ツイーザに閉じ込められた一対のナノ球の量子力学に対する光力による相互作用の影響について検討する。
ツイーザービームと他のナノスフィアによる弾性散乱光との干渉により、効果的なナノスフィア間カップリングは超強結合状態に達する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:54:08 GMT)
On Reinforcement Learning, Effect Handlers, and the State Monad [0.0] 本研究では,機能プログラムにおける意思決定抽象化を支援する手段として,エフェクトとハンドラについて検討する。
我々は,これらの操作のハンドラセットとして実装された強化学習アルゴリズムとして,その基盤となるインテリジェンスを表現している。
我々は、タイプとエフェクトハンドラがいかに安全性を確保できるかを示唆することで結論付けた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:46:58 GMT)
No-go theorems for deterministic purification and probabilistic
enhancement of coherence [0.0] 量子状態が不整合状態とコヒーレント状態の凸結合として表現できるならば、量子状態は決定論的に浄化できないことを証明する。
本研究は,実量子系における量子コヒーレンス理解に反するものである。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:02:31 GMT)
New insights into four-boson renormalization group limit cycles [0.0] 我々は、変分オートエンコーダの強化されたアンサンブルの潜在空間内で合成特異ポテンシャルの集団を生成する。
我々は、4つのボソンに対して極限サイクルを生成することを証明し、3つのボソン系において既に極限サイクルを生成することが知られている。
これはまた、4体の項が先行する順序で低エネルギーの観測値に入り込まないことを示唆している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:40:50 GMT)
NeuraGen-A Low-Resource Neural Network based approach for Gender
Classification [0.0] ELSDSRとTIMITデータセットから収集した音声記録を用いた。
我々は、8つの音声特徴を抽出し、その特徴を前処理し、その後NeuraGenに入力し、性別を特定した。
NeuraGenは90.7407%、F1スコア91.227%、20倍のクロス検証データセットを達成している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 05:57:24 GMT)
NL-FCOS: Improving FCOS through Non-Local Modules for Object Detection [0.0] FCOSヘッドと組み合わせた非局所モジュール(NL-FCOS)は実用的で効率的であることを示す。
衣服検出と手書き量認識問題における最先端性能を確立した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 15:00:14 GMT)
Min-Max Similarity: A Contrastive Learning Based Semi-Supervised
Learning Network for Surgical Tools Segmentation [0.0] コントラスト学習に基づく半教師付きセグメンテーションネットワークを提案する。
従来の最先端技術とは対照的に、両視点トレーニングの対照的な学習形式を導入する。
提案手法は、最先端の半教師付きおよび完全教師付きセグメンテーションアルゴリズムを一貫して上回る。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 01:40:26 GMT)
MQDD: Pre-training of Multimodal Question Duplicity Detection for
Software Engineering Domain [0.0] 本研究では,Stack Overflow Webサイトで収集されたデータを活用して,質問応答Webサイトの重複を検索するためのマルチモーダルモデルを事前トレーニングする,新たなパイプラインを提案する。
我々のマルチモーダルモデルは、複数のプログラミング言語の疑問記述とソースコードに基づいて訓練されている。
その結果、成熟した、微調整されたマルチモーダル質問重複検出(MQDD)モデルとなり、Stack Overflow検索システムに統合できる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:36:36 GMT)
ME-CapsNet: A Multi-Enhanced Capsule Networks with Routing Mechanism [0.0] 本研究は,各層の受容領域内の空間成分とチャネル成分の両面を高度に最適化する,新たなソリューションの実現に焦点をあてる。
我々は, カプセル層を戦略的に通過する前に重要な特徴を抽出するために, より深い畳み込み層を導入し, ME-CapsNetを提案する。
より深い畳み込み層にはSqueeze-Excitation Networkのブロックが含まれており、空間サイズを徐々に小さくするためにソフトプーリングアプローチを使用している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:29:38 GMT)
IoT with a Soft Touch: A Modular Remote Sensing Platform for STE(A)M
Applications [0.0] この作業では,2つの目標を達成するために開発された,IoT with a Soft Touchというリモートセンシングプラットフォームを提示する。
まず,STE(A)Mを実践する学生を刺激し,技術力の低下を図る。
第2に、この技術はよりソフトな応用(例えば、環境と医療)に使用される。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:41:39 GMT)
Improving the Learnability of Machine Learning APIs by Semi-Automated
API Wrapping [0.0] 学習や使用が容易なAPIを作成するという課題に,特に初心者が対処しています。
広く使われているML API skl のこの問題について検討する。
クライアントプログラムに影響を与えることなく、排除できるAPIの未使用部分と明らかに役に立たない部分を特定します。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:42:05 GMT)
Improving Persian Relation Extraction Models by Data Augmentation [0.0] 本システムの結果と結果について述べる。
PERLEXをベースデータセットとして使用し、テキスト前処理のステップを適用して拡張する。
次に、拡張PERLEXデータセット上の関係抽出にParsBERTとmultilingual BERTの2つの異なるモデルを用いる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:08:47 GMT)
High-order harmonic generation from C$_{20}$ isomers [0.0] 3つの構造のスペクトルは、高原に沿った高調波スペクトルの強い変調を示す。
異なるC$_20$異性体は、炭素原子の幾何学的配置と分子配向によって異なる調和分極をもたらす。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:26:47 GMT)
Graph Neural Networks are Dynamic Programmers [0.0] グラフニューラルネットワーク(GNN)は動的プログラミング(DP)と一致すると主張される
ここでは、理論と抽象代数学の手法を用いて、GNNとDPの間に複雑な関係が存在することを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:27:28 GMT)
From asymptotic freedom to $\theta$ vacua: Qubit embeddings of the O(3)
nonlinear $\sigma$ model [0.0] 効率的な格子モンテカルロアルゴリズムを用いて任意の$theta$に対する最初の符号プロブレムフリー正規化を構築する。
我々の構成は、すべての$textCP(N-1)$モデルで$theta$ vacuaに一般化され、長期の符号問題を解く。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:23:47 GMT)
Face segmentation: A comparison between visible and thermal images [0.0] 提案アルゴリズムは,マルチスペクトル(可視・熱)顔データベースのセグメント化において,10倍以上高速である。
熱画像における顔のセグメンテーションの精度は、ヴィオラ・ジョーンズの場合よりも高い。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 09:02:45 GMT)
Explaining random forest prediction through diverse rulesets [0.0] Local Tree eXtractor (LTreeX)は、与えられたテストインスタンスのフォレスト予測を、いくつかの異なるルールで説明することができる。
提案手法は予測性能の点で他の説明可能な手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:54:57 GMT)
Evaluating Prompts Across Multiple Choice Tasks In a Zero-Shot Setting [0.0] 大規模な言語モデルでは、自然言語のプロンプトによって、印象的なゼロショットのパフォーマンスが達成できることが示されている。
私たちは、プロンプトの品質はそのパフォーマンスにどのように影響しますか?
設計されていないタスクで使用するために、さまざまなタスクからプロンプトを収集し、標準化します。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 17:04:17 GMT)
Edge Detection and Deep Learning Based SETI Signal Classification Method [0.0] バークレーSETI研究センターの科学者が地球外知的生命体(SETI)を探索中
無線信号をフーリエ変換によりスペクトルに変換し、2次元時間周波数スペクトルで表される信号を分類する。
本稿では,背景雑音がスペクトル分類の精度に与える影響を考察し,新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 04:31:48 GMT)
Driving chemical reactions with polariton condensates [0.0] 電子移動過程における振動偏光子凝縮の効果について検討した。
励起と赤外レーザー源を比較すると、凝縮物は反応の収率を著しく変化させる。
以上の結果から, 凝縮剤を化学反応の促進に有効活用できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 03:18:19 GMT)
Deep Reinforcement Learning for Data-Driven Adaptive Scanning in
Ptychography [0.0] 提案手法は強化学習(RL)により訓練された深層学習モデルに基づいて構築される。
適応型スキャンによる同等の低用量実験は, 再現能の点で従来のポチトグラフィー実験より優れていた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 10:25:02 GMT)
Correlations and Work Statistics in Critical Quantum Systems [0.0] 我々は、量子スピン-$frac12$モデルに存在する平衡および外平衡量子相転移を解析する。
我々は、量子相関と位相空間定式化による量子情報アプローチを用いる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:06:39 GMT)
Contextual Information Based Anomaly Detection for a Multi-Scene UAV
Aerial Videos [0.0] UAVに基づく監視ビデオ分析のためのコンピュータ支援システムの開発が重要である。
フレームレベルのアノテーションを用いて,UAVに基づくマルチシーン異常検出データセットを開発した。
少数の異常サンプルと通常のサンプルを併用して、より良い決定境界を同定する新しい推論戦略を提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:07:49 GMT)
Collision-Free Navigation using Evolutionary Symmetrical Neural Networks [0.0] 本稿では、反応衝突回避のための進化的ニューラルネットワークを用いた以前の研究を拡張した。
我々は、対称ニューラルネットワークと呼ばれる新しい手法を提案している。
この手法は,ネットワーク重み間の制約を強制することにより,モデルの性能を向上させる。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 13:02:14 GMT)
Classification of NEQR Processed Classical Images using Quantum Neural
Networks (QNN) [0.0] この研究は、著者による以前の研究に基づいており、NEQR(NEQR)を用いた画像分類のためのQNNに対処している。
NEQRモデル回路を構築し、同じデータを前処理し、画像をQNNに入力する。
その結果,NEQRによるQNN性能がNEQRを使わずにQNNの性能を上回った際の限界改善(約5.0%)が認められた。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 08:05:53 GMT)
Bayesian optimization with known experimental and design constraints for
chemistry applications [0.0] 実験計画アルゴリズムであるPhoenicsとGryffinを拡張して、任意の制約を扱えるようにします。
2つのシミュレーション化学研究シナリオでその実用性を解説する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:16:54 GMT)
Artificial Intelligence Software Structured to Simulate Human Working
Memory, Mental Imagery, and Mental Continuity [0.0] 本稿では,人間の作業記憶システムのシミュレーションを目的とした人工知能アーキテクチャを提案する。
大脳皮質の特別なモジュールをエミュレートするために設計された、いくつかの相互接続されたニューラルネットワークが特徴である。
ワーキングメモリに格納されたコンテンツが徐々に進化するにつれて、連続した状態は重なり合い、互いに連続している。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:23:36 GMT)
Applications of the Numerov method to simple quantum systems using
Python [0.0] Numerov メソッドは Python を使って,実践的な方法で開発されている。
水素原子の固有関数と固有値を計算するコードを示す。
他の2つの例を計算するために必要なコード変更も、続編で提供されている。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 06:19:46 GMT)
Application of Quantum Computers in Foreign Exchange Reserves Management [0.0] 本論の主な目的は、外貨準備管理における量子コンピュータの応用の可能性を評価することである。
量子コンピュータの能力は、量子モンテカルロ法とポートフォリオ最適化を用いて実証される。
この論文は、中央銀行と金融市場監督当局のスタッフのための量子コンピューティングの紹介として機能する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 16:20:19 GMT)
Angular Super-Resolution in Diffusion MRI with a 3D Recurrent
Convolutional Autoencoder [0.0] 高分解能拡散MRI(dMRI)データは、臨床環境ではスキャン時間に制限されることが多い。
角領域のdMRIボリュームを超解き放つことができる3次元リカレント畳み込みニューラルネットワークを開発した。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 14:08:30 GMT)
An Introduction to Renormalization in Atomic Physics [0.0] 量子放射場に結合した非相対論的単一電子原子模型の量子力学について検討する。
電子と放射線場の相互作用は、適切なカットオフ処方薬を用いて規則化される。
我々は、電子に作用する放射線反応力を特定し、紫外線遮断を徐々に除去すると、この力は無限遠へと分岐することを示す。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:09:07 GMT)
An Artificial Intelligence Browser Architecture (AIBA) For Our Kind and
Others: A Voice Name System Speech implementation with two warrants, Wake
Neutrality and Value Preservation of Privately Identifiable Information [0.0] 会話型コマースは、環境と対話するタイミングを決定する、常時オンの人工知能システムに基づく5月の最初のアプリケーションである。
現在の支配的なシステムは、ウェイク中立性のないクローズドガーデンソリューションであり、IRBやCohues型の制約のため、それらが持つPIIデータを完全に活用することはできない。
本稿では,これら2つの制限に対処するための音声ブラウザ・サーバアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 11:49:41 GMT)
Achieving Guidance in Applied Machine Learning through Software
Engineering Techniques [0.0] 現在開発環境とML APIを使用しており、MLアプリケーションの開発者に提供しています。
現在のMLツールは、いくつかの基本的なソフトウェアエンジニアリングのゴールドスタンダードを満たすには足りません。
この結果から,ML固有のソフトウェア工学の研究に十分な機会があることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 12:54:57 GMT)
A deep learning model for burn depth classification using ultrasound
imaging [0.0] 本稿では, 皮膚の組織形態の変化に基づいて, 燃焼深度を分類する深層畳み込みニューラルネットワークを提案する。
ネットワークはエンコーダ・デコーダアーキテクチャを用いて、未焼成皮膚画像の低次元多様体を学習する。
20倍のクロスバリデーションから得られた性能測定値から, モデルが深部厚熱傷を識別できることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 20:01:22 GMT)
A Derivation of Nesterov's Accelerated Gradient Algorithm from Optimal
Control Theory [0.0] ネステロフの加速勾配アルゴリズムは第一原理から導かれる。
結果の微分方程式のオイラー離散化はネステロフのアルゴリズムを生成する。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 19:26:20 GMT)
A Deep Learning Approach for Thermal Plume Prediction of Groundwater
Heat Pumps [0.0] 本研究では, 周辺海域における地下水ヒートポンプが生み出す熱気流をモデル化するための, 小型サロゲート構築のための新しいデータ駆動手法を開発した。
既存のモデルと比較して、計算が迅速でありながら、より複雑なダイナミクスをキャプチャできることが示されています。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 07:12:28 GMT)
A Computational Architecture for Machine Consciousness and Artificial
Superintelligence: Updating Working Memory Iteratively [0.0] 本稿では,コンピュータ内でのヒューマンライクな作業記憶と思考プロセスの構築方法について考察する。
ワーキングメモリストアは2つあり、1つは関連大脳皮質における持続的発射に類似しており、もう1つは大脳皮質におけるシナプス増強に類似している。
ストアは、環境刺激または内部処理から生じる新しい表現で常に更新されなければならない。
論文参考訳(メタデータ) (Tue, 29 Mar 2022 22:28:30 GMT)