Practical Blind Denoising via Swin-Conv-UNet and Data Synthesis [143.4] 本研究では,残差畳み込み層の局所モデリング能力とスウィントランスブロックの非局所モデリング能力を組み込むスウィンコンブブロックを提案する。
トレーニングデータ合成のために,異なる種類のノイズを考慮した実用的なノイズ劣化モデルの設計を行う。
AGWN除去と実画像復号化の実験は、新しいネットワークアーキテクチャ設計が最先端の性能を達成することを実証している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:11:31 GMT)
Learning Hierarchical Cross-Modal Association for Co-Speech Gesture
Generation [107.1] 協調音声ジェスチャ生成のためのHA2G(Hierarchical Audio-to-Gesture)という新しいフレームワークを提案する。
提案手法は,現実的な共同音声ジェスチャーを描画し,従来手法よりも明確なマージンで性能を向上する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:33:29 GMT)
Pastiche Master: Exemplar-Based High-Resolution Portrait Style Transfer [103.5] StyleGANの最近の研究は、限られたデータを用いたトランスファーラーニングによる芸術的肖像画生成に高い性能を示している。
本稿では,オリジナルフェイスドメインと拡張アートポートレートドメインの両スタイルを柔軟に制御できる新しいDualStyleGANを提案する。
高品質なポートレートスタイル転送とフレキシブルなスタイル制御において、DualStyleGANが最先端の手法よりも優れていることを示す実験である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:57:11 GMT)
Linking Emergent and Natural Languages via Corpus Transfer [99.0] 創発言語と自然言語のコーパス転送によるリンクを確立する新しい方法を提案する。
このアプローチでは,言語モデリングとイメージキャプションという,2つの異なるタスクに対して,非自明な転送メリットを示す。
また,同一画像に基づく自然言語キャプションに創発的メッセージを翻訳することで,創発的言語の伝達可能性を予測する新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:24:54 GMT)
On the Kullback-Leibler divergence between pairwise isotropic
Gaussian-Markov random fields [93.4] 2つの対の等方性ガウス-マルコフ確率場間のクルバック-リーブラ分散の式を導出する。
提案した方程式は、画像処理と機械学習の応用において、新しい類似度尺度の開発を可能にする。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:37:24 GMT)
Bailando: 3D Dance Generation by Actor-Critic GPT with Choreographic
Memory [92.8] そこで我々は3Dキャラクターを1曲の楽曲に追従して踊るための新しい音楽間距離フレームワークBailandoを提案する。
本稿では,音楽に忠実な流麗なダンスにユニットを構成するアクタ批判型生成事前学習変換器(GPT)を紹介する。
提案するフレームワークは,定性的かつ定量的に最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:06:43 GMT)
Towards Semi-Supervised Deep Facial Expression Recognition with An
Adaptive Confidence Margin [92.8] Ada-CM(Adaptive Confidence Margin)を学習し、ラベルのないすべてのデータを半教師付き深層表情認識に活用する。
すべてのラベルなしサンプルは、信頼スコアと適応的に学習された信頼マージンを比較して、2つのサブセットに分割される。
提案手法は最先端の性能,特に半教師付きベースラインを超越した性能を実現する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:40:17 GMT)
Horizon-Free Reinforcement Learning in Polynomial Time: the Power of
Stationary Policies [88.8] 我々は既存の境界に対して,$Oleft(mathrmpoly(S,A,log K)sqrtKright)を後悔するアルゴリズムを設計する。
この結果は、定常政策の近似力、安定性、および濃度特性を確立する新しい構造補題の列に依存している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:14:12 GMT)
Neural Reflectance for Shape Recovery with Shadow Handling [88.7] 本論文は,非ランベルト的かつ空間的に変化する表面材料を用いて,シーンの形状を復元することを目的とする。
本研究では, 未知の3次元形状と未知の面点の両方をパラメータ化するために, 座標に基づく深部反射率(多層パーセプトロン)を提案する。
このネットワークは、観測された光度差と表面上の影を利用して、表面形状と一般的な非ランベルト反射率の両方を回復することができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:57:20 GMT)
Knowledge Removal in Sampling-based Bayesian Inference [86.1] 単一のデータ削除要求が来ると、企業は大量のリソースで学んだモデル全体を削除する必要があるかもしれない。
既存の研究は、明示的にパラメータ化されたモデルのためにデータから学んだ知識を取り除く方法を提案する。
本稿では,MCMCのための機械学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:03:01 GMT)
SwiftAgg+: Achieving Asymptotically Optimal Communication Load in Secure
Aggregation for Federated Learning [83.9] SwiftAgg+は、フェデレーション学習システムのための新しいセキュアアグリゲーションプロトコルである。
中央サーバは、分散ユーザである$NinmathbbN$のローカルモデルを集約する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:12:23 GMT)
Evaluating Distributional Distortion in Neural Language Modeling [81.8] 稀な事象の重みは、言語における分布の総確率質量のかなりの量を占める。
パープレキシティなどの標準言語モデリングメトリクスは、集約された言語モデル(LM)のパフォーマンスを定量化する。
自然言語を人工言語として訓練した生成モデルを用いた制御評価手法を開発した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 01:09:46 GMT)
Towards Efficient and Elastic Visual Question Answering with Doubly
Slimmable Transformer [81.2] Doubly Slimmable Transformer (DST)は、任意のTransformerベースのVQAモデルにシームレスに統合できる一般的なフレームワークである。
1つのスリム化MCAN_DSTサブモデルはVQA-v2で同等の精度を実現し、モデルサイズは0.38倍小さく、FLOPは0.27倍少ない。
最小のMCAN_DSTサブモデルは、推論段階で9Mパラメータと0.16GのFLOPを持ち、エッジデバイスにデプロイできる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:26:04 GMT)
Video Instance Segmentation via Multi-scale Spatio-temporal Split
Attention Transformer [78.0] ビデオセグメンテーション(VIS)アプローチは通常、注意計算中に単一スケールの時間的特徴またはフレームごとのマルチスケール特徴のいずれかを利用する。
エンコーダにMS-STSアテンションモジュールを組み込んだトランスフォーマーベースのVISフレームワークMS-STS VISを提案する。
MS-STSモジュールは、ビデオ内のフレームをまたいだ複数のスケールにおける分割時間的特徴関係を効果的にキャプチャする。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:59:20 GMT)
When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.3] 新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:09:41 GMT)
Dynamically-Scaled Deep Canonical Correlation Analysis [77.3] カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:29:17 GMT)
Joint Feature Learning and Relation Modeling for Tracking: A One-Stream
Framework [76.7] 特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。
このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。
OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:39:35 GMT)
Global Tracking Transformers [76.6] グローバル多目的追跡のためのトランスフォーマーに基づく新しいアーキテクチャを提案する。
コアコンポーネントはグローバルなトラッキングトランスフォーマーで、シーケンス内のすべてのフレームからオブジェクトを操作する。
われわれのフレームワークは、最先端の大語彙検出装置にシームレスに統合され、あらゆる物体を追跡できる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:58:04 GMT)
Associating Objects with Scalable Transformers for Video Object
Segmentation [74.4] 本稿では,複数のオブジェクトを協調的かつ協調的にマッチング・復号するAssociating Objects with Transformers (AOT)アプローチを提案する。
詳しくは、AOTは複数のターゲットを同じ高次元の埋め込み空間に関連付けるための識別機構を使用している。
3つの人気のあるベンチマークで最先端のパフォーマンスを新たに達成する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:34:06 GMT)
FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.4] 本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:26:29 GMT)
Sparse Instance Activation for Real-Time Instance Segmentation [72.2] 本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:15:39 GMT)
LHNN: Lattice Hypergraph Neural Network for VLSI Congestion Prediction [70.3] 格子ハイパーグラフ(格子ハイパーグラフ)は、回路のための新しいグラフ定式化である。
LHNNは、F1スコアのU-netやPix2Pixと比べて、35%以上の改善を常に達成している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:31:18 GMT)
A Quantum Optimal Control Problem with State Constrained Preserving
Coherence [68.8] 非単体脱コヒーレンスチャネルを特徴とするマルコフ脱コヒーレンスを受ける3レベル$Lambda$型原子を考える。
我々は、デコヒーレンスレベルが予め定義された境界内にある状態制約で量子最適制御問題を定式化する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:31:34 GMT)
Learning Disentangled Representation for One-shot Progressive Face
Swapping [66.0] ジェネレーティブ・アドバーサリアル・ネットワークに基づくワンショット・フェイススワップのためのシンプルで効率的なFaceSwapperを提案する。
提案手法は,不整合表現モジュールと意味誘導融合モジュールから構成される。
その結果,本手法は,トレーニングサンプルの少ないベンチマークで最先端の結果が得られることがわかった。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:19:04 GMT)
R-DFCIL: Relation-Guided Representation Learning for Data-Free Class
Incremental Learning [64.8] クラスインクリメンタルラーニング(Class-Incremental Learning, CIL)は、新しい知識を学ぶ際に、破滅的な忘れ方に苦しむ。
近年のDFCIL研究は、従来のクラスのデータ合成のためのモデル反転のような手法を導入している。
本稿では、R-DFCILと呼ばれるDFCILのための関係誘導型表現学習(RRL)を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:54:15 GMT)
Risk Consistent Multi-Class Learning from Label Proportions [64.0] 本研究は,バッグにトレーニングインスタンスを提供するMCLLP設定によるマルチクラス学習に対処する。
既存のほとんどのMCLLPメソッドは、インスタンスの予測や擬似ラベルの割り当てにバッグワイズな制約を課している。
経験的リスク最小化フレームワークを用いたリスク一貫性手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:49:04 GMT)
On the Birth of the Universe and Time [63.0] 理論は、作用関数が波動関数の空間上の作用素として実装される量子表現に基づいている。
宇宙の初期半径の推定法が提案されている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:09:59 GMT)
One Country, 700+ Languages: NLP Challenges for Underrepresented
Languages and Dialects in Indonesia [60.9] インドネシアの700以上の言語を対象としたNLP研究の現状について概説する。
インドネシアのNLPにおける課題と、現在のNLPシステムの性能にどのように影響するかを強調します。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:07:22 GMT)
AP-BSN: Self-Supervised Denoising for Real-World Images via Asymmetric
PD and Blind-Spot Network [60.7] ブラインド・スポット・ネットワーク(BSN)とその変種は、自己監督型デノナイジングにおいて大きな進歩を遂げた。
自己教師付きBSNを用いて空間的に相関した実世界の雑音に対処することは困難である。
近年,実世界の雑音の空間的相関を取り除くために,画素シャッフルダウンサンプリング (PD) が提案されている。
本稿では,この問題に対処する非対称PD(AP)を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 05:35:09 GMT)
Subjective and Objective Analysis of Streamed Gaming Videos [60.3] ゲームビデオにおける主観的および客観的ビデオ品質評価(VQA)モデルについて検討する。
LIVE-YouTube Gaming Video Quality (LIVE-YT-Gaming) と呼ばれる新しいゲームビデオリソースを作成しました。
このデータについて主観的人間調査を行い,61名の被験者が記録した品質評価18,600名を得た。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:02:57 GMT)
IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument
Mining Tasks [59.5] 本稿では,一連の議論マイニングタスクに適用可能なIAMという,包括的で大規模なデータセットを提案する。
データセットの70k近い文は、引数特性に基づいて完全に注釈付けされている。
議論準備プロセスに関連する2つの新しい統合された議論マイニングタスクを提案する。(1) 姿勢分類付きクレーム抽出(CESC)と(2) クレーム・エビデンス・ペア抽出(CEPE)である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:27:52 GMT)
Maximum entropy quantum state distributions [58.7] 我々は、保存された量の完全な分布に関する伝統的な熱力学と条件を超える。
その結果、熱状態からの偏差が広い入力分布の極限でより顕著になる量子状態分布が得られた。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 00:48:31 GMT)
Make-A-Scene: Scene-Based Text-to-Image Generation with Human Priors [58.7] 近年のテキスト・ツー・イメージ生成手法は、生成した画像の忠実度とテキスト関連性を漸進的に改善している。
i)シーンの形式でテキストを補完する単純な制御機構を実現することで,これらのギャップに対処する新しいテキスト・ツー・イメージ手法を提案する。
このモデルにより,512×512ピクセルの解像度で高忠実度画像を生成することができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:44:50 GMT)
Self-supervised Video-centralised Transformer for Video Face Clustering [58.1] 本稿では,ビデオ集中型トランスを用いたビデオの顔クラスタリング手法を提案する。
我々はEasyCom-Clusteringという名前の大規模なビデオ顔クラスタリングデータセットを初めてリリースした。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:38:54 GMT)
Compound Domain Generalization via Meta-Knowledge Encoding [55.2] マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:54:59 GMT)
Generating Scientific Claims for Zero-Shot Scientific Fact Checking [54.6] 科学言語の複雑さと大量のトレーニングデータが不足しているため、自動科学的事実チェックは困難である。
科学的な文から1つ以上の原子的かつ検証可能なクレームを生成するための科学的クレーム生成を提案する。
また, バイオメディカルクレームのゼロショット事実チェックにも有用であることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:29:20 GMT)
CVF-SID: Cyclic multi-Variate Function for Self-Supervised Image
Denoising by Disentangling Noise from Image [53.8] そこで本研究では,CVF-SIDと呼ばれる,新しい,強力な自己監督型デノベーション手法を提案する。
CVF-SIDは、様々な自己教師付き損失項を活用することにより、入力からクリーンな画像とノイズマップを分離することができる。
最先端の自己監督型画像復調性能を達成し、既存のアプローチに匹敵する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:59:28 GMT)
Bellman Residual Orthogonalization for Offline Reinforcement Learning [53.2] 我々はベルマン方程式を近似した新しい強化学習原理を導入し、その妥当性をテスト関数空間にのみ適用する。
我々は、この原則を利用して、政策外の評価のための信頼区間を導出するとともに、所定の政策クラス内の政策を最適化する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 01:04:17 GMT)
Continual Learning and Private Unlearning [49.8] 本稿では、継続学習とプライベートアンラーニング(CLPU)問題を定式化する。
これはCLPU問題を解決するための第一歩として、単純だが完全にプライベートなソリューションであるCLPU-DER++を紹介している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:40:33 GMT)
Learning Motion-Dependent Appearance for High-Fidelity Rendering of
Dynamic Humans from a Single Camera [49.4] 外観のダイナミクスを学ぶ上で重要な課題は、違法に大量の観測を必要とすることである。
本手法は,1つの視点映像から,身体のポーズや新しいビューを時間的に協調的に生成できることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 00:22:03 GMT)
Experimental Validation of Fully Quantum Fluctuation Theorems Using
Dynamic Bayesian Networks [48.8] ゆらぎ定理は、小系に対する熱力学の第2法則の基本的な拡張である。
核磁気共鳴装置における2つの量子相関熱スピン-1/2を用いた熱交換の詳細な完全量子ゆらぎ定理を実験的に検証した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:30:15 GMT)
MonoDETR: Depth-aware Transformer for Monocular 3D Object Detection [47.9] モノクロ3Dオブジェクト検出は、自動運転における長年の課題だった。
既存のほとんどの手法は、従来の2Dオブジェクト検出器に追従して、まずその中心で物体を位置決めし、次に中心に隣接する局所特徴を用いて3D属性を予測する。
深度対応TRansformer, MonoDETR を用いた単分子検出のための簡易フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 19:28:54 GMT)
Bi-level Doubly Variational Learning for Energy-based Latent Variable
Models [46.8] エネルギーベース潜在変数モデル(EBLVM)は、従来のエネルギーベースモデルよりも表現力が高い。
EBLVMの学習を容易にするために,バイレベル二重変分学習(BiDVL)を提案する。
本モデルは,関連作品よりも印象的な画像生成性能を実現する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 04:13:38 GMT)
WarpingGAN: Warping Multiple Uniform Priors for Adversarial 3D Point
Cloud Generation [46.6] WarpingGANは効率的で効率的な3Dポイントクラウド生成ネットワークである。
我々は、複数の同一の事前定義された事前定義を3次元形状にワープするために、統一された局所ワープ関数を学習する。
WarpingGANは、様々な解像度で均一に分散された3D点雲を効率的に生成することができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:12:43 GMT)
Language Models that Seek for Knowledge: Modular Search & Generation for
Dialogue and Prompt Completion [44.5] 我々のSeeKeR法は,探索,知識生成,最終的な応答生成という3つのモジュールタスクに1つのLMを適用する。
SeeKeRを対話モデルとして使用する場合、最先端モデルであるBlenderBot 2よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:31:26 GMT)
BigDetection: A Large-scale Benchmark for Improved Object Detector
Pre-training [44.3] 我々はBigDetectionと呼ばれる新しい大規模ベンチマークを構築した。
私たちのデータセットには600のオブジェクトカテゴリがあり、3.4M以上のトレーニングイメージと36Mのバウンディングボックスが含まれています。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:57:29 GMT)
DyRep: Bootstrapping Training with Dynamic Re-parameterization [43.4] 本稿では、ネットワーク構造を動的に進化させるトレーニングプロセスにRepテクニックをエンコードする動的再パラメータ化(DyRep)手法を提案する。
DyRepは、ImageNet上でResNet-18の精度を2.04%改善し、ベースライン上でのランタイムを22%削減する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:22:33 GMT)
AziNorm: Exploiting the Radial Symmetry of Point Cloud for
Azimuth-Normalized 3D Perception [42.8] アジマス正規化(AziNorm)は、半径方向に沿った点雲を正規化し、アジマスの差による変動を排除する。
AziNormは、ほとんどのLiDARベースの知覚方法に柔軟に組み込むことができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:29:34 GMT)
Answer-Driven Visual State Estimator for Goal-Oriented Visual Dialogue [42.6] 視覚状態に対する異なる回答の効果を付加するアンサー駆動型視覚状態推定器(ADVSE)を提案する。
まず、視覚的注意に対する回答駆動の効果を捉えるために、回答駆動集中注意(ADFA)を提案する。
そして、焦点をあてて、条件付き視覚情報融合(CVIF)による視覚状態推定を行う。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 12:55:15 GMT)
Recommendation as Language Processing (RLP): A Unified Pretrain,
Personalized Prompt & Predict Paradigm (P5) [41.6] 提案手法は,“Pretrain, Personalized Prompt, and Predict Paradigm”(P5)と呼ばれる,フレキシブルで統一されたテキスト・テキスト・テキスト・パラダイムを推奨する。
ユーザ-テムインタラクション、アイテムメタデータ、ユーザレビューなどのすべてのデータは、自然言語シーケンスという共通のフォーマットに変換されます。
P5は事前トレーニング中に同じ言語モデリングの目的で異なるタスクを学習する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:13:23 GMT)
RayTran: 3D pose estimation and shape reconstruction of multiple objects
from videos with ray-traced transformers [41.5] RGBビデオからの多目的3D再構成のためのトランスフォーマーベースニューラルネットワークアーキテクチャを提案する。
我々は、画像形成過程に関する知識を活用して、注意重み行列を著しく分散させる。
従来の手法と比較して、アーキテクチャは単一ステージであり、エンドツーエンドのトレーニングが可能である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:49:12 GMT)
VRNet: Learning the Rectified Virtual Corresponding Points for 3D Point
Cloud Registration [40.8] 3Dポイントクラウドの登録は、アウトレーヤに対して脆弱であり、対応するポイントを持たないポイントとしてラベル付けされている。
本稿では,両世界の長所を活かし,新しいロバストな3Dポイントクラウド登録フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:51:02 GMT)
A Representation Separation Perspective to Correspondences-free
Unsupervised 3D Point Cloud Registration [40.1] リモートセンシング分野における3Dポイントクラウドの登録は、ディープラーニングベースの手法によって大幅に進歩している。
表現分離の観点から,対応のない非教師なしポイントクラウド登録(UPCR)手法を提案する。
提案手法は, ポーズ不変表現の障害を除去するだけでなく, 部分対部分点の雲やノイズに対して頑健である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:50:19 GMT)
RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [39.9] 本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:24:55 GMT)
Moving Window Regression: A Novel Approach to Ordinal Regression [39.7] 本稿では、入力および参照インスタンスの新しい順序表現スキームである相対ランク(rho$-rank)の概念を提案する。
グローバルおよびローカルな相対回帰器(rho$-regressors)は、全体および特定のランク範囲内で$rho$-ranksを予測するために開発されている。
提案アルゴリズムは,顔の年齢推定と過去のカラー画像分類のための様々なベンチマークデータセット上で,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:30:48 GMT)
Disentangleing Content and Fine-grained Prosody Information via Hybrid
ASR Bottleneck Features for Voice Conversion [39.7] CTC-BNFsとCE-BNFsから抽出したハイブリッドボトルネック特徴を用いたノン・ツー・ワンVC法を提案する。
実験の結果,提案手法はベースライン法よりも類似性,自然性,品質が高いことがわかった。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:24:39 GMT)
Coarse-to-Fine Cascaded Networks with Smooth Predicting for Video Facial
Expression Recognition [35.5] 本稿では,表情認識の性能向上を図るために,Smooth Predicting (CFC-SP) を併用したCarse-to-Fine Cascaded Networkを提案する。
CFC-SPは、CFC(Coarse-to-Fine Cascaded Network)とSmooth Predicting(SP)の2つのコアコンポーネントを含んでいる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:01:53 GMT)
Mix and Match: Learning-free Controllable Text Generation using Energy
Language Models [34.0] 制御可能なテキスト生成のためのグローバルスコアベースの代替手段であるMix and Match LMを提案する。
我々は制御可能な生成のタスクをエネルギーベースモデルからのサンプルの描画として解釈する。
我々は、このエネルギーベースモデルからサンプリングするためにメトロポリス・ハスティングスサンプリングスキームを使用する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:52:09 GMT)
Token Dropping for Efficient BERT Pretraining [33.6] 本研究では,変圧器モデルの事前学習を高速化する簡易かつ効果的な「トーケンドロップ」手法を開発した。
我々は既に組み込まれているマスキング言語モデリング(MLM)の損失を利用して、計算オーバーヘッドのない重要でないトークンを識別する。
この単純なアプローチは、BERTの事前トレーニングコストを25%削減し、標準の下流タスクで同様の微調整性能を実現する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:50:46 GMT)
Searching for fingerspelled content in American Sign Language [32.9] 手話ビデオの自然言語処理は、聴覚障害者に人工知能技術を提供することに不可欠である。
本稿では,手話ビデオ中の指で打ったキーワードやキーフレーズを検索する問題に対処する。
本稿では,指で指を打つことを共同で検出し,それをテキストシーケンスにマッチさせるFSS-Netを提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:36:22 GMT)
Local optimisation of Nystr\"om samples through stochastic gradient
descent [32.5] 我々は、Nystrの近似精度を評価するために用いられる古典的基準のサロゲートとして、二乗カーネルの差分基準の未加重変動を考慮する。
我々は、放射状SKDの局所最小化が、Nystr"omサンプルを改良したNystr"om近似精度で得られることを示す数値実験を行った。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:17:27 GMT)
Leveraging unsupervised and weakly-supervised data to improve direct
speech-to-speech translation [32.2] 中間的なテキスト表現に依存しない音声音声翻訳(S2ST)は、急速に研究のフロンティアになりつつある。
近年の研究では、このような直接S2STシステムの性能が、同等のデータセットでトレーニングされた場合、従来のカスケードS2STシステムに近づいていることが示されている。
本研究では,トランスラトトロン2に基づく直接S2STの性能向上のために,より広く利用可能な教師なし・弱教師付き音声・テキストデータを活用するための複数のアプローチについて検討する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:06:15 GMT)
On Exploiting Layerwise Gradient Statistics for Effective Training of
Deep Neural Networks [32.1] 我々はAdamとAdaBeliefを前処理または後処理によって更新手順に階層的に適応的なステップ化を導入することで修正する。
そこで本稿では,各層内の要素的段階化が,統計的分散が著しく小さいことを目的として,新しい最適化手法であるAidaを提案する。
実験の結果,Adam や AdaBelief などの既存手法と比較して,Aida は競争力や性能が向上していることがわかった。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:00:32 GMT)
Privileged Attribution Constrained Deep Networks for Facial Expression
Recognition [32.0] 顔の表情認識(FER)は、機械が人間の振る舞いをよりよく理解できるようにするため、多くの研究領域において重要である。
これらの問題を緩和するために、私たちはモデルに、目、口、まぶたなどの特定の顔領域に集中するよう指導する。
PAL(Privleged Attribution Loss)は,最も健康な顔領域に向けて,モデルの注意を向ける手法である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:49:33 GMT)
Neural Neighbor Style Transfer [31.7] 本稿では,最先端の品質,一般化,芸術的スタイルの伝達のための競争効率を提供するパイプラインを提案する。
我々のアプローチは、入力されたコンテンツから抽出されたニューラル特徴をスタイルの例から抽出した特徴に明示的に置き換え、最終的な出力を合成することに基づいている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:11:31 GMT)
Making Heads or Tails: Towards Semantically Consistent Visual
Counterfactuals [31.4] 視覚的対物的説明は、クエリ画像内の画像領域を、イントラクタ画像から領域に置き換えて、変換された画像に対するシステムの判断がイントラクタクラスに変化するようにする。
本稿では2つの重要なアイデアに基づいて視覚的対実的説明を計算するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:26:11 GMT)
Revisiting the Effects of Leakage on Dependency Parsing [31.0] Sogaard氏の最近の研究によると、ツリーバンクのサイズはさておき、トレーニンググラフとテストグラフの重なり合い(終端リーク)は、他の説明よりも依存性解析のパフォーマンスの観察されたばらつきについて説明している。
この作業では、この主張を再考し、より多くのモデルや言語でそれをテストします。
本報告では, 従来の測定値と異なり, より微細な測定値を提案するとともに, 観測性能の変動と相関する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:33:30 GMT)
A Hybrid Mesh-neural Representation for 3D Transparent Object
Reconstruction [30.7] 自然光条件下で手持ちの撮像画像を用いて透明物体の3次元形状を復元する新しい手法を提案する。
明示的なメッシュとハイブリッド表現であるマルチレイヤパーセプトロン(MLP)ネットワークの利点を組み合わせて、最近のコントリビューションで使用されるキャプチャを簡素化する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 05:28:17 GMT)
Differential Assessment of Black-Box AI Agents [30.0] 従来知られていたモデルから逸脱したブラックボックスAIエージェントを差分評価する手法を提案する。
我々は,漂流エージェントの現在の挙動と初期モデルの知識の疎度な観察を利用して,アクティブなクエリポリシーを生成する。
経験的評価は、エージェントモデルをスクラッチから再学習するよりも、我々のアプローチの方がはるかに効率的であることを示している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:48:58 GMT)
DPar2: Fast and Scalable PARAFAC2 Decomposition for Irregular Dense
Tensors [29.1] 本研究では不規則な高密度テンソルに対する高速かつスケーラブルなPARAFAC2分解法DPar2を提案する。
大規模な実験により、DPar2は実世界の不規則なテンソルの競合よりも最大6.0倍速いことが示されている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 01:43:13 GMT)
SharpContour: A Contour-based Boundary Refinement Approach for Efficient
and Accurate Instance Segmentation [29.1] 我々は,境界領域の分割に対処するために,SharpContourという名前の効率的な輪郭ベース境界修正手法を提案する。
本手法は、オフセットを個別に更新することで、輪郭を反復的に変形させる。
実験により、SharpContourは高い効率を保ちながら競争上の利益を達成することが示された。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 19:37:20 GMT)
NPC: Neuron Path Coverage via Characterizing Decision Logic of Deep
Neural Networks [28.5] ディープニューラルネットワーク(DNN)の品質は、いまだに実用的な運用環境における懸念を提起している。
ソフトウェアテストにインスパイアされたいくつかの構造的カバレッジ基準が設計され、DNNのテスト精度を測定するために提案されている。
本稿では,DNNの決定構造を構築することにより,解釈可能なカバレッジ基準を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:10:13 GMT)
Learning Dense Correspondence from Synthetic Environments [27.8] 既存の方法では、実際の2D画像に手動でラベル付けされた人間のピクセルを3D表面にマッピングする。
本稿では,自動生成合成データを用いた2次元3次元人物マッピングアルゴリズムの訓練により,データ不足の問題を解決することを提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:13:26 GMT)
Generating Data to Mitigate Spurious Correlations in Natural Language
Inference Datasets [27.6] 自然言語処理モデルはしばしば、タスクに依存しない特徴とデータセットのラベルの間の急激な相関を利用して、トレーニング対象のディストリビューション内でのみうまく機能する。
そこで本研究では, 脱バイアス化したデータセットを生成して, 脱バイアス化したオフザシェルフモデルをトレーニングする手法を提案する。
提案手法は,1)高品質なラベル一貫性のあるデータサンプルを生成するためのデータジェネレータの訓練方法,2)素粒子相関に寄与するデータ点を除去するフィルタリング機構から構成される。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 09:08:05 GMT)
HMFS: Hybrid Masking for Few-Shot Segmentation [27.5] 我々は特徴マスキング(FM)を強化するためのシンプルで効果的で効率的なアプローチを開発した。
本研究では,FM法における微細な空間的詳細の損失を補足する基本入力マスキング手法の検証と活用により補足する。
3つの公開ベンチマークの実験結果から、HMFSは現在の最先端手法よりも目に見えるマージンで優れていることが明らかになった。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:07:20 GMT)
Towards Exemplar-Free Continual Learning in Vision Transformers: an
Account of Attention, Functional and Weight Regularization [27.1] 本研究では,視覚変換器 (ViT) の連続学習について検討する。
我々の研究は、自己注意機構(SAM)の外科的研究に向けて最初の一歩を踏み出した。
非対称な変種を提案し、それをViTに適応したプール出力蒸留(POD)損失に適用する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:40:36 GMT)
MetricGAN+/-: Increasing Robustness of Noise Reduction on Unseen Data [26.9] 予測ネットワークのロバスト性を改善する「デジェネレータ」を提案する。
VoiceBank-DEMANDデータセットの実験結果は、PSSQスコアが3.8%相対的に改善したことを示している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:03:35 GMT)
Probing for Labeled Dependency Trees [25.7] DepProbeは、埋め込みからラベル付きおよび指示付き依存関係解析木を抽出できる線形プローブである。
提案手法は13言語にまたがって,当時最高のソースツリーバンクを同定する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:21:07 GMT)
Can Unsupervised Knowledge Transfer from Social Discussions Help
Argument Mining? [25.4] 本稿では,教師なし,議論型対話型知識の課題を克服するために,新しい伝達学習戦略を提案する。
本研究では,ChangeMyViewのサブレディットからの議論に富んだ社会的な議論を,教師なしの議論型知識の源泉として活用する。
本稿では,提案手法を補完する,コンポーネント間関係予測のための新しいプロンプトベースの戦略を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:48:56 GMT)
Weakly-Supervised End-to-End CAD Retrieval to Scan Objects [25.4] 本稿では,意味的および構造的に類似したCADモデルをクエリ3Dスキャンシーンに検索する手法を提案する。
提案手法では,トップモデルとスキャンクエリとの幾何的および知覚的類似性により,エンド・ツー・エンドのトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:30:47 GMT)
Shoring Up the Foundations: Fusing Model Embeddings and Weak Supervision [24.5] 我々は,基盤モデル埋め込みを併用して,弱い監視技術を改善するLigerを提案する。
基礎モデルのブラックボックスの性質にもかかわらず、我々のアプローチがパフォーマンスをどのように改善するかを特徴付ける結果が証明されている。
リガーはバニラの弱い監督を14.1ポイント、弱い監督のkNNとアダプタを11.8ポイント、伝統的な手札で7.2ポイントで監督する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:00:18 GMT)
Industrial Style Transfer with Large-scale Geometric Warping and Content
Preservation [24.4] 本稿では,産業デザイナーの参考として,新しいビジュアル製品を迅速に作成するための新しいスタイル転送手法を提案する。
本手法は, 原点生成物, 対象物, アートスタイルの画像から, ターゲットの幾何学的形状を模倣するために, 原点形状を歪曲するニューラルワーピング場を生成する。
我々のモデルであるInst(Industrial Style Transfer)は、大規模幾何学的ワープ(LGW)とICTT(inter interest-consistency texture Transfer)から構成される。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:47:49 GMT)
CrossFormer: Cross Spatio-Temporal Transformer for 3D Human Pose
Estimation [24.1] 3次元人間のポーズ推定は、身体部分間の幾何学的依存関係を符号化し、運動的制約を強制することによって行うことができる。
最近のTransformerは、空間領域と時間領域における関節間の長距離依存関係を符号化するために採用されている。
フレーム間の微妙な変化を捉えるのに重要な身体関節の豊かな表現を特徴とする新しいポーズ推定変換器を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 23:40:11 GMT)
Improving Generalization in Federated Learning by Seeking Flat Minima [23.9] フェデレートされた設定で訓練されたモデルは、しばしば劣化したパフォーマンスに悩まされ、一般化に失敗する。
本研究では,損失の幾何レンズとヘッセン固有スペクトルを用いて,そのような挙動を考察する。
損失面のシャープさと一般化ギャップを接続する先行研究により,サーバ側のシャープネス・アウェア・最小化 (SAM) や適応バージョン (ASAM) をローカルにトレーニングすることで,一般化を大幅に改善できることが示されている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:30:14 GMT)
Occluded Human Mesh Recovery [23.6] 我々は、画像空間コンテキストを組み込んだ新しいトップダウンメッシュ回復アプローチであるOCHMR(Occluded Human Mesh Recovery)を提案する。
OCHMRは、3DPW、CrowdPose、OCHumanといった挑戦的なマルチパーソンベンチマークにおいて優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:39:20 GMT)
A Manifold View of Adversarial Risk [23.0] 本研究は,2種類の新しい対向リスク,通常の方向に沿った摂動による通常の対向リスク,多様体内の摂動による対向リスクについて検討する。
通常のリスクと人的リスクの両方がゼロであっても、標準的な敵のリスクはゼロである可能性があるという悲観的なケースを示します。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:11:21 GMT)
Q-PPG: Energy-Efficient PPG-based Heart Rate Monitoring on Wearable
Devices [22.7] 本稿では、人事監視のための深層時間畳み込みネットワーク(TCN)のリッチなファミリーを自動生成する設計手法を提案する。
私たちの最も正確なモデルは、平均絶対誤差で新しい最先端のモデルを設定します。
我々は,STM32WB55マイクロコントローラを内蔵した組み込みプラットフォーム上にTCNを配置し,リアルタイム実行に適していることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:50:33 GMT)
SMARAGD: Synthesized sMatch for Accurate and Rapid AMR Graph Distance [19.3] SMATCHスコアとグラフアライメントを近似するニューラルネットワークの可能性を示す。
データ拡張とAMRグラフの匿名化を適用して近似誤差を大幅に低減できることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:31:46 GMT)
Domino: Discovering Systematic Errors with Cross-Modal Embeddings [18.8] 全体的な精度の高い機械学習モデルは、重要なサブセット(またはスライス)で体系的なエラーを犯すことが多い。
Dominoは、識別されたスライスの自然言語記述を提供し、スライスの正確な名前を35%で正しく生成できる最初のSDMである。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:38:56 GMT)
Rich Feature Construction for the Optimization-Generalization Dilemma [18.7] 我々は、モデルで使用できる潜在的に有用な機能のパレットを含むリッチな表現(RFC)を構築する。
RFCは、6つのOoDメソッドが挑戦的な不変トレーニングベンチマークで最高のパフォーマンスを達成するのを一貫して支援します。
現実的な Camelyon17 タスクでは,OoD と OoD の両手法が,従来の計算可能な結果に対して少なくとも 5% 以上の性能を発揮する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 20:39:33 GMT)
Egocentric Prediction of Action Target in 3D [18.0] 本稿では,RGB-DとIMUストリームの100万フレームを超える大規模なマルチモーダルデータセットを提案する。
この新たな課題は、ロボット工学、ビジョン、学習コミュニティの研究者によるさらなる研究に値することを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:16:05 GMT)
Out-of-distribution Generalization with Causal Invariant Transformations [17.2] 本研究では,因果的特徴を明示的に回復することなく,OOD問題に対処する。
不変因果機構の設定の下で、理論的には、そのような変換がすべて利用可能であれば、最小限の最適モデルを学ぶことができる。
これらの因果不変変換の完全な集合が非現実的であることを知ることは、これらの変換のサブセットのみを知るのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:47:43 GMT)
Does human speech follow Benford's Law? [16.9] 人為的および自然発生的データセットにおける先頭桁の頻度は対数曲線に従う。
人間の音声スペクトルもベンフォードの法則に従っていることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:54:49 GMT)
Automatic User Profiling in Darknet Markets: a Scalability Study [15.8] 本研究の目的は,現在の計算スタイメトリ手法の信頼性と限界を理解することである。
根拠となる真実は得られず、歴史的調査による検証済みの犯罪データも検証目的には利用できないため、クリアウェブフォーラムから新たなデータを収集した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:54:59 GMT)
Computing Optimal Location of Microphone for Improved Speech Recognition [15.7] マイクロホンの最適位置は,3次元空間におけるマイクロホンの正確な位置を推定し,その位置を推定する。
クリーンで騒々しい音声を用いて実験を行い、マイクロホンの最適位置がユニークでノイズの影響を受けていることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:27:15 GMT)
Repairing Group-Level Errors for DNNs Using Weighted Regularization [15.2] ディープニューラルネットワーク(DNN)は、人々の生活に影響を与える決定を下すソフトウェアで広く使われている。
それらは、不運な結果につながる可能性のある重度の誤った行動を示すことが判明した。
以前の研究では、そのような不行は単一の画像上のエラーではなく、クラスプロパティの違反によって発生することが多かった。
本稿では,DNNの修正を目的とした5つの具体的手法からなる重み付き正規化法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:45:23 GMT)
Direct parsing to sentiment graphs [15.2] グラフに基づくセマンティクスが、構造化された感情分析のタスクにどのように適用できるかを示す。
ソースコード、モデル、予測を公開しています。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:09:23 GMT)
Effectively leveraging Multi-modal Features for Movie Genre
Classification [15.2] 撮影情報を利用したマルチモーダル手法MMShotを提案し,映像ジャンルを効率的かつ効果的に分類する。
ジャンル分類のために,本手法をMovieNetとCondensed Moviesで評価し,平均平均精度(mAP)を17%改善した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:15:12 GMT)
Continuous Emotion Recognition using Visual-audio-linguistic
information: A Technical Report for ABAW3 [15.1] 連続的感情認識のためのクロスモーダルコアテンションモデル
視覚、音声、言語ブロックは、マルチモーダル入力の特徴を学ぶために使用される。
トレーニングおよび検証セット上でクロスバリデーションを行う。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 12:18:06 GMT)
Laser Manipulation of Spin-Exchange Interaction Between Alkaline-Earth
Atoms in $^1$S$_0$ and $^3$P$_2$ States [14.1] アルカリ土類原子の構造から, レーザビームによる加熱効果は非常に弱いことが示唆された。
その結果、レーザー強度を変化させてSEIを効率的に制御できるフェシュバッハ共鳴は、低い加熱速度でレーザービームによって誘導される可能性がある。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:22:14 GMT)
Towards Escaping from Language Bias and OCR Error: Semantics-Centered
Text Visual Question Answering [14.0] シーンイメージのテキストは、シーン理解と推論のための重要な情報を伝える。
現在のTextVQAモデルはテキスト中心ではなく、いくつかの制限に悩まされている。
本稿では,インスタンスレベルのコントラスト型セマンティックな予測モジュールとセマンティックス中心のトランスフォーマーモジュールからなるセマンティックス中心ネットワーク(SC-Net)を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:21:41 GMT)
Your Policy Regularizer is Secretly an Adversary [13.6] 報奨関数の最悪の摂動に対して,頑健性がヘッジングによって生じることを示す。
我々は、KLとα偏差正規化の下で、この頑健な対向報酬摂動を特徴付ける。
本稿では、最悪の報酬摂動に関する詳細な議論と、この堅牢性を示す直感的な経験例を紹介する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:59:01 GMT)
Text to Mesh Without 3D Supervision Using Limit Subdivision [13.4] 本稿では,ターゲットテキストプロンプトのみを用いた3次元モデルのゼロショット生成手法を提案する。
入力テキストプロンプトを3Dモデルの異なるレンダリング画像と比較する、事前訓練されたCLIPモデルに依存しています。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 20:36:28 GMT)
WeSinger: Data-augmented Singing Voice Synthesis with Auxiliary Losses [13.2] 我々はWeSingerという中国語多言語音声合成システムを開発した。
定量的および定性的な評価結果はWeSingerの有効性を精度と自然性の観点から示している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:57:17 GMT)
Dexterous Imitation Made Easy: A Learning-Based Framework for Efficient
Dexterous Manipulation [13.1] DIME(Dexterous Made Easy)は、デクスタラスな操作のための新しい模倣学習フレームワークである。
DIMEは、人間のオペレーターを観察し、ロボットハンドを遠隔操作するために、単一のRGBカメラしか必要としない。
シミュレーションと実ロボットベンチマークの両方において、複雑な手動操作タスクを解くためにDIMEを使用できることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:58:54 GMT)
Is Geometry Enough for Matching in Visual Localization? [13.0] GoMatchは、画像キーポイントとマップをマッチングするための幾何学的情報に依存し、軸受ベクトルの集合として表される、視覚ベースのマッチングの代替手段である。
GoMatchは、以前の幾何学ベースのマッチング作業を改善し、ケンブリッジ・ランドマークと7シーンの平均中央値の誤差を10.67m, 95.7circ$)と1.43m$, 3,4.7circ$)に減らした。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:55:17 GMT)
Multilingual CheckList: Generation and Evaluation [12.9] 本研究では,多言語チェックListの品質を生成・評価するための複数のアプローチについて検討する。
ソースからターゲット言語にチェックリストを自動的に転送するアルゴリズム -- 自動多言語チェックリスト生成(AMCG)。
自動的なアプローチは、機能にわたってモデルの失敗率を正確に見積もることができることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:05:28 GMT)
A Rationale-Centric Framework for Human-in-the-loop Machine Learning [12.8] 本稿では,RDL(Ralionales-centric Double-robustness Learning)を用いた新たな理性中心型フレームワークを提案する。
RDLは、有理性(すなわち、予測を引き起こすフレーズ)、人間の介入、半現実的な拡張を利用して、スパイラルな関連性やバイアスモデルを切り離し、一般に適用可能な基礎的分布に向かわせる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:12:57 GMT)
Tackling Online One-Class Incremental Learning by Removing Negative
Contrasts [12.0] 他の連続的な学習設定とは違い、学習者は1回だけ新しいサンプルが提示される。
ER-AMLは、入力データと再生データにコントラスト学習に基づく非対称な損失を適用することにより、この設定で強い性能を達成した。
我々は、教師付き学習から教師付き学習環境へ、最近提案されたアプローチを適応させ、コントラストの制約を解き放つ。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 19:17:29 GMT)
Open-set Recognition via Augmentation-based Similarity Learning [11.7] ペアの類似点を学習することで未知(または見知らぬクラスサンプル)を検出することを提案する。
我々はOPG(Pseudo unseen data generationに基づくオープンセット認識)と呼ぶ。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:49:38 GMT)
Introducing Neural Bag of Whole-Words with ColBERTer: Contextualized
Late Interactions using Enhanced Reduction [10.7] ColBERTerは、文脈化された遅延相互作用(ColBERT)と強化されたリダクションを用いたニューラル検索モデルである。
マルチベクタコンポーネントのために、ColBERTerは、各ドキュメントの用語に対するユニークな全ワード表現を学習することで、ドキュメントごとの格納数を減らす。
MS MARCOとTREC-DLのコレクションの結果から、ColBERTerは最大2.5倍のストレージフットプリントを削減できるが、有効性は維持できる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:28:07 GMT)
Object Memory Transformer for Object Goal Navigation [10.4] 本稿では,物体目標ナビゲーション(Nav)のための強化学習手法を提案する。
エージェントは3次元屋内環境をナビゲートし、対象物やシーンの長期観察に基づいて対象物に到達する。
私たちの知る限りでは、ゴール指向ナビゲーションタスクにおけるオブジェクトセマンティクスの長期記憶を利用する最初の作業である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 09:16:56 GMT)
Addressing Client Drift in Federated Continual Learning with Adaptive
Optimization [10.3] 本稿では,NetTailorを連続学習候補として活用することにより,FCL(Federated Continual Learning)を実現するための枠組みを概説する。
適応型フェデレーション最適化は,クライアントドリフトの悪影響を低減し,CIFAR100,MiniImagenet,Deathlonベンチマーク上での有効性を示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 20:00:03 GMT)
Emergence of hierarchical reference systems in multi-agent communication [10.2] 自然言語では、異なるレベルの特異性でオブジェクトを参照することは、文脈における効率的なコミュニケーションのための実践的なメカニズムである。
我々は,人工エージェントにおけるそのような参照システムの出現を研究するために,新しいコミュニケーションゲームである階層型参照ゲームを開発する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:52:07 GMT)
Classifying Cyber-Risky Clinical Notes by Employing Natural Language
Processing [9.8] 近年、アメリカ合衆国内の一部の州では、患者が臨床ノートに自由にアクセスできるように求めている。
本研究は,臨床ノートにおけるセキュリティ・プライバシリスクの特定方法について検討する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 00:36:59 GMT)
Deep Portrait Delighting [9.5] 制約のないポートレート画像から望ましくないシェーディング特徴を除去するディープニューラルネットワークを提案する。
トレーニング手法には3つの正規化戦略が組み込まれている: マスキング損失、高周波シェーディング特徴強調、ソフトシャドウ損失、微妙な照明変化に対する感度向上である。
本手法は,最先端技術と比較して,満足度の向上と一般化を実証する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:05:48 GMT)
Distilling GHZ States using Stabilizer Codes [9.2] 量子誤り訂正符号(QECC)を用いたGHZ状態の蒸留に関する研究
ローカル操作と古典通信に基づくGHZ蒸留プロトコルを開発した。
本稿では, 高速高出力GHZ蒸留法について述べる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:32:50 GMT)
Lahjoita puhetta -- a large-scale corpus of spoken Finnish with some
benchmarks [9.2] ドナート・スピーチ・キャンペーンはフィンランドの通常の口頭で約3600時間のスピーチを収集することに成功している。
収集の主な目的は、フィンランド語を自発的に研究するための代表的かつ大規模な資源を作成し、言語技術と音声ベースのサービスの開発を加速することであった。
収集プロセスと収集コーパスを示し,その汎用性を複数のユースケースで示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:50:25 GMT)
Bayesian Nonparametric Submodular Video Partition for Robust Anomaly
Detection [9.1] MIL(Multiple-instance Learning)は、ビデオ異常検出問題に対処するための効果的な方法である。
我々は,MILモデルトレーニングを大幅に改善するために,新しいベイズ非パラメトリックサブモジュールビデオ分割(BN-SVP)を提案する。
我々の理論解析は,提案アルゴリズムの性能保証を確実にする。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 04:00:49 GMT)
Intrinsic Bias Identification on Medical Image Datasets [9.1] まず、データ固有のバイアス属性を定義し、次いで、医用画像データセットのための新しいバイアス識別フレームワークを提案する。
このフレームワークには、KlotskiNetとBias Discriminant Direction Analysis(bdda)という2つの主要なコンポーネントが含まれている。
3つのデータセットの実験結果から,フレームワークが検出したバイアス特性の有効性が示された。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:28:07 GMT)
Addressing Missing Sources with Adversarial Support-Matching [8.5] そこで本研究では,データ内の2段階階層の2段階に,データの欠如が関係しているシナリオについて検討する。
アルゴリズム的公正性から保護された群の概念に触発され、この第2階層によって彫られた分割を「部分群」と呼ぶ。
私たちは、サブグループに不変な表現を学ぶために、"deployment set"と呼ばれる追加で多様だがラベルなしのデータセットを使用します。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:19:19 GMT)
Distributionally Robust Optimization via Ball Oracle Acceleration [8.4] 凸損失の分散ロバスト最適化(DRO)のためのアルゴリズムを開発し,解析する。
この問題に対する既存のアルゴリズムと比較して、最大$epsilon-4/3$の係数で複雑性を改善する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:31:43 GMT)
A Preliminary Research on Space Situational Awareness Based on Event
Cameras [8.3] イベントカメラは、従来のカメラとは異なる新しいタイプのセンサーである。
トリガーイベントは、画素に照射された明るさの変化である。
従来のカメラと比較して、イベントカメラは高時間分解能、低レイテンシ、高ダイナミックレンジ、低帯域幅、低消費電力の利点がある。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:36:18 GMT)
AIMusicGuru: Music Assisted Human Pose Correction [8.0] 生成した音と生成する動きの因果関係を高次に理解する手法を提案する。
音声シグネチャを用いて、正確な人体ポーズ動作モデルを洗練し、予測する。
また,音楽で演奏する3DヴァイオリンのマルチモーダルデータセットMAPdatをオープンソース化した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:16:42 GMT)
PCP Theorems, SETH and More: Towards Proving Sub-linear Time
Inapproximability [7.9] 分散PCP定理は任意の時間不近似性を証明するために一般化できるが、線形の場合失敗することを示す。
線形時間アルゴリズムの研究の進展を考えると、線形時間近似アルゴリズムの研究を導く上では、サブ線形PCP定理が重要である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:32:15 GMT)
Multi-armed bandits for online optimization of language model
pre-training: the use case of dynamic masking [7.4] トランスフォーマーベース言語モデル(TLM)は最先端の言語処理アプリケーションを提供する。
モデルは、Masked Language Model (MLM)のような汎用目的関数を最小限に抑えるために、大量のテキスト上で事前訓練される。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:12:21 GMT)
Multi-modal Multi-label Facial Action Unit Detection with Transformer [7.3] 本稿では,第3回ABAW(Affective Behavior Analysis)2022コンペティションについて述べる。
映像中の顔行動単位(FAU)を検出するためのトランスフォーマーモデルを提案した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:59:31 GMT)
Rubik's Cube Operator: A Plug And Play Permutation Module for Better
Arranging High Dimensional Industrial Data in Deep Convolutional Processes [6.5] 畳み込みニューラルネットワーク(CNN)は産業データに基づく入力を処理するために広く利用されている。
画像とは異なり、産業データベースシステムの情報は必ずしも空間的に順序づけられるとは限らない。
産業データのデータ構造を適応的に変更するルービックキューブ演算子(RCO)を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:13:56 GMT)
Human Response to an AI-Based Decision Support System: A User Study on
the Effects of Accuracy and Bias [6.3] 本稿では,意思決定支援システムの特徴に対する人間の反応を観察するための一連の実験について述べる。
我々はDSSの正確さとバイアスを変え、参加者の総得点、完了までの時間、提案に従うか無視するかを観察する。
以上の結果から,DSSでは得点が向上する傾向があり,DSSのアドバイスに従えば,DSSの難易度やDSSの精度が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:05:55 GMT)
On the Search for Feedback in Reinforcement Learning [6.3] 我々は,オープンループシーケンスと関連する最適線形フィードバック法則からなる局所的なフィードバック表現の探索を提唱する。
この代替手法は, 高い効率のトレーニングを実現し, 得られた回答は再現可能で信頼性が高く, 得られたクローズド性能は, 最先端のRL技術よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 01:29:19 GMT)
Nonreciprocal waveguide-QED for spinning cavities with multiple coupling
points [6.2] 非相反光子透過はキャビティ導波管系で起こる。
我々の提案は、量子非相互デバイスを実現するための新しい方法を提供する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:49:03 GMT)
Personalized incentives as feedback design in generalized Nash
equilibrium problems [6.1] 定常および時間変化の非単調なナッシュ平衡問題について検討する。
半分散Nash平衡探索アルゴリズムを設計する。
いくつかの企業が提供している配車サービスについては,サービスオーケストレーションとして検討しています。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 09:24:29 GMT)
Analyzing Process-Aware Information System Updates Using Digital Twins
of Organizations [5.8] 我々は、最近開発されたDTO(Digital Twins of Organizations)を用いて、(プロセス認識)情報システムの更新の影響を評価する。
より詳しくは、DTOの設定を用いて更新をモデル化し、情報システム更新の異なる種類の影響を定量的に評価する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:19:59 GMT)
Predicting Personas Using Mechanic Frequencies and Game State Traces [5.4] 本稿では,プレイヤーペルソナを推定する2つの手法を提案する。1つは正規教師付き学習とゲームメカニクスの集約尺度を用いて開始し,もう1つは密集したゲームプレイ観測のトレースに基づくシーケンス学習に基づく。
どちらの手法も、手続き的ペルソナと一致して定義されたプレイペルソナを予測する際に高い精度を達成するが、プレイヤー自身がアンケートを用いて定義したプレイスタイルを全く予測できない。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:52:11 GMT)
An Ensemble Approach for Facial Expression Analysis in Video [5.4] 本稿では,ABAW3 2022の課題について紹介する。
論文は問題の解決に焦点を当てている。
価-覚醒推定とアクションユニット検出。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:25:23 GMT)
Multitasking Framework for Unsupervised Simple Definition Generation [5.2] 本稿では,言語学習者や低リテラシー学習者を支援するための,シンプル定義生成の課題を提案する。
この課題の重要な課題は、多くの言語における学習者の辞書の欠如である。
複雑な定義を持つ標準辞書と任意の単純なテキストを含むコーパスのみを必要とするマルチタスクフレームワークSimpDefinerを提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:16:04 GMT)
Interpretability of Neural Network With Physiological Mechanisms [5.2] ディープラーニングは、レグレッションと分類タスクの様々な領域で異常な精度を達成した強力な最先端技術として、引き続き機能している。
ニューラルネットワークモデルを最初に提案する目的は、数学的表現アプローチを使用して複雑な人間の脳を理解することを改善することである。
近年のディープラーニング技術は、ブラックボックス近似器として扱われることによって、機能的プロセスの解釈を失う傾向にある。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:40:04 GMT)
Estimating Social Influence from Observational Data [5.2] 本研究では,社会的影響を推定する問題,個人の行動が将来の仲間の行動に与える影響を考察する。
鍵となる課題は、友人間の共有行動は、影響または他の2つの要因によって等しく説明できることである。
本稿では,3つの貢献によって社会的影響を推定する上での課題について論じる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 20:21:24 GMT)
Effects of counter-rotating-wave terms on the noisy frequency estimation [4.8] 本研究では, 数値的に厳密な階層型運動方程式を用いて, 散逸環境に埋め込まれた2レベル原子系のトンネル周波数を推定する問題について検討する。
反回転波項は、中間結合系と強結合系においてノイズの多い量子距離論的性能を高めることができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:40:45 GMT)
Expression Classification using Concatenation of Deep Neural Network for
the 3rd ABAW3 Competition [4.8] 第3回Affective Behavior Analysis In-The-Wildコンペティションでは、ビデオからの人間の顔の基本的な表現を含む8つのクラスを含む表現分類を行う。
本稿では,表現分類タスクに対してRegNet,Attention Module,Transformerの組合せ表現を行う。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:36:21 GMT)
A Deep-Discrete Learning Framework for Spherical Surface Registration [4.8] 皮質表面の登録は神経画像解析の基本的なツールである。
本稿では,登録を多ラベル分類問題に変換する,教師なし学習に基づく新しいフレームワークを提案する。
実験により,提案するフレームワークは,最もポピュラーな古典的表面登録アルゴリズムと比較して,類似性やアラル歪みの点で競合的に動作することが示された。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:47:11 GMT)
Automatic Speech recognition for Speech Assessment of Preschool Children [4.6] 本研究では,幼児期の音声の音響的特徴と言語的特徴について検討した。
Wav2Vec 2.0は、堅牢なエンドツーエンド音声認識システムを構築するために使用できるパラダイムである。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:15:24 GMT)
Unsupervised Simultaneous Learning for Camera Re-Localization and Depth
Estimation from Video [4.5] 本稿では,モノクロカメラの再位置推定と,ラベルなし映像列からの深度推定を行うための教師なし同時学習フレームワークを提案する。
本フレームワークでは,シーン座標を方向から推定する2つのネットワークと,カメラのポーズを推定するために合成された各画像からの深度マップを訓練する。
また,本手法は,訓練された環境下での最先端の単分子深度推定よりも優れていた。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:11:03 GMT)
Continuous-Time Audiovisual Fusion with Recurrence vs. Attention for
In-The-Wild Affect Recognition [4.1] 本稿では,第3報 ABAW (Affective Behavior Analysis in-the-Wild) 課題について述べる。
再帰性と注意(Recurrence and attention)は、文献で広く使われている2つのシーケンスモデリングメカニズムである。
LSTM-RNNは低コンプレックスCNNバックボーンと組み合わせることでアテンションモデルより優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:22:56 GMT)
An Evolutionary Note on Smart City Development in China [4.0] スマートシティの概念は世界中の主要都市で急速に採用された。
中国におけるスマートシティ開発の推進力について検討した。
将来のスマートシティを構築するための4つの大きな課題が議論されている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:44:19 GMT)
FitCLIP: Refining Large-Scale Pretrained Image-Text Models for Zero-Shot
Video Understanding Tasks [3.8] 大規模な事前訓練された画像テキストモデルは、少数のタスクで驚くほどゼロショットのパフォーマンスを示している。
我々は、ゼロショット映像理解タスクのために、これらのモデルを洗練するための微調整戦略を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:35:00 GMT)
Deep learning for laboratory earthquake prediction and autoregressive
forecasting of fault zone stress [3.7] 実験室では、摩擦性スティックスリップ現象が地震と地震のサイクルに類似している。
近年の研究では, 断層帯の音響放射を用いて, 機械学習が地震のいくつかの側面を予測できることが示されている。
本研究では,室内地震予測と自己回帰予測のための深層学習(DL)手法を実証する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 19:38:32 GMT)
Using Orientation to Distinguish Overlapping Chromosomes [3.6] 私たちはDeep Learningメソッドを使って、タッチやオーバーラップする染色体を分割します。
我々は第2段階で染色体のインスタンスを分離し、染色体の向きを予測する。
本稿では,ニューラルネットワークを用いて方向を予測できる新しいダブルアングル表現を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:52:43 GMT)
Are Evolutionary Algorithms Safe Optimizers? [3.3] 本稿では、進化計算(EC)コミュニティにおける安全な最適化問題(SafeOP)への関心を再燃させることを目的とする。
我々は、SafeOPの正式な定義を提供し、選択された安全な最適化アルゴリズムの性能に対する鍵となるSafeOPパラメータの影響を調査し、最先端の安全な最適化アルゴリズムに対してECをベンチマークする。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:11:36 GMT)
mcBERT: Momentum Contrastive Learning with BERT for Zero-Shot Slot
Filling [3.2] BERTを用いたモーメントコントラスト学習のためのmcBERTを提案し,ロバストなゼロショットスロット充足モデルを提案する。
SNIPSベンチマークによる実験結果から,mcBERTは従来モデルよりもかなり優れていたことがわかった。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 09:04:52 GMT)
A Simulation Benchmark for Vision-based Autonomous Navigation [3.1] この研究は、視覚に基づく自律ナビゲーションのためのシミュレーターベンチマークを導入する。
ベンチマークには、完全な自律的なビジュアルナビゲーションスタックのさまざまなコンポーネントのモジュール化された統合が含まれている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 12:51:10 GMT)
Quantum-accelerated algorithms for generating random primitive
polynomials over finite fields [3.1] 量子アルゴリズムを用いて、有限体上のランダムプリミティブを生成する問題を解く方法を示す。
コードベースの暗号、コードベースの識別とシグネチャスキーム、キー通信プロトコルにおけるプリミティブの今後の応用の道を開く。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:06:51 GMT)
Remember and Forget Experience Replay for Multi-Agent Reinforcement
Learning [3.1] マルチエージェント強化学習(MARL)におけるRefreed and Forget for Experience Replay(ReF-ER)アルゴリズムの拡張について述べる。
ReF-ERはOpenAI Gymから複雑な流体の流れまで、連続的な制御を行うための技術アルゴリズムの状況よりも優れていた。
ReF-ER MARLのポリシーと値関数に1つのフィードフォワードニューラルネットワークを用いることで、複雑なニューラルネットワークアーキテクチャに依存する技術アルゴリズムの状態を上回ります。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 19:59:43 GMT)
Onto4MAT: A Swarm Shepherding Ontology for Generalised Multi-Agent
Teaming [2.9] 我々は、Swarm AIがその環境とシステムについて推論できる形式的な知識表現設計を提供する。
我々は,人間とチーム間のより効果的なチーム編成を実現するために,Ontology for Generalized Multi-Agent Teaming(Onto4MAT)を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 09:36:50 GMT)
The Dutch Draw: Constructing a Universal Baseline for Binary Prediction
Models [2.9] パフォーマンススコアの「良さ」を評価するためには、適切なベースラインが必要である。
本稿では、ダッチ・ドロー(DD)と呼ばれる全ての二項分類モデルに対する普遍的ベースライン法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:20:27 GMT)
Channel Polarization of Two-dimensional-input Quantum Symmetric Channels [2.8] 本稿では、量子対称チャネルと呼ばれる量子チャネルのクラスを定義する。
従来のチャネル分極と同様のチャネル結合と分割プロセスの下では、座標チャネルの最大単一文字コヒーレント情報が分極される。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:24:32 GMT)
Interpretable Prediction of Pulmonary Hypertension in Newborns using
Echocardiograms [2.8] 新生児および乳児の肺高血圧は、いくつかの肺疾患、心臓疾患、全身疾患に関連する複雑な疾患である。
心エコー図を用いたコホート194新生児のPH予測のための多視点ビデオに基づく多視点深層学習手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 12:33:58 GMT)
Convergence of eigenstate expectation values with system size [2.7] 本研究では, 局所演算子の固有状態期待値が, 系サイズが多様化するにつれて, エネルギー密度のスムーズな関数にどのように収束するかを検討する。
任意の空間次元の変換不変量子格子系において、局所作用素の測度ゼロ集合を除くすべての場合において、有限サイズの固有状態期待値の偏差が1/O(N)$で低いことが証明される。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 23:57:10 GMT)
Calibration Error for Heterogeneous Treatment Effects [2.7] ヘテロジニアス処理効果(HTE)のためのロバストな推定器を提案する。
我々のアプローチは、二重に頑健な治療効果推定器によって動機付けられ、不偏で、補充、過度な適合、高次元性の問題に耐性がある。
本稿では,提案手法を用いて学習したHTEモデルの校正評価を行い,CRITEO-UPLIFT試験への適用について述べる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:10:43 GMT)
Facial Expression Recognition based on Multi-head Cross Attention
Network [2.6] ABAW 2022で導入されたVA推定と表情問題に対処するために,DANモデルの拡張版を提案する。
VA推定タスクの平均CCC値は0.44、表現分類タスクの平均F1スコアは0.33である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:47:56 GMT)
k-Rater Reliability: The Correct Unit of Reliability for Aggregated
Human Annotations [2.5] 集約データセットの正しいデータ信頼性として、提案されたk-rater信頼性(kRR)を用いる必要がある。
我々は、WordSim-353上でkRRを計算するための経験的、分析的、ブートストラップに基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:05:06 GMT)
Steganalysis of Image with Adaptively Parametric Activation [2.4] Adap-tive Parametric Activation Moduleは、Nega-tiveの埋め込み信号を保存するように設計されている。
クラス間最大距離によるクロスエントロピー損失の限界を克服するために,コントラスト学習に基づく損失関数を適用した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 04:44:51 GMT)
Position Tracking using Likelihood Modeling of Channel Features with
Gaussian Processes [2.4] 最近のローカライゼーションフレームワークは、複雑なチャネル計測の空間情報を利用して正確な位置を推定する。
本稿では,強力なマルチパス伝搬を持つスパースデータセットに順応する新しいフレームワークを提案する。
本フレームワークでは,トレーニングされたGPと直視域と粒子フィルタのダイナミックスモデルを組み合わせる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:06:01 GMT)
Learning the Dynamics of Autonomous Linear Systems From Multiple
Trajectories [2.2] 自律線形系同定の学習速度と一貫性に関する既存の結果は、1つの長い軌道からの定常状態の挙動の観測に依存している。
定常状態の挙動が容易に観察できない複数の短い軌跡に基づく学習システムダイナミクスのシナリオを考察する。
厳密な安定系の学習速度は$mathcalO(sqrtfraclogNN)$、学習速度は$mathcalO(frac(logN)dsqrとなる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 01:29:53 GMT)
Focus-and-Detect: A Small Object Detection Framework for Aerial Images [1.9] 我々はFocus-and-Detectと呼ばれる2段階のオブジェクト検出フレームワークを提案する。
第1段階は、焦点領域を構成するオブジェクトのクラスタを生成する。
第2段階は対象検出器ネットワークであり、焦点領域内の物体を予測する。
提案した2段階のフレームワークは,VisDrone検証データセットのAPスコアが42.06であることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:43:56 GMT)
Precipitaion Nowcasting using Deep Neural Network [1.7] 本稿では,高分解能降水マップを得るためのパッチ抽出アルゴリズムを提案する。
我々は,ぼやけた画像の問題を解消し,降水マップにおけるゼロ値画素の影響を低減するために,損失関数を提案した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:28:08 GMT)
The Fixed Sub-Center: A Better Way to Capture Data Complexity [1.6] 我々は、F-SC(Fixed Sub-Center)を用いて、より離散的なサブセンターを構築することを提案する。
実験の結果,F-SCは画像分類と微粒化処理の精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:21:28 GMT)
Reactive Whole-Body Obstacle Avoidance for Collision-Free Human-Robot
Interaction with Topological Manifold Learning [1.5] 本稿では,リアクティブな全身障害物回避手法を提案する。
提案手法はトポロジカル多様体学習と最新の深層学習の両方を活用する。
産業用コボットとは対照的に,ロボットアームは任意の3次元形状の障害物を積極的に回避することができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:11:43 GMT)
Non-Parametric Stochastic Policy Gradient with Strategic Retreat for
Non-Stationary Environment [1.5] 非パラメトリックな最適制御ポリシのシーケンスを学習するための体系的な方法論を提案する。
本手法はDDPG法とTD3法を学習性能の点で大きな差で上回っている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:41:13 GMT)
Email Summarization to Assist Users in Phishing Identification [1.4] サイバーフィッシング攻撃は、特定の情報や手がかりが存在する場合にのみ、トレーニングデータによってより正確で、標的になり、調整される。
この研究は、トランスフォーマーベースの機械学習を活用して、将来的な心理的トリガーを分析する。
次に、この情報をアマルゲイトし、ユーザーに提示し、電子メールが「フィシー」なのか(ii)自己学習した先進的な悪意あるパターンなのかを簡単に判断できるようにします。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 23:03:46 GMT)
Multiple Emotion Descriptors Estimation at the ABAW3 Challenge [1.4] ABAW3チャレンジに参加する際に、複数の感情記述子推定のためのアーキテクチャを設計する。
1969年、Ekman and Friesenの理論に基づいて、私たちは手動車(顔の動きユニット)とメッセージを測定するための異なるアーキテクチャを設計した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 04:55:21 GMT)
Probing phases of quantum matter with an ion-trap tensor-network quantum
eigensolver [1.3] 我々は、TNアンザッツ状態を直接量子シミュレータにエンコードし、純粋に数値シミュレーションよりも指数関数的に有利である可能性がある。
特に、イオントラップ量子コンピュータ上の変分量子固有解法を用いて、量子符号化されたTNアンザッツ状態の最適化を実証する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:00:19 GMT)
Principal Fairness for Human and Algorithmic Decision-Making [1.3] 我々は、人間とアルゴリズムによる意思決定のために、主公正と呼ばれる新しい公正の概念を導入する。
既存の統計的公正の定義とは異なり、主公正性は個人が決定に影響を及ぼすことができるという事実をはっきりと説明している。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 20:35:58 GMT)
HiFi++: a Unified Framework for Neural Vocoding, Bandwidth Extension and
Speech Enhancement [1.1] 本稿では,ニューラルボコーディング,帯域拡張,音声強調のための新しいHiFi++フレームワークを提案する。
改良されたジェネレータアーキテクチャと簡易なマルチディスクリミネータトレーニングにより、HiFi++はこれらのタスクにおける最先端技術と同等に機能することを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:25:51 GMT)
Statistic Selection and MCMC for Differentially Private Bayesian
Estimation [1.1] 本稿では,人口分布のパラメータの個人的ベイズ推定について述べる。
我々は、プライバシー制限の下では、非プライバシ設定で最も有益な統計が最適な選択ではないことに気付きました。
そこで本稿では,モンテカルロをベースとしたいくつかの数値計算手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:57:37 GMT)
Transformer Compressed Sensing via Global Image Tokens [1.0] 低解像度入力に自然に画像を埋め込む新しい画像分解法を提案する。
我々は、よく知られたCS-MRIニューラルネットワークのCNNコンポーネントをTNNブロックに置き換え、KDによる改善を実証する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 05:56:30 GMT)
A Deep Learning Approach to Probabilistic Forecasting of Weather [1.0] 本稿では,2つの連鎖学習ステップに基づく確率予測手法について論じる。
本手法は,22年間の気象調査・予測(WRF)シミュレーションデータを用いて,グリッド上の表面風の時系列データを用いて検証する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 20:08:54 GMT)
On the link between conscious function and general intelligence in
humans and machines [0.9] 意識機能に関する3つの理論に関連する認知能力について考察する。
これら3つの理論は、意識機能と、人間におけるドメインジェネラルインテリジェンス(ドメインジェネリジェンス)のいくつかの側面を特に関連付けている。
3つの理論のそれぞれからの洞察を統一モデルに組み込む方法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:22:23 GMT)
Mono vs Multilingual BERT: A Case Study in Hindi and Marathi Named
Entity Recognition [0.8] 我々は、ヒンディー語やマラタイ語のような低リソースのインドの言語について、NERについて検討する。
BERTのさまざまなバリエーションであるbase-BERT、RoBERTa、AlBERTについて検討し、公開されているHindiおよびMarathi NERデータセットでそれらをベンチマークする。
モノリンガルのMahaRoBERTaモデルがMarathi NERに最適であるのに対し,マルチリンガルのXLM-RoBERTaはHindi NERに最適であることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:50:41 GMT)
Automated Algorithm Selection: from Feature-Based to Feature-Free
Approaches [0.6] 本稿では,データ中に暗黙的なシーケンシャル情報がカプセル化されている最適化に適用可能な,アルゴリズム選択のための新しい手法を提案する。
我々は、よく知られた4つのドメインから選択して、オンラインビンパッキングのパッキングを予測するために、2種類のリカレントニューラルネットワークをトレーニングする。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 23:59:50 GMT)
Random Forest Regression for continuous affect using Facial Action Units [0.3] 我々は第3回ワークショップ・コンペティション・オブ・エフェクティブ・ビヘイビア・アナリティクス・イン・ザ・ワイルド(ABAW)へのアプローチについて述べる。
OpenFaceを用いて顔の特徴を抽出し,複数出力のランダムフォレスト回帰器を訓練した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:41:09 GMT)
g2pW: A Conditional Weighted Softmax BERT for Polyphone Disambiguation
in Mandarin [0.3] 多音不明瞭化は、マンダリン・グラテム・音素変換において最も重要な課題である。
本稿では,学習可能なソフトマックスウェイトを適応させて,ポリフォニックな特徴を持つBERTの出力を条件付ける,g2pWという新しい手法を提案する。
実験の結果,g2pWはCPPデータセット上の既存の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 08:56:02 GMT)
Kullback-Leibler control for discrete-time nonlinear systems on
continuous spaces [0.2] Kullback-Leibler (KL) 制御は非線形最適制御問題の効率的な数値解法を可能にする。
再構成されたKL制御は、不合理な仮定を伴わずに、元のKL制御のような効率的な数値アルゴリズムを許容することを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:03:42 GMT)
minicons: Enabling Flexible Behavioral and Representational Analyses of
Transformer Language Models [0.2] miniconsはオープンソースライブラリで、トランスフォーマーベースの言語モデルの振る舞い解析と表現解析のための標準APIを提供する。
ミニコンは、(1)予測レベルで、(2)単語/文レベルの確率を効率的に抽出する機能を提供し、(2)表現レベルでは、単語/フレーズレベルのベクトルの効率的な抽出を容易にすることによって、2つのレベルで分析方法を適用することができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:11:06 GMT)
Gender and Racial Stereotype Detection in Legal Opinion Word Embeddings [0.1] 本稿では、米国事例法に基づく司法意見に基づいて訓練された単語埋め込みにおける性別と人種的ステレオタイプを特定するためのアプローチを提案する。
まず、これらのバイアスを識別する手法が、法的意見文で訓練された単語埋め込みの使用に適していないかを説明する。
次に、法域内の性別と人種の偏見を識別する領域適応手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:30:49 GMT)
Kratt: Developing an Automatic Subject Indexing Tool for The National
Library of Estonia [0.0] Krattは自動被写体インデックスツールのプロトタイプである。
クラットは本を索引づけするのに約1分かかり、人間を10~15回上回ります。
モデルをトレーニングし、より注意深い前処理技術を適用するためのより大きなコーパスを含めることで、結果を向上することができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 11:45:44 GMT)
Universal Dephasing Mechanism of Many-Body Quantum Chaos [0.0] 我々は、相互作用によって、普遍的な多体量子カオス状態が出現することを示す。
Altshuler-Aronov-Khmelnitskiiがローカライゼーションの理論で軽蔑しているように、デファーシング機構はカオスへの移行の基盤となる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:41:43 GMT)
Two Stage Curvature Identification with Machine Learning: Causal
Inference with Possibly Invalid Instrumental Variables [0.0] 本稿では,2段階曲率同定 (TSCI) と呼ばれる新しい手法を提案する。
処理モデルを一般的な機械学習手法に適合させ,機械学習手法から過度に適合するバイアスを除去する新しいバイアス補正法を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:19:24 GMT)
The early-time Lieb-Robinson correlation function for qubit arrays [0.0] 初期の相互作用量子ビット系に対するリーブ・ロビンソン相関関数の先頭次数を計算する。
解析結果は数値計算と比較され、1, 2, 3次元の正則量子ビット格子に適用される。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:07:46 GMT)
Semantic system for searching of employees [0.0] 企業内の従業員の情報を検索するセマンティックシステムを提案する。
企業内の新従業員の位置や機能を知る上で,企業内の新従業員のオリエント向上に役立つだろう。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 12:41:04 GMT)
Self-testing nonlocality without entanglement [0.0] エンタングルメントのない非局所性を示す測定値がデバイスに依存しない方法で証明可能であることを示す。
この結果はまた、真のネットワーク量子非局所性は非絡み合いの測定だけで得られることを示した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:45:41 GMT)
Satellite Monitoring of Terrestrial Plastic Waste [0.0] プラスチック廃棄物は、監視が難しい重要な環境汚染物質である。
我々は、Sentinel-2衛星データのスペクトル、空間、時間成分を分析するニューラルネットワークシステムを構築した。
インドネシアでの性能評価を行い, 公共データベースの2倍以上の374個の廃棄物集合体を検出した。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:17:11 GMT)
SIFT and SURF based feature extraction for the anomaly detection [0.0] 本稿では,SIFTアルゴリズムとSURFアルゴリズムを用いて異常検出のための画像特徴を抽出する方法を示す。
これらの特徴ベクトルを用いて、実世界のデータセット上で様々な分類器を訓練する。
SIFTアルゴリズムとSURFアルゴリズムを特徴抽出器として使用できることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:46:25 GMT)
Real-time simulation of light-driven spin chains on quantum computers [0.0] 我々は,IBMの量子デバイスを用いた量子コンピュータ上での周期駆動(フロケット)システムのリアルタイム進化について検討した。
この単純な1量子ビットモデルでは、Floquet状態間の遷移確率によって示されるように、Floquet状態はリアルタイムで発展することができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:13:06 GMT)
Physics-based Learning of Parameterized Thermodynamics from Real-time
Thermography [0.0] 実時間サーモグラフィデータから熱過程のダイナミクスを学習するための物理に基づく新しいアプローチを提案する。
提案手法は雑音に対して頑健であり,パラメータ推定の精度向上に有効であることを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 16:06:31 GMT)
Multitask Emotion Recognition Model with Knowledge Distillation and Task
Discriminator [0.0] ABAWデータセットを用いて感情を予測するマルチタスクモデルを設計した。
不完全なラベルから知識蒸留技術を適用してモデルを訓練した。
その結果、マルチタスク学習タスク検証データセットで2.40を達成しました。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:50:48 GMT)
Multiparameter estimation for qubit states with collective measurements:
a case study [0.0] 両パラメータの同時最適推定は, 簡易な集団計測戦略により達成可能であることを示す。
状態がほぼ純粋である場合、十分に大きな$N$でない場合、ほとんどの情報は最大3$j$-subspaceで取得される。
また、ベルマルチポート構成を用いて、$j=N/2$と$j=N/2-1部分空間への射影を区別できることを示す数値的な結果を得る。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 09:25:15 GMT)
Multilevel Bayesin Deep Neural Networks [0.0] 我々は、ディープニューラルネットワーク(NN)、特に、クラスニューラルネットワーク(TNN)に関連付けられた推論について検討する。
本研究では,このようなモデルに対するマルチレベルモンテカルロ法(MLMC)を提案する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 09:49:27 GMT)
Multi-modal multi-objective model-based genetic programming to find
multiple diverse high-quality models [0.0] 遺伝的プログラミング(GP)は、しばしば説明可能な人工知能(XAI)に貢献するのに一意に適しているとされる。
本稿では,GP-GOMEAと呼ばれる現代モデルに基づくGPアルゴリズムを拡張した,新しいマルチモーダルマルチツリー多目的GPアプローチにより,これを正確に実現する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:35:07 GMT)
Lower Bound of $l_{1}$ Norm of Coherence of Bipartite Qubit-Qudit System
and its Application in the Detection of Entangled Tripartite
Qudit-Qubit-Qudit System [0.0] 本研究では,2次元の高次元の絡み合い状態と多次元の絡み合い状態を検出するための絡み合い検出問題について検討する。
任意の$l_1$の2部量子量子系のコヒーレンスノルムが上限の$U$より大きい場合、与えられた量子量子量子状態は絡み合っている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 06:34:33 GMT)
Locally Asynchronous Stochastic Gradient Descent for Decentralised Deep
Learning [0.0] Local Asynchronous SGD (LASGD) は、モデル同期にAll Reduceに依存する非同期分散アルゴリズムである。
ImageNetデータセット上の画像分類タスクにおいて、LASGDの性能を実証的に検証する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:25:15 GMT)
Learning Spatiotemporal Chaos Using Next-Generation Reservoir Computing [0.0] 次世代カオス貯水池コンピュータと組み合わせたMLアーキテクチャは,訓練時間103~10ドル4倍の最先端性能を示す。
また、モデルの翻訳対称性を利用して、計算コストとトレーニングデータをさらに削減し、それぞれが$sim$10の係数で処理する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 18:42:12 GMT)
Keypoints Tracking via Transformer Networks [0.0] 本稿では,トランスフォーマネットワークを用いた画像間におけるスパースキーポイントの追跡に関する先駆的な研究を提案する。
実時間およびロバストなキーポイントトラッキングの特定の事例について検討する。
提案手法は, 粗いマッチングと, キーポイントの対応の微妙な局所化の2段階からなる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 05:06:46 GMT)
Intelligent Systematic Investment Agent: an ensemble of deep learning
and evolutionary strategies [0.0] 本稿では,進化的アルゴリズムと深層学習モデルを組み合わせた長期投資戦略開発手法を提案する。
本手法は, 長期投資計画(SIP)におけるETF決定を一定期間にわたって改善することにより, 長期的富の創出に重点を置いている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:39:05 GMT)
Implementation of single-qubit measurement-based t-designs using IBM
processors [0.0] 超伝導量子コンピュータにおける計測に基づくアプローチにより生成されたt設計について検討する。
特に、IBM量子プロセッサ上で6量子グラフ状態の測定を行うことにより、正確に1量子ビットの3次元設計を実装した。
その結果, 単位のアンサンブルは1-設計であったが, テスト条件下では2-設計や3-設計ではなく, 偏極雑音の結果であることがわかった。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:35:27 GMT)
Human Gait Recognition Using Bag of Words Feature Representation Method [0.0] このアルゴリズムは93人の個人からなるユニークな人間の歩行データに基づいて訓練され、テストされ、評価される。
提案手法は, 一般的な統計的特徴を用いた場合と比較して, 精度が向上する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 19:57:53 GMT)
Feature visualization for convolutional neural network models trained on
neuroimaging data [0.0] 畳み込みニューラルネットワーク(CNN)の機能可視化による最初の結果を示す。
我々は、MRIデータに基づく性分類や人為的病変分類など、さまざまなタスクのためにCNNを訓練した。
得られた画像は、その形状を含む人工的な病変の学習概念を明らかにするが、性分類タスクにおける抽象的な特徴を解釈することは困難である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:24:38 GMT)
Fast, high precision dynamics in quantum optimal control theory [0.0] 我々は、最先端技術よりもはるかに高速な最適化のための新しい理論量子制御フレームワークを提案する。
実数列項とその勾配の導出式は、シミュレーション設定の初期の近似積分に基づいて、演算子と積分の計算コストを高く見積もることができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:42:46 GMT)
Facial Action Unit Recognition With Multi-models Ensembling [0.0] 本稿では,ABAW(Affective Behavior Analysis in-the-wild)2022のコンペティションについて述べる。
改良されたIResnet100をバックボーンとして使用し、Aff-Wild2のAUデータセットを、プライベートAuと式データセットで事前訓練された3つのモデルとGlint360Kでトレーニングする。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 12:50:02 GMT)
Extended critical regimes of deep neural networks [0.0] 重み付き重みは、微調整パラメータを使わずに、拡張臨界状態の出現を可能にすることを示す。
この拡張クリティカルレジームでは、DNNは層間のリッチで複雑な伝播ダイナミクスを示す。
効率的なニューラルアーキテクチャの設計のための理論的ガイドを提供する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 10:15:50 GMT)
Explainable Artificial Intelligence for Exhaust Gas Temperature of
Turbofan Engines [0.0] 記号回帰は「ブラックボックス」モデルの解釈可能な代替品である。
本研究では, 実寿命排ガス温度(EGT)データにSRを適用し, 飛行全体を通して高周波数で収集する。
その結果, 3degCの絶対差は, モデル精度に有意な結果が得られた。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 15:05:32 GMT)
Evolved Open-Endedness in Cultural Evolution: A New Dimension in
Open-Ended Evolution Research [0.0] 我々は、文化的進化は、オープンエンド進化システムのもう一つの実例と見なされるべきであると主張する。
本稿では,進化系としての文化の概観を,オープンエンド進化系としての人類文化進化の興味深い事例として紹介する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 12:55:23 GMT)
Ensembling and Knowledge Distilling of Large Sequence Taggers for
Grammatical Error Correction [0.0] 大規模構成における最先端トランスフォーマーを用いたエンコーダのアンサンブルに着目し, GEC シーケンスタグアーキテクチャの改善について検討する。
私たちの最高のアンサンブルはBEA 2019でF_0.5$スコア76.05という新しいSOTA結果を達成する(テスト)。
さらに、訓練アンサンブルを用いて知識蒸留を行い、新しい合成訓練データセット「Troy-Blogs」と「Troy-1BW」を生成する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:18:36 GMT)
Encoding quantum bits in bound electronic states of a graphene nanotorus [0.0] グラフェンナノトーラスの内面に閉じ込められた電子の量子状態を用いて、新しい物理量子ビットとして実現することを提案する。
量子情報処理の基本課題は、外部磁場と電場を用いて行うことができる。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 21:50:33 GMT)
Direct evaluation of progression or regression of disease burden in
brain metastatic disease with Deep Neuroevolution [0.0] 深部神経進化(Deep Neuroevolution、DNE)は、小さなトレーニングセットでうまく機能する放射線学人工知能(AI)を生成することができる。
そこで我々はDNEを用いて,転移性脳疾患の進行と退縮を予測する機能近似を行った。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 05:29:09 GMT)
Deep reinforcement learning for optimal well control in subsurface
systems with uncertain geology [0.0] 深部強化学習(DRL)に基づく一般制御政策枠組みを導入し, 地下流れにおける閉ループ決定について検討した。
DRLに基づく手法は、従来のモデルよりも頑健な最適化と比較して、NPVの15%(2Dの場合)と33%(3Dの場合)の増加をもたらすことが示されている。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 22:50:47 GMT)
Correlation between concurrence and mutual information [0.0] コンカレンスと相互情報の関係を理解するための2ビットシステムについて検討する。
一致の値が均一に分布するランダムな純粋状態のアンサンブルに対して,一致の結合確率と相互情報の計算を行う。
共通アンサンブルにおいて、ゼロの相互情報は最も可能性が高いが、古典的な情報と一致との間には正の相関関係がある。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 03:35:41 GMT)
Behavior Trees in Robot Control Systems [0.0] 振舞い木の主な考え方は、モジュラリティ、階層、フィードバックを活用することである。
ロボットタスクは、しばしばサブタスクの階層に分解されるため、そのようなモジュールの階層は自然である。
フィードバック制御は、低レベル制御システムにおける不確実性と障害を扱うための基本的なツールである。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:16:15 GMT)
BASiNETEntropy: an alignment-free method for classification of
biological sequences through complex networks and entropy maximization [0.0] 本研究は, 複雑なネットワークとエントロピーによる生物配列の分類法を提案する。
最大エントロピー原理は、RNAクラスに関する最も情報性の高いエッジを同定し、フィルターされた複雑なネットワークを生成するために提案される。
提案手法は13種の異なるRNAクラスの分類において評価された。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 14:19:43 GMT)
Asymmetric comb waveguide for strong interactions between atoms and
light [0.0] 寒冷なルビジウム原子は1.3mKの深さポテンシャルで構造から100nm近い距離で閉じ込められることを示す。
この位置に閉じ込められた原子に対しては、誘導光子への放出が好まれており、ベータ係数は0.88、放射崩壊速度は自由空間崩壊率の10倍である。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 07:30:09 GMT)
A platform for causal knowledge representation and inference in
industrial fault diagnosis based on cubic DUCG [0.0] システムの動作状況を正確に把握し、時間内に故障を検出するためには、システムの動作を制御することが重要である。
システム障害の発生は段階的なプロセスであり、現在のシステム障害の発生はシステムの以前の状態に依存する可能性がある。
時系列に基づく故障診断技術は、システムの動作状態をリアルタイムで監視し、許容時間間隔内でシステムの異常動作を検出し、障害の根本原因を診断し、状態傾向を予測する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 02:06:22 GMT)
A Perturbation Constrained Adversarial Attack for Evaluating the
Robustness of Optical Flow [0.0] Perturbation Constrained Flow Attack (PCFA)は、現実の攻撃として適用性よりも破壊性を強調する新しい敵攻撃である。
実験の結果,PCFAのホワイトボックスおよびブラックボックス設定への適用性は確認できたが,従来の攻撃フレームワークに比べて,光フローに対して強い逆方向のサンプルが検出された。
予測品質と対向ロバスト性を両立させ,高品質な手法が必ずしもロバストであるとは限らないことを示す。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 17:10:26 GMT)
A Local Convergence Theory for the Stochastic Gradient Descent Method in
Non-Convex Optimization With Non-isolated Local Minima [0.0] 非孤立ミニマは、未探索のままのユニークな挑戦を示す。
本稿では, 勾配降下法の非溶解大域ミニマへの局所収束について検討する。
論文参考訳(メタデータ) (Thu, 24 Mar 2022 13:51:57 GMT)