Scaling Semantic Segmentation Beyond 1K Classes on a Single GPU [87.5] 既存のセマンティックセグメンテーションモデルのトレーニングとスケールアップのための新しいトレーニング手法を提案する。
我々は、LVISとCOCOアノテーションからブートストラップした1284クラスのデータセットに対するアプローチの明確な利点を示し、DeeplabV3+モデルの3倍のmIoUを実現した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:38:34 GMT)
Modeling Object Dissimilarity for Deep Saliency Prediction [86.1] 本稿では,複数の物体間の差分をモデル化する検出誘導サリエンシー予測ネットワークについて紹介する。
私たちのアプローチは一般的であり、深いサリエンシー予測ネットワークから抽出された特徴とオブジェクトの不類似性を融合させることができます。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:10:37 GMT)
Open Domain Generalization with Domain-Augmented Meta-Learning [83.6] オープンドメイン一般化(OpenDG)の新しい実践的問題について研究する。
本稿では,オープンドメイン一般化表現を学ぶためのメタ学習フレームワークを提案する。
種々のマルチドメインデータセットの実験結果から、提案したドメイン拡張メタラーニング(DAML)が、未確認ドメイン認識の先行手法より優れていることが示された。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:12:24 GMT)
InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.4] 逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 01:19:22 GMT)
A Design Space Study for LISTA and Beyond [79.8] 近年では、反復アルゴリズムの展開による問題固有のディープネットワーク構築に大きな成功を収めている。
本稿では,深層ネットワークにおける設計アプローチとしてのアンローリングの役割について再考する。
スパースリカバリのためのlistaを代表例として,未ロールモデルに対する設計空間調査を初めて実施した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 23:01:52 GMT)
Just Label What You Need: Fine-Grained Active Selection for Perception
and Prediction through Partially Labeled Scenes [78.2] 提案手法は,コストに配慮した手法と,部分的にラベル付けされたシーンを通じて詳細なサンプル選択を可能にする一般化を導入している。
実世界の大規模自動運転データセットに関する我々の実験は、微粒な選択が知覚、予測、下流計画タスクのパフォーマンスを向上させることを示唆している。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:57:41 GMT)
TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.6] TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 20:01:00 GMT)
Learning What To Do by Simulating the Past [76.9] 学習した特徴エンコーダと学習した逆モデルを組み合わせることで、エージェントが人間の行動を後方にシミュレートして、彼らがすべきことを推測できることを示す。
得られたアルゴリズムは、そのスキルに最適なポリシーから抽出された単一の状態を与えられたMuJoCo環境で特定のスキルを再現することができる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:43:29 GMT)
Semantic Scene Completion via Integrating Instances and Scene
in-the-Loop [73.1] Semantic Scene Completionは、単一の視野深度またはRGBD画像から正確なボキセルワイズセマンティクスで完全な3Dシーンを再構築することを目指しています。
本稿では、シーンレベルのセマンティクス情報とインスタンスレベルのセマンティクス情報の両方を利用するScene-Instance-Scene Network(textitSISNet)を提案する。
本手法は, セマンティックなカテゴリが容易に混在している近傍のオブジェクトと同様に, きめ細かい形状の細部を推定できる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:50:30 GMT)
DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3] DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 04:27:32 GMT)
Rethinking and Improving the Robustness of Image Style Transfer [70.9] トレーニング済みのVGGネットワークによって抽出された特徴間の相関は、画像の視覚的スタイルをキャプチャする顕著な能力を有することを示す。
この品質は堅牢ではなく、より先進的で軽量なネットワークの機能に適用すると、しばしば大幅に劣化する。
本稿では,そのエントロピーを高める機能アクティベーションのソフトマックス変換に基づく解を提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 03:24:45 GMT)
BR-NS: an Archive-less Approach to Novelty Search [70.1] 行動認識に基づく新規性探索(BR-NS)という,新規性推定の代替手法について議論する。
BR-NSはアーカイブを必要とせず、行動空間で定義できるメトリクスを前提にせず、近隣の検索に依存しません。
我々は、その実現可能性とダイナミクス、および時間複雑性の観点からアーカイブベースのnsよりも潜在的に有利な点について洞察を得るために実験を行う。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:31:34 GMT)
SMD-Nets: Stereo Mixture Density Networks [68.6] SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:15:46 GMT)
Attribute-Guided Adversarial Training for Robustness to Natural
Perturbations [64.4] 本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。
我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 03:25:14 GMT)
A Theoretical Analysis of Learning with Noisily Labeled Data [62.9] 最初に、最初のエポックトレーニングで、クリーンラベルの例が先に学習されることを示しました。
次に、クリーンデータステージから学習した後、継続的なトレーニングモデルがテストエラーのさらなる改善を達成できることを示します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 23:40:02 GMT)
Towards Multi-Scale Style Control for Expressive Speech Synthesis [60.1] 提案手法では,マルチスケール参照エンコーダを用いて,対象音声のグローバルな発話レベルと局所的な準音素レベルの特徴を抽出する。
訓練期間中、マルチスケールスタイルモデルは、エンドツーエンドで音声合成モデルと共同で訓練することができる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 05:50:09 GMT)
CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.7] 通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 19:04:55 GMT)
Gi and Pal Scores: Deep Neural Network Generalization Statistics [58.9] 深層ニューラルネットワークの一般化能力を捉えた2つの新しい尺度、gi-scoreとpal-scoreを導入する。
Gini係数とPalma比にインスパイアされた我々の統計は、一般化ギャップを正確に予測する摂動に対するネットワークの不変性の頑健な測度である。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 01:52:49 GMT)
Riggable 3D Face Reconstruction via In-Network Optimization [58.0] 本稿では,単眼画像からの3次元顔再構成法を提案する。
表情、ポーズ、照明を含む画像ごとのパーソナライズされた顔リグとパラメータを共同で推定する。
実験により,SOTA復元精度,ロバスト性,一般化能力が得られた。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 03:53:20 GMT)
QD-GCN: Query-Driven Graph Convolutional Networks for Attributed
Community Search [54.4] QD-GCNは、ACS問題を解決するために、コミュニティ構造とノード属性を統一するエンドツーエンドフレームワークである。
本稿では、QD-GCNが既存の属性付きコミュニティ検索アルゴリズムを効率性と有効性の両方で上回ることを示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 07:52:48 GMT)
Learning optical flow from still images [53.3] 我々は,容易に利用可能な単一の実画像から,高精度な光学的フローアノテーションを迅速かつ多量に生成するフレームワークを提案する。
既知の動きベクトルと回転角を持つ再構成された環境でカメラを仮想的に移動させる。
我々のデータでトレーニングすると、最先端の光フローネットワークは、実データを見るのに優れた一般化を実現する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:59:58 GMT)
GTA: Global Temporal Attention for Video Action Understanding [51.5] 空間的注意を軸にグローバルな時間的注目を行うグローバルテンポラルアテンション(AGT:Global Temporal Attention)を分離的に紹介します。
2Dおよび3Dネットワーク上でのテストは、我々のアプローチが時間的モデリングを一貫して強化し、3つのビデオアクション認識データセットに対して最先端のパフォーマンスを提供することを示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 18:16:52 GMT)
Progressive Temporal Feature Alignment Network for Video Inpainting [51.3] ビデオ畳み込みは、時間内「破損した地域」に可能な内容で埋めることを目指しています。
現在の方法は、注意、フローベースのワープ、あるいは3次元時間的畳み込みによってこの目標を達成する。
現在のフレームから抽出された特徴を、隣接するフレームから歪んだ特徴で段階的に強化する「プログレッシブ・テンポラリティ・アライメント・ネットワーク」を提案します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 04:50:33 GMT)
On Self-Contact and Human Pose [51.0] 自己接触による人格推定を著しく改善する新しいデータセットと手法を開発した。
新たな自己接触トレーニングデータにより,保持されていないテストデータと既存の3DPWのようなデータセットの3次元ポーズ推定が大幅に向上することを示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 07:29:50 GMT)
Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.8] データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 11:00:43 GMT)
Incentivizing Exploration in Linear Bandits under Information Gap [50.2] 線形バンディットにおけるミオピックユーザに対するインセンティブ探索の問題点について検討した。
長期報酬を最大化するために、システムは、ユーザに探索的な腕を引くインセンティブを与えるための補償を提供する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:01:56 GMT)
LieTransformer: Equivariant self-attention for Lie Groups [50.0] 群等価ニューラルネットワークは群不変ニューラルネットワークの構成要素として用いられる。
我々は、文学の範囲を、ディープラーニングモデルの顕著な構築ブロックとして現れつつある自己注意にまで広げる。
任意のリー群とその離散部分群に同値なリー自己結合層からなる構造であるリー変換器を提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:19:14 GMT)
FACESEC: A Fine-grained Robustness Evaluation Framework for Face
Recognition Systems [49.6] FACESECは、顔認識システムのきめ細かい堅牢性評価のためのフレームワークです。
5つの顔認識システムをクローズド設定とオープン設定の両方で検討します。
ニューラルネットワークの正確な知識は、ブラックボックス攻撃におけるトレーニングデータの知識よりもはるかに重要である。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 23:00:25 GMT)
RNN Transducer Models For Spoken Language Understanding [49.1] 本稿では,事前学習した音声認識システムからRNN-T SLUモデルを開発する方法について述べる。
実際の音声データが入手できない環境では、様々なSLUモデルに適応するために人工合成音声を使用する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:35:22 GMT)
Geometry-based Distance Decomposition for Monocular 3D Object Detection [48.6] 本研究では,その要因により距離を回復する新しい幾何学的距離分解法を提案する。
分解の要因は、最も代表的かつ安定な変数へのオブジェクトの距離である。
RGB画像から3Dバウンディングボックスをコンパクトなアーキテクチャで直接予測します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 13:57:30 GMT)
Video Question Answering with Phrases via Semantic Roles [40.7] ビデオ質問回答(VidQA)評価指標は、単一の単語の回答や、固定されたフレーズセットからフレーズを選択することに限定されています。
我々は、ビデオ記述から派生した意味的役割を利用して、特定のフレーズを隠ぺいし、vidqaを補足するvidqapを導入する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 13:27:43 GMT)
User-Generated Text Corpus for Evaluating Japanese Morphological
Analysis and Lexical Normalization [39.5] 一般公開のugtコーパスを構築した。
コーパスは, 形態情報および正規化情報を付加した929文と, 頻繁なUGT現象を分類したカテゴリ情報から構成される。
コーパスの実験では、非一般語および非標準形に対する既存のMA/LN手法の低性能を実証し、このコーパスがUGTのさらなる研究のための挑戦的なベンチマークとなることを示した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 05:53:46 GMT)
Bayesian Variational Federated Learning and Unlearning in Decentralized
Networks [37.6] 本稿では,ベイズフレームワーク内の分散ネットワークにおけるフェデレート学習とアンラーニングについて述べる。
局所的自由エネルギー最小化問題の分散解に基づいて、フェデレーション付き変分推論(VI)ソリューションを特に開発する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:18:35 GMT)
MetricGAN+: An Improved Version of MetricGAN for Speech Enhancement [37.3] 音声処理の領域知識を応用した3つのトレーニング手法を提案するMetricGAN+を提案する。
これらの手法により、VoiceBank-DEMANDデータセットの実験結果から、MetricGAN+は以前のMetricGANと比較してPSSQスコアを0.3増加させることができる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:46:35 GMT)
Multilingual Contextual Affective Analysis of LGBT People Portrayals in
Wikipedia [34.2] 物語文における特定の語彙選択は、物語の中の人々に対する作家の態度を反映し、聴衆の反応に影響を与える。
言語や文化によって単語の意味がどう異なるかを示し、既存の英語データセットを一般化することの難しさを浮き彫りにしている。
次に、LGBTコミュニティのメンバーのウィキペディアの伝記ページを3つの言語で分析することで、本手法の有用性を実証する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 08:20:12 GMT)
Joint Optimization of Communications and Federated Learning Over the Air [32.1] Federated Learning(FL)は、データプライバシーを保護しながら、リッチな分散データを利用するための魅力的なパラダイムです。
本稿では,リアル無線ネットワークにおけるアナログアグリゲーション伝送に基づく通信とFLの協調最適化について検討する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 03:38:31 GMT)
Seeing Out of tHe bOx: End-to-End Pre-training for Vision-Language
Representation Learning [31.9] 「tHe bOx」は画像全体を入力とし、視覚言語表現をエンドツーエンドで学習する。
SohoはMSCOCOテキスト検索5kテスト分割で2.0% R@1スコア、NLVR$2$テスト-P分割で1.5%の精度、SNLI-VEテスト分割で6.7%の精度を達成しました。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 01:03:43 GMT)
Few-Shot Action Recognition with Compromised Metric via Optimal
Transport [31.8] 少数の画像分類の広い研究にもかかわらず、少数のアクション認識はまだ成熟していません。
これらのアルゴリズムをアクション認識に適用する主な障害の1つは、ビデオの複雑な構造です。
これら2つのソリューションの利点を組み合わせるために、CMOT(Compromised Metric via Optimal Transport)を提案します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 12:42:05 GMT)
Layer Reduction: Accelerating Conformer-Based Self-Supervised Model via
Layer Consistency [31.6] トランスフォーマーをベースとした自己教師型モデルは特徴抽出器として訓練され、多くの下流音声タスクで最先端のパフォーマンスを実現している。
従来のBERT法と同等の性能を維持しつつ、7.8Xパラメータの削減、41.9%のトレーニングスピードアップ、37.7%の推論スピードアップを実験的に達成した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 08:21:59 GMT)
Cross-Cultural Similarity Features for Cross-Lingual Transfer Learning
of Pragmatically Motivated Tasks [30.6] 本稿では,言語パターンに現れる異文化の類似性を捉え,言語プラグマティクスの異なる側面を定量化する3つの言語特徴を紹介する。
分析の結果,提案する実用的特徴は異文化間の類似性を捉え,社会言語学や言語人類学における既存の研究とよく一致していることがわかった。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 08:31:54 GMT)
How Metaphors Impact Political Discourse: A Large-Scale Topic-Agnostic
Study Using Neural Metaphor Detection [29.6] 政治談話におけるメタファーの大規模データ駆動型研究について述べる。
メタファーの使用は、選挙に勝ったり負けたりといった同時的な政治イベントに依存する複雑な方法でイデオロギー的傾向と相関していることを示す。
本研究では,ジェンダーや政党の所属など様々な社会的・政治的要因をコントロールした上でも,メタファーのある投稿が聴衆全体からより多くのエンゲージメントを引き出すことを示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:16:31 GMT)
Jointly Optimizing State Operation Prediction and Value Generation for
Dialogue State Tracking [23.8] オープン語彙を用いた多ドメイン対話状態追跡(DST)の問題点について検討する。
既存のアプローチではBERTエンコーダとコピーベースのRNNデコーダを使用し、そこでエンコーダは状態操作を予測し、デコーダは新しいスロット値を生成する。
本稿では,1つのBERTがエンコーダとデコーダの両方として機能する,純粋にトランスフォーマーベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 02:04:05 GMT)
Tight finite-key analysis for generalized high-dimensional quantum key
distribution [23.6] 一般化された高次元量子鍵分布プロトコルに適した厳密な有限鍵解析を提案する。
我々の理論から見れば、有限資源を持つ高次元量子鍵分布プロトコルは実験的に実現可能である。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:13:21 GMT)
Conditional Meta-Network for Blind Super-Resolution with Multiple
Degradations [22.9] 単一画像スーパーリゾリューション(SISR)メソッドは、実際のシナリオで複数のデグレード効果でパフォーマンス低下を被る。
条件付きメタネットワークフレームワーク(CMDSRと命名)を初めて提案し、SRフレームワークが入力分布の変化に適応する方法を学ぶのに役立つ。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:15:25 GMT)
CoCoNets: Continuous Contrastive 3D Scene Representations [21.9] 本稿では,RGBとRGB-Dの画像とビデオから非モーダルな3D特徴表現を自己監督的に学習する。
得られた3次元視覚特徴表現は,オブジェクトやシーンにまたがって効果的にスケールし,入力視点から逸脱した情報を想像し,時間とともにオブジェクトを追跡し,意味的に関連したオブジェクトを3dで調整し,3dオブジェクト検出を改善する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:50:47 GMT)
Predicting the Reproducibility of Social and Behavioral Science Papers
Using Supervised Learning Models [21.7] 本論文では,学術研究から5種類の特徴を抽出し,公開研究クレームの評価を支援するフレームワークを提案する。
個々の特徴と人間評価の基底真理ラベルのセットを予測するための重要性のペアワイズ相関を分析します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 00:45:20 GMT)
ORBIT: A Real-World Few-Shot Dataset for Teachable Object Recognition [21.6] 我々は,視覚障害者のための教示可能な物体認識装置を実世界に適用したorbitデータセットとベンチマークを提案する。
データセットには、携帯電話で盲目/低視野の人が記録した486個のオブジェクトの3,822本のビデオが含まれている。
我々は、さらなるイノベーションのための大きなスコープがあることを示し、幅広い現実世界のビジョンアプリケーションに影響を与える可能性を秘めている。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:32:01 GMT)
Continual Adaptation of Visual Representations via Domain Randomization
and Meta-learning [21.5] ほとんどの標準的な学習アプローチは、異なる性質のサンプルを逐次訓練すると、漂流しにくい脆弱なモデルにつながる。
忘れることに対して本質的により堅牢なモデルを学ぶ方法の1つは、ドメインのランダム化である。
正規化子は、現在のドメインから異なる"副次的"メタドメインへのモデル転送に関連する損失を明示的に罰するメタラーニング戦略を考案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:58:04 GMT)
Reconstructing Recognizable 3D Face Shapes based on 3D Morphable Models [20.4] 本稿では,形状パラメータと形状幾何学領域の識別性を高めることを目的とした,形状パラメータに対する新しい形状認識正規化(SIR)損失を提案する。
提案手法は, 形状パラメータの再構成誤差, 視覚的識別性, 顔認識精度の観点から, 既存の手法と比較する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 05:11:48 GMT)
On Biasing Transformer Attention Towards Monotonicity [20.2] 標準注意機構と互換性のある単調性損失関数を導入し,いくつかのシーケンスからシーケンスへのタスクでテストする。
実験により、ほとんど単調な振る舞いが達成できることが示される。
一般的な単調性はトランスマルチヘッドの注意に役立ちませんが、単調な行動に偏っているのは、ヘッドのサブセットのみです。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:42:05 GMT)
Deep Indexed Active Learning for Matching Heterogeneous Entity
Representations [20.2] 本稿では,ブロッキングのリコールとブロックペアのマッチング精度を最大化するために,組込みを共同で学習するスケーラブルなアクティブラーニング手法であるdiardを提案する。
5つのベンチマークデータセットと多言語レコードマッチングデータセットの実験は、精度、リコール、実行時間の観点から、我々のアプローチの有効性を示している。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 18:00:19 GMT)
Field Convolutions for Surface CNNs [19.9] 簡単な観測に基づいてベクトル場に作用する新しい曲面畳み込み演算子を提案する。
この定式化は、散乱演算において内在的な空間畳み込みと平行輸送を組み合わせる。
基本幾何処理タスクにおける標準ベンチマークの最先端結果を得る。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:11:14 GMT)
DeepProg: A Transformer-based Framework for Predicting Disease Prognosis [19.7] 本稿では,一対多のシーケンス予測問題として,予後予測タスクを定式化する。
放射線医と一般開業医の2人のエージェントによる臨床意思決定プロセスに触発され,汎用的なエンドツーエンドトランスフォーマーベースのフレームワークを提案する。
本手法の有効性と妥当性は,膝関節の構造的骨関節変化の進展を予測するために,合成データ上に示される。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:53:18 GMT)
RTIC: Residual Learning for Text and Image Composition using Graph
Convolutional Network [19.0] 画像検索のための画像とテキストの構成学習について検討する。
本稿では,グラフ畳み込みネットワーク(gcn)と既存の合成手法を組み合わせた新しい手法を提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 23:28:15 GMT)
Does Your Dermatology Classifier Know What It Doesn't Know? Detecting
the Long-Tail of Unseen Conditions [18.4] 皮膚の状態を正確に分類できる深層学習システムを開発し,厳密に評価した。
このタスクは、アウトオブディストリビューション(OOD)検出問題としてフレーム化します。
我々の新しいアプローチである階層外乱検出(HOD)は、各トレーニングクラスに対して複数の禁制クラスを割り当て、インレーヤ対外乱の粗い分類を共同で行う。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:15:22 GMT)
Risk-Aware Lane Selection on Highway with Dynamic Obstacles [18.2] コストに配慮したリアルタイムレーン選択アルゴリズムとモジュール設計を提案します。
アルゴリズムは、連続時間と空間領域の下で他の車両の不確定な動的位置を評価する検索ベースの最適化方法です。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 22:54:27 GMT)
1st Place Solution to ICDAR 2021 RRC-ICTEXT End-to-end Text Spotting and
Aesthetic Assessment on Integrated Circuit [17.5] 本論文では,ICDAR 2021ロバストリーディングチャレンジ-集積回路テキストスポッティングと審美評価への提案手法を提案する。
テキストスポッティングタスクでは、統合回路上で文字を検出し、yolov5検出モデルに基づいて分類する。
審美評価タスクには,各キャラクタの審美クラスを識別するために,3つの分類枝を追加する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:52:49 GMT)
On tuning consistent annealed sampling for denoising score matching [17.1] Scoreベースの生成モデルは、画像とオーディオ合成に最先端の品質を提供します。
本稿では,まず,スコアマッチングを訓練したモデルの3つの一般的なサンプリングスキームについて概説する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 12:19:10 GMT)
Emotion Recognition from Speech Using Wav2vec 2.0 Embeddings [16.8] 音声認識のための伝達学習手法を提案する。
トレーニング前のモデルからいくつかのレイヤーの出力を、下流モデルとの共同学習可能なウェイトで組み合わせます。
提案手法をIEMOCAPとRAVDESSの2つの標準感情データベース上で評価し,結果よりも優れた性能を示した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 04:31:58 GMT)
Deep Features for training Support Vector Machine [16.8] 本稿では,訓練済みcnnから抽出した特徴に基づく汎用コンピュータビジョンシステムを開発した。
複数の学習特徴を単一の構造に組み合わせ、異なる画像分類タスクに取り組んでいます。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 03:13:09 GMT)
Talk, Don't Write: A Study of Direct Speech-Based Image Retrieval [13.4] 共同表現学習のプロキシとして,音声に基づく画像検索が研究されている。
音声に基づく検索が実際にどれだけうまく機能するかは不明だ。
音声の自発的,アクセント的,あるいは自動書き起こしが難しい場合には,asr-to-textエンコーディングのカスケードを克服できる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 10:16:17 GMT)
Question-Driven Design Process for Explainable AI User Experiences [12.9] デザイナーは、最適なXAI技術を選択し、それらをUXソリューションに変換する方法の課題に取り組んでいます。
本稿では,ユーザのニーズ,XAI技術の選択,設計,XAI UXの評価を基礎とした質問駆動設計プロセスを提案する。
設計者とAIエンジニアのコラボレーションを支援するバウンダリオブジェクトとして、原型的ユーザ質問とXAI技術の例の間のマッピングガイドを提供します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 02:51:36 GMT)
Multimodal Fusion of EMG and Vision for Human Grasp Intent Inference in
Prosthetic Hand Control [12.9] 脳波やEMGなどの生理学的信号に基づく現在の制御方法は、推論結果が悪い傾向にあります。
視線映像,視線,EMGを用いた意図推論を前腕から把握するためのベイジアンエビデンス融合フレームワークを提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:01:19 GMT)
Computation and Bribery of Voting Power in Delegative Simple Games [12.3] 委任的単純ゲームにおける代表的バンジャフ値とシャプリー・シュビク値を計算する擬似多項式時間アルゴリズムを提案する。
次に、代表者の投票力/重みを最大化・最小化することを目的とした贈収賄問題について、定員数を最大にすることで検討する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 11:28:50 GMT)
CLVSA: A Convolutional LSTM Based Variational Sequence-to-Sequence Model
with Attention for Predicting Trends of Financial Markets [12.0] 生の金融トレーディングデータの特徴を変動的に捉えるハイブリッドモデルであるCLVSAを提案する。
本モデルでは,畳み込みニューラルネットワーク,バニラlstmネットワーク,シーケンシャル・ツー・シーケンスモデルなどの基本モデルよりも注目される。
実験の結果,clvsaは,近似後段の導入により,kullback-leibler 発散に基づく余分な正規化剤を活用し,トラップの過剰フィットを防止することができた。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 20:31:04 GMT)
A Simple Geometric Method for Cross-Lingual Linguistic Transformations
with Pre-trained Autoencoders [11.5] 複数の言語で訓練された強力な文エンコーダが増えている。
これらのシステムは、幅広い言語特性をベクトル表現に埋め込むことができる。
埋め込み空間における幾何写像を用いた言語特性の変換について検討する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:33:50 GMT)
Learning Graph Structures with Transformer for Multivariate Time Series
Anomaly Detection in IoT [11.5] 本研究は,グラフ構造とグラフ畳み込みを自動的に学習することにより,多変量時系列異常検出のための新しいフレームワークGTAを提案する。
また,グラフノード間の異常情報フローをモデル化するために,影響伝播畳み込みという新しいグラフ畳み込みを考案した。
4つの公開異常検出ベンチマークの実験は、我々のアプローチが他の最先端技術よりも優れていることをさらに証明している。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 01:45:28 GMT)
Dynamic Surface Function Networks for Clothed Human Bodies [11.0] 単眼のrgb-d配列が与えられると、動的表面関数ネットワークに基づく個人特異的体モデルが学習される。
SMPLボディモデルの正則空間に埋め込まれた多層パーセプトロン(MLP)を用いて、人の表面を明示的にモデル化します。
この表面表現とポーズパラメータは, 合成による解析と微分の原理を用いて, 自己教師あり方式で学習できることを示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 18:00:03 GMT)
A transfer-learning approach for lesion detection in endoscopic images
from the urinary tract [10.9] 尿管鏡および嚢胞内視鏡は、尿路沿いの腫瘍を同定し治療するための金標準法である。
通常の手術では病変の10~20%が欠落していたことが報告されている。
本研究では,3種類の畳み込みニューラルネットワーク(CNN)を用いて,病変の有無にかかわらず尿路からの画像の分類を行った。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:16:12 GMT)
Handling Climate Change Using Counterfactuals: Using Counterfactuals in
Data Augmentation to Predict Crop Growth in an Uncertain Climate Future [10.8] 牧草地管理を支援することで、持続可能な乳製品栽培を支援するために設計されたCBRシステムを検討する。
気候変動に伴い、PBI-CBRの歴史的事例は将来の草の成長を予測するのに役に立ちません。
我々は、データ拡張を用いてPBI-CBRを拡張し、特に破壊的な気候イベントをカウンターファクトカル手法を用いて処理する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 18:54:21 GMT)
XFORMAL: A Benchmark for Multilingual Formality Style Transfer [10.6] XFORMALは、ポルトガル語、フランス語、イタリア語の非公式テキストの複数の形式改革のベンチマークです。
xformalの結果は、最先端のスタイル転送アプローチが単純なベースラインに近いことを示唆している。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 23:01:17 GMT)
Causal Decision Making and Causal Effect Estimation Are Not the Same...
and Why It Matters [10.5] 大規模意思決定(CDM)はビジネスの日常的な部分となっている。
この記事では、CDMは因果効果推定(CEE)と同じではありません。
これらの影響の3つを強調するために、最近の研究を振り返ります。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 22:50:54 GMT)
How Transferable are Reasoning Patterns in VQA? [10.4] 視覚の不確実性は、視覚と言語の問題における推論の学習が成功するのを妨げる要因であると主張する。
私たちは視覚的なオラクルを訓練し、大規模な研究では、スプリアスデータセットバイアスを利用する傾向がはるかに低いという実験的証拠を提供します。
我々はこれらの知見を,オーラルからSOTAトランスフォーマーベースのVQAモデルへの推論パターンの転送により活用する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 10:18:45 GMT)
Towards Deployment of Deep-Reinforcement-Learning-Based Obstacle
Avoidance into Conventional Autonomous Navigation Systems [10.3] 深層強化学習は、過度に保守的なアプローチを置き換える代替計画方法として登場した。
深層強化学習アプローチは、局所ミニマに対する傾向のため、長距離ナビゲーションには適していません。
本論文では,従来のナビゲーションスタックに深層強化学習に基づくローカルプランナーを組み込んだナビゲーションシステムを提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 08:56:53 GMT)
Deep Monocular 3D Human Pose Estimation via Cascaded Dimension-Lifting [10.3] 1枚の画像からの3次元ポーズ推定は、深さの曖昧さのために難しい問題である。
従来の手法の1つのタイプは、外部の2Dポーズ検出器に頼って得られた2D関節を3D空間に持ち上げる。
文脈情報を利用しながら、3D空間で直接出力する,新たなエンドツーエンドフレームワークを提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 05:44:02 GMT)
The Evolution of the Manosphere Across the Web [10.3] 概して「男性の問題」に焦点をあてた、Webベースの擬人化運動のコングロマリットであるManosphereを大規模に評価する。
6つのフォーラムと51のサブレディットから288万の投稿を集め、分析する。
私たちは、ピックアップアーティストやメンズ・ライツ・アクティビストのような、より穏やかで古いコミュニティが、インセルやメン・ゴーイング(Men Going their Own Way)のようなより過激なコミュニティに道を譲っていることに気付きました。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 10:55:12 GMT)
Multi-Density Attention Network for Loop Filtering in Video Compression [9.3] ビデオ圧縮におけるループフィルタリングのためのオンラインスケーリングに基づく多密度注意ネットワークを提案する。
実験の結果、同じビデオ品質で10.18%のビットレート削減が最新のVVC(Versatile Video Coding)規格で達成できることが示された。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 05:46:38 GMT)
Does Fair Ranking Improve Minority Outcomes? Understanding the Interplay
of Human and Algorithmic Biases in Online Hiring [9.2] 我々は、雇用者の仕事状況や固有のバイアスなど、オンライン雇用プラットフォームにおける性別バイアスの源泉を分析した。
結果から, 公平なランキングアルゴリズムは, 少数民族の選抜率を向上するが, 求職状況や候補者のプロファイルに大きく依存していることが示唆された。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:31:51 GMT)
Site Mixing for Engineering Magnetic Topological Insulators [8.8] MnSb$Te$_4$で反サイト欠陥が磁性および電子構造に与える影響を調べた。
MnSb-$Te$_4$結晶の詳細な非化学量測定とサイト混合は成長パラメータに依存する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:05:33 GMT)
PhoNLP: A joint multi-task learning model for Vietnamese part-of-speech
tagging, named entity recognition and dependency parsing [8.6] PhoNLPと名づけられた最初のマルチタスク学習モデルを提案し,ベトナムの音声合成(POS)タグ付け,エンティティ認識(NER)と依存性解析を行った。
ベトナムのベンチマークデータセットの実験は、PhoNLPが最先端の結果を生成することを示している。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:31:16 GMT)
Archetypal Analysis for Sparse Nonnegative Matrix Factorization:
Robustness Under Misspecification [8.3] 正規化による非負行列ファクタリゼーション(NMF)のスパースの問題を検討する。
目的は、魅力的な性質を持ついくつかの非負のスパース因子の非負の線形結合としてデータポイントの集合を表現することである。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:06:48 GMT)
A Learning Strategy for Contrast-agnostic MRI Segmentation [8.3] 我々は、非前処理脳MRIスキャンのコントラスト非依存的セマンティックセマンティックセグメンテーションを可能にするディープラーニング戦略を提案する。
提案した学習手法であるSynthSegは,訓練中のハエのコントラストが多種多様である合成サンプル画像を生成する。
我々は,1000名以上の被験者と4種類のMRコントラストからなる4種類のデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 11:47:24 GMT)
Voluntary safety commitments provide an escape from over-regulation in
AI development [8.1] この研究は、ピアまたは機関による制裁による自発的なコミットメントが、社会的に有益な結果をもたらすことを初めて明らかにしている。
結果は、倫理的で責任あるAI技術開発プロセスを保証することを目的としたガバナンスと規制ポリシーの設計に直接関係しています。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 12:54:56 GMT)
Efficient Quantum Digital Signatures without Symmetrization Step [7.8] 量子デジタルシグネチャ(QDS)は、メッセージの非監査、偽造、転送可能性を保証するために量子法則を利用する。
現在のQDSプロトコルは、シンメトリゼーションステップの要件を含む2つの大きな制限に直面している。
本稿では,ポストマッチング方式と呼ばれる古典的な後処理操作を活用することで,これらの問題を克服する効率的なQDSプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 01:54:50 GMT)
Learning specialized activation functions with the Piecewise Linear Unit [7.8] 本稿では, 注意深く設計した定式化学習法を組み込んだ, 区分線形単位 (pwlu) と呼ばれる新しい活性化関数を提案する。
特殊なアクティベーション機能を学び、ImageNetやCOCOなどの大規模データセットでSOTA性能を達成できます。
PWLUは推論時に実装も簡単で効率も良く、現実世界のアプリケーションにも広く適用できる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 11:29:11 GMT)
Statistically significant detection of semantic shifts using contextual
word embeddings [7.4] 文脈的単語埋め込みと順列に基づく統計的テストを組み合わせて意味的変化を推定する手法を提案する。
本手法の性能をシミュレーションで実証し,偽陽性を抑圧することにより,一貫して高精度に達成する。
また,SemEval-2020 Task 1 と Liverpool FC subreddit corpus の実際のデータも分析した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 13:58:54 GMT)
Software/Hardware Co-design for Multi-modal Multi-task Learning in
Autonomous Systems [7.3] 自律システムは本質的にマルチモーダルマルチタスク(MMMT)学習を必要とする。
まず,自律システムにMMMT技術を適用する機会について論じ,解決すべき課題について論じる。
MMMTモデルと異種ハードウェア実装を微分可能最適化問題として共設計する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 18:29:30 GMT)
AlephBERT:A Hebrew Large Pre-Trained Language Model to Start-off your
Hebrew NLP Application With [7.3] 大規模プリトレーニング言語モデル(PLM)は、言語理解技術の発展においてユビキタスになっています。
PLMを用いた英語の進歩は前例がないが、ヘブライ語でのPLMの使用の進展は少ない。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 20:51:29 GMT)
Stable deep neural network architectures for mitochondria segmentation
on electron microscopy volumes [5.7] EMボリュームにおけるミトコンドリアのセグメンテーションのための最先端のディープラーニングアーキテクチャに関する広範な研究を紹介します。
この課題に対する2次元および3次元U-Net様モデルの違いによる性能への影響を評価する。
この研究から派生したコードとそのドキュメントが公開されている。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 07:41:13 GMT)
Kernel Operations on the GPU, with Autodiff, without Memory Overflows [5.7] KeOpsライブラリは、数学的公式によってエントリが与えられるテンソルに対して、高速でメモリ効率のよいGPUサポートを提供する。
KeOpsは、カーネルおよび幾何学的アプリケーションのためのテンソル中心ライブラリの大きなボトルネックであるメモリ消費を緩和する。
KeOpsは、最適化されたC++/CUDAスキームと、Python(NumpyとPyTorch)、Matlab、Rのバインダーを組み合わせる。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 12:36:50 GMT)
A variational quantum algorithm for Hamiltonian diagonalization [5.2] 本稿では量子系のハミルトン対角化(VQHD)のための変分アルゴリズムを提案する。
系の熱状態は、ハミルトニアン系の固有値と固有状態の情報を符号化する。
我々のVQHDアルゴリズムは、短期量子コンピュータの応用に新たな光を当てている。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 03:23:27 GMT)
Zero-shot sim-to-real transfer of tactile control policies for
aggressive swing-up manipulation [5.0] 本稿では,視覚ベースの触覚センサを備えたロボットが,操作対象の物理的属性を事前に知ることなく動的操作を行うことができることを示す。
異なる質量、半径、長さの極を180度の角度に振り上げることができるロボットシステムが提示されています。
これは、高次元触覚観測からのフィードバックポリシーを用いて閉ループにおける極の揺らぎ操作を制御する最初の方法である。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 13:33:16 GMT)
DenResCov-19: A deep transfer learning network for robust automatic
classification of COVID-19, pneumonia, and tuberculosis from X-rays [5.0] 胸部X線画像に基づいて, 新型コロナウイルス, 肺炎, 結核患者を診断するための新しいディープトランスファー学習パイプラインを開発した。
提案モデルでは、畳み込みニューラルネットワークブロックを備えた余剰層を作成し、これらの2つのモデルを組み合わせて、どちらのモデルよりも優れた性能を確立する。
提案したネットワークの性能を,2クラス(肺炎対健康),3クラス(COVID-19を含む),4クラス(結核を含む)の分類問題で検証した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 18:49:22 GMT)
A synthetic monopole source of Kalb-Ramond field in diamond [4.7] ダイヤモンドの単一固体欠陥のスピン度自由度により, 4次元パラメータ空間で合成したテンソルモノポールの特性について報告する。
我々の研究は、固体系におけるテンソルモノポールの最初の検出であり、弦理論に触発されたエキゾチックなトポロジー構造をエミュレートする可能性を開く。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 04:45:51 GMT)
Generalized Approach to Matched Filtering using Neural Networks [4.5] 我々は,新たな深層学習と従来の技術との関係について重要な観察を行う。
一致するフィルタリングは、特定のニューラルネットワークと正式に等価です。
提案するニューラルネットワークアーキテクチャがマッチングフィルタリングよりも優れていることを示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:59:07 GMT)
Uncertainty-Aware Temporal Self-Learning (UATS): Semi-Supervised
Learning for Segmentation of Prostate Zones and Beyond [4.4] CNNベースのコンセプトは、前立腺の自動分割と、その粗い部分分割を移行ゾーン(TZ)と周辺ゾーン(PZ)に導入しています。
tz, pz, 遠位前立腺尿道(dpu)および前線維筋ストロマ(afs)の細粒化を標的とした場合, 課題はより困難になる
そこで本研究では,半教師付き学習手法である不確実性認識時間学習を応用し,コストと時間を要する手話の真理ラベリングを克服する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:31:57 GMT)
Advanced Image Enhancement Method for Distant Vessels and Structures in
Capsule Endoscopy [3.1] 本稿では,カプセル内視鏡画像のコントラスト強調手法を提案する。
主な目的は、画像のより遠くにある船や構造物について十分な情報を得ることである。
提案手法は、より暗い領域と明るい領域の強化のための2つのアルゴリズムを組み合わせる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 10:37:36 GMT)
Affine-modeled video extraction from a single motion blurred image [3.0] 動き鈍化画像は、露光時間上の複数のシャープフレームの時間平均です。
本研究では,アフィンモーションモデリングを用いた一般化ビデオ抽出手法について報告する。
公開データセットと実際のキャプチャデータの両方の実験は、報告されたテクニックの最先端のパフォーマンスを検証する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 13:59:14 GMT)
Exploring the Relationship Between Algorithm Performance, Vocabulary,
and Run-Time in Text Classification [2.7] 本研究では,前処理技術が語彙サイズ,モデル性能,実行時間に与える影響について検討する。
個々の手法が精度を損なわずに実行時間を短縮できるのに対し、いくつかの手法の組み合わせでは2-5%の精度で実行時間を最大65%削減できることを示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:49:59 GMT)
Approximate Bayesian inference from noisy likelihoods with Gaussian
process emulated MCMC [2.6] 提案手法は, 限定的な確率評価しか得られない場合, 近似ベイズ推定を行うための効率的な手法である。
我々は,gaussian process (gp) を用いてlog-likelihood関数を局所的にモデル化し,metropolis-hastings (mh) アルゴリズムが適用可能であれば,その進展をエミュレートするためにこのモデルを適用した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:38:02 GMT)
Born Identity Network: Multi-way Counterfactual Map Generation to
Explain a Classifier's Decision [2.6] Born Identity Network (BIN) は、マルチウェイ・デファクト・マップを作成するためのポストホック・アプローチである。
逆ファクトマップは、入力サンプルを条件付けし、ターゲットラベルとして分類する。
提案したBINを,MNIST,3次元形状,ADNIデータセットの質的,定量的に検証した。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 05:24:34 GMT)
Lone Pine at SemEval-2021 Task 5: Fine-Grained Detection of Hate Speech
Using BERToxic [2.5] 本稿では, 有害スパン検出問題に対するアプローチについて述べる。
BERToxicは、事前に訓練されたBERTモデルを微調整して、与えられたテキスト中の有毒なテキストスパンを見つけるシステムである。
我々のシステムは、提供されたベースラインを著しく上回り、f1-score 0.683を達成し、91チーム中17位にlone pineを配置した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 04:46:14 GMT)
Towards End-to-End Neural Face Authentication in the Wild - Quantifying
and Compensating for Directional Lighting Effects [2.4] 本研究では, 指向性照明がニューラルフェイス認識器に及ぼす影響について検討する。
トップ照明とそのバリエーションは、精度に最小限の効果を有することが判明し、ボトム左またはボトム右方向の照明が最も顕著な効果を有する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:58:09 GMT)
Relieving the Plateau: Active Semi-Supervised Learning for a Better
Landscape [2.3] semi-supervised learning (ssl) はラベル付きデータよりもアクセスしやすいラベルなしデータを活用する。
active learning (al)は、ラベルなしのインスタンスを選択して、ラベル付きデータの少ないパフォーマンスを期待する。
本稿では,ラベル付き集合を含む問題条件を改善するためにラベル付きデータを選択するALアルゴリズムである収束率制御(CRC)を提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:03:59 GMT)
Contextual Semi-Supervised Learning: An Approach To Leverage
Air-Surveillance and Untranscribed ATC Data in ASR Systems [0.6] 飛行機へのコールサインは、atco-パイロット通信の必須部分である。
ASRシステムのエラー率を低減するために,半教師付きトレーニング中に文脈知識を追加する2段階のアプローチを提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:53:54 GMT)
OGGN: A Novel Generalized Oracle Guided Generative Architecture for
Modelling Inverse Function of Artificial Neural Networks [0.6] 本稿では,ANN(Artificial Neural Network)の逆関数を,完全にあるいは部分的にモデル化するための新しい生成ニューラルネットワークアーキテクチャを提案する。
OGGNと呼ばれる提案されたOracle Guided Generative Neural Networkは、さまざまな機能生成問題に柔軟に対応します。
この制約関数により、ニューラルネットワークは与えられた局所空間を長時間調査することができる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:28:52 GMT)
A Sketch-Based Neural Model for Generating Commit Messages from Diffs [0.5] コミットメッセージは、特に大規模チームで働く場合、ソフトウェア開発に重要な影響を与える。
コード差分をコミットメッセージに変換するために、ニューラルマシン翻訳(NMT)技術を適用します。
このタスクのための改善されたスケッチベースのエンコーダを紹介します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 21:21:28 GMT)
Uncertainty relation between detection probability and energy
fluctuations [0.5] 量子ウォークでは、破壊的干渉は事実上非エルゴード的特徴を誘発する。
検出確率の古典的偏差に対する不確実な関係を見いだす。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 10:22:38 GMT)
Combining hard and soft decoders for hypergraph product codes [0.3] ハイパーグラフ製品コードは、スモールセットフリップ (SSF) と呼ばれる線形時間デコーダを備えた定数レート量子低密度パリティチェック (LDPC) 符号である。
このデコーダは、実際には準最適性能を示し、非常に大きなエラー訂正符号を必要とする。
本稿では,信念伝搬(BP)アルゴリズムとSFデコーダを組み合わせたハイブリッドデコーダを提案する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 04:59:13 GMT)
Detecting of a Patient's Condition From Clinical Narratives Using
Natural Language Representation [0.3] 本稿では,臨床自然言語表現学習と教師付き分類フレームワークを提案する。
この新しいフレームワークは、文脈的臨床物語入力から分布構文と潜在意味論(表現学習)を共同で発見する。
提案手法では, 精度, 再現性, 精度をそれぞれ89 %, 88 %, 89 %とした総合分類性能が得られる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:16:04 GMT)
Machine Learning Based on Natural Language Processing to Detect Cardiac
Failure in Clinical Narratives [0.3] この研究の目的は、患者が心不全または健康な状態を有するかどうかを自動的に検出する機械学習アルゴリズムを開発することである。
bag-of-word (BoW), term frequency inverse document frequency (TFIDF), and neural word embeddeddings (word2vec) を用いて単語表現学習を行った。
提案されたフレームワークは、ac、pre、rec、f1がそれぞれ84%、82%、85%、83%の全体的な分類性能を達成した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 17:28:43 GMT)
Enabling Cross-Domain Communication: How to Bridge the Gap between AI
and HW Engineers [0.2] システム設計における重要な問題は、ハードウェア、ソフトウェア、ドメインエキスパート間のコミュニケーションの欠如である。
最近の研究は、ニューラルアクセラレータの自動HW/SW共同設計フローの進歩を示しています。
本稿では、(構成可能な)専用加速器を含むシステムの方法論の確立の可能性について論じる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 14:05:15 GMT)
Efficient time stepping for numerical integration using reinforcement
learning [0.2] 機械学習とメタラーニングに基づくデータ駆動型タイムステッピング方式を提案する。
まず、1つまたは複数の基礎学習者(非滑らかまたはハイブリッドシステムの場合)はRLを使用して訓練されます。
次に、メタ学習者は(システムの状態に応じて)現在の状況に最適と思われる基礎学習者を選択する訓練を受ける。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 07:24:54 GMT)
The Proper Use of Google Trends in Forecasting Models [0.0] Googleの検索データの各サンプルは、同じ検索語、データ、および場所を設定しても、他のものとは異なります。
これは、偶然に任意の結論を見つけることができることを意味する。
本稿は,問題になり得る理由と,その克服方法を明らかにすることを目的とする。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 14:15:57 GMT)
Spin digitizer for high-fidelity readout of a cavity-coupled silicon
triple quantum dot [0.0] 3つの量子ドットの中でインライン電荷センサを動作させ、一方のドットはマイクロ波空洞に結合され、もう一方の2つのドットの電荷状態を読み取るのに使用される。
本手法は,半導体量子デバイスにおける極小デバイスオーバーヘッドとフレキシブル量子ビット演算を組み合わせた高忠実スピン読み出しを実現する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:04:14 GMT)
Speech Denoising without Clean Training Data: a Noise2Noise Approach [0.0] 本稿では,深層学習に基づく音声復調法で求められるクリーンな音声データの重依存の問題に取り組む。
その結果, 雑音下音声サンプルのみを用いて, ディープ音声発声ネットワークの訓練が可能となった。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:27:49 GMT)
Post-Hoc Domain Adaptation via Guided Data Homogenization [0.0] ガイドデータ均質化によるデータ分布の変化への対応を提案する。
このアプローチは、ディープラーニングモデルに含まれるトレーニングデータに関する情報を利用して、ドメイン転送機能を学ぶ。
CIFAR-10およびMNISTデータセットの実験を通じて、データ均質化の可能性を示す。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:18:48 GMT)
Physics and Metaphysics of Wigner's Friends: Even performed
pre-measurements have no results [0.0] ウィグナーの友は、単に事前測定しただけであり、量子論に関する有効な結果をもたらす可能性がある。
これは、未測定のウィグナーの友の修正された概念が量子論に関する有効な結果をもたらすという主張を無効にする。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 22:07:36 GMT)
Output-Weighted Optimal Sampling for Bayesian Experimental Design and
Uncertainty Quantification [0.0] サンプル選択のための一連の取得関数を導入し,ベイズの実験設計と不確実性定量化に関する応用において,より高速な収束をもたらす。
提案手法は,ブラックボックス関数の入力方向が他よりも出力に大きく影響していることを活用することを目的としており,特に稀かつ極端な事象を示すシステムにおいて重要である。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 20:21:01 GMT)
Optimal Market Making by Reinforcement Learning [0.0] 古典的量的金融市場形成問題に強化学習アルゴリズムを適用する。
Deep Q-Learningアルゴリズムは最適なエージェントを復元する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 20:13:21 GMT)
Neural Network for Weighted Signal Temporal Logic [0.0] We propose a neuro-symbolic framework called weighted Signal Temporal Logic Neural Network (wSTL-NN)。
wSTL-NNはエンドツーエンドの差別化が可能で、バックプロパゲーションを使ってwSTL式を学習することができる。
このフレームワークを稼働時間検出時系列データセットに適用し、オフィスルームの稼働状況を予測する分類器を学習する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 20:44:26 GMT)
Measurement of the Casimir Force between 0.2 and 8 mum: Experimental
Procedures and Comparison with Theory [0.0] 本研究では,Au被覆のサファイア球とAu被覆の深部シリコントレンチの上部および下部との差分カシミール力の測定結果について述べる。
測定された力信号のランダムかつ系統的な誤差は95%の信頼度で決定される。
表面粗さとエッジ効果について検討し, 無視できるほど小さいことを示した。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:00:59 GMT)
Magnon-assisted photon-phonon conversion in the presence of the
structured environments [0.0] 量子変換またはインタフェースは、量子情報処理と量子状態工学において最も顕著なプロトコルの1つである。
マイクロ波光モード, 駆動マグノンモード, 機械振動モードからなるハイブリッド磁気機械システムにおける光子フォノン変換プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 04:25:13 GMT)
MRI-based Alzheimer's disease prediction via distilling the knowledge in
multi-modal data [0.0] MCI変換予測のために,マルチモーダルデータから学んだ知識をMRIベースのネットワークに抽出することを目的としたマルチモーダルマルチインスタンス蒸留方式を提案する。
本研究は、マルチモーダル情報から抽出した余計な監視を活用し、MRIに基づく予測モデルの改善を試みる最初の研究です。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:06:39 GMT)
M-Net with Bidirectional ConvLSTM for Cup and Disc Segmentation in
Fundus Images [0.0] 緑内障は、光ファイバーを劣化させることが知られている重度の眼疾患であり、カップのサイズが増加します。
我々は,関節カップとディスクセグメンテーションに基づく双方向畳み込み長短期記憶(LSTM)を改良したM-Netを提案する。
提案したモデルでは,カップとディスクの比率の異常を観察できるカップとディスク領域を分割した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 07:01:42 GMT)
Local measurement of vortex statistics in quantum turbulence [0.0] 超流動Heの乱流中で量子渦線の密度変動を測定する。
渦密度確率分布は、古典的な乱流で観測される渦度分布と同様、強く歪められている。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 08:12:40 GMT)
Languages for Smart and Computable Contracts [0.0] スマートコントラクトは、コンピュータ技術を使用して、商用契約の側面のパフォーマンスを自動化する。
コンピュータコードが当事者の意図に忠実であるという自信をどうやって持てるのか?
ここでは、重要な問題のいくつかを考察し、現在の研究の方向性を探り、信頼できるスマートコントラクトの開発における言語設計の重要性を説明します。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 13:32:17 GMT)
Kerr-like nonlinearities in an optomechanical system with an asymmetric
anharmonic mechanical resonator [0.0] 交差カー相互作用とカー様の光子と振動量子の自己相互作用はハミルトニアンで起こる。
振動量子数のバイスタブルな振舞いを示し、この振舞いはクロスカー相互作用によって制御されることを示した。
駆動と消散なしに、構築された共振器(または機械共振器)のYurke-Stoler様状態が系の絡み合いモードのあるタイミングで歪むことが示されている。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:37:25 GMT)
HindSight: A Graph-Based Vision Model Architecture For Representing
Part-Whole Hierarchies [0.0] 本稿では,画像中の部分全体階層の表現をグラフ形式で符号化するモデルアーキテクチャを提案する。
イメージを異なるレベルのパッチに分割し、すべてのパッチを完全に接続されたグラフのノードとして扱うというアイデアです。
動的特徴抽出モジュールは、各グラフイテレーションでこれらのパッチから特徴表現を抽出するために使用される。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 12:17:54 GMT)
Fidelity based purity and coherence for quantum states [0.0] 純度とコヒーレンスモノトンの有効測定法を提案し,それらの関係を確立する。
このコヒーレンスの定式化は、測定値に対する量子相関に拡張される。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:38:46 GMT)
Fast Regression of the Tritium Breeding Ratio in Fusion Reactors [0.0] トリチウム繁殖比(TBR)は、現代および次世代のD-T燃料核融合炉の設計に不可欠な量です。
本論文では,各々の研究するサロゲートと相互に作用する新しい適応サンプリングアルゴリズムであるQuality-Adaptive Surrogate Samplingを提案する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 19:55:42 GMT)
Extended Parallel Corpus for Amharic-English Machine Translation [0.0] リソース不足の言語であるamharicの機械翻訳に有用である。
コーパスを用いて,ニューラルマシン翻訳とフレーズベース統計機械翻訳モデルを訓練した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:51:08 GMT)
Exact Stochastic Second Order Deep Learning [0.0] ディープラーニングは、主にバックプロパゲーションの中心概念を中心に構築されたファーストオーダーメソッドによって支配される。
二階法では、一階法よりも使われない二階微分を考慮に入れる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 14:29:31 GMT)
Enhancing Object Detection for Autonomous Driving by Optimizing Anchor
Generation and Addressing Class Imbalance [0.0] 本研究では,より高速なR-CNNに基づく拡張型2次元物体検出器を提案する。
より高速なr-cnnに対する修正は計算コストを増加させず、他のアンカーベースの検出フレームワークを最適化するために容易に拡張できる。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 16:58:31 GMT)
Dynamical Mean-Field Theory for Markovian Open Quantum Many-Body Systems [0.0] 非平衡ボソニックな力学平均場理論をマルコフ開量子系に拡張する。
第一の応用として、二体損失と非コヒーレントポンプを有する駆動散逸型Bose-Hubbardモデルの定常状態について述べる。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 10:25:55 GMT)
Dynamical Coulomb blockade under a temperature bias [0.0] 我々は,温度差に応答する電子量子チャネルを横断する電気伝導のクーロン遮断の動的抑制を観察し,理解した。
トンネル状態の量子チャネルについては、コンダクタンス測定とトンネル力学のクーロン遮断理論の密接な一致が見られる。
逆の弾道状態では、電子および電磁浴の温度が異なる理論が展開される。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 14:45:42 GMT)
Coronary Artery Segmentation from Intravascular Optical Coherence
Tomography Using Deep Capsules [0.0] 血管内光コヒーレンストモグラフィーによる冠動脈の分画と解析は,冠動脈疾患の診断と管理の重要な側面である。
現在の画像処理手法は、専門家ラベル付きデータセットを生成するのに必要な時間と、分析中のバイアスの可能性によって妨げられている。
セグメンテーションの品質を犠牲にすることなく、推論時に高速なメモリフットプリントのモデルを開発する。
私たちは、私たちの開発が12%のパラメータを使用しながら、セグメンテーション品質とロバストネスの観点から最先端の機械学習手法と同等のモデルであるDeepCapにつながっていることを示しています。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 03:02:59 GMT)
Convolutional LSTM Neural Networks for Modeling Wildland Fire Dynamics [0.0] 森林火災伝播のダイナミクスをモデル化するために,畳み込み長短期記憶リカレントニューラルネットワークの有効性を評価する。
その結果,convlstmsは局所的な火災伝達イベントを捕捉できるだけでなく,火の拡散率など全体の火災動態を把握できることがわかった。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 21:07:09 GMT)
Blockchain technology for a Safe and Transparent Covid-19 Vaccination [0.0] 2019年後半、私たちはコビッドウイルスの出現を目撃しました。
このウイルスが最初に現れたのは武漢で、人為的な旅行が世界中に広まった。
本稿では,ワクチンの登録,保管,流通を管理するシステムを提案する。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 09:55:44 GMT)
Automated User Experience Testing through Multi-Dimensional Performance
Impact Analysis [0.0] 新規な自動ユーザエクスペリエンステスト手法を提案する。
コードの変更が時間単位とシステムテストにどう影響するかを学び、この情報に基づいてユーザエクスペリエンスの変更を推定します。
当社のオープンソースツールは,ランダムフォレストレグレッサで絶対誤差率3.7%を達成した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 01:18:01 GMT)
Autoencoder-based Representation Learning from Heterogeneous
Multivariate Time Series Data of Mechatronic Systems [0.0] 本稿では,データベースの異質性に着目したオートエンコーダネットワークを用いた教師なし特徴抽出手法を提案する。
異なるアプリケーションドメインからのメカトロニクスシステムの3つの公開データセットを使用して結果を検証する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 12:39:35 GMT)
An Empirical Study of the Effects of Sample-Mixing Methods for Efficient
Training of Generative Adversarial Networks [0.0] 生成敵対ネットワーク(GAN)のトレーニングは、発電機が高品質のサンプルを提供する前に巨大なイテレーションを必要とすることがよく知られています。
本研究では, この問題を緩和するために, 試料混合法であるMixup, CutMix, SRMixの効果を検討した。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:40:23 GMT)
Aharonov-Bohm-Like Scattering in the Generalized Uncertainty
Principle-corrected Quantum Mechanics [0.0] 一般化不確実性原理(GUP)パラメータ$beta$の1階までの散乱断面積を計算する。
通常のアハラノフ・ボーム散乱とは異なり、断面はすべての整数 $alpha'$ において不連続な振る舞いを示す。
断面が GUP が存在しないときの対称性は、$cal O (beta)$のレベルで明示的に破られる。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 06:31:57 GMT)
ACERAC: Efficient reinforcement learning in fine time discretization [0.0] 本フレームワークでは,微時間分別学習における強化学習(RL)の枠組みと学習アルゴリズムを提案する。
このアルゴリズムの効率は、3つの他のRL法と異なる時間差で検証される。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 18:40:20 GMT)
A Proposal for an Interactive Shell Based on a Typed Lambda Calculus [0.0] Favalonは、対話的なシェル置換として使用する計算の前提に基づいて構築された関数型プログラミング言語である。
falonは、型推論、柔軟なランタイム型メタデータ、シェルがコマンドを一緒にリンクするのと同じテクニックを使用して、既存のライブラリやコマンドの型付きバージョンとシームレスに統合する。 論文参考訳(メタデータ) (Thu, 8 Apr 2021 10:46:28 GMT)
A Model of Spinfoam Coupled with an Environment [0.0] スピンフォームのためのオープン量子システム理論が開発されている。
デコヒーレンス効果は、小さな領域のサテに向かって量子重力状態の緩和を引き起こす。
この結果は、量子時空の減少するダイナミクスを研究するために、さらなる近似が可能であることを示唆している。
論文参考訳(メタデータ) (Thu, 8 Apr 2021 15:50:12 GMT)