OmniTracker: Unifying Object Tracking by Tracking-with-Detection [119.5] OmniTrackerは、完全に共有されたネットワークアーキテクチャ、モデルウェイト、推論パイプラインですべてのトラッキングタスクを解決するために提供されている。
LaSOT、TrackingNet、DAVIS16-17、MOT17、MOTS20、YTVIS19を含む7つの追跡データセットの実験は、OmniTrackerがタスク固有の追跡モデルと統合された追跡モデルの両方よりも、オンパーまたはそれ以上の結果を達成することを示した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:59:57 GMT)
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with
Gradient-Disentangled Embedding Sharing [117.4] 本稿では,DeBERTaモデルの改良を目的とした,事前学習型言語モデルDeBERTaV3を提案する。
ELECTRAでのバニラ埋め込み共有は、トレーニング効率とモデルパフォーマンスを損なう。
そこで本研究では、タグ・オブ・ウォーのダイナミクスを回避するために、新しい勾配距離の埋め込み方式を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 05:17:08 GMT)
A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to
GPT-5 All You Need? [112.1] 生成AI(AIGC、つまりAI生成コンテンツ)は、テキスト、画像、その他を分析、作成する能力により、あらゆる場所で話題を呼んだ。
純粋な分析から創造へと移行するAIの時代において、ChatGPTは最新の言語モデルであるGPT-4とともに、多くのAIGCタスクからなるツールである。
本研究は,テキスト,画像,ビデオ,3Dコンテンツなど,出力タイプに基づいたAIGCタスクの技術的開発に焦点を当てている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:09:47 GMT)
PromptCap: Prompt-Guided Image Captioning for VQA with GPT-3 [111.8] 本稿では,画像とブラックボックスLMのより良いコネクタとして設計されたキャプションモデルであるPromptCapを提案する。
PromptCapは、生成されたキャプションで記述する視覚エンティティを制御するために自然言語プロンプトを使用する。
本稿では,GPT-3に画像キャプションを付加してVQAを実行する既存のパイプライン上で,PromptCapの有効性を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:10:18 GMT)
3D Mitochondria Instance Segmentation with Spatio-Temporal Transformers [101.4] 本稿では,空間的および時間的注意を並列に効率的に計算するハイブリッドエンコーダデコーダフレームワークを提案する。
また,ミトコンドリアインスタンスの領域を背景から支援する訓練中に,意味的クラッタ・バックグラウンドの逆行性障害も導入した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:58:49 GMT)
Agave crop segmentation and maturity classification with deep learning
data-centric strategies using very high-resolution satellite imagery [101.2] 超高解像度衛星画像を用いたAgave tequilana Weber azul crop segmentation and mature classificationを提案する。
実世界の深層学習問題を,作物の選別という非常に具体的な文脈で解決する。
結果として得られた正確なモデルにより、大規模地域で生産予測を行うことができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:15:29 GMT)
Detecting Everything in the Open World: Towards Universal Object
Detection [100.4] オープン世界の巨大なカテゴリを認識できる汎用オブジェクト検出器である textbfUniDetector を提案する。
視覚と言語モダリティの両方からの豊富な情報のおかげで、目に見えるクラスと目に見えないクラスのバランスを維持しながら、オープンワールドに容易に一般化する。
LVIS、ImageNetBoxes、VisualGenomeのような大語彙データセット上で、ゼロショットの強力な一般化機能を実行する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:15:03 GMT)
Fighting Money Laundering with Statistics and Machine Learning [95.4] 反マネーロンダリングのための統計的および機械学習手法に関する科学的文献はほとんどない。
本研究では,クライアントのリスクプロファイリングと疑わしい行動フラグングという2つの中心的要素を持つ統一用語を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:13:27 GMT)
Valid Inference after Causal Discovery [95.2] 我々は、因果関係発見後の推論に有効なツールを開発する。
因果発見とその後の推論アルゴリズムの組み合わせは,高度に膨らんだ誤発見率をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:28:23 GMT)
Multi-modal Prompting for Low-Shot Temporal Action Localization [95.2] 低ショット(ゼロショット・少数ショット)シナリオ下での時間的行動局所化の問題点を考察する。
クラスに依存しない2段階のアクションローカライズアーキテクチャをTransformerに導入し,その後にオープン語彙分類を行った。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:40:13 GMT)
Vid2Seq: Large-Scale Pretraining of a Visual Language Model for Dense
Video Captioning [93.7] Vid2Seqは、ナレーション付きビデオで事前訓練されたマルチモーダルなシングルステージのイベントキャプションモデルである。
本研究では, 文境界を擬似事象境界として再構成することにより, ラベル付きナレーション付き動画を高密度映像キャプションに活用可能であることを示す。
YT-Temporal-1Bデータセットで事前トレーニングされた結果のVid2Seqモデルは、さまざまな高密度ビデオキャプションベンチマーク上でのテクニックの状態を改善する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:01:09 GMT)
Joint Differentiable Optimization and Verification for Certified
Reinforcement Learning [91.9] 安全クリティカル制御システムのためのモデルベース強化学習では,システム特性を正式に認定することが重要である。
本稿では,強化学習と形式検証を共同で行う枠組みを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:41:42 GMT)
Learning Context-aware Classifier for Semantic Segmentation [88.9] 本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:00:35 GMT)
Enhancing the Self-Universality for Transferable Targeted Attacks [88.6] 本手法は,高次対角的摂動が標的攻撃に対してより伝達しやすい傾向にあることを示す。
異なる画像上の摂動を最適化する代わりに、異なる領域を最適化して自己ユニバーシティを実現することで、余分なデータを排除することができる。
特徴的類似性欠如により,本手法は,良性画像よりも対向性摂動の特徴が支配的となる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:49:48 GMT)
Human Pose as Compositional Tokens [88.3] 本稿では,PoseをPCT(Compincial Tokens)と名づけた構造的表現について述べる。
これはM個の離散トークンによるポーズを表し、それぞれがいくつかの相互依存結合を持つ部分構造を特徴づける。
事前に学習したデコーダネットワークを使用してトークンからのポーズを後処理なしで復元する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:14:18 GMT)
Propagate And Calibrate: Real-time Passive Non-line-of-sight Tracking [84.4] 本研究では,リレー壁のみを観察することで,見えない部屋を歩いている人を追跡する純粋受動的手法を提案する。
本研究では,リレー壁の映像の非知覚的変化を発掘するため,時間的局所的な動きの伝達に欠かせない特徴として差分フレームを導入する。
提案手法を評価するため,最初の動的受動NLOS追跡データセットであるNLOS-Trackを構築し,公開する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:18:57 GMT)
Real-time volumetric rendering of dynamic humans [83.1] 本研究では,モノクラービデオから動的人間の高速3次元再構成とリアルタイムレンダリングを行う手法を提案する。
提案手法は, 72時間を要する最近の最先端の代替技術と比較して, 3時間未満で動的人間を1つのGPUで再構築することができる。
新たなローカル光線マーチングレンダリングにより、モバイルVRデバイス上で、視覚的品質の損失を最小限に抑えて、ニューラルヒューマンを毎秒40フレームで可視化することができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:41:25 GMT)
WALDO: Future Video Synthesis using Object Layer Decomposition and
Parametric Flow Prediction [82.2] WALDOは、過去のビデオフレームを予測するための新しいアプローチである。
個々の画像は、オブジェクトマスクと小さなコントロールポイントのセットを組み合わせた複数の層に分解される。
レイヤ構造は、各ビデオ内のすべてのフレーム間で共有され、フレーム間の密接な接続を構築する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:22:30 GMT)
Robust Dynamic Radiance Fields [79.4] 動的放射場再構成法は動的シーンの時間変化構造と外観をモデル化することを目的としている。
しかし、既存の手法では、正確なカメラポーズをStructure from Motion (SfM)アルゴリズムによって確実に推定できると仮定している。
カメラパラメータとともに静的および動的放射場を共同で推定することにより、このロバスト性問題に対処する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:57:46 GMT)
Exact Non-Oblivious Performance of Rademacher Random Embeddings [79.3] 本稿では,Rademacherランダムプロジェクションの性能を再検討する。
入力データに関して数値的に鋭く、曖昧でない新しい統計的保証を確立する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:45:27 GMT)
Task-Oriented Communications for NextG: End-to-End Deep Learning and AI
Security Aspects [78.8] NextG通信システムは,タスク指向通信などのタスクを確実に実行するために,この設計パラダイムのシフトを探求し始めている。
無線信号分類はNextG Radio Access Network (RAN) のタスクであり、エッジデバイスはスペクトル認識のための無線信号を収集し、信号ラベルを識別する必要があるNextGベースステーション(gNodeB)と通信する。
エッジデバイスとgNodeB用のエンコーダデコーダ対として、送信機、受信機、および分類器機能を共同で訓練することで、タスク指向通信を考える。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 23:01:40 GMT)
Better Understanding Differences in Attribution Methods via Systematic
Evaluations [77.1] モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
これらの評価手法を用いて、広範囲のモデルにおいて広く用いられている属性手法の長所と短所について検討する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:24:58 GMT)
Lidar Line Selection with Spatially-Aware Shapley Value for
Cost-Efficient Depth Completion [76.6] ライダーはシーンの深さを推定するための重要なセンサーである。
我々はライダーラインの位置を最適化する新しい問題を提案する。
そこで本稿では,深度補修の高精度さを維持しつつ,線数を削減する手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:14:11 GMT)
Towards Efficient Visual Adaption via Structural Re-parameterization [76.6] 本稿では,RepAdapterと呼ばれる巨大ビジョンモデルに対して,パラメータ効率と計算親和性を考慮したアダプタを提案する。
RepAdapterは、VTAB-1k上で25%のトレーニング時間、20%のGPUメモリ、94.6%のストレージコストを節約できる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:51:27 GMT)
Self-Sufficient Framework for Continuous Sign Language Recognition [75.6] この作業の目標は、継続的手話認識のための自己充足型のフレームワークを開発することです。
これには、理解のための手、顔、口などの複雑なマルチスケール機能、フレームレベルのアノテーションの欠如が含まれる。
ネットワークやアノテーションを必要とせずに手動と非手動の両方の機能を抽出するDivide and Focus Convolution (DFConv)を提案する。
DPLRは、基底真理グロスシーケンスラベルと予測シーケンスを組み合わせることにより、非スパイクフレームレベルの擬似ラベルを伝搬する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:42:57 GMT)
Solving Oscillation Problem in Post-Training Quantization Through a
Theoretical Perspective [74.5] ポストトレーニング量子化(PTQ)は、事実上最も効率的な圧縮手法の1つである。
我々は、PTQ法で見過ごされた振動問題について論じる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:52:52 GMT)
Dynamic-Aware Loss for Learning with Label Noise [73.8] ディープニューラルネットワーク(DNN)にラベルノイズが深刻な脅威をもたらす
本稿では,この問題を解決するためにDAL(Dynamics-Aware Los)を提案する。
詳細な理論的解析と広範な実験結果の両方が,本手法の優位性を示している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:05:21 GMT)
Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral
Fracture Grading [72.5] 本稿では,教師なし特徴抽出器として生成拡散オートエンコーダモデルを訓練するための新しい手法を提案する。
フラクチャーグレーディングを連続回帰としてモデル化し, フラクチャーのスムーズな進行を反映した。
重要なことに,本手法の創成特性は,与えられた脊椎の様々な段階を可視化し,自動グルーピングに寄与する特徴を解釈し,洞察することを可能にする。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:16:01 GMT)
DiffuMask: Synthesizing Images with Pixel-level Annotations for Semantic
Segmentation Using Diffusion Models [70.5] 本研究では,オフザシェルフ安定拡散モデルにより生成された合成画像の正確なセマンティックマスクを自動で取得できることを示す。
我々のアプローチはDiffuMaskと呼ばれ、テキストと画像間の相互注意マップの可能性を利用しています。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:43:15 GMT)
The Treasure Beneath Multiple Annotations: An Uncertainty-aware Edge
Detector [70.4] 既存のメソッドは、単純な投票プロセスを使用して複数のアノテーションを融合し、エッジ固有の曖昧さを無視し、アノテータのラベル付けバイアスを無視する。
多様なアノテーションの主観性とあいまいさを調査するために不確実性を利用した新しい不確実性認識エッジ検出器(UAED)を提案する。
UAEDは複数のエッジ検出ベンチマークで一貫したパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:14:36 GMT)
Towards Compositional Adversarial Robustness: Generalizing Adversarial
Training to Composite Semantic Perturbations [70.1] まず,合成逆数例を生成する新しい手法を提案する。
本手法は, コンポーネントワイド射影勾配勾配を利用して最適攻撃組成を求める。
次に,モデルロバスト性を$ell_p$-ballから複合意味摂動へ拡張するための一般化逆トレーニング(GAT)を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:38:39 GMT)
Adaptive Negative Evidential Deep Learning for Open-set Semi-supervised
Learning [69.9] オープンセット半教師付き学習(Open-set SSL)は、ラベル付きデータ(inliers)で観測されない新しいカテゴリ(outliers)を含むラベル付きデータとテストデータを含む、より実践的なシナリオである。
本研究では,様々な不確かさを定量化するための外乱検出器として顕在的深層学習(EDL)を導入し,自己学習と推論のための異なる不確実性指標を設計する。
Inlierとoutlierの両方を含むラベルなしデータセットに適合するように、新しい適応的負の最適化戦略を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:07:15 GMT)
Using Explanations to Guide Models [68.6] モデルガイダンスは、時にはモデルパフォーマンスも改善できることを示す。
本研究では,物体の特徴に着目したモデルの有効性を示す新しいエネルギー損失を提案する。
また、バウンディングボックスアノテーションのわずかな部分でも、これらのゲインが達成可能であることも示しています。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:34:50 GMT)
Infrastructure-based End-to-End Learning and Prevention of Driver
Failure [68.0] フェールネットは、規模が拡大したミニ都市において、名目上と無謀なドライバーの両方の軌道上で、エンドツーエンドでトレーニングされた、繰り返しニューラルネットワークである。
制御障害、上流での認識エラー、ドライバーのスピードを正確に識別し、名目運転と区別することができる。
速度や周波数ベースの予測器と比較すると、FailureNetのリカレントニューラルネットワーク構造は予測能力を向上し、ハードウェアにデプロイすると84%以上の精度が得られる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:55:51 GMT)
VideoXum: Cross-modal Visual and Textural Summarization of Videos [67.0] 我々は新しい共同ビデオとテキスト要約タスクを提案する。
目標は、短縮されたビデオクリップと、長いビデオから対応するテキスト要約の両方を生成することだ。
生成された短縮ビデオクリップとテキストナラティブは、セマンティックに適切に調整されるべきである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:51:23 GMT)
Recommendation Systems in Libraries: an Application with Heterogeneous
Data Sources [66.8] Reading&Machineプロジェクトは、デジタル化のサポートを利用して、ライブラリの魅力を高め、ユーザエクスペリエンスを向上させる。
プロジェクトでは、ユーザが意思決定プロセスにおいて、ユーザが興味を持つであろう書籍のリストをレコメンデーションシステム(RecSys)で作成するアプリケーションを実装している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:13:01 GMT)
Collecting Interactive Multi-modal Datasets for Grounded Language
Understanding [66.3] 自然言語タスクを用いた協調型エンボディエージェントの定式化を行った。
広範かつスケーラブルなデータ収集ツールを開発しました。
対話型基底言語理解のための最初のデータセットを収集した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:38:48 GMT)
Linear-Covariance Loss for End-to-End Learning of 6D Pose Estimation [65.6] 現代の画像に基づく6Dオブジェクトのポーズ推定手法は、2D-3D対応の予測を学習し、そこから解法を用いてポーズを求めることができる。
ここでは、ネットワークが精度を低下させるであろう勾配につながる問題の平均的な性質と矛盾するものであると論じる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:32:31 GMT)
Environmental Sensor Placement with Convolutional Gaussian Neural
Processes [65.1] 南極のような遠隔地において、計測情報度を最大化し、センサーを効率的に配置することは困難である。
確率論的機械学習モデルは、新しいセンサによって提供される不確実性低減を予測することにより、配置情報性を評価することができる。
本稿では,これらの問題に対処するために,畳み込み型ガウスニューラルプロセス(ConvGNP)を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:53:55 GMT)
TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation
with Question Answering [64.0] 視覚的質問応答(VQA)を用いたテキスト入力に生成した画像の忠実度を測定する自動評価指標を導入する。
そこで本研究では,12カテゴリにわたる4Kの多様なテキスト入力と25Kの質問(オブジェクト,カウントなど)からなるベンチマークを用いて,既存のテキスト・ツー・イメージ・モデルの包括的評価を行う。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:41:02 GMT)
Online Learning of Wheel Odometry Correction for Mobile Robots with
Attention-based Neural Network [63.8] 現代のロボットプラットフォームは、人間の横で毎日運用するために、信頼性の高いローカライゼーションシステムを必要としている。
フィルタされた車輪と慣性オドメトリーに基づく単純なポーズ推定アルゴリズムは、急激なキネマティックな変化とホイールスリップの存在下で失敗することが多い。
本稿では,車輪形状補正のための革新的なオンライン学習手法を提案し,ロバストなマルチソースローカライゼーションシステムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:30:31 GMT)
Tracking, exploring and analyzing recent developments in German-language
online press in the face of the coronavirus crisis: cOWIDplus Analysis and
cOWIDplus Viewer [63.0] 新型コロナウイルスのパンデミックは、世界が第二次世界大戦以来直面してきた最大の危機かもしれない。
私たちの主要なコミュニケーションツールとして言語に影響を与えているのも驚きではありません。
ドイツ語のサブセット上でこれらの効果をキャプチャし、説明するために設計された3つの相互接続リソースを提示する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:39:27 GMT)
Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles [61.2] 特徴不確かさ下における文脈線形帯域問題について検討する。
最適な仮説は、ノイズ特性によって基礎となる実現可能性関数から遠ざかることができる。
本研究では,ベイズ神託を観測情報から目的とするアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:19:15 GMT)
Contrastive Alignment of Vision to Language Through Parameter-Efficient
Transfer Learning [60.3] コントラスト的視覚言語モデル(例えばCLIP)は、コントラスト的トレーニングを通じて視覚モデルと言語モデルの全てのパラメータを更新することによって作成される。
パラメータ更新の最小セット($7%)が、フルモデルトレーニングと同じパフォーマンスを実現可能であることを示す。
既存の知識がパラメータ効率のトレーニングにおいてより強く保存されていることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:12:08 GMT)
Near-optimal inference in adaptive linear regression [60.1] 最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:18:30 GMT)
Neural Belief Propagation Decoding of Quantum LDPC Codes Using
Overcomplete Check Matrices [60.0] 元のチェック行列における行の線形結合から生成された冗長な行を持つチェック行列に基づいてQLDPC符号を復号する。
このアプローチは、非常に低い復号遅延の利点を付加して、復号性能を著しく向上させる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:33:54 GMT)
Melting Pot 2.0 [58.6] Melting Potは、マルチエージェント人工知能の開発を容易にするために開発されたツールである。
新たなソーシャルパートナーへの一般化を測定する評価プロトコルを提供する。
Melting Potは、最も多様な相互依存とインセンティブの集合をカバーすることを目指している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:14:21 GMT)
Time Series Contrastive Learning with Information-Aware Augmentations [57.5] コントラスト学習の鍵となる要素は、いくつかの先行を示唆する適切な拡張を選択して、実現可能な正のサンプルを構築することである。
対照的な学習タスクやデータセットに意味のある時系列データの増大をどうやって見つけるかは、未解決の問題である。
本稿では,時系列表現学習のための最適な拡張を適応的に選択する情報認識拡張を用いた新しいコントラスト学習手法であるInfoTSを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:02:50 GMT)
Scheduling and Aggregation Design for Asynchronous Federated Learning
over Wireless Networks [56.9] Federated Learning(FL)は、デバイス上でのトレーニングとサーバベースのアグリゲーションを組み合わせた、協調的な機械学習フレームワークである。
FLシステムにおけるストラグラー問題に対処するために,周期的アグリゲーションを用いた非同期FL設計を提案する。
年齢認識の集約重み付け設計は,非同期FL設定における学習性能を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:26:58 GMT)
Explicit Visual Prompting for Low-Level Structure Segmentations [55.5] 我々はExplicit Visual Prompting(EVP)という新しいビジュアルプロンプトモデルを提案する。
EVPは、同じ量のチューナブルパラメータの下で、他のパラメータ効率のチューニングプロトコルを著しく上回る。
EVPはまた、様々な低レベル構造セグメンテーションタスクにおける最先端のパフォーマンスも達成している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:25:09 GMT)
Dissipative preparation and stabilization of many-body quantum states in
a superconducting qutrit array [55.4] 本稿では,量子多体絡み合い状態の生成と安定化のためのプロトコルを提案し,解析する。
超伝導トランスモン回路と線形マイクロ波共振器からなる実験プラットフォームについて検討する。
本研究は, 自己補正型量子多体状態とロバストかつ自己補正型量子多体状態の共振型超伝導cQEDシステムの容量を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:02:47 GMT)
CurveCloudNet: Processing Point Clouds with 1D Structure [52.7] 我々はCurveCloudNetと呼ばれる新しいポイントクラウド処理方式とバックボーンを導入する。
CurveCloudNetは、ポイントクラウドをポリラインの集合としてパラメータ化し、ポイント上の局所的なサーフェスアウェアの順序を確立する。
提案手法は,曲線雲の対称な1次元畳み込み,曲線に沿った点をマージする球群,曲線上の1次元極端点サンプリングアルゴリズムを含む曲線雲の処理に曲線固有演算を適用した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:41:36 GMT)
Emotionally Enhanced Talking Face Generation [52.1] 我々は、適切な表現でビデオを生成するために、カテゴリー的感情に基づく話し顔生成フレームワークを構築した。
モデルが任意のアイデンティティ、感情、言語に適応できることを示します。
提案するフレームワークはユーザフレンドリーなWebインターフェースを備えており,感情を伴う顔生成をリアルタイムに行うことができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:33:27 GMT)
CoopInit: Initializing Generative Adversarial Networks via Cooperative
Learning [50.9] CoopInitは、協力的な学習ベースの戦略で、GANにとって良い出発点を素早く学べる。
本稿では,画像生成における提案手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:49:32 GMT)
Self-Paced Learning for Open-Set Domain Adaptation [50.6] 従来のドメイン適応手法は、ソースとターゲットドメインのクラスが同一であると仮定する。
オープンセットドメイン適応(OSDA)は、この制限に対処する。
そこで,本研究では,共通クラスと未知クラスを識別するための自己評価学習に基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:52:47 GMT)
LEAPS: End-to-End One-Step Person Search With Learnable Proposals [50.4] LEAPSという学習可能な提案を用いたエンドツーエンドのワンステップ人物探索手法を提案する。
スパースと学習可能な提案のセットが与えられた後、LEAPSは動的人物検索ヘッドを使用して、非最大抑圧後処理なしで直接人物検出および対応するre-id特徴生成を行う。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:59:32 GMT)
CC3D: Layout-Conditioned Generation of Compositional 3D Scenes [50.1] 本稿では,複雑な3次元シーンを2次元セマンティックなシーンレイアウトで合成する条件生成モデルであるCC3Dを紹介する。
合成3D-FRONTと実世界のKITTI-360データセットに対する評価は、我々のモデルが視覚的および幾何学的品質を改善したシーンを生成することを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:59:02 GMT)
Compositional 3D Scene Generation using Locally Conditioned Diffusion [49.6] 合成シーン拡散へのアプローチとして,テクスブフォローカライズ条件付き拡散を導入する。
本研究では, スコア蒸留によるテキスト・ツー・3D合成パイプラインを試作し, 関連するベースラインよりも高忠実度で合成3Dシーンを生成できることを示した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:37:16 GMT)
A Whac-A-Mole Dilemma: Shortcuts Come in Multiples Where Mitigating One
Amplifies Others [48.1] 視覚システムの信頼性向上の鍵は、既存の方法が複数のショートカットを克服できるか、あるいはWhac-A-Moleゲームで苦労できるかを理解することである。
大規模な基盤モデルを含むコンピュータビジョンモデルは、複数のショートカットが存在する場合に苦労する。
We propose Last Layer Ensemble, a simple-yet- Effective method to mitigate multiple shortcuts without Whac-A-Mole behavior。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:13:58 GMT)
Unconstrained Dynamic Regret via Sparse Coding [47.4] オンライン線形最適化(OLO)を2つの問題構造の結合の下で検討する。
本稿では,問題をスパース符号化に再キャストすることで,別の複雑性尺度を提案する。
また、新しい連続時間機械を用いて設計した静的非拘束型OLOに対して、新しい勾配適応アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:01:46 GMT)
Positive-Augmented Constrastive Learning for Image and Video Captioning
Evaluation [47.4] 画像キャプションのための新しいコントラストベース評価指標,すなわち肯定的拡張コントラスト学習スコア(PAC-S)を提案する。
PAC-Sは、生成した画像とキュレートされたデータにテキストを追加することで、対照的な視覚的意味空間の学習を統一する。
複数のデータセットにまたがる実験により、私たちの新しい測定基準は、画像とビデオの両方で人間の判断と最も高い相関を達成できることが示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:03:14 GMT)
Implementing two-qubit gates at the quantum speed limit [45.8] 実験では、2量子ゲートを可能な限り高速な速度で実証する。
我々は、機械学習にインスパイアされた最適制御法を用いて設計された実験ゲートを実装することにより、この量子速度制限を実現する。
提案手法では,非ネイティブな2ビットゲートの高速化が期待できる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:51:54 GMT)
Adap-$\tau$: Adaptively Modulating Embedding Magnitude for
Recommendation [45.5] 本稿では,適応性,パーソナライズ,効率,モデルに依存しない4つの望ましい特性を満たす温度に対するAdap-$tau$の適応戦略を提案する。
実世界の4つのデータセットにおける印象的なパフォーマンス向上(平均9%)を実証的に観察する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:48:20 GMT)
Data Augmentation For Label Enhancement [45.3] ラベル拡張(LE)が出現し、論理ラベルからラベル分布(LD)を回復する。
本稿では,低次元の特徴空間に原データを投影する新しいLE次元削減手法を提案する。
その結果,提案手法は,他の5つの比較手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:36:58 GMT)
Sharpness-aware Quantization for Deep Neural Networks [45.2] シャープネス・アウェア量子化(SAQ)は,シャープネス・アウェア最小化(SAM)がモデル圧縮に与える影響を探索する新しい手法である。
本研究では,SAQにより量子化モデルの一般化性能が向上し,SOTAの結果が均一に量子化されることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:31:46 GMT)
Rotating without Seeing: Towards In-hand Dexterity through Touch [43.9] 本稿では,タッチデクスタリティ(Touch Dexterity)を提案する。
小さな領域で正確な触覚センサーに頼る代わりに、ロボットハンドの片側をオーバーレイする密度の高い二分力センサー(タッチまたはタッチなし)を用いた新しいシステム設計を導入する。
我々は,各種物体のシミュレーションに強化学習を用いて手動回転ポリシーを訓練する。タッチオンリーセンシングを応用して,実際のロボットの手で直接ポリシーを展開し,トレーニングで提示されていない新規物体を回転させることができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:41:28 GMT)
Diverse 3D Hand Gesture Prediction from Body Dynamics by Bilateral Hand
Disentanglement [43.0] 両手指離断に基づく2段階手指生成手法を提案する。
第1段階では、2つの手振り枝による自然な手振りを生成する。
第2段階は、3Dハンドの予測は非決定論的であるべきだという洞察に基づいて構築されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:50:41 GMT)
Revealing Emergent Magnetic Charge in an Antiferromagnet with Diamond
Quantum Magnetometry [42.6] トポロジカルテクスチャの反面、磁気材料のエキゾチックな位相において重要な役割を担い、論理とメモリの応用を約束する。
反強磁性体では、これらのテクスチャは強磁性体に対する安定性とより高速なダイナミクスを示す。
無視可能なバックアクションによる高感度ベクトル磁場センシングの需要を満たす技術は、ダイヤモンド量子磁気メトリーである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:30:20 GMT)
$L_2$BN: Enhancing Batch Normalization by Equalizing the $L_2$ Norms of
Features [42.2] サンプル機能の$l$ノルムの違いは、バッチの正規化を妨げる可能性がある。
サンプル特徴の$l$ノルムを等化するための単純で効果的な手法を提案する。
L$BNは、さまざまなニューラルネットワークモデルの能力を高め、大幅なパフォーマンス向上を実現する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:58:36 GMT)
CVT-SLR: Contrastive Visual-Textual Transformation for Sign Language
Recognition with Variational Alignment [42.1] 手話認識(SLR)は、手話ビデオにテキストグルースとして注釈を付ける弱い教師付きタスクである。
近年の研究では、大規模手話データセットの欠如による訓練不足がSLRの主なボトルネックとなっている。
本稿では,SLR,PHO-SLRに対して,視覚的・言語的モダリティの事前知識を十分に探求するために,新しいコントラッシブ・ビジュアル・テクスチャ変換を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:28:49 GMT)
Dynamic Query Selection for Fast Visual Perceiver [42.1] 精度低下を抑えつつ、推論中のクエリQ数を削減し、Perceiversをさらに効率的にする方法を示す。
本研究では,精度低下を抑えつつ,推論中のクエリQ数を削減し,Perceiversをより効率的にする方法を検討する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:53:32 GMT)
Learning A Sparse Transformer Network for Effective Image Deraining [42.0] 有効デレインネットワークであるスパーストランス(DRSformer)を提案する。
学習可能なトップk選択演算子を開発し、各クエリのキーから最も重要な注意点を適応的に保持し、より優れた機能アグリゲーションを実現する。
我々は,協調改良デライン方式を示すために,専門家による特徴補償器を混合したモデルを開発した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:41:57 GMT)
An Effective Motion-Centric Paradigm for 3D Single Object Tracking in
Point Clouds [39.4] LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。
以前のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:28:44 GMT)
CAT-Seg: Cost Aggregation for Open-Vocabulary Semantic Segmentation [38.6] 本稿では,新しいコスト集約手法を用いて,画像テキスト類似度マップ,すなわちコストマップを最適化する代替手法を提案する。
当社のフレームワーク,すなわちCAT-Segは,すべてのベンチマークで最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:28:21 GMT)
GPT4MIA: Utilizing Generative Pre-trained Transformer (GPT-3) as A
Plug-and-Play Transductive Model for Medical Image Analysis [38.6] 医用画像解析のためのプラグアンドプレイトランスダクティブ推論ツールとして,GPT(Generative Pre-trained Transformer)を提案する。
GPT-3のような大規模事前学習言語モデルがMIAのプラグ・アンド・プレイ・トランスダクティブ推論モデルとして利用できる理由を理論的に分析する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:59:20 GMT)
Contrastive Semi-supervised Learning for Underwater Image Restoration
via Reliable Bank [38.5] 本研究では,未ラベルのデータをネットワークトレーニングに組み込む半教師付き水中画像復元(Semi-UIR)フレームワークを提案する。
まず、信頼度の高い銀行を導入し、「最高の」アウトプットを疑似土台真理として保存する。
完全参照型および非参照型水中ベンチマークによる実験結果から,本アルゴリズムはSOTA法よりも明らかに改善されていることが示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:21:03 GMT)
Visibility Constrained Wide-band Illumination Spectrum Design for
Seeing-in-the-Dark [38.1] Seeing-in-the-darkは、コンピュータビジョンのタスクの中で、最も重要で挑戦的なタスクの1つだ。
本稿では,広帯域VIS-NIR領域における補助照明の最適スペクトルを設計することにより,NIR2RGB翻訳の堅牢化を図る。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:27:37 GMT)
Poisoning Attacks in Federated Edge Learning for Digital Twin 6G-enabled
IoTs: An Anticipatory Study [38.0] フェデレーションエッジ学習は、デジタルツインの6G対応モノのインターネット(IoT)環境において、プライバシ保護、人工知能(AI)対応のアクティビティをサポートする上で不可欠である。
本稿では,デジタル双対6G対応IoT環境におけるフェデレーションエッジ学習における中毒攻撃の予測研究を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:12:17 GMT)
PaGE-Link: Path-based Graph Neural Network Explanation for Heterogeneous
Link Prediction [37.6] 透明性と説明責任は、ブラックボックス機械学習(ML)モデルの主要な関心事となっている。
本稿では、接続解釈性のある説明を生成するヘテロジニアスリンク予測(PaGE-Link)のためのパスベースのGNN説明法を提案する。
本研究では,PaGE-Linkが生成した説明により,引用グラフとユーザ項目グラフの推奨値が9~35%向上し,人的評価において78.79%の回答が選択された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:46:02 GMT)
Ask-AC: An Initiative Advisor-in-the-Loop Actor-Critic Framework [36.1] 本稿では,Ask-ACと呼ばれる新しいアドバイザリ・イン・ザ・ループアクター・クリティカル・フレームワークを提案する。
Ask-ACの中心には2つの補完的なコンポーネント、すなわちアクションリクエスタとアダプティブステートセレクタがある。
定常環境および非定常環境における実験結果から,提案手法はエージェントの学習効率を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:41:14 GMT)
CLSA: Contrastive Learning-based Survival Analysis for Popularity
Prediction in MEC Networks [36.0] ディープニューラルネットワーク(DNN)と統合されたモバイルエッジキャッシング(MEC)は、将来の次世代無線ネットワークにとって大きな可能性を秘めている革新的な技術である。
MECネットワークの有効性は、最も人気のあるコンテンツでキャッシュノードのストレージを予測し、動的に更新する能力に大きく依存している。
有効にするためには、DNNベースの人気予測モデルには、コンテンツの歴史的要求パターンを理解する能力が必要である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:57:46 GMT)
Evaluating Inclusivity, Equity, and Accessibility of NLP Technology: A
Case Study for Indian Languages [35.9] NLP技術が広く適用され、公正で有用になるためには、世界中の言語で多様な話者を提供する必要がある。
本研究では,NLP技術を3次元にわたって評価する評価パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:34:36 GMT)
Two-shot Video Object Segmentation [35.5] 少ない注釈付きビデオでビデオオブジェクトセグメンテーションモデルを訓練する。
ラベル付きフレームの擬似ラベルを生成し、ラベル付きデータと擬似ラベル付きデータの組み合わせでモデルを最適化する。
初めて、2ショットのVOSデータセット上でVOSモデルをトレーニングする一般的な方法を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:59:56 GMT)
SpikeCV: Open a Continuous Computer Vision Era [35.2] SpikeCVはスパイクカメラ用の新しいオープンソースのコンピュータビジョンプラットフォームである。
スパイクカメラは、近年急速に発達しているニューロモルフィックな視覚センサーである。
SpikeCVは、さまざまな超高速シーンデータセット、ハードウェアインターフェース、使いやすいモジュールライブラリを提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:00:12 GMT)
ExtremeNeRF: Few-shot Neural Radiance Fields Under Unconstrained
Illumination [34.5] より実践的な環境で新しい視点を合成する新しい課題を提案する。
NeRFは、制約された照明下で撮影された大量のマルチビュー画像を必要とする。
閉塞型マルチビューアルベド整合性を利用したExtremeNeRFを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:32:27 GMT)
BoxSnake: Polygonal Instance Segmentation with Box Supervision [34.5] ボックスアノテーションのみを用いた効率的な多角形インスタンスセグメンテーションを実現するために,BoxSnakeと呼ばれる新しいエンドツーエンドトレーニング手法を提案する。
BoxSnakeはマスクベースの弱教師付き手法と比較して、予測セグメンテーションとバウンディングボックスの間のパフォーマンスギャップをさらに減らし、Cityscapesデータセットに顕著な優位性を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:54:18 GMT)
Influencer Backdoor Attack on Semantic Segmentation [34.4] セマンティックセグメンテーションモデルにおけるバックドア攻撃について検討する。
本研究では,インフルエンサーバックドアアタック(IBA)について検討する。
IBAは、すべての推定において、非ビビティ画素の分類精度を維持し、すべての犠牲者画素の誤分類を導出することが期待されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:45:38 GMT)
Fix the Noise: Disentangling Source Feature for Controllable Domain
Translation [34.2] 制御性に優れた高品質なドメイン翻訳手法を提案する。
キーとなるアイデアは、ソースの機能を、ターゲットのフィーチャー空間のアンタングルされた部分空間内に保持することである。
実験の結果,提案手法はより一貫性があり,現実的な画像を生成することができることがわかった。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:19:48 GMT)
VAD: Vectorized Scene Representation for Efficient Autonomous Driving [32.5] VADは、自動運転のためのエンドツーエンドのベクトル化パラダイムである。
ベクトル化されたエージェントの動きと要素を明示的なインスタンス集約計画制約として利用します。
VADは従来のエンドツーエンドの計画手法よりもはるかに高速に動作します。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:59:22 GMT)
Policy Adaptation from Foundation Model Feedback [31.6] 視覚言語基盤モデルの最近の進歩は、汎用ロボットの構築に大きな進歩をもたらした。
事前訓練されたモデルを使用してシーンと命令を意思決定の入力としてエンコードすることで、命令条件付きポリシーはさまざまなオブジェクトやタスクにわたって一般化することができる。
本研究では,基礎モデルフィードバック(PAFF)からのポリシー適応を提案する。
PAFFはすべてのケースにおいて大きなマージンでベースラインを改善することを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:16:41 GMT)
Sim-to-Real Transfer for Quadrupedal Locomotion via Terrain Transformer [31.6] 様々な地形における四足歩行制御のための高容量トランスモデルを提案する。
シミュレーション・トゥ・リアルシナリオにおいてTransformerをよりよく活用するために、オフライン事前学習段階とオンライン修正段階からなる新しい2段階トレーニングフレームワークを提案する。
シミュレーション実験により、TERTはリターン、エネルギー消費、制御のスムーズさの観点から、様々な地形における最先端のベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:06:45 GMT)
Pre-trained Token-replaced Detection Model as Few-shot Learner [31.4] ELECTRAのような事前訓練されたトークン置換検出モデルを用いて,少数ショット学習のための新しい手法を提案する。
16のデータセットの体系的評価により,事前学習されたマスキング言語モデルを用いた数発の学習者よりも優れた結果が得られた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:43:30 GMT)
Learning Optical Flow and Scene Flow with Bidirectional Camera-LiDAR
Fusion [30.8] 同期した2Dデータと3Dデータから光フローとシーンフローを同時推定する問題について検討する。
従来の方法では、ジョイントタスクを独立したステージに分割する複雑なパイプラインを使用するか、アーリーフュージョンまたはレイトフュージョンの方法で2Dと3D情報を融合する。
本稿では,2次元および3次元の分岐からなり,各層に複数方向の融合接続を施した新しいエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:54:01 GMT)
Large AI Models in Health Informatics: Applications, Challenges, and the
Future [30.4] 大規模なAIモデル、あるいは基礎モデル(ファウンデーションモデル)は、パラメータワイドとデータワイドの両方で大規模に出現するモデルである。
健康情報学において、大規模AIモデルの出現は方法論の設計に新たなパラダイムをもたらした。
この記事では、バックグラウンドからアプリケーションまで、大規模なAIモデルの最新の包括的なレビューを紹介する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:28:33 GMT)
CMX: Cross-Modal Fusion for RGB-X Semantic Segmentation with
Transformers [29.4] CMXは、RGB-Xセマンティックセグメンテーションのためのトランスフォーマーベースのクロスモーダルフュージョンフレームワークである。
CMXはRGB画像とXモードから特徴を抽出する2つのストリームで構築されている。
CMXは様々なマルチモーダルの組み合わせに一般化し、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:30:43 GMT)
Natural Language-Assisted Sign Language Recognition [28.6] 自然言語支援手話認識フレームワークを提案する。
グルース(記号ラベル)に含まれる意味情報を利用して、手話における視覚的に区別できない記号(VISigns)の問題を緩和する。
提案手法は, MSASL, WLASL, NMFs-CSLの3つのベンチマークに対して, 最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:59:57 GMT)
Prompt-MIL: Boosting Multi-Instance Learning Schemes via Task-specific
Prompt Tuning [28.6] 全スライド画像(WSI)分類は、計算病理学において重要な課題である。
技術手法の現在の状況は、通常、インスタンスを表現するために事前訓練された機能に依存するマルチインスタンス学習スキーム(MIL)に基づいている。
本稿では,WSI 分類にプロンプトを統合する MIL フレームワーク Prompt-MIL を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:24:27 GMT)
PointTAD: Multi-Label Temporal Action Detection with Learnable Query
Points [28.6] 時間的アクション検出(TAD)は通常、単一のラベルから少数のアクションインスタンスを持つ未トリミングビデオを処理する。
本稿では,マルチラベル・アントリム映像からすべてのアクション・インスタンスをローカライズすることを目的とした,マルチラベル・テンポラル・アクション検出の課題に焦点をあてる。
本稿では,従来のTADからスパースクエリに基づく検出パラダイムを拡張し,PointTADのマルチラベルTADフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:03:50 GMT)
Simple Yet Effective Synthetic Dataset Construction for Unsupervised
Opinion Summarization [28.5] 本稿では、アスペクト特化と一般的な意見要約の両方を生成するための、単純で効果的な教師なしの2つのアプローチを提案する。
最初のアプローチであるSed Words Based Leave-One-Out (SW-LOO) は、正確にマッチングされたアスペクトシードワードによって、アスペクト関連のレビューを識別する。
第2のアプローチであるNLI-LOO(Natural Language Inference Based Leave-One-Out)では、NLIモデルを用いたアスペクト関連文を、シード語を使わずにより一般的な設定で識別する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:08:04 GMT)
3D Human Mesh Estimation from Virtual Markers [28.3] 体表面上の64個のランドマークキーポイントを学習する仮想マーカーを中間表現として提示する。
提案手法は3つのデータセット上で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:30:43 GMT)
CompoDiff: Versatile Composed Image Retrieval With Latent Diffusion [28.3] 本稿では,遅延拡散を用いた合成画像検索(CIR)のための新しい拡散モデルCompoDiffを提案する。
CompoDiffはFashionIQのようなCIRベンチマークで新たなゼロショットステート・オブ・ザ・アートを実現している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:06:35 GMT)
A Single-Step Multiclass SVM based on Quantum Annealing for Remote
Sensing Data Classification [26.8] 本研究は,QMSVM(Quantum Multiclass SVM)と呼ばれる,量子アニールに基づく直接多クラス分類のための新しい量子SVMを提案する。
この研究の主な目的は、このアプローチの実現可能性、正確性、および時間性能を評価することである。
リモートセンシングデータの分類問題に対するD-Wave Advantage 量子アニールを用いた実験が実施されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:51:19 GMT)
Black-box Backdoor Defense via Zero-shot Image Purification [26.8] バックドア攻撃は、トレーニングセットに有毒なデータを注入し、モデル推論中に有毒なサンプルを誤分類する。
本稿では,ゼロショット画像の浄化により,様々な攻撃を効果的に防御できる新しいバックドア防御フレームワークを提案する。
提案手法はブラックボックスモデルに適用可能であり, 汚染されたモデルの内部情報や, 汚染されたサンプルの事前知識は不要である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:21:44 GMT)
Equiangular Basis Vectors [26.5] ディープニューラルネットワークでは、モデルは通常、異なる分類タスクを処理するために、ソフトマックスを備えたkウェイ完全に接続された層で終わる。
分類タスクのための等角基底ベクトル(EBV)を提案する。
EBVは2022年のDIGIX Global AI Challengeで優勝しました。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:08:51 GMT)
Markerless Camera-to-Robot Pose Estimation via Self-supervised
Sim-to-Real Transfer [26.2] 本稿では,オンラインカメラ・ロボット・キャリブレーションと自己監督型トレーニング手法を備えたエンドツーエンドのポーズ推定フレームワークを提案する。
我々のフレームワークはロボットのポーズを解くための深層学習と幾何学的ビジョンを組み合わせており、パイプラインは完全に微分可能である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:57:07 GMT)
Dual-Stream Transformer for Generic Event Boundary Captioning [25.7] 本稿では,CVPR2022ジェネリックイベント境界キャプタリング(GEBC)コンペティションのチャンピオンソリューションについて述べる。
本稿では,映像コンテンツエンコーディングとキャプション生成の両方を改善したDual-Stream Transformerを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:32:18 GMT)
360BEV: Panoramic Semantic Mapping for Indoor Bird's-Eye View [25.4] 狭い視野(FoV)を単独で使用する場合、鳥眼視(BEV)の知覚は制限される。
360BEVタスクは、トップダウンビューで室内シーンの全体的表現を実現するために、初めて確立された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:01:02 GMT)
The Alberta Plan for AI Research [25.3] アルバータ計画(Alberta Plan)は、アルバータの我々の研究グループや、世界中を意識している人たちによって追求されている。
私たちはこの追撃に参加するすべての人を歓迎します。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:20:47 GMT)
Understanding the Diffusion Objective as a Weighted Integral of ELBOs [24.7] 現在、拡散モデルは、サンプルの品質の点でより良い結果のため、一様でない重み付けで最適化されている。
重み付き損失はELBOの重み付き積分として記述できることを示す。
重み関数が単調であれば、重み付き損失は可能性に基づく目的である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:23:51 GMT)
Continual Learning in the Presence of Spurious Correlation [24.0] 標準的な連続学習アルゴリズムは、前も後ろも、あるタスクから別のタスクへバイアスを転送できることを示す。
グループクラスバランスグレーディサンプリング (Group-class Balanced Greedy Sampling, BGS) と呼ばれる,デバイアス対応連続学習のためのプラグイン手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:06:12 GMT)
Learning and controlling the source-filter representation of speech with
a variational autoencoder [23.1] 音声処理において、音源フィルタモデルは、音声信号はいくつかの独立的かつ物理的に有意な連続潜伏因子から生成されるとみなす。
本稿では,潜在部分空間内の音源-フィルタ音声要素を高精度かつ独立に制御する手法を提案する。
テキストや人ラベルデータなどの追加情報を必要としないため、音声スペクトログラムの深い生成モデルが得られる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:41:12 GMT)
Improving Deep Dynamics Models for Autonomous Vehicles with Multimodal
Latent Mapping of Surfaces [23.0] そこで本稿では,潜伏変数ベクトルに条件付けすることで表面認識力学モデルを学ぶ新しい手法を提案する。
潜時マッパーは、複数のモードからの推論中にこれらの潜時変数を更新するように訓練される。
このモデルを用いることで、様々な面および困難面において駆動性能を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:21:31 GMT)
UKnow: A Unified Knowledge Protocol for Common-Sense Reasoning and
Vision-Language Pre-training [23.0] この研究はUKnowと呼ばれる統一知識プロトコルを提示し、データの観点から知識に基づく研究を促進する。
データ知識は、インイメージ、インテキスト、クロスイメージ、クロステキスト、イメージテキストの5つのタイプに分類される。
UKnowプロトコルに従って、我々は、大規模なマルチモーダル知識グラフデータセットである、公開国際ニュースから収集する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:33:56 GMT)
Leveraging Inpainting for Single-Image Shadow Removal [22.6] 本研究では,画像インペイントデータセットにおける影除去ネットワークの事前学習により,影の残差を著しく低減できることを示す。
単純エンコーダ・デコーダネットワークは、10%のシャドウとシャドウフリーの画像ペアで、最先端の手法で競合する復元品質を得る。
これらの観測から着想を得て,影の除去と画像の塗装を両立させる適応融合タスクとして,影の除去を定式化する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:37:15 GMT)
MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient
Neural Field Rendering on Mobile Architectures [22.6] レージアンス・フィールズ(NeRF)は、新しい視点から3Dシーンの画像を合成する素晴らしい能力を実証した。
広くデプロイされたグラフィックスハードウェアの能力にマッチしない、レイマーチングに基づく特殊なレンダリングアルゴリズムに依存している。
本稿では,テクスチャ化されたポリゴンをベースとした新しいNeRF表現を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:05:37 GMT)
3D Video Loops from Asynchronous Input [22.5] ループ動画は短いビデオクリップで、目に見えるシームやアーティファクトを使わずに無限にループできる。
本稿では,動的3次元ループシーンにおける没入型体験を実現するための実用的なソリューションを提案する。
このフレームワークの実験では,モバイルデバイス上でもリアルタイムに3Dループビデオの生成とレンダリングを成功させる可能性が示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:01:23 GMT)
DocRED-FE: A Document-Level Fine-Grained Entity And Relation Extraction
Dataset [22.5] 文書レベルのきめ細かいJEREデータセットDocRED-FEを構築した。
具体的には、11の粗粒度型と119の細粒度型を含む階層的なエンティティ型スキーマを使用して、DocREDを手動で再アノテーションします。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:03:14 GMT)
Efficient and Feasible Robotic Assembly Sequence Planning via Graph
Representation Learning [22.4] 本稿では,製品集合体に対するアセンブリグラフと呼ばれるグラフ表現を含む総合的なグラフィカルアプローチを提案する。
GRACEを用いて、グラフ入力から意味のある情報を抽出し、ステップバイステップでアセンブリシーケンスを予測する。
実験では,アルミニウムプロファイルの積変種にまたがって,本手法が実現可能なアセンブリシーケンスを予測可能であることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:58:19 GMT)
Efficient Feature Distillation for Zero-shot Detection [22.2] ゼロショット検出(EZSD)のための効率的な特徴蒸留法を提案する。
EZSDはCLIPの機能空間をターゲット検出ドメインに適応させ、CLIPを再正規化し、ドメインギャップを埋める。
EZSDは、COCOゼロショットベンチマークにおいて、より短いトレーニングスケジュールで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:02:36 GMT)
OTJR: Optimal Transport Meets Optimal Jacobian Regularization for
Adversarial Robustness [22.0] 頑健な分類器の学習を改善するために、2つのよく知られた防御法、すなわち、対人訓練(AT)とヤコビ正規化(Jacobian regularization)が採用されている。
我々は,入力出力ジャコビアン正則化をATに組み込んだOTJRと呼ばれるジャコビアン正則化手法を新たに提案する。
本実験は,ジャコビアン正規化をATに組み込んだ提案手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:22:59 GMT)
Efficiently Explaining CSPs with Unsatisfiable Subset Optimization
(extended algorithms and examples) [22.0] 我々は,制約満足度問題の解法を段階的に説明する手法を最近提案した。
ここでは、コスト関数を用いて単純さを定量化する単純な推論ステップの列を説明する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:03:36 GMT)
TMA: Temporal Motion Aggregation for Event-based Optical Flow [21.7] イベントカメラは、時間分解能の高いオブジェクトの連続的かつ詳細な軌跡を記録できる。
既存の学習に基づくイベント光フロー推定手法は、イベントデータの時間的連続性を無視する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:51:31 GMT)
Liveness score-based regression neural networks for face anti-spoofing [21.5] 従来のアンチ・スプーフィング手法では擬似マップやユーザ定義ラベルが用いられていた。
本稿では,サードパーティネットワークやユーザへの依存を克服するための,実効性スコアに基づく回帰ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:14:41 GMT)
Learning a 3D Morphable Face Reflectance Model from Low-cost Data [21.4] 既存の作業では、Light Stageデータを使用して拡散とスペクトルアルベドのためのパラメトリックモデルを構築している。
本稿では,低コストで利用可能なデータのみを用いた空間変化BRDFを用いた最初の3次元顔反射モデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:08:30 GMT)
PartNeRF: Generating Part-Aware Editable 3D Shapes without 3D
Supervision [21.2] PartNeRFは、編集可能な3D形状合成のための部分認識生成モデルであり、明示的な3D監督を必要としない。
我々のモデルは、アフィン変換で拡張された局所的に定義されたNeRFの集合としてオブジェクトを生成する。
これにより、パーツへの変換の適用、異なるオブジェクトからのパーツの混合など、いくつかの編集操作が可能になる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:09:25 GMT)
Indeterminate Probability Neural Network [21.0] 本稿では,古典的確率論の拡張である新しい一般確率論を提案する。
提案するニューラルネットワークフレームワークでは,ニューラルネットワークの出力を確率事象として定義する。
例えば、100の出力ノードを持つモデルでは、100億のカテゴリを分類できる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:57:40 GMT)
Modeling Relational Patterns for Logical Query Answering over Knowledge
Graphs [20.9] そこで我々は,複雑な空間における回転により,クエリ領域を幾何学的円錐と代数的クエリ演算子として定義する新しいクエリ埋め込み手法RoConEを開発した。
いくつかのベンチマークデータセットに対する実験結果から,論理的問合せ処理の強化のための関係パターンの利点が確認された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:59:15 GMT)
Logical Reasoning over Natural Language as Knowledge Representation: A
Survey [20.9] 本稿では、自然言語を知識表現として利用する論理的推論の新しいパラダイムと、推論として事前学習された言語モデルについて概説する。
この新たなパラダイムは、形式表現の多くの課題を軽減するだけでなく、エンドツーエンドのニューラルメソッドよりもアドバンテージを持つため、有望である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:56:05 GMT)
Hierarchical Knowledge Guided Learning for Real-world Retinal Diseases
Recognition [20.9] 眼科AIで最近発表されたいくつかのデータセットは、40種類以上の網膜疾患からなり、複雑な異常と様々な致死性がある。
モデリングの観点からは、これらのデータセットでトレーニングされたほとんどのディープラーニングモデルは、まれな疾患に一般化する能力に欠ける可能性がある。
本稿では,網膜疾患認識のための長期データベースから深部ニューラルネットワークを学習するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:07:43 GMT)
Boosting Verified Training for Robust Image Classifications via
Abstraction [20.7] 本稿では,ロバストな画像分類器のための新しい,抽象的,認証されたトレーニング手法を提案する。
間隔のトレーニングにより、同じ間隔にマッピングされた全ての摂動画像を同じラベルに分類する。
また,この学習手法により,健全かつ完全なブラックボックス検証手法が実現される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:38:14 GMT)
CoReS: Compatible Representations via Stationarity [20.6] 本稿では,従来学習されていた特徴表現モデルとテキスト互換な内部特徴表現モデルを学習するための新しい手法を提案する。
定常性(CoReS)によるコンパチブル表現(Compatible Representations)と呼ばれる我々の手法は、学習された表現モデルに定常性を促すことによって、互換性を実現する。
提案手法は,互換性のある機能を実現するための最先端の手法を,大きなマージンで改善することを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:36:35 GMT)
Subspace Perturbation Analysis for Data-Driven Radar Target Localization [20.3] 我々は、サブスペース分析を用いて、ミスマッチしたシナリオ間でレーダーターゲットのローカライゼーション精度をベンチマークする。
ミスマッチした制約領域に変動強度のターゲットをランダムに配置することで、包括的データセットを生成する。
畳み込みニューラルネットワークを用いて,これらの熱マップテンソルからターゲット位置を推定する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:24:53 GMT)
Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D
Object Detection [20.2] マルチビュー3Dオブジェクト検出のための長周期モデリングフレームワークStreamPETRを提案する。
StreamPETRは、単一フレームのベースラインと比較して、無視可能なコストでのみ、大幅なパフォーマンス向上を実現している。
軽量版は45.0%のmAPと31.7のFPSを実現し、2.3%のmAPと1.8倍の高速FPSを達成している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:19:20 GMT)
Detecting the open-world objects with the help of the Brain [20.0] Open World Object Detection (OWOD) は、新しいコンピュータビジョンタスクである。
OWODアルゴリズムは、目に見えない、未知のオブジェクトを検出し、それを漸進的に学習することが期待されている。
我々は、未知のラベルを単に生成することで、VLをオープンワールド検出器のBrain'として活用することを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:44:02 GMT)
Maximum margin learning of t-SPNs for cell classification with filtered
input [19.7] t-SPNアーキテクチャはマージンを最大化することで学習される。
L2-regularization (REG) は学習過程における最大限界(MM)基準とともに検討される。
HEp-2 と Feulgen のベンチマークデータセットでは,正則化による最大マルジン基準に基づいて t-SPN アーキテクチャを学習した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:15:48 GMT)
SVCNet: Scribble-based Video Colorization Network with Temporal
Aggregation [19.6] SVCNetは、異なるユーザ生成カラースクリブルに基づいてモノクロビデオをカラー化することができる。
カラー化の鮮明さ、時間的一貫性、色出血という、スクリブルベースのビデオカラー化領域における3つの一般的な問題に対処する。
実験の結果,SVCNetは高画質かつ時間的に一貫したビデオを生成することがわかった。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:42:39 GMT)
Whose Emotion Matters? Speaking Activity Localisation without Prior
Knowledge [19.5] 固定音声情報を用いたMELD(MELD-FAIR)について紹介する。
我々はMELDで提供される発話の96.92%で話者の表情を捉えた。
自己教師付き音声認識モデルを用いた実験では、再構成されたMELD-FAIRビデオは、転写された発話とより密に一致していることが示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:19:03 GMT)
One-to-Few Label Assignment for End-to-End Dense Detection [19.5] 1対1(o2o)ラベル割り当ては、トランスフォーマーベースのエンドツーエンド検出において重要な役割を果たす。
エンドツーエンドの高密度検出のための単純な1対1 (o2f) ラベル割り当て戦略を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:24:47 GMT)
Information-containing Adversarial Perturbation for Combating Facial
Manipulation Systems [19.3] ディープラーニングシステムの悪意ある応用は個人のプライバシーと評判に深刻な脅威をもたらす。
IAP(Information- containing Adversarial Perturbation)と呼ばれる新しい2層保護手法を提案する。
エンコーダを用いて、顔画像とその識別メッセージを、複数の顔操作システムを妨害できるクロスモデル対向例にマッピングする。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:48:14 GMT)
Text2Room: Extracting Textured 3D Meshes from 2D Text-to-Image Models [19.1] 入力としてテキストプロンプトからルームスケールのテクスチャ化された3Dメッシュを生成する方法であるText2Roomを提案する。
我々は、事前訓練された2次元テキスト・画像モデルを利用して、異なるポーズから画像列を合成する。
これらの出力を一貫した3次元シーン表現に引き上げるために、単眼深度推定とテキスト条件のインペイントモデルを組み合わせる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:21:02 GMT)
DeSTSeg: Segmentation Guided Denoising Student-Teacher for Anomaly
Detection [19.0] 本稿では,教師ネットワーク,学生エンコーダ・デコーダ,セグメンテーションネットワークを1つのフレームワークに統合したDeSTSegと呼ばれる改良モデルを提案する。
画像レベルのAUCは98.6%,画素レベルの平均精度は75.8%,インスタンスレベルの平均精度は76.4%である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:18:20 GMT)
Uncertainty-Aware Optimal Transport for Semantically Coherent
Out-of-Distribution Detection [18.6] SCOOD(Semantically coherent out-of-distribution)検出は、ラベルなしの余分な集合にアクセスして、意図したデータ分布からアウトリーチを識別することを目的としている。
分布内および分布外サンプルの共存は、区別されない場合の過剰適合を悪化させる。
提案手法は,セマンティックな表現の割り当てを促進するため,不確実性の変動コストを推定するエネルギーベース輸送機構から構成される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:41:03 GMT)
Compute-Efficient Deep Learning: Algorithmic Trends and Opportunities [18.5] ニューラルネットワークのトレーニングの経済的および環境的コストは、持続不可能になりつつある。
*アルゴリズム的に効率のよいディープラーニングの研究*は、トレーニングプログラムの意味論の変化を通じて、トレーニングコストを削減しようとしている。
アルゴリズム的に効率的な学習の基本的な構成要素を用いて分類学を開発する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:24:01 GMT)
VectorMapNet: End-to-end Vectorized HD Map Learning [18.5] 本稿では,VectorMapNetと呼ばれるエンドツーエンドのベクトル化HDマップ学習パイプラインを紹介する。
このパイプラインは、地図要素間の空間関係を明示的にモデル化し、ベクトル化された地図を生成する。
VectorMapNetはnuScenesとArgoverse2データセットの両方で強力なマップ学習性能を実現する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:38:27 GMT)
Robust Model-based Face Reconstruction through Weakly-Supervised Outlier
Segmentation [18.4] フェース・オートエンコーダとアウター・セグメンテーション・アプローチ(FOCUS)を導入する。
フェースモデルでは外周がうまく収まらないため、高品質なモデルフィッティングを前提として、局所化が可能であるという事実を生かしている。
特に, フェースモデルでは外周がうまく収まらないため, 高品質なモデルフィッティングを前提として, 局所化が可能であるという事実を生かしている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:25:02 GMT)
Secure Aggregation in Federated Learning is not Private: Leaking User
Data at Large Scale through Model Modification [18.3] 私たちは、大量のクライアントデータを直接リークする以前の制限を克服する攻撃であるMANDRAKEを紹介します。
多くのクライアントに集約することで、以前の作業は1%未満の画像しかリークできなかった。
同じ数の非ゼロパラメータを持ち、単一のトレーニングイテレーションのみを使用して、MANDRAKEは70~80%のデータサンプルをリークする。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 23:29:35 GMT)
PRISE: Demystifying Deep Lucas-Kanade with Strongly Star-Convex
Constraints for Multimodel Image Alignment [18.3] ルーカス・カナーデ法(英語版)(LK)は、画像の古典的反復的ホモグラフィー推定アルゴリズムであるが、画像対に歪みがある場合、特に局所的最適性に悩まされることが多い。
本稿では、画像最適化のための新しいDeep Star-Convexified Lucas-Kanade(RISE)法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:19:35 GMT)
Projections of Model Spaces for Latent Graph Inference [18.2] グラフニューラルネットワークは、グラフの接続構造を帰納バイアスとして利用する。
潜在グラフ推論は、適切なグラフ構造を学習して、モデルの下流のパフォーマンスを拡散し改善することに焦点を当てる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:20:22 GMT)
On Penalty-based Bilevel Gradient Descent Method [18.2] 我々はペナルティ法のレンズを通して二段階問題に取り組む。
ペナルティに基づく二段階勾配勾配法(PBGD)アルゴリズムを提案する。
実験では提案したPBGDアルゴリズムの有効性を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:25:54 GMT)
NeAT: Learning Neural Implicit Surfaces with Arbitrary Topologies from
Multi-view Images [17.6] NeATは、多視点画像から任意のトポロジを持つ暗黙の曲面を学習する、新しいニューラルネットワークレンダリングフレームワークである。
NeATは、古典的なマーチングキューブアルゴリズムを用いて、フィールドからメッシュへの変換を容易にする。
我々のアプローチは、水密面と非水密面の両方を忠実に再構築することができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:49:41 GMT)
Self-Paced Neutral Expression-Disentangled Learning for Facial
Expression Recognition [17.4] 中立表現において中立情報を利用するモデルを提案する。
類似表現間の異種情報をキャプチャすることができる。
3つの人気データベースの実験は、その有効性を示している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:34:12 GMT)
SignCRF: Scalable Channel-agnostic Data-driven Radio Authentication
System [17.4] RFFDL(Radio Frequency Fingerprinting through Deep Learning)は、データ駆動型IoT認証技術である。
提案されているSignCRFは、スケーラブルで、チャネルに依存しない、データ駆動の無線認証プラットフォームである。
SignCRFは,WiFiおよびLoRaデバイスの認証精度を最大5倍,8倍向上させることで,RFFDLの性能を著しく向上することを示した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:11:02 GMT)
Assessor-Guided Learning for Continual Environments [17.2] 本稿では,継続的学習のための評価者指導型学習戦略を提案する。
評価者は、学習過程の方向とペースを制御することにより、基礎学習者の学習過程を案内する。
評価器はメタ学習方式でメタオブジェクトを用いて訓練され、ベース学習者の学習プロセスが促進される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:45:14 GMT)
Efficient Decision-based Black-box Patch Attacks on Video Recognition [17.2] この研究はまず、意思決定に基づくビデオモデルに対するパッチ攻撃について検討する。
問合せ効率の高い攻撃を実現するために,時空間差分進化フレームワークを提案する。
STDEは、脅威、効率、非受容性の点で最先端のパフォーマンスを実証している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:08:35 GMT)
LIMITR: Leveraging Local Information for Medical Image-Text
Representation [17.1] 胸部X線画像とそれに対応する放射線学的報告に焦点を当てた。
共同X線画像とレポート表現を学習する新しいモデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:20:34 GMT)
MulGT: Multi-task Graph-Transformer with Task-aware Knowledge Injection
and Domain Knowledge-driven Pooling for Whole Slide Image Analysis [17.1] 深層学習領域における自動診断を支援するためにWSI(Whole Slide Image)が広く用いられている。
特殊設計したグラフ変換器によるWSI解析のための新しいマルチタスクフレームワーク(MulGT)を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:10:33 GMT)
A Review on Machine Theory of Mind [17.0] 心の理論(りょうがく、英: Theory of Mind、ToM)とは、人間の認知の基盤である他者に対する精神状態の属性付け能力である。
本稿では,機械ToMにおける信念,欲求,意図に関する最近の進歩を概観する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:58:47 GMT)
I Can't Believe There's No Images! Learning Visual Tasks Using only
Language Data [16.8] 本稿では,テキストデータからこれらのスキルを学習し,視覚データを訓練することなく視覚タスクに伝達できるかどうかを問う。
我々のアプローチの鍵は、対照的に訓練された視覚と言語エンコーダの結合埋め込み空間を活用することである。
我々は、画像キャプション、視覚的エンターテイメント、視覚的質問応答、視覚的ニュースの4つのタスクに関するテキストトレーニングデータのみを用いて、モデルを作成し、それらを画像を用いた標準ベンチマークで評価する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:54:55 GMT)
BigSmall: Efficient Multi-Task Learning for Disparate Spatial and
Temporal Physiological Measurements [16.7] 生理・行動計測のための効率的なアーキテクチャであるBigSmallを提案する。
本稿では,時間シフトモジュールをラップしたマルチブランチネットワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:41:57 GMT)
Understand Legal Documents with Contextualized Large Language Models [16.4] 本稿では,SemEval-2023タスク6について,法的テキストの理解について述べる。
我々はまず,文内および文間両方の包括的文脈情報を考慮した法-BERT-HSLNモデルを開発した。
次に、法的なエンティティを認識するために、法的なコンテキスト化とエンティティ認識を備えた法的なLUKEモデルをトレーニングする。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:48:11 GMT)
Visual Representation Learning from Unlabeled Video using Contrastive
Masked Autoencoders [16.4] Masked Autoencoders (MAEs) は入力画像パッチと再構成損失をランダムにマスキングすることで自己教師付き表現を学習する。
そこで本稿では,MAEとコントラスト学習を組み合わせた一般的な手法であるViC-MAEを提案する。
ViC-MAEで学習した視覚表現は,映像分類タスクと画像分類タスクの両方によく当てはまることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:33:40 GMT)
BoPR: Body-aware Part Regressor for Human Shape and Pose Estimation [16.4] 提案手法であるBoPR(Body-Aware Part Regressor)は,まず注意誘導機構を用いて身体と部分の両方の特徴を抽出する。
次に、これらの機能を使用して、部分単位のレグレッションに余分な部分ボディ依存性をエンコードします。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:36:59 GMT)
A High-Frequency Focused Network for Lightweight Single Image
Super-Resolution [16.3] 高周波の詳細は低周波情報よりも再構成が難しい。
ほとんどのSISRモデルは、低周波および高周波情報に等しい計算資源を割り当てる。
高周波情報を選択的に強化するHFFN(High-Frequency Focused Network)を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:41:13 GMT)
Coarse-to-Fine Active Segmentation of Interactable Parts in Real Scene
Images [16.3] 屋内シーンのRGB画像から対話可能な動的部分の高精度なインスタンスセグメンテーションのための,最初のアクティブラーニングフレームワークを提案する。
提案手法は実画像上での完全精度(96%以上)のセグメンテーション結果に近づき,手作業よりも77%の時間を節約できる。
最終的に、2,550枚の実際の写真と注釈付き対話可能なパーツのデータセットをコントリビュートし、現在のベストな代替品よりも優れた品質と多様性を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:30:20 GMT)
Motion Planning for Autonomous Driving: The State of the Art and
Perspectives [16.2] 本稿では,パイプライン計画やエンドツーエンド計画など,最先端の計画手法の見直しを目的とする。
パイプラインの手法については,拡張と最適化のメカニズムに関する議論とともに,アルゴリズムの選択について調査する。
実験用プラットフォームをレビューし、読者が適切なトレーニングと検証方法を選択できるようにする。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:48:19 GMT)
Learning a Depth Covariance Function [16.1] 入力としてRGB画像が与えられると、共分散関数は深度関数の事前を定義するために柔軟に使用できる。
我々は,これらの手法を,深度補正,バンドル調整,モノクローナル高密度視覚計測といった下流タスクの選択に活用する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:34:20 GMT)
Is Prompt All You Need? No. A Comprehensive and Broader View of
Instruction Learning [16.1] タスクのセマンティクスは入力から出力までの例のセットやテキストによる命令で表現できる。
コミュニティは、NLPの新しい監視-探索パラダイム、すなわちタスク命令から学ぶことに、ますます関心を払っている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:27:16 GMT)
Style Miner: Find Significant and Stable Explanatory Factors in Time
Series with Constrained Reinforcement Learning [15.9] 高次元時系列解析では、観測変数の変化を説明する重要な要素のセットを持つことが不可欠である。
本稿では,スタイルファクタを生成する強化学習手法であるStyle Minerを提案する。
実世界の金融データセットの実験は、Style Minerが既存の学習ベースの手法より優れていることを示している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:08:42 GMT)
LidarMultiNet: Towards a Unified Multi-Task Network for LiDAR Perception [15.8] LidarMultiNetは、LiDARベースのマルチタスクネットワークで、3Dオブジェクトの検出、セマンティックセグメンテーション、およびパノプティックセグメンテーションを統合する。
LidarMultiNetの中核には、Global Context Pooling (GCP)モジュールを備えた強力な3Dボクセルベースのエンコーダデコーダアーキテクチャがある。
LidarMultiNetはOpenデータセットとnuScenesデータセットの両方で広くテストされている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:30:25 GMT)
LiDARFormer: A Unified Transformer-based Multi-task Network for LiDAR
Perception [15.8] 変換器に基づく新しいLiDARマルチタスク学習パラダイムを提案する。
LiDARFormerはクロスタスクのシナジーを利用して、LiDAR知覚タスクのパフォーマンスを向上させる。
LiDARFormerは3D検出とセマンティックセグメンテーションの両方のために、大規模なnuScenesとOpenデータセットで評価されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:52:02 GMT)
Dexterity from Touch: Self-Supervised Pre-Training of Tactile
Representations with Robotic Play [15.8] T-Dexは、触覚に基づくデキスタリティの新しいアプローチで、2つのフェーズで動作する。
第1フェーズでは、2.5時間のプレイデータを収集し、自動教師付き触覚エンコーダの訓練に使用する。
第2段階では, 触覚観察と視覚的観察を組み合わせた非パラメトリックな政策を学習する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:59:20 GMT)
Robust Table Structure Recognition with Dynamic Queries Enhanced
Detection Transformer [15.7] 本稿では,TSRFormerと呼ばれる新しいテーブル構造認識手法を提案する。
これらの新しい手法により、我々のTSRFormerは、SciTSR、PubTabNet、WTW、FinTabNetなど、いくつかのベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:20:49 GMT)
Semi-supervised Semantics-guided Adversarial Training for Trajectory
Prediction [15.7] 軌道予測に対する敵対的な攻撃は、将来の軌道予測を誤解させ、安全でない計画を引き起こす可能性がある。
本稿では,軌道予測のための新しい逆学習法を提案する。
本手法は、敵攻撃の影響を最大73%軽減し、他の一般的な防御方法より優れる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:55:06 GMT)
Neural Message Passing for Objective-Based Uncertainty Quantification
and Optimal Experimental Design [15.7] データ駆動型アプローチに基づくMOCUによる客観的UQの計算コスト削減手法を提案する。
提案手法は,MOCUをベースとしたOEDを4~5桁の精度で高速化できることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:09:33 GMT)
Simple and Fast Polarization Tracking algorithm for Continuous-Variable
Quantum Key Distribution System Using Orthogonal Pilot Tone [15.6] 実験の結果, 偏光衝突速度12.57krad/sは, 提案アルゴリズムを用いて追跡可能であることがわかった。
デジタルシミュレーションにより、提案したアルゴリズムによって約188.50Mrad/sを追跡できることが示されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:37:13 GMT)
From Understanding Genetic Drift to a Smart-Restart Mechanism for
Estimation-of-Distribution Algorithms [15.6] 我々は,分布推定アルゴリズム(EDAs)のためのスマートリスタート機構を開発する。
遺伝的ドリフトのリスクが高い場合、実行を停止することで、適切なパラメーター条件下でEDAを自動的に実行します。
スマートリスタート機構は,文献で示唆されるものよりも,集団サイズに対してはるかに優れた値を見出すことを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:19:37 GMT)
ElasticViT: Conflict-aware Supernet Training for Deploying Fast Vision
Transformer on Diverse Mobile Devices [15.5] 非常に大きな検索空間上で高品質なViTスーパーネットをトレーニングする2段階NASアプローチであるElasticViTを提案する。
本稿では,複雑性を意識したサンプリングと性能を意識したサンプリングという2つの新しいサンプリング手法を提案する。
我々のモデルは、ImageNetの67.2%から80.0%までのトップ1の精度を6000万から800万のFLOPから、余分なリトレーニングなしで達成している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:11:01 GMT)
DNG: Taxonomy Expansion by Exploring the Intrinsic Directed Structure on
Non-gaussian Space [15.5] 本稿では,各ノードを継承特徴(構造部分)と拡張特徴(補足部分)の組み合わせとして明示的に記述する。
Darmois-Skitovich Theorem に触発されて、補足的特徴に対する非ガウス的制約により、この可逆性を実装した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:28:02 GMT)
ALOFT: A Lightweight MLP-like Architecture with Dynamic Low-frequency
Transform for Domain Generalization [15.1] ドメイン・ドメイン(DG)は、再トレーニングすることなく、複数のソース・ドメインを利用する未確認のターゲット・ドメインに適切に一般化するモデルを学ぶことを目的としています。
既存のDG作品の多くは畳み込みニューラルネットワーク(CNN)に基づいている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:36:34 GMT)
Merak: An Efficient Distributed DNN Training Framework with Automated 3D
Parallelism for Giant Foundation Models [14.9] 資源利用率の高い3次元並列化ディープラーニング学習フレームワークであるMerakを提案する。
Merakは、モデルのプロキシ表現にグラフシャーディングアルゴリズムを使用する自動モデルパーティショナで自動的にデプロイする。
Merakは1.5、2.5、8.3、200億のパラメータを持つモデルの最先端の3D並列化フレームワークをそれぞれ1.42X、1.39X、1.43X、1.61Xまで高速化することができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:05:16 GMT)
Recent Progress in Transformer-based Medical Image Analysis [14.7] 変換器は主に自然言語処理の分野で使われている。
コンピュータビジョン(CV)分野において採用され、将来性を示す。
医療画像解析(MIA)はCVの重要な分野であり、この最先端技術から大きな恩恵を受けている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:54:36 GMT)
MXM-CLR: A Unified Framework for Contrastive Learning of Multifold
Cross-Modal Representations [14.4] マルチフォールド・クロスモーダル表現のコントラスト学習のための統合フレームワークMXM-CLRを提案する。
XM-CLRは、異なるモードからインスタンスの多重折りたたみ観測の関係を明示的にモデル化し、学習する。
その結果,マルチフォールドデータの表現性を向上させる上で,MXM-CLRの優位性が示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:37:37 GMT)
Bandits Corrupted by Nature: Lower Bounds on Regret and Robust
Optimistic Algorithm [14.2] 破損したバンドイット問題、すなわち、$k$未知の報酬分布を持つ多重武装バンドイット問題について検討する。
本稿では,ハマー推定器上に構築した,破損した盗賊に対する新しいUPB型アルゴリズムを提案する。
異なる報酬分布と異なるレベルの汚職に対する腐敗した包帯の解法におけるHubUCBとSeqHubUCBの有効性を実験的に説明した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:04:25 GMT)
Experimental Phase-Matching Quantum Key Distribution without Intensity
Modulation [14.1] 強度変調のない位相整合量子鍵分布プロトコルを提案する。
シミュレーションの結果,プロトコルの伝送距離は270kmに達する可能性が示唆された。
我々のプロトコルは量子ネットワーク構築に有望なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:32:01 GMT)
NEMTO: Neural Environment Matting for Novel View and Relighting
Synthesis of Transparent Objects [14.1] 我々は3次元透明物体をモデル化する最初のエンドツーエンドニューラルネットワークパイプラインであるNEMTOを提案する。
透明物体の2次元像を入力として, 高品質な新規ビューと光合成が可能となる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:50:08 GMT)
STDLens: Model Hijacking-resilient Federated Learning for Object
Detection [13.9] Federated Learning (FL)は、ディープラーニングに基づくオブジェクト検出モデルをクライアントの分散集団でトレーニングするための協調学習フレームワークとして人気を集めている。
その利点にもかかわらず、FLはモデルハイジャックに弱い。
本稿では,このような攻撃に対してFLを保護するための原則的アプローチであるSTDLensを紹介する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:15:53 GMT)
Wearing Masks Implies Refuting Trump?: Towards Target-specific User
Stance Prediction across Events in COVID-19 and US Election 2020 [13.5] 議論の的となっている話題に関して同様の意見を共有する人々は、同意見の場を形成し、他のトピックについても同様の政治的見解を共有することができる。
私たちがコネクテッドな行動と呼ぶこのようなつながりの存在は、過去の行動を考えると、将来の出来事に対してどのように振る舞うかを予測するユニークな機会を与えます。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:14:04 GMT)
Performance-aware Approximation of Global Channel Pruning for Multitask
CNNs [13.4] グローバルチャネルプルーニング(GCP)は、異なるレイヤにわたるチャネル(フィルタ)のサブセットを、パフォーマンスを損なうことなく、ディープモデルから削除することを目的としている。
本稿では,PAGCP(Performance-Aware Global Channel Pruning)フレームワークを提案する。
複数のマルチタスクデータセットの実験により、提案されたPAGCPは、小さなパフォーマンス低下を伴ってFLOPとパラメータを60%以上削減できることが示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:15:21 GMT)
Neural Pre-Processing: A Learning Framework for End-to-end Brain MRI
Pre-processing [13.2] 頭部MRI前処理では、標準座標空間内の強度正規化され頭蓋骨が張られた脳に生画像が変換される。
ニューラルネットワークを介して3つのサブタスクを同時に解くために,NPP(Neural Pre-processing)と呼ばれる,エンドツーエンドの教師付き学習手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:10:21 GMT)
Task-based Generation of Optimized Projection Sets using Differentiable
Ranking [13.2] このアプローチは、プロジェクションベースの検出性とデータ完全性という2つの重要な要素を、単一のフィードフォワードニューラルネットワークに統合する。
ネットワークはプロジェクションの価値を評価し、それらを微分可能なランク関数で処理し、ストレートスルー推定器を用いて最終選択を行う。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:29:30 GMT)
Calibration Matters: Tackling Maximization Bias in Large-scale
Advertising Recommendation Systems [13.1] キャリブレーションの最適化は多くのオンライン広告レコメンデーションシステムに不可欠です
その重要性にもかかわらず、キャリブレーション最適化はしばしば「最大化バイアス」と呼ばれる問題に悩まされる。
本稿では,この問題を緩和する分散調整メタアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:00:59 GMT)
Novel Class Discovery for 3D Point Cloud Semantic Segmentation [13.0] セマンティックセグメンテーションのための新しいクラス発見(NCD)は、ラベル付き(ベース)クラスからの監督のみを使用して、未ラベル(ノーベル)クラスをセグメンテーションできるモデルを学ぶタスクである。
本論文は,ポイントクラウドデータ解析技術の現状を4方向に進めるものである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:10:39 GMT)
Manipulating Transfer Learning for Property Inference [12.8] 転送学習は、異なる下流タスクのために事前訓練された(上流)モデルをチューニングする一般的な方法である。
本研究では,トランスファー学習に使用される上流モデルを制御する敵が,被害者の調整した下流モデルに対して特性推論攻撃を行う方法について検討する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:32:32 GMT)
E-MLB: Multilevel Benchmark for Event-Based Camera Denoising [12.7] イベントカメラは、差動信号を出力する際に、ジャンクションリーク電流と光電流に敏感である。
大規模イベント復号化データセット(イベント復号化のためのマルチレベルベンチマーク、E-MLB)を初めて構築する。
また、与えられた事象の構造強度を測定する最初の非参照事象認知尺度であるイベント構造比(ESR)を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:31:53 GMT)
DG-Trans: Dual-level Graph Transformer for Spatiotemporal Incident
Impact Prediction on Traffic Networks [12.6] 本稿では,新しい交通事故影響予測フレームワークであるDG-Transを提案する。
動的グラフ学習を通じて、トラフィックインシデントの影響を予測します。
交通事故管理システムに有望な可能性を秘めている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 23:44:09 GMT)
PhyGNNet: Solving spatiotemporal PDEs with Physics-informed Graph Neural
Network [12.4] 本稿では,グラフニューラルネットワークの基本値から偏微分方程式を解くためのPhyGNNetを提案する。
特に、計算領域を正規グリッドに分割し、グリッド上の偏微分演算子を定義し、PhyGNNetモデルを構築する最適化のためにネットワークのpde損失を構築する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 05:28:26 GMT)
End-to-End Integration of Speech Separation and Voice Activity Detection
for Low-Latency Diarization of Telephone Conversations [12.3] 音声分離誘導ダイアリゼーション(SSGD)は、まず話者を分離し、各分離ストリームに音声活動検出(VAD)を適用することでダイアリゼーションを行う。
3つの最先端音声分離(SSep)アルゴリズムを検討し,その性能をオンラインおよびオフラインのシナリオで検討する。
我々は,CALLHOMEの8.8%のDORを実現し,現在の最先端のニューラルダイアリゼーションモデルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:33:56 GMT)
Towards Models that Can See and Read [12.1] Visual Question Answering (VQA) と Image Captioning (CAP) は、画像中のテキストからの推論を必要とする類似のシーンテキストバージョンである。
We propose UniTNT, an Unified Text-Non-Text approach, which allows existing multimodal scene-text understanding capabilities。
シーンテキスト理解機能により、一般的なVQAおよびCAPにおける視覚言語モデルの性能が最大2.69%向上し、0.6CIDEr向上することを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:40:47 GMT)
Stall Number Detection of Cow Teats Key Frames [11.8] このデータセットは、1042のトレーニングイメージと、0から60までのストール番号を持つ261のテストイメージを含む。
実験結果は、停止数認識における92%の精度と、停止数位置予測における40.1%のIoUスコアを達成する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:54:10 GMT)
Absence of operator growth for average equal-time observables in
charge-conserved sectors of the Sachdev-Ye-Kitaev model [11.4] 量子スクランブルは閉量子系における熱化を理解する上で重要な役割を果たす。
観測対象物の乱れ平均予測値にはスクランブルが欠落していることが示される。
等時可観測物の進化を近似する累積展開法を開発した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:48:53 GMT)
Focused and Collaborative Feedback Integration for Interactive Image
Segmentation [11.3] クリック型インタラクティブ画像セグメンテーションのフィードバックをフル活用するために,Focused and Collaborative Feedback Integration (FCFI)を提案する。
FCFIはまず、新しいクリックに関するローカル領域に焦点を当て、ハイレベル機能の類似性に基づいてフィードバックを修正する。
そして、フィードバックと深い機能を交互に共同で更新し、機能にフィードバックを統合する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:24:06 GMT)
Model Robustness Meets Data Privacy: Adversarial Robustness Distillation
without Original Data [11.3] DFARD(Data-Free Adversarial Robustness Distillation)と呼ばれる新しい課題を提案する。
DFARDは、オリジナルのデータに頼ることなく、小さな、簡単にデプロイ可能な、堅牢なモデルをトレーニングしようとしている。
トレーニング目標の定式化と情報内容の不足によるモデル性能の低下が,既存の手法と組み合わせた結果が得られた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:10:47 GMT)
SAMSON: Sharpness-Aware Minimization Scaled by Outlier Normalization for
Improving DNN Generalization and Robustness [11.2] エネルギー効率の高いディープニューラルネットワーク(DNN)アクセラレータは、推論時にパフォーマンスを低下させる非イデオロギーの傾向がある。
既存の手法では、トレーニング中にDNNの重み付けに摂動を加え、ノイズの多いハードウェアでの推論をシミュレートする。
本研究では,損失値と損失シャープネスの両方を最適化することにより,ノイズの多いハードウェアに対する推論時のロバスト性を著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:34:27 GMT)
Is BERT Blind? Exploring the Effect of Vision-and-Language Pretraining
on Visual Language Understanding [11.2] 視覚的・言語的な事前学習が、暗黙的な視覚的推論を含むテキストのみのタスクのパフォーマンスを向上させるかどうかを検討する。
本稿では,テキストエンコーダモデルの視覚的推論能力を探索するための視覚言語理解タスクを提案する。
また,テキストのみのタスクにCLIPなどのモデルを適用するための新しいゼロショット知識探索手法であるStroop Probingも提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:30:40 GMT)
Heterogeneous-Branch Collaborative Learning for Dialogue Generation [11.1] 協調学習は、十分に訓練された大規模な教師モデルが存在しない場合、一段階のグループ蒸留を効果的に行う方法である。
従来の作業は、同じトレーニング目標と独立した同一トレーニングセットのために、深刻な分岐均一性の問題があった。
本稿では, 正の蒸留法と負の蒸留法を組み合わせた二重群式知識蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:41:50 GMT)
ModEFormer: Modality-Preserving Embedding for Audio-Video
Synchronization using Transformers [11.0] 音声/ビデオ同期の欠如は、テレビ放送やビデオ会議においてよくある問題である。
モータリティ特化変換器を用いて音声とビデオの埋め込みを独立に抽出するModEFormerを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:37:46 GMT)
Image Reconstruction without Explicit Priors [11.0] 提案手法では,画像前処理や地中処理を行なわずに,不適切な画像逆問題に対処することを検討する。
低次元の潜在空間を持つ共有画像生成器を学習することにより,そのような逆問題の集合を同時に解くことができることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:35:04 GMT)
Policy Mirror Descent Inherently Explores Action Space [10.8] 1/epsilon2)$tildemathcalO($tildemathcalO)を,探索戦略を使わずに,オンラインポリシグラデーションメソッドのサンプル複雑性を初めて確立しました。
新しいポリシー勾配法は、最適なポリシーを探す際に、潜在的にリスクの高い行動に繰り返しコミットするのを防ぐことができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:50:48 GMT)
Automated deep learning segmentation of high-resolution 7 T ex vivo MRI
for quantitative analysis of structure-pathology correlations in
neurodegenerative diseases [10.7] 7T全体MRIスキャナーでスキャンした生後ヒト脳組織標本37点の高分解能データセットを報告する。
9つのディープニューラルアーキテクチャの性能をベンチマークすることで,皮質マントルをセグメント化するディープラーニングパイプラインを開発した。
また、異なる磁場強度と異なる画像シーケンスで取得した未確認画像についても、脳半球全体にわたって優れた一般化能力を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 23:44:02 GMT)
Addressing Class Variable Imbalance in Federated Semi-supervised
Learning [10.5] 我々は,クラス変数の不均衡を解決するために,FCVI(Federated Semi-supervised Learning for Class Variable Im Balance)を提案する。
FCVIは、クラス数の変化によるデータの不均衡を軽減するために使用される。
クライアントのプライバシを維持しながら,ベースライン方式よりもはるかに優れた手法であることが実証された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:50:17 GMT)
SALAD: Part-Level Latent Diffusion for 3D Shape Generation and
Manipulation [10.5] 部分レベルの暗黙的3次元表現に基づくカスケード拡散モデルを提案する。
提案モデルでは,最先端の生成品質を実現し,条件付き設定での付加的なトレーニングを伴わずに,部分レベルの形状の編集と操作が可能となる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 23:43:58 GMT)
The Multiscale Surface Vision Transformer [10.2] 自己注意は、基礎となるデータの高精細なサンプリングを可能にするために、局所的なメッシュウインドウに適用される。
隣接パッチは順次マージされ、MS-SiTは任意の予測タスクに適した階層表現を学習できる。
以上の結果から,MS-SiTは新生児の表現型予測タスクにおいて,既存の表面深層学習法よりも優れていた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:00:17 GMT)
Data-efficient Large Scale Place Recognition with Graded Similarity
Supervision [10.1] 視覚的位置認識(VPR)はコンピュータビジョンの基本課題である。
既存の方法は、同じ場所を表すか、そうでないイメージペアを使って訓練される。
VPRデータセットを再ラベルするための自動再アノテーション戦略をデプロイする。
コントラストネットワークのトレーニングに,グレード付き類似性ラベルを用いた新しい一般化コントラスト損失(GCL)を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:56:57 GMT)
Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection [10.1] そこで本研究では,粗粒度物体検出器の高精度検出を支援する手法を提案する。
具体的には、粗粒度ラベルを細粒度ラベルに変換するコモンセンス知識推論モジュール(CKIM)を導入する。
実験の結果,提案手法は,精度,モデルサイズ,処理遅延の点で,ベンチマーク検出器よりも優れていた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 05:54:28 GMT)
Fine-Grained Selective Similarity Integration for Drug-Target
Interaction Prediction [10.1] FGSと呼ばれるファイングラインド選択類似性統合手法を提案する。
5つのDTI予測データセットのFGSを様々な予測条件下で評価する。
類似度重みの解析と新しい予測の検証に関する事例研究により、FGSの実用性が確認された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:52:31 GMT)
A Token-level Contrastive Framework for Sign Language Translation [9.2] 手話翻訳は、聴覚障害者と聴覚障害者のコミュニケーションギャップを埋める有望な技術である。
トークンレベルの新しい ConSLT を提案する。
textbfSign textbfLanguage用のコントラスト学習フレームワーク。
textbf翻訳。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:58:01 GMT)
Abstract Visual Reasoning: An Algebraic Approach for Solving Raven's
Progressive Matrices [9.1] 抽象的推論に適した新しい推論フレームワークである代数的機械推論を導入する。
我々のフレームワークは、与えられた解集合から正しい解を選択でき、また与えられた質問行列のみで正しい解を生成することができる。
I-RAVENデータセットの実験では、全体的な9,3.2%の精度が得られ、現在の最先端の精度7,7.0%の精度を著しく上回り、8,4.4%の精度で人間のパフォーマンスを上回っている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:34:39 GMT)
Controlled-NOT gate based on the Rydberg states of surface electrons [9.0] 表面電子(SE)は、量子計算のための完璧な2次元プラットフォームを提供する。
制御NOT(CNOT)ゲートをSEの4レベルRydberg構造に符号化することにより,制御NOT(CNOT)ゲートを実現する手法を提案する。
提案手法の忠実度は実験的に達成可能なパラメータで0.999以上である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:56:01 GMT)
In-depth analysis of music structure as a self-organized network [9.0] 音声をテキストにエンコードする Essential Element Network (EEN) というアルゴリズムを導入する。
ネットワークは、スケール、時間、ボリュームの相関を計算して得られる。
我々はこれらの符号化された単語を時空間にマッピングし、音楽の深い構造における構文を体系的に整理するのに役立つ。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:39:56 GMT)
GAM : Gradient Attention Module of Optimization for Point Clouds
Analysis [9.0] 点雲解析タスクでは、既存のローカル特徴集約記述子(LFAD)は中心点近傍の情報を完全に活用できない。
本稿では, グラディエント・アテンション・モジュール (GAM) と呼ばれる勾配に基づく局所的アテンション・モジュールを提案する。
GAMは、それぞれ74.4%/90.6%/83.2%のmIoU/OA/mAccを持つ現行のポイントベースモデルの中で最高のパフォーマンスを達成している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:36:31 GMT)
Contrastive learning for regression in multi-site brain age prediction [9.0] MRIスキャンによる頑健な脳年齢予測のための新しいコントラスト学習回帰損失を提案する。
提案手法は,OpenBHBチャレンジにおける最先端性能を実現し,サイト関連ノイズに対する最高の一般化能力とロバスト性を実現する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:37:04 GMT)
Protective Self-Adaptive Pruning to Better Compress DNNs [8.8] 重要なフィルタが監視勾配を通ってプルーニングされるのを防止するため, 保護修復機構が提案されている。
ImageNetとCIFAR-10の実験は、精度と圧縮比の両方において、現在の研究よりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:24:26 GMT)
Pre-NeRF 360: Enriching Unbounded Appearances for Neural Radiance Fields [8.6] 我々は,NeRFアーキテクチャの性能向上のための新しいフレームワークを提案する。
我々のソリューションは、以前のバージョンのNeRFに悩まされていたいくつかの障害を克服します。
我々はN5k360データセットとして知られるNutrition5kデータセットの更新版を導入する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 23:29:38 GMT)
Estimating Distances Between People using a Single Overhead Fisheye
Camera with Application to Social-Distancing Oversight [8.3] 屋内での人との距離をモニタリングするための2つのアプローチを提案する。
1つの方法は魚眼レンズの幾何学的モデルを利用し、もう1つはニューラルネットワークを使って3D世界距離を予測する。
アルゴリズムは1-2フィートの誤差と95%以上の精度で社会的距離違反を検出する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:50:14 GMT)
Adaptive Experimentation at Scale: Bayesian Algorithms for Flexible
Batches [8.1] 我々は,任意のバッチサイズに対応可能な新しい適応実験フレームワークを開発した。
我々の主な観察は、統計的推論における正規近似は、スケーラブルな適応設計の設計を導くことができるということである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:17:03 GMT)
Focus or Not: A Baseline for Anomaly Event Detection On the Open Public
Places with Satellite Images [8.0] 公開地における異常事象を検出するための新しい衛星画像データセット(AED-RS)を提案する。
このデータセットでは、弱い教師付きでトレーニングできるデータセットTB-FLOWのベースラインモデルを導入する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:23:05 GMT)
GAMR: A Guided Attention Model for (visual) Reasoning [7.9] 人間は、複雑な視覚シーンを柔軟に解析し理解する能力において、現代のAIシステムよりも優れています。
視覚的推論のための新しいモジュール,(視覚的)推論のためのガイド付き注意モデル(GAMR)を提案する。
GAMRは、タスク関連視覚情報をメモリに選択してルーティングするために、注意シフトのシーケンスを通じて、脳が複雑な視覚的推論問題を動的に解くことを示唆している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:35:50 GMT)
Auto-Encoder Neural Network Incorporating X-Ray Fluorescence Fundamental
Parameters with Machine Learning [7.5] 限定ラベル付きデータから学習するニューラルネットワークモデルを開発した。
リチウム鉱物探査プロジェクトから,岩盤データセット上でのモデルとベースラインモデルの評価を行った。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:33:46 GMT)
Fighting over-fitting with quantization for learning deep neural
networks on noisy labels [7.1] 両問題に一度に対処できる圧縮法について検討する。
我々は、ニューラルネットワークの表現性を制限することによって、量子化を意識したトレーニングが正規化として振る舞うことを仮定する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:36:58 GMT)
ProphNet: Efficient Agent-Centric Motion Forecasting with
Anchor-Informed Proposals [6.9] モーション予測は自動運転システムにおいて重要なモジュールである。
マルチソース入力の不均一性、エージェント動作のマルチモーダリティ、オンボードデプロイメントに必要な低レイテンシのため、このタスクは極めて難しい。
本稿では,効率的なマルチモーダル動作予測のためのアンカー情報を用いたエージェント中心モデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:58:28 GMT)
Short-length SSVEP data extension by a novel generative adversarial
networks based framework [6.9] 合成脳波(EEG)データを作成するためにGAN(Generative Adversarial Network)ベースのデータ生成法が広く採用されている。
本稿では,TEGANと呼ばれるデータ長拡張のためのGANベースのエンドツーエンド信号変換ネットワークを提案する。
TEGANの助けを借りて、従来の周波数認識法と深層学習法の性能が大幅に向上した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:42:11 GMT)
Joint Visual Grounding and Tracking with Natural Language Specification [6.7] 自然言語仕様による追跡は、自然言語記述に基づくシーケンス内の参照対象の特定を目的としている。
統合されたタスクとしてグラウンドとトラッキングを再構成する統合的な視覚的グラウンドとトラッキングフレームワークを提案する。
本手法は,トラッキングとグラウンドの両方において,最先端のアルゴリズムに対して良好に動作する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:09:03 GMT)
A Survey on Class Imbalance in Federated Learning [6.6] フェデレーション学習は、ネットワーク内の複数のクライアントデバイスが、クライアントのデータを直接露出することなく、機械学習モデルを共同でトレーニングすることを可能にする。
連合学習で訓練されたモデルは通常、標準集中学習モードで訓練されたモデルよりもパフォーマンスが悪いことが判明した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:34:23 GMT)
Long-tailed Classification from a Bayesian-decision-theory Perspective [6.6] 長い尾の分類は、クラス確率の過度な不均衡と非対称な予測コストを伴う尾の感度リスクのために課題となる。
最近の試みでは、再分散損失とアンサンブル法を用いているが、理論的な説明が欠如しており、主に経験的な結果に大きく依存している。
本稿では,ベイズ決定理論の観点から,再バランス法やアンサンブル法を含む既存の手法を統一した一般原理的・原則的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:36:17 GMT)
Oral-NeXF: 3D Oral Reconstruction with Neural X-ray Field from Panoramic
Imaging [6.5] 2次元画像からの医用画像の3次元再構成は、深層学習の高度化にともなう課題となっている。
限られた(一般的には1つか2つの)X線画像からの3D再構成におけるこれまでの作業は、主にペア化された2D画像と3D画像からの学習に依存していた。
本研究では,パノラマスキャンによる3次元口腔構造の再構築において,画像方向や投影画像などの投影データのみに依存する新しいモデルを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:17:27 GMT)
LEAPT: Learning Adaptive Prefix-to-prefix Translation For Simultaneous
Machine Translation [6.4] 機械翻訳は、多くのライブシナリオで有用であるが、精度とレイテンシのトレードオフのため非常に難しい。
LEAPTと呼ばれる新しい適応型トレーニングポリシーを提案し、それによって機械翻訳モデルがソースプレフィックスの翻訳方法を学習し、将来の文脈を活用することができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:17:37 GMT)
Mapping Language Literacy At Scale: A Case Study on Facebook [6.4] 本研究は,世界の160か国以上におけるオンライン人口の言語リテラシースキルを体系的に研究する。
本研究では,成人Facebook利用者の投稿を集約・非特定し,オンライン人口に対する人口レベルリテラシー推定手法を開発した。
Facebookでは、多くの国で女性が男性よりも高い言語リテラシーを示していますが、アフリカとアジアでは大きなギャップが残っています。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:24:13 GMT)
Learning Representations of Bi-level Knowledge Graphs for Reasoning
beyond Link Prediction [6.4] 知識グラフは三つ子を使った既知の事実を表す。
BiVEは三つ子の構造を考慮して埋め込みを学ぶ。
3重項予測と条件付きリンク予測の2つの新しいタスク。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:30:06 GMT)
MV-MR: multi-views and multi-representations for self-supervised
learning and knowledge distillation [6.4] マルチビューと多表現(MV-MR)に基づく自己教師型学習と知識蒸留の新しい手法を提案する。
MV-MRは、拡張ビューと非拡張ビューからの学習可能な埋め込み間の依存に基づいている。
提案手法は,効率的な自己監督型分類とモデル非依存型知識蒸留に利用できることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:40:59 GMT)
Multi-agent Reinforcement Learning for Regional Signal control in
Large-scale Grid Traffic network [6.2] マルチエージェント強化学習(MARL)を用いた適応的な交通信号制御のための新しいトレーニングフレームワークを提案する。
本フレームワークは,ネットワーク境界外における仮想的交点によるバイアスを軽減するために,交差点と拡張分岐処理Q-Network(BDQ)と動的分岐処理Q-Network(DBDQ)の隣接性に基づいている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:42:58 GMT)
ChatGPT and a New Academic Reality: AI-Written Research Papers and the
Ethics of the Large Language Models in Scholarly Publishing [6.1] ChatGPTは、テキストベースのユーザ要求を満たすために自然言語処理を使用する生成事前学習トランスフォーマーである。
GPT-3のような大規模言語モデルの出現に伴う潜在的な倫理的問題について論じる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:35:07 GMT)
Data-Efficient Learning of Natural Language to Linear Temporal Logic
Translators for Robot Task Specification [6.1] 本稿では、自然言語コマンドから、人間ラベルの訓練データに制限のある仕様への変換を学習ベースで行う手法を提案する。
これは、人間のラベル付きデータセットを必要とする既存の自然言語から翻訳者への変換とは対照的である。
自然言語コマンドを75%の精度で翻訳できることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:35:10 GMT)
Mitigating climate and health impact of small-scale kiln industry using
multi-spectral classifier and deep learning [6.0] 小規模産業、特にブルレンチレンガキルンは南アジアにおける大気汚染の原因の1つである。
キルン産業の気候と健康への影響を緩和するためには、地理的に異なる場所での微粒なキルン局在化が必要である。
本稿では,南アジアの「Brick-Kiln-Belt」において,ブロックキルン分類のための高分解能画像を用いた大局的マルチスペクトルデータの融合を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:54:58 GMT)
Statistical Analysis of Karcher Means for Random Restricted PSD Matrices [5.9] 本稿では,制限された正の半定値行列の多様体上の固有平均モデルについて検討し,カルチャー平均の漸近的統計解析を提供する。
アプリケーションとして,分散主成分分析アルゴリズムであるLRC-dPCAが,全サンプルPCAアルゴリズムと同じ性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:49:46 GMT)
Chinese Intermediate English Learners outdid ChatGPT in deep cohesion:
Evidence from English narrative writing [5.7] 本研究は,ChatGPTと中国語中間英語学習者によるナラティブ・トピックの書き方を比較した。
データをCoh-Metrixを用いて5つの談話成分を用いて分析した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:55:54 GMT)
Why is That a Good or Not a Good Frying Pan? -- Knowledge Representation
for Functions of Objects and Tools for Design Understanding, Improvement, and
Generation [5.6] 本稿では、特定のオブジェクト(この場合、フライパン)とそのサポートを意図したプロセスへの関与が、一般的な関数表現言語とフレームワークでどのように表現できるかを示す。
なぜフライパンに何か良いフライパンがあるのか、それともフライパンの特定の部分が何らかの方法でデザインされているのか?
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:20:57 GMT)
Online Learning for Equilibrium Pricing in Markets under Incomplete
Information [5.1] 不完全な情報設定における均衡価格設定の問題を考える。
我々は3つのパフォーマンス指標、すなわち不需要、コストの後悔、支払いの後悔を共同で最適化する。
この拡張環境では,サブ線形後悔を伴うアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:53:37 GMT)
Analytical Conjugate Priors for Subclasses of Generalized Pareto
Distributions [5.0] この記事では、連続確率分布の有限サポート、すなわち有限領域上で定義された分布の最小と最大を推定しようとする実践者を対象としている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:12:29 GMT)
Transformers in Speech Processing: A Survey [5.0] トランスフォーマーは、音声認識、音声合成、音声翻訳、音声パラ言語学、音声強調、音声対話システム、マルチモーダルアプリケーションなど、様々な音声関連領域で注目を集めている。
本稿では,音声技術における様々な分野の研究を橋渡しすることを目的とした包括的調査を行う。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:00:39 GMT)
Context-Aware Timewise VAEs for Real-Time Vehicle Trajectory Prediction [4.6] マルチモーダル車軌道予測のためのコンテキスト認識手法であるContextVAEを提案する。
すべてのテストデータセットにおいて、ContextVAEモデルはトレーニングが高速で、リアルタイムに高品質なマルチモーダル予測を提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:02:34 GMT)
Low-complexity Deep Video Compression with A Distributed Coding
Architecture [4.6] 有意な予測符号化に基づくビデオ圧縮手法は、時間的相関を低減するために重エンコーダに依存している。
1970年代まで、分散ソース符号化理論は、独立符号化と側情報との結合復号により、相関したソースの高効率な圧縮が達成できることを示した。
本稿では,レート・歪み特性を改善するために,最初のエンドツーエンドの分散ビデオ圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 05:34:04 GMT)
Convergence of stochastic gradient descent on parameterized sphere with
applications to variational Monte Carlo simulation [4.5] 本稿では,教師付き学習の設定のための新しいアルゴリズムを提案し,理論的にも数値的にもその収束性を示す。
また、量子物理学において広く用いられている変分モンテカルロ法(VMC)に対応する、教師なし設定に対する収束の最初の証明も提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 05:41:24 GMT)
ADCNet: End-to-end perception with raw radar ADC data [4.4] 新たなトレンドは、リッチで低レベルなレーダーデータを知覚に活用することだ。
本稿では,生のレーダアナログ・デジタル(ADC)データを用いてエンドツーエンドの学習を行う手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:31:15 GMT)
Multi-modal reward for visual relationships-based image captioning [4.4] 本稿では、画像のシーングラフから抽出した視覚的関係情報を画像の空間的特徴マップに融合させることにより、画像キャプションのためのディープニューラルネットワークアーキテクチャを提案する。
次に、共通埋め込み空間における言語と視覚の類似性の組み合わせを用いて、提案するネットワークの深層強化学習のためにマルチモーダル報酬関数を導入する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:39:10 GMT)
Community detection in complex networks via node similarity, graph
representation learning, and hierarchical clustering [4.3] コミュニティ検出は、現実世界のグラフやネットワークの分析において重要な課題である。
グラフにおけるコミュニティ検出に階層的クラスタリング手法を適用するための3つのアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:12:53 GMT)
Efficient Quantum Secret Sharing Scheme Based On Monotone Span Program [4.2] このスキームはモノトーンスパンプログラムに基づいており、アクセス構造はアクセス構造(t,n)のしきい値よりも一般的である。
他のスキームと比較すると,提案方式はより効率的で計算コストも少ない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:12:44 GMT)
Machine Learning for Brain Disorders: Transformers and Visual
Transformers [4.2] トランスフォーマーは当初、自然言語処理(NLP)タスク用に導入されたが、コンピュータビジョンを含む多くのディープラーニング分野に急速に採用された。
本稿では、注意機構(Section 1)を導入し、次にビジョン変換器を含む基本変換器ブロックを紹介する。
最後に,画像分類以外のタスク,例えば検出,セグメンテーション,生成,ラベルなしのトレーニングに適用されるVisual Transformerを紹介する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:57:33 GMT)
The Threat of Adversarial Attacks on Machine Learning in Network
Security -- A Survey [4.2] ネットワークセキュリティにおける機械学習の応用は、他のドメインと比較して、活発な敵攻撃に対する不当な脅威に直面している。
本調査ではまず,機械学習技術,タスク,深さの分類について述べる。
ネットワークセキュリティにおける機械学習に対する様々な敵攻撃について検討し、ネットワークセキュリティにおける敵攻撃に対する2つの分類手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:10:36 GMT)
Fundamentals of Generative Large Language Models and Perspectives in
Cyber-Defense [3.9] レビューは、ジェネレーティブ言語モデルの歴史、技術状況、そしてその原則、能力、限界、将来の展望について、簡単な概要を提供することを目的としている。
2022年後半から2023年初頭にかけて、生成言語モデル(Generative Language Models)が大きな注目を集めた。
このレビューは、ジェネレーティブ言語モデルの歴史、技術状況、そしてその原則、能力、限界、将来の展望について、簡単な概要を提供することを目的としている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:45:09 GMT)
Training Invertible Neural Networks as Autoencoders [3.9] Invertible Neural Networks (INNs) を INN (variational) autoencoders と呼ぶ (variational) autoencoders として訓練する方法を提案する。
MNIST, CIFAR, CelebAを用いた実験により, 低ボトルネックサイズでは, INNオートエンコーダは古典的オートエンコーダと同様の結果が得られた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:43:11 GMT)
COLA: COarse LAbel pre-training for 3D semantic segmentation of sparse
LiDAR datasets [3.8] 転送学習は、2次元コンピュータビジョンにおいて、利用可能な大量のデータを活用し、高い性能を達成するための実証された技術である。
本研究では,スパース自動運転LiDARスキャンのリアルタイムな3次元セマンティックセマンティックセマンティックセグメンテーションを実現する。
我々は,COLA(Coarse label pre-training)と呼ばれる新しい事前訓練タスクを導入する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:12:46 GMT)
Policy Optimization for Personalized Interventions in Behavioral Health [3.8] デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
ポリシー反復の1ステップを近似したDecompPIをダブした新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:42:03 GMT)
Experimental Simulation of Symmetry-Protected Higher-Order Exceptional
Points with Single Photons [3.8] 単光子干渉法による2次元NHバンド構造を実験的にシミュレーションした。
対称性の存在下で2つの実パラメータのみをチューニングすることによって得られる位相的に安定な3階EPを観察する。
我々の研究は、対称性によって保護されたより豊富で概念的に高階のEPを明らかにする。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:22:43 GMT)
Stateless actor-critic for instance segmentation with high-level priors [3.8] インスタンスセグメンテーションはコンピュータビジョンの重要な問題であり、深層学習に基づく手法によって依然として困難である。
本稿では, グラフ分割問題としてインスタンス分割問題を定式化し, アクタ評論家は, 対象形状, 位置, 大きさの高レベル先行に対するセグメント化されたインスタンスの適合性に基づいて, 報酬によって引き起こされるエッジウェイトを予測した。
おもちゃと実際のデータセットの実験では、豊富な事前セットのみに基づいて直接監督することなく、優れたパフォーマンスを達成できることが示されています。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:11:44 GMT)
Universal Smoothed Score Functions for Generative Modeling [3.6] 我々は、$mathbbRd$における未知の関心密度の平滑化に基づく生成モデルの問題を考える。
M-density (M-density) と呼ばれる$mathbbRMd$の滑らかな密度を学習する際の時間的複雑さを特徴付ける。
本稿では,CIFAR-10データセットを用いた生成モデルのサンプル品質について述べる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:23:37 GMT)
DeepGraviLens: a Multi-Modal Architecture for Classifying Gravitational
Lensing Data [3.4] DeepGraviLensは、1つの非レンズ系と3つのレンズ系に属する時間データを分類する新しいネットワークである。
検討されたデータセットによっては、アート精度の現在の状態を$approx$19%から$43%に越えている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:39:49 GMT)
Fast exploration and learning of latent graphs with aliased observations [3.3] 探索効率をほぼ最大化する政策を提供する。
未利用例では,最先端の強化学習ベースラインの性能向上が見られた。
エイリアス化の場合、適切なベースラインを意識せず、代わりに様々なトポロジに対するランダムなポリシーw.r.t.を高速にリカバリし、挑戦するトポロジに対するランダムなポリシーよりも指数関数的に高速なリカバリを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:27:35 GMT)
Penalty-Based Imitation Learning With Cross Semantics Generation Sensor
Fusion for Autonomous Driving [3.2] そこで本研究では,擬似学習を用いたエンドツーエンドの自動運転ナビゲーションのための,機能レベルのマルチセンサ融合技術を提案する。
本稿では主にLidarとRGB情報の融合技術に焦点を当てる。
また,交通規則の遵守を強化するために,新たなペナルティに基づく模倣学習手法を提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:29:52 GMT)
Full or Weak annotations? An adaptive strategy for budget-constrained
annotation campaigns [3.1] セグメンテーションデータセットのアノテーション戦略を決定する新しい手法を提案する。
提案手法は, 分割と分類アノテーションの比率を連続的に決定し, 予算制約の収集を行う。
実験では、さまざまなアノテーション予算とデータセットに対して最適に非常に近いアノテーションが得られたことを示します。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:41:54 GMT)
Are uGLAD? Time will tell! [3.1] 条件独立グラフ(CI)を用いた多変量時系列セグメンテーションのための新しい手法を提案する。
$texttuGLAD$は、変数の数が$DN$である設定に対して$O(N)$の競合時間複雑性を提供する。
身体活動モニタリングデータを用いて実験結果を実証した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:46:28 GMT)
Explain To Me: Salience-Based Explainability for Synthetic Face
Detection Models [3.0] 本稿では,モデル・サリエンスを利用してモデル・サリエンスを大規模に説明するための5つの手法を提案する。
これらの方法は、 (a) モデルのサリエンスマップの平均エントロピーは何か、 (b) モデルサリエンスがどのように変化するか、 (c) モデルサリエンスを独立したトレーニングで安定させるか、 (e) モデルサリエンスがサリエンス誘導画像の劣化にどのように反応するかを問う。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:01:55 GMT)
Unlocking Layer-wise Relevance Propagation for Autoencoders [3.0] 本稿では,Deep Taylor Decompositionフレームワークを用いた自動エンコーダの高速な説明可能性解を提案する。
本結果は,提案した説明可能性解の定性的利点だけでなく,計算性にも焦点をあてるものである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:46:34 GMT)
Self-supervised learning of a tailored Convolutional Auto Encoder for
histopathological prostate grading [3.0] 前立腺癌は世界で2番目に多いがんであり、全体でも4番目に多いがんである。
特に3級(G3)と4級(G4)の鑑別が困難である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:29:17 GMT)
Online conspiracy communities are more resilient to deplatforming [3.0] Reddit, GreatAwakening, FatPeopleHateの2つの大きなコミュニティの禁止によって影響を受けるユーザの行動の変化を比較した。
われわれの推計によると、陰謀コミュニティのユーザーはRedditを離れ、Voatに加わる可能性がずっと高い。
移住するゼアロットはほとんどなく、新たな大覚醒コミュニティがVoatで成長する一方、この効果はFatPeopleHateにとって欠落している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:08:51 GMT)
Physics Driven Deep Retinex Fusion for Adaptive Infrared and Visible
Image Fusion [3.0] 畳み込みニューラルネットワークは、画像融合と超解像のための輝かしいツールになった。
Deep Retinex Fusion (DRF) は、適応赤外(IR)と可視(VIS)画像の超解像融合のためのデータセットのない手法である。
DRFは、IRとVIS情報を適応的にバランスさせ、優れたノイズ免疫を有する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:34:09 GMT)
SIFT: Sparse Iso-FLOP Transformations for Maximizing Training Efficiency [2.9] 最近の研究は、ディープニューラルネットワーク(DNN)のトレーニング効率(テスト精度w.r.tトレーニングFLOPs)を改善するために重量空間の利用を探求している。
そこで本研究では,FLOPSを高密度モデルとして用いた場合の精度向上を目的として,より高精度なトレーニング効率向上を実現する。
我々の知る限りでは、これはスパース変換の単純対用セットを通じて高密度モデルの精度を向上させるためのスパース性の使用を示す最初の研究である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:06:37 GMT)
Autofluorescence Bronchoscopy Video Analysis for Lesion Frame Detection [2.7] 自家蛍光式気管支鏡(AFB)は気管支病変の検出に使用される一次的適応である。
本稿では,情報フレームと非情報フレームを区別する頑健な自動AFB解析手法を提案する。
提案手法は,コンピュータによる画像解析,機械学習,深層学習を組み合わせた手法である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:10:35 GMT)
ChatGPT for Programming Numerical Methods [2.7] ChatGPTはOpenAIによってトレーニングされた大規模な言語モデルである。
計算アルゴリズムのプログラミングにおけるChatGPTの能力を初めて探求する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:18:17 GMT)
Reasonable Scale Machine Learning with Open-Source Metaflow [2.6] 既存のツールを再購入しても、現在の生産性の問題は解決しない、と私たちは主張します。
私たちは、データ実践者の生産性を高めるために明示的に設計された、MLプロジェクトのためのオープンソースのフレームワークであるMetaflowを紹介します。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:28:09 GMT)
Probabilistic Domain Adaptation for Biomedical Image Segmentation [2.5] 本稿では,確率的ドメイン適応手法,自己学習アプローチ,確率的UNetを提案する。
本研究では, バイオメディカルセグメンテーションのための3つの課題領域適応課題について, 共同および個別のソースターゲットトレーニング戦略について検討し, 評価を行った。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:17:21 GMT)
Using Differential Evolution to Avoid Local Minima in Variational
Quantum Algorithms [2.3] 局所最小値とバレン高原問題の影響を回避または低減する代替最適化法について検討した。
我々の仮説は、DECは2つの主な理由から、勾配と局所ミニマの消失に対して弾力性があるというものである。
我々は,DECを局所的に組み合わせることで,すべての局所最小値を回避するとともに,大域的最小値への収束度を高めることができることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:31:06 GMT)
Top-Down Beats Bottom-Up in 3D Instance Segmentation [2.3] エンドツーエンドでトレーニングされたトップダウン、完全なデータ駆動、シンプルなアプローチで、3DインスタンスのセグメンテーションをTD3Dで処理します。
提案手法は,従来のグループ化手法よりもはるかに高速である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:37:12 GMT)
ChatGPT Is on the Horizon: Could a Large Language Model Be All We Need
for Intelligent Transportation? [2.2] OpenAIが開発したChatGPTは,60億のパラメータを持つ,マイルストーンの大規模言語モデル(LLM)の1つである。
本稿では,重要な輸送問題に対するLCMの今後の応用について考察する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 05:47:11 GMT)
Optical Character Recognition and Transcription of Berber Signs from
Images in a Low-Resource Language Amazigh [2.1] バーバー語族(英: Berber language)またはアマージー語族(英: Amazigh language family)は、北アフリカ原住民の言語である。
独自のアルファベットはティフィナグ(Tifinagh)と呼ばれ、モロッコ、アルジェリアなどのベルベルのコミュニティで使用されている。
Afroasiatic Language Berberは1400万人が話しているが、教育、研究、Webアプリケーションなどには十分な表現がない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:38:44 GMT)
Beam Management Driven by Radio Environment Maps in O-RAN Architecture [2.0] M-MIMOは5Gと将来の6Gネットワークの主要な技術の一つと考えられている。
ビームの静的集合、すなわちグリッド・オブ・ビーム(GoB)を利用するM-MIMOネットワークの実装が容易である。
ビームマネジメント(BM)は、無線環境に関する歴史的知識を考慮し、強化することができる。
提案手法はOpen Radio Access Network (O-RAN) アーキテクチャに準拠している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:09:31 GMT)
The Open-domain Paradox for Chatbots: Common Ground as the Basis for
Human-like Dialogue [2.0] オープンドメインチャットボットの開発への関心の高まりは、近年の大規模言語モデルの進歩によって引き起こされた。
対話のオープン性」は、想定される共同活動を含む、期待できる共通基盤についての最小限の情報を提供することによって最大化されることが期待される。
ユーザに対して"何でもチャットする"ように指示すると、非常に狭いダイアログとなり、"オープンドメインパラドックス"と呼ばれる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:01:49 GMT)
Deep Learning for Video-based Person Re-Identification: A Survey [1.9] 本稿では,ビデオリIDのためのディープラーニング手法の最新の進歩について紹介する。
制限付きの短いビデオリIDメソッド、技術的な課題による大きなマイルストーン、アーキテクチャ設計などについて説明する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 05:50:53 GMT)
Multiagent Reinforcement Learning for Autonomous Routing and Pickup
Problem with Adaptation to Variable Demand [1.9] 都市の地図に現れる要求に対処する自律走行車両群に対して、ルーティング/ピックポリシーを生成するための学習枠組みを導出する。
当社は、車両間の協調を促す政策に焦点を合わせ、要求の待ち時間を短縮する。
本稿では、現在の需要が元の妥当性領域外にある場合に、トレーニング済みのオフライン近似を切り替えるメカニズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:18:48 GMT)
Hey Dona! Can you help me with student course registration? [1.8] 学生登録では,Hey Dona(あるいは単にDona)と呼ばれるインテリジェントなパーソナルエージェントのデモを行う。
ドナは、学生登録における音声支援のための知的パーソナルエージェントとして最初の存在である。
スマートな生活とスマートな人々のスマートシティの特徴は、新しい生活方法への貢献によって、より広範な影響を与える。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:37:19 GMT)
Machine Learning Techniques for Estimating Soil Moisture from Mobile
Captured Images [1.8] 本研究は,土壌画像から土壌水分(SM)を推定するための機械学習(ML)技術を解析することを目的とする。
MLを利用してSMを予測するスマートフォンカメラの可能性を示す。
将来、ソフトウェア開発者は、正確な、簡単で、迅速なSM推定のための研究結果に基づいて、モバイルアプリケーションを開発することができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:22:04 GMT)
MFBE: Leveraging Multi-Field Information of FAQs for Efficient Dense
Retrieval [1.7] 本稿では,複数組み合わせのFAQフィールドを利用するバイエンコーダベースのクエリ-FAQマッチングモデルを提案する。
本モデルでは,内部およびオープンデータセットにおけるFAQ検索タスクにおいて,約27%,20%の精度でトップ1の精度を実現している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:38:10 GMT)
Dens-PU: PU Learning with Density-Based Positive Labeled Augmentation [1.7] 本研究では,異常検出戦略に基づくPU学習問題の解法を提案する。
正ラベルデータから抽出された潜時符号化を線形に組み合わせて新しいサンプルを取得する。
正ラベル付きデータの密度に依存してDens-PUと命名されたこの手法は、ベンチマーク画像データセットを用いて評価された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:48:53 GMT)
Efficient Multi-stage Inference on Tabular Data [1.6] 従来型の知恵は、MLコードをRPC API経由で製品コードによってクエリされるサービスに分離することを好む。
推論アルゴリズムを単純化し、それらを製品コードに組み込んでネットワーク通信を減らします。
トレーニングと推論の両方にAutoMLによる最適化を適用することで、推論遅延を1.3倍、CPUリソースを30%削減し、アプリケーションフロントエンドとMLバックエンド間のネットワーク通信を約50%削減します。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:01:55 GMT)
Interactive Geometry Editing of Neural Radiance Fields [1.6] 本稿では,ニューラルラディアンスフィールド操作のためのインタラクティブな幾何学的編集を可能にする手法を提案する。
シーンの編集を可能にするために2つのケージ(インナーケージとアウターケージ)を使用します。
我々の手法は明示的な3次元幾何表現を必要としない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:07:36 GMT)
Online Transformers with Spiking Neurons for Fast Prosthetic Hand
Control [1.6] 本稿では,自己注意機構の代わりにスライディングウィンドウアテンション機構を用いる。
この機構は、入力とターゲット間の有限範囲依存性を持つ連続的な信号に対してより効率的であることを示す。
本研究の結果は,スムーズな義手制御のためのsEMG信号の正確かつ高速なオンライン処理を約束するものである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:59:35 GMT)
Transcriptomics-based matching of drugs to diseases with deep learning [1.6] 我々は, 仮説のない, トランスクリプトミクスに基づく病気の薬物のマッチングを行うための深層学習手法を提案する。
提案するニューラルネットワークアーキテクチャは、関連する疾患と薬物差遺伝子の発現プロファイルを入力として、承認された薬物障害の指標に基づいて訓練されている。
我々は,最も広く使用されている転写学ベースのマッチングベースラインであるCMapと特徴方向に対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:32:31 GMT)
A Tale of Two Circuits: Grokking as Competition of Sparse and Dense
Subnetworks [1.5] スパースパリティタスクでグラッキングを行うネットワークの内部構造について検討する。
グラッキング相転移はモデル予測に支配的なスパースサブネットワークの出現に対応する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:17:29 GMT)
Texture Learning Domain Randomization for Domain Generalized
Segmentation [1.5] 既存の汎用セマンティックドメイン(DGSS)法は,テクスチャよりも形状を優先するモデルを導くことによって,領域ギャップ問題を緩和している。
本稿では,DGSSの性能向上にテクスチャを活用することが重要であることを論じる。
学習領域ランダム化(TLDR)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:23:26 GMT)
Artificial muses: Generative Artificial Intelligence Chatbots Have Risen
to Human-Level Creativity [1.3] 6つの生成人工知能(GAI)による人為的アイデアとの比較
AIと人間の創造性には質的な違いはないが、アイデアの生成方法には違いがある。
以上の結果から,GAIは創造的プロセスにおいて貴重なアシスタントであることが示唆された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:35:01 GMT)
Physics informed machine learning with Smoothed particle hydrodynamics:
Hierarchy of reduced Lagrangian models of turbulence [1.2] この原稿は乱流に対するパラメータ化還元ラグランジアンモデルの階層を構築している。
Smoothed Particle Hydrodynamics (SPH) を通した物理的構造を、普遍関数近似器としてニューラルネットワーク(NN)に依存することによる影響について検討する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:37:26 GMT)
A Novel and Optimal Spectral Method for Permutation Synchronization [1.1] 置換同期はコンピュータ科学において重要な問題であり、多くのコンピュータビジョンタスクの重要なステップを構成する。
目標は、雑音と不完全なペアワイズ測定から$n$潜在置換を回復することである。
スペクトル法は、データ行列の先頭の固有空間$U$とそのブロックサブマトリクス$U_1,U,ldots,U_n$を利用して、置換を回復する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:43:26 GMT)
Deep Learning Pipeline for Preprocessing and Segmenting Cardiac Magnetic
Resonance of Single Ventricle Patients from an Image Registry [1.1] データは3つのディープラーニングモデルを含むパイプラインのトレーニングと評価に使用された。
パイプラインのパフォーマンスは、DiceとIoUのスコアに基づいて、自動化された標準手動セグメンテーションと参照された手動セグメンテーションの間で評価された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:37:15 GMT)
Accelerating Progress Towards Practical Quantum Advantage: The Quantum
Technology Demonstration Project Roadmap [1.1] 量子情報科学と技術(QIST)は、世界に大きな影響を与える可能性のある、重要かつ新しい技術である。
量子技術実証プロジェクト(QTDP)のロードマップを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:12:29 GMT)
Deep Q-Network Based Decision Making for Autonomous Driving [1.0] 本稿では,Q-Networksと制御理論からの洞察を組み合わせることで,高速道路のシナリオで自動運転車を安全にナビゲートする方法を提案する。
ディープQネットワークは、軌道プランナーの目標を提案することにより、中心的な意思決定ユニットとして機能するようにシミュレーションで訓練される。
経年移動のための制御装置と組み合わせて生成された軌道を用いて車線変更操作を行う。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:01:22 GMT)
The Maximum Linear Arrangement Problem for trees under projectivity and
planarity [0.9] 線形配置は、グラフの $n$ 頂点から $n$ 異なる連続整数への写像 $pi$ である。
本稿では,最大線形配置問題 (MaxLA) の2つの変種について検討する。
本稿では,木に対する平面的および射影的MaxLAを解くために,時間と空間で線形なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 08:47:13 GMT)
A Unified Taxonomy of Deep Syntactic Relations [0.8] 本稿では,汎用的なセマンティック・ロール・ラベルの提案を目標として,複数のディープ・シンタクティック・フレームワークを解析する。
本提案では,言語学的視点について検討し,意味テキスト理論と機能生成記述フレームワークに焦点を当てた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:43:41 GMT)
cTBL: Augmenting Large Language Models for Conversational Tables [0.8] 本稿では,3段階のエンコーダ・デコーダアプローチである会話表(cTBL)を導入し,検索した情報に基づいて対話応答を生成する。
cTBLは、Dense Table Retrieval用のTransformerエンコーダ埋め込みを使用し、HirbiDialogueデータセット上のスパース検索よりもTop-1とTop-3の精度を最大5%向上させる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:04:44 GMT)
Integrable Floquet systems related to logarithmic conformal field theory [0.7] 密度高分子の普遍性クラスにおける格子統計系に関連する可積分フロケ量子系について検討する。
テンパーリー-リーブ代数の元に対する単純リー代数構造は、2つの格子サイトによるシフトの下で不変である。
スケーリング制限において、この非平衡系は対数共形場理論によって記述されるという強い示唆を与える。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:22:40 GMT)
Defect Detection Approaches Based on Simulated Reference Image [0.7] 我々は、いくつかの自然画像異常に加えて、SEM半導体欠陥に着目する。
本研究では, シミュレーションされた参照が, 結果の改善に有用であることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:04:09 GMT)
MSTFormer: Motion Inspired Spatial-temporal Transformer with
Dynamic-aware Attention for long-term Vessel Trajectory Prediction [0.6] MSTFormer は Transformer に基づく動きインスパイアされた容器軌道予測手法である。
軌道の空間的特徴と運動特徴を記述するためのデータ拡張手法を提案する。
第2に,頻繁な動き変換を伴う軌道点に着目したマルチヘッド動的自己認識機構を提案する。
第三に、モデルの性能をさらに向上させるために、知識にインスパイアされた損失関数を構築する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:11:37 GMT)
A Random Projection k Nearest Neighbours Ensemble for Classification via
Extended Neighbourhood Rule [0.5] k近い隣人(kNN)に基づくアンサンブルは、多数の基礎学習者を組み合わせている。
RPExNRuleアンサンブルは、与えられたトレーニングデータからのブートストラップサンプルをランダムに低次元に投影する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:58:59 GMT)
Cross-Domain Evaluation of a Deep Learning-Based Type Inference System [0.4] 本研究では,最先端のディープラーニング型推論システムとして,Type4Pyについて検討する。
クラス不均衡、語彙外単語、データセットシフト、未知クラスといった問題に対処する。
我々のデータセットは、ソフトウェアプロジェクトの異なる領域における型推論システムの評価を可能にする。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:06:37 GMT)
Improving Fabrication Fidelity of Integrated Nanophotonic Devices Using
Deep Learning [0.4] 本稿では,フォトニックデバイスの設計レイアウトを自動的に修正する汎用ディープラーニングモデルを提案する。
我々のモデルは次世代フォトニック回路における信頼性と性能の新たなレベルへの扉を開く。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:51:17 GMT)
Topology optimization with physics-informed neural networks: application
to noninvasive detection of hidden geometries [0.4] 本稿では,隠れた幾何学構造を検出するためのPINNに基づくトポロジ最適化フレームワークを提案する。
非線形弾性体および非線形弾性体における隠れヴォイドおよび包有物の数,位置,形状を検出することにより,我々の枠組みを検証した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:48:00 GMT)
GLADE: Gradient Loss Augmented Degradation Enhancement for Unpaired
Super-Resolution of Anisotropic MRI [0.2] 異方性3D画像から高分解能等方性3D腹部MR像を無呼吸で合成する方法を提案する。
これにより、短時間の呼吸保持時間内に高解像度の等方性画像で腹部全体をスキャンすることができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:19:51 GMT)
Feature-adjacent multi-fidelity physics-informed machine learning for
partial differential equations [0.2] 物理インフォームドニューラルネットワークは偏微分方程式の解法として登場した。
複雑な問題に対して、そのようなネットワークのトレーニングには高忠実度データが必要である。
本稿では,低忠実度および高忠実度ソリューションで共有される特徴空間に基づく,新しい多忠実度アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:51:15 GMT)
The Representational Status of Deep Learning Models [0.2] 本稿では、DLMはリレーショナルな意味でターゲットを表すが、高度に理想化されたモデルとして最もよく理解されていることを論じる。
この結果は、説明可能なAI(XAI)に即座に影響し、DLM表現の理想化された性質を調べるために哲学的な注意を向ける。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:19:35 GMT)
DIPPM: a Deep Learning Inference Performance Predictive Model using
Graph Neural Networks [0.1] 我々は、NVIDIA A100 GPU上で与えられた入力DLモデルの推論遅延、エネルギー、メモリ使用量を予測するDL推論性能予測モデル(DIPPM)を開発した。
また、DIPPMの出力から適切なA100 Multi-Instance GPUプロファイルを提案するアルゴリズムを考案した。
我々のDIPPMは、適切なハードウェア構成を見つけるのに役立つだけでなく、モデルの推論性能の迅速な設計空間探索にも役立ちます。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:43:41 GMT)
\"Uberpr\"ufung von Integrit\"atsbedingungen in Deduktiven Datenbanken [0.0] 整合性違反は、整合性制約の証明に関する特別な操作と解釈できる。
本研究では,証明木を特別なデータ構造として定義し,そのような木を通してSLDNF証明の存在を示唆する。
知識ベースの変化が整合性制約の妥当性に影響を及ぼすかどうかを規定する条件の最小セットを決定する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 21:07:15 GMT)
Waveguided sources of consistent, single-temporal-mode squeezed light:
the good, the bad, and the ugly [0.0] 本研究では, ポンプの明るさが, 固定されたパラメトリック導波源によって生じる圧縮状態の時間的モード構造にどのように影響するかを理論的に検討した。
これらの圧縮状態の時間的モードは、部分的にミスマッチし、区別可能であることが分かり、量子コンピューティングやheralded state generationのリソースとしてこれらの状態を使用する場合、それは望ましくない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:53:14 GMT)
Viscoelastic Constitutive Artificial Neural Networks (vCANNs) $-$ a
framework for data-driven anisotropic nonlinear finite viscoelasticity [0.0] 粘弾性構成型ニューラルネットワーク(vCANN)を紹介する。
vCANNは、有限ひずみにおける異方性非線形粘性のための新しい物理インフォームド機械学習フレームワークである。
我々は,vCANNが人間の指導なしに,これらの素材の挙動を正確に,効率的に把握できることを実証した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:45:59 GMT)
Universal Approximation Property of Hamiltonian Deep Neural Networks [0.0] 我々はHDNNのフローの一部がコンパクト領域上の任意の連続関数を任意に近似できることを示した。
この結果はHDNNの実用化のための確かな理論基盤を提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:10:09 GMT)
Uniform Risk Bounds for Learning with Dependent Data Sequences [0.0] 本稿では、独立データを用いた学習理論から依存データのシーケンスまで、標準的な結果を拡張する。
我々は、古典的な証明パターンとキャパシティ尺度との均一なリスク境界を導出する、複雑性の議論やシーケンシャルな尺度の混合には依存していない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:51:52 GMT)
Ultrafast artificial intelligence: Machine learning with atomic-scale
quantum systems [0.0] 0 から 9 の間の手書き桁を認識するためにモデル原子を訓練する。
トレーニングでは、範囲0〜9の手書き桁の個々の画像を、形状のレーザーパルスに変換する。
このシステムは時間依存的なシュリンガー方程式に従って量子力学的に進化する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 23:22:51 GMT)
The singularities of the rate function of quantum coherent work in
one-dimensional transverse field Ising model [0.0] 我々は,コヒーレントギブズ状態における一次元逆場量子イジングモデルに関する議論を専門とする。
量子コヒーレンスは、熱ゆらぎによって破壊される量子相転移を回復するだけでなく、回復する。
これらの特異点がスピンフリップに根付いていて、スピン偏極の領域境界が突然変化することが分かる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:57:28 GMT)
The quantum detection of projectors in finite-dimensional algebras and
holography [0.0] 量子位相推定(QPE)に基づくタスクの量子アルゴリズムについて述べる。
本稿では,AdS/CFT対応によるプロジェクタ識別問題に関連する古典的アルゴリズムと比較する。
量子プロジェクター検出の第3の例は、それぞれ$m,n$と$m+n$ボックスの3つのヤング図形でラベル付けされたプロジェクターである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:26:05 GMT)
The impact of decoherence on the route to equilibrium [0.0] 射影作用素法の枠組みの中で,浴槽に結合する場合の単一量子ビットの時間発展について検討する。
量子ビットの運動の減少方程式は理想主義系で導かれる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:16:26 GMT)
The Zeldovich number: A universal dimensionless measure for the
electromagnetic field [0.0] 我々の拡張式は、電磁場の全体的な強度の普遍的な次元のない測度を与えることを示す。
基底状態の水素原子は0.025で、キセノン原子はおよそ50である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:27:15 GMT)
Tensor networks for quantum machine learning [0.0] 本稿では,MPS,PEPS,TTN,MERAなどのレイアウトを量子コンピュータにマップする方法について議論する。
また、機械学習やデータエンコーディングにどのように使用できるか、実装技術によってパフォーマンスが向上するかについても論じる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:46:56 GMT)
Symmetry-resolved entanglement in fermionic systems with dissipation [0.0] いくつかの絡み合いに関連する量の力学の力学的記述を導出する。
これらの量はすべて、絡み合った準粒子の流体力学的な記述を持つことを示す。
その結果, 大区間, 長い時間, 散逸速度の弱散逸性流体力学限界が得られた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:15:13 GMT)
Suppressing quantum circuit errors due to system variability [0.0] 本稿では,現在のノイズの多い量子コンピューティングプラットフォームに固有の誤差率の変動を考慮した量子回路最適化手法を提案する。
コスト関数を効率よく計算することで、より優れた量子ビット選択を用いて、平均的な不確かさのほとんどを回復できることが示される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:59:56 GMT)
Supersymmetric Quantum Potentials Analogs of Classical Electrostatic
Fields [0.0] 古典的な静電場とシュル「オーディンガー」のようなハミルトニアンの関係が証明されている。
古典的な静電場に類似した超対称量子ポテンシャルを構築することができる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:37:05 GMT)
Stronger EPR-steering criterion based on Schrodinger-Robertson
uncertainty relation [0.0] 両部構成系に対する完全な推論分散ステアリング基準を, 片面, 両面, 両面のシナリオで導出する。
我々のステアリング基準は、二部離散変数の場合に適用すると、2量子Werner状態に対してより厳密な範囲を提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:06:11 GMT)
Stochastic regularized majorization-minimization with weakly convex and
multi-convex surrogates [0.0] 提案アルゴリズムの最初の最適性ギャップは,非テンソル依存データ設定下での様々な手法の期待損失率で減衰することを示す。
非テンション依存データ設定の下で, 各種手法の収束点を求める。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:35:09 GMT)
Stochastic approach to evolution of a quantum system interacting with a
wave packet in squeezed number state [0.0] 連続モード圧縮数状態において、光の波束と相互作用する量子系のフィルタリングとマスター方程式を決定する。
繰り返し相互作用と測定のモデルを用いた量子系の条件進化の問題を定式化する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:42:15 GMT)
Squeezing of the quantum electromagnetic vacuum [0.0] 電磁真空は空ではなく、仮想光子で満たされることが一般的である。
これはラムシフトや自然放出のような効果をもたらす。
真空が仮想光子を持つ場合、それは非常に弱く、そのため電磁場は基底状態(真空)ではなく励起暗黒状態であることを意味するかもしれない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:57:20 GMT)
Spin-motion coupling in a circular Rydberg state quantum simulator: case
of two atoms [0.0] 円状リドベルク原子はスピンアレイの量子シミュレーションに顕著な道具である。
スピン交換と運動力学の相互作用を、調和トラップに閉じ込められた2つの相互作用する円形リドベルク原子の単純な場合で研究する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 19:16:24 GMT)
Smart-Tree: Neural Medial Axis Approximation of Point Clouds for 3D Tree
Skeletonization [0.0] 本稿では,木の点雲から分岐骨格の軸を近似する教師付き手法であるSmart-Treeを提案する。
スパースボクセル畳み込みニューラルネットワークは、各入力点の半径と方向を中間軸に向けて抽出する。
実生樹点雲上で,多種合成木集合を用いて定性解析を行い,その方法の訓練と試験を行った。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:03:46 GMT)
Simulating Malaria Detection in Laboratories using Deep Learning [0.0] マラリアは通常、血液スミアの小さなサンプルを調べることで微生物学者によって診断される。
早期に診断され適切な治療を受けた場合、マラリア感染による死亡率の低下が可能である。
WHOは、2030年にはマラリアの発生率と死亡率を90%削減し、35カ国でマラリアを除去するという大胆な目標を掲げている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:23:59 GMT)
Sample4Geo: Hard Negative Sampling For Cross-View Geo-Localisation [0.0] 対称なInfoNCE損失を伴うコントラスト学習に基づく,シンプルだが効果的なアーキテクチャを提案する。
私たちのフレームワークは、アグリゲーションモジュールの使用を不要にする、狭いトレーニングパイプラインで構成されています。
本研究は,CVUSA,CVACT,University-1652,VIGORなどの一般的なクロスビューデータセットに対して,優れた性能を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:49:49 GMT)
Rough Randomness and its Application [0.0] 本研究の目的は、さまざまな粗いプロセスを捕捉し、関連するモデルを構築し、他の機械学習アルゴリズムの有効性を探ることである。
大心的推論と呼ばれる乱数関数のクラスは、これらに中心的な役割を果たす。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:22:33 GMT)
Roots and Requirements for Collaborative AI [0.0] 本稿では,人間と人工エージェントの効果的でロバストなコラボレーションの認知的分析について述べる。
これは、コラボレーティブAIに関する第2の論文のモチベーションとコンテキストとして意図されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:27:38 GMT)
Risk-Sensitive Reinforcement Learning with Exponential Criteria [0.0] 本研究では,指数的基準が強化学習エージェントの政策のリスク感受性に及ぼす影響について検討した。
我々はモンテカルロポリシーグラディエントアルゴリズムとオンライン(時間差)アクター・クリティカルアルゴリズムの変種を開発する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:48:24 GMT)
Research on Efficiency Analysis of Microservices [0.0] 本研究では,従来の大規模サービスをnに分割した場合の効率差を分析するために,待ち行列モデルに基づく効率解析フレームワークを提案する。
複数のサービスに分割することで、システム効率が効果的に向上し、大規模サービスの時間が複数に均等に分散されている場合、最高の改善効果が達成できることを示した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 02:00:28 GMT)
Recoverability of quantum channels via hypothesis testing [0.0] 量子チャネルは、この集合上で逆転できるならば、入力状態の集合に対して十分である。
十分な量子チャネルと回復可能性のキャラクタリゼーションの簡単な証明を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 10:01:33 GMT)
QuantumDynamics.jl: A modular approach to simulations of dynamics of
open quantum systems [0.0] 我々は、新しいオープンソースのソフトウェアフレームワークQuantumDynamics.jlを紹介します。
量子系の力学をシミュレートするための様々な摂動的および非摂動的手法の実装を提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:57:13 GMT)
Quantum memories for fundamental science in space [0.0] 宇宙における基礎物理学における量子メモリの活用を推し進める。
我々は、量子メモリプラットフォームとその性能について、異なる実験と潜在的な量子メモリプラットフォームの両方について論じる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:52:22 GMT)
Quantum gas-enabled direct mapping of active current density in
percolating networks of nanowires [0.0] ナノワイヤを用いた電気的パーコレーションネットワークは、次世代透明電極の最も有望な候補である。
電流分布とそれを解釈するのに適した非線形パーコレーションモデルを空間的に解決できる実験技術がないため、これらの材料を設計するには経験則と安全性因子に依存する。
本稿では,2次元導電性材料中の活性電流を撮像する長寿命問題の解法として,新しい量子センシング技術を導入する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:23:17 GMT)
Quantics Tensor Cross Interpolation for High-Resolution, Parsimonious
Representations of Multivariate Functions in Physics and Beyond [0.0] 両スキームの利点を組み合わせた戦略である量子TCI(QTCI)を提案する。
凝縮物質物理学の応用でその可能性を説明する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:02:58 GMT)
Purification Timescales in Monitored Fermions [0.0] 我々は$mathbbZ$とU(1)対称性でマヨラナ回路とディラック回路を研究する。
混合相は$tau_Psim Lalpha(p)$で特徴づけられ、連続的に変化する指数$alpha(p)1$である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:29:31 GMT)
Privacy-Preserving Tree-Based Inference with Fully Homomorphic
Encryption [0.0] 我々は、暗号化データ上で任意の計算を実行できる強力なツールであるFHE(Fully Homomorphic Encryption)に焦点を当てる。
本稿では、FHEをツリーベースモデルに適用し、暗号化されたデータに対して最先端のソリューションを得る方法について述べる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:11:37 GMT)
On the exact quantum query complexity of $\text{MOD}_m^n$ and
$\text{EXACT}_{k,l}^n$ [0.0] 我々は、$textMOD_mn$を計算するための最適量子アルゴリズムを提案する。
我々は、0,1n$ を有限集合 $X$ が$n$ 未満であるような対称関数の広いクラスの正確な量子的クエリ複雑性を示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:33:44 GMT)
Noncommutative integration, quantum mechanics, Tannaka's theorem for
compact groupoids and examples [0.0] 位相群を有限かつコンパクトな設定で考える。
最初の節では、典型的な可観測物の定義を導入し、統計力学と量子力学の文脈でそれらを研究した。
我々は明示的な例を示し、そのうちの1つはいわゆる量子ラチェットである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:18:20 GMT)
Non-Asymptotic Pointwise and Worst-Case Bounds for Classical Spectrum
Estimators [0.0] 本稿では、スペクトル推定器の幅広いクラスに対して非漸近誤差境界を与える。
古典的なブラックマン・テューキー、バートレット、ウェルチ推定器の誤差境界を導出するために用いられる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:58:16 GMT)
Neural networks trained on synthetically generated crystals can extract
structural information from ICSD powder X-ray diffractograms [0.0] 機械学習技術は粉末X線回折画像から構造情報を抽出するのに成功している。
本稿では,各空間群の対称性演算を用いて,ランダムな座標で合成結晶を生成する方法を提案する。
我々は,1時間に数百万のオンザフライ生成された合成ディフラクトグラムに対して,Deep ResNetライクなモデルのオンライントレーニングを実演する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 09:37:29 GMT)
Multi-Resolution Online Deterministic Annealing: A Hierarchical and
Progressive Learning Architecture [0.0] 本稿では,多解像度データ空間のプログレッシブパーティショニングに基づく汎用階層型学習アーキテクチャを提案する。
各最適化問題の解は、勾配のない近似更新を用いてオンラインで推定できることを示す。
教師なしおよび教師なしの学習問題に対して、漸近収束解析と実験結果を提供する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:13:48 GMT)
Metrology and multipartite entanglement in measurement-induced phase
transition [0.0] 測定誘起相転移は、決定論的量子進化と繰り返し測定過程の競合から生じる。
我々は、量子フィッシャー情報のスケーリング動作を通じて、位相間の多粒子交絡の遷移を実演する。
この結果は、測定誘起相転移中の量子系の特徴に関する新たな知見を提供し、量子物理学の分野におけるさらなる研究の道筋を示すものである。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:45:36 GMT)
Mermin's inequalities in Quantum Field Theory [0.0] 我々はミンコフスキー真空$vert 0 rungle$, GHZ型状態を生成するユニタリ作用素を導入する。
メルミンの不等式がこれらの州で評価された場合、最大で違反されることが示される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:56:58 GMT)
Materials Discovery with Extreme Properties via AI-Driven Combinatorial
Chemistry [0.0] 我々は、データに依存しない規則に基づく逆分子デザイナであるAI駆動化学を開発する。
本モデルは,確率分布学習モデルよりも優れた材料を発見するのに適していることを示す。
我々のモデルは、タンパク質ドッキング材料とHIV阻害剤の発見という2つの実用的応用でうまく機能する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:21:43 GMT)
Large Language Models Can Be Used to Estimate the Ideologies of
Politicians in a Zero-Shot Learning Setting [0.0] 我々は、米国上院議員の潜在イデオロギーを測定するために、大きな言語モデルを使用します。
モデルが繰り返し繰り返して安定した回答を生成し、幻覚を起こさず、単一の情報源から情報を取り出すだけではありませんでした。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:48:00 GMT)
Inverting the Fundamental Diagram and Forecasting Boundary Conditions:
How Machine Learning Can Improve Macroscopic Models for Traffic Flow [0.0] 高速道路を走行する車両のフラックスと速度のデータを,固定センサで収集し,車線および車種別に分類したデータセットについて検討する。
1) 渋滞がセンサの下に現れる場合, 2) 今後センサの下に通過する車両の総量を推定する。
これらの情報片は、センサ間のトラフィックフローのダイナミクスを記述したLWRベースの1次1次マルチクラスモデルの精度を向上させるために使用される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:07:19 GMT)
Hidden Steering Nonlocality in Quantum Networks [0.0] 線形ネットワークシナリオにおける混合絡み合い状態の異なるクラスに対して、操舵非局所性の活性化が観察される。
還元ステアリングの概念を用いることで、非線形ネットワークでもステアビリティアクティベーションのインスタンスが観察される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:48:47 GMT)
Generalized partitioned local depth [0.0] 我々は、最近ベレンハウト、ムーア、メルヴィンによって導入された凝集の概念の一般化を提供する。
この定式化は2つの主要な確率的概念、すなわち局所的妥当性と支援分割を蒸留することにより、分割された局所深さの技法に基づいている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:42:16 GMT)
General properties of fidelity in non-Hermitian quantum systems with PT
symmetry [0.0] フィデリティ・サセプティビリティ(fidelity susceptibility)は、エルミート凝縮物質系の量子相転移を研究するためのツールである。
PTアンブローク状態の場合、$mathcalF$は常に実数であることが示される。
また、2本脚非エルミートSu-Schrieffer-Heeger(SSH)モデルと非エルミートXXZスピン鎖についても検討した。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:50:56 GMT)
Fine-tuning ClimateBert transformer with ClimaText for the disclosure
analysis of climate-related financial risks [0.0] 本稿では,テキストコーパスの気候変動検出に最先端のNLP技術を適用した。
転送学習を用いて、BERTとClimateBertの2つのトランスフォーマーモデルを微調整する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:25:36 GMT)
Explainable AI does not provide the explanations end-users are asking
for [0.0] 我々は、XAIのデプロイメントにおける制限について議論し、厳格な検証とともに透明性がAIシステムへの信頼を得るのに適していると結論づける。
XAI技術は、複雑なモデルや関連する予測を理解し、信頼を得ることを目標として、多くのAIシステムのユーザによって頻繁に要求される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 14:16:06 GMT)
Emerging (2+1)D massive graviton in graphene-like systems [0.0] 巨大な重力子のような重力の量子的側面は、分数量子ホール液体を用いた実験で現れる。
我々は(2+1)次元のディラックフェルミオンを用い、フェルミオンハニカム格子の連続的な極限に現れ、ボソニックモードでシミュレートされた巨大な重力子と結合する。
現在の光学格子構成に対する我々のアプローチの類似性は、近い将来、重力の量子的シグネチャを実験室でシミュレートできることを示唆している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:30:40 GMT)
Electronic structure calculations with interpolating tensor product
wavelet basis [0.0] 我々はHとHe原子と分子のシュル「オーディンガー方程式」を数値的に解く。
水素の2sと2pの励起状態も計算する。
パフォーマンスはCCCBDBやBigDFTと比較される。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:07:35 GMT)
Eigen Solution and Thermodynamic Properties of Manning Rosen Plus
Exponential Yukawa Potential [0.0] マニング・ローゼンと湯川ポテンシャルを用いたシュリンガー方程式の解析的境界状態解を得た。
エネルギー固有方程式は決定され、コンパクトな形で提示された。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 11:56:32 GMT)
Dynamic Healthcare Embeddings for Improving Patient Care [0.0] 患者, 医師, 部屋, 薬品の動的埋め込みを学習するための, 異種共進化型動的ニューラルネットワークDECENTを提案する。
学習した患者埋め込みを予測モデルに用いた結果、DECENTは死亡リスク予測タスクで最大48.1%向上していることがわかった。
学習した医師、薬品、部屋の埋め込みに関するケーススタディは、我々のアプローチが有意義で解釈可能な埋め込みを学習していることを示している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:14:15 GMT)
Dynamic Asset Allocation with Expected Shortfall via Quantum Annealing [0.0] 本稿では,動的アセット割り当て問題を解決するために,ハイブリッド量子古典アルゴリズムを提案する。
D-Waveの2000QとAdvantageの量子アニールの結果を実世界の財務データを用いて比較する。
高い相関関係を持つ資産の実験は、より優れた性能を発揮する傾向にあり、近い将来、実用的な量子アプリケーションを設計するのに役立つかもしれない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 22:47:00 GMT)
Do intermediate feature coalitions aid explainability of black-box
models? [0.0] この研究は、ブラックボックスモデルの説明可能性を支援するため、レベル構造に基づく中間概念の概念を導入する。
実際の自動車モデルとタイタニックデータセットの例で、このアプローチのユーザビリティを説明します。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:12:01 GMT)
Dissipative ground state preparation and the Dissipative Quantum
Eigensolver [0.0] H の基底状態部分空間に収束する局所 CPT 写像と停止条件を構築する。
この散逸性量子固有解法には多くの興味深い特徴があり、これは以前の基底状態生成アルゴリズムよりも有利である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:50:06 GMT)
Difficulty in learning chirality for Transformer fed with SMILES [0.0] SMILESの学習過程と化学構造との関係を代表的NLPモデルであるTransformerを用いて検討した。
結果は、トランスフォーマーは分子の部分構造を素早く学習するが、全体構造を理解するには拡張トレーニングが必要であることを示唆している。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 04:47:45 GMT)
Counteracts: Testing Stereotypical Representation in Pre-trained
Language Models [0.0] 本稿では,反例を用いた事前学習言語モデルの内部ステレオタイプ表現を簡易に検証する手法を提案する。
その結果,事前学習した言語モデルは,無関係な知識を用いた場合,ある程度の堅牢性を示すことがわかった。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:04:09 GMT)
Computational Choreography using Human Motion Synthesis [0.0] 深層ニューラルネットワークを用いた芸術的人間の動作の合成について検討する。
舞踊の動きを予測するために学習モデルを適用するという、より伝統的な応用の可能性について論じる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 03:52:17 GMT)
CLIP-ReIdent: Contrastive Training for Player Re-Identification [0.0] 事前学習したCLIPモデルのゼロショット性能をプレイヤー再識別領域に転送できるかどうかを検討する。
これまでの研究とは異なり、私たちのアプローチは完全にクラスに依存しず、大規模な事前トレーニングの恩恵を受けています。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 13:55:27 GMT)
Building artificial neural circuits for domain-general cognition: a
primer on brain-inspired systems-level architecture [0.0] 本稿では,生体神経ネットワークにフレキシブル認知に必要な機能を持たせることの意義について概説する。
機械学習モデルがより複雑になるにつれて、これらの原則は、可能なアーキテクチャの広大な領域において、価値ある方向を提供するかもしれない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:36:17 GMT)
Blow-up Algorithm for Sum-of-Products Polynomials and Real Log Canonical
Thresholds [0.0] 紙は平均誤差関数を比較的単純な対数標準しきい値(RLCT)に置き換える
RLCTは、ブローアップと呼ばれる操作によって特異性を解き放つことで得られる。
本稿では、積和(sop)と呼ばれる反復の爆破アルゴリズムについて考察する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 06:40:06 GMT)
Bayesian Optimization for Function Compositions with Applications to
Dynamic Pricing [0.0] 本稿では, 構成の形式が知られているが, 構成関数を評価するのに費用がかかる機能構成の実用的BO法を提案する。
本稿では,収益管理における動的価格設定への新たな応用を,その基盤となる需要関数の評価に費用がかかる場合に示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 15:45:06 GMT)
Automatic evaluation of herding behavior in towed fishing gear using
end-to-end training of CNN and attention-based networks [0.0] 本稿では、エンドツーエンドに訓練された3つの畳み込み型および注目型ディープアクション認識ネットワークアーキテクチャを比較した。
2ストリームCNNモデル、CNN変換器ハイブリッドモデル、純粋なトランスフォーマーモデルがエンドツーエンドで訓練され、63%、54%、10倍の分類精度が得られた。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:52:08 GMT)
An Embarrassingly Simple Approach for Wafer Feature Extraction and
Defect Pattern Recognition [0.0] 本稿では,ウェハ画像から特徴を抽出する手法を提案する。
提案手法は極めて高速で直感的であり,説明可能でありながら非パラメトリックである。
我々の特徴抽出は、解釈可能性分析によって明らかになったデータポイントの相対的な形状と位置を保ちながら、トレーニングや微調整を必要としない。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 07:00:13 GMT)
AI-in-the-Loop -- The impact of HMI in AI-based Application [0.0] 我々は,AIと人間の強みを組み合わせたループ型AIの概念を導入する。
AIを使用した推論でHMIを有効にすることで、AIと人間の強みを組み合わせた、ループ内のAIの概念を導入します。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 00:04:33 GMT)
A simple quantum system that describes a black hole [0.0] 我々はアインシュタイン方程式によって支配される創発宇宙のブラックホールを記述することを予想した。
過去の数値計算に基づいて、ブラックホールの特徴を見るのに必要な量子ビットの数を推定する。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 01:42:23 GMT)
A quantum-classical eigensolver using multiscale entanglement
renormalization [0.0] 強相関量子物質のシミュレーションのための変分量子固有解法(VQE)を提案する。
これは、対応する古典的アルゴリズムよりも計算コストがかなり低い。
イオンシャットリング機能を備えたイオントラップデバイスとしては特に魅力的である。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 18:14:06 GMT)
A large-momentum-transfer matter-wave interferometer to measure the
effect of gravity on positronium [0.0] 本稿では,ポジトロニウムの重力効果を測定するための新しい干渉計構成について報告する。
マッハ・ツェンダー物質波干渉計は単光子遷移で動作し、200eVのポジトロニウムビームに高い運動量を運ぶように設計されている。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 12:29:33 GMT)
A graph-based formalism for surface codes and twists [0.0] 我々は、ツイストで曲面コードを構築するための厳密な形式主義を提供する。
特に、曲面符号を2次元多様体上に埋め込まれた幻グラフ$G$に関連付ける。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 20:44:17 GMT)
A Landau-Zener formula for the Adiabatic Gauge Potential [0.0] 断熱ゲージ電位が遷移確率を抑制するメカニズムについて検討する。
これらの結果は、積分可能な時間依存量子ハミルトニアンのクラスにまで拡張されることを示す。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 17:56:46 GMT)
A Comprehensive Review of Spiking Neural Networks: Interpretation,
Optimization, Efficiency, and Best Practices [0.0] スパイクニューラルネットワークは、低消費電力、モバイル、その他のハードウェアに制約のある設定の可能性を秘めている。
本稿では, スパイキングニューラルネットワークの解釈, 最適化, 効率, 精度に関する最近の研究成果について述べる。
論文参考訳(メタデータ) (Tue, 21 Mar 2023 16:48:53 GMT)