Waffling around for Performance: Visual Classification with Random Words
and Broad Concepts [121.6] WaffleCLIPはゼロショット視覚分類のためのフレームワークで、LLM生成した記述子をランダムな文字と単語記述子に置き換える。
LLM生成記述子で導入された追加意味論の影響と欠点について、広範囲にわたる実験的研究を行う。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:27:32 GMT)
CONVERT:Contrastive Graph Clustering with Reliable Augmentation [110.5] 学習可能なデータ拡張によるグラフノードクラスタリングは、教師なしグラフ学習の分野でホットな研究ポイントである。
これらの戦略は依然として事前定義された拡張に依存しており、拡張グラフのセマンティクスは容易にドリフトできる。
信頼性オーグメンテーション(COVERT)を用いたContrastiVe Graph ClustEringネットワークを提案する。
本手法では,データ拡張を可逆的パーターブ・リカバリネットワークにより処理する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:07:09 GMT)
Text-Only Training for Visual Storytelling [107.2] 視覚条件付きストーリー生成問題として視覚的ストーリーテリングを定式化する。
本稿では,モダリティ間のアライメントとストーリー生成の学習を分離するテキストのみのトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:32:17 GMT)
Auxiliary Tasks Benefit 3D Skeleton-based Human Motion Prediction [106.1] 本稿では,補助的なタスクを伴うモデル学習フレームワークを提案する。
補助作業では、部分体関節の座標はマスキングまたはノイズ付加によって損なわれる。
本稿では,不完全かつ破損した動作データを処理できる新しい補助適応変換器を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:26:11 GMT)
SimFIR: A Simple Framework for Fisheye Image Rectification with
Self-supervised Representation Learning [105.0] 自己教師型表現学習に基づく魚眼画像修正のためのフレームワークであるSimFIRを紹介する。
まず魚眼画像を複数のパッチに分割し,その表現を視覚変換器で抽出する。
下流修正作業における転送性能が著しく向上し、学習された表現の有効性が検証される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:20:17 GMT)
History Aware Multimodal Transformer for Vision-and-Language Navigation [96.8] ヴィジュアル・アンド・ランゲージナビゲーション(VLN)は、指示に従う自律的な視覚エージェントの構築と、実際のシーンでのナビゲーションを目的としている。
長い水平履歴をマルチモーダルな意思決定に組み込むために,HAMT(History Aware Multimodal Transformer)を導入する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:42:07 GMT)
Point-aware Interaction and CNN-induced Refinement Network for RGB-D
Salient Object Detection [95.8] 我々は,CNNによるトランスフォーマーアーキテクチャを導入し,ポイント・アウェア・インタラクションとCNNによるリファインメントを備えた新しいRGB-D SODネットワークを提案する。
トランスフォーマーがもたらすブロック効果とディテール破壊問題を自然に軽減するために,コンテンツリファインメントとサプリメントのためのCNNRユニットを設計する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:57:49 GMT)
Universal Instance Perception as Object Discovery and Retrieval [91.0] UNIは多様なインスタンス認識タスクを統一されたオブジェクト発見・検索パラダイムに再構成する。
入力プロンプトを変更するだけで、さまざまな種類のオブジェクトを柔軟に知覚することができる。
UNIは10のインスタンスレベルのタスクから20の挑戦的なベンチマークで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:50:28 GMT)
TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation
with Question Answering [86.4] 視覚的質問応答(VQA)を用いたテキスト入力に生成した画像の忠実度を測定する自動評価指標を導入する。
そこで本研究では,12カテゴリにわたる4Kの多様なテキスト入力と25Kの質問(オブジェクト,カウントなど)からなるベンチマークを用いて,既存のテキスト・ツー・イメージ・モデルの包括的評価を行う。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:45:52 GMT)
SDDNet: Style-guided Dual-layer Disentanglement Network for Shadow
Detection [85.2] 入力シャドウ画像を背景層と影層の合成として扱い、これらの層を独立にモデル化するためのスタイル誘導デュアル層ディスタングルネットワークを設計する。
提案モデルは背景色による有害な効果を効果的に最小化し,32FPSのリアルタイム推論速度を持つ3つの公開データセットに対して優れた性能を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:10:51 GMT)
JOTR: 3D Joint Contrastive Learning with Transformers for Occluded Human
Mesh Recovery [84.7] 本稿では,3次元メッシュ復元のためのTRansformersフレームワークを用いた3次元ジョイントコントラスト学習について述べる。
提案手法は,2D$&$3D対応結果を得るために,2Dおよび3D表現を融合するエンコーダ・デコーダ変換器アーキテクチャを含む。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:43:05 GMT)
Linearity of Relation Decoding in Transformer Language Models [82.5] トランスフォーマー言語モデル(LM)で符号化された知識の多くは、関係性の観点から表現することができる。
関係のサブセットに対して、この計算は対象表現上の1つの線形変換によってよく近似されることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:59:19 GMT)
Towards Instance-adaptive Inference for Federated Learning [80.4] Federated Learning(FL)は、複数のクライアントがローカルトレーニングを集約することで、強力なグローバルモデルを学ぶことができる分散学習パラダイムである。
本稿では,FedInsという新しいFLアルゴリズムを提案する。
我々のFedInsは、Tiny-ImageNet上での通信コストが15%未満で、トップパフォーマンスの手法に対して6.64%の改善など、最先端のFLアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:04:43 GMT)
SeqTrack: Sequence to Sequence Learning for Visual Object Tracking [79.9] 視覚追跡のためのシーケンシャル・ツー・シーケンス学習フレームワークSeqTrackを提案する。
視覚的トラッキングをシーケンス生成問題とみなし、自動回帰的にオブジェクト境界ボックスを予測する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:32:54 GMT)
Optimizing quantum gates towards the scale of logical qubits [78.6] 量子ゲート理論の基本的な前提は、量子ゲートはフォールトトレランスの誤差閾値を超えることなく、大きなプロセッサにスケールできるということである。
ここでは、このような問題を克服できる戦略について報告する。
我々は、68個の周波数可変ビットの周波数軌跡をコレオグラフィーして、超伝導エラー中に単一量子ビットを実行することを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:26:40 GMT)
DealMVC: Dual Contrastive Calibration for Multi-view Clustering [78.5] マルチビュークラスタリングのための新しいデュアルコントラストキャリブレーションネットワーク(DealMVC)を提案する。
まず、グローバルなクロスビュー特徴を得るための融合機構を設計し、その上で、ビュー特徴類似性グラフと高信頼な擬ラベルグラフを整列させることにより、グローバルなコントラストキャリブレーション損失を提案する。
トレーニング手順の間、対話型クロスビュー機能は、ローカルレベルとグローバルレベルの両方で共同最適化される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:14:28 GMT)
Tipping Point Forecasting in Non-Stationary Dynamics on Function Spaces [78.1] タップポイントは急激で、急激で、しばしば非定常力学系の進化における不可逆的な変化である。
我々は、関数空間間のマッピングを学習する新しいリカレントニューラル演算子(RNO)を用いて、そのような非定常系の進化を学習する。
本稿では,物理制約から逸脱をモニタリングすることで,チップ点の予測を行う共形予測フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:42:27 GMT)
Artificial Intelligence for Web 3.0: A Comprehensive Survey [76.1] Web 3.0の現在の開発状況と、Web 3.0におけるAIテクノロジの適用について検討する。
調査では、各レイヤに存在する主な課題と課題について詳しく調べています。
私たちは、Web 3.0の基礎と成長におけるAIの重要な役割を説明します。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:36:01 GMT)
An Empirical Study of Catastrophic Forgetting in Large Language Models
During Continual Fine-tuning [74.0] カタストロフィック・ナッシング(英: Catastrophic forgetting、CF)は、機械学習において、モデルが新しい情報を学ぶ際に学習した情報を忘れたときに発生する現象である。
本研究では,大言語モデルの知識における忘れ現象を,ドメイン知識,推論,理解という観点から実証的に評価する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:53:23 GMT)
Diverse Data Augmentation with Diffusions for Effective Test-time Prompt
Tuning [73.8] DiffTPTを提案する。DiffTPTは,事前学習した拡散モデルを用いて,多種多様な情報データを生成する。
DiffTPTがゼロショット精度を平均5.13%向上することを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:20:18 GMT)
MarginMatch: Improving Semi-Supervised Learning with Pseudo-Margins [73.2] MarginMatchは、一貫性の正規化と擬似ラベルを組み合わせた新しいSSLアプローチである。
トレーニングが進むにつれて、擬似ラベル付きモデル上でのモデルの振る舞いを分析し、低品質な予測が隠蔽されることを確かめる。
CIFAR-100では,クラス毎に25ラベル,STL-10では3.78%,クラス毎に4ラベルで3.25%の誤差率向上を実現した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:19:04 GMT)
Model-Free Algorithm with Improved Sample Efficiency for Zero-Sum Markov
Games [71.0] モデルフリーのステージベースQ-ラーニングアルゴリズムはモデルベースアルゴリズムと同じ$H$依存の最適性を享受できることを示す。
本アルゴリズムは,楽観的値関数と悲観的値関数のペアとして参照値関数を更新するキーとなる新しい設計を特徴とする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:34:58 GMT)
Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.7] Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:34:29 GMT)
Do you really follow me? Adversarial Instructions for Evaluating the
Robustness of Large Language Models [70.3] 大規模言語モデル(LLM)は、以下の命令で顕著な習熟度を示しており、顧客向けアプリケーションで有用である。
逆命令 — サードパーティ攻撃者が入力したモデルにインジェクトできる。
本稿では,LLMの逆命令に対するロバスト性を自動的に評価するための先駆的ベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:21:50 GMT)
CMB: A Comprehensive Medical Benchmark in Chinese [69.7] そこで我々は,中国語の包括的医療ベンチマークであるCMB(Comprehensive Medical Benchmark)を提案する。
伝統的な中国医学はこの評価に欠かせないものであるが、全体としては成り立たない。
私たちのベンチマークは、リーダーボードの競争としてではなく、モデルの進歩を自己評価するための手段として考案されています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:51:23 GMT)
Forward-Backward Reasoning in Large Language Models for Verification [69.3] Self-Consistency citepwang2023selfConsistencyは、様々な推論チェーンをサンプリングすることを提案する。
本稿では,候補解の検証に後方推論を用いる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:55:44 GMT)
Relightable and Animatable Neural Avatar from Sparse-View Video [66.8] 本稿では、未知の照明下でのダイナミックな人間のスパースビュー(あるいはモノクラーク)ビデオから、リライザブルでアニマタブルなニューラルアバターを作成するという課題に取り組む。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:26:44 GMT)
SurgicalSAM: Efficient Class Promptable Surgical Instrument Segmentation [65.5] SurgerySAMはSAMの新しいエンドツーエンドの効率的なチューニング手法である。
外科固有の情報とSAMの事前訓練された知識を統合し、一般化を改善する。
その結果,オペレーショナルSAMは,少数のパラメータしか必要とせず,最先端のパフォーマンスを実現していることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:51:01 GMT)
Building Emotional Support Chatbots in the Era of LLMs [64.1] 我々は,Large Language Models (LLMs) の計算能力で人間の洞察を合成する革新的な方法論を導入する。
また,ChatGPTの文脈内学習の可能性を利用して,ExTESと呼ばれる感情支援対話データセットを生成する。
次に、LLaMAモデルに高度なチューニング手法を展開し、多様なトレーニング戦略の影響を検証し、最終的に感情的支援の相互作用に細心の注意を払ってLLMを出力する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:49:18 GMT)
Chinese Spelling Correction as Rephrasing Language Model [63.7] Chinese Spelling Correctionは、ある文中の潜在的なスペルエラーを検出し、修正することを目的としている。
現在の最先端の手法は、CSCをシーケンスタギングタスクと文対上の細いBERTベースのモデルとみなしている。
ReLM(Rephrasing Language Modeling$)を提案する。このモデルでは,文字から文字へのタグ付けではなく,追加のスロットを埋め込むことで文全体を言い換えるように訓練されている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:04:28 GMT)
Dynamic Kernel-Based Adaptive Spatial Aggregation for Learned Image
Compression [63.6] 本稿では,空間アグリゲーション機能の拡張に焦点をあて,動的カーネルベースの変換符号化を提案する。
提案したアダプティブアグリゲーションはカーネルオフセットを生成し、コンテント条件付き範囲の有効な情報をキャプチャして変換を支援する。
実験により,本手法は,最先端の学習手法と比較して,3つのベンチマークにおいて高い速度歪み性能が得られることを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:34:51 GMT)
Instance Neural Radiance Field [62.2] 本稿では,bf inerflong あるいは inerf と呼ばれる,学習に基づく最初の NeRF 3D インスタンスセグメンテーションパイプラインを提案する。
個別の3Dインスタンスマスクを生成するNeRFのサンプル特徴に対して、3Dプロポーザルベースのマスク予測ネットワークを採用する。
inerfは任意の3Dポイントでインスタンス情報をクエリすることができ、NeRFオブジェクトのセグメンテーションと操作を大幅に強化する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:23:28 GMT)
GraMMaR: Ground-aware Motion Model for 3D Human Motion Reconstruction [61.8] 本研究では,GraMMaRという3次元人体動作再構成のための新しいグラウンド・アウェア・モーション・モデルを提案する。
GraMMaRは、動きシーケンスの各時間ステップにおいて、ポーズにおける遷移の分布と、各関節面と接地面の間の相互作用を学習する。
運動と地面への距離変化との整合性を明確に促進するように訓練されている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:39:51 GMT)
Don't lose the message while paraphrasing: A study on content preserving
style transfer [61.4] スタイル伝達研究の現実的な応用には,コンテンツ保存が不可欠である。
形式性伝達領域の例において、様々なスタイル転送モデルを比較する。
我々は,スタイル伝達のための最先端技術について,精密な比較研究を行っている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:41:08 GMT)
ALADIN-NST: Self-supervised disentangled representation learning of
artistic style through Neural Style Transfer [60.7] 我々は、画像に描かれた意味的内容から、より強く絡み合った視覚芸術スタイルの表現を学習する。
スタイルと内容の絡み合いに強く対処することで、スタイル固有のメトリクスが大きく向上することを示します。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:27:35 GMT)
Distributed Extra-gradient with Optimal Complexity and Communication
Guarantees [60.6] 複数のプロセッサ/ワーカー/クライアントがローカルなデュアルベクトルにアクセス可能なマルチGPU設定において、モノトン変分不等式(VI)問題を考察する。
モノトーンVI問題に対するデファクトアルゴリズムであるExtra-gradientは、通信効率が良くないように設計されている。
そこで本稿では,VI の解法に適した非バイアスで適応的な圧縮手法である量子化一般化外部勾配 (Q-GenX) を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:15:04 GMT)
ZhiJian: A Unifying and Rapidly Deployable Toolbox for Pre-trained Model
Reuse [59.5] 本稿では、PyTorchバックエンドを利用して、モデル再利用のための包括的でユーザフレンドリなツールボックスであるZhiJianを紹介する。
ZhiJianは、PTMによるターゲットアーキテクチャ構築、PTMによるターゲットモデルチューニング、およびPTMに基づく推論を含む、モデル再利用に関するさまざまな視点を統一する新しいパラダイムを提示している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:12:13 GMT)
Contrastive Model Adaptation for Cross-Condition Robustness in Semantic
Segmentation [58.2] 意味的セグメンテーションのための正規-逆条件モデル適応について検討する。
提案手法は, コントラスト学習を通じて条件不変の特徴を学習するために, このような画像ペアを利用する。
いくつかの正規-逆適応ベンチマークにおけるモデル適応のための最先端セマンティックセマンティックセマンティクス性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:24:32 GMT)
Weakly-supervised 3D Pose Transfer with Keypoints [57.7] 3Dポーズ転送の主な課題は、1) 異なる文字で同じポーズを行うペアトレーニングデータの欠如、2) ターゲットメッシュからポーズと形状情報を分離すること、3) 異なるトポロジを持つメッシュに適用することの難しさである。
本稿では,これらの課題を克服するためのキーポイントベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:02:11 GMT)
iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.2] トラジェクトリと意図予測を用いた分散マルチエージェント強化学習アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:43:51 GMT)
Reinforced Self-Training (ReST) for Language Modeling [56.8] 人間からのフィードバック(RLHF)からの強化学習は、人間の好みに合わせることで、大きな言語モデル(LLM)の出力の品質を向上させることができる。
強化自己学習(Reinforced Self-Training, ReST)と呼ばれる, バッチ強化学習(RL)の成長にインスパイアされたLLMを人間の好みに合わせるための簡単なアルゴリズムを提案する。
この結果から,ReSTは自動測定値と機械翻訳ベンチマークの人的評価によって,計算とサンプル効率で翻訳品質を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:12:48 GMT)
Chat-3D: Data-efficiently Tuning Large Language Model for Universal
Dialogue of 3D Scenes [56.7] 3Dシーンの理解は幅広い用途で注目されている。
本稿では,事前学習した3次元表現の3次元視覚的知覚能力と,高度なLCMの印象的な推論と会話能力を組み合わせたChat-3Dを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:52:15 GMT)
The Unreasonable Effectiveness of Large Language-Vision Models for
Source-free Video Domain Adaptation [56.6] Source-Free Video Unsupervised Domain Adaptation (SFVUDA) メソッドは、ラベル付きソースデータセットでトレーニングされたアクション認識モデルを、ラベル付きターゲットデータセットに適応するタスクで構成される。
従来のアプローチでは、ターゲットデータ自体から派生した自己スーパービジョンを活用してSFVUDAに対処しようと試みてきた。
我々は,LLVMがよりリッチな世界を含むという理論的根拠により,Large Language-Vision Models (LLVMs) の "web-supervision" を利用するアプローチをとる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:12:05 GMT)
Swarm Bug Algorithms for Path Generation in Unknown Environments [56.1] 我々は,古典経路生成アルゴリズムCom,Bug1,Bug2のSwarmCom,SwarmBug1,SwarmBug2と呼ばれるSwarm一般化を提案する。
潜在的なアプリケーションには、損傷した環境が典型的である検索・救助操作が含まれる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:34:22 GMT)
Learning Lightweight Object Detectors via Multi-Teacher Progressive
Distillation [56.1] 本稿では,教師検出器の知識を学生に段階的に伝達する,知識蒸留への逐次的アプローチを提案する。
私たちの知識を最大限に活用するために、私たちはTransformerベースの教師検出器から、畳み込みベースの学生まで、初めて知識を抽出しました。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:17:08 GMT)
KnowledGPT: Enhancing Large Language Models with Retrieval and Storage
Access on Knowledge Bases [55.9] KnowledGPTは、様々な知識ベースで大きな言語モデルをブリッジするための包括的なフレームワークである。
検索プロセスでは思考プロンプトプログラムを使用し,KBの検索言語をコード形式で生成する。
KnowledGPTは、個々のユーザ要求に合わせて、知識をパーソナライズされたKBに格納する機能を提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:07:00 GMT)
DetZero: Rethinking Offboard 3D Object Detection with Long-term
Sequential Point Clouds [55.8] 既存のオフボード3D検出器は、無限の逐次点雲を利用するために常にモジュラーパイプライン設計に従っている。
その結果, 物体の運動状態は, 物体中心の精製段階において必然的な課題となること, 物体の運動状態は, 物体軌道を十分に生成できないこと, 物体中心の精製段階において必然的な課題となること, の2つの理由から, オフボード型3D検出器の完全なポテンシャルは明らかにされていないことがわかった。
これらの問題に対処するために,DetZero という,オフボード型3次元物体検出の新たなパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:37:46 GMT)
Learning Global-aware Kernel for Image Harmonization [55.6] 画像調和は、背景を基準として前景画素を適応的に調整することで、合成画像の視覚的不整合問題を解決することを目的としている。
既存の手法では、前景と背景の間の局所的な色変換や領域マッチングが採用されている。
本稿では,長距離バックグラウンド参照を包括的に考慮した地域調和のための,GKNet(Global-Aware Kernel Network)を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:16:14 GMT)
Identity-Seeking Self-Supervised Representation Learning for
Generalizable Person Re-identification [55.2] 従来のDG ReID法では、アノテーションのコストが高いため、トレーニングにラベル付きデータを限定的に使用していた。
本稿では,ISR(Identity-seeking Self-supervised Representation Learning)法を提案する。
ISRは、最大重み付き二部マッチング問題としてインスタンスアソシエーションをモデル化することにより、フレーム間画像から正のペアを構築する。
ISRは市場1501で87.0%、MSMT17で56.4%、それぞれ5.0%、19.5%となっている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:46:27 GMT)
mCL-NER: Cross-Lingual Named Entity Recognition via Multi-view
Contrastive Learning [54.5] CrossNERは多言語コーパスの不足により不均一な性能から生じる課題に直面している。
言語横断的名前付きエンティティ認識(mCL-NER)のためのマルチビューコントラスト学習を提案する。
40言語にまたがるXTREMEベンチマーク実験では、従来のデータ駆動型およびモデルベースアプローチよりもmCL-NERの方が優れていることを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:02:29 GMT)
Pedestrian Environment Model for Automated Driving [54.2] 歩行者の位置とポーズ情報を含む環境モデルを提案する。
画像から人間のポーズ推定器を用いて骨格情報を抽出する。
位置の3D情報を得るために,車両の位置と合わせて連続するフレームからデータを集約する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:10:58 GMT)
EgoSchema: A Diagnostic Benchmark for Very Long-form Video Language
Understanding [53.3] Egoは、250時間以上の実際のビデオデータにまたがる、非常に長い形式のビデオ質問回答データセットである。
それぞれの質問に対して、Egoは3分間のビデオクリップに基づいて、与えられた5つのオプションの中から正しい回答を選択する必要がある。
Egoは、第2の最も近いデータセットよりも5.7倍、他のビデオ理解データセットより10倍長い時間長を持つ。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:59:59 GMT)
Bootstrap Motion Forecasting With Self-Consistent Constraints [52.9] 本稿では,デュアル一貫性制約とマルチ擬似目標監視を用いた動き予測のための新しいフレームワークを提案する。
動作予測タスクは、過去の空間的および時間的情報を組み込むことで、車両の将来の軌跡を予測する。
DCMSの鍵となる設計は、トレーニング期間中に空間的および時間的摂動の下で予測された軌道を規則化するデュアル一貫性制約(Dual Consistency Constraints)である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:47:44 GMT)
Language-enhanced RNR-Map: Querying Renderable Neural Radiance Field
maps with natural language [51.8] 自然言語クエリプロンプトを用いた視覚ナビゲーションのための言語拡張型Renderable Neural Radiance Mapを提案する。
Le-RNR-Mapは、各ピクセルに配置された遅延符号からなるグリッド構造を用いる。
CLIPをベースとした埋め込みコードによりRNRマップを強化し,ラベルデータを追加せずに自然言語検索を可能にする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:27:01 GMT)
Frequency Perception Network for Camouflaged Object Detection [51.3] 周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:30:46 GMT)
Good Intentions: Adaptive Parameter Management via Intent Signaling [50.0] そこで本研究では,既存の機械学習スタックに自然に統合された新たなインテントシグナリング機構を提案する。
次に、このメカニズムに基づいて、完全に適応的でゼロチューニングのパラメータマネージャであるAdaPMについて説明する。
私たちの評価では、AdaPMは、最先端のパラメータマネージャにマッチするか、あるいはパフォーマンスが良くなりました。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:17:53 GMT)
How Does Pruning Impact Long-Tailed Multi-Label Medical Image
Classifiers? [49.4] プルーニングは、ディープニューラルネットワークを圧縮し、全体的なパフォーマンスに大きな影響を及ぼすことなく、メモリ使用量と推論時間を短縮する強力なテクニックとして登場した。
この研究は、プルーニングがモデル行動に与える影響を理解するための第一歩である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:40:30 GMT)
Label Shift Adapter for Test-Time Adaptation under Covariate and Label
Shifts [48.8] テスト時間適応(TTA)は、推論中にバッチ・バイ・バッチ方式で、事前訓練されたモデルをターゲットドメインに適応することを目的としている。
これまでのほとんどのTTAアプローチは、ソースとターゲットのドメインのデータセットがバランスの取れたラベルの分布を持っていると仮定している。
本稿では,ラベルシフトを効果的に扱うために,既存のTTAアプローチに組み込む新しいラベルシフトアダプタを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:37:37 GMT)
Change is Hard: A Closer Look at Subpopulation Shift [48.0] 本稿では,部分群における共通シフトを識別し,説明する統一的なフレームワークを提案する。
次に、ビジョン、言語、医療領域の12の現実世界のデータセットで評価された20の最先端アルゴリズムのベンチマークを作成します。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:15:28 GMT)
Log Parsing Evaluation in the Era of Modern Software Systems [47.4] 自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:19:22 GMT)
GrammarGPT: Exploring Open-Source LLMs for Native Chinese Grammatical
Error Correction with Supervised Fine-Tuning [46.8] オープンソースのLarge Language ModelであるGrammarGPTを導入し、中国語の文法的誤り訂正の可能性を探る。
手がかり付き文法的誤りに対しては,ChatGPTを案内して非文法的文を生成する手法を提案する。
手がかりのない文法的誤りに対しては,公開ウェブサイトから非文法的文章を収集し,手作業で修正した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:58:42 GMT)
Factuality Detection using Machine Translation -- a Use Case for German
Clinical Text [45.9] 本研究は、機械翻訳を用いて、英語データをドイツ語に翻訳し、トランスフォーマーに基づく事実性検出モデルを訓練する簡単な解を提案する。
臨床的テキストを自動的に処理する際には、特定の症状が明示的に存在せず、おそらくは存在せず、言及されていない、あるいは肯定されていない場合、その違いが生じるため、現実性は重要な役割を果たす。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:24:06 GMT)
Quantum Circuit Completeness: Extensions and Simplifications [45.0] 量子回路に関する最初の完全な方程式理論は、最近導入されたばかりである。
我々は方程式理論を単純化し、いくつかの規則が残りの規則から導出されることを証明した。
完全な方程式理論は、アンシラやクビットの破棄を伴う量子回路に拡張することができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:45:36 GMT)
Nuclei Segmentation with Point Annotations from Pathology Images via
Self-Supervised Learning and Co-Training [44.1] 核分割のための弱い教師付き学習法を提案する。
粗いピクセルレベルのラベルは、ボロノイ図に基づく点アノテーションから導かれる。
病理画像の核分割に適した自己教師付き視覚表現学習法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:56:32 GMT)
End-to-end Alternating Optimization for Real-World Blind Super
Resolution [44.0] Blind Super-Resolution (SR) は通常2つのサブプロブレムを含む。
与えられた低分解能(LR)画像の劣化を推定し、高分解能(HR)画像に超解凍する。
本稿では,SR画像の劣化と復元を1つのモデルで推定できる交互最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:55:09 GMT)
A Dual-Perspective Approach to Evaluating Feature Attribution Methods [43.2] 本稿では,直観的特性を明らかにする忠実度パラダイムの中で,音性と完全性という2つの新しい視点を提案する。
健全性は、どの特徴が真に予測的特徴であるかを評価する一方、完全性は、結果の帰属が予測的特徴をどの程度うまく明らかにするかを調べる。
これらのメトリクスを主流属性法に適用し、特徴属性法を解析・比較するための新しいレンズを提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:41:04 GMT)
Towards Semi-supervised Learning with Non-random Missing Labels [42.7] クラス遷移追跡に基づく Pseudo-Rectifying Guidance (PRG) は、MNAR (Missing Not At Random) ラベルのために考案された。
PRGは、疑似修正手順によって引き起こされたクラス分布とクラス遷移の履歴情報を統一する。
さまざまなMNARシナリオにおけるPRGの優れたパフォーマンスを示し、最新のSSLアプローチよりも優れています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:09:36 GMT)
SuperAnimal pretrained pose estimation models for behavioral analysis [42.2] 我々は、SuperAnimalと呼ばれる新しい手法により、ディープラーニングモデルの開発とデプロイを可能にする一連の技術革新を提案する。
SuperAnimalは、45種以上の動物ポーズモデルが2種類しかないビデオ推論を可能にする。
本稿では,マウスの行動分類と馬の歩行解析におけるモデルの有用性について述べる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:12:31 GMT)
Federated Reinforcement Learning for Electric Vehicles Charging Control
on Distribution Networks [42.0] マルチエージェント深部強化学習(MADRL)はEV充電制御において有効であることが証明されている。
既存のMADRLベースのアプローチでは、配電ネットワークにおけるEV充電/放電の自然な電力フローを考慮できない。
本稿では,マルチEV充電/放電と最適電力流で動作する放射分布ネットワーク(RDN)を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:34:46 GMT)
Long-term Causal Inference Under Persistent Confounding via Data
Combination [41.5] 実験データと観測データの両方が利用可能である場合の長期治療効果の同定と推定について検討した。
長期の成果は長期間の遅延後にのみ観測されるため、実験データでは測定されず、観測データでのみ記録される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:01:05 GMT)
Black Box Few-Shot Adaptation for Vision-Language models [41.5] ヴィジュアル・ランゲージ(V-L)モデルは、視覚的・言語的モダリティを整合させるために、対照的な学習で訓練された。
本稿では,プリコンパイルされた画像とテキストの特徴に基づいて,V-L小ショット適応のためのブラックボックス手法について述べる。
対象領域におけるV-L再アライメントに対する単純な線形アプローチである線形特徴アライメント(LFA)を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:22:41 GMT)
Few-Shot Table-to-Text Generation with Prompt Planning and Knowledge
Memorization [41.2] 数ショット設定でテーブル・ツー・テキスト生成をターゲットとするPromptMizeという新しいフレームワークを提案する。
私たちのフレームワークの設計は、プロンプトプランナーと知識アダプタの2つの側面で構成されています。
本モデルは,人的・自動的な評価によって判断される品質を著しく向上させる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:51:48 GMT)
Synthesizing Physically Plausible Human Motions in 3D Scenes [41.1] 物理的にシミュレートされたキャラクタが,多様で散らばった,見えない場面で長時間のインタラクションタスクを実行できるフレームワークを提案する。
具体的には、InterConには2つの補完的なポリシーが含まれており、文字が対話状態に入り、去ることができる。
異なる場所でのオブジェクトとのインタラクションを生成するために,3Dシーンの自由空間において文字の動きを保ち続けるために,ポリシーに従う軌道であるNavConをさらに設計する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:17:49 GMT)
Ref-DVGO: Reflection-Aware Direct Voxel Grid Optimization for an
Improved Quality-Efficiency Trade-Off in Reflective Scene Reconstructio [40.9] 最近の手法では、反射シーンの処理におけるベースラインよりも大幅に改善されている。
本研究では,従来のボリュームレンダリングに基づく暗黙的・明示的手法による復元品質の向上について検討する。
提案手法は, 競合する手法と比較して, 競合する品質効率のトレードオフを実現する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:44:13 GMT)
Learning Through Guidance: Knowledge Distillation for Endoscopic Image
Classification [40.4] 内視鏡は消化管(GI)の根底にある異常を同定する上で重要な役割を担っている。
ディープラーニング、特にCNN(Convolution Neural Networks)は、従来の機能エンジニアリングを使わずに自動機能学習を実行するように設計されている。
KDに基づく3つの学習フレームワーク、応答ベース、特徴ベース、関係ベースメカニズムについて検討し、関係ベース学習を支援するために、新しい多面的注意型特徴融合機構を導入する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:02:11 GMT)
When Noisy Labels Meet Long Tail Dilemmas: A Representation Calibration
Method [40.3] 実世界のデータセットは騒々しくラベル付けされ、クラス不均衡である。
本稿では,表現キャリブレーション手法RCALを提案する。
我々は,表現キャリブレーションの有効性を論じるために理論的結果を得る。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:05:57 GMT)
Bag of Tricks for Long-Tailed Multi-Label Classification on Chest X-Rays [40.1] 本報告では,ICCV CVAMD 2023 CXR-LT コンペティションにおけるソリューションの概要について述べる。
我々は,CXR診断の有効性を,いくつかの先進的な設計を統合することで実証的に検討した。
私たちのフレームワークは最終的に、競争テストセットで0.349 mAPを獲得し、トップ5にランクインしました。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:25:55 GMT)
Enhance Diffusion to Improve Robust Generalization [39.9] emphAdversarial Training (AT)は、敵の摂動に対する最も強力な防御機構の1つである。
本稿では, 第一のATフレームワークであるGD-AT(Projected Gradient Descent Adversarial Training)に焦点を当てる。
本稿では,分散項を操作し,計算負荷を実質的に伴わない堅牢な一般化を改善するための新しい手法であるemphDiffusion Enhanced Adversarial Training (DEAT)を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:43:01 GMT)
Beam Retrieval: General End-to-End Retrieval for Multi-Hop Question
Answering [39.8] マルチホップQAは、複数の関連するパスを見つけ、複雑な質問に答えるためにステップバイステップの推論を行う。
従来の手法では、関連する通路を選択するための検索モジュールが開発されたが、2つのホップを超えるシナリオでは課題に直面している。
マルチホップQAのための一般的なエンドツーエンド検索フレームワークであるBeam Retrievalを紹介する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:24:14 GMT)
FaceCLIPNeRF: Text-driven 3D Face Manipulation using Deformable Neural
Radiance Fields [39.6] 既存の操作方法は広範囲の人的労働を必要とする。
我々のアプローチは、NeRFで再構成された顔を操作するために単一のテキストを必要とするように設計されている。
我々のアプローチは、NeRFで再構成された顔のテキスト駆動による操作に最初に対処するものである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:06:09 GMT)
Learning A Coarse-to-Fine Diffusion Transformer for Image Restoration [39.1] 画像復元のための粗大な拡散変換器(C2F-DFT)。
C2F-DFTは拡散自己注意(DFSA)と拡散フィードフォワードネットワーク(DFN)を含んでいる
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:59:59 GMT)
A Reminder of its Brittleness: Language Reward Shaping May Hinder
Learning for Instruction Following Agents [38.9] 我々は,LSSの明らかな成功は不安定であり,事前の陽性所見はRLの基線が弱いことに起因すると論じる。
我々は、RS報酬を用いて訓練されたエージェントが純粋なRLエージェントよりも緩やかに収まるという理論的および実証的な証拠を提供した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:11:14 GMT)
Mitigating Semantic Confusion from Hostile Neighborhood for Graph Active
Learning [38.5] Graph Active Learning(GAL)は、グラフニューラルネットワーク(GNN)のパフォーマンスを最大化するためのアノテーションのための、グラフで最も情報に富むノードを見つけることを目的としている。
Gal戦略は、特にグラフがノイズの多い場合、選択したトレーニングセットに意味的な混乱をもたらす可能性がある。
本稿では,意味的混乱を緩和するために,グラフのためのセマンティック・アウェア・アクティブ・ラーニング・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:06:54 GMT)
Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.1] ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:51:01 GMT)
Towards General Low-Light Raw Noise Synthesis and Modeling [37.9] 生成モデルにより信号非依存ノイズを合成する新しい視点を導入する。
具体的には、信号に依存しないノイズと信号に依存しないノイズを物理と学習に基づく方法で合成する。
このようにして、本手法は一般的なモデルとみなすことができ、つまり、異なるISOレベルの異なるノイズ特性を同時に学習することができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:10:15 GMT)
Towards Inadequately Pre-trained Models in Transfer Learning [37.7] より優れたImageNet事前訓練モデルでは、下流タスクへの転送性が向上することが示されている。
本稿では,同じ事前学習過程において,十分に訓練されていない中新世のモデルが,完全に訓練されたモデルより優れていることを示す。
我々の発見は、事前学習中、モデルはまず大きな特異値に対応するスペクトル成分を学習する傾向があることを示唆している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:27:39 GMT)
Single-Cell Multimodal Prediction via Transformers [36.5] 異なるモード間の複雑な相互作用をモデル化するために、scMoFormerを提案する。
scMoFormerは24/1221(Top 2%)のランクでカグル銀メダルを獲得したが、NeurIPS 2022の大会ではアンサンブルは無かった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:10:50 GMT)
Joint Local Relational Augmentation and Global Nash Equilibrium for
Federated Learning with Non-IID Data [36.4] フェデレーテッド・ラーニング(FL)は分散機械学習のパラダイムであり、サーバーと一連のクライアントの協力を必要とする。
本稿では,局所的リレーショナル拡張(LRA)と大域的ナッシュ均衡(GNE)の2つの主要モジュールからなるFedRANEを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:17:51 GMT)
CLIP-Driven Universal Model for Organ Segmentation and Tumor Detection [36.1] 本稿では,Contrastive Language-Image Pre-trainingから学習したテキストをセグメンテーションモデルに組み込んだCLIP駆動ユニバーサルモデルを提案する。
提案モデルは14のデータセットから作成され、合計3,410個のCTスキャンを使用してトレーニングを行い、さらに3つの追加データセットから6,162個の外部CTスキャンで評価する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:37:32 GMT)
Overwriting Pretrained Bias with Finetuning Data [36.1] 目的タスクと機密属性の相互関係を概念化した場合のバイアスや,データセット内の特定のグループを過小評価する場合のバイアスについて検討する。
事前訓練されたモデルの上に微調整されたモデルは、実際にそれらのバイアスを継承できるが、(2)このバイアスは、比較的小さな介入によって修正できる。
その結果、下流タスクのバイアスを軽減するためには、微調整データセットの慎重なキュレーションが重要であることが示唆され、事前訓練されたモデルのバイアスを補うこともできる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:01:07 GMT)
Learning Semi-supervised Gaussian Mixture Models for Generalized
Category Discovery [36.0] 本稿では,表現学習とクラス数推定を交互に行うEMライクなフレームワークを提案する。
汎用画像分類データセットと細粒度オブジェクト認識データセットの双方について,本フレームワークの評価を行った。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:12:37 GMT)
Watch Your Steps: Local Image and Scene Editing by Text Instructions [34.8] テキスト命令で暗黙的に所望の編集領域をローカライズする手法を提案する。
InstructPix2Pix (IP2P) を利用して,IP2P予測と命令の有無の相違を識別する。
関連マップは、編集を行うために各ピクセルを変更することの重要性を伝え、修正を導くために使用される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:39:06 GMT)
MindMap: Knowledge Graph Prompting Sparks Graph of Thoughts in Large
Language Models [34.4] 我々は、KG入力を解釈し、暗黙の知識と検索された外部知識を組み合わせて推論する能力を備えたLCMを実現するプロンプトパイプラインを構築した。
実験では、MindMapのプロンプトは、目覚ましい経験的な利益をもたらす。例えば、MindMapでGPT-3.5をプロンプトすると、GPT-4よりも圧倒的なパフォーマンスが得られる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:59:50 GMT)
Hidden Biases of End-to-End Driving Models [34.2] ほぼすべての最先端の手法で再帰する2つのバイアスを同定し、CARLAにおける観察の進歩に不可欠である。
TF++は、Longest6とLAVベンチマークで最初にランク付けするシンプルなエンドツーエンドのメソッドで、Longest6の最高の先行作業で11の駆動スコアを獲得しています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:45:46 GMT)
Self-Edit: Fault-Aware Code Editor for Code Generation [34.0] 大規模言語モデル(LLM)は、競合するプログラミングタスクのコードを生成する素晴らしい能力を示している。
競合するプログラミングタスクにおけるコード品質を改善するために,Self-Editという生成・編集手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:20:27 GMT)
IMM: An Imitative Reinforcement Learning Approach with Predictive
Representation Learning for Automatic Market Making [33.2] 強化学習技術は量的取引において顕著な成功を収めた。
既存のRLベースのマーケットメイキング手法のほとんどは、単価レベルの戦略の最適化に重点を置いている。
Imitative Market Maker (IMM) は、準最適信号に基づく専門家の知識と直接的な政策相互作用の両方を活用する新しいRLフレームワークである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:04:09 GMT)
Cost-effective On-device Continual Learning over Memory Hierarchy with
Miro [32.9] Miroは、リソース状態に基づいてCLシステムを動的に構成する新しいシステムランタイムである。
Miroは、私たちが構築するベースラインシステムを大幅に上回り、コスト効率を継続的に向上します。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:36:04 GMT)
Hessian-Aware Bayesian Optimization for Decision Making Systems [32.7] 我々は,多数のパラメータでパラメータ化された多層アーキテクチャを効率的に最適化するために,ヘシアン対応ベイズ最適化を導入する。
実験の結果,提案手法は資源制約と不正なフィードバック設定の下で,複数のベンチマークで効果的に動作することが示された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:39:00 GMT)
EgoPoser: Robust Real-Time Ego-Body Pose Estimation in Large Scenes [32.5] ヘッドポーズとハンドポーズだけでのフルボディのエゴ位置推定は、ヘッドセットベースのプラットフォーム上でのアバター表現を効果的に活用するための研究の活発な領域となっている。
本稿では,ヘッドセットを用いたエゴ位置推定のための入力表現を再考し,新しい動作分解法を導入することで,これらの制約を克服するEgoPoserを提案する。
実験の結果,EgoPoserは600fps以上の高速な推論速度を維持しながら,定性的かつ定量的に最先端の手法より優れていることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:50:11 GMT)
Optimal Prediction Using Expert Advice and Randomized Littlestone
Dimension [32.3] 古典的な結果は、リトルストーン次元を用いた決定論的学習者によって達成可能な最適誤りを特徴づける。
クラス $mathcalH$ の学習における最適予測誤差は、そのランダム化されたリトルストーン次元と等しいことを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:35:27 GMT)
Consciousness in Artificial Intelligence: Insights from the Science of
Consciousness [32.0] このレポートは、AI意識に対する厳密で実証的なアプローチを主張し、実証している。
我々は、反復処理理論、グローバルワークスペース理論、高次理論、予測処理、注意スキーマ理論など、意識に関するいくつかの顕著な科学的理論を調査した。
私たちの分析は、現在のAIシステムが意識的でないことを示唆していますが、意識的なAIシステムを構築するための明らかな障壁がないことも示しています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:10:16 GMT)
Clinical Camel: An Open Expert-Level Medical Language Model with
Dialogue-Based Knowledge Encoding [31.9] 臨床研究に適したオープン・大型言語モデル(LLM)であるクリニカル・カメルについて述べる。
QLoRAを用いてLLaMA-2を微調整し,医療用LCMの医療用ベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:19:02 GMT)
Event-Guided Procedure Planning from Instructional Videos with Text
Supervision [31.8] 本研究は,テキスト管理による指導ビデオからの手順計画の課題に焦点をあてる。
この課題の重要な課題は、観察された視覚状態と観測されていない中間動作の間の大きな意味的ギャップである。
本稿では,まず観測された状態から事象を推定し,その状態と予測された事象の両方に基づいて行動計画を行う,新しいイベント誘導パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:43:28 GMT)
Efficient Utilization of Large Pre-Trained Models for Low Resource ASR [31.6] ベトナム語とドイツ語の医学領域から,低リソースの会話音声コーパスについて検討した。
本研究では,大規模事前学習モデルの簡易微調整を超えて,教師なし手法の利点を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:49:08 GMT)
RFD-ECNet: Extreme Underwater Image Compression with Reference to
Feature Dictionar [31.4] 本稿では,特徴辞書(RFD-ECNet)に着目した極端な圧縮ネットワークを提案する。
RFD-ECNetは、最も先進的なVVCよりも31%の大幅なBDレートの削減を実現した最初の研究である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:20:46 GMT)
Half-Hop: A graph upsampling approach for slowing down message passing [31.3] メッセージパッシングニューラルネットワークにおける学習を改善するためのフレームワークを提案する。
我々のアプローチは基本的に、各エッジに"スローノード"を追加することで、元のグラフのエッジをサンプリングする。
提案手法は入力グラフのみを修正し,既存のモデルでプラグイン・アンド・プレイしやすくする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:24:15 GMT)
Experimental Design for Causal Effect Identification [31.2] 必要な効果を識別するために,最小限のコストで介入の収集を設計する問題を考察する。
まず、この問題がNPハードであることを証明し、次に最適な解や対数近似を求めるアルゴリズムを提案する。
これらのアルゴリズムは準最適解に反する可能性があるが、我々のシミュレーションはランダムグラフに対する小さな後悔を達成していることを示している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:30:13 GMT)
Global Adaptation meets Local Generalization: Unsupervised Domain
Adaptation for 3D Human Pose Estimation [31.2] textitPoseDAは、MPI-INF-3DHP上で61.3mmのMPJPEを達成する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:55:15 GMT)
EdgeMA: Model Adaptation System for Real-Time Video Analytics on Edge
Devices [31.0] EdgeMAは、実世界のビデオストリームのシフトにモデルを適応させるように設計された、実用的で効率的なビデオ分析システムである。
重要度重み付けに基づくモデル適応手法を導入し,ラベル分布シフトに対応するためのモデル更新に特化して設計した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:49:44 GMT)
MaScQA: A Question Answering Dataset for Investigating Materials Science
Knowledge of Large Language Models [29.7] この研究は、材料学生の知識とスキルを必要とする材料領域から、650の挑戦的な質問のデータセットをキュレートする。
GPT-4はGPT-3.5と比較して最高の性能(62%の精度)を示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:51:05 GMT)
From Chaos Comes Order: Ordering Event Representations for Object
Recognition and Detection [29.7] 本稿では、Gromov-Wasserstein Discrepancy(GWD)に基づくタスクの適切な表現を、生イベントとそれらの表現の間で選択する方法を示す。
ニューラルネットワークのトレーニングよりも計算が約200倍高速で、イベント表現のタスクパフォーマンスランキングを保存する。
最適化された表現は1Mpxデータセットで1.7mAP、Gen1データセットで0.3mAP、確立された2つのオブジェクト検出ベンチマークで3.8%、Mini N-ImageNetベンチマークで3.8%、既存の表現よりも優れています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:23:08 GMT)
Automated and Context-Aware Repair of Color-Related Accessibility Issues
for Android Apps [28.9] アプリケーションにおける色関連アクセシビリティ問題を修正するための,自動かつコンテキスト対応の修復手法であるIrisを提案する。
新たなコンテキスト認識技術を活用することで、Irisは最適な色と属性対ペアのローカライゼーションの重要なフェーズを解決した。
実験の結果,Irisは91.38%の補修成功率を高い効率と効率で達成できることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:03:11 GMT)
Knowledge-inspired Subdomain Adaptation for Cross-Domain Knowledge
Transfer [28.8] ほとんどの最先端のディープドメイン適応技術は、ソースとターゲットのサンプルをグローバルな方法で整列させる。
ドメイン適応をきめ細かいものにするためのKISA(Knowledge-Inspired Sub Domain Adaptation)フレームワークを提案する。
大規模な実験により,KISAは不正検出や交通需要予測タスクにおいて顕著な結果をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:46:38 GMT)
Parallel and Distributed Graph Neural Networks: An In-Depth Concurrency
Analysis [28.5] グラフニューラルネットワーク(GNN)は、ディープラーニングにおいて最も強力なツールのひとつだ。
ノード分類、グラフ分類、リンク予測などの非構造化ネットワーク上の複雑な問題を高精度に解決する。
しかし、GNNの推論とトレーニングは複雑であり、不規則なグラフ処理の特徴と密度と正規な計算を一意に組み合わせている。
この複雑さは、現代の大規模並列アーキテクチャ上でGNNを効率的に実行することを非常に困難にしている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:28:36 GMT)
FashionLOGO: Prompting Multimodal Large Language Models for Fashion Logo
Embeddings [27.2] ロゴ埋め込みの堅牢性を向上させるために,テキスト知識を補助として活用する新しい手法を提案する。
我々は、画像埋め込みクエリがテキスト埋め込みから補足的知識を自動学習できるようにするために、クロスアテンショントランスフォーマーを採用している。
実世界の3つのデータセットに対する実験により、FashionLOGOは一般化されたロバストなロゴ埋め込みを学習することを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:30:26 GMT)
RepViT: Revisiting Mobile CNN From ViT Perspective [26.9] 軽量ビジョントランスフォーマー(ViT)は、リソース制約のあるモバイルデバイス上での軽量畳み込みニューラルネットワーク(CNN)と比較して、パフォーマンスとレイテンシの低下を実証する。
我々は軽量CNNの効率的な設計を再考し、モバイルデバイスにおけるその可能性を強調する。
我々は、軽量VTの効率的なアーキテクチャ選択を統合することで、標準軽量CNN、特にMobileNetV3のモバイルフレンドリ性を漸進的に強化する。
RepViTは、最先端の軽量ViTよりも優れており、様々なビジョンタスクにおいて好ましいレイテンシを示している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:43:24 GMT)
Neural-PBIR Reconstruction of Shape, Material, and Illumination [26.6] ニューラルネットワークを用いた物体再構成と物理ベースの逆レンダリング(PBIR)を組み合わせた高精度かつ高効率な物体再構成パイプラインを提案する。
我々のパイプラインは、まず、ニューラルネットワークSDFに基づく形状再構成を利用して、高品質であるが、潜在的に不完全な物体形状を生成する。
最終段階では、ニューラルネットワークによる予測により、PBIRを行い、初期結果を洗練し、オブジェクトの形状、材料、照明の最終的な高品質な再構築を得る。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:16:21 GMT)
Spatially and Spectrally Consistent Deep Functional Maps [26.2] サイクル一貫性は、長い間、形状の集合内の地図を共同最適化するための強力な先駆体として利用されてきた。
本稿では,非剛形形状マッチングにおける最先端技術と考えられるDeep Functional Mapsのアプローチにおける有用性について検討する。
本稿では,教師なしの深部関数写像の設計について述べる。これはスペクトルと点表現の下で学習された地図の調和を効果的に実施する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:04:44 GMT)
ICAR: Image-based Complementary Auto Reasoning [25.2] 本稿では、類似性(色、幾何学、テクスチャなど)と相補性(テーブルと椅子の組立など)からなる視覚互換性の概念を提案する。
本稿では,フレキシブルマスク付きエンコーダ,カテゴリ予測アーム,自動回帰視覚埋め込み予測アームを備えた「フレキシブル双方向変換器(FBT)」を提案する。
SOTA法と比較すると、FITBでは最大5.3%、FITBでは9.6%、ファッションや家具では22.3%、SFIDでは31.8%となる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:55:54 GMT)
Predicting Crop Yield With Machine Learning: An Extensive Analysis Of
Input Modalities And Models On a Field and sub-field Level [25.0] 我々は,高解像度の収量マップを地中真理データとして使用し,サブフィールドレベルでの作物および機械学習モデルの訓練を行う。
我々は、天気、土壌、DEMデータを含む他の相補的なモダリティを含む入力データの一次モダリティとしてSentinel-2衛星画像を使用する。
提案手法は,グローバルな範囲で利用可能な入力モダリティを用いて,グローバルな拡張性を実現する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:40:38 GMT)
UniNeXt: Exploring A Unified Architecture for Vision Recognition [24.8] 視覚バックボーンのための汎用アーキテクチャUniNeXtを提案する。
我々は、空間トークンミキサーを、畳み込みモジュールとアテンションモジュールの両方を含む、様々な典型的なモダンなデザインでインスタンス化する。
驚いたことに、我々のUniNeXtは、従来の最先端技術よりも優れた、素直なローカルウィンドウアテンションを備えています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:37:52 GMT)
Learning logic programs by combining programs [24.3] 我々は、小さな非分離型プログラムを学習し、それらを組み合わせるアプローチを導入する。
我々は制約駆動型LPシステムにアプローチを実装した。
ゲームプレイやプログラム合成など,複数の領域に対する実験により,既存のアプローチを劇的に上回る結果が得られた。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:43:54 GMT)
Learning to Learn: How to Continuously Teach Humans and Machines [24.3] カリキュラムは、人間と複数の連続機械学習アルゴリズムの学習結果に一貫して影響を与えている。
本稿では,クラス間特徴類似度に基づいてキュリキュラの設計とランク付けを行う,Curriculum Designer (CD) という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:24:56 GMT)
ImGeoNet: Image-induced Geometry-aware Voxel Representation for
Multi-view 3D Object Detection [24.3] ImGeoNetは画像に基づく3Dオブジェクト検出フレームワークで、画像による幾何学的なボクセル表現によって3D空間をモデル化する。
我々は、ARKitScenes、ScanNetV2、ScanNet200という3つの屋内データセットで実験を行う。
本研究は,画像による幾何認識表現により,画像に基づく手法がより優れた検出精度を達成できることを示唆している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:49:38 GMT)
Equitable Restless Multi-Armed Bandits: A General Framework Inspired By
Digital Health [23.8] Restless Multi-armed Bandits (RMAB) は、限られたリソースを持つシーケンシャルな設定でアルゴリズムによる意思決定を行う一般的なフレームワークである。
RMABは、公衆衛生、治療スケジュール、密猟、そしてこの仕事の動機であるデジタル健康などの繊細な決定にますます使われています。
我々は、RMABの公平な目標を初めて検討し、公平性文学、ミニマックス報酬、最大ナッシュ福祉の2つの目標について考察する。
我々は,前者に対する水充填アルゴリズムと,異なる群の大きさのバランスをとるための理論的動機付けされたニュアンスをもつグリーディアルゴリズムをそれぞれ解くための効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:00:27 GMT)
Uni-NLX: Unifying Textual Explanations for Vision and Vision-Language
Tasks [23.7] 自然言語説明(NLE)は、人間に優しい自然文によるモデルの予測を補うことを目的としている。
我々は,すべてのNLEタスクを単一かつコンパクトなマルチタスクモデルに統合する統一フレームワークUni-NLXを提案する。
1Mの複合NLEサンプルをトレーニングすることにより、単一の統一フレームワークが同時に7つのNLEタスクを実行することができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:15:55 GMT)
Task Relation Distillation and Prototypical Pseudo Label for Incremental
Named Entity Recognition [23.7] InERのためのタスク関係蒸留法とプロトタイプ擬似ラベル(RDP)を提案する。
本手法は従来の最先端手法に比べて,マイクロF1のスコアが6.08%,マクロF1のスコアが7.71%増加し,大幅な改善を実現している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:36:56 GMT)
A Survey on Model Compression for Large Language Models [23.4] 大規模言語モデル(LLM)は、自然言語処理タスクに革命をもたらした。
それらの大きなサイズと計算上の要求は、実践的な展開に重大な課題をもたらす。
モデル圧縮の分野は、これらの制限を緩和するための重要な研究領域として現れている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:16:24 GMT)
Modeling Edge Features with Deep Bayesian Graph Networks [23.3] 元のモデルで使用する離散状態にベイズネットワークマッピングエッジ機能を追加する。
計算複雑性をエッジ数に線形に保つことにより,大規模グラフ処理に有効である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:29:17 GMT)
Person Re-Identification without Identification via Event Anonymization [23.1] ディープラーニングは、イベントカメラからのイメージを高い忠実度で再構築することができ、イベントベースのビジョンアプリケーションに対するプライバシーに対する潜在的な脅威を再導入した。
本稿では,プライバシを保護し,人物ReIdのような下流タスクを実行するという2つの目的のために,エンドツーエンドのネットワークアーキテクチャを共同で提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 23:00:58 GMT)
CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception [22.3] カメラレーダ融合フレームワークであるカメラレーダネット(CRN)を提案する。
CRNは、様々なタスクに対して意味的にリッチで空間的に正確な鳥眼視(BEV)特徴マップを生成する。
リアルタイム設定のCRNは20FPSで動作し、nuScenes上のLiDAR検出器に匹敵する性能を実現している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:27:43 GMT)
Diversifying AI: Towards Creative Chess with AlphaZero [22.2] 多様なAIシステムからなるチームが、グループとしてより多くのアイデアを生成し、最適なAIを選択することで、困難なタスクにおいて1つのAIより優れているかどうかを調査する。
我々の実験は、AZ_dbが様々な方法でチェスをし、グループとしてより多くのパズルを解き、より均質なチームを上回ることを示唆している。
我々の研究結果は、AIエージェントのチームでは、人間のチームと同じように多様性のボーナスが現れることを示唆している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:27:33 GMT)
Exploiting Point-Wise Attention in 6D Object Pose Estimation Based on
Bidirectional Prediction [22.1] 本稿では,ポイントワイズ対応機構を備えた双方向対応予測ネットワークを提案する。
私たちの重要な洞察は、各モデルポイントとシーンポイントの相関が、ポイントペアマッチの学習に不可欠な情報を提供するということです。
LineMOD, YCB-Video, Occ-LineMODの公開データセットに対する実験結果から, 提案手法が他の最先端手法よりも優れた性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:18:13 GMT)
Hyperbolic Face Anti-Spoofing [22.0] 双曲空間におけるよりリッチな階層的および差別的なスプーフィングキューを学習することを提案する。
単調なFAS学習では、特徴埋め込みはポアンカーボールに投影され、双対対対数回帰層は分類のためにカスケードされる。
双曲空間における消失勾配問題を緩和するために,双曲モデルのトレーニング安定性を高めるために,新しい特徴クリッピング法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:18:21 GMT)
Kernel-Based Tests for Likelihood-Free Hypothesis Testing [21.1] 2つのバランスの取れたクラスから$n$の観測が与えられたとき、追加の$m$入力をラベル付けするタスクを考える。
この問題の特別なケースはよく知られており、$m=1$はバイナリ分類に対応し、$mapprox n$は2サンプルテストに相当する。
最近の研究で、$m$と$n$の間に根本的なトレードオフがあることが判明した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:24:03 GMT)
MV-ROPE: Multi-view Constraints for Robust Category-level Object Pose
and Size Estimation [20.4] RGBに基づくカテゴリレベルの6Dオブジェクトのポーズとサイズ推定のための新しいフレームワークを提案する。
私たちの斬新さは、現実的なシナリオで一般的に利用できる多視点情報を活用することにあります。
実験の結果,提案手法は最先端のRGB-D手法に匹敵する性能を示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:29:54 GMT)
Fighting Fire with Fire: Can ChatGPT Detect AI-generated Text? [20.4] 人間の書き起こし対AI生成テキスト検出におけるChatGPTのゼロショット性能を評価する。
我々は,ChatGPTがAI生成テキストや人文テキストの検出に対称的に有効であるかどうかを実証的に検討する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:34:38 GMT)
Deformable Model-Driven Neural Rendering for High-Fidelity 3D
Reconstruction of Human Heads Under Low-View Settings [20.1] 低視点で3Dの頭部を再構築することは技術的な課題を呈する。
幾何学的分解を提案し、2段階の粗大なトレーニング戦略を採用する。
提案手法は,低視野環境下での再現精度と新規ビュー合成の観点から,既存のニューラルレンダリング手法より優れる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:33:47 GMT)
Human Motion Diffusion as a Generative Prior [20.0] 拡散先行に基づく3種類の合成法を提案する。
長いシーケンス生成の課題に取り組みます。
並列合成を用いて、2人の世代に向けた有望なステップを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:24:41 GMT)
Joint Power Control and Data Size Selection for Over-the-Air Computation
Aided Federated Learning [19.9] フェデレートラーニング(FL)は、複数のモバイルデバイスで生成された大量の生データを処理するための、魅力的な機械学習アプローチとして登場した。
本稿では,基地局と移動機器の信号増幅係数を協調的に最適化することを提案する。
提案手法は平均二乗誤差(MSE)を大幅に低減し,FLの性能向上に有効である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:01:02 GMT)
Refining a Deep Learning-based Formant Tracker using Linear Prediction
Methods [19.9] 2つの洗練されたDeepFormantsトラッカーは、オリジナルのDeepFormantsと、5つの既知の伝統的なトラッカーと比較された。
その結果、データ駆動型DeepFormantsトラッカーは従来のトラッカーよりも優れており、QCP-FB分析を用いてDeepFormantsが予測したフォルマントを精製することで最高の性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:32:32 GMT)
ARAI-MVSNet: A multi-view stereo depth estimation network with adaptive
depth range and depth interval [19.3] マルチビューステレオ(MVS)は幾何学的コンピュータビジョンの基本的な問題である。
適応的な全画素深度範囲と深度間隔を実現するために,新しい多段粗大化フレームワークを提案する。
我々のモデルは最先端の性能を達成し、競争一般化能力を得る。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:52:11 GMT)
MotionAug: Augmentation with Physical Correction for Human Motion
Prediction [19.2] 本稿では,動き合成を取り入れた動きデータ拡張手法を提案する。
提案手法は,リカレントニューラルネットワークとグラフ畳み込みネットワークを併用した人間の動き予測モデルにおいて,従来の雑音に基づく動き増進手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:00:58 GMT)
Fast Inference and Update of Probabilistic Density Estimation on
Trajectory Prediction [19.2] 自動運転車や社会ロボットのような安全クリティカルな応用には、高速な計算と正確な確率密度推定が必要である。
本稿では,フローチェインという新しい正規化フローベース軌道予測モデルを提案する。
FlowChainは、カーネル密度推定のような追加の近似を必要とする生成モデルよりも高速である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:16:21 GMT)
Edit Temporal-Consistent Videos with Image Diffusion Model [19.0] 大規模なテキスト・ツー・イメージ(T2I)拡散モデルが拡張され、テキストガイドによる動画編集が可能になった。
しかしながら、生成されたビデオは、ビデオの時間的特性が忠実にモデル化されていないため、通常、空間的不規則性と時間的不整合を示す。
本稿では,高機能なテキスト誘導ビデオ編集における時間的不整合性を軽減するため,エレガントで効果的な時間的一貫性ビデオ編集手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:40:55 GMT)
Are They All Good? Studying Practitioners' Expectations on the
Readability of Log Messages [18.8] ログメッセージの重要性にもかかわらず、ログメッセージの可読性を構成する標準がまだ不足している。
我々は,ログメッセージの可読性に対する期待を調査するため,産業従事者17人と一連のインタビューを行った。
ディープラーニングモデルと機械学習モデルの両方が、平均80.0%以上のバランスの取れた精度でログメッセージの読みやすさを効果的に分類できることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:53:24 GMT)
Beyond Sharing: Conflict-Aware Multivariate Time Series Anomaly
Detection [18.8] 本稿では,衝突を意識した異常検出アルゴリズムCADを紹介する。
その結果,バニラMMoEの粗悪な性能は,MTS定式化の入力出力ミスアライメント設定に起因していることが判明した。
CADは3つの公開データセットの平均F1スコアが0.943であることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:00:01 GMT)
Bridging High-Quality Audio and Video via Language for Sound Effects
Retrieval from Visual Queries [18.2] ビデオ中のモーメントにマッチする適切なサウンドエフェクト(SFX)を見つけるのは難しく、時間を要する作業です。
ビデオフレームからHQ SFXを推薦するフレームワークを提案する。
自動データキュレーションパイプラインを用いてトレーニングした本システムは,Wildデータに基づいてトレーニングしたベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:38:30 GMT)
SRMAE: Masked Image Modeling for Scale-Invariant Deep Representations [17.9] マスクド画像モデリング(MIM)のための自己教師型信号として画像スケールを用いることを提案する。
我々のフレームワークは、予測ヘッドの設計に超解像(SR)の最新の進歩を利用する。
また,低分解能表情認識タスクにおいて74.84%の精度を達成し,現状のFMDを9.48%超えた。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:43:14 GMT)
Can Knowledge Graphs Simplify Text? [17.6] KGSimpleは教師なしのテキスト単純化の新しいアプローチである。
我々のモデルは、重要な情報を保持することを学ぶことで、KGから始めるときのテキストを単純化することができる。
現在利用可能なKG-to-textデータセット上で、KGSimpleモデルの様々な設定を評価する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:51:40 GMT)
Interpretable Graph Neural Networks for Tabular Data [17.5] IGNNetは学習アルゴリズムを制約し、解釈可能なモデルを生成する。
IGNNetは最先端の機械学習アルゴリズムに匹敵するパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:35:02 GMT)
Discretization-Induced Dirichlet Posterior for Robust Uncertainty
Quantification on Regression [17.5] 不確実性定量化は、現実世界のアプリケーションにディープニューラルネットワーク(DNN)をデプロイするために重要である。
AuxUE(Auxiliary Uncertainity Estimator)は、主タスク予測の不確実性を推定する最も効果的な方法の1つである。
回帰タスクにおけるより堅牢な不確実性定量化のための一般化されたAuxUEスキームを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:54:11 GMT)
Direct Learning-Based Deep Spiking Neural Networks: A Review [17.3] スパイキングニューラルネットワーク(SNN)は、二分スパイク情報伝達機構を備えた有望な脳誘発計算モデルである。
本稿では,直接学習に基づく深部SNN研究について,主に精度向上法,効率改善法,時間的ダイナミクス利用法に分類する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:51:45 GMT)
Towards Automatically Addressing Self-Admitted Technical Debt: How Far
Are We? [17.1] 本稿では,ニューラルベース生成モデルによって技術的負債を自動的に返済できる範囲を実験的に検討する。
595のオープンソースプロジェクトから5,039件の自己申告技術的負債(SATD)の削除日程を抽出することから始めます。
このデータセットを用いて、7つの異なる生成ディープラーニング(DL)モデル構成を実験する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:27:32 GMT)
Why do networks have inhibitory/negative connections? [17.0] 関数を表現することは、(i)自然知能における脳と(ii)人工知能における深層ネットワークの両方の主要な役割である。
負の重みがない場合、非減少活性化関数を持つニューラルネットワークは普遍的な近似器ではないことを証明した。
非負のディープネットワークでは表現できない表現空間の幾何学的性質に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:27:29 GMT)
A Review of Panoptic Segmentation for Mobile Mapping Point Clouds [16.8] 3Dポイント・クラウド・パノプティック・セグメンテーションは、(i)各ポイントをセマンティック・クラスに割り当て、(ii)各クラスのポイントをオブジェクト・インスタンスに分割する複合タスクである。
近年,セマンティックセグメンテーションの急速な進歩を基盤として,このような総合的な3Dシーン理解への関心が高まっている。
しかし、現在、屋外のモバイル・マッピングデータのパノプティック・セグメンテーションに関する研究はほとんど行われておらず、体系的な比較は行われていない。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:19:51 GMT)
Dual Gauss-Newton Directions for Deep Learning [16.8] ガウスニュートンのような手法に着想を得て,ディープラーニングの目的の構造を活用する利点について検討した。
このような方向オーラクルを2つの定式化によって計算し,計算上の利点と新たな洞察を両立させることを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:44:05 GMT)
Severity Classification of Parkinson's Disease from Speech using Single
Frequency Filtering-based Features [16.7] 本研究では、単一周波数フィルタリング(SFF)法に基づく2種類の新しい特徴セットを提案する。
提案されたSFFCCとMFCC-SFFは母音タスクに対して5.8%と2.3%の相対的な改善を与えた。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:22:47 GMT)
Attention-free Spikformer: Mixing Spike Sequences with Simple Linear
Transforms [16.5] SpikformerはSNNの自己注意能力と生物学的特性を統合する
Spiking Self-Attention (SSA)モジュールを導入し、スパイクフォームクエリ、キー、バリューを使ってスパースなビジュアル機能をミックスする。
我々はニューロモルフィックデータセットと静的データセットの両方を用いて画像分類に関する広範な実験を行った。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:12:24 GMT)
D-IF: Uncertainty-aware Human Digitization via Implicit Distribution
Field [16.3] そこで本研究では,暗黙の値を適応不確かさ分布に置き換えて,表面への距離に基づいて点を区別する手法を提案する。
この分散の遷移に対する単純な値は、ほぼすべてのベースラインに対して大きな改善をもたらす。
その結果、不確実性分布損失を用いてトレーニングされたモデルは、より複雑なしわや現実的な手足を捉えることができることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:31:11 GMT)
On Data Imbalance in Molecular Property Prediction with Pre-training [16.2] プレトレーニングと呼ばれるテクニックは、機械学習モデルの精度を向上させるために使用される。
事前トレーニングでは、対象タスクでモデルをトレーニングする前に、対象タスクとは異なるプレテキストタスクでモデルをトレーニングする。
本研究では,入力データの不均衡に対処する効果的な事前学習手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:04:14 GMT)
Representation Learning on Hyper-Relational and Numeric Knowledge Graphs
with Transformers [16.0] ハイパーリレーショナル知識グラフ(英語版)が最近研究され、三重項が一組の等化子と関連付けられている。
我々はHyNTという名前の統一フレームワークを提案し、三重項または等化子に数値リテラルを含むハイパーリレーショナル知識グラフの表現を学習する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:09:32 GMT)
InGram: Inductive Knowledge Graph Embedding via Relation Graphs [16.0] 本稿では,インダクティブ・ナレッジGRAph eMbedding法であるInGramを提案する。
実験の結果,InGramは様々な帰納的学習シナリオにおいて,14種類の最先端手法より優れていた。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:08:26 GMT)
ChatGPT-HealthPrompt. Harnessing the Power of XAI in Prompt-Based
Healthcare Decision Support using ChatGPT [16.0] 本研究は,OpenAIのChatGPTを中心に,大規模言語モデル(LLM)を臨床意思決定に適用するための革新的なアプローチを提案する。
提案手法では,タスク記述,特徴記述,ドメイン知識の統合を前提とした文脈的プロンプトの利用を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:50:46 GMT)
Dealing With Non-stationarity in Decentralized Cooperative Multi-Agent
Deep Reinforcement Learning via Multi-Timescale Learning [15.9] 分散協調深層学習(MARL)は多目的学習フレームワークである。
分散化深層MARLにおける重要な課題の1つは、複数のエージェントが同時に学習している場合の学習環境の非定常性である。
マルチスケール学習に基づく分散協調型MARLアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:58:03 GMT)
Controlling Federated Learning for Covertness [15.9] 学習者は、ノイズの多い勾配評価を提供する分散オラクルを何度もクエリすることで、関数の$f$を最小化することを目指している。
同時に、学習者は、学習者のクエリを監視する悪意のある盗聴者から$argmin f$を隠そうとする。
本稿では,学習者が学習と難読化のどちらを動的に選択するかという,textitcovert や textitlearner-private 最適化の問題について考察する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:16:41 GMT)
MIPS-Fusion: Multi-Implicit-Submaps for Scalable and Robust Online
Neural RGB-D Reconstruction [15.9] 本稿では,新しい暗黙表現-多目的サブマップに基づく,堅牢でスケーラブルなオンラインRGB-D再構成手法を提案する。
本手法では,脳神経サブマップを走査軌道に沿って漸進的に配置し,局所的な神経束の調整によって効率よく学習する。
初めてランダム化された最適化は、学習プロセスにいくつかの重要な設計を施したニューラルトラッキングにおいて可能となり、高速カメラモーションの下でも効率的でロバストなトラッキングを可能にする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:33:16 GMT)
Fine-grained Text and Image Guided Point Cloud Completion with CLIP
Model [15.6] 本稿では,ポイントクラウド補完のための新しいマルチモーダル融合ネットワークを提案する。
我々は、大量の画像テキストペアで訓練された事前学習された視覚言語モデルを採用する。
点雲完了のための細粒度テキスト記述の有効性をさらに検討するため,細粒度記述を用いたテキストコーパスを構築した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:05:18 GMT)
Predict to Detect: Prediction-guided 3D Object Detection using
Sequential Images [15.5] 本稿では,予測スキームを検出フレームワークに統合した新しい3Dオブジェクト検出モデルP2Dを提案する。
P2Dは、過去のフレームのみを用いて現在のフレーム内のオブジェクト情報を予測し、時間的動きの特徴を学習する。
次に,予測対象情報に基づいて,バードアイビュー(Bird's-Eye-View,BEV)特徴を注意深く活用する時間的特徴集約手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:34:33 GMT)
Controlling class layout for deep ordinal classification via constrained
proxies learning [15.2] 本稿では,各順序クラスのプロキシを学習し,それらのプロキシを制約することでクラス全体のレイアウトを調整可能な,制約付きプロキシ学習(CPL)手法を提案する。
実験により,提案手法は特徴抽出器の同一設定下において,従来の深層順序分類法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:30:29 GMT)
Cross-city Few-Shot Traffic Forecasting via Traffic Pattern Bank [15.1] 交通パターンバンク(TPB)を用いた都市間交通予測フレームワークを提案する。
TPBは、訓練済みのトラフィックパッチエンコーダを使用して、データ豊富な都市からの生のトラフィックデータを高次元空間に投影する。
隣接行列は、下流の時空間モデルで将来のトラフィックを予測するために構成される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:29:57 GMT)
Optimal Resource Allocation for U-Shaped Parallel Split Learning [15.1] Split Learning(SL)は、データ所有者の生データサンプルを明らかにすることなく、モデルトレーニングのための有望なアプローチとして登場した。
従来のSLは必然的に、(最後のレイヤを持つ)テールモデルがサーバに置かれるべきとして、ラベルのプライバシをリークする。
有望な解決策の1つは、U字型アーキテクチャを使用して、初期のレイヤと最後のレイヤの両方をユーザ側に置いておくことである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:07:45 GMT)
On the Power of Gradual Network Alignment Using Dual-Perception
Similarities [14.8] ネットワークアライメント(NA)は、ネットワーク構造とノード属性に基づいて、2つのネットワーク間のノードの対応を見つけるタスクである。
我々の研究は、既存のNA手法のほとんどが一度に全てのノード対を発見しようとしたため、ノード対応の暫定的な発見によって得られた情報を利用していないという事実に動機づけられている。
強い一貫性を示すノード対をフル活用することにより、ノード対を徐々に発見する新しいNA法であるGrad-Alignを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:03:10 GMT)
FastViT: A Fast Hybrid Vision Transformer using Structural
Reparameterization [14.7] 我々は、最先端のレイテンシ-精度トレードオフを得るハイブリッドビジョントランスフォーマーアーキテクチャであるFastViTを紹介する。
我々は,当社のモデルがCMTの3.5倍,EfficientNetの4.9倍,モバイルデバイスのConvNeXtの1.9倍で,ImageNetデータセットと同じ精度であることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:10:59 GMT)
Self-distillation Regularized Connectionist Temporal Classification Loss
for Text Recognition: A Simple Yet Effective Approach [14.7] 損失関数の観点から、テキスト認識モデルの最適化方法を示す。
CTCに基づく手法は、性能と推論速度のバランスが良いため、実際は広く用いられているが、それでも精度は低下している。
本稿では,CTCモデルを用いた自己蒸留方式を提案し,この問題に対処する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:32:57 GMT)
Guiding Diamond Spin Qubit Growth with Computational Methods [14.7] 電子中心スピンデコヒーレンスの理論計算をNV-スピン浴ワークフローの不可欠な部分として用いた。
次に、理論モデルを用いて最大確率推定器を構築し、試験試料のキャラクタリゼーションを可能にする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:53:42 GMT)
On the Effectiveness of Log Representation for Log-based Anomaly
Detection [14.6] 本研究は,従来のログ解析研究から広く採用されているログ表現技術について検討し,比較する。
6つのログ表現手法を選択し、7つのMLモデルと4つの公開ログデータセットで評価する。
また、ログ表現技術を採用する際に、ログ解析プロセスと異なる特徴集約アプローチの影響についても検討する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:18:59 GMT)
Reactive Motion Generation on Learned Riemannian Manifolds [14.3] 人間の操作者が示す複雑な動作パターンに基づいて動作スキルを生成する方法を示す。
そこで本研究では,学習多様体を変形させることにより,オンザフライのエンドエフェクタ/マルチランブ障害物回避を容易にする手法を提案する。
7-DoFロボットマニピュレータを用いて,タスク空間と関節空間のシナリオにおいて,我々のアプローチを広範囲に検証した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:05:39 GMT)
Metacognitive Prompting Improves Understanding in Large Language Models [14.3] メタ認知プロンプト(MP)は,人間の内省的推論プロセスにインスパイアされた戦略である。
MPを用いて、LLMは構造化された自己認識評価の体系的なシリーズを実行する。
MPは、標準とチェーンのプロンプトを含む既存のプロンプトメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:53:15 GMT)
Forensic Data Analytics for Anomaly Detection in Evolving Networks [13.8] 多くのサイバー犯罪や攻撃が、悪意ある活動を行うために進化するネットワークで開始されている。
本章では,ネットワーク異常検出のためのディジタル分析フレームワークについて紹介する。
実世界の進化するネットワークデータに関する実験は、提案した法医学データ分析ソリューションの有効性を示している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:09:33 GMT)
MatSpectNet: Material Segmentation Network with Domain-Aware and
Physically-Constrained Hyperspectral Reconstruction [13.5] MatSpectNetは、RGB画像から回復したハイパースペクトル画像で材料を分割する新しいモデルである。
現代のカメラにおける色知覚の原理を利用して、再構成されたハイパースペクトル画像を制限する。
平均ピクセル精度は1.60%増加し、最新の出版物と比べて平均クラス精度は3.42%改善している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:19:57 GMT)
Can ChatGPT Detect Intent? Evaluating Large Language Models for Spoken
Language Understanding [13.4] 大規模な事前訓練された言語モデルは、強力な言語理解能力を示している。
複数のベンチマークで異なるサイズのChatGPTやOPTなどのモデルを評価した。
しかし、スロットフィリングではモデルが悪化し、その性能はASR誤差に敏感であることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:23:20 GMT)
Realistic Full-Body Tracking from Sparse Observations via Joint-Level
Modeling [13.3] 頭部と手の3つの追跡信号だけで、正確でスムーズな全身運動を得ることができる2段階のフレームワークを提案する。
本フレームワークは,第1段階の関節レベル特徴を明示的にモデル化し,第2段階の関節レベル相関を捉えるために,空間的および時間的トランスフォーマーブロックの交互化に時間的トークンとして利用する。
AMASSモーションデータセットと実捕集データに関する広範な実験により,提案手法は既存の手法と比較して,より正確で滑らかな動きを実現することができることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:27:55 GMT)
HiLo: Exploiting High Low Frequency Relations for Unbiased Panoptic
Scene Graph Generation [13.2] Panoptic Scene Graph Generation (PSG) は、画像のセグメント化と、被写体、オブジェクト、およびそれらの関係を抽出してシーングラフを構築することを目的としている。
この課題は関係カテゴリーの長い問題に悩まされ、偏りのある手法は高周波関係に傾倒する。
既存のバイアスのない手法は、低周波関係を支持するためにデータ/ロスリバランシングによって、長い尾の問題に対処する。
既存の手法は互いに有利だが,提案するHiLoフレームワークでは,低周波・高周波関係に特化している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:31:40 GMT)
A Cross-Scale Hierarchical Transformer with Correspondence-Augmented
Attention for inferring Bird's-Eye-View Semantic Segmentation [13.0] マルチカメラビュー画像に条件付きBEVセマンティックセマンティックセマンティクスを推定することは、安価なデバイスとリアルタイム処理としてコミュニティで人気がある。
セマンティックセグメンテーション推論のための対応強化された注目度を持つ新しいクロススケール階層変換器を提案する。
マルチカメラビュー画像上でのBEVセマンティックセマンティックセグメンテーションの推測における最先端性能を有する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:33:34 GMT)
BERT4CTR: An Efficient Framework to Combine Pre-trained Language Model
with Non-textual Features for CTR Prediction [12.9] 本稿では,非テキスト特徴とテキスト特徴の相互作用の恩恵を受けることができるUni-Attention機構を備えた新しいフレームワークBERT4CTRを提案する。
BERT4CTRは、マルチモーダル入力を処理する最先端フレームワークを大幅に上回り、Click-Through-Rate (CTR)予測に適用できる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:25:54 GMT)
Adaptive occlusion sensitivity analysis for visually explaining video
recognition networks [12.8] 咬合感度分析は、単一画像分類の分析に一般的に用いられる。
本稿では,映像認識ネットワークの意思決定過程を視覚的に説明するための手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:36:46 GMT)
Over-the-Air Computation Aided Federated Learning with the Aggregation
of Normalized Gradient [12.7] オーバー・ザ・エア(Over-the-air)は、フェデレートラーニング(FL)のための通信効率のよい解である。
このようなシステムでは、プライベート損失関数の反復手順を更新し、すべてのモバイルデバイスで送信する。
この問題を回避するため,局所勾配を正規化して増幅する手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:15:47 GMT)
MetaGPT: Meta Programming for Multi-Agent Collaborative Framework [12.7] メタプログラミングアプローチとして効率的な人間を多エージェントコラボレーションに組み込んだ,革新的なフレームワークであるMetaGPTを紹介する。
具体的には、MetaGPTは、Standardized Operating Procedures (SOP) を構造化調整を強化するプロンプトにエンコードする。
アウトプットの検証と複合エラーの最小化のために、モジュール形式のアウトプットを委任し、ドメインの専門家に匹敵する専門知識を持つエージェントに権限を与える。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:01:31 GMT)
Quantum Money from Abelian Group Actions [12.6] 公開鍵量子マネーの構築と、量子ライティングと呼ばれる強化版も提供します。
本研究は,グループ行動の汎用群モデルにおいて,妥当な計算仮定の下でのセキュリティを実証する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 23:12:15 GMT)
On the Evaluation of Neural Code Translation: Taxonomy and Benchmark [12.4] 我々は,コードの翻訳タスクを,その複雑さと知識依存度に応じて4つの一次タイプに分類する分類法を開発した。
次に、これらの4つのカテゴリで既存のアプローチがどのように機能するかを徹底的に分析する。
以上の結果から,最先端のコード翻訳モデルでは1型,2型が優れているが,3型,4型といった知識に依存しない翻訳に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:05:27 GMT)
Cross-model Fairness: Empirical Study of Fairness and Ethics Under Model
Multiplicity [12.4] 1つの予測者が同じパフォーマンスモデルのグループからアドホックに選択された場合、個人は害を受ける可能性がある、と我々は主張する。
これらの不公平性は実生活で容易に発見でき、技術的手段だけで緩和することは困難である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:53:25 GMT)
PlaneRecTR: Unified Query Learning for 3D Plane Recovery from a Single
View [12.3] PlaneRecTRはTransformerベースのアーキテクチャで、単一のコンパクトモデルで単一のビュープレーンリカバリに関連するすべてのサブタスクを統合する。
提案した統合学習はサブタスク間の相互利益を達成し,パブリックScanNetとNYUv2-Planeデータセット上での最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:56:24 GMT)
PMET: Precise Model Editing in a Transformer [11.7] PMETはTransformer Component (TC) の隠蔽状態を同時に最適化するが、FFNの最適化されたTC隠蔽状態のみを用いてFFN重みを正確に更新する。
実験の結果,PMET はtextsccounterfact と zsRE の両方のデータセットに対して最先端の性能を示すことがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:33:43 GMT)
A White-Box False Positive Adversarial Attack Method on Contrastive
Loss-Based Offline Handwritten Signature Verification Models [11.5] 我々は, 競合的損失に基づくオフライン手書き署名検証モデルに対する, 偽正逆攻撃の難しさに対処する。
そこで本研究では,この攻撃を,密接に関連するが異なる書体間のスタイル転送として扱う新たな攻撃手法を提案する。
提案手法は,ホワイトボックス攻撃によるオフライン手書き署名検証モデルに対する最先端性能を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:30:49 GMT)
GPU Accelerated Color Correction and Frame Warping for Real-time Video
Stitching [11.1] 伝統的な画像ステッチは、ビデオの空間的時間的一貫性を考慮せずに、単一のパノラマフレームに焦点を当てている。
本論文では,複数のビデオシーケンスをパノラマ映像シーケンスに縫合するリアルタイムシステムを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 23:28:39 GMT)
Ray-Patch: An Efficient Querying for Light Field Transformers [10.9] ターゲットビューに暗黙の表現をデコードするトランスフォーマーを効率的にクエリする新しいモデルであるRay-Patchクエリを提案する。
我々のRay-Patchデコーディングは計算フットプリントを減らし、従来のモデルに比べて1桁の推論速度を増大させる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:39:05 GMT)
Hitting the High-Dimensional Notes: An ODE for SGD learning dynamics on
GLMs and multi-index models [10.8] 高次元限界におけるストリーミング勾配降下(SGD)のダイナミクスを解析する。
我々は、通常の微分方程式の体系の形で、SGDの決定論的等価性を実証する。
決定論的等価性に加えて、単純化された拡散係数を持つSDEを導入する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:33:02 GMT)
Sparsity and Coefficient Permutation Based Two-Domain AMP for Image
Block Compressed Sensing [10.6] 画像ブロック圧縮センシングのための新しいスペーサ性および係数置換型AMP(SCP-AMP)法を提案する。
SCP-AMPは、視覚的知覚と客観的メトリクスの両方の観点から、他の最先端のBCSアルゴリズムよりも、より良い再構成精度を実現する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:43:00 GMT)
Capturing Popularity Trends: A Simplistic Non-Personalized Approach for
Enhanced Item Recommendation [10.6] Popularity-Aware Recommender (PARE) は、最も人気の高いアイテムを予測することで、非個人化されたレコメンデーションを行う。
私たちの知る限り、レコメンデーションシステムでアイテムの人気を明示的にモデル化する最初の試みである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:20:03 GMT)
LesionMix: A Lesion-Level Data Augmentation Method for Medical Image
Segmentation [10.5] 新規かつ簡便な病変認識データ拡張法であるLesionMixを提案する。
病変レベルで増強を行い、病変の形状、位置、強度、負荷分布の多様性を増大させる。
4つの脳MRI病変データセットと1つの肝CT病変データセットを含む、異なるモダリティと異なる病変データセットの実験は、LesionMixが病変画像セグメンテーションにおいて有望なパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:56:08 GMT)
Enhancing Phrase Representation by Information Bottleneck Guided Text
Diffusion Process for Keyphrase Extraction [10.5] キーフレーズ抽出は自然言語処理において重要な課題である。
本研究では,拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:26:30 GMT)
The Geometry and Calculus of Losses [10.5] 本稿では,二項・多クラス分類とクラス確率推定問題に対する損失関数の理論を開発する。
視点は3つの新しい機会を提供する。
これにより、これまで気付かなかったと思われる損失と(反)ノルムの基本的な関係の開発が可能になる。
第二に、凸集合の計算によって引き起こされる損失の計算の開発を可能にする。
第三に、パースペクティブは、損失を定義する凸集合の極双対から導かれる極の損失関数の自然な理論につながる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:57:27 GMT)
Semiquantum key distribution using initial states in only one basis
without the classical user measuring [10.4] 半量子鍵分布(SQKD)により、量子利用者は秘密鍵を1つのベースで準備し操作する古典的ユーザと共有することができる。
SQKDプロトコルを構築し,量子状態の生成を1つの基準で制限し,古典的ユーザの計測能力を排除した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:44:20 GMT)
Dynamic Neural Network is All You Need: Understanding the Robustness of
Dynamic Mechanisms in Neural Networks [10.2] 我々は,DyNNにおける動的機構のロバスト性および動的機構設計がDyNNのロバスト性に与える影響について検討する。
我々は,DyNNからSDNNへの攻撃伝達性が,SDNNからDyNNへの攻撃伝達可能性よりも高いことを発見した。
また、DyNNsはSDNNsよりも効率的に敵のサンプルを生成することができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:15:11 GMT)
Efficient Quantum Transduction Using Anti-Ferromagnetic Topological
Insulators [10.1] 量子システム間の量子情報の変換は、量子ネットワークや量子コンピューティングを含む様々なアプリケーションにおいて重要なステップである。
我々は高効率なトランスデューサとして機能する固体反強磁性トポロジカル絶縁体を提案する。
磁気トポロジカル絶縁体における強い非線形相互作用は、異なる周波数の光子間の絡み合いの発生を含む様々な応用を見出すことができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:30:16 GMT)
Learning by Aligning Videos in Time [10.1] 本稿では,時間的映像アライメントを前提課題として,映像表現を学習するための自己教師型アプローチを提案する。
我々は、エンコーダネットワークをトレーニングするための監視信号として使用できる、時間的アライメント損失と時間的正規化項の新たな組み合わせを利用する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:29:40 GMT)
Unsupervised Action Segmentation by Joint Representation Learning and
Online Clustering [10.1] 本稿では,ビデオフレームクラスタリングをプレテキストタスクとして利用する,教師なしアクティビティセグメンテーションのための新しい手法を提案する。
我々は時間的最適輸送を利用してビデオの時間的情報を活用する。
我々の手法は、メモリの制約が大幅に少ないにもかかわらず、以前の方法と同等かそれ以上に機能する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:21:53 GMT)
FedPerfix: Towards Partial Model Personalization of Vision Transformers
in Federated Learning [10.0] 視覚変換器モデル(ViT)のパーソナライズ方法について検討する。
自己注意層と分類ヘッドがViTの最も敏感な部分であるという知見に基づいて、FedPerfixと呼ばれる新しいアプローチを提案する。
CIFAR-100、OrganAMNIST、Office-Homeのデータセットに対する提案手法の評価を行い、いくつかの先進的なPFL手法と比較してその効果を実証した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:22:30 GMT)
Causal Adversarial Perturbations for Individual Fairness and Robustness
in Heterogeneous Data Spaces [9.9] 本研究では,不均一なデータ空間における個人的公正性,対角的ロバスト性,構造的因果モデルとの関係について検討する。
新たな因果摂動を導入し, 逆行訓練を適用して, 個別の公平性, 因果性, 頑健性を組み合わせた新たな正則化器を作成する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:16:48 GMT)
Differential Privacy, Linguistic Fairness, and Training Data Influence:
Impossibility and Possibility Theorems for Multilingual Language Models [9.9] 多言語圧縮と言語フェアネスは、差分プライバシーと互換性があるが、差分プライバシは、訓練データの影響と相反することを示している。
我々は2つの共通NLPタスクに関する一連の実験を行い、異なるプライバシー保証の下で多言語圧縮とトレーニングデータの影響について評価する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:13:26 GMT)
MoCLIM: Towards Accurate Cancer Subtyping via Multi-Omics Contrastive
Learning with Omics-Inference Modeling [9.9] 我々は癌サブタイプのための表現学習フレームワークであるMoCLIMを開発した。
その結果,本手法は,高次元癌症例の少ない症例において,データ適合性やサブタイプ性能を著しく向上させることが示唆された。
本フレームワークは, 各種医療評価を最終要素として含み, 医療分析における高い解釈可能性を提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:49:48 GMT)
Do I Have Your Attention: A Large Scale Engagement Prediction Dataset
and Baselines [9.9] 「機械と対話しながら個人によって表される集中、熱意、楽観、情熱の度合いをユーザエンゲージメントと呼ぶ。」
現実の環境で動作可能なエンゲージメント予測システムを構築するためには、リッチで多様なデータセットから学ぶことが不可欠である。
野生データセットEngageNetにおける大規模多面的エンゲージメントを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:50:29 GMT)
Semantic Consistency for Assuring Reliability of Large Language Models [9.9] 大規模言語モデル(LLM)は、様々な自然言語タスクに対して顕著な流布と能力を示す。
セマンティック一貫性の一般的な尺度を導入し、様々なLLMの性能を評価するために、この指標の複数バージョンを定式化する。
本稿では,Ask-to-Choose (A2C) と呼ばれる新しいプロンプト戦略を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:11:33 GMT)
UMIFormer: Mining the Correlations between Similar Tokens for Multi-View
3D Reconstruction [9.9] 非構造化多重画像(UMIFormer)のためのトランスフォーマネットワークを提案する。
これは、切り離されたビュー内エンコーディングのためのトランスフォーマーブロックと、トークンの修正のために設計されたブロックを利用する。
様々な分岐から取得した全てのトークンは、固定サイズのコンパクト表現に圧縮される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:34:41 GMT)
Hyperdimensional Computing as a Rescue for Efficient Privacy-Preserving
Machine Learning-as-a-Service [9.8] ホモモルフィック暗号化(HE)はこの逆問題に対処するための有望な手法である。
HEを使用すると、サービスプロバイダは、暗号化されたデータをクエリとして取り、それを復号することなくモデルを実行することができる。
我々は、超次元コンピューティングが、暗号化データによるプライバシー保護機械学習の救いになることを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:25:17 GMT)
Degree-Preserving Randomized Response for Graph Neural Networks under
Local Differential Privacy [9.6] 本稿では,DPRR (Degree-Preserving Randomized Response) と呼ばれる新しいLDPアルゴリズムを提案する。
我々のDPRRは、各ユーザの次数を保存するので、エッジ LDP を提供しながらグラフ構造を保ちます。
我々は,GNNのタスクとしてのグラフ分類に注目し,3つのソーシャルグラフデータセットを用いてDPRRを評価する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:26:28 GMT)
TARGET: Federated Class-Continual Learning via Exemplar-Free
Distillation [9.6] 本稿では,未探索だが重要な課題であるフェデレーション・クラス・コンチネンタル・ラーニング(FCCL)に焦点を当てる。
既存のFCCLの作業には、データセットの追加や、以前のタスクからのプライベートデータの保存など、さまざまな制限がある。
本稿では,クライアントデータのプライバシを保ちながら,FCCLにおける破滅的な忘れを緩和する,TARGETと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:09:19 GMT)
DietCNN: Multiplication-free Inference for Quantized CNNs [9.3] 本稿では,CNNにおける乗算をテーブルルックアップで置き換える手法を提案する。
単一のアクティベーションコードブックに基づく乗算自由なCNNは、推論あたりのエネルギーの4.7倍、5.6倍、3.5倍の削減を達成できることが示されている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:10:41 GMT)
Long-Range Grouping Transformer for Multi-View 3D Reconstruction [9.3] 配当原理に基づくLGA(Long-range Grouping attention)を提案する。
ビュー間特徴を接続する効率的かつ効率的なエンコーダを確立することができる。
プログレッシブ・アップサンプリング・デコーダは比較的高解像度のボクセル生成のために設計された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:34:59 GMT)
On Size-Independent Sample Complexity of ReLU Networks [9.2] 一般化の観点からReLUニューラルネットワークを学習する際のサンプル複雑性について検討する。
関連する関数クラスのRademacher複雑性を推定する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:21:04 GMT)
Synergistic Signal Denoising for Multimodal Time Series of Structure
Vibration [9.1] 本稿では,構造的健康モニタリング(SHM)で広く用いられているマルチモーダル振動信号に固有の複雑さに適した,新しいディープラーニングアルゴリズムを提案する。
畳み込みと再帰的なアーキテクチャの融合により、アルゴリズムは局所化と長期化の両方の構造挙動を順応的にキャプチャする。
以上の結果から,複数のSHMシナリオにおける予測精度,早期損傷検出,適応性に有意な改善が認められた。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:41:50 GMT)
Learning Decision Trees with Gradient Descent [9.1] 決定木(DT)は、高い解釈可能性のために多くの機械学習タスクに一般的に使用される。
本稿では,グリーディアルゴリズムを用いてDTを学習する新しい手法を提案する。
直進演算子と直進演算子を高密度DT表現とし,すべての木パラメータを協調的に最適化する手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:59:33 GMT)
URL: Combating Label Noise for Lung Nodule Malignancy Grading [8.9] ほとんどの肺悪性度分類データセットにはラベルノイズが含まれており、それは必然的にモデルの性能と一般化性を低下させる。
クラス間の順序関係をモデル化する一様規則化ラベルノイズ耐性(URL)フレームワークを提案する。
LIDC-IDRIデータセットで行った実験は、他の競合する方法よりもURLの方が優れていることを示している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:06:35 GMT)
Is Argument Structure of Learner Chinese Understandable: A Corpus-Based
Analysis [8.9] 本稿では,中国語学習者における議論構造誤りのコーパスに基づく解析について述べる。
分析用データには、言語学習者が生成した文と、母語話者による補正が含まれている。
2人の高校生が手作業で作成したセマンティックロールラベリングアノテーションとデータを結合する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:10:04 GMT)
Regularizing Adversarial Imitation Learning Using Causal Invariance [8.4] シミュレーション学習法は、マルコフ決定プロセスにおけるポリシーを専門家によるデモンストレーションのデータセットから推論するために用いられる。
本稿では,これらのモデルの正則化原理として因果不変性を用いることを提案する。
実測的な2次元設定における正規化定式化の有効性と,多数の高次元ロボット移動ベンチマークタスクの有効性を実証する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:24:34 GMT)
OmniDataComposer: A Unified Data Structure for Multimodal Data Fusion
and Infinite Data Generation [8.1] OmniDataComposerは、マルチモーダルデータ融合と無制限データ生成のための革新的なアプローチである。
6400以上のオブジェクトを識別でき、視覚情報のスペクトルを大幅に広げる。
多様なモダリティを網羅し、モダリティ間の相互強化を促進し、モダリティ間のデータ修正を容易にする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:25:22 GMT)
Lifted Algorithms for Symmetric Weighted First-Order Model Sampling [7.7] 数量化器を用いた一階述語論理の2変数フラグメントのサンプリングにおけるテキストドメインリフト性を証明する。
そして、この結果は、基数制約の存在下においても引き続き持続することを示す。
我々のアルゴリズムは、最先端のWMSサンプリングよりもかなりのマージンで優れています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:40:47 GMT)
Minimax risk classifiers with 0-1 loss [7.7] 本稿では,不確実な分布集合に対する最悪の0-1損失を最小限に抑えるミニマックスリスク分類器(MRC)を提案する。
MRCは学習時に厳密な性能保証を提供し,特徴カーネルが与える特徴写像を用いて,一意に一貫した特徴を持つことを示す。
また, MRC学習における効率的な最適化手法を提案し, 提案手法は, 厳密な性能保証とともに, 正確な分類を行うことができることを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:58:24 GMT)
XVTP3D: Cross-view Trajectory Prediction Using Shared 3D Queries for
Autonomous Driving [7.6] 不確実性を伴う軌道予測は、自動運転にとって重要かつ困難な課題である。
共有3Dクエリ(XVTP3D)を用いたクロスビュー軌道予測手法を提案する。
2つの公開データセットに対する実験の結果、XVTP3Dは、一貫したクロスビュー予測で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:35:13 GMT)
Contrasting Linguistic Patterns in Human and LLM-Generated Text [7.5] 我々は、人書きの英語ニューステキストとAI生成テキストを対比した定量的分析を行う。
結果は、人間とAIが生成したテキストの様々な測定可能な相違を明らかにした。
人間の文章は、AIが生成したテキストよりも、より散在した文の長さの分布、依存関係と構成型の明確な使用、より短い構成成分、より攻撃的な感情(嫌悪感、嫌悪感)を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:54:38 GMT)
An O.D.E. Framework of Distributed TD-Learning for Networked Multi-Agent
Markov Decision Processes [7.5] 本稿では,ネットワーク型マルチエージェントマルコフ決定問題(MAMDP)に対する分散常微分方程式(ODE)と分散時間差(TD)学習アルゴリズムについて検討する。
本研究では,個々のエージェントが自身の報酬のみにアクセスできる分散マルチエージェントフレームワークを採用し,他のエージェントの報酬に対する洞察を欠いている。
提案する分散ODEの1つに、2つの独立した動的システムが組み込まれており、それぞれが異なる役割を担っている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:45:19 GMT)
Conditional Sampling of Variational Autoencoders via Iterated
Approximate Ancestral Sampling [7.4] 変分オートエンコーダ(VAE)の条件付きサンプリングは、データ計算の欠如など、様々なアプリケーションで必要とされるが、計算上は難解である。
基本的条件付きサンプリングはMetropolis-within-Gibbs (MWG)である
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:08:18 GMT)
Environment Diversification with Multi-head Neural Network for Invariant
Learning [7.3] この研究は、データバイアスを吸収するマルチヘッドニューラルネットワークを含む不変学習フレームワークEDNILを提案する。
このフレームワークは環境に関する事前の知識や事前訓練されたモデルに関する強い仮定を必要としないことを示す。
EDNILでトレーニングされたモデルは、分布シフトに対して実験的に堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:33:38 GMT)
Fast Decision Support for Air Traffic Management at Urban Air Mobility
Vertiports using Graph Learning [7.3] アーバン・エアモビリティ(UAM)航空機は、バーティポートと呼ばれる小さな空港から運用される。
このスケジュールをリアルタイムで管理することは、従来の航空交通管制官にとって難しいが、代わりに自動化されたソリューションを求めている。
本稿では,UAM-VSM(Urban Air Mobility - Vertiport Schedule Management)問題に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:05:44 GMT)
Learning to In-paint: Domain Adaptive Shape Completion for 3D Organ
Segmentation [7.2] 現在の3次元臓器分割モデルに明示的な形状情報を定式化することを目的としている。
そこで本研究では, 塗装中の修復損失と擬似損失の両方を兼ね備えた新規な形状認識型自己蒸留法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:19:13 GMT)
Two-and-a-half Order Score-based Model for Solving 3D Ill-posed Inverse
Problems [7.1] 本稿では,3次元ボリューム再構成のための2次半順序スコアベースモデル(TOSM)を提案する。
トレーニング期間中、TOSMは2次元空間のデータ分布を学習し、トレーニングの複雑さを低減する。
再構成フェーズでは、TOSMは3方向の相補的なスコアを利用して、3次元空間のデータ分布を更新する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:09:26 GMT)
Non-Hermitian tearing by dissipation [7.0] 我々は、エネルギーバンドが虚線ギャップを示し、エネルギー固有状態が特定の領域に束縛された非エルミート系について研究する。
この結果は、より複雑なシステムにおける非エルミート断裂の研究に理論的アプローチを提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:07:46 GMT)
High-dimensional limit theorems for SGD: Effective dynamics and critical
scaling [7.0] 我々は、勾配降下(SGD)の要約統計の軌跡に対する極限定理を証明する。
下記の有効弾道力学が人口減少の勾配流と一致するステップサイズにおける重要なスケーリング体制を示す。
この実効力学の固定点について、対応する拡散極限は極めて複雑であり、さらに退化することもある。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:05:36 GMT)
Anatomical Invariance Modeling and Semantic Alignment for
Self-supervised Learning in 3D Medical Image Analysis [6.9] 自己教師付き学習(SSL)は、最近、3D医療画像解析タスクで有望なパフォーマンスを達成した。
現在のほとんどの手法は、元々写真や自然画像用に設計された既存のSSLパラダイムに従っている。
我々は,解剖的不変性モデリングと意味的アライメントを明確に満たす,自己教師付き学習フレームワークAliceを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:18:39 GMT)
Uplift Modeling: from Causal Inference to Personalization [6.8] アップリフトモデリング(uplift modeling)は、個別またはサブグループレベルでの治療の因果効果を推定する機械学習手法の集合である。
本チュートリアルでは、因果関係の基本的な概念を取り上げ、アップリフトモデリングにおける最先端技術に聴衆を紹介する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:54:21 GMT)
V-FUSE: Volumetric Depth Map Fusion with Long-Range Constraints [6.7] 本稿では,Multi-View Stereo(MVS)アルゴリズムによって生成された深度マップと信頼マップのセットを入力として受け入れ,改良する学習ベースの深度マップ融合フレームワークを提案する。
また、各線に沿った深度仮説探索空間を減らすために、より大きな融合サブネットワークと共に訓練された深度探索ウィンドウ推定サブネットワークを導入する。
本手法は,データから直接,深度コンセンサスと可視性制約の違反をモデル化することを学ぶ。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:39:56 GMT)
CodeCoT and Beyond: Learning to Program and Test like a Developer [6.3] 自然言語処理では、トランスフォーマーベースの大規模言語モデル(LLM)がランドスケープに革命をもたらした。
LLMはタスク固有の最小限のデータで適応することができる。
CoT(Chain-of-Thought Prompting)として知られる革新的な戦略が、多段階の推論において認知過程を明らかにするためにLSMを導くために導入された。
本稿では,Vanilla CodeCoTとSelf-exam CodeCoTの2つのコンポーネントからなるCode Chain-of-Thought(CodeCoT)を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:58:51 GMT)
Eosinophils Instance Object Segmentation on Whole Slide Imaging Using
Multi-label Circle Representation [6.3] 好酸球性食道炎 (EoE) は食道炎を特徴とする慢性再発性疾患である。
EoEの診断は一般的に高出力場当たりの好酸球の閾値(15~20)で行われる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:27:01 GMT)
GastroVision: A Multi-class Endoscopy Image Dataset for Computer Aided
Gastrointestinal Disease Detection [6.2] 本データセットは, 解剖学的所見, 病理所見, ポリープ除去症例, 正常所見を含む。
経験豊富なGI内科医によって注釈され、検証された。
我々のデータセットは、GI病の検出と分類のためのAIベースのアルゴリズムの開発を促進することができると信じている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:21:30 GMT)
General Lipschitz: Certified Robustness Against Resolvable Semantic
Transformations via Transformation-Dependent Randomized Smoothing [6.1] 構成可能な可解なセマンティック摂動に対してニューラルネットワークを認証する新しいフレームワークであるEmph General Lipschitz (GL)を提案する。
提案手法は,ImageNetデータセットにおける最先端のアプローチと同等に機能する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:39:24 GMT)
A Survey on Deep Multi-modal Learning for Body Language Recognition and
Generation [5.9] ボディランゲージ(Body language, BL)とは、身体の動き、ジェスチャー、表情、姿勢によって表現される非言語コミュニケーションのこと。
深層マルチモーダル学習技術は,これらのBLの多様な側面を理解し解析する上で有望であることを示す。
いくつかの共通BLは、手話(SL)、キュードスピーチ(CS)、コスペーチ(CoS)、トーキングヘッド(TH)とみなされる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:15:51 GMT)
Efficient Commercial Bank Customer Credit Risk Assessment Based on
LightGBM and Feature Engineering [5.6] 本論文は、カグルの外国商業銀行の顧客情報データセットに基づくものである。
私たちはLightGBMアルゴリズムを使用して、顧客を分類する分類器を構築し、銀行が顧客の信用デフォルトの可能性を判断する手助けをします。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:32:38 GMT)
Get It in Writing: Formal Contracts Mitigate Social Dilemmas in
Multi-Agent RL [5.3] マルチエージェント強化学習 (MARL) は, 共通環境において独立して機能する自動システムの訓練を行う強力なツールである。
MARLは、個人インセンティブとグループインセンティブが多様化する際の準最適行動を引き起こす。
エージェントが自発的に状態依存的な報酬の転送に同意するマルコフゲームの拡張を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:35:14 GMT)
Domain generalization of 3D semantic segmentation in autonomous driving [5.2] その重要性にもかかわらず、ドメインの一般化は3次元自律運転セマンティックセグメンテーションの場合、比較的未解明である。
本稿では、最先端の手法を検証し、レーザーイメージング検出とラングング(LiDAR)ドメインシフトに対処することの難しさを論じ、この応用のための最初のベンチマークを示す。
また,この領域の一般化に対処するために設計された最初の手法を提案し,これを3DLabelPropと呼ぶ。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:15:31 GMT)
Amplifying Frequency Up-Converted Infrared Signals with a Molecular
Optomechanical Cavity [5.2] 分子量107ドルの分子キャビティシステムにおいて,1000以上の因子で信号強度を高めることができる増幅機構を提案する。
我々の研究は、赤外線信号を可視域にアップコンバートするための実現可能なアプローチを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:53:59 GMT)
Learned Thresholds Token Merging and Pruning for Vision Transformers [5.1] 本稿では,トークンマージとトークンプルーニングの両方の長所を活用する新しいアプローチであるLTMP(Learned Thresholds token Merging and Pruning)を紹介する。
我々は、ImageNet分類タスクにおいて、視覚変換器に関する広範な実験を行い、我々のアプローチを実証する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:51:16 GMT)
Texture Learning Domain Randomization for Domain Generalized
Segmentation [5.1] 既存の汎用セマンティックドメイン(DGSS)法は,テクスチャよりも形状を優先するモデルを導くことによって,領域ギャップ問題を緩和している。
本稿では,DGSSの性能向上にテクスチャを活用することが重要であることを論じる。
学習領域ランダム化(TLDR)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:39:37 GMT)
A Model-Agnostic Framework for Recommendation via Interest-aware Item
Embeddings [5.0] Interest-Aware Capsule Network (IaCN)は、関心指向のアイテム表現を直接学習するモデルに依存しないフレームワークである。
IaCNは補助的なタスクとして機能し、アイテムベースと興味ベースの両方の表現の合同学習を可能にする。
提案手法をベンチマークデータセットで評価し、異なるディープニューラルネットワークを含むさまざまなシナリオを探索する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:40:59 GMT)
Robust Multi-Task Learning and Online Refinement for Spacecraft Pose
Estimation across Domain Gap [4.9] スペースクラフト・ポース・ネットワーク v2 (SPNv2) は、非協力的な宇宙船をドメインギャップを越えて推定するための畳み込みニューラルネットワーク (CNN) である。
オンラインドメインリファインメント(ODR)は、デプロイ時にオンラインのターゲットドメインイメージ上のSPNv2の正規化レイヤのパラメータを洗練する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:45:06 GMT)
HyperSNN: A new efficient and robust deep learning model for resource
constrained control applications [4.9] HyperSNNは、超次元コンピューティングと組み合わせてスパイキングニューラルネットワーク(SNN)を使用するタスクを制御する革新的な方法である。
私たちのモデルは、Cartpole、Acrobot、MountainCar、Lunar Landerなど、AI Gymベンチマークでテストされました。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:20:28 GMT)
Robust Framework for Explanation Evaluation in Time Series
Classification [4.8] 本稿では時系列分類のための説明手法を定量的に評価・ランク付けするための枠組みを提供する。
本稿では,複数のサリエンシに基づく説明の定量化と比較を行うための頑健なモデル非依存的説明評価フレームワークを提案する。
その結果, 時系列の識別的部分の摂動は, 分類精度に大きな変化をもたらすことがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:58:29 GMT)
Differential Good Arm Identification [4.7] 本稿では,GAI(Good Arm Identification)と呼ばれる多腕バンディット問題の変種を対象とする。
GAIは純粋な探索用バンディット問題であり、できるだけ少ないサンプルで優れた腕を出力することを目的としている。
本稿では,DGAI - 優れた腕識別アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:09:23 GMT)
MixBag: Bag-Level Data Augmentation for Learning from Label Proportions [4.6] ラベルパーセンテージ(LLP)からの学習は、有望な教師付き学習問題である。
そこで本研究では,MixBagと呼ばれるLPPのバッグレベルのデータ拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:06:50 GMT)
Certifying randomness in quantum state collapse [4.5] 本稿では,ランダムネス生成と状態崩壊の定量的関係について検討する。
I) 発生源と測定装置の独立性, および (II) 崩壊状態に対するL "uders' rule。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:06:37 GMT)
Quantum speed limit for complex dynamics [4.5] 量子速度制限(OQSL)の操作的定義が提案され、時間に依存しないハミルトンの固有最小時間を明らかにした。
ここでは、ある時間依存ハミルトニアンに対してOQSL表現を提供し、三段階(分類-回帰-校正)手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:29:19 GMT)
Neurological Prognostication of Post-Cardiac-Arrest Coma Patients Using
EEG Data: A Dynamic Survival Analysis Framework with Competing Risks [4.5] 脳波データを用いた心停止後コマトース患者の神経学的予後の枠組みを提案する。
我々のフレームワークは、患者レベルの累積頻度関数を推定する形で競合するリスクをサポートする動的生存分析モデルを使用する。
我々は,922人の実際のデータセット上で競合するリスクをサポートする3つの既存動的生存分析モデルをベンチマークすることで,我々の枠組みを実証する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:46:23 GMT)
MedLens: Improve Mortality Prediction Via Medical Signs Selecting and
Regression [4.4] データ品質の問題については文献では議論されていない。
我々はMEDLENSを設計し、統計による自動バイタルメディカルサイン選択手法と、高損失率時系列に対する柔軟なアプローチを用いて設計した。
精度は 0.96 AUC-ROC と 0.81 AUC-PR で、これは以前のベンチマークを超えている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:10:54 GMT)
Nonreciprocal photon transport in indirectly coupled whispering-gallery
mode resonators [4.3] 本研究では,2つのささやきモード共振器からなる系の反射特性と伝送特性について検討した。
その結果,共振器と光ファイバの結合強度を調整することにより,一方向反射・透過を実現することができることがわかった。
この研究は、アイソレータ、サーキュレータ、ルータなどの量子光学デバイスの開発に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:58:00 GMT)
BOTT: Box Only Transformer Tracker for 3D Object Tracking [4.2] Box Only Transformer Tracker (BOTT) は、同じオブジェクトの3Dボックスを異なるフレームからリンクすることを学ぶために提案されている。
BOTTはオンラインとオフラインの両方のトラッキングモードでシームレスに使用できる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:04:55 GMT)
Large Language Models at Work in China's Labor Market [4.2] 本稿では,中国労働市場における大規模言語モデル(LLM)の潜在的影響について考察する。
その結果,職業曝露と賃金水準・経験年金との正の相関が示唆された。
また、AI導入による生産性と雇用のトレードオフを定量化するために、産業の露出を取り入れた経済成長モデルも開発しています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:20:36 GMT)
Cross-Modal Learning with 3D Deformable Attention for Action Recognition [4.1] 本稿では,適応的な注意場を持つ行動認識のための新しい3次元変形可能な変換器と時間的学習方式を提案する。
提案した3次元変形可能な変圧器が試験された。
60,.120 FineGYM と PennActionAction のデータセットは、事前訓練された最先端手法よりも良い結果を示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:23:45 GMT)
A Mathematical Characterization of Minimally Sufficient Robot Brains [4.1] 本稿では,内部システムのための情報遷移システムについて紹介する。
情報遷移システムをフィルタとみなし、この情報遷移システムの状態をラベル付けする機能としてポリシーまたは計画とみなす。
一般的な設定では、最小限の情報遷移系は妥当な等価性の仮定まで存在すると断定する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:22:06 GMT)
CherryPicker: Semantic Skeletonization and Topological Reconstruction of
Cherry Trees [3.9] 木々の測光点雲を再構築する自動パイプラインであるCherryPickerを紹介する。
本システムでは, 3D 植物表現型アプリケーションにおいて, 自動処理を実現するために, 最先端のアルゴリズムを組み合わせている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:05:41 GMT)
AIR: Threats of Adversarial Attacks on Deep Learning-Based Information
Recovery [3.9] 本稿では,SOTA DLに基づく情報リカバリモデルであるDeepReceiverに対する敵攻撃について検討する。
大規模な実験では、DeepReceiverは考慮されたすべてのシナリオにおいて、設計された攻撃方法に弱いことが示されている。
また、DeepReceiverは、非常に低い電力と限られたPAPRでも、敵の摂動に弱いことが分かる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:55:02 GMT)
Topological properties and organizing principles of semantic networks [3.8] 本研究では,11言語から7つの意味関係によって定義されたConceptNetのセマンティックネットワークの特性について検討する。
セマンティック・ネットワークには普遍的な基本的特性があり、疎らで、クラスタ化され、多くは非合法な等級分布を示す。
一部のネットワークでは接続は類似性に基づくが、他のネットワークでは接続は相補性に基づくものである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:51:25 GMT)
Deep Learning Framework for Spleen Volume Estimation from 2D
Cross-sectional Views [3.8] シングルビューまたはデュアルビュー2Dセグメンテーションから脾体積を測定するための変分オートエンコーダベースのフレームワークについて述べる。
我々の最良のモデルでは、単一のビューと双ビューのセグメンテーションで86.62%と92.58%の相対体積精度を達成した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:21:02 GMT)
LLM-FuncMapper: Function Identification for Interpreting Complex Clauses
in Building Codes via LLM [3.8] LLM-FuncMapperは、様々な規制条項を解釈するために必要な事前定義された関数を特定するアプローチである。
ほぼ100%のコンピュータ処理可能な節をコンピュータ実行可能なコードとして解釈し表現することができる。
この研究は、複雑な規制条項を理解し解釈するためのLSMを導入する最初の試みである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:58:04 GMT)
Towards a Practical Defense against Adversarial Attacks on Deep
Learning-based Malware Detectors via Randomized Smoothing [3.7] 本稿では,ランダムな平滑化に触発された敵のマルウェアに対する現実的な防御法を提案する。
本研究では,入力のランダム化にガウスノイズやラプラスノイズを使う代わりに,ランダム化アブレーションに基づく平滑化方式を提案する。
BODMASデータセットに対する様々な最先端の回避攻撃に対するアブレーションモデルの有効性を実証的に評価した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:30:25 GMT)
Multi-field Visualisation via Trait-induced Merge Trees [3.7] 属性空間で定義された特性の概念は、特徴レベルセットフレームワークで導入されたものと同じである。
属性空間における結果の距離場は、トポロジカルデータ解析の入力となる空間領域におけるスカラー場を誘導する。
提案手法は、異なるアスペクトのハイライトを可能にする、ツリーに対する異なるクエリメソッドを含む。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:40:48 GMT)
ICoNIK: Generating Respiratory-Resolved Abdominal MR Reconstructions
Using Neural Implicit Representations in k-Space [3.7] そこで本研究では,k空間内での暗黙的表現を直接学習することにより,ぼやけた動きを解消する腹部再建法を提案する。
余分なサンプル領域の正規化を支援するため、追加の情報補正層(ICo)を導入する。
提案手法であるNIKとICoNIKは,標準動作解決手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:46:50 GMT)
Predictive Modelling of Quantum Process with Neural Networks [3.7] 我々は、入力状態の所定のアンサンブルに適用した場合、未知の量子プロセスの振る舞いを予測するための最初のニューラルネットワークアルゴリズムを開発した。
我々は、量子コンピューティング、量子多体物理学、量子光学における様々な関連プロセスに対して、ニューラルネットワークモデルを用いて数値的な結果を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:53:58 GMT)
Predicting Software Performance with Divide-and-Learn [3.6] 本稿では,$DaL$という「分割学習」の概念に基づくアプローチを提案する。
実世界の8つのシステムと5組のトレーニングデータによる実験結果から、現在最先端のアプローチと比較して、$DaL$は40件中33件で最高のシステムよりも悪い結果が得られている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:29:51 GMT)
Bluetooth and WiFi Dataset for Real World RF Fingerprinting of
Commercial Devices [3.5] 本稿では,市販のオフ・ザ・シェルフ(COTS)コンボチップセットから,WiFiとBluetoothを2つの異なる時間枠で伝送するエミッションをキャプチャする。
広く使用するために、72GBデータセット内の各キャプチャは、多様な入力テンソルの長さとフォーマットをサポートするのに十分な長さ(40MSamples)である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:25:47 GMT)
Reinforcement Learning for Battery Management in Dairy Farming [3.4] 本研究は,Qラーニングを利用して,乳園における電池の充電および排出に関する効果的な政策を学習する。
その結果,提案手法が確立されたベースラインアルゴリズムと比較して電力コストを大幅に削減できることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:52:15 GMT)
Decoding Emotions: A comprehensive Multilingual Study of Speech Models
for Speech Emotion Recognition [3.4] 本稿では、8つの音声表現モデルと6つの異なる言語を用いた音声感情認識のための総合的ベンチマークを示す。
音声モデルの1つの最適層から得られる特徴を用いることで、7つのデータセットの平均誤差率を32%削減できることがわかった。
以上の結果から,中間層が感情認識において最も重要な感情情報を捉えていることが示唆された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:30:56 GMT)
Explainable AI for tool wear prediction in turning [3.4] 本研究は,ツール摩耗予測のための人間の理解可能なソリューションを容易にするための,説明可能な人工知能(XAI)フレームワークの開発を目的とする。
ランダムフォレストアルゴリズムは、トレーニングとバイナリ分類のための教師付き機械学習(ML)分類器として使用された。
Shapley criterionは、訓練されたML分類器の予測を説明するために使用された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:36:13 GMT)
Deep Ear Biometrics for Gender Classification [3.3] 我々は、耳画像のサンプルを用いて、ジェンダーの自動分類のためのディープ畳み込みニューラルネットワーク(CNN)モデルを開発した。
提案したモデルは、EarVN1.0の耳データセットで93%の精度を達成した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:15:52 GMT)
Fostering User Engagement in the Critical Reflection of Arguments [3.3] 本研究では,人間との対話を行うシステムを提案する。
ユーザが既存の意見に集中しすぎれば,システムに介入することが可能になる。
58名の被験者を対象に,本モデルと介入機構の効果について調査を行った。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:48:23 GMT)
A Feasibility-Preserved Quantum Approximate Solver for the Capacitated
Vehicle Routing Problem [3.2] CVRP(Capacitated Vehicle Routing Problem)は、輸送や物流など様々な分野で発生するNP最適化問題である。
本稿では,CVRPの車載容量制約を回避できる最短経路を最小化する目的関数として,CVRPの新しいバイナリエンコーディングを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:14:43 GMT)
Development of a Knowledge Graph Embeddings Model for Pain [3.2] 痛みは複雑な概念であり、痛みを引き起こす可能性のある障害のような他の概念と結びつくことができる。
本稿では、メンタルヘルスの電子健康記録から抽出した痛み概念の知識グラフ埋め込みモデルの構築について述べる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:27:43 GMT)
Discrete Prompt Compression with Reinforcement Learning [3.1] コンテキストウィンドウの長さと計算コストに関連する制約により、圧縮プロンプトの開発が促進される。
既存の方法は、複数のトークンの意味に対応するように設計された、トレーニングの埋め込みに大きく依存している。
本研究では,新しい離散的即時圧縮法であるPCRLを用いた即時圧縮を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:10:17 GMT)
Semi-sparsity Priors for Image Structure Analysis and Extraction [3.1] 画像構造解析と抽出のための半スパース正規化フレームワークを提案する。
有名な階段のアーチファクトを導入することなく,画像構造を保存できることが示される。
また,乗算器の方向法(ADMM)に基づく効率的な数値解も導入する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:22:00 GMT)
Properties of Discrete Sliced Wasserstein Losses [2.8] スライスされたワッサーシュタイン距離(SW)は、確率測度を比較するためにワッサーシュタイン距離の代替として人気がある。
広範囲のアプリケーションには画像処理、ドメイン適応、生成モデリングが含まれており、SWを最小化するためにパラメータを最適化することが一般的である。
このエネルギーの正則性と最適化特性、およびモンテカルロ近似 $mathcalE_p$ について検討する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:01:05 GMT)
Using AI to Measure Parkinson's Disease Severity at Home [2.7] パーキンソン病(PD)患者の運動能力を評価する人工知能システムを提案する。
運動障害学会統一パーキンソン病評価尺度(MDS-UPDRS)を施行した3人の神経学者による世界250人の参加者のデータを評価した。
我々の機械学習モデルは,MDS-UPDRS認定レーダよりも優れており,平均絶対誤差は0.59であり,レーダのMAEは0.79であった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:38:15 GMT)
MovePose: A High-performance Human Pose Estimation Algorithm on Mobile
and Edge Devices [2.6] 我々は、モバイルデバイス上でリアルタイムのボディポーズ推定に特化して設計された、軽量な畳み込みニューラルネットワークであるMovePoseを紹介する。
このネットワークは、毎秒11フレームを超えるレートで、各個人に対して17のキーポイントを生成し、フィットネストラッキング、手話解釈、高度な移動体姿勢推定などのリアルタイムアプリケーションに適合する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:23:52 GMT)
Identity-Aware Semi-Supervised Learning for Comic Character
Re-Identification [2.5] 本稿では,メタラーニングと新しい「アイデンティティ・アウェア」自己監督手法を組み合わせた頑健なフレームワークを提案する。
我々のアプローチは、統合されたネットワークアーキテクチャにおいて、顔と身体の両方の機能を処理することである。
シリーズ内評価とシリーズ間評価の指標を用いて,本手法を広範囲に検証することにより,漫画のキャラクターを一貫した同定において,その有効性を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:48:41 GMT)
Characterizing Information Seeking Events in Health-Related Social
Discourse [2.4] イベント駆動分析は、個別および集団レベルで、医療のさまざまな側面に関する洞察を提供することができる。
Treat-ISEは、イベントベースのフレームワークでオンライン談話を分析するための、新しいマルチラベル処理情報検索イベントデータセットである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:08:42 GMT)
Long-lived quantum memory enabling atom-photon entanglement over 101 km
telecom fiber [2.4] 本報告では, 長波長光ファイバー上での1つの87ドルRb原子と1つの光子との絡み合いを拡大する開発について報告する。
このような繊維を介して長い飛行時間に高い忠実性を維持するために、長寿命のクビット符号化を適用することにより、単一原子のコヒーレンス時間を7msに延長する。
これにより、101kmの光ファイバーを70.8$pm$2.4%以上の忠実度で通過させた後に、原子量子メモリと放出光子との間の絡み合いを観測することができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:00:22 GMT)
Hyperfuzzing: black-box security hypertesting with a grey-box fuzzer [2.2] LeakFuzzerは、非干渉セキュリティプロパティとセキュリティフローポリシーを神託として使用することで、技術の状態を前進させる。
LeakFuzzerは、通常のファジィザが検出できるのと同じエラーセットを検出し、セキュアな情報フローポリシー違反を検出することができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:15:02 GMT)
Observational entropy with general quantum priors [2.2] 観測エントロピーは、暗黙的に一様参照を含むことを示す。
我々は、任意の量子状態に先立って一様を置き換えることにより、完全量子一般化を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 03:32:42 GMT)
Fault Localization for Buggy Deep Learning Framework Conversions in
Image Recognition [2.2] 本稿では,バグの多いディープラーニングフレームワーク変換のフォールトローカライズと修復に向けて,新しいアプローチを提案する。
我々は,Apache TVMディープラーニングコンパイラ上に実装した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:48:34 GMT)
Probabilistic Results on the Architecture of Mathematical Reasoning
Aligned by Cognitive Alternation [2.0] 数学的問題を解くことができる機械を構想する。
定量的推論システムを思考プロセスと認知プロセスの2つの部分に分割し、アーキテクチャの確率論的記述を提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:35:11 GMT)
Online Transition-Based Feature Generation for Anomaly Detection in
Concurrent Data Streams [1.9] 本稿では、属性付き一般的なアクティビティデータを読み出し、ステップバイステップで生成されたデータを生成するTFGen(transition-based feature generator)技術を紹介する。
TFGenはデータをオンラインで処理し、高い計算効率で受信した各アクティビティの履歴データをエンコードしたデータを生成する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:29:44 GMT)
Neural oscillators for generalization of physics-informed machine
learning [1.9] 物理インフォームド機械学習(PIML)の最大の課題は、トレーニング領域を超えた一般化である。
本稿では,PIMLの一般化能力の向上をめざし,実用的で現実的な応用を促進することを目的とする。
我々は、PDEソリューションの因果性と時間的逐次特性を利用して、反復的なニューラルアーキテクチャを持つPIMLモデルを融合する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:50:03 GMT)
RTB Formulation Using Point Process [1.7] 本稿では,ポイントプロセスを用いたリアルタイム入札(RTB)エコシステムにおいて,繰り返しオークションをモデル化するための一般的なフレームワークを提案する。
プレイヤーの最適な戦略を様々なシナリオで特定する。
限界分布を個別に見積もるのではなく,実用性と市場状態の連立分布を考えることが重要である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:57:59 GMT)
Data diversity and virtual imaging in AI-based diagnosis: A case study
based on COVID-19 [1.7] 多くの研究が、新型コロナウイルス(COVID-19)の医療画像診断のためのディープラーニングベース人工知能(AI)モデルについて研究している。
パフォーマンスのばらつきと基礎となるデータバイアスは、臨床の一般化に関する懸念を引き起こす。
この振り返り研究は、多様な臨床画像と実質的に生成された医療画像を用いて、新型コロナウイルスの診断のためのAIモデルの開発と評価を含む。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:12:32 GMT)
Automatic Signboard Recognition in Low Quality Night Images [1.7] 本稿では,低照度,雑音,ぼかしで捉えた画像から交通信号を認識することの課題について述べる。
提案手法は,Yolov4の低画質画像に対して,mAP@0.5で5.40%向上した。
また、GTSDBデータセットでmAP@0.5の100%を達成した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:26:06 GMT)
Forecasting Algorithms for Causal Inference with Panel Data [1.6] 我々は,処理単位が処理を行なわなかった場合の反実的進化をより正確に予測するために,時系列予測のための深部ニューラルネットワークアーキテクチャ(N-BEATSアルゴリズム)を適用した。
様々な設定において、結果として生じる推定器("SyNBEATS")は、一般的に用いられるメソッドよりも著しく優れています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:00:36 GMT)
Deep-seeded Clustering for Unsupervised Valence-Arousal Emotion
Recognition from Physiological Signals [1.6] 本稿では、生理的・心理的データから感情認識を行うための、教師なしのディープクラスタフレームワークを提案する。
オープンベンチマークデータセット WESAD での試験では、深いk平均と深いc平均がラッセルの概略モデルの4つの四分項を87%の精度で区別していることが示された。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:37:35 GMT)
APPFLx: Providing Privacy-Preserving Cross-Silo Federated Learning as a
Service [1.5] クロスサイロプライバシ保護フェデレーション学習(PPFL)は、機密性の高いローカルデータを共有することなく、堅牢で一般化された機械学習(ML)モデルを協調的にトレーニングする強力なツールである。
APPFLxは、プライバシ保護のためのクロスサイロ・フェデレーション・ラーニング・アズ・ア・サービスを提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:15:47 GMT)
Precision and Recall Reject Curves for Classification [1.5] 本稿では、精度とリコール、リコール・リジェクト曲線、精度・リジェクト曲線を評価するリジェクション曲線を提案する。
不均衡なベンチマークと、これらのシナリオに対して提案された精度とリコール曲線によりより正確な洞察が得られる実世界の医療データを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:31:20 GMT)
A Fusion of Variational Distribution Priors and Saliency Map Replay for
Continual 3D Reconstruction [1.4] 単一画像からの3次元物体形状の予測に焦点をあてた研究課題である。
このタスクは、形状の可視部分と隠蔽部分の両方を予測するために、重要なデータ取得を必要とする。
本稿では,従来のクラスを新しいクラスで学習した後でも合理的に再構築できる変分優先を用いたモデルの設計を目標とする,連続的な学習に基づく3D再構成手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:48:55 GMT)
ReProHRL: Towards Multi-Goal Navigation in the Real World using
Hierarchical Agents [1.3] 本稿では、強化学習によって誘導される階層的マルチゴールナビゲーションでタスクを分割する生産階層RL(ReProHRL)について述べる。
また、物体検出装置を前処理のステップとして使用して、マルチゴールナビゲーションを学習し、それを現実世界に転送する。
実世界の実装と概念実証のために,提案手法をフロントカメラを用いたナノドローンCrzyflieに展開する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:23:59 GMT)
Sensor Fusion by Spatial Encoding for Autonomous Driving [1.3] 本稿では,カメラとLiDARのデータを融合する手法を提案する。
複数の解像度でTransformerモジュールを利用することで、ローカルおよびグローバルなコンテキスト関係を効果的に組み合わせることができる。
提案手法は, 従来の手法よりも高い性能を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:12:02 GMT)
Linguistically-Informed Neural Architectures for Lexical, Syntactic and
Semantic Tasks in Sanskrit [1.2] この論文は、サンスクリット写本を自然言語技術を通じてエンドユーザーにとってよりアクセスしやすくすることを目的としている。
サンスクリットの形態的豊かさ、複合性、自由語順性、低リソース性は、ディープラーニングソリューションを開発する上で重要な課題となっている。
我々は,サンスクリットの堅牢なNLP技術開発に不可欠な4つの基本課題を特定した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:33:33 GMT)
Protocol for nearly deterministic parity projection on two photonic
qubits [1.1] 2つのフォトニック量子ビット上のほぼ決定論的パリティプロジェクションプロトコルを提案する。
我々のプロトコルが完全制御Zゲートを必要としないという事実は、より実験的な実装に適しています。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:17:21 GMT)
Learning the hub graphical Lasso model with the structured sparsity via
an efficient algorithm [1.1] ハブグラフィカルモデルを推定する二相アルゴリズムを提案する。
提案アルゴリズムはまず,乗算器の2つの交互方向法を用いてよい初期点を生成する。
その後、半滑らかなニュートン(SSN)ベースの拡張ラグランジアン法(ALM)を温め、実用的なタスクに十分正確な解を計算する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:24:28 GMT)
ACIPS: A Framework for Evaluating Patient Perception in the Introduction
of AI-Enabled Healthcare [1.1] 本稿では,医療環境におけるAI対応デジタル技術の導入に対する患者の反応を評価するためのフレームワークACIPSを提案する。
我々は、人間中心の分野におけるAIの関連性と認識される課題の一般的な導入により、ACIPSの必要性を正当化する。
このフレームワークは、AIが医療でどのように使われているかを学ぶ際に保持される、受容性、快適性、インフォームドコンセント、プライバシー、セキュリティ患者の知覚を測定する5つの原則で構成されている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:42:56 GMT)
Feedback Enhanced Phonon Lasing of a Microwave Frequency Resonator [1.0] 本稿では,自励式機械共振器の振幅を増大させるフィードバック手法を提案する。
この手法は、コヒーレントスピンフォノンカップリングのような高動的機械的応力に依存する応用を推し進める。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:00:03 GMT)
Pattern recognition using spiking antiferromagnetic neurons [1.0] 我々は、パターン認識を行うために、AFMニューロンの人工ニューラルネットワークを訓練する。
ニューロンスパイクの時間的位置に依存するスパイクパターン関連ニューロン(SPAN)と呼ばれる単純な機械学習アルゴリズムが訓練中に使用される。
物理時間のマイクロ秒未満では、AMMニューラルネットワークは、指定された時間ウィンドウ内でスパイクを生成してグリッドから構成されたシンボルを認識するように訓練される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:00:57 GMT)
A coherence-witnessing game and applications to semi-device-independent
quantum key distribution [1.0] コヒーレンスをベースとした半デバイス非依存の半量子鍵分配プロトコルを,コヒーレンス平等ゲームのノイズロスバージョン上に構築する。
セキュリティはバウンド量子ストレージモデルで証明されており、ユーザーは古典的な操作のみを実装する必要がある。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:27:46 GMT)
Automatic Cadastral Boundary Detection of Very High Resolution Images
Using Mask R-CNN [1.0] 本稿では,ディープラーニングに着目し,作業の質を向上させるための3つの幾何学的後処理手法を提案する。
最初の部分では、ImageNetデータセット上で、事前トレーニングされたResNet-50のバックボーンでMask R-CNNを使用します。
第2段階では、3つの幾何学的後処理法を第1部の出力に適用し、全体的な出力を改善する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:47:15 GMT)
Education in the age of Generative AI: Context and Recent Developments [0.8] 人工知能の教育導入は1960年代までさかのぼる。
この白書は、教育におけるAIの役割を解明する4部作の第1部として機能する。
このシリーズは、その可能性、成功しているアプリケーション、制限、倫理的考慮、将来のトレンドといったトピックを掘り下げている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:56:57 GMT)
Beyond the Pixel: a Photometrically Calibrated HDR Dataset for Luminance
and Color Prediction [0.7] Laval Photometric Indoor HDRデータセットは、高ダイナミックレンジ360degパノラマの大規模な測光校正データセットとしては初めてである。
我々は、RAWブラケットによる露光をプロの測光装置と同時に正確に捕捉することで実現している。
得られたデータセットは屋内シーンの豊かな表現であり、幅広い照度と色、様々な種類の光源を表示する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:32:02 GMT)
Quantifying the biomimicry gap in biohybrid systems [0.7] 我々は,ヒラメの4種の魚類(Hemigrammus rhodostomus)とニューラルネットワーク(NN)モデルを用いた生体模倣的社会相互作用の生成を行った。
分析の結果,1) 実世界の相互作用におけるルアーとNNはシミュレーションや魚のみの実験に比べて最小限の偏差を保ち,2) NNはロボットをリアルタイムで効率的に制御し,3) バイオミミクリーギャップを埋めるためには包括的検証が不可欠であることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:33:15 GMT)
A Novel Loss Function Utilizing Wasserstein Distance to Reduce
Subject-Dependent Noise for Generalizable Models in Affective Computing [0.5] 感情は人間の行動の重要な部分であり、思考、意思決定、コミュニケーションスキルに影響を与える可能性がある。
感情を正確に監視し識別する能力は、行動訓練、感情的幸福の追跡、人間とコンピュータのインターフェイスの開発など、多くの人間中心のアプリケーションで有用である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:15:26 GMT)
Classical surrogate simulation of quantum systems with LOWESA [0.4] 本稿では,古典的に構築されたサロゲート期待ランドスケープを通じて量子システムを忠実にシミュレーションするアルゴリズムとしてLOWESAを紹介する。
最大20個のトロッターステップを持つヘキサゴン格子上に127量子ビットの逆場イジング量子系をシミュレートする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:32:16 GMT)
On the fragility of gate-error metrics in simulation models of
flux-tunable transmon quantum computers [0.3] 精度の欠如は、平均不忠実度やダイヤモンド距離といったゲートエラーの指標によって定量化されることが多い。
本稿では,これらの問題をフラックス可変トランスモンとカップリング共振器を用いた量子コンピュータの現実シミュレーションモデルを用いて検討する。
本研究の主目的は,(1)ゲートエラー指標がモデル上の多くの仮定に影響されていること,(2)連続ゲートエラーが線形に蓄積されないこと,(3)ゲートエラー指標が連続ゲートの性能予測に弱いこと,である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:26:41 GMT)
Embracing assay heterogeneity with neural processes for markedly
improved bioactivity predictions [0.3] リガンドの生物活性を予測することは、コンピュータ支援薬物発見において最も困難かつ最も重要な課題の1つである。
長年のデータ収集とキュレーションの努力にもかかわらず、生物活性データは希少で不均一である。
異種アッセイ間の情報シナジーを利用した階層型メタラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:26:58 GMT)
An Efficient Quantum Factoring Algorithm [0.3] 我々は、$tildeO(n3/2)$の量子回路を独立に実行することで、$n$bit整数を分解できることを示した。
アルゴリズムの正しさは、指数的古典的因数分解アルゴリズムで使われるものに似た数論的な仮定に依存する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:49:04 GMT)
Towards Lightweight Data Integration using Multi-workflow Provenance and
Data Observability [0.3] 統合データ分析は、特に現在のAI時代において、科学的発見において重要な役割を果たす。
軽量ランタイム向けマルチワークフロー統合データ分析手法MIDAを提案する。
Summitスーパーコンピュータの1,680個のCPUコア上で,最大10000のタスクを実行するほぼゼロのオーバーヘッドを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:20:29 GMT)
Explainable Multi-View Deep Networks Methodology for Experimental
Physics [0.2] 物理実験は、X線スキャンや顕微鏡画像などの複数の画像表現を含むことが多い。
深層学習モデルはこれらの実験において教師あり分析に広く利用されている。
マルチビューデータが現れ、それぞれのサンプルは異なる角度、ソース、モダリティからのビューによって記述される。
マルチビューモデルには適切な説明責任が欠如しており、アーキテクチャのため説明が難しい。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:58:55 GMT)
A comprehensive study of spike and slab shrinkage priors for
structurally sparse Bayesian neural networks [0.2] スパースディープラーニングは、基礎となるターゲット関数のスパース表現を復元することで、課題に対処する。
構造化された空間によって圧縮されたディープニューラルアーキテクチャは、低レイテンシ推論、データスループットの向上、エネルギー消費の削減を提供する。
本研究では, (i) Spike-and-Slab Group Lasso (SS-GL) と (ii) Spike-and-Slab Group Horseshoe (SS-GHS) を併用した過剰ノードを誘発する構造的疎いベイズニューラルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:14:18 GMT)
SR-GAN for SR-gamma: photon super resolution at collider experiments [0.1] 我々は超解像ネットワークを訓練し、各次元の4倍の解像度で画像を生成する。
生成された画像は、名目上の解像度で画像から明らかでない電磁シャワーの特徴を再現することができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:55:23 GMT)
Towards Phytoplankton Parasite Detection Using Autoencoders [0.1] 本稿では,オリジナルおよびオートエンコーダで再構成されたサンプルの類似性に基づく教師なし異常検出システムを提案する。
植物プランクトン9種のF1スコアは0.75点に達した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:28:12 GMT)
The universe as a nonlinear quantum simulation: Large $n$ limit of the
central spin model [0.0] 我々は、$n$-qubit中心スピンモデルへの写像に基づく非線形量子ビット進化のモデルについて検討する。
この双対性は、線形および非線形量子力学に従って進化する宇宙の間に明確な区別がないことを意味する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:57:48 GMT)
Targeted Adversarial Attacks on Wind Power Forecasts [0.0] 研究によると、ディープラーニングモデルは敵の攻撃によって操作されることが多い。
風力予測は、現代の電力システムの安定性に不可欠である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:44:16 GMT)
Steering Language Generation: Harnessing Contrastive Expert Guidance and
Negative Prompting for Coherent and Diverse Synthetic Data Generation [0.0] 大規模言語モデル(LLM)は、高品質で実用性の高い合成データを生成する大きな可能性を秘めている。
本稿では,細調整された言語モデルと基本言語モデルのロジット分布の違いを強調する,対照的な専門家指導を紹介する。
STEER: Embedding Repositioningによるセマンティックテキストの強化。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:08:39 GMT)
State-dependent potentials for the $^1\text{S}_{0}$ and $^3\text{P}_{0}$
clock states of neutral ytterbium atoms [0.0] 我々は174textYb$原子における1textS_0-3textP_0$クロック遷移に対する3つの異なる状態依存波長の測定を行った。
具体的には、652.281(21),$THzと542.50205(19),$THzの2つの魔法の波長を決定する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:22:34 GMT)
Spectral information criterion for automatic elbow detection [0.0] スペクトル情報基準(SIC)は、自動肘検出器であると考えられている。
SICは全ての可能なモデルのサブセットを提供し、しばしば可能なモデルの総数よりもはるかに小さい基数を持つ。
我々はSICをいくつかの数値実験でテストし、実際のデータセットを含む2つの実験を行った。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:18:45 GMT)
Semantic Information for Object Detection [0.0] 本稿では,インスタンスレベルのアノテーションを付加した画像のデータセットから知識グラフを抽出する新しい手法を提案する。
本稿では,Faster-RCNNおよびDETRオブジェクト検出モデルにおける知識認識再最適化の有効性について検討する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:53:29 GMT)
Revisiting mass-radius relationships for exoplanet populations: a
machine learning insight [0.0] 我々は効率的な機械学習手法を用いて、762個の太陽系外惑星と8個の太陽系外惑星からなるデータセットを解析した。
異なる教師なしクラスタリングアルゴリズムを適用することで、データを「小さい」惑星と「巨大な」惑星の2つの分類に分類する。
我々の分析は、惑星の質量、軌道周期、恒星質量が太陽系外惑星半径を予測する重要な役割を担っていることを強調している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:55:54 GMT)
Representations of epistemic uncertainty and its perception in
data-driven initiatives [0.0] 本稿では,エージェントが介在する情報伝達に関する知識表現や推論の不確実性に対処する新しい概念モデルを提案する。
これらの組み合わせによって更新が表現され、その説明可能性はその異なる次元表現における一貫性に基づいている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:34:43 GMT)
Relational Quantum Mechanics and Consistent Histories [0.0] 本稿では,この量子力学に関する諸問題について論じる。
まず、RQMが従う文脈性による測定の可能性について論じる。
次に、一貫性のあるフォーマリズムを用いて、システムのどのインフォメーションシステムを異なるオブザーバ間で共有できるかを明らかにする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:25:35 GMT)
Recursive Detection and Analysis of Nanoparticles in Scanning Electron
Microscopy Images [0.0] 本研究では,走査型電子顕微鏡(SEM)画像中のナノ粒子の精密検出と包括的解析を目的とした計算フレームワークを提案する。
このフレームワークはPythonの堅牢な画像処理機能を採用しており、特にOpenCV、SciPy、Scikit-Imageといったライブラリを利用している。
SEMナノ粒子のデータセットから得られた5つの異なるテスト画像から粒子を検出する精度は97%だ。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:08:05 GMT)
RatGPT: Turning online LLMs into Proxies for Malware Attacks [0.0] オープンに利用可能なプラグインを活用し、攻撃者と被害者の間のプロキシとしてLLMを使用します。
本稿では、ChatGPTが検出を回避しつつ悪意あるソフトウェアの普及に使用される概念実証を提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 20:54:39 GMT)
Quantum computing for chemistry and physics applications from a Monte
Carlo perspective [0.0] この観点は、物理学と化学の分野における量子アルゴリズムとモンテカルロ法の間の重複に焦点をあてる。
我々は、確立された量子モンテカルロ解を量子アルゴリズムに統合することの課題と可能性を分析する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:21:26 GMT)
Quantum Key Distribution using Expectation Values of Super-classical GHZ
States [0.0] 最大絡み合うグリーンベルガー・ホーネ・ザイリンガー状態の最適期待値に基づく新しい量子鍵分布スキームを提案する。
本プロトコルは連続的な可変角度で自由度を利用するため,鍵分布の安全性が向上する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:40:21 GMT)
Quantum Frame Relativity of Subsystems, Correlations and Thermodynamics [0.0] 内部量子参照フレーム(QRF)は、システムを異なる方法でサブシステムに分割する。
実際、サブシステム相対性理論は、内部フレームとの特殊相対性理論においても生じることを示す。
我々は,QRF変換の下でサブシステム間の相関やエントロピー,相互作用,ダイナミクスの種類がいつ,どのように変化するかを検討することに注力する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:00:03 GMT)
Protecting backaction-evading measurements from parametric instability [0.0] 総和と差分周波数から2つのポンプを変形させることにより,系の安定化とBAE性能の回復が可能であることを示す。
また, 弱い信号検出実験で得られた加速度は, このデチューニング技術によってのみ達成可能であることを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 19:55:18 GMT)
Promotion/Inhibition Effects in Networks: A Model with Negative
Probabilities [0.0] 生物学的ネットワークは、しばしばグラフの符号付きエッジウェイトとして促進/抑制をカプセル化する。
逆問題に対処し,ノードにおける有意な隣接度と表現レベルに基づいてネットワークエッジウェイトを決定する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:03:16 GMT)
Polynomial Bounds for Learning Noisy Optical Physical Unclonable
Functions and Connections to Learning With Errors [0.0] ノイズの存在下でも、光学的物理的非拘束関数(PUF)のクラスを任意に高い確率で精度で学習できることが示されている。
これはRh"uramir et al. (2013) の結果を拡張し、この分類のPUFのサブセットがノイズがない場合に学習可能であることを示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 22:26:48 GMT)
Orbital-free functional with sub-milliHartree errors for slabs [0.0] 我々は、スラブのコーン・シャム電子に対するトーマス・フェルミ運動エネルギー近似の正確な補正を導出する。
この膨張近似は、標準半局所密度汎関数によって欠落する重要な量子振動を含む。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:20:41 GMT)
On the variational treatment of a class of double-well oscillators [0.0] 我々は、有名なレイリー・リッツ変分法(RRVM)と、最近提案された超対称性量子力学に基づくアプローチを比較した。
未証明のSSQMGS上界は保たないことを示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:59:04 GMT)
On the Bell Experiment and Quantum Foundation [0.0] ベル実験は、量子力学の基礎への新しいアプローチの光で議論される。
基本的なモデルから、オブザーバーの心は何らかの方法で制限されなければならないと結論付けられる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:12:07 GMT)
Novel cavity-induced switching between Bell-state textures in a quantum
dot [0.0] 我々は、共鳴におけるこの相互作用の単純な理論的モデルが、複雑だが測定可能な効果をいかに予測するかを示す。
スピン、相対モード、放射を組み合わせた新しい偏光子状態が出現する。
我々は高相関スピンと電荷密度を含む新しいトポロジ効果を明らかにする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 01:31:36 GMT)
New Properties of Intrinsic Information and Their Relation to Bound
Secrecy [0.0] シークレットキーレートは、アリスとボブが共同確率分布のサンプリングからシークレットビットを抽出できる速度を測定する。
減少した内在情報が 0 であることは、内在情報が 0 である場合に限り証明する。
この結果は、以下の2つの予想のうちの少なくとも1つが偽であることを意味している:有界な秘密が存在するか、あるいは減少した内在的な情報が秘密鍵レートに等しい。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:10:45 GMT)
Near-Minimal Gate Set Tomography Experiment Designs [0.0] ほぼすべての冗長性を取り除き, GST 実験設計を合理化する方法を示す。
我々は、GST回路の心臓にある「胚」サブルーチンを解析することでこれを行う。
新しい実験設計は、以前のGST実験の精度をはるかに少ない回路で一致させることができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 04:46:25 GMT)
Multimode ion-photon entanglement over 101 kilometers of optical fiber [0.0] ノード内の各量子ビットと101kmの光ファイバーの上を移動した別個の光子との絡み合いを確立する能力を示す。
一度より多くの量子ビットに拡張すると、このマルチモードアプローチは、将来の光と物質の長距離量子ネットワークにおける絡み合いの分布率を高めるのに有用な手法となる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:56:19 GMT)
Multi-fidelity Fourier Neural Operator for Fast Modeling of Large-Scale
Geological Carbon Storage [0.0] 大規模炭素貯蔵問題を解決するために,多要素フーリエニューラル演算子を提案する。
このモデルは、同じ量の高忠実度データで訓練された高忠実度モデルに匹敵する精度で予測できる。
高忠実度データが極端に制限された場合でも、多忠実度FNOモデルが妥当な精度で圧力場を予測できることを観察する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:44:59 GMT)
Modeling Digital Penetration of the Industrialized Society Modeling
Digital Penetration of the Industrialized Society and its Ensuing
Transfiguration [0.0] 第4次産業革命は、デジタル技術のプロフェッショナルと社会空間への深い統合によって支えられ、社会に有意義に奉仕する機会を提供する。
本稿では, 価値創造, 価値消費, インフラの実現, 必要なスキル, 付加的なガバナンスを対象とする, 産業生態系の統一モデルを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:37:12 GMT)
Machine Learning-Assisted Discovery of Novel Reactor Designs via
CFD-Coupled Multi-fidelity Bayesian Optimisation [0.0] クロスセクションとコイルパスの変動を可能にする2つの新しいコイルチューブパラメタライゼーションを提案する。
提案手法は,複数の連続忠実度を特徴付け,パラメータ化メッシュやシミュレーションと組み合わせることで,より低い品質を実現するが,より高速なシミュレーションを最適化を通じて活用する。
高パラメータ化リアクターの設計,最適化,製造を実証することにより,次世代リアクターの枠組みの確立を目指す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:00:20 GMT)
Loss of coherence and coherence protection from a graviton bath [0.0] グラビトン浴と結合した量子調和振動子を考える。
その結果,デコヒーレンス率は高調波トラップ周波数の立方体に比例することがわかった。
特に、数値の重ね合わせは$frac1sqrt2left[vert0rangle+vert1rangleright]$ never decoheresである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:51:59 GMT)
Learning the Solution Operator of Boundary Value Problems using Graph
Neural Networks [0.0] グラフニューラルネットワーク(GNN)とスペクトルグラフ畳み込みを用いた2つの異なる時間非依存PDEに対する一般解演算子を設計する。
我々は、様々な形状と不均一性の有限要素ソルバからシミュレーションデータを用いてネットワークを訓練する。
有限要素メッシュの変動が多岐にわたる多様なデータセット上でのトレーニングが,優れた一般化結果を得るための鍵となる要素であることがわかった。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 07:34:37 GMT)
Learning representations by forward-propagating errors [0.0] バックプロパゲーション(BP)はニューラルネットワーク最適化のための学習アルゴリズムとして広く使われている。
現在のニューラルネットワークオプティミザイトンは、計算統一デバイスアーキテクチャ(CUDA)プログラミングによるグラフィカル処理ユニット(GPU)で実行される。
本稿では,GPU上でのアクセラレーションと同じくらい高速な高速学習アルゴリズムをCPU上で提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:56:26 GMT)
Interactions and integrability in weakly monitored Hamiltonian systems [0.0] 局所的な測定によるユニタリダイナミクスの分散は、量子系における測定誘起相と遷移をもたらす。
エンタングルメントエントロピーのシステムサイズスケーリングの急激な変化を特徴とする2種類の遷移が観察されている。
弱監視相における絡み合いのスケーリングの原因となる重要な要素を同定する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:00:11 GMT)
Improved Privacy-Preserving PCA Using Optimized Homomorphic Matrix
Multiplication [0.0] 主成分分析(英: principal Component Analysis、PCA)は、機械学習とデータ分析の領域で広く利用されている重要な技術である。
近年,セキュアなクラウドコンピューティングシナリオにおいて,プライバシ保護型PCAアルゴリズムの同型暗号化を活用する取り組みが進められている。
本稿では,これらの制約に対処するプライバシー保護PCAに対して,従来の手法に比べて効率,精度,拡張性に優れる新たなアプローチを提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:38:24 GMT)
Giant magnetic and optical anisotropy in cerium-substituted M-type
strontium hexaferrite driven by 4$f$ electrons [0.0] 重元素セリウム (Ce) を置換したM型ヘキサフェライトの巨大結晶異方性 (MCA) 定数が得られた。
電子構造は電子移動がCe$3+$とFe$2+$の形成に繋がることを示している。
Ce-ヘキサフェライトは、自動車の駆動モーターなどの装置での使用に適合する新しい高性能な臨界要素のない永久磁石材料である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:45:37 GMT)
Getting pwn'd by AI: Penetration Testing with Large Language Models [0.0] 本稿では,GPT3.5のような大規模言語モデルによるAIスパーリングパートナーによる浸透テストの強化の可能性について検討する。
セキュリティテストの課題のためのハイレベルなタスクプランニングと、脆弱な仮想マシン内での低レベルな脆弱性ハンティングである。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:26:40 GMT)
Fuzzy Labeling Semantics for Quantitative Argumentation [0.0] ファジィ議論システムのためのファジィラベリングと呼ばれる新しい定量的手法を提案する。
3重の受理性、拒絶性、不決定性の度合いは、議論の強さを評価するために用いられる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:43:29 GMT)
Fluctuations in the Entropy of Hawking Radiation [0.0] 我々は、重力経路積分(GPI)を用いて、ページ曲線の周りのホーキング放射エントロピーのゆらぎを計算する。
この矛盾は、ブラックホールヒルベルト空間次元が状態準備によって固定されないという事実に起因している。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 05:29:17 GMT)
Fingerprinting Defects in Hexagonal Boron Nitride via Multi-Phonon
Excitation [0.0] 六方晶窒化ホウ素における黄色の単一光子放出の起源を決定した。
この原子構造とその光学的性質の知識は、量子技術におけるこれらのエミッタの信頼性の高い実装に不可欠である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:47:09 GMT)
Feature Enforcing PINN (FE-PINN): A Framework to Learn the
Underlying-Physics Features Before Target Task [0.0] FE-PINNは計算コストの低い問題の基本パターンを学習することができる。
FE-PINNは、シリンダー上の流れ、2次元熱伝導、入口速度を計算する逆問題という3つのベンチマークに適用される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:10:07 GMT)
Evaluation of really good grammatical error correction [0.0] 文法的誤り訂正(GEC)は、異なる目的を持つ様々なモデルを含んでいる。
従来の評価手法では、システム機能や目的を完全に把握できない。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 13:45:35 GMT)
Evading Quantum Mechanics \'{a} la Sudarshan: quantum-mechanics-free
subsystem as a realization of Koopman-von Neumann mechanics [0.0] クープマン・ヴォン・ノイマン力学に関するスダルシャンの見解は、量子力学を含まないサブシステムにおいて実現されていると論じる。
量子力学のないサブシステムが実験的に実現されているため、クープマンヴォン・ノイマン力学は本質的に工学科学に変換される。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 11:06:06 GMT)
Estimating fire Duration using regression methods [0.0] 本稿では、RF(ランダム森林)、KNN、XGBoost回帰モデルおよびCNNなどの画像ベースによる既知の山火事の消火期間を予測する。
入力を別々に処理して最適な結果を得ることにより、システムは高速かつ比較的正確な将来の予測を行うことができる。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:11:27 GMT)
Enhancing the purity of single photons in parametric down-conversion
through simultaneous pump-beam and crystal-domain engineering [0.0] 生成した光子の空間相関に対するドメイン工学の影響について検討する。
単一光子状態の純度は,空間フィルタを使わずに99 %まで向上する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:44:33 GMT)
Enhancing API Documentation through BERTopic Modeling and Summarization [0.0] 本稿では、アプリケーションプログラミングインタフェース(API)ドキュメントの解釈の複雑さに焦点を当てる。
公式APIドキュメンテーションは、開発者にとって最も重要な情報ソースであるが、広くなり、ユーザフレンドリ性に欠けることが多い。
我々の新しいアプローチは、トピックモデリングと自然言語処理(NLP)にBERTopicの長所を利用して、APIドキュメントの要約を自動的に生成する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:57:12 GMT)
Enhanced repetition codes for the cross-platform comparison of progress
towards fault-tolerance [0.0] 繰り返し符号は、クロスプラットフォームの比較を可能にする実験の一般的な基礎となっている。
本稿では,繰り返しコード実験を拡張・改善する手法を提案する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:43:49 GMT)
Embedding stochastic differential equations into neural networks via
dual processes [0.0] 本稿では、微分方程式の予測のためのニューラルネットワーク構築のための新しいアプローチを提案する。
提案手法は入力と出力のデータセットを必要としない。
実演として,Ornstein-Uhlenbeck プロセスと van der Pol システムのためのニューラルネットワークを構築した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:29:49 GMT)
Does mBERT understand Romansh? Evaluating word embeddings using word
alignment [0.0] 類似度に基づく単語アライメントモデル(SimAlign と Super-Align )と mBERT と XLM-R の単語埋め込みを,ドイツ語とロマンシュ語の並行文に組み合わせて検証する。
mBERTの埋め込みを使用して、両方のモデルがアライメントエラー率0.22に達し、fast_alignを上回っている。
また、ドイツ語とロマンシュ語の単語アライメントのための金の標準も提示する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 08:54:42 GMT)
Developmental Bootstrapping of AIs [0.0] 発達的なブートストラップでは、AIは人間の子供のように能力が発達する。
発達型ロボティクスは、大人レベルの堅牢な能力を持つAIをまだ生産していない。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 16:31:33 GMT)
Collective neutrino oscillations on a quantum computer with hybrid
quantum-classical algorithm [0.0] 量子コンピュータ上での2自由度設定における集合ニュートリノ振動の時間発展をシミュレートする。
また、ノイズの多い中間規模量子(NISQ)デバイスにおける問題を解くために、より効率的なハイブリッド量子古典アルゴリズムも検討されている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 17:59:02 GMT)
Characterization and benchmarking of a phase-sensitive two-qubit gate
using direct digital synthesis [0.0] フラックス可変カプラを用いた2つのトランスモンキュービットを持つiSWAPゲートを実装した。
我々は、iSWAPゲートをチューニングし、ベンチマークするプロセスについて述べ、そこでは、パルスの相対位相をソフトウェアを介して制御する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:01:17 GMT)
Bures geodesics and quantum metrology [0.0] ビューズ計量に対する混合量子状態の多様体上の測地学について検討する。
これらの測地線は、アンシラと結合した系の物理的非マルコフ進化に対応することが示されている。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 00:00:39 GMT)
Block perturbation of symplectic matrices in Williamson's theorem [0.0] ウィリアムソンの定理の任意のシンプレクティック行列 $tildeS$ 対角化 $A+H$ は $tildeS=S Q+mathcalO(|H|)$ の形であることを示す。
我々の結果は、たとえ$A$がシンプレクティック固有値を繰り返したとしても成り立つ。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 15:31:00 GMT)
Aspects of heat currents in qubit systems [0.0] 一つの量子ビットの例と、異なる温度で2つの熱貯水池によって駆動される2つの結合量子ビットの単純な合成系について述べる。
熱力学の第2法則に則って, 熱電流に対する明示的な表現を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 09:01:50 GMT)
Architecture and Applications of IoT Devices in Socially Relevant Fields [0.0] 本稿では、そのアーキテクチャ、通信プロトコル、機能に基づいて、いくつかの重要な社会的関連分野におけるIoTデバイスをレビューする。
驚くことに、すでにかなりの数のデバイスがこれらの分野で報告されており、そのパフォーマンスは有望である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:43:58 GMT)
Approximate Real Symmetric Tensor Rank [0.0] $varepsilon$-neighborhood of $f$の最小対称テンソルランクは?
2つの定理を証明し、この問題に対して構築的な上限を与える3つの対応するアルゴリズムを開発する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:21:53 GMT)
Approaches to Generative Artificial Intelligence, A Social Justice
Perspective [0.0] チャンの「AI-giarism」と呼ばれるAI駆動の筆記支援の台頭は、盗作行為をよりアクセスしやすく、検出しにくくする。
本稿では、これらのモデルのトレーニング、本質的バイアス、およびAI生成書面の検出における潜在的な不正について、社会的正義の観点から、生成AIを探索することを目的とする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 06:30:46 GMT)
An Extended Convergence Result for Behaviour Tree Controllers [0.0] 振舞い木(BT)は階層的なハイブリッド制御ポリシーを組み立てるための最適なモジュラー・フレームワークである。
我々は、状態空間の所望部分に到達するという意味で、BTsの収束について研究する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:05:45 GMT)
Accurate machine learning force fields via experimental and simulation
data fusion [0.0] 機械学習(ML)ベースの力場は、量子レベルの精度で古典的原子間ポテンシャルのスケールにまたがる能力のために、ますます関心が高まりつつある。
ここでは、密度汎関数理論(DFT)計算と実験的に測定された力学特性と格子パラメータの両方を活用して、チタンのMLポテンシャルを訓練する。
融合したデータ学習戦略は、全ての対象目標を同時に満たすことができ、結果として、単一のソースデータで訓練されたモデルと比較して高い精度の分子モデルが得られることを実証する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 18:22:19 GMT)
A Survey on Malware Detection with Graph Representation Learning [0.0] マルウェアの検出は、マルウェアの数と複雑さの増大により、大きな関心事となっている。
近年、機械学習(ML)、特にディープラーニング(DL)は、データから有用な表現を学習することで、マルウェア検出において印象的な成果を上げている。
本稿は、共通アプローチとアーキテクチャの下で既存の作品を要約し、統一するための詳細な文献レビューを提供する。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 12:28:57 GMT)
A Novel Method of Function Extrapolation Inspired by Techniques in
Low-entangled Many-body Physics [0.0] 量子力学にインスパイアされた新しい外挿アルゴリズムを導入し,その性能を線形予測に対して評価する。
この結果から,提案アルゴリズムは線形予測に匹敵する外挿を生成するとともに,鋭い特徴を持つ関数に対する性能向上を示した。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 14:16:27 GMT)
A Novel Application for Real-time Arrhythmia Detection using YOLOv8 [0.0] 本稿では,最新のYou-Only-Look-Once (YOLO)v8アルゴリズムを用いた不整脈検出のための新しい応用を提案する。
我々のモデルは、NVIDIA Tesla V100で平均99.5%、0.992 mAP@50で不整脈を検出でき、検出時間は0.002秒である。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 02:01:22 GMT)
A Comparative Study of Text Embedding Models for Semantic Text
Similarity in Bug Reports [0.0] 既存のデータベースから同様のバグレポートを取得することは、バグを解決するのに必要な時間と労力を削減するのに役立つ。
我々はTF-IDF(Baseline)、FastText、Gensim、BERT、ADAなどの埋め込みモデルについて検討した。
本研究は, 類似のバグレポートを検索するための埋め込み手法の有効性について考察し, 適切なバグレポートを選択することの影響を明らかにする。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 21:36:56 GMT)
A Bottom-up Approach to Constructing Symmetric Variational Quantum
Circuits [0.0] 表現理論を用いて対称量子回路を構築する方法を示す。
ハードウェア効率のよい量子回路構築によく用いられる粒子保存交換ゲートの導出方法を示す。
論文参考訳(メタデータ) (Thu, 17 Aug 2023 10:57:15 GMT)