TrustLLM: Trustworthiness in Large Language Models [446.6] 本稿では,大規模言語モデル(LLM)における信頼度に関する総合的研究であるTrustLLMを紹介する。
まず、8つの異なる次元にまたがる信頼性の高いLCMの原則を提案する。
これらの原則に基づいて、真理性、安全性、公正性、堅牢性、プライバシ、機械倫理を含む6つの次元にわたるベンチマークを確立します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:49:05 GMT)
Adversarial Training Should Be Cast as a Non-Zero-Sum Game [122.0] 対人訓練の2つのプレイヤーゼロサムパラダイムは、十分な強靭性を発揮できていない。
敵のトレーニングアルゴリズムでよく使われるサロゲートベースの緩和は、ロバスト性に関するすべての保証を無効にすることを示す。
対人訓練の新たな非ゼロサム二段階の定式化は、一致し、場合によっては最先端の攻撃よりも優れたフレームワークをもたらす。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:55:44 GMT)
LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images [119.2] LLaVA-UHDは,任意のアスペクト比と高解像度の画像を効率的に知覚できる大規模マルチモーダルモデルである。
総合的な実験の結果、LLaVA-UHDは9つのベンチマークで2~3桁のデータで訓練されたLMMよりも優れていた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:04:11 GMT)
DeepSolo++: Let Transformer Decoder with Explicit Points Solo for Multilingual Text Spotting [112.5] DeepSolo++は単純なDETRライクなベースラインで、テキスト検出、認識、スクリプト識別を同時に行うために、明示的なポイントを持つ1つのデコーダを単独で使用することができる。
本手法は、英語のシーンだけでなく、複雑なフォント構造と中国語などの1000レベルの文字クラスで書き起こしを習得する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:30:03 GMT)
Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression [109.2] 本研究は,Large Language Models (LLM) の最初の完全評価を行う。
量子化は現在、効率性と信頼性を同時に達成する上で、プルーニングよりも効果的なアプローチであることが分かっています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:38:19 GMT)
MotionGPT: Finetuned LLMs Are General-Purpose Motion Generators [108.7] 本稿では,マルチモーダル制御信号を利用するMotionGPT(Motion General-Purpose generaTor)を提案する。
まず,マルチモーダル制御信号を離散符号に量子化し,それらを統一的なプロンプト命令で定式化する。
我々のMotionGPTは、LLMパラメータのわずか0.4%をチューニングすることで、マルチモーダル制御信号を用いた統一された人の動き生成モデルを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:14:50 GMT)
HVDistill: Transferring Knowledge from Images to Point Clouds via Unsupervised Hybrid-View Distillation [106.1] 本稿では,HVDistillと呼ばれるハイブリッドビューに基づく知識蒸留フレームワークを提案する。
提案手法は,スクラッチからトレーニングしたベースラインに対して一貫した改善を実現し,既存のスキームを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:18:08 GMT)
Provable and Practical: Efficient Exploration in Reinforcement Learning via Langevin Monte Carlo [105.0] 我々は、強化学習のためのトンプソンサンプリングに基づくスケーラブルで効果的な探索戦略を提案する。
代わりに、Langevin Monte Carlo を用いて、Q 関数をその後部分布から直接サンプリングする。
提案手法は,Atari57スイートからのいくつかの挑戦的な探索課題において,最先端の深部RLアルゴリズムと比較して,より優れた,あるいは類似した結果が得られる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:37:12 GMT)
HIRI-ViT: Scaling Vision Transformer with High Resolution Inputs [102.5] Vision Transformer(ViT)とConvolution Neural Network(CNN)のハイブリッドディープモデルは、ビジョンタスクのための強力なバックボーンのクラスとして登場した。
高分解能入力に適した4段のViTから5段のViTにアップグレードしたHIgh-Resolution Inputs(HIRI-ViT)のハイブリッドバックボーンを提案する。
HiRI-ViTは448$times$448の入力でImageNetで84.3%の最高のTop-1精度を達成し、iFormer-Sの83.4%を224$timesで0.9%改善した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:34:29 GMT)
Energy-guided Entropic Neural Optimal Transport [100.2] エネルギーベースのモデル(EBM)は、機械学習コミュニティで数十年にわたって知られている。
EBMとEntropy-regularized OTのギャップを埋める。
実際に,玩具2Dおよび画像領域における適用性を検証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:11:08 GMT)
T-MARS: Improving Visual Representations by Circumventing Text Feature Learning [99.4] LAIONの画像の40%近くは、字幕と重なるテキストを含んでいるという、我々の観察に動機づけられた新しいデータフィルタリング手法を提案する。
我々のシンプルでスケーラブルなアプローチであるT-MARSは、テキストが残りの視覚的特徴を支配するペアのみをフィルタリングします。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:18:02 GMT)
From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.4] 大規模基盤モデル(LLM)は様々な自然言語処理(NLP)タスクに革命をもたらした。
本稿では,最近のチャート理解の展開,課題,今後の方向性について概説する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:57:09 GMT)
Arc2Face: A Foundation Model of Human Faces [95.0] Arc2Faceは、ID条件のフェイスファンデーションモデルである。
既存のモデルと無矛盾の顔類似度で、多様なフォトリアリスティック画像を生成することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:32:51 GMT)
GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image [94.6] 単一画像から幾何学的属性を推定するための新しい生成基盤モデルであるGeoWizardを紹介する。
拡散前処理の活用は,資源利用における一般化,詳細な保存,効率性を著しく向上させることが示唆された。
本稿では,様々なシーンの複雑なデータ分布を,個別のサブディストリビューションに分離する,シンプルかつ効果的な戦略を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:50:41 GMT)
Mastering Text, Code and Math Simultaneously via Fusing Highly Specialized Language Models [93.9] 大規模言語モデル(LLM)は、3つのドメインすべてにまたがって高いパフォーマンスを同時に達成しようと試みている。
本稿では,すでに高度に特殊化されているモデルを融合する手法を提案する。
提案されているハウジングフレームワークであるUltraFuserは、すでに言語、コーディング、数学について十分に訓練されている3つの異なるスペシャリストで構成されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:21:28 GMT)
GaussNav: Gaussian Splatting for Visual Navigation [92.1] インスタンスイメージゴールナビゲーション(IIN)では、エージェントが探索されていない環境で、目標画像に描かれた特定のオブジェクトを見つける必要がある。
我々のフレームワークは3次元ガウススプラッティングに基づく新しい地図表現を構築する(3DGS)
我々のフレームワークは、Habitat-Matterport 3D(HM3D)データセットに挑戦するPath Length(SPL)が0.252から0.578に重み付けしたSuccessの増加によって証明された、パフォーマンスの著しい飛躍を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:56:48 GMT)
GenView: Enhancing View Quality with Pretrained Generative Model for Self-Supervised Learning [90.1] GenViewは、ポジティブなビューの多様性を強化するコントロール可能なフレームワークである。
我々は、正のペアの品質を評価する品質駆動のコントラスト損失を導入する。
肯定的なビュー品質の改善と品質主導のコントラスト損失のおかげで、GenViewはさまざまなタスクにわたる自己教師型学習を大幅に改善した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:41:26 GMT)
Motion-aware 3D Gaussian Splatting for Efficient Dynamic Scene Reconstruction [89.5] 動的シーン再構築のための新しい動き認識拡張フレームワークを提案する。
具体的には,まず3次元ガウス運動と画素レベルの流れの対応性を確立する。
より厳密な最適化問題を示す先行的な変形に基づくパラダイムに対して,過渡対応変形補助モジュールを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:46:26 GMT)
EchoReel: Enhancing Action Generation of Existing Video Diffusion Models [88.5] EchoReelは、既存のビデオからのモーションをエミュレートすることで、複雑なアクションを生成するためのVDMの機能を強化する新しいアプローチである。
Action Prismは参照ビデオからモーション情報を抽出する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:41:19 GMT)
Multistep Inverse Is Not All You Need [87.6] 実世界の制御環境では、観測空間は不要に高次元であり、時間関連ノイズにさらされることが多い。
したがって、観測空間を制御関連変数のより単純な空間にマッピングするエンコーダを学ぶことが望ましい。
本稿では,多段階逆予測と遅延フォワードモデルを組み合わせた新しいアルゴリズムACDFを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:36:01 GMT)
ReGenNet: Towards Human Action-Reaction Synthesis [87.6] 我々は、人間と人間の相互作用の非対称、動的、同期、および詳細な性質を分析する。
本研究では,人間の行動に条件付けされた人間の反応を生成するための,最初のマルチセットヒト行動反応ベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:33:06 GMT)
Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theory [87.0] 条件付き拡散モデルは現代の画像合成の基礎となり、計算生物学や強化学習などの分野に広く応用されている。
経験的成功にもかかわらず、条件拡散モデルの理論はほとんど欠落している。
本稿では,条件拡散モデルを用いた分布推定の急激な統計的理論を提示することにより,ギャップを埋める。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:08:24 GMT)
Offline Multitask Representation Learning for Reinforcement Learning [86.3] 強化学習(RL)におけるオフラインマルチタスク表現学習の研究
オフラインマルチタスク表現学習のための新しいアルゴリズム MORL を提案する。
我々の理論的結果は、ローランクモデルの表現を直接学習するのではなく、上流のオフラインタスクから学習した表現を使用することの利点を実証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:50:30 GMT)
The Lipschitz-Variance-Margin Tradeoff for Enhanced Randomized Smoothing [85.9] ディープニューラルネットワークの現実的な応用は、ノイズの多い入力や敵攻撃に直面した場合、その不安定な予測によって妨げられる。
入力にノイズ注入を頼りに、認証された半径を持つ効率的な分類器を設計する方法を示す。
新たな認証手法により、ランダムな平滑化による事前学習モデルの使用が可能となり、ゼロショット方式で現在の認証半径を効果的に改善できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:43:46 GMT)
Near-Optimal Solutions of Constrained Learning Problems [85.5] 機械学習システムでは、振る舞いを縮小する必要性がますます顕在化している。
これは、双対ロバスト性変数を満たすモデルの開発に向けた最近の進歩によって証明されている。
この結果から, 豊富なパラメトリゼーションは非次元的, 有限な学習問題を効果的に緩和することが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:55:45 GMT)
Global Optimality without Mixing Time Oracles in Average-reward RL via Multi-level Actor-Critic [83.9] Multi-level Actor-Critic (MAC) フレームワークには、Multi-level Monte Carlo (MLMC) 勾配推定器が組み込まれている。
2次元グリッドワールド目標到達ナビゲーション実験により、MACは従来のPGベースの平均報酬法よりも高い報酬を得られることを示した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:23:47 GMT)
How Far Are We on the Decision-Making of LLMs? Evaluating LLMs' Gaming Ability in Multi-Agent Environments [83.8] 本研究では,ゲーム理論のレンズによる大規模言語モデルの意思決定能力について検討する。
2人以上のエージェントが同時に参加するゲームに特化しています。
我々は,8つの古典的マルチエージェントゲームを含むGAMA-Benchというフレームワークを紹介した。
これらのゲームにおいて,モデルの性能を定量的に評価するためのスコアリング方式を設計する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:04:47 GMT)
Transferring Foundation Models for Generalizable Robotic Manipulation [82.1] インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:57:09 GMT)
Agent3D-Zero: An Agent for Zero-shot 3D Understanding [79.9] Agent3D-Zeroは、3Dシーン理解に対処する革新的な3D対応エージェントフレームワークである。
本稿では,3次元理解のための視点を積極的に選択し,分析することで,VLM(Large Visual Language Model)を利用する新しい手法を提案する。
Agent3D-Zeroの独特な利点は、新しい視覚的プロンプトの導入である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:47:03 GMT)
FLex: Joint Pose and Dynamic Radiance Fields Optimization for Stereo Endoscopic Videos [79.5] 内視鏡的シーンの再構築は、外科手術後の分析から教育訓練まで、様々な医療応用にとって重要な要素である。
変形組織の非常にダイナミックな環境下での移動内視鏡の挑戦的なセットアップに着目する。
複数重重なり合う4次元ニューラルラジアンスフィールド(NeRF)への暗黙的なシーン分離と、再構成とカメラのスクラッチからのポーズを協調的に最適化するプログレッシブ最適化手法を提案する。
これにより、使いやすさが向上し、5000フレーム以上の手術ビデオの処理に間に合うように復元能力を拡張できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:13:02 GMT)
Effectiveness Assessment of Recent Large Vision-Language Models [78.7] 専門的・汎用的なタスクにおいて,一般的な大規模視覚言語モデル(LVLM)の能力を評価する。
視覚認識とローカライゼーションの領域における最近の3つのオープンソースLVLM(MiniGPT-v2,LLaVA-1.5,Shikra)の性能について検討する。
本研究により, これらのモデルは, 特殊タスクだけでなく, 一般タスクにおいても, 限られた習熟度を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:21:01 GMT)
LSKNet: A Foundation Lightweight Backbone for Remote Sensing [78.3] 本稿では,軽量なLarge Selective Kernel Network (LSKNet) バックボーンを提案する。
LSKNetはその大きな空間受容場を調整し、リモートセンシングシナリオにおける様々なオブジェクトの範囲をモデル化する。
我々の軽量LSKNetは、標準リモートセンシング分類、オブジェクト検出、セマンティックセグメンテーションベンチマークに基づいて、最先端のスコアを設定しています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:43:38 GMT)
LLM^3:Large Language Model-based Task and Motion Planning with Motion Failure Reasoning [78.2] 従来のタスク・アンド・モーション・プランニング(TAMP)アプローチは、シンボル的タスク・プランニングと連続的なモーション・ジェネレーションを結びつける手作業によるインタフェースに依存している。
本稿では,ドメインに依存しないインターフェースを備えたLarge Language Model (LLM) ベースの TAMP フレームワーク LLM3 を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:03:47 GMT)
Executable Code Actions Elicit Better LLM Agents [77.0] この研究は、Pythonコードを使用して、Large Language Model(LLM)エージェントのアクションを統一されたアクション空間(CodeAct)に統合することを提案する。
Pythonインタプリタと統合されたCodeActは、コードアクションを実行し、事前アクションを動的に修正したり、マルチターンインタラクションを通じて新しい観察に新しいアクションを発行することができる。
CodeActのパフォーマンス向上は、解釈可能なコードを実行し、自然言語を使ってユーザとコラボレーションすることで、環境と対話するオープンソースのLLMエージェントを構築する動機となります。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:18:45 GMT)
Tram: A Token-level Retrieval-augmented Mechanism for Source Code Summarization [76.6] ニューラルモデルの性能を高めるために,デコーダ側で詳細なTokenレベル検索強化機構(Tram)を提案する。
文脈的コードセマンティクスの取得におけるトークンレベルの検索の課題を克服するために,コードセマンティクスを個々の要約トークンに統合することを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:04:56 GMT)
Improving Machine Translation with Human Feedback: An Exploration of Quality Estimation as a Reward Model [75.7] 本研究では,QEモデルを報酬モデルとして活用し,フィードバックトレーニングにおける人間の嗜好を予測する可能性について検討する。
まず,QEに基づくフィードバックトレーニングにおいて,翻訳品質が低下する中で,報酬の増大として現れる過度な最適化問題を同定した。
問題に対処するために,ルールを用いて誤った翻訳を検知し,報酬のスコアにペナルティ項を割り当てる,シンプルで効果的な手法を採用する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:16:16 GMT)
LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation [73.4] 本稿では,LN3Diffと呼ばれる新しいフレームワークを導入し,統一された3次元拡散パイプラインに対処する。
提案手法では,3次元アーキテクチャと変分オートエンコーダを用いて,入力画像を構造化されたコンパクトな3次元潜在空間に符号化する。
3次元生成のためのShapeNetの最先端性能を実現し,モノクロ3次元再構成と条件付き3次元生成において優れた性能を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:54:34 GMT)
Exploring Pre-trained Text-to-Video Diffusion Models for Referring Video Object Segmentation [72.9] ビデオ理解タスクのためのテキスト・ツー・ビデオ拡散モデル(T2V)から生成した視覚的表現について検討する。
固定T2Vモデル上に構築された専用コンポーネントを組み込んだ,VD-ITと呼ばれる新しいフレームワークを提案する。
我々のVD-ITは、既存の最先端手法を超越して、非常に競争力のある結果を得る。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:58 GMT)
Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.4] 視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。
具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。
実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:28:31 GMT)
DynaMoN: Motion-Aware Fast and Robust Camera Localization for Dynamic Neural Radiance Fields [71.9] 我々はDynaMoNを提案する。DynaMoNは、カメラのポーズ推定と、高速で正確なノベルビュー合成のためのスタティックス中心のレイサンプリングのための動的コンテンツを扱う。
我々の新しい反復学習方式は、NeRFのトレーニングとポーズパラメータの更新を切り替えて、改良された再構成と軌道推定の品質を向上する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:22:04 GMT)
UV Gaussians: Joint Learning of Mesh Deformation and Gaussian Textures for Human Avatar Modeling [71.9] メッシュ変形と2次元UV空間のガウステクスチャを共同学習することで3次元人体をモデル化するUVガウスアンを提案する。
我々は,多視点画像,走査モデル,パラメトリックモデル登録,およびそれに対応するテクスチャマップを含む,人間の動作の新たなデータセットを収集し,処理する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:03:56 GMT)
CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark [71.7] 大学レベルの教科知識と意図的推論を必要とするタスクにおいて,LMMを評価するために設計された,中国の大規模多分野マルチモーダル理解ベンチマークを導入する。
CMMMUは、大学試験、クイズ、教科書から12kの質問を手作業で収集し、アート・アンド・デザイン、ビジネス、サイエンス、ヘルス・アンド・メディカル、ヒューマニティ・アンド・ソーシャル・サイエンス、テック・アンド・エンジニアリングの6つの中核分野をカバーしている。
CMMMUは、中国語の文脈における複雑な認識とドメイン固有の知識による推論に焦点を当てている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:02:03 GMT)
In-context Autoencoder for Context Compression in a Large Language Model [70.8] In-context Autoencoder (ICAE) を提案し、長いコンテキストを短いメモリスロットに圧縮する。
ICAEは、大量のテキストデータに基づく自動符号化と言語モデリングの両方の目的を用いて、まず事前訓練を行う。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:45:48 GMT)
Continual Forgetting for Pre-trained Vision Models [70.5] 現実のシナリオでは、選択的な情報は事前訓練されたモデルから継続的に取り除かれることが期待される。
効率的な削除のためのグループスパースロラ(GS-LoRA)を提案する。
我々は,顔認識,物体検出,画像分類に関する広範な実験を行い,GS-LoRAが他のクラスに最小限の影響で,特定のクラスを忘れることが実証された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:33:56 GMT)
LeBenchmark 2.0: a Standardized, Replicable and Enhanced Framework for Self-supervised Representations of French Speech [70.3] この研究は、SSL対応のフランス語音声技術の評価と構築のためのオープンソースのフレームワークであるLeBenchmark 2.0を紹介している。
文書化され、大規模で、異質なコーパスを含み、14,000時間に及ぶ異質なスピーチがある。
コミュニティが共有する2600万から10億の学習可能なパラメータを含む、トレーニング済みのSSLwav2vec 2.0モデルが10種類含まれている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:54:15 GMT)
Siamese Learning with Joint Alignment and Regression for Weakly-Supervised Video Paragraph Grounding [70.3] ビデオ段落の接頭辞は、意味的関係と時間的順序を持つ複数の文を、トリミングされていないビデオからローカライズすることを目的としている。
既存のVPGアプローチは、かなりの数の時間ラベルに大きく依存している。
我々は、時間的アノテーションの必要性を排除するために、Wakly-Supervised Video paragraph Grounding (WSVPG)を導入し、探索する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:30:31 GMT)
LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model [70.1] 層共同拡散モデルであるLayerDiffは、テキスト誘導、多層化、構成可能な画像合成のために設計されている。
本モデルでは,従来の全画像生成手法に匹敵する性能で,高品質な多層画像を生成することができる。
LayerDiffは、レイヤ固有の画像編集やスタイル転送など、幅広いコントロール可能な生成アプリケーションを可能にする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:28:28 GMT)
Towards Real-World Blind Face Restoration with Generative Diffusion Prior [69.8] ブラインド顔の復元はコンピュータビジョンにおいて重要な課題であり、広範囲の応用により注目されている。
低画質の顔画像から特徴を効果的に抽出するBFRffusionを提案する。
また、人種、性別、年齢といったバランスのとれた属性を備えたPFHQというプライバシ保護顔データセットも構築しています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:23:48 GMT)
HallusionBench: An Advanced Diagnostic Suite for Entangled Language Hallucination and Visual Illusion in Large Vision-Language Models [69.5] 本稿では,画像コンテキスト推論評価のためのベンチマークであるHalusionBenchを紹介する。
このベンチマークは、1129の質問と組み合わせた346の画像で構成されており、すべて人間の専門家によって細心の注意を払って作成されている。
HallusionBenchの評価では、15種類のモデルをベンチマークし、最先端のGPT-4Vによって達成された31.42%の質問対精度を強調した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:42:10 GMT)
Farm3D: Learning Articulated 3D Animals by Distilling 2D Diffusion [67.7] 本稿では,カテゴリー固有の3D再構成器の学習方法であるFarm3Dについて述べる。
本稿では,Stable Diffusion などの画像生成装置を用いて,合成学習データを生成するフレームワークを提案する。
我々のネットワークは、単分子再構成や合成などの分析に利用でき、ビデオゲームのようなリアルタイムアプリケーションのための音響資産を生成することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:09:33 GMT)
Expressive Losses for Verified Robustness via Convex Combinations [67.5] 本研究では, 過近似係数と異なる表現的損失に対する性能分布の関係について検討した。
表現性が不可欠である一方で、最悪の場合の損失のより良い近似は、必ずしも優れた堅牢性-正確性トレードオフに結びついていないことを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:35:21 GMT)
What Are Tools Anyway? A Survey from the Language Model Perspective [67.2] 言語モデル(LM)は強力だが、主にテキスト生成タスクに向いている。
LMが使用する外部プログラムとしてツールを統一的に定義する。
各種ツールの効率を実証的に検討した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:20:07 GMT)
Dynamic Tuning Towards Parameter and Inference Efficiency for ViT Adaptation [67.1] 動的チューニング(DyT)は、ViT適応のためのパラメータと推論効率を改善するための新しいアプローチである。
DyTは既存のPEFT法と比較すると、同等またはそれ以上の性能を実現している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:05:52 GMT)
EnvGen: Generating and Adapting Environments via LLMs for Training Embodied Agents [65.4] 本稿では,より小型のRLエージェントが,弱体化している有用なスキルを学習するのを支援するために,EnvGenを提案する。
EnvGenで訓練された小さなRLエージェントは、GPT-4エージェントを含むSOTAメソッドよりも優れており、長い水平タスクをかなり高速に学習することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:51:16 GMT)
Functional-Group-Based Diffusion for Pocket-Specific Molecule Generation and Elaboration [63.2] ポケット特異的分子生成とエラボレーションのための機能群に基づく拡散モデルD3FGを提案する。
D3FGは分子を、剛体として定義される官能基と質量点としてのリンカーの2つのカテゴリに分解する。
実験では, より現実的な3次元構造, タンパク質標的に対する競合親和性, 薬物特性の良好な分子を生成できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:29:42 GMT)
Larimar: Large Language Models with Episodic Memory Control [62.7] Larimarは、分散エピソードメモリで大規模言語モデルを拡張するための、脳にインスパイアされたアーキテクチャである。
複数の事実編集ベンチマークの結果、Larimarは最も競争力のあるベースラインに匹敵する精度を達成した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:01:42 GMT)
NovelQA: A Benchmark for Long-Range Novel Question Answering [61.9] NovelQAは拡張テキストによる大規模言語モデルの能力をテストするために設計されたベンチマークである。
本稿では,ノベルQAの設計と構築について述べる。
NovelQAにおけるLong-context LLMの評価により,モデルの性能に関する重要な知見が得られた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:32:32 GMT)
Truly No-Regret Learning in Constrained MDPs [61.8] 未知のCMDPで学習するモデルベース原始双対アルゴリズムを提案する。
提案アルゴリズムは,誤差のキャンセルを伴わずにサブ線形後悔を実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:51:18 GMT)
Object-aware Inversion and Reassembly for Image Editing [61.2] オブジェクトレベルのきめ細かい編集を可能にするために,オブジェクト認識型インバージョンと再アセンブリ(OIR)を提案する。
画像の編集時に各編集ペアに対して最適な反転ステップを見つけるために,検索基準を用いる。
本手法は,オブジェクトの形状,色,材料,カテゴリなどの編集において,特に多目的編集シナリオにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:36:02 GMT)
UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio, Video, Point Cloud, Time-Series and Image Recognition [61.0] 大規模なカーネルベースの畳み込みニューラルネットワーク(ConvNets)を設計するための4つのアーキテクチャガイドラインを提案する。
提案する大規模カーネルベースのConvNetは,画像認識における主要な性能を示す。
大規模なカーネルが、もともと熟練していないドメインにおいて、ConvNetの例外的なパフォーマンスを解放する鍵であることを発見した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:37:24 GMT)
Robust Domain Adaptive Object Detection with Unified Multi-Granularity Alignment [59.8] ドメイン適応検出は、ターゲットドメイン上の検出器の一般化を改善することを目的としている。
近年のアプローチは、異なる粒度の特徴アライメントを通じて、逆学習を通じてドメイン適応を実現する。
ドメイン不変な特徴学習のための統合多重粒度アライメント(MGA)に基づく検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:57:19 GMT)
HD-Painter: High-Resolution and Prompt-Faithful Text-Guided Image Inpainting with Diffusion Models [59.0] HD-Painterはトレーニングフリーのアプローチで、プロンプトを正確に追従し、高解像度の画像インパインティングにコヒーレントにスケールする。
そこで我々は,自己注意スコアを向上するPrompt-Aware Introverted Attention (PAIntA) 層を設計した。
実験の結果,HD-Painterは既存の最先端アプローチを定量的に,質的に超越していることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:48:13 GMT)
Bongard-OpenWorld: Few-Shot Reasoning for Free-form Visual Concepts in the Real World [57.8] Bongard-OpenWorldは、マシンビジョンの実際の数ショット推論を評価するための新しいベンチマークである。
これは、現在の数発の推論アルゴリズムにすでに大きな課題を課している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:05:12 GMT)
OmniQuant: Omnidirectionally Calibrated Quantization for Large Language Models [57.3] 大規模言語モデル(LLM)は自然言語処理タスクに革命をもたらした。
近年のPTQ法はメモリフットプリントの削減とLLMの計算効率の向上に有効である。
多様な量子化設定において優れた性能を実現するLLMのOmnidirectly calibrated Quantization手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:33:22 GMT)
Bridging 3D Gaussian and Mesh for Freeview Video Rendering [57.2] GauMeshはダイナミックシーンのモデリングとレンダリングのために3D GaussianとMeshをブリッジする。
提案手法は, 動的シーンの異なる部分を表現するために, プリミティブの適切なタイプに適応することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:01:26 GMT)
Boosting Order-Preserving and Transferability for Neural Architecture Search: a Joint Architecture Refined Search and Fine-tuning Approach [57.2] 本稿では,アーキテクチャ探索とスーパーネットファインチューニングを組み合わせた検索手法であるSupernet Shiftingを提案する。
我々は、Supernet Shiftingが新しいデータセットにスーパーネットを転送できることを示す。
総合的な実験により,本手法の順序保存能力は向上し,支配的アーキテクチャを見出すことができた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:13:41 GMT)
Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters [57.0] 本稿では,視覚言語モデルを用いた漸進的学習における長期的忘れを緩和するパラメータ効率の連続学習フレームワークを提案する。
提案手法では,Mixture-of-Experts (MoE)アダプタの統合により,事前学習したCLIPモデルの動的拡張を行う。
視覚言語モデルのゼロショット認識能力を維持するために,分布判別オートセレクタを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:00:23 GMT)
RLIF: Interactive Imitation Learning as Reinforcement Learning [57.0] 我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:45:17 GMT)
On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [57.0] 本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:45:45 GMT)
Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities [56.7] 我々は,他のモダリティからの無関係なデータを用いて,特定のモダリティのトランスフォーマーを改善することを提案する。
我々は、他のモダリティのデータで訓練された補助変圧器を使用し、2つのモデルのコンポーネントを接続するための経路を構築している。
我々は、他のモダリティの無関係なデータを用いて、顕著で一貫したパフォーマンス改善を観察する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:45:52 GMT)
Auditing Fairness under Unobserved Confounding [56.6] リスクの高い個人間の割当率に情報的制約を与えることができることを示す。
新型コロナウイルス患者に対するPaxlovid割当の実環境調査において,本フレームワークの有効性を実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:09:06 GMT)
HyperVQ: MLR-based Vector Quantization in Hyperbolic Space [56.4] ベクトル量子化(HyperVQ)における双曲空間の利用について検討する。
本稿では,高VQが識別タスクにおいてVQを上回り,高度に絡み合った潜在空間を学習しながら,再建作業や生成作業において相容れない性能を発揮することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:17:08 GMT)
Diffusion Denoising as a Certified Defense against Clean-label Poisoning [56.0] 本稿では,市販の拡散モデルを用いて,改ざんしたトレーニングデータを浄化する方法を示す。
7件のクリーンラベル中毒に対する我々の防御を広範囲に検証し、その攻撃成功率を0-16%に抑え、テスト時間の精度は無視できない程度に低下した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:17:07 GMT)
Improving Expressive Power of Spectral Graph Neural Networks with Eigenvalue Correction [55.6] スペクトルグラフニューラルネットワークはフィルタによって特徴づけられる。
本稿では,繰り返し入力される固有値の制約からフィルタを解放する固有値補正手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:00:41 GMT)
IDF-CR: Iterative Diffusion Process for Divide-and-Conquer Cloud Removal in Remote-sensing Images [55.4] 雲除去のための反復拡散過程(IDF-CR)を提案する。
IDF-CRは、ピクセル空間と潜在空間に対処する2段階のモデルに分けられる。
潜時空間の段階では、拡散モデルは低品質の雲の除去を高品質のクリーンな出力に変換する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:23:48 GMT)
DreamSampler: Unifying Diffusion Sampling and Score Distillation for Image Manipulation [55.3] DreamSampler は任意の LDM アーキテクチャに適用可能なモデルに依存しないアプローチである。
既存のアプローチと比較して,DreamSamplerの競合性能を実証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:08:58 GMT)
Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [55.2] テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。
本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:49:45 GMT)
Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.0] 本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:01:01 GMT)
On student-teacher deviations in distillation: does it pay to disobey? [54.9] 知識蒸留は「学生」ネットワークのテスト精度を向上させるために広く用いられている。
教師の確率に合うように訓練されているにもかかわらず、生徒は教師の確率から大きく逸脱するだけでなく、パフォーマンスにおいて教師を上回ることもある。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:15:51 GMT)
A Library of Mirrors: Deep Neural Nets in Low Dimensions are Convex Lasso Models with Reflection Features [54.8] 1次元データ上でニューラルネットワークをトレーニングすることは、凸ラッソ問題を固定的、明示的に定義された特徴の辞書行列で解くのと等価であることを示す。
分割線形アクティベーションを持つ2層ネットワーク,最大4層までの細いReLUネットワーク,符号アクティベーションと任意の深さを持つ長方形およびツリーネットワークについて検討する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:11:45 GMT)
FlexCap: Generating Rich, Localized, and Flexible Captions in Images [54.8] 可変長の領域固有記述を生成できる多機能な$textitflexible-captioning$ Vision-Language Model(VLM)を導入する。
モデルであるFlexCapは、入力バウンディングボックスのための長さ条件付きキャプションを生成するように訓練されている。
これにより、簡潔なオブジェクトラベルから詳細なキャプションまで、その出力の情報密度を制御できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:57:02 GMT)
Object Segmentation-Assisted Inter Prediction for Versatile Video Coding [53.9] 本稿では,参照フレーム内のオブジェクトをいくつかの高度な技術でセグメント化するオブジェクトセグメンテーション支援インター予測手法を提案する。
適切な指示により、オブジェクトセグメンテーションマスクは、参照フレームから現在のフレームに、異なる領域の任意の形のパーティションとして変換される。
提案手法は, 最大1.98%, 1.14%, 0.79%, 平均0.82%, 0.49%, 0.37%のBDレート低下が得られた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:48:20 GMT)
EasyJailbreak: A Unified Framework for Jailbreaking Large Language Models [53.9] 本稿では,大規模言語モデル(LLM)に対するジェイルブレイク攻撃の構築と評価を容易にする統合フレームワークであるEasyJailbreakを紹介する。
Selector、Mutator、Constraint、Evaluatorの4つのコンポーネントを使ってJailbreak攻撃を構築する。
10の異なるLSMで検証した結果、さまざまなジェイルブレイク攻撃で平均60%の侵入確率で重大な脆弱性が判明した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:39:53 GMT)
Measuring Meaning Composition in the Human Brain with Composition Scores from Large Language Models [53.8] コンポジションスコアは、文理解中に意味合成の度合いを定量化するために設計された、新しいモデルに基づく計量である。
実験結果から, 単語の頻度, 構造処理, 単語に対する一般感性に関連する脳クラスタとの関連が示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:17:48 GMT)
Complete and Efficient Graph Transformers for Crystal Material Property Prediction [53.3] 結晶構造は、3次元空間の正則格子に沿って繰り返される原始単位セル内の原子塩基によって特徴づけられる。
本稿では,各原子の格子に基づく表現を確立するために,単位細胞の周期パターンを利用する新しい手法を提案する。
結晶材料に特化して設計されたSE(3)トランスであるComFormerを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:06:37 GMT)
MoreStyle: Relax Low-frequency Constraint of Fourier-based Image Reconstruction in Generalizable Medical Image Segmentation [53.2] MoreStyleと呼ばれるデータ拡張のためのPlug-and-Playモジュールを紹介します。
MoreStyleは、フーリエ空間の低周波制約を緩和することで、イメージスタイルを多様化する。
敵対的学習の助けを借りて、MoreStyleは潜在機能の中で最も複雑なスタイルの組み合わせを指差している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:38:47 GMT)
Multimodal Transformer Distillation for Audio-Visual Synchronization [53.2] 本稿ではMTDVocaLiSTモデルを提案する。
MTDVocaLiSTはVocaLiSTのモデルサイズを83.52%削減するが、同様の性能を維持している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:55:34 GMT)
Open-World Semi-Supervised Learning for Node Classification [53.1] ノード分類のためのオープンワールド半教師付き学習(Open World SSL)は、グラフコミュニティにおいて実用的だが未探索の課題である。
オープンワールド半教師付きノード分類のためのIM Balance-AwareメソッドOpenIMAを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:12:54 GMT)
SlimSAM: 0.1% Data Makes Segment Anything Slim [53.0] 本稿では,新しいデータ効率のSAM圧縮手法であるSlimSAMを紹介する。
SlimSAMは、非常に少ないトレーニングデータで優れたパフォーマンスを達成する。
コードはhttp://github.com/czg1225/SlimSAMで入手できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:38:04 GMT)
Distributional Reinforcement Learning with Dual Expectile-Quantile Regression [51.9] 分布RLに対する量子レグレッションアプローチは、任意の戻り分布を柔軟かつ効果的に学習する方法を提供する。
我々は,分布保証が消えることを示し,推定分布が急速に崩壊して平均推定値が崩壊することを実証的に観察する。
提案手法は,$L$の学習効率を生かして,返却分布の予測値と量子化値とを協調的に学習し,返却分布の完全な分布を推定し,効率的な学習を可能にするものである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:27:21 GMT)
Aerial Lifting: Neural Urban Semantic and Building Instance Lifting from Aerial Imagery [51.7] 航空画像から都市規模のセマンティックスとビルレベルのインスタンスセグメンテーションのためのニューラルラジアンスフィールド法を提案する。
都市空撮画像の物体は、建物、車、道路など、相当な大きさのバリエーションを示している。
我々は,様々な大きさのオブジェクトのセグメンテーションを強化する,スケール適応型セマンティックラベル融合戦略を導入する。
次に、2次元のインスタンスラベルにおける多視点不整合問題を緩和するために、新しいクロスビューインスタンスラベルグループ化戦略を導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:15:39 GMT)
LLM-CXR: Instruction-Finetuned LLM for CXR Image Understanding and Generation [51.1] LLMにおける視覚言語アライメントは、マルチモーダル推論とビジュアルIOを可能にするために活発に研究されている。
医用画像の視覚言語能力を得るために,テキストのみにLLMを指導する手法を開発した。
このアプローチで訓練したLLM-CXRは,CXR理解タスクと生成タスクの両方において,より優れた画像テキストアライメントを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:41:09 GMT)
Can LLMs Generate Human-Like Wayfinding Instructions? Towards Platform-Agnostic Embodied Instruction Synthesis [51.0] 本稿では,ロボットエージェントの「ウェイフィンディング指示」を自動的に合成する手法を提案する。
提案アルゴリズムは,LLMの条件付けにコンテキスト内学習を用い,わずかな参照を用いて命令を生成する。
我々は,Matterport3D,AI Habitat,ThreeDWorldなど,複数のシミュレーションプラットフォームにアプローチを実装した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:38:07 GMT)
Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.8] 本稿では、露光ブラケット写真を利用して復元・拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:51:58 GMT)
View-Consistent 3D Editing with Gaussian Splatting [50.6] 3D Gaussian Splatting (3DGS)は、3D編集に革命をもたらした。
現在、拡散ベースの2D編集モデルを用いて、マルチビューレンダリング画像を修正し、3DGSモデルの編集をガイドしている。
画像編集プロセスに3DGSをシームレスに組み込む新しいフレームワークであるView-Consistent Editing (VcEdit)を導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:22:09 GMT)
Prompt-Singer: Controllable Singing-Voice-Synthesis with Natural Language Prompt [50.3] 本稿では,歌手の性別,声域,音量を自然言語で制御できる最初のSVS手法であるPrompt-Singerを提案する。
我々は,マルチスケール階層を持つデコーダのみの変換器に基づくモデルアーキテクチャを採用し,レンジメロディデカップリングされたピッチ表現を設計する。
実験により,本モデルは良好な制御能力と音質が得られることが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:39:05 GMT)
Language Evolution with Deep Learning [49.9] 計算モデリングは言語の出現の研究において重要な役割を担っている。
構造化言語の出現を誘発する可能性のある条件と学習プロセスをシミュレートすることを目的としている。
この章では、最近機械学習の分野に革命をもたらした別の種類の計算モデル、ディープ・ラーニング・モデルについて論じる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:52:54 GMT)
Zero Resource Code-switched Speech Benchmark Using Speech Utterance Pairs For Multiple Spoken Languages [49.7] 我々は,自己教師型音声エンコーダのコード切替能力を評価するために,ゼロリソースコード切替音声ベンチマークを導入した。
本稿では,音声エンコーダのコードスイッチング能力を評価するために,離散単位に基づく言語モデリングのベースラインシステムを紹介する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:57:58 GMT)
Methods for Generating Drift in Text Streams [49.3] コンセプトドリフトは、実世界のデータセットで頻繁に発生する現象であり、時間とともにデータ分布の変化に対応する。
本稿では,ラベル付きドリフトを用いたデータセット作成を容易にするための4つのテキストドリフト生成手法を提案する。
その結果、ドリフトの直後にすべてのメソッドのパフォーマンスが低下し、インクリメンタルなSVMは、以前のパフォーマンスレベルを実行し、回復するのに最も速いことを示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:48:33 GMT)
Improving Sampling Methods for Fine-tuning SentenceBERT in Text Streams [49.3] 本研究では,選択的な微調整言語モデルの設計した7つのテキストサンプリング手法の有効性について検討した。
これらの手法がSBERTモデルの微調整に与える影響を, 4つの異なる損失関数を用いて正確に評価する。
その結果,テキストストリームの分類にはソフトマックスの損失とバッチ・オール・トリプレットの損失が特に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:41:52 GMT)
Deep Homography Estimation for Visual Place Recognition [49.2] 本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:33:47 GMT)
Urban Scene Diffusion through Semantic Occupancy Map [49.2] UrbanDiffusionは、Bird's-Eye View (BEV)マップに条件付き3次元拡散モデルである。
我々のモデルは,潜在空間内のシーンレベルの構造の分布を学習する。
実世界の運転データセットをトレーニングした後、我々のモデルは多様な都市シーンを生成することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:54:35 GMT)
Control and Automation for Industrial Production Storage Zone: Generation of Optimal Route Using Image Processing [49.2] 本稿では,DIPを用いた生産ラインモデルのゾーンに対する産業自動化手法の開発に焦点をあてる。
新カスケード法は、それぞれの段階を適切な方法で定義し、関連する手法を開発に含めることを可能にした。
システムはOpenCVライブラリをベースとしており、Java言語に基づいたオブジェクト指向プログラミング(OOP)プラットフォーム上に実装された人工視覚に焦点を当てたツールである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:42:45 GMT)
Interaction Replica: Tracking Human-Object Interaction and Scene Changes From Human Motion [49.0] 人間による変化をモデル化することは、デジタル双生児を作るのに不可欠である。
本手法は,シーン中の人間の視覚的位置決めとIMUデータからの人間とシーンの相互作用に関する接触に基づく推論を組み合わせたものである。
私たちのコード、データ、モデルは、プロジェクトのページ http://virtual humans.mpi-inf.mpg.de/ireplica/.comで公開されています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:11:53 GMT)
Ensuring Safe and High-Quality Outputs: A Guideline Library Approach for Language Models [48.9] 大きな言語モデル(LLM)は印象的な能力を示すだけでなく、バイアスのあるコンテンツ生成やプライバシの問題といったリスクも提示する。
現在のアライメント手法の1つは原則駆動の統合であるが、手作業によるルールの不正確さに起因する課題に直面している。
これらの課題に対処するための2段階のアプローチである Guide-Align を紹介します。
我々のモデルであるラブラドールは、パラメータが13億であっても、GPT-3.5-turboより優れ、GPT-4よりもアライメント能力が高い。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:48:29 GMT)
DreamMotion: Space-Time Self-Similarity Score Distillation for Zero-Shot Video Editing [48.2] ビデオスコアの蒸留は、ターゲットテキストで示される新しいコンテンツを導入することができるが、構造や動きのずれを引き起こすこともある。
本稿では, 原ビデオの時空間自己相似性と, スコア蒸留中の編集ビデオとを一致させることを提案する。
我々のアプローチはモデルに依存しないもので、カスケードと非カスケードの両方の動画拡散フレームワークに適用できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:38:53 GMT)
Hang-Time HAR: A Benchmark Dataset for Basketball Activity Recognition using Wrist-Worn Inertial Sensors [47.3] 本稿では,手首に装着したセンサから身体活動認識手法を評価するためのベンチマークデータセットを提案する。
データセットは、米国とドイツの2つのチームで記録され、計24人のプレーヤーが手首に慣性センサーを装着した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:27:10 GMT)
DeforestVis: Behavior Analysis of Machine Learning Models with Surrogate Decision Stumps [46.6] 複雑なMLモデルの振る舞いを要約する視覚解析ツールであるDeforestVisを提案する。
DeforestVisは、より多くの切り株をインクリメンタルに生成することで、複雑さとフィデリティのトレードオフを探索するのに役立つ。
DeforestVisの適用性と有用性について,2つのユースケースと,データアナリストとモデル開発者とのエキスパートインタビューで紹介する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:35:16 GMT)
Hybrid-Task Meta-Learning: A Graph Neural Network Approach for Scalable and Transferable Bandwidth Allocation [46.3] ユーザ数に応じてスケーラブルで,異なる通信シナリオに転送可能な,ディープラーニングベースの帯域割り当てポリシを開発する。
スケーラビリティをサポートするために、帯域割り当てポリシーはグラフニューラルネットワーク(GNN)によって表現される。
我々は,GNNの初期パラメータを異なる通信シナリオで学習するハイブリッドタスクメタ学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:01:08 GMT)
InTeX: Interactive Text-to-texture Synthesis via Unified Depth-aware Inpainting [46.3] InteXはインタラクティブなテキスト・テクスチャ合成のための新しいフレームワークである。
InteXにはユーザフレンドリーなインターフェースが含まれており、合成プロセス全体を通してインタラクションと制御を容易にする。
本研究では,奥行き情報と塗り絵情報を統合する深度認識型塗り絵モデルを構築し,効果的に3次元不整合を緩和する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:31:57 GMT)
Measurement-induced phase transition for free fermions above one dimension [46.2] 自由フェルミオンモデルに対する$d>1$次元における測定誘起エンタングルメント相転移の理論を開発した。
臨界点は、粒子数と絡み合いエントロピーの第2累積のスケーリング$$elld-1 ln ell$でギャップのない位相を分離する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:17:26 GMT)
Do CLIPs Always Generalize Better than ImageNet Models? [45.9] CLIPのような大規模なビジョン言語モデルは、現代の機械学習に革命をもたらした。
LAIONデータとOpenAIデータの両方でトレーニングされたCLIPは、カウンタグループに顕著なパフォーマンス低下を示します。
驚くべきことに、ImageNetでトレーニングされたシングルモーダルモデルは、CLIPよりも堅牢である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:04:02 GMT)
Toolink: Linking Toolkit Creation and Using through Chain-of-Solving on Open-Source Model [44.5] Toolinkは総合的なフレームワークで、まずツールキットを作成し、次にチェーン・オブ・ソルディング・アプローチを通じてツールの計画と呼び出しを統合することでタスク解決を行います。
LLaMA-CoSは高度なツールプランニングとツールコール機能を備えた強力なオープンソースモデルである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:19:33 GMT)
Improving LoRA in Privacy-preserving Federated Learning [44.5] ローランク適応(ローランク適応、LoRA)は、事前訓練された言語モデルにおける最も一般的なタスク固有パラメータ効率細調整(PEFT)手法の1つである。
本稿では,これらの課題を緩和するために,LoRAの効率的かつ効果的なフェデレートフリーズA LoRA(FFA-LoRA)を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:20:08 GMT)
Warped geometric information on the optimisation of Euclidean functions [43.4] 我々は、潜在的に高次元ユークリッド空間で定義される実数値函数の最適化を考える。
函数の最適度は、曲がった計量を持つ多様体に沿う。
提案アルゴリズムは測地学の3次近似を用いており、標準ユークリッド勾配法よりも優れている傾向にある。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:16:00 GMT)
StyleChat: Learning Recitation-Augmented Memory in LLMs for Stylized Dialogue Generation [43.3] LLM(Large Language Models)の生成能力を活用することで38のスタイルを持つスタイル化された対話データセットであるStyleEvalを導入する。
本稿では,多タスク型学習戦略と再帰型メモリ戦略を通したスタイル化対話フレームワークであるStyleChatを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:26:18 GMT)
Tur[k]ingBench: A Challenge Benchmark for Web Agents [43.2] TurkingBenchは、マルチモーダルコンテキストによるテキスト命令を含むWebページとして定式化されたタスクのベンチマークである。
このベンチマークには158タスクに分散した32.2Kインスタンスが含まれている。
本ベンチマークでは,言語のみ,視覚のみ,レイアウトのみを含む最先端モデルの性能を評価する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:06:30 GMT)
Let's Focus on Neuron: Neuron-Level Supervised Fine-tuning for Large Language Model [43.1] 大型言語モデル(LLM)は、様々な行動や役割を示すニューロンで構成されている。
最近の研究によると、全てのニューロンが異なるデータセットで活動しているわけではない。
我々は,パラメータ学習の粒度を個々のニューロンに絞り込む新しいアプローチであるNeFT(Neuron-Level Fine-Tuning)を導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:55:01 GMT)
See, Imagine, Plan: Discovering and Hallucinating Tasks from a Single Image [42.9] ゼロショットタスク幻覚(zero-shot Task Hallucination) – 任意のシーンの1つのRGBイメージを考えると、私たちのモデルは潜在的なタスクを特定し、ビデオとして実現された鮮やかな物語の中でそれらの実行を想像することができます。
動的相互作用のためのVLMと物体軌道のための3次元モーションプランニングを組み込んだ,シーンの分解,理解,再構築を段階的に向上するモジュールパイプラインを開発した。
我々のモデルは、機械と人間の両方が理解できる現実的で魅力的な視覚結果を示すタスクビデオによって、多様なタスクを発見できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:38:29 GMT)
CRS-Diff: Controllable Generative Remote Sensing Foundation Model [41.7] 本稿では,リモートセンシング画像の生成に適した拡散モデリングフレームワークであるCRS-Diffを提案する。
このモデルはグローバルな制御入力とローカルな制御入力を統合し、生成条件を正確に組み合わせて生成プロセスを洗練させる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:44:44 GMT)
DeCoTR: Enhancing Depth Completion with 2D and 3D Attentions [41.6] 本研究では,2次元と3次元の両方の注意を生かし,高精度な深度補完を実現する手法を提案する。
提案手法であるDeCoTRを,確立した深度補完ベンチマークで評価した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:22:55 GMT)
Molecular Classification Using Hyperdimensional Graph Classification [41.4] この研究は超次元コンピューティングを利用してグラフ学習に革新的なアプローチを導入する。
この領域における重要な応用は、様々な分子構造にまたがるがん細胞の同定である。
グラフニューラルネットワーク(GNN)やWeisfieler-Lehmanグラフカーネル(WL)のような最先端のモデルと比較して,曲線の下の面積を比較検討したHDCモデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:16:17 GMT)
Causal Intervention for Fairness in Multi-behavior Recommendation [40.9] 異なるユーザ行動(例えば変換率)間の関係は、実際にはアイテムの品質を反映している、と我々は主張する。
本稿では,不公平な問題に対処するため,複数のユーザの行動を考慮した人気バイアスを軽減することを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:36:35 GMT)
Diffeomorphic Mesh Deformation via Efficient Optimal Transport for Cortical Surface Reconstruction [40.7] メッシュ変形は、動的シミュレーション、レンダリング、再構成を含む多くの3次元視覚タスクにおいて重要な役割を果たす。
現在のディープラーニングにおける一般的なアプローチは、2つのメッシュからランダムにサンプリングされた2つの点雲とシャンファーの擬似距離を比較することで、2つの面間の差を測定するセットベースアプローチである。
本稿では,メッシュのスライスされたワッサーシュタイン距離を,セットベースアプローチを一般化する確率測度として表現したメッシュ変形の学習指標を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:34:27 GMT)
ANIM: Accurate Neural Implicit Model for Human Reconstruction from a single RGB-D image [40.0] ANIMは単視点RGB-D画像から任意の3次元形状を前例のない精度で再構成する新しい手法である。
我々のモデルは、深度情報を活用するためにピクセル整列とボクセル整列の両方の機能から幾何学的詳細を学習する。
実験によると、ANIMはRGB、表面正規、ポイントクラウド、RGB-Dデータを入力として使用する最先端の作業よりも優れている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:00:57 GMT)
Stop Reasoning! When Multimodal LLMs with Chain-of-Thought Reasoning Meets Adversarial Images [40.0] マルチモーダルLLM(MLLM)において,CoT推論が広く研究されている。
本研究は,CoT推論を用いたMLLMの対角的ロバスト性を評価する。
本稿では,CoTによる拡張を効果的に回避する新しい停止推論攻撃手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:55:36 GMT)
Where Are We So Far? Understanding Data Storytelling Tools from the Perspective of Human-AI Collaboration [40.0] 最近の研究は、人工知能がデータストーリーテリングにおいて人間を支援し、強化する可能性を探っている。
人とAIのコラボレーションの観点から、データストーリーテリングツールを理解するための体系的なレビューがない。
本稿では,分析,計画,実装,コミュニケーションなどのツールが機能するストーリーテリングワークフローの段階と,人間とAIの役割という2つの視点から,既存のツールをフレームワークで検討した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:00:17 GMT)
COLE: A Hierarchical Generation Framework for Multi-Layered and Editable Graphic Design [39.8] 本稿では,これらの課題に対処するために設計された階層型生成フレームワークであるCOLEシステムを紹介する。
このCOLEシステムは、曖昧な意図のプロンプトを高品質な多層グラフィック設計に変換すると同時に、ユーザ入力に基づく柔軟な編集をサポートする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:43:20 GMT)
$\mathcal{B}$-Coder: Value-Based Deep Reinforcement Learning for Program Synthesis [39.7] プログラム合成は、問題仕様から正確で実行可能なプログラムを作成することを目的としている。
最近の研究は、大規模言語モデル(LLM)とともに強化学習(RL)の力を活用している。
我々の研究は価値ベースのアプローチの実現可能性を探究し、$mathcalB$-Coderの開発につながります。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:44:47 GMT)
Prototipo de un Contador Bidireccional Automático de Personas basado en sensores de visión 3D [39.6] RGB-Dセンサーとしても知られる3Dセンサーは、深度画像を利用して、各ピクセルがカメラから物体までの距離を測定する。
プロトタイプはRGB-Dセンサーを使って、スタジアムや空港などの空間におけるセキュリティと監視を支援する。
このシステムには、RealSense D415奥行きカメラと、人物をカウントするオブジェクト検出アルゴリズムを実行するミニコンピュータと、身元確認のための2Dカメラが含まれている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:18:40 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [39.4] 本稿では,知識グラフにおけるマルチホップリンク予測を強化するために,知識グラフ大言語モデルフレームワーク(KG-LLM)を提案する。
知識グラフをチェーン・オブ・シークレットのプロンプトに変換することで、我々のフレームワークは、エンティティの潜在表現とその相互関係を識別し、学習するように設計されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:35:29 GMT)
Error Norm Truncation: Robust Training in the Presence of Data Noise for Text Generation Models [39.4] 本稿では,ノイズの多いデータをトラストする標準学習目標に対する頑健な強化手法であるError Norm Truncation (ENT)を提案する。
ENTは,従来のソフト・ハード・トランケーション法よりも生成品質の向上を図っている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:28:38 GMT)
Variational Sampling of Temporal Trajectories [39.2] 遷移関数 $f$ を関数空間の要素として明示的にパラメータ化することにより、軌道の分布を学習する機構を導入する。
我々のフレームワークは、新しい軌道の効率的な合成を可能にすると同時に、推論に便利なツールを直接提供します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:12:12 GMT)
Distilling Datasets Into Less Than One Image [39.1] データセットの蒸留の境界を押し、データセットをクラスごとの画像以下に圧縮する。
本手法は, CIFAR-10, CIFAR-100, CUB200に対して, 0.3画像/クラスで新たな最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:49 GMT)
MVDiffusion++: A Dense High-resolution Multi-view Diffusion Model for Single or Sparse-view 3D Object Reconstruction [39.1] 本稿では3次元オブジェクト再構成のためのニューラルネットワークMVDiffusion++を提案する。
MVDiffusion++は、カメラポーズなしで1つか数枚の画像が与えられたオブジェクトの高解像度で高解像度なビューを合成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:58:05 GMT)
GPT-4V with Emotion: A Zero-shot Benchmark for Generalized Emotion Recognition [38.3] GPT-4 with Vision (GPT-4V) は、様々なタスクにおいて顕著な視覚能力を示すが、その感情認識性能は十分に評価されていない。
6つのタスクをカバーする21のベンチマークデータセットに対して,GPT-4Vの定量的評価結果を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:50:08 GMT)
Learning Unified Reference Representation for Unsupervised Multi-class Anomaly Detection [38.1] RLRと呼ばれる新しい特徴再構成に基づく異常検出フレームワークを提案する。
RLRは学習可能な参照表現を使用して、モデルに正常な特徴パターンを明示的に学習するように強制する。
15カテゴリのMVTec-ADデータセットと12カテゴリのVisAデータセットによるRLRの評価は、最先端の手法と比較して優れた性能を示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:29:47 GMT)
CO3: Low-resource Contrastive Co-training for Generative Conversational Query Rewrite [37.9] 生成的クエリ書き換えは、会話履歴を用いて再構成されたクエリ書き換えを生成する。
これらの手法は固有のノイズに敏感であるのに対して、このタスクではショットラーニングが人気が高まっている。
ノイズと言語スタイルのシフトに頑健な低リソース生成型対話型クエリ書き換えについて検討する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:26:32 GMT)
SmartRefine: An Scenario-Adaptive Refinement Framework for Efficient Motion Prediction [37.5] 我々は,最小限の計算量で予測を洗練するために,SmartRefineというシナリオ適応型改良戦略を導入する。
SmartRefineは汎用的で柔軟なアプローチとして設計されており、ほとんどの最先端のモーション予測モデルにシームレスに統合することができる。
QCNetにSmartRefineを追加することで、提出時にArgoverse 2のリーダーボード(シングルエージェントトラック)で、すべてのアンサンブルフリーの作品をパフォーマンスします。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:53:20 GMT)
OpenEval: Benchmarking Chinese LLMs across Capability, Alignment and Safety [37.1] OpenEvalは、能力、アライメント、安全性にわたって中国のLLMをベンチマークする評価テストベッドである。
機能評価には,NLPタスク,ディシプリナリーナレッジ,コモンセンス推論,数学的推論という4つのサブディメンジョンから中国語LLMを評価するための12のベンチマークデータセットを含む。
アライメントアライメントアセスメントのために、OpenEvalには、中国のLLMが出力するバイアス、攻撃性、不正性を調べる7つのデータセットが含まれている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:21:37 GMT)
Choice-75: A Dataset on Decision Branching in Script Learning [36.9] 提案するChoice-75は、インテリジェントなシステムに対して、記述的なシナリオによって決定を下すための最初のベンチマークである。
現在の大言語モデル(LLM)による予備結果を示す。
全体的にまともなパフォーマンスを示しているが、ハードなシナリオには依然として注目すべきヘッドルームがある。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:35:48 GMT)
Development of Automated Neural Network Prediction for Echocardiographic Left ventricular Ejection Fraction [36.6] 本稿では,深層ニューラルネットワークとアンサンブル学習に基づく新しいパイプライン手法を提案する。
この手法は,10,030個の心エコー図を含むオープンソースデータセットを用いて開発,検証した。
本研究では、LVEFの自動ニューラルネットワークに基づく計算が、心収縮機能のフレーム・バイ・フレーム手動評価を行う専門医に匹敵することを示した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:09:22 GMT)
Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale [36.6] 原文のスクラッチから事前学習が可能な大規模教師なしSLM(Generative Pretrained Structured Transformers, GPST)を提案する。
GPSTは、ゴールドツリーやシーケンシャルトレーニングなど、以前のSLMの制限を回避している。
GPSTは、左から右への文法誘導において、既存の教師なしSLMを著しく上回る。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:48:30 GMT)
EC-Depth: Exploring the consistency of self-supervised monocular depth estimation in challenging scenes [36.4] EC-Depthは、堅牢な深さ推定を実現するための、新しい自己教師型2段階フレームワークである。
第1段階では、信頼性の高い監督を標準から挑戦的な場面に広めるために、奥行き整合正則化を提案する。
第2段階では、疑似ラベルの品質を向上させるために、一貫性に基づく新しい擬似ラベルフィルタリング戦略を採用する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:25:43 GMT)
Generalizing deep learning models for medical image classification [36.2] 本稿では,Deep Learning(DL)に基づく分類モデルの一般化手法の最近の展開を概観する。
また、評価プロトコルやベンチマークの改善など、今後の課題についても論じる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:35:32 GMT)
VmambaIR: Visual State Space Model for Image Restoration [36.1] VmambaIRは、画像復元タスクに線形に複雑な状態空間モデル(SSM)を導入する。
VmambaIRは、より少ない計算資源とパラメータで最先端(SOTA)性能を達成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:38:55 GMT)
Semantic Role Labeling Guided Out-of-distribution Detection [35.1] 本稿では,新しい教師なしOOD検出手法,すなわちSemantic Role Labeling Guided Out-of-distriion Detection (SRLOOD)を提案する。
SRLOODは、文の異なる引数からきめ細かい局所的特徴表現を導出した意味的役割ラベル付け(SRL)を分離し、抽出し、学習する。
また,SRLの抽出した役割を予測することにより,グローバルな特徴学習を強化するために,新たな自己教師型アプローチも導入されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:53:50 GMT)
One-Step Image Translation with Text-to-Image Models [35.1] 本稿では,新たな課題や領域に一段階拡散モデルを適用するための汎用的手法を提案する。
我々は,バニラ潜在拡散モデルの様々なモジュールを,小さなトレーニング可能な重みを持つ単一エンドツーエンドのジェネレータネットワークに統合する。
我々のモデルであるCycleGAN-Turboは、様々なシーン翻訳タスクにおいて、既存のGANベースおよび拡散ベースの手法より優れています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:40 GMT)
Zeroth-Order Hard-Thresholding: Gradient Error vs. Expansivity [34.8] 本稿では,新しいランダムサンプリングを用いた一般ZO勾配推定器を用いたゼロ階ハードスレッディング(SZOHT)アルゴリズムを提案する。
SZOHTの問合せ複雑性は, 異なる条件下での次元性に依存しないか, あるいは弱く依存していることが判明した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:57:55 GMT)
Nonsmooth Implicit Differentiation: Deterministic and Stochastic Convergence Rates [34.8] パラメトリックな非微分可縮写像の固定点の微分を効率よく計算する問題について検討する。
我々は、反復的分化(ITD)と近似的暗黙的分化(AID)の2つの一般的なアプローチを分析する。
本稿では,固定点が外接写像と内接写像として定義される場合に,暗黙の微分を計算する新しい手法NSIDを紹介する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:37:53 GMT)
Understanding Domain Generalization: A Noise Robustness Perspective [34.7] ラベルノイズのレンズによるEMM上のDGアルゴリズムの利点について検討する。
ラベルノイズはERMに対するスプリアス相関の影響を悪化させ,一般化を損なうことを示す。
我々は,スプリアス相関から生じるERMの故障モードが,実際にはあまり顕著でないと推測する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:09:57 GMT)
Enhanced Detection of Transdermal Alcohol Levels Using Hyperdimensional Computing on Embedded Devices [34.7] 私たちは、スマートフォン、スマートウェアラブル、IoTデプロイメントに実用的なジャスト・イン・タイムの介入アプローチを設計しています。
我々は、様々なHDC符号化設計を探求し、それらを様々なHDC学習モデルと組み合わせて、モバイルデバイスに最適な、実現可能なアプローチを作成する。
精度は89%で,現状よりも12%向上した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:32:08 GMT)
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking [34.6] 自己学習型推論器の一般化であるQuiet-STaRについて述べる。
LMは、将来のテキストを説明するために各トークンで合理性を生成することを学ぶ。
GSM8KとCommonsenseQAではゼロショットの改善が見られた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:56:48 GMT)
VideoMV: Consistent Multi-View Generation Based on Large Video Generative Model [34.4] 基本的な2つの質問は、トレーニングに使用するデータと、マルチビューの一貫性を確保する方法です。
本稿では,市販のビデオ生成モデルから微調整した,密集した一貫したマルチビュー生成モデルを提案する。
我々のアプローチは24の濃密なビューを生成し、最先端のアプローチよりもはるかに高速にトレーニングに収束する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:48:15 GMT)
GT-Rain Single Image Deraining Challenge Report [34.1] 本報告では,CVPR 2023のUG2+ワークショップにおいて,単一画像デライニングにおけるGT-Rainチャレンジの結果についてレビューする。
本コンペティションの目的は、現実のシナリオにおける雨天現象の研究、新しい現実の雨天画像データセットの提供、および、実際の画像上での単一画像デコレーション手法の開発をさらに進めるための革新的なアイデアの創出である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:45:18 GMT)
Temporal Interest Network for User Response Prediction [34.0] 本稿では,行動と対象間の意味的・時間的相関を同時に捉えるための時間的関心ネットワーク(TIN)を提案する。
TINは2023年10月から運用に成功し、WeChat Momentsのトラフィックに対応している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:24:24 GMT)
Semantic-Enhanced Representation Learning for Road Networks with Temporal Dynamics [33.9] 道路網の汎用表現を学習するためのToastという新しいフレームワークと、その先進的なDyToastを紹介する。
具体的には,交通パターンと走行意味論という,道路ネットワークに固有の2つの重要な意味的特徴を符号化することを提案する。
提案するフレームワークは,最先端のベースラインを大きなマージンで一貫して上回っている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:59:56 GMT)
CASPER: Causality-Aware Spatiotemporal Graph Neural Networks for Spatiotemporal Time Series Imputation [33.9] 本稿では,時間的時系列計算を因果的観点から再考する。
インプット、アウトプット、埋め込み、共同創設者間の因果関係を示す。
この結果に基づいて,新しいCausality-Aware SpatiotEmpoRalグラフニューラルネットワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:57:16 GMT)
SV3D: Novel Multi-view Synthesis and 3D Generation from a Single Image using Latent Video Diffusion [33.7] 安定ビデオ3D(SV3D) - 3Dオブジェクトの周囲の高解像度・画像・マルチビュー生成のための潜時ビデオ拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:46:06 GMT)
Demystifying the DAO Governance Process [33.5] 分散自律組織(DAO)は、分散ガバナンスを実現するために、分散アプリケーション(dApps)のための一般的なガバナンスソリューションである。
アドバンテージにもかかわらず、ほとんどのメンバーから承認を受けなくても、dAppsを任意にコントロールできるエンティティは存在しない。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:12:29 GMT)
LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models [33.4] ドメイン内の課題として、マルチコンセプトのカスタマイズが登場します。
既存のアプローチでは、複数のLoRAのローランド適応(LoRA)融合行列をトレーニングして、さまざまな概念を単一のイメージにマージすることが多い。
LoRA-Composerは、複数のLoRAをシームレスに統合するために設計されたトレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:58:52 GMT)
AuG-KD: Anchor-Based Mixup Generation for Out-of-Domain Knowledge Distillation [33.2] データフリー知識蒸留法(DFKD)が直接解法として登場した。
しかし、DFKDから派生したモデルを現実のアプリケーションに適用するだけで、性能が著しく低下する。
本研究では,教師の適切な知識を選択的に伝達する簡易かつ効果的なAuG-KDを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:45:04 GMT)
PerceptionCLIP: Visual Classification by Inferring and Conditioning on Contexts [33.1] 本稿では,人間の視覚知覚過程からインスピレーションを得る。
トレーニング不要で2段階のゼロショット分類手法であるPerceptionCLIPを提案する。
実験の結果,PerceptionCLIPはより優れた一般化,グループロバスト性,相互運用性を実現することがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:02:10 GMT)
CoCoCo: Improving Text-Guided Video Inpainting for Better Consistency, Controllability and Compatibility [32.6] 本稿では, 一貫性, 制御性, 互換性を向上する新しいテキスト誘導型映像インペインティングモデルを提案する。
我々のモデルは、より優れた動きの整合性、テキスト制御可能性、モデルの互換性を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:27 GMT)
Tag2Text: Guiding Vision-Language Model via Image Tagging [32.3] 本稿では,視覚言語事前学習フレームワークであるTag2Textについて述べる。
対象タグを手動でラベル付けするか,あるいはオフザシェルフ検出器で自動的に検出する従来の手法とは対照的に,本手法では画像ペアリングテキストから解析したタグを用いて画像タグを明示的に学習する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:34:30 GMT)
Graph Algorithms with Neutral Atom Quantum Processors [31.5] 我々は中性原子量子処理ユニット(QPU)上で動作するグラフ問題に対する量子アルゴリズムの進歩を概観する。
最近導入された埋め込みと問題解決技術について論じる。
我々は、中性原子QPUのスケーラビリティ、制御可能性、繰り返し率の向上に重点を置いて、ハードウェアの継続的な進歩を明らかにした。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:30:42 GMT)
Infinite-ID: Identity-preserved Personalization via ID-semantics Decoupling Paradigm [31.1] アイデンティティ保存型パーソナライゼーションのためのID-セマンティックデカップリングパラダイムであるInfinite-IDを提案する。
我々は、十分なID情報を取得するために、追加のイメージクロスアテンションモジュールを組み込んだアイデンティティ強化トレーニングを導入する。
また、2つのストリームをシームレスにマージするために、混合アテンションモジュールとAdaIN平均演算を組み合わせた機能相互作用機構を導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:39:53 GMT)
3D Reconstruction in Noisy Agricultural Environments: A Bayesian Optimization Perspective for View Planning [30.9] ビュープランニング(VP)は、視覚情報を最大化する位置に、一定の数のカメラを最適に配置することを目的としている。
既存の環境騒音は3次元再構成の性能に大きな影響を及ぼす可能性がある。
本研究は,ノイズの存在下での高精度な3次元再構成のための適応ベイズ最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:51:09 GMT)
OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation [30.8] 従来の3Dシーン理解アプローチでは、高価なラベル付き3Dデータセットを使用して、単一のタスクに対してモデルのトレーニングと監視を行う。
我々は,3次元シーン再構成とオープン語彙理解をニューラルラディアンスフィールドで統合する新しいフレームワークOpenOccを提案する。
提案手法は3次元シーン理解タスクにおいて,特に小型・長距離オブジェクトにおいて,競争性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:53:48 GMT)
WanJuan-CC: A Safe and High-Quality Open-sourced English Webtext Dataset [30.7] 本稿では,Common Crawlデータから得られた安全で高品質なウェブテキストデータセットであるWanJuan-CCを提案する。
包括的なプロセスは、抽出、ルールフィルタリング、ファジィ重複、コンテントセーフティフィルタリング、データ品質フィルタリングを含むCommon Crawlデータを扱うように設計されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:18:58 GMT)
Approximated Likelihood Ratio: A Forward-Only and Parallel Framework for Boosting Neural Network Training [30.5] 本稿では、勾配推定における計算およびメモリ要求を軽減するために、LR法を近似する手法を提案する。
ニューラルネットワークトレーニングにおける近似手法の有効性を実験により実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:23:50 GMT)
Approximation of RKHS Functionals by Neural Networks [30.4] ニューラルネットワークを用いたHilbert空間(RKHS)を再現するカーネル上の関数の近似について検討する。
逆多重四元数、ガウス、ソボレフのカーネルによって誘導される場合の明示的な誤差境界を導出する。
ニューラルネットワークが回帰マップを正確に近似できることを示すため,機能回帰に本研究の成果を適用した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:58:23 GMT)
Enhancing the Antidote: Improved Pointwise Certifications against Poisoning Attacks [30.4] 毒殺攻撃は、トレーニングコーパスに小さな変更を加えることで、モデル行動に不当に影響を及ぼす可能性がある。
限られた数のトレーニングサンプルを修正した敵攻撃に対して,サンプルの堅牢性を保証することを可能とする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:05:36 GMT)
InsCL: A Data-efficient Continual Learning Paradigm for Fine-tuning Large Language Models with Instructions [29.7] InsCLは、Wasserstein Distanceによって計算されたタスク類似性に基づいて、以前のデータを動的に再生する。
InsCLはRandom Replayと比較して3.0 Relative Gain、No Replayに比べて27.96 Relative Gainのパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:10:36 GMT)
Self-supervised Video Object Segmentation with Distillation Learning of Deformable Attention [29.6] ビデオオブジェクトセグメンテーションはコンピュータビジョンの基本的な研究課題である。
変形性注意の蒸留学習に基づく自己教師型ビデオオブジェクトセグメンテーション法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:45:07 GMT)
Federated Modality-specific Encoders and Multimodal Anchors for Personalized Brain Tumor Segmentation [29.6] FedMEMA (Federated modality-specific encoder) とマルチモーダルアンカー (Multimal anchors) が提案されている。
FedMEMAは、モーダル間の不均一性を考慮するために、各モーダルに排他的エンコーダを使用する。
FedMEMAは、マルチモーダル脳腫瘍セグメンテーションのためのBraTS 2020ベンチマークで検証されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:02:53 GMT)
How Free is Parameter-Free Stochastic Optimization? [29.2] パラメータフリー最適化の問題について検討し、パラメータフリーな手法が存在するかどうかを問う。
既存の手法は、真の問題パラメータに関するいくつかの非自明な知識を必要とするため、部分的にはパラメータフリーとみなすことができる。
単純なハイパーサーチ手法により、より洗練された最先端アルゴリズムより優れたパラメータフリーな手法が実現できることを実証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:32:00 GMT)
Generative Motion Stylization within Canonical Motion Space [28.6] 本研究では,多種多様かつ多種多様な構造体上での動作に対して,モーションスタイリングパイプライン(MotionS)を提案する。
私たちの重要な洞察は、モーションスタイルをモダリティのラテント空間に埋め込むことで、標準モーション空間内でのモーションスタイリングを可能にします。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:41:59 GMT)
VideoAgent: A Memory-augmented Multimodal Agent for Video Understanding [28.3] VideoAgent: 1)は、一般的な時間的イベント記述と、ビデオのオブジェクト中心のトラッキング状態の両方を格納する構造化メモリを構築する。
2) 入力タスククエリが与えられた場合,ビデオセグメントのローカライゼーションやオブジェクトメモリクエリなどのツールと,他の視覚基盤モデルを用いて対話的にタスクを解く。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:07:59 GMT)
The Benefits of Reusing Batches for Gradient Descent in Two-Layer Networks: Breaking the Curse of Information and Leap Exponents [28.1] マルチインデックスターゲット関数を学習する際の2層ニューラルネットワークのトレーニングダイナミクスについて検討する。
本稿では,複数回バッチを再利用するマルチパス勾配勾配(GD)に着目し,どの関数が学習可能かという結論を大きく変えることを示す。
再使用したバッチでは,階段特性を満足しない関数であっても,ネットワークがターゲット部分空間と重なり合う2つのステップで達成できることが示される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:23:35 GMT)
BAGS: Building Animatable Gaussian Splatting from a Monocular Video with Diffusion Priors [28.0] 拡散前の単眼ビデオからアニマタブルな3次元ガウススプラッティングを構築する手法を提案する。
3Dガウス表現はトレーニングとレンダリングのプロセスを大幅に加速し、拡散先行法により、限られた視点で3Dモデルを学習することができる。
我々は、様々な実世界のビデオに対して広範囲に評価を行い、現在の最先端手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:44:46 GMT)
R3DS: Reality-linked 3D Scenes for Panoramic Scene Understanding [27.7] 本稿では,Matterport3Dパノラマのリアルなシーン配置を反映した合成3Dシーンの3Dシーンデータセットについて紹介する。
R3DSは、パノラマにおける現実世界の観測に関連付けられたオブジェクトを持つ、より完全で人口密度の高いシーンを持っている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:46:14 GMT)
ImageNet-OOD: Deciphering Modern Out-of-Distribution Detection Algorithms [27.7] アウト・オブ・ディストリビューション(OOD)検出は、未定義で悪名高い。
最近の研究は、障害検出に焦点をあてている。
以前は最先端と見なされていた複雑なOOD検出器は、単純な最大ソフトマックス確率ベースラインと同じような、あるいはそれ以上に機能している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:31:29 GMT)
TPLLM: A Traffic Prediction Framework Based on Pretrained Large Language Models [27.3] 大規模言語モデル(LLM)を利用した新しい交通予測フレームワークであるTPLLMを紹介する。
本フレームワークでは,Lonal Neural Networks (LoCNNs) に基づくシーケンス埋め込み層と,Graph Contemporalal Networks (GCNs) に基づくグラフ埋め込み層を構築し,シーケンスの特徴と空間的特徴を抽出する。
実世界の2つのデータセットの実験では、フルサンプルと数ショットの予測シナリオの両方で、満足できるパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:01:26 GMT)
SETA: Semantic-Aware Token Augmentation for Domain Generalization [27.3] ドメイン一般化(DG)は、ターゲットドメインにアクセスすることなく、ドメインシフトに対するモデルを強化することを目的としている。
トークンベースのモデルに対する従来のCNNベースの拡張手法は、全体的な形状情報を学ぶためのモデルへのインセンティブが欠如しているため、亜最適である。
本研究では,グローバルな形状を保ちながら局所的なエッジキューを摂動することで特徴を変換するセマンティック・アウェア・トークン拡張(SETA)法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:50:35 GMT)
Compositional Kronecker Context Optimization for Vision-Language Models [27.2] 合成クローネッカーコンテキスト最適化(CK-CoOp)と呼ばれる軽量で一般化可能な手法を提案する。
技術的には、CK-CoOpにおけるプロンプトの文脈語は学習可能なベクトルであり、辞書から派生したベースベクトルを線形に結合することによって構成される。
CK-CoOpは、ベース・ツー・ドメイン・クロスタスクの一般化評価において最先端の性能を達成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:09:28 GMT)
Diffusion Reward: Learning Rewards via Conditional Video Diffusion [26.7] Diffusion Rewardは、複雑な視覚的RL問題を解決するための条件付きビデオ拡散モデルを通じて、エキスパートビデオから報酬を学ぶフレームワークである。
我々の重要な洞察は、専門家の軌道で条件付けされた場合、低い生成多様性が観察されるということである。
本稿では,メタワールドとアドロイトのロボット操作タスク10名に対して,視覚的インプットとスパース報酬が有効であることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:08:54 GMT)
SparseDFF: Sparse-View Feature Distillation for One-Shot Dexterous Manipulation [26.6] SparseDFFは、大きな2次元視覚モデルを用いて、スパースRGBD画像から意味的特徴を抽出する3次元シーンのための新しいDFFである。
SparseDFFはビュー一貫性を持つ3D DFFを生成し、デクスタラスな操作の効率的なワンショット学習を可能にする。
剛性オブジェクトと変形可能なオブジェクトの両方を操作できることを証明し、オブジェクトとシーンのバリエーションをまたいだ重要な一般化能力を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:20:41 GMT)
Generalized Multi-Source Inference for Text Conditioned Music Diffusion Models [26.4] マルチソース拡散モデル (Multi-Source Diffusion Models, MDM) は、楽曲の合成作業を可能にする。
本稿では,テキスト埋め込みを前提としたMSDMを任意の時間領域拡散モデルに一般化する。
本稿では,ソースと伴奏のコヒーレントな生成を可能にする推論手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:08:01 GMT)
The Value of Reward Lookahead in Reinforcement Learning [26.3] 競合分析のレンズを用いて,今後の報奨情報の価値を分析した。
我々は、最悪の報酬分布を特徴づけ、最悪の報酬予測の正確な比率を導出する。
本研究の結果は, 即時報酬の観察から, 相互作用開始前の報酬の観察までのスペクトルを網羅した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:19:52 GMT)
Learning Exhaustive Correlation for Spectral Super-Resolution: Where Spatial-Spectral Attention Meets Linear Dependence [26.2] スペクトル超解像は、容易に取得可能なRGB画像からハイパースペクトル像(HSI)を復元することを目的としている。
既存のTransformerのボトルネックは2種類あり、パフォーマンスの改善と実用性に制限がある。
スペクトル超解像のための新しい Exhaustive correlation Transformer (ECT) を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:02:20 GMT)
Language Modeling Is Compression [26.2] 我々は圧縮レンズを通して予測問題を見ることを提唱する。
大規模言語モデルは強力な汎用予測器であることを示す。
また, 予測圧縮等価性により, 任意の圧縮機を用いて条件付き生成モデルを構築することができることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:15:47 GMT)
Enhanced Event-Based Video Reconstruction with Motion Compensation [26.0] 本稿では,入力強度フレームとスパース符号の歪みを補正し,再現性を向上させることを提案する。
CISTA-Flowネットワークは、動き補償のためのフローネットワークとCISTA-LSTCを統合することで構築される。
以上の結果から,本手法は最先端の復元精度を達成し,信頼性の高い高密度流れ推定を同時に提供することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:58:23 GMT)
SeisFusion: Constrained Diffusion Model with Input Guidance for 3D Seismic Data Interpolation and Reconstruction [26.0] 本研究では3次元地震データに適した新しい拡散モデル再構成フレームワークを提案する。
拡散モデルに3次元ニューラルネットワークアーキテクチャを導入し、2次元拡散モデルを3次元空間に拡張することに成功した。
本手法は、フィールドデータセットと合成データセットの両方に適用した場合、より優れた再構成精度を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:10:13 GMT)
A Unified Model for Longitudinal Multi-Modal Multi-View Prediction with Missingness [26.0] 本稿では,長手マルチモーダル・マルチビュー(MMMV)予測のための統一モデルを提案する。
提案手法は,入力に希望する時間ポイントを最大で確保し,利用可能なデータをすべて活用することを目的としている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:51:55 GMT)
ROUTERBENCH: A Benchmark for Multi-LLM Routing System [25.5] パフォーマンスとコストのバランスをとる場合、すべてのタスクやアプリケーションに最適に対処できるモデルは存在しない。
この制限により、個々のLSMの制約を克服するために、様々なモデルの強みを組み合わせたLSMルーティングシステムの開発に繋がった。
本稿では,LLMルーティングシステムの有効性を体系的に評価する新しい評価フレームワークROUTERBENCHを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:04 GMT)
MASSTAR: A Multi-Modal and Large-Scale Scene Dataset with a Versatile Toolchain for Surface Prediction and Completion [25.4] MASSTARはマルチモーダルなlArgeスケールのシーンデータセットであり、サーフAce predictionと完了のためのVerSatile Toolchainを備えている。
環境から生の3Dデータを処理するための汎用的で効率的なツールチェーンを開発した。
実世界の部分的なデータを含む1000以上のシーンレベルのモデルからなるサンプルデータセットを生成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:35:18 GMT)
GetMesh: A Controllable Model for High-quality Mesh Generation and Manipulation [25.4] Meshは様々な産業アプリケーションにおける3Dアセットの基本的な表現であり、プロのソフトウェアによって広く支持されている。
本稿では,メッシュ生成と異なるカテゴリ間の操作のための,高度に制御可能な生成モデルGetMeshを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:25:36 GMT)
Pluggable Neural Machine Translation Models via Memory-augmented Adapters [25.3] プリトレーニングされたNMTモデルをプラガブルな方法でステアリングするためのメモリ拡張アダプタを提案する。
具体的には,ユーザが提供するテキストサンプルに基づいて,多粒性メモリを構築する。
また,NMTモデルとメモリ間の素早い依存関係を低減するため,メモリドロップアウトを用いたトレーニング戦略を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:07:52 GMT)
Non-Convex Stochastic Composite Optimization with Polyak Momentum [25.1] 一般化近位勾配は広く用いられる勾配降下法(SGD)の強力な一般化である。
しかし、メソッドがマシン内の多くのアプリケーションに収束しないことは知られている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:41:55 GMT)
DIG In: Evaluating Disparities in Image Generations with Indicators for Geographic Diversity [24.9] 本稿では,テキスト・ツー・イメージ生成システムの現実性,多様性,迅速な生成一貫性を評価するための3つの指標を提案する。
モデルがヨーロッパよりもアフリカや西アジアを推し進める場合には、現実主義や世代ごとの多様性が低いことが分かりました。
おそらく最も興味深いのは、画像生成品質の進歩は、現実世界の地理的表現のコストがかかることを示唆している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:31:57 GMT)
Is it Really Negative? Evaluating Natural Language Video Localization Performance on Multiple Reliable Videos Pool [24.9] Video Corpus Moment Retrieval (VCMR)は、複数のビデオから与えられた自然言語クエリにマッチするビデオモーメントを検出することを目的としている。
既存のVCMR研究では、特定のクエリと組み合わせていないすべてのビデオは否定的であると見なされている。
ビデオフレームを大規模なビデオ集合内にローカライズすることを目的としたMVMRタスクを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:55:36 GMT)
TnT-LLM: Text Mining at Scale with Large Language Models [24.7] 大規模言語モデル(LLM)は、最小限の努力でエンドツーエンドのラベル生成と割り当てのプロセスを自動化する。
我々は,TnT-LLMが最先端のベースラインと比較した場合,より正確で関連性の高いラベルを生成することを示す。
また、現実のアプリケーションにおける大規模テキストマイニングにLLMを使うことの課題と機会に関する実践的経験と洞察を共有します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:45:28 GMT)
MCD: Diverse Large-Scale Multi-Campus Dataset for Robot Perception [24.7] 我々はMDDと呼ばれる包括的データセットを導入し、広範囲なセンシング・モダリティ、高精度な地上真実、多様な困難環境を特徴とする。
MCDはCCS(Classical Cylindrical Spinning)とNRE(Non-Repetitive Epicyclic)ライダー、高品質IMU(Inertial Measurement Units)、カメラ、UWB(Ultra-WideBand)センサーから構成されている。
先駆的な取り組みとして、59kのスパースNREライダースキャンで29クラスのセマンティックアノテーションを導入し、既存のセマンティックセグメンテーション研究に挑戦する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:00:38 GMT)
IVAC-P2L: Enhancing Video Action Counting through Irregular Repetition Priors [24.6] ビデオアクションカウント(VAC)は、ビデオ内の反復的なアクションを分析する上で重要である。
伝統的な手法は、割り込みや周期の変動など、アクション反復の複雑さを見落としてきた。
ビデオにおける不規則な反復パターンのモデル化を優先する不規則なビデオアクションカウント(IVAC)を導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:56:47 GMT)
Diffusion Models are Geometry Critics: Single Image 3D Editing Using Pre-Trained Diffusion Priors [24.5] 単一画像の3次元操作を可能にする新しい画像編集手法を提案する。
本手法は,テキスト・イメージ・ペアの広い範囲で訓練された強力な画像拡散モデルを直接活用する。
提案手法では,高画質な3D画像編集が可能で,視点変換が大きく,外観や形状の整合性も高い。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:18:59 GMT)
Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation [24.2] 蒸留法は、モデルをマルチショットからシングルステップ推論にシフトすることを目的としている。
ADDの限界を克服する新しい蒸留法であるLADD(Latent Adversarial Diffusion Distillation)を導入する。
ピクセルベースのADDとは対照的に、LADDは事前訓練された潜伏拡散モデルから生成的特徴を利用する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:51:43 GMT)
Scene-LLM: Extending Language Model for 3D Visual Understanding and Reasoning [24.2] Scene-LLMは3次元視覚言語モデルであり、インタラクティブな3次元屋内環境におけるエンボディエージェントの能力を高める。
Scene-LLMを用いた実験は, 密接なキャプション, 質問応答, 対話型プランニングにおいて, 強力な機能を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:18:48 GMT)
CasSR: Activating Image Power for Real-World Image Super-Resolution [24.2] 超解像のためのカスケード拡散法CasSRは、高精細でリアルな画像を生成するために設計された新しい方法である。
低解像度画像からの情報の抽出を最適化するカスケード制御可能な拡散モデルを開発した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:59:43 GMT)
Video Object Segmentation with Dynamic Query Modulation [23.8] オブジェクトとマルチオブジェクトセグメンテーションのためのクエリ変調手法QMVOSを提案する。
提案手法は,メモリベースSVOS法を大幅に改善し,標準SVOSベンチマーク上での競合性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:31:39 GMT)
HyperAgent: A Simple, Scalable, Efficient and Provable Reinforcement Learning Framework for Complex Environments [23.7] HyperAgentはハイパーモデルとインデックスサンプリングスキームを備えたRLフレームワークである。
HyperAgentの実装は簡単で、Double-DQNに必要なモジュールをひとつ追加するだけでよい。
この研究はRLの理論的および実践的な領域を橋渡しし、RLアルゴリズム設計の新しいベンチマークを確立した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:22:17 GMT)
Compositional learning of functions in humans and machines [23.6] 我々は,構成関数を用いた学習と推論において,人間とニューラルネットワークモデルの能力を探るための関数学習パラダイムを開発する。
その結果,人間は相互作用条件をまたいだ新しい視覚機能合成をゼロショットで一般化できることが示唆された。
同じタスクにおけるニューラルネットワークモデルとの比較により、合成性(MLC)アプローチのメタラーニングを通じて、標準的なシーケンス対シーケンス変換器は、構成関数における人間の一般化パターンを模倣することができることが明らかになった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:22:53 GMT)
Boundary Attention: Learning to Localize Boundaries under High Noise [23.5] 我々は、境界注意と呼ばれるメカニズムを用いて、曲線、コーナー、ジャンクションを含む明示的な境界を推論する微分可能モデルを提案する。
バウンダリアテンション(Bundary attention)は、境界対応の局所アテンション演算であり、密集して繰り返し適用された場合、変数のフィールドを徐々に洗練する。
提案手法は, 実センサノイズにより劣化した自然画像に一般化し, ノイズの多い条件下での一貫した境界を予測できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:41:41 GMT)
HateCOT: An Explanation-Enhanced Dataset for Generalizable Offensive Speech Detection via Large Language Models [23.4] HateCOTは、GPT-3.5-Turboと人間によって生成された説明を含む、さまざまな既存のソースから52,000のサンプルのデータセットである。
HateCOT上での攻撃的コンテンツ検出のための事前学習モデルは、ゼロおよび少数設定の3つのベンチマークデータセット上で、オープンソースのLanguage Modelsを著しくブートする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:12:35 GMT)
KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge [23.2] KorNATは韓国と国家の整合性を測定する最初のベンチマークである。
社会価値データセットについて,6,174人の韓国人参加者を対象とした大規模調査から,基礎的真理ラベルを得た。
共通知識データセットについて,韓国の教科書とGED参照資料に基づくサンプルを構築した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:12:17 GMT)
Removing Undesirable Concepts in Text-to-Image Generative Models with Learnable Prompts [23.0] テキストから画像への生成モデルから望ましくない概念を除去する新しい手法を提案する。
この学習可能なプロンプトは、望ましくない概念の知識をそれに移すための追加記憶として機能する。
安定拡散モデルにおける本手法の有効性を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:42:04 GMT)
BEVCar: Camera-Radar Fusion for BEV Map and Object Segmentation [22.9] 共同BEVオブジェクトとマップセグメンテーションのための新しいアプローチであるBEVCarを紹介する。
我々のアプローチの中核的な特徴は、まず生のレーダーデータのポイントベース符号化を学習することにある。
レーダ情報の導入は, 環境問題におけるロバスト性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:14:46 GMT)
Controllable Data Generation by Deep Learning: A Review [22.6] 制御可能な深層データ生成は有望な研究領域であり、一般に制御可能な深部データ生成として知られている。
本稿では、制御可能な深層データ生成のエキサイティングな応用を紹介し、既存の研究を実験的に分析し比較する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:06:48 GMT)
Large-scale flood modeling and forecasting with FloodCast [22.1] 高速で、安定し、正確で、解像度不変であり、幾何適応的な洪水モデリングと予測フレームワークを構築します。
このフレームワークは、マルチ衛星観測と流体力学モデリングの2つの主要なモジュールから構成されている。
流体力学モデリングモジュールでは、幾何適応型物理インフォームドニューラルソルバ(GeoPINS)が導入された。
大規模洪水モデルにおいて,GeoPINS を用いた長期時間系列と広域空間領域を扱うためのシーケンス・ツー・シーケンスのGeoPINS モデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:18:32 GMT)
Convergence of Kinetic Langevin Monte Carlo on Lie groups [21.8] 結果の速度論的ラウンジビン型サンプリングダイナミクスを微妙に識別し,Lie群MCMCサンプリング器を提案する。
これは、曲線空間上での動力学ランゲヴィンの初めての収束結果であり、等長性のような凸性や一般的な緩和を必要としない最初の定量的結果である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:50:20 GMT)
Better (pseudo-)labels for semi-supervised instance segmentation [21.7] 本稿では,教師モデルの訓練プロセスを強化するための2段階戦略を導入し,数発の学習における性能を大幅に向上させる。
我々は,LVISデータセット上での最先端の教師付きベースライン性能に対して,平均精度(AP)が2.8%,レアクラスのAPが10.3%向上し,顕著な改善が見られた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:23:02 GMT)
Narrative Feature or Structured Feature? A Study of Large Language Models to Identify Cancer Patients at Risk of Heart Failure [21.7] 本研究は, 心不全リスクのあるがん患者を同定するための機械学習モデルについて検討した。
肺がん,乳がん,大腸癌と診断され,フロリダ大学から12,806人のがんコホートを同定した。
提案した物語は,特徴密度が著しく増加し,性能が向上した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:42:01 GMT)
Transfer Learning Beyond Bounded Density Ratios [21.5] 学習アルゴリズムは、あるソース分布からデータを収集するが、異なるターゲット分布に対して$Q$である。
我々の主な結果は、ドメインの$mathbbRn$に対する一般的な転送不等式であり、非常に穏やかな仮定の下では、低次数に対する非自明な転送学習が可能であることを証明している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:02:41 GMT)
Divide-and-Conquer Posterior Sampling for Denoising Diffusion Priors [21.5] そこで本研究では,中間的および単純な後続サンプリング問題の集合を定義するために異なるアプローチをとっており,その結果,従来の手法と比較して近似誤差が低い。
合成例と様々な画像復元タスクを用いて,一般線形逆問題に対する提案手法の再構築能力を実証的に実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:47:24 GMT)
DEE: Dual-stage Explainable Evaluation Method for Text Generation [21.4] テキスト生成の品質を推定するための2段階説明可能な評価手法であるDEEを紹介する。
Llama 2 上に構築された DEE は、生成したテキスト中のエラーの効率的な識別を行うためのステージ固有の命令によって導かれる2段階の原理に従う。
このデータセットは、幻覚や毒性などの新たな問題に対処し、DEEの評価基準の範囲を広げる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:30:41 GMT)
ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training [21.3] 本稿では,エンティティ中心型医療ビジョン言語事前学習のための新しいフレームワークを提案する。
医療報告からエンティティ中心のコンテキストを抽出し、テキストモダリティをより効果的に管理する。
提案したマルチスケールコンテキスト融合設計は、粗い画像表現と細かな画像表現の両方のセマンティックな統合も改善する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:54:03 GMT)
Learning to better see the unseen: Broad-Deep Mixed Anti-Forgetting Framework for Incremental Zero-Shot Fault Diagnosis [21.3] ゼロショット断層診断(ZSFD)は、人間の専門家によってラベル付けされた断層特性を予測することによって、目に見えない断層を識別することができる。
本稿では,新しい障害カテゴリと属性から学習することを目的とした,広域混合型アンチフォゲッティングフレームワーク(BDMAFF)を提案する。
提案手法の有効性は,実油圧システムとテネシー・イーストマンベンチマークプロセスによって検証される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:50:42 GMT)
DyRoNet: Dynamic Routing and Low-Rank Adapters for Autonomous Driving Streaming Perception [21.2] Dynamic Routering Network (DyRoNet) は、自律運転システムにおけるストリーミング知覚のために設計された低ランク拡張動的ルーティングフレームワークである。
DyRoNetは事前訓練された分岐ネットワークを統合し、それぞれ異なる環境条件下で機能するように微調整する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:39:34 GMT)
Analyzing-Evaluating-Creating: Assessing Computational Thinking and Problem Solving in Visual Programming Domains [21.1] コンピュータ思考(CT)と問題解決のスキルは、世界中のK-8スクールカリキュラムに統合されつつある。
我々はブルームの分類学における3つの高い認知レベルに焦点を当てた新しいテストであるACEを開発した。
学年3~7年生371名を対象に,ACEの心理測定特性について検討した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:18:34 GMT)
EMIE-MAP: Large-Scale Road Surface Reconstruction Based on Explicit Mesh and Implicit Encoding [21.1] EMIE-MAPは,暗黙的メッシュと暗黙的符号化に基づく大規模道路表面再構成手法である。
本手法は,様々な現実の難易度シナリオにおいて,顕著な路面復元性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:46:52 GMT)
Zero-Shot Image Feature Consensus with Deep Functional Maps [21.0] より優れた対応戦略が利用可能であることを示し,対応フィールドに直接構造を課す関数写像について述べる。
提案手法は,学習対象の大規模視覚モデルに埋め込まれた知識をよりよく反映し,よりスムーズなだけでなく,より正確に対応できることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:47 GMT)
Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight [20.9] 視覚に基づく自律型ドローンレースにおける強化学習(RL)の有効性とImitation Learning(IL)の有効性を組み合わせる。
本フレームワークは,特権状態情報を用いた教師政策の初期訓練,ILを用いた学生政策への蒸留,適応的RL微調整の3段階からなる。
実環境と実環境の両方でのシミュレーション実験により,我々の手法は,明示的な状態推定を伴わない視覚情報のみを用いて,レースコースを走行する際に,ILやRL単独よりも優れた性能とロバスト性を達成できることが示されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:25:57 GMT)
Emotion Analysis in NLP: Trends, Gaps and Roadmap for Future Directions [20.7] 我々は過去10年間の154件のNLP出版を徹底的にレビューする。
EAやタスク、使用されている感情フレームワーク、既存のデータセット、メソッド、アプリケーションなど、さまざまなトレンドを抱えています。
私たちの研究は、EAに関するより集中的な研究と、NLPの感情をモデリングするためのより包括的なアプローチを可能にします。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:51:14 GMT)
Magnushammer: A Transformer-Based Approach to Premise Selection [20.4] 我々は、(保護状態、関連する前提)ペアのテキスト表現を含む、前提選択のための新しいデータセットを開発し、オープンソース化する。
我々の手法であるMagnushammerは、Sledgehammerと呼ばれるインタラクティブな定理の証明において、最も先進的で広く使われている自動化ツールより優れています。
さらに、PISAベンチマークでは、最先端の証明成功率を57.0%から71.0%に改善し、パラメータを4ドル減らした。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:16:22 GMT)
Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution [20.2] 本研究は,感情がジェンダー化されているか,社会的ステレオタイプに基づくのかを考察する。
すべてのモデルは、ジェンダーステレオタイプの影響を受けながら、一貫して性的な感情を示す。
私たちの研究は、言語、性別、感情の間の複雑な社会的相互作用に光を当てています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:04:44 GMT)
A Toolbox for Surfacing Health Equity Harms and Biases in Large Language Models [20.1] 大規模言語モデル(LLM)は、複雑な健康情報のニーズを満たすための大きな約束を持っている。
LLMは、有害性を導入し、健康格差を悪化させる可能性がある。
エクイティ関連モデル失敗の信頼性評価は、ヘルスエクイティを促進するシステムを開発するための重要なステップである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:56:37 GMT)
HDLdebugger: Streamlining HDL debugging with Large Language Models [20.1] チップ設計の分野では、ハードウェア記述言語(HDL)が重要な役割を果たしている。
大規模言語モデル(LLM)のソフトウェアコードの生成、完成、検査における強力な能力にもかかわらず、HDLデバッグの専門分野における利用は制限されている。
本稿では, 逆エンジニアリング手法によるHDLデータ生成, 検索拡張生成のための検索エンジン, 検索拡張LDMファインチューニング手法によるHDLgerというフレームワークを提案する。
HDLgerはHuaweiから提供されたHDLコードデータセットで実施した実験により,HDLgerが13件の切断に優れていることが判明した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:19:37 GMT)
VFusion3D: Learning Scalable 3D Generative Models from Video Diffusion Models [20.1] 本稿では,事前学習ビデオ拡散モデルを用いたスケーラブルな3次元生成モデル構築のための新しいパラダイムを提案する。
微調整により多視点生成能力を解放することにより、大規模な合成多視点データセットを生成し、フィードフォワード3D生成モデルを訓練する。
提案したモデルであるVFusion3Dは、ほぼ3Mの合成マルチビューデータに基づいて訓練され、単一の画像から数秒で3Dアセットを生成することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:12 GMT)
DeepCRE: Transforming Drug R&D via AI-Driven Cross-drug Response Evaluation [19.9] 我々は、薬物研究開発の後期において、クロスドラッグ反応評価(CRE)を効果的に予測するために設計された先駆的なAIモデルであるDeepCREを紹介する。
DeepCREは、患者レベルのCREの平均パフォーマンス改善を17.7%、指示レベルのCREを5倍に向上させることで、既存の最高のモデルより優れている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:05:55 GMT)
Towards Lossless Dataset Distillation via Difficulty-Aligned Trajectory Matching [19.9] 合成データセットのサイズが大きくなるにつれて有効なアルゴリズムを提案する。
実験により, 一致する軌道の訓練段階が, 蒸留データセットの有効性に大きく影響していることが判明した。
そこで我々は,軌道マッチングに基づく手法を大規模合成データセットに拡張することに成功している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:44:06 GMT)
Layer-diverse Negative Sampling for Graph Neural Networks [19.8] グラフニューラルネットワーク(GNN)は、様々な構造学習アプリケーションのための強力なソリューションである。
メッセージパッシング伝搬のための層間負サンプリング法を提案する。
本研究は,ネガティブサンプルの多様性向上と総合学習性能向上におけるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:48:50 GMT)
Domain Adaptation Using Pseudo Labels for COVID-19 Detection [19.8] ドメイン適応のために擬似ラベルを利用する2段階のフレームワークを提案する。
あるドメインからのアノテートデータと別のドメインからの非アノテートデータを利用することで、モデルはデータの不足と可変性の課題を克服する。
COV19-CT-DBデータベースの実験結果は、高い診断精度を達成するためのモデルの可能性を示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:07:45 GMT)
Advancing COVID-19 Detection in 3D CT Scans [19.8] 我々はResNeSt50を強力な特徴抽出器として使用し、新型コロナウイルス特異的な事前知識を持つ事前訓練した重量で初期化する。
本モデルでは,第4回COV19Dコンペティションチャレンジの検証セットにおいて,マクロF1スコア0.94を達成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:50:13 GMT)
Streamlining Social Media Information Retrieval for COVID-19 Research with Deep Learning [19.7] ソーシャルメディアを基盤とする公衆衛生研究は、疫病の監視に不可欠である。
ほとんどの研究はキーワードマッチングを伴う関連コーパスを特定している。
本研究は,口語医学辞典の整理過程を合理化するシステムを開発した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:22:16 GMT)
Collage Prompting: Budget-Friendly Visual Recognition with GPT-4V [19.5] GPT-4Vは画像認識タスクにおいて顕著な熟練性を示す。
しかし、GPT-4Vの推論に伴う金銭的コストは、広く使われる上で大きな障壁となる。
予算に優しいプロンプトアプローチであるColllage Promptingを導入し、複数の画像を単一の視覚入力に誘導する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:41:38 GMT)
Sim-to-Real Grasp Detection with Global-to-Local RGB-D Adaptation [19.4] 本稿では,RGB-Dグリップ検出のシム・ツー・リアル問題に着目し,ドメイン適応問題として定式化する。
本稿では,RGBと深度データにおけるハイブリッドドメインギャップに対処し,マルチモーダルな特徴アライメントが不十分なグローバル・ローカルな手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:42:38 GMT)
LocalStyleFool: Regional Video Style Transfer Attack Using Segment Anything Model [19.4] LocalStyleFoolは、ビデオ上の地域スタイルのトランスファーベースの摂動を重畳する、ブラックボックスビデオの敵対攻撃の改良だ。
そこで我々は、LocalStyleFoolがフレーム内およびフレーム間自然性の両方を人為的な調査によって改善できることを実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:53:00 GMT)
Enhancing the Reliability of Segment Anything Model for Auto-Prompting Medical Image Segmentation with Uncertainty Rectification [19.2] 本稿では,医用画像の自動セグメント化の信頼性を高めるため,不確かさを補正したSAMフレームワークUR-SAMを提案する。
提案手法では,不確実性評価のためのSAMの一連のインプットプロンプトを得るためのプロンプト拡張モジュールと,推定不確実性の分布をさらに活用してセグメンテーション性能を向上させるための不確実性修正モジュールを組み込んだ。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:47:03 GMT)
Personalized 3D Human Pose and Shape Refinement [19.1] 回帰に基づく手法は3次元人間のポーズと形状推定の分野を支配してきた。
本稿では,初期人間のモデル推定値と対応する画像との密接な対応性を構築することを提案する。
提案手法は画像モデルアライメントの改善だけでなく,3次元精度の向上にも寄与する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:13:53 GMT)
PET-SQL: A Prompt-enhanced Two-stage Text-to-SQL Framework with Cross-consistency [19.1] スパイダーベンチマークで新しいSOTA結果が得られ、実行精度は87.6%である。
提案手法は, 87.6%の精度で, スパイダーベンチマークで新しいSOTA結果が得られる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:45:41 GMT)
Defense Against Adversarial Attacks on No-Reference Image Quality Models with Gradient Norm Regularization [19.0] No-Reference Image Quality Assessment (NR-IQA)モデルは、メディア業界において重要な役割を果たす。
これらのモデルは、入力画像に知覚不能な摂動をもたらす敵攻撃に弱いことが判明した。
そこで本研究では,小さな摂動に攻撃された場合の予測スコアの安定性を向上させるための防衛手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:11:53 GMT)
Spatio-Temporal Fluid Dynamics Modeling via Physical-Awareness and Parameter Diffusion Guidance [18.9] 本稿では,時空間流体力学モデリングのための2段階フレームワークST-PADを提案する。
上流では時間特性を持つベクトル再構成モジュールを設計する。
下流では、パラメータを含む拡散確率ネットワークを用いて、流体の高品質な将来状態を生成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:57:47 GMT)
Scheduled Knowledge Acquisition on Lightweight Vector Symbolic Architectures for Brain-Computer Interfaces [18.8] 古典的特徴エンジニアリングは計算効率は高いが精度は低いが、最近のニューラルネットワーク(DNN)は精度を向上するが、計算コストが高く、レイテンシが高い。
有望な代替として、ベクトル記号アーキテクチャ(VSA)に基づく低次元計算(LDC)分類器は、古典的な特徴工学手法よりも小さいモデルサイズで精度が高い。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:06:29 GMT)
The Power of Few: Accelerating and Enhancing Data Reweighting with Coreset Selection [18.7] 再重み付けにコアサブセット選択を用いる新しい手法を提案する。
戦略的に選択されたコアセットに焦点を当てることで、我々のアプローチは堅牢な表現を提供する。
再校正された重みは、データセット全体に対してマッピングされ、伝播される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:30:22 GMT)
QueryAgent: A Reliable and Efficient Reasoning Framework with Environmental Feedback based Self-Correction [18.4] 環境フィードバックに基づく自己補正手法ERASERを提案する。
実験の結果、QueryAgentは以前の数ショットメソッドよりも特に優れていた。
このアプローチは、実行時、クエリオーバヘッド、API呼び出しコストなど、効率性の面で優れています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:39:14 GMT)
Human Simulacra: A Step toward the Personification of Large Language Models [18.3] 大規模言語モデル(LLM)は、人間の知性の側面を忠実に模倣するシステムとして認識されている。
本稿では,仮想キャラクタのライフストーリーをゼロから構築するためのフレームワークを提案する。
実験により, 構築したシミュラクラは, 対象キャラクタと一致した擬人化応答を生成できることが実証された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:29:43 GMT)
Copula Conformal Prediction for Multi-step Time Series Forecasting [18.3] 時系列予測のためのCopula Conformal Predictionアルゴリズム,CopulaCPTSを提案する。
我々は,CopulaCPTSが既存の手法よりも多段階予測タスクに対して,よりキャリブレーションと鋭い信頼区間を生成することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:49:35 GMT)
GraphBEV: Towards Robust BEV Feature Alignment for Multi-Modal 3D Object Detection [18.2] We propose a robust fusion framework called Graph BEV to integrate LiDAR and camera BEV features。
我々のフレームワークは、悪臭のある条件下で、BEV Fusionを8.3%上回っている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:00:38 GMT)
State-Separated SARSA: A Practical Sequential Decision-Making Algorithm with Recovering Rewards [18.1] 本論文は,前回腕を抜いた時から経過したラウンド数に依存する包帯の回復設定について考察する。
本稿では, ラウンドを状態として扱う状態分離SARSA(State-Separate SARSA)アルゴリズムという, この設定に適した新しい強化学習法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:14:21 GMT)
Pessimistic Causal Reinforcement Learning with Mediators for Confounded Offline Data [18.0] 我々は新しいポリシー学習アルゴリズム PESsimistic CAusal Learning (PESCAL) を提案する。
我々のキーとなる観察は、システム力学における作用の効果を媒介する補助変数を組み込むことで、Q-関数の代わりに媒介物分布関数の下位境界を学習することは十分であるということである。
提案するアルゴリズムの理論的保証とシミュレーションによる有効性の実証、および主要な配車プラットフォームからのオフラインデータセットを利用した実世界の実験を提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:51:19 GMT)
Generalization error of spectral algorithms [17.9] 我々は、$textitspectralアルゴリズムのファミリによるカーネルのトレーニングを、プロファイル$h(lambda)$で指定する。
一般化誤差は2つのデータモデルに対する学習プロファイル$h(lambda)$の関数として導出する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:52:33 GMT)
SuperLoRA: Parameter-Efficient Unified Adaptation of Multi-Layer Attention Modules [17.7] 低ランク適応(LoRA)とその変種は、微調整された大型モデルに広く用いられている。
SuperLoRAは、他のLoRA亜種と比較して高い柔軟性を提供し、転送学習タスクに優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:40:36 GMT)
Single-Agent Actor Critic for Decentralized Cooperative Driving [17.7] 本稿では,自律走行車における分散型協調運転政策の学習を目的とした,新しい非対称アクター批判モデルを提案する。
提案手法では,マスキングを用いたアテンションニューラルネットワークを用いて,現実の交通流の動的性質と部分観測可能性を扱う。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:13:02 GMT)
Scalable Quantum State Tomography with Locally Purified Density Operators and Local Measurements [17.4] 量子状態の効率的な表現により、最小限の測定で量子状態トモグラフィを実現することができる。
そこで本稿では,混合状態のテンソルネットワーク表現を用いた状態トモグラフィの新しいアプローチを提案する。
本研究では,テンソルネットワーク形式を用いた2次元システムのための量子状態トモグラフィの新たな道を開く。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:54:06 GMT)
Benchmarking the Robustness of UAV Tracking Against Common Corruptions [17.3] UAV-Cは、一般的な腐敗下でのUAVトラッカーの堅牢性を評価するためのベンチマークである。
汚職に対する既存のUAVトラッカーの堅牢性を理解するため,UAV-C上で12の代表的なアルゴリズムを広範囲に評価した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:39:21 GMT)
Multi-Source Diffusion Models for Simultaneous Music Generation and Separation [17.1] 私たちは、音楽ソース分離のための標準データセットであるSlakh2100でモデルをトレーニングします。
我々の手法は、生成タスクと分離タスクの両方を処理できる単一のモデルの最初の例である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:39:29 GMT)
Accelerating String-Key Learned Index Structures via Memoization-based Incremental Training [16.9] 学習されたインデックスは、機械学習モデルを使用して、キーと対応する位置のマッピングをキー値インデックスで学習する。
更新クエリによって導入された変更を組み込むためには、モデルを頻繁に再トレーニングする必要がある。
SIAと呼ばれるアルゴリズムとハードウェアで設計した文字列キー学習インデックスシステムを開発した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:44:00 GMT)
Unveiling the Significance of Toddler-Inspired Reward Transition in Goal-Oriented Reinforcement Learning [16.9] このToddler-Inspired Reward Transitionからインスピレーションを得た私たちは,Reinforcement Learning (RL)タスクに組み込まれた場合の,さまざまな報酬遷移の影響について検討した。
エゴセントリックなナビゲーションやロボットアーム操作タスクなど、さまざまな実験を通じて、適切な報酬遷移がサンプル効率と成功率に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:43:20 GMT)
ParallelPARC: A Scalable Pipeline for Generating Natural-Language Analogies [16.9] 複雑な段落に基づくアナロジーを作成するパイプラインを開発する。
我々は人によって検証された金のセットと銀のセットを自動生成する。
私たちは、銀のセットがトレーニングモデルに役立つことを実証します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:55:46 GMT)
Align and Distill: Unifying and Improving Domain Adaptive Object Detection [16.9] ドメイン適応オブジェクト検出(DAOD)手法は近年,この問題に対処する上で大きな成果を上げている。
過去の結果を疑問視し、さらなる進歩を妨げるような、システムベンチマークの落とし穴を特定します。
統一されたベンチマークと実装フレームワークであるAlign and Distill (ALDI)。
新しいベンチマークデータセットであるCFC-DAODは、さまざまな実世界のデータの評価を可能にし、(4)最先端の結果を大きなマージンで達成する新しいメソッドALDI++である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:58:02 GMT)
HSEmotion Team at the 6th ABAW Competition: Facial Expressions, Valence-Arousal and Emotion Intensity Prediction [16.9] 我々は、下流タスクのためにニューラルネットワークを微調整することなく、信頼できる感情的特徴を抽出する訓練済みのディープモデルを使用することの可能性を検討する。
我々は、マルチタスクシナリオで訓練されたMobileViT、MobileFaceNet、EfficientNet、DFNDAMアーキテクチャに基づいて、表情を認識するための軽量モデルをいくつか導入する。
提案手法では,既存の非アンサンブル手法と比較して,検証セットの品質指標を大幅に改善する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:08:41 GMT)
Deep learning for dynamic graphs: models and benchmarks [16.9] 近年,Deep Graph Networks (DGNs) の研究が進展し,グラフ上の学習領域が成熟した。
この研究分野の成長にもかかわらず、まだ解決されていない重要な課題がまだ残っている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:01:30 GMT)
Reinforcement Learning with Token-level Feedback for Controllable Text Generation [16.1] token-Level rewards for controllable text generationを定式化するTOLEという新しい強化学習アルゴリズムを提案する。
実験結果から,本アルゴリズムは単一属性と複数属性の制御タスクにおいて,優れた性能が得られることが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:18:37 GMT)
Quantum Coordination Rates in Multi-Partite Networks [16.0] 最適調整速度は、マルチパーティ量子ネットワークの3つの一次設定で決定される。
量子戦略を持つ非局所ゲームにおいて,この結果がもたらす意味について述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:53:30 GMT)
LogicalDefender: Discovering, Extracting, and Utilizing Common-Sense Knowledge [16.0] 画像の理解と処理において,知識として機能する深層論理情報が重要な役割を担っていることがわかった。
我々は、画像と、すでに人間がテキストで要約した論理的知識を組み合わせたLogicalDefenderを提案する。
実験により、我々のモデルはより優れた論理的性能を達成し、抽出された論理的知識は他のシナリオに効果的に適用できることが示されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:43:42 GMT)
Impart: An Imperceptible and Effective Label-Specific Backdoor Attack [15.9] 我々は,攻撃者が被害者モデルにアクセスできないシナリオにおいて,Impartという新たな非知覚的なバックドア攻撃フレームワークを提案する。
具体的には、オール・ツー・オール・セッティングの攻撃能力を高めるために、まずラベル固有の攻撃を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:22:56 GMT)
S-Agents: Self-organizing Agents in Open-ended Environments [15.7] 動的ワークフローのための「エージェントのツリー」構造を持つ自己組織化エージェントシステム(S-Agents)を導入する。
この構造はエージェントのグループを自律的に調整することができ、オープン環境と動的環境の課題に効率的に対処することができる。
実験の結果,S-AgentsはMinecraft環境において協調的な建築作業や資源収集を行うことができた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:56:42 GMT)
RL en Markov Games with Independent Function Approximation: Improved Sample Complexity Bound under the Local Access Model [15.6] シミュレータへの局所アクセスを伴う粗相関平衡(CCE)を学習するための新しいアルゴリズムLin-Confident-FTRLを導入する。
状態空間のサイズに対数的依存がある限り、Lin-Confident-FTRLは証明可能な最適精度で$O(epsilon-2)$で$epsilon$-CCEを学ぶ。
本分析は,単一エージェントのローカルプランニング文献における仮想ポリシー境界を一般化する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:54:11 GMT)
Learning General Policies for Classical Planning Domains: Getting Beyond C$_2$ [15.6] 計画領域全体にわたる一般的なポリシーを学ぶためのGNNベースのアプローチは、$C$の表現力によって制限される。
関係GNNのパラメータ化版を導入し、$t$が無限大であるとき、R-GNN[$t$]は埋め込みのための2次空間のみを用いて3ドルGNNを近似する。
t=1 や $t=2 のような $t$ の低い値の場合、R-GNN[$t$] はより少ないメッセージを交換することでより弱い近似を達成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:42:53 GMT)
Graph Partial Label Learning with Potential Cause Discovering [15.3] 雑音ラベルが存在する場合でも,GNNモデルで識別情報を学習できる新しいグラフ表現学習法を提案する。
提案手法は潜在的な原因抽出を利用してラベルと因果関係を持つ確率の高いグラフデータを得る。
抽出したグラフデータに基づいて補助訓練を組み込むことで,ラベルに含まれるノイズを効果的に除去することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:56:34 GMT)
The Real Tropical Geometry of Neural Networks [15.1] 本稿では,ReLUニューラルネットワークを熱帯有理関数として分類する。
本研究は, ニューラルネットワークと熱帯地形との関係を, 実際の熱帯地形で確立された構造を観察することによって拡張し, 改善するものである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:24:47 GMT)
DVN-SLAM: Dynamic Visual Neural SLAM Based on Local-Global Encoding [15.0] 本稿では,局所グロバル融合型ニューラル暗黙表現に基づくリアルタイム動的視覚SLAMシステムを提案する。
提案したDVN-SLAMは、複数のデータセットをまたいだローカライゼーションとマッピングにおいて、競合的な性能を達成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:34:22 GMT)
Point Mamba: A Novel Point Cloud Backbone Based on State Space Model with Octree-Based Ordering Strategy [15.0] 我々は、因果性を考慮した注文機構を備えた、新しいSSMベースのポイントクラウド処理バックボーン、Point Mambaを提案する。
本手法は, 変圧器をベースとした変圧器と比較して, 93.4%の精度と75.7mIOUの精度を実現している。
提案手法は,SSMが点雲理解において一般的なバックボーンとして機能する可能性を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:56:26 GMT)
GRAM: Global Reasoning for Multi-Page VQA [15.0] 本稿では,事前学習したシングルページモデルをマルチページ設定にシームレスに拡張するGRAMを提案する。
そのため、ローカルページレベルの理解にシングルページエンコーダを活用し、文書レベルの指定層と学習可能なトークンで拡張する。
復号化時に計算量を増やすため、任意の圧縮段階を導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:47:24 GMT)
Counting-Stars: A Simple, Efficient, and Reasonable Strategy for Evaluating Long-Context Large Language Models [14.9] GPT-4 TurboとKimi Chatは、4Kから128Kまでの長いコンテキストで大きなパフォーマンスを実現している。
我々は,長文LLMを新しいベンチマークとして,Counting-Stars(カウンティング・スターズ)という,シンプルで効率的かつ合理的な評価手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:01:45 GMT)
Hierarchical Frequency-based Upsampling and Refining for Compressed Video Quality Enhancement [14.7] 圧縮ビデオ品質向上のための階層型周波数ベースアップサンプリング・精製ニューラルネットワーク(HFUR)を提案する。
ImpFreqUpは暗黙のDCT変換によって引き起こされたDCTドメインを利用して、粗い粒度転送によってDCTドメインの損失を正確に再構築する。
HIRを導入して、スケール間の相互協力と情報補償を容易にし、特徴マップをさらに洗練し、最終的な出力の視覚的品質を向上する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:13:26 GMT)
Hybrid Reasoning Based on Large Language Models for Autonomous Car Driving [14.6] 大規模言語モデル(LLM)は、テキストや画像を理解し、人間に似たテキストを生成し、複雑な推論タスクを実行する能力において、大きな注目を集めている。
算術的推論と常識的推論の組み合わせ,特に自律運転シナリオにおけるLLMの適応性について検討する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:50:00 GMT)
Deep Nonnegative Matrix Factorization with Beta Divergences [14.6] 我々は,いくつかの$beta$-divergencesを用いて深部NMFの新しいモデルとアルゴリズムを開発した。
本稿では,これらの手法を,顔の特徴抽出,文書コレクション内の話題の同定,ハイパースペクトル画像内の資料の同定に適用する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:48:37 GMT)
GenFlow: Generalizable Recurrent Flow for 6D Pose Refinement of Novel Objects [14.6] 我々は、新しいオブジェクトへの精度と一般化を可能にするアプローチであるGenFlowを提案する。
提案手法は, レンダリング画像と観察画像との間の光学的流れを予測し, 6次元ポーズを反復的に洗練する。
3次元形状の制約と、エンドツーエンドの微分システムから学習した一般化可能な幾何学的知識により、性能を向上させる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:32:23 GMT)
Quality and Quantity: Unveiling a Million High-Quality Images for Text-to-Image Synthesis in Fashion Design [14.6] Fashion-Diffusion データセットは,多年にわたる厳格な努力の成果である。
データセットは100万以上の高品質なファッションイメージで構成されており、詳細なテキスト記述と組み合わせている。
T2Iに基づくファッションデザイン分野の標準化を促進するために,ファッションデザインモデルの性能評価のための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:23:25 GMT)
Flooding Regularization for Stable Training of Generative Adversarial Networks [14.6] 我々は,洪水がGAN訓練を安定させ,他の安定化技術と組み合わせることができることを実験的に検証した。
また, 差別者の損失をフラッドレベル以下に抑えることにより, フラッドレベルがある程度高い場合でも, トレーニングは安定的に進行することを示した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:21:27 GMT)
Probabilistic Modeling for Sequences of Sets in Continuous-Time [14.4] 設定値データを連続的にモデリングするための一般的なフレームワークを開発する。
また,そのようなモデルを用いて確率的クエリに答える推論手法も開発している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:13:26 GMT)
Gradient-based Fuzzy System Optimisation via Automatic Differentiation -- FuzzyR as a Use Case [14.2] 我々は,ファジィシステム設計者が複雑な微分計算から自由なファジィシステム設計へ向けて,ニューラルネットワーク学習に精通する自動微分に焦点をあてる。
本稿では、ファジィ推論システムの実装が、自動微分ツールセットの強力な機能を活用するためにどのように調整できるかを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:18:16 GMT)
Path-GPTOmic: A Balanced Multi-modal Learning Framework for Survival Outcome Prediction [14.2] 本稿では,癌生存率予測のためのマルチモーダルパスGPTOmicフレームワークを提案する。
基礎モデルである scGPT の埋め込み空間は,最初は単一セルRNA-seq で訓練された。
生存予測のためのCox部分的可能性損失に対応する勾配変調機構を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:02:48 GMT)
StillFast: An End-to-End Approach for Short-Term Object Interaction Anticipation [14.2] 我々は,エゴセントリックな視点から,短期的な物体相互作用予測問題を考察した。
提案手法は静止画像と映像を同時に処理し,次のアクティブ物体を検出する。
本手法は,EGO4D短期オブジェクトインタラクション予測課題2022において,第1位にランクされている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:40:17 GMT)
Touch-GS: Visual-Tactile Supervised 3D Gaussian Splatting [13.9] 光触覚センサを用いた3次元ガウス撮影シーンの監視手法を提案する。
我々は、DenseTact光触覚センサとRealSense RGB-Dカメラを活用し、この方法でタッチとビジョンを組み合わせることで、視覚やタッチ単独よりも定量的に質的に優れた結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:46:13 GMT)
Revisiting Zero-Shot Abstractive Summarization in the Era of Large Language Models from the Perspective of Position Bias [13.8] 位置バイアスを測定することにより,Large Language Models (LLMs) におけるゼロショット抽象要約を特徴付ける。
位置バイアスは入力テキストの特定の部分からの情報を不当に優先するモデルの傾向を捉え、望ましくない振る舞いをもたらす。
その結果,ゼロショット要約タスクにおけるモデルの性能と位置バイアスに関する新たな洞察と議論につながった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:09:01 GMT)
Guiding the generation of counterfactual explanations through temporal background knowledge for Predictive Process Monitoring [13.6] 我々は,XAIのドメインにおいて,実行時の一連の時間的制約を検討するために,対実生成のための最先端技術を適用した。
本稿では,時間的背景知識を取り入れることで,時間的背景知識に適合した反事実の生成が可能になることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:34:40 GMT)
Toward a Theory of Causation for Interpreting Neural Code Models [13.6] 本稿では,ニューラルコードモデル(NCM)に特化したポストホック解釈法である$do_code$を紹介する。
$do_code$は、言語指向の説明を可能にする因果推論に基づいている。
その結果,NCMはコード構文の変化に敏感であることが判明した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:41:04 GMT)
Experimental Quantum Byzantine Agreement on a Three-User Quantum Network with Integrated Photonics [13.1] 量子通信ネットワークをスケーラブルで費用効率のよい方法で構築することは、広く普及するのに不可欠である。
そこで我々は,ブラッグ反射導波路量子源を極性に統合した完全連結ネットワークを構築した。
プライベートアンプリフィケーションの必要性を回避した不完全な鍵を用いた、ソース非依存の量子デジタルシグネチャの最初の実験的実装を提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:29:18 GMT)
Fed3DGS: Scalable 3D Gaussian Splatting with Federated Learning [12.9] Fed3DGSは3Dガウススプラッティング(3DGS)に基づくスケーラブルな3D再構成フレームワークである。
既存の都市規模の再構築手法では、中央サーバにすべてのデータを収集し、シーンを再構築する集中型アプローチが一般的である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:26:18 GMT)
HomoGenius: a Foundation Model of Homogenization for Rapid Prediction of Effective Mechanical Properties using Neural Operators [12.8] 均質化(homogenization)は、多スケールの物理現象を研究するための重要なツールである。
本稿では,演算子学習に基づく数値ホモジェナイゼーションモデルを提案する。
提案したモデルでは、任意の測地、材料、解像度に対して、迅速に均質化結果を提供することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:47:35 GMT)
Contextual Refinement of Translations: Large Language Models for Sentence and Document-Level Post-Editing [12.8] 大規模言語モデル(LLM)は、様々な自然言語処理タスクでかなりの成功を収めている。
ニューラルネットワーク翻訳における最先端性能は,まだ達成できていない。
直接翻訳者ではなく,自動編集者 (APE) としてLLMを適用することを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:11:03 GMT)
Hierarchical Auto-Organizing System for Open-Ended Multi-Agent Navigation [12.8] Minecraftにおけるマルチエージェント組織のための階層的自動組織ナビゲーションシステムを設計する。
Minecraft環境では、探索や探索を含む一連のナビゲーションタスクも設計しています。
私たちは、具体的AIの境界を押し進め、より人間的な組織構造へと移行する、具体的組織の開発を目指しています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:03:53 GMT)
Bugs in Large Language Models Generated Code: An Empirical Study [12.6] コード用の大規模言語モデル(LLM)が最近注目を集めている。
人間書きのコードと同様、LLM生成コードはバグを起こしやすい。
本稿では,3つのLLMを用いて生成されたコードから収集した333個のバグのサンプルについて検討する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:34:13 GMT)
Metaphor Understanding Challenge Dataset for LLMs [12.4] メタファー理解チャレンジデータセット(MUNCH)をリリースする。
MUNCHは、大規模言語モデル(LLM)のメタファー理解能力を評価するように設計されている。
このデータセットは、メタファーの使用を含む文に対して10k以上のパラフレーズと、不適応パラフレーズを含む1.5kのインスタンスを提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:08:59 GMT)
Just Add $100 More: Augmenting NeRF-based Pseudo-LiDAR Point Cloud for Resolving Class-imbalance Problem [12.3] 本稿では,小クラスのミニチュアや現実世界のオブジェクトのサラウンドビューをキャプチャしたビデオから生成された擬似LiDAR点雲を活用することを提案する。
Pseudo Ground Truth Aug (PGT-Aug) と呼ばれるこの手法は, (i) 2D-to-3Dビュー合成モデルを用いたボリューム3Dインスタンス再構成, (ii)LiDAR強度推定によるオブジェクトレベルドメインアライメント, (iii) 地上情報と地図情報からのコンテキスト認識配置のハイブリッド化という3つのステップから構成される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:50:04 GMT)
MAC Advice for Facility Location Mechanism Design [12.1] 我々は、$k$-facility位置決め機構設計問題について検討する。
以前のモデルとは異なり、$k$の最適施設位置の予測は各エージェントの位置の予測に対して$n$の予測を受ける。
予測された位置の$delta$-fractionの一部が任意に誤りを許容され、残りの予測は$varepsilon$-errorまで修正される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:52:04 GMT)
Intelligent Execution through Plan Analysis [11.8] 計画は世界について仮定する。
計画を実行する場合、通常、仮定は満たされない。
代わりに私たちは、ポジティブな影響や、より良い計画を見つける機会に重点を置いています。
いくつかのパラダイム的なロボットタスクの実験は、アプローチが標準的な計画戦略よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:23:36 GMT)
ProMISe: Promptable Medical Image Segmentation using SAM [11.7] ターゲット領域にユークリッド適応プロンプトを付加したSAMベースの基盤モデルを提供する自動プロンプトモジュール(APM)を提案する。
また、SAMを特定の医療領域に適応させるために、Incrmental Pattern Shifting (IPS) と呼ばれる新しい非侵襲的手法を提案する。
これら2つの手法を結合することにより,プロンプタブル・メディカルイメージのためのエンドツーエンドな非微調整フレームワークであるProMISeを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:40:48 GMT)
EcoVal: An Efficient Data Valuation Framework for Machine Learning [11.7] 機械学習におけるデータアセスメントのための既存のShapley値ベースのフレームワークは、計算コストが高い。
機械学習モデルのデータを高速かつ実用的な方法で推定するために,効率的なデータアセスメントフレームワークであるEcoValを導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:47:08 GMT)
Ultraman: Single Image 3D Human Reconstruction with Ultra Speed and Detail [11.6] 本研究では,1つの画像からテクスチャ化された3次元人間のモデルを高速に再構成するためのemphUltramanという手法を提案する。
emphUltramanは、高品質なテクスチャの詳細を保存しながら、再構築のスピードと精度を大幅に改善する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:57:30 GMT)
A proposal to characterize and quantify superoscillations [11.5] これまでに提案された定義の限界について議論し、超振動挙動の全域をカバーしていないことを示す。
本稿では,従来の定義を含まないよく知られた超振動関数の例を用いて,提案手法の適合性を実証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:11:10 GMT)
A Novel Paradigm Boosting Translation Capabilities of Large Language Models [11.5] 本論文は,一貫した単言語データを用いた二次事前学習,インターリニアテキストフォーマット文書による継続事前学習,および教師付きファインチューニングのためのソース・ランゲージ・コンスタント・インストラクションの活用という,3つの段階からなる新しいパラダイムを提案する。
Llama2モデルを用いた実験結果,特に中国語-Llama2を用いて,LLMの翻訳能力の向上を実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:53:49 GMT)
Zero-shot Compound Expression Recognition with Visual Language Model at the 6th ABAW Challenge [11.5] 従来のCNNネットワークと統合された事前学習された視覚言語モデルを活用することで,複合表現の認識のためのゼロショットアプローチを提案する。
本研究では,従来のCNNネットワークと統合された事前学習された視覚言語モデルを活用することで,複合表現認識のためのゼロショットアプローチを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:59:24 GMT)
Filter-free high-performance single photon emission from a quantum dot in a Fabry-Perot microcavity [11.4] Purcell-enhanced single quantum dots (QDs) を用いた共鳴励起は、高性能な固体単一光子源を実現するための重要な戦略である。
伝統的に、これは偏光フィルタリングを含み、達成可能な偏光方向とフォトニック状態のスケーラビリティを制限する。
我々は, モノリシックファブリペロマイクロキャビティと決定的に結合したQDの空間直交共振励起を用いて, この問題に対処することに成功している。
得られた光源は、高い抽出効率が0.87、純度が0.9045(4)、識別性が0.963(4)の単一光子を同時に生成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:45:17 GMT)
Data-Efficient Contrastive Language-Image Pretraining: Prioritizing Data Quality over Quantity [11.4] 大規模な画像キャプチャデータセットを用いたコントラスト言語-画像事前学習は、目覚ましいゼロショットの一般化を実現するための表現を学ぶ。
ベストを確実に一般化するトレーニングデータの小さなサブセットは、未解決の問題のままである。
画像とキャプションの相互共分散を密に保存する部分集合は、より優れた一般化性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:32:58 GMT)
The Expressive Power of Low-Rank Adaptation [11.4] パラメータ効率のよい微調整法である低ランク適応は、微調整事前学習モデルの代表的な手法として登場した。
本稿では,LoRAの表現力を理論的に解析することで,ギャップを埋める第一歩を踏み出す。
トランスフォーマーネットワークでは、任意のモデルが、ランク=$(fractextembedding size2)$ LoRAで同じサイズのターゲットモデルに適応可能であることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:13:24 GMT)
Properties of Discrete Sliced Wasserstein Losses [11.3] スライスされたワッサーシュタイン距離(SW)は、確率測度を比較するためにワッサーシュタイン距離の代替として人気がある。
広範囲のアプリケーションには画像処理、ドメイン適応、生成モデリングが含まれており、SWを最小化するためにパラメータを最適化することが一般的である。
このエネルギーの正則性と最適化特性、およびモンテカルロ近似 $mathcalE_p$ について検討する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:07:40 GMT)
Investigating the Benefits of Projection Head for Representation Learning [11.2] 高品質な表現を得るための効果的なテクニックは、トレーニング中にエンコーダの上にプロジェクションヘッドを追加し、それを破棄し、プリプロジェクション表現を使用することである。
プロジェクション前表現は損失関数によって直接最適化されていない。
トレーニングアルゴリズムの暗黙のバイアスは、階層的にプログレッシブな機能の重み付けにつながり、レイヤーに深く入り込むにつれて、機能がますます不平等になることを示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:48:58 GMT)
Matrix-Transformation Based Low-Rank Adaptation (MTLoRA): A Brain-Inspired Method for Parameter-Efficient Fine-Tuning [11.0] マトリックス変換に基づく低ランク適応(MTLoRA)は、脳の機能はその幾何学的構造によって形成されるという考えから着想を得ている。
MTLoRAは8つのタスクでパフォーマンスが約1.0%向上する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:13:05 GMT)
Privacy Perceptions and Behaviors of Google Personal Account Holders in Saudi Arabia [11.0] サウジアラビアのGoogleアカウント保有者30人に、プライバシーの認識と行動についてインタビューした。
私たちの結果は、ほとんどの参加者はGoogleのデータプラクティスについてある程度の意識を持っているが、多くは曖昧な認識しか持っていないことを示している。
多くの参加者は、Googleが提供したサービスを改善するためにデータを使用することを容認しているが、大多数は広告目的でデータを使用することを容認できないと考えている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:07:02 GMT)
Deep Bayesian Future Fusion for Self-Supervised, High-Resolution, Off-Road Mapping [11.0] 我々は、RGB/高さの生のスパースとノイズの多い入力とマップベースの高密度ラベルのペアを含む高解像度のフューチャーフュージョンデータセットを作成する。
次に,ベイズフィルタのバニラ畳み込みネットワークへの効率的な実現を設計する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:28:35 GMT)
TCNet: Continuous Sign Language Recognition from Trajectories and Correlated Regions [11.0] 連続手話認識(CSL)における鍵は、入力から経時的に長距離空間的相互作用を効率的にキャプチャする。
トラジェクトリと時間的関連領域から映像情報トラジェクトリを効果的にモデル化するハイブリッドネットワークTCNetを提案する。
PHOENIX14, PHOENIX14-T, CSL, CSLの4つの大規模データセットについて実験を行った。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:20:17 GMT)
Embedded Named Entity Recognition using Probing Classifiers [10.6] 生成したテキストから意味情報を抽出することは、自動事実チェックや検索拡張生成に有用なツールである。
本稿では,事前学習した言語モデルに韻律分類器を用いた埋め込み情報抽出機能を提案する。
GPT-2を用いた実験は、EMBERがストリーミングテキスト生成中に高いトークン生成率を維持することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:58:16 GMT)
On the Detectability of ChatGPT Content: Benchmarking, Methodology, and Evaluation through the Lens of Academic Writing [10.5] そこで我々は,ChatGPT文中の微妙で深い意味的・言語的パターンをよりよく捉えるために,CheckGPTというディープニューラルネットワークフレームワークを開発した。
ChatGPTコンテンツの検出性を評価するため、我々はCheckGPTの転送性、迅速なエンジニアリング、ロバスト性について広範な実験を行った。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:14:54 GMT)
Thwarting Cybersecurity Attacks with Explainable Concept Drift [10.5] サイバーセキュリティ攻撃は、自律システムの運用に重大な脅威をもたらす。
本稿では, ドリフト特徴を特定するための特徴ドリフト記述(FDE)モジュールを提案する。
FDEは85.77 %のドリフト特性を同定し、DL適応法でその有用性を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:20:00 GMT)
EmoCLIP: A Vision-Language Method for Zero-Shot Video Facial Expression Recognition [10.4] 本稿では,サンプルレベルのテキスト記述を自然言語の監視に用いる新しい視覚言語モデルを提案する。
以上の結果から,本手法はベースライン法と比較して大きな改善をもたらすことが示唆された。
本研究では,メンタルヘルス症状推定の下流課題について,サンプルレベル記述を用いてトレーニングしたネットワークから得られた表現を評価した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:07:03 GMT)
Reinforcement Learning from Delayed Observations via World Models [10.3] 本稿では,部分的に観測可能な環境下での観測遅延に対処することに焦点を当てる。
本稿では、過去の観測と学習のダイナミクスを統合することに成功している世界モデルを活用して、観測遅延を処理することを提案する。
実験の結果,提案手法の1つが,モデルベースアプローチを最大で30パーセント上回ることが示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:18:27 GMT)
LHRS-Bot: Empowering Remote Sensing with VGI-Enhanced Large Multimodal Language Model [10.3] 本稿では,新しい視覚言語アライメント戦略とカリキュラム学習手法を通じて,RS画像理解に適したMLLMであるLHRS-Botを紹介する。
総合的な実験により、LHRS-BotはRS画像の深い理解と、RS領域内でニュアンス推論を行う能力を示すことが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:16:29 GMT)
Decentralized Stochastic Subgradient Methods for Nonsmooth Nonconvex Optimization [10.3] 本稿では,分散化サブグラディエント手法のグローバル収束を解析するためのフレームワークを提案する。
提案するフレームワークは,高効率ニューラルネットワークの範囲で保証されていることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:35:17 GMT)
Crystalformer: Infinitely Connected Attention for Periodic Structure Encoding [10.2] 結晶構造から材料の物性を予測することは、材料科学の基本的な問題である。
結晶構造が無限に繰り返し、原子の周期的な配列であり、完全に連結された注意が無限に連結された注意をもたらすことを示す。
本稿では, 結晶構造に対する簡単なトランスフォーマーベースエンコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:37:42 GMT)
Decomposing Control Lyapunov Functions for Efficient Reinforcement Learning [10.1] 現在の強化学習(RL)手法では、特定のタスクを学習するために大量のデータを必要とするため、エージェントをデプロイして実世界のアプリケーションにデータを収集する場合、不合理なコストが発生する。
本稿では,RL の報酬関数を補うために,CLF (Control Lyapunov Function) を導入して,サンプルの複雑さを低減した既存の作業から構築する。
提案手法は,最先端のソフト・アクター・クリティカル・アルゴリズムが必要とする実世界のデータの半分以下でクワッドコプターを着陸させることが可能であることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:51:17 GMT)
An Accurate and Real-time Relative Pose Estimation from Triple Point-line Images by Decoupling Rotation and Translation [10.1] 3D-2D制約は、Visual Odometry (VO) やStructure-from-Motion (SfM) システムで広く使われている。
回転変換デカップリング推定に基づく新しい3次元ポーズ解決器を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:21:05 GMT)
DNABERT-2: Efficient Foundation Model and Benchmark For Multi-Species Genome [10.1] 我々は、k-merトークン化によって導入された計算とサンプルの非効率性が、大規模なゲノム基盤モデルの開発における主要な障害であると主張している。
我々は、k-merトークン化をByte Pair$に置き換えることを提案するゲノムトークン化に関する概念的および実証的な洞察を提供する。
DNABERT-2は、効率的なトークン化を施し、入力長制約を克服するために複数の戦略を用いるゲノム基盤モデルである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:59:29 GMT)
Explanations, Fairness, and Appropriate Reliance in Human-AI Decision-Making [10.0] 特徴に基づく説明がAIによる意思決定の分配的公平性に及ぼす影響について検討する。
以上の結果から,説明は公正感に影響を及ぼし,人間のAI推奨に固執する傾向に影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:11:33 GMT)
Private graphon estimation via sum-of-squares [10.0] ブロックモデルを学習し,任意のブロックに対して一定の実行時間でグラフトン推定を行うための,最初の純粋ノード微分プライベートアルゴリズムを開発した。
統計的ユーティリティは、これらの問題に対する以前の最良の情報理論(指数時間)ノードプライドメカニズムのそれと一致することを保証している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:54:59 GMT)
Learning Dynamical Systems Encoding Non-Linearity within Space Curvature [10.0] 動的システム(DS)は、ロボット制御のための高レベルポリシーを効果的かつ強力に形成する手段である。
DSの現在の学習戦略は、しばしばトレードオフを伴い、安定性を保証するかオフラインの計算効率を犠牲にする。
ロボット制御のための非線形DSを学習的に安定させる幾何学的手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:42:39 GMT)
Lifelong Person Re-Identification with Backward-Compatibility [9.9] LReID (Lifelong person re-identification) は、連続的にやってくるデータセットに基づいてモデルを逐次訓練する現実的なシナリオを前提としている。
本稿では,LReIDの後方互換性を初めて取り入れることで,上記の問題に対処する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:57:08 GMT)
Assessing the potential of AI-assisted pragmatic annotation: The case of apologies [9.9] 本研究では,大言語モデル(LLM)を用いたプラグマ離散コーパスアノテーションの自動化について検討する。
そこで我々は,ChatGPT,Bingチャットボット,および人間のコーダを用いて,局所文法フレームワークに基づく英語の謝罪コンポーネントの注釈付けを行った。
結果は、AIをうまくデプロイして、プラグマの分散コーパスアノテーションを補助し、プロセスをより効率的かつスケーラブルにすることができることを示唆している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:56:09 GMT)
3DGS-Calib: 3D Gaussian Splatting for Multimodal SpatioTemporal Calibration [9.8] マルチモーダルキャリブレーションを実現するために,3次元ガウス平滑化の高速化と精度に依存する新しいキャリブレーション法を提案する。
我々は、広く使われている運転データセットであるKITTI-360のシーケンスに関する実験結果を用いて、提案手法の優位性を実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:53:03 GMT)
Efficient Transformer-based Hyper-parameter Optimization for Resource-constrained IoT Environments [9.7] 本稿では,トランスフォーマーアーキテクチャとアクター批判型強化学習モデルTRL-HPOを組み合わせた新しいアプローチを提案する。
その結果、TRL-HPOはこれらの手法の分類結果を同時に6.8%上回る結果となった。
本稿では,資源制約環境下でのRLベースのHPOプロセスを改善するための新しい方法について述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:35:35 GMT)
Shifting to Machine Supervision: Annotation-Efficient Semi and Self-Supervised Learning for Automatic Medical Image Segmentation and Classification [9.7] S4MI(Self-Supervision and Semi-Supervision for Medical Imaging)パイプラインを導入する。
本研究は、これらの手法を3つの異なる医用画像データセット上で評価し、分類と分割作業の有効性を評価する。
注目すべきは、半教師付きアプローチはセグメンテーションにおいて優れた結果を示し、全データセットで50%少ないラベルを使用しながら、完全な教師付き手法よりも優れた結果を示したことだ。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:01:53 GMT)
ACFIX: Guiding LLMs with Mined Common RBAC Practices for Context-Aware Repair of Access Control Vulnerabilities in Smart Contracts [9.6] ACFIXは、スマートコントラクトにおけるAC脆弱性の自動的かつ適切な修復のための新しいアプローチである。
私たちは、コード機能の主要なカテゴリで一般的なACプラクティスを抽出し、同様の機能でコードを修正するのにLLMをガイドするためにそれを使用します。
ACFIXを評価するために、118個の実世界のAC脆弱性のベンチマークデータセットを構築し、ACFIXが94.92%の修正に成功したことを明らかにした。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:37:56 GMT)
Span-Oriented Information Extraction -- A Unifying Perspective on Information Extraction [9.5] インフォメーション抽出(Information extract)とは、テキストとそのラベル内のサブシーケンスを識別するタスクの集合である。
私たちは、これらの一見不連続なタスクを、テキストにまたがっていると定義することを中心に、統一された視点に再調整します。
そこで我々は,情報抽出タスクの多種多様さを,Span-Oriented Information extractタスクの変種として再表現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:10:44 GMT)
CURSOR: Scalable Mixed-Order Hypergraph Matching with CUR Decomposition [9.5] 本研究は,高速なハイパーグラフマッチングを実現するために,新しい第2および第3次ハイパーグラフマッチングフレームワーク(CURSOR)を導入する。
CURベースの2階グラフマッチングアルゴリズムを用いて粗マッチングを行い、繊維CURベースのテンソル生成法であるCURSORのコアは、互換性テンソルのエントリを直接計算する。
大規模合成データセットと広く評価されたベンチマークセットの実験結果は、既存の手法よりもCURSORの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:21:31 GMT)
Fusion Transformer with Object Mask Guidance for Image Forgery Analysis [9.5] OMG-Fuserは、様々な法医学的信号から情報を取り出すために設計された融合トランスフォーマーベースのネットワークである。
本手法は任意の数の法定信号を用いて動作し,解析に対象情報を利用する。
我々のネットワークは、伝統的で新しい偽造攻撃に対する堅牢性を示し、スクラッチからトレーニングを受けることなく、新しい信号で拡張することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:20:13 GMT)
EffiVED:Efficient Video Editing via Text-instruction Diffusion Models [9.3] EffiVEDは、命令誘導ビデオ編集をサポートする効率的な拡散ベースモデルである。
我々は、膨大な画像編集データセットとオープンワールドビデオを、EffiVEDをトレーニングするための高品質なデータセットに変換する。
実験結果から,EffiVEDは高品質な編集ビデオを生成するだけでなく,高速に実行可能であることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:42:08 GMT)
Word Order's Impacts: Insights from Reordering and Generation Analysis [9.1] 現存する研究は、自然文中の単語の順序が与える影響について研究している。
この結果を踏まえ、単語順序に関する異なる仮説が提案されている。
ChatGPTは単語順序に依存するが、単語順序の語彙的意味論の間の冗長関係をサポートし、否定することはできない。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:45:44 GMT)
Evaluating Text to Image Synthesis: Survey and Taxonomy of Image Quality Metrics [9.0] 本稿では,既存のテキスト・画像評価指標の概要を概観し,これらの指標を分類するための新しい分類法を提案する。
我々は、テキスト・ツー・イメージの評価を改善するためのガイドラインを導き、オープンな課題と現在の制限について議論する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:24:20 GMT)
Improving Generalization via Meta-Learning on Hard Samples [9.0] 検証集合における難しい分類インスタンスの使用は、理論上の関係と、一般化の強い経験的証拠の両方を持つことを示す。
我々は,このメタ最適化モデルを訓練するための効率的なアルゴリズムと,注意深い比較研究のための簡単なトレインツースを提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:33:44 GMT)
Quantum density estimation with density matrices: Application to quantum anomaly detection [8.9] 密度推定は統計学と機械学習の中心的なタスクである。
本稿ではQ-DEMDEと呼ばれる新しい量子古典密度行列密度推定モデルを提案する。
また,本手法の量子古典的異常検出への応用について述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:20:37 GMT)
Exploring 3D-aware Latent Spaces for Efficiently Learning Numerous Scenes [8.8] 本研究では,NeRFのスケーリングにより,多くの意味的類似シーンを学習する手法を提案する。
本手法は,1000シーンのトレーニングにおいて,有効メモリコストを44%削減し,実時間コストを86%削減する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:29:43 GMT)
GNeRP: Gaussian-guided Neural Reconstruction of Reflective Objects with Noisy Polarization Priors [8.8] ニューラルレイディアンス場(NeRF)からの学習面がマルチビューステレオ(MVS)の話題となった
近年の手法は、ランバートのシーンの正確な3次元形状を復元する能力を示した。
しかし、反射シーンにおけるそれらの結果は、特異な放射率と複雑な幾何学の絡み合いにより満足できない。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:58:03 GMT)
EHRDiff: Exploring Realistic EHR Synthesis with Diffusion Models [8.8] プライバシー上の懸念は、研究者のための高品質で大規模なEHRデータへのアクセスを制限している。
近年の研究では、生成モデリング技術による現実的なEHRデータの合成が研究されている。
本研究では, EHRデータ合成における拡散モデルの可能性について検討し, 新たな手法である EHRDiff を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:34:44 GMT)
Enhancing Continuous Domain Adaptation with Multi-Path Transfer Curriculum [8.7] 継続的ドメイン適応(Continuous Domain Adaptation)は、トレーニングとテストデータの分散ギャップを埋める効果的なテクニックとして登場した。
本稿では,ドメインの順序付けとエラー蓄積の問題に厳密に対処する新しい手法W-MPOTを提案する。
我々は、複数のデータセット上でW-MPOTを広範囲に評価し、マルチセッションアルツハイマーMR画像分類における54.1%の精度向上と、バッテリ容量推定における94.7%のMSE削減を実現した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:10:46 GMT)
Problem space structural adversarial attacks for Network Intrusion Detection Systems based on Graph Neural Networks [8.6] 本稿では,ネットワーク侵入検知におけるGNNに適した敵攻撃の最初の形式化を提案する。
我々は、現実のシナリオにおいて、実行可能な構造攻撃を実行するために、攻撃者が考慮すべき問題空間の制約を概説し、モデル化する。
以上の結果から,古典的特徴に基づく攻撃に対するモデルの堅牢性の向上が示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:40:33 GMT)
Online learning in bandits with predicted context [8.3] エージェントがコンテキストの騒々しいバージョンにしかアクセスできない場合、コンテキスト的帯域幅の問題を考える。
この設定は、意思決定の真のコンテキストが守られない広範囲のアプリケーションによって動機付けられている。
本研究では,この設定において,軽度条件下でのサブ線形後悔保証を用いた最初のオンラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:08:41 GMT)
Visuo-Tactile Pretraining for Cable Plugging [8.2] 我々は,複雑なタスクの性能向上のために,触覚情報を模倣学習プラットフォームに組み込む方法について検討する。
私たちはロボットエージェントにUSBケーブルを差し込むように訓練します。
また, 触覚情報を用いて非触覚エージェントの訓練を行う方法についても検討した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:56:44 GMT)
Supervised Fine-Tuning as Inverse Reinforcement Learning [8.0] LLM(Large Language Models)の整合性に対する一般的なアプローチは、一般的に人間やAIのフィードバックに依存します。
本研究では,このようなデータセットの有効性に疑問を呈し,専門家による実演との整合性がより現実的であることを証明した様々なシナリオを探索する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:52:57 GMT)
Unsupervised Modality-Transferable Video Highlight Detection with Representation Activation Sequence Learning [7.9] 教師なしハイライト検出のためのクロスモーダル認識を用いた新しいモデルを提案する。
提案モデルでは,自己再構成タスクを通じて,画像と音声のペアデータから視覚レベルのセマンティクスを用いて表現を学習する。
実験結果から,提案手法は,他の最先端手法と比較して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:08:01 GMT)
Towards Understanding the Relationship between In-context Learning and Compositional Generalization [7.8] 私たちは、通常の学習を非常に難しい設定で因果変換器を訓練します。
しかし、このモデルは、初期の例を利用して、後の例に一般化することで、タスクを解くことができる。
データセット、SCAN、COGS、GeoQueryの評価では、この方法でトレーニングされたモデルは、実際に合成の一般化の改善を示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:45:52 GMT)
Measuring Quantum Information Leakage Under Detection Threat [7.8] 任意の盗聴者への情報漏洩の尺度として、ゲントル量子リークを提案する。
盗聴者の欲求を符号化して検出を回避するための措置が用いられる。
グローバルな分極ノイズは、緩やかな量子漏れを減らすことが示されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:07:09 GMT)
Augment Before Copy-Paste: Data and Memory Efficiency-Oriented Instance Segmentation Framework for Sport-scenes [7.8] Visual Inductive Priors Challenge (VIPriors2023)では、参加者はバスケットボールコートで個人を正確に特定できるモデルを訓練しなければならない。
本稿では,視覚的インダクティブな前流伝搬に基づくメモリ効率インスタンスフレームワークを提案する。
実験では、限られたデータとメモリの制約の下でも、我々のモデルを有望な性能を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:44:40 GMT)
Observation of discrete charge states of a coherent two-level system in a superconducting qubit [7.7] 我々は、オフセット電荷感受性超伝導トランスモン量子ビットと強く結合したコヒーレント2レベル系(TLS)の離散電荷状態の観測を報告する。
2つのTLS固有状態と関連する0.072$e$のオフセット電荷を測定し、遷移周波数は2.9GHz、緩和時間は3ms以上である。
本研究では、低周波帯電雑音の発生源としてマイクロ波TLSを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:42:27 GMT)
Reinforcement Learning with Generalizable Gaussian Splatting [7.6] 優れた表現は強化学習(RL)のパフォーマンスに不可欠である。
本稿では、GSRLと呼ばれるRLタスクを表現するための新しい一般化可能なガウススティングフレームワークを提案する。
提案手法は,複数のタスクにおいて,他のベースラインよりも優れた結果が得られ,最も難しいタスクのベースラインと比較して10%,44%,15%の性能が向上する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:50:23 GMT)
SSAP: A Shape-Sensitive Adversarial Patch for Comprehensive Disruption of Monocular Depth Estimation in Autonomous Navigation Applications [7.6] SSAP(Shape-Sensitive Adrial Patch)は,自律ナビゲーションアプリケーションにおける単眼深度推定(MDE)を阻害する新しい手法である。
我々のパッチは、推定距離を歪ませたり、システムの観点から消える物体の錯覚を作り出すことによって、2つの異なる方法でMDEを選択的に弱体化させる。
提案手法は平均深度推定誤差が0.5を超え,CNNベースMDEモデルの目標領域の99%に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:01:21 GMT)
Predict the Next Word: Humans exhibit uncertainty in this task and language models _____ [7.6] 言語モデル(LM)は、人間の生成したテキストに確率を割り当てるように訓練されている。
我々は、この事実を利用して、人間が「次の単語予測」タスクで示す変動性を再現するLMの能力を評価する。
我々は、GPT2、BLOOM、ChatGPTを評価し、人間の不確実性に対するキャリブレーションがかなり低いことを発見した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:21:24 GMT)
Syn-QA2: Evaluating False Assumptions in Long-tail Questions with Synthetic QA Datasets [7.5] 合成された質問応答(QA)データセットの集合であるSyn-(QA)$2$を紹介する。
先行研究の結果を反映して,QAにおける誤った仮定は困難であることが判明した。
検出タスクは、自然発生の質問よりも長い尾の質問の方が難しい。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:01:26 GMT)
Semantic Prompting with Image-Token for Continual Learning [7.5] I-Promptはタスク予測を排除するためのタスクに依存しないアプローチである。
提案手法は,4つのベンチマーク上での競合性能を実現する。
様々なシナリオにまたがって,提案手法の優位性を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:43:14 GMT)
Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images [7.5] ゲノムインフォームドハイパーアテンションネットワーク(G-HANet)は、トレーニング中にヒストリーゲノム知識を効果的に蒸留することができる。
ネットワークは、クロスモーダル・アソシエーション・ブランチ(CAB)とハイパーアテンション・サバイバル・ブランチ(HSB)から構成される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:02:11 GMT)
BackCache: Mitigating Contention-Based Cache Timing Attacks by Hiding Cache Line Evictions [7.5] L1データキャッシュ攻撃は、重大なプライバシーと機密性の脅威を引き起こす。
BackCacheは常にキャッシュミスではなくキャッシュヒットを達成し、L1データキャッシュに対する競合ベースのキャッシュタイミング攻撃を軽減します。
BackCacheは、解放されたキャッシュラインをL1データキャッシュから完全に連想的なバックアップキャッシュに配置して、排除を隠蔽する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:52:15 GMT)
GPT-4 as Evaluator: Evaluating Large Language Models on Pest Management in Agriculture [7.5] 農業、特に害虫管理における大規模言語モデル(LLM)の適用は、まだ初期段階である。
我々は,OpenAIのGenerative Pre-trained Transformer(GPT)シリーズやGoogleのFLANシリーズなど,LLMsが生み出す害虫管理アドバイスの内容を評価することで,その実現可能性を証明することを目的とした。
我々は, GPT-4 を評価指標として, コヒーレンス, 論理的一貫性, 頻度, 妥当性, 包括性, 露出性について, 生成した内容を評価する革新的な手法を提案した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:08:01 GMT)
A Natural Extension To Online Algorithms For Hybrid RL With Limited Coverage [7.4] 私たちは、よく設計されたオンラインアルゴリズムがオフラインデータセットの"ギャップを埋める"必要があることを示しています。
オフラインデータセットが単一政治中心性を持っていなくても、ハイブリッドデータから同様の証明可能なゲインが得られることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:18:16 GMT)
denoiSplit: a method for joint image splitting and unsupervised denoising [7.4] denoiSplitは、共同セマンティックイメージ分割と教師なし denoising の課題に取り組む方法である。
画像分割は、イメージを識別可能なセマンティック構造に分割することを含む。
この課題に対する現在の最先端の手法は、画像ノイズの存在に苦慮していることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:03:56 GMT)
Optimal Transport for Domain Adaptation through Gaussian Mixture Models [7.3] 本稿では,ガウス混合モデルを用いてデータ分布をモデル化する手法を提案する。
最適なトランスポートソリューションは、ソースとターゲットドメインの混合コンポーネントのマッチングを提供します。
断層診断における2つの領域適応ベンチマークを用いて,本手法の最先端性能を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:32:33 GMT)
Synergizing Machine Learning & Symbolic Methods: A Survey on Hybrid Approaches to Natural Language Processing [7.2] 自然言語の理解、生成、推論を必要とする幅広いNLPタスクに使われている最先端のハイブリッドアプローチについて論じる。
具体的には、自然言語理解、生成、推論を必要とする幅広いNLPタスクに使用される最先端のハイブリッドアプローチについて検討する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:05:30 GMT)
Claim Detection for Automated Fact-checking: A Survey on Monolingual, Multilingual and Cross-Lingual Research [7.2] 本稿では,現状の多言語クレーム検出研究を,問題の3つの重要な要因,妥当性,優先性,類似性に分類する。
本稿では,既存の多言語データセットの概要と課題について概説し,今後の発展の可能性を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:49:59 GMT)
Graph-Jigsaw Conditioned Diffusion Model for Skeleton-based Video Anomaly Detection [7.1] スケルトンに基づくビデオ異常検出(SVAD)はコンピュータビジョンにおいて重要な課題である。
本稿では,Skeleton-based Video Anomaly Detection (GiCiSAD) のためのグラフ-Jigsaw条件付き拡散モデル(Graph-Jigsaw Conditioned Diffusion Model)を提案する。
広く使われている4つの骨格ベースのビデオデータセットの実験では、GiCiSADはトレーニングパラメータが大幅に少ない既存の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:42:32 GMT)
OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System [7.1] 我々は,光学的文字認識(OCR)を基本とする外部モダリティ誘導データマイニングフレームワークを導入し,画像から統計的特徴を抽出する。
提案手法の重要な側面は、単一のモーダル認識モデルを用いて抽出された外部モーダル特徴のアライメントであり、畳み込みニューラルネットワークによって符号化された画像特徴である。
本手法は欠陥検出モデルのリコール率を大幅に向上させ,挑戦シナリオにおいても高い堅牢性を維持する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:41:39 GMT)
A Spatial-Temporal Progressive Fusion Network for Breast Lesion Segmentation in Ultrasound Videos [7.0] 超音波画像による乳房病変の分節化の最大の課題は、フレーム内とフレーム間の両方の病変を同時に活用する方法である。
本稿では,ビデオベース乳房病変分割問題に対する新しい空間進行核融合ネットワーク(STPFNet)を提案する。
STPFNetは、最先端の方法よりも優れた乳房病変検出性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:56:32 GMT)
Towards Generalizing to Unseen Domains with Few Labels [7.0] ラベル付きデータの限られたサブセットを活用することにより、ドメインの一般化可能な特徴を学習するモデルを得る。
ラベル付けされていないデータを活用できない既存のドメイン一般化(DG)手法は、半教師付き学習(SSL)法に比べて性能が劣る。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:21:52 GMT)
Span-Based Optimal Sample Complexity for Weakly Communicating and General Average Reward MDPs [7.0] 平均回帰マルコフ決定過程 (MDP) における$epsilon$-optimal Policy の学習の複雑さについて, 生成モデルを用いて検討した。
MDP を弱通信するためには、$tildeO(SAfracHepsilon2)$, $H$ は最適ポリシーのバイアス関数のスパンであり、$SA$ は状態-作用空間の濃度である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:52:11 GMT)
STREAM: Spatio-TempoRal Evaluation and Analysis Metric for Video Generative Models [6.9] ビデオ生成モデルは、短いビデオクリップを生成するのに苦労する。
現在のビデオ評価メトリクスは、埋め込みをビデオ埋め込みネットワークに切り替えることによって、画像メトリクスの単純な適応である。
本稿では,空間的側面と時間的側面を独立に評価するために一意に設計された新しいビデオ評価指標STREAMを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:02:44 GMT)
Predicting Generalization of AI Colonoscopy Models to Unseen Data [6.6] 見えないデータ中の現象を識別する「マスケシームズネットワーク」(MSN)。
MSNはラベルなしでポリプ画像のマスキング領域を予測する訓練を行った。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:04:39 GMT)
S-JEPA: towards seamless cross-dataset transfer through dynamic spatial attention [6.6] 本稿では,脳波信号処理におけるシームレスなクロスデータセット転送の課題に触発され,JEPA(Joint Embedding Predictive Architectures)の利用に関する探索的研究を行う。
本稿では、新しい領域固有の空間ブロックマスキング戦略と、下流分類のための3つの新しいアーキテクチャを含む、脳波記録を表現するためのSignal-JEPAを紹介する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:30:12 GMT)
SAM-Lightening: A Lightweight Segment Anything Model with Dilated Flash Attention to Achieve 30 times Acceleration [6.5] Segment Anything Model (SAM)は、ゼロショットの一般化能力のためにセグメンテーションタスクに大きな注目を集めている。
我々はSAMの亜種であるSAM-Lighteningを紹介し、Dilated Flash Attentionと呼ばれる再設計されたアテンション機構を特徴としている。
COCOとLVISの実験により、SAM-Lighteningは実行時の効率とセグメンテーション精度の両方において最先端の手法よりも大幅に優れていることが明らかになった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:30:17 GMT)
Improving Neural Radiance Field using Near-Surface Sampling with Point Cloud Generation [6.5] 本稿では,NeRFのレンダリング品質を向上させるため,表面近傍のサンプリングフレームワークを提案する。
新たな視点の深度情報を得るために,3次元点雲生成法と点雲から投影された深度を簡易に精錬する方法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:44:59 GMT)
Circle Representation for Medical Instance Object Segmentation [6.5] 球状医療オブジェクトをインスタンスレベルでセグメント化するための円輪郭変形を利用した,単純なエンドツーエンドセグメンテーション手法であるCircleSnakeを紹介する。
病理画像における糸球体、核、好酸球の検出などの実用化において、CircleSnakeは優れた性能と回転不変性を示した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:25:41 GMT)
What is Wrong with End-to-End Learning for Phase Retrieval? [6.5] このような問題を解決するために,データ駆動型ディープラーニングアプローチを用いることで,フォワードモデルの対称性が学習困難を引き起こすことを示す。
学習前にトレーニングセット、すなわち対称性の破れを前処理することで、それらを克服する方法を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:01:53 GMT)
Value of Assistance for Grasping [6.5] 本研究では,特定の観察がロボットのタスク完了能力に与える影響を評価する尺度を提案する。
シミュレーションおよび実世界の協調的把握設定における提案手法の評価を行った。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:35:28 GMT)
Efficient and Privacy-Preserving Federated Learning based on Full Homomorphic Encryption [6.4] 本稿では,同相暗号技術を用いた新しいフェデレーション学習手法を提案する。
従来の水平・垂直連携型学習方式と比較して, 安全性, 効率, 実用性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:13:09 GMT)
MLVICX: Multi-Level Variance-Covariance Exploration for Chest X-ray Self-Supervised Representation Learning [6.4] MLVICXは、胸部X線画像からの埋め込みの形でリッチな表現をキャプチャするアプローチである。
自己教師付き胸部X線表現学習におけるMLVICXの性能を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:19:37 GMT)
BraSyn 2023 challenge: Missing MRI synthesis and the effect of different learning objectives [6.4] この研究は、2023年の脳腫瘍(BraTS)チャレンジの一環として開催されたBrain Magnetic Resonance Image Synthesis for tumor (BraSyn)チャレンジに対処する。
この課題では、研究者は、他の利用可能なシーケンスが与えられたら、欠落した磁気共鳴画像シーケンスを合成して、画像シーケンスの完全なセットで訓練された腫瘍セグメンテーションパイプラインを促進するよう招待される。
この問題は、ペア画像-画像変換のフレームワーク内でのディープラーニングによって解決することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:42:20 GMT)
PAON: A New Neuron Model using Padé Approximants [6.3] 畳み込みニューラルネットワーク(CNN)は、古典的なマカロック・ピッツニューロンモデルに基づいて構築されている。
パドニューロン(パオン)と呼ばれる新しいニューロンモデルを導入し、パド近似に着想を得た。
単一画像超解像タスクにおける実験により,PadeNetsは競合するアーキテクチャよりも優れた結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:49:30 GMT)
OUCopula: Bi-Channel Multi-Label Copula-Enhanced Adapter-Based CNN for Myopia Screening Based on OU-UWF Images [6.3] 近縁超広視野撮影(UWF)による近視性検診は眼科成績に有意な影響を及ぼすと考えられた。
近年,眼科と深部学習(DL)の多分野的な研究は,主に単一眼画像を用いた疾患の分類と診断に焦点をあてている。
我々は,OU UWF Fundus image (OUCopula) を用いたCNN学習の枠組みを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:12:00 GMT)
CiMNet: Towards Joint Optimization for DNN Architecture and Configuration for Compute-In-Memory Hardware [6.3] 計算インメモリ(CiM)のための最適なサブネットワークとハードウェア構成を共同で検索するフレームワークであるCiMNetを提案する。
提案するフレームワークは、サブネットワークの性能とCiMハードウェア構成選択の間の複雑な相互作用を理解することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:25:30 GMT)
Key-point Guided Deformable Image Manipulation Using Diffusion Model [6.2] キーポイント誘導拡散確率モデル(KDM)
中間出力として光フローマップを組み込んだ2段階生成モデルを提案する。
KDMは様々なキーポイント条件付き画像合成タスクで評価される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:15:39 GMT)
Demystifying Deep Reinforcement Learning-Based Autonomous Vehicle Decision-Making [6.2] ベースラインモデルとして継続的ポリシー最適化に基づくDRLアルゴリズムを用い、オープンソースのAVシミュレーション環境にマルチヘッドアテンションフレームワークを付加する。
第1頭部の重みは隣接する車両の位置を符号化し、第2頭部は先頭車両のみに焦点を当てている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:59:13 GMT)
Adaptive LPD Radar Waveform Design with Generative Deep Learning [6.2] 本稿では,検出レーダ波形の低確率を適応的に生成する新しい学習手法を提案する。
提案手法では,検出可能性の最大90%を低減できるLPD波形を生成できると同時に,アンビグニティ関数(センシング)特性も向上する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:07:57 GMT)
Graph Neural Modeling of Network Flows [6.2] Per-Edge Weights (PEW) と呼ばれるネットワークフロー問題に対する新しいグラフ学習アーキテクチャを提案する。
PEWはグラフアテンションネットワーク上に構築され、各リンクに沿って明確にパラメータ化されたメッセージ関数を使用する。
PEWはグローバルメッセージ関数を制約するルーティング方式よりもかなりの利得が得られることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:28:39 GMT)
End-To-End Underwater Video Enhancement: Dataset and Model [6.2] 水中ビデオエンハンスメント(UVE)は、水中ビデオの可視性とフレーム品質を改善することを目的としている。
既存の手法は主に、各フレームを独立して拡張する画像強調アルゴリズムの開発に重点を置いている。
この研究は、私たちの知識に対するUVEの総合的な探索である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:24:46 GMT)
EffiPerception: an Efficient Framework for Various Perception Tasks [6.2] EffiPerceptionは、一般的な学習パターンを探求し、モジュールを増やすためのフレームワークである。
複数の知覚タスクにおいて比較的低いメモリコストで、高い精度のロバスト性を実現することができる。
EffiPerceptionは4つの検出およびセグメンテーションタスクにおいて、精度-メモリ全体のパフォーマンスが大幅に向上する可能性がある。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:22:37 GMT)
A Clustering Method with Graph Maximum Decoding Information [6.1] 本稿では,CMDIと呼ばれるグラフベースモデルにおけるデコード情報の最大化のための新しいクラスタリング手法を提案する。
CMDIは2次元構造情報理論を、グラフ構造抽出とグラフ分割という2つのフェーズからなるクラスタリングプロセスに組み込んでいる。
3つの実世界のデータセットに対する実証的な評価は、CMDIが古典的ベースライン法より優れており、より優れた復号化情報比(DI-R)を示すことを示している。
これらの結果から,デコード情報の品質と計算効率を向上させるCMDIの有効性が示され,グラフベースのクラスタリング解析において有用なツールとして位置づけられた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:18:19 GMT)
Unimodal Multi-Task Fusion for Emotional Mimicry Prediciton [6.1] 第6回ワークショップ・コンペティション・アフェクティブ・ビヘイビア・アナリティクス(Affective Behavior Analysis in the-wild)の文脈における情緒的ミミリティ・インテンシティ(EMI)推定の方法論を提案する。
我々のアプローチは、包括的なポッドキャストデータセットで事前トレーニングされたWav2Vec 2.0フレームワークを利用して、幅広いオーディオ機能を抽出する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:32:02 GMT)
QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation [6.1] 四元数を考慮した視覚舞踊合成のための四元数拡張注意ネットワーク(QEAN)を提案する。
第一に、SPEは位置情報を回転的に自己注意に埋め込み、運動シーケンスと音声シーケンスの特徴をよりよく学習する。
第2に、QRAは一連の四元数という形で3Dモーション特徴とオーディオ特徴を表現・融合し、モデルが音楽とダンスの時間的調整をよりよく学習できるようにする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:58:43 GMT)
TTT-KD: Test-Time Training for 3D Semantic Segmentation through Knowledge Distillation from Foundation Models [6.0] テストタイムトレーニング(TTT)では、事前トレーニングされたネットワークをオンザフライでのデータ分散を変更することを提案する。
本稿では,基礎モデルから知識蒸留(KD)をモデル化した3次元セマンティックセマンティックセグメンテーションのための最初のTTT手法TTT-KDを提案する。
我々は,OOD試験試料に適用した場合,列車と試験分布が類似している場合,最大13% mIoU (平均7%) ,最大45% (平均20%) を得ることができた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:41:55 GMT)
Towards Real-Time Fast Unmanned Aerial Vehicle Detection Using Dynamic Vision Sensors [6.0] 無人航空機(UAV)は民間や軍事用途で人気を集めている。
UAVの予防と検出は、機密性と安全性を保証するために重要である。
本稿では,F-UAV-D(Fast Unmanned Aerial Vehicle Detector)を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:27:58 GMT)
Human-AI collaboration is not very collaborative yet: A taxonomy of interaction patterns in AI-assisted decision making from a systematic review [6.0] 意思決定支援システムにおける人工知能の活用は、技術的進歩に不相応に焦点を合わせてきた。
人間中心の視点は、既存のプロセスとのシームレスな統合のためにAIソリューションを設計することで、この懸念を緩和しようとする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:31:05 GMT)
Advancing Quantum Software Engineering: A Vision of Hybrid Full-Stack Iterative Model [5.9] 本稿では,Quantum Software Develop-mentライフサイクルのビジョンを紹介する。
量子コンピューティングと古典コンピューティングを統合するハイブリッドフルスタック反復モデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:18:33 GMT)
From explainable to interpretable deep learning for natural language processing in healthcare: how far from reality? [5.9] XAI(eXplainable and Interpretable Artificial Intelligence)という用語は、XAIとIAIを区別するために導入された。
分析の結果,注意機構がIAIの主流であったことが判明した。
主要な課題は、ほとんどのXIAIが"グローバル"モデリングプロセスを探求していないことである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:53:33 GMT)
TrafficGPT: Breaking the Token Barrier for Efficient Long Traffic Analysis and Generation [5.8] 我々は、長いフローの分類と生成タスクに関連する複雑な課題に対処できるディープラーニングモデルであるTrafficGPTを紹介する。
TrafficGPTは、分類タスクにおいて優れたパフォーマンスを示し、最先端レベルに達する。
これらの進歩は、トラフィックフローの分類と生成タスクの両方における将来の応用を約束する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:11:22 GMT)
Learning Triangular Distribution in Visual World [5.8] 畳み込みニューラルネットワークは、ラベル分布学習を含む広汎な視覚タスクで成功している。
本研究では,特徴量とそのラベル間の数学的関連性について検討し,ラベル分布学習のための汎用的でシンプルな枠組みを提案する。
特徴とラベルの間に射影関数を構築するためのいわゆる三角分布変換(TDT)を提案し、対称的特徴差がラベルの違いを線形に反映することを保証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:03:05 GMT)
Estimation and Analysis of Slice Propagation Uncertainty in 3D Anatomy Segmentation [5.8] 3次元解剖学的セグメンテーションの監視手法は優れた性能を示すが、アノテートされたデータの可用性によって制限されることが多い。
この制限により、利用可能な無注釈データの豊富さと相まって、自己監督的なアプローチへの関心が高まっている。
スライス伝播は、スライス登録を自己監督のタスクとして活用し、最小限の監督で完全な解剖学的セグメンテーションを実現する自己監督のアプローチとして登場した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:26:19 GMT)
Local Interpretations for Explainable Natural Language Processing: A Survey [5.7] 本研究では,自然言語処理(NLP)タスクにおけるディープニューラルネットワークの解釈可能性を改善するための様々な手法について検討する。
本研究のはじめに,解釈可能性という用語の定義とその諸側面について,包括的に議論する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:29:49 GMT)
NEDS-SLAM: A Novel Neural Explicit Dense Semantic SLAM Framework using 3D Gaussian Splatting [5.7] 本稿では,3次元ガウス表現に基づく明示的DenseセマンティックSLAMシステムNEDS-SLAMを提案する。
本研究では,事前学習したセグメンテーションヘッドからの誤推定の影響を低減するために,空間一貫性のある特徴融合モデルを提案する。
我々は,高次元意味的特徴をコンパクトな3次元ガウス表現に圧縮するために,軽量エンコーダデコーダを用いる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:31:03 GMT)
Robust Overfitting Does Matter: Test-Time Adversarial Purification With FGSM [5.6] 防衛戦略は通常、特定の敵攻撃法のためにディープニューラルネットワーク(DNN)を訓練し、この種の敵攻撃に対する防御において優れた堅牢性を達成することができる。
しかしながら、不慣れな攻撃モダリティに関する評価を受けると、実証的な証拠はDNNの堅牢性の顕著な劣化を示す。
ほとんどの防衛方法は、DNNの敵の堅牢性を改善するために、クリーンな例の精度を犠牲にすることが多い。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:54:01 GMT)
Implicit Discriminative Knowledge Learning for Visible-Infrared Person Re-Identification [5.6] Visible-Infrared Person Re-identification (VI-ReID) は、横断歩行者検索の課題である。
既存の研究は主に、異なるモダリティのイメージを統一された空間に埋め込み、モダリティの共有された特徴をマイニングすることに焦点を当てている。
本稿では,モダリティ特定に含まれる暗黙的識別情報を発見・活用するために,新たなIDKLネットワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:12:45 GMT)
Deep Medial Voxels: Learned Medial Axis Approximations for Anatomical Shape Modeling [5.6] 画像量からトポロジカルな骨格を忠実に近似する半単純表現であるディープ・メディアル・ボクセルを導入する。
再現技術は,可視化と計算機シミュレーションの両方の可能性を示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:47:18 GMT)
A Unifying Generator Loss Function for Generative Adversarial Networks [5.6] 二重目的生成逆数ネットワーク(GAN)に対する$alpha$-parametrized generator loss関数の導入
ジェネレータ損失関数は対称クラス確率推定型関数である$mathcalL_alpha$に基づいており、その結果のGANシステムは$mathcalL_alpha$-GANと呼ばれる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:03:52 GMT)
DCVNet: Dilated Cost Volume Networks for Fast Optical Flow [5.5] コストボリュームは、2つの入力画像間での対応の類似性を捉え、最先端の光学的流れのアプローチにおいて重要な要素である。
そこで本研究では,小型・大規模の変位を同時に捉えるために,異なる拡張係数を持つコストボリュームを構築する方法を提案する。
スキップ接続を有するU-Netを用いて、拡張コストのボリュームを、光学的フローを得るために、可能なすべての変位の間の重みに変換する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:59:33 GMT)
Local and Regional Counterfactual Rules: Summarized and Robust Recourses [5.5] 本稿では,各観測の局所的反実律を緩やかに規定する確率的枠組みを提案する。
これらの規則は、様々な反事実的説明の要約として機能し、堅牢な論説をもたらす。
当社のメソッドはPythonパッケージとして利用可能です。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:39:00 GMT)
PARMESAN: Parameter-Free Memory Search and Transduction for Dense Prediction Tasks [5.5] 我々は,これらの課題を解決するためのステップストーンとして,記憶からトランスダクションによって分離するという考えを論じる。
本稿では,高密度予測タスクを解くためにメモリモジュールを活用するスケーラブルなトランスダクション手法であるPARMESANを提案する。
提案手法は一般的なニューラルネットワークと互換性があり、1D, 2D, 3Dグリッドベースのデータにカノニカルに転送する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:55:40 GMT)
A Comprehensive Evaluation of Augmentations for Robust OOD Self-Supervised Contrastive Phonocardiogram Representation Learning [5.4] 信号の一般化表現を学習することにより,1次元心電図(PCG)の異常を検出するための自己監督学習(SSL)を提案する。
実験により, トレーニング分布によっては, 完全に教師されたモデルの有効性が32%まで低下することを示した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:32:01 GMT)
Smooth Sensitivity for Learning Differentially-Private yet Accurate Rule Lists [5.3] Differentially-private (DP) メカニズムを機械学習アルゴリズムの設計に組み込んで、結果のモデルをプライバシリークから保護することができる。
本稿では,Giniの不純物のスムーズな感度を確立し,それを利用してDPグリードルリストアルゴリズムを提案することによって,ルールリストモデルのトレードオフを改善することを目的とする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:44:22 GMT)
Distill2Explain: Differentiable decision trees for explainable reinforcement learning in energy application controllers [5.3] 住宅セクターはエネルギー柔軟性の重要な(潜在的)源である。
そのようなタスクの潜在的制御フレームワークは、データ駆動型制御、特にモデルフリー強化学習(RL)である。
RLは、環境と対話し、データに基づいて純粋に学習し、人間の介入を最小限に抑えて、優れた制御ポリシーを学ぶ。
本稿では、微分可能な決定木を用いて、説明可能なRLポリシーを得るための新しい方法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:09:49 GMT)
GCAM: Gaussian and causal-attention model of food fine-grained recognition [5.2] 本稿では,細粒度物体認識のためのガウス的・因果的アテンションモデルを提案する。
不均一なデータ分布から生じるデータドリフトに対処するために、我々は反実的推論アプローチを採用する。
実験により,GCAMはETH-FOOD101, UECFOOD256, Vireo-FOOD172データセットの最先端手法を上回ることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:39:54 GMT)
Safety Cases: How to Justify the Safety of Advanced AI Systems [5.1] AIシステムがより高度化するにつれ、企業や規制機関は、トレーニングとデプロイが安全かどうかという難しい決定を下すことになる。
安全事例を整理する枠組みを提案し,安全性を正当化するための議論の4つのカテゴリについて論じる。
我々は、各カテゴリにおける議論の具体的な例を評価し、AIシステムが安全にデプロイ可能であることを正当化するために、議論をどのように組み合わせるかを概説する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:11:46 GMT)
Large language models in 6G security: challenges and opportunities [5.1] 我々は,潜在的敵の立場から,Large Language Models(LLMs)のセキュリティ面に注目した。
これには包括的脅威分類の開発が含まれ、様々な敵の行動を分類する。
また、我々の研究は、防衛チーム(ブルーチームとしても知られる)によるサイバーセキュリティ活動にLLMがどのように統合されるかに焦点を当てます。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:39:34 GMT)
Modality-Agnostic fMRI Decoding of Vision and Language [4.8] 我々は、画像とテキスト記述の両方を見ている人々の大規模なfMRIデータセット(被験者あたり8,500トライアル)を導入し、使用します。
この新しいデータセットは、被験者が見ている刺激を予測できる単一のデコーダである、モダリティに依存しないデコーダの開発を可能にする。
我々はこのようなデコーダをトレーニングし、脳の信号を様々な利用可能な視覚、言語、マルチモーダル(ビジョン+言語)モデルから刺激表現にマッピングする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:30:03 GMT)
Parasitic Circus:On the Feasibility of Golden Free PCB Verification [4.8] 我々は,PCBコンポーネントの寄生インピーダンスが,検証に成功するための主要な役割を担っていることを示す。
得られた結果と統計値を用いて,シミュレーションと測定から得られたシグネチャの差を緩和できることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:04:02 GMT)
Exploring Multi-modal Neural Scene Representations With Applications on Thermal Imaging [4.8] 我々は、RGB以外の2次モードをNeRFに組み込むための4つの戦略を提案する。
放射能の点でRGBと大きく異なるため,熱画像は第2のモダリティとして選択した。
以上の結果から,第2分枝をNeRFに付加することは熱画像の新規なビュー合成に最適であり,かつRGBに有意な結果をもたらすことが判明した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:18:55 GMT)
CRISP: Hybrid Structured Sparsity for Class-aware Model Pruning [4.8] 機械学習パイプラインは、幅広いクラスにわたる正確性を達成するために、普遍的なモデルを訓練することが多い。
この格差は、ユーザー固有のクラスにフォーカスするようにモデルを調整することで、計算効率を高める機会を提供する。
細粒度N:M構造と粗粒度ブロックの粒度を組み合わせた新しい刈り込みフレームワークCRISPを提案する。
我々のプルーニング戦略は、勾配に基づくクラス対応サリエンシスコアによって導かれ、ユーザ固有のクラスに不可欠なウェイトを維持できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:15:48 GMT)
Relational Representation Learning Network for Cross-Spectral Image Patch Matching [4.6] 軽量表現学習ネットワーク(RRL-Net)の構築
具体的には、固有の個々の特徴を完全に特徴付けるオートエンコーダを構築する。
さらに個々の特徴を深く掘り下げるために、軽量な多次元グローバル・ローカライズ・アテンション(MGLA)モジュールが構築されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:59:35 GMT)
Visualization for Trust in Machine Learning Revisited: The State of the Field in 2023 [4.6] 可視化手法を解説したピアレビュー論文を収集し、以前に確立された分類スキーマに基づいて分類し、オンラインサーベイブラウザで542のテクニックを収集した。
この結果から,過去3年間の機械学習モデルの信頼性向上に向けて,可視化技術の急速な発展傾向が示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:42:27 GMT)
Explainable Reinforcement Learning-based Home Energy Management Systems using Differentiable Decision Trees [4.6] 住宅セクターは、太陽光発電、家庭用バッテリー、EVの採用の増加により、柔軟性を損なう主要かつ未解決の源となっている。
微分可能な決定木を用いた強化学習に基づくアプローチを提案する。
このアプローチは、データ駆動強化学習のスケーラビリティと(微分可能)決定木の説明可能性を統合する。
概念実証として,家庭内エネルギー管理問題を用いて提案手法を解析し,その性能を市販のルールベースベースラインと標準ニューラルネットワークベースRLコントローラと比較した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:40:41 GMT)
X-LLaVA: Optimizing Bilingual Large Vision-Language Alignment [4.6] 91Kの英語-韓国-中国の多言語・マルチモーダルトレーニングデータセットを作成します。
韓国語と英語の両方で優れた性能を示すバイリンガル・マルチモーダル・モデルを開発した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:14:47 GMT)
Reasoning Abilities of Large Language Models: In-Depth Analysis on the Abstraction and Reasoning Corpus [4.6] 大規模言語モデルの推論と文脈理解能力を評価するための新しい手法を提案する。
抽象・推論コーパスデータセットを用いて,大規模言語モデルの推論と文脈理解能力を評価する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:50:50 GMT)
Shifting the Lens: Detecting Malware in npm Ecosystem with Large Language Models [4.5] レポートは、世界中の組織の45%が2025年までにソフトウェアサプライチェーン攻撃に遭遇すると予想している。
現在のマルウェア検出技術は、良性パッケージとマルウェアパッケージをフィルタリングすることで、手動によるレビュープロセスを支援する。
SocketAI Scannerは,Thoughtの反復自己修正とゼロショットロールプレイチェーンを用いた多段階意思決定マルウェア検出ワークフローである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:10:12 GMT)
Interpretable statistical representations of neural population dynamics and geometry [4.5] 我々は、非線形力学のデータ駆動表現のための、完全に教師なしの幾何学的深層学習フレームワークMARBLEを紹介する。
我々は,MARBLEがグローバルなシステム変数の観点から高い解釈が可能な潜在表現を推論可能であることを示す。
また、MARBLE表現はニューラルネットワークや動物間で一貫性があることを示し、認知計算の比較や普遍デコーダの訓練に使用することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:02:17 GMT)
ChildCI Framework: Analysis of Motor and Cognitive Development in Children-Computer Interaction for Age Detection [4.4] 本稿では、最近のChildCIフレームワークで提案されている異なるテストの包括的な分析について述べる。
本稿では,子どもがモバイルデバイスと対話する際の運動・認知的側面に関連する,100以上のグローバルな特徴について述べる。
93%以上の精度は、公開されているChildCIdb_v1データベースを使って達成される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:22:51 GMT)
Safety Implications of Explainable Artificial Intelligence in End-to-End Autonomous Driving [4.2] 現代の学習手法によるリアルタイム意思決定における解釈可能性の欠如は、ユーザの信頼を阻害し、そのような車両の広範な展開と商業化を阻害する。
したがって、車両自動化の安全性を実現するためには、エンドツーエンドの自動運転における説明責任が不可欠である。
我々は、自動運転における安全性と最先端の説明可能性の確立について再考し、自動運転の安全性向上における説明の重要な役割を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:49:20 GMT)
Enhancing Hokkien Dual Translation by Exploring and Standardizing of Four Writing Systems [4.2] 台湾のホッキエン漢と伝統的なマンダリン中国語の正書法的類似性を活用するために,従来のマンダリン中国語に特化して訓練済みのLLaMA2-7Bモデルを用いる。
そして、翻訳モデルを用いて、台湾のすべての法キエン文字体系を北キエン漢に標準化し、さらなる性能向上を実現した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:56:13 GMT)
Sound Event Detection and Localization with Distance Estimation [4.1] 3D SELDは、音事象とその対応方向(DOA)を識別する複合作業である
本研究では,SELDコア内に距離推定を統合する2つの方法について検討する。
以上の結果から,音事象検出やDOA推定における性能劣化を伴わずに3D SELDを行うことが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:34:16 GMT)
E2F-Net: Eyes-to-Face Inpainting via StyleGAN Latent Space [4.1] 我々は、E2F-Net(Eyes-to-Face Network)と呼ばれるGANベースのモデルを提案する。
提案手法は,2つの専用エンコーダを用いて眼周囲領域から同一性および非同一性の特徴を抽出する。
提案手法は,現在の手法を超越して,高品質な顔全体の再構築に成功していることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:11:34 GMT)
Gun Culture in Fringe Social Media [4.1] 我々は4chanの武器盤/k/で銃文化を探求する。
様々な定量的手法を用いて,/k/上の4M以上のポストについて検討した。
以上の結果から, /k/ のガンカルチャーは比較的多種多様なトピックをカバーすることが示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:44:54 GMT)
A Taxonomy of Testable HTML5 Canvas Issues [4.0] HTML5 canvas>は、Webアプリケーションで高品質なグラフィックを表示するために広く使われている。
そこで本論文では, キャンバスの今後の研究を支援するために, テスト可能なキャンバスの分類について述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:06:50 GMT)
Posterior Uncertainty Quantification in Neural Networks using Data Augmentation [4.0] 深層アンサンブルは,既存の観測結果にのみ,将来のデータがサポートされることを前提として,基本的に不特定モデルクラスであることを示す。
一般的なデータ拡張手法を用いて,より現実的な予測分布を構築する手法であるMixupMPを提案する。
実験により,MixupMPは様々な画像分類データセットにおいて,優れた予測性能と不確かさの定量化を実現することが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:46:07 GMT)
Boosting Continuous Emotion Recognition with Self-Pretraining using Masked Autoencoders, Temporal Convolutional Networks, and Transformers [4.0] 本研究では,Valence-Arousal (VA) Estimation Challenge, Expression (Expr) Classification Challenge, Action Unit (AU) Detection Challengeに取り組む。
本研究は,継続的な感情認識を改善するための新しいアプローチを提唱する。
我々は、顔データセット上でMasked Autoencoders(MAE)を事前トレーニングし、その後、式(Expr)ラベルを付加したaff-wild2データセットを微調整することで、これを実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:28:01 GMT)
Time Series Compression using Quaternion Valued Neural Networks and Quaternion Backpropagation [3.9] 本稿では,長い時系列をデータセグメントに分割する4元時間時系列圧縮手法を提案する。
我々は,これらのチャンクのミン,マックス,平均,標準偏差を代表的特徴として抽出し,四元数でカプセル化する。
この時系列は、四重項値ニューラルネットワーク層を用いて処理される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:22:11 GMT)
Compiler generated feedback for Large Language Models [3.9] 我々は,LLVMアセンブリのコードサイズを最適化するために,コンパイラフィードバックを備えたLarge Language Modelを用いたコンパイラ最適化において,新しいパラダイムを導入する。
このモデルは、最適化されていないLLVM IRを入力として取り、最適化されたIR、最適な最適化パス、最適化されていないIRと最適化されたIRの両方の命令数を生成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:25:13 GMT)
Evaluating Named Entity Recognition: Comparative Analysis of Mono- and Multilingual Transformer Models on Brazilian Corporate Earnings Call Transcriptions [3.8] 本研究は,ブラジル銀行の決算報告書から抽出したポルトガル語テキストに焦点をあてる。
384文字からなる包括的データセットをキュレートすることにより、ポルトガル語で訓練された単言語モデルの性能を評価する。
以上の結果から,BERTベースモデルはT5ベースモデルより一貫して優れていた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:53:56 GMT)
(Almost-)Quantum Bell Inequalities and Device-Independent Applications [3.7] 量子ベルの不等式の導出による量子相関の研究は、DI情報処理に重要な応用をもたらす。
我々は、(ほぼ)量子ベルの不等式(英語版)のファミリーを提示し、3つの基礎的およびDI的応用を強調した。
これまでに知られている量子境界の最も正確な特徴を提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:18:55 GMT)
Deep learning automates Cobb angle measurement compared with multi-expert observers [3.7] コブ角 (Cobb angle) は、傾斜した椎骨間の曲率を測定する、広く使われているスコリシス定量法である。
我々は、Cobb角を正確に測定し、これらの測定をはっきりと視覚化する完全に自動化されたソフトウェアを作成しました。
このソフトウェアは、ディープニューラルネットワークに基づく脊髄領域の検出とセグメンテーション、脊髄中心の同定を統合し、最も傾いた脊椎をピンポイントする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:43:45 GMT)
Beyond IID weights: sparse and low-rank deep Neural Networks are also Gaussian Processes [3.7] 我々は Matthews らの証明を、より大きな初期重み分布のクラスに拡張する。
また,PSEUDO-IID分布を用いた完全連結・畳み込みネットワークは,その分散にほぼ等価であることを示す。
この結果を用いて、ニューラルネットワークの幅広いクラスに対してEdge-of-Chaosを識別し、トレーニングを強化するために臨界度で調整することができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:28:44 GMT)
Coarsening of chiral domains in itinerant electron magnets: A machine learning force field approach [3.6] 三角格子内のキラル磁区を安定化する複雑な電子-スピン相互作用をモデル化するためのスケーラブルな機械学習フレームワークを提案する。
非保存イジング次数体に対する予想されるアレン・カーンのドメイン成長則とは対照的に,キラル領域の特徴的サイズは時間とともに線形に増加する。
我々の研究は、イテナント磁石の大規模スピンダイナミクスに対するMLモデルの有望な可能性も示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:07:46 GMT)
Hidden in Plain Sight: Undetectable Adversarial Bias Attacks on Vulnerable Patient Populations [3.6] 本研究では,階層的に標的としたラベル中毒攻撃は,深層学習(DL)モデルにおいて検出不能な診断バイアスをもたらす可能性があることを示す。
以上の結果から, 逆バイアス攻撃は, 外部データセットを用いて評価した場合においても, 予測バイアスを伝播する有意なDLモデルをもたらすことが示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:19:33 GMT)
Universal fluctuations and noise learning from Hilbert-space ergodicity [3.6] 近年、エルゴード性という量子概念、すなわち孤立した大域量子状態が利用可能な状態空間を均一に探索することが提案されている。
ここでは、実験的なRydberg量子シミュレータと様々な数値モデルを用いて、このプロセスのシグネチャを観察する。
次に、外部環境と騒々しく相互作用するオープンシステムについて考察する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:09:05 GMT)
MARVEL: Multi-Agent Reinforcement-Learning for Large-Scale Variable Speed Limits [3.5] 可変速度制限(VSL)制御は、世界展開において有望な高速道路交通管理戦略として機能する。
これまでのVSL制御アルゴリズムの多くはルールベースであり、様々な複雑なトラフィックシナリオ下での一般化性に欠けていた。
実環境に配置したハイウェイ廊下における大規模VSL制御のための新しいフレームワークであるMARVELを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:04:18 GMT)
Gridless 2D Recovery of Lines using the Sliding Frank-Wolfe Algorithm [3.4] Sliding Frank-Wolfeアルゴリズムを利用して、劣化画像のラインリカバリの課題に対処する新しい手法を提案する。
スペクトル画像における線分分解と線分の隆起検出の領域内での線分検出タスクに適した2つの異なるモデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:45:27 GMT)
A Maximum Entropy Principle in Deep Thermalization and in Hilbert-Space Ergodicity [3.4] 量子多体系において自然に現れる純粋状態のアンサンブルによって示される普遍統計特性について報告する。
この結果はヒルベルト空間エルゴード性の概念を時間非依存のハミルトン力学と深熱化に一般化する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:09:04 GMT)
Ground-state chiral current via periodic modulation [3.4] 我々は、量子場と古典場によって駆動される3レベル原子に基づく基底状態キラル電流をエミュレートするために、光子を介するジアロシンスキー-モリヤ相互作用を設計する。
我々は、2レベル系の効果的なジアロシンスキー-モリヤ相互作用ハミルトニアンを導出するために断熱除去技術を用いる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:26:37 GMT)
A Disease Labeler for Chinese Chest X-Ray Report Generation [3.4] 中国の胸部X線レポートデータセットの不足は、中国の胸部X線レポートを生成する技術の開発を妨げている。
本研究は,中国の胸部X線レポート作成に適した疾患ラベル作成手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:10:33 GMT)
BACQ - Application-oriented Benchmarks for Quantum Computing [3.3] BACQプロジェクトは、量子コンピューティングのためのアプリケーション指向ベンチマークに特化している。
コンソーシアム収集THALES、EVIDEN、Atosビジネス、CEA、CNRS、TERATEC、LNEは、参照のパフォーマンス評価基準を確立することを目的としている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:41:02 GMT)
Single-Atom Amplification Assisted by Multiple Sideband Interference in 1D Waveguide QED Systems [3.3] 1次元導波路量子電磁力学系における複数のRabiサイドバンドコヒーレンスから生じる信号増幅について検討した。
文献上より微細なスペクトルを呈し, 特定の共振条件下での信号増幅について検討した。
特に,本研究の結果は,集団逆転の有無がなくても,集団逆転や複数のサイドバンドの構成的干渉によって増幅が生じる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:28:55 GMT)
High-energy physics image classification: A Survey of Jet Applications [3.1] 高エネルギー物理実験では、機械学習(ML)とその専門分野であるディープラーニング(DL)が統合されている。
この調査は、様々なDLアプローチの範囲内で、これらの応用を包括的に評価する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:33:29 GMT)
Leveraging Large Language Models to Extract Information on Substance Use Disorder Severity from Clinical Notes: A Zero-shot Learning Approach [3.1] 物質利用障害 (SUD) は、健康や社会に有害な影響があるとして大きな懸念を抱いている。
国際疾患分類(ICD-10)のような既存の診断符号化システムは、特定の診断のための粒度を欠いている。
従来の自然言語処理(NLP)手法は、このような多様な臨床言語を正確に解析する際の限界に直面している。
本研究では,臨床ノートから重症度関連情報を抽出するためのLarge Language Models (LLMs) の応用について検討した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:39:03 GMT)
Towards understanding the nature of direct functional connectivity in visual brain network [3.0] 様々な種類の視覚脳ネットワーク(VBN)を探索するために、fMRI時系列(TS)の包括的解析を行った。
画像複雑性特異的なVBN分類では、XGBoostは正に相関したVBNに対して86.5%から91.5%の範囲で平均精度を得る。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:03:07 GMT)
Nanoscale Casimir force softening originated from surface electrons [2.9] 表面電子は材料や結晶面に応じてナノスケールカシミール力を増強または抑制できることを示す。
本研究は, 表面電子と真空場との相互作用に注目し, ナノスケール変動型問題の理論的および実験的研究のレシピを提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:00:53 GMT)
ForzaETH Race Stack - Scaled Autonomous Head-to-Head Racing on Fully Commercial off-the-Shelf Hardware [2.9] ForzaETH Race Stackは、1:10スケールのヘッド・ツー・ヘッド・レーシング・コンペティションであるF1TENTH向けに設計された自動運転レーシングソフトウェアプラットフォームである。
市販のオフザシェルフハードウェアを使用することで、レプリケーションを簡単にする。
このスタックは、公式のF1TENTH国際大会で複数回優勝することで、この分野における有効性、堅牢性、適応性を示した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:42:06 GMT)
Towards Enabling FAIR Dataspaces Using Large Language Models [2.7] セマンティックWeb技術を活用することは、データ空間をFAIRにするのに役立つが、その複雑さはデータ空間の採用に重大な課題をもたらす。
LLM(Large Language Models)の出現は、これらのモデルがFAIRデータ空間の採用をサポートするにはどうすればよいのかという疑問を提起する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:46:00 GMT)
Invisible Backdoor Attack Through Singular Value Decomposition [2.7] バックドア攻撃はディープニューラルネットワーク(DNN)に深刻なセキュリティ脅威をもたらす
トリガーを知覚しにくく、知覚できないものにするため、様々な目に見えないバックドア攻撃が提案されている。
本稿では,DEBAと呼ばれる目に見えないバックドア攻撃を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:25:12 GMT)
3R-INN: How to be climate friendly while consuming/delivering videos? [2.7] 3R-INNは3つのタスクを同時に実行します。高解像度のグレーン画像が与えられたら、それを低解像度にスケールし、フィルムグレーンを除去し、表示時に消費電力を削減します。
3R-INNはまた、その可逆性と高周波の歪みにより、高解像度のグレーン画像またはグレーンフリー版を復元する可能性も提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:14:30 GMT)
Unsupervised End-to-End Training with a Self-Defined Bio-Inspired Target [2.7] 現在の教師なし学習法はエンドツーエンドの訓練に依存している。
ネットワークの最終層でWinner-Take-All (WTA) の選択性を利用する'self-defined target'を導入する。
このアプローチはフレームワークに依存しず、グローバル(バックプロパゲーション)とローカル(平衡伝播)の学習ルールの両方と互換性があり、MNISTデータセット上で97.6%のテスト精度を達成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:14:28 GMT)
Efficient preparation of the AKLT State with Measurement-based Imaginary Time Evolution [2.6] 本稿では,Affleck-Lieb-Kennedy-Tasakiモデルの基底状態を決定論的に生成する手法を提案する。
MITEアプローチを用いて効率的に調製できることが示される。
この手順は、キュービットベースのシミュレータと互換性があることが示される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:47:16 GMT)
Visualizing Progress in Broadening Participation in Computing: The Value of Context [2.6] 米国内でのコンピューティングの表現に関する懸念は、参加を広げるために多くの活動を促している。
コンピューティングへの参加拡大に関する文献の多数は、性別や人種・民族に関するデータを報告し、学生の交叉アイデンティティに関するデータを省略している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:12:02 GMT)
Financial Table Extraction in Image Documents [2.6] テーブルの抽出は、金融サービスにおいて長年にわたり広範囲にわたる問題であった。
画像セグメンテーション、OCR、シーケンスモデリングのためのディープラーニングの進歩は、印象的な結果を得るために必要な重み付けを提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:46:35 GMT)
Cut Facets and Cube Facets of Lifted Multicut Polytopes [2.5] 線形プログラミングに基づく厳密なアルゴリズムは、持ち上げられたマルチカットポリトープを理解する必要がある。
必要かつ十分かつ効率的に決定可能な条件を確立することで、最初の質問に答える。
カット不等式のファセット定義性を決定することはNPハードであることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:19:40 GMT)
BCQQ: Batch-Constraint Quantum Q-Learning with Cyclic Data Re-uploading [2.5] 量子コンピューティングの最近の進歩は、量子モデルは古典的手法に比べて訓練に必要なデータが少ないことを示唆している。
離散バッチ制約深部Q-ラーニングアルゴリズムにおいて,VQCを関数近似器として利用するバッチRLアルゴリズムを提案する。
我々は,OpenAI CartPole環境におけるアルゴリズムの有効性を評価し,その性能を従来のニューラルネットワークに基づく離散BCQと比較した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:02:00 GMT)
Safety Analysis of Autonomous Railway Systems: An Introduction to the SACRED Methodology [2.5] 本稿では,自律システムの初期安全ケースを作成するための安全手法であるSACREDを紹介する。
SACREDの開発は、ベルリンで提案されたGoA-4ライトレールシステムによって動機付けられている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:12:19 GMT)
Privacy Protection in MRI Scans Using 3D Masked Autoencoders [2.5] データ匿名化と非識別化は、個人の個人情報のプライバシーと機密性の確保に関係している。
CP-MAE(CP-MAE)を提案する。
私たちの方法では、解像度の高忠実度スキャンを最大2563ドルまで合成することができます。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:27:01 GMT)
Can LLM-Augmented autonomous agents cooperate?, An evaluation of their cooperative capabilities through Melting Pot [2.4] 本稿では,よく知られたメルチンポット環境を用いた大規模言語モデル拡張自律エージェント(LAA)の協調機能について検討する。
研究のコントリビューションには、LLMにメルティングポットゲームシナリオを適用するための抽象化レイヤが含まれている。
Melting Potの"Commons Harvest"ゲームに関連するメトリクスのセットを用いた協調機能の評価。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:13:43 GMT)
Probabilistic Calibration by Design for Neural Network Regression [2.3] 本稿では,量子校正トレーニングと呼ばれる新しいエンドツーエンドモデルトレーニング手法を提案する。
57の回帰データセットを含む大規模実験において,本手法の性能を実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:04:33 GMT)
Genuine N-partite entanglement in Schwarzschild-de Sitter black hole spacetime [2.2] シュワルツシルト・ド・シッター時空における質量を持たないディラック場の真のN-粒子絡みについて検討する。
真のN粒子の絡み合いはブラックホールの質量の減少とともに単調に減少する。
真のN-粒子の絡み合いが宇宙定数の非単調関数であることは興味深い。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:50:42 GMT)
Inverse Problems with Learned Forward Operators [2.2] 本章は、2つの異なるパラダイムに従う学習前方演算子による逆問題における再構成手法についてレビューする。
射影による正規化の枠組みは、再構成を見つけるために使われる。
両方のメソッドは、フォワード演算子だけでなく、アジョイントのためにもトレーニングデータを必要とする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:28:00 GMT)
Variable Hyperparameterized Gaussian Kernel using Displaced Squeezed Vacuum State [2.1] 多モードコヒーレント状態は、ハイパーパラメータの定数値を持つガウス核を生成することができる。
この定数ハイパーパラメータは、複雑な学習問題に適用されるときにガウスカーネルの適用を制限する。
マルチモード変位真空状態の可変ハイパーパラメータ化カーネルを実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:25:56 GMT)
Approaching Test Time Augmentation in the Context of Uncertainty Calibration for Deep Neural Networks [2.1] 画像分類のための深部モデルの不確実性校正を改善するため,M-ATTAとV-ATTAという新しい手法を提案する。
ナ適応重み付けシステムを利用することで、M/V-ATTAはモデルの精度に影響を与えることなく不確実性校正を改善する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:52:58 GMT)
Understanding Addition in Transformers [2.1] 本稿では,n桁整数加算を行うために訓練された1層トランスフォーマーモデルの包括的解析を行う。
提案手法は,各桁を対象とする並列ストリームに分割し,各桁の異なる位置に合わせて最適化されたアルゴリズムを用いることを示唆している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:58:41 GMT)
Attention-based Reinforcement Learning for Combinatorial Optimization: Application to Job Shop Scheduling Problem [2.0] 本研究では,ジョブショップスケジューリング問題に特化して設計された,革新的な注意力に基づく強化学習手法を提案する。
この研究の鍵となる発見は、提案手法で訓練を受けた学習者が、初期訓練セットに含まれない大規模問題に再利用できることである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:57:22 GMT)
EmpowerAbility: A portal for employment & scholarships for differently-abled [2.0] このプロジェクトは、多様な能力を持つ個人に権限を与える仕事と奨学金のポータルである。
成功物語、ユーザ中心の機能、実践的な機会を通じて、レジリエンスと傾倒を育みます。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:26:26 GMT)
Multi-GPU-Enabled Hybrid Quantum-Classical Workflow in Quantum-HPC Middleware: Applications in Quantum Simulations [2.0] 本研究では,革新的な分散型量子古典量子アーキテクチャを提案する。
最先端の量子ソフトウェアフレームワークを高性能な古典コンピューティングリソースと統合する。
物質と凝縮物質物理学の量子シミュレーションにおける課題に対処する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:54:10 GMT)
Postselection technique for optical Quantum Key Distribution with improved de Finetti reductions [2.0] 我々は,光量子鍵分布プロトコルにポストセレクション手法を厳格に適用するために,複数のステップを踏襲する。
本稿では, ポストセレクション法を厳密な数学的基礎の上に配置し, ポストセレクション法における技術的欠陥を修正した。
提案手法の適用性は,デ・フィネッティ・リダクション(デ・フィネッティ・リダクション,デ・フィネッティ・リダクション,デ・フィネッティ・リダクション)を用いて拡張する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:01:43 GMT)
A Theoretical and Practical Framework for Evaluating Uncertainty Calibration in Object Detection [1.9] 本研究では,不確実性校正の文脈において,物体検出システムを評価するための理論的,実践的な枠組みを提案する。
提案した不確実性校正指標のロバスト性は, 一連の代表的な実験を通して示される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:24:34 GMT)
QAOA with random and subgraph phase operators [1.9] カスタム位相演算子と呼ばれる通常のコスト以外のハミルトニアンの使用がQAOAの性能に与える影響について検討する。
これらのカスタム位相演算子のいくつかは、元のアルゴリズムの実装よりも高い近似比を達成可能であることを数値的に示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:00:09 GMT)
RoGUENeRF: A Robust Geometry-Consistent Universal Enhancer for NeRF [1.8] 2Dエンハンサーは、いくつかの詳細を回復するために事前訓練することができるが、シーン幾何学には依存しない。
既存の3Dエンハンサーは、近隣のトレーニング画像から、一般化可能な方法で詳細を転送することができる。
両パラダイムの長所を生かしたニューラルレンダリングエンハンサーであるRoGUENeRFを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:11:42 GMT)
Advancing Neuromorphic Computing: Mixed-Signal Design Techniques Leveraging Brain Code Units and Fundamental Code Units [1.8] 本稿では,脳コードユニット(BCU)と基本コードユニット(FCU)を革新的に統合した,画期的なデジタルニューロモルフィックアーキテクチャを提案する。
本研究は,ニューロモルフィックシステムの計算効率,精度,適応性の向上に重点を置いている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:33:56 GMT)
Is It Really You Who Forgot the Password? When Account Recovery Meets Risk-Based Authentication [1.8] リスクベースの認証(RBA)は、ユーザアカウントを不正な乗っ取りから保護するために用いられる。
最近の攻撃で認証プロセスの他の部分、特にアカウント回復機能に脆弱性が見つかった。
本研究は,野生におけるリスクベース会計回復(RBAR)を調査するための最初の研究である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:55:24 GMT)
From Words and Exercises to Wellness: Farsi Chatbot for Self-Attachment Technique [1.8] 私たちはFarsiでセルフアタッチメント(SAT)を通じてユーザを誘導する音声対応ロボットを開発した。
6000以上の発話のデータセットを収集し、ユーザー感情を12クラスに分類する新しい感情分析モジュールを開発し、精度は92%以上である。
当社のプラットフォームは,ほとんどのユーザ(75%),72%がインタラクションの後に気分が良くなり,74%がSAT Teacherのパフォーマンスに満足していた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:08:31 GMT)
LOOPer: A Learned Automatic Code Optimizer For Polyhedral Compilers [1.8] ディープラーニングに基づくコストモデルを用いた,最初の多面体自動スケジューリングシステムである LOOPer を紹介する。
大規模なアフィン変換の探索をサポートし、多面体変換の複雑な配列を適用できる。
また、複数のループネストと長方形および非矩形反復領域を持つプログラムの最適化もサポートする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:22:31 GMT)
DCEM-PINNs: A deep complementary energy method for solid mechanics [1.7] 本稿では,最小相補エネルギーの原理に基づくDCEM(Deep complementary energy method)を提案する。
本稿では,Prandtl と Airy の応力関数を用いて数値計算を行い,既存の PINN と DEM のアルゴリズムとの比較を行った。
以上の結果から,DCEMはDEMよりも応力精度と効率が優れていた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:53:32 GMT)
Prioritized Semantic Learning for Zero-shot Instance Navigation [1.7] 我々はゼロショットのインスタンスナビゲーションについて研究し、エージェントはトレーニングにオブジェクトアノテーションを使わずに特定のオブジェクトにナビゲートする。
本稿では,ナビゲーションエージェントのセマンティック理解能力を向上させるために,優先度付き意味学習(PSL)手法を提案する。
我々のPSLエージェントは、0ショットのObjectNavにおいて、0ショットのObjectNavを66%上回り、新しいInstanceNavタスクよりも優れている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:45:50 GMT)
Effect of Leaders Voice on Financial Market: An Empirical Deep Learning Expedition on NASDAQ, NSE, and Beyond [1.7] 異なる分野のリーダーのTwitterハンドルのNLP分析に基づいて、ディープラーニングに基づくモデルを提案し、金融市場のトレンドを予測する。
インドとアメリカの金融市場は、将来他の市場が取られるように、現在の作業で探索されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:19:08 GMT)
Multi-Criteria Comparison as a Method of Advancing Knowledge-Guided Machine Learning [1.7] 本稿では,AI/MLモデルの評価に適用可能な一般化可能なモデル評価手法について述べる。
本手法は,複数の科学的,理論的,実践的基準にまたがる,様々なタイプの候補モデルと構造の評価を行う。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:50:48 GMT)
On the Integration of Spectrum-Based Fault Localization Tools into IDEs [1.6] SBFLは軽量で実装が容易であるため、研究者の間で人気がある。
有効性向上を目的とした研究には、多くの可能性がある。
少数の研究用プロトタイプが利用可能である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:43:31 GMT)
Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception [1.6] 本稿では,フレームレベルの認識に弱いラベルを持つビデオベースの行動認識モデルを訓練するための新しい学習フレームワークを提案する。
弱いラベルを用いてモデルを訓練するために,新しい潜在損失関数を提案する。
また、下流フレームレベルの行動認識および検出タスクにビュー固有の潜伏埋め込みを利用するモデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:47:41 GMT)
Binary Noise for Binary Tasks: Masked Bernoulli Diffusion for Unsupervised Anomaly Detection [1.6] 本稿では,潜在ベルヌーイ拡散モデルに基づく新規かつ高速な教師なし異常検出手法を提案する。
我々は,他の拡散に基づく教師なし異常検出アルゴリズムと比較して,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:15:03 GMT)
Cobweb: An Incremental and Hierarchical Model of Human-Like Category Learning [1.5] 本研究は,Cobwebと古典的人間カテゴリー学習効果の整合性を確立するものである。
また、単一のモデル内で学習するように、Cobwebが模範とプロトタイプの両方を示す柔軟性についても検討している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:09:15 GMT)
Quantum Scissor from Exact Generalized Photon Number Statistics [1.5] 解析的に得られた分布は、様々な量子ハサミを実現するための正確なレーザー強度ウィンドウを予測することができる。
円形幾何学の重要性は、そのような量子ハサミの工学にも示される。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:33:53 GMT)
Stochastic Quantum Dynamics Stabilization: A Lyapunov-Based Control Approach with Homodyne-Mediated Filtering [1.5] 本稿では, ホモダインを媒介としたフィルタを用いたリアプノフ制御手法を提案する。
ホモダイン検出において, 漏れキャビティに結合したキュービットを安定化させる手法の有効性を実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:12:10 GMT)
Expectation Entropy as a Password Strength Metric [1.5] 期待エントロピーは、ランダムまたはランダムなパスワードの強度を推定するために適用することができる。
例えば、0.4のようなある値の「探索エントロピー」を持つことは、攻撃者がパスワードを見つけるための推測の総数の少なくとも40%を網羅的に検索しなければならないことを意味する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:03:37 GMT)
ASOP: A Sovereign and Secure Device Onboarding Protocol for Cloud-based IoT Services [1.5] ASOPは、デバイスメーカ、サプライチェーン、クラウドサービスプロバイダを盲目的に信頼することなく、IoTデバイスの主権的でセキュアなプロトコルである。
私たちのゼロトラストとヒューマン・イン・ザ・ループのアプローチは、デバイス所有者がサードパーティのインフラの恩恵を受けていないことを保証します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:45:14 GMT)
Global $\mathcal{L}^2$ minimization at uniform exponential rate via geometrically adapted gradient descent in Deep Learning [1.4] 本稿では,Deep Learning Networkにおける$mathcalL2$コスト関数の最小化に広く用いられている勾配降下流について考察する。
過度なパラメータ設定に適合するバージョンと、過度なパラメータ設定に適応するバージョンを2つ導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:51:52 GMT)
Out-of-Distribution Detection Should Use Conformal Prediction (and Vice-versa?) [1.4] コンフォーマル予測(CP)は、確率的カバレッジ保証を備えた予測セットを構築するために、非コンフォーマルスコアを使用する。
CP と OOD を併用する利点は,OOD スコアを非整合性スコアとして用いることで,その逆に適用できることが示されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:35:25 GMT)
Fair Distributed Cooperative Bandit Learning on Networks for Intelligent Internet of Things Systems (Technical Report) [1.3] 本稿では,データ収集を容易にし,公平性を考慮に入れた,インテリジェントIoTシステムのためのマルチプレイヤーマルチアームバンドモデルを提案する。
我々は,分散協調バンドレットアルゴリズムDC-ULCBを設計し,サーバが協調的にセンサを選択してデータレートを最大化し,公平性を保ちながらデータレートを最大化できるようにする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:25:59 GMT)
Routing and Scheduling in Answer Set Programming applied to Multi-Agent Path Finding: Preliminary Report [1.3] We present alternative approach to routing and schedule in Answer Set Programming (ASP)
その考え方は、アクションや流線型に付随する時間ステップではなく、部分的な順序で時間の流れを捉えることである。
これはまた、計画の長さの固定された上界の必要性を廃止する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:09:47 GMT)
Deep Regularized Compound Gaussian Network for Solving Linear Inverse Problems [1.3] 問題固有の統計的事前選択を可能にする線形逆問題に対する2つの新しいアプローチを考案する。
第1の方法は、正規化された最小二乗目的関数を最小化する反復アルゴリズムである。
第2の方法は、DR-CG-Netと呼ばれる新しいDeep regularized(DR)ニューラルネットワークで、事前情報を学習する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:35:52 GMT)
Quantum Expander Mixing Lemma and its Converse [1.2] 量子膨張器が出現し、量子情報理論で多くの用途が発見された。
古典的な拡張子混合補題はグラフ理論において中心的な役割を担い、グラフ内のエッジ分布に関する洞察を提供し、多様なネットワーク特性やアルゴリズムの分析を支援する。
本稿では,古典的拡張器混合レムマの量子アナログと,量子展開器の逆について述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:03:46 GMT)
LeTO: Learning Constrained Visuomotor Policy with Differentiable Trajectory Optimization [1.2] 本稿では,可微分軌道最適化による制約付きビジュモータポリシーの学習手法であるLeTOを紹介する。
シミュレーションでは、LeTOは最先端の模倣学習手法に匹敵する成功率を達成する。
実世界の実験では、制約クリティカルなタスクを処理するためにLeTOをデプロイしました。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:10:02 GMT)
BeyondPixels: A Comprehensive Review of the Evolution of Neural Radiance Fields [1.2] NeRF(Neural Radiance Fieldsの略)は、AIアルゴリズムを使用して2D画像から3Dオブジェクトを生成する最近のイノベーションである。
この調査は、最近のNeRFの進歩を概観し、それらのアーキテクチャ設計に従って分類する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:09:58 GMT)
Operator size growth in Lindbladian SYK [1.1] 演算子のサイズと分布を有限の$q$で計算し、解析的に大きめの$q$で計算する。
演算子サイズ成長の不確実性関係は、大きな$q$で飽和しており、散逸を伴う演算子サイズ成長の古典力学に繋がる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:12:41 GMT)
Empirical Analysis on CI/CD Pipeline Evolution in Machine Learning Projects [1.1] この研究は、機械学習(ML)ソフトウェアシステムにおいて、継続的インテグレーションとデリバリ(CI/CD)の構成がどのように進化するかについて、最初の経験的分析を提示する。
我々は508のオープンソースMLプロジェクトから収集した343のコミットを手動で分析し、CI/CD構成変更カテゴリを特定した。
我々は15,634コミットで頻繁なCI/CD構成変更パターンを識別するCI/CD構成変更クラスタリングツールを開発した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:14:38 GMT)
Efficient Training of Learning-Based Thermal Power Flow for 4th Generation District Heating Grids [1.1] 本稿では,必要な供給と需要を網羅した,十分に大規模なトレーニングデータセットを生成するための,新しい,効率的な手法を提案する。
提案手法は,供給と需要の値をサンプリングする代わりに,ジェネレータおよびコンシューマのマスフロー上のプロキシ分布からトレーニング例を生成する。
従来の格子構造をシミュレーションすることで,新しい手法により2桁のトレーニングセット生成時間を短縮できることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:31:09 GMT)
Hamiltonian-reconstruction distance as a success metric for the Variational Quantum Eigensolver [1.1] 変分量子固有解法 (VQE) は、量子シミュレーションのためのハイブリッド量子古典的アルゴリズムである。
VQEの課題は、真の基底状態と基底状態エネルギーが未知のとき、アルゴリズムの出力解が真の基底状態にどの程度近いかを知ることである。
ハミルトン再構成の最近の発展は、ハミルトン固有解問題に対する変分解の質を評価するために計量を与えることができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:28:06 GMT)
A Quantum Algorithmic Approach to Multiconfigurational Valence Bond Theory: Insights from Interpretable Circuit Design [1.0] 本研究では,解釈可能な回路設計と効果的な基本手法を組み合わせることで,多構成結合波動関数を最適化する。
選択されたモデルシステムに基づいて、これがいかに説明可能な性能をもたらすかを示す。
提案手法は, 実効ベースのサイズや, 関連回路の個々の量子資源の観点から, 関連手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:31:41 GMT)
The POLAR Traverse Dataset: A Dataset of Stereo Camera Images Simulating Traverses across Lunar Polar Terrain under Extreme Lighting Conditions [1.0] 本研究は, 直線路面を模擬した極点照明条件下での月状地形の高忠実度ステレオ対画像のデータセットを提案する。
このデータセットは、月極環境において使用するために、ステレオカメラやモノキュラーカメラの画像(例えば視覚計測など)に依存するソフトウェアアルゴリズムの開発とテストを目的としている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:07:42 GMT)
A Comparative Investigation of Compositional Syntax and Semantics in DALL-E 2 [0.9] 本研究は,幼児の理解テストにおいて,DALL-E 2が言語的指示の意味を視覚的にどのように表現するかを比較検討した。
結果,若年者(2歳)においても,DALL-E2生成画像が子どもの意味的正確性に合致する状況はみられなかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:33:51 GMT)
Normalized Validity Scores for DNNs in Regression based Eye Feature Extraction [0.9] 我々は、目覚ましい妥当性の喪失を改善することを提案する。
ランドマーク検出は, 頭部ポーズ推定, 眼球形状抽出, 瞳孔, 虹彩のセグメンテーションに広く用いられている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:12:39 GMT)
Selecting informative conformal prediction sets with false coverage rate control [0.9] コンフォーマル手法は、任意の機械学習予測器に対して有限サンプルカバレッジで結果/ラベルの予測セットを提供する。
分析者が予測ラベルセットや予測間隔を十分に小さくしたサンプルのみを情報化できるような分類設定と回帰設定の両方を考慮する。
本研究では,このような情報的共形予測セットを構築するための統一的なフレームワークを開発し,選択したサンプルの偽カバレッジ率(FCR)を制御した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:35:43 GMT)
Fusing Domain-Specific Content from Large Language Models into Knowledge Graphs for Enhanced Zero Shot Object State Classification [0.8] 本研究では,Large Language Models (LLMs) のドメイン固有情報の生成と提供における可能性について検討する。
これを実現するために、LLMは知識グラフと事前訓練されたセマンティックベクターを利用するパイプラインに統合される。
その結果,LLMをベースとした組込みと汎用的な事前学習型組込みを組み合わせることで,大幅な性能向上が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:08:44 GMT)
MedMerge: Merging Models for Effective Transfer Learning to Medical Imaging Tasks [0.8] 医用画像解析領域では、異なる初期化から始まるモデルを統合する機会がある。
異なるモデルの重みをマージする手法であるMedMergeを提案する。
統合モデルではF1スコアが最大3%向上し,大幅な性能向上が達成できることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:42:24 GMT)
Notochord: a Flexible Probabilistic Model for Real-Time MIDI Performance [0.8] Notochord は構造化事象の列の深い確率モデルである。
ポリフォニックおよびマルチトラックMIDIを生成し、10ミリ秒未満のレイテンシで入力に応答する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:35:02 GMT)
Retrieve to Explain: Evidence-driven Predictions with Language Models [0.8] Retrieve to Explain (R2E) は、ドキュメントコーパスのエビデンスに基づいた研究質問に対する回答を優先する検索ベースの言語モデルである。
R2Eは、再訓練することなく新しいエビデンスに適応し、自然言語へのテンプレート化を通じて構造化データを組み込むことができる。
本モデルは,臨床治験結果の予測において,業界標準遺伝学的アプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:37:45 GMT)
Low-overhead non-Clifford topological fault-tolerant circuits for all non-chiral abelian topological phases [0.8] 任意のアーベル非キラル位相を積極的に誤り訂正されたフォールトトレラントメモリとして実現した明示的幾何学的局所回路のファミリー。
回路は、離散的な不動点経路積分における1-形式対称性の測定から構成される。
1-形式対称固定点回路と呼ぶ位相回路の非常に一般的なクラスに対して、任意の局所雑音(非パウリノイズを含む)の下での耐故障性を証明する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:00:00 GMT)
Stochastic approach for elliptic problems in perforated domains [0.7] 科学と工学における幅広い応用は、穴埋めされた金属や空気フィルターのような穴埋めされた領域におけるPDEモデルを含む。
本稿では,ニューラルネットワークを用いたメッシュフリーアプローチを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:22:33 GMT)
Depth- and Semantics-aware Multi-modal Domain Translation: Generating 3D Panoramic Color Images from LiDAR Point Clouds [0.7] 本研究は,LiDARとカメラセンサのマルチモーダル構成によるクロスドメイン画像・画像変換のための条件生成モデルであるTITAN-Nextを提案する。
我々は、これがこの種の最初のフレームワークであり、フェールセーフなメカニズムを提供し、ターゲット画像領域で利用可能なデータを増強するなど、自動運転車に実践的な応用があると主張している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:41:45 GMT)
A tutorial on learning from preferences and choices with Gaussian Processes [0.7] このチュートリアルは、既存の文献の特定のギャップに対処する新しいGPベースのモデルを導入しながら、確立された研究の上に構築されている。
このフレームワークは、ランダムなユーティリティモデル、識別の限界、およびオブジェクトとラベルの両方に矛盾するユーティリティを持つシナリオを含む嗜好学習モデルの構築を可能にする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:40:48 GMT)
AI-Assisted Cervical Cancer Screening [0.7] 低所得国と中所得国(LMICs)の資源制約環境では、視覚検査が最も有効な頸がん検診試験である。
カメラやスマートフォンを統合するさまざまなハンドヘルドデバイスは、最近、VIA中に頚部画像をキャプチャし、遠隔医療やAIモデルによる意思決定を支援するために研究されている。
本稿では,スマートフォンをベースとしたAI支援システムを構築するためのエンド・ツー・エンドの設計プロセスについて述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:34:38 GMT)
Fuzzy Rough Choquet Distances for Classification [0.6] 本稿では,ファジィラフセットに基づく新しいチョケット距離を提案する。
提案手法は,ファジィ粗集合理論から得られる属性情報とチョーケ積分の柔軟性を組み合わせたものである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:53:48 GMT)
Covid-19 detection from CT scans using EfficientNet and Attention mechanism [0.6] 我々は,肺のCTスキャン画像から新型コロナウイルスを検出するためのディープラーニングモデルに基づくパイプラインを開発した。
当社のパイプラインは、競合データセットの検証セットにおいて、昨年のチームよりも優れています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:20:49 GMT)
End-to-end multi-modal product matching in fashion e-commerce [0.6] 業界環境では,堅牢なマルチモーダル製品マッチングシステムを提案する。
人間のループプロセスとモデルに基づく予測が組み合わさって、ほぼ完全な精度を達成できることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:12:16 GMT)
MechProNet: Machine Learning Prediction of Mechanical Properties in Metal Additive Manufacturing [0.6] 本研究では,機械的特性予測のための機械学習モデルのベンチマークフレームワークを提案する。
様々な情報源から90以上のMAM記事やデータシートから実験データセットを収集した。
本フレームワークは,MAMに特有の物理認識の成果化,調整可能なMLモデル,調整された評価指標を含む。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:32:52 GMT)
Towards the Development of a Real-Time Deepfake Audio Detection System in Communication Platforms [0.6] ディープフェイクオーディオは、音声ストリームの整合性のためにリアルタイム検出を必要とする通信プラットフォームにおいて、ますます脅威となる。
本研究では,リアルタイム通信プラットフォームにおける静的ディープフェイク音声検出モデルの適用可能性を評価する。
ResnetとLCNNアーキテクチャに基づく2つのディープフェイク音声検出モデルを実装した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:35:10 GMT)
Tight concentration inequalities for quantum adversarial setups exploiting permutation symmetry [0.5] 量子状態に対する我々の片側濃度の不等式は、置換不変量として$N$-qudit系を必要とすることを示す。
簡単な量子情報処理タスクにおいて,境界の厳密さを数値的に示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:20:46 GMT)
Ricci flow-based brain surface covariance descriptors for diagnosing Alzheimer's disease [0.5] 我々は、リッチエネルギー最適化を用いて、皮質表面から新しい共分散に基づく記述子を抽出するパイプラインを提案する。
異常な皮質脳形態計測の分析にこの新たなサインを適用することで、アルツハイマー病の診断が可能になる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:22:01 GMT)
Accelerating Matrix Factorization by Dynamic Pruning for Fast Recommendation [0.5] MF(Matrix Factorization)は、リコメンデーションシステム(RS)のための協調フィルタリングアルゴリズムである。
現在のRSではユーザ/イテムが劇的に増加しているため、MFモデルのトレーニングに要する計算の複雑さは大幅に増大している。
我々は、追加の計算資源を誘導することなく、MFを高速化するアルゴリズム手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:27:33 GMT)
N-Modal Contrastive Losses with Applications to Social Media Data in Trimodal Space [0.5] コンフリクトダイナミクスのソーシャルメディアの展望は、ますますマルチモーダル化している。
CLIPのようなモデルアーキテクチャの最近の進歩により、研究者はテキストのモダリティと画像の共有潜在空間における相互作用を研究することができるようになった。
本稿では,任意のモダリティを許容するコントラッシブ・ロス関数の拡張について検討し,ソーシャルメディア上でのトリモーダル・スペースにおけるその有用性を示す。
新たに収集したTelegramポストの公開データセットを使って,3つのモダリティすべてをトレーニングし,その有用性を2つのOSINTシナリオで示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:48:24 GMT)
SSCAE -- Semantic, Syntactic, and Context-aware natural language Adversarial Examples generator [0.4] 機械学習モデルは悪質に作られたAdversarial Examples(AEs)に脆弱である
本稿では,textbfSemantic, textbfSyntactic, textbfContext-aware natural language textbfAEs ジェネレータに対するSSCAEと呼ばれる実用的で効率的な攻撃モデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:45:20 GMT)
Solution of the Probabilistic Lambert Problem: Connections with Optimal Mass Transport, Schrödinger Bridge and Reaction-Diffusion PDEs [0.4] 終端結合確率密度を持つランベルト問題は、最適一般化質量輸送制約問題であることを示す。
我々は,加法的動的プロセスノイズを用いた確率ランベルト問題を数値的に解く。
反応拡散PDEの境界結合系を解いた結果の解析結果について説明する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:43:48 GMT)
Does AI help humans make better decisions? A methodological framework for experimental evaluation [0.4] 我々は、人間とAI、AIの3つの代替意思決定システムのパフォーマンスを比較する方法を示す。
AIレコメンデーションは、キャッシュベイルを課す裁判官の決定の分類精度を向上しない。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:04:52 GMT)
A low latency attention module for streaming self-supervised speech representation learning [0.4] SSRL(Self-latency Speech Expression Learning)は、トランスフォーマーアーキテクチャにおける一般的なユースケースである。
本稿では,低演算およびメモリ要求のSSRLアーキテクチャのトレーニングを可能にするアテンションモジュールの実装について述べる。
私たちの実装では、推論のレイテンシも1.92秒から0.16秒に短縮しています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:09:44 GMT)
Sonification of Wigner functions: case study of intense light-matter interactions [0.4] Wigner function $rho_W(textbfr,textbfp)$は位相空間表現として機能する。
量子システムを直感的に表現するツールとして機能し、例えば、ソニフィケーション技術を用いて機能する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:34:58 GMT)
Frequency effects in Linear Discriminative Learning [0.4] 形態と意味間の効率的かつ周波数インフォームドマッピングがいかに得られるかを示す(周波数インフォームド・ラーニング; FIL)。
FILは比較的低い型と高いトークン精度を示し、モデルが日々の生活の中で話者が遭遇するほとんどのワードトークンを正しく処理できることを示した。
本研究は,学習モデルにおける周波数効果を効率的にシミュレートする方法を示し,認知モデルにおける低頻度単語の最適な説明法について疑問を投げかけるものである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:36:05 GMT)
Entanglement Microscopy: Tomography and Entanglement Measures via Quantum Monte Carlo [0.3] 我々は、量子モンテカルロシミュレーションにおいて、部分領域に付随する完全に還元された密度行列を得るために、エンタングルメント顕微鏡と呼ばれるプロトコルを開発する。
我々は、一般的な相互作用系に対するフェルミオンLNの大規模温度法則スケーリングを解析的に取得する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:34:29 GMT)
A Data-driven Approach for Rapid Detection of Aeroelastic Modes from Flutter Flight Test Based on Limited Sensor Measurements [0.3] 本研究では,空気弾性モードを特定するために,時間遅延組み込み動的モード分解手法を実装した。
この手法は入力励起の知識を前提とせず、加速度計のチャネルで捉えた応答のみを扱う。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:15:01 GMT)
Fostering Inclusion: A Regional Initiative Uniting Communities to Co-Design Assistive Technologies [0.3] 提示された地域的取り組みは、障害のある人々、学生、研究者、協会をまとめることによって、これらの課題に対処しようとするものである。
大学における様々な講義形式において、学生は障害のある人と支援技術を共同設計する。
参加者や他の関係者を対象に,13回の半構造化インタビューを実施し,分析した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:21:50 GMT)
Directed Criteria Citation Recommendation and Ranking Through Link Prediction [0.3] 本モデルでは,各文書の意味を要約ネットワーク内のノードとして符号化するために,トランスフォーマーベースのグラフ埋め込みを用いる。
我々のモデルが生成するセマンティック表現は、推薦タスクやランキングタスクにおいて、他のコンテントベースの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:47:38 GMT)
Modular Neural Networks for Time Series Forecasting: Interpretability and Feature Selection using Attention [0.3] 本稿では,構築によって解釈可能な時系列予測のための新しいモジュール型ニューラルネットワークモデルを提案する。
リカレントニューラルネットワークはデータ内の時間的依存関係を学習し、アテンションベースの特徴選択コンポーネントは最も関連性の高い特徴を選択する。
モジュール型のディープネットワークは、選択した機能から独立してトレーニングされ、ユーザーが機能がどのように結果に影響を与えるかを示し、モデルを解釈できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:39:11 GMT)
NuGraph2: A Graph Neural Network for Neutrino Physics Event Reconstruction [0.3] 本稿では、LArTPC検出器におけるシミュレーションニュートリノ相互作用の低レベル再構成のためのグラフニューラルネットワーク(GNN)であるNuGraph2について述べる。
このネットワークは、複数の2D表現にまたがる検出器オブザーバブルを直接運用するが、これらの表現間の一貫性を促進するために3Dコンテキスト認識機構を利用する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:26:05 GMT)
What can we know about that which we cannot even imagine? [0.3] 最初の疑問は、知能の生物学的機能、特に人間の知能の認知的補綴に関するものである。
言語で強化されているにもかかわらず、人間の言語がいかに恐ろしいほど制限されているか、そして、我々の認知能力がどれほど制限されているかを強調します。
そして、これらの質問を組み合わせて、このエッセイの指導的関心事に答える。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:15:20 GMT)
FedSPU: Personalized Federated Learning for Resource-constrained Devices with Stochastic Parameter Update [0.3] Federated Dropoutはこの課題に対処するための一般的な戦略として登場した。
パラメータ更新によるフェデレーション学習(FedSPU)を提案する。
実験の結果,FedSPUはFederated Dropoutを平均7.57%の精度で上回った。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 04:31:38 GMT)
The effect of niobium thin film structure on losses in superconducting circuits [0.3] 結晶特性の異なるニオブ共振器のマイクロ波特性と表面トポグラフィーについて検討した。
私たちが測定する低損失共振器は、サファイア・プラットフォーム上でNbを用いて記録された中で、単光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光子・光
その結果, 超伝導薄膜の結晶構造と共振器による損失機構の関連性が強調され, 薄膜成膜時の温度の適度な変化が結果として生じる品質要因に大きく影響することが示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:26:03 GMT)
Control of Medical Digital Twins with Artificial Neural Networks [0.2] この研究は、医療用デジタルツインを制御する代替アプローチとして、動的インフォームドニューラルネットワークコントローラを導入している。
提案手法の有効性を他の手法と比較し, 評価を行った。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:30:46 GMT)
PETScML: Second-order solvers for training regression problems in Scientific Machine Learning [0.2] 近年、分析のためのデータ駆動ツールとして、科学機械学習の出現を目撃している。
我々は、ディープラーニングソフトウェアと従来の機械学習技術とのギャップを埋めるために、Portable and Extensible Toolkit for Scientific計算上に構築されたソフトウェアを紹介します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:59:42 GMT)
Heuristic Reasoning in AI: Instrumental Use and Mimetic Absorption [0.2] 人工知能(AI)の新しい推論プログラムを提案する。
我々は、AIが、リソース・レーショナルな人間の認知の原理と整合して、精度と効率の適応的バランスを示すことを示す。
我々の発見は、資源と目的のトレードオフが生物学的システムのエミュレーションに繋がる、AI認知の微妙なイメージを明らかにした。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:45:01 GMT)
Human-in-the-Loop AI for Cheating Ring Detection [0.2] 本稿では,これらの不正行為を検知し,抑えるように設計された,ループ内AI不正行為検出システムを提案する。
このシステムはResponsible AI(RAI)標準に準拠しており、倫理的配慮が開発プロセス全体を通して統合されることを保証する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:25:57 GMT)
Transfer Learning for T-Cell Response Prediction [0.2] 特定のペプチドに対するT細胞応答の予測について検討した。
膨らませた予測性能の危険性は,単に理論的なものではなく,実際に発生することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:32:19 GMT)
ClimateQ&A: Bridging the gap between climate scientists and the general public [0.1] 本研究では,気候変動と生物多様性の喪失に関する世論を,ClimateQ&Aプラットフォームに対する質問の分析によって調査する。
2023年3月にオンライン公開されたこのツールは、主にフランスの聴衆から3万以上の質問を集めた。
3,425の質問のサンプルでNLPクラスタリングアルゴリズムを実行すると、気候変動と生物多様性の喪失が個人に与える影響について25.8%が重要な調査をしていることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:16:02 GMT)
Unconstrained Stochastic CCA: Unifying Multiview and Self-Supervised Learning [0.1] PLS, CCA, Deep CCA の高速アルゴリズム群を標準 CCA と Deep CCA のベンチマークで示す。
我々のアルゴリズムは、従来の最先端ベンチマークよりもはるかに高速な収束と高い相関関係の回復を示す。
これらの改良により、非常に大きなバイオメディカルデータセットの第一種PSS分析を行うことができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:32:59 GMT)
TivNe-SLAM: Dynamic Mapping and Tracking via Time-Varying Neural Radiance Fields [0.1] 動的シーンの追跡と再構成を行うための時間変化表現を提案する。
トラッキングプロセスでは、全ての入力画像は一様にサンプリングされ、その後、自己監督パラダイムで漸進的に訓練される。
既存のNeRF法と比較し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:37:31 GMT)
Current and efficiency of bosonic systems interacting with two thermal reservoirs [0.1] 本稿では,異なる温度で2つの貯水池と相互作用する中心系からなるボソニック系の電流と効率のダイナミクスについて検討する。
システム内のボソンの流れを表す電流を定量化し、その熱貯水池のパラメータと温度に依存することを解析する。
解析の結果,温度依存性や量子補正係数などの量子効果がエネルギー伝達効率に大きな影響を及ぼすことが示された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:48:25 GMT)
Identifying Three-Dimensional Radiative Patterns Associated with Early Tropical Cyclone Intensification [0.1] 雲の放射フィードバックは初期の熱帯性サイクロンの増強に影響を及ぼす。
そこで我々は, 実数値シミュレーションTCの表面強度と放射の隠れた関係を学習するための線形変分デコーダ (VED) を提案する。
抽出した3次元放射構造を綿密に調べたところ, 内心深部対流と浅部雲からの長波放射強制力は強度に寄与することが示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:40:00 GMT)
Decoding Multilingual Topic Dynamics and Trend Identification through ARIMA Time Series Analysis on Social Networks: A Novel Data Translation Framework Enhanced by LDA/HDP Models [0.1] われわれは、コロナウイルスパンデミックの間、チュニジアのソーシャルネットワーク内での対話や、スポーツや政治などの有名なテーマに焦点を当てている。
まず、これらのテーマに関連するコメントの多言語コーパスを集約することから始めます。
次に、言語的差異に対処するために、ノー・イングリッシュ・トゥ・イングリッシュ・マシン翻訳手法を導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:01:10 GMT)
mqdtfit: A collection of Python functions for empirical multichannel quantum defect calculations [0.0] Python関数は、マルチチャネル量子欠陥理論モデルのパラメータを計算するのに使うことができる。
理論の2つの主要な定式化、すなわちモデルのパラメータが固有チャネル量子欠陥と変換行列の集合であるものを支持する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:41:48 GMT)
Wigner-molecule supercrystal in transition-metal dichalcogenide moiré superlattices: Lessons from the bottom-up approach [0.0] 二重井戸モワール量子ドット(MQD)におけるフェルミオン荷電担体の数体問題について検討した。
しばしば用いられるスピン・アンド・スペース・アンリミテッド・ハーツリー・フォック(sS-UHF)の平均場解との比較解析は、UHF法の限界を証明している。
$nu=2$ moir'e TMD 超格子の場合の結論は、孤立 MQD におけるスライド WM に関連する積分フィリングを持つすべてのケースに拡張されると推測されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:17:47 GMT)
Why E.T. Can't Phone Home: A Global View on IP-based Geoblocking at VoWiFi [0.0] 多くのオペレーターはVoWiFiを代替のネットワークアクセス技術として使用し、無線信号がない地域での携帯電話網を補完する。
この収益源を失わないために、海外に滞在する顧客のためにIMSへのアクセスをブロックするオペレーターもいる。
本研究は,グローバルオペレータ間のVoWiFiの現在の展開状況を評価し,IP層上の既存のジオブロッキング対策を解析する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:12:56 GMT)
Variational Approach for Efficient KL Divergence Estimation in Dirichlet Mixture Models [0.0] 本研究は, ディリクレ混合モデル(DMM)におけるクルバック・リブラー(KL)の多様性の効率的な推定に挑戦する。
従来のアプローチはモンテカルロ法を計算的に要求することに依存しており、新しい変分法の導入を動機付けていた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:14:54 GMT)
Vacuum Rabi splitting as a manifestation of virtual two-mode squeezing: Extracting the squeezing parameters from frequency shifts [0.0] 真空ラビ分割は仮想的な2モードスキューズ現象の顕在化であると主張する。
このような量子場の仮想的スクイーズもまた、場の量子論において重要な役割を果たしているかもしれない。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:50:04 GMT)
Using Generative Text Models to Create Qualitative Codebooks for Student Evaluations of Teaching [0.0] 学生による教育評価(SET)は、教育者にとって重要なフィードバック源である。
SETのコレクションは、管理者がコースやプログラム全体の信号として役立つ。
自然言語処理(NLP)と大規模言語モデル(LLM)を用いてSETを解析する新しい手法について論じる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:21:35 GMT)
Useful Compact Representations for Data-Fitting [0.0] 我々はベクトルの選択によってパラメータ化される新しいコンパクト表現を開発し、特別な選択のために既存のよく知られた公式に還元する。
本研究では, 大規模固有値計算, テンソル因子分解, 非線形回帰に対するコンパクト表現の有効性を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:43:00 GMT)
Use of recommendation models to provide support to dyslexic students [0.0] 本研究は, ディプレックス学生に最も適した支援ツールとして, AIを活用する可能性について検討した。
我々は,3つの協調フィルタリング推薦モデルを訓練し,1237名の学生の大規模データベース上で実験を行った。
その結果,レコメンデーションシステムは,全員に最適なヘルプツールや戦略を提案する上で極めて有効であることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:12:38 GMT)
Usability and Performance Analysis of Embedded Development Environment for On-device Learning [0.0] 本研究は、リソース制約されたIoTデバイス上で、さまざまな抽象化レベルを持つ様々な開発ツールを評価する。
この分析は、モデルトレーニングと推論におけるメモリ使用量、エネルギー消費量、パフォーマンスメトリクスを含む。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:26:04 GMT)
Unit Commitment Predictor With a Performance Guarantee: A Support Vector Machine Classifier [0.0] 従来の単位のオン/オフ決定を学習し、予測することにより、システムオペレーターが解凍器を温め、計算を著しく高速化する可能性があることを示す。
予測のために、線形およびカーネル化されたサポートベクタマシン分類器を訓練し、適切に正規化された場合、サンプル外の性能保証を提供する。
その結果、正規化を適切に行うカーネル化されたSVMは他の分類器よりも優れており、計算時間を1.7倍に削減できることがわかった。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:20:37 GMT)
TrajectoryNAS: A Neural Architecture Search for Trajectory Prediction [0.0] 軌道予測は自律走行システムの重要な構成要素である。
本稿では,軌道予測にポイントクラウドデータを活用する先駆的手法であるTrajectoryNASを紹介する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:48:41 GMT)
Towards automated formal security analysis of SAML V2.0 Web Browser SSO standard - the POST/Artifact use case [0.0] シングルサインオン(SSO)プロトコルは、複数のオンラインサービスに対する統一ログインによるユーザ認証を合理化し、ユーザビリティとセキュリティを改善している。
最も一般的なものの一つ。
SSOプロトコルフレームワーク - Security Assertion Markup Language V2.0 (SAML) Web。
シングルサインオン(SSO)プロトコルは、複数のオンラインサービスに対する統一ログインによるユーザ認証を合理化し、改善する。
ユーザビリティとセキュリティ
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:11:29 GMT)
Tangent space generators of matrix product states and exact Floquet quantum scars [0.0] 連続的ユニタリ進化による行列積状態 (MPS) の生成のための構成的アプローチを開発する。
我々は、与えられたMPSの特定の方向に沿ってその接空間の進化を正確に実装する演算子の明示的な構成を提供する。
Floquetユニタリが軌道の1つの周期でダイナミクスを発生し、熱化固有状態の海に埋め込まれた近似MPSのような固有状態が特徴的であることを実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:34:19 GMT)
Synthetic Image Generation in Cyber Influence Operations: An Emergent Threat? [0.0] 本報告では, 合成画像の作成において, 拡散モデルなどの生成的深層学習モデルの可能性と限界について検討する。
我々は、これらのツールのアクセシビリティ、実用性、出力品質と、それらが詐欺、影響、転倒の脅威シナリオに与える影響を批判的に評価する。
我々は、脅威アクターに対するこれらのAI駆動手法の現在の能力と限界を実証するために、いくつかの仮説的サイバー影響操作のためのコンテンツを生成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:44:30 GMT)
Super-resolution of ultrafast pulses via spectral inversion [0.0] ブロードバンド光(10~100GHz)を対象とした分光超解像法を実験的に実証した。
等輝度の2つの非コヒーレントスペクトル特徴と、コヒーレンス時間当たりの光子との小さな分離を推定するパラダイム的問題について検討した。
この装置は、電気光学タイムレンズとインバージョンを実装したパッシブスペクトル分散器を備えた、アクティブに安定化されたマッハ・ツェンダー型干渉計に基づいている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:21:37 GMT)
State space representations of the Roesser type for convolutional layers [0.0] 2次元畳み込み層に対するRoesser型の状態空間表現を提供する。
また、拡張、ストライド、N-D畳み込みのための状態空間表現も構築する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:35:13 GMT)
Spatio-seasonal risk assessment of upward lightning at tall objects using meteorological reanalysis data [0.0] 本研究は,アルプス東部とその周辺地域における高層天体の雷害について検討し,上向きの雷害のリスクを評価する。
現在のリスク評価手法は、気象条件の影響を見落とし、ULリスクを過小評価する可能性がある。
この研究では、ガイスベルクタワー(オーストリア)で測定されたULと35ドルの大規模気象変数の関係を機械学習技術であるランダムフォレストを用いて分析した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:13:24 GMT)
Semantic Data Representation for Explainable Windows Malware Detection Models [0.0] 本稿では,PEマルウェアファイルに対する再利用可能なセマンティックスキーマを提供するPEマルウェアオントロジーを提案する。
このオントロジーは、PEファイルの静的マルウェア解析に焦点を当てたEMBERデータセットの構造に着想を得たものである。
また、EMBERの実験を支援するために、分数データセットを含む意味的に処理されたEMBERデータも公開する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:17:27 GMT)
Scalable and programmable quantum computing platform for optical non-Gaussian input states [0.0] 非ガウス入力状態のためのプログラマブルな光量子コンピューティングプラットフォームを開発する。
我々は、典型的な非ガウス状態における決定論的、プログラム可能、反復可能な量子ゲートを検証する。
このプラットフォームは非ガウス状態と互換性があり、大規模な普遍量子コンピューティングを実現する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:27:01 GMT)
Ricci flow-guided autoencoders in learning time-dependent dynamics [0.0] 時間的非線形力学、特に偏微分方程式(PDE)を学習するための多様体に基づくオートエンコーダ法を提案する。
これは、物理学的インフォームドな設定でリッチフローをシミュレートすることで実現でき、また、リッチフローが経験的に達成されるように、多様体の量と一致させることができる。
本稿では,周期性やランダム性などの望ましい特徴を包含するPDEを用いた数値実験について述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:12:48 GMT)
Revisiting The Classics: A Study on Identifying and Rectifying Gender Stereotypes in Rhymes and Poems [0.0] この研究は、男女のステレオタイプを特定するために韻文と詩のデータセットを集め、性別バイアスを特定するために97%の精度のモデルを提案することで貢献する。
ジェンダーのステレオタイプをLarge Language Model (LLM) を用いて修正し、その効果を人間の教育者に対する比較調査で評価した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:02:02 GMT)
Retrieval of photon statistics from click detection [0.0] 我々は, 擬似逆変換法を用いて, 測定されたクリック数から光子数を推定する。
検出器トモグラフィーを行い、量子効率、クロストークレートなどの重要な測定特性を得る。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:21:37 GMT)
Quantum reference frames, measurement schemes and the type of local algebras in quantum field theory [0.0] 我々は相対論的量子測定理論と量子参照フレーム(QRF)を結合する
対称性を持つ背景上の量子場の局所的な測定は、QRFに対して行われる。
これにより、時空等距離群の自然な作用の下で不変である量子場と参照フレームの合同代数が得られる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:11:44 GMT)
Probing Site-Resolved Current in Strongly Interacting Superconducting Circuit Lattices [0.0] 輸送測定は、超伝導から分数量子ホール効果まで、凝縮物質現象を理解するための基礎となる。
ここでは超伝導回路格子内のその場粒子電流の測定を実演し、コヒーレントおよびバス結合格子の輸送の研究に応用する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:08:04 GMT)
Post-Quantum Cryptography: Securing Digital Communication in the Quantum Era [0.0] ポスト量子暗号(英: Post-quantum Cryptography, PQC)は、量子攻撃に対するレジリエント暗号アルゴリズムの開発を目的とした重要な分野である。
本稿では、古典暗号システムの脆弱性を量子攻撃に説明し、量子コンピューティングの不確定原理を解明し、様々なPQCアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:51:56 GMT)
Photon statistics analysis of h-BN quantum emitters with pulsed and continuous-wave excitation [0.0] ヘキサゴナル窒化ホウ素(h-BN)量子エミッタの量子光子統計について,マンデルQパラメータを解析して報告する。
我々は,h-BN量子エミッタのマンデルQパラメータを,様々な温度およびポンプ出力条件下で測定した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 22:31:44 GMT)
Phased Data Augmentation for Training a Likelihood-Based Generative Model with Limited Data [0.0] 生成モデルは現実的なイメージの作成に優れていますが、トレーニングのための広範なデータセットに依存しているため、大きな課題があります。
現在のデータ効率の手法はGANアーキテクチャに重点を置いており、他の生成モデルの訓練にギャップを残している。
位相データ拡張(phased data augmentation)は、このギャップに対処する新しい手法であり、データ分散に固有の変更を加えることなく、限られたデータシナリオでのトレーニングを最適化する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 06:34:01 GMT)
Pedestrian Tracking with Monocular Camera using Unconstrained 3D Motion Model [0.0] 移動物体の広さは、歩行者の高さなどの3次元の既知の統計によって説明できると仮定される。
このモデルのための非線形フィルタは、無人カルマンフィルタ(UKF)を用いて実装され、公開されているMOT-17データセットを用いてテストされる。
提案手法は, 2次元画像に投影された場合, 完全な結果を維持しつつ, 3次元で有望な結果が得られる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:13:18 GMT)
Parsing skin effect in a non-Hermitian spinless BHZ-like model [0.0] この研究は、スピンレスベルネヴィグ・ヒューズ・チャン(BHZ)のような1次元のモデルにおける非エルミート皮膚効果(NHSE)を包括的に研究する。
システム内のNHSEやその変種の存在を復号するためには,より詳細な分析が必要である。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:52:59 GMT)
Overhead-constrained circuit knitting for variational quantum dynamics [0.0] 回路編み込みを用いて、大きな量子システムを小さなサブシステムに分割し、それぞれを別々のデバイスでシミュレートすることができる。
長径ゲートを切断することで回路深度を低減するために,同じ手法が利用できることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 19:28:35 GMT)
Orthosymplectic diagonalization in Williamson's theorem [0.0] 行列を直交行列で対角化するのに必要で十分である任意の 2n 倍 2n$ 実対称正定行列に条件を与える。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:33:51 GMT)
Optimal Layout Synthesis for Deep Quantum Circuits on NISQ Processors with 100+ Qubits [0.0] スケーラブルなレイアウト合成は、NISQプロセッサにとって非常に重要である。
本稿では,1つのSWAPとCNOTのグループを各ステップで適用する並列計画に基づくSAT符号化を提案する。
初めて、8, 14, 16量子ビット回路を最大17個のSWAPを持つ54, 80, 127量子ビットプラットフォームに最適にマッピングできる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:19:01 GMT)
Open Brain AI. Automatic Language Assessment [0.0] 言語評価は、個人を言語、言語、コミュニケーション障害で診断し、治療する上で重要な役割を担っている。
本稿では,Open Brain AI,AI言語処理モジュールの開発,および談話マクロ構造とマイクロ構造の言語計測について論じる。
言語の迅速かつ自動的な分析により、臨床医の負担が軽減され、ワークフローを合理化し、より多くの時間とリソースを患者のケアに直接割り当てることが可能になる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:37:51 GMT)
One-sided DI-QKD secure against coherent attacks over long distances [0.0] デバイスに依存しない(DI)QKDプロトコルは、最小限のデバイス仮定をすることでこの問題を克服する。
本研究では,一方の一方のDI QKDスキームが,信頼できない側において,50.1%以上の検出効率を有するコヒーレントアタックに対して安全であることを示す。
また、信頼できない側に状態のソースを置くことで、我々のプロトコルは標準QKDプロトコルに匹敵する距離にわたって安全であることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:01:17 GMT)
One Axis Twisting (OAT) spin squeezing for metrology [0.0] スピンスクイージングは,OATスクイージングにおけるデコヒーレンスの存在下においても,メロジカルな精度向上に有効であることを示す。
我々は, 北川上田OATスクイーズ式を有限分極に拡張する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:59:17 GMT)
Neural network representation of quantum systems [0.0] 我々は、幅広い種類の量子力学系をニューラルネットワークの形でキャストできる新しいマップを提供する。
我々の発見は、機械学習を量子の世界に近づける。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:20:22 GMT)
Multiplexed quantum state transfer in waveguides [0.0] 量子ネットワークは、QEDセットアップにおける量子情報のストレージと操作の最大化を示すテストベッドとして機能する。
ウェーブパケット工学と量子状態伝達プロトコルを用いて2つの手法を解析する。
現状の実験では、フォールトトレラント量子コンピューティングの要求を満たすグローバルな忠実度を持つ多重光子を数十個採用できることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 20:10:29 GMT)
Many-body quantum heat engines based on free-fermion systems [0.0] 自由フェルミオン系に基づく不完全量子多体オットーエンジンの性能について検討する。
様々なモデルパラメータの関数としての最適作業点の出現について論じる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:41:38 GMT)
Loops On Retrieval Augmented Generation (LoRAG) [0.0] Loops On Retrieval Augmented Generation (LoRAG)は、検索強化テキスト生成の品質を高めるために設計された新しいフレームワークである。
アーキテクチャは、生成モデル、検索機構、動的ループモジュールを統合する。
LoRAGはBLEUスコア、ROUGEスコア、パープレキシティの点で既存の最先端モデルを上回っている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:19:17 GMT)
Linguacodus: A Synergistic Framework for Transformative Code Generation in Machine Learning Pipelines [0.0] 本稿では,自然言語のタスク記述を高レベルなデータ生成命令によってコードに変換する動的パイプラインを提案する。
本稿では、微調整過程を詳述し、自然言語記述を関数型コードに変換する方法について光を当てる。
本稿では,MLタスクの自然な記述を人間のインタラクションを最小限に抑えたコードに変換するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:58:47 GMT)
Light Curve Classification with DistClassiPy: a new distance-based classifier [0.0] 我々はDistClassiPyと呼ばれる距離メートル法に基づく新しい分類器を開発した。
我々は、異なるクラスの天体間の距離を比較することで、変光星の光曲線を分類する。
この分類器は最先端の性能に適合するが, 計算要求が低く, 解釈性も向上していることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:00:00 GMT)
Learning t-doped stabilizer states [0.0] 本稿では,有限個の$t$ of$T$-gateをドープしたクリフォード回路を用いて,計算基底状態から得られる学習状態を対象とした学習アルゴリズムを提案する。
このアルゴリズムは、パウリ観測可能量の観点から、$t$ドープ安定化状態の正確なトモグラフィ記述を学習する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:23:40 GMT)
LOSTU: Fast, Scalable, and Uncertainty-Aware Triangulation [0.0] この研究は、textttLOSTUと呼ばれる三角測量の非定型的でスケーラブルで統計的に最適な方法を提案する。
再射(L$)エラーを最小限に抑える三角法アルゴリズムとは異なり、LOSTUはカメラのポーズやパラメータにエラーがある場合に、最大推定値を提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:12:44 GMT)
LLM Guided Evolution - The Automation of Models Advancing Models [0.0] ガイドド・エボリューション(GE)は、従来の機械学習アプローチから切り離された斬新なフレームワークである。
思想の進化(EoT)は、従来の突然変異の結果からLLMを反映して学習させることでGEを強化する。
ExquisiteNetV2モデルの進化におけるGEの適用は,その有効性を示している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:44:55 GMT)
Investigating Markers and Drivers of Gender Bias in Machine Translations [0.0] 大型言語モデル(LLM)におけるインプシット性バイアスは、文書化された問題である。
我々は、DeepL翻訳APIを使用して、56のソフトウェアエンジニアリングタスクを繰り返し翻訳する際に生じるバイアスを調査する。
いくつかの言語は、類似した代名詞の使用パターンを示し、3つの緩いグループに分類する。
文中に出現する主動詞は,翻訳における意味のあるジェンダーの要因である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 15:54:46 GMT)
Informed Spectral Normalized Gaussian Processes for Trajectory Prediction [0.0] 本稿では,SNGPの正規化に基づく連続学習手法を提案する。
提案手法は確立された手法に基づいており,リハーサルメモリやパラメータ拡張を必要としない。
本研究では, 自律運転における軌道予測問題に対する情報SNGPモデルの適用について検討した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:05:24 GMT)
Improved Quantum Algorithms for Eigenvalues Finding and Gradient Descent [0.0] ブロック符号化は、最近開発された量子アルゴリズムの統一フレームワークを形成する量子信号処理において重要な要素である。
本稿では,前述した2つの量子アルゴリズムを効果的に拡張するためにブロック符号化を利用する。
提案手法を,行列逆転や多重固有値推定など,異なる文脈に拡張する方法を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:34:49 GMT)
High-Fidelity Entangling Gates for Electron and Nuclear Spin Qubits in Diamond [0.0] ダイヤモンド中の窒素空孔中心における高速かつ高忠実な密閉ゲートの設計法を提案する。
我々は、欠陥の窒素原子の核スピンの状態に条件付けられたNV電子スピンに対処する際に、2量子ゲートの非共鳴駆動誤差の完全な抑制を予測した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:07:55 GMT)
Hatred Stems from Ignorance! Distillation of the Persuasion Modes in Countering Conversational Hate Speech [0.0] 本研究は, 説得モードを, 理性, 感情, 信頼性に抽出し, 2種類の会話相互作用におけるそれらの使用性を評価する。
オープンおよびクローズドな相互作用に対する対音声説得モードのニュアンス差を観察する。
生成された反音声は感情的な説得モードを示す傾向があり、一方で人間のカウンターは推論を用いて傾いている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:20:35 GMT)
Graphs Unveiled: Graph Neural Networks and Graph Generation [0.0] 本稿では,グラフニューラルネットワーク(GNN)の概要を紹介する。
様々な領域にわたるグラフニューラルネットワークの適用について論じる。
我々は,グラフ生成という,GNNの先進的な分野を提示する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:37:27 GMT)
Geometric phase for a nonstatic coherent light-wave: nonlinear evolution harmonized with the dynamical phase [0.0] 静環境下で発生した非定常コヒーレント光波の幾何学的位相の特性を解析した。
総相は極度の非静的な場合の特異な挙動を示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:27:45 GMT)
Fusion of deterministically generated photonic graph states [0.0] 絡み合いは、量子物理学の謎的な概念から、量子技術の鍵となる要素へと進化してきた。
ここでは、光共振器にアドレス可能な原子を用いることにより、この目標を達成する。
我々の技術は、より多くの量子レス量子リピータに対してスケーラブルなメモリである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:46:00 GMT)
Formal Security Analysis of the AMD SEV-SNP Software Interface [0.0] AMD Secure Encrypted 技術は、仮想マシンをハイパーバイザのような特権の高いソフトウェアから保護することによって、機密計算を可能にする。
我々は、SEV Secure Nested Paging (SEV-SNP) と呼ばれる、最新のSEVイテレーションにおけるソフトウェアインターフェースの最初の包括的シンボリックモデルを開発する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:09:11 GMT)
Fisher Mask Nodes for Language Model Merging [0.0] 本稿では,トランスフォーマーの新たなモデルマージ手法について紹介し,フィッシャー重み付けにおける過去の研究成果とモデルプルーニングにおけるフィッシャー情報の利用について考察する。
提案手法は,BERTファミリーの各種モデルに対して,正規かつ顕著な性能向上を示し,計算コストのごく一部において,大規模フィッシャー重み付き平均値よりも優れていた。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:10:24 GMT)
Fast and accurate nonadiabatic molecular dynamics enabled through variational interpolation of correlated electron wavefunctions [0.0] 我々は,化学空間を平均フィールドコストで多体波動関数の小さなトレーニングセットを開発する。
解析的多状態力と非断熱的結合が非断熱的分子動力学への応用を可能にすることを示す。
これにより、光励起された28原子水素鎖の非断熱的分子動力学に応用できる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 21:44:46 GMT)
Fair Division of Multi-layered Cakes [0.0] まず,一対のナイフという多層ケーキに新しい計算モデルを導入する。
新しい計算モデルを用いて,2つのエージェントと2つのレイヤに対して,正確なマルチアロケーションが存在することを示す。
3層ケーキ上に3個以上のエージェントを配置し, 有効かつ連続的な比例多重配置の手順を実証した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:51:27 GMT)
Exploring Estonia's Open Government Data Development as a Journey towards Excellence: Unveiling the Progress of Local Governments in Open Data Provision [0.0] エストニアは、デジタル国家または電子国家という世界的名声を持っている。
デジタルガバナンスの成功にもかかわらず、この国はオープン・ガバメント・データ(OGD)の領域で課題に直面している。
本稿では,エストニアのOGD開発の発展と位置づけを,国内および地域レベルを包括的に検討することを目的とする。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:50:05 GMT)
Exceptional points of any order in a generalized Hatano-Nelson model [0.0] 例外点(EP)は真に非エルミート(NH)退化であり、行列が欠陥となる。
我々は,新しいタイプのEPを導入し,システムサイズでスケールしない任意の順序でEPを実現する方法のレシピを提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:53:33 GMT)
Emotion Detection with Transformers: A Comparative Study [0.0] 我々は、異なる変圧器の変種を用いて、感情データセットを用いて、事前訓練されたトランスフォーマーモデルを訓練し、評価する。
解析の結果,句読解や停止語といった一般的な手法は,モデルの性能を損なうことが判明した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:22:50 GMT)
Embracing the Generative AI Revolution: Advancing Tertiary Education in Cybersecurity with GPT [0.0] GPT(Generative Pre-trained Transformer)モデルは、サイバーセキュリティに大きな影響を与える可能性がある。
本研究では,GPT,特にChatGPTがサイバーセキュリティの第三次教育に与える影響について検討した。
私たちは、サイバーセキュリティのような実践的な学位を提供する大学は、産業の需要と密接に一致し、必然的に生成するAI革命を受け入れるべきだと結論付けました。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:20:38 GMT)
Effective versus Floquet theory for the Kerr parametric oscillator [0.0] 駆動系の静的有効ハミルトニアンの観点から設計されたパラメトリックゲートとプロセスは量子技術の中心である。
この研究は、通常の静的な効果的な処理によって取り残され、最先端の実験によって探索される物理学の光をもたらす。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:17:15 GMT)
Effective Message Hiding with Order-Preserving Mechanisms [0.0] StegaFormerはビット順序を保存し、モジュール間のグローバルな融合を可能にするように設計されたフレームワークである。
StegaFormerは、リカバリの正確性、メッセージキャパシティ、不可避性の点で、既存の最先端メソッドを超越している。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 03:26:02 GMT)
Dynamic Contexts for Generating Suggestion Questions in RAG Based Conversational Systems [0.0] 本研究の目的は,提案問題生成器の開発によってギャップを埋めることである。
提案する質問を生成するために,提案手法は動的コンテキストを活用する。
動的コンテキストアプローチは、他のプロンプトアプローチと比較して、より優れた提案質問を生成することができることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:01:58 GMT)
Digital Twin Data Modelling by Randomized Orthogonal Decomposition and Deep Learning [0.0] デジタルツインは、元のプロセスの振る舞いを反映する主な特徴を持つ代理モデルである。
本稿では,流体の効率的なディジタル双対モデルを作成するための新しい枠組みを提案する。
我々は、最先端の人工知能Deep Learning(DL)を用いて、ディジタルツインモデルのリアルタイム適応キャリブレーションを行う。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:24:55 GMT)
Dicke superradiance in ordered arrays of multilevel atoms [0.0] 逆原子アンサンブルでは、光子を介する相互作用は多体崩壊の一形態であるディック超放射性を引き起こす。
そこで本研究では,アルカリ性アース(-様)原子の規則配列を用いた現実的な実験環境下でのDicke超放射能について検討する。
我々の研究はアルカリ原子を量子光学源として利用するための重要なステップである。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:21:56 GMT)
Convergence of SGD for Training Neural Networks with Sliced Wasserstein Losses [0.0] 我々は,SGDの直感的収束に関する知識ギャップを非滑らか関数と非生成関数に橋渡しする。
すなわち、長い軌道は損失関数の一般化された臨界点の集合に近づく。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:55:08 GMT)
Construction of Hyper-Relational Knowledge Graphs Using Pre-Trained Large Language Models [0.0] テキストからハイパーリレーショナルな知識を抽出するゼロショットプロンプトベースの手法を提案する。
モデルとベースラインを比較して,0.77のリコールで有望な結果を得た。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 13:44:48 GMT)
Complete equational theories for classical and quantum Gaussian relations [0.0] ガウス関係と正アフィンラグランジュ関係のハイパーグラフプロップに対して生成子と関係を与える。
また、受動線形光量子回路を推論するために、LOv-calculusを解釈する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:28:19 GMT)
Communication protocols and QECCs from the perspective of TQFT, Part I: Constructing LOCC protocols and QECCs from TQFTs [0.0] トポロジカル量子場理論(TQFT)は、量子状態の準備と測定を記述する一般的な言語を提供する。
ここでは、LOCCプロトコルが量子誤り訂正符号(QECC)を一般化することを示す。
第II部では,QECCは相互作用系の境界における時空の出現を,実装あるいは誘導するものとみなすことができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:00:31 GMT)
Communication protocols and QECC from the perspective of TQFT, Part II: QECCs as spacetimes [0.0] トポロジカル量子場理論(TQFT)は、量子状態の準備と測定を記述する一般的な言語を提供する。
LOCCプロトコルはエージェント環境境界上で量子誤り訂正符号(QECC)を誘導することを示す。
バルク境界符号としてのQECCが有効時空をいかに引き起こすかを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 08:03:52 GMT)
Clustering theorem in 1D long-range interacting systems at arbitrary temperatures [0.0] 本稿では, 1次元(1次元)系における熱相転移の欠如について, 量子統計力学の基本的側面を考察する。
任意の温度での幅広い相互作用崩壊に適用可能なクラスタリング定理の導出に成功した。
超ポリノミカル崩壊相互作用を持つ1次元系における相転移の欠如が示唆された。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 02:54:55 GMT)
Characterizing the Entanglement of Anyonic Systems using the Anyonic Partial Transpose [0.0] 混合量子状態の絡み合いは、部分転位とその対応する絡み合い測度、対数ネガティリティを用いて定量化することができる。
近年、部分転位の概念は、交換統計がボゾンやフェルミオンのケースを超えたエキゾチック準粒子であるエキゾチック準粒子の系にまで拡張されている。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:00:00 GMT)
CapsLorentzNet: Integrating Physics Inspired Features with Graph Convolution [0.0] 本稿では,広範囲なグラフニューラルネットワーク(GNN)アーキテクチャと互換性のあるアーキテクチャを新たに導入する。
本手法は,標準GNNにおける従来の復号ブロックを置き換えるカプセル層の統合を提唱する。
我々の新しいアーキテクチャはクォークグルーオンタグ処理においてローレンツネットの性能を20%向上させることができる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 14:31:09 GMT)
CCC++: Optimized Color Classified Colorization with Segment Anything Model (SAM) Empowered Object Selective Color Harmonization [0.0] カラー化問題を多項分類問題に定式化し、次に重み付き関数をクラスに適用する。
クラスを最適化するために、カラークラス変換のために異なるビンサイズで実験する。
カラークラスアクティベーション比(CCAR)とTrue Activation比(TAR)の2つの新しいカラー画像評価指標を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 05:58:13 GMT)
Beyond-adiabatic Quantum Admittance of a Semiconductor Quantum Dot at High Frequencies: Rethinking Reflectometry as Polaron Dynamics [0.0] 我々は、電荷貯水池に結合した量子ドットトンネルのアプタンスを得るために、自己整合量子マスター方程式の定式化を開発する。
本報告では,QD状態のドレッシングによって決定されるFloquet wideeningと,光子損失によって決定されるFloquet wideeningの2つについて述べる。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:57:13 GMT)
Automated data processing and feature engineering for deep learning and big data applications: a survey [0.0] 現代の人工知能(AI)のアプローチは、データから直接学習するアルゴリズムを設計することを目的としている。
従来のディープラーニングパイプラインのすべてのデータ処理タスクが自動化されたわけではない。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:07:48 GMT)
An index for quantum cellular automata on fusion spin chains [0.0] 融合圏$mathbfFib$から構築された融合スピン鎖に対して、この指数はQCAモジュロ有限深さ回路群に対する完全な不変量であることを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 18:26:13 GMT)
Alternant Hydrocarbon Diradicals as Optically Addressable Molecular Qubits [0.0] 高スピン分子はボトムアップ量子ビットの設計を可能にし、磁気センシングと量子情報科学のための有望なプラットフォームである。
交代対称性を用いて、基底状態におけるラジカル-ラジカル相互作用を選択的に最小化し、高い2進文字を持つ$pi$系を生成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 00:53:05 GMT)
Adiabatic Bottlenecks in Quantum Annealing and Nonequilibrium Dynamics of Paramagnons [0.0] 長距離相互作用量子スピングラスと最適化問題との対応は、断熱量子コンピューティングの物理的動機を支えている。
乱れた(量子)スピン系では、無限系とアンサンブルサイズの極限におけるシステム量の計算を可能にする複製トリックのような正確な方法に焦点が当てられている。
ここでは、スピンコヒーレント状態経路積分に非平衡グリーン関数形式を適用し、統計的揺らぎと集団励起スペクトルを得る。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:59:46 GMT)
Adaptative Bilingual Aligning Using Multilingual Sentence Embedding [0.0] 我々はAIlignと呼ばれる適応的なビット情報アライメントシステムを提案する。
文の埋め込みに依存して、アライメントパスをガイドできる信頼できるアンカーポイントを抽出する。
いくつかのデータセットの実験において、AIlignは、準線形複雑度で、芸術の状態と同等の結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 16:19:41 GMT)
Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Representation, and Multimodal Intelligent Graph Reasoning [0.0] 生物材料分野における1000の科学論文の集合を、詳細なオントロジ知識グラフに変換する。
問合せに使える前例のない学際的関係についての深い洞察を明らかにする。
我々の予測は、従来の生成型AI手法よりもはるかに高い斬新さ、技術的詳細、爆発能力を達成する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:30:27 GMT)
AI for bureaucratic productivity: Measuring the potential of AI to help automate 143 million UK government transactions [0.0] 我々は、英国中央政府が年間約10億件の市民向け取引を約400サービスで行っていると見積もる。
これらの複雑なトランザクションの84%は高度に自動化可能であり、潜在的に大きな可能性を秘めていると見積もっています。
我々の研究は、現代政府の構造と機能、そしてそれが人工知能の時代にどのように進化するかについて、新しい視点を示します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 17:03:17 GMT)
A tree-approach Pauli decomposition algorithm with application to quantum computing [0.0] 本稿では,この分解をツリーアプローチを用いて最適化する並列実装によるアルゴリズムを提案する。
また、特定の行列構造をどのように利用して操作数を削減できるかを説明します。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 10:38:06 GMT)
A survey of synthetic data augmentation methods in computer vision [0.0] 本稿では,合成データ拡張技術について概観する。
我々は、重要なデータ生成と拡張技術、アプリケーション全般の範囲、および特定のユースケースに焦点を当てる。
コンピュータビジョンモデルをトレーニングするための一般的な合成データセットの要約を提供する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 01:16:04 GMT)
A simplified Mølmer-Sørensen gate for the trapped ion quantum computer [0.0] トラップされたイオン量子コンピュータで使用されるMolmer-Sorensen(MS)ゲートの簡易化について論じる。
単色コヒーレント光電場を個別に照射することにより、2つのイオンの分離可能な状態をベル状態の1つに変換する方法を提案する。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 07:03:07 GMT)
A review of predictive uncertainty estimation with machine learning [0.0] 機械学習アルゴリズムを用いて予測不確実性推定の話題を概観する。
我々は確率的予測を評価するための関連する指標(一貫性スコアリング関数と適切なスコアリングルール)について論じる。
このレビューでは、ユーザーのニーズに合わせて新しいアルゴリズムを開発する方法についての理解を深める。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 11:22:36 GMT)
A physics-informed neural network method for the approximation of slow invariant manifolds for the general class of stiff systems of ODEs [0.0] 我々は、遅い不変多様体(SIM)の発見のための物理インフォームドニューラルネットワーク(PINN)アプローチを提案する。
削減順序のブラックボックスサロゲートモデルを構成する他の機械学習(ML)アプローチとは対照的に,我々のアプローチはベクトル場を高速かつ低速なコンポーネントに分解する。
提案手法は,QSSA,PEA,CSPが提供する手法よりも,同等あるいは高い精度でSIM近似を提供することを示す。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 09:10:39 GMT)
A Temporal Bias Correction using a Machine Learning Attention model [0.0] バイアス補正(BC)法は、時間的バイアスを調整するのに苦労する。
BCメソッドは、連続するタイムポイント間の依存を無視します。
私たちは、時間的バイアスを修正するための新しいBC方法論を提供しています。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 12:17:50 GMT)
3D Holistic OR Anonymization [0.0] 手術室の多視点RGB-Dビデオ記録(OR)を自動的に匿名化する新しい手法を提案する。
匿名化手法は,各画像の顔を異なる顔に置き換えることで,元のデータ分布を保存する。
確立された匿名化法とは対照的に,本手法は2次元空間ではなく,まず3次元空間の顔の局所化を行う。
論文参考訳(メタデータ) (Mon, 18 Mar 2024 23:32:02 GMT)