Fugu-MT: arxivの論文翻訳(概要)

Embrace Divergence for Richer Insights: A Multi-document Summarization Benchmark and a Case Study on Summarizing Diverse Information from News Articles [136.8]
同一イベントを含む複数のニュース記事において遭遇する多様な情報を要約する新しい課題を提案する。この作業を容易にするために、多様な情報を特定するためのデータ収集スキーマの概要と、DiverseSummというデータセットをキュレートした。データセットには245のニュース記事が含まれており、各ストーリーは10のニュース記事からなり、人間公認の参照と組み合わせられる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:54:04 GMT)
Open-sourced Data Ecosystem in Autonomous Driving: the Present and Future [130.9]
このレビューは、70以上のオープンソースの自動運転データセットを体系的に評価する。高品質なデータセットの作成の基礎となる原則など、さまざまな側面に関する洞察を提供する。また、解決を保障する科学的、技術的課題も検討している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:45:41 GMT)
IS-Fusion: Instance-Scene Collaborative Fusion for Multimodal 3D Object Detection [130.4]
我々は,イノベーティブなマルチモーダル融合フレームワークであるIS-Fusionを提案する。インスタンスレベルのコンテキスト情報とシーンレベルのコンテキスト情報をキャプチャする。 Is-Fusionは基本的に、BEVシーンレベルの融合のみに焦点を当てた既存のアプローチとは異なる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:34:17 GMT)
Gradient-based Sampling for Class Imbalanced Semi-supervised Object Detection [111.1]
半教師付き物体検出(SSOD)におけるクラス不均衡問題を,より困難なシナリオ下で検討する。本稿では,2種類の確認バイアスの観点から,クラス不均衡問題に対処する,単純かつ効果的な勾配に基づくサンプリングフレームワークを提案する。提案手法は,MS-COCO,MS-COCO,Object365,LVISの3種類のサブタスクにおいて,現行の非平衡物体検出器よりもクリアマージンの方が優れていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:30:10 GMT)
Dynamic-SUPERB: Towards A Dynamic, Collaborative, and Comprehensive Instruction-Tuning Benchmark for Speech [107.8]
テキスト言語モデルは、よく整形された命令が与えられたときに、目に見えないタスクに一般化する際、顕著なゼロショット能力を示している。ゼロショット方式で複数のタスクを実行するための命令チューニングを活用できるユニバーサル音声モデルを構築するためのベンチマークであるDynamic-SUPERBを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:25:04 GMT)
SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。 GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:52:15 GMT)
Recent Trends in 3D Reconstruction of General Non-Rigid Scenes [104.1]
コンピュータグラフィックスやコンピュータビジョンにおいて、3次元幾何学、外観、実際のシーンの動きを含む現実世界のモデルの再構築が不可欠である。これは、映画産業やAR/VRアプリケーションに有用な、フォトリアリスティックなノベルビューの合成を可能にする。この最新技術レポート(STAR)は、モノクロおよびマルチビュー入力による最新技術の概要を読者に提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:46:11 GMT)
MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training [103.7]
MLLM(Performant Multimodal Large Language Models)を構築する。特に,さまざまなアーキテクチャコンポーネントとデータ選択の重要性について検討する。本稿では,画像キャプチャ,インターリーブ画像テキスト,テキストのみのデータを組み合わせた大規模マルチモーダル事前学習について述べる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:03:16 GMT)
Eyes Closed, Safety On: Protecting Multimodal LLMs via Image-to-Text Transformation [98.0]
MLLMの安全性を意識した新しいトレーニング不要保護手法ECSO(Eyes Closed, Safety On, Eyes Closed, Safety On)を提案する。 ECSOは、安全でない画像をテキストに適応的に変換することで、より安全な応答を生成し、あらかじめ整列されたLCMの本質的な安全性メカニズムを活性化する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:07:06 GMT)
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality [95.8]
mPLUG-Owlは、大規模言語モデル(LLM)にマルチモーダル能力を持たせる訓練パラダイムである。トレーニングパラダイムは、LLMの助けを借りて視覚知識を学ぶ、画像とテキストの整列のための2段階の手法を含む。実験の結果,本モデルは既存のマルチモーダルモデルよりも優れていた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:23:22 GMT)
UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.8]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:36:50 GMT)
Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation [88.8]
インスタンスイメージゴールナビゲーション(IIN)は、探索されていない環境でゴールイメージによって表現された指定されたオブジェクトにナビゲートすることを目的としている。本稿では、インスタンスレベルの画像目標ナビゲーションのための新しいモジュール型ナビゲーションフレームワーク、Exploration-Verification-Exploitation (IEVE)を提案する。我々の手法は従来の最先端の手法を超越し、古典的セグメンテーションモデル(0.684対0.561成功)またはロバストモデル(0.702対0.561成功)を用いる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:23:51 GMT)
Can large language models explore in-context? [87.5]
単純なマルチアームバンディット環境において,エージェントとして大規模言語モデルをデプロイする。モデルが実質的な介入なしには、探索にしっかりと関わっていないことが分かっています。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:50:43 GMT)
RoleInteract: Evaluating the Social Interaction of Role-Playing Agents [85.7]
社会的相互作用の個人レベルとグループレベルの両方において、ロールプレイング・会話エージェントの社会的性を評価するために設計された最初のベンチマークを紹介する。ベンチマークはさまざまなソースから構築され、500文字以上と6000以上の質問プロンプトをカバーする。個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:49:59 GMT)
Local Search GFlowNets [85.0]
Generative Flow Networks (GFlowNets) は、報酬に比例した離散オブジェクト上の分布を学習するアモータイズされたサンプリング手法である。 GFlowNetsは、多様なサンプルを生成する素晴らしい能力を示していますが、広いサンプル空間での過剰な探索のために、常に高い報酬を持つサンプルを生成するのに苦労することがあります。本稿では,局所探索によるGFlowNetsの学習を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:49:46 GMT)
Learning for Transductive Threshold Calibration in Open-World Recognition [83.4]
グラフニューラルネットワークを用いた高剛性と適応性を有するトランスダクティブしきい値キャリブレーション法であるOpenGCNを導入する。オープンワールドの視覚認識ベンチマークにおける実験は、オープンワールドのしきい値校正のための既存のポストホック校正方法よりもOpenGCNの方が優れていることを検証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:39:54 GMT)
Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.9]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。 LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:29:01 GMT)
LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement [79.3]
LLM2LLMは、教師のLLMを使用して、特定のタスクの微調整に使用できる追加データを追加することで、小さなシードデータセットを強化する。 GSM8Kデータセットでは最大24.2%、CaseHOLDでは32.6%、SNIPSでは32.0%、TRECでは52.6%、SST-2では39.8%の改善が達成された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:57:07 GMT)
SecondPose: SE(3)-Consistent Dual-Stream Feature Fusion for Category-Level Pose Estimation [79.1]
カテゴリーレベルのオブジェクトのポーズ推定は、既知のカテゴリから6次元のポーズと3次元の大きさを予測することを目的としている。我々は、DINOv2のセマンティックカテゴリにオブジェクト固有の幾何学的特徴を統合する新しいアプローチであるSecondPoseを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:36:02 GMT)
VideoPoet: A Large Language Model for Zero-Shot Video Generation [78.6]
VideoPoetは、高品質なビデオと一致するオーディオを合成できる言語モデルである。 VideoPoetはマルチモーダル入力を処理するデコーダのみのトランスフォーマーアーキテクチャを採用している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:06:53 GMT)
LSKNet: A Foundation Lightweight Backbone for Remote Sensing [78.3]
本稿では,軽量なLarge Selective Kernel Network (LSKNet) バックボーンを提案する。 LSKNetはその大きな空間受容場を調整し、リモートセンシングシナリオにおける様々なオブジェクトの範囲をモデル化する。我々の軽量LSKNetは、標準リモートセンシング分類、オブジェクト検出、セマンティックセグメンテーションベンチマークに基づいて、最先端のスコアを設定しています。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:39:20 GMT)
Selecting Query-bag as Pseudo Relevance Feedback for Information-seeking Conversations [76.7]
情報検索対話システムは電子商取引システムで広く利用されている。クエリバッグに基づくPseudo Relevance Feedback framework(QB-PRF)を提案する。関連クエリを備えたクエリバッグを構築し、擬似シグナルとして機能し、情報検索の会話をガイドする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:10:32 GMT)
LATTE3D: Large-scale Amortized Text-To-Enhanced3D Synthesis [76.4]
LATTE3Dは400msで3Dオブジェクトを生成し、高速なテストタイム最適化でさらに拡張することができる。 LATTE3Dを導入し、これらの制限に対処し、より大きなプロンプトセット上で高速で高品質な生成を実現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:59:37 GMT)
Large Multilingual Models Pivot Zero-Shot Multimodal Learning across Languages [76.4]
MPMは、英語以外の言語で大規模なマルチモーダルモデルを訓練するための効果的な訓練パラダイムである。画像・テキスト・テキスト・画像生成における大規模なマルチモーダルモデルVisCPMを構築し,中国語の最先端(オープンソース)性能を実現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:24:57 GMT)
D-SCo: Dual-Stream Conditional Diffusion for Monocular Hand-Held Object Reconstruction [74.5]
モノクローナルハンドヘルドオブジェクト再構成のためのCentroid-fixed dual-stream conditionalfusionを導入する。まず、対象のセントロイドがずれることを避けるために、手動制約付きセントロイド固定パラダイムを用いる。第2に、意味的および幾何学的に手動物体の相互作用をモデル化するための二重ストリームデノイザを導入する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:45:52 GMT)
Metric3D v2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.3]
Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。距離深度推定と表面正規度推定の両方の解を提案する。本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:30:46 GMT)
Blockchain-based Pseudonym Management for Vehicle Twin Migrations in Vehicular Edge Metaverse [73.8]
Vehicle Twins(VT)は、VMUの運転安全性と車載満足度を改善するために、貴重なメタバースサービスを提供している。中断しないメタバース体験を維持するためには、VTは車両の動きに従ってエッジサーバ間で移動する必要がある。これにより、車両のエッジメタバース間の動的通信中にプライバシー侵害が懸念される可能性がある。既存の偽名管理手法は、車両のエッジメタバースにおける広範囲な偽名要求を満たすには不十分である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:31:37 GMT)
Not All Attention is Needed: Parameter and Computation Efficient Transfer Learning for Multi-modal Large Language Models [73.5]
MLLM(Multi-modal Large Language Models)のための新しいパラメータと計算効率のチューニング手法を提案する。 The Efficient Attention Skipping (EAS) method evaluate the attention redundancy and skips the less important MHAs to speed up inference。実験により、EASは高い性能とパラメータ効率を維持するだけでなく、推論速度を大幅に高速化することが示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:20:34 GMT)
DreamFlow: High-Quality Text-to-3D Generation by Approximating Probability Flow [72.9]
本稿では,T2I拡散を利用したテキスト・ツー・3Dの最適化手法を提案する。提案手法を応用して,実用的な3段階間粗大なテキスト・ツー・3D最適化フレームワークであるDreamFlowを設計する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:38:15 GMT)
FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions [71.6]
Information Retrievalモデルは命令を正しく使うことができず、基本的なキーワードとして使うことができず、長文情報を理解するのに苦労している。このデータセットには厳密なインストラクション評価ベンチマークと、IRモデルによる実世界のインストラクションの学習を支援するトレーニングセットが含まれています。この結果から,既存の検索モデルでは命令を正しく使用できず,基本キーワードとして使用し,長文情報の理解に苦慮していることが示唆された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:42:29 GMT)
Hulk: A Universal Knowledge Translator for Human-Centric Tasks [69.9]
我々は、最初のマルチモーダルな人間中心ジェネラリストモデルであるハルクを提示する。 2Dビジョン、3Dビジョン、スケルトンベース、そしてタスク固有の微調整なしで視覚言語タスクに対処する。 Hulkは11のベンチマークで最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:47:00 GMT)
Mixture of Cluster-conditional LoRA Experts for Vision-language Instruction Tuning [68.9]
クラスタ条件付きLoRAエキスパート(MoCLE)の混合は、命令クラスタに基づいてタスクカストマイズされたモデルパラメータを活性化するように設計されている。新たな命令に対するMoCLEの一般化能力を改善するために、別個のユニバーサルエキスパートが組み込まれている。 11のゼロショットタスクの実験では、MoCLEの有効性が示されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:36:53 GMT)
DragAPart: Learning a Part-Level Motion Prior for Articulated Objects [68.0]
DragAPartは、ドラッグのアクションと互換性のある新しい状態において、同じオブジェクトの新しいイメージを生成するメソッドである。従来の動作制御ジェネレータと比較して、より優れた部分レベルの動作理解を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:58:59 GMT)
FunQA: Towards Surprising Video Comprehension [64.6]
本稿では,挑戦的なビデオ質問応答データセットであるFunQAを紹介する。 FunQAはHumorQA、CreativeQA、MagicQAの3種類の驚くべきビデオをカバーしている。 FunQAベンチマークは4.3Kビデオクリップから派生した312KのフリーテキストQAペアで構成されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:24:35 GMT)
Inducing High Energy-Latency of Large Vision-Language Models with Verbose Images [63.9]
大規模視覚言語モデル(VLM)は、様々なマルチモーダルタスクにおいて例外的な性能を達成している。本稿では,VLMの推論中に高エネルギー遅延コストを誘導することを目的とする。本稿では,長い文を生成するためにVLMを誘導するために,知覚不能な摂動を作り出すことを目的とした冗長な画像を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:31:39 GMT)
Comprehensive Reassessment of Large-Scale Evaluation Outcomes in LLMs: A Multifaceted Statistical Approach [63.0]
評価の結果、スケーリング、トレーニングタイプ、アーキテクチャなどの要因がLLMのパフォーマンスに大きな影響を与えていることが明らかになった。本研究は, これらのLCMの徹底的な再検討に着手し, 現状評価手法における不整合性に着目した。これには、ANOVA、Tukey HSDテスト、GAMM、クラスタリング技術などが含まれる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:47:35 GMT)
ThemeStation: Generating Theme-Aware 3D Assets from Few Exemplars [62.3]
現実世界のアプリケーションは、一貫したテーマを共有する3Dアセットの大規模なギャラリーを必要とすることが多い。テーマを意識した3D-to-3D生成のための新しいアプローチであるThemeStationを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:59:01 GMT)
LSK3DNet: Towards Effective and Efficient 3D Perception with Large Sparse Kernels [62.3]
大型スパースカーネル3次元ニューラルネットワーク(LSK3DNet) 提案手法は,SDS (Spatial-wise Dynamic Sparsity) とCWS (Channel-wise Weight Selection) の2成分からなる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:54:33 GMT)
An Open-World, Diverse, Cross-Spatial-Temporal Benchmark for Dynamic Wild Person Re-Identification [58.6]
人物再識別(ReID)は、データ駆動のディープラーニング技術のおかげで大きな進歩を遂げました。既存のベンチマークデータセットには多様性がなく、これらのデータに基づいてトレーニングされたモデルは、動的なワイルドシナリオに対してうまく一般化できない。 OWDと呼ばれる新しいOpen-World, Diverse, Cross-Spatial-Temporalデータセットを開発した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:21:51 GMT)
S-DyRF: Reference-Based Stylized Radiance Fields for Dynamic Scenes [58.1]
現在の3Dスタイリング手法は、現実世界の動的な性質に反する静的なシーンを想定することが多い。本稿では,動的ニューラルネットワークのための参照型時間スタイリング手法であるS-DyRFを提案する。合成と実世界の両方のデータセットを用いた実験により,本手法が有意なスタイリング結果をもたらすことが示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:05:33 GMT)
Generative Active Learning for Image Synthesis Personalization [57.0]
本稿では,伝統的に識別モデルを用いて研究されてきた能動的学習の生成モデルへの応用について検討する。生成モデル上でアクティブな学習を行う上での最大の課題は、クエリのオープンな性質にある。問合せ処理を半開問題に変換するために,アンカー方向の概念を導入する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:45:45 GMT)
Early Period of Training Impacts Out-of-Distribution Generalization [56.3]
ニューラルネットワークトレーニングの初期における学習力学とOOD一般化の関係について検討した。トレーニング中に異なる時間にトレーニング可能なパラメータ数を選択することは、ID結果に極端に影響を及ぼすことを示す。訓練初期におけるシャープネスの絶対値とフィッシャー情報の痕跡は,OOD一般化の指標にはならない。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:52:53 GMT)
BadCLIP: Trigger-Aware Prompt Learning for Backdoor Attacks on CLIP [55.3]
BadCLIPは、CLIPに対するバックドア攻撃において、新しく効果的なメカニズムの上に構築されている。画像に適用される学習可能なトリガーとトリガー対応コンテキストジェネレータで構成されており、トリガーはトリガー対応プロンプトを通じてテキスト機能を変更することができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:53:59 GMT)
TexRO: Generating Delicate Textures of 3D Models by Recursive Optimization [54.6]
TexROは、UVテクスチャを最適化することで、既知の3Dメッシュの繊細なテクスチャを生成する新しい方法である。テクスチャ品質,ディテール保存,視覚的一貫性,特に実行速度の観点から,TexROの優れた性能を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:45:51 GMT)
Spectral Motion Alignment for Video Motion Transfer using Diffusion Models [54.3]
スペクトル運動アライメント(英: Spectral Motion Alignment、SMA)は、フーリエ変換とウェーブレット変換を用いて運動ベクトルを洗練・整列するフレームワークである。 SMAは周波数領域の正規化を取り入れて動きパターンを学習し、全体フレームのグローバルな動きのダイナミクスの学習を容易にする。大規模な実験は、様々なビデオカスタマイズフレームワーク間の計算効率と互換性を維持しながら、モーション転送を改善するSMAの有効性を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:47:18 GMT)
From Complexity to Clarity: Analytical Expressions of Deep Neural Network Weights via Clifford's Geometric Algebra and Convexity [54.0]
我々は,標準正規化損失のトレーニングにおいて,深部ReLUニューラルネットワークの最適重みがトレーニングサンプルのウェッジ積によって与えられることを示した。トレーニング問題は、トレーニングデータセットの幾何学的構造をエンコードするウェッジ製品機能よりも凸最適化に還元される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:26:53 GMT)
EndoGSLAM: Real-Time Dense Reconstruction and Tracking in Endoscopic Surgeries using Gaussian Splatting [53.4]
EndoGSLAMは鏡視下手術の効率的なアプローチであり、合理化表現と微分ガウス化を統合している。実験の結果,EndoGSLAMは従来型あるいは神経型SLAMアプローチよりも術中可用性と再建品質のトレードオフが良好であることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:27:43 GMT)
A Picture Is Worth a Graph: Blueprint Debate on Graph for Multimodal Reasoning [53.4]
この研究は、過剰な要約による意見の自明化と、画像から導入された散逸した概念による焦点の転換という2つの主要な課題に対処する。この問題に対処するため,BDoG (Blueprint Debate on Graphs) と呼ばれる演目的(トップダウン)な議論手法を提案する。 BDoGでは、世界レベルの要約による意見の自明化を防止するために、ブループリントグラフに限定して議論を行う。さらに、BDoGはグラフ内の枝に証拠を格納することで、頻繁だが無関係な概念によって引き起こされる混乱を緩和する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:03:07 GMT)
Unified Language-Vision Pretraining in LLM with Dynamic Discrete Visual Tokenization [52.9]
非言語的なイメージを外国語のような個別のトークン列に変換するために、よく設計されたビジュアルトークン化器を導入する。結果として得られる視覚トークンは、単語に相応しいハイレベルな意味論を含み、画像から変化する動的シーケンス長もサポートする。この統合によりLaVITは、マルチモーダルコンテンツの理解と生成を同時に行うための印象的な汎用インターフェースとして機能する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:41:55 GMT)
Event-based Simultaneous Localization and Mapping: A Comprehensive Survey [52.7]
ローカライゼーションとマッピングタスクのための非同期および不規則なイベントストリームの利点を利用する、イベントベースのvSLAMアルゴリズムのレビュー。 Paperは、イベントベースのvSLAMメソッドを、特徴ベース、ダイレクト、モーション補償、ディープラーニングの4つのカテゴリに分類する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:36:32 GMT)
The Decisive Power of Indecision: Low-Variance Risk-Limiting Audits and Election Contestation via Marginal Mark Recording [51.8]
リスクリミット監査(リスクリミット監査、RLA)は、大規模な選挙の結果を検証する技術である。正確性に関する厳密な保証を提供する一方で、効率上の懸念と、それらが絶対的な結論ではなく統計的に提供しているという事実の両方によって広く採用が妨げられている。これは、証明可能な音のオーディションとしては初めてのものです。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:26:31 GMT)
Multi-perspective Memory Enhanced Network for Identifying Key Nodes in Social Networks [51.5]
ソーシャルネットワークにおけるキーノードを識別する新しいマルチパースペクティブメモリ拡張ネットワーク(MMEN)を提案する。 MMENは複数の視点からキーノードをマイニングし、履歴情報を記憶するためにメモリネットワークを利用する。我々の手法は過去の方法よりも大幅に優れている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:29:03 GMT)
Hierarchical Information Enhancement Network for Cascade Prediction in Social Networks [51.5]
カスケード予測のための階層型情報拡張ネットワーク(HIENet)を提案する。本手法では,基本カスケードシーケンス,ユーザソーシャルグラフ,サブカスケードグラフを統合フレームワークに統合する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:57:27 GMT)
InternVideo2: Scaling Video Foundation Models for Multimodal Video Understanding [50.9]
InternVideo2は、アクション認識、ハイライト、対話における最先端のパフォーマンスを実現する新しいビデオファンデーションモデル(FM)である。当社のアプローチでは,マスク付きビデオトークン再構成,クロスモーダルコントラスト学習,トークン予測といった,自己中心あるいは弱中心の学習フレームワークを統一する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:57:42 GMT)
Simultaneous symmetry breaking in spontaneous Floquet states: Floquet-Nambu-Goldstone modes, Floquet thermodynamics, and the time operator [49.2]
本研究では, 原子凝縮体の特異な場合に着目し, 自発フロッケ状態における同時対称性破砕について検討した。まず,ハミルトニアンのいくつかの対称性を同時に破壊する定常状態に対するナムブ・ゴールドストーン(NG)モードの量子化について述べる。フォーマリズムをフロケ状態にまで拡張し、同時にいくつかの対称性を破り、ゴールドストーンの定理が準エネルギーゼロのフロケ・ナンブ・ゴールドストーンモードの出現へと変換されることを示した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:37:24 GMT)
Neural Plasticity-Inspired Foundation Model for Observing the Earth Crossing Modalities [48.7]
我々の新しいアプローチは、脳科学における神経可塑性の概念を活用する、ダイナミックワンフォーオール(DOFA)モデルを導入している。このダイナミックなハイパーネットワークは、異なる波長に調整され、5つのセンサーのデータに基づいて1つの多目的トランスフォーマーを共同で訓練し、12の異なる地球観測タスクを遂行することを可能にする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:11:47 GMT)
Inferentialist Resource Semantics [48.7]
システムモデリングでは、システムは典型的にどのプロセスが実行されるかを示すリソースから構成される。本稿では,リソースセマンティクスにおいて,推論が汎用的で表現力豊かなフレームワークを実現する方法を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:35:48 GMT)
Controlled Training Data Generation with Diffusion Models [48.1]
本稿では,教師あり学習のためのトレーニングデータを生成するために,テキスト・ツー・イメージ生成モデルを制御する手法を提案する。本研究では,2つのフィードバック機構を備えたクローズドループシステムを開発した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:59:24 GMT)
VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding [47.6]
VisionGPT-3Dはマルチモーダル基盤モデルの強みを基盤として多目的なマルチモーダルフレームワークを提供する。様々なSOTAビジョンモデルをシームレスに統合し、SOTAビジョンモデルの選択に自動化をもたらす。 2次元深度マップ解析に対応する適切な3次元メッシュ生成アルゴリズムを特定し、多様なマルチモーダル入力に基づいて最適な結果を生成する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:26:05 GMT)
Hear Me, See Me, Understand Me: Audio-Visual Autism Behavior Recognition [47.6]
本稿では,音声・視覚自閉症の行動認識の新たな課題について紹介する。社会的行動認識は、AIによる自閉症スクリーニング研究において、これまで省略されてきた重要な側面である。データセット、コード、事前トレーニングされたモデルをリリースします。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:52:35 GMT)
Quantification using Permutation-Invariant Networks based on Histograms [47.5]
量子化とは、モデルが与えられたサンプルの袋の中で各クラスの有病率を予測するために訓練される教師付き学習タスクである。本稿では、対称的教師あり手法の適用が可能なシナリオにおいて、量子化タスクへのディープニューラルネットワークの適用について検討する。ヒストグラムに基づく置換不変表現に依存する新しいニューラルアーキテクチャHistNetQを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:25:38 GMT)
Argument-Aware Approach To Event Linking [47.4]
イベントリンクは、テキスト内のイベント参照と、知識ベース(KB)内の関連するノードを接続する。我々は、入力テキストにタグ付けされたイベント引数情報を追加することで、イベントリンクモデルを改善する。イベント引数の制御操作により、KB内インスタンスからKB外のトレーニング例を合成する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:32:43 GMT)
ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection [47.2]
本稿では,CLIP citeDBLP:conf/icml/RadfordKHRGASAM21を用いて,IDライクな外れ値を検出する新しいOOD検出フレームワークを提案する。強力なCLIPから恩恵を受けるため、モデルのプロンプトを学習するためには、少数のIDサンプルしか必要ありません。本手法は,様々な実世界の画像データセットにおいて,より優れた数ショット学習性能を実現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:05:58 GMT)
Long-CLIP: Unlocking the Long-Text Capability of CLIP [47.1]
Long-CLIPはContrastive Language-Image Pre-trainingに代わるプラグインとプレイである。 Long-CLIPは、長文入力をサポートし、ゼロショットの一般化性を維持または超える。 CLIPをプラグイン・アンド・プレイで置き換えることで、詳細なテキスト記述から画像を生成する機能が強化されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:58:16 GMT)
Augmented Reality based Simulated Data (ARSim) with multi-view consistency for AV perception networks [47.1]
ARSimは3次元合成オブジェクトを用いた実写多視点画像データの拡張を目的としたフレームワークである。実データを用いて簡易な仮想シーンを構築し,その内部に戦略的に3D合成資産を配置する。結果として得られたマルチビュー一貫性のあるデータセットは、自動運転車のためのマルチカメラ知覚ネットワークのトレーニングに使用される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:49:11 GMT)
Video Super-Resolution Transformer with Masked Inter&Intra-Frame Attention [46.7]
Vision Transformerは、低解像度のシーケンスで欠落した詳細を復元することに成功した。 VSRの精度が優れているにもかかわらず、計算負荷と大きなメモリフットプリントはトランスフォーマーベースのVSRモデルの展開を妨げる。マスク内およびフレーム間アテンション(MIA-VSR)を用いた新しい特徴レベルマスキング処理フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:14:53 GMT)
Knowledge Card: Filling LLMs' Knowledge Gaps with Plug-in Specialized Language Models [46.1]
我々は,新しい事実と関連する知識を汎用言語モデルにプラグインするモジュール型フレームワークであるKnowledge Cardを提案する。まず、特定のドメインやソースからコーパスで訓練された特殊な言語モデルであるナレッジカードを紹介します。次に,知識カードが生成した文書中の情報を動的に選択・保持する3つのコンテンツセレクタを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:04:41 GMT)
LLMR: Real-time Prompting of Interactive Worlds using Large Language Models [45.9]
Large Language Model for Mixed Reality (LLMR)は、インタラクティブなMixed Reality体験のリアルタイム作成と修正のためのフレームワークである。私たちのフレームワークはテキストインタラクションとUnityゲームエンジンに依存しています。 LLMRは標準のGPT-4を平均誤差率で4倍に上回る。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:28:17 GMT)
End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control [45.8]
本研究では, (e)NMPCの一部として最適性能を示すために, Koopman シュロゲートモデルの強化学習法を提案する。エンドツーエンドトレーニングモデルは,(e)NMPCにおけるシステム識別を用いてトレーニングしたモデルよりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:51:19 GMT)
A2DMN: Anatomy-Aware Dilated Multiscale Network for Breast Ultrasound Semantic Segmentation [45.0]
そこで本研究では, 乳腺解剖をエンコードするスムーズな表現法と, 微細な画像の詳細を捉えた新しい乳腺解剖ネットワークを提案する。複数の空間スケールにわたるコンテキスト情報を組み込んで、より正確な意味境界を生成する。以上の結果から, 提案法は, 筋肉, 乳腺, 腫瘍のセグメンテーションを有意に改善することが示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:31:24 GMT)
Differentially Private Ad Conversion Measurement [44.9]
我々は、差分プライバシー(DP)を用いたプライベート広告変換測定のための公式なフレームワークを開発する。特に、帰属規則の運用上有効な構成の概念を定義する。次に、実際に最も一般的に発生する構成の集合に対して、完全な特徴付けを提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:18:52 GMT)
Bootstrapped Training of Score-Conditioned Generator for Offline Design of Biological Sequences [44.4]
本稿では,スコア条件付きジェネレータ(BootGen)アルゴリズムのブートストラップ型学習法を提案する。第1段階では, アルゴリズムは, 高得点に基づくシーケンス生成の精度を高めるために, ランクに基づく重み付き生物配列生成装置を訓練する。次のステージはブートストレッピングで、プロキシスコア関数によってラベル付けされた自己生成データでトレーニングデータセットを拡張する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:43:38 GMT)
MSCoTDet: Language-driven Multi-modal Fusion for Improved Multispectral Pedestrian Detection [44.4]
マルチスペクトル歩行者検出は, 概日光の応用にとって魅力的な手法である。現在のモデルは、明らかなケースで歩行者を検出するのに失敗することが多い。本稿では,MSCoTDet(Multispectral Chain-of-Thought Detection)フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:50:27 GMT)
The Power of Bamboo: On the Post-Compromise Security for Searchable Symmetric Encryption [43.7]
動的検索可能な対称暗号(DSSE)により、ユーザは動的に更新されたデータベース上のキーワード検索を、誠実だが正確なサーバに委譲することができる。本稿では,DSSEに対する新たな,実用的なセキュリティリスク,すなわち秘密鍵妥協について検討する。キー更新(SEKU)による検索可能な暗号化の概念を導入し,非対話型キー更新のオプションを提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:21:47 GMT)
WSCLoc: Weakly-Supervised Sparse-View Camera Relocalization [42.9]
WSCLocは、様々なディープラーニングベースの再ローカライゼーションモデルにカスタマイズできるシステムである。最初の段階では、WSCLocはWFT-NeRFと呼ばれる多層パーセプトロン構造を用いて画像再構成の品質を最適化する。第2段階では,事前学習したWFT-NeRFとWFT-Poseを併用する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:15:44 GMT)
NAYER: Noisy Layer Data Generation for Efficient and Effective Data-free Knowledge Distillation [42.4]
Data-Free Knowledge Distillation (DFKD)は、教師のニューラルネットワークから学生のニューラルネットワークに、元のデータにアクセスせずに知識を移すことによって、近年大きな進歩を遂げている。既存のアプローチは、本質的に意味のある情報を欠くランダムノイズ入力からサンプルを生成する際に、重大な課題に直面する。本稿では,入力からノイズ層へランダムなソースを移動させる新しいノイズ層生成法(NAYER)を提案し,その入力として有意な定数ラベルテキスト埋め込み(LTE)を利用する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:46:44 GMT)
Local and Global Trend Bayesian Exponential Smoothing Models [42.2]
本稿では、加法的および乗法的指数的平滑化モデルの一般化とみなすことができる季節・ノンシーズン時系列モデルのファミリーについて述べる。我々のモデルは、加法から乗法へのスムーズな変化が可能な大域的な傾向を持ち、線形局所的傾向と組み合わせられる。我々は、標準的な指数的滑らか化モデルよりも複雑で柔軟なこれらのモデルを正確に適合させるために、最先端のベイズフィッティング技術を活用している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:49:41 GMT)
Rethinking Boundary Discontinuity Problem for Oriented Object Detection [42.1]
最先端のIoUライクな手法でさえ境界不連続問題を解くことができないことを示す。既存のIoUライクな手法では、このモデルは基本的に箱と物体の間の角関係を適合させようとするが、そこでは角境界のブレークポイントが予測を非常に不安定にする。そこで我々は, 可逆性と結合最適化を, 単一の平滑化関数から2つの異なるエンティティに分離し, 角境界補正と他のパラメータとのブレンディングの両目的を初めて達成する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:07:25 GMT)
A Technological Perspective on Misuse of Available AI [41.9]
民間人工知能(AI)の悪意ある誤用は、国家や国際レベルでのセキュリティに深刻な脅威をもたらす可能性がある。既存のオープンなAI技術が、いかに誤用されているかを示します。我々は、政治的、デジタル的、物理的セキュリティを脅かす、潜在的に誤用されたAIの典型的なユースケースを3つ開発する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:30:58 GMT)
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks [41.6]
本稿では,ビデオ編集を2つのステップに簡略化する新しいトレーニングフリーフレームワークであるAnyV2Vを紹介する。最初の段階では、AnyV2Vは既存の画像編集ツールをプラグインして、幅広いビデオ編集タスクをサポートすることができる。従来のプロンプトベースの編集方法以外にも、AnyV2Vは参照ベースのスタイル転送、主題駆動編集、アイデンティティ操作などの新しいビデオ編集タスクもサポートする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:16:40 GMT)
BiTT: Bi-directional Texture Reconstruction of Interacting Two Hands from a Single Image [41.5]
BiTTは、2つの相互作用する手の位置を再現し、面白く、ポーズのないテクスチャを再構築するための、最初のエンドツーエンドのトレーニング方法である。 In experiment using InterHand2.6M and RGB2Hands datasets, we method significantlyforms state-of-the-the-art hand texture reconstruction method。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:06:31 GMT)
Mean-field Analysis on Two-layer Neural Networks from a Kernel Perspective [40.7]
2層ニューラルネットワークは、どのカーネル手法よりも効率的に複数の再生カーネルヒルベルト空間の結合を学習できることを示す。また,グローバルな最適度に収束するラベルノイズプロシージャを開発し,その自由度が暗黙の正規化として現れることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:41:57 GMT)
CR3DT: Camera-RADAR Fusion for 3D Detection and Tracking [40.6]
Camera-RADAR 3D Detection and Tracking (CR3DT)は3Dオブジェクト検出のためのカメラ・レーダ融合モデルであり、Multi-Object Tracking (MOT) である。 State-of-the-Art (SotA)カメラ専用のBEVDetアーキテクチャの基礎の上に構築されたCR3DTは、検出機能とトラッキング機能の両方で大幅に改善されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:06:05 GMT)
Trajectory Regularization Enhances Self-Supervised Geometric Representation [40.5]
SSL幾何表現を評価するための新しいポーズ推定ベンチマークを導入する。意味分類の精度を犠牲にすることなくSSL幾何学的表現の強化について検討する。中間層表現の活用により,ポーズ推定性能が10～20%向上することが判明した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:04:11 GMT)
FSC: Few-point Shape Completion [39.4]
64点などの数点でさえ、物体の3次元形状を復元するのに十分な情報を保持できることが示される。極めてスパースな入力を処理するための新しいデュアルブランチ特徴抽出器を含むFew-point Shape Completionモデルを提案する。実験では,数点から3次元形状を復元できる可能性を示した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:33:51 GMT)
Toward Tiny and High-quality Facial Makeup with Data Amplify Learning [39.3]
小型メイクモデル「TinyBeauty」とともに「データ増幅学習」を提案する。 DALの中核となる考え方は、DDA(Diffusion-based Data Amplifier)を使用して、モデルトレーニングのために制限されたイメージを"増幅"することにある。 TinyBeautyはiPhone 13で460fpsという驚くべき速度を実現している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:32:30 GMT)
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference [38.8]
線形計算複雑性マルチモーダル言語モデル(MLLM)であるCobraを提案する。特に、Cobraは効率的なMamba言語モデルを視覚的モダリティに統合する。プロジェクトページは、https://sites.google.com/view/cobravlm.com/com/com/cobravlm.comで公開されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:35:49 GMT)
InterFusion: Text-Driven Generation of 3D Human-Object Interaction [38.4]
ゼロショットテキスト・ツー・3D方式でテキスト記述から3次元オブジェクト間相互作用(HOI)を生成する複雑な課題に取り組む。本稿では,HOI生成に特化して設計された2段階フレームワークであるInterFusionを紹介する。実験の結果,InterFusionは3次元HOI生成において既存の最先端手法よりも優れていたことが確認された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:49:26 GMT)
RankPrompt: Step-by-Step Comparisons Make Language Models Better Reasoners [38.3]
大きな言語モデル(LLM)は、様々な推論タスクで素晴らしいパフォーマンスを実現しています。しかし、ChatGPTのような最先端のLCMでさえ、推論プロセス中に論理的な誤りを犯しやすい。新たなプロンプト手法である RankPrompt を導入し,LLM が追加リソースを必要とせずに応答を自己ランクできる手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:18:54 GMT)
Hyperbolic Metric Learning for Visual Outlier Detection [38.1]
Out-Of-Distribution (OOD)検出は、ディープラーニングモデルを安全クリティカルなアプリケーションにデプロイするために重要である。本研究は,OOD検出における双曲幾何学の強みを利用する計量フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:00:29 GMT)
LILAC: Log Parsing using LLMs with Adaptive Parsing Cache [38.0]
適応型解析キャッシュを備えた大規模言語モデル (LLM) を用いた最初の実用的なログ解析フレームワーク LILAC を提案する。 LLMの特殊なログ解析能力の欠如は、現在解析の正確さを妨げている。 LILACは,テンプレートの精度の平均F1スコアにおいて,最先端の手法よりも69.5%優れていた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:09:19 GMT)
Addressing Concept Shift in Online Time Series Forecasting: Detect-then-Adapt [38.0]
概念 textbfDrift textbfDetection antextbfD textbfAdaptation (D3A) まずドリフトの概念を検知し、次に急激な適応の検出の後、現在のモデルをドリフトされた概念に積極的に適応する。これは、トレイン-テストのパフォーマンスの不整合に寄与する重要な要因であるデータ分散ギャップを軽減するのに役立ちます。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:44:43 GMT)
Multimodal Fusion with Pre-Trained Model Features in Affective Behaviour Analysis In-the-wild [37.3]
本稿では,表現(Expr)認識とValence-Arousal(VA)推定の課題に対処するためのアプローチを提案する。我々は,事前学習モデルを用いてAff-Wild2データベースを評価し,モデルの最終層を特徴として抽出する。抽出した特徴を整合させる前処理や畳み込みに続いて、異なるモデルがモーダル融合に使用される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:00:24 GMT)
PLANNER: Generating Diversified Paragraph via Latent Language Diffusion Model [37.2]
本稿では,潜在意味の拡散と自己回帰生成を組み合わせ,流動的なテキストを生成するモデルであるPLANNERを提案する。意味生成, テキスト補完, 要約の結果は, 高品質な長文を生成する上での有効性を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:36:57 GMT)
UniChest: Conquer-and-Divide Pre-training for Multi-Source Chest X-Ray Classification [36.9]
UniChestはConquer-and-Divide事前トレーニングフレームワークで、複数のCXRソースのコラボレーション利益をフル活用することを目的としている。我々は、ChestX-ray14、CheXpert、Vindr-CXR、深セン、Open-I、SIIM-ACR Pneumothoraxなどの多くのベンチマークで徹底的な実験を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:33:14 GMT)
Defying Imbalanced Forgetting in Class Incremental Learning [36.9]
我々は,同じ古いタスクにおいて,異なるクラスの精度の高レベルの不均衡を初めて観察する。この現象は、破滅的な忘れ物が起こる前にその正確さが似ているため、学習クラスの不均衡な忘れ物が強調される。我々は,忘れられやすい古いクラスを予測し,その精度を高めるためにCLass-Aware Disentanglementを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:06:44 GMT)
STAG4D: Spatial-Temporal Anchored Generative 4D Gaussians [36.8]
STAG4Dは、事前訓練された拡散モデルと動的3次元ガウススプラッティングを組み合わせた、高忠実度4D生成のための新しいフレームワークである。提案手法は, レンダリング品質, 時空間整合性, 生成ロバスト性において, 先行4次元生成よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:16:33 GMT)
Improving the Robustness of Large Language Models via Consistency Alignment [36.2]
大規模言語モデル(LLM)は、ユーザ命令に従い、有用な応答を生成することで大きな成功を収めている。 LLMは、言語化された命令の微妙な変化により、非常に矛盾した応答を生成する。本稿では,教師付き微調整と整合性調整を併用した2段階のトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:34:47 GMT)
LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models [35.9]
大規模マルチモーダルモデル(LMM)は、視覚エンコーダと大規模言語モデルとを接続することで、重要な推論能力を示している。近年のLMMには、高解像度の画像やビデオなど、より複雑な視覚入力が組み込まれており、視覚トークンの数が大幅に増加する。そこで我々はPruMergeを提案する。PruMergeは適応型視覚トークン削減手法で、比較モデルの性能を維持しながら、視覚トークンの数を大幅に削減する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:59:52 GMT)
Your Image is My Video: Reshaping the Receptive Field via Image-To-Video Differentiable AutoAugmentation and Fusion [35.9]
本稿では,ビデオとして処理可能な画像のバリエーションを生成するために,最初の微分可能拡張探索法(DAS)を提案する。 DASは非常に高速で柔軟性があり、GPUの1日以内で非常に大きな検索スペースを検索できる。 DASを利用して、タスク依存変換を選択することにより、空間受容場の再構成を誘導する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:27:57 GMT)
On the Convergence of Adam under Non-uniform Smoothness: Separability from SGDM and Beyond [35.7]
我々は,非一様有界な滑らかさの条件下で,AdamがSGDMよりも高速な収束を実現することを示した。その結果,(1)決定論的環境下では,Adamは決定論的一階の収束率の既知下限を達成でき,一方,GDM(Gradient Descent with Momentum)の収束率は初期関数値に高い順序依存性を持つことがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:57:51 GMT)
SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery [35.6]
本稿では,2150万の時間的シーケンスを持つマルチモーダルリモートセンシングデータセットを事前トレーニングした総称10億スケールモデルSkySenseを提案する。我々の知る限り、SkySenseは今までで最大のマルチモーダルであり、モジュールを柔軟に組み合わせたり、個別に使用して様々なタスクに適合させることができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:46:36 GMT)
A Temporally Disentangled Contrastive Diffusion Model for Spatiotemporal Imputation [35.5]
C$2$TSDという条件拡散フレームワークを導入する。実世界の3つのデータセットに対する我々の実験は、最先端のベースラインと比較して、我々のアプローチの優れた性能を示している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:41:08 GMT)
Differentially Private Conditional Independence Testing [35.4]
条件独立テスト(CI)は統計データ解析に広く用いられている。本研究では,差分プライバシー制約下での条件付き独立試験について検討する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:40:59 GMT)
Clean-image Backdoor Attacks [35.3]
本稿では,バックドアが不正確なラベルで注入可能であることを明らかにするクリーンイメージバックドア攻撃を提案する。私たちの攻撃では、攻撃者はまず、トレーニングイメージを2つの部分に分割するトリガー機能を探します。バックドアは、毒データで訓練された後、最終的にターゲットモデルに埋め込まれる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:47:13 GMT)
Subjective Quality Assessment of Compressed Tone-Mapped High Dynamic Range Videos [35.2]
ストリーミングHDRビデオの視覚的品質に及ぼすトネマッピング演算子の影響を解析する。我々は、圧縮トーンマップ付きHDRビデオの大規模主観的オープンソースデータベースを構築した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:38:16 GMT)
On the validity of the rotating wave approximation for coupled harmonic oscillators [34.8]
我々は、シンプレクティック幾何の道具を用いて解析的に力学を解く。フルハミルトニアンと初期状態に存在するスクイージングは、近似された進化からの偏差を支配している。また、共振周波数と周波数比との結合を解消するために、回転波近似が復元されることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:51:53 GMT)
AllHands: Ask Me Anything on Large-scale Verbatim Feedback via Large Language Models [34.8]
Allhandsは、自然言語インタフェースによる大規模なフィードバック分析のために設計された革新的な分析フレームワークである。 LLMは、精度、堅牢性、一般化、ユーザフレンドリー性を高める大きな言語モデルである。 Allhandsは、テキスト、コード、テーブル、イメージを含む、包括的なマルチモーダルレスポンスを提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:13:16 GMT)
An Agnostic View on the Cost of Overfitting in (Kernel) Ridge Regression [34.3]
雑音性カーネルリッジ回帰(KRR)におけるオーバーフィッティングのコストについて検討する。サンプルサイズが整合性に十分でない場合や,RKHSの外部にある場合であっても,そのコストは対象関数のサンプルサイズ関数として考慮する。我々の分析は、良心的、誘惑的、破滅的なオーバーフィッティングのより洗練された特徴を提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:20:30 GMT)
Pixel-GS: Density Control with Pixel-aware Gradient for 3D Gaussian Splatting [34.1]
3D Gaussian Splatting (3DGS) は、リアルタイムレンダリング性能を向上しながら、印象的なビュー合成結果を示した。しかし、初期点雲の品質に大きく依存しており、初期化点が不十分な地域では、ぼやけや針状のアーティファクトが生じる。これは主に3DGSの点雲成長条件によるもので、観測可能な視点からの平均勾配等級しか考慮していない。成長条件の計算において,各視点でガウスがカバーする画素数を考慮し,Pixel-GSという新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:59:21 GMT)
BSNet: Box-Supervised Simulation-assisted Mean Teacher for 3D Instance Segmentation [33.6]
3Dインスタンスのセグメンテーションは重要なタスクですが、ポイントレベルのアノテーションは、完全に教師された設定では面倒です。 Box-assisted Simulation-assisted Mean Teacher for 3D Instance (BSNet)は、Transformerと呼ばれる新しい擬似ラベルを考案した。 1つ目はシミュレーション支援平均教師シミュレーションであり、このタスクで初めて平均教師を紹介している。また,教師や学生のラベリングのためのデコーダとして,ローカル・グローバル・アウェア・アテンション(Local-Global Aware Attention)を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:05:30 GMT)
Adaptive Coded Federated Learning: Privacy Preservation and Straggler Mitigation [33.6]
トラグラーの負の影響を軽減するために、符号化された連合学習フレームワークが提案されている。本稿では,この欠点を克服するために,適応符号化フェデレーション学習(ACFL)という新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:51:48 GMT)
From Hardware Fingerprint to Access Token: Enhancing the Authentication on IoT Devices [33.3]
MCUベースのIoTデバイスのためのセキュアなハードウェアフィンガープリントフレームワークであるMCU-Tokenを紹介する。 MCU-Tokenは、さまざまなIoTデバイスやアプリケーションシナリオ間のオーバーヘッドを低くして、高い精度(97%以上)を達成することができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:15:28 GMT)
Self-Guard: Empower the LLM to Safeguard Itself [33.2]
ジェイルブレイク攻撃には2つの主要なアプローチがある。本稿では,両安全性手法の強みを組み合わせた,セルフガードと呼ばれる新しいアプローチを提案する。この実験は、セルフガードがジェイルブレイク攻撃に対して堅牢であることを示した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:02:11 GMT)
Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection [32.9]
本稿では,弱半教師付き3D検出のための教師支援フレームワークであるPoint-DETR3Dを紹介する。ラベル付きデータの5%しか持たないPoint-DETR3Dは、完全な教師付きデータのパフォーマンスを90%以上達成している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:11:29 GMT)
DP-Dueling: Learning from Preference Feedback without Compromising User Privacy [32.6]
ユーザ好みでアクティブな学習を行うための,最初の微分プライベートなダリング帯域幅アルゴリズムを提案する。我々のアルゴリズムは、ほぼ最適性能で計算効率が良い。我々は結果を任意の一般的な決定空間に拡張し、潜在的に無限の腕を持つ$d$次元を持つ。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:02:12 GMT)
PPA-Game: Characterizing and Learning Competitive Dynamics Among Online Content Creators [32.3]
本稿では,PPA-Game(Proportional Payoff Allocation Game)を導入し,エージェントがさまざまなリソースと消費者の注意を競う方法をモデル化する。分析の結果, 純粋なナッシュ平衡 (PNE) はすべてのシナリオにおいて保証されていないが, 一般的に観察される。本稿では,各エージェントの累積支払をT$ラウンドで行うことを容易にするオンラインアルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:13:11 GMT)
DITTO: Demonstration Imitation by Trajectory Transformation [31.9]
ロボットに新しいスキルを迅速かつ便利に教えることは、ロボットシステムの普及に不可欠である。我々は、RGB-Dビデオ録画による1人の人間の実演から1発の模倣の問題に対処する。コードはhttp://ditto.cs.uni-freiburg.deで公開しています。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:46:51 GMT)
An Optimization Framework to Enforce Multi-View Consistency for Texturing 3D Meshes Using Pre-Trained Text-to-Image Models [31.6]
本稿では,多視点整合性を実現するために,4段階の最適化フレームワークを提案する。第3段と第4段は繰り返し,第4段のカットは第3段の非剛性アライメントを奨励し,カットに近い領域に焦点を合わせている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:28:04 GMT)
Simple Graph Condensation [30.9]
グラフ凝縮(Graph condensation)は、グラフニューラルネットワーク(GNN)を小さな凝縮グラフにチューニングし、大規模なオリジナルグラフで使用する。既存の手法は主に、GNNの勾配、分布、軌跡など、凝縮グラフと原グラフの間のキーメトリックの整合に重点を置いている。本稿では,GNNから受け継いだ不要な複雑性を低減することを目的とした,グラフ凝縮における計量アライメントの簡易化手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:04:48 GMT)
FileDES: A Secure Scalable and Succinct Decentralized Encrypted Storage Network [30.8]
分散ストレージネットワーク(DSN)は、従来のクラウドベースのストレージシステムに挑戦する新興技術である。本稿では,プライバシ保護,拡張性のあるストレージ証明,バッチ検証という,3つの重要な要素を取り入れたFileDESを提案する。我々のプロトコルは、証明生成/検証効率、ストレージコスト、スケーラビリティにおいて他よりも優れています。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:41:30 GMT)
Faster Neighborhood Attention: Reducing the O(n^2) Cost of Self Attention at the Threadblock Level [30.7]
近隣の注意は、それぞれのトークンの注意を隣人に限定することで、自己注意のコストを減少させる。そこで本研究では,従来のGEMM問題と同様に,近隣の注意をバッチ化したGEMM問題として表現し,その実装を1次元,2次元の近所の注意のために行なえることを示す。我々はまた、異なる空間軸にまたがる注意を細かく制御できる、融合したドット積アテンションカーネルの適応として、融合した近傍アテンションも展開する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:26:40 GMT)
Sparse Mean Field Load Balancing in Large Localized Queueing Systems [30.7]
我々は、疎結合な待ち行列ネットワークにおいて、ほぼ最適負荷分散ポリシーを抽出可能な方法で学習する。境界次数という文脈で新しい平均場制御問題を定式化することにより、そうでなければ難しいマルチエージェント問題を単一エージェント問題に還元する。提案手法は,現実的かつスケーラブルな無線ネットワークトポロジでよく機能する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:00:47 GMT)
Imagination Augmented Generation: Learning to Imagine Richer Context for Question Answering over Large Language Models [30.4]
知識強化フレームワークImagination-Augmented-Generation(IAG)を提案する。 IAGは人間の能力をシミュレートし、知識不足を補うと同時に、外部リソースに頼ることなく、想像のみで質問に答える。 3つのデータセットの実験結果から、IMcQAはオープンドメインとクローズドブックの両方で大きな優位性を示すことが示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:06:45 GMT)
Multiple-Input Auto-Encoder Guided Feature Selection for IoT Intrusion Detection Systems [30.2]
本稿ではまず,Multiple-Input Auto-Encoder (MIAE)と呼ばれる新しいニューラルネットワークアーキテクチャを紹介する。 MIAEは複数のサブエンコーダで構成されており、異なる特性を持つ異なるソースからの入力を処理できる。より関連性の高い機能を排除し、保持するために、トレーニングプロセスにおいて重要/冗長でないものを取り除くために、我々はさらに機能選択層を設計し、組み込む。この層は表現ベクトルにおける特徴の重要性を学習し、表現ベクトルから情報的特徴の選択を容易にする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:54:04 GMT)
Content Knowledge Identification with Multi-Agent Large Language Models (LLMs) [30.2]
教師の数学的内容知識(CK)は、教師の専門的開発(PD)プログラムにおいて不可欠である。コンピュータ支援型非同期PDシステムは近年提案されているPD技術であり、時間や場所のコストや制限に対する懸念が少なく、教師のPD改善を支援することを目的としている。非同期PDシステムの中核技術の一つである現在の自動CK識別手法は,ユーザ応答の多様性,高品質な注釈付きデータの不足,予測の解釈可能性の低下といった課題に直面している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:37:33 GMT)
Retrieval-Augmented Layout Transformer for Content-Aware Layout Generation [30.1]
コンテンツ対応グラフィックレイアウト生成は、Eコマース製品イメージなどの所定のコンテンツとともに、視覚要素を自動的に配置することを目的としている。単純な検索拡張により生成品質が大幅に向上することを示す。 Retrieval-Augmented Layout Transformer (RALF) と呼ばれる我々のモデルは、入力画像に基づいて近接したレイアウト例を検索し、これらの結果を自己回帰生成器に供給する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:46:55 GMT)
Conformal online model aggregation [29.4]
本稿では,オンライン環境における共形モデルアグリゲーションへの新たなアプローチを提案する。これは、過去の性能に基づいてモデルの重みが時間とともに適応される投票によって、いくつかのアルゴリズムの予測セットを組み合わせることに基づいている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:40:06 GMT)
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting [28.0]
オープン語彙の3Dシーン理解はコンピュータビジョンにおいて重要な課題である。本稿では,セマンティックガウシアン(SemanticGaussians)について紹介する。提案手法は,従来のオープン語彙シーン理解手法よりも4.2%mIoUと4.0%mAccの改善を実現している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 21:28:19 GMT)
LEGO: Learning EGOcentric Action Frame Generation via Visual Instruction Tuning [27.7]
我々は、エゴセントリックなアクションフレーム生成という新しい問題を導入する。ユーザプロンプトと入力エゴセントリック画像に条件付けすることで、ユーザのコンテキスト(例えばアクションフレーム)におけるアクションを描写した画像を合成する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:03:34 GMT)
Safe Learning of PDDL Domains with Conditional Effects -- Extended Version [27.1]
実験されたほとんどの領域において、条件付きSAMはテストセット問題のほとんどを完璧に解くのに利用できることを示す。この結果から,Conditional-SAMで学習したアクションモデルを用いて,テストセット問題を完全に解決できることが示唆された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:49:49 GMT)
Planning with a Learned Policy Basis to Optimally Solve Complex Tasks [26.6]
本稿では,後継機能を用いて政策ベースを学習し,その中の各(サブ)政治が明確に定義されたサブプロブレムを解決することを提案する。同じサブプロブレムの集合を含む有限状態オートマトン(FSA)によって記述されるタスクでは、これらの(サブ)ポリケーションの組み合わせを使用して、追加の学習なしに最適な解を生成することができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:51:39 GMT)
A Unified Model for Longitudinal Multi-Modal Multi-View Prediction with Missingness [26.0]
本稿では,長手マルチモーダルマルチビュー予測のための統一モデルを提案する。提案手法は,入力に希望する時間ポイントを最大で確保し,利用可能なデータをすべて活用することを目的としている。変形性膝関節症とKellgren-Lawrenceグレード予測による膝関節症データセットに関する広範な実験を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:17:11 GMT)
HealMe: Harnessing Cognitive Reframing in Large Language Models for Psychotherapy [25.9]
メンタルエンハンスメント(HealMe)モデルにおける適応言語によるヘルピングとエンパワーメントについて紹介する。この新しい認知的リフレーミング療法は、根深い否定的思考に効果的に対処し、合理的でバランスの取れた視点を育む。我々は、認知リフレーミングのパフォーマンスを厳格に評価するために特別に設計された、包括的で専門的な心理学的評価指標を採用した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:34:38 GMT)
Forward Learning for Gradient-based Black-box Saliency Map Generation [25.6]
そこで我々は,ブラックボックス設定の勾配を推定し,モデル決定を解釈するためのサリエンシマップを生成する新しいフレームワークを提案する。本研究では,出力から入力までの勾配を推定し,その確率比法を用いてサリエンシマップ生成を行う。ブラックボックス設定における実験により,提案手法の有効性が検証され,精度の高い勾配推定と,生成した塩分濃度マップの説明可能性が確認された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:11:19 GMT)
CODA: A COst-efficient Test-time Domain Adaptation Mechanism for HAR [25.6]
モバイルセンシングのためのCOst- efficient Domain Adaptation 機構であるCODAを提案する。 CODAは、データ分散の観点からのリアルタイムドリフトにアクティブラーニング理論を用いて対処する。我々はCODAによるオンライン適応の可能性と可能性を実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:50:42 GMT)
RFI Detection with Spiking Neural Networks [25.1]
本研究では、スパイキングニューラルネットワーク(SNN)の天文学的データ処理タスク、特にRFI検出への最初の探索的応用について紹介する。 ANN2SNN変換によりSNN実行に最寄りのラテンネーブラーアルゴリズムとオートエンコーダアーキテクチャを適用する。我々のアプローチは、HERAデータセットのAUROC、AUPRC、F1の既存の手法と競合するが、LOFAR、Tabascalデータセットでは困難である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:54:09 GMT)
FairerCLIP: Debiasing CLIP's Zero-Shot Predictions using Functions in RKHSs [25.0]
本稿では,CLIPのゼロショット予測をより公平かつ堅牢に行うための一般手法であるFairerCLIPを提案する。ヒルベルト核空間(RKHS)の再生において,CLIPのイメージとテキスト表現を両立させる問題を定式化する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:41:26 GMT)
Tri-Perspective View Decomposition for Geometry-Aware Depth Completion [25.0]
Tri-Perspective View Decomposition (TPVD)は、3D幾何学を明示的にモデル化できる新しいフレームワークである。 TPVDは元の点雲を3つの2Dビューに分解する。 TPVDは、KITTI、NYUv2、SUN RGBDの既存の手法より優れている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:45:50 GMT)
Sphere Neural-Networks for Rational Reasoning [24.6]
ベクトルから球面への計算ビルディングブロックを一般化することにより、最小限の拡張を提案する。モデル構築と検査を通して人間のような推論を行うための球ニューラルネット(SphNN)を提案する。 SphNNは、ユーラー時間的推論、否定と解離を伴う論理的推論、イベント推論、ニューロシンボリック推論、ユーモア理解など、様々なタイプの推論に進化することができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:44:59 GMT)
Robust Conformal Prediction under Distribution Shift via Physics-Informed Structural Causal Model [24.6]
整形予測(CP)は、テスト入力上の集合を予測することによって不確実性を扱う。このカバレッジは、キャリブレーションとテストデータセットの差分分布が$P_X$であったとしても、テストデータ上で保証することができる。本稿では,上界を小さくする物理インフォームド構造因果モデル(PI-SCM)を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:13:33 GMT)
Multi-resolution Time-Series Transformer for Long-term Forecasting [24.5]
様々な時間パターンを異なる解像度で同時モデリングするための新しいフレームワークMTST(Multi- resolution Time-Series Transformer)を提案する。多くの既存の時系列変換器とは対照的に、異なるスケールで周期成分を抽出するのに適する相対的な位置符号化を用いる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:37:38 GMT)
Adapprox: Adaptive Approximation in Adam Optimization via Randomized Low-Rank Matrices [24.3]
Adapproxは、Adamの2番目の瞬間をより正確に近似するためにランダム化された低ランク行列近似を利用する新しいアプローチである。 GPT-2のトレーニングとダウンストリームタスクでは、アダポックスは34.5%から49.9%のメモリ節約を達成した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:23:31 GMT)
Scene-LLM: Extending Language Model for 3D Visual Understanding and Reasoning [24.2]
Scene-LLMは3次元視覚言語モデルであり、インタラクティブな3次元屋内環境におけるエンボディエージェントの能力を高める。 Scene-LLMを用いた実験は, 密接なキャプション, 質問応答, 対話型プランニングにおいて, 強力な機能を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:52:51 GMT)
Gaussian-SLAM: Photo-realistic Dense SLAM with Gaussian Splatting [24.2]
本稿では3次元ガウスアンをシーン表現として用いたSLAM法を提案する。本手法は,実世界のシングルカメラRGBDビデオから,インタラクティブなリアルタイム再構成と写真リアルレンダリングを実現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:59:09 GMT)
EthioLLM: Multilingual Large Language Models for Ethiopian Languages with Task Evaluation [24.1]
本稿では,エチオピア語5言語(Amharic, Ge'ez, Afan Oromo, Somali, Tigrinya)と英語の多言語大言語モデルであるEthioLLMを紹介する。我々は,5つの下流自然言語処理(NLP)タスクにおいて,これらのモデルの性能を評価する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:49:51 GMT)
MV-ROPE: Multi-view Constraints for Robust Category-level Object Pose and Size Estimation [23.6]
本稿では,RGBビデオストリームを利用した新しいソリューションを提案する。本フレームワークは,スケール対応単分子高密度SLAMソリューション,軽量オブジェクトポーズ予測器,オブジェクトレベルのポーズグラフの3つのモジュールから構成される。提案手法は,高精細度情報を用いた公開データセットを用いた場合,最先端のRGB-D手法に匹敵する性能を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:51:55 GMT)
Towards a Comprehensive, Efficient and Promptable Anatomic Structure Segmentation Model using 3D Whole-body CT Scans [23.6]
Segment Any Model (SAM) は、自然画像のセグメンテーションにおける強力な能力の一般化を示す。 3D放射線CTまたはMRIスキャンを分割するには、2D SAMモデルは数百の2Dスライスを別々に処理する必要がある。我々はCT-SAM3Dという全身CTセグメント化のための包括的でスケーラブルな3次元SAMモデルを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:40:52 GMT)
Online Open-set Semi-supervised Object Detection with Dual Competing Head [23.4]
本稿では,性能と効率を向上するエンドツーエンドのOSSODフレームワークを提案する。実験の結果,提案手法は既存の手法と比較してOSSODベンチマークの最先端性能を実現していることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:17:25 GMT)
On Zero-Shot Counterspeech Generation by LLMs [23.4]
対音声生成のためのゼロショット設定において,4つの大規模言語モデル(LLM)の性能を包括的に解析する。モデルの種類を考えると、GPT-2とFlanT5モデルは対音声品質においてかなり優れている。 ChatGPTは、すべてのメトリクスの他のモデルよりも、カウンタースピーチを生成するのがはるかに優れている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:13:10 GMT)
Learning to Importance Sample in Primary Sample Space [23.0]
本稿では,ニューラルネットワークを用いて,サンプルの集合に代表される所望密度からサンプルを抽出する方法を学習する,新たな重要サンプリング手法を提案する。提案手法は, 様々なシナリオにおいて, 効果的な分散低減につながることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:27:29 GMT)
Collaborative AI Teaming in Unknown Environments via Active Goal Deduction [22.8]
協調エージェントを訓練するための既存のアプローチは、しばしば定義され既知の報酬信号を必要とする。本稿では,カーネル密度ベイズ逆学習法をアクティブなゴール推論に活用する未知のエージェントフレームワークと組むことを提案する。我々のフレームワークにおける不偏報酬推定は、未知のエージェントと最適なチームを作るのに十分であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:50:56 GMT)
Do Vision and Language Encoders Represent the World Similarly? [22.7]
CLIPのようなアライメントされたテキストイメージエンコーダは、視覚言語タスクのデファクトモデルになっている。非整列および整列エンコーダの表現空間は意味論的に類似していることがわかった。 CLIPのようなアライメントエンコーダに統計的に類似性がない場合、アライメントされていないエンコーダのマッチングがトレーニングなしで存在することを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:39:41 GMT)
An Audio-Visual Speech Separation Model Inspired by Cortico-Thalamo-Cortical Circuits [22.6]
音声・視覚音声分離のための新しい皮質・視床・皮質神経回路(CTCNet)を提案する。 CTCNetは階層的な聴覚と視覚の表現をボトムアップで学習する。 3つの音声分離ベンチマークデータセットの実験では、CTCNetはパラメータがかなり少ない既存のAVSSメソッドよりも著しく優れていた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:33:35 GMT)
MC-NeRF: Multi-Camera Neural Radiance Fields for Multi-Camera Image Acquisition Systems [22.5]
ニューラル・ラジアンス・フィールド(NeRF)は3次元シーン表現にマルチビュー・イメージを使用し、顕著な性能を示す。以前のNeRFベースの手法のほとんどは、ユニークなカメラを前提としており、マルチカメラのシナリオをめったに考慮していない。提案するMC-NeRFは,内在パラメータと外在パラメータの両方を,NeRFと併用して共同最適化する手法である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:41:50 GMT)
Zero-Shot Cross-Lingual Document-Level Event Causality Identification with Heterogeneous Graph Contrastive Transfer Learning [22.4]
事象因果同定(英: Event Causality Identification、ECI)とは、テキスト中の事象間の因果関係を検出すること。文書レベルのECIのための多粒性コントラスト変換学習(GIMC)を用いた異種グラフ相互作用モデルを提案する。筆者らのフレームワークは, 単言語および多言語シナリオの平均F1スコアの9.4%と8.2%で, 従来の最先端モデルよりも優れていた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:44:32 GMT)
Workload-Balanced Pruning for Sparse Spiking Neural Networks [22.2]
Pruning for Spiking Neural Networks (SNN)は、リソース制約のあるエッジデバイスにディープSNNをデプロイするための基本的な方法論として登場した。我々は,LTH(Lottery Ticket hypothesis)に基づくプルーニング中にSNNの重み接続を監視し,調整するu-Ticketを提案する。実験の結果,U-Ticketは最大100%のハードウェア利用を保証でき,76.9%のレイテンシと63.8%のエネルギーコストを低減できることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:53:37 GMT)
Optimal path for Biomedical Text Summarization Using Pointer GPT [21.9]
GPTモデルは、事実の誤りを発生させ、文脈を欠き、言葉を単純化する傾向にある。これらの制約に対処するため、GPTモデルの注意機構をポインタネットワークに置き換えた。 ROUGEスコアを用いてポインター-GPTモデルの有効性を評価した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:13:23 GMT)
Event Temporal Relation Extraction based on Retrieval-Augmented on LLMs [21.9]
イベント時間関係(TempRel)は、イベント関係抽出タスクの主テーマである。伝統的な手作業でデザインされたテンプレートは、正確な時間的知識を引き出すのに苦労する。本稿では,新しいTempRel抽出手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:16:10 GMT)
Beyond Inserting: Learning Identity Embedding for Semantic-Fidelity Personalized Diffusion Generation [21.7]
本稿では,パーソナライズされた生成のための安定拡散モデルに,正確でインタラクティブなIDを挿入することに焦点を当てる。顔のレイアウトや背景などのIDに依存しない情報を絡み合わせるのではなく、顔領域にフィットする顔の注意損失を提案する。その結果,従来の手法と比較して,IDの精度,テキストベースの操作能力,一般化性が向上した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:00:37 GMT)
VRSO: Visual-Centric Reconstruction for Static Object Annotation [21.7]
本稿では静的オブジェクトアノテーションのための視覚中心型アプローチであるVRSOを紹介する。カメライメージのみを入力として、3D空間の静的オブジェクトを復元する。 VRSOは低コスト、高効率、高品質である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:16:59 GMT)
GaNI: Global and Near Field Illumination Aware Neural Inverse Rendering [21.6]
GaNIは、同じ位置にある光とカメラで撮影されたシーンの画像から、幾何学、アルベド、粗さのパラメータを再構築することができる。既存の逆レンダリング技術と光カメラは、単一の物体のみに焦点を合わせている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:47:19 GMT)
Listen to Look into the Future: Audio-Visual Egocentric Gaze Anticipation [21.6]
エゴセントリックな視線予測は、拡張現実(Augmented Reality)の出現する能力の鍵となるビルディングブロックとして機能する。我々は,エゴセントリックな視線予測のために,ビデオとオーディオの両方のモダリティを利用する最初のモデルを導入する。また,従来の最先端手法を少なくとも +1.9% と +1.6% で上回っている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:10:07 GMT)
Twin Auto-Encoder Model for Learning Separable Representation in Cyberattack Detection [21.6]
サイバーアタック検出のためのTwin Auto-Encoder (TAE) と呼ばれる新しいモードを提案する。実験結果は、最先端のRLモデルとよく知られた機械学習アルゴリズムよりもTAEの精度が優れていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:39:40 GMT)
Interpretability Guarantees with Merlin-Arthur Classifiers [21.6]
本稿では,ニューラルネットワークのような複雑なエージェントに対しても,証明可能な解釈可能性保証を提供する対話型マルチエージェント分類器を提案する。この結果はInteractive Proof SystemsのMerlin-Arthurプロトコルにインスパイアされている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:13:56 GMT)
Unifying Lane-Level Traffic Prediction from a Graph Structural Perspective: Benchmark and Baseline [21.4]
本稿では,レーンレベルの交通予測における既存研究を幅広く分析し,分類する。グラフ構造と予測ネットワークに基づくシンプルなベースラインモデルであるGraphMLPを導入している。既存の研究では公開されていないコードを複製し、有効性、効率、適用性の観点から様々なモデルを評価しました。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:21:40 GMT)
Do not trust what you trust: Miscalibration in Semi-supervised Learning [21.2]
最先端の半教師付き学習(SSL)アプローチは、ラベルなしサンプルのトレーニングをガイドする擬似ラベルとして機能するために、信頼性の高い予測に依存している。擬似ラベルに基づくSSL方式は, かなり誤解されていることを示し, ミンエントロピーの最小化を正式に示す。我々は単純なペナルティ項を統合し、ラベルのないサンプルの予測のロジットを低く保ち、ネットワーク予測が過信にならないようにする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:43:46 GMT)
A Benchmark Study on Calibration [20.9]
ディープニューラルネットワークは、さまざまな機械学習タスクでますます活用されている。多くの研究は、特定の損失関数、データ前処理、トレーニングフレームワークを使用することでキャリブレーション性能を向上させるために努力してきた。本研究では,ニューラルアーキテクチャ探索(NAS)探索空間を活用し,徹底的なキャリブレーション特性探索のための網羅的なモデルアーキテクチャ空間を提供する。このデータセットは、広く使われているNATS-Bench検索空間内の117,702のユニークなニューラルネットワークに対して、90のビンベースと12のキャリブレーション測定値を評価する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:42:14 GMT)
AutoTAMP: Autoregressive Task and Motion Planning with LLMs as Translators and Checkers [20.9]
人間とロボットの効果的なインタラクションには、ロボットは複雑な長期的タスクを理解し、計画し、実行する必要がある。大規模言語モデルの最近の進歩は、自然言語をロボットのアクションシーケンスに変換することを約束している。本研究では,複雑なタスク領域において,LLMをプランナとして用いる手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:21:04 GMT)
Multi-Review Fusion-in-Context [20.7]
接地テキスト生成には、コンテンツ選択とコンテンツ統合の両方が必要である。最近の研究で、各ステップごとに別々のコンポーネントを持つモジュラーアプローチが提案されている。本研究は,マルチドキュメント・セッティングにおけるモジュール・テキスト・ジェネレーションのさらなる探求の基盤となるものである。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:06:05 GMT)
Simple and Scalable Strategies to Continually Pre-train Large Language Models [20.6]
大規模言語モデル(LLM)は、数十億のトークンで定期的に事前訓練されるが、新しいデータが利用可能になると、プロセスを再開する。学習率のリウォーミング、LR再計算、過去のデータのリプレイをシンプルかつスケーラブルに組み合わせることで、スクラッチから完全に再学習する性能に匹敵することを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:56:38 GMT)
Leave No One Behind: Online Self-Supervised Self-Distillation for Sequential Recommendation [20.5]
そこで我々は,オンライン自己監督型自己蒸留(Online Self-Supervised Self-distillation for Sequential Recommendation)という新しい学習パラダイムを導入する。オンラインクラスタリングは、ユーザ独自の潜伏意図によって、ユーザを巧みにグループ化するのに使用される。また,幅広い行動のユーザから限られた行動のユーザへの知識の伝達を容易にするために,自己蒸留を用いる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:27:21 GMT)
Evaluating Large Language Models as Generative User Simulators for Conversational Recommendation [20.2]
本稿では,言語モデルが対話的推薦において人間の行動を正確にエミュレートできる程度を測定するための新しいプロトコルを提案する。これらのタスクは、人間の行動から言語モデルの逸脱を効果的に明らかにし、モデル選択と促進戦略による逸脱を減らす方法についての洞察を提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:08:42 GMT)
Cell Tracking according to Biological Needs -- Strong Mitosis-aware Random-finite Sets Tracker with Aleatoric Uncertainty [20.0]
本稿では,ニューラルトラッキング・バイ・レグレス・フレームワークに対する不確実性推定手法を提案する。我々の不確実性推定は、高い性能のトラッキング・バイ・レグレッション法における不確実な関連を識別する。我々のトラッカーは、長期にわたる対立から生じる偽の関連と有糸分裂の検出を解消する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:49:55 GMT)
Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion [20.0]
Videoshopは、ローカライズされたセマンティック編集のためのトレーニング不要のビデオ編集アルゴリズムである。ユーザーはオブジェクトの追加や削除、セマンティックな変更、ストック写真をビデオに挿入したり、場所や外観を細かくコントロールできる。 Videoshopは、評価基準10を用いて、2つの編集ベンチマークで6つのベースラインに対して高い品質の編集を行う。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:45:52 GMT)
Mora: Enabling Generalist Video Generation via A Multi-Agent Framework [20.0]
Soraは、社会全体で大きな注目を集めた最初の大規模ジェネラリストビデオ生成モデルである。本稿では,複数の高度な視覚AIエージェントを組み込んだマルチエージェントフレームワークであるMoraを提案し,Soraがデモした汎用ビデオ生成を再現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:43:56 GMT)
Deep Generative Model based Rate-Distortion for Image Downscaling Assessment [20.0]
速度歪み(IDA-RD)による画像ダウンスケーリング評価を提案する。 IDA-RDは画像ダウンスケーリングアルゴリズムを定量的に評価するための新しい尺度である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:48:09 GMT)
Image super-resolution via dynamic network [19.4]
画像超解像(DSRNet)のための動的ネットワークを提案する。残余の増築ブロック、広範囲の増築ブロック、特徴の増築ブロック、建設ブロックを含む。画像の超解像と複雑性の回復時間に関して,本手法はより競争力がある。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:03:50 GMT)
PhoGPT: Generative Pre-training for Vietnamese [19.3]
ベトナム語のための4Bパラメータ生成モデルシリーズをオープンソースとして公開し,PhoGPT-4Bとそのチャット変種であるPhoGPT-4B-Chatをベースとした単言語モデルPhoGPT-4Bを含む。ベースモデルであるPhoGPT-4Bはベトナムの102Bトークンのスクラッチから事前訓練され、8192コンテキスト長の20480トークンの語彙を使用する。チャット変種であるPhoGPT-4B-Chatは、70K命令プロンプトのデータセット上でPhoGPT-4Bを微調整して得られるモデリング出力である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:18:51 GMT)
Extracting Human Attention through Crowdsourced Patch Labeling [18.9]
画像分類では、データセットのバイアスから重大な問題が生じる。このようなバイアスを軽減する1つのアプローチは、モデルが対象物の位置に注意を向けることである。本稿では,画像から人の注意を捉えるために,クラウドソーシングとAI支援を統合した新しいパッチラベル手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:57:27 GMT)
CACA Agent: Capability Collaboration based AI Agent [18.8]
本稿ではCACAエージェント(Capability Collaboration based AI Agent)を提案する。 CACA Agentは、単一のLLMへの依存を減らすだけでなく、AI Agentを実装するための一連のコラボレーティブ機能を統合する。本稿ではCACAエージェントの動作とアプリケーションシナリオの拡張について説明する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:42:47 GMT)
Llama meets EU: Investigating the European Political Spectrum through the Lens of LLMs [18.8]
我々は、Llama ChatをEU政治の文脈で監査し、モデルの政治的知識と文脈における推論能力を分析する。我々は、欧州議会で議論された個々のユーロ党の演説に対して、さらなる微調整、すなわちラマ・チャット(Llama Chat)を適用して、その政治的傾向を再評価した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:37:28 GMT)
KnowLA: Enhancing Parameter-efficient Finetuning with Knowledgeable Adaptation [18.6]
そこで我々は,KnowLAという,知識に富んだ適応手法を提案する。 LLMに適応層を挿入し、入力テキストに現れるエンティティの埋め込みを統合する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:48:41 GMT)
Complete quantum control of orbital qubits by phase-controlled stimulated Raman transitions [18.6]
量子ドットにおけるホール軌道状態の完全な制御を実証する。これは、放射型オーガー転移を介して接続された$Lambda$システム内で、刺激されたラマン遷移をうまく誘導することで実現される。その結果, 固体量子エミッタの軌道状態は, 量子情報処理や量子通信への応用において, 潜在的に有効な資源として確立された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:40:59 GMT)
U-ARE-ME: Uncertainty-Aware Rotation Estimation in Manhattan Environments [18.5]
本稿では、未校正RGB画像からの不確実性とともに、カメラ回転を推定するアルゴリズムであるU-ARE-MEを提案する。実験の結果,U-ARE-MEはRGB-D法と互換性があり,特徴量ベースのSLAM法よりも頑健であることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:14:28 GMT)
Bioinformatics and Biomedical Informatics with ChatGPT: Year One Review [18.5]
2023年は、様々な分野にわたる大規模言語モデル(LLM)チャットボット、特にChatGPTの適用に関する調査において、大きな急上昇を見せた。バイオインフォマティクス, バイオインフォマティクス, バイオインフォマティクス教育, バイオインフォマティクス教育, バイオインフォマティクス教育, バイオインフォマティクス教育, バイオインフォマティクス教育, バイオインフォマティクス教育, バイオインフォマティクス, バイオインフォマティクス, バイオインフォマティクス教育, バイオインフォマティクス, バイオインフォマティクス, バイオインフォマティクス, バイオインフォマティクス, バイオインフォマティクス, バイオインフォマティクスの様々な分野におけるChatGPTの適用について調査を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:16:23 GMT)
Enabling Physical Localization of Uncooperative Cellular Devices [18.4]
本研究では,実世界の課題が細胞局在に与える影響について検討する。我々はこれらの課題に対処する非協調的多角的攻撃(UMA)を提案する。 UMAは, デバイスがローカライゼーションに協力的でない場合に, 現実環境における課題を効果的に解決することを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:31:57 GMT)
Recurrent Drafter for Fast Speculative Decoding in Large Language Models [18.3]
本稿では,大規模言語モデルの提供効率向上を目的とした投機的復号化手法を提案する。我々は、古典的な2モデル投機的復号法と、より最近のシングルモデルアプローチであるMedusaという2つの確立された手法の長所を生かしている。提案手法がいくつかのポピュラーなオープンソース言語モデルに対して有効であることを実証的に示すとともに,このアプローチの適用に関わるトレードオフを包括的に分析する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:06:42 GMT)
Language Modeling for Content-enriched Recommendation [18.3]
本稿では、事前学習した言語モデルの意味理解機能を活用してパーソナライズされたレコメンデーションを生成するLANCERを提案する。我々のアプローチは、言語モデルとレコメンデーションシステムの間のギャップを埋め、より人間的なレコメンデーションを生み出します。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:57:48 GMT)
Continual Vision-and-Language Navigation [18.2]
VLN(Vision-and-Language Navigation)エージェントは、自然言語命令と観察する視覚情報を使用して目的地にナビゲートする。既存のVLNエージェントのトレーニング方法は、固定データセットを前提としており、大きな制限をもたらす。本稿では,連続的な学習プロセスを通じて訓練されたエージェントを評価するために,CVLN(Continuous Vision-and-Language Navigation)パラダイムを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:15:36 GMT)
Evidence-Driven Retrieval Augmented Response Generation for Online Misinformation [18.2]
オンライン誤報(RARG)のための検索強化応答生成を提案する。 RARGは科学的情報源から証拠を収集し、証拠に基づいて反情報応答を生成する。得られた証拠の質を維持しつつ,得られた証拠の有効利用を最大化する報奨関数を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:05:45 GMT)
Symmetry Breaking and Equivariant Neural Networks [17.7]
我々は「緩和された同注入」という新しい概念を導入する。我々は、この緩和を同変多層パーセプトロン(E-MLP)に組み込む方法を示す。対称性の破れの関連性は、様々な応用領域で議論される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:12:08 GMT)
Fast ODE-based Sampling for Diffusion Models in Around 5 Steps [17.5]
本稿では, 高速サンプリングのための平均方向を直接学習することにより, トランケーション誤差を解消する近似平均方向解法(AMED-r)を提案する。本手法は,既存の ODE ベースのサンプルを改良するためのプラグインとして容易に利用できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:38:34 GMT)
Attacking with Something That Does Not Exist: Low-Rate Flood with 'Proof of Non-Existence' Can Exhaust DNS Resolver CPU [17.2]
NSEC3-encloser攻撃は、依然として72倍のCPU命令数を発生させることができる。十分な量のDNSパケットを使用すれば、攻撃はCPU負荷を増大させ、パケットロスを引き起こす可能性があることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:27:45 GMT)
Language-Based Depth Hints for Monocular Depth Estimation [16.9]
我々は、世界の構造に関する明示的な事前の情報源として、自然言語の使用を実証する。まず、学習中にこの暗黙のバイアスを符号化した言語モデルを示し、非常に単純な学習手法を用いて抽出できることを示す。この予測は,既成のインスタンスセグメンテーションモデルを用いて,MDEシステムに対する仮定の明示的な情報源として提供されることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:05:33 GMT)
DiffusionMTL: Learning Multi-Task Denoising Diffusion Model from Partially Annotated Data [16.5]
我々は,部分ラベル付きマルチタスクの高密度予測を画素レベルの分解問題として再検討する。本稿では,DiffusionMTLと呼ばれる新しいマルチタスク・デノナイズ・フレームワークを提案する。タスク予測や特徴写像の潜在的なノイズ分布をモデル化するために、共用拡散・雑音化パラダイムを設計する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:59:58 GMT)
Enhancing Effectiveness and Robustness in a Low-Resource Regime via Decision-Boundary-aware Data Augmentation [16.4]
本稿では,事前訓練された言語モデルを用いて,ロバスト性を高めるための決定境界対応型データ拡張戦略を提案する。提案手法は、まず、決定境界に近い潜在特徴のシフトに焦点をあて、続いて、ソフトラベル付き曖昧なバージョンを生成する再構成を行う。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:18:08 GMT)
Shadow Generation for Composite Image Using Diffusion model [16.3]
我々は、自然影画像の知識が豊富な基礎モデルに頼っている。まず、タスクにControlNetを適応させ、次にシャドーインテンシティを改善するためにインテンシティ変調モジュールを提案する。 DESOBAとDESOBAv2データセットと実合成画像の両方の実験結果から,影生成タスクにおけるモデルの有効性が示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:27:58 GMT)
6D-Diff: A Keypoint Diffusion Framework for 6D Object Pose Estimation [16.2]
単一のRGB画像から6Dオブジェクトのポーズを推定することは、しばしばノイズと不確定性を伴う。本稿では,オブジェクトのポーズ推定におけるノイズと不確定性を扱うための拡散に基づく新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:52:28 GMT)
Few-shot Adaption to Distribution Shifts By Mixing Source and Target Embeddings [16.0]
MixProは軽量でデータ効率のよいアプローチで、数ショットの適応が可能だ。 MixProはベースラインを最大7%上回り、2-4のターゲット例しかありません。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:20:41 GMT)
Forward Learning with Top-Down Feedback: Empirical and Analytical Characterization [15.9]
フォワードオンリー」アルゴリズムは、後方通過を避けながらニューラルネットワークを訓練する。私たちはまず、"フォワードオンリー"ルールに関連する魅力的な課題に取り組みます。トップダウンフィードバックを持つフォワードオンリーのアルゴリズムは「適応フィードバックアライメント」アルゴリズムによってよく近似されていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:31:26 GMT)
Reasoning-Enhanced Object-Centric Learning for Videos [15.6]
複雑なシーンにおけるモデルの知覚能力を高めるため,Slot ベースの Memory buffer (STATM) を用いた Time-Space Transformer を開発した。実験の結果,STATMはスロットベースビデオモデルのオブジェクト中心学習能力を著しく向上させることができることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:41:55 GMT)
Scalable Optimal Transport Methods in Machine Learning: A Contemporary Survey [15.5]
本稿では,機械学習における最適な輸送方法について述べる。まず、最適な輸送背景を説明し、異なるフレーバー(数学的定式化)、特性、顕著な応用を紹介する。次に、大規模・高次元データの現在の要求に対応するために最適な輸送をスケールする方法に関する根本的な問題に対処する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:17:08 GMT)
Surgical-LVLM: Learning to Adapt Large Vision-Language Model for Grounded Visual Question Answering in Robotic Surgery [15.5]
本稿では, 複雑な手術シナリオに適した, パーソナライズされた大規模視覚言語モデルであるオペレーショナル-LVLMを紹介する。本研究では,EndoVis-17-VQLA,EndoVis-18-VQLA,新たに導入されたEndoVis Conversationsデータセットなど,いくつかのベンチマークにおける手術用LVLMの有効性を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:38:27 GMT)
Contrastive Learning on Multimodal Analysis of Electronic Health Records [15.4]
本稿では,新しい特徴埋め込み生成モデルを提案し,マルチモーダルEHR特徴表現を得るためのマルチモーダルコントラスト損失を設計する。本理論は, 単モーダル学習と比較して, 多モーダル学習の有効性を実証するものである。この接続は、マルチモーダルEHR特徴表現学習に適したプライバシー保護アルゴリズムの道を開く。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:01:42 GMT)
Win-Win: Training High-Resolution Vision Transformers from Two Windows [15.4]
本稿では,高解像度ビジョントランスの効率的なトレーニングと推論のための新しい手法を提案する。鍵となる原則は、トレーニング中の高解像度入力の大部分をマスクし、N個のランダムウィンドウだけを保持することである。回転埋め込みなどの相対的な位置埋め込みを利用する場合,この戦略が有効であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:38:53 GMT)
Semantics, Distortion, and Style Matter: Towards Source-free UDA for Panoramic Segmentation [15.4]
本稿では、ピンホールからパノラマのセマンティックセマンティックセグメンテーションのための、ソースフリーな教師なしドメイン適応(SFUDA)の問題に対処する。この問題に取り組むことは、意味的ミスマッチ、スタイルの相違、パノラマ画像の避けられない歪みのため、簡単ではない。本稿では,Tangent Projection (TP) を用いて歪みを小さくし,固定されたFoVで正方形投影(ERP)をスリットしてピンホール画像を模倣する手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:41:20 GMT)
Survey on Modeling of Articulated Objects [15.3]
3Dモデリングはコンピュータビジョン、グラフィックス、ロボット工学における研究課題である。本調査は, 調音物体の3次元モデリングにおける現状について概観する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:47:02 GMT)
Formation of ultracold deeply-bound molecules via multi-state chainwise coincident pulses technique [15.1]
本手法は,3状態一致パルス法と一般化5状態一致パルス法に基づく。 3状態系では、この技術は、共鳴と共振ポンプとストークスパルスの2組の列車を介して、フェシュバッハ状態から深い境界状態へ効率的に人口を移動させることができる。 5状態系では、このM型システムは最も単純な共振結合を持つ$Lambda$-type構造に一般化できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:52:53 GMT)
Decoupled Data Consistency with Diffusion Purification for Image Restoration [15.0]
本稿では,データ整合性ステップから逆処理を分離することで問題に対処する拡散型画像復元法を提案する。我々の手法は多目的性を示し、潜在空間における効率的な問題解決に高い適応性を与える。提案手法の有効性は,画像のデノイング,デブロアリング,インペイント,超解像など,画像修復作業における総合的な実験を通じて検証される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:14:59 GMT)
Novelty Detection in Reinforcement Learning with World Models [15.0]
世界モデルを用いた強化学習(RL)は近年大きな成功を収めている。しかし、突然世界力学や性質が変化した場合、エージェントの性能と信頼性は劇的に低下する。生成されたワールドモデルフレームワーク内での新規性検出の実装は、デプロイ時にエージェントを保護するための重要なタスクである。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:30:48 GMT)
PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models [14.7]
PIAは、条件画像との整合性、テキストによる動作制御性、および特定のチューニングなしで様々なパーソナライズされたT2Iモデルとの互換性に優れる。 PIAのキーコンポーネントは条件モジュールの導入であり、入力として条件フレームとフレーム間の親和性を利用する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:25:53 GMT)
Identifying Linearly-Mixed Causal Representations from Multi-Node Interventions [14.6]
因果表現学習において、複数の変数を1つの環境内の介入によって対象とすることができる最初の識別可能性結果を提供する。我々のアプローチは、環境全体にわたる介入のカバレッジと多様性に関する一般的な仮定に基づいている。理論的貢献に加えて,多ノード干渉データから因果表現を学習するための実用的なアルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:00:40 GMT)
Quantum Langevin Dynamics for Optimization [14.4]
我々は、最適化問題を解決するためにQuantum Langevin Dynamics(QLD)を利用する。具体的には、無限熱浴と結合した系の力学について検討する。系の平均エネルギーが低温限界でゼロに近づくことを実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:28:02 GMT)
Language Models in Dialogue: Conversational Maxims for Human-AI Interactions [14.3]
本稿では,人間とAIの会話を効果的に記述するための一組の最大値を提案する。まず、人間とAIの相互作用の文脈において、最初の4つの最大値の適用性を正当化する。そして、現代の人間とAIの相互作用に特有の行動に対処するためには、2つの新しい最大値、慈悲と透明性が不可欠である、と論じる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:16:43 GMT)
ECHO: Efficient Off-Chain Payments and Cross-Chain Swaps for Cryptocurrencies [14.2]
ECHOはTEEベースのレイヤ2ソリューションで、暗号通貨の領域における2つの重要な課題に取り組む。支払い者は、オンチェーン関係や仲介チャネルを必要とせずに、誰にでも直接支払いを行うことができる。これは、中央サーバーに頼ることなくリアルタイムのクロスチェーンスワップを可能にする、最初の既知のソリューションである。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:21:09 GMT)
Data-centric Prediction Explanation via Kernelized Stein Discrepancy [14.2]
HD-Explainは、カーネル化スタイン離散性(KSD)の特性を利用した簡単な予測説明法である我々は,HD-Explainが,精度(きめ細かい説明),一貫性,効率など,様々な面から既存手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:04:02 GMT)
Cross-domain Random Pre-training with Prototypes for Reinforcement Learning [13.9]
CRPTproは、新規で効率的で効果的な自己監督型クロスドメインRL事前学習フレームワークである。 CRPTproは、エンコーダの事前トレーニングからデータサンプリングを分離し、デカップリングされたランダムコレクションを提案する。 CRPTproは、11/12のクロスストリームタスクにおいて54%のウォールタイム事前トレーニング時間で、次の最高のProto-RL(C)を著しく上回っている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:34:11 GMT)
ODD: A Benchmark Dataset for the Natural Language Processing based Opioid Related Aberrant Behavior Detection [13.8]
オピオイド関連異常行動(ORAB)はオピオイド過剰摂取の新しい危険因子である。本稿では,ODDという新しいバイオメディカル自然言語処理ベンチマークデータセットを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:01:04 GMT)
CBNet: A Plug-and-Play Network for Segmentation-Based Scene Text Detection [13.7]
本稿では,これらの問題に対処するためのコンテキスト認識および境界誘導ネットワーク(CBN)を提案する。 CBNでは、最初のセグメンテーション結果を予測するために、まず基本的なテキスト検出器が使用される。最後に,輪郭上の画素のみに適応的に拡張されたテキストカーネルを拡張するための境界誘導モジュールを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:33:39 GMT)
Double Cross-fit Doubly Robust Estimators: Beyond Series Regression [13.6]
クロスフィットの頑健な推定器は、好意的な構造に依存しないエラー保証のため、因果推論で人気を博している。トレーニングデータを分割し、独立したサンプルにニュアンス関数推定器をアンダースムースすることにより、DCDR (Double Cross-fit Duubly robust) 推定器を構築することができる。我々は、非平滑なDCDR推定器がより遅い$sqrtn$中心極限を満たすことを示し、非$sqrtn$状態においても推論が可能であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:59:03 GMT)
Investigating Bias in LLM-Based Bias Detection: Disparities between LLMs and Human Perception [13.6]
大規模言語モデル(LLM)におけるバイアスの存在と性質について検討する。 LLMが特に政治的バイアス予測やテキスト継続タスクにおいてバイアスを示すかどうかを調査する。我々は,素早い工学とモデル微調整を含む脱バイアス戦略を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:59:48 GMT)
Differentially Private Next-Token Prediction of Large Language Models [13.3]
DP-SGDは、微分プライバシー(DP)を保証する方法でモデルを訓練する本稿では,次世代の予測を行うプロトコルPMixEDについて述べる。その結果,PMixEDはサンプルレベルのプライバシよりも強力なプライバシ保証を実現し,大規模データセットのプライバシに対してDP-SGDを上回っていることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:27:44 GMT)
Generalisable Agents for Neural Network Optimisation [13.3]
ニューラルネットワーク最適化のための汎用エージェント(GANNO)の枠組みを提案する。 GANNOは、ニューラルネットワークの最適化を改善するために学習するマルチエージェント強化学習(MARL)アプローチである。私たちの研究は、このパラダイムがニューラルネットワークのトレーニングにもたらす機会と、克服すべき重要な課題の概要を示します。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:26:20 GMT)
PatchZero: Zero-Shot Automatic Patch Correctness Assessment [13.2]
コードに大規模言語モデルを適用することにより,パッチの正当性評価を行うツールネームを提案する。ツールネームは、新しいAPRツールによって生成されたものとセマンティックな類似性を示す既存のAPRツールからラベル付きパッチを優先する。実験の結果,ツールネームの精度は84.4%,F1スコアは86.5%であった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:09:15 GMT)
An Exploratory Investigation into Code License Infringements in Large Language Model Training Datasets [13.1]
我々は、この分野における現在のトレンドと、大規模言語モデルのトレーニングにコードを統合することの重要性を評価する。我々は、これらのモデルが将来法的問題のリスクを伴わずに、これらのモデルでトレーニングできるかどうかを、公開データセットで検証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:23:21 GMT)
Testing for Fault Diversity in Reinforcement Learning [13.1]
ポリシテストは可能な限り多くの障害(例えば、同様の自動車事故を引き起こすインプット)を見つけるのではなく、モデルで可能な限り情報的かつ多様な障害を明らかにすることを目的としている、と私たちは主張する。 QDの最適化は概念的には単純であり、一般的に適用可能であるが、決定モデルにおいてより多様な欠点を効果的に発見できることが示される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:46:30 GMT)
Similarity-based Label Inference Attack against Training and Inference of Split Learning [13.1]
分割学習は、プライバシを保存する分散学習のための有望なパラダイムである。本稿では、スマッシュデータを含む交換された中間結果が、既にプライベートラベルを明らかにすることができることを示す。トレーニングと推論の両段階において,プライベートラベルを効率よく回収する3つのラベル推論攻撃を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:38:29 GMT)
Bilateral Unsymmetrical Graph Contrastive Learning for Recommendation [12.9]
両面非対称グラフコントラスト学習(BusGCL)と呼ばれる推薦タスクのための新しいフレームワークを提案する。 BusGCLは、スライスされたユーザとアイテムグラフのユーザ-itemノード関係密度の両側非対称性を、両スライスしたコントラストトレーニングより優れていると考えている。 2つの公開データセットに関する総合的な実験は、様々なレコメンデーション手法と比較して、BusGCLの優位性を証明している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:58:33 GMT)
An axiomatized PDE model of deep neural networks [12.8]
ディープニューラルネットワーク(DNN)と偏微分方程式(PDE)の関係から着想を得て,ディープニューラルネットワークのPDEモデルの一般的な形式について検討する。進化作用素が実際に対流拡散方程式によって決定されることを示す。対流拡散方程式モデルによりロバスト性が向上し,ラデマッハの複雑性が低下することを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:36:29 GMT)
CoLLEGe: Concept Embedding Generation for Large Language Models [12.8]
CoLLEGeは、新しい概念のための柔軟な埋め込みを生成することができるメタ学習フレームワークである。我々は,現実のシナリオに挑戦する上で,新しい概念学習をテストするための一連のタスクを設計する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:26:05 GMT)
Residual Denoising Diffusion Models [12.7]
本稿では,従来の単音化拡散過程を残差拡散と雑音拡散に分解する新しい二重拡散過程を提案する。この二重拡散フレームワークは、デノナイジングに基づく拡散モデルを拡張し、画像生成と復元の両方のための統一的で解釈可能なモデルへと拡張する。革新的なフレームワークのさらなる探索、応用、開発を促進するために、コードと事前訓練されたモデルを提供しています。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:30:57 GMT)
BigGait: Learning Gait Representation You Want by Large Vision Models [12.6]
既存の歩行認識手法は、教師あり学習によって駆動されるタスク固有の上流に頼り、明確な歩行表現を提供する。この傾向から逃れたこの研究は、BigGaitと呼ばれるシンプルだが効率的な歩行フレームワークを提案する。 BigGaitは、すべての目的の知識を、サードパーティの監視信号を必要としない暗黙の歩行表現に変換する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:03:54 GMT)
CHisIEC: An Information Extraction Corpus for Ancient Chinese History [12.4]
我々は,中国歴史情報抽出コーパス(CHis IEC)データセットを提示する。 CHis IECは、NERおよびREタスクの開発と評価のために設計された、精巧にキュレートされたデータセットである。データセットは4つの異なるエンティティタイプと12のリレーショナルタイプを含み、慎重にラベル付けされたデータセットとなる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:12:10 GMT)
HalluciDet: Hallucinating RGB Modality for Person Detection Through Privileged Information [12.4]
HalluciDetは、オブジェクト検出のためのIR-RGB画像変換モデルである。我々は、画像翻訳とIRの微調整のための最先端手法に対する我々のアプローチを実証的に比較した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:35:18 GMT)
Kinematics-aware Trajectory Generation and Prediction with Latent Stochastic Differential Modeling [12.3]
軌道生成と軌道予測は自動運転における重要な課題である。深層学習に基づく手法は、様々な交通シナリオを学習する上で、これらの2つのタスクに大きな可能性を示してきた。しかし、生成/予測された軌道が物理的に現実的であることを保証するためには、これらの手法が依然として難しい問題である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:59:15 GMT)
On the Generalizability of Deep Learning-based Code Completion Across Programming Language Versions [12.2]
コード補完は統合開発環境(IDE)の重要な特徴である現代のコード補完アプローチは、しばしばディープラーニング(DL)モデルによって利用される。これらのモデルは、異なる言語バージョンにまたがって一般化できますか?
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:05:18 GMT)
Promoting Segment Anything Model towards Highly Accurate Dichotomous Image Segmentation [12.0]
本研究では,高精度なオブジェクトセグメンテーションに向けてSAMを前進させるDisdis-SAMを提案する。 DIS-SAM は2段階のアプローチを採用し、SAM と DIS 専用の IS-Net を統合している。 DIS-SAM は SAM や HQ-SAM に比べて精度が大幅に向上している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:25:03 GMT)
NL2TL: Transforming Natural Languages to Temporal Logics using Large Language Models [11.9]
TL(Temporal Logic)は、多くのエンジニアリングアプリケーションにおいて、複雑な高レベル仕様を厳格に指定するために用いられる。本稿では,NLからTLへの英語命令の正確かつ一般化可能な変換フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:28:51 GMT)
ShapeFormer: Shape Prior Visible-to-Amodal Transformer-based Amodal Instance Segmentation [11.5]
ShapeFormerは、可視的からアモーダルな遷移を持つTransformerベースのモデルである。これは出力セグメンテーション間の明示的な関係を促進し、アモーダル-可視遷移の必要性を回避する。 ShapeFormerは、Visible-Occluding Mask Head、Shape-Prior Amodal Mask Head、Calegory-Specific Shape Prior Retrieverの3つの主要なモジュールで構成されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:25:14 GMT)
Infrastructure-Assisted Collaborative Perception in Automated Valet Parking: A Safety Perspective [11.4]
協調知覚は、連結車両の視野を広げるために適用することができる。インフラ支援型AVPシステムのためのBEV機能に基づくCPネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:11:06 GMT)
"This is not a data problem": Algorithms and Power in Public Higher Education in Canada [11.4]
カナダのオンタリオ州にある公立大学で使われているデータ、アルゴリズム、そして結果を特定します。アルゴリズム決定への依存度が高まると、学生の監視が増加し、既存の不平等が悪化し、教員-学生関係が自動化される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:57:20 GMT)
SyncTweedies: A General Generative Framework Based on Synchronized Diffusions [11.3]
正準空間を通した多重拡散過程の同期化のシナリオを網羅的に検討する。我々は、Tweedieの公式の出力を、複数のインスタンス空間で denoising を行いながら平均化するという、未探索のケースを明らかにした。上述した映像コンテンツを生成する実験では、SyncTweedies による生成の質が他の同期法と比較して優れていることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:26:33 GMT)
Transfer CLIP for Generalizable Image Denoising [11.1]
ノイズ画像を含む高密度特徴を含む非対称エンコーダデコーダデノイズネットワークを考案する。合成ノイズ,実世界のsRGBノイズ,低線量CT画像ノイズを含む多様なOODノイズに対する実験と比較を行った結果,本手法の優れた一般化能力が示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:33:04 GMT)
ZePT: Zero-Shot Pan-Tumor Segmentation via Query-Disentangling and Self-Prompting [11.1]
問合せと自己プロンプトに基づく新しいゼロショットパン腫瘍セグメンテーションフレームワーク(ZePT)を提案する。 ZePTはオブジェクトクエリを2つのサブセットに切り離し、2つのステージでトレーニングする。腫瘍セグメンテーションタスクの実験は、ZePTの性能上の優位性を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:34:13 GMT)
Towards Effective Next POI Prediction: Spatial and Semantic Augmentation with Remote Sensing Data [11.0]
本稿では,2段階予測フレームワークにおける効果的なディープラーニング手法を提案する。本手法は,まずリモートセンシングデータを組み込んで,重要な環境状況の把握を行う。本研究では,利用者の歴史的トラジェクトリに対するQR-Pグラフを構築し,歴史的旅行知識をカプセル化する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:22:36 GMT)
A Survey on Safe Multi-Modal Learning System [10.9]
マルチモーダル学習システム(MMLS)は、様々なモーダル入力から情報を処理し統合する能力で注目を集めている。安全に関する体系的な研究が欠如していることは、この分野の進歩にとって重要な障壁である。 MMLSの安全性を体系的に分類し評価する最初の分類法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:47:50 GMT)
SFOD: Spiking Fusion Object Detector [10.9]
Spiking Fusion Object Detector (SFOD)は、SNNベースのオブジェクト検出のためのシンプルで効率的なアプローチである。我々は、イベントカメラに適用されたSNNにおいて、異なるスケールのフィーチャーマップを初めて融合させる、スパイキングフュージョンモジュールを設計する。我々は、NCARデータセット上で93.7%の精度を達成し、SNNに基づいて最先端の分類結果を確立する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:24:50 GMT)
Stance Reasoner: Zero-Shot Stance Detection on Social Media with Explicit Reasoning [10.8]
ソーシャルメディアにおけるゼロショットスタンス検出のアプローチであるスタンス・レーソナーを提示する。我々は、事前学習された言語モデルを世界知識の源泉として、中間推論ステップを生成するために、チェーン・オブ・コンテクスト・ラーニング・アプローチを用いています。 Stance Reasonerは、現在の最先端モデルを3つのTwitterデータセットで上回っている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:58:28 GMT)
SRLM: Human-in-Loop Interactive Social Robot Navigation with Large Language Model and Deep Reinforcement Learning [10.7]
SRLM(Social Robot Planner)と呼ばれる新しいハイブリッドアプローチを提案する。 LLM(Large Language Models)とDRL(Deep Reinforcement Learning)を統合し、人間に満たされた公共空間をナビゲートする。 SRLMは、リアルタイムでヒューマン・イン・ループ・コマンドからグローバル・プランニングを推測し、LLMベースの大型ナビゲーション・モデルに社会情報をエンコードする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:12:28 GMT)
Decision-making with Speculative Opponent Models [10.6]
分散応答支援型マルチエージェントアクター・クリティカル(DOMAC)について紹介する。 DOMACは、ローカル情報(例えば、制御されたエージェントの観察、行動、報酬)のみに依存する最初の投機的相手モデリングアルゴリズムである。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:40:11 GMT)
Subequivariant Reinforcement Learning Framework for Coordinated Motion Control [10.6]
CoordiGraphは、物理から準同変原理を活用して、強化学習による運動制御の調整を強化する新しいアーキテクチャである。多様な環境における高度なエージェントによる広範囲な実験を通じて、我々はアプローチのメリットを強調した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:39:22 GMT)
GCN-DevLSTM: Path Development for Skeleton-Based Action Recognition [10.6]
ビデオにおける骨格に基づく行動認識(SAR)はコンピュータビジョンにおいて重要な課題であるが難しい課題である。本稿では、シーケンシャルデータに対する原則的かつ同義的な表現である経路開発を利用するDevLSTMモジュールを提案する。提案するG-DevLSTMモジュールは,既存のGCNベースモデルを補完し,時間グラフに都合よくプラグインすることができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:55:52 GMT)
Learning High-level Semantic-Relational Concepts for SLAM [10.5]
低レベル因子グラフから推定できる高レベル意味関連概念を学習するためのアルゴリズムを提案する。提案手法をシミュレーションと実データの両方で検証し, 2つのベースラインアプローチによる性能向上を実証した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:32:24 GMT)
An LLM-Enhanced Adversarial Editing System for Lexical Simplification [10.5]
Lexical Simplificationは、語彙レベルでのテキストの簡略化を目的としている。既存のメソッドはアノテーション付きデータに大きく依存している。並列コーパスのない新しいLS法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:45:51 GMT)
Contextual Restless Multi-Armed Bandits with Application to Demand Response Decision-Making [10.1]
本稿では、複雑なオンライン意思決定のための新しいマルチアームバンドキットフレームワーク、Contextual Restless Bandits (CRB)を紹介する。 CRBは、各アームの内部状態遷移と、外部のグローバル環境コンテキストの影響の両方をモデル化できるように、コンテキストブレイディットとレスレスブレイディットのコア特徴を取り入れている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:35:07 GMT)
Vehicle Detection Performance in Nordic Region [9.9]
本論文は,北欧地方の厳しい冬条件下での車両検出における重要な課題について論じる。従来の車両検出手法は、これらの有害な状況で苦労してきた。本研究では、Nordic Vehicleデータセットを用いて、最先端の車両検出アルゴリズムの性能を評価する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:03:10 GMT)
Improve Cross-domain Mixed Sampling with Guidance Training for Adaptive Segmentation [9.9]
教師なしのドメイン適応(UDA)は、ソースドメインでトレーニングされたモデルを調整し、追加のアノテーションを必要とせずにターゲットドメインでうまく機能させる。本稿では,指導訓練という新しい補助課題を提案する。本課題は,実世界の分散シフトを緩和しつつ,クロスドメイン混合サンプリング手法の有効利用を促進する。既存の手法と統合し、継続的に性能を向上することで、我々のアプローチの有効性を実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:12:48 GMT)
Large Language Model-informed ECG Dual Attention Network for Heart Failure Risk Prediction [9.8]
心不全(HF)は、世界的な死亡率の上昇とともに、公衆衛生上の大きな課題となる。 12誘導心電図(ECG)を用いた新しいHFリスク予測手法を提案する。本稿では, 早期HFリスク予測に不可欠な複雑なECG特徴を捉えるために設計された, 軽量なデュアルアテンションECGネットワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:00:24 GMT)
SensoryT5: Infusing Sensorimotor Norms into T5 for Enhanced Fine-grained Emotion Classification [9.7]
SensoryT5は、感覚情報をT5モデルに統合し、微粒な感情分類を行う神経認知アプローチである。厳格なテストでは、SensoryT5はパフォーマンスを改善し、基礎的なT5モデルと最先端の作業の両方を上回っている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:03:25 GMT)
ACCESS: Assurance Case Centric Engineering of Safety-critical Systems [9.5]
保証ケースは、安全性やセキュリティなどの重要なシステム特性について、コミュニケーションし、信頼性を評価するために使用されます。近年,システム保証活動の効率化と品質向上のために,モデルに基づくシステム保証アプローチが普及している。モデルに基づくシステム保証ケースが異種工学的アーティファクトにどのように辿り着くかを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:29:50 GMT)
CARE: Large Precision Matrix Estimation for Compositional Data [9.4]
合成精度行列の正確な仕様を導入し,その基礎となる行列に関連付ける。この接続を利用して、スパース基底精度行列を推定する合成正規化推定法(CARE)を提案する。筆者らの理論は, 同定と推定の間の興味深いトレードオフを明らかにし, 構成データ解析における次元性の祝福を強調する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:37:39 GMT)
A Nonlinear African Vulture Optimization Algorithm Combining Henon Chaotic Mapping Theory and Reverse Learning Competition Strategy [9.3]
ヘノンのカオスマッピング理論とエリート集団戦略は、ハゲワシの初期個体数のランダム性と多様性を改善するために提案されている。逆学習競争戦略は、最適解に対する発見分野の拡大を目的としている。提案したHWEAVOAは, 収束速度, 最適化能力, 解安定性における比較アルゴリズムよりも優れている全試験関数で第1位である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:20:45 GMT)
You Only Need Two Detectors to Achieve Multi-Modal 3D Multi-Object Tracking [9.2]
提案手法は,2次元検出器と3次元検出器のみを用いて,ロバストなトラッキングを実現する。多くの最先端のTBDベースのマルチモーダルトラッキング手法よりも正確であることが証明されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:55:14 GMT)
Hierarchical Skip Decoding for Efficient Autoregressive Text Generation [9.2]
本稿では,効率的な自己回帰テキスト生成のための階層型スキップ復号法(HSD)を提案する。ほぼ半分のレイヤがスキップされているため、HSDはバニラの自動回帰デコードに比べてテキスト品質の90%を維持できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:44:05 GMT)
Enhancing Testing at Meta with Rich-State Simulated Populations [9.1]
本稿では,自動および手動テストのためのMetaにおけるRich-State Simulated Populationsの展開結果について報告する。ユーザインタラクションを模倣し、実際のユーザアカウントが状態を取得するのと同じように、状態を取得するために、シミュレートされたユーザ(別名テストユーザ)を使用します。自動テストでは、Facebook、Messenger、iOSおよびAndroidプラットフォーム向けのInstagramアプリへのデプロイによる経験的な結果を提示します。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:54:00 GMT)
PseudoTouch: Efficiently Imaging the Surface Feel of Objects for Robotic Manipulation [9.0]
私たちの目標は、ロボットに同じような能力を持たせることです。我々はこの問題を,低次元視覚触覚埋め込み学習のタスクとして捉えている。 ReSkinを使って、アライメントされた触覚と視覚データペアからなるデータセット上でPseudoTouchを収集し、トレーニングします。我々はPseudoTouchの有効性を、物体認識と把握安定性予測という2つの下流タスクに適用することで実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:51:31 GMT)
Evaluating GPT-4 with Vision on Detection of Radiological Findings on Chest Radiographs [8.8]
本研究は,100個の胸部X線写真から放射線学的所見を検出するために,視覚認識を備えた多モード大言語モデルであるGPT-4Vの応用について検討した。 GPT-4Vは、現在、胸部X線像の解釈において実際の診断には準備が整っていないことが示唆されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:27:18 GMT)
Unitary-invariant witnesses of quantum imaginarity [8.7]
単純なペアの重なり合いの測定は、4つの状態の集合を目撃するのに十分であるが、3つの状態の集合については不十分であることを示す。我々の目撃者は実験的に友好的であり、想像力をリソースとして測定し利用するための新しい道を開く。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:46:58 GMT)
Learning Topological Representations for Deep Image Understanding [8.7]
深層学習フレームワークにおけるトポロジカル構造の新しい表現法を提案する。我々は、トポロジカルデータ解析の数学的ツールを活用し、より良いセグメンテーションと不確実性推定のための原理的手法を開発した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:23:37 GMT)
Piecewise-Linear Manifolds for Deep Metric Learning [8.7]
教師なしの深度学習は、ラベルなしデータのみを使用して意味表現空間を学習することに焦点を当てる。本稿では,各低次元線形片が点の小さな近傍でデータ多様体を近似して高次元データ多様体をモデル化することを提案する。我々は、この類似度推定が、現在の最先端技術の類似度推定よりも基礎的真理と相関していることを実証的に示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:22:20 GMT)
Solution-Set Geometry and Regularization Path of a Nonconvexly Regularized Convex Sparse Model [8.6]
オズボーン一般化ミニマックス幾何学のペナルティ(Osborne generalized minimax geometry penalty)は、正規化された経路の全体二乗性を保存することができる非一意性解である。 LASSOと同様、最小$ell$-norm正規化は、$lambda$.continuouswiseで連続的であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:26:52 GMT)
Medical Image Data Provenance for Medical Cyber-Physical System [8.6]
本研究では,画像にデバイス指紋(DFP)を埋め込むための透かし技術を提案する。 DFPは、キャプチャ装置のユニークな特性と生画像を表すもので、保存前に生画像に埋め込まれる。相互接続型医療システムにおける医用画像データの整合性を高めるため、画像認証のために堅牢な遠隔検証手法が導入された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:24:44 GMT)
Generative deep learning-enabled ultra-large field-of-view lens-free imaging [8.5]
我々は、ホログラフィック画像再構成に生成人工知能(AI)を活用するディープラーニング(DL)ベースのイメージングフレームワーク、GenLFIを提案する。我々は、GenLFIが550ドル以上のリアルタイムFOVを達成でき、現在のLFIシステムを20倍以上上回り、世界最大規模の共焦点顕微鏡よりも1.76倍大きいことを実証した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:42:47 GMT)
Combining the Strengths of Dutch Survey and Register Data in a Data Challenge to Predict Fertility (PreFer) [8.4]
オランダにおける出生率の予測可能性を調べるために,2つのデータセットを提案する。 1つのデータセットは、幅広いトピックに関する数千の変数を含む縦断調査であるISSパネルに基づいている。もう一つはオランダの登録データに基づいており、位置データに欠けるが、オランダの住民数百万人のライフコースに関する詳細な情報を含んでいる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:13:17 GMT)
Guided Decoding for Robot Motion Generation and Adaption [8.3]
障害のある複雑な環境でのハイDoFロボットアームの動作生成,ポイント経由などについて検討する。シミュレーショントラジェクトリの大規模なデータセット上にトランスフォーマーアーキテクチャをトレーニングする。我々のモデルでは,初期点と目標点から運動を生成できるだけでなく,複雑なタスクをナビゲートする際に軌道に適応できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:32:27 GMT)
Multi-conditioned Graph Diffusion for Neural Architecture Search [8.3]
本稿では、離散的な条件付きグラフ拡散プロセスを用いて、高性能ニューラルネットワークアーキテクチャを生成するグラフ拡散に基づくNAS手法を提案する。 6つの標準ベンチマークで有望な結果を示し、新しいアーキテクチャとユニークなアーキテクチャを高速に実現します。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:51:55 GMT)
Learners Teaching Novices: An Uplifting Alternative Assessment [8.2]
我々は,AVT(Audiment via teaching)と呼ばれる新しい形式的評価手法を提案し,実施する。 AVTは従来のアセスメントよりも強力なメリットがあり、他者へのサービスを中心にしており、教える学習者には高い報奨を与える。授業試験前のAVTセッションを行う学習者は,いくつかの質問に対して,クラス平均よりも20～30ポイントよい成績を示した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:01:00 GMT)
AI Teaches the Art of Elegant Coding: Timely, Fair, and Helpful Style Feedback in a Global Course [8.2]
我々は、大規模なオンラインCS1コースであるCode in Placeに、新しいリアルタイムスタイルフィードバックツールをデプロイした経験を紹介する。その結果, リアルタイムにスタイルフィードバックを受けた学生は, 遅延フィードバックを受けた学生に比べて, 5倍の視聴率と参加率を示した。フィードバックを見た人は、コードに対して重要なスタイル関連の編集を行う傾向があり、これらの編集のうち79%が直接フィードバックを取り入れている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:45:39 GMT)
Large language models for crowd decision making based on prompt design strategies using ChatGPT: models, analysis and challenges [8.1]
クラウド意思決定(Crowd Decision Making、CDM)は、平易なテキストから意見や判断を推測できる方法論である。大規模言語モデル(LLM)は、書かれたテキストを自動的に理解する新しいシナリオを探求するのに役立ちます。本稿では、CDMプロセスにおける意見の抽出と意思決定を支援するための設計戦略に基づくChatGPTの使用について分析する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:21:44 GMT)
LimGen: Probing the LLMs for Generating Suggestive Limitations of Research Papers [8.1]
本稿では,研究論文における提案的限界生成の新規かつ挑戦的な課題について述べる。我々はLimGenと呼ばれるデータセットをコンパイルし、ACLアンソロジーから4068の研究論文とその関連する制限を包含する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:31:43 GMT)
AVT2-DWF: Improving Deepfake Detection with Audio-Visual Fusion and Dynamic Weighting Strategies [8.0]
AVT2-DWFは、イントラモーダルとクロスモーダルの両方のフォージェリーキューを増幅し、検出能力を向上することを目的としている。 AVT2-DWFは、表情の空間的特徴と時間的ダイナミクスの両方を捉えるための二重ステージアプローチを採用している。 DeepfakeTIMIT、FakeAVCeleb、DFDCデータセットの実験は、AVT2-DWFが最先端のパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:04:37 GMT)
Enhancing Worker Recruitment in Collaborative Mobile Crowdsourcing: A Graph Neural Network Trust Evaluation Approach [7.9]
CMCS(Collaborative Mobile Crowdsourcing)は、複雑なセンシングタスクを協調的に実行するワーカーチームを募集するプラットフォームである。本稿では,ソーシャルネットワークにおける全作業者の非対称信頼度を求めるために,信頼強化評価フレームワーク(TREF)を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:14:07 GMT)
MSAC: Multiple Speech Attribute Control Method for Reliable Speech Emotion Recognition [7.8]
シングルコーパスとクロスコーパスSERの両方を同時に処理できる新しい統合SERフレームワークであるMSAC-SERNetを紹介する。様々な音声属性間の情報重なりを考慮し、異なる音声属性の相関に基づく新しい学習パラダイムを提案する。シングルコーパスSERシナリオとクロスコーパスSERシナリオの両方の実験は、MSAC-SERNetが最先端SERアプローチと比較して優れた性能を発揮することを示している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:49:31 GMT)
Privacy-Preserving End-to-End Spoken Language Understanding [7.5]
人間のスピーチには、性別、アイデンティティ、センシティブなコンテンツなど、多くのユーザセンシティブな情報が含まれる。新たなタイプのセキュリティおよびプライバシ侵害が出現した。ユーザは、信頼できない第三者による悪意ある攻撃に対して、個人情報を公開したくない。本稿では,音声認識(ASR)とID認識(IR)の両方を防止するために,新しいマルチタスクプライバシ保護モデルを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:41:57 GMT)
(Un)making AI Magic: a Design Taxonomy [7.5]
我々は7つの設計原則を特定し、それぞれの効果をエンハンスメントと非エンハンスメントの観点で解き放つ。我々は、この分類を設計/HCI実践者によってアプローチし、適切なものにする方法を明確にすることで結論付ける。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:03:37 GMT)
RetiGen: A Framework for Generalized Retinal Diagnosis Using Multi-View Fundus Images [7.5]
本研究では,医用画像における領域一般化の新たな枠組みを紹介する。提案手法は,階層化されていないマルチビュー画像データのリッチな情報を活用し,モデルのロバスト性と精度を向上させる。本フレームワークは,ドメインの一般化能力の向上を実証し,実世界の展開に実用的なソリューションを提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:08:31 GMT)
Ultrasound Imaging based on the Variance of a Diffusion Restoration Model [7.4]
本稿では, 線形直列モデルと学習に基づく先行モデルを組み合わせたハイブリッド再構成手法を提案する。我々は,高品質な画像再構成を実現するための分散イメージング手法の有効性を実証し,合成,in-vitro,in-vivoデータの実験を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:10:38 GMT)
"The Law Doesn't Work Like a Computer": Exploring Software Licensing Issues Faced by Legal Practitioners [7.3]
法律実務者30名および関連職種を対象に調査を行った。法律実務者の観点からOSSライセンスコンプライアンスのさまざまな側面を特定した。本研究の意義について論じる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:07:11 GMT)
Hydro: Adaptive Query Processing of ML Queries [7.3]
機械学習(ML)クエリを効率的に処理するための適応クエリ処理(AQP)であるHydroを提案する。ベースラインシステム上で最大11.52倍のスピードアップを実現し,Hydroの有効性を実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:17:07 GMT)
Automated Feature Selection for Inverse Reinforcement Learning [7.3]
逆強化学習(IRL)は、専門家によるデモンストレーションから報酬関数を学習するための模倣学習手法である。本稿では,基本関数を用いて特徴の候補セットを作成する手法を提案する。専門家のポリシーを捉えた報酬関数を回収することで、アプローチの有効性を実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:05:21 GMT)
EC-NAS: Energy Consumption Aware Tabular Benchmarks for Neural Architecture Search [7.2]
ディープラーニングモデルの選択、トレーニング、デプロイによるエネルギー消費は、最近大幅に増加しています。この研究は、計算資源の少ないエネルギー効率の高いディープラーニングモデルの設計を容易にすることを目的としている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:59:43 GMT)
Defending Against Unforeseen Failure Modes with Latent Adversarial Training [7.1]
赤いチームと敵のトレーニング(AT)は、AIシステムをより堅牢にするために一般的に使用される。本研究では,LAT(Latent Adversarial Training)を用いて,脆弱性を誘発する入力を発生させることなく脆弱性を防御する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:49:42 GMT)
MM-Diff: High-Fidelity Image Personalization via Multi-Modal Condition Integration [7.1]
MM-Diffはチューニング不要な画像パーソナライズフレームワークで、単写体と複数体の高忠実度画像を数秒で生成できる。 MM-Diff は視覚エンコーダを用いて入力画像を CLS に変換し、埋め込みをパッチする。一方、CLS埋め込みはテキスト埋め込みを強化するために使用され、一方、パッチ埋め込みと共に、少数の詳細に富んだ主題埋め込みを導出する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:32:31 GMT)
Beyond Quantities: Machine Learning-based Characterization of Inequality in Infrastructure Quality Provision in Cities [6.9]
本稿では,環境汚染を発生させるインフラストラクチャの特徴を識別する機械学習に基づく手法を提案する。本研究では,都市の空間領域のインフラ品質規定を計算するために,モデルにより得られた重みを利用する。その結果、低所得者が居住する地域では、インフラの質が低いことが示唆された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:35:16 GMT)
Insights into the Lottery Ticket Hypothesis and the Iterative Magnitude Pruning [6.7]
そこで本研究では,反復的等級切削工程の様々な段階で得られた溶液の体積/幾何学および損失景観特性について検討した。抽選券仮説によって提案された特定の初期化が、一般化(および訓練)性能においてよりうまく機能する傾向にある理由を説明する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:11:14 GMT)
Predicting Generalization of AI Colonoscopy Models to Unseen Data [6.6]
見えないデータ中の現象を識別する「マスケシームズネットワーク」(MSN)。 MSNはラベルなしでポリプ画像のマスキング領域を予測する訓練を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:53:29 GMT)
Autonomous Driving With Perception Uncertainties: Deep-Ensemble Based Adaptive Cruise Control [6.5]
ブラックボックスDeep Neural Networks (DNN) を用いた高度な認識システムは、人間のような理解を実証する。予測不可能な振る舞いと解釈可能性の欠如は、安全クリティカルなシナリオへの展開を妨げる可能性がある。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:04:58 GMT)
Risk and Response in Large Language Models: Evaluating Key Threat Categories [6.4]
本稿では,Large Language Models (LLMs) におけるリスクアセスメントのプレッシャーについて考察する。人為的レッドチームデータセットを利用することで、情報ハザード、悪用、差別/憎しみのあるコンテンツなど、主要なリスクカテゴリを分析します。以上の結果から,LSMは情報ハザードを有害とみなす傾向があることが示唆された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:46:40 GMT)
E-Sparse: Boosting the Large Language Model Inference through Entropy-based N:M Sparsity [6.4]
隠れ状態特徴の情報エントロピーをプルーニング計量設計、すなわちE-Sparseに導入する。 E-Sparseはチャネルの重要性を活用するために情報豊かさを使用し、さらにいくつかの新しいテクニックを取り入れて効果を発揮させる。 E-Sparseは、高密度モデル(最大1.53X)に対するモデル推論を著しく高速化し、大きなメモリ節約(最大43.52%)を得ることができ、精度の低下を許容できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:18:24 GMT)
ToonAging: Face Re-Aging upon Artistic Portrait Style Transfer [6.3]
ポートレート・スタイル・トランスファーと組み合わさって, 顔のリエイジングのための新しいワンステージ手法を提案する。同じPRドメイン内でトレーニングされた既存の顔のリエイジとスタイル転送ネットワークを活用します。提案手法は,ドメインレベルの微調整手法に比べて柔軟性が高い。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:17:24 GMT)
A study on the impact of Self-Supervised Learning on automatic dysarthric speech assessment [6.3]
以上の結果から,HuBERTは難聴分類,単語認識,インテリジェンス分類において最も汎用性の高い特徴抽出器であり,従来の音響特徴と比較して,それぞれ+24.7%,+61%,テキストおよび+7.2%の精度を実現していることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:41:02 GMT)
A Multimodal Approach for Cross-Domain Image Retrieval [6.2]
本稿では、生成した画像のコレクションを検査するための追加ツールとして使用できるCDIR(Cross-Domain Image Retrieval)に焦点を当てる。理想的な検索システムは、複数の領域から見えない複雑な画像を一般化することができる。本稿では,大規模データセット上で事前学習したマルチモーダル言語ビジョンアーキテクチャを活用する新しいキャプションマッチング手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:08:16 GMT)
Learning with Silver Standard Data for Zero-shot Relation Extraction [6.2]
まず,銀標準データから少量のクリーンデータを検出し,選択したクリーンデータを用いて事前学習したモデルを微調整する。ゼロショットREタスクでは,TACREDおよびWiki80データセットでベースラインを12%,11%上回る性能が得られた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:09:52 GMT)
Accurately Predicting Probabilities of Safety-Critical Rare Events for Intelligent Systems [6.2]
本研究は,精度とリコール率を両立させる臨界予測モデルの構築を目的とする。アプローチを検証するために,月面着陸機と二足歩行機という2つの事例で評価を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:59:56 GMT)
CPA-Enhancer: Chain-of-Thought Prompted Adaptive Enhancer for Object Detection under Unknown Degradations [6.2]
本研究では, 未知の劣化下での物体検出のための適応エンハンサーCPA-Enhancerを提案する。私たちの知る限りでは、オブジェクト検出タスクのためにCoTのプロンプトを利用する最初の作業です。実験結果から,CPA-Enhancerはオブジェクト検出のための新しい手法の状態を設定できるだけでなく,未知の劣化下での他の下流視覚タスクの性能も向上することが示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:42:40 GMT)
Cell Variational Information Bottleneck Network [6.2]
本稿では,最新のフィードフォワードネットワークアーキテクチャと組み合わせることができる情報ボトルネック機構を用いた畳み込みニューラルネットワークを提案する。セル変動情報ボトルネックネットワークは、不確実性のある特徴マップを生成するVIBセルを積み重ねて構築される。より複雑な表現学習タスクである顔認識では、ネットワーク構造も非常に競争力のある結果を得た。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:06:31 GMT)
Unimodal Multi-Task Fusion for Emotional Mimicry Prediction [6.1]
第6回ワークショップ・コンペティション・アフェクティブ・ビヘイビア・アナリティクス(Affective Behavior Analysis in the-wild)の文脈における情緒的ミミリティ・インテンシティ(EMI)推定の方法論を提案する。我々のアプローチは、包括的なポッドキャストデータセットで事前トレーニングされたWav2Vec 2.0フレームワークを利用して、幅広いオーディオ機能を抽出する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:08:51 GMT)
Cascading Blackout Severity Prediction with Statistically-Augmented Graph Neural Networks [6.0]
我々は,初期グリッド条件からブラックアウト等級を推定するための2つの新しい手法を開発した。まず、安全な"非ブラックアウト"シナリオをフィルタリングする初期分類ステップを利用するいくつかの方法を提案する。第2に,カスケードブラックアウトの統計特性から得られた知見を用いて,GNNモデルにおける非局所的メッセージパッシング手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:31:21 GMT)
LeGO: Leveraging a Surface Deformation Network for Animatable Stylized Face Generation with One Example [6.0]
所望のトポロジを持つ高度にスタイリングされた3次元顔モデルを作成する方法を提案する。提案手法は3DMMを用いて表面変形ネットワークをトレーニングし,その領域を微分可能なメッシュと方向CLIP損失を用いて対象に翻訳する。ネットワークは、差別化可能なメッシュと指向的なCLIP損失を使用して、ターゲットのスタイルを模倣することにより、3Dフェイスメッシュのスタイリングを実現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:20:54 GMT)
Deployment of Deep Learning Model in Real World Clinical Setting: A Case Study in Obstetric Ultrasound [5.9]
実世界の臨床環境で画像ベースAIモデルをデプロイするための汎用フレームワークを提案する。胎児超音波標準平面検出のための訓練されたモデルをデプロイし,初級者および熟練者の両方でリアルタイムに評価する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:38:26 GMT)
MasonTigers at SemEval-2024 Task 9: Solving Puzzles with an Ensemble of Chain-of-Thoughts [5.9]
本稿では、SemEval-2024 Task 9にチームMasonTigersを提出する。自然言語理解をテストするためのパズルのデータセットを提供する。我々は,いくつかのプロンプト手法を用いて,この課題を解決するために,大規模言語モデル (LLM) を用いる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:31:49 GMT)
MasonTigers at SemEval-2024 Task 1: An Ensemble Approach for Semantic Textual Relatedness [5.9]
本稿では,SemEval-2024 Task 1 - Semantic Textual RelatednessのMasonTigersエントリについて述べる。このタスクには、教師なし(Track A)、教師なし(Track B)、14言語にわたる言語横断(Track C)アプローチが含まれる。我々のアプローチは、トラックAで11位から21位、トラックBで1位から8位、トラックCで5位から12位までランク付けした。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:47:42 GMT)
GPT-Connect: Interaction between Text-Driven Human Motion Generator and 3D Scenes in a Training-free Manner [5.9]
テキスト駆動のモーションジェネレータは、通常、空白の背景でモーションシーケンスを生成するためにのみ設計されている。 GPT接続では、既存の空白背景の人体モーションジェネレータを直接利用して、シーン認識のモーションシーケンスを生成できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:39:15 GMT)
Cartoon Hallucinations Detection: Pose-aware In Context Visual Learning [5.9]
TTIモデルにより生成された漫画の文字画像に対する新しい視覚幻覚検出システムを提案する。提案手法は,視覚言語モデル (VLM) を用いたポーズ認識型インコンテキスト・ビジュアル・ラーニング (PA-ICVL) を活用し,RGB画像とポーズ情報の両方を活用する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:13:09 GMT)
Attention-Driven Reasoning: Unlocking the Potential of Large Language Models [5.8]
本稿では,注意機構の最適化を通じて,大規模言語モデルの推論を強化する新しい手法を提案する。非意味トークンによる注意分布の非効率性を同定し、歪んだ分布を再均衡させるアルゴリズムを提案する。我々の実験は、特に非STEM質問に対して、推論能力を大幅に改善したことを示した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:23:58 GMT)
Bidirectional Temporal Diffusion Model for Temporally Consistent Human Animation [5.8]
本研究では,1つの画像,ビデオ,ランダムノイズから時間的コヒーレントな人間のアニメーションを生成する手法を提案する。両方向の時間的モデリングは、人間の外見の運動あいまいさを大幅に抑制することにより、生成ネットワーク上の時間的コヒーレンスを強制すると主張している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:18:11 GMT)
Soft Contrastive Learning for Time Series [5.8]
時系列の簡易かつ効果的なソフトコントラスト学習戦略であるSoftCLTを提案する。具体的には,1)データ空間上の時系列間の距離によるインスタンス単位のコントラスト損失,2)タイムスタンプの違いによる時間的コントラスト損失について,ソフトな割り当てを定義する。実験では、SoftCLTは、分類、半教師付き学習、移動学習、異常検出など、様々な下流タスクのパフォーマンスを一貫して改善することを示した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:02:42 GMT)
Learning to Embed Time Series Patches Independently [5.8]
近年,時系列モデリングは時系列の自己教師型表現学習戦略として注目されている。このようなパッチをキャプチャすることは、時系列表現学習の最適戦略ではないかもしれない、と我々は主張する。本論文では,1)他のパッチを見ることなく各パッチを自動エンコードするシンプルなパッチ再構築タスク,2)個別に各パッチを埋め込むシンプルなパッチワイド再構築タスクを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:05:02 GMT)
Model Uncertainty in Evolutionary Optimization and Bayesian Optimization: A Comparative Analysis [5.7]
ブラックボックス最適化問題は、多くの現実世界のアプリケーションで一般的な問題である。これらの問題はインプット・アウトプット・インタラクションを通じて内部動作へのアクセスなしに最適化する必要がある。このような問題に対処するために2つの広く使われている勾配のない最適化手法が用いられている。本稿では,2つの手法間のモデル不確実性の類似点と相違点を明らかにすることを目的とする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:15:20 GMT)
Grey-informed neural network for time-series forecasting [5.6]
この研究は、グレーインフォームドニューラルネットワーク(GINN)の実装を示唆している。 GINNは、ニューラルネットワークの出力がグレーシステムの微分方程式モデルに従うことを保証し、解釈可能性を向上させる。提案手法は,実世界の基盤となるパターンを解明し,実証データに基づいて信頼性の高い予測を行う。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:17:00 GMT)
Depth-Optimal Addressing of 2D Qubit Array with 1D Controls Based on Exact Binary Matrix Factorization [5.5]
最近の中性原子系プラットフォームの進歩は、2次元量子ビットアレイの制御粒度と柔軟性のバランスに長方形(ロウカラム)アドレスが当てられることを示唆している。深度最適長方形アドレッシング問題を,通信複雑性と最適化にも現れるNPハード問題である,正確な二分分解として定式化する。本稿では, フォールトトレラント量子コンピューティングの文脈における長方形のアドレッシングについて論じる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:36:10 GMT)
Task-Oriented GNNs Training on Large Knowledge Graphs for Accurate and Efficient Modeling [5.5]
本稿では,大規模知識グラフ(KG)を用いたタスク指向HGNN学習におけるTOSG抽出の自動化手法であるKG-TOSAを提案する。 KG-TOSAは、最新のHGNN手法により、トレーニング時間とメモリ使用量を最大70%削減し、精度や推論時間などのモデル性能を向上させる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:44:17 GMT)
GTAGCN: Generalized Topology Adaptive Graph Convolutional Networks [5.2]
一般化集約ネットワークとトポロジ適応グラフ畳み込みネットワークという2つの確立された手法に基づくハイブリッドアプローチを導出する。結果は、文献の結果と同等であり、グラフ構造が探索されていないシーケンスデータとして手書きのストロークの方が優れている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:02:13 GMT)
CO-Fun: A German Dataset on Company Outsourcing in Fund Prospectuses for Named Entity Recognition and Relation Extraction [5.1]
名前付きエンティティ認識と関係抽出に特化して設計されたデータセットを提案する。 948文のラベル付けは3人の専門家によって行われた。深層学習モデルは、実体を認識し、関係を抽出するために訓練された。データセットの匿名化バージョンと、モデルトレーニングに使用されるガイドラインとコードは、https://www.dfki.uni-kl.de/cybermapping/data/CO-Fun-1.0-anonymized.zipで公開されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:17:55 GMT)
Selectively Informative Description can Reduce Undesired Embedding Entanglements in Text-to-Image Personalization [5.1]
本稿では,SID(Selectively Informative Description)というテキスト記述戦略を提案する。本研究は,クロスアテンションマップ,主観的アライメント,非対象的アライメント,テキストアライメントの分析とともに,総合的な実験結果を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:35:38 GMT)
iSLAM: Imperative SLAM [5.1]
SLAMシステムは、しばしば、動き推定のためのフロントエンドコンポーネントと、推定ドリフトを除去するバックエンドシステムから構成される。本稿では,フロントエンドとバックエンドの相互修正を促進する,命令型SLAMという,自己指導型命令型学習フレームワークを提案する。実験の結果,iSLAMトレーニング戦略はベースラインモデルよりも平均22%の精度向上を実現していることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:10:49 GMT)
Spacewalk-18: A Benchmark for Multimodal and Long-form Procedural Video Understanding [4.9]
本研究では,(1)ステップ認識と(2)動画内検索の2つのタスクを含むベンチマークであるSpacewalk-18を紹介する。タンデムでは、この2つのタスクは、(1)ドメイン外の視覚情報、(2)高時間的コンテキストウィンドウ、(3)マルチモーダル(視覚と音声)ドメインを利用するモデルの能力の定量化を行う。現状の手法は我々のベンチマークでは性能が良くないことがわかったが、異なるモダリティにまたがるより長い時間的文脈からの情報を組み込むことで改善が得られる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:21:14 GMT)
Spread complexity and dynamical transition in two-mode Bose-Einstein condensations [4.9]
2モードのボース・アインシュタイン凝縮における拡散複雑性について検討する。拡散複雑性は,低い値から高い値への急激な遷移を示すことが明らかとなった。熱力学的極限において、$E_c(omega)$と初期エネルギー$E_0(omega)$の交差点は、動的遷移点を決定する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:09:14 GMT)
A Single Linear Layer Yields Task-Adapted Low-Rank Matrices [4.7]
Low-Rank Adaptation (LoRA) は、初期重量行列$W_0$をデルタ行列$Delta W$で更新するPEFT (Efficient Fine-Tuning) 法として広く用いられている。 CondLoRAのトレーニング可能なパラメータがLoRAのパラメータよりも少ないにもかかわらず、CondLoRAはLoRAと同等のパフォーマンスを維持していることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:38:42 GMT)
Latent Neural Cellular Automata for Resource-Efficient Image Restoration [4.5]
ニューラルセルオートマトン(LNCA)モデルを導入する。これはニューラルセルオートマトン(英語版)の資源制限に対処するために設計された新しいアーキテクチャである。提案手法は,事前学習したオートエンコーダに頼って,従来の入力空間から特別に設計された潜在空間へ計算をシフトする。この修正は、モデルのリソース消費を減らすだけでなく、様々なアプリケーションに適した柔軟なフレームワークも維持する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:15:28 GMT)
Unraveling the origin of antiferromagnetic coupling at YIG/permalloy interface [4.4]
反強磁性結合は、酸素を介する四面体FeのYIG表面上の超交換結合機構によって主に駆動される。本研究は, 磁気界面力学の制御における酸化物表面の終端の役割を浮き彫りにする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:12:38 GMT)
LogPrécis: Unleashing Language Models for Automated Malicious Log Analysis [4.4]
テキストのようなUnixシェル攻撃ログを自動的に解析するために、言語モデルにおける最先端の利点を示す。約40,000のUnixシェル攻撃を含む2つの大きなデータセットの分析をサポートするLogPr'ecis機能を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:52:47 GMT)
FastCAD: Real-Time CAD Retrieval and Alignment from Scans and Videos [4.4]
FastCADは、シーン内のすべてのオブジェクトに対してCADモデルを同時に取得およびアライメントするリアルタイムメソッドである。単段法は,RGB-Dスキャンで動作している他の手法と比較して,推論時間を50倍に高速化する。これにより、10FPSでビデオからCADモデルに基づく正確な再構成をリアルタイムに生成できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:20:23 GMT)
Unveiling Group-Specific Distributed Concept Drift: A Fairness Imperative in Federated Learning [4.3]
グループ固有の概念ドリフト(グループ特化概念ドリフト)とは、あるグループが時間とともに概念をドリフトし、別のグループがそうでない状況を指す。連合学習のフレームワークでは、各クライアントは、同じ概念を共有しながら、独立してグループ固有の概念ドリフトを経験できる。我々は、グループ固有の分散コンセプトドリフトに取り組むために、既存の分散コンセプトドリフト適応アルゴリズムを適用した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:25:26 GMT)
Just another copy and paste? Comparing the security vulnerabilities of ChatGPT generated code and StackOverflow answers [4.3]
この研究は、ChatGPTとStackOverflowスニペットの脆弱性を実証的に比較する。 ChatGPTはSOスニペットにある302の脆弱性と比較して248の脆弱性を含んでおり、統計的に有意な差のある20%の脆弱性を生み出した。この結果から,両プラットフォーム間の安全性の低いコード伝搬について,開発者が教育を受けていないことが示唆された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:06:41 GMT)
Thompson Sampling for Stochastic Bandits with Noisy Contexts: An Information-Theoretic Regret Analysis [4.3]
本研究では,エージェントが真コンテキストのノイズや破損したバージョンを観測するコンテキスト線形帯域問題について検討する。我々の目標は、託宣の「近似可能なアクションポリシー」を設計することである。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 21:33:47 GMT)
Estimation of multiple mean vectors in high dimension [4.2]
我々は,独立標本に基づいて,共通空間上の様々な確率分布の多次元的手段を推定する。我々のアプローチは、これらのサンプルから得られた経験的手段の凸結合による推定器の形成である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:42:41 GMT)
User Training with Error Augmentation for Electromyogram-based Gesture Classification [4.2]
手首バンド構成の8電極から表面筋電図(sEMG)活性を抽出し,ユーザインタフェースをリアルタイムに制御するシステムの設計と試験を行った。 sEMGデータは、リアルタイムで手の動きを分類する機械学習アルゴリズムにストリームされた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 21:11:15 GMT)
VPAS: Publicly Verifiable and Privacy-Preserving Aggregate Statistics on Distributed Datasets [4.2]
プライバシ保護アグリゲーションプロトコルにおける入力検証と公開検証の課題について検討する。これらの要件を満たす「VPAS」プロトコルを提案する。本研究は,従来のzkSNARKを用いた場合に比べて,本プロトコルの妥当性に関するオーバーヘッドが10倍低いことを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:50:22 GMT)
Training Fully Connected Neural Networks is $\exists\mathbb{R}$-Complete [4.2]
InpiricalRiskmization(英語版)として知られる、与えられたデータポイントのセットに可能な限り適合する2層完全連結ニューラルネットワークの重みとバイアスを求める問題を考察する。任意のデータポイントが有理である場合でも、いくつかのインスタンスを最適に訓練できるウェイトとして、任意の大きな次数の代数数が必要であることを証明します。この結果、Basu, Mianjy, Mukherjee [ICLR 2018]のような検索アルゴリズムは、$mathsfNP=existsでない限り、複数の出力次元を持つネットワークでは不可能である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:42:26 GMT)
KGLiDS: A Platform for Semantic Abstraction, Linking, and Automation of Data Science [4.1]
本稿では、機械学習と知識グラフ技術を用いて、データサイエンスアーティファクトのセマンティクスとその接続を抽象化し、キャプチャするスケーラブルなプラットフォームKGLiDSを提案する。この情報に基づいて、KGLiDSはデータディスカバリやパイプライン自動化など、さまざまなダウンストリームアプリケーションを可能にする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:14:45 GMT)
A Stochastic Quasi-Newton Method for Non-convex Optimization with Non-uniform Smoothness [4.1]
滑らか性に不均一性が存在する場合の高速準ニュートン法を提案する。我々のアルゴリズムは、最もよく知られた$mathcalO(epsilon-3)$サンプルの複雑さを達成でき、収束のスピードアップを楽しむことができる。我々の数値実験により,提案アルゴリズムは最先端の手法よりも優れていることが示された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:40:29 GMT)
Differentially Private Communication of Measurement Anomalies in the Smart Grid [4.0]
本稿では,差分プライバシ(DP)に基づく電力測定を問合せし,システム異常や悪いデータを検出するフレームワークを提案する。我々のDPアプローチは,不信頼な第三者が異常の仮説を検証できるようにしながら,消費とシステムマトリックスデータを隠蔽する。本稿では,電力注入やシステムマトリクスに関するプライベート情報を明らかにしない新しいDPチ方形ノイズ機構を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 21:04:25 GMT)
Statistical Inference For Noisy Matrix Completion Incorporating Auxiliary Information [4.0]
本稿では,半教師付きモデルにおける雑音行列補完の統計的推測について検討する。検討した文脈において,反復最小二乗(LS)推定手法を適用した。提案手法は数回の反復しか必要とせず、結果として得られる低ランク行列と係数行列のエントリーワイズ推定器は正規分布を持つことが保証されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:06:36 GMT)
Codesign of quantum error-correcting codes and modular chiplets in the presence of defects [3.9]
製造エラーは、固体量子デバイスをフォールトトレラントアプリケーションに必要なサイズにスケールアップする際の課題となる。我々は、任意に分散した欠陥を持つキュービットアレイに適応した表面コードをシミュレートし、欠陥が忠実性にどう影響するかを特徴付けるメトリクスを見つける。欠陥率と目標忠実度に基づいて最適なチップレットサイズを選択することは、欠陥による追加のエラー修正オーバーヘッドを制限するのに不可欠である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:35:57 GMT)
Align-to-Distill: Trainable Attention Alignment for Knowledge Distillation in Neural Machine Translation [3.8]
本稿では,機能マッピング問題に対処するためのA2D(Align-to-Distill)戦略を紹介する。実験の結果,WMT-2022->DsbおよびWMT-2014 En->Deに対して,最大3.61点,+0.63点のBLEU値が得られた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:14:48 GMT)
Robust Utility Optimization via a GAN Approach [3.7]
本稿では,堅牢なユーティリティ最適化問題を解決するために,GAN(Generative Adversarial Network)アプローチを提案する。特に、投資家と市場の両方をニューラルネットワーク(NN)でモデル化し、ミニマックスゼロサムゲームでトレーニングする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:36:39 GMT)
Robust sparse IQP sampling in constant depth [3.7]
NISQ(ノイズのある中間スケール量子)は、堅牢な量子優位性と完全なフォールトトレラント量子計算の証明のないアプローチである。本稿では,最小限の誤差補正条件でノイズに頑健な証明可能な超多項式量子優位性を実現する手法を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:34:40 GMT)
ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition [3.7]
ChunkAttentionは、大きな言語モデルのためのプレフィックス対応のセルフアテンションモジュールである。複数のリクエストにまたがる一致したプロンプトプレフィックスを検出し、実行時にそのキー/値テンソルをメモリで共有する。実験によると、ChunkAttentionは、最先端の実装と比較して、自己保持カーネルを3.2-4.8$times$で高速化できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:03:10 GMT)
Geometric Generative Models based on Morphological Equivariant PDEs and GANs [3.6]
群畳み込みニューラルネットワーク(G-CNN)のための等変偏微分方程式(PDE)に基づく幾何学的生成モデルを提案する。提案手法は, PDE-G-CNNにおける形態的同変畳み込みを用いて, GM-GAN (Geological morphological GAN) を求める。予備的な結果は、GM-GANモデルが古典的GANより優れていることを示している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:02:09 GMT)
Anytime, Anywhere, Anyone: Investigating the Feasibility of Segment Anything Model for Crowd-Sourcing Medical Image Annotations [3.4]
Segment Anything Model (SAM)は、例外的なゼロショットの一般化性を備えたセマンティックセマンティックセマンティクスに革命をもたらした。我々は,最先端のDLセグメンテーションモデルである3D nnU-Netモデルをトレーニングするための"dense"セグメンテーションマスクを生成する。その結果, SAM生成アノテーションは, 接地真実アノテーションと比較してDiceスコアが高かったが, SAM生成アノテーションで訓練したnnU-Netモデルは, 接地真実アノテーションで訓練したnnU-Netモデルよりも有意に劣っていることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:07:07 GMT)
ParFormer: Vision Transformer Baseline with Parallel Local Global Token Mixer and Convolution Attention Patch Embedding [3.4]
ParFormerは、異なるトークンミキサーを単一のステージに組み込むことができる拡張トランスフォーマーアーキテクチャである。我々は、トークンミキサー抽出を改善するために標準パッチ埋め込みの強化として、CAPE(Convolutional Attention Patch Embedding)を提供する。 11M,23M,34Mのモデル変種はそれぞれ80.4%,82.1%,83.1%のスコアを得た。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:32:21 GMT)
Private, Anonymous, Collateralizable Commitments vs. MEV [3.4]
PACCは、スマートコントラクトウォレット所有者が、クレーム、要求、あるいはコミットメント全般を、プライベートで匿名の方法で担保することを可能にする。本研究では,現在発生しているDeFiの最大抽出可能値(MEV)を効果的に除去するためにPACCを適用し,検閲に代えてMEVを移行できることを実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:43:20 GMT)
KoCoSa: Korean Context-aware Sarcasm Detection Dataset [3.4]
サルカズム(英: Sarcasm)は、言葉による皮肉の一種で、ある人、状況、あるいは考えを笑うために、誰かがその意味とは逆の言葉を言う。本稿では,韓国のSarcasm検出タスクKoCoSaの新しいデータセットについて紹介する。データセットは、1日12.8Kの韓国の対話と、最後のレスポンスでこのタスクのラベルで構成されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:29:26 GMT)
Bridging BRC-20 to Ethereum [3.3]
私たちは、これまで不均一に不適合だったBitcoinとネットワークを接続するための軽量ブリッジを設計し、実装し、評価しました。最近発表されたBitcoin Request Comment (BRC-20)標準に触発された私たちは、それぞれのサトシに編集可能な操作を埋め込むことで、Bitcoinの銘文の柔軟性を活用しています。ユーザは、Bitcoinネットワークからのリクエストを初期化して、ネットワーク上で対応するアクションをトリガーすることができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:27:06 GMT)
Towards Deep Learning Enabled Cybersecurity Risk Assessment for Microservice Architectures [3.1]
CyberWise Predictorは、マイクロサービスアーキテクチャに関連するセキュリティリスクを予測し、評価するためのフレームワークである。当社のフレームワークは,新たな脆弱性に対する脆弱性メトリクスの自動予測において,平均92%の精度を実現している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:42:33 GMT)
Improving Forward Compatibility in Class Incremental Learning by Increasing Representation Rank and Feature Richness [3.1]
本稿では,前方互換性向上を目的としたRFR法を提案する。本研究は,破滅的忘れ込みを緩和しつつ,新規タスク性能を高めるためのアプローチの有効性を実証するものである。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:14:30 GMT)
CLIP-VQDiffusion : Langauge Free Training of Text To Image generation using CLIP and vector quantized diffusion model [3.0]
トレーニング済みのCLIPモデルを利用して,マルチモーダルなテキスト画像表現と強力な画像生成機能を実現するCLIP-VQDiffusionを提案する。筆者らのモデルでは,従来の最先端手法を4.4%向上させ,テキストが分布内外であっても,非常にリアルな画像を生成することができた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:34:59 GMT)
Investigating Use Cases of AI-Powered Scene Description Applications for Blind and Low Vision People [3.0]
視覚障害者(BLV)にとって「シーン記述」の応用は有用な日常ツールである。我々は,16人のBLV参加者がAIを用いたシーン記述アプリケーションを使用した2週間の日記調査を行った。既知のオブジェクトの視覚的特徴を識別するなどのユースケースや、危険なオブジェクトとの接触を避けるような驚くべきユースケースが頻繁に見出されました。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:16:55 GMT)
Explanation Hacking: The perils of algorithmic recourse [3.0]
我々は、リコメンデーションの説明がいくつかの概念的な落とし穴に直面しており、問題のある説明ハッキングにつながると論じている。代替として、AI決定の説明は理解を目的とすべきである、と我々は主張する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:49:28 GMT)
Tie-Breaking Rule Based on Partial Proof of Work in a Blockchain [2.9]
既存のブロックチェーンシステムの実証に容易に適用可能な,最後の生成ルールを提案する。本手法では,ブロックとして機能しない部分的な作業証明を,より粒度の細かい時間標準として用いる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:24:12 GMT)
Finding the right XAI method -- A Guide for the Evaluation and Ranking of Explainable AI Methods in Climate Science [2.9]
気候の文脈でXAI評価を導入し、異なる所望の説明特性について論じる。 XAI法では, 階層的関係伝播, 入力時間勾配が, 強靭性, 忠実性, 複雑度を示すことがわかった。 XAI手法のロバスト性,複雑性,ローカライゼーションスキルに関して,アーキテクチャに依存した性能差がみられた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:56:05 GMT)
CTSM: Combining Trait and State Emotions for Empathetic Response Model [2.9]
共感応答生成は、対話システムに話者の感情を知覚し、それに応じて共感応答を生成する。我々は,共感反応モデル(CTSM)のためのトラストと状態感情の組み合わせを提案する。対話における感情を十分に知覚するために、まず特徴と状態の感情の埋め込みを構築し、エンコードする。感情表現を誘導する感情誘導モジュールにより、感情知覚能力をさらに強化する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:45:13 GMT)
No distributed quantum advantage for approximate graph coloring [2.9]
分散アルゴリズムを用いた$c$-coloring $chi$-chromatic graphの難易度を,ほぼ完全に評価する。これらの問題は、分散量子の優位性を認めないことを示している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:26:33 GMT)
IFSENet : Harnessing Sparse Iterations for Interactive Few-shot Segmentation Excellence [2.8]
新しいクラスのセグメンテーションを学ぶために必要な画像の数を減らします。インタラクティブなセグメンテーション技術は、一度に1つのオブジェクトのセグメンテーションを漸進的に改善することのみに焦点を当てます。 2つの概念を組み合わせることで、新しいクラスのセグメンテーションモデルをトレーニングするのに要する労力を大幅に削減する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:15:53 GMT)
Inferring the arrow of time in quantum spatiotemporal correlations [2.8]
量子実験から得られた測定データに付随する時間順序を2回および任意の数量子ビットで示す方法について検討する。擬似密度行列時空状態を用いて測定データを表現する。非対称な条件に対して、このプロトコルは、データがユニタリディレーション回復マップと一致しているか、CPTPマップと一致しているかを決定する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:12:12 GMT)
Investigating the Performance of Language Models for Completing Code in Functional Programming Languages: a Haskell Case Study [2.8]
関数型プログラミング言語Haskell上で、コードのための2つの言語モデル、CodeGPTとUniXcoderを評価した。 HuggingFace上で公開されているHaskellデータセットから得られたHaskell関数のモデルを微調整し、評価する。我々の自動評価では, LLMの事前学習における命令型プログラミング言語の知識は, 関数型言語にうまく移行しない可能性が示唆された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:13:13 GMT)
Snail: Secure Single Iteration Localization [2.7]
ローカライゼーション(Localization)とは、画像と環境マップからカメラの位置と向きを決定するコンピュータビジョンタスクである。本稿では,2つのローカライゼーション手法,ガーブロード回路に適したローカライゼーションのベースラインデータ公開適応と,新しいシングルイテレーションローカライゼーションを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:41:14 GMT)
On the Inclusion of Charge and Spin States in Cartesian Tensor Neural Network Potentials [2.7]
最先端の同変カルトテンソルニューラルネットワーク電位が拡張される。入力縮退問題に対処し、様々な化学系におけるモデルの予測精度を高める。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:54:04 GMT)
Fast Nonlinear Two-Time-Scale Stochastic Approximation: Achieving $O(1/k)$ Finite-Sample Complexity [2.5]
本稿では,2つの結合非線形作用素の根を探すために,2時間スケールのモノトン近似の新しい変種を開発することを提案する。私たちのキーとなるアイデアは、古典的なRuppert-Polyak平均化技術を活用して、それらのサンプルを通して演算子を動的に推定することです。これらの平均ステップの見積値は、望まれる解を見つけるために、2時間スケールの近似更新で使用される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:29:14 GMT)
Learning to Predict Structural Vibrations [2.5]
飛行機、車、家屋などの機械構造では、騒音が発生し振動によって伝達される。このノイズを低減させるためには、高価な数値計算で振動をシミュレートする必要がある。本稿では,高調波励起板の振動予測に関するベンチマークを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:49:06 GMT)
SiMBA: Simplified Mamba-Based Architecture for Vision and Multivariate Time series [2.4]
我々は,特定の固有値計算によるチャネルモデリングのためのEinstein FFT(EinFFT)を導入し,シーケンスモデリングにMambaブロックを用いる新しいアーキテクチャであるSiMBAを提案する。 SiMBAは既存のSSMよりも優れており、最先端の変換器と性能のギャップを埋めている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:22:56 GMT)
Exploring the Task-agnostic Trait of Self-supervised Learning in the Context of Detecting Mental Disorders [2.3]
自己教師付き学習(SSL)は、様々な領域にまたがるタスクに依存しない表現を生成するために研究されている。この研究では、複数の固定されたターゲットまたはマスクされたフレームを予測することでトレーニングされたSSLモデルを採用する。本稿では,MDDおよびPTSDの検出において,生成した表現をより効率的にするための固定目標のリストを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:46:58 GMT)
Fundus: A Simple-to-Use News Scraper Optimized for High Quality Extractions [2.3]
Fundusはユーザーフレンドリーなニューススクレイパーで、ユーザーはほんの数行のコードで何百万もの高品質なニュース記事を入手できる。既存のニューススクレイパーとは異なり、手作業で作り上げたコンテンツ抽出機を使っています。私たちのフレームワークは、クローリング(Webや大規模なWebアーカイブからHTMLを取得する)とコンテンツ抽出を1つのパイプラインに組み合わせています。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:22:06 GMT)
Web-based Melanoma Detection [2.3]
本研究では,11のデータセットと24の最先端ディープラーニングアーキテクチャを組み合わせた54の組み合わせをサポートする統一メラノーマ分類手法を提案する。 1,296の実験を公平に比較することができ、その結果、Mela-Dという名前のWebベースのMeshNetアーキテクチャにデプロイ可能な軽量モデルが実現される。このアプローチはパラメータを24倍にすることで最大33倍高速に実行でき、それ以前の画像ではResNet50に匹敵する88.8%の精度が得られる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:04:51 GMT)
Global Control for Local SO(3)-Equivariant Scale-Invariant Vessel Segmentation [2.3]
本稿では, ボクセルマスクのセグメンテーションを利用した大域的制御器の組み合わせにより, 興味のある容器の境界条件を提供する。腹部大動脈瘤(AAA)を含むデータセットに対する本法の有用性について検討した。本手法は, AAA, 腸骨動脈, 腎動脈の分節における最先端の分節モデルと同等に機能する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:06:43 GMT)
Generative AI in Education: A Study of Educators' Awareness, Sentiments, and Influencing Factors [2.2]
本研究は,AI言語モデルに対する教員の経験と態度について考察する。学習スタイルと生成AIに対する態度の相関は見つからない。 CS教育者は、生成するAIツールの技術的理解にはるかに自信を持っているが、AI生成された仕事を検出する能力にこれ以上自信がない。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:21:29 GMT)
All van der Waals three-terminal SOT-MRAM realized by topological ferromagnet Fe3GeTe2 [2.2]
磁気ファンデルワールス(vdW)材料は、学術的関心と過去数年間の応用の可能性から、大きな注目を集めている。ここでは、Fe3GeTe2(FGT)の巨大内在性SOTの物理原理と、よく知られた産業適応型トンネル磁気抵抗効果(TMR)効果を用いて、全vdW三端子SOTメモリを実現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:08:11 GMT)
Assessing Web Fingerprinting Risk [2.1]
ブラウザー指紋(Browser fingerprints)は、クッキーが無効になってもユーザーの秘密の追跡を可能にするデバイス固有の識別子である。これまでの研究は、指紋認証のリスクを定量化するための鍵となる指標として、情報の尺度であるエントロピーを確立してきた。我々は,先行作業の限界に対処するブラウザのフィンガープリントについて,最初の研究を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:34:41 GMT)
FSD-Inference: Fully Serverless Distributed Inference with Scalable Cloud Communication [2.1]
FSD-Inferenceは、分散ML推論のための、初めて完全にサーバレスで高度にスケーラブルなシステムである。我々は、クラウドベースのパブリッシュ/サブスクライブ/キューとオブジェクトストレージの両方を活用する、ML推論ワークロードのための、新しい完全なサーバレス通信スキームを紹介します。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:31:24 GMT)
Two convergent NPA-like hierarchies for the quantum bilocal scenario [2.0]
結合量子系の単一部分の局所的な測定から生じる相関を特徴づけることは、量子情報理論の主要な問題の一つである。スカラー拡張に同値性を示す新しい階層を導入し、既知の一般化との関係を探求する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:07:58 GMT)
S2DM: Sector-Shaped Diffusion Models for Video Generation [2.0]
ビデオ生成のためのセクタ型拡散モデル(S2DM)を提案する。 S2DMは、同じ意味と本質的な特徴を共有する本質的な関連データ群を生成することができる。追加のトレーニングなしに、我々のモデルは、他の時間的条件と統合され、生成モデルは、既存の作業と同等のパフォーマンスを達成できることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:41:38 GMT)
ESG Classification by Implicit Rule Learning via GPT-4 [2.0]
本稿では,GPT-4のような最先端言語モデルが未知のESG評価基準に適合するようにガイドできるかどうかを検討する。韓国における共有タスクML-ESG-3Impact Type Trackの2位にランク付けすることで,これらのアプローチの有効性を実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:45:30 GMT)
From Guidelines to Governance: A Study of AI Policies in Education [2.0]
本研究は,新興技術に関する政策状況を調べるための調査手法を用いている。ほとんどの機関は、ChatGPTのようなAIツールの倫理的展開のための特別なガイドラインを欠いている。高校は高等教育機関よりも政策に取り組む傾向が低い。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:07:58 GMT)
Spiking Wavelet Transformer [1.9]
スパイキングニューラルネットワーク(SNN)は、脳のイベント駆動処理を模倣することによって、従来のディープラーニングに代わるエネルギー効率の高い代替手段を提供する。グローバルな自己注意操作に依存しているため、移動エッジや画素レベルの明るさ変化のような高周波パターンを捉えることは不可能である。本研究では、スパイク駆動方式で包括的空間周波数特徴を効果的に学習する無注意アーキテクチャであるSpking Wavelet Transformer(SWformer)を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:44:21 GMT)
Accelerating Recommender Model Training by Dynamically Skipping Stale Embeddings [1.8]
Slipstreamは、オンザフライで古い埋め込みを識別し、更新をスキップしてパフォーマンスを向上させるフレームワークである。本稿では,実世界のデータセットと構成における2x,2.4x,1.2x,1.175xのトレーニング時間短縮について述べる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:29:06 GMT)
Robust optimization for adversarial learning with finite sample complexity guarantees [1.8]
本稿では,線形・非線形な分類問題に着目し,ロバストな分類器に対する新しい逆学習法を提案する。データ駆動型レンズの下ではロバスト性があり、線形および非線形の分類器の2進および複数クラスシナリオにおける有限標本複雑性境界を導出する。線形および非線形モデルに対する線形計画法 (LP) と2次コーン計画法 (SOCP) を用いて, 最悪のサロゲート損失を最小限に抑えるアルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:49:53 GMT)
LOOPer: A Learned Automatic Code Optimizer For Polyhedral Compilers [1.8]
ディープラーニングに基づくコストモデルを用いた,最初の多面体自動スケジューリングシステムである LOOPer を紹介する。大規模なアフィン変換の探索をサポートし、多面体変換の複雑な配列を適用できる。また、複数のループネストと長方形および非矩形反復領域を持つプログラムの最適化もサポートする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:28:05 GMT)
Modular Deep Active Learning Framework for Image Annotation: A Technical Report for the Ophthalmo-AI Project [1.7]
MedDeepCyleALは、完全なアクティブラーニングサイクルを実装するエンドツーエンドフレームワークである。研究者に、採用したいディープラーニングモデルの種類を選択する柔軟性を提供する。 MedDeepCyleALはどんな画像データにも適用可能ですが、本プロジェクトでは特に眼科データに適用しています。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:53:03 GMT)
A Transfer Attack to Image Watermarks [1.7]
本研究では,Non-box設定における画像透かしに対する新しい転送回避攻撃を提案する。私たちの主な貢献は、理論的にも経験的にも、透かしベースのAI生成画像検出器は、回避攻撃に対して堅牢ではないことを示すことです。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:33:11 GMT)
Origin of Symmetry Breaking in the Grasshopper Model [1.6]
我々は、長距離等方性相互作用を持つモデルにおける回転対称性の破れの性質を解析し、説明する。回転対称性は小さなジャンプのために3次元で回復され、2次元問題の非等方的コグホイール状態に対応する。 2次元のフルグラスホッパーモデルに対して、ディスクの最適摂動の定量的予測を得る。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:00:05 GMT)
SwiftBrush: One-Step Text-to-Image Diffusion Model with Variational Score Distillation [1.6]
テキストと画像の拡散モデルは、しばしば遅い反復的なサンプリングプロセスに悩まされる。我々は$textbfSwiftBrush$という新しいイメージフリー蒸留方式を提案する。 SwiftBrushは、COCO-30Kベンチマークで、$textbf16.67$のFIDスコアと$textbf0.29$のCLIPスコアを達成している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:13:23 GMT)
Application of the NIST AI Risk Management Framework to Surveillance Technology [1.5]
本研究は、NIST AI RMF(National Institute of Standards and Technology's AI Risk Management Framework)の応用と意義を詳細に分析する。本研究は, 顔認識システムのリスクが高く, 連続性が高いことから, 本分野におけるリスク管理への構造的アプローチの必要性を強調している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:07:11 GMT)
Real-time Threat Detection Strategies for Resource-constrained Devices [1.5]
本稿では,ルータ内のDNSトンネリング攻撃を効果的に処理するエンド・ツー・エンド・プロセスを提案する。我々は、MLモデルをトレーニングするためにステートレスな機能を利用することと、ネットワーク構成から独立して選択した機能を利用することで、非常に正確な結果が得られることを実証した。さまざまな環境にまたがる組み込みデバイスに最適化されたこの慎重に構築されたモデルのデプロイにより、最小のレイテンシでDNSチューニングされた攻撃検出が可能になった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:02:54 GMT)
Towards Knowledge-Grounded Natural Language Understanding and Generation [1.5]
この論文は、トランスフォーマーモデルによる自然言語の理解と生成が、モデルに知識表現を組み込むことの利点について考察する。この論文では、関連性のある、最新のエンティティの知識を取り入れることで、偽ニュース検出の恩恵を受ける。パラメトリックな知識や蒸留された知識といった他の一般的な知識は、多言語および多言語的な知識集約的なタスクを強化することが確立されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:32:43 GMT)
Music to Dance as Language Translation using Sequence Models [1.4]
MDLTは、振付生成問題を翻訳タスクとしてフレーム化する新しい手法である。本稿では,トランスフォーマーアーキテクチャを利用したMDLTと,Mambaアーキテクチャを用いたMDLTの2つのバリエーションを提案する。我々はAIST++とPhantomDanceのデータセットを使ってロボットアームにダンスを教えるが、本手法は完全なヒューマノイドロボットに適用できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:47:54 GMT)
Estimating properties of a quantum state by importance-sampled operator shadows [1.4]
観測変数の期待値を未知の量子状態で推定する簡単な方法を提案する。データ構造を構築するための時間的複雑さは、古典的なシャドウの処理後時間と同様、$k$-local observablesに対して2O(k)$である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:20:38 GMT)
RGBD GS-ICP SLAM [1.3]
一般化反復閉点(G-ICP)と3次元ガウススプラッティング(DGS)を融合した新しい密度表現SLAM手法を提案する。実験の結果,提案手法の有効性が示され,非常に高速な107 FPSが得られた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:05:53 GMT)
MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis [1.3]
胸部X線像は急性および慢性の心肺疾患の予測に一般的に用いられている。構造化された臨床データと統合する努力は、不完全な電子健康記録による課題に直面している。本稿では,マルチモーダル大言語モデル (MLLM) , 少数ショットプロンプト (FP) , ビジュアルグラウンド (VG) を統合した最初のモデルである textbfMedPromptX を紹介する。その結果、MedPromptXのSOTA性能を示し、ベースラインに比べてF1スコアが11%向上した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:19:51 GMT)
MaCmS: Magahi Code-mixed Dataset for Sentiment Analysis [1.3]
このデータセットは、感情分析タスクのための最初のMagahi-Hindi-Englishコードミックスデータセットである。また、コードミキシングの構造を理解するために、データセットの言語学的解析を行う。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:28:42 GMT)
Improving cross-domain brain tissue segmentation in fetal MRI with synthetic data [1.2]
胎児脳MRIにおける領域ランダム化手法であるFetal SynthSegを紹介する。以上の結果から,合成データのみにトレーニングされたモデルは,実データにトレーニングされたモデルよりも優れていた。評価は低磁場(0.55T)MRIで得られた40例に拡張し,新しいSRモデルを用いて再構成した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:42:25 GMT)
Efficiently Assemble Normalization Layers and Regularization for Federated Domain Generalization [1.2]
ドメインシフト(Domain shift)は、マシンラーニングにおいて、目に見えないドメインでテストした場合に、モデルのパフォーマンス低下に悩まされるという深刻な問題である。 FedDGは、プライバシー保護の方法で協調的なクライアントを使用してグローバルモデルをトレーニングしようと試みている。本稿では, 誘導正規化方式に依存するFedDGの新しいアーキテクチャ手法,すなわちgPerXANを紹介する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:22:08 GMT)
Self-Improvement for Neural Combinatorial Optimization: Sample without Replacement, but Improvement [1.2]
建設的ニューラル最適化の現在の手法は、通常、専門家ソリューションからの行動クローニングや強化学習からのポリシー勾配手法を用いてポリシーを訓練する。各エポックにおける現在のモデルを用いて、ランダムなインスタンスに対して複数の解をサンプリングし、その後、教師付き模倣学習のための専門家の軌跡として最適な解を選択することにより、この2つを橋渡しする。我々は,旅行セールスマン問題とキャパシタントカールーティング問題に対する我々のアプローチを評価し,本手法で訓練したモデルは,専門家データで訓練したモデルと同等の性能と一般化を実現する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:09:10 GMT)
Physics-Enhanced Multi-fidelity Learning for Optical Surface Imprint [1.1]
本稿では,MFNN(Multi-fidelity Neural Network)を用いた逆問題解法を提案する。我々は、純粋なシミュレーションデータを通してNNモデルを構築し、次にトランスファーラーニングを介してsim-to-realギャップをブリッジする。実際の実験データを収集することの難しさを考慮し、未知の物理を掘り出し、既知の物理を転写学習フレームワークに埋め込む。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:09:25 GMT)
Fermionic Isometric Tensor Network States in Two Dimensions [1.0]
リアルタイムおよび仮想時間進化のための時間進化ブロック決定アルゴリズムをベンチマークした。仮想時間進化は、ギャップ化されたシステム、ディラック点を持つシステム、ギャップのないエッジモードを持つシステムの基底状態エネルギーを精度良く生成する。リアルタイムTEBDはチャーン絶縁体の境界上の2つのフェルミオンの散乱とカイラルエッジのダイナミクスをキャプチャする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:16:31 GMT)
Specifying Genericity through Inclusiveness and Abstractness Continuous Scales [1.0]
本稿では,自然言語における名詞句(NP)の詳細なモデリングのための新しいアノテーションフレームワークを提案する。このフレームワークはシンプルで直感的に設計されており、専門家でないアノテータにもアクセスでき、クラウドソースのタスクに適している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:21:07 GMT)
Empirical investigation of multi-source cross-validation in clinical machine learning [1.0]
クロスバリデーション法は、機械学習に基づく臨床予測モデルの精度を推定するために用いられる。マルチソース環境における標準Kフォールドクロスバリデーションと離脱元クロスバリデーションの系統的評価について述べる。以上の結果から,K-foldクロスバリデーションは単一ソースデータと複数ソースデータの両方において,新たなソースへの一般化を目標とする場合の予測性能を体系的に過大評価していることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:56:31 GMT)
Federated Bayesian Deep Learning: The Application of Statistical Aggregation Methods to Bayesian Models [1.0]
集約戦略は、分散決定論的モデルの重みとバイアスをプールまたはフューズするために開発されている。決定論的モデルに対するFLスキームに付随するアグリゲーション手法の簡単な適用は不可能か、あるいは準最適性能をもたらすかを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:02:24 GMT)
GTC: GNN-Transformer Co-contrastive Learning for Self-supervised Heterogeneous Graph Representation [0.9]
本稿では,GNN-Transformerの協調学習手法を提案し,GTCアーキテクチャを構築する。 The Transformer branch for the Metapath-aware Hop2Token and CG-Hetphormer which can Cooper with GNN to Attentively encoding neighborhood information from different levels。実際のデータセットでの実験では、GTCは最先端の手法よりも優れた性能を示している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:22:44 GMT)
Cross-Lingual Learning vs. Low-Resource Fine-Tuning: A Case Study with Fact-Checking in Turkish [0.9]
実世界で3238件のクレームからなるFCTRデータセットを紹介した。このデータセットは複数のドメインにまたがり、3つのトルコのファクトチェック組織から収集された証拠が組み込まれている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:54:03 GMT)
A Linear Time-Delay Scheme to Propagate Reduced Electron Density Matrices [0.7]
この手法を分子中の電子の相関ダイナミクスの解法に応用する。我々は、TDCI電子密度を減少させる自己完結型対称性/制約保存法を導出した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:56:48 GMT)
Augmented Reality Warnings in Roadway Work Zones: Evaluating the Effect of Modality on Worker Reaction Times [0.7]
本研究では、異なるAR警告の組み合わせが労働者の反応時間に与える影響を分析することにより、道路作業区域内の安全対策を改善することを目的とする。提案手法は,高度なARシステムのプロトタイプ,ワークゾーン環境内のAR機能のVRシミュレーション,実験間でユーザエクスペリエンスを同期するWizard of Ozテクニックの3つの重要なコンポーネントから構成される。コントロールされた屋外ワークゾーンと屋内VR設定で5つの実験を行うことで、さまざまなマルチモーダルAR警告が労働者の反応時間に与える影響について貴重な情報を提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:52:10 GMT)
Construction of a Japanese Financial Benchmark for Large Language Models [0.7]
GPT-4は現在際立っており、構築されたベンチマークは効果的に機能している。我々のベンチマークは、異なる困難を伴うタスクを組み合わせることで、すべての性能範囲のモデル間でベンチマークスコアを区別することができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:40:27 GMT)
Empirically Exploring How Novices Write Software Models in Alloy [0.6]
本稿では, 初心者がアロイを学習しようとする場合, 97,000モデル以上のモデルについて実証的研究を行った。本研究では,ユーザが将来使用するための総合的なベンチマークを作成するために,正しいモデルと間違ったモデルの両方を記述する方法を検討する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:21:09 GMT)
Toulouse Hyperspectral Data Set: a benchmark data set to assess semi-supervised spectral representation learning and pixel-wise classification techniques [0.6]
本稿では,大規模ハイパースペクトル画像に対するスペクトル表現学習と分類において重要な課題に対処するToulouse Hyperspectral Data Setについて述べる。我々は,Masked Autoencoderを含むスペクトル表現学習のための自己指導的手法を議論し,また,総合精度85%,F1スコア77%を達成できる画素単位の分類基準を確立する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:46:05 GMT)
Global License Plate Dataset [0.6]
データセットは、74カ国から収集されたさまざまなサンプルを含む500万枚以上の画像で構成されている。データセットの統計分析を含み、ベースラインの効率的かつ正確なモデルを提供します。 GLPDは、モデル開発とライセンスプレート認識のための微調整のための主要なベンチマークデータセットになることを目標としている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:01:24 GMT)
Magic for the Age of Quantized DNNs [0.6]
ミニバッチサイズに依存しない新しい正規化(Layer-Batch Normalization)を導入し,推論時に追加コストを必要としない。また、同じ関数を用いて活性化関数を量子化し、代理勾配を適用して、量子化重みと量子化活性化関数の両方でモデルを訓練する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:21:09 GMT)
Parametric PDE Control with Deep Reinforcement Learning and Differentiable L0-Sparse Polynomial Policies [0.6]
パラメトリック偏微分方程式(PDE)の最適制御は、工学や科学における多くの応用において重要である。深部強化学習(DRL)は高次元および複雑な制御問題を解く可能性がある。本研究では、辞書学習とL$_0$正規化を利用して、PDEのスパース、ロバスト、解釈可能な制御ポリシーを学習する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:06:31 GMT)
Analyzing Male Domestic Violence through Exploratory Data Analysis and Explainable Machine Learning Insights [0.6]
既存の文献は、主に家庭内暴力のシナリオにおける女性の犠牲者を強調しており、男性の犠牲者に関する研究が欠如している。本研究はバングラデシュにおける男性家庭内暴力(MDV)の未発見領域の先駆的な探索である。本研究は、家庭内虐待が主に女性に影響を及ぼすという一般的な考え方に挑戦し、男性被害者に対する適切な介入や支援システムの必要性を強調した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:53:21 GMT)
Towards Automatic Abdominal MRI Organ Segmentation: Leveraging Synthesized Data Generated From CT Labels [0.5]
腹部の臓器を正確に分断する能力はMRI(MRI)スキャンでは依然として困難である。我々は、CTラベルマップを利用してトレーニング中に合成画像を生成する、モダリティ非依存領域ランダム化アプローチを活用する。 MRデータを用いた完全教師付きセグメンテーション法と比較した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:38:40 GMT)
Multiscale Hodge Scattering Networks for Data Analysis [0.5]
我々は,simplicial Complex上で測定された信号に対する新しい散乱ネットワークを提案し,これをemphMultiscale Hodge Scattering Networks (MHSNs)と呼ぶ。我々の構成は、単純複体上の多スケール基底辞書、すなわち $kappa$-GHWT と $kappa$-HGLET に基づいている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:08:51 GMT)
Large-scale quantum approximate optimization on non-planar graphs with machine learning noise mitigation [0.5]
誤差軽減は、ノイズの多いデバイスが有意義に実行できる量子回路のサイズを拡大する。機械学習に基づく誤差軽減により最大40ノードの非平面ランダム正規グラフ上で量子近似最適化アルゴリズム(QAOA)を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:38:40 GMT)
Solving a Real-World Package Delivery Routing Problem Using Quantum Annealers [0.4]
本研究の目的は,問題緩和や技術的ショートカットを回避し,現実的な事例の解決方法を提案することである。量子古典的ハイブリッド解法 Q4RPD を開発した。 Q4RPDの適用を実証するために、6つの異なるインスタンスからなる実験が実施されている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:16:11 GMT)
Guided quantum walk [0.4]
確率振幅は局所的なラビ振動によって探索空間を横切ることを示す。誘導量子ウォーク(GQW)をQWライクな手順とQAライクな手順のブリッジとして導入することにより、多段階QWの概念を拡張した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:23:58 GMT)
Quantum-inspired classification via efficient simulation of Helstrom measurement [0.4]
ヘルストロム測定(HM)は、最小誤差で非直交量子状態を識別するための最適戦略として知られている。本稿では,HMと状態忠実度の関係を利用して,任意のコピー数の効率的なシミュレーション手法を提案する。本手法は,データコピー数に応じて分類性能が単調に向上しないことを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:59:21 GMT)
Self-Supervised Backbone Framework for Diverse Agricultural Vision Tasks [0.4]
農業におけるコンピュータビジョンは、農業をデータ駆動で正確で持続可能な産業に変えるために、ゲームを変える。ディープラーニングは農業のビジョンに力を与えて、膨大な複雑な視覚データを分析するが、大きな注釈付きデータセットの可用性に大きく依存している。本研究では,ResNet-50のバックボーンを実世界の農地画像の大規模データセット上に事前学習するための,コントラスト学習手法であるSimCLRを用いた軽量フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:46:51 GMT)
WEEP: A method for spatial interpretation of weakly supervised CNN models in computational pathology [0.4]
モデル解釈のための新しい方法 Wsi rEgion sElection aPproach (WEEP) を提案する。乳がん計算病理領域における二分分類課題におけるWEEPについて検討した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:32:02 GMT)
Brain-grounding of semantic vectors improves neural decoding of visual stimuli [0.3]
本稿では,意味ベクトルの脳基底と呼ばれる表現学習フレームワークを提案する。我々は,150種類の視覚刺激カテゴリーのfMRIを用いて,このモデルを訓練した。脳基底ベクトルを用いることで、異なるモードの脳データにおける脳の復号と識別精度が増大することが観察された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:01:10 GMT)
An Integrated Neighborhood and Scale Information Network for Open-Pit Mine Change Detection in High-Resolution Remote Sensing Images [0.3]
高分解能(HR)リモートセンシング画像における露天地雷変化検出(CD)は、鉱物開発と環境保護において重要な役割を担っている。本稿では、HRリモートセンシング画像におけるオープンピットマイニングCDのためのINSINet(Integrated Neighborhood and Scale Information Network)を提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:27:25 GMT)
SIMAP: A simplicial-map layer for neural networks [0.2]
SIMAPレイヤはSimplicial-Map Neural Networks (SMNN)の拡張版である SMNNとは異なり、サポートセットは、行列ベースの乗算アルゴリズムで効率よく計算される、固定された最大値の単純度に基づいている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:06:42 GMT)
PDE-CNNs: Axiomatic Derivations and Applications [0.2]
グループ畳み込みニューラルネットワーク(PDE-G-CNN)は、幾何学的に意味のある進化PDEの解法を、G-CNNの従来のコンポーネントの代用として利用する。本稿では, ユークリッド同変 PDE-G-CNN に焦点をあてる。我々は、PDE-CNNがCNNと比較して少ないパラメータ、優れた性能、データ効率を提供する小さなネットワークを実験的に確認した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:11:26 GMT)
The optimal placement of the head in the noun phrase. The case of demonstrative, numeral, adjective and noun [0.2]
言語において好まれる順序によって、名詞は終わりの1つに置かれる傾向があることを示す。我々はまた、アンチローカリティ効果の証拠も示している: 望ましい順序における構文依存は、偶然に予想されるよりも長い。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:10:14 GMT)
An In-Depth Analysis of Data Reduction Methods for Sustainable Deep Learning [0.2]
トレーニングデータセットのサイズを減らすために、最大8つの異なる方法を提示します。また、それらを適用するPythonパッケージも開発しています。これらのデータ削減手法がデータセットの表現性に与える影響を実験的に比較した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:06:40 GMT)
An Interactive Decision-Support Dashboard for Optimal Hospital Capacity Management [0.1]
サージ期間中に病院の容量管理決定を通知するためのインタラクティブでユーザフレンドリな電子ダッシュボードを開発した。ダッシュボードには、リアルタイム病院データ、予測分析、最適化モデルが統合されている。病院の管理者は対話的にパラメータをカスタマイズでき、さまざまなシナリオを探索できる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:13:18 GMT)
Integrating multiscale topology in digital pathology with pyramidal graph convolutional networks [0.1]
グラフ畳み込みネットワーク(GCN)は、デジタル病理学における畳み込みニューラルネットワークを用いた複数インスタンス学習の強力な代替手段として登場した。提案するマルチスケールGCN (MS-GCN) は,スライド画像全体において複数の倍率レベルにまたがる情報を活用することでこの問題に対処する。 MS-GCNは、既存の単一磁化GCN法よりも優れた性能を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:48:50 GMT)
Measuring two temperatures using a single thermometer [0.1]
1つの温度計を用いて2つの温度を同時に測定できることを示す。特に、複数の量子自由度(DoF)を持つ複合粒子を温度センサとして検討する。これらの粒子をマッハ・ツェンダー型干渉計で同時に2つの温度を推定できることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:14:55 GMT)
SYNCS: Synthetic Data and Contrastive Self-Supervised Training for Central Sulcus Segmentation [0.1]
デンマーク高リスク・レジリエンス研究(VIA)は、特に家族性高リスク児(FHR)の早期疾患プロセスの理解に焦点を当てている中枢サルクス(Central sulcus, CS)は、運動および感覚処理に関わる脳の領域に関連する顕著な脳のランドマークである。本研究では,CSの多様性をモデル化するための合成データ生成と,新しいコホートにモデルを適用するためのマルチタスク学習による自己教師付き事前学習という,CSセグメンテーションを改善するための2つの新しいアプローチを紹介する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:24:31 GMT)
An ensemble of data-driven weather prediction models for operational sub-seasonal forecasting [0.1]
運用可能なマルチモデルアンサンブル天気予報システムを提案する。データ駆動型天気予報モデルを用いたマルチモデルアンサンブル手法により、最先端のサブシーズン・シーズン・シーズン予測を実現することができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 20:01:53 GMT)
Comprehensive Lipidomic Automation Workflow using Large Language Models [0.1]
Comprehensive Automated (CLAW)プラットフォームは、解析、詳細な統計分析、脂質アノテーションのためのワークフローを統合している。 CLAWは不飽和脂質中の炭素-炭素二重結合位置の同定を含むいくつかのモジュールを含む。人工知能(AI)エージェントを使用した大規模言語モデルによる統合言語ユーザインタフェース。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:00:52 GMT)
BBE-LSWCM: A Bootstrapped Ensemble of Long and Short Window Clickstream Models [0.0]
本稿では,QBOのような製品におけるリアルタイムの顧客イベント予測問題に対するクリックストリームモデリングフレームワークの開発について考察する。我々は,低レイテンシ,低コスト,堅牢なアンサンブルアーキテクチャ(BBE-LSWCM)を開発した。他のベースライン手法と比較して、2つの重要なリアルタイム事象予測問題に対して提案手法の優れた性能を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:14:22 GMT)
Prethermal stability of eigenstates under high frequency Floquet driving [0.0]
局所的な可観測物は、エネルギー保存過程によってはるかに早く崩壊することを示した。ここでは、忠実度減衰時間 $tau_rm f$ を記述する2チャンネル理論を示す。本研究は,Floquet 工学を用いて興味深い多体ハミルトニアンを生成する実験手法の堅牢性について報告する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:17:41 GMT)
tLaSDI: Thermodynamics-informed latent space dynamics identification [0.0]
熱力学の第一原理と第二原理を組み込んだ潜在空間力学同定法,すなわち tLa を提案する。潜伏変数は、非線形次元減少モデルとしてオートエンコーダを通して学習される。誘引的相関は、潜在空間におけるtLaの量とフルステート溶液の挙動の間に実験的に観察される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:01:58 GMT)
Visualization of Unstructured Sports Data -- An Example of Cricket Short Text Commentary [0.0]
本研究では,非構造化データ,すなわちビジュアライゼーションのためのクリケット短いテキストコメンタリーの利用を提案する。短いテキストコメンタリーデータは、個々のプレイヤーの強みルールと弱みルールを構築するために使用される。我々は,100万以上のテキストコメンタリーを用いてクリケット選手の長所と短所を解析し,ビジュアライゼーションにおける短いテキストコメンタリーの有用性を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:13:10 GMT)
Unfolding system-environment correlation in open quantum systems: Revisiting master equations and the Born approximation [0.0]
開系の力学に対するマスター方程式(ME)の導出は、相関に対する系の力学のマスク依存の近似を必要とする。ここでは、最も一般的なMEには、明示的なシステム環境相関に関する隠れ情報が含まれていることを実証する。我々はこれらの相関関係を、MEをシステムバス相関作用素が現れる普遍的な形式に再キャストすることによって展開する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:26:09 GMT)
Ultra-high quality factor of a levitated nanomechanical oscillator [0.0]
分離は機械的消散率を低下させます我々は,リニアポールトラップ内のシリカナノ粒子を室温で,7時間10～11ドルmbarの圧力で浮遊させる。粒子の減衰と加熱速度の圧力依存性の研究は、関連する散逸機構に関する洞察を与える。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:13:42 GMT)
Transition Graph Properties of Target Class Classification [0.0]
本研究では,現実的な遷移グラフの構造について検討し,不整合の発見を可能にする。本論文で考慮された動的治療体制の医学的解釈は,研究の枠組みをさらに明らかにしている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:37:14 GMT)
Towards gaze-independent c-VEP BCI: A pilot study [0.0]
このパイロットスタディは、コード変調された視覚誘発電位(c-VEP)に基づく、視線に依存しないスペルへの第一歩となる。両刺激を同時に発する際の隠れ空間的注意を用いた視線非依存型BCIに対するc-VEPプロトコルの利用の可能性を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:34:46 GMT)
Towards auditory attention decoding with noise-tagging: A pilot study [0.0]
AAD (Auditory attention decoding) は、参加話者の脳活動から候補話者を抽出することを目的としている。このパイロット研究は、ノイズタギング刺激プロトコルを用いて、AADへの第一歩を踏み出す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:35:34 GMT)
Thermodynamic formalism and anomalous transport in 1D semiclassical Bose-Hubbard chain [0.0]
半古典的な1次元Bose-Hubbard鎖の時間依存性自由エネルギー汎関数を解析した。まず,弱いカオス力学とそれに伴うシステム内の異常拡散について概説する。異常拡散は頑健で、厳密な量子化係数を持ち、非常に長い鎖でも持続する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:57:28 GMT)
Theory of quasiparticle-induced errors in driven-dissipative Schrödinger cat qubits [0.0]
そこで我々は,Schr"odinger cat qubitsにおけるボゴリボフ準粒子の残留効果について検討した。 Schr"odinger cat qubits は非平衡条件下で操作される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:59:39 GMT)
The role of thermal and squeezed photons in the entanglement dynamics of the double Jaynes-Cummings model [0.0]
原子, 原子場, 磁場サブシステムの絡み合いに及ぼす励起光子と熱光子の影響について検討した。この2つの原子間のイジング型相互作用を導入することにより、この原子場系に新たな絡み合いが生じることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:08:32 GMT)
The Ethics of AI in Education [0.0]
人工知能の研究室ベースの科学から生きた人間の文脈への移行は多くの歴史的、社会文化的偏見、不平等、道徳的ジレンマに焦点を合わせている。 AIの幅広い倫理に関する疑問は、教育におけるAI(AIED)にも関係している。 AIEDは、その技術がユーザに与える影響、そのような技術が私たちが学び、教える方法の強化や変更にどのように使われるか、そして私たちが社会や個人として、教育の成果として価値あるものについて、さらなる課題を提起します。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:41:37 GMT)
Text clustering with LLM embeddings [0.0]
テキストの埋め込みとクラスタリングアルゴリズムの違いが、テキストデータセットのクラスタリングに与える影響について検討する。その結果、LLM埋め込みは構造化言語のニュアンスを捉えるのに優れており、BERTは性能において軽量な選択肢を導いていることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:08:48 GMT)
Symmetries & Correlations in Continous Time Crystals [0.0]
連続時間結晶のダイナミクスを探求することで平均場理論の不適切性を実証する。 2階の累積理論の切り離しを選択し、平均場によって見下ろされる力学的特徴を正確に捉えるのに十分であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:31:08 GMT)
SymboSLAM: Semantic Map Generation in a Multi-Agent System [0.0]
サブシンボリックな人工知能手法は、環境タイプの分類と同時局所化とマッピングの分野を支配している。本稿では,共生的局所化とマッピングによる環境型分類への新たなアプローチ,SymboSLAMを提案し,その説明可能性のギャップを埋める。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:48:52 GMT)
Stronger Graph Transformer with Regularized Attention Scores [0.0]
最近、Graph Transformerと呼ばれるTransformerベースのGNNでは、長距離依存が存在する場合、優れたパフォーマンスが得られることが示されている。位置決めの必要性を緩和する「エッジ正規化技術」の新たなバージョンを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:18:44 GMT)
Statistical Agnostic Regression: a machine learning method to validate regression models [0.0]
本稿では,MLに基づく線形回帰の統計的意義を評価する手法として,統計的回帰(Agnostic Regression, SAR)を提案する。我々は、説明的(機能)変数と反応(ラベル)変数の間の集団に線形関係があることを結論付けるために、少なくとも1-etaの確率で十分な証拠が存在することを示すしきい値を定義する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:26:48 GMT)
SoK: Analysis techniques for WebAssembly [0.0]
WebAssemblyは低レベルのバイトコード言語で、C、C++、Rustといった言語をネイティブに近いパフォーマンスでブラウザで実行できる。 CやC++のようなメモリ不安全な言語の脆弱性は、WebAssemblyバイナリの脆弱性に変換できる。 WebAssemblyは暗号鍵のような悪意ある目的で使われてきた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:28:21 GMT)
SoK: Analysis techniques for WebAssembly [0.0]
WebAssemblyは低レベルのバイトコード言語で、C、C++、Rustといった言語をネイティブに近いパフォーマンスでブラウザで実行できる。 CやC++のようなメモリ不安全な言語の脆弱性は、WebAssemblyバイナリの脆弱性に変換できる。 WebAssemblyは暗号鍵のような悪意ある目的で使われてきた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:28:21 GMT)
Secure communication based on sensing of undetected photons [0.0]
我々は、絡み合った光子対内の量子相関を利用するセキュアな光通信プロトコルを導入する。いずれかの光子に作用して書かれたメッセージは、対の他の光子を排他的に測定することで読み取ることができる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:24:16 GMT)
Scattering matrix approach to dynamical Sauter-Schwinger process: Spin- and helicity-resolved momentum distributions [0.0]
時間依存型電気パルスによる電子-陽電子対生成の動的ソーター・シュウィンガー機構を考察する。それらの性質は、生成されたペアのスピン分解された確率振幅と結びついている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:48:57 GMT)
Scalar field with a time-independent classical source, not trivial after all: from vacuum decay to scattering [0.0]
散乱振幅を正確に解き、不安定真空からの粒子の生成が鍵となる。過去に見いだされた自明な散乱は、相互作用の断熱スイッチングの副産物であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:00:00 GMT)
Robustness of the Random Language Model [0.0]
このモデルは、潜在的言語の広大な空間におけるアニーリングの一種として、最初の言語学習の簡単な図を示唆している。これは、潜在的な単語とカテゴリ間の対称性が自発的に壊れる文法構文への単一の連続的な遷移を意味する。結果は、言語学における第一言語習得の理論と、機械学習における最近の成功を踏まえて議論される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:39:24 GMT)
Ricci flow-guided autoencoders in learning time-dependent dynamics [0.0]
時間的非線形力学、特に偏微分方程式(PDE)を学習するための多様体に基づくオートエンコーダ法を提案する。これは、物理学的インフォームドな設定でリッチフローをシミュレートすることで実現でき、また、リッチフローが経験的に達成されるように、多様体の量と一致させることができる。本稿では,周期性やランダム性などの望ましい特徴を包含するPDEを用いた数値実験について述べる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:51:51 GMT)
Realisation of versatile and effective quantum metrology using a single bosonic mode [0.0]
単一ボソニックモードにおける決定論的パラメータ推定のための多目的オンデマンドプロトコルを提案する。最大1.76までの低光子数では、ハイゼンベルクスケーリングに近づく量子強調精度を達成する。入力状態を調整することにより、ハエの利得や感度範囲をさらに高めることができることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:47:47 GMT)
Rate-fidelity trade-off in cavity-based remote entanglement generation [0.0]
量子コンピューティングモジュール間のフォトニック相互接続は、量子ビットスケーラビリティ問題に対する解決策を提供する。光子発生に使用するポンプパルスの波形と自然放出による絡み合いについて検討した。本稿では, 一般多部構造における絡み合い分布に解析を拡張し, 両部構造解析が直接適用可能であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:08:27 GMT)
Quantum entanglement transfer assisted via Duffing nonlinearity [0.0]
本稿では,いわゆるダッフィング非線形性を利用して,光学系の量子絡み合いを高める手法を提案する。この研究は、ロバストな量子エンタングルメントを生成するために非線形資源を利用する新しい道を開く。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:36:47 GMT)
Quantum Strategies for Rendezvous and Domination Tasks on Graphs with Mobile Agents [0.0]
我々は,コミュニケーションなしで特定の分散タスクに従事しているモバイルエージェントに対して,量子的優位性を示す。本研究は、グラフ上のランデブーの重大な課題に対処し、グラフ支配問題に根ざしたモバイルエージェントのための新しい分散タスクを導入する。本稿は数値的な分析で締めくくり、我々の研究結果についてさらなる知見を提供する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 11:46:31 GMT)
Quantum Fluctuations Suppress the Critical Fields in BaCo$_2$(AsO$_4$)$_2$ [0.0]
BaCo$$(AsO$_4$)$$は、最近、結合依存(例えば、キタエフ)および第3隣人(J_3$)相互作用の候補ホストとして登場した。平面外磁場方向の関数としてBaCo$(AsO$_4$)$の中間および高磁場位相図をマップする。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:08:39 GMT)
Programmers Prefer Individually Assigned Tasks vs. Shared Responsibility [0.0]
現代のアジャイル、リーン、eXtremeプログラミングのプラクティスは共通の責任を主張する。その結果,プログラマは個別にタスクを割り当てることが望ましいことがわかった。これらの好みを理解することは、チームのダイナミクスを最適化することを目的としたプロジェクトマネージャにとって非常に重要です。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:10:15 GMT)
Photon condensation, Van Vleck paramagnetism, and chiral cavities [0.0]
量子化された空間変化空洞電磁ベクトルポテンシャルA(r)に結合した平面二乗分子のゲージ不変モデルを導入する。分子がVan Vleck常磁性状態にある場合、光子凝縮状態への平衡量子相転移が起こる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:29:18 GMT)
Parametric Encoding with Attention and Convolution Mitigate Spectral Bias of Neural Partial Differential Equation Solvers [0.0]
PGCAN(Parametric Grid Convolutional Attention Networks)は偏微分方程式(PDE)の解法である。 PGCANは、DNNデコーダを介して出力に接続されたグリッドベースのエンコーダで入力空間をパラメータ化する。我々のエンコーダは、局所的な学習能力を提供し、畳み込みレイヤを使用して、境界からドメインの内部への情報の伝播速度を過度に調整し改善する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 23:56:40 GMT)
Optimisation of photodetectors design: comparison between Montecarlo and Genetic Algorithms [0.0]
本稿では,モンテカルロと遺伝的アルゴリズムを光検出器の設計に適用する。回路性能はメリット関数で評価され、系統探索法が参照として使用される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:22:03 GMT)
On the choice of non-linear terms in blocking cat states by energy conservation [0.0]
エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。 W.D. Wick, arXiv:1710.03278]で導入された種類の非線形項は、測定問題の解法としてエネルギー保存によって空間猫をブロックすることであった。最後に [W.D. Wick, arXiv:1710.03278] の提案を検証するための実験的見積もりを述べる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 07:49:39 GMT)
On Image Search in Histopathology [0.0]
病理組織学における画像検索技術の最近の展開について概説する。本研究は, 画像検索の効率, 高速, 効率的な手法を求める計算病理研究者向けに, 簡潔な概要を提示する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 03:31:22 GMT)
NaturalTurn: A Method to Segment Transcripts into Naturalistic Conversational Turns [0.0]
ナチュラルトゥール(NaturalTurn)は、自然主義交換の力学を正確に捉えるために設計されたターンセグメンテーションアルゴリズムである。本研究では,NaturalTurnから派生した転写産物が,既存の方法から派生した転写産物と比較して,統計的および推論的特性が良好であることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 21:05:54 GMT)
Multivariate Scenario Generation of Day-Ahead Electricity Prices using Normalizing Flows [0.0]
本研究では, 正規化フローと呼ばれる完全データ駆動型深部発電モデルを用いて, 日頭電力価格の確率的予測手法を提案する。その結果,正規化フローは真の価格分布を再現し,正確な予測を行う高品質なシナリオを生成することがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:35:13 GMT)
Multipartite entanglement distribution in a topological photonic network [0.0]
本稿では, フォトニックキャビティの格子を交互にホッピングすることで, 改良されたマルチドメインSSHチェーンを創出する。このシステムは、この1次元格子による光子のトポロジカル転送が、要求に応じて任意の量子ビットを絡み合わせることができるため、量子情報処理に適していることを示す。この主張を検証し, 障害のある場合においても, 両部交絡と多部交絡が生じることを証明した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 19:14:37 GMT)
MasonTigers at SemEval-2024 Task 8: Performance Analysis of Transformer-based Models on Machine-Generated Text Detection [0.0]
タスクは、バイナリ人文対マシン生成テキスト分類(トラックA)、マルチウェイマシン生成テキスト分類(トラックB)、ヒューマン・マシン混合テキスト検出(トラックC)を含む。本稿では,主に識別器変換器モデルのアンサンブルと,特定の事例における文変換器と統計的機械学習のアプローチを利用する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 06:47:28 GMT)
Local fraction in Static Causal Orders [0.0]
任意の静的因果背景に対して行われる実験に対して局所分数の概念を導入する。具体的な計算を行うのに必要な行列を効率的に構築できる因果関数のフリーな特徴付けを導出する。我々は,2つのベル試験を含む新たな事例の局所的な分画を分析して,本手法を実証する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:36:37 GMT)
Linear cross-entropy certification of quantum computational advantage in Gaussian Boson Sampling [0.0]
我々は,対応する理想分布を用いてGBS実装を直接検証することで,この問題を回避することができると論じる。我々は、LXEスコアと呼ばれる線形クロスエントロピーの修正版を用いて、与えられたGBS実装が対応する理想モデルにどの程度近いかを評価するのに役立つ基準値を求める。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:49:17 GMT)
Learning to walk on new ground: Calibration-free decoding for c-VEP BCI [0.0]
本研究では,脳-コンピュータインタフェース(BCI)のユーザビリティ向上を目的とした2つのゼロトレーニング手法について検討する。事象関連電位(ERP)領域に根ざした新しい手法,unsupervised mean(UMM)を導入する。正準相関解析(CCA)を用いた最先端のC-VEPゼロトレーニング法と比較する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:20:33 GMT)
KTbench: A Novel Data Leakage-Free Framework for Knowledge Tracing [0.0]
KT(Knowledge Tracing)は、知的学習システムにおける学習項目の将来のパフォーマンスを予測することを目的としている。多くのKTモデルは、学習項目をその構成するKCに置き換えることで、アイテムと学生の相互作用のシーケンスをKC-学生の相互作用へと拡張する。提案手法は,スパースアイテム-学生間相互作用とモデルパラメータの最小化の問題に対処する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:54:30 GMT)
InstaSynth: Opportunities and Challenges in Generating Synthetic Instagram Data with ChatGPT for Sponsored Content Detection [0.0]
大規模言語モデル(LLM)は、非倫理的または違法な目的に使用できるテキストの生成コストを下げるという懸念を提起する。本稿では,オンライン上でのスポンサードコンテンツの開示に関する法的要件の実施を支援するため,そのようなモデルが約束されているかを検討する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:58:42 GMT)
Improved Long Short-Term Memory-based Wastewater Treatment Simulators for Deep Reinforcement Learning [0.0]
排水処理データのトレーニングモデルを改善するための2つの手法を実装した。実験結果から, これらの手法を用いることで, シミュレーションの動作を1年を通して動的時間ワープで改善できることがわかった。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:20:09 GMT)
Image Classification with Rotation-Invariant Variational Quantum Circuits [0.0]
変分量子アルゴリズムは、ノイズ中間スケール量子(NISQ)デバイスの初期応用として注目されている。変分法の主な問題の1つは、変分パラメータの最適化に現れるバレンプラトー現象にある。量子モデルに帰納バイアスを加えることは、この問題を緩和する潜在的な解決策として提案され、Geometric Quantum Machine Learningと呼ばれる新しい分野が生まれた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 08:26:31 GMT)
Human behaviour through a LENS: How Linguistic content triggers Emotions and Norms and determines Strategy choices [0.0]
本稿では、結果に基づく嗜好モデルの伝統的な制限を超越する、新しいフレームワークを提案する。 LENSモデルによると、決定問題の言語学的記述は感情的な反応を誘発し、潜在的な行動ノルムを示唆する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:40:11 GMT)
High Harmonic Generation by Bright Squeezed Vacuum [0.0]
非摂動性高調波発生固体は、光励起真空(BSV)のマクロ量子状態によって励起される BSVは、コヒーレント光で観測するよりもはるかに広い範囲のピーク強度で自由キャリアダイナミクスへのアクセスを提供する。同じ平均強度のコヒーレント光よりも、高調波発生においてかなり効率的である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:46:23 GMT)
Hidden Variables: Rehabilitation of von Neumann's Analysis, and Pauli's Uncashable Check [0.0]
J・フォン・ノイマン(J. von Neumann)は、量子力学に隠れパラメータ(隠れ変数)を導入する結果の分析を行った。彼は、隠れた変数は、大きな修正なしに既存の量子力学の理論に組み込むことはできないことを示した。彼はその理論が完成していない可能性を明かした。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:35:26 GMT)
Ground state energy of dilute Bose gases in 1D [0.0]
密度$rho$の1Dボソンの気体の基底状態エネルギーを、散乱長$a$の一般の2体ポテンシャルを介して相互作用し、希薄な極限$rho |a|ll1$で研究する。スピンレスフェルミオンと1D異方性対称性の拡張を含み、閉じ込められた3次元気体への応用について議論する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:54:27 GMT)
Galilean relativity and wave-particle duality imply the Schrödinger equation [0.0]
複素波動関数は物理系の一貫した記述には避けられないことを示す。これは2つの異なる波動方程式、すなわちクライン=ゴルドン方程式とローレンツ共変シュル「オーディンガー方程式につながる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:10:17 GMT)
Fully automated workflow for the design of patient-specific orthopaedic implants: application to total knee arthroplasty [0.0]
提案したワークフローは、患者のCT画像から直接、高速で信頼性の高い膝インプラントのパーソナライズを可能にする。 TKAの患者固有の事前手術計画を極めて短期間で確立し、すべての患者に容易に利用できるようにする。このソリューションは、合併症を減らし、患者の満足度を高めながら、関節形成の増大に答えるのに役立つ。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:08:03 GMT)
First path component power based NLOS mitigation in UWB positioning system [0.0]
本稿では,UWB位置決めシステムにおけるNLOS(Non-Line-of-Sight)緩和法について述べる。提案手法は,NLOS条件下で得られた測定結果を補正し,タグ位置推定プロセスにおいてその意義を低下させる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 22:19:08 GMT)
Evaluating the Influence of Multi-Factor Authentication and Recovery Settings on the Security and Accessibility of User Accounts [0.0]
本稿では,Google および Apple ユーザのアカウント設定について検討する。多要素認証設定とリカバリオプションを考慮して,アカウントのセキュリティとロックアウトリスクを分析した。以上の結果から,Google と Apple のアカウント間のセキュリティ上の大きな違いを示すとともに,認証デバイスを1つ失うと,多くのユーザがアカウントへのアクセスを逃してしまうことが判明した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:05:37 GMT)
Entanglement signatures of a percolating quantum system [0.0]
エンタングルメント対策は、量子相とその遷移を診断するための多用途プローブの1つとして登場した。基礎となる格子がパーコレーション障害を持つとき、有限密度における自由フェルミオンは興味深い絡み合い特性を示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:00:07 GMT)
Enhanced Imaging of Electronic Hot Spots Using Quantum Squeezed Light [0.0]
熱反射イメージングは、ワイヤや半導体材料の熱の正確な時間的および空間的イメージングを行うために使用されている。我々は、古典的アプローチのショットノイズ限界を超越して、マイクロワイヤ上で熱反射イメージングを行うために量子圧縮光を適用した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:55:46 GMT)
End-to-End Mineral Exploration with Artificial Intelligence and Ambient Noise Tomography [0.0]
我々は, 再生可能エネルギーソリューションにおいて, かなりの量の銅を必須元素として重視する。速度,スケーラビリティ,深度浸透,分解能,環境影響の低さを特徴とするANTの利用のメリットを示す。我々は、AIが地球物理データ解釈をどのように拡張し、鉱物探査の新しいアプローチを提供するかを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:23:48 GMT)
Eigenvector Continuation and Projection-Based Emulators [0.0]
固有ベクトル継続はパラメトリック固有値問題の計算方法である。還元基底法(reduce-basis method)と呼ばれる、より広範な部分空間射影技法のクラスの一部である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 04:21:41 GMT)
Effective light cone and digital quantum simulation of interacting bosons [0.0]
本研究は、相互作用するボソンにおける情報伝達を制限するために、強い有効光円錐を明らかにする。ボソンの連立速度が有限であることが証明され,各部位におけるボソン数切り離しの誤差が保証される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:57:33 GMT)
Dual Accuracy-Quality-Driven Neural Network for Prediction Interval Generation [0.0]
本稿では,回帰に基づくニューラルネットワークの予測間隔を自動的に学習する手法を提案する。我々の主な貢献は、PI世代ネットワークのための新しい損失関数の設計である。合成データセット,8つのベンチマークデータセット,および実世界の収量予測データセットを用いて実験したところ,本手法は有意な確率カバレッジを維持することができた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:30:02 GMT)
Driven-dissipative phase separation in free-space atomic ensembles [0.0]
光深度が低い自由空間アンサンブルは空洞系と同様の挙動を示す。自由空間系は相転移ではなく、概して飽和領域と不飽和領域の間の相分離である」と主張する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 14:31:45 GMT)
Doped stabilizer states in many-body physics and where to find them [0.0]
この研究は、ドープ安定化状態と多体量子系における固有状態の構造の基本的な関係を明らかにする。我々は,低エネルギー固有状態の探索,クエンチダイナミクスのシミュレーション,およびこれらのシステムにおけるエンタングルメントエントロピーの計算といったタスクに対して,効率的な古典的アルゴリズムを開発する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:21:48 GMT)
Directional superradiance in a driven ultracold atomic gas in free-space [0.0]
我々は,双極子-双極子相互作用を介して相互作用しながら,強コヒーレント駆動によって照らされた密接なアンサンブルを研究する。定常状態は、報告された超放射能と通常の非誘起遷移にいくつかの類似性があるが、有意な質的および定量的な差異を観察する。相互作用平衡不均一効果と自然放出を考慮した簡単な理論モデルを構築した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:14:44 GMT)
Dipole-dipole interacting two-level emitters in a moderately intense laser field [0.0]
共振器の共振特性について検討し, 共振器内での2レベルエミッタの共振特性について検討した。世俗近似の下では、集団共鳴蛍光スペクトルは2N+1スペクトル線で構成されており、Nはサンプルから放出されるエミッタの数である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:26:55 GMT)
Detection Is Tracking: Point Cloud Multi-Sweep Deep Learning Models Revisited [0.0]
自律運転では、ライダー測定は通常、ディープラーニングモデルによって実現された「仮想センサー」を介して行われる。本稿では,このような入力には時間的情報が含まれており,仮想センサの出力には時間的情報も含むべきであると論じる。本稿では,MULti-Sweep PAired Detector (MULSPAD)と呼ばれる深層学習モデルを提案する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:19:06 GMT)
Depth scaling of unstructured search via quantum approximate optimization [0.0]
変分量子アルゴリズムは、現在の量子計算のデファクトモデルとなっている。そのような問題の1つは、ある文字列の特定のビットを見つけることで構成される非構造化探索である。我々は、CTQWを用いてQAOA配列を復元し、最近のトロッター公式の理論の進歩を利用して、クエリの複雑さを束縛する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 18:00:03 GMT)
Deep learning-based method for weather forecasting: A case study in Itoshima [0.0]
本研究では,九州,糸島における気象予報に適した多層パーセプトロンモデルを提案する。我々の細心の注意を払って設計したアーキテクチャは、Long Short-Term MemoryやRecurrent Neural Networksといったベンチマークを上回り、既存のモデルよりも優れた性能を示している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:42:38 GMT)
Cryptic Bytes: WebAssembly Obfuscation for Evading Cryptojacking Detection [0.0]
WebAssemblyのコードの難読化テクニックについて、これまでで最も包括的な評価を行った。 Tigressやwasm-mutateといった最先端の難読化ツールを使って、ユーティリティやゲーム、暗号マイニングなど、さまざまなアプリケーションを難読化しています。 2万以上の難読化されたWebAssemblyバイナリと、さらなる研究を促進するために公開されたEcc-obfツールのデータセットです。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:32:08 GMT)
Contact interactions, self-adjoint extensions, and low-energy scattering [0.0]
一次元散乱問題は驚くほど複雑であることを示す。自己随伴拡大の族は対称波と反対称波の結合系に対応することを示す。応用として、調和トラップとの一般点相互作用のスペクトルを1次元で解く。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:39:56 GMT)
Comprehensive Evaluation and Insights into the Use of Large Language Models in the Automation of Behavior-Driven Development Acceptance Test Formulation [0.0]
受け入れテスト生成を自動化するために,大規模言語モデル(LLM)を用いてBDDの実践を強化する新しい手法を提案する。本研究は, GPT-3.5, GPT-4, Llama-2-13B, PaLM-2 などの LLM の評価に 0 および few-shot プロンプトを用いた。その結果, GPT-3.5 と GPT-4 は誤りのないBDD 受け入れテストを生成し,性能が向上した。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:37:52 GMT)
Coherent Equalization of Linear Quantum Systems [0.0]
受動的量子系である近似最適等化フィルタを求める。ネバンリンナ・ピック(Nevanlinna-Pick)と組み合わされた半有限緩和は、ほぼ最適コヒーレント等化器の設計のためのトラクタブルアルゴリズムへと導かれる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:08:32 GMT)
Closed-channel parameters of Feshbach resonances [0.0]
二次元フェシュバッハ共鳴の一般的な説明は、共鳴を引き起こす素境界状態に関連する「閉チャネルパラメータ」を必要とすると論じられた。本研究は, 共振理論が再正規化されると, 2体オブザーバブルの依存が消えることを示す。結果として生じる量子欠陥理論は、素境界状態エネルギーとは驚くほど独立である。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 05:31:15 GMT)
Classification of colorectal primer carcinoma from normal colon with mid-infrared spectra [0.0]
組織コアあたり数千のスペクトルを測定するために,ホルマリン固定パラフィン埋め込み(FFPE)組織サンプルを用いた。分類にはランダムフォレスト,サポートベクターマシン,XGBoost,線形判別分析法を用いた。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:16:03 GMT)
Chiral symmetry breaking and topological charge of graphene nanoribbons [0.0]
長方形グラフェンナノリボンのエッジジグザグ特性について検討した。自己整合Hartree-Fock場はキラル対称性を破るが、グラフェンナノリボンは短距離交絡対称性保護型トポロジカル絶縁体としての地位を維持していることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:54:23 GMT)
Can a GPT4-Powered AI Agent Be a Good Enough Performance Attribution Analyst? [0.0]
本研究では,AIエージェントの様々なパフォーマンス属性タスクへの適用について紹介する。パフォーマンスドライバの分析では93%を超え、マルチレベルの属性計算では100%を達成し、公式な試験基準をシミュレートするQA演習では84%を超える精度を達成している。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:59:34 GMT)
Calculations of magnetic field produced by spin-vortex-induced loop currents in Bi$_2$Sr$_2$CaCu$_2$O$_{8+δ}$ thin films using the particle-number conserving Bogoliubov-de Gennes formalism [0.0]
銅酸化物超伝導の理論はスピン渦誘起ループ電流(SVILCs)」と呼ばれるナノサイズのループ電流の存在を予測している。本研究では,Bi$Sr$$Caapprox SVILCのモデルを用いて,それらの磁場を計算する。磁場測定によるSVILCの検出は、銅酸化物超伝導の解明につながる可能性があり、またそれらの量子デバイス応用にも繋がる可能性がある。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 13:03:54 GMT)
Building Efficient Universal Classifiers with Natural Language Inference [0.0]
本稿では,自然言語推論(NLI)を普遍的な分類タスクとして用いる方法について述べる。ユニバーサル分類器を構築するために、再利用可能なJupyterノートブックを備えたステップバイステップガイドを提供する。我々の新しい分類器はゼロショット性能を9.4%向上させる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:12:49 GMT)
Broad Instantaneous Bandwidth Microwave Spectrum Analyzer with a Microfabricated Atomic Vapor Cell [0.0]
87mathrmRb$原子のマイクロ波スペクトル解析センサー(Sensor)はMEMSの原子蒸気電池で、等方的に純粋な8,7mathrmRb$と$mathrmN$バッファーガスで満たされている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 12:10:23 GMT)
Blended RAG: Improving RAG (Retriever-Augmented Generation) Accuracy with Semantic Search and Hybrid Query-Based Retrievers [0.0]
Retrieval-Augmented Generation (RAG) は、大規模言語モデル (LLM) で文書のプライベートな知識基盤を注入し、生成的Q&A (Question-Answering) システムを構築するための一般的なアプローチである。本稿では,Vector インデックスや Sparse インデックスなどのセマンティック検索手法をハイブリッドクエリ手法と組み合わせた 'Blended RAG' 手法を提案する。本研究は,NQ や TREC-COVID などの IR (Information Retrieval) データセットの検索結果の改善と,新たなベンチマーク設定を行う。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 17:13:46 GMT)
Bell-CHSH inequality and unitary operators [0.0]
単位演算子はベル-CHSH不平等の違反を調べるために使用される。期待値が実数である特定の種類のユニタリ作用素の関連性が指摘される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 15:17:31 GMT)
Autoparametric resonance extending the bit-flip time of a cat qubit up to 0.3 s [0.0]
キャットキュービットは量子誤り訂正への有望な経路を提供する。我々は、高調波モードの光子対を環境の単一光子と交換するために、消散を利用する。オートキャットキュービットのビットフリップ誤差は、位相フリップ誤差にわずかに影響を及ぼすことなく、0.3秒までの特性時間で防止されることを示す。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:46:43 GMT)
Attractor reconstruction with reservoir computers: The effect of the reservoir's conditional Lyapunov exponents on faithful attractor reconstruction [0.0]
貯留層コンピューティング(Reservoir computing)は、動的システムのカオス的な魅力を再現できる機械学習フレームワークである。その結果, 誘導型貯水池のリアプノフ指数は, ターゲット系の最も負のリャプノフ指数よりも有意に負であることが示唆された。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:57:37 GMT)
Analyzing Potential Solutions Involving Regulation to Escape Some of AI's Ethical Concerns [0.0]
この記事では、人工知能の倫理的危機における現在の問題について触れる。これには、AI内での差別と、AIですぐに利用できるようになる偽情報に関する懸念が含まれている。規制に関するもっともらしい解決策が議論され倫理的懸念を和らげる方法が議論されています
論文参考訳（メタデータ） (Fri, 22 Mar 2024 01:35:51 GMT)
An algorithm for exact analytical solutions for tilted anisotropic Dirac materials [0.0]
傾斜異方性ディラック材料の束縛状態に対する正確な解は、翻訳対称性を持つ外部電場と磁場の作用の下で得られる。これらの材料の有効ハミルトニアンから生じる固有値方程式を解くために、スピノル成分に対して得られる微分方程式を分離するアルゴリズムを記述する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:33:12 GMT)
Advancing Frontiers in SLAM: A Survey of Symbolic Representation and Human-Machine Teaming in Environmental Mapping [0.0]
本稿では,マルチエージェントシステム(MAS)とヒューマンマシンチームにおける研究動向を総合的に分析し,シンボリックおよびサブシンボリックSLAMタスクにおけるそれらの応用を強調した。この研究は、マッピングタスクにおける人間と機械のコラボレーションの強化に対する需要の増加を認めている。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 00:48:48 GMT)
Active Learning for Regression based on Wasserstein distance and GroupSort Neural Networks [0.0]
Wassersteinのアクティブ回帰モデルは、ラベル付きデータセットの代表性を測定するための分散マッチングの原理に基づいている。 Wasserstein距離はGroupSort Neural Networksを用いて計算される。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:51:55 GMT)
AI-Dentify: Deep learning for proximal caries detection on bitewing x-ray -- HUNT4 Oral Health Study [0.0]
人工知能の使用は、噛まれた画像の迅速かつ情報的な分析を提供することで、診断を支援する可能性がある。 HUNT4口腔健康研究から得られた13,887個の噛み付きデータセットは、6人の異なる専門家によって個別に注釈付けされた。同じ6人の歯科医が共同で注釈を付けた197枚の画像のコンセンサスデータセットを用いて評価を行った。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 10:36:47 GMT)
A Wasserstein perspective of Vanilla GANs [0.0]
バニラ GAN はワッサーシュタイン GAN の一般化である。特に、ワッサーシュタイン距離におけるバニラ GAN のオラクル不等式を得る。バニラ GAN とワッサーシュタイン GAN の収束率を未知の確率分布の推定子として結論付ける。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 16:04:26 GMT)
A Taxmans guide to taxation of crypto assets [0.0]
Bitcoinやその他の暗号通貨資産の台頭は、人々が分散化されたネットワーク上で価値を交換し、伝達する方法の根本的な変化を示している。このことは、政府や税務当局が、この革新的で革新的で、急進的な技術に対する政策対応を理解し、提供するために、規制と税政策の盲点を生み出している。本稿では、暗号資産が機能する原理と、その基盤技術と、このエコシステム内で生じる税問題や課税可能な事象との関連について説明する。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 09:54:18 GMT)
A Noisy Approach to Intrinsically Mixed-State Topological Order [0.0]
得られた混合状態は内在的に混合状態位相秩序(imTO)を示すことができることを示す。我々は、デコヒーレント状態は物質の真の混合状態量子相を表すと論じる。
論文参考訳（メタデータ） (Fri, 22 Mar 2024 02:16:28 GMT)