CoIN: A Benchmark of Continual Instruction tuNing for Multimodel Large
Language Model [128.5] 逐次的命令チューニングパラダイムにおける既存のMLLMを評価するためのベンチマークであるContinuous Instruction tuNing(CoIN)を提案する。
CoINの実験では、現在の強力なMLLMが依然として破滅的な忘れを被っていることが示されている。
従来の命令アライメントを維持するのに有効なMLLMにMoELoRAを導入する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:54:31 GMT)
Gemma: Open Models Based on Gemini Research and Technology [126.0] Gemmaは、Geminiモデルを作成するために使用される研究と技術から構築された、軽量で最先端のオープンモデルのファミリーである。
Gemmaモデルは、言語理解、推論、安全性のための学術ベンチマークで強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:59:16 GMT)
Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation [124.1] 大規模言語モデル(LLM)は、言語における生成タスクの主要なモデルである。
本稿では,ビデオと画像の両方に対して簡潔かつ表現力のあるトークンを生成するために設計されたビデオトークンライザMAGVIT-v2を紹介する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:34:20 GMT)
Language models scale reliably with over-training and on downstream
tasks [116.4] スケーリング法則は言語モデルを開発する上で有用なガイドである。
現在のスケーリング研究と、言語モデルが最終的にトレーニングされ、評価される方法には、まだギャップがあります。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:54:00 GMT)
Language-Driven Visual Consensus for Zero-Shot Semantic Segmentation [114.7] 本稿では,言語駆動型ビジュアルコンセンサス(LDVC)アプローチを提案する。
クラス埋め込みを、その離散的で抽象的な性質からアンカーとして活用し、クラス埋め込みに向けて視覚的特徴を操る。
我々の手法は、目に見えないクラスに対するセグメンテーションモデルの能力を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:23:55 GMT)
MixReorg: Cross-Modal Mixed Patch Reorganization is a Good Mask Learner
for Open-World Semantic Segmentation [110.1] セマンティックセグメンテーションのための新鮮で簡単な事前学習パラダイムであるMixReorgを提案する。
我々のアプローチは、パッチとテキストの対応を保ちながら、画像パッチを混合することで、きめ細かいパッチテキストペアデータを生成することである。
マスク学習者としてMixReorgを使用することで、従来のテキスト教師付きセマンティックセマンティックセマンティックモデルは、非常に一般化可能なピクセル・セマンティックアライメントを実現することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:25:32 GMT)
Scaling Laws of RoPE-based Extrapolation [103.3] 基本値と外挿性能の関係を記述するために,RoPEに基づく外挿法におけるtextbftextitScaling法則を提案する。
LLaMA2 7Bと13Bで最大100万の文脈長を16Kのトレーニング長で達成した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:14:47 GMT)
Classes Are Not Equal: An Empirical Study on Image Recognition Fairness [100.4] 我々は,クラスが等しくないことを実験的に証明し,様々なデータセットにまたがる画像分類モデルにおいて,公平性の問題が顕著であることを示した。
以上の結果から,モデルでは認識が困難であるクラスに対して,予測バイアスが大きくなる傾向が示唆された。
データ拡張および表現学習アルゴリズムは、画像分類のある程度の公平性を促進することにより、全体的なパフォーマンスを向上させる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:07:08 GMT)
Mastering Text, Code and Math Simultaneously via Fusing Highly
Specialized Language Models [96.9] 大規模言語モデル(LLM)は、3つのドメインすべてにまたがって高いパフォーマンスを同時に達成しようと試みている。
本稿では,すでに高度に特殊化されているモデルを融合する手法を提案する。
提案されているハウジングフレームワークであるUltraFuserは、すでに言語、コーディング、数学について十分に訓練されている3つの異なるスペシャリストで構成されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:18:48 GMT)
Agent Lumos: Unified and Modular Training for Open-Source Language
Agents [93.2] LUMOSは、オープンソースのLLMベースのエージェントをトレーニングするための最初のフレームワークの1つです。
LUMOSは、高レベルなサブゴール生成を学習する計画モジュールを備えた、学習可能で統一されたモジュラーアーキテクチャを備えている。
我々は、多様な地道理理性から導かれた大規模で統一的で高品質なトレーニングアノテーションを収集する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:54:21 GMT)
Alice Benchmarks: Connecting Real World Re-Identification with the
Synthetic [92.0] 我々は、Aliceベンチマーク、大規模データセット、ベンチマークおよび評価プロトコルを研究コミュニティに導入する。
Aliceベンチマークでは、人と車の2つのre-IDタスクが提供されている。
実際のターゲットの重要な特徴として、トレーニングセットのクラスタビリティは、実際のドメイン適応テストシナリオに近づくように手動で保証されない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:53:24 GMT)
A Hitchhiker's Guide to Geometric GNNs for 3D Atomic Systems [87.3] 原子系の計算モデリングの最近の進歩は、これらを3次元ユークリッド空間のノードとして埋め込まれた原子を含む幾何学的グラフとして表現している。
Geometric Graph Neural Networksは、タンパク質構造予測から分子シミュレーション、物質生成まで、幅広い応用を駆動する機械学習アーキテクチャとして好まれている。
本稿では,3次元原子システムのための幾何学的GNNの分野について,包括的で自己完結した概要を述べる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:38:27 GMT)
NoiseDiffusion: Correcting Noise for Image Interpolation with Diffusion Models beyond Spherical Linear Interpolation [86.7] 画像の妥当性を補正する新しい手法としてノイズ拡散法を提案する。
NoiseDiffusionはノイズの多い画像空間内で動作し、これらのノイズの多い画像に生画像を注入することで、情報損失の課題に対処する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:32:25 GMT)
Octavius: Mitigating Task Interference in MLLMs via LoRA-MoE [85.8] LLM(Large Language Models)は、命令チューニングを通じて、ゼロショット能力をマルチモーダル学習に拡張することができる。
ネガティブな対立や干渉は パフォーマンスに悪影響を及ぼすかもしれない
我々は,MLLMを用いたマルチモーダル学習に関する総合的な研究と実験を行うための,Octaviusと呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:24:06 GMT)
SkillDiffuser: Interpretable Hierarchical Planning via Skill
Abstractions in Diffusion-Based Task Execution [79.7] 拡散モデルは、ロボット軌道計画の強力な可能性を示している。
高レベルの命令からコヒーレントな軌道を生成することは依然として困難である。
エンド・ツー・エンドの階層的計画フレームワークであるSkillDiffuserを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:29:50 GMT)
TCP:Textual-based Class-aware Prompt tuning for Visual-Language Model [78.8] 本稿では,テキストベースのクラス認識型Promptチューニング(TCP)を提案する。
TCPは、トレーニング時間の短縮を要求しながら、常に優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:42:51 GMT)
Deceptive Semantic Shortcuts on Reasoning Chains: How Far Can Models Go
without Hallucination? [77.8] 本研究はセマンティックアソシエーションによって誘発される特定の種類の幻覚の研究である。
この現象を定量化するために,EureQAと呼ばれる新しい探索手法とベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:11:15 GMT)
StableToolBench: Towards Stable Large-Scale Benchmarking on Tool
Learning of Large Language Models [77.7] ToolBenchから進化したベンチマークであるStableToolBenchを紹介します。
仮想APIサーバには、キャッシングシステムとAPIシミュレータが含まれており、APIステータスの変更を緩和するための補完となる。
安定評価システムは、GPT-4を自動評価器として使用し、評価中のランダム性を排除し、解決可能なパスと勝利率を設計する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:08:19 GMT)
Usable XAI: 10 Strategies Towards Exploiting Explainability in the LLM Era [77.2] XAIはLarge Language Models (LLM)に拡張されている
本稿では,XAIがLLMやAIシステムにどのようなメリットをもたらすかを分析する。
10の戦略を導入し、それぞれに重要なテクニックを導入し、関連する課題について議論します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:25:27 GMT)
SOTOPIA-$\pi$: Interactive Learning of Socially Intelligent Language
Agents [76.5] 本稿では,対話型学習手法であるSOTOPIA-$pi$を提案する。
この手法は,大規模言語モデル(LLM)の評価に基づいて,フィルタリングされた社会的相互作用データに対する行動クローニングと自己強化トレーニングを活用する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:17:48 GMT)
FSViewFusion: Few-Shots View Generation of Novel Objects [75.8] 本研究では,3次元前処理を伴わないビュー合成のための事前訓練された安定拡散モデルを提案する。
具体的には,Dreamboothという画像モデルを用いたパーソナライズされたテキストに基づく手法を提案する。
ビューの概念は、ビューが学習された元のオブジェクトの識別に関係なく、アンタングル化され、新しいオブジェクトに転送可能であることを確認します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:41:34 GMT)
CRAFT: Customizing LLMs by Creating and Retrieving from Specialized
Toolsets [75.6] 大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。
タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。
本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:39:25 GMT)
MOHO: Learning Single-view Hand-held Object Reconstruction with
Multi-view Occlusion-Aware Supervision [75.4] ハンドヘルドオブジェクト再構成のためのハンドオブジェクトビデオから,多視点オクルージョン対応監視を利用する新しいフレームワークを提案する。
このような設定において、手による排他と対象の自己排他という2つの主要な課題に対処する。
HO3D と DexYCB のデータセットを用いた実験では、2D のMOHO が 3D の教師付き手法に対して大きなマージンで優れた結果を得ることが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:39:10 GMT)
Can Direct Latent Model Learning Solve Linear Quadratic Gaussian
Control? [75.1] 本研究では,高次元観測から状態表現を学習する課題について検討する。
我々は,ある潜在状態空間における動的モデルを,計画に直接関連する量を予測することによって学習する,直接潜在モデル学習手法を追求する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:44:52 GMT)
AutoGuide: Automated Generation and Selection of State-Aware Guidelines for Large Language Model Agents [74.2] AutoGuideは、オフライン体験における暗黙の知識を活用することで、事前訓練されたLLMの知識ギャップを埋める。
提案手法は, 逐次意思決定ベンチマークにおいて, 競争力のあるLCMベースラインよりも高い性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:06:03 GMT)
DevBench: A Comprehensive Benchmark for Software Development [73.6] DevBenchは、ソフトウェア開発ライフサイクルのさまざまな段階にわたる大規模言語モデル(LLM)を評価するベンチマークである。
GPT-4-Turboを含む現在のLLMは、DevBench内での課題の解決に失敗している。
本研究は,LLMを現実のプログラミングアプリケーションに展開する上で,現実的な知見を提供するものである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:13:44 GMT)
Think before you speak: Training Language Models With Pause Tokens [73.6] 言語モデルは、即座に連続して一連のトークンを生成して応答を生成する。
代わりに、$(K+1)th$トークンを出力する前に、モデルに$K+10$隠れベクターを操作させるとしたらどうでしょう?
私たちは、(学習可能な)$textitpause$トークンを使って、言語モデルでトレーニングと推論を行うことで、このアイデアを運用します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:33:41 GMT)
StreamingDialogue: Prolonged Dialogue Learning via Long Context
Compression with Minimal Losses [72.0] StreamingDialogueは長い対話履歴を最小限の損失でconv-attnシンクに圧縮する。
本手法は,高密度注意再計算と比較してメモリ使用率を18ドル削減しつつ,4$times$の高速化を実現している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:44:14 GMT)
MLLMs-Augmented Visual-Language Representation Learning [70.5] MLLM(Multi-modal Large Language Models)が視覚言語表現学習を向上させることを実証した。
本手法は単純で,MLLMを用いて画像毎に複数のキャプションを拡張できる。
拡張キャプションの品質と可用性を維持するために,テキストシーリングを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:47:32 GMT)
DAM: Dynamic Adapter Merging for Continual Video QA Learning [70.4] 連続的なビデオ質問応答(VidQA)学習のためのパラメータ効率のよい手法を提案する。
提案手法では,(i)壊滅的忘れを軽減し,(ii)継続的に到着するデータセットへの効率的な適応を可能にし,(iv)類似したデータセットドメイン間の知識共有を可能にする。
我々のDAMモデルは、さまざまなドメインにまたがる6つのVidQAデータセットに対する1.9%の忘れ込みを示しながら、最先端の継続的学習アプローチを9.1%向上させています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:53:47 GMT)
TOOLVERIFIER: Generalization to New Tools via Self-Verification [69.9] 本稿では,ツール選択中にコントラスト質問を自己問合せすることで,近接候補を識別する自己検証手法を提案する。
ToolBenchベンチマークによる4つのタスクの実験では、17の見えないツールで構成されており、数ショットのベースラインよりも平均22%改善されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:38:42 GMT)
SSMG: Spatial-Semantic Map Guided Diffusion Model for Free-form
Layout-to-Image Generation [68.4] 本稿では,レイアウトから派生した特徴写像を用いた空間意味マップガイド(SSMG)拡散モデルを提案する。
SSMGは,従来の研究に比べて空間的,意味的な制御性に優れた生成品質を実現する。
また,RSA(Relation-Sensitive Attention)機構とLSA(Location-Sensitive Attention)機構を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:16:20 GMT)
HawkI: Homography & Mutual Information Guidance for 3D-free Single Image to Aerial View [67.8] 本稿では,テキストと模範画像から空中視像を合成するためのHawkeIを提案する。
HawkIは、予め訓練されたテキストから2次元の安定拡散モデルに入力画像からの視覚的特徴をブレンドする。
推測において、HawkeIは、入力画像の意味的詳細を忠実に複製するために生成されたイメージを操るために、ユニークな相互情報ガイダンスの定式化を用いる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:46:03 GMT)
Follow-Your-Click: Open-domain Regional Image Animation via Short
Prompts [67.5] 簡単なユーザクリックで画像アニメーションを実現するために,Follow-Your-Clickという実用的なフレームワークを提案する。
我々のフレームワークは、従来の方法よりもシンプルで正確なユーザ制御と、より優れた生成性能を備えています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:44:37 GMT)
Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.3] オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:53:31 GMT)
Fast Dual-Regularized Autoencoder for Sparse Biological Data [65.3] 本研究では,近傍正規化行列補完問題に対する浅層オートエンコーダを開発する。
本研究は, 薬物と薬物の相互作用と薬物の放出関連性を予測する上で, 既存の最先端技術に対するアプローチの速度と精度の優位性を実証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:03:40 GMT)
Towards Personalized Evaluation of Large Language Models with An
Anonymous Crowd-Sourcing Platform [64.8] 大規模言語モデルのための匿名クラウドソーシング評価プラットフォームであるBingJianを提案する。
このプラットフォームを通じて、ユーザーは質問を提出し、パーソナライズされ、潜在的に幅広い機能でモデルをテストできる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:31:20 GMT)
Davidsonian Scene Graph: Improving Reliability in Fine-grained Evaluation for Text-to-Image Generation [64.6] テキスト・ツー・イメージ・モデルを評価するための形式的意味論にインスパイアされた評価フレームワークを開発する。
Davidsonian Scene Graph (DSG) が依存性グラフにまとめられた原子的およびユニークな質問を生成することを示す。
また,1060個のプロンプトを含むオープンソースの評価ベンチマークDSG-1kを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:58:59 GMT)
Delta-AI: Local objectives for amortized inference in sparse graphical models [64.6] スパース確率的グラフィカルモデル(PGM)における補正推論のための新しいアルゴリズムを提案する。
提案手法は, PGMにおける変数のサンプリングをエージェントが行う一連の行動とみなす場合, エージェントのポリシー学習目的において, PGMの疎結合が局所的な信用割当を可能にするという観察に基づいている。
合成PGMからサンプリングし、スパース因子構造を持つ潜在変数モデルを訓練するための$Delta$-AIの有効性について説明する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:07:19 GMT)
Expected flow networks in stochastic environments and two-player zero-sum games [64.0] 生成フローネットワーク(GFlowNets)は、所定の分布に合わせてトレーニングされた逐次サンプリングモデルである。
我々はGFlowNetsを環境に拡張する予測フローネットワーク(EFlowNets)を提案する。
本稿では,タンパク質設計などのタスクにおいて,EFlowNetが他のGFlowNetよりも優れていることを示す。
次に、EFlowNetsの概念を敵環境に拡張し、2プレイヤーゼロサムゲームのための敵フローネットワーク(AFlowNets)を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:57:44 GMT)
VeCLIP: Improving CLIP Training via Visual-enriched Captions [63.5] 本研究は,ノイズキャプション書き換えのためのスケーラブルパイプラインを提案する。
視覚豊かなキャプション(VeCap)と呼ばれるキャプションへの視覚概念の組み入れを強調した。
本稿では,大規模なWebクローリングデータセットであるVeCLIP上でCLIPをトレーニングするためのこの手法の適用について紹介する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:27:08 GMT)
Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained
Ship Classification [62.4] リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。
大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。
本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:48:58 GMT)
ManiGaussian: Dynamic Gaussian Splatting for Multi-task Robotic
Manipulation [62.1] マルチタスクロボット操作のための動的ガウス分割法ManiGaussianを提案する。
我々のフレームワークは、最先端の手法を平均的な成功率で13.1%上回ることができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:06:41 GMT)
S-DyRF: Reference-Based Stylized Radiance Fields for Dynamic Scenes [61.0] 現在の3Dスタイリング手法は、現実世界の動的な性質に反する静的なシーンを想定することが多い。
本稿では,動的ニューラルネットワークのための参照型時間スタイリング手法であるS-DyRFを提案する。
合成と実世界の両方のデータセットを用いた実験により,本手法が有意なスタイリング結果をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:45:29 GMT)
In-Context Learning Learns Label Relationships but Is Not Conventional
Learning [60.9] 大規模言語モデルの文脈内学習(ICL)能力について、現時点では合意が得られていない。
ICLがラベル情報をどのように活用するかという新たな洞察を提供し、機能と制限の両方を明らかにします。
実験の結果, ICLの予測はコンテキスト内ラベルにほぼ常に依存しており, ICLはコンテキスト内における真に新しいタスクを学習できることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:00:20 GMT)
DS-Agent: Automated Data Science by Empowering Large Language Models
with Case-Based Reasoning [60.3] 大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:02:25 GMT)
Scaling Up Dynamic Human-Scene Interaction Modeling [60.2] TRUMANSは、現在利用可能な最も包括的なモーションキャプチャーHSIデータセットである。
人体全体の動きや部分レベルの物体の動きを複雑に捉えます。
本研究では,任意の長さのHSI配列を効率的に生成する拡散型自己回帰モデルを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:45:04 GMT)
Beyond Memorization: The Challenge of Random Memory Access in Language
Models [59.9] 生成言語モデル(LM)がそのメモリに逐次的またはランダムにアクセスできるかどうかを検討する。
本手法により, LMのランダムメモリアクセス性能が向上することがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:46:38 GMT)
PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6] 本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:04:18 GMT)
Consistency Trajectory Models: Learning Probability Flow ODE Trajectory
of Diffusion [58.5] Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:50:56 GMT)
Open-Vocabulary Video Anomaly Detection [57.6] 監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:57:00 GMT)
Tractable Local Equilibria in Non-Concave Games [57.1] オンライングラディエントDescentとノンレグレット学習は,非コンケーブゲームにおける粗相関平衡に効率よく収束することを示した。
非凹面ゲームにおいて局所的なナッシュ均衡を一般化する、$(varepsilon, Phi(delta))$-local equilibriumと呼ばれる新しい解の概念を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:51:30 GMT)
Amortizing intractable inference in large language models [56.9] 難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。
我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。
重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:48:14 GMT)
Ambient Diffusion Posterior Sampling: Solving Inverse Problems with
Diffusion Models trained on Corrupted Data [56.8] Ambient Diffusion Posterior Smpling (A-DPS) は、ある種類の腐敗に対して事前訓練された生成モデルである。
A-DPSは、いくつかの画像復元タスクにおいて、クリーンなデータで訓練されたモデルよりも、速度と性能の両方で優れていることが示される。
我々はAmbient Diffusionフレームワークを拡張して、FourierサブサンプルのマルチコイルMRI測定にのみアクセスしてMRIモデルをトレーニングする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:28:20 GMT)
Linear attention is (maybe) all you need (to understand transformer
optimization) [55.8] 我々は、単純だが正準化された浅部変圧器モデルの研究により、変圧器の微妙さの理解に向けて前進する。
最も重要なことは、線形化モデルがトランスフォーマーのトレーニング力学のいくつかの顕著な側面を再現できることである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:48:27 GMT)
FastMAC: Stochastic Spectral Sampling of Correspondence Graph [55.8] 本稿では,対応グラフの領域にグラフ信号処理を導入する最初の研究について述べる。
我々は、対応グラフ上の一般化次数信号を利用し、高周波成分を保存するサンプリング戦略を追求する。
アプリケーションとして,FastMACと呼ばれる,リアルタイムな高速な3D登録アルゴリズムを構築した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:59:56 GMT)
Stochastic action for the entanglement of a noisy monitored two-qubit
system [55.2] 局所的な一意雑音が局所的なモニタリングおよび量子間カップリングを受ける2ビット系の絡み合い進化に及ぼす影響について検討した。
チャンタスリ・ドルッセル・ヨルダン経路積分に雑音を組み込んでハミルトニアンを構築し、それを最適絡み合い力学の同定に利用する。
長時間定常エンタングルメントの数値解析により,コンカレンスと雑音強度の非単調な関係が明らかとなった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:14:10 GMT)
Quantum simulation in hybrid transmission lines [55.2] 超伝導量子干渉装置(SQUID)を用いて、右手の伝送線を左手の伝送線に接続するハイブリッドプラットフォームを提案する。
特定の共鳴条件を活性化することにより、このプラットフォームは量子光学、マルチモード量子システム、量子熱力学の異なる現象の量子シミュレータとして使用できることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:15:14 GMT)
Data Augmentation in Human-Centric Vision [55.0] 本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:05:18 GMT)
Learning to Describe for Predicting Zero-shot Drug-Drug Interactions [54.2] 薬物と薬物の相互作用は同時投与の有効性を損なう可能性がある。
従来のDDI予測の計算手法では、知識不足のため、新しい薬物の相互作用を捉えることができない可能性がある。
言語モデルに基づくDDI予測器と強化学習(RL)に基づく情報セレクタを用いたテキストDDIを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:42:46 GMT)
Spectral Meets Spatial: Harmonising 3D Shape Matching and Interpolation [54.0] 本稿では,3次元形状の対応と形状の両面を統一的に予測する枠組みを提案する。
我々は、スペクトル領域と空間領域の両方の形状を地図化するために、奥行き関数写像フレームワークと古典的な曲面変形モデルを組み合わせる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:13:04 GMT)
Human Alignment of Large Language Models through Online Preference
Optimisation [50.5] 最近のアライメント手法であるアイデンティティポリシー最適化(IPO)とNash Mirror Descent(Nash-MD)の等価性を示す。
この等価性は、オンラインバージョンのIPOを考えると証明できる。これは、両方の世代がオンラインポリシーによってサンプルされ、訓練された選好モデルによって注釈付けされる時である。
本稿では,一般的なNash-MDアルゴリズムと同様に,オンラインポリシと参照ポリシの混在したデータを生成するIPO-MDアルゴリズムを紹介する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:47:26 GMT)
Gaussian Entanglement Measure: Applications to Multipartite Entanglement
of Graph States and Bosonic Field Theory [50.2] フービニ・スタディ計量に基づく絡み合い尺度は、Cocchiarellaと同僚によって最近導入された。
本稿では,多モードガウス状態に対する幾何絡み合いの一般化であるガウスエンタングルメント尺度(GEM)を提案する。
自由度の高い系に対する計算可能な多部絡み合わせ測度を提供することにより、自由なボゾン場理論の洞察を得るために、我々の定義が利用できることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:40:21 GMT)
SmartPlay: A Benchmark for LLMs as Intelligent Agents [50.0] SmartPlayはRock-Paper-Scissors, Tower of Hanoi, Minecraftなど,6つの異なるゲームで構成されている。
各ゲームは知的LLMエージェントの9つの重要な能力のサブセットに挑戦する。
テストには、オブジェクト依存による推論、事前計画、空間的推論、履歴からの学習、ランダムさの理解が含まれる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:02:01 GMT)
Pink: Unveiling the Power of Referential Comprehension for Multi-modal
LLMs [49.9] 本稿では,MLLMの微細な画像理解能力を高めるための新しい枠組みを提案する。
本稿では,既存のデータセットのアノテーションを活用して,命令チューニングデータセットを低コストで構築する手法を提案する。
本研究では,Qwen-VLよりも5.2%精度が向上し,Kosmos-2の精度が24.7%向上したことを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:42:31 GMT)
IPDreamer: Appearance-Controllable 3D Object Generation with Image
Prompts [49.8] 本稿では,3次元オブジェクト生成のための具体的かつ包括的な外観情報を含む新しいアプローチであるIDDreamerを紹介する。
以上の結果から,IDDreamerは提供されたテキストと複雑な画像プロンプトの出現の両方に整合した高品質な3Dオブジェクトを効果的に生成できることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:56:47 GMT)
Retentive or Forgetful? Diving into the Knowledge Memorizing Mechanism
of Language Models [49.4] 大規模事前学習型言語モデルは、顕著な記憶能力を示している。
プレトレーニングのないバニラニューラルネットワークは、破滅的な忘れ物問題に悩まされていることが長年観察されてきた。
1)バニラ言語モデルは忘れがちである; 2)事前学習は暗黙の言語モデルにつながる; 3)知識の妥当性と多様化は記憶形成に大きな影響を及ぼす。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:34:17 GMT)
BiTT: Bi-directional Texture Reconstruction of Interacting Two Hands
from a Single Image [49.1] BiTT (Bi-directional Texture Restruction of Two Hand) は, 対話型2つの手において, 安心してポーズのないテクスチャ再構築を行うための, エンドツーエンドトレーニング可能な最初の方法である。
In experiment using InterHand2.6M and RGB2Hands datasets, we method significantlyforms state-of-the-the-art hand texture reconstruction method。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:25:49 GMT)
Towards Model Extraction Attacks in GAN-Based Image Translation via Domain Shift Mitigation [48.4] モデル抽出攻撃(MEA)は、攻撃者がAPIサービスをリモートでクエリすることで、被害者のディープニューラルネットワーク(DNN)モデルの機能を複製することを可能にする。
本稿では,画像間翻訳(I2IT)タスクにおけるMEAの脅威を新たな視点から明らかにする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:58:52 GMT)
HRLAIF: Improvements in Helpfulness and Harmlessness in Open-domain
Reinforcement Learning From AI Feedback [48.3] 我々はAIフィードバック(HRLAIF)によるハイブリッド強化学習を提案する。
この方法は、応答に対するAIアノテーションの精度を高め、モデルのトレーニングプロセスにおける有用性をより堅牢にする。
HRLAIFはRLAIFの能力を継承し、低コストで結果に対する人間の嗜好を高めると同時に、反応の満足度を向上させる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:38:20 GMT)
LongAgent: Scaling Language Models to 128k Context through Multi-Agent
Collaboration [47.9] textscLongAgentはマルチエージェントのコラボレーションに基づいており、128Kのコンテキストにスケールする。
LLaMA-7Bでインスタンス化されたエージェントチームは、128k長のテキスト検索やマルチホップ質問応答といったタスクにおいて、GPT-4に比べて大幅に改善されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:16:42 GMT)
Semi-Supervised Learning for Anomaly Traffic Detection via Bidirectional Normalizing Flows [47.5] 本稿では,異常なネットワークトラフィック検出の問題点を考察し,通常のトラフィックのみを用いた3段階の異常検出フレームワークを提案する。
本フレームワークは,異常を事前に知ることなく擬似異常サンプルを生成し,異常データの検出を実現する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:10:32 GMT)
A Causal Inspired Early-Branching Structure for Domain Generalization [46.6] ドメイン不変セマンティック表現の学習は、ドメインの一般化を達成するために不可欠である。
標準的なトレーニングは、しばしば絡み合った意味とドメイン固有の特徴をもたらす。
これまでの研究は、因果的な観点から問題を定式化することを示唆している。
基本的なフレームワークを補完する2つの戦略を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:04:29 GMT)
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation [46.1] 市販のMLLMとT2Iモデルを連携させてマルチモーダル対話システムを構築するためのDialogGenを提案する。
描画プロンプトアライメント、注意深いトレーニングデータキュレーション、エラー修正で構成されている。
ダイアログジェネレーションとユーザスタディに関する実験は、他の最先端モデルと比較してダイアログジェネレーションの有効性を実証している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:00:01 GMT)
Robust extended states in Anderson model on partially disordered random
regular graphs [45.0] スペクトルの運動量エッジは、無限大の均一分散障害において、ある範囲のパラメータ$(d,beta)$で生存することが示されている。
スパースと超高密度RRGの局在特性の双対性が発見され、理解されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:57:13 GMT)
Architectural Implications of Neural Network Inference for High Data-Rate, Low-Latency Scientific Applications [43.6] 多くの科学的NNアプリケーションは、そのような制約を満たすためにカスタムチップを必要とする極端なケースにおいて、チップ上で完全に動作しなければならない。
我々の研究では、多くの科学的NNアプリケーションはチップ上で完全に動作しなければなりませんが、極端な場合、そのような厳しい制約を満たすためにカスタムチップが必要であることが示されています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:10:42 GMT)
Fast Inference of Removal-Based Node Influence [43.4] 本稿では,ノードの除去による学習GNNモデルの予測変化を計測するノードの影響評価手法を提案する。
我々は,ノード除去に伴うノードやエッジの変化をシミュレート可能な代理モデルとして,GNNを使用している。
本稿では,ノード除去の影響を近似するために勾配を用いたNOde-Removal-based fAst GNN推論(NORA)を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:37:31 GMT)
Safe Road-Crossing by Autonomous Wheelchairs: a Novel Dataset and its Experimental Evaluation [42.9] 自動車椅子と空飛ぶドローンで構成されるシステムにおいて,道路横断決定を支援するマルチセンサ融合方式を提案する。
概念実証として,複数センサの利点を示す実験室環境の評価を行った。
この研究は欧州のプロジェクトREXASI-PROの文脈で開発され、モビリティを低下させた人々のソーシャルナビゲーションのための信頼できる人工知能の開発を目的としている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:19:06 GMT)
Electrocardiogram Instruction Tuning for Report Generation [42.7] 心電図(ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令によるECGレポート生成に対処するMultimodal ECG Instruction Tuning(MEIT)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:20:47 GMT)
Source-Free Domain Adaptation with Frozen Multimodal Foundation Model [42.2] Source-Free Domain Adaptation (SFDA)は、ターゲットドメインにソースモデルを適用することを目的としている。
ヘテロジニアス知識を生かしながら、リッチな市販の視覚言語(ViL)マルチモーダルモデルの可能性を探る。
本稿では,新しいDIFOアポローチモデルを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:11:47 GMT)
Call Me When Necessary: LLMs can Efficiently and Faithfully Reason over
Structured Environments [42.1] 本稿では,構造化環境に対する効率的な推論を行うために,Reasoning-Path-Editing (Readi)を提案する。
Readiはクエリが与えられた推論パスを生成し、必要なときにのみそのパスを編集する。
3つのKGQAデータセットと2つのTableQAデータセットの実験結果は、Readiの有効性を示している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:59:07 GMT)
Threshold-Consistent Margin Loss for Open-World Deep Metric Learning [42.0] 画像検索にDeep Metric Learning (DML) で使われている既存の損失は、しばしば非均一なクラス内およびクラス間表現構造に繋がる。
不整合はしばしば、商用画像検索システムを展開する際のしきい値選択過程を複雑にする。
クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:52:37 GMT)
Optimizing Conical Intersections Without Explicit Use of Non-Adiabatic
Couplings [41.9] 微分結合(DC)を知らずに最小エネルギー円錐交叉(MECI)分子幾何学を最適化する2つの方法を提案する。
一連の小さな分子系上で行った試験は、他の方法と比較して、提案手法がMECIを最適化する能力を示している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:29:10 GMT)
AGI: Artificial General Intelligence for Education [41.5] 本稿では,人工知能(AGI)の重要な概念,能力,範囲,将来的な教育の可能性について概説する。
AGIは知的学習システム、教育評価、評価手順を大幅に改善することができる。
この論文は、AGIの能力が人間の感情や社会的相互作用を理解することに拡張されていることを強調している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:47:04 GMT)
OpenXAI: Towards a Transparent Evaluation of Model Explanations [41.4] 我々は,ポストホックな説明手法の評価とベンチマークを行う,包括的でオープンソースなフレームワークであるOpenXAIを紹介する。
柔軟性のある合成データジェネレータと多様な実世界のデータセットのコレクション、事前訓練されたモデル、最先端の機能属性メソッド、および(ii)忠実性、安定性(ロバスト性)、説明方法の公正性を評価するための11の定量的メトリクスのオープンソース実装。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:38:44 GMT)
MuseGraph: Graph-oriented Instruction Tuning of Large Language Models
for Generic Graph Mining [41.2] グラフニューラルネットワーク(GNN)は、異なるグラフタスクやデータセットに適用されるたびに、再トレーニングされる必要がある。
GNNとLarge Language Models(LLM)の強みをシームレスに統合する新しいフレームワークMusteGraphを提案する。
実験結果から,異なるグラフタスクの大幅な改善が示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:52:33 GMT)
GaussCtrl: Multi-View Consistent Text-Driven 3D Gaussian Splatting
Editing [40.9] GaussCtrlは、3D Gaussian Splatting(3DGS)によって再構成された3Dシーンを編集するテキスト駆動方式である。
私たちの重要な貢献は、複数ビューの一貫性のある編集であり、1つの画像を反復的に編集する代わりに、すべての画像を一緒に編集できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:35:28 GMT)
VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis [40.9] VLOGGER (VLOGGER) は、単一の入力画像から音声駆動のヒューマンビデオを生成する方法である。
空間的および時間的制御の両面からテキスト・ツー・イメージ・モデルを拡張する新しい拡散型アーキテクチャを用いている。
ビデオ編集やパーソナライズにおける応用例を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:59:02 GMT)
Return of Unconditional Generation: A Self-supervised Representation
Generation Method [40.8] 非条件生成は、人間のアノテートラベルに頼ることなく、データの分散をモデル化する問題である。
本研究では,自己教師型エンコーダによって生成された表現空間における意味表現を生成することにより,このギャップを埋めることができることを示す。
このフレームワークはRepresentation-Conditioned Generation (RCG)と呼ばれ、ラベルを使わずに無条件生成問題に対する効果的な解決策を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:01:02 GMT)
AIGCs Confuse AI Too: Investigating and Explaining Synthetic
Image-induced Hallucinations in Large Vision-Language Models [40.5] 我々は、AI合成画像によるLVLM(Large Vision-Language Models)の悪化する幻覚現象を強調した。
注目すべきは、AIGC textbfhallucination biasに光を当てることである: 合成画像によって誘導される物体幻覚は、より多い量で特徴づけられる。
我々は,Q-formerとLinearプロジェクタについて検討した結果,合成画像は視覚投射後のトークン偏差を呈し,幻覚バイアスを増幅することがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:56:34 GMT)
Nonlinear Manifold Learning Determines Microgel Size from Raman
Spectroscopy [40.3] 近年のアプローチでは、ラマン信号と粒子径の相関を示すが、ラマン測定からポリマーのサイズを正確にかつ確実に決定することができない。
本稿では,拡散マップ,交互拡散マップ,共形オートエンコーダネットワークを含む3つの機械学習手法を提案する。
共形オートエンコーダはラマンスペクトルからのポリマーサイズ予測において、最先端の手法と結果を大きく上回った。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:39:15 GMT)
Improved Regret Bounds of (Multinomial) Logistic Bandits via
Regret-to-Confidence-Set Conversion [40.2] 我々は,オンライン学習アルゴリズムのテキストテキシスタンスのみに基づく凸信頼セットを,後悔の保証付きで構築する。
R2CSを用いて、計算実現可能性を維持しながら、ロジスティックな包帯におけるw.r.t.$S$を厳格に改善する。
我々は,この分析を多項ロジスティック・バンディットにまで拡張し,R2CSの有効性を示した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:58:07 GMT)
Make Me Happier: Evoking Emotions Through Image Diffusion Models [39.8] 本稿では,感情を誘発するイメージを合成することを目的とした,感情誘発画像生成の新たな課題を提案する。
本稿では、ソースイメージを効果的に理解し、編集し、望ましい感情や感情を伝える拡散モデルを提案する。
我々は、人間の心理物理学実験を行い、すべての手法を体系的にベンチマークする4つの新しい評価指標を導入する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:13:17 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [39.4] 本稿では,知識グラフにおけるマルチホップリンク予測を強化するために,知識グラフ大言語モデルフレームワーク(KG-LLM)を提案する。
知識グラフをチェーン・オブ・シークレットのプロンプトに変換することで、我々のフレームワークは、エンティティの潜在表現とその相互関係を識別し、学習するように設計されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:44:30 GMT)
Generative Pretrained Structured Transformers: Unsupervised Syntactic
Language Models at Scale [39.2] 原文のスクラッチから事前学習が可能な大規模教師なしSLM(Generative Pretrained Structured Transformers, GPST)を提案する。
GPSTは、ゴールドツリーやシーケンシャルトレーニングなど、以前のSLMの制限を回避している。
GPSTは、左から右への文法誘導において、既存の教師なしSLMを著しく上回る。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:54:47 GMT)
Bifurcated Attention for Single-Context Large-Batch Sampling [39.2] Bifurcated attentionは、単一コンテキストのバッチサンプリングコンテキストにおける言語モデル推論のために開発された手法である。
2つの異なるGEMM演算にインクリメンタルデコーディング中にアテンション機構を分割することで、この処理を実現する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:30:57 GMT)
OccFiner: Offboard Occupancy Refinement with Hybrid Propagation [38.0] OccFinerは、視覚ベースの占有率予測の精度を高めるために設計された、新しいオフボードフレームワークである。
OccFinerは、1)複数のローカルなフレームを暗黙的に整列して処理し、モデルエラーを訂正し、すべての距離にわたって占有精度を一貫して向上するマルチツーマルチローカルな伝搬ネットワークである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:12:42 GMT)
SWAP-NAS: Sample-Wise Activation Patterns for Ultra-fast NAS [37.6] トレーニング不要のメトリクスは、リソース集約型ニューラルネットワークトレーニングを避けるために広く使用されている。
我々は,新しい高性能トレーニングフリーメトリックであるSWAP-ScoreとSample-Wise Activation Patternsを提案する。
SWAP-Scoreは,様々な検索空間やタスクの接地構造と強く相関している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:40:52 GMT)
Loop unrolling (for test coverage): formal definition [37.5] ブランチカバレッジなど、さまざまなテストカバレッジを実現するためのテクニックは、通常、ループを反復しない。
より最近の研究によると、ループをアンロールすることで、アプローチははるかに多くのバグを見つけることができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:28:04 GMT)
LAFS: Landmark-based Facial Self-supervised Learning for Face
Recognition [37.5] 我々は、効果的な顔認識モデルの訓練に適応できる顔表現の学習に焦点をあてる。
本研究では,自己教師付き事前学習による未ラベル顔画像の学習戦略について検討する。
提案手法は,複数の顔認識ベンチマークにおける最先端技術よりも大幅に向上する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:07:55 GMT)
CIFAR-10-Warehouse: Broad and More Realistic Testbeds in Model
Generalization Analysis [37.3] CIFAR-10-Warehouseは画像検索エンジンと拡散モデルによって収集された180個のデータセットから構成される。
本研究の目的は,様々なアウト・オブ・ディストリビューション環境における領域一般化とモデル精度予測という,2つの一般化タスクの理解を深めることである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:49:19 GMT)
Using Deep Learning for Morphological Classification in Pigs with a Focus on Sanitary Monitoring [36.4] この研究は、これらのカドファジー、耳血腫、体のひっかき傷、赤み、天然汚れ(茶色または黒)の5つの豚の特徴に焦点を当てた。
以上の結果から,D-CNNは皮膚特性に関連するブタの身体形態の偏差の分類に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:05:34 GMT)
Pre-examinations Improve Automated Metastases Detection on Cranial MRI [36.4] コントラスト強調T1強調画像における高感度MMの自動検出
診断成績は造影T1強調画像と術前MRIで得られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:18:08 GMT)
REPAIR: Rank Correlation and Noisy Pair Half-replacing with Memory for
Noisy Correspondence [36.3] 取得したデータにノイズが存在することは、クロスモーダルマッチングの性能低下につながる。
我々は,不一致なデータペア問題に対処するために,ランクコラーレーションと雑音hAlf wIth memoRyというフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:01:20 GMT)
Unleashing the Power of Meta-tuning for Few-shot Generalization Through
Sparse Interpolated Experts [35.6] Sparse MetA-Tuning (SMAT) はスパース・ミックス・オブ・エキスパート・アプローチにインスパイアされた手法である。
SMATはOOD感度を克服し、ビジョンファウンデーションモデルの転送能力を高めることを約束する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:46:03 GMT)
An Empirical Study of Parameter Efficient Fine-tuning on Vision-Language
Pre-train Model [35.6] PEFTの自然な期待は、様々なPEFTの性能がデータサイズと微調整可能なパラメータサイズに肯定的な関係があることである。
このような直感は、下流のデータとタスクが事前トレーニングと一致していない場合にのみ成立する。
事前トレーニングと整合した下流の微調整では、データサイズはもはやパフォーマンスに影響を与えず、微調整可能なパラメータサイズの影響は単調ではない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:33:38 GMT)
Gaussian Splatting in Style [35.4] テスト時に高品質なスタイリングされた新しいビューを生成できる,スタイルイメージのコレクションをトレーニングした新しいアーキテクチャを提案する。
本研究では,室内および屋外の様々な実世界のデータに対して,視覚的品質の優れた最先端性能を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:06:31 GMT)
Modular Blind Video Quality Assessment [35.3] Blind Video Quality Assessment (BVQA) は、幅広いビデオベースのプラットフォームやサービスにおけるエンドユーザーの視聴体験を評価し改善する上で重要な役割を担っている。
本稿では,モジュール型BVQAモデルを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:24:51 GMT)
PathM3: A Multimodal Multi-Task Multiple Instance Learning Framework for Whole Slide Image Classification and Captioning [35.2] 本稿では,WSI分類とキャプションのためのマルチタスク・マルチインスタンス学習フレームワークPathM3を提案する。
本手法は,限られたWSI診断キャプションデータを活用することで,WSIレベルのキャプションにおけるデータ不足を克服する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:19:12 GMT)
Token Alignment via Character Matching for Subword Completion [34.8] 本稿では,生成モデルにおけるテキスト補完におけるトークン化アーティファクトの緩和手法について検討する。
この手法はトークンアライメントと呼ばれ、最後の完全なトークンをバックトラックし、モデルの生成がプロンプトと整合することを保証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:44:39 GMT)
Unveiling the Truth: Exploring Human Gaze Patterns in Fake Images [34.0] 我々は、人間の意味的知識を活用して、偽画像検出のフレームワークに含まれる可能性を調べる。
予備的な統計的分析により、人間が本物の画像や変化した画像をどのように知覚するかの特徴的なパターンを探索する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:56:30 GMT)
DragAnything: Motion Control for Anything using Entity Representation [33.3] DragAnythingは、制御可能なビデオ生成における任意のオブジェクトのモーション制御を実現する。
提案手法は従来の手法(例えばDragNUWA)を26%上回る。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:22:36 GMT)
Feature Extraction for Generative Medical Imaging Evaluation: New
Evidence Against an Evolving Trend [32.5] Fr'echet Inception Distance (FID)は、合成画像の品質を評価するための指標である。
最近の傾向は、医用画像で訓練された特徴抽出器による医用画像へのFIDの適用である。
本研究では,ImageNetをベースとした抽出器がRadImageNetよりも人間の判断に整合していることを示すことで,この実践に挑戦する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:10:53 GMT)
CacheGen: Fast Context Loading for Language Model Applications via KV
Cache Streaming [32.5] CacheGenは、大きな言語モデル(LLM)のための高速なコンテキストローディングモジュールである
KVキャッシュを符号化/復号のオーバーヘッドを無視して、よりコンパクトなビットストリーム表現にエンコードする。
ストリーミング戦略を適用して、利用可能な帯域幅の変化に対処する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:55:39 GMT)
A Decade's Battle on Dataset Bias: Are We There Yet? [32.5] 10年前にTorralbaとEfrosによって提案された"データセット分類"実験を再考する。
驚くべきことに、現在のニューラルネットワークは、画像がどのデータセットから来ているかの分類において、優れた精度を達成することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:46:37 GMT)
A Quasi-Wasserstein Loss for Learning Graph Neural Networks [32.1] グラフ上で定義された最適輸送の助けを借りて、新しい準ワッサーシュタイン(QW)損失を提案する。
提案したQW損失は,様々なグラフニューラルネットワーク(GNN)に適用され,ノードレベルの分類や回帰タスクの性能向上に寄与することを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:14:52 GMT)
DataInf: Efficiently Estimating Data Influence in LoRA-tuned LLMs and
Diffusion Models [31.7] 本稿では,大規模生成AIモデルに有効な効率的な影響近似手法であるDataInfを提案する。
理論的解析により,DataInfはLoRAのようなパラメータ効率のよい微調整技術に特に適していることが示された。
RoBERTa-large、Llama-2-13B-chat、stable-diffusion-v1.5モデルへの適用において、DataInfは、他の近似影響スコアよりも、最も影響力のある微調整例を効果的に識別する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:27:46 GMT)
ILCiteR: Evidence-grounded Interpretable Local Citation Recommendation [31.3] 本稿では,特定の論文を推薦するための証拠を対象とする,根拠に基づく局所引用推薦タスクを紹介する。
単にレコメンデーションを出力する過去の定式化とは異なり、ICCiteRはエビデンスのリストとレコメンデーションペーパーのペアを検索する。
本研究では,エビデンスに基づく局所的引用推薦タスクのための新しいデータセットを提供し,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:38:05 GMT)
VertiBench: Advancing Feature Distribution Diversity in Vertical
Federated Learning Benchmarks [31.1] 本稿では,VFLの性能に影響を及ぼす2つの要因について紹介する。
また、画像イメージのVFLシナリオの欠点に対応するために、実際のVFLデータセットも導入する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:06:37 GMT)
Simulating Meson Scattering on Spin Quantum Simulators [30.4] 我々は,イジングスピンハミルトニアンのアナログ量子シミュレータにおいて,複合粒子の波束に対応する絡み合ったスピン状態を生成する2つの方法を開発した。
トラップイオンシミュレータに焦点をあて,両手法を数値的にベンチマークし,短期実験において高忠実度波動パケットが実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:46:25 GMT)
KnowGPT: Knowledge Injection for Large Language Models [30.3] 我々は,ジェネレーティブ・大型言語モデル(LLM)のためのブラックボックス知識注入フレームワークであるKnowGPTを紹介した。
KnowGPTは、深い強化学習(RL)を活用して知識グラフ(KGs)から関連する知識を抽出し、マルチアーメッド帯域(MAB)を使用して各質問に最も適したプロンプトを構築する。
KnowGPTはChatGPTよりも平均23.7%改善し、GPT-4より平均2.9%改善した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:35:18 GMT)
Iterative Online Image Synthesis via Diffusion Model for Imbalanced
Classification [29.7] 医用画像分類におけるクラス不均衡問題に対処するための反復オンライン画像合成フレームワークを提案する。
このフレームワークにはオンライン画像合成(OIS)と精度適応サンプリング(AAS)という2つの重要なモジュールが組み込まれている。
不均衡な分類に対処するための提案手法の有効性を評価するため,HAM10000およびAPTOSデータセットを用いて実験を行った。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:51:18 GMT)
SMART: Submodular Data Mixture Strategy for Instruction Tuning [29.5] SMART(Submodular Data Mixture strAtegy for InstRuction Tuning)を新たなデータ混合戦略として紹介する。
微調整の予算が与えられると、SMARTはタスク間で予算を再分配し、各タスクから非冗長サンプルを選択する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:31:50 GMT)
Tackling the Singularities at the Endpoints of Time Intervals in
Diffusion Models [29.2] 不適切な特異点の扱いは、アプリケーションにおける平均的な明るさの問題につながる。
理論的・実践的な両面から特異点に取り組むことに注力する。
本稿では,初期特異時間ステップサンプリングに対処する新しいプラグアンドプレイ方式SingDiffusionを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:47:04 GMT)
Graph Unlearning with Efficient Partial Retraining [28.4] グラフニューラルネットワーク(GNN)は、様々な現実世界のアプリケーションで顕著な成功を収めている。
GNNは、望ましくないグラフデータに基づいてトレーニングされ、パフォーマンスと信頼性を低下させることができる。
学習不能なGNNのモデルユーティリティをよりよく維持するグラフアンラーニングフレームワークであるGraphRevokerを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:43:23 GMT)
GaussianImage: 1000 FPS Image Representation and Compression by 2D
Gaussian Splatting [28.4] Inlicit Neural representations (INR)は画像表現と圧縮で大成功を収め、10-1000 FPSで高画質で高速なレンダリング速度を提供する。
本稿では,2次元ガウススプラッティングによる画像表現と圧縮の基盤となるパラダイムであるガウス画像を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:02:54 GMT)
Multi-Task Pseudo-Label Learning for Non-Intrusive Speech Quality
Assessment Model [28.3] 本研究ではMTQ-Netと呼ばれるマルチタスク擬似ラベル学習(MPL)に基づく非侵入的音声品質評価モデルを提案する。
MPLは、事前訓練されたモデルから擬似ラベルスコアを取得し、マルチタスク学習を行う2つの段階から構成される。
MPLアプローチによるMTQ-Netは、他のSSLベースの音声アセスメントモデルと比較して、全体的な予測能力が高い。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:15:11 GMT)
DrFER: Learning Disentangled Representations for 3D Facial Expression
Recognition [28.3] 本稿では,3D FERの分野に非交叉表現学習の概念を取り入れた,革新的なDrFER法を提案する。
DrFERは、表現情報をID情報から効果的に切り離すために、デュアルブランチフレームワークを使用している。
この適応は、顔の表情を認識する際の枠組みの能力を高める。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:00:07 GMT)
Distilling Named Entity Recognition Models for Endangered Species from Large Language Models [27.3] 名前付きエンティティ認識と2段階プロセスによる関係抽出のためのデータセットを作成する。
構築されたデータセットは、一般的なBERTとドメイン固有のBERTのバリエーションの両方を微調整するために使用される。
実験の結果,本手法は絶滅危惧種をテキストから検出するのに適したNERモデルを作成するのに有効であることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:38:55 GMT)
Beyond Gradient and Priors in Privacy Attacks: Leveraging Pooler Layer
Inputs of Language Models in Federated Learning [27.0] 本稿では,現代言語モデルのアーキテクチャの脆弱性を狙う2段階のプライバシ攻撃戦略を提案する。
比較実験は、様々なデータセットやシナリオで優れた攻撃性能を示す。
私たちは、大きな言語モデルの設計において、これらの潜在的なプライバシーリスクを認識し、対処するようコミュニティに呼びかけます。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:19:24 GMT)
Multilingual Turn-taking Prediction Using Voice Activity Projection [26.9] 本稿では,音声対話における音声活動予測モデルである音声活動予測(VAP)の多言語データへの適用について検討する。
その結果, ある言語で訓練された単言語VAPモデルでは, 他の言語に適用してもよい予測が得られないことが示唆された。
3つの言語すべてでトレーニングされた多言語モデルは、すべての言語にわたるモノリンガルモデルと同等の予測性能を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:41:36 GMT)
Demystifying Embedding Spaces using Large Language Models [26.9] 本稿では,埋め込みをより解釈しやすく,広く活用する上での課題に対処する。
埋め込みを直接操作するためにLarge Language Models(LLMs)を用いることで、抽象ベクトルを理解可能な物語に変換する。
提案手法は,概念アクティベーションベクトル(CAV)の強化,新しい組み込みエンティティの通信,レコメンデーションシステムにおけるユーザの好みのデコードなど,多種多様なタスクに対するアプローチを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:40:04 GMT)
Mipha: A Comprehensive Overhaul of Multimodal Assistant with Small
Language Models [26.6] マルチモーダル小言語モデル(Multimodal Small Language Models, MLM)の設計側面について検討し, Mipha という名前の効率的なマルチモーダルアシスタントを提案する。
私たちのMipha-3Bは、最先端の大規模MLLM、特にLLaVA-1.5-13Bを複数のベンチマークで上回ります。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:56:18 GMT)
Strengthening Multimodal Large Language Model with Bootstrapped
Preference Optimization [26.6] MLLM(Multimodal Large Language Models)は、視覚的な入力に基づいて応答を生成する。
彼らはしばしば、事前学習したコーパスと同様の反応を生み出すバイアスに悩まされ、視覚情報の重要性を誇示する。
我々は、このバイアスを事前学習統計のための"推奨"として扱い、視覚入力におけるモデルの基盤を妨げます。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:29:45 GMT)
SKoPe3D: A Synthetic Dataset for Vehicle Keypoint Perception in 3D from
Traffic Monitoring Cameras [26.5] 道路側から見たユニークな合成車両キーポイントデータセットであるSKoPe3Dを提案する。
SKoPe3Dには150万以上の車両インスタンスと490万のキーポイントがある。
実験では、データセットの適用性と、合成データと実世界のデータ間の知識伝達の可能性を強調した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:19:24 GMT)
LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual
Semantic Segmentation for Autonomous Driving [26.3] 本稿では,ロジット蒸留と特徴蒸留の両面に新たな貢献をし,Learning to Infuse "X" (LIX) フレームワークを紹介した。
本稿では,2つの技術ノベルティを含む適応的な特徴蒸留アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:24:36 GMT)
Bridging State and History Representations: Understanding
Self-Predictive RL [26.0] マルコフ決定過程(MDPs)と部分的に観測可能なマルコフ決定過程(POMDPs)のすべての強化学習(RL)手法の中核に表現がある
状態と歴史を抽象化するこれらの明らかに異なる方法やフレームワークの多くは、実際、自己予測的抽象化の共通概念に基づいています。
我々は、自己予測表現の学習において、停止段階技術のような広く採用されている目的と最適化に関する理論的洞察を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:24:42 GMT)
Sketch2Manga: Shaded Manga Screening from Sketch with Diffusion Models [26.0] 本稿では,まずスケッチからカラーイラストを作成し,次にスクリーントーンマンガを生成する新しいスケッチ・ツー・マンガフレームワークを提案する。
本手法は, シェード型高周波数スクリーントーンを用いた高品質マンガの製作において, 既存の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:33:52 GMT)
Feature Likelihood Divergence: Evaluating the Generalization of
Generative Models Using Samples [25.7] Feature Likelihood Divergenceは、生成モデルの包括的なトリコトミック評価を提供する。
我々は,以前に提案された指標が失敗した場合でも,FLDが過度に適合する問題を識別できることを実証的に示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:48:30 GMT)
Better Fit: Accommodate Variations in Clothing Types for Virtual Try-on [25.6] 画像ベースの仮想試着は、ターゲットとなる服を着替えたモデル画像に転送することを目的としている。
トレーニングマスクを動的に調整する適応型マスクトレーニングパラダイムを提案する。
未ペアの試行検証のために、総合的なクロストライオンベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:07:14 GMT)
Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring [25.4] そこで本研究では,シングルインプットとマルチアウトプット(SIMO)に基づくマルチスケールネットワークを提案する。
実世界の軌道特性を学習可能なウェーブレット変換モジュールと組み合わせて、ぼやけた画像から鋭い画像へのステップバイステップ遷移の方向連続性と周波数特性に着目した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:51:29 GMT)
MoleculeQA: A Dataset to Evaluate Factual Accuracy in Molecular
Comprehension [25.4] 62KのQA対を23K以上持つ新しいQAデータセットであるMoleculeQAを提案する。
Mo MoleculeQAは、分子の事実バイアス評価のための最初のベンチマークであるだけでなく、分子研究のための最大のQAデータセットでもある。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:26:16 GMT)
Quantifying the Plausibility of Context Reliance in Neural Machine
Translation [25.3] 我々は、PECoRe(Context Reliance)の可塑性評価を導入する。
PECoReは、言語モデル世代におけるコンテキスト使用量の定量化を目的として設計されたエンドツーエンドの解釈可能性フレームワークである。
我々は、文脈対応機械翻訳モデルの妥当性を定量化するために、pecoreを使用します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:45:53 GMT)
Dr. Jekyll and Mr. Hyde: Two Faces of LLMs [25.1] この研究は、敵対的ペルソナを使用することで、ChatGPTとBardによって設定された安全メカニズムを克服できることを示している。
同じ原則で、信頼に値する個性を理解するためにモデルを推し進める2つの防衛法を導入する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:52:47 GMT)
Kernel-Based Testing for Single-Cell Differential Analysis [25.1] 非線形な細胞分布比較のためのカーネルテストフレームワークを提案する。
本手法は, 細胞集団の多様性を明らかにするため, 機能的およびグローバルなトランスクリプトーム/エポジェノムの比較を可能にする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:18:59 GMT)
Causal Graph Neural Networks for Wildfire Danger Prediction [25.1] 森林火災の予報は、気象条件、植生の種類、人的活動など様々な要因の複雑な相互作用のため、非常に難しいことが知られている。
ディープラーニングモデルは、データから直接学習することで、この複雑さを扱うことを約束している。
私たちは正しい理由のために正しいモデルが必要だと主張する。つまり、学んだ暗黙のルールは、山火事を駆動する基盤となるプロセスによって基礎づけられるべきである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:58:55 GMT)
OneVOS: Unifying Video Object Segmentation with All-in-One Transformer
Framework [24.9] OneVOSは、VOSのコアコンポーネントをAll-in-One Transformerと統合する新しいフレームワークである。
OneVOSは、7つのデータセット、特に70.1%と66.4%の複雑なLVOSとMOSEデータセットにおいて、最先端のパフォーマンスを達成し、それぞれ4.2%と7.0%の従来の最先端メソッドを上回っている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:38:26 GMT)
Multi-Level Compositional Reasoning for Interactive Instruction
Following [24.6] 多レベル合成共鳴剤(MCR-Agent)
最上位レベルでは、高レベルポリシー構成制御器による言語命令に基づいて、人間の解釈可能なサブゴールのシーケンスを推測する。
中間レベルでは、ナビゲーションポリシーと様々な独立したインタラクションポリシーを交互に切り替えることで、エージェントのナビゲーションをマスターポリシーで識別的に制御する。
最も低いレベルでは、適切なインタラクションポリシーを用いて、対応するオブジェクトマスクによる操作動作を推論する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:37:47 GMT)
Are Language Models Puzzle Prodigies? Algorithmic Puzzles Unveil Serious
Challenges in Multimodal Reasoning [24.4] 本稿では,視覚的質問応答の文脈内での多モーダルパズル解決の新たな課題を紹介する。
本稿では,アルゴリズムパズルの解法におけるマルチモーダル言語モデルの能力に挑戦し,評価するための新しいデータセットAlgoVQAを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:50:05 GMT)
PROGrasp: Pragmatic Human-Robot Communication for Object Grasping [24.2] 対話型オブジェクトグラスピング(IOG)は、人間とロボットの自然言語による対話を通じて、望ましいオブジェクトを識別し、把握するタスクである。
Pragmatic-IOG タスクとそれに対応するデータセット Intention-oriented Multi-Modal Dialogue (IM-Dial) を導入する。
Prograspは、視覚的なグラウンドニング、質問、オブジェクトの把握、そして最も重要なのは、実用的推論の解答解釈のモジュールを組み込むことで、Pragmatic-IOGを実行する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:27:10 GMT)
Spin relaxation in inhomogeneous magnetic fields with depolarizing
boundaries [24.0] 脱分極壁を有する気相セルに閉じ込められた原子スピンの場不均一性による緩和に関する研究を行った。
希ガススピンのような核スピンとは対照的に、非被覆細胞の原子スピンは境界でランダム化される。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:15:50 GMT)
SM4Depth: Seamless Monocular Metric Depth Estimation across Multiple
Cameras and Scenes by One Model [24.0] 本稿では, SM4Depthを提案する。SM4Depthは, 1つのネットワーク内の全ての問題にシームレスに対処するMMDE手法である。
まず、一貫した視野(FOV)が、カメラ間の距離あいまいさを解決する鍵であることを明らかにする。
第2に,シーン間で一貫した精度を達成するために,距離尺度の決定を,深さ間隔をビンに識別するものとして明示的にモデル化する。
第三に、大規模なトレーニングデータへの依存を減らすために、我々は「分割と征服」のソリューションを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:08:25 GMT)
Interactive environments for training children's curiosity through the
practice of metacognitive skills: a pilot study [23.9] 本研究では,特定のメタ認知能力のセットを訓練することで,子どもの好奇心を高めることを目的とした8セッションワークショップを提案する。
最初の結果から,子どものメタ認知効率と,質問行動を通じて好奇心を表現する能力に肯定的な影響が認められた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:21:32 GMT)
A comprehensive survey on deep active learning in medical image analysis [23.8] 深層学習は医用画像解析において広く成功し、大規模な専門家による医用画像データセットの需要が高まっている。
しかし、医用画像に注釈をつける高コストは、この分野での深層学習の発展を著しく妨げている。
アノテーションのコストを削減するため、アクティブラーニングは、アノテーションの最も有益なサンプルを選択し、できるだけ少ないラベル付きサンプルで高性能モデルを訓練することを目的としている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:23:10 GMT)
The Price of Adaptivity in Stochastic Convex Optimization [23.8] 非平滑凸最適化における適応性に対する不合理性を証明した。
我々は,不確実性による準最適性の乗算的増加を測定する「適応性の値」(PoA)を定義する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:42:03 GMT)
Adaptive Splitting of Reusable Temporal Monitors for Rare Traffic Violations [23.8] 2つの一般的な問題は、既存の手法を使って見積もりを生成するときに生じる。
本稿では,レアイベントサンプリング手法をオンライン仕様監視アルゴリズムにインターリーブすることで,両問題に対処する。
我々はモンテカルロよりも優れた推定値を生成し、より少ないシミュレーションで重要なサンプリングを行う。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:47:39 GMT)
Improving Acoustic Word Embeddings through Correspondence Training of
Self-supervised Speech Representations [23.6] 自己教師付き学習(SSL)に基づく音声モデルから得られた表現は、多くの下流タスクにおいてMFCCを上回っている。
HuBERTベースのCAEモデルは、すべての言語で単語識別の最良の結果を得る。
1つのソース言語でトレーニングし、ターゲット言語でテストする場合、MFCCベースのCAEモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:42:03 GMT)
Activating Wider Areas in Image Super-Resolution [23.5] Vision Mamba (Vim)は、対応する高解像度画像を再構成する最も関連性の高い、代表的な入力ピクセルを見つけることができる。
MMAは最先端のSISR法と比較して、競争力や性能に優れる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:29:58 GMT)
Is Context Helpful for Chat Translation Evaluation? [23.4] 我々は、機械翻訳チャットの品質を評価するために、既存の文レベル自動メトリクスのメタ評価を行う。
参照なしのメトリクスは、特に英語外設定で翻訳品質を評価する場合、参照ベースのメトリクスよりも遅れていることが分かりました。
大規模言語モデルを用いたバイリンガル文脈を用いた新しい評価指標 Context-MQM を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:49:50 GMT)
Rich Semantic Knowledge Enhanced Large Language Models for Few-shot
Chinese Spell Checking [23.4] 本稿では,RS-LLM (Rich Semantic based LLMs) というコンテキスト内学習手法を用いて,大規模言語モデル (LLM) を基礎モデルとして導入する。
少数の中国固有のリッチなセマンティック構造を導入することで、LCMは、数ショットのCSCタスクにおいてBERTベースのモデルよりも優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:55:43 GMT)
Automatic Interactive Evaluation for Large Language Models with State
Aware Patient Simulator [22.9] 大きな言語モデル(LLM)は、人間の相互作用において顕著な熟練性を示している。
本稿では,SAPS(State-Aware patient Simulator)とAIE(Automated Interactive Evaluation)フレームワークを紹介する。
AIEとSAPSは、多ターン医師-患者シミュレーションを通じてLCMを評価するための動的で現実的なプラットフォームを提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:04:58 GMT)
Towards Model-Agnostic Posterior Approximation for Fast and Accurate Variational Autoencoders [22.8] 我々は,真のモデルの後部の決定論的,モデルに依存しない後部近似(MAPA)を計算可能であることを示す。
我々は,(1)MAPAが真の後部傾向を捉えた低次元合成データに対する予備的な結果を示し,(2)MAPAに基づく推論は,ベースラインよりも少ない計算でより優れた密度推定を行う。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:16:21 GMT)
The Philosopher's Stone: Trojaning Plugins of Large Language Models [22.7] オープンソースのLarge Language Models (LLM) は、プロプライエタリなLLMに匹敵するパフォーマンスのため、最近人気を集めている。
ドメイン特化タスクを効率的にこなすために、低ランクアダプタを用いて高価なアクセラレーターを使わずにオープンソースのLLMを洗練することができる。
LLMを制御するために低ランクアダプタを利用できるかどうかはまだ分かっていない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:28:20 GMT)
Asymptotics of Random Feature Regression Beyond the Linear Scaling
Regime [22.7] 機械学習の最近の進歩は、トレーニングデータの近くにトレーニングされた過度にパラメータ化されたモデルを使用することによって達成されている。
モデル複雑性と一般化はパラメータ数$p$にどのように依存するか?
特に、RFRRは近似と一般化パワーの直感的なトレードオフを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:59:25 GMT)
DNGaussian: Optimizing Sparse-View 3D Gaussian Radiance Fields with
Global-Local Depth Normalization [22.6] 放射場は、スパース入力ビューから新しいビューを合成する際、顕著な性能を示してきたが、一般的な方法は、高いトレーニングコストと遅い推論速度に悩まされている。
本稿では,DNGaussianについて紹介する。DNGaussianは3次元ガウス放射場に基づく奥行き規則化フレームワークで,低コストでリアルタイムかつ高品質なノベルショットビュー合成を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:41:45 GMT)
Improving Implicit Regularization of SGD with Preconditioning for Least
Square Problems [22.5] 最小二乗問題に対する事前条件付き勾配降下(SGD)の一般化性能について検討した。
提案したプレコンディショニング行列は有限標本からのロバストな推定が可能なほど単純であることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:42:06 GMT)
A Sparsity Principle for Partially Observable Causal Representation
Learning [21.9] 因果表現学習は、知覚データから高レベルの因果変数を特定することを目的としている。
我々は、インスタンスに依存した部分的可観測パターンを持つデータセットから、未確認の観測から学ぶことに集中する。
提案手法は,推定された表現の間隔を小さくすることで,基礎となる因果変数を推定する2つの手法である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:40:49 GMT)
Detecting Errors in a Numerical Response via any Regression Model [21.7] ノイズは多くの数値データセットを悩ませ、データ中の記録された値が真の基礎となる値と一致しない可能性がある。
真の誤りと自然データゆらぎを区別する妥当性スコアを導入する。
また,実世界の数値誤差を伴う5つの回帰データセットを含む新しいエラー検出ベンチマークも提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:36:44 GMT)
StyleDyRF: Zero-shot 4D Style Transfer for Dynamic Neural Radiance
Fields [21.6] 既存の3Dスタイル転送の取り組みは、スタイル画像とニューラルレイディアンスフィールド(NeRF)の視覚的特徴を効果的に組み合わせることができる
本稿では,4次元特徴量を表す手法であるStyleDyRFを紹介する。
提案手法は、4Dフォトリアリスティックなスタイルの転送結果をゼロショット方式でレンダリングするだけでなく、視覚的品質と一貫性の点で既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:42:21 GMT)
Universal Neural-Cracking-Machines: Self-Configurable Password Models
from Auxiliary Data [21.3] ユニバーサルパスワードモデル(ユニバーサルパスワードモデル、Universal password model)は、ターゲットシステムに基づく推測戦略を適応させるパスワードモデルである。
これは、ユーザの補助情報、例えばメールアドレスをプロキシ信号として利用して、基盤となるパスワードの配布を予測する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:02:51 GMT)
Representing Molecules as Random Walks Over Interpretable Grammars [21.2] 複素分子を表現・推論するためのデータ効率・解釈可能なモデルを提案する。
設計空間上のランダムウォークという形で,新しい表現を提示する。
予測分子の性能, 効率, 合成性の観点から, 既存の手法に対する明確な優位性を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:19:06 GMT)
Benchmarking Large Language Models on Answering and Explaining
Challenging Medical Questions [21.2] JAMAクリニカルチャレンジとメドブルレットという2つの新しいデータセットを構築した。
JAMA 臨床チャレンジは、挑戦的な臨床ケースに基づく質問から成り、Medbullets は USMLE Step 2&3 スタイルの臨床質問から成り立っている。
各種のプロンプトを用いて2つのデータセット上で4つのLSMを評価する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:44:45 GMT)
NaturalVLM: Leveraging Fine-grained Natural Language for
Affordance-Guided Visual Manipulation [21.0] 多くの実世界のタスクは複雑な多段階推論を必要とする。
15個の異なる操作タスクからなるベンチマークであるNrVLMを導入する。
そこで本研究では,操作タスクをステップバイステップで完了させる新しい学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:12:16 GMT)
Simple and Scalable Strategies to Continually Pre-train Large Language
Models [20.9] 大規模言語モデル(LLM)は、数十億のトークンで定期的に事前訓練されるが、新しいデータが利用可能になると、プロセスを再開する。
学習率のリウォーミング、LR再計算、過去のデータのリプレイをシンプルかつスケーラブルに組み合わせることで、スクラッチから完全に再学習する性能に匹敵することを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:58:57 GMT)
Spatiotemporal Diffusion Model with Paired Sampling for Accelerated
Cardiac Cine MRI [20.9] 加速MRIにおける近年の深層学習再建は,空間的および時間的ぼかしに悩まされている。
ペアサンプリング方式は, 生成結果において, 人工雑音を大幅に低減する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:56:12 GMT)
Clinically Feasible Diffusion Reconstruction for Highly-Accelerated
Cardiac Cine MRI [20.9] 我々は,シネMRIの画質を向上させるために,臨床的に実現可能な拡散モデルに基づく再建パイプラインを開発することを目的とする。
マルチインマルチアウト拡散促進モデルと高速推論戦略を併用して, 再構成モデルと併用する手法を開発した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:51:01 GMT)
MonoOcc: Digging into Monocular Semantic Occupancy Prediction [20.8] 単眼セマンティック占領予測は2次元画像のみからシーンの完全な3次元形状と意味情報を推測することを目的としている。
既存の手法は、3Dシーンを復元するために、比較的限られた情報しか持たない複雑なカスケードフレームワークに依存している。
本手法は,SemanticKITTI Scene Completionベンチマークを用いて,最先端の性能を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:59:04 GMT)
Exploiting Structural Consistency of Chest Anatomy for Unsupervised
Anomaly Detection in Radiography Images [20.8] 簡易な空間認識メモリマトリックスによるX線画像からの異常検出(略してSimSID)を提案する。
トレーニング中、SimSIDは解剖学的構造を繰り返し発生する視覚パターンに分類することができ、推論では、テストイメージから異常を識別することができる。
我々のSimSIDは、ZhangLab、COVIDx、CheXpertベンチマークデータセット上の+8.0%、+5.0%、+9.9%のAUCスコアによる教師なし異常検出において、芸術の状態を超越している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:44:49 GMT)
Decoupled Federated Learning on Long-Tailed and Non-IID data with
Feature Statistics [20.8] 特徴統計量(DFL-FS)を用いた2段階分離型フェデレーション学習フレームワークを提案する。
最初の段階では、サーバは、マスキングされたローカル特徴統計クラスタリングによってクライアントのクラスカバレッジ分布を推定する。
第2段階では、DFL-FSは、グローバルな特徴統計に基づくフェデレーションされた特徴再生を使用して、長い尾を持つデータ分布へのモデルの適応性を高める。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:24:59 GMT)
Steering LLMs Towards Unbiased Responses: A Causality-Guided Debiasing
Framework [20.8] 大規模言語モデル(LLM)はバイアスや差別的な応答を容易に生成できる。
本稿では,人口統計情報とLCMのアウトプットの関連性に着目し,社会的偏見に着目した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:46:28 GMT)
CLIP-BEVFormer: Enhancing Multi-View Image-Based BEV Detector with Ground Truth Flow [20.6] CLIP-BEVFormerは,多視点画像由来のBEVバックボーンを接地真実情報フローで拡張する新しい手法である。
我々は、挑戦的なnuScenesデータセットに関する広範な実験を行い、SOTAに対して顕著で一貫した改善を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:21:03 GMT)
Knowledge Conflicts for LLMs: A Survey [20.5] 調査では、コンテキストメモリ、コンテキスト間、メモリ内コンフリクトの3つのカテゴリに焦点が当てられている。
これらの対立は、大規模言語モデルの信頼性と性能に大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:02:23 GMT)
ZipIt! Merging Models from Different Tasks without Training [20.2] ZipIt!」は、同じアーキテクチャの2つの任意のモデルをマージする一般的な方法である。
これら2つの変更が組み合わさって、以前の作業よりも20~60%改善されていることが分かりました。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:04:06 GMT)
Evaluating Large Language Models as Generative User Simulators for Conversational Recommendation [20.2] 本稿では,言語モデルが対話的推薦において人間の行動を正確にエミュレートできる程度を測定するための新しいプロトコルを提案する。
これらのタスクは、人間の行動から言語モデルの逸脱を効果的に明らかにし、モデル選択と促進戦略による逸脱を減らす方法についての洞察を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:16:21 GMT)
Class Incremental Learning via Likelihood Ratio Based Task Prediction [20.1] 新たな理論誘導アプローチは、タスクごとにタスク固有のモデルを、すべてのタスクに対して共有ネットワークでトレーニングすることである。
本稿では,従来のOOD検出器をタスクID予測に利用することは,追加情報を利用することができるため,最適ではないと主張している。
新手法をTPL (Task-id Prediction based on Likelihood Ratio) と呼ぶ。
強いCILベースラインを著しく上回り、破滅的な忘れがほとんどない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:24:28 GMT)
Online Continual Learning For Interactive Instruction Following Agents [20.1] このような学習シナリオは,ロボットエージェントが世界を探索し,知覚する上で,継続的に世界を学ぶことが求められているため,現実的ではない,と我々は主張する。
本研究では,新しい行動学習と新しい環境学習という,エンボディエージェントのための2つの連続学習環境を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:31:47 GMT)
Efficiently Computing Similarities to Private Datasets [20.0] 微分プライベートモデルトレーニングの多くの方法は、クエリポイント(公開データや合成データなど)とプライベートデータとの類似性を計算することに依存している。
類似関数$f$と大きな高次元プライベートデータセット$XサブセットmathbbRd$を与えられた場合、任意のクエリ$y$に対して、X f(x,y)$のsum_xを近似した差分プライベート(DP)データ構造を出力する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:19:19 GMT)
Flexible Distribution Alignment: Towards Long-tailed Semi-supervised
Learning with Proper Calibration [19.7] Longtailed semi-supervised learning (LTSSL)は、半教師付きアプリケーションのための実践的なシナリオである。
この問題は、ラベル付きとラベルなしのクラス分布の相違によってしばしば悪化する。
本稿では,新しい適応ロジット調整型損失フレームワークFlexDAを紹介する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:23:45 GMT)
Luminate: Structured Generation and Exploration of Design Space with Large Language Models for Human-AI Co-Creation [19.6] 現在のインタラクションパラダイムは不足しており、限られたアイデアの集合に対して、ユーザを迅速なコンバージェンスへと導くものだ、と私たちは主張する。
本研究では,ユーザがシームレスに探索し,評価し,多数の応答を合成できる設計空間の構造化を促進するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:50:00 GMT)
PFStorer: Personalized Face Restoration and Super-Resolution [19.5] 顔修復の最近の進歩は、高品質でライフスタイルのアウトプットを生み出すことに顕著な成果を上げている。
しかし、驚くべき結果は、モデルに必要なコンテキストが欠如しているため、人のアイデンティティに忠実でないことがしばしばあります。
提案手法では, 個人像を用いて復元モデルをパーソナライズし, 詳細な情報を保持しつつ, 個人像に対して調整した復元を行う。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:39:30 GMT)
Reverse Diffusion Monte Carlo [19.4] 逆拡散モンテカルロ(rdMC)と呼ばれる新しいモンテカルロサンプリングアルゴリズムを提案する。
rdMCはマルコフ連鎖モンテカルロ(MCMC)法とは異なる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:11:18 GMT)
SeCG: Semantic-Enhanced 3D Visual Grounding via Cross-modal Graph
Attention [19.2] 設計したメモリグラフアテンション層を用いたグラフネットワークに基づくセマンティック・エンハンスド・リレーショナル学習モデルを提案する。
本手法は,従来の言語に依存しないエンコーディングを,視覚解析におけるクロスモーダルエンコーディングに置き換える。
ReferIt3D と ScanRefer のベンチマーク実験の結果,提案手法は既存の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:11:04 GMT)
PET-SQL: A Prompt-enhanced Two-stage Text-to-SQL Framework with Cross-consistency [19.1] スパイダーベンチマークで新しいSOTA結果が得られ、実行精度は87.6%である。
提案手法は, 87.6%の精度で, スパイダーベンチマークで新しいSOTA結果が得られる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:32:41 GMT)
Towards Benchmarking and Evaluating Deepfake Detection [18.8] ディープフェイク検出は、操作されたビデオと非修正されたビデオの違いを分析することによって、操作されたメディアを自動的に認識する。
評価条件が研究間で矛盾しているため,既存の検出手法の音響ベンチマーク比較を行うことは困難である。
本研究の目的は,包括的かつ一貫したベンチマークを確立すること,反復可能な評価手順を開発すること,および検出手法の幅広い性能を測定することである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:07:52 GMT)
Ethos: Rectifying Language Models in Orthogonal Parameter Space [18.6] Ethosは、言語モデルを修正して、出力の毒性とバイアスを軽減し、プライバシリークを回避する。
エトスはタスクベクトルを再構成する際の一般的な有益な知識と望ましくない知識を区別する。
Ethosは、現在のタスク算術法と比較して、望ましくない知識を取り除き、全体のモデル性能を維持するのに効果的である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:25:30 GMT)
One-Shot Averaging for Distributed TD($λ$) Under Markov Sampling [18.4] 政策評価の一般的な手法であるTD($lambda$)の線形高速化は、$N$エージェントが政策の$N$倍の速度で評価できるという意味で達成できることを示す。
これは、エージェントがTD($lambda$)を実行し、Markovが独立してサンプリングし、最終ステップ後にのみ結果を平均する手順である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:37:16 GMT)
Continuous Object State Recognition for Cooking Robots Using Pre-Trained
Vision-Language Models and Black-box Optimization [18.4] 本稿では,ロボットを調理する際の食品の状態変化を音声言語で認識する手法を提案する。
各テキストの重み付けを調整することで、より正確で堅牢な連続状態認識を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:45:40 GMT)
Can Large Language Models Identify Authorship? [18.4] 大規模言語モデル(LLM)は、推論と問題解決に非常に優れた能力を示している。
本稿では,著者分析におけるLLMの包括的評価を行う。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:22:02 GMT)
SLCF-Net: Sequential LiDAR-Camera Fusion for Semantic Scene Completion using a 3D Recurrent U-Net [18.3] SLCF-Netは、LiDARとカメラデータを逐次融合するSemantic Scene Completionタスクの新しいアプローチである。
それは、RGB画像のシーケンスと疎LiDAR測定から、シーンの欠落した幾何学と意味を共同で推定する。
すべてのSSC測定値に優れ、時間的整合性を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:12:53 GMT)
Envision3D: One Image to 3D with Anchor Views Interpolation [18.3] 本研究では,1枚の画像から高品質な3Dコンテンツを効率よく生成する新しい手法であるEnvision3Dを提案する。
テクスチャと幾何学の観点から高品質な3Dコンテンツを生成することができ、従来の画像から3Dのベースライン法を超越している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:46:33 GMT)
$\mathbf{C}^2$Former: Calibrated and Complementary Transformer for
RGB-Infrared Object Detection [18.3] 本稿では,モダリティの誤校正や不正確な問題に対処するため,$mathrmC2$Formerと呼ばれる新しい校正・補足変換器を提案する。
mathrmC2$Formerは機能ドメインで機能するため、バックボーンネットワークを介して既存のRGB-IRオブジェクト検出器に組み込むことができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:57:24 GMT)
Learnable Community-Aware Transformer for Brain Connectome Analysis with
Token Clustering [18.2] 本稿では,共同コミュニティクラスタリングと分類のためのトークンクラスタリング脳トランスフォーマーモデル(texttTC-BrainTF$)を提案する。
我々の学習可能なコミュニティ対応モデルである $textttTC-BrainTF$ は自閉症スペクトラム障害(ASD)を識別し、性別を分類する精度を向上させることを実証した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:55:27 GMT)
LTGC: Long-tail Recognition via Leveraging LLMs-driven Generated Content [18.0] 尾の認識は、尾のカテゴリから良い表現を学習し、すべてのカテゴリで不均衡に対処する必要があるため、困難である。
そこで本研究では,生成コンテンツを利用した長期認識を実現するための,新たな生成および微調整フレームワークLTGCを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:04:13 GMT)
Representing Anatomical Trees by Denoising Diffusion of Implicit Neural Fields [17.9] 解剖学的木は臨床診断と治療計画において中心的な役割を果たす。
伝統的な木構造表現法は、医学的画像を用いて捉えられ、解像度、柔軟性、効率の制限による欠点を示す。
暗黙的神経表現(INR)を用いた解剖学的木表現の新しい手法を提案する。
解剖学的樹木の複雑な地形や地形を任意の解像度で正確に把握する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:43:24 GMT)
Unveiling the Secrets of Engaging Conversations: Factors that Keep Users
Hooked on Role-Playing Dialog Agents [17.8] ボットが果たす役割を具現化する程度は保持率に限られた影響を与え、各ターンの長さは保持率に大きく影響する。
本研究は,ロールプレイングモデルによるユーザエンゲージメントの重要な側面を明らかにし,ロールプレイング目的の大規模言語モデルの開発において,今後の改善に向けた貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:40:21 GMT)
PROMISE: Preconditioned Stochastic Optimization Methods by Incorporating Scalable Curvature Estimates [17.8] PROMISE ($textbfPr$econditioned $textbfO$ptimization $textbfM$ethods by $textbfI$ncorporating $textbfS$calable Curvature $textbfE$stimates)はスケッチベースの事前条件勾配アルゴリズムである。
PROMISEには、SVRG、SAGA、およびKatyushaのプレコンディション版が含まれている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:08:31 GMT)
OverleafCopilot: Empowering Academic Writing in Overleaf with Large Language Models [17.7] OverleafCopilotは、LLMとOverleafをシームレスに統合する最初のツールである。
PromptGeniusは、研究者が高品質な最新プロンプトを見つけ、共有するためのウェブサイトだ。
私たちの仕事は、学術的な筆記の実践に革命をもたらす可能性があると信じています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:52:31 GMT)
Towards Efficient Risk-Sensitive Policy Gradient: An Iteration Complexity Analysis [17.5] リスクに敏感なアルゴリズムは、リスクニュートラルなアルゴリズムに比べて、イテレーションの複雑さが向上するかどうかを検討する。
我々の理論的分析は、リスクに敏感なREINFORCEは収束に必要な反復回数を減らすことができることを示している。
シミュレーションの結果, リスク・ニュートラルなケースに比べて, 約半数のエピソードの後に, リスク・アバースのケースが収束し, より早く安定することが確認できた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:50:49 GMT)
Machine Unlearning: Taxonomy, Metrics, Applications, Challenges, and
Prospects [17.5] データユーザには、データを忘れる権利が与えられている。
機械学習(ML)の過程で、忘れられた権利は、ユーザーデータを削除するためにモデルプロバイダを必要とする。
機械学習は、業界と学界の両方からますます注目を集めている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:11:24 GMT)
REFRESH: Responsible and Efficient Feature Reselection Guided by SHAP Values [17.5] REFRESHは、いくつかの新しいモデルをトレーニングすることなく、モデルパフォーマンスに望ましい追加の制約を達成できるように、機能を再選択する手法である。
REFRESHの基盤となるアルゴリズムは、SHAP値と相関解析を用いて、モデルをトレーニングすることなくモデルの予測を近似できる新しい手法である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:06:43 GMT)
SemCity: Semantic Scene Generation with Triplane Diffusion [17.4] セムシティ」は現実世界の屋外環境におけるセマンティックシーン生成のための3次元拡散モデルである。
本研究では,三面体表現をシーン分布のプロキシ形式として利用し,拡散モデルを用いて学習する。
私たちは、シーン内のオブジェクトのシームレスな追加、削除、修正を容易にするトリプレーン操作を示します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:34:11 GMT)
Attack Deterministic Conditional Image Generative Models for Diverse and
Controllable Generation [17.0] 本稿では,多様な制御可能な画像生成のためのプラグイン投影勾配降下法(PGD)を提案する。
鍵となる考え方は、入力条件に微小摂動を加えることで、事前訓練された決定論的生成モデルを攻撃することである。
我々の研究は、低レベルの視覚タスクに敵攻撃を適用するための扉を開く。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:57:23 GMT)
Misinformation is not about Bad Facts: An Analysis of the Production and
Consumption of Fringe Content [17.0] コンセンサスに基づく「実際的正当」なコンテンツの利用を通じて,オンラインフロンティアイデオロギーが広まることが示唆された。
オーストラリアでは、中道派と極右派の両方の政治的傾向を持つニュース出版社が、情報完全性と品質のレベルを同等に含んでいることがわかった。
コミュニケーションスタイルに基づいて誤情報を共有する傾向のあるユーザも特定できます。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:10:07 GMT)
MolBind: Multimodal Alignment of Language, Molecules, and Proteins [17.0] MolBindは、コントラスト学習を通じて、複数のモダリティのためにエンコーダを訓練するフレームワークである。
MolBindは、幅広いタスクにわたって優れたゼロショット学習性能を示している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:38:42 GMT)
Detecting Hallucination and Coverage Errors in Retrieval Augmented Generation for Controversial Topics [16.9] 我々は,ウィキペディアのニュートラル・ポイント・オブ・ビュー(NPOV)の原則に基づいて,LLMベースのチャットボットで議論を呼んでいるトピックを扱うための戦略を探る。
決定論的検索システムを用いて、本手法のテキスト生成中に発生する一般的なLCM障害モード、すなわち幻覚とカバレッジエラーに焦点を当てる。
本手法は, 幻覚 (84.0%) とカバレッジエラー (85.2%) の検出において, 良好な結果が得られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:47:00 GMT)
Federated Data Model [16.6] 人工知能(AI)、特にディープラーニングでは、データ多様性とボリュームがモデル開発において重要な役割を果たす。
我々はFDM(Federated Data Model)と呼ばれる手法を開発し、様々な場所で堅牢なディープラーニングモデルを訓練した。
その結果,本手法でトレーニングしたモデルは,当初トレーニングしたデータと,他のサイトのデータの両方で良好に動作することがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:16:54 GMT)
Learning to Watermark LLM-generated Text via Reinforcement Learning [16.6] 誤用追跡のためのLCM出力の透かしについて検討する。
出力に信号を埋め込むモデルレベルの透かしを設計する。
強化学習に基づく協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:43:39 GMT)
PNeSM: Arbitrary 3D Scene Stylization via Prompt-Based Neural Style
Mapping [16.5] 3Dシーンスタイリング(3D scene stylization)とは、3Dシーンの外観を、所定のスタイルのイメージに合わせるように変換することである。
既存のいくつかの手法は、3Dシーンのスタイリングにおいて印象的な結果を得た。
任意のシーンに任意のスタイルを転送する新しい3Dシーンスタイリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:08:47 GMT)
UniTabE: A Universal Pretraining Protocol for Tabular Foundation Model
in Data Science [16.4] 本研究は,データサイエンスにおける表上での予測を容易にするために,事前学習方法論の能力を拡張することを目的とする。
テーブルを一様に処理するために設計されたUniTabEは、特定のテーブル構造によって課される制約を無視する。
プレトレーニングフェーズを実装するため,Kaggleプラットフォームから正確に収集した約13Bサンプルからなる拡張データセットをキュレートした。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:20:34 GMT)
iCONTRA: Toward Thematic Collection Design Via Interactive Concept
Transfer [16.4] 対話型Concept TRAnsferシステムであるiCONTRAを導入する。
iCONTRAは、経験豊富なデザイナーと初心者の両方が、創造的なデザインコンセプトを熱心に探求することを可能にする。
また、微調整モデルを必要としないゼロショット画像編集アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:48:39 GMT)
Neural reproducing kernel Banach spaces and representer theorems for
deep networks [16.3] ディープニューラルネットワークが適切な再生カーネルバナッハ空間を定義することを示す。
応用において一般的に用いられる有限アーキテクチャを正当化する代表者定理を導出する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:51:02 GMT)
HIMap: HybrId Representation Learning for End-to-end Vectorized HD Map
Construction [16.1] State-of-the-art法は主に正確な点座標を回帰する点レベルの表現学習に基づいている。
本稿では,HybrId フレームワーク HIMap を提案する。
我々は、大規模な実験を行い、nuScenesとArgoverse2データセットの両方で、従来手法より一貫して優れています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:51:23 GMT)
De-Confusing Pseudo-Labels in Source-Free Domain Adaptation [16.0] ソースフリードメイン適応(SFDA)は、ソースデータにアクセスすることなく、未ラベルのターゲットドメインにソーストレーニングされたモデルを適用することを目的としている。
本稿では,ドメイン適応設定における雑音分布に対処するための新しいノイズ学習手法を提案する。
SFDA法(SHOT, SHOT++, AaD)と組み合わせたアプローチの有効性を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:13:57 GMT)
Context-Aware Planning and Environment-Aware Memory for Instruction
Following Embodied Agents [15.9] 本稿では,CAPEAMによる行動行動の結果を一連の行動で考察する。
提案したCAPEAMのエージェントは,様々な測定値において最先端の性能を達成することを実証的に示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:34:31 GMT)
Sharp detection of the onset of Floquet heating using eigenstate
sensitivity [15.7] 十分に低い駆動周波数のカオスフロケ系は、熱力学限界における無限温度アンサンブルまで加熱することが知られている。
本研究では,Floquet固有状態の無限小変形に対する感度(感受性)を提案する。
加熱開始付近の低周波では,Floquet固有状態は摂動に最も敏感であることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:54:07 GMT)
DPOD: Domain-Specific Prompt Tuning for Multimodal Fake News Detection [15.6] 文脈外画像を用いたフェイクニュースが広まり、情報過負荷の時代における問題となっている。
ドメイン外データが、所望のドメインのコンテキスト外誤情報検出を改善するのに役立つかどうかを検討する。
DPOD (Domain-specific Prompt-tuning using Out-of-Domain data) と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:32:32 GMT)
Governing Through the Cloud: The Intermediary Role of Compute Providers
in AI Regulation [15.3] 計算プロバイダは、AI開発とデプロイメントに関連する法的義務と倫理的責任を持つべきだ、と我々は主張する。
コンピューティングプロバイダは,4つの重要な能力を通じて,規制エコシステムにおいて重要な役割を果たすことができます。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:08:16 GMT)
HeightFormer: Explicit Height Modeling without Extra Data for
Camera-only 3D Object Detection in Bird's Eye View [15.3] 視覚に基づくバードアイビュー(Bird's Eye View, BEV)の表現は、自律運転のための新たな知覚定式化である。
我々は、LiDARのような余分なデータを必要とせず、任意のカメラリグやタイプに適合できるBEV空間の高さを明示的にモデル化することを提案する。
自己再帰的手法で高さと不確実性をモデル化するHeightFormerを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:09:04 GMT)
RECIPE4U: Student-ChatGPT Interaction Dataset in EFL Writing Education [15.3] 本稿では、英語の212人の大学生を対象に、学期間実験から得られたデータセットRECIPE4Uについて紹介する。
研究期間中、ChatGPTと対話してエッセイを改訂する。RECIPE4Uには、会話ログ、学生の意図、学生の自己評価満足度、学生のエッセイ編集履歴など、これらの相互作用の包括的な記録が含まれている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:51:57 GMT)
Randomized Kaczmarz in Adversarial Distributed Setting [15.2] 本稿では,凸最適化問題に対して逆耐性を持つ反復的アプローチを提案する。
本手法は収束を保証し,逆分布に適応することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:11:20 GMT)
Model Will Tell: Training Membership Inference for Diffusion Models [15.2] トレーニングメンバーシップ推論(TMI)タスクは、ターゲットモデルのトレーニングプロセスで特定のサンプルが使用されているかどうかを判断することを目的としている。
本稿では,拡散モデル内における本質的な生成先行情報を活用することで,TMIタスクの新たな視点を探求する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:52:37 GMT)
Cultural evolution in populations of Large Language Models [15.0] 本研究では,人間の振る舞いを模倣する大規模言語モデルの能力を利用することで,このギャップに対処できる可能性が示唆された。
人工エージェントは、文化の進化にますます参加することが求められているため、機械生成文化の進化のダイナミクスをより深く理解することが不可欠である。
本稿では, LLMの人口の文化的進化をシミュレーションする枠組みを提案し, 文化的進化において重要な変数の操作を可能にする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:11:17 GMT)
MambaMorph: a Mamba-based Framework for Medical MR-CT Deformable
Registration [15.0] 我々は,新しい多モード変形可能な登録フレームワークであるMambaMorphを紹介する。
MambaMorphは、Mambaベースの登録モジュールと、きめ細かい、しかし単純な機能抽出器を使用している。
MambaMorphは,登録精度の観点から,現在最先端の学習ベース登録法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:40:07 GMT)
Terminal Embeddings in Sublinear Time [15.0] 我々は、$T$を前処理して、サブ線形時間における$qinmathbbRd$の端末埋め込み画像の計算をサポートする、ほぼ線形空間のデータ構造を得る方法を示す。
この研究の主な貢献は、端末の埋め込みを計算するための新しいデータ構造を提供することです。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:45:31 GMT)
Interactive Navigation in Environments with Traversable Obstacles Using
Large Language and Vision-Language Models [14.9] 本稿では,大規模言語と視覚言語を用いた対話型ナビゲーションフレームワークを提案する。
我々は、微調整なしで効果的な経路計画を行うためのアクション対応コストマップを作成する。
すべての実験結果から,提案フレームワークの有効性と多様な環境への適応性が確認された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:53:30 GMT)
Medical Multimodal-Multitask Foundation Model for Superior Chest CT
Performance [14.9] 患者管理にはマルチモーダルデータとのマルチタスクインタラクションが必要である。
第一種医療マルチモーダルマルチタスク基盤モデル(M3FM)を提案する。
M3FMは、肺がんスクリーニング、心臓疾患予測、その他のCT関連タスクに優れたボリュームCT画像撮影性能を実現している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:20:40 GMT)
LitCab: Lightweight Language Model Calibration over Short- and Long-form
Responses [14.8] 本稿では,入力テキストの表現とバイアス項の予測を行う単一線形層からなる軽量キャリブレーション機構LitCabを提案する。
評価のために、8つのテキスト生成タスクからなるベンチマークであるCaTを構築し、短いフレーズから段落までの応答をカバーする。
Llama2-7BでLitCabをテストし、すべてのタスクのキャリブレーションを改善し、平均ECEスコアを最大30%削減する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:11:57 GMT)
ARtVista: Gateway To Empower Anyone Into Artist [14.7] 本稿では,ARと生成AI技術を統合した新しいシステムARtVistaを提案する。
ARtVistaは、ユーザの抽象的なアイデアに沿った参照イメージを推奨し、ユーザが描くスケッチを生成する。
パイロット研究を行い、そのユーザビリティに対する肯定的なフィードバックを明らかにします。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:00:57 GMT)
CART: Caltech Aerial RGB-Thermal Dataset in the Wild [14.7] 本稿では,自然環境下での航空ロボットのためのRGB熱水性データセットについて紹介する。
私たちのデータセットは、川、湖、海岸線、砂漠、森林など、アメリカ大陸の様々な地形を捉えています。
熱的およびRGB-熱的セマンティックセグメンテーション、RGB-熱的画像変換、および視覚慣性オドメトリーのための新しい、挑戦的なベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:31:04 GMT)
Identity-aware Dual-constraint Network for Cloth-Changing Person
Re-identification [14.5] CC-ReID(CC-Changing Person Re-Identification)は、歩行者が着替えを行うより現実的な監視シナリオにおいて、対象者を正確に識別することを目的としている。
大きな進歩にもかかわらず、既存のCC-ReIDデータセットの限られた布質変化トレーニングサンプルは、モデルが布質非関連の特徴を適切に学習することを妨げている。
本稿では,CC-ReIDタスクのためのID-Aware Dual-Constraint Network (IDNet)を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:46:36 GMT)
Promises of Deep Kernel Learning for Control Synthesis [14.4] ディープラーニング(DKL)は、ニューラルネットワークの表現力とガウス過程の不確実性を組み合わせたものだ。
動的システムの制御にDKLを用いることが可能な,スケーラブルな抽象化ベースのフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:15:08 GMT)
Toward Open Vocabulary Aerial Object Detection with CLIP-Activated
Student-Teacher Learning [14.4] 本稿では,CLIP-activated students-Teacher Open-vocabulary Object DetectionフレームワークであるCastDetを提案する。
我々のアプローチは、新しいオブジェクトの提案だけでなく、分類も促進します。
実験の結果,CastDetはより優れた開語彙検出性能が得られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:42:38 GMT)
Which Modality should I use -- Text, Motif, or Image? : Understanding Graphs with Large Language Models [14.3] 本稿では,テキスト,画像,モチーフなどの多様性を持つグラフを符号化する新たな手法を提案する。
また、グラフ構造解析において、LLM(Large Language Models)を評価するための新しいベンチマークであるGraphTMIも提示されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:32:32 GMT)
MD-Dose: A Diffusion Model based on the Mamba for Radiotherapy Dose
Prediction [14.2] 胸部癌に対する放射線治療用線量分布予測のための新しい拡散モデルMD-Doseを導入する。
前処理では、MD-Doseは線量分布マップにガウスノイズを加え、純粋なノイズ画像を得る。
後向きのプロセスでは、MD-Doseはマンバに基づくノイズ予測器を使用してノイズを予測し、最終的に線量分布マップを出力する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:46:36 GMT)
Log Summarisation for Defect Evolution Analysis [14.1] エラーログに対するオンラインセマンティックベースのクラスタリング手法を提案する。
また、時間ログクラスタの性能を評価するための新しい指標も導入する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:18:46 GMT)
VIGFace: Virtual Identity Generation Model for Face Image Synthesis [13.8] 合成顔画像を生成する新しいフレームワークであるVIGFaceを提案する。
肖像画の権利を気にすることなく、仮想顔画像を作成することができる。
既存のイメージを組み込んだ効果的な拡張手法として機能する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:11:41 GMT)
Multiscale Low-Frequency Memory Network for Improved Feature Extraction
in Convolutional Neural Networks [13.8] 本稿では,Multiscale Low-Frequency Memory (MLFM) Networkを提案する。
MLFMは低周波情報を効率よく保存し、目標とするコンピュータビジョンタスクの性能を向上させる。
我々の研究は、既存のCNN基盤の上に構築され、コンピュータビジョンの今後の進歩の道を開く。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:48:41 GMT)
Robust COVID-19 Detection in CT Images with CLIP [13.8] 深層学習モデルは、特に新型コロナウイルス検出において、医療画像の課題に直面している。
凍結したCLIP画像エンコーダとトレーニング可能な多層認識(MLP)を活用して,これらの障害を克服するための最初の軽量検出器を提案する。
教師と学生のフレームワークを統合して、大量のラベルのないデータに便乗し、本質的なデータ制限にもかかわらず、我々のモデルは優れたパフォーマンスを達成できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:26:50 GMT)
Advancing Pose-Guided Image Synthesis with Progressive Conditional
Diffusion Models [13.8] 本稿では,ターゲット下の人物像とソースポーズのギャップを段階的に橋渡しするプログレッシブ条件拡散モデル(PCDM)を提案する。
定性的かつ定量的な結果は,難解なシナリオ下で提案したPCDMの一貫性と光現実性を示すものである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:32:06 GMT)
When Code Smells Meet ML: On the Lifecycle of ML-specific Code Smells in
ML-enabled Systems [13.7] 本研究の目的は、ML特有のコードの臭いとして知られる、特定の品質関連関心事の出現と進化を調査することである。
具体的には、実際のML対応システムにおいて、ML特有のコードの臭いを経験的に分析して研究する計画を提案する。
探索的研究を行い、ML対応システムの大規模なデータセットをマイニングし、約337のプロジェクトに関する400万件のコミットを分析します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:43:45 GMT)
IG-FIQA: Improving Face Image Quality Assessment through Intra-class
Variance Guidance robust to Inaccurate Pseudo-Labels [13.6] IG-FIQAは、FIQAトレーニングをガイドする新しいアプローチであり、これらの授業の有害な影響を軽減するために重みパラメータを導入する。
提案手法であるIG-FIQAは,様々なベンチマーク・データセットを用いて,新しいSOTA(State-of-the-art)性能を実現した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:15:43 GMT)
Contrastive Explanations of Centralized Multi-agent Optimization
Solutions [13.5] CMAoEは、対照的な説明を生成するドメインに依存しないアプローチである。
CMAoEは,大規模なマルチエージェント最適化問題に対して,コントラスト的な説明を生成可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:56:05 GMT)
Historical Astronomical Diagrams Decomposition in Geometric Primitives [13.4] 我々は、XII世紀からXVIII世紀にかけての様々な伝統から、303の天文図のユニークなデータセットを紹介した。
我々はDINO-DETR上に構築されたモデルを構築し、複数の幾何学的プリミティブの予測を可能にする。
提案手法は,複数のプリミティブに対して有意義なパラメトリゼーションを導入することにより,ラインに制限されたLETRベースラインを改良する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:20:25 GMT)
Resisting Backdoor Attacks in Federated Learning via Bidirectional
Elections and Individual Perspective [13.4] 既存のアプローチは、フェデレートラーニング(FL)におけるバックドア攻撃を防御する
スノーボール(Snowball)は、双方向選挙による新しいアンチバックドアFLフレームワークである。
我々は、Snowballと最先端の防御と、FLの5つの実世界のデータセットに対するバックドアアタックを比較した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:16:54 GMT)
Towards Unified Modeling for Positive and Negative Preferences in
Sign-Aware Recommendation [13.3] textbfLight textbfSigned textbfGraph Convolution Network for textbfRecommendation (textbfLSGRec)を提案する。
高次不均一相互作用における負の選好について、一階の負の選好は負のリンクによって捕捉される。
推奨結果は肯定的な選好に基づいて生成され、負の選好で最適化される。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:00:42 GMT)
Diffusion Models with Implicit Guidance for Medical Anomaly Detection [13.2] 組織再生のための時間的調和 (THOR) は, 病態の影響を受けない領域における健全な組織の整合性を維持することを目的としている。
相対的な評価では、THORは、脳MRIと手首X線における異常の検出とセグメンテーションにおいて、既存の拡散に基づく手法を超越している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:26:55 GMT)
Imitate the Good and Avoid the Bad: An Incremental Approach to Safe
Reinforcement Learning [13.1] 制約付きRLは強化学習における安全な行動を実施するためのフレームワークである。
制約付きRLを解くための最近の手法は、軌道に基づくコスト制約を代理問題に変換する。
トラジェクトリに基づくコスト制約を変更しず、代わりにグッドのトラジェクトリを模倣するアプローチを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:48:36 GMT)
Content-aware Masked Image Modeling Transformer for Stereo Image
Compression [13.0] 本稿では,CAMSICというステレオ画像圧縮フレームワークを提案する。
CAMSICは各画像を潜在表現に変換し、強力なデコーダフリートランスフォーマーエントロピーモデルを用いる。
実験により,本フレームワークは2つのステレオ画像データセット上で,最先端の速度歪み性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:12:57 GMT)
Digital Twin-assisted Reinforcement Learning for Resource-aware
Microservice Offloading in Edge Computing [13.0] 本稿では,深部強化学習(DRL)とディジタルツイン技術を活用した新しいマイクロサービスオフロードアルゴリズムDTDRLMOを紹介する。
具体的には、協調エッジコンピューティングのエッジノード負荷の変化とネットワーク条件をリアルタイムに予測し、適応するためにデジタルツイン技術を用いる。
このアプローチは効率的なオフロード計画の生成を可能にし、各マイクロサービスに最適なエッジノードを選択する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:44:36 GMT)
Low-Cost and Real-Time Industrial Human Action Recognitions Based on
Large-Scale Foundation Models [12.8] 各種LSFMと軽量手法を併用した大規模基礎モデル(LSFM)を用いたIHAR法を提案する。
大規模製造ラインの総合的な試験により, 提案手法は, 雇用コストの大幅な削減, 実時間性能の向上, 精度, 一般化能力の向上を実現した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:11:59 GMT)
Neural Network-Based Score Estimation in Diffusion Models: Optimization
and Generalization [12.8] 拡散モデルは、忠実さ、柔軟性、堅牢性を改善した高品質なサンプルを生成する際に、GANと競合する強力なツールとして登場した。
これらのモデルの主要な構成要素は、スコアマッチングを通じてスコア関数を学ぶことである。
様々なタスクにおいて経験的な成功にもかかわらず、勾配に基づくアルゴリズムが証明可能な精度でスコア関数を学習できるかどうかは不明である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:25:26 GMT)
Hierarchical Auto-Organizing System for Open-Ended Multi-Agent
Navigation [12.8] Minecraftの複雑な環境をナビゲートすることは、マルチエージェントシステムにとって大きな課題となる。
従来のアプローチは、エージェント間のコミュニケーションとタスクの分散を効率的に管理するのに苦労することが多い。
エージェントが目的を完全に理解するためには、マルチモーダル情報の処理と統合が不可欠である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:22:17 GMT)
ToPro: Token-Level Prompt Decomposition for Cross-Lingual Sequence
Labeling Tasks [12.7] ToProメソッドは入力文を1つのトークンに分解し、各トークンに1つのプロンプトテンプレートを適用する。
マルチリンガルNERおよびPOSタグ付けデータセットの実験により,ToProをベースとしたファインチューニングは,ゼロショットのクロスリンガル転送において,VanillaファインチューニングとPrompt-Tuningに優れることが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:45:02 GMT)
Learning Human-like Representations to Enable Learning Human Values [12.6] 人間とAIエージェントの表現的アライメントは価値アライメントを促進すると我々は主張する。
価値アライメントの一側面として倫理を重視し,さまざまな手法を用いてMLエージェントを訓練する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:37:55 GMT)
Bugs in Large Language Models Generated Code [12.6] コード用の大規模言語モデル(LLM)が最近注目を集めている。
人間書きのコードと同様、LLM生成コードはバグを起こしやすい。
本稿では,3つのLLMを用いて生成されたコードから収集した333個のバグのサンプルについて検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:12:01 GMT)
CoLiDE: Concomitant Linear DAG Estimation [12.4] 観測データから線形方程式への非巡回グラフ構造学習の問題に対処する。
本稿では,空間認識学習DAGのための新しい凸スコア関数を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:56:11 GMT)
Leveraging Compressed Frame Sizes For Ultra-Fast Video Classification [12.3] 動画をSportやMusic Videoといった別のカテゴリーに分類することは、マルチメディアの理解と検索に不可欠である。
従来の方法では、色、テクスチャ、動きといったピクセルレベルの特徴を抽出するためにビデオ圧縮が必要である。
本稿では,ビデオの圧縮後ビットストリームのみを解析して分類を行い,ビットストリーム復号化の必要性を解消する手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:35:13 GMT)
A Stochastic-Gradient-based Interior-Point Algorithm for Solving Smooth Bound-Constrained Optimization Problems [12.3] 提案アルゴリズムは、他のインテリアポイント法からの主観的特異な制約に基づいている。
提案アルゴリズムは,プロジェクション,ステップサイズ,シーケンスシーケンスのバランスを慎重に保ち,数値的および決定論的両方の設定において収束を保証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:34:31 GMT)
Regret Analysis of Policy Optimization over Submanifolds for Linearly
Constrained Online LQG [12.2] 制御器に与えられた線形制約を持つオンライン線形二次ガウス問題について検討する。
関数列の第1次および第2次情報に対する予測に基づいてオンラインコントローラを提供するオンライン楽観的ニュートン(OONM)を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:06:18 GMT)
From Weak to Strong Sound Event Labels using Adaptive Change-Point
Detection and Active Learning [12.1] 適応的変化点検出(A-CPD)に基づく音声録音セグメンテーション手法を提案する。
ラベルのない音声記録毎に,アノテーションを導くために使用する確率曲線の導出に予測モデルを用いる。
アノテーションの予算が限られている場合でも,高品質なラベルを導き出すことが可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:33:35 GMT)
The Runtime of Random Local Search on the Generalized Needle Problem [12.0] 我々は、C. Doerr と Krejca が与えられた上限を大幅に改善する期待ランタイムの正確な記述を導出する。
また、期待されるランタイムの推定についても記述する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:30:47 GMT)
Embedded Translations for Low-resource Automated Glossing [12.0] 我々は,線間グラフトテキストから抽出した組込み翻訳情報を用いて,ハードアテンショナル・ニューラル・モデルを強化する。
グロース出力を生成する文字レベルデコーダを提案する。
本結果は,システムの性能向上における翻訳情報の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:23:13 GMT)
MASA-TCN: Multi-anchor Space-aware Temporal Convolutional Neural
Networks for Continuous and Discrete EEG Emotion Recognition [11.9] 脳波の感情回帰と分類タスクのための新しいモデル MASA-TCN を提案する。
空間認識時間層は、TNがEEG電極間の空間関係から追加的に学習することを可能にする。
実験により、MASA-TCNは、脳波の感情回帰と分類タスクの両方において最先端の手法よりも高い結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:35:00 GMT)
Referential communication in heterogeneous communities of pre-trained
visual deep networks [11.8] 大規模なトレーニング済みの画像処理ニューラルネットワークは、自動運転車やロボットのような自律エージェントに組み込まれている。
提案手法は,対象対象物を参照するための共有プロトコルを,自己管理的に開発することができることを示す。
また,創発的プロトコルの特性を質的かつ定量的に検討し,オブジェクトの高レベルなセマンティックな特徴を捉えていることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:04:03 GMT)
Iterative Learning for Joint Image Denoising and Motion Artifact
Correction of 3D Brain MRI [11.8] 本稿では, 動きアーチファクトを用いたノイズの多いMRIの処理を反復学習により行うJDAC(Joint Image Denoising and Motion Artifact Correction)フレームワークを提案する。
まず,新しい雑音レベル推定手法を設計し,推定雑音分散に基づく特徴正規化条件付きU-Netバックボーンによる雑音を適応的に低減する。
アンチアーティファクトモデルは、運動補正プロセス中に脳解剖の整合性を維持するために設計された、新しい勾配に基づく損失関数を組み込んだ、運動アーティファクトの除去に別のU-Netを使用している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:18:55 GMT)
TimeDRL: Disentangled Representation Learning for Multivariate
Time-Series [11.8] TimeDRLは、アンタングル化されたデュアルレベル埋め込みを備えた一般的な時系列表現学習フレームワークである。
TimeDRLは、既存の表現学習アプローチを一貫して上回り、MSEでは58.02%、精度では1.48%の平均的な改善を実現している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:23:10 GMT)
A Generalized Framework with Adaptive Weighted Soft-Margin for
Imbalanced SVM Classification [11.8] ソフトマージン重み付きSVM(AW-WSVM)に対する適応重み関数を用いた新しい一般化フレームワークを提案する。
未拘束ソフトマージン支持ベクトルマシンに重量係数を導入し、各トレーニング前にサンプル重量を更新する。
実験結果から,提案手法は精度,基準値,G平均値において優れた性能を示した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:43:14 GMT)
TINA: Think, Interaction, and Action Framework for Zero-Shot Vision Language Navigation [11.6] 本稿では,Large Language Models(LLM)に基づく視覚言語ナビゲーション(VLN)エージェントを提案する。
環境認識におけるLLMの欠点を補うための思考・相互作用・行動の枠組みを提案する。
また,本手法は教師付き学習手法よりも優れ,ゼロショットナビゲーションの有効性を強調した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:22:39 GMT)
milliFlow: Scene Flow Estimation on mmWave Radar Point Cloud for Human Motion Sensing [11.5] mmWaveレーダーはプライバシーにやさしい機能のために人気を博している。
我々はmmWave点雲の相補的な動き情報としてシーンフローを推定する新しい深層学習手法である MilliFlow を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:54:08 GMT)
Do Language Models Care About Text Quality? Evaluating Web-Crawled
Corpora Across 11 Languages [11.5] 我々は、最も関連性の高いWebクローラコーパスのうち4つを、11の低リソースのヨーロッパ言語で比較した。
コーパスの品質には明らかな違いがみられ,MaCoCuとOSCARが最適結果を得た。
我々は,本実験において,Webcrawled corporaの品質は,LMのトレーニングにおいて重要な役割を果たさないと結論づけた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:56:33 GMT)
ActionDiffusion: An Action-aware Diffusion Model for Procedure Planning
in Instructional Videos [11.4] ActionDiffusionは、講義ビデオにおけるプロシージャ計画のための新しい拡散モデルである。
本手法は,行動間の時間的依存関係の学習と拡散過程における行動計画の認知を統一する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:54:04 GMT)
Structural perspective on constraint-based learning of Markov networks [11.4] すべての$n$-vertexグラフは、最大$nkappa$テストによって、条件付きサイズのセットを最大$kappa$で学習できることを証明します。
正の面において、有界木幅のすべてのグラフは、条件付きサイズの集合を少なくとも2kappa$で持つ多くのテストによって学習できることを証明している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:14:47 GMT)
A framework for conditional diffusion modelling with applications in motif scaffolding for protein design [11.3] バインダーや酵素設計などの多くのタンパク質設計用途では、高い精度で構造モチーフの足場を作る必要がある。
微分拡散過程に基づく生成的モデリングパラダイムがこのモチーフ足場問題に対処する主要な候補として浮上した。
本稿では,数学的によく理解されたDoobのh-transformに基づいて,既存の条件付きトレーニングプロトコルの新しいバリエーションを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:49:33 GMT)
OccFusion: A Straightforward and Effective Multi-Sensor Fusion Framework
for 3D Occupancy Prediction [11.3] 本稿では,3次元占有率を予測するための簡易かつ効率的なセンサ融合フレームワークであるOccFusionを紹介する。
ライダーやサラウンドビューレーダなどの付加センサの機能を統合することで、我々のフレームワークは占有率予測の精度と堅牢性を高めることができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:23:59 GMT)
Topology of Discrete Quantum Feedback Control [11.1] 真の動的トポロジカル位相のクラスは離散的な量子フィードバック制御によって実現できる。
トポロジカルフィードバック制御は、オープン量子系における非平衡トポロジカル位相の生成と制御のための多用途ツールを提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:46:19 GMT)
MatFuse: Controllable Material Generation with Diffusion Models [11.0] MatFuseは3D素材の作成と編集に拡散モデルの生成力を利用する統一的なアプローチである。
本手法は,カラーパレット,スケッチ,テキスト,画像など,複数のコンディショニング源を統合し,創造性を向上する。
複数の条件設定下でのMatFuseの有効性を実証し,材料編集の可能性を探る。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:31:21 GMT)
ShareYourReality: Investigating Haptic Feedback and Agency in Virtual
Avatar Co-embodiment [10.9] 2人のユーザーがバーチャルリアリティー(VR)で1つのアバターを共有できるバーチャルコエボディメント
このような経験において、共同行動中に共有動作制御の錯覚が壊れることがある。
我々は, 触覚が共身体的参加者間の非言語的協調を可能にする方法について検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:23:53 GMT)
Jellyfish: A Large Language Model for Data Preprocessing [10.9] 命令調整型ローカルLCMをユニバーサルDP問解器として検討する。
4つのDPタスクにまたがるデータセットの集合を選択する。
DP指導のためのデータセットであるJellyfishは,LLMのDP性能を効果的に向上することを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:02:57 GMT)
Point Cloud Compression via Constrained Optimal Transport [10.8] COT-PCCは最適輸送の余分な制約として圧縮された特徴を用いる。
元の点と再構成された点の間の分布変換を学習する。
COT-PCCはCDとPSNRの両方で最先端の手法より優れている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:36:24 GMT)
COSTREAM: Learned Cost Models for Operator Placement in Edge-Cloud
Environments [10.7] COSTREAMは、分散ストリーム処理システムの学習コストモデルである。
これは不均一なハードウェアにまたがる演算子の初期配置を見つけるのに使うことができる。
初期演算子配置の高精度なコスト見積と、見当たらない配置、クエリ、ハードウェアへの一般化が可能である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:56:10 GMT)
NTIRE 2023 Image Shadow Removal Challenge Technical Report: Team IIM_TTI [10.7] NTIRE2023シャドウ除去チャレンジの準備としてShadowFormerを分析し,議論する。
LPIPSでは0.196(19点中3点)、平均オピニオンスコア(MOS)では7.44(19点中3点)のスコアを得た。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:27:31 GMT)
CINA: Conditional Implicit Neural Atlas for Spatio-Temporal
Representation of Fetal Brains [10.5] CINAは胎児の脳の一般的な表現を学び、被検体固有の情報を潜伏コードにエンコードする。
トレーニング後、CINAは胎児の脳の組織確率マップを持つ忠実なアトラスを構築することができる。
CINAは、神経型脳と心室筋腫を有する病理性脳に対して優れた精度を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:02:42 GMT)
UniLiDAR: Bridge the domain gap among different LiDARs for continual
learning [10.1] 本稿では,異なるLiDARを扱える統一モデルを開発することを目的とする。
幾何的配向とセマンティックラベルマッピングを利用した占有予測パイプラインUniLiDARを提案する。
UniLiDARは、直接マージされたデータセットでトレーニングされたモデルと比較して、占有率予測のmIoUをそれぞれ15.7%、12.5%上昇させる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:23:05 GMT)
Implicit Regularization of Gradient Flow on One-Layer Softmax Attention [10.1] 一層ソフトマックスアテンションモデルを用いた分類問題に対する指数損失の勾配流について検討した。
データ上の分離性仮定では、勾配流が最小損失値を達成すると、鍵とクエリの重み行列の積の核ノルムを暗黙的に最小化する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:02:27 GMT)
P2LHAP:Wearable sensor-based human activity recognition, segmentation
and forecast through Patch-to-Label Seq2Seq Transformer [10.0] P2LHAPは、効率的なシングルタスクモデルで3つのタスクすべてに取り組む新しいフレームワークである。
センサデータストリームを"パッチ"のシーケンスに分割し、入力トークンとして機能し、パッチレベルのアクティビティラベルのシーケンスを出力する。
センサ信号チャネルに依存しないトランスフォーマーエンコーダとデコーダによるパッチレベルの表現を学習する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:23:50 GMT)
Actor-Critic Physics-informed Neural Lyapunov Control [9.9] 重要なパフォーマンス指標は、結果のアトラクション領域のサイズである。
本稿では,アトラクション領域の最大化を目的とした,安定化ニューラルネットワークコントローラのトレーニング手法を提案する。
いくつかの設計問題に対する数値実験により, 得られたアトラクション領域のサイズが一貫した, 顕著な改善が見られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:03:27 GMT)
Verifix: Post-Training Correction to Improve Label Noise Robustness with
Verified Samples [9.9] トレーニング後の補正は、初期訓練後のモデルパラメータを調整し、ラベルノイズを軽減する。
Verifixは、小さな検証済みのデータセットを利用して、1回の更新でモデルの重みを補正する新しいアルゴリズムである。
25%の合成汚職を伴うCIFARデータセットの実験では、平均して7.36%の一般化改善が見られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:32:08 GMT)
Cyclic Data Parallelism for Efficient Parallelism of Deep Neural Networks [9.9] Data ParallelismやZeRO-DPといった既存の手法では、データのマイクロバッチが並列に処理される。
本稿では,マイクロバッチの実行を同時からシーケンシャルにシフトさせる新しいパラダイムであるCyclic Data Parallelismを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:39:21 GMT)
Shielded Deep Reinforcement Learning for Complex Spacecraft Tasking [9.8] まず、宇宙船の作業や安全要件を形式化するための形式言語であるLTL(Linear Temporal Logic)について検討する。
次に、SDRLフレームワークにおける効果的なトレーニングのために、コセーフ仕様から報酬関数を自動で構築する方法を定義する。
いくつかの実験を通して、これらのシールドが異なるポリシーや報酬構造の柔軟性とどのように相互作用するかを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:03:47 GMT)
FSDR: A Novel Deep Learning-based Feature Selection Algorithm for Pseudo
Time-Series Data using Discrete Relaxation [9.8] 深層学習に基づく特徴選択アルゴリズム:離散緩和(FSDR)による特徴選択
FSDRは、既存のDLベースまたは従来のメソッドの範囲を超えて、多数の特徴次元を収容することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:37:52 GMT)
STMPL: Human Soft-Tissue Simulation [9.8] 人体形状と軟組織の統一表現をデータ駆動型非剛性変形シミュレータを用いて提案する。
提案手法はリアルタイムに高精度な推論を実現する。
実験の結果,本手法は軟組織層の可塑性変形を未確認シナリオにおいても達成できることが判明した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:49:40 GMT)
Boosting Disfluency Detection with Large Language Model as Disfluency
Generator [9.7] 本稿では,拡散検出のための軽量なデータ拡張手法を提案する。
拡張データとして,大言語モデル(LLM)を用いて不自由な文を生成する。
文の質を向上させるために不確実性を考慮したデータフィルタリング手法を適用する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:14:33 GMT)
Unsupervised Learning of Hybrid Latent Dynamics: A Learn-to-Identify
Framework [9.6] 現代の応用では、高次元時系列からの潜在力学の教師なし学習がますます求められている。
本稿では、モデル化されているデータに特異的な物理誘導バイアスの使用と、その識別に使用されるデータから予測対象を分離する学習・識別戦略について検討する。
我々はこれら2つの戦略をハイブリッド潜在力学(Meta-HyLaD)の教師なしメタラーニングのための新しいフレームワークに組み合わせる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:33:57 GMT)
AutoDev: Automated AI-Driven Development [9.6] AutoDevは完全に自動化されたAI駆動ソフトウェア開発フレームワークである。
ユーザはAutoDevの自律AIエージェントに割り当てられる複雑なソフトウェアエンジニアリングの目標を定義することができる。
AutoDevは、Dockerコンテナ内のすべての操作を集約することで、セキュアな開発環境を確立する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:12:03 GMT)
Say Anything with Any Style [9.5] Anything withAny Styleは、学習したスタイルのコードブックで生成モデルを介して、個別のスタイル表現をクエリします。
提案手法は, リップ同期とスタイル表現の両方の観点から, 最先端の手法を超越した手法である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:37:12 GMT)
Data-oriented Dynamic Fine-tuning Parameter Selection Strategy for FISH
Mask based Efficient Fine-tuning [9.4] FISH Maskのサンプルパラメータ対の最適設定を探索するIRDアルゴリズムを提案する。
GLUEベンチマークを用いて提案手法の有効性と合理性を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:50:23 GMT)
Non-Hermitian sensing in the absence of exceptional points [9.3] 例外点の欠如による普遍的非エルミート感覚を実験的に実証した。
このスキームは、非エルミートプローブの内在感度を弱い外部場に利用し、非ハーミティティーの直接的な結果と解釈できる。
我々の実験は、オープンシステムのユニークな特徴を活用することを目的とした既存の取り組みを補完し、例外的なポイントを伴わずに強化されたセンシングの道を開く。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:32:23 GMT)
Translating between SQL Dialects for Cloud Migration [9.3] データベースのオンライン移行の難しさを考察する。
マイグレーションを複雑にするさまざまなSQL方言があります。
AWSやAzureのような共通クラウドが提供するツールは、方言間の翻訳を支援する。
しかし、これらのツールはコードの100%の翻訳には成功しない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:38:39 GMT)
FOCIL: Finetune-and-Freeze for Online Class Incremental Learning by Training Randomly Pruned Sparse Experts [9.3] オンライン連続学習環境におけるクラスインクリメンタルラーニング(CIL)は、トレーニングに1回だけのデータポイントを使用して、データストリームから一連の新しいクラスに関する知識を取得しようとしている。
現在のオンラインCILアプローチでは、以前のデータのサブセットを格納しているため、メモリと計算の両方のオーバーヘッドコストとプライバシの問題が発生する。
FOCILと呼ばれる新しいオンラインCILアプローチを提案し、各タスクに対してランダムに切断されたスパースサブネットワークをトレーニングすることにより、メインアーキテクチャを継続的に微調整する。
FOCILはまた、タスク毎のスパーシリティレベルと学習率を適応的に決定し、(ほとんど)ゼロを忘れることを保証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:51:12 GMT)
Tastle: Distract Large Language Models for Automatic Jailbreak Attack [9.1] 大規模言語モデル(LLM)の自動レッドチーム化のためのブラックボックスジェイルブレイクフレームワークを提案する。
我々のフレームワークは、有効性、スケーラビリティ、転送性において優れている。
また,攻撃に対する既存のジェイルブレイク防御手法の有効性についても検討した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:16:43 GMT)
Efficient Combinatorial Optimization via Heat Diffusion [9.1] 組合せ最適化問題は広く存在するが、本質的には離散的な性質のため困難である。
我々は,熱拡散を通じて解法に情報を積極的に伝播させることに重点を置いている。
私たちは、最も困難で広く認識されている最適化の範囲で優れたパフォーマンスを示します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:55:34 GMT)
A Parallel Beam Splitting Based on Gradient Metasurface: Preparation and
Fusion of Quantum Entanglement [9.1] グラディエント準曲面は古典光学や量子光学において偏光ビーム分割(BS)に広く用いられている。
本研究では,BSプロセスの並列化を可能とし,連続的に結合されたビームスプリッタとして機能することが実証された。
準曲面による並列BSの原理は、マイクロ/ナノスケールでの量子状態を操作するための多用途な方法を開く。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:24:26 GMT)
The Garden of Forking Paths: Observing Dynamic Parameters Distribution
in Large Language Models [9.0] モデルパラメータの統計分布の時間的進化を考えることで、モデルの品質を理解するのに役立つことを提案する。
重量分散効果の背景にある要因を実証的に示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:42:32 GMT)
A Comprehensive Study of Gender Bias in Chemical Named Entity
Recognition Models [9.0] 本稿では, 化学NERシステムにおけるジェンダー関連性能格差について検討する。
合成データは、女性関連の名前がしばしば化学物質として誤分類されることを示唆している。
多くのシステムは、出生制御のような避妊薬を検出できない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:41:14 GMT)
TeaMs-RL: Teaching LLMs to Teach Themselves Better Instructions via
Reinforcement Learning [9.0] 大きな言語モデル(LLM)は、人間のアノテーションに大きく依存することによる課題に直面することが多い。
この作業では、強化学習(RL:Reinforcement Learning)へと方向転換します。
我々はRLを用いて、微調整だけで十分である基礎的な命令データセットを直接生成する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:57:57 GMT)
3DFIRES: Few Image 3D REconstruction for Scenes with Hidden Surface [8.8] 3DFIRESは、ポーズ画像からシーンレベルの3D再構成を行う新しいシステムである。
単一視点再構成法の有効性を1つの入力で示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:59:50 GMT)
Emergence of Social Norms in Large Language Model-based Agent Societies [8.7] 本稿では,大規模言語モデルに基づくエージェントの集団内での社会的規範の出現を促進するための,最初の生成エージェントアーキテクチャを提案する。
私たちのアーキテクチャは、創造と表現、スプレッド、評価、コンプライアンスの4つのモジュールで構成されています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:08:10 GMT)
Predictive Clustering of Vessel Behavior Based on Hierarchical Trajectory Representation [8.7] 階層型容器挙動(PC-HiV)の予測クラスタリング
PC-HiVはまず階層表現を用いて全ての軌道を行動列に変換する。
そして、その表現に基づいて、シーケンスの各タイムスタンプで進化を予測する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:05:02 GMT)
Skipformer: A Skip-and-Recover Strategy for Efficient Speech Recognition [8.5] コンフォーマーに基づくアテンションモデルは、音声認識タスクの事実上のバックボーンモデルとなっている。
本研究では,Skipformer という名前の "Skip-and-Recover" Conformer アーキテクチャを提案する。
本モデルでは,Aishell-1の入力シーケンス長を31倍,Librispeech corpusの22倍に短縮する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:20:45 GMT)
Autoregressive Score Generation for Multi-trait Essay Scoring [8.5] 自動エッセイスコア(AES)におけるマルチトレイスコア(ArTS)の自動回帰予測を提案する。
先行回帰法や分類法とは異なり、AESをスコア生成タスクとして再定義し、単一のモデルで複数のスコアを予測する。
実験の結果、ArTSの有効性が証明され、プロンプトと形質の両方で平均5%以上の改善が見られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:34:53 GMT)
Research on the Application of Deep Learning-based BERT Model in
Sentiment Analysis [8.5] 本稿では、感情分析における深層学習技術、特にBERTモデルの適用について検討する。
感情分析におけるBERTモデルの応用効果と最適化戦略を明らかにする。
実験結果から, BERTモデルは感情分析タスクにおいて頑健な性能を示し, 微調整後の顕著な改善が見られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:31:26 GMT)
Multi-Objective Optimization Using Adaptive Distributed Reinforcement Learning [8.5] 本稿では,多目的・マルチエージェント強化学習(MARL)アルゴリズムを提案する。
我々はエッジクラウドコンピューティングを用いたITS環境でアルゴリズムをテストする。
また,本アルゴリズムは,モジュール化および非同期オンライントレーニング手法により,様々な実用上の問題にも対処する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:05:16 GMT)
Large Language Models are Contrastive Reasoners [8.4] コントラスト的なプロンプトが,複雑な推論を行うための大規模言語モデルの能力を大幅に向上させることを示す。
2つの大きな言語モデルの実験では、ゼロショットの対照的なプロンプトが算術、コモンセンス、シンボリック推論タスクの性能を向上させることが示されている。
本手法は,ほとんどの算術的・常識的推論タスクにおいて,ゼロショットのCoTや少数ショットのCoTを超えるだけでなく,既存のプロンプトメソッドとシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:15:05 GMT)
Transparent AI Disclosure Obligations: Who, What, When, Where, Why, How [8.3] 本稿では,第52条の開示義務に基づく重要な質問を導出するための参加的アプローチを提案する。
参加者が第52条の関連する条項を5W1Hフレームワークを用いて分解するワークショップを2回実施する。
我々は5つのテーマと18のサブテーマにまとめられた149の質問をコントリビュートする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:40:33 GMT)
Bayesian Analysis for Over-parameterized Linear Model without Sparsity [8.2] 本研究では,データ共分散行列の固有ベクトルに依存する事前分布を用いたベイズ的手法を提案する。
また、導出した後続推定の収縮率も提供し、後続分布のガウス近似を計算した。
これらの結果は,データスペクトルを処理し,非スパースな高次元パラメータを推定できるベイズ的手法が実現可能であることを示唆している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:29:18 GMT)
Weak Collocation Regression for Inferring Stochastic Dynamics with
L\'{e}vy Noise [8.2] 本稿では,L'evyノイズを伴う力学を抽出するためのFokker-Planck(FP)方程式の弱い形式を提案する。
本手法は,多次元問題においても混合雑音を同時に識別することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:54:38 GMT)
TILDE-Q: A Transformation Invariant Loss Function for Time-Series
Forecasting [8.1] 時系列予測は、エネルギー、天気、交通、経済など、さまざまな領域における現実世界の問題に対処することができる。
時系列予測はよく研究されている分野であり、シーケンシャルデータの急激な変化などの複雑な時間的パターンを予測することは、現在のモデルでは依然として課題となっている。
本稿では, 振幅および位相歪みだけでなく, 時系列列の形状をモデルで捉えることができる, TILDEQ と呼ばれる新しいコンパクトな損失関数を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:31:24 GMT)
Optical-Cavity Manipulation Strategies of Conical Intersections Mediated
Singlet Fission Systems [8.0] 偏光円錐円錐-断面駆動一重項フィッション(SF)材料のシミュレーションと工学に関する理論的展望を提供する。
ルブレインを例として、数値的精度のDavydov-Ansatz法を適用し、システムの動的および分光的応答を導出する。
我々は、この分野における未解決の問題と課題の概要を述べ、今後の研究線の開発についての見解を共有します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:44:30 GMT)
Kernel Alignment for Unsupervised Feature Selection via Matrix Factorization [8.0] 教師なしの特徴選択は、いわゆる次元の呪いを和らげるために有効であることが証明されている。
多くの既存行列分解に基づく教師なし特徴選択法は、サブスペース学習に基づいて構築されている。
本稿では,カーネル関数とカーネルアライメントを統合したモデルを構築する。
これにより、線形および非線形の類似情報を学習し、最適なカーネルを自動的に生成することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:35:44 GMT)
Vector Quantization for Deep-Learning-Based CSI Feedback in Massive MIMO
Systems [7.9] 本稿では,大規模マルチインプットマルチアウトプット(MIMO)システムのための,有限レート深層学習(DL)に基づくチャネル状態情報(CSI)フィードバック手法を提案する。
提案手法は,ベクトル量子化変分オートエンコーダ(VQ-VAE)フレームワークに基づく潜在ベクトルの有限ビット表現を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:29:29 GMT)
FocusMAE: Gallbladder Cancer Detection from Ultrasound Videos with Focused Masked Autoencoders [7.8] 超音波ソノグラフィー(US)画像を利用したSOTA法は,変換的アプローチの必要性を強調しつつ,限定的な一般化を示している。
本研究では,高情報領域からのマスキングトークンの選択を体系的にバイアスし,より洗練された悪性度表現を育成するFocusMAEという新しい設計を提案する。
我々は,現在の画像ベースSOTA-RadFormerで84%,ビデオベースSOTA-AdaMAEで94.7%,GBC検出問題で96.4%の最先端(SOTA)精度を報告した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:57:04 GMT)
(Beyond) Reasonable Doubt: Challenges that Public Defenders Face in Scrutinizing AI in Court [7.7] 我々は,公務員が法廷でどのようにAIを精査するかを研究することによって,実際にAIシステムに挑戦する努力を研究する。
我々は,米国公共防衛コミュニティの17人のインタビューから得られた知見を報告する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:19:46 GMT)
SpeechColab Leaderboard: An Open-Source Platform for Automatic Speech
Recognition Evaluation [7.6] SpeechColab Leaderboardは、ASR評価用に設計された汎用オープンソースプラットフォームである。
我々は、ASRシステムにおける最先端のパノラマについて、包括的なベンチマークを報告した。
スコアリングパイプラインにおける異なるニュアンスが最終的なベンチマーク結果にどのように影響するかを定量化する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:41:53 GMT)
Retrieval Helps or Hurts? A Deeper Dive into the Efficacy of Retrieval Augmentation to Language Models [7.5] 大規模言語モデル(LM)における実体と関係の組合せの効果について検討する。
多様なLMと検索器を用いた実験により,検索がファクト中心の人気の観点から常にLMを向上しないことが明らかとなった。
適応型検索システムを用いて,より微細な測定値と洞察値の有効性を実証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:09:46 GMT)
DeepCSHAP: Utilizing Shapley Values to Explain Deep Complex-Valued
Neural Networks [7.5] ディープニューラルネットワークは、アカデミーや企業や公共のアプリケーションで広く使われている。
アウトプットを説明する能力は、安全上の理由だけでなく、応募者の受け入れにも不可欠である。
複素数値ニューラルネットワークでの使用に適した4つの勾配に基づく説明法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:26:43 GMT)
Caformer: Rethinking Time Series Analysis from Causal Perspective [7.4] 本稿では,因果的観点からの時系列解析のためのCaformerという新しいフレームワークを紹介する。
本フレームワークは,動的学習,環境学習,依存学習という3つのコンポーネントから構成される。
我々のCaformerは5つの主流時系列分析タスクで一貫した最先端性能を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:28:02 GMT)
SUQL: Conversational Search over Structured and Unstructured Data with
Large Language Models [7.3] 本稿では、SUQLと呼ばれる言語を用いて、大規模知識コーパスのためのハイブリッドデータアクセスの完全な汎用性をサポートする最初の対話エージェントを提案する。
線形化に基づくベースラインの63.4%とは対照的に,SUQLに基づく会話エージェントでは,すべてのユーザの要求を満たすエンティティが90.3%であることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:07:02 GMT)
Cross-Modal Learning of Housing Quality in Amsterdam [7.3] アムステルダムの住宅品質を地上および空中画像から認識するためのデータとモデルをテストする。
地上レベルの画像については、Google StreetView(GSV)とFlickrイメージを比較します。
以上の結果から,GSVは空中画像のみを用いた場合よりも約30%高い精度で構築品質を予測できることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:11:58 GMT)
Inverse Design of Vitrimeric Polymers by Molecular Dynamics and
Generative Modeling [7.3] ビトリマーは、自己修復能力を持つ持続可能なポリマーの新しいクラスである。
私たちは100万という最初のビトリマーデータセットを構築し、8,424のTgを計算します。
所望のTgを用いた新規硝子体発見のためのフレームワークの精度と効率性を実証した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:04:36 GMT)
ChatEDA: A Large Language Model Powered Autonomous Agent for EDA [7.2] 本稿では,大規模な言語モデルであるAutoMageによって強化されたEDAのための自律エージェントであるChatEDAを紹介する。
ChatEDAは、タスク計画、スクリプト生成、タスク実行を効果的に管理することで、登録-転送レベル(RTL)からグラフデータシステムバージョンII(GDSII)への設計フローを合理化する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:05:52 GMT)
Generalizable Two-Branch Framework for Image Class-Incremental Learning [7.2] ディープニューラルネットワークは、新しい知識を学ぶ際に、これまで学んだ知識を忘れることが多い。
本稿では,既存のCL手法をさらに強化するために,新しい2分岐連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:11:18 GMT)
A non-asymptotic theory of Kernel Ridge Regression: deterministic equivalents, test error, and GCV estimator [7.2] カーネルリッジ回帰を用いた未知のターゲット関数$f_*$の学習を検討する。
KRRのテスト誤差に対する非漸近的決定論的近似を確立した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:12:03 GMT)
When can we Approximate Wide Contrastive Models with Neural Tangent
Kernels and Principal Component Analysis? [6.9] 訓練されたコントラストモデルが実際にカーネルメソッドやPCAに対応するかどうかは不明である。
ニューラルネットワークがニューラル・タンジェント・カーネル(NTK)マシンと等価であることは、教師付き設定でよく知られている。
NTKのコンバージェンス結果のコンバージェンスを比較検討し,ニュアンス画像を提示する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:25:55 GMT)
Unification of spatiotemporal quantum formalisms: mapping between
process and pseudo-density matrices via multiple-time states [6.7] 量子状態を定義するための3つの異なるアプローチ、すなわち擬密度行列(PDM)、プロセス行列、多重時間状態アプローチの関係について考察する。
研究により、二分二状態は二分二過程行列の統計を再現できることが示されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:54:39 GMT)
MGIC: A Multi-Label Gradient Inversion Attack based on Canny Edge
Detection on Federated Learning [6.7] 本稿では,多ラベルデータセットと単一ラベルデータセットの両方において,キャニーエッジ検出(MGIC)に基づく新たな勾配インバージョン戦略を提案する。
提案手法は、最も広く使われているものよりも視覚的逆画像結果の方が優れており、ImageNetデータセットの78%以上の時間的コストを節約できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:34:49 GMT)
Koopman Ensembles for Probabilistic Time Series Forecasting [6.7] 独立に訓練されたモデルのアンサンブルは極めて過信であり、メンバーに高いモデル間分散による予測を明示的に促す訓練基準を用いることで、アンサンブルの不確実性を大幅に改善することを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:57:42 GMT)
TSFool: Crafting Highly-Imperceptible Adversarial Time Series through
Multi-Objective Attack [6.7] TSFoolと呼ばれる効率的な手法を提案する。
中心となる考え方は、「カモフラージュ係数」(Camouflage Coefficient)と呼ばれる新しい大域的な最適化目標であり、クラス分布から反対サンプルの非受容性を捉えるものである。
11のUCRデータセットとUEAデータセットの実験では、TSFoolは6つのホワイトボックスと3つのブラックボックスベンチマークアタックを著しく上回っている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:50:44 GMT)
Environment-Induced Information Scrambling Transition with Charge
Conservations [6.7] 一般閉量子系では、作用素の複雑さはハイゼンベルク方程式によって支配される時間進化の下で増加する。
システムが外部環境と相互作用する場合、システム環境の結合によりオペレーターはシステムから脱出することができる。
この遷移は、もともとマヨラナ・フェルミオン・システムで提案された環境誘起情報スクランブル・トランジションとして知られている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:36:53 GMT)
Image Super-resolution Reconstruction Network based on Enhanced Swin
Transformer via Alternating Aggregation of Local-Global Features [6.6] 本稿では,局所的な特徴を交互に集約するSwin Transformerモジュールを提案する。
実験の結果,提案したネットワークは,他の最先端の超解像ネットワークよりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:28:28 GMT)
BG-HGNN: Toward Scalable and Efficient Heterogeneous Graph Neural
Network [6.6] 不均一グラフニューラルネットワーク(HGNN)は、異種グラフ用に設計された有望なニューラルモデルクラスである。
既存のHGNNは、様々な関係をモデル化するために異なるパラメータ空間を使用する。
本稿では,Blend&Grind-HGNNについて紹介する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:03:40 GMT)
HAIFIT: Human-Centered AI for Fashion Image Translation [6.6] 本稿では,スケッチを高忠実なライフスタイルの衣料品画像に変換する新しいアプローチであるHAIFITを紹介する。
本手法は, ファッションデザインに欠かせない, 独特のスタイルの保存に優れ, 細部が複雑である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:06:07 GMT)
ConR: Contrastive Regularizer for Deep Imbalanced Regression [6.5] ConRは、グローバルおよびローカルなラベル類似性を特徴空間でモデル化する対照的な正規化器である。
その結果,ConRは4つの大規模深層不均衡回帰ベンチマークにおける最先端手法の性能を著しく向上させることを示した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:10:48 GMT)
WsiCaption: Multiple Instance Generation of Pathology Reports for
Gigapixel Whole-Slide Images [6.3] スライド画像全体から病理報告を生成する方法について検討する。
私たちは、最大のWSIテキストデータセット(TCGA-PathoText)をキュレートしました。
本稿では,ギガピクセルWSIの病態レポートを生成するマルチインスタンス生成モデル(MI-Gen)を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:31:30 GMT)
Learning How to Strategically Disclose Information [6.3] 送信者が未知のタイプの受信機と対話する情報設計のオンライン版を考える。
我々は、$mathcalO(sqrtT)$ regretが完全な情報フィードバックで達成可能であることを示す。
また,一般凸ユーティリティ関数に対して$mathcalO(sqrtT)$ regretを送信者が達成できる新しいパラメトリゼーションを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:44:16 GMT)
Diffusion-based Iterative Counterfactual Explanations for Fetal
Ultrasound Image Quality Assessment [6.2] 拡散に基づく反現実的説明可能なAIを用いて、低品質の非標準平面から現実的な高品質の標準平面を生成する。
このことは、視覚的フィードバックを提供することによる臨床医の訓練の強化と、画質の向上、そして下流の診断とモニタリングの両立を将来の約束として示している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:04:56 GMT)
Naming, Describing, and Quantifying Visual Objects in Humans and LLMs [6.1] 視覚・言語大言語モデル(VLLM)を3つのカテゴリ(名詞・属性・量化子)で評価する。
以上の結果から,VLLMsがヒトの命名嗜好を捉える能力を示す証拠が混在していることが判明した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:26:26 GMT)
Wet TinyML: Chemical Neural Network Using Gene Regulation and Cell
Plasticity [6.0] Wet TinyMLは、遺伝子制御ネットワークに基づく化学ベースのニューラルネットワークの一種である。
GRNNは、アプリケーションベースの検索プロセスを利用することで、従来の計算に使用できる。
本研究は, 細胞可塑性の誘導により, 動的システムに適合する数学的回帰進化を抽出できることを実証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:00:18 GMT)
FogGuard: guarding YOLO against fog using perceptual loss [5.9] FogGuard(フォグガード)は、霧の天候によって引き起こされる課題に対処するために設計された、霧を意識した物体検出ネットワークである。
FogGuardは、RTTSデータセットで57.78%のYOLOv3に対して69.43%のmAPを達成した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:13:25 GMT)
Consistent Prompting for Rehearsal-Free Continual Learning [5.8] 継続的な学習は、古い知識を忘れずに、モデルが絶えず変化する環境やデータストリームに自律的に適応することを可能にする。
既存のプロンプトベースの手法は、トレーニングとテストの間に不整合であり、その効果を制限している。
より整合性のあるトレーニングとテストのための新しいプロンプトベースの手法であるConsistent Prompting(CPrompt)を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:24:09 GMT)
The Effect of Different Optimization Strategies to Physics-Constrained
Deep Learning for Soil Moisture Estimation [5.8] 水輸送と水感知信号に関する物理に基づく原理を統合するために,物理制約付き深層学習(P-DL)フレームワークを提案する。
実験的な収束関数Adamsは、ミニバッチとフルバッチのトレーニングの両方において、他の最適化手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:32:30 GMT)
An Image Enhancement Method for Improving Small Intestinal Villi Clarity [5.8] 本稿では,Wireless Capsule Endoscopy (WCE)画像における小腸ビリの明瞭度向上を目的とした画像強調手法を提案する。
実験により,WCE画像強調法と比較すると,本手法は小腸ビリル像の縁部の詳細をアクセントするだけでなく,ノイズ増幅を巧みに抑制することが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:18:56 GMT)
CoroNetGAN: Controlled Pruning of GANs via Hypernetworks [5.8] ハイパネットワークによる識別可能なプルーニング法を併用したGAN圧縮のためのCoroNet-GANを提案する。
我々の手法はゼブラ・ト・ホセとサマー・ト・ライトのベースラインを上回り、それぞれ32.3と72.3の最良のFIDスコアを達成した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:24:28 GMT)
RAF-GI: Towards Robust, Accurate and Fast-Convergent Gradient Inversion
Attack in Federated Learning [5.7] 本稿では,RAF-GIと呼ばれるロバスト,高精度,高速なGI攻撃アルゴリズムを提案する。
RAF-GIは、ImageNetデータセットの超高画質を実現しながら、94%の時間コストを削減できる。
バッチサイズ1のRAF-GIは、最先端のベースラインに比べて7.89ピーク信号対ノイズ比(PSNR)が高い。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:48:04 GMT)
A Novel Feature Learning-based Bio-inspired Neural Network for Real-time
Collision-free Rescue of Multi-Robot Systems [5.5] バイオインスパイアされたニューラルネットワークは、複雑でダイナミックな環境で救助経路を生成するために提案される。
提案されたFLBBINNは、ニューラルネットワークベースのアプローチの計算複雑性を低減することを目的としている。
その結果,提案するFLBBINNは救助活動の速度,効率,最適性を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:43:10 GMT)
SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM [5.4] SGS-SLAMはSplattingに基づく最初の意味的視覚的SLAMシステムである。
外観幾何学とマルチチャネル最適化による意味的特徴は、ニューラル暗黙のSLAMシステムの過度な制限に対処する。
カメラポーズ推定、マップ再構成、正確なセマンティックセグメンテーション、およびオブジェクトレベルの幾何精度において最先端のパフォーマンスを提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:55:38 GMT)
Federated Knowledge Graph Unlearning via Diffusion Model [5.4] フェデレート・ラーニング(FL)は、人工知能技術の開発と応用を促進する。
本稿では,フェデレートされた知識グラフにおける機械学習に適した新しいフレームワークであるFedDMを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:06:51 GMT)
LiqD: A Dynamic Liquid Level Detection Model under Tricky Small
Containers [5.4] 本稿では,U2-Netに基づくコンテナ動的液位検出モデルを提案する。
実験結果から, 容器内の液体の動的液体レベル変化を効果的に検出できることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:53:25 GMT)
PaddingFlow: Improving Normalizing Flows with Padding-Dimensional Noise [5.4] パディングフロー(PaddingFlow)は,パディング次元雑音による正規化フローを改善する新しいデクエント化法である。
PaddingFlowは簡単に実装でき、計算的に安価で、様々なタスクに広く適合し、データのバイアスのない推定サンプルを生成する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:28:39 GMT)
Non-discrimination Criteria for Generative Language Models [5.3] 本稿では、生成言語モデルにおけるジェンダーバイアスの存在を解明し、定量化する方法について研究する。
我々は、独立性、分離性、充足性という3つのよく知られた非識別基準のジェネレーティブAIアナログを導出する。
本研究は,このような対話型言語モデルにおける職業性バイアスの存在に対処するものである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:19:08 GMT)
Generating and Explaining Corner Cases Using Learnt Probabilistic Lane
Graphs [5.3] 本稿では,車両が走行する車線の位置と方向の有限セットを記述するために,確率的レーングラフ(PLG)を導入する。
PLGの構造は、歴史的交通データから直接学習される。
我々は、このポリシーを変更するために強化学習技術を使用し、現実的で説明可能なコーナーケースシナリオを生成する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:08:34 GMT)
Mitigate Target-level Insensitivity of Infrared Small Target Detection
via Posterior Distribution Modeling [5.2] Infrared Small Target Detection (IRSTD) は、赤外線クラッタ背景から小さなターゲットを分離することを目的としている。
マスク後部分布モデルを用いて画素レベルの判別を補正する赤外線小ターゲット検出のための拡散モデルフレームワークを提案する。
実験により,提案手法は, NUAA-SIRST, IRSTD-1k, NUDT-SIRSTデータセット上での最先端手法と競合する性能向上を実現することを示した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:45:30 GMT)
System for systematic literature review using multiple AI agents:
Concept and an empirical evaluation [5.2] 本稿では,システム文献レビューの実施プロセスの完全自動化を目的とした,新しいマルチAIエージェントモデルを提案する。
このモデルは、研究者がトピックを入力するユーザフレンドリーなインターフェースを介して動作する。
関連する学術論文を検索するために使用される検索文字列を生成する。
モデルはこれらの論文の要約を自律的に要約する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:27:52 GMT)
RAGged Edges: The Double-Edged Sword of Retrieval-Augmented Chatbots [5.2] ChatGPTの幻覚(もっともらしいが偽の情報を生み出す)は大きな課題となる。
本稿では、外部知識をプロンプトと統合することにより、検索・拡張生成が幻覚にどのように対処できるかを考察する。
以上の結果から,RAGの精度は向上するが,事前学習されたモデル理解と直接矛盾する場合は,まだ誤解が残る可能性がある。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:57:19 GMT)
DiffPMAE: Diffusion Masked Autoencoders for Point Cloud Reconstruction [5.1] 本稿では,DiffPMAEと呼ばれる自己教師型学習概念にインスパイアされた効果的なポイントクラウド再構築アーキテクチャを提案する。
この再構成プロセスの性質により、DiffPMAEはポイントクラウド圧縮、アップサンプリング、完了を含む多くの関連する下流タスクに拡張できる。
DiffPMAEの性能は、検討された自動エンコーディングおよびダウンストリームタスクの期間において、多くの最先端手法を超越して検証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:59:52 GMT)
QCSHQD: Quantum computing as a service for Hybrid classical-quantum
software development: A Vision [5.0] 本研究は,古典的開発者のためのQCリソースへのアクセスを民主化するために設計されたQCSHQDの青写真を示す。
QCSHQDのビジョンは、古典的コンピュータと量子コンピュータのハイブリッド化における重要な課題に対処することで、イノベーションを画期的なものにする道を開く。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:16:43 GMT)
Meta Pattern Concern Score: A Novel Evaluation Measure with Human Values
for Multi-classifiers [5.0] 本稿ではメタパターン関連スコアという新しい評価尺度を提案する。
我々は,2種類の共通指標,すなわち混乱行列に基づく評価尺度と損失値の利点と欠点から学習する。
また,学習率を動的に調整することで,モデルトレーニングの洗練にも有効である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:10:25 GMT)
Exploring global symmetry-breaking superradiant phase via phase
competition [5.0] 1つの正規位相、1つの大域対称性破れ超放射相、2つの局所対称性破れ超放射相が一致する四重点が存在することを示す。
我々の研究は、大域対称性の破れを伴う多段階量子臨界現象を探求する視点を開拓する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:10:06 GMT)
Real-time 3D semantic occupancy prediction for autonomous vehicles using
memory-efficient sparse convolution [5.0] 自動運転車では、エゴ車の周囲の3D環境をリアルタイムで理解することが不可欠である。
State of the art 3D mapping method leverageer with cross-attention mechanism to elevate 2D vision-centric camera features into the 3D domain。
本稿では、正面2Dカメラ画像とLiDARスキャンから特徴を抽出し、3Dセマンティック占有予測にスパース畳み込みネットワーク(Minkowski Engine)を用いる手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:50:59 GMT)
Segmentation of Knee Bones for Osteoarthritis Assessment: A Comparative
Analysis of Supervised, Few-Shot, and Zero-Shot Learning Approaches [4.9] そこで本研究では,手動分割骨を用いた2次元骨形態解析を行い,痛み条件に関連する形態的特徴について検討した。
6つのセマンティックセグメンテーションアルゴリズムを用いて,X線画像から大腿骨骨と大腿骨骨を抽出する。
数発の学習に基づくアルゴリズムであるUniverSegは、Diceスコアが99.69%で大腿骨が99.69%、ティビアが99.60%という優れたセグメンテーション結果を示した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:58:34 GMT)
Reweight-annealing method for calculating the value of partition
function via quantum Monte Carlo [4.9] 量子モンテカルロフレームワークにおいて,非バイアスの低技術バリアアルゴリズムを提案する。
この方法は古典的モンテカルロシミュレーションと量子的モンテカルロシミュレーションの両方で広く利用でき、コンピュータ上で容易に並列化できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:54:57 GMT)
A Multimodal Fusion Network For Student Emotion Recognition Based on
Transformer and Tensor Product [4.9] 本稿では,FasterNetを取り入れたYOLOv5アーキテクチャの改良と,鉄道や空港の滑走路における異物検出の促進を目的としたアテンション機構を提案する。
このデータセットは、外部オブジェクトターゲットの認識能力を改善することを目的としている。
改良されたYOLOモデルは精度が1.2%、リコールレートが1.0%、mAP@.5が0.6%向上し、mAP@.5-.95は変わらなかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:16:26 GMT)
Defining an universal "sign" to strictly probe phase transition [4.8] 最近の研究は、サインが位相遷移を探索するのに使えることを指摘して、サイン問題において顕著なブレークスルーをもたらした。
我々は、位相遷移を厳密に探索できる参照系の影響を排除した修正符号を定義する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:15:11 GMT)
Automatic Speech Recognition (ASR) for the Diagnosis of pronunciation of
Speech Sound Disorders in Korean children [4.8] 本研究では,音声障害児の発音障害を診断するための音声認識モデルを提案する。
モデルの単語の発音予測は、約90%の精度で人間のアノテーションと一致した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:20:05 GMT)
CleanAgent: Automating Data Standardization with LLM-based Agents [4.8] カラム型を標準化するための宣言的統一APIを備えたPythonライブラリを提案する。
Dataprep.Cleanは、特定の列型を1行のコードで標準化可能にすることで、複雑さを大幅に削減する。
データ標準化プロセスを自動化するために、Dataprep.CleanとLLMベースのエージェントを統合するCleanAgentフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:54:15 GMT)
Teaching Machines to Code: Smart Contract Translation with LLMs [4.8] 本稿では、2つの異なる大規模言語モデル(LLM)を統一されたフレームワーク内でシナジーを利用する先駆的なアプローチを提案する。
このフレームワークは、コーディング原則を把握し、コードから馴染みのない言語への変換にこの理解を適用するように設計されています。
本研究では,人間の学習過程を模倣するLLMの能力について検討し,Solidityで記述されたスマートコントラクトをMoveに変換する手法の詳細な評価を行った。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:55:20 GMT)
Robust Decision Aggregation with Adversarial Experts [4.8] 我々は、真理と敵の双方の専門家が存在する場合、二項決定集約問題を考える。
最悪の情報構造下では,後悔を最小限に抑える最適なアグリゲータが見つかる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:47:08 GMT)
A path-norm toolkit for modern networks: consequences, promises and
challenges [4.7] この研究は、一般的なDAG ReLUネットワークをバイアスで完全に包含するパスノルムに関する最初のツールキットを導入する。
これは、最も広く適用可能なパスノルムベースであるだけでなく、このタイプの最も鋭い既知の境界を回復または打ち負かすような、現代のニューラルネットワークの一般化境界を確立することを可能にする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:21:06 GMT)
Adaptive proximal algorithms for convex optimization under local
Lipschitz continuity of the gradient [4.5] バックトラックライン探索は、局所リプシッツ勾配を持つ連続微分可能関数を最小化するデファクトアプローチである。
近年、凸配置では線探索を完全に避けることが可能であることが示されている。
局所滑らか度係数の新しい推定値を用いた適応的近位勾配法 adaPG を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:01:29 GMT)
Lowering Detection in Sport Climbing Based on Orientation of the Sensor
Enhanced Quickdraw [4.4] 壁に取り付けられた登山器具に取り付けられた加速度センサを用いてデータを収集するプロトタイプが開発された。
対応するセンサはエネルギー効率が良いように構成されているため、費用と代替の時間消費の観点から実用的になる。
本稿では、ハードウェア仕様、超低電力モードでセンサが測定したデータ、異なる経路におけるセンサの向きパターンを検出し、低電力モードを特定するための教師ありアプローチを開発する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:43:22 GMT)
An Analysis of Human Alignment of Latent Diffusion Models [4.3] 大量のデータに基づいて訓練された拡散モデルは、画像合成に顕著な性能を示した。
それらは、人間とのエラーの整合性が高く、分類に使用するときのテクスチャバイアスも低い。
このような表現が3重の奇数ワンアウトタスクにおいて、人間の反応にどの程度うまく一致しているかを分析する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:31:08 GMT)
Towards Dense and Accurate Radar Perception Via Efficient Cross-Modal
Diffusion Model [4.3] 本稿では, クロスモーダル学習による高密度かつ高精度なミリ波レーダポイント雲構築手法を提案する。
具体的には, 2組の生レーダデータからLiDARのような点雲を予測するために, 生成モデルにおける最先端性能を有する拡散モデルを提案する。
提案手法をベンチマーク比較と実世界の実験により検証し,その優れた性能と一般化能力を実証した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:20:20 GMT)
Stable Neural Stochastic Differential Equations in Analyzing Irregular
Time Series Data [4.1] 実世界の時系列データにおける不規則サンプリング間隔と欠落値は,従来の手法の課題である。
本稿では,Langevin-type SDE,Linear Noise SDE,Geometric SDEの3つの安定クラスを提案する。
本研究は,実世界の不規則時系列データを扱う上で,提案手法の有効性を示すものである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:27:47 GMT)
LLM-Assisted Light: Leveraging Large Language Model Capabilities for
Human-Mimetic Traffic Signal Control in Complex Urban Environments [4.0] 本研究では,大規模言語モデル(LLM)を交通信号制御(TSC)システムに統合する革新的な手法を提案する。
具体的には、LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークを提案する。
シミュレーションの結果から,追加のトレーニングを必要とせず,交通環境の多種性に適応するシステムの有効性が確認された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:41:55 GMT)
IPMix: Label-Preserving Data Augmentation Method for Training Robust
Classifiers [4.0] クリーンな精度を損なうことなくロバスト性を改善するための単純なデータ拡張手法であるIMMixを提案する。
IPMixは、トレーニングデータの多様性を高めるために、3つのレベルのデータ拡張をコヒーレントでラベル保存のテクニックに統合する。
実験により、IMMixはCIFAR-CとImageNet-Cで最先端の破損堅牢性を上回っていることが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:39:47 GMT)
Sentiment-aware Enhancements of PageRank-based Citation Metric, Impact
Factor, and H-index for Ranking the Authors of Scholarly Articles [4.0] 引用の背後にある感情を考えると、著者の学術的なアウトプットに対する仲間の研究者の見解をよりよく理解できます。
著者を評価する唯一の方法は、引用を中立的な感情とみなす周波数ベースの引用メトリクスである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:01:25 GMT)
Disparate Effect Of Missing Mediators On Transportability of Causal
Effects [3.9] 我々は、公衆衛生の課題によって動機づけられた、欠落した仲介者の問題について研究し、無作為ではなく、仲介者が欠落する可能性がある。
本稿では, 媒介物質が輸送媒介効果に与える影響を定量的に評価する感度解析フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:51:03 GMT)
GPT, Ontology, and CAABAC: A Tripartite Personalized Access Control
Model Anchored by Compliance, Context and Attribute [3.9] 本研究は、生成トランスフォーマー(GPT)、医療アクセス、コンテキスト対応属性ベースアクセス制御(BACT)を提案する。
従来のモデルとは異なり、GP-Onto-CAABACTはポリシーを動的に解釈し、医療や法的な環境の変化に適応する。
アクセス制御が厳格なコンプライアンスと状況基準を満たす必要がある分野において、より広範な適用性を示している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:30:30 GMT)
Contextual Bandits with Budgeted Information Reveal [3.9] コンテキストバンディットアルゴリズムは、パーソナライズされた治療を推奨するために、デジタルヘルスで一般的に使用される。
治療の有効性を確保するため、患者は直接の利益のない行動を取るよう要求されることが多い。
本稿では,この問題に対処するための新しい最適化と学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:42:44 GMT)
Exploring Prompt Engineering Practices in the Enterprise [3.8] プロンプト(英: prompt)は、モデルから特定の振る舞いや出力を引き出すように設計された自然言語命令である。
特定の要求のある複雑なタスクやタスクに対して、迅速な設計は簡単ではない。
我々は、プロンプト編集行動のセッションを分析し、ユーザが反復したプロンプトの一部と、それらが行った変更の種類を分類する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:32:32 GMT)
PAGE: Domain-Incremental Adaptation with Past-Agnostic Generative Replay
for Smart Healthcare [3.6] PAGEは、保存されたデータや以前のドメインの情報なしで生成的な再生を可能にする。
3つの異なる疾患データセットを用いたドメイン・インクリメンタルな疾患検出におけるPAGEの有効性を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:44:33 GMT)
Symmetry restoration and quantum Mpemba effect in symmetric random
circuits [3.6] エンタングルメント非対称性は、対称性の破れの診断ツールおよび熱化のプロキシとして機能する。
本稿では,様々な対称ランダム量子回路の対称性回復について検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:20:03 GMT)
Search-based Optimisation of LLM Learning Shots for Story Point
Estimation [3.5] 探索に基づく手法を用いて,LLMの推定性能を向上させる実例の数と組み合わせを最適化する。
予備実験の結果,SBSE法によりLLMの推定性能は平均59.34%向上した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:29:37 GMT)
RRWNet: Recursive Refinement Network for Effective Retinal Artery/Vein
Segmentation and Classification [3.5] 網膜血管の徹底的な解析は、血管の分画と動脈と静脈への分類を必要とする。
本稿では,この制限に対処する新しいエンドツーエンドディープラーニングフレームワークRRWNetを紹介する。
特にRRWNetは、入力画像からベースセグメンテーションマップを生成するBaseサブネットワークと、これらのマップを反復的に改善するRecursive Refinementサブネットワークである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:52:26 GMT)
Advancing Security in AI Systems: A Novel Approach to Detecting
Backdoors in Deep Neural Networks [3.5] バックドアは、ディープニューラルネットワーク(DNN)上の悪意あるアクターと、データ処理のためのクラウドサービスによって悪用される。
提案手法は高度テンソル分解アルゴリズムを利用して,事前学習したDNNの重みを慎重に解析し,バックドアモデルとクリーンモデルとの区別を行う。
この進歩は、ネットワークシステムにおけるディープラーニングとAIのセキュリティを強化し、新興技術の脅威の進化に対して不可欠なサイバーセキュリティを提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:10:11 GMT)
The Full-scale Assembly Simulation Testbed (FAST) Dataset [3.5] われわれはVRを用いたFAST(Full-scale Assembly Simulation Testbed)による新しいオープンデータセットを提案する。
このデータセットは、VRで2つの異なるフルスケール構造を組み立てる方法を学ぶ108人の参加者から収集されたデータで構成されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:30:01 GMT)
MobileAtlas: Geographically Decoupled Measurements in Cellular Networks for Security and Privacy Research [3.4] 我々は,SIMをセルモデムからリモートで接続することで地理的に分離するフレームワークを構築した。
これにより、任意のモデム位置の任意の演算子で、パーツを動かさずに、任意のサブスクライバをテストできる。
この枠組みを用いることで、商業ネットワークにおける国際実験により、交通計測における悪用可能な不整合が明らかになった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:15:13 GMT)
Leveraging Federated Learning and Edge Computing for Recommendation
Systems within Cloud Computing Networks [3.4] エッジインテリジェンスの鍵となる技術は、フェデレートラーニング(FL)として知られる、プライバシ保護機械学習パラダイムである。
ノード障害とデバイス終了を減らすため、階層的フェデレートラーニング(HFL)フレームワークが提案され、指定されたクラスタリーダが中間モデルアグリゲーションを通じてデータオーナをサポートする。
ユーザエクスペリエンスの品質(QoE)に対するソフトクリックの影響を軽減するため、著者らは、ユーザQoEを包括的なシステムコストとしてモデル化した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:46:39 GMT)
Security Assumptions in Dispersive-Optics QKD [3.2] 量子鍵分布(QKD)は、遠隔者間で暗号的にセキュアな鍵を生成する方法を提供する。
2つのモデルで予測されるHolevo情報とシークレットキーレートの間に大きなギャップが存在する例を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:14:49 GMT)
A Dual-domain Regularization Method for Ring Artifact Removal of X-ray
CT [3.2] 検出ユニットの望ましくない応答から生じる計算トモグラフィー画像のリングアーティファクトは、画像品質と診断信頼性を著しく低下させた。
本稿では,元のCT画像の整合性を保ちながら,リングアーティファクトを効果的に除去するための二重領域正規化モデルを提案する。
提案モデルでは, 検出ユニットの応答不整合補償係数を革新的に更新することにより, シングラム上の垂直ストライプアーティファクトを補正する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:01:37 GMT)
NeRF-Supervised Feature Point Detection and Description [3.2] 本稿では,現実的なマルチビュートレーニングデータ生成にニューラルレイディアンス場(NeRF)を活用する新しいアプローチを提案する。
提案手法は,視点射影幾何学によって制御されたNeRF合成ビューのトレーニングに最先端の特徴検出器と記述子を適用した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:43:10 GMT)
Convolutional Neural Network-based Efficient Dense Point Cloud
Generation using Unsigned Distance Fields [3.2] 本稿では,任意の3次元形状の符号なし距離場を学習し,予測する軽量畳み込みニューラルネットワークを提案する。
実験により、提案されたアーキテクチャは、7.8倍のモデルパラメータ、2.4倍の推論時間、最大24.8%の生成品質向上により、技術の状態よりも優れていた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:11:33 GMT)
The negation of permutation mass function [3.2] 既存の否定法は主に確率論、エビデンス理論、複雑なエビデンス理論に適用される。
ランダムな置換集合論に否定の概念を適用する方法はまだ研究されていない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:17:25 GMT)
MedInsight: A Multi-Source Context Augmentation Framework for Generating
Patient-Centric Medical Responses using Large Language Models [3.1] 大きな言語モデル(LLM)は、人間のような応答を生成する素晴らしい能力を示している。
我々は,LLM入力を関連背景情報で拡張する新しい検索フレームワークMedInsightを提案する。
MTSamplesデータセットの実験は、文脈的に適切な医療応答を生成するMedInsightの有効性を検証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:20:30 GMT)
Self-Supervised Learning for Covariance Estimation [3.0] 推論時に局所的に適用されるニューラルネットワークをグローバルに学習することを提案する。
アーキテクチャは、一般的な注目メカニズムに基づいている。
基礎モデルとして事前訓練し、レーダーやハイパースペクトル画像の適応目標検出など、様々な下流タスクに再利用することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:16:20 GMT)
Versatile Defense Against Adversarial Attacks on Image Recognition [3.0] 現実の環境での敵の攻撃に対する防御は、アンチウイルスソフトの動作方法と比較することができる。
画像から画像への翻訳をベースとした防御手法が実現可能であると考えられる。
訓練されたモデルは、分類精度をほぼゼロから平均86%に改善した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:48:01 GMT)
PTransIPs: Identification of phosphorylation sites enhanced by protein
PLM embeddings [3.0] 我々は,リン酸化部位の同定のための新しいディープラーニングフレームワークであるPTransIPsを開発した。
PTransIPsは既存のSOTA法より優れており、AUCは0.9232と0.9660である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:02:32 GMT)
KARINA: An Efficient Deep Learning Model for Global Weather Forecast [3.0] カリナは計算資源が大幅に少ない高解像度の予測精度を達成している。
カリナはConvNext、SENet、Geocyclic Paddingを統合し、2.5degの解像度で天気予報を強化する。
カリナは気象予報の精度を新たなベンチマークで設定し、ECMWF S2Sのような既存のモデルを最大7日間のリードタイムで上回った。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:41:37 GMT)
BaSAL: Size-Balanced Warm Start Active Learning for LiDAR Semantic
Segmentation [2.9] 既存のアクティブな学習方法は、LiDARセマンティックセグメンテーションデータセットに固有の深刻なクラス不均衡を見落としている。
本研究では,各オブジェクトクラスが特徴的サイズであることを示す観測結果に基づいて,サイズバランスの取れたウォームスタートアクティブラーニングモデルBaSALを提案する。
その結果,初期モデルの性能を大きなマージンで改善できることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:05:59 GMT)
Training Machine Learning models at the Edge: A Survey [2.8] この調査はエッジ学習(EL)、特にエッジでの機械学習モデルトレーニングの最適化に重点を置いている。
目的は、ELにおける多様なアプローチや方法論を包括的に探求し、既存の知識を合成し、課題を特定し、将来の動向を明らかにすることである。
この調査はさらに、エッジ学習のためにMLを最適化するために使用されるテクニックを比較するためのガイドラインと、ELで利用可能なさまざまなフレームワーク、ライブラリ、シミュレーションツールの探索を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:19:06 GMT)
AutoTRIZ: Artificial Ideation with TRIZ and Large Language Models [2.8] TRIZリソースと概念の複雑さは、ユーザの知識、経験、推論能力への依存と相まって、その実践性を制限する。
本稿では,大規模言語モデル(LLM)を活用してTRIZ手法の自動化と拡張を行う,人工的思考ツールであるAutoTRIZを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:53:36 GMT)
On the Convergence of Locally Adaptive and Scalable Diffusion-Based
Sampling Methods for Deep Bayesian Neural Network Posteriors [2.7] ベイズニューラルネットワークは、ディープニューラルネットワークにおける不確実性をモデル化するための有望なアプローチである。
ニューラルネットワークの 後部分布からサンプルを生成することは 大きな課題です
この方向の進歩の1つは、モンテカルロ・マルコフ連鎖サンプリングアルゴリズムへの適応的なステップサイズの導入である。
本稿では,これらの手法が,ステップサイズやバッチサイズが小さくても,サンプリングした分布にかなりの偏りがあることを実証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:21:14 GMT)
Open Source Software Field Research: Spanning Social and Practice
Networks for Re-Entering the Field [2.7] 社会技術研究は、大規模社会技術基盤から生まれる社会的サブネットワークをますます含んでいる。
本研究は, フィールド研究において, 隣接するソーシャルサブネットワークを最大限に活用する方法に焦点を当てる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:09:54 GMT)
Coherent competition and control between three-wave mixing and four-wave
mixing in superconducting circuits [2.6] 超伝導量子系における三波混合(TWM)と四波混合(FWM)のコヒーレント競争と制御
驚くべきことに、TWMとFWMの同期プロセスは強い制御系で実証される。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:33:50 GMT)
Multi-product Hamiltonian simulation with explicit commutator scaling [2.6] well-conditioned multi-product formula (MPF) は、単純な高次時間独立ハミルトンシミュレーションアルゴリズムである。
我々はMPFの厳密な解析を行い、明示的な通勤者スケーリングとほぼ最適時間と精度依存性を示す。
ポスト・トロッター法と比較して、二階積公式に基づくMPFは、進化時間と精度において多対数オーバーヘッドしか持たず、システムサイズをより良くスケールすることができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:23:59 GMT)
Learning capability of parametrized quantum circuits [2.5] 変分量子アルゴリズム(VQA)とそのパラメタライズド量子回路(PQC)による量子機械学習分野への応用は、ノイズの多い中間スケール量子コンピューティングデバイスを活用する主要な方法の1つであると考えられている。
本稿では、Schuldらによる研究に基づいて、学習能力の新たな尺度を用いて、PQCの一般的なアンス・アゼと比較する。
また,Beerらが導入した分散量子ニューラルネットワーク(dQNN)についても検討し,その学習能力を高めるために,dQNNのデータ再アップロード構造を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:54:26 GMT)
Classification of Volatile Organic Compounds by Differential Mobility Spectrometry Based on Continuity of Alpha Curves [2.5] 揮発性有機化合物(VOC)の分類は多くの分野において興味深い。
DMS分散プロットの分析に用いられる現在の方法は、通常、これらのトレースの連続性に格納された情報を利用しない。
時系列分類アルゴリズムは分散プロットの分類と解析に有効であると仮定した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:02:20 GMT)
Dual Branch Deep Learning Network for Detection and Stage Grading of
Diabetic Retinopathy [2.4] 本稿では,糖尿病網膜症の診断とステージグレーディングのためのディープラーニング手法を提案する。
提案されたモデルは、APTOS 2019データセットを含む、大規模なマルチセンターデータセットに基づいてトレーニングされている。
糖尿病網膜症の検出とステージ分類において顕著な性能を発揮する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:21:11 GMT)
Tight Group-Level DP Guarantees for DP-SGD with Sampling via Mixture of
Gaussians Mechanisms [2.4] 本稿では,Poisson サンプリングや固定バッチサイズサンプリングを用いて,DP-SGD に対するグループレベルの $(epsilon, delta)$-DP 保証の計算手順を提案する。
実装における離散化エラーに対して、この手順によって計算されたDP保証は厳密である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:08:01 GMT)
Towards a Generic Representation of Combinatorial Problems for
Learning-Based Approaches [2.3] 近年,問題解決に学習ベースのアプローチを使うことへの関心が高まっている。
この課題は、対象とする問題を学習アルゴリズムと互換性のある構造に符号化することにある。
既存の多くの研究は、しばしばグラフの形で、テキストトグラフニューラルネットワークの利点を活用するために問題固有の表現を提案している。
本稿では,学習に基づくアプローチにおける問題を完全に包括的に表現することを提唱する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:09:46 GMT)
A Picture Is Worth a Thousand Words: Exploring Diagram and Video-Based
OOP Exercises to Counter LLM Over-Reliance [2.1] 大規模言語モデル(LLM)は、テキストベースの仕様で、より複雑なオブジェクト指向プログラミング(OOP)の課題を効果的に解決することができる。
これは、学生がこれらのモデルを使って非倫理的に課題を完了させるため、学術的完全性に対する懸念を提起する。
本稿では,OOP の授業において,学生の課題解決を奨励し,学生をコピー・アンド・プロンプト・アプローチから遠ざける方法として,図表やビデオを用いてOOP タスクを定式化する革新的な手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:21:29 GMT)
Masked Generative Story Transformer with Character Guidance and Caption
Augmentation [2.1] ストーリービジュアライゼーションは、生成した画像シーケンス内の異なるフレーム間の視覚的品質と一貫性の両方を必要とする、難しい生成的視覚タスクである。
以前のアプローチでは、イメージシーケンスの自動回帰生成を通してコンテキストを維持するために何らかのメモリメカニズムを使用していたり、文字とその背景の生成を別々にモデル化したりしていた。
我々は,過去と将来のキャプションとのクロスアテンションに頼って整合性を実現する,完全に並列なトランスフォーマーベースのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:10:20 GMT)
A Physics-driven GraphSAGE Method for Physical Process Simulations
Described by Partial Differential Equations [2.1] 物理駆動型グラフSAGE法は不規則なPDEによって支配される問題を解くために提案される。
距離関連エッジ機能と特徴マッピング戦略は、トレーニングと収束を支援するために考案された。
ガウス特異性ランダム場源によりパラメータ化された熱伝導問題に対するロバストPDEサロゲートモデルの構築に成功した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:25:15 GMT)
Occluded Cloth-Changing Person Re-Identification [2.1] 着替え者の再識別は, 着替えのシナリオにおいて, 着替えに無関係な特徴を用いて歩行者の身元を把握することを目的としている。
既存の布の変質的再同定手法のパーフォマンスは, 閉塞による識別的布の無関係な特徴の低下により著しく低下する。
我々は,隠蔽された布を交換する人物を新しいタスクとして再同定した最初の人物である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:08:45 GMT)
Efficient geometric Markov chain Monte Carlo for nonlinear Bayesian
inversion enabled by derivative-informed neural operators [2.1] 幾何学的マルコフ連鎖モンテカルロ(MCMC)の高速化のための演算子学習手法を提案する。
本稿では,インプット-アウトプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット-インプット・トレーニング・サンプルを用いて,微分型演算子学習(O'Leary-Roseberry et al.,J. Comput. Phys.,496 (2024)の拡張について述べる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:45:14 GMT)
Deep Submodular Peripteral Network [2.0] submodular peripteral network (DSPNs) は、submodular functionの新たなファミリーである。
コントラスト学習にインスパイアされたGPC対応戦略を用いて,DSPNとその学習方法を紹介する。
DSPNsが高コストな目標部分モジュラリティ関数からサブモジュラリティを学習する際の有効性を実証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:53:52 GMT)
Specification Overfitting in Artificial Intelligence [2.0] 機械学習(ML)と人工知能(AI)のアプローチは、その固有のバイアスと、制御の欠如、説明責任、透明性のためにしばしば批判される。
公平性や堅牢性といった高レベルの要件は、具体的な仕様メトリクスに形式化する必要があります。
本稿では,高レベルの要求とタスク性能の低下に対して,特定の指標に過度に注目するシナリオである仕様オーバーフィッティングを定義する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:20:34 GMT)
Process signature-driven high spatio-temporal resolution alignment of
multimodal data [1.9] HiRA-Proは、データをミリ秒以下のタイムスタンプに合わせるという課題に対処する。
スマートな製造環境では、13以上のチャネルから取得したデータを3Dプリンティングとミリング操作で整列させる。
HiRA-Proの優位性はさらに、追加製造におけるケーススタディを通じて示され、機械学習による予測性能の向上が示されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:07:06 GMT)
Emergent Continuous Time Crystal in Dissipative Quantum Spin System
without Driving [1.8] 明示駆動のない2次元散逸型ハイゼンベルクスピン系の非平衡位相図について検討する。
時間結晶は、自発対称性を時間次元に分割する非平衡現象であり、量子多体物理学を理解する上で基本的な重要性を持っている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:40:32 GMT)
Controlled-Joint Remote Implementation of Operators and its Possible
Generalization [1.7] この課題は、光子の空間的および分極的自由度の両方で同時に絡み合う4量子超絡み合い状態を用いて行うことができる。
また、既存の量子リモコンスキームのすべての変種が、現在のスキームの特別な場合として得られることが示されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:16:21 GMT)
Efficiently verifiable quantum advantage on near-term analog quantum
simulators [1.7] 本稿では,アナログ量子シミュレーションの単一ステップFeynman-Kitaev検証に基づく量子アドバンテージプロトコルを提案する。
また、正直な証明者のための短期的実現可能な戦略を提案し、潜在的な実験的実現について論じる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:41:39 GMT)
Data-Efficient Sleep Staging with Synthetic Time Series Pretraining [1.6] 本稿では,睡眠段階のためのニューラルネットワークを事前訓練する「周波数事前学習」という事前訓練タスクを提案する。
実験の結果,本手法は限られたデータと少ない主題のシナリオにおいて,完全に教師付き学習を超越していることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:57:10 GMT)
Fuzzy Fault Trees Formalized [1.6] ファジィ論理は曖昧な値を扱うための一般的なフレームワークである。
本稿では,ファジィ不確実性値に対する厳密な枠組みを定義する。
また,システムのファジィ信頼性を効率的に計算するボトムアップアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:45:54 GMT)
HOLMES: HOLonym-MEronym based Semantic inspection for Convolutional
Image Classifiers [1.6] 本稿では,ラベルを関連概念の集合に分解する手法を提案する。
HOLMESはイメージ分類のためのコンポーネントレベルの説明を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:51:02 GMT)
Fast Generation of GHZ-like States Using Collective-Spin XYZ Model [1.6] Greenberger-Horne-Zeilinger状態(GHZ)は、量子情報処理と量子気象学の鍵となるリソースである。
本稿では,超短時間でGHZライクな状態を生成する3体集合スピンXYZモデルを提案する。
本モデルは,Floquet 運転をオリジナル OAT Hamiltonian に適用することにより,効果的に生成可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:16:00 GMT)
Anyon condensation and the color code [1.6] 我々は、任意の縮合に対する構成理論を示し、タンデムでは、カラーコードモデルを用いて、我々の理論を明示的に説明する。
異なる凝縮過程は、空間的方向と時間的方向の両方に存在し得る領域壁の一般クラスと関連していることを示す。
最後の例として、動的浮動小数点符号は一連の凝縮演算と見なすことができると論じる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:03:11 GMT)
Predictive Analysis of Tuberculosis Treatment Outcomes Using Machine Learning: A Karnataka TB Data Study at a Scale [1.5] 本研究では,結核治療の結果をより正確に予測するために,機械学習をどのように利用できるかを検討する。
データ前処理は研究の重要な要素であり、検証セットでは98%のリコールとAUC-ROCスコア0.95のリコールを達成した。
この研究は、医療における機械学習の可能性を示すため、TBとの戦いにおいて重要な一歩を踏み出した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:04:00 GMT)
Complementarity of which-path information in induced and stimulated
coherences via four-wave mixing process from warm Rb atomic ensemble [1.5] 本研究では,2モード圧縮コヒーレント状態の干渉可視性,コンカレンス,および誘導コヒーレンスと刺激コヒーレンスとの相補的関係を確立する。
量子的挙動から古典的挙動への遷移は、誘導的コヒーレンス効果によって特徴づけられることを示す。
2つのFWM原子アンサンブルと長いコヒーレント光子を併用した実験手法は、誘導されたコヒーレンスと刺激されたコヒーレンスにおける経路情報の相補性に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:21:22 GMT)
Zero-shot and Few-shot Generation Strategies for Artificial Clinical
Records [1.5] 本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。
筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。
このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:17:09 GMT)
Universal and robust quantum coherent control based on a chirped-pulse
driving protocol [1.5] 我々は、チャープパルス駆動プロトコルを提案し、量子コヒーレント制御における例外的な特性を明らかにする。
このプロトコルは、適切に調整されたスイーピング周波数またはパルス強度でパルスシーケンスを設計することで、キュービットシステムの普遍的な操作を可能にする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:05:41 GMT)
Evaluation of LLM Chatbots for OSINT-based Cyber Threat Awareness [1.5] 本研究では,ChatGPT,GPT4all,Dolly,Stanford Alpaca,Alpaca-LoRA,Falcon,Vicunaチャットボットのバイナリ分類および名前付きエンティティ認識タスクにおける性能について検討する。
バイナリ分類実験では、商業モデルとしてGPT-4が許容されるF1スコア0.94を達成し、オープンソースのGPT4allモデルはF1スコア0.90を達成した。
本研究は、OSINTバイナリ分類のためのチャットボットの能力を実証し、特別に訓練されたモデルを効果的に置き換えるために、NERをさらに改善する必要があることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:51:13 GMT)
Training Self-localization Models for Unseen Unfamiliar Places via Teacher-to-Student Data-Free Knowledge Transfer [1.5] 最先端の自己ローカライゼーションモデルにおける典型的な仮定は、アノテーション付きトレーニングデータセットがターゲットのワークスペースで利用できるということである。
本研究では,オープンワールド分散ロボットシステムのための新しいトレーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:20:47 GMT)
Encoding a magic state with beyond break-even fidelity [1.4] 本稿では, 超電導量子ビットアレイ上に, 誤差補正を用いたマジック状態作成手法を提案し, 実装する。
我々の手法は、装置の個々の量子ビットを用いて準備できるものよりも優れたマジック状態を生成する。
我々のプロトタイプは、高忠実度マジック状態を生成するのに必要な物理量子ビットの数を削減できるので、将来的には貴重なものになるだろう。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:20:58 GMT)
Second-Order Information Matters: Revisiting Machine Unlearning for Large Language Models [1.4] プライバシーの漏洩と著作権侵害はまだ未発見だ。
我々の未学習のアルゴリズムは、データに依存しない/モデルに依存しないだけでなく、ユーティリティの保存やプライバシー保証の観点からも堅牢であることが証明されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:57:30 GMT)
Optimizing Risk-averse Human-AI Hybrid Teams [1.4] 本稿では,標準化された強化学習スキームを通じて,最良デリゲート法を学習するマネージャを提案する。
いくつかのグリッド環境において,マネージャのパフォーマンスの最適性を示す。
結果から、マネージャは望ましいデリゲートをうまく習得でき、その結果、チームパスは、ほぼ、あるいは正確には最適であることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:49:26 GMT)
Strategizing against Q-learners: A Control-theoretical Approach [1.4] 戦略的に洗練されたエージェントが、相手のQラーニングアルゴリズムを知っていれば、どれだけの戦略的なQラーナーを活用できるかを定量化する。
本稿では,連続状態空間に挑戦し,その性能を解析するための量子化に基づく近似手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:54:27 GMT)
Efficient and practical Hamiltonian simulation from time-dependent
product formulas [1.3] 本稿では,製品公式を用いた量子システムの時間進化手法を提案する。
我々のアルゴリズムは、進化演算子を量子コンピュータ上で直接実装可能な単純なユニタリの積に分解する。
理論的スケーリングは最先端のアルゴリズムと比較すると最適ではないが,提案するアルゴリズムの性能は実際は極めて競争力が高い。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:29:05 GMT)
Effective Structural Encodings via Local Curvature Profiles [1.3] 離散リッチ曲率に基づく新しい構造符号化法(局所曲率プロファイル,短いLCP)を提案する。
既存の符号化手法よりも大幅に優れていることを示す。
異なるエンコーディングタイプを、再配線(曲率に基づく)技術と比較する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:12:10 GMT)
Rethinking Loss Functions for Fact Verification [1.3] FEVERに適した2つのタスク特化目標を策定する。
実験により,提案する目的関数が標準のクロスエントロピーより優れていることを確認した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:56:32 GMT)
Link Prediction for Social Networks using Representation Learning and
Heuristic-based Features [1.3] ソーシャルネットワークのリンク不足を効率的に予測することは、現代の様々なビジネスアプリケーションに役立つ。
本稿では,ソーシャルネットワークにおけるノードとエッジの表現を生成するための様々な特徴抽出手法について検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:23:55 GMT)
A Comparative Analysis of Energy Consumption Between The Widespread
Unreal and Unity Video Game Engines [1.2] この研究は、最も広く使われている業界規模のビデオゲームエンジンであるUnityとUnreal Engineのエネルギー消費を評価する。
我々の研究は、ビデオゲームエンジンのエネルギー消費に大きな違いがあることを確認した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:02:26 GMT)
A Short Review on Novel Approaches for Maximum Clique Problem: from Classical algorithms to Graph Neural Networks and Quantum algorithms [1.1] この写本は、最大傾倒問題を解くための単純な古典的なアルゴリズムを網羅している。
レビューでは、古典的および新しい学習、量子アルゴリズムをテストするためのベンチマークで締めくくられている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:12:05 GMT)
MinkUNeXt: Point Cloud-based Large-scale Place Recognition using 3D
Sparse Convolutions [1.1] MinkUNeXtは、新しい3D MinkNeXt Blockをベースとした、ポイントクラウドからの位置認識のための効率的かつ効率的なアーキテクチャである。
提案の徹底的な評価は、Oxford RobotCarとIn-houseデータセットを用いて行われている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:39:14 GMT)
SNOW-SCA: ML-assisted Side-Channel Attack on SNOW-V [1.1] 我々は,32ビットARM Cortex-M4マイクロコントローラ上で動作する5Gモバイル通信セキュリティ標準候補SNOW-Vの最初の電力側チャネル解析(SCA)攻撃を提案する。
SNOW-Vの256ビット秘密鍵は、提案したSCA攻撃を用いて段階的に復元できる。
我々は、これらのSCA攻撃を防ぐために使用できる低オーバーヘッド対策を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:35:55 GMT)
A Moral Imperative: The Need for Continual Superalignment of Large Language Models [1.0] スーパーアライメント(Superalignment)は、超知能AIシステムが人間の価値観や目標に応じて行動することを確実にする理論フレームワークである。
本稿では,AIシステム,特に大規模言語モデル(LLM)における生涯的スーパーアライメントの実現に関わる課題について検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:44:50 GMT)
SoK: Reducing the Vulnerability of Fine-tuned Language Models to
Membership Inference Attacks [1.0] 我々は,大規模言語モデルのメンバシップ推論攻撃に対する脆弱性について,初めて体系的なレビューを行った。
これらの攻撃に対して最高のプライバシー保護を実現するために、差分プライバシーと低ランク適応器を組み合わせることで、いくつかのトレーニング手法がプライバシーリスクを著しく低減することを発見した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:46:51 GMT)
An Extended View on Measuring Tor AS-level Adversaries [1.0] 我々はAtlasフレームワークを使用して、ドイツとアメリカのIPv4クライアントの匿名化のリスクを推測する。
しかし、ドイツと米国の顧客にとって、全体像は2020年以来変わっていない。
ロシアのユーザーはTorを使って検閲を回避することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:27:02 GMT)
Authorship Verification based on the Likelihood Ratio of Grammar Models [0.9] 著者検証(英語: Authorship Verification、AV)とは、特定の著者によって書かれたかどうかを判断する一連の文書を分析するプロセスである。
我々は、$lambda_G$ (LambdaG) と呼ぶ量を計算する方法を提案する。
トレーニングに大量のデータを必要としないにも関わらず、LambdaGは計算複雑性の高い既存のAVメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:25:47 GMT)
Local Binary and Multiclass SVMs Trained on a Quantum Annealer [0.8] 近年,動作量子アンニールの出現に伴い,量子トレーニングと古典的実行を特徴とするハイブリッドSVMモデルが導入されている。
これらのモデルは、古典的なモデルに匹敵する性能を示した。
しかし、現在の量子アニールの接続が制限されているため、トレーニングセットサイズに制限がある。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:37:00 GMT)
Meta-operators for Enabling Parallel Planning Using Deep Reinforcement Learning [0.8] 複数の計画演算子を同時に適用した結果,メタ演算子の概念を導入する。
RL アクション空間にメタ演算子を含めることで、並列計画のような新しい計画視点を RL を用いて解決できることが示される。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:00:36 GMT)
Software Vulnerability and Functionality Assessment using LLMs [0.8] 我々は,Large Language Models (LLMs) がコードレビューに役立つかどうかを検討する。
我々の調査は、良質なレビューに欠かせない2つの課題に焦点を当てている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:29:13 GMT)
Validating and Exploring Large Geographic Corpora [0.8] ニュージーランド英語のような特定の言語国を表すサブコーパスの品質向上に3つの手法が用いられている。
評価の結果, サブコーパスの妥当性は清掃段階ごとに改善されているが, この改善は言語や人口に不均一に分散していることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:46:17 GMT)
Deep Learning for In-Orbit Cloud Segmentation and Classification in
Hyperspectral Satellite Data [0.8] 本稿では、ハイパースペクトル衛星を用いたクラウド検出のための最新の畳み込みニューラルネットワーク(CNN)について検討する。
クラウドセグメンテーションと分類のための最新の1D CNN(1D-Justo-LiuNet)と最近の2D CNN(nnU-netと2D-Justo-UNet-Simple)の性能を評価する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:58:37 GMT)
A Comparison of SynDiffix Multi-table versus Single-table Synthetic Data [0.7] SynDiffixは構造化データ合成のための新しいオープンソースツールである。
匿名化機能があり、強力な匿名性を維持しながら複数の合成テーブルを生成することができる。
本稿では、SDNIST分析フレームワークを用いて、SynDiffixと15の合成データ技術を比較した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:26:50 GMT)
Equipping Computational Pathology Systems with Artifact Processing
Pipelines: A Showcase for Computation and Performance Trade-offs [0.7] 損傷組織, ぼかし, 折りたたみ組織, 気泡, 組織学的に無関係な血液を含む5つの重要な人工物を検出するための専門家(MoE)の混合手法を提案する。
2つのMoEと2つのマルチクラスモデルであるDCNNとビジョントランスフォーマーを用いたDLパイプラインを開発した。
提案されたMoEは86.15%のF1と97.93%の感度スコアを持ち、ViTを用いたMoEよりも推論の計算コストが低い。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:20:19 GMT)
Coherent Control of the Fine-Structure Qubit in a Single Alkaline-Earth
Atom [0.7] キュービット状態のラマンカップリングは、高速なライドバーグ媒介の2体ゲートと同等の高速な単一量子ビット回転を約束する。
我々は、キュービットの準備、読み出し、コヒーレントな制御を実証する。
我々の研究は、中性原子ベースの量子コンピューティングのための未探索の量子ビット符号化概念の扉を開く。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:37:52 GMT)
Review of Generative AI Methods in Cybersecurity [0.7] 大規模言語モデル(LLM)と生成人工知能(GenAI)は、サイバーセキュリティにおけるパラダイムシフトを構成する。
我々の研究は、GoogleのGeminiやChatGPT-4のようなモデルがセキュリティプロトコル、脆弱性評価、脅威識別をいかに強化するかを強調している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:05:05 GMT)
Frequency-dependent entanglement advantage in spin-network Quantum Reservoir Computing [0.7] 線形および非線形メモリタスクにおける量子貯水池計算(QRC)のためのIsingスピンネットワークの性能について検討する。
本研究では,量子エンタングルメントの挙動をモニタリングすることにより,量子度が性能を高める方法について検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:32:14 GMT)
Stabilizer ground states: theory, algorithms and applications [0.6] 一般のパウリ・ハミルトニアンの安定化基底状態を特定するための簡易な等価形式論を提案する。
また、1次元局所ハミルトニアンの安定化基底状態を得るための正確で線形スケールのアルゴリズムも開発している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:54:25 GMT)
Language-based game theory in the age of artificial intelligence [0.6] 感情分析は、経済的な結果を超えた人間の行動を説明することができることを示す。
我々のメタ分析は、感情分析が経済的な結果を超えた人間の行動を説明することができることを示している。
この研究が、人間の決定における言語の重要性を強調する新しいゲーム理論アプローチの舞台となることを願っている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:21:20 GMT)
Non-verbal information in spontaneous speech -- towards a new framework
of analysis [0.6] 本稿では,韻律信号の分類のための解析的スキーマと技術的概念実証を提供する。
3つの順序の韻律現象を解き放つ分類過程を示す。
散在する韻律パターンは、コミュニケーションと音声の組織化の理論を導くことができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:50:40 GMT)
A Novel Implicit Neural Representation for Volume Data [0.6] 本稿では,提案アーキテクチャを用いてボリュームデータを圧縮する新しい暗黙的ニューラル表現を提案する。
我々のアーキテクチャは、トレーニング時間を効果的に削減し、最終的なレンダリング品質を維持しながら高い圧縮率を得ることができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:22:13 GMT)
Measuring the Energy Consumption and Efficiency of Deep Neural Networks:
An Empirical Analysis and Design Recommendations [0.5] BUTTER-Eデータセットは、BUTTER Empirical Deep Learningデータセットの拡張である。
このデータセットは、データセットのサイズ、ネットワーク構造、エネルギー使用の複雑な関係を明らかにする。
本稿では,ネットワークサイズ,コンピューティング,メモリ階層を考慮した,単純かつ効率的なエネルギーモデルを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:27:19 GMT)
BED: Bi-Encoder-Based Detectors for Out-of-Distribution Detection [0.4] 本稿では,バイエンコーダを用いた検出器を用いた新しい手法を提案する。
NLPにおける様々なアウト・オブ・ディストリビューション(OOD)検出法を比較した総合的研究を行った。
提案されたバイエンコーダベースの検出器は、トレーニングでOODラベルを必要とするものと、そうでないものの両方において、他の方法よりも優れている。
トレーニングプロセスの単純さと優れた検出性能により、現実のシナリオに適用できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:49:54 GMT)
PAPERCLIP: Associating Astronomical Observations and Natural Language with Multi-Modal Models [0.4] 本稿では,望遠鏡が撮影した天体観測と自然言語をニューラルネットワークモデルを用いて関連付ける手法を提案する。
モデルは、事前訓練されたContrastive Language-Image Pre-training (CLIP)モデルから微調整される。
ハッブル宇宙望遠鏡(HST)の観測例を用いて、微調整されたモデルが観察と自然言語の間の有意義な共同表現を具現化していることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:00:00 GMT)
Pig aggression classification using CNN, Transformers and Recurrent
Networks [0.4] ブタの攻撃性は、動物の分類と識別を通じてその影響を減らすために研究される行動の例である。
本研究では,STAM,TimeSformer,ViViTの変種と,ResNet3D2,Resnet(2+1)D,CnnLstmなどの畳み込みを用いた手法が主な手法である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:38:58 GMT)
Structural Positional Encoding for knowledge integration in transformer-based medical process monitoring [0.3] 本研究では,注意機構に基づくディープラーニングアーキテクチャであるエムトランスを用いた予測プロセスモニタリング手法を提案する。
我々の研究の大きな貢献は、グラフ位置符号化技術を通じて行われる存在論的ドメイン固有の知識の取り込みにある。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:15:18 GMT)
Ultra-long relaxation of a Kramers qubit formed in a bilayer graphene
quantum dot [0.2] 2次元スピン・バレー部分空間に符号化された新しいタイプのクビット(クラマーズ・クビット)が利用可能となる。
クラマーズ量子ビットの極長スピンバレー緩和時間が30mathrms$を超えることを示す。
証明された高忠実な単一ショット読み出しと長い緩和時間は、新しい長寿命半導体量子ビットの基礎である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:08:26 GMT)
Image Classification for CSSVD Detection in Cacao Plants [0.0] カカオ増殖性シュートウイルス(CSSVD)を検出するために、画像分類器を訓練する研究のギャップがある。
我々のソリューションはVGG16, ResNet50, Vision Transformer (ViT) をベースとしている。
我々の最良の画像分類器は、95.39%の精度、93.75%のリコール、94.34%のF1スコア、94%の精度を20エポックで達成している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:16:34 GMT)
Zero modes of velocity field and topological invariant in quantum torus [0.0] 本稿では,速度場のゼロモードに基づく速度場流の指数について紹介する。
これらの零モードは、ポアンカー・ホップの定理によってオイラー標数にリンクする効果的な位相電荷や欠陥の役割を担っている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 04:23:16 GMT)
Wave-particle correlations in multiphoton resonances of coherent
light-matter interaction [0.0] 多光子動作下でのJaynes-Cummings(JC)モデルにおける非古典光子列による場振幅の条件測定について検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:00:23 GMT)
Variance Minimisation of the Lipkin-Meshkov-Glick Model on a Quantum
Computer [0.0] 我々は分散最小化法を用いて、リプキン-メシュコフ-グリックモデルのエネルギー固有値の全スペクトルを求める。
我々は、IBMクラウドベースの量子コンピュータを介してアクセスされる量子シミュレータと実際の量子ハードウェアの両方を用いて、これらの計算を実行する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:40:06 GMT)
Unlocking Heisenberg Sensitivity with Sequential Weak Measurement Preparation [0.0] 非線型スピン相互作用の必要性のない絡み合ったスピン状態を生成する。
結果として生じる状態のメロジカル感度は、標準量子限界を超える。
本研究は,大規模,非古典的,絡み合った状態を生成する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:41:49 GMT)
Unifying uncertainties for rotor-like quantum systems [0.0] 角運動量と角変数の相補性の量子化は、量子力学におけるこの正準対の活用に不可欠である。
フォン・ミーゼスによって正確に、あるいはほぼ最小化された不確実性製品に特別に注意が払われる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:51:52 GMT)
Understanding and Evaluating Developer Behaviour in Programming Tasks [0.0] 一連の3つの研究で、特定のプログラミングタスクを解く開発者の具体的な振る舞いを調査した。
私たちは、どのソースコードファイルを訪れたか、どのようにしてコードと知識を他人に関連づけ、いつ、どのようにコード編集を成功させたかに焦点を当てました。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:46:42 GMT)
Towards a Privacy and Security-Aware Framework for Ethical AI: Guiding
the Development and Assessment of AI Systems [0.0] 本研究は2020年から2023年までの系統的な文献レビューを行う。
本研究は,SLRから抽出した知識の合成を通じて,プライバシとセキュリティを意識したAIシステムに適した概念的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:39:57 GMT)
Tissue Artifact Segmentation and Severity Analysis for Automated
Diagnosis Using Whole Slide Images [0.0] 本稿では,畳み込みニューラルネットワークを用いたアーティファクト検出に重大度評価を取り入れたシステムを提案する。
提案システムはDoubleUNetを用いてアーティファクトを分割し、6つの微調整された畳み込みニューラルネットワークモデルのアンサンブルネットワークを用いて重大性を決定する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:14:16 GMT)
Time-dependent Darboux transformation and supersymmetric hierarchy of Fokker-Planck equations [0.0] 定常拡散を伴うFokker-Planck方程式の解法を示す。
これはフォッカー・プランク方程式と非定常シュル・オーディンガー方程式の対応に基づいている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:03:43 GMT)
Time-bin entanglement in the deterministic generation of linear photonic
cluster states [0.0] 本稿では,個々の量子エミッタを用いた時間結合型光子の列車の効率的な決定論的生成戦略について検討する。
フル微視的数値シミュレーションにおいて, かなりの長さの高品質な線形クラスター状態の生成を明示的に示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:38:45 GMT)
The Human Factor in Detecting Errors of Large Language Models: A Systematic Literature Review and Future Research Directions [0.0] 2022年11月、OpenAIによるChatGPTのローンチは人工知能の重要な瞬間となった。
大規模言語モデル (LLM) は、様々な領域で顕著な会話能力を示す。
これらのモデルは「幻覚」や省略といった誤りに影響を受けやすく、誤った情報や不完全な情報を生成する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:39:39 GMT)
The Development and Performance of a Machine Learning Based Mobile
Platform for Visually Determining the Etiology of Penile Pathology [0.0] 我々は5つのペニス病を分類する機械学習モデルを開発した。
このモデルは現在世界中で使用されており、ペニス病の診断サービスへのアクセスを改善する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:05:40 GMT)
Tailoring quantum error correction to spin qubits [0.0] 最先端のエラー訂正コードでは、最寄りの接続しか必要としない。
これらの誤り訂正符号のそれぞれにスピン量子レイアウトが必要であった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:25:40 GMT)
System-bath correlations and finite-time operation enhance the
efficiency of a dissipative quantum battery [0.0] 熱浴に強く結合した量子電池の効率について検討した。
第1のシナリオでは、放電した電池は接続時の浴槽と無関係であると仮定する。
第2のシナリオでは、放電された電池は浴槽と相関し、最適効率は瞬時に切断される。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:29:09 GMT)
Studying time-like proton form factors using vortex state $p\bar{p}$ annihilation [0.0] 粒子の渦状態は、粒子物理学の新しい機会を開く。
渦プロトンと反プロトンは、非偏極散乱においても陽子電磁形状因子の位相にアクセスする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:28:40 GMT)
Strict hierarchy of optimal strategies for global estimations: Mapping
global estimations into local ones [0.0] 我々は,グローバルな推定をローカルにマッピングできる仮想想像時間進化法を開発した。
我々は、並列、シーケンシャル、不確定な因果順序戦略を含む、異なる大域的推定戦略に対する達成可能な精度の厳密な階層を公表する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:48:53 GMT)
Stein Boltzmann Sampling: A Variational Approach for Global Optimization [0.0] 我々は,Stein Boltzmann Sampling (SBS) と呼ばれるリプシッツ関数の大域的最適化のための新しいフローベース手法を提案する。
本手法は,最適化対象関数の最小値集合上で一様となるボルツマン分布からサンプリングする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:59:10 GMT)
Stacking-based deep neural network for player scouting in football 1 [0.0] 本稿では,多人数のサッカー選手を検知するスタックリングに基づくディープラーニングモデルを提案する。
オープンソースデータベースに適用すると,従来の統計手法よりもはるかに優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:10:18 GMT)
Stabilizer Tensor Networks: universal quantum simulator on a basis of
stabilizer states [0.0] 本稿では,クリフォード回路シミュレーションに用いるテーブルー形式を一般化する。
我々は、クリフォードゲート、非クリフォードゲート、および測定を用いて、フォーマリズムをどう更新するかを明確に証明する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:23:09 GMT)
Solving lattice gauge theories using the quantum Krylov algorithm and qubitization [0.0] 量子部分空間展開アルゴリズムを用いてシュウィンガーモデルの基底状態を計算する。
量子化を用いた量子アルゴリズムを用いて,LGT真空状態の計算に必要な資源の完全な分析を行う。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:00:01 GMT)
Solutions of the Lippmann-Schwinger equation for confocal parabolic
billiards [0.0] 共焦点放物型ビリヤードの共鳴とトンネルについて数値解析を行った。
ビリヤードの放物的側面を識別するための基準を詳しく説明する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:17:30 GMT)
Size-consistency and orbital-invariance issues revealed by VQE-UCCSD calculations with the FMO scheme [0.0] フラグメント分子軌道 (FMO) スキームは、フラグメント化に基づく一般的な手法の1つである。
我々は、FMO計算の電子相関部分を実行するために、GPU加速量子シミュレータ(cuQuantum)を使用した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:22:13 GMT)
Sequential hypothesis testing for continuously-monitored quantum systems [0.0] 我々は、連続的に監視されている量子系を考察し、測定信号を生成する。
我々は、信号がリアルタイムで分析されるシーケンシャル戦略の利用を推進した。
本研究では, 停止時間挙動を解析し, シーケンシャルテストの性能を解析する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:18:32 GMT)
Scaling and Universality at Ramped Quench Dynamical Quantum Phase
Transition [0.0] 周期駆動型拡張XYモデルの非平衡ダイナミクスを動的量子相転移(DQPT)の概念を用いて検討する。
差分閉じが発生するモデルの臨界点は、駆動周波数を調整して移動可能であることを示す。
数値シミュレーションにより,全スイープ速度と駆動周波数に対して指数$nu=1pm 0.01$で,動的自由エネルギーは時間とともに線形にスケールすることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:59:56 GMT)
Reproducibility and Geometric Intrinsic Dimensionality: An Investigation
on Graph Neural Network Research [0.0] これらの努力に基づいて構築することは、マシンラーニングにおけるもうひとつの重要な課題、すなわち次元の呪いに向かっています。
本研究は,機械学習モデルが学習対象のデータセットの拡張次元にどのような影響を受けているのかを,本質的な次元の密接な関連概念を用いて検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:44:30 GMT)
Reduced Jeffries-Matusita distance: A Novel Loss Function to Improve
Generalization Performance of Deep Classification Models [0.0] 本稿では,深層分類モデルの学習における損失関数として,Reduced Jeffries-Matusitaという距離を導入する。
その結果、新しい距離測定はトレーニングプロセスを著しく安定化させ、一般化能力を高め、精度とF1スコアの指標におけるモデルの性能を向上させることを示した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:51:38 GMT)
Random Search as a Baseline for Sparse Neural Network Architecture
Search [0.0] スパースニューラルネットワークは、密度の高いニューラルネットワークと同じような、あるいはより良い一般化性能を示している。
本研究では,適切なスパース構成を見つけるための評価手法と,ランダム検索の簡易なベースライン手法を提案する。
本研究では,このアーキテクチャ探索タスクにおいて,ランダム検索が検出したスパースネットワークは,ランダム検索よりも効率良く,効率的に収束しないことを示した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:32:13 GMT)
Quantum states resembling classical periodic trajectories in mesoscopic
elliptic billiards [0.0] メソスコピック楕円ビリヤードにおける古典周期軌道上の局在を伴う量子波動関数が達成されている。
楕円ビリヤードにおける運動の回転状態とリリレーショナル状態を分析し,議論する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:02:53 GMT)
Quantum plasmonics model of refractive index sensing using photon
correlations [0.0] 量子エミッタと金属ナノ粒子からなるナノセンサシステムを提案する。
最適駆動波長において、強度と強度-強度相関のセンシング性能を比較した。
ショットノイズ限界以下でノイズを低減できる状態が同定され、センシング性能が量子的に向上する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:46:38 GMT)
Quantum jump photodetector for narrowband photon counting with a single
atom [0.0] textsuperscript87Rb 原子を光トラップに保持し、単一光子開始状態変化の「量子ジャンプ」を検出する。
弱い信号と強い光背景を分離するIntrepid-Narrowband単光子検出器
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:29:26 GMT)
Quantum entanglement of ions for light dark matter detection [0.0] ポールイオントラップシステムを用いて、アクシオンダークマターやダークフォトンダークマターなどの軽いダークマターを検知する方法を探索する。
最初に、ポールトラップ内のイオンの振動モードの基底と最初の励起状態から構築された量子ビットが、弱い電場に対する効果的なセンサとして機能することを実証した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:35:53 GMT)
Quantum Many-Body Scars for Arbitrary Integer Spin in $2+1$D~Abelian Gauge Theories [0.0] 量子多体スカー(Quantum Many-Body Scars)の存在は、異なる量子多体システムにまたがって確立されている。
任意の大きさの整数スピンを持つ純ゲージ理論のスカーを2+1$Dで同定する。
任意の整数スピンに対する2+1$Dゲージ理論において、傷跡の存在が広く認められる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:26:20 GMT)
Quantum Many-Body Scarring in $2+1$D Gauge Theories with Dynamical Matter [0.0] 量子多体散乱(Quantum many-body scarring, QMBS)は、非可積分量子多体モデルにおける弱いエルゴディディディティ破壊の興味深いパラダイムとして登場した。
QMBS は 2+1$D $mathrmU(1)$ quantum link model で発生することを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:00:01 GMT)
Quantum Control of Radical Pair Dynamics beyond Time-Local Optimization [0.0] 低磁場状態におけるラジカル対のスピン選択的再結合反応の任意の波形制御を実現する。
これにより、ラジカル対の反応制御に先立って提案された時間局所最適化アプローチの欠点を克服する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:59:45 GMT)
Quantum Codes and Irreducible Products of Characters [0.0] 我々は、ツイストを1ドルグループと定義し、エラー検出量子コードを自動的に誘導することを示した。
また、一意的な1$-群が文字の既約積に対応することを示し、有限群の文字理論における計算へのコードフィディングの問題を減らした。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:36:02 GMT)
Projective Quantum Eigensolver via Adiabatically Decoupled Subsystem
Evolution: a Resource Efficient Approach to Molecular Energetics in Noisy
Quantum Computers [0.0] 我々は,ノイズ中間スケール量子(NISQ)ハードウェアを用いて,分子系の基底状態エネルギーを正確に計算することを目的とした射影形式を開発した。
本研究では,将来の耐故障システムにおいて,必要な精度を同時に確保しながら,ノイズ下での優れた性能を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:27:40 GMT)
Principles for Optimizing Quantum Transduction in Piezo-Optomechanical
Systems [0.0] 双方向マイクロ波光量子トランスダクションは、光ファイバーを介して遠隔超伝導量子ビットを接続する重要な機能である。
フォノン-フォトン4波混合を用いた光非線形性による新しい光結合機構を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:38:44 GMT)
Plug-and-Play Regularization on Magnitude with Deep Priors for 3D Near-Field MIMO Imaging [0.0] 近接場レーダイメージングシステムは、隠蔽兵器の検出や医療診断など、幅広い用途で使用されている。
3次元複素数値反射率の問題は、その大きさに対して正則化を強制することによるものである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:27:03 GMT)
Physical Memory Attacks and a Memory Safe Management System for Memory Defense [0.0] 我々は、ビットフリップ脆弱性に関連する脆弱性のあるメモリを保護できる、ソフトウェアベースの新しい低レベル層の概念を探求する。
既存の物理防衛ソリューションは、展開直後に一貫して回避されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:10:04 GMT)
PhagoStat a scalable and interpretable end to end framework for
efficient quantification of cell phagocytosis in neurodegenerative disease
studies [0.0] 本稿では,食欲活動の定量化と分析を行うためのエンドツーエンド,スケーラブル,汎用的なリアルタイムフレームワークを提案する。
提案するパイプラインでは,大規模なデータセットを処理でき,データ品質検証モジュールも備えている。
我々はこのパイプラインをFTDの微小グリア細胞食細胞解析に応用し,統計的に信頼性の高い結果を得た。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:48:50 GMT)
Penning micro-trap for quantum computing [0.0] 高周波トラップにおけるトラップイオンは、量子コンピュータの実現における主要なアプローチの一つである。
高周波磁場を3T磁場に置き換えることで,これらの制約を除去するマイクロファブリック化ペニングイオントラップを実現する。
Penningマイクロトラップアプローチのこのユニークな特徴は、接続性と柔軟性を改善したQuantum CCDアーキテクチャの変更を開放する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:03:49 GMT)
Particle detector models from path integrals of localized quantum fields [0.0] プローブ場の任意の有限個のモードの力学は、正確には有限個の検出器の力学であることを示す。
このアプローチは、最近提案された検出器ベースとフィールド理論ベースの測定フレームワーク間の橋渡しと拡張を行う。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:29:50 GMT)
Ozawa's Intersubjectivity Theorem as justification of RQM's postulate on
internally consistent descriptions [0.0] 大沢のintersubjectivity Theorem (OIT) は量子測定理論の中で証明されている。
これはリレーショナル量子力学の新しい仮定(RQM)をサポートする。
しかし、OITの観点からは、仮定の定式化は確率の仮定によって完了するべきである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:47:00 GMT)
Optimized Detection and Classification on GTRSB: Advancing Traffic Sign
Recognition with Convolutional Neural Networks [0.0] 本稿では,CNNの精度を96%近く向上する革新的な手法を提案する。
高度なローカライゼーション技術によってさらに精度が向上する可能性を強調している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 06:28:37 GMT)
Optimal adaptation of surface-code decoders to local noise [0.0] 量子デバイスのノイズ特性は、量子エラー訂正符号の性能向上に利用することができる。
本稿では,表面符号デコーダの雑音特性への適応が性能改善につながる範囲を最大化する手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:12:33 GMT)
On the eigenvalues of the harmonic oscillator with a Gaussian
perturbation [0.0] 我々の数値固有値は、これらの式が著者が見積もった値よりも大きい結合パラメータの間隔で有効であることを示している。
また、複素平面における結合パラメータといくつかの例外点の臨界値を計算する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:59:19 GMT)
On the Preservation of Africa's Cultural Heritage in the Age of
Artificial Intelligence [0.0] 本論文は,口頭伝承からデジタル時代への知識の普及の過程を辿り,言語の重要性と文化の多様性を浮き彫りにしたものである。
また、デジタル技術が記憶、コミュニケーション、文化保存に与える影響を探求し、アフリカなどにおけるデジタル文化(デジタル文化ではなく)の文化を促進する必要性を強調している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:44:23 GMT)
On the Performance of Imputation Techniques for Missing Values on Healthcare Datasets [0.0] 値やデータの欠落は、実世界のデータセット、特に医療データの一般的な特徴のひとつだ。
本研究は, 平均計算法, 中間計算法, 最終観測法 (LOCF) 計算法, K-Nearest Neighbor (KNN) 計算法, 補間計算法, ミスフォレスト計算法, 連鎖方程式による多重計算法の比較である。
その結果,ミスフォレスト・インキュベーションが最善であり,MICEインキュベーションが最善であることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:07:17 GMT)
Noninteger high-harmonic generation from extended correlated systems [0.0] 我々はFermi-Hubbardモデルを用いて、線形鎖の原子からHHGを研究する。
非整数高調波における信号の存在は、複数のフロケ状態の集団に由来すると解釈できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:24:53 GMT)
Neural Implicit Swept Volume Models for Fast Collision Detection [0.0] 本稿では,深層学習に基づく符号付き距離計算の高速化と幾何衝突チェッカーの精度保証を併用したアルゴリズムを提案する。
シミュレーションおよび実世界のロボット実験において、我々のアプローチを検証するとともに、商用ビンピッキングアプリケーションを高速化できることを実証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:34:47 GMT)
Negative pressure in the quantum vacuum [0.0] 我々は、光子場に特別な境界が存在する場合、量子真空中の仮想光子は、このタイプの負の圧力を引き起こす可能性があることを示した。
異常な量子真空放射がこの負圧の出現の原因である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:47:32 GMT)
Negative Wigner function by decaying interaction from equilibrium [0.0] 負のウィグナー関数重畳状態を得るための概念的に異なる、より自律的な方法を提案する。
検出可能な負のウィグナー関数と量子コヒーレンスと、より多くの量子ビットを用いた定性的拡張を同時に示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:39:02 GMT)
Multifidelity linear regression for scientific machine learning from
scarce data [0.0] 本稿では,科学機械学習のための多要素学習手法を提案する。
様々な忠実さとコストのデータが利用できる科学的な文脈を利用する。
本研究では,高忠実度データを学習した学習モデルが,高忠実度データのみを学習した標準モデルよりも,高忠実度データを訓練した学習モデルよりも低次モデルの分散を実現することを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:40:17 GMT)
Multichannel quantum defect theory of strontium bound Rydberg states [0.0] 新規に算出されたマルチチャネル量子欠陥理論パラメータとチャネル分画を、ストロンチウムの1重項および3重項S,P,D系列および1重項F系列に対して提示する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:44:40 GMT)
Multi-axis inertial sensing with 2D arrays of Bose Einstein Condensates [0.0] 時間平均光電位を多軸慣性センシングに利用したBose-Einstein Condensates (BEC) の新規な2Dアレイを提案する。
回転参照ミラーの角速度と加速度の測定と,重力,勾配,高次微分によって誘導される線形加速度の測定を行う。
本研究は, 簡易な高精度多軸慣性センシングの道を開くとともに, 3次元波面解析へのさらなる応用を想定する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:58:55 GMT)
Moments of Clarity: Streamlining Latent Spaces in Machine Learning using Moment Pooling [0.0] モーメント・ポーリング(Moment Pooling)はディープ・セット・ネットワークの自然な拡張であり、これらのネットワークの潜在空間次元を劇的に減少させる。
クォーク/グルーオンジェット分類のコライダー物理タスクにおけるモーメントプーリングの実証を行った。
潜時次元が 1 のモーメントEFNは、高い潜時次元の通常のEFNと同様の働きをする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:00:01 GMT)
Modeling the Feedback of AI Price Estimations on Actual Market Values [0.0] 人工知能が生成した情報の公開は、市場を永遠に変えることができる。
不動産超インフレは新しい現象ではなく、12年間にわたって一貫したほぼ単調な持続性である。
不動産インフレ率に対するMREE圧力が絶対的なMREE推定誤差と相関しているという予想をシミュレーションで検証する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 03:44:13 GMT)
Measurement-induced phase transitions by matrix product states scaling [0.0] 固定結合次元の行列積状態(MPS)を介して連続的なモニタリングを受ける長い量子スピン鎖の時間発展について検討した。
本研究では, 比較的低い結合次元の値のスケーリング解析により, モニタリング強度の位相遷移が検出可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:29:32 GMT)
Maximum Geometric Quantum Entropy [0.0] 本稿では,情報次元と量子エントロピーの概念を活用するために,最大幾何量子エントロピー原理を提案する。
これにより、完全任意のアンサンブルのエントロピーを定量化し、それを最大化するアンサンブルを選択することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:02:11 GMT)
Matrix decompositions in Quantum Optics: Takagi/Autonne,
Bloch-Messiah/Euler, Iwasawa, and Williamson [0.0] 量子光学においてよく用いられる4つの重要な行列分解について述べる。
これらの分解の最初の2つは特異値分解の特殊版である。
第三の因子はシンプレクティック群(英語版)の異なる部分群に属する行列の観点で一意的にシンプレクティック行列である。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:55:37 GMT)
METER: a mobile vision transformer architecture for monocular depth
estimation [0.0] アート推定の状態を達成できる新しい軽量ビジョントランスフォーマアーキテクチャであるMETERを提案する。
本稿では,METERの3つの代替構成,画像詳細の画素推定と再構成のバランスをとる新たな損失関数,および最終的な予測を改善するための新たなデータ拡張戦略を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:30:08 GMT)
Leveraging Non-Decimated Wavelet Packet Features and Transformer Models
for Time Series Forecasting [0.0] 非時間的および時間的予測手法の入力特徴として,異なる数の消滅モーメントを持つDaubechieウェーブレットを用いる。
我々は,これらのウェーブレットの特徴を,従来の研究よりもはるかに広い予測手法を用いて評価した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:45:29 GMT)
Learning-Enhanced Neighborhood Selection for the Vehicle Routing Problem with Time Windows [0.0] 機械学習(ML)をLarge Neighborhood Search(LNS)に統合し、LNSの各イテレーションにおいて、ソリューションのどの部分が破壊され、修復されるべきかを決定する。
我々のアプローチは普遍的に適用可能であり、すなわち、破壊アルゴリズムの動作を増幅するために任意のLSSアルゴリズムに適用することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:08:27 GMT)
Learning Melanocytic Cell Masks from Adjacent Stained Tissue [0.0] メラノーマは最も攻撃的な皮膚がんの1つであり、皮膚がんの死亡率が高い。
メラノーマはメラノサイト癌であるため、メラノサイト細胞分画ツールを開発する必要がある。
ヘマトキシリンおよびエオシン染色部位からのメラノサイトーシス細胞分画のためのディープニューラルネットワークの訓練方法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:10:38 GMT)
LMStyle Benchmark: Evaluating Text Style Transfer for Chatbots [0.0] LMStyle Benchmarkはチャットスタイルのテキストスタイル転送(C-TST)に適用可能な評価フレームワークである
スタイルの強度測定に加えて、LMStyle Benchmarkは適切性と呼ばれるメトリクスの新たな側面について検討している。
実験により,新しい評価手法は,適切性の観点から人的判断と高い相関性を有することが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:19:30 GMT)
JAXbind: Bind any function to JAX [0.0] JAXbindは、カスタム関数をJAXにバインドするために必要な労力を大幅に削減することを目指している。
JAXbindは、任意のJAX変換をサポートするカスタムのいわゆるJAXプリミティブを定義するための、使い易いPythonインターフェースを提供する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:50:04 GMT)
Inspiration from machine learning on example of optimization of the
Bose-Einstein condensate of thulium atoms in a 1064-nm trap [0.0] ボース=アインシュタイン凝縮体の原子数は実験の規模を決定する。
1064nmの双極子トラップにおけるツリウム原子の凝縮の例として,機械学習から物理を学ぶ可能性を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:16:30 GMT)
Improved YOLOv5 Based on Attention Mechanism and FasterNet for Foreign
Object Detection on Railway and Airway tracks [0.0] 本稿では,FasterNetを取り入れたYOLOv5アーキテクチャの改良と,鉄道や空港の滑走路における異物検出の促進を目的としたアテンション機構を提案する。
このデータセットは、外部オブジェクトターゲットの認識能力を改善することを目的としている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:07:14 GMT)
Improved Image-based Pose Regressor Models for Underwater Environments [0.0] 単一のRGB画像から6自由度ポーズを高精度に再現する。
ステレオカメラ画像を用いたデータ拡張によるモデル精度の向上について検討する。
実験により, 模擬水と清浄水の両方で精度の高いモデルが得られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:20:43 GMT)
Impact of Decoherence on Average Correlation [0.0] 本稿では, 純量子状態の平均相関に対するデコヒーレンスの影響を包括的に研究する。
相減衰と振幅減衰の2つの主要なメカニズムを探索し、それぞれが量子系に異なる影響を及ぼす。
我々の解析は量子コンピューティングの文脈において、位相減衰が量子ビット間の絡み合いと相関にどのように影響するかに着目して理解することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:45:03 GMT)
How to determine the local unitary equivalence of sets of generalized
Bell states [0.0] 局所ユニタリ同値 (LU-equivalence) は効果的な分類ツールである。
任意の次元二部分量子系における一般化ベル状態(GBS)の集合のLU等価性を決定する方法を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:23:57 GMT)
Heat radiation and transfer for nanoparticles in the presence of a
cylinder [0.0] 無限長シリンダーの存在下でのナノ粒子の熱放射と放射熱伝達について検討した。
単一粒子の熱放射はナノワイヤに近接させて増強することができる。
シリンダーに沿った熱伝達は空の真空よりもはるかに遅く崩壊する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:33:32 GMT)
Gauge invariant quantization for circuits including Josephson junctions [0.0] 超伝導の新たな理論は、超伝導の起源は、多電子波動関数からの非自明なベリー接続の出現によるものである。
我々は超伝導量子ビット回路の量子化を再検討する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:21:58 GMT)
Fundamental Components of Deep Learning: A category-theoretic approach [0.0] この論文は、カテゴリ理論の言語に基づく、ディープラーニングのための新しい数学的基礎を発展させている。
我々はまた、既存の多くのアプローチを体系化し、多くの既存の構成と概念を同じ傘の下に置きます。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 01:29:40 GMT)
From human experts to machines: An LLM supported approach to ontology
and knowledge graph construction [0.0] 大規模言語モデル(LLM)は、人間のような自然言語を理解し、生成する能力で最近人気を集めている。
本研究は,オープンソースLLMによって促進されるKGの半自動構築について考察する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:50:15 GMT)
From "um" to "yeah": Producing, predicting, and regulating information flow in human conversation [0.0] 約13ビット/秒の非構造化会話の情報密度を推定する。
我々は,その情報の検索と提示の両方の認知負荷に関連する有意な影響を見出した。
以上の結果から,認知資源の変動的要求にどう反応するか,という理論に関する新たな知見が得られた。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:20:24 GMT)
Foundation Models and Information Retrieval in Digital Pathology [0.0] 本稿では, 基礎モデル, LLM, 生成AI, 情報検索, CBIRの現状について概説する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:28:08 GMT)
Flexible K Nearest Neighbors Classifier: Derivation and Application for
Ion-mobility Spectrometry-based Indoor Localization [0.0] K Nearest Neighbors (KNN) は指紋による局所化や医学など多くの分野で広く使われている。
この論文では、K近傍の近傍が実際に未標識標本に近接していることを保証するKNN変異について論じる。
テストではKNNよりも高い分類精度を達成し、計算要求は同じである。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:14:02 GMT)
Field demonstration of a fully managed, L1 encrypted 3-node network with
hybrid relayed-QKD and centralized symmetric classical key management [0.0] 我々はL1-OTNsec暗号を用いた完全管理された3ノードQKDリングネットワークを実演する。
我々は、QKDと古典的だが量子的に安全な対称鍵のハイブリッドスキームを用いて、ポイントツーポイントとリレー消費者をサポートする。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:34:03 GMT)
Fault Localization in a Microfabricated Surface Ion Trap using Diamond
Nitrogen-Vacancy Center Magnetometry [0.0] ダイヤモンド中の窒素空孔中心をベースとした高分解能量子磁気イメージング技術を用いて,イオントラップチップの短絡欠陥を解析する。
これらの短絡断層から地中への電流を意図的に生成した断層と比較したところ、断層の根本原因はオンチップトレンチコンデンサの故障であることがわかった。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:30:06 GMT)
Extracting Explanations, Justification, and Uncertainty from Black-Box
Deep Neural Networks [0.0] 本稿では,Deep Neural Networks から説明,正当化,不確実性推定を抽出する新しいベイズ的手法を提案する。
我々の手法はメモリと計算の両面で効率的であり、再トレーニングなしにどんなブラックボックスDNNにも適用できる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:06:26 GMT)
Explicit error-correction scheme and code distance for bosonic codes
with rotational symmetry [0.0] 回転対称性を持つ符号は数と回転誤差に関して$(d_n, d_theta)=(N, pi/N)$であることを示す。
また、$N$の回転対称性を持つ符号は、数と回転誤差に関して$(d_n, d_theta)=(N, pi/N)$であることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:49:24 GMT)
Evaluating the Application of Large Language Models to Generate Feedback in Programming Education [0.0] 本研究では,大規模言語モデル,特にGPT-4のプログラミング教育への応用について検討する。
本研究は, GPT-4 を用いてプログラミングタスクに対するフィードバックを提供する Web アプリケーションの設計について概説する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 23:14:35 GMT)
Evaluating Pedagogical Incentives in Undergraduate Computing: A Mixed Methods Approach Using Learning Analytics [0.0] 本稿では,ユニヴァーシティ・カレッジ・ロンドンにおける1年目のコンピュータ・モジュールにおける新たな教育的インセンティブの効果を評価する。
我々は、学習分析と質的データを組み合わせて、これらのインセンティブの有効性を学生のエンゲージメントを高めるために、混合手法を用いて評価する。
本稿では,データ駆動型客観分析を学生の視点と統合した,生徒のエンゲージメントに対する解釈可能かつ行動可能なモデルを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:39:38 GMT)
Error analysis in large area multi-Raman pulse atom interferometry due to undesired spontaneous decay [0.0] 原子干渉計(感度を制御する)は、原子雲により大きな運動量キックを与えることで増大させることができる。
そのような原子光学技術の一つは、中心の$pi-$Ramanパルスの数を増やすことである。
中間高エネルギー状態における時間の増加は、望ましくない自然崩壊の確率が高く、量子情報の損失をもたらす。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:09:45 GMT)
Entangled Photon-pair Generation in Nonlinear Thin-films [0.0] 非線形薄膜における自発パラメトリックダウンコンバージョンを記述するために, 完全ベクトルおよび非パラ軸形式を開発した。
非線形薄膜における絡み合った光子対生成のダイナミクスを詳細に研究する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:46:38 GMT)
Efficient quantum amplitude encoding of polynomial functions [0.0] 実関数を$n$ qubitsで符号化する2つの効率的な方法を紹介し比較する。
まず、線形関数をワード列多制御ゲートで量子レジスタにエンコードする。
第2に、この構成をビルディングブロックとして使用し、線形関数に対応する振幅のブロック符号化を実現する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:07:40 GMT)
Does one still need to "shut up and calculate"? [0.0] 我々は、最も初等的で、最も扱いにくい概念は、物理事象に対する複雑な確率振幅の存在であると主張する。
量子光学の分野の基本的な例は、ファインマンの原理への固執が量子力学の魔法に対してより良く、より直感的な評価をもたらすことを証明している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:03:25 GMT)
Do Large Language Models Solve ARC Visual Analogies Like People Do? [0.0] 我々は、新しいARCアイテム群において、人間と大規模言語モデル(LLM)のパフォーマンスを比較した。
以上の結果から, 子どもと大人の双方がこれらの課題においてLLMよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:48:13 GMT)
Dielectric microwave resonator with large optical apertures for
spin-based quantum devices [0.0] 内部品質係数が2.30タイムs104$のマイクロ波共振器は、直径が8, Mathrmmm$..
2,2-ジフェニル-1-ピクリルヒドラジル (DPPH) 結晶粉末に対して連続波 (cw) とパルス電子スピン共鳴 (ESR) 分光を行った。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:18:37 GMT)
Deep learning modelling of manufacturing and build variations on
multi-stage axial compressors aerodynamics [0.0] 本稿では,製造・施工のバリエーションをリアルタイムに予測するためのディープラーニングフレームワークの開発と応用について述べる。
提案アーキテクチャは,産業関連アプリケーションに対して,CFDベンチマークに匹敵する精度をリアルタイムに達成できることが証明されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:42:40 GMT)
Deep Learning Based Dynamics Identification and Linearization of Orbital Problems using Koopman Theory [0.0] 本研究では, 2-Body 問題と円制限 3-Body 問題の同時同定と大域的線形化のための枠組みを提案する。
本稿では、クープマン作用素が、再訓練を必要とせずに、他の様々な2音素系に一般化できる能力を示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 21:11:58 GMT)
Data augmentation with automated machine learning: approaches and
performance comparison with classical data augmentation methods [0.0] 最先端のアプローチは一般的に、自動機械学習(AutoML)の原則に依存します。
本稿では,AutoMLに基づくデータ拡張技術に関する総合的な調査を紹介する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:00:38 GMT)
Cyclical Log Annealing as a Learning Rate Scheduler [0.0] 学習率スケジューラ(英: learning rate scheduler)とは、モデル学習過程において、様々な探索ステップの指示セットである。
本稿では,降下勾配を通したステップサイズを過度に再起動する手法を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:07:20 GMT)
Current experimental upper bounds on spacetime diffusion [0.0] 古典的な時空で相互作用する量子系の力学を記述する一貫した理論が、最近オッペンハイムらによって提唱された。
本稿では,このような時空拡散に関する実験的な上限について,非常に低力音を伴ういくつかの実験のレビューに基づいて報告する。
我々は、オッペンハイムらによって提示された明示的モデルの初期境界よりも、少なくとも15桁低い上限を求める。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 19:00:54 GMT)
Constructive nonlocal games with very small classical values [0.0] 本稿では,いわゆるリニアゲームの古典的価値を分析することを目的とする。
我々は、高調波解析の文脈において、グラフ理論の非自明な結果と、それ以前の数論的な結果を用いる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:48:38 GMT)
Constructing Variables Using Classifiers as an Aid to Regression: An
Empirical Assessment [0.0] 本稿では,初期入力ベクトルに含まれる情報を補完する変数の自動生成手法を提案する。
提案手法を5種類の回帰器を用いて検証し,33種類の回帰データセットで評価した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:01:57 GMT)
Complex dynamics approach to dynamical quantum phase transitions: the
Potts model [0.0] 本稿では1次元および2次元の量子3状態ポッツモデルにおける動的量子相転移を研究するための複素力学法を紹介する。
特殊な境界条件は遷移の性質を変化させることができ、伝達行列計算により一次元系のクレームを検証できることを示す。
我々のアプローチは、多変数問題、高次元、および有理関数として表される近似RG変換にまで拡張することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 11:11:32 GMT)
Chatbots as social companions: How people perceive consciousness, human likeness, and social health benefits in machines [0.0] チャットボットを定期的に利用している人と、それを使用していない人について検討した。
期待とは対照的に、コンパニオンユーザーはこれらの関係が社会的健康に有益であることを示した。
相手のチャットボットを、より意識的で人間らしく認識することは、より肯定的な意見と、より顕著な社会的健康上の利益と相関している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:49:36 GMT)
Can physical information aid the generalization ability of Neural
Networks for hydraulic modeling? [0.0] 河川水理学へのニューラルネットワークの適用は、データ不足に苦しむ分野にもかかわらず、未熟である。
本稿では,トレーニングフェーズに物理情報を導入することで,そのような問題を緩和することを提案する。
このようなソフトな物理情報を組み込むことで予測能力を向上できることを示す。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:51:16 GMT)
CAM: A Collection of Snapshots of GitHub Java Repositories Together with
Metrics [0.0] 2024年3月2日に公開された2.2Gbの最新アーカイブには、クラス毎に48のメトリクスを持つ532KのJavaクラスが含まれています。
少なくとも年に1回は、非常に強力なサーバ上で最低10日間のプロセスであるスクリプト全体を実行して、新しいデータセットを生成します。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:52:57 GMT)
Bolstering Stochastic Gradient Descent with Model Building [0.0] 勾配降下法とその変種は、優れた収束率を達成するためのコア最適化アルゴリズムを構成する。
本稿では,前方ステップモデル構築に基づく新しいアルゴリズムを用いて,線探索の代替手法を提案する。
提案アルゴリズムは、よく知られたテスト問題において、より高速な収束とより優れた一般化を実現する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:20:14 GMT)
Big Bang, Low Bar -- Risk Assessment in the Public Arena [0.0] 潜在的な失敗が悲惨なほど、それを安全に無視する前には、その必要がより不可能なものになる。
この原則は、リスクに関する世論では容易に見過ごされる。
失敗はこのケースに特有のものではないが、近年の議論は、この原則がいかに容易に見落とされ得るかを示す、特に顕著な例を提供している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:31:44 GMT)
Beyond-adiabatic Quantum Admittance of a Semiconductor Quantum Dot at
High Frequencies: Rethinking Reflectometry as Polaron Dynamics [0.0] 我々は、電荷貯水池に結合した量子ドットトンネルのアプタンスを得るために、自己整合量子マスター方程式の定式化を開発する。
本報告では,QD状態のドレッシングによって決定されるFloquet wideeningと,光子損失によって決定されるFloquet wideeningの2つについて述べる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:43:07 GMT)
Bell Correlations as Selection Artefacts [0.0] ベル相関は,実験の初期状態の通常の制御によって生じる特別な選択人工物として生じる可能性があることを示す。
これは非局所性であり、直接的な空間的な因果関係や影響を含まない。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 00:38:56 GMT)
Bayesian Optimization that Limits Search Region to Lower Dimensions
Utilizing Local GPR [0.0] 本稿では,探索領域を低次元に制限し,局所ガウス過程回帰(LGPR)を用いてBOを高次元に拡張するBOを提案する。
LGPRは低次元の探索領域を「局所的」として扱い、予測精度を向上させる。
従来法よりも25%,LGPRを使わずに3.4%の比抵抗化を実現した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 08:34:40 GMT)
Anti-Jamming Path Planning Using GCN for Multi-UAV [0.0] UAVスワーミングの有効性は、ジャミング技術によって著しく損なわれる可能性がある。
UAV群集が集団知能を利用してジャム領域を予測する手法が提案されている。
マルチエージェント制御アルゴリズムを使用して、UAVスワムを分散し、ジャミングを回避し、ターゲットに到達すると再グループ化する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 07:28:05 GMT)
Ancilla-free measurement of out-of-time-ordered correlation functions:
General measurement protocol and Rydberg atom implementation [0.0] 本稿では,多体量子システムにおいて,時間外順序付き相関関数へのアクセスを可能にするプロトコルを提案する。
我々は、Rydberg-dressed 原子の配列におけるハミルトニアン符号逆変換 $Hto-H$ の戦略を提唱した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 16:20:37 GMT)
An optically defined phononic crystal defect [0.0] 光力で完全に制御された欠陥モードを持つフォノン結晶を提示する。
我々はSi$_3$N$_4$フォノン結晶膜の単一単位セルに強い光トラップを印加する。
これは、モードの空間プロファイルが結晶全体に広がるものから、わずか数個の単位セルに閉じ込められたものへと局所化されるのを伴う。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 13:16:16 GMT)
An Integrated Usability Framework for Evaluating Open Government Data
Portals: Comparative Analysis of EU and GCC Countries [0.0] 本研究は、多様な利害関係者間の透明性と協力を促進するために、オープン政府データ(OGD)ポータルが果たす重要な役割について考察する。
本稿では,ユーザビリティ,多様な集団とのコミュニケーション,戦略的価値創造の課題を認識し,OGDポータルの有効性を評価するための統合的な枠組みを開発する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 12:06:42 GMT)
Agricultural Recommendation System based on Deep Learning: A
Multivariate Weather Forecasting Approach [0.0] 本稿では,天気予報モデルを用いたコンテキスト型作物推薦システムを提案する。
提案された気象モデルは、バングラデシュの任意の場所において降雨、気温、湿度、日差しを平均して0.9824で予測することができる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 02:03:20 GMT)
Acoustic Side Channel Attack on Keyboards Based on Typing Patterns [0.0] キーボードに対するサイドチャネル攻撃は、入力デバイスとしてキーボードを使用する多くのシステムにおけるセキュリティ対策をバイパスすることができる。
本稿では,現実的な環境におけるユーザのタイピングパターンを考慮に入れた適用方法を提案する。
本手法は実世界のシナリオを考慮した場合, ケーススタディ全体で平均43%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 17:44:15 GMT)
AcademiaOS: Automating Grounded Theory Development in Qualitative Research with Large Language Models [0.0] AcademiaOSは、大規模言語モデルを用いた質的研究において、基底理論の開発を自動化する最初の試みである。
ユーザスタディは、このシステムが学術コミュニティで受け入れられ、質的研究において人間を増強する可能性を示すことを示唆している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:54:49 GMT)
AI coach for badminton [0.0] 本研究では,バドミントンマッチの映像を識別し,プレイヤーの運動学と生体力学の知見を抽出する。
この研究は、姿勢、技術、筋肉の向きの改善を示唆する予測モデルを導出することを目的としている。
これらの勧告は、誤ったテクニックを緩和し、関節疲労のリスクを低減し、全体的なパフォーマンスを向上させるように設計されている。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 20:51:21 GMT)
A realistic model for completing Quantum Mechanics [0.0] コペンハーゲンでは、物理的対象と実験結果はマクロ言語でのみ記述できる。
測定問題は、主に波動関数の低減プロセスの導入を必要とするため、これらの困難の中心にある。
我々は、測定問題とそれに関連する他の問題をすべて解決できるモデルを構築し、提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 10:41:40 GMT)
A continuous beam monochromator for matter waves [0.0] 原子干渉計の構築における一般的な方法論は、レーザービームから作製した格子の利用である。
本研究では,原子-表面回折に基づいて,速度比103$の超高速精製を実現する連続ビームモノクロマター方式を提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 09:02:16 GMT)
A Three-Phases SFT Hybrid Model Integrated Strong Prior Module and Data Overlap Estimation in the Eduation Context [0.0] 教師付き微調整モデルとして,エンド・ツー・エンドの3相モデルを提案する。
本モデルは,学習知識の構造的分解と漸進的指導によるアウトプットを実現する。
当社のモデルは,オープンソースモデルと比較して,コード能力の最先端性も達成している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 05:38:39 GMT)
A Sophisticated Framework for the Accurate Detection of Phishing Websites [0.0] フィッシング(英: Phishing)は、ますます洗練されたサイバー攻撃形態であり、世界中の企業に巨額の経済的損害を与えている。
本稿では,フィッシングサイトを検出するための包括的手法を提案する。
特徴選択, 欲求アルゴリズム, クロスバリデーション, 深層学習を組み合わせて, 洗練された積み重ねアンサンブルを構築している。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:26:25 GMT)
A New Quantum CNN Model for Image Classification [0.0] 量子密度行列は、画像特徴情報と古典的画像分類の特徴との関係性を高めることができると論じる。
一連の実験により、画像分類における量子密度行列の応用は、異なるデータセットに対する一般化と高効率性を有することが示された。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 14:46:05 GMT)
A Framework for Strategic Discovery of Credible Neural Network Surrogate Models under Uncertainty [0.0] 本研究では,Occam Plausibility Algorithm for surrogate model (OPAL-surrogate)を提案する。
OPAL-surrogateは、予測ニューラルネットワークベースのサロゲートモデルを明らかにするための、体系的なフレームワークを提供する。
モデルの複雑さ、正確性、予測の不確実性の間のトレードオフをバランスさせる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 18:45:51 GMT)
A 4-8 GHz Kinetic Inductance Travelling-Wave Parametric Amplifier Using
Four-Wave Mixing with Near Quantum-Limit Noise Performance [0.0] 動インダクタンス進行波パラメトリック増幅器(KI-TWPA)は、量子制限感度に近づき、比較的高いダイナミックレンジを有する広い瞬時帯域を有する。
本研究では,NbTiNマイクロストリップ伝送線路における4波長混合に基づくKI-TWPAの設計,製造,性能について述べる。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 15:39:28 GMT)
7T MRI Synthesization from 3T Acquisitions [0.0] 改良されたディープラーニング技術は、3T MRI入力から合成された7T MRIを生成するために使用できる。
本稿では,V-Net畳み込みニューラルネットワークのカスタム設計版に基づく,新しい7T合成アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 13 Mar 2024 22:06:44 GMT)