Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems [133.5] 大規模言語モデル(LLM)の出現は、人工知能の変革的シフトを触媒している。
これらのエージェントがAI研究と実践的応用をますます推進するにつれて、その設計、評価、継続的な改善は複雑で多面的な課題を呈している。
この調査は、モジュール化された脳にインスパイアされたアーキテクチャ内でインテリジェントエージェントをフレーミングする、包括的な概要を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:29 GMT)
Model Hemorrhage and the Robustness Limits of Large Language Models [119.5] 大規模言語モデル(LLM)は、自然言語処理タスク全体で強力なパフォーマンスを示すが、デプロイメント用に修正された場合、大幅なパフォーマンス低下を経験する。
この現象をモデル出血(パラメータ変更とアーキテクチャ変更によるパフォーマンス低下)と定義する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:16:03 GMT)
Eliminating Position Bias of Language Models: A Mechanistic Approach [119.3] 位置バイアスは現代言語モデル (LM) の一般的な問題であることが証明されている。
我々の力学解析は、ほぼ全ての最先端のLMで使われている2つのコンポーネント(因果的注意と相対的位置エンコーディング)に位置バイアスが関係している。
位置バイアスを排除することによって、LM-as-a-judge、検索強化QA、分子生成、数学推論など、下流タスクのパフォーマンスと信頼性が向上する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:37:34 GMT)
Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation [118.5] 我々は任意の条件下で制御可能なビデオ生成のための新しいフレームワークであるAny2Captionを提示する。
現代のマルチモーダルな大言語モデル(MLLM)を活用することで、Any2Captionはテキスト、画像、ビデオ、地域、動き、カメラのポーズなど、多種多様な入力を解釈する。
包括的評価は,既存の映像生成モデルの様々な側面において,制御性と映像品質の大幅な向上を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:01 GMT)
HOIGen-1M: A Large-scale Dataset for Human-Object Interaction Video Generation [99.7] 我々は,HOI生成のための最初の大規模データセットであるHOIGEN-1Mを紹介した。
高品質なビデオを実現するために,我々はまず,強力なマルチモーダル大言語モデル(MLLM)を用いて,HOIビデオを自動的にキュレートする効率的なフレームワークを設計する。
HOIビデオの正確なテキストキャプションを得るために,Mixture-of-Multimodal-Experts(MoME)戦略に基づく新しいビデオ記述手法を設計する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:30:34 GMT)
Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like Architectures [96.0] 本稿では、NLPフィールドで使用されるRWKVモデルから適応したVision-RWKVを紹介する。
我々のモデルは、スパース入力を効率的に処理し、ロバストなグローバル処理能力を実証するために設計されている。
評価の結果,VRWKVは画像分類におけるViTの性能を超え,高速化とメモリ使用量の削減を図っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:14:48 GMT)
Expanding RL with Verifiable Rewards Across Diverse Domains [92.4] 検証可能な報酬を伴う強化学習(RLVR)は、数学的推論やコーディングタスクにおいて有望な結果を示している。
我々は、医学、化学、心理学、経済学など、より多様な分野へのRLVRの拡張について研究する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:22:49 GMT)
Synergizing Self-Regulation and Artificial-Intelligence Literacy Towards Future Human-AI Integrative Learning [92.3] 自己制御学習(SRL)と人工知能(AI)リテラシーは、人間とAIの対話学習を成功させる上で重要な能力となっている。
本研究では,4つの学習グループを明らかにするクラスタリング手法を用いて,1,704人の中国人大学生のデータを分析した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:41:21 GMT)
Don't lie to your friends: Learning what you know from collaborative self-play [90.4] 我々は、AIエージェントが知っていることを教えるために、根本的に新しいアプローチを提案する。
我々は,集団が正解に到達して報奨を受けるマルチエージェントコラボレーションを構築した。
望ましいメタ知識は、相互作用の構造に組み込まれたインセンティブから生まれる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:28:02 GMT)
The Devil is in the Distributions: Explicit Modeling of Scene Content is Key in Zero-Shot Video Captioning [89.6] ゼロショットビデオキャプションのためのプログレッシブな多粒性テキストプロンプト戦略を提案する。
提案手法は,名詞句,名詞句のシーングラフ,全文を含む3つの異なる記憶バンクを構築する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:00:19 GMT)
SPA-Bench: A Comprehensive Benchmark for SmartPhone Agent Evaluation [89.2] スマートフォンエージェントは、ユーザーがデバイスを効率的に制御するのを助けるためにますます重要になっている。
We present SPA-Bench, a comprehensive SmartPhone Agent Benchmark designed to evaluate (M)LLM-based agent。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:39:17 GMT)
ActionStudio: A Lightweight Framework for Data and Training of Large Action Models [88.9] ActionStudioは、大規模アクションモデルのための軽量で標準化されたデータおよびトレーニングフレームワークである。
LoRAやフル微調整,分散セットアップなど,さまざまなトレーニングパラダイムをサポートする。
公的な業界ベンチマークと現実的な業界ベンチマークの両方で有効性を検証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:38:50 GMT)
AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization [86.8] 異種MLLMに適した新しいモデルマージ手法であるAdaMMSを提案する。
提案手法は,マッピング,マージ,検索という3段階の課題に対処する。
ラベル付きデータ無しで異種MLLMをマージできる最初のモデルマージ手法として、AdaMMSは様々なビジョンベンチマークで過去のモデルマージ手法より優れている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:13:02 GMT)
Will Pre-Training Ever End? A First Step Toward Next-Generation Foundation MLLMs via Self-Improving Systematic Cognition [86.2] 自己改善認知(Self-Improving cognition、SIcog)は、次世代基礎言語モデルを構築するための自己学習フレームワークである。
ステップバイステップの視覚的理解手法であるChain-of-Descriptionを導入し、構造化連鎖推論(CoT)を統合し、深いマルチモーダル推論をサポートする。
広範囲にわたる実験により、SIcogはマルチモーダル認知を著しく改善した次世代基盤MLLMを生産することが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:04:05 GMT)
An Iterative Bayesian Approach for System Identification based on Linear Gaussian Models [86.1] システム識別の問題に取り組み、入力を選択し、実際のシステムから対応する出力を観測し、データに最も合うようにモデルのパラメータを最適化する。
本稿では,任意のシステムやパラメトリックモデルと互換性のある,フレキシブルで計算可能な手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:54:20 GMT)
Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.6] ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。
本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:24:31 GMT)
DCAD-2000: A Multilingual Dataset across 2000+ Languages with Data Cleaning as Anomaly Detection [81.9] 新たに抽出したCommon Crawlデータを用いて構築された大規模多言語コーパスであるDCAD-2000を導入する。
DCAD-2000には2,282言語、46.72TBのデータ、833億のドキュメントがあり、155のハイソース言語と159のスクリプトがある。
我々はFineTaskベンチマークでDCAD-2000の品質を評価し、多言語データセットの品質とタスク性能を大幅に改善した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:25:57 GMT)
Inductive Moment Matching [81.0] Inductive Moment Matching (IMM) は1段階または数段階のサンプリングのための新しい生成モデルである。
IMMはImageNet-256x256上の拡散モデルを8ステップのみを用いて1.99 FIDで上回り、CIFAR-10上で1.98の最先端の2ステップFIDをスクラッチから訓練したモデルで達成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:02:38 GMT)
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models [79.0] DICE(Discrete Inversion for Controllable Editing)を導入し,離散拡散モデルの正確なインバージョンを実現する。
逆拡散過程におけるノイズシーケンスとマスキングパターンを記録することにより、DICEは離散データの正確な再構成とフレキシブルな編集を可能にする。
以上の結果から,DICEは高いデータ忠実性を保ちながら編集能力を向上し,離散空間における微細なコンテンツ操作の新たな機会を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:17:51 GMT)
On the Differential Privacy and Interactivity of Privacy Sandbox Reports [78.9] GoogleのPrivacy Sandboxイニシアチブには、プライバシ保護広告機能を実現するAPIが含まれている。
これらのAPIのプライバシを分析するための抽象モデルを提供し、それらが正式なDP保証を満たすことを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:09:20 GMT)
Truth or Mirage? Towards End-to-End Factuality Evaluation with LLM-Oasis [78.1] LLM-Oasisは、エンド・ツー・エンドの事実性評価をトレーニングするための最大のリソースである。
ウィキペディアからクレームを抽出し、これらのクレームのサブセットを偽造し、事実と非事実のテキストのペアを生成することで構築される。
次に、データセットの品質を検証し、事実性評価システムのための金の標準テストセットを作成するために、人間のアノテータに依存します。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:55:07 GMT)
MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues [71.9] Momentum Multi-modal target extract (MoMuSE)について紹介する。
MoMuSEはメモリ内に話者アイデンティティの運動量を保持しており、モデルがターゲット話者を継続的に追跡することができる。
実験により、特に視覚的手がかりの重篤な障害のあるシナリオにおいて、MoMuSEは顕著な改善を示すことが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:31:19 GMT)
MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models [71.4] 我々は、LVLM(Large Vision-Language Models)において、インターリーブされたマルチモーダル理解と生成を評価するための大規模ベンチマークであるMMIEを紹介する。
MMIEは、数学、コーディング、物理学、文学、健康、芸術を含む3つのカテゴリ、12のフィールド、102のサブフィールドにまたがる20Kの厳密にキュレートされたマルチモーダルクエリで構成されている。
インターリーブされたインプットとアウトプットの両方をサポートし、多様な能力を評価するために、複数選択とオープンな質問フォーマットの混合を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:59:50 GMT)
XLRS-Bench: Could Your Multimodal LLMs Understand Extremely Large Ultra-High-Resolution Remote Sensing Imagery? [68.4] 超高分解能RSシナリオにおけるMLLMの知覚と推論能力を評価するための総合的なベンチマークであるXLRS-Benchを提案する。
超高分解能RS画像上の新しい半自動キャプタによって手動で注釈付けされたすべての評価試料。
XLRS-Bench上の一般およびRSに焦点を当てたMLLMの結果は、現実世界のRSアプリケーションにはさらなる努力が必要であることを示唆している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:41:18 GMT)
Can Test-Time Scaling Improve World Foundation Model? [67.8] 我々は世界基盤モデル(WFM)に適したテストタイムスケーリングフレームワークであるSWIFTを紹介する。
COSMOSモデルの実証的な結果は、テストタイムのスケーリングが計算-最適方法であっても存在することを示している。
その結果,テストタイムスケーリング法則はWFMに対して有効であり,SWIFTはモデルサイズを調整・増大させることなく,WFM推論を改善するためのスケーラブルで効果的な経路を提供することがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:07:37 GMT)
All-optical modulation with single-photons using electron avalanche [66.3] シリコン中の電子雪崩による全光変調を実証する。
我々のアプローチは、ギガヘルツ速度と、さらに高速な光スイッチングの可能性を開く。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:33:26 GMT)
FakeScope: Large Multimodal Expert Model for Transparent AI-Generated Image Forensics [66.1] 本稿では,AIによる画像鑑定に適した専門家マルチモーダルモデル(LMM)であるFakeScopeを提案する。
FakeScopeはAI合成画像を高精度に識別し、リッチで解釈可能なクエリ駆動の法医学的な洞察を提供する。
FakeScopeは、クローズドエンドとオープンエンドの両方の法医学的シナリオで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:12:48 GMT)
JudgeLRM: Large Reasoning Models as a Judge [65.1] 我々は,Large Language Models (LLMs) の判断が推論能力の強化から真に恩恵を受けるかどうかを考察する。
本稿では、強化学習(RL)を用いて学習した判断指向LLMのファミリーであるジャッジLRMを紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:18:51 GMT)
UltraRAG: A Modular and Automated Toolkit for Adaptive Retrieval-Augmented Generation [64.8] Retrieval-Augmented Generation (RAG) は、下流タスクにおける大規模言語モデル(LLM)の性能を大幅に向上させる。
既存のRAGツールキットは、特定のアプリケーションシナリオに適した知識適応をサポートしていない。
ワークフロー全体を通して知識適応を自動化するRAGツールキットであるUltraRAGを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:49:49 GMT)
TransXNet: Learning Both Global and Local Dynamics with a Dual Dynamic Token Mixer for Visual Recognition [63.9] グローバル・ローカル・ダイナミクスを同時に学習するための軽量なデュアル・ダイナミック・トケン・ミキサー(D-Mixer)を提案する。
我々は、新しいハイブリッドCNN-TransformerビジョンバックボーンネットワークであるTransXNetを設計するために、基本的なビルディングブロックとしてD-Mixerを使用している。
ImageNet-1K分類では、TransXNet-TはSwin-Tを0.3%上回り、計算コストの半分以下である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:29:53 GMT)
LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification [63.1] 本稿では,AG-ReID のための新しいフレームワーク LATex を提案する。
属性ベースのテキスト知識を活用するために、プロンプトチューニング戦略を採用する。
我々のフレームワークは、AG-ReIDを改善するために属性ベースのテキスト知識を完全に活用できる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:47:05 GMT)
MovieBench: A Hierarchical Movie Level Dataset for Long Video Generation [62.9] 長いビデオ生成モデルの分析、評価、トレーニングに適したデータセットは公開されていない。
The MovieBench: A Hierarchical Movie-Level dataset for Long Video Generation。
データセットは公開され、継続的に維持され、長いビデオ生成の分野を前進させることを目的としている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:52:56 GMT)
Synthetic Prior for Few-Shot Drivable Head Avatar Inversion [61.5] そこで本研究では,合成前駆体に基づく乾燥可能な頭部アバターの少数ショット逆転法であるSynShotを提案する。
合成データのみに基づいて訓練された機械学習モデルに着想を得て,合成頭部の大きなデータセットから先行モデルを学習する手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:30:17 GMT)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.9] World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:26:30 GMT)
Emphasizing Discriminative Features for Dataset Distillation in Complex Scenarios [60.5] 合成画像における重要な識別領域を強化するデータセット蒸留法であるEDFを提案する。
単純なデータセットでは、高活性化領域が画像の大部分を占めるのに対して、複雑なシナリオでは、これらの領域のサイズはずっと小さくなります。
特にEDFは、ImageNet-1Kサブセットのような複雑なシナリオにおいて、SOTAの結果を一貫して上回る。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:10:38 GMT)
Consistent Subject Generation via Contrastive Instantiated Concepts [60.0] コントラッシブ・コンセプト・インスティファイション(CoCoIns)を導入し,複数の独立した生成物にまたがる一貫性のある主題を効果的に合成する。
このフレームワークは生成モデルとマッピングネットワークで構成されており、入力潜時符号を特定の概念のインスタンスに関連する擬単語に変換する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:51 GMT)
DiET-GS: Diffusion Prior and Event Stream-Assisted Motion Deblurring 3D Gaussian Splatting [59.9] 拡散前およびイベントストリーム支援動作3DGSであるDiET-GSについて述べる。
我々のフレームワークは、2段階のトレーニング戦略において、ぼやけのないイベントストリームと拡散の両方を効果的に活用する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:27:07 GMT)
Chapter-Llama: Efficient Chaptering in Hour-Long Videos with LLMs [59.9] ビデオチャプティングの課題、すなわち、長いビデオタイムラインを意味単位に分割し、対応するチャプティングタイトルを生成する。
本稿では,音声書き起こし内容に基づく軽量な音声誘導フレーム選択手法を提案し,その利点を実験的に示す。
以上の結果から,最新のVidChapters-7Mベンチマークでは,技術の現状よりも大幅な改善が見られた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:41:29 GMT)
CBIL: Collective Behavior Imitation Learning for Fish from Real Videos [58.8] 魚の学習行動を直接ビデオから学習するためのスケーラブルなアプローチCBIL(Collective Behavior Imitation Learning)を提案する。
MVAEは2次元の観察を、模倣学習段階に従うためにコンパクトで表現力のある暗黙の状態に効果的にマッピングする。
CBILは、学習された集合的な動きの前の様々なアニメーションタスクに使用することができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:15:00 GMT)
Balls-and-Bins Sampling for DP-SGD [57.0] 本稿では,DP-SGD などのDP最適化手法に対する Balls-and-Bins サンプリングを提案する。
我々は,Balls-and-Binsサンプリングが,Balls-and-Binsサンプリングの実装をShufflingと類似した「ベスト・オブ・ボトム」サンプリングを実現することを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:49:32 GMT)
Towards Understanding How Knowledge Evolves in Large Vision-Language Models [55.8] 我々はマルチモーダル知識がどのように進化し、最終的にLVLM(Large Vision-Language Models)において自然言語を誘導するかを考察する。
知識進化における2つの重要なノードを同定する: 臨界層と突然変異層、進化過程を3段階に分割する: 急速な進化、安定化、突然変異。
我々の研究は、LVLMにおける知識進化の軌跡を初めて明らかにし、その基盤となるメカニズムを理解するための新たな視点を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:35:37 GMT)
Short-video Propagation Influence Rating: A New Real-world Dataset and A New Large Graph Model [55.6] クロスプラットフォームのショートビデオデータセットには、117,720の動画、381,926のサンプル、中国最大の5つのプラットフォームにわたる535のトピックが含まれている。
大グラフモデル(LGM)NetGPTは、多種多様なグラフ構造データを強力な推論能力とLarge Language Models(LLM)の知識で橋渡しすることができる
我々のNetGPTは,短ビデオ伝搬グラフの理解と解析が可能であり,短ビデオの長期伝搬の影響を予測できる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:53:15 GMT)
Drag Your Gaussian: Effective Drag-Based Editing with Score Distillation for 3D Gaussian Splatting [55.1] DYGは3次元ガウススプラッティングのための効果的な3次元ドラッグベース編集法である。
3次元マスクと一対の制御点を入力して編集範囲を正確に制御できる。
DYGは暗黙三面体表現の強さを統合し、編集結果の幾何学的足場を確立する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:45:59 GMT)
Cropper: Vision-Language Model for Image Cropping through In-Context Learning [54.3] 画像トリミングのための大規模視覚言語モデル(VLM)を効果的に活用する手法を提案する。
まず,画像トリミングのための効率的なプロンプト検索機構を提案する。
第2に、予測された作物を反復的に増強する反復的改良戦略を導入する。
提案手法は, 自由形態の収穫, 主観的な収穫, アスペクト比の収穫など, 広範囲にわたる収穫作業に適用可能である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:42:39 GMT)
Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1 [53.9] ビデオ理解におけるMLLMのポストトレーニング手法を評価するためのベンチマークであるSEED-Bench-R1を紹介する。
複雑な現実世界のビデオや、複数の質問の形式での複雑な日常的な計画タスクも含んでいる。
Qwen2-VL-Instruct-7Bをベースモデルとして、RLと教師付き微調整(SFT)を比較した。
我々の詳細な分析では、RLは視覚知覚を増強するが、しばしばコヒーレント推論連鎖を減少させる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:55:23 GMT)
MedTrinity-25M: A Large-scale Multimodal Dataset with Multigranular Annotations for Medicine [53.0] 本稿では,医療用大規模マルチモーダルデータセットであるMedTrinity-25Mを紹介する。
65以上の疾患に対する多彩なアノテーションを備えた10のモダリティで、2500万以上の画像をカバーしている。
画像テキストペアの可用性に制限がある既存のマルチモーダルデータセットとは異なり、我々は最初の自動パイプラインを開発した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:11:59 GMT)
Enhancing Large Language Models (LLMs) for Telecommunications using Knowledge Graphs and Retrieval-Augmented Generation [52.8] 大規模言語モデル(LLM)は、汎用自然言語処理タスクにおいて大きな進歩を遂げている。
本稿では,知識グラフ(KG)と検索拡張生成(RAG)技術を組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:58:08 GMT)
Can Diffusion Models Disentangle? A Theoretical Perspective [52.4] 本稿では,拡散モデルが非交叉表現を学習する方法を理解するための新しい理論的枠組みを提案する。
我々は、一般的な非絡み付き潜在変数モデルの識別可能性条件を確立し、トレーニング力学を解析し、非絡み付き潜在部分空間モデルのサンプル複雑性境界を導出する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:46:18 GMT)
Context-Aware Weakly Supervised Image Manipulation Localization with SAM Refinement [52.2] 悪意のある画像操作は社会的リスクを生じさせ、効果的な画像操作検出方法の重要性を高めている。
画像操作検出の最近のアプローチは、完全に教師されたアプローチによって大きく推進されている。
本稿では,デュアルブランチトランスフォーマー-CNNアーキテクチャに基づく,弱教師付きフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:54:08 GMT)
Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models [51.9] 大規模言語モデル(LLM)の最近の進歩は、複雑な推論タスクを実行する能力を大幅に強化している。
システム1推論は計算効率が良いが、最適以下の性能をもたらす。
システム2推論(System 2 reasoning)は、思考の遅さや非効率性、不必要な推論の振る舞いにより、かなりの計算コストを発生させることが多い。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:58:07 GMT)
Learning Bijective Surface Parameterization for Inferring Signed Distance Functions from Sparse Point Clouds with Grid Deformation [50.3] 疎点雲から符号付き距離関数(SDF)を推定することは、表面再構成の課題である。
本稿では,SDFをエンドツーエンドに予測するために動的変形ネットワークを学習する新しい手法を提案する。
合成および実スキャンデータを用いた実験結果から,本手法は最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:27:02 GMT)
Intrinsically-Motivated Humans and Agents in Open-World Exploration [50.0] 複雑なオープンエンド環境で、大人、子供、AIエージェントを比較します。
エントロピーとエンパワーメントだけが、人類の探査の進歩と一貫して正の相関関係にあることがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:09:00 GMT)
Training-Free Exponential Context Extension via Cascading KV Cache [49.6] カスケードサブキャッシュバッファを利用して,最も関連性の高いトークンを選択的に保持する機構を導入する。
本手法は,1Mトークンのフラッシュアテンションと比較して,プリフィルステージ遅延を6.8倍削減する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:28:44 GMT)
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training [48.9] Easi3Rは,4次元再構成のための簡易かつ効率的なトレーニングフリー手法である。
提案手法は,事前学習やネットワークファインチューニングの必要性を排除し,推論中の注意適応を適用した。
実世界のダイナミックビデオの実験では、従来の最先端手法よりも軽量な注意適応が著しく優れていたことが示されている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:58 GMT)
Texture or Semantics? Vision-Language Models Get Lost in Font Recognition [48.9] FRB(Font Recognition Benchmark)は15のフォントからなるコンパクトで構造化されたデータセットである。
FRBには2つのバージョンがある: (i) 簡単なバージョン、10つの文を異なるフォントで描画するバージョン、 (ii) ハードバージョン。
現在のVLMはフォント認識能力に限界があり,多くの最先端モデルでは良好な性能が得られていない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:33:21 GMT)
Neurons for Neutrons: A Transformer Model for Computation Load Estimation on Domain-Decomposed Neutron Transport Problems [48.4] 本稿では, 独自の3次元入力埋め込みを持つトランスフォーマーモデルと, 領域分解中性子輸送問題のための入力表現を提案する。
本研究では,ドメイン分割型小型モジュールリアクタ(SMR)シミュレーションでトレーニングしたモデルが98.2%の精度を実現し,小型シミュレーションのステップを完全にスキップできることを実証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:36:30 GMT)
NoProp: Training Neural Networks without Back-propagation or Forward-propagation [48.0] 我々はNoPropという新しい学習手法を導入し、前方または後方の伝播に依存しない。
NoPropは拡散とフローマッチングの手法から着想を得ている。
MNIST, CIFAR-10, CIFAR-100画像分類ベンチマークにおいて, 本手法の有効性を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:08:57 GMT)
HACTS: a Human-As-Copilot Teleoperation System for Robot Learning [47.9] HACTS(Human-As-Copilot Teleoperation System)は,ロボットアームと遠隔操作ハードウェアを双方向でリアルタイムに同期させるシステムである。
このシンプルで効果的なフィードバックメカニズムは、自動運転車のステアリングホイールに似たもので、人間の操縦士がシームレスに介入し、将来の学習のために行動補正データを収集することを可能にする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:28:13 GMT)
Communication-Efficient and Personalized Federated Foundation Model Fine-Tuning via Tri-Matrix Adaptation [47.8] 本稿では, パーソナライズされたモデルパラメータアグリゲーションを用いた三要素化低ランク適応手法である通信効率のフェデレーションLoRA適応(CE-LoRA)を提案する。
各種LLMおよびVLM微調整タスクの実験により、CE-LoRAは通信オーバーヘッドを著しく低減するだけでなく、独立で同一の分散データ条件下での性能も向上することが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:18:42 GMT)
RadSplat: Radiance Field-Informed Gaussian Splatting for Robust Real-Time Rendering with 900+ FPS [47.5] 本稿では,複雑なシーンをリアルタイムにレンダリングする軽量なRadSplatを提案する。
まず, 優先信号として放射場を用い, 点ベースシーン表現の最適化を行い, 品質の向上とロバストな最適化を実現した。
次に,高い品質を維持しつつ全体の点数を削減し,より高速な推論速度でより小型でコンパクトなシーン表現を実現する新しいプルーニング手法を開発した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:56:03 GMT)
Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model [47.1] 大規模推論指向RLトレーニングの最初のオープンソース実装であるOpen-Reasoner-Zeroを紹介する。
オープンソースを念頭に置いて、ソースコード、パラメータ設定、トレーニングデータ、さまざまなサイズのモデルウェイトをリリースしています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:36:05 GMT)
Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations [47.0] 本稿では,因果的時間的ダイナミクスと相互視的アライメントを促進するマスク付きエゴエクソモデリングを提案する。
我々は、堅牢なクロスビュー理解の基礎として、人間の行動の構成的性質を捉えることの重要性を強調した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:46:51 GMT)
Contextualize-then-Aggregate: Circuits for In-Context Learning in Gemma-2 2B [47.0] In-Context Learning (ICL)は、大規模言語モデル(LLM)の興味深い能力である。
我々は5つの自然主義ICLタスクに対してGemma-2 2Bにおける情報フローを因果介入を用いて同定する。
このモデルでは,2段階戦略を用いてタスク情報を推論し,コンテキスト化-then-aggregateと呼ぶ。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:33:55 GMT)
Point Tracking in Surgery--The 2024 Surgical Tattoos in Infrared (STIR) Challenge [47.0] 外科手術における組織運動の定量化のためのポイントトラッキング課題であるSTIR Challenge 2024について述べる。
STIRチャレンジ2024は、精度と効率の2つの定量的要素から構成される。
本稿では,課題から得られた設計,提案,成果を要約する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:53:09 GMT)
Faster Rates for No-Regret Learning in General Games via Cautious Optimism [46.5] 我々は,マルチプレイヤーの汎用ゲームにおいて,O(n, d log T)$per-playerの後悔を実現する最初の未結合学習アルゴリズムを確立する。
この結果は,Log-Regularized Lifted Optimistic FTRLで達成可能な$O(n, d log T)$ regretと比較して,$d$への依存を指数関数的に改善する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:25:33 GMT)
Training-Free Text-Guided Image Editing with Visual Autoregressive Model [46.2] 本稿では,Visual AutoRegressive モデリングに基づく新しいテキスト誘導画像編集フレームワークを提案する。
本手法は, 正確かつ制御された修正を確実にしながら, 明示的な逆変換の必要性を解消する。
我々のフレームワークは、トレーニング不要な方法で動作し、高速な推論速度で高忠実度編集を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:46:56 GMT)
Quantum Information meets High-Energy Physics: Input to the update of the European Strategy for Particle Physics [46.1] 量子力学の最も驚くべき特徴、例えば絡み合いやベル非局所性は、低エネルギーの実験装置でしか広く研究されていない。
粒子衝突による高エネルギー体制におけるこれらの研究の可能性は、最近しか示されておらず、科学界の注目を集めている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:01 GMT)
Controllable Human Image Generation with Personalized Multi-Garments [46.0] BootCompは、テキストから画像への拡散モデルに基づく新しいフレームワークである。
本研究では,ヒトとマルチガーメントのペアからなる大規模な合成データセットを構築するためのデータ生成パイプラインを提案する。
ファッションドメインにおいて、異なるタイプの参照ベース生成に適応することで、フレームワークの幅広い適用性を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:27:25 GMT)
A Double Deep Learning-based Solution for Efficient Event Data Coding and Classification [45.8] イベントカメラは、"イベント"と呼ばれる、画素ごとの非同期の明るさ変化をキャプチャする機能を持つ
本稿では、イベントのポイントクラウドベースの表現を用いて、イベントデータ符号化と分類の両方のための新しいダブルディープラーニングベースのアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:41:20 GMT)
The AI off-switch problem as a signalling game: bounded rationality and incomparability [45.8] 我々は、人間の意思決定者がAIエージェントにその好みを伝える合図ゲームとしてオフスイッチ問題をモデル化する。
我々は、AIシステムがオフスウィッチを無効にすることを避けるために必要な条件は、人間の実用性に対する不確実性であることを示した。
また、メッセージコストが最適な戦略にどのように影響するかを分析し、非互換性を含むシナリオまで分析を拡張します。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:18:33 GMT)
AutoEval: Autonomous Evaluation of Generalist Robot Manipulation Policies in the Real World [45.7] AutoEvalは、人間の介入を最小限に抑えて、時計周りのロボットポリシーを自律的に評価するシステムだ。
評価プロセスにおいて,AutoEvalは人間の関与をほぼ完全に排除できることを示す。
We provide public access to multiple AutoEval scene in the popular BridgeData robot set with WidowX robot arms。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:23:44 GMT)
Certified Approximate Reachability (CARe): Formal Error Bounds on Deep Learning of Reachable Sets [45.7] 我々は, 真の到達可能な集合のトレーニング損失と精度の関係を確立するための, エプシロン近似ハミルトン-ヤコビ偏微分方程式(HJ-PDE)を導入する。
我々の知識を最大限に活用するために、CARe(Certified Approximate Reachability)は、学習された連続力学系の到達可能な集合に音質を保証するための最初のアプローチである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:02:57 GMT)
Diversity-driven Data Selection for Language Model Tuning through Sparse Autoencoder [45.6] 本稿では,データ多様性対策の課題に取り組むために,スパースオートエンコーダ(SAE)を提案する。
我々は、選択したデータに基づいてトレーニングされたモデルが、モデル能力の点で他の手法より優れていることを実験的に証明した。
より広いコミュニティで使用するために、トレーニングされたSAEをリリースします。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:41:42 GMT)
Geometric Interpretation of Timelike Entanglement Entropy [45.0] 境界部分領域が時間的な方向に沿って広がるホログラフィックエンタングルメントエントロピーの解析的継続は、新しい時間中心の時空プローブの約束をもたらした。
このホログラフィック時型エンタングルメントエントロピーのバルクキャリアは、ホログラフィック時空の複雑な座標への解析的連続性を示す境界アンコール面である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:26:48 GMT)
TablePilot: Recommending Human-Preferred Tabular Data Analysis with Large Language Models [44.4] 大規模言語モデルを活用する先駆的なデータ分析フレームワークであるTablePilotを,包括的で優れた分析結果を自律的に生成する。
このフレームワークは、分析準備と分析最適化に重要な設計を取り入れ、精度を向上する。
また,レコメンデーション品質を向上し,ヒトの嗜好に適合する新しい手法であるRec-Alignを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:02:55 GMT)
It's a (Blind) Match! Towards Vision-Language Correspondence without Parallel Data [43.4] ビジョンと言語埋め込みは、モデルとデータセットのサイズが大きくなるにつれて、より均一になる。
基礎モデルが成熟するにつれて、ビジョンと言語埋め込みを完全に教師なしの方法で一致させることができるかもしれない。
本研究は,既存のビジョンと言語基盤モデルの適合性について考察する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:14:25 GMT)
Diffusion-driven lensless fiber endomicroscopic quantitative phase imaging towards digital pathology [43.2] マルチコアファイバ(MCF)の検出側で捕獲されたスペックルから直接位相像を再構成するためのスペックル条件拡散モデル(SpecDiffusion)を提案する。
従来のニューラルネットワークとは異なり、SpecDiffusionはスペックル駆動の位相再構成に反復的な位相分解ステップを採用している。
SpecDiffusionは高忠実度位相再構成結果を提供し、見えない物体に対して強力な一般化能力を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:03:41 GMT)
TransMamba: Flexibly Switching between Transformer and Mamba [43.2] 本稿ではTransformerとMambaを統合するフレームワークであるTransMambaを提案する。
本研究では,TransMambaがベースラインよりも優れたトレーニング効率と性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:26:24 GMT)
Multilingual Sentiment Analysis of Summarized Texts: A Cross-Language Study of Text Shortening Effects [42.9] 要約は様々な形態を持つ言語における感情分析に大きな影響を及ぼす。
本研究では,英語,ドイツ語,フランス語,スペイン語,イタリア語,フィンランド語,ハンガリー語,アラビア語の感情分類における抽出的,抽象的要約効果について検討した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:16:04 GMT)
TwT: Thinking without Tokens by Habitual Reasoning Distillation with Multi-Teachers' Guidance [42.9] 多教師指導による常習的推論蒸留による推論時間コスト削減手法TwTを提案する。
提案手法は,教師指導型圧縮戦略により,モデルの習慣行動に対する明確な推論を内包する。
実験により,TwTは優れた性能を維持しつつ,推論コストを効果的に低減できることが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:16:31 GMT)
A machine learning platform for development of low flammability polymers [42.8] 可燃性指数 (FI) とコーンカロリー測定結果(最大放火率, 点火時間, 総煙放出量, 発火速度など)は, 高分子の火災安全性を評価する上で重要な要因である。
本研究では,これらの可燃性指標を予測するための機械学習(ML)技術の利用について検討する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:50:29 GMT)
SpeechDialogueFactory: Generating High-Quality Speech Dialogue Data to Accelerate Your Speech-LLM Development [42.6] 自然言語対話を効率的に生成するための生産対応フレームワークであるtextscSpeechDialogueFactory を紹介する。
提案手法では,メタデータ生成,対話スクリプティング,パラ言語に富んだ発話シミュレーション,音声クローニングによる自然な音声合成を含む包括的パイプラインを用いる。
私たちはオープンソースツールキットとして、サンプルデータセットを英語と中国語で公開しています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:52:21 GMT)
Bayesian Learning-driven Prototypical Contrastive Loss for Class-Incremental Learning [42.1] 本稿では,先行クラスと新たに登場したクラスプロトタイプ間の効果的な表現を学習する手法を提案する。
クラス間距離を減少させ,クラス間距離を増大させることにより,新しいクラスを潜在表現に組み込むコントラスト的損失を導入する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:04:03 GMT)
Ride-Sourcing Vehicle Rebalancing with Service Accessibility Guarantees via Constrained Mean-Field Reinforcement Learning [42.1] Uber、Lyft、Didi Chuxingといったサービスの急速な拡大は、モバイルアプリケーションを通じてフレキシブルでオンデマンドなモビリティを提供することで、都市交通を再構築した。
不適切な再バランスは、長時間の乗車待ち時間、非効率な車両利用、不平等な配電サービスをもたらす。
我々は,各車両の正確な位置を明示し,他の車両の分布に導かれる連続配置動作を利用する連続状態平均場制御(MFC)と強化学習(MFRL)モデルを導入する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:00:11 GMT)
Two-time quantities as elements of physical reality [41.9] 2回共振器は、新しい物理オブザーバブルを含む平均値と見なされるべきである。
本稿では,2時間相関器と2時間演算子自体の推定成分が,物理現実の同時的要素とはならないことを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:36:29 GMT)
PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models [41.9] 既存のフロンティアモデルのベンチマークは、非専門家が把握するのが難しい専門的な"PhDレベル"の知識をテストすることが多い。
一般知識のみを必要とするNPRサンデー・パズル・チャレンジに基づく594の問題点のベンチマークを提示する。
私たちのベンチマークは人間とモデルの両方にとって難しいものですが、正しいソリューションを検証するのは簡単で、モデルのミスを見つけるのは簡単です。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:21:49 GMT)
Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation [41.0] 本稿では,視覚に基づくロボット操作課題を解決するためにシミュレーションデータを利用する手法を提案する。
ロボットアームとヒューマノイドの2つの領域を用いて,シミュレーションデータにより実世界のタスク性能を平均38%向上させることができることを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:39:38 GMT)
CONGRAD:Conflicting Gradient Filtering for Multilingual Preference Alignment [40.4] 本稿では,言語間の最小勾配の衝突を最小限に抑えた高品質な選好サンプルを選択する,スケーラブルで効率的なフィルタリング手法を提案する。
本手法は,多言語更新方向を集約したサンプルを保持するために勾配手術を利用する。
CONGRADを自己回帰フレームワークに統合し、LLaMA3-8BとGemma2-2Bを10言語で評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:52:56 GMT)
Agent-Centric Personalized Multiple Clustering with Multi-Modal LLMs [40.4] エージェント中心のパーソナライズされたクラスタリングフレームワークを提案する。
エージェントはリレーショナルグラフを横断して、ユーザの関心事に基づいてクラスタを検索する。
その結果,提案手法はカードオーダーとカードサイツのベンチマークで0.9667と0.9481のNMIスコアを得ることができた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:56:24 GMT)
PathOrchestra: A Comprehensive Foundation Model for Computational Pathology with Over 100 Diverse Clinical-Grade Tasks [40.0] 本稿では,300Kの病理スライドからなるデータセット上で,自己教師型学習を通じて学習した多種多様な病理基盤モデルPathOrchestraを提案する。
このモデルは、61のプライベートデータセットと51のパブリックデータセットを組み合わせて、112の臨床的タスクで厳格に評価された。
PathOrchestraは27,755のWSIと9,415,729のROIで例外的なパフォーマンスを示し、47のタスクで0.950以上の精度を達成した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:28:02 GMT)
On Infinite Tensor Networks, Complementary Recovery and Type II Factors [39.6] 無限テンソルネットワークの境界における局所作用素代数について検討する。
ヒルベルト空間と可観測体の代数を、ネットワーク内の絡み合いを追跡する方法で分解する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:09 GMT)
Distributed quantum error correction based on hyperbolic Floquet codes [39.6] 局所的および非局所的な回路レベルの雑音下では,分散双曲型フロケット符号が良好な性能を示すことを示す。
このことは、分散量子誤差補正が可能であるだけでなく、効率的に実現可能であることを示している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:30:04 GMT)
Bridge the Gap Between Visual and Linguistic Comprehension for Generalized Zero-shot Semantic Segmentation [39.2] 汎用ゼロショットセマンティックセマンティックセグメンテーション(GZS3)は、目に見えないクラスや見えないクラスのセグメンテーションを実現することを目的としている。
本稿では,空間部品 (SPMatch) とチャネル状態 (CSMatch) マッチングモジュールからなるデカップリング型視覚言語マッチング (DeVLMatch) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:39:14 GMT)
Effectively Controlling Reasoning Models through Thinking Intervention [38.8] 推論強化された大言語モデルは、最終回答を生成する前に、中間的推論ステップを明示的に生成する。
この新たな世代フレームワークは、モデルの振る舞いをよりきめ細かいコントロールするためのユニークな機会を提供します。
本稿では,LLMの内部推論プロセスを明示的に導くための新しいパラダイムであるThinking Interventionを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:50:13 GMT)
Rack Position Optimization in Large-Scale Heterogeneous Data Centers [38.6] 本稿では,局所探索のための低レベル勾配に基づく高レベル深部強化学習(DRL)モデルを用いた新しい2層最適化フレームワークを提案する。
高レベルのDRLエージェントは、Lead Rewardを最適ラック型順序付けに使用し、低レベルの効率的な位置マップ、移動回数の最小化、耐故障性資源分布の確保を行う。
当社のアルゴリズムは,大規模データセンタ管理に不可欠な,安定的で効率的な結果を継続的に提供しています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:55:37 GMT)
Reinforcement Learning for Safe Autonomous Two Device Navigation of Cerebral Vessels in Mechanical Thrombectomy [38.5] 現在の強化学習法は頸動脈に限られている。
本稿では,頸動脈を越えて脳血管へ移動可能な安全デュアルデバイスRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:25:46 GMT)
Detecting Localized Density Anomalies in Multivariate Data via Coin-Flip Statistics [38.2] 本稿では,2つのデータセットを比較する異常検出手法であるEagleEyeを紹介する。
異常は、各点について、隣人の登録ラベルの順序付けられたシーケンスをモデル化することによって検出される。
人工と実世界の両方のデータセットの実験を通して、その効果を実証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:20:04 GMT)
Know "No'' Better: A Data-Driven Approach for Enhancing Negation Awareness in CLIP [38.2] 本稿では,大言語モデル(LLM)と多モーダルLLMを用いたデータ生成パイプラインを導入し,否定を包含するキャプションを生成する。
パイプラインから生成したデータを微調整したCLIPを用いて,一般性を維持しつつ否定意識を高めるNegationCLIPを開発した。
さまざまなCLIPアーキテクチャの実験は、CLIPの否定を正確に認識する能力を向上する上で、データ生成パイプラインの有効性を検証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:38:48 GMT)
Self-Evolving Visual Concept Library using Vision-Language Critics [38.2] 手動による定義が労働集約的であるため、効果的なビジュアル概念ライブラリの構築は困難である。
我々のアプローチであるESCHERは、視覚概念を反復的に発見し、改善するためのライブラリ学習の視点を採っている。
我々は、ゼロショット、少数ショット、微調整の視覚的分類タスクのための概念ライブラリをESCHERが学習できることを実証的に示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:47:55 GMT)
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models [37.8] テストタイムスケーリング(TTS)が注目されている。
TTS研究の4つのコア次元に沿って構成された統一多次元フレームワークを提案する。
我々は, TTS の発達軌道を現在まで蒸留し, 実践的展開のための手動ガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:46:15 GMT)
Graph Neural Network-Based Predictive Modeling for Robotic Plaster Printing [37.8] 本研究は、粒子ベース製造プロセスから得られる表面を予測するためのグラフニューラルネットワーク(GNN)モデリング手法を提案する。
GNNモデルはエンコーダ-プロセッサ-デコーダアーキテクチャで構成され、実験室テストのデータを用いて訓練されている。
提案モデルの性能は,未確認の真理データに対する予測誤差の観点から評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:15:00 GMT)
Coarse-to-Fine Learning for Multi-Pipette Localisation in Robot-Assisted In Vivo Patch-Clamp [36.9] そこで本研究では,ロボット支援型パッチクランプのマルチピペットリアルタイムローカライズを容易にするために,ヒートマップによる粗大な学習手法を提案する。
実験の結果,10m以内の精度は98%,5m以内の精度は89%であった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:03:56 GMT)
Evaluation of (Un-)Supervised Machine Learning Methods for GNSS Interference Classification with Real-World Data Discrepancies [36.7] 自動車のローカライゼーションは、自動運転車、有料システム、デジタルタコグラフなどのアプリケーションに不可欠である。
正確な位置決めを実現するために、車両は通常、グローバルナビゲーション衛星システム(GNSS)受信機を使用して絶対位置を検証する。
機械学習(ML)に基づく最近のアプローチは、監視干渉において優れた性能を示している。
我々は,MLに基づく最新の教師付き手法の評価を行い,実環境におけるその性能について報告する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:51:52 GMT)
THEMIS: Towards Practical Intellectual Property Protection for Post-Deployment On-Device Deep Learning Models [36.0] オンデバイスディープラーニング(DL)はモバイルアプリで急速に採用され、オフラインモデル推論とクラウドベースのアプローチよりもユーザのプライバシ保護のメリットを提供する。
必然的に、ユーザーデバイスにモデルを保存し、新しい脆弱性、特にモデルステアリング攻撃と知的財産権侵害を導入する。
本稿では,デバイス上でのDLモデルの読み取り専用制約を緩和するツールであるTheMISを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:58:57 GMT)
Decentralized Bilevel Optimization: A Perspective from Transient Iteration Complexity [35.9] 分散二段階最適化(SBO)は機械学習においてますます不可欠になりつつある。
本稿では,分散一ループバイレベルアルゴリズムフレームワークであるD-SOBAを紹介する。
総合的な非漸近収束解析を行い、D-SOBAの過渡的複雑性を確立する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:15:45 GMT)
DIN-CTS: Low-Complexity Depthwise-Inception Neural Network with Contrastive Training Strategy for Deepfake Speech Detection [35.9] コントラスト学習戦略(CTS)を訓練した低複雑さDIN(Depthwise-Inception Network)に基づくディープフェイク音声検出(DSD)のためのディープニューラルネットワークアプローチを提案する。
提案システムを評価するため,ASVspoof 2019 LAのベンチマークデータセットについて広範な実験を行った。
提案システムは,ASVspoof 2019 LAチャレンジにおけるシングルシステム提案よりも優れており,リアルタイムアプリケーションの可能性を示している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:32:56 GMT)
SchemaAgent: A Multi-Agents Framework for Generating Relational Database Schema [35.6] 既存の取り組みは主に、カスタマイズされたルールや従来のディープラーニングモデルに基づいており、しばしばリレーショナルスキーマを生成する。
高品質データベーススキーマの自動生成のための統一LLMベースのマルチエージェントフレームワークを提案する。
我々は、様々な段階にわたる問題の正当性を特定するために、リフレクションとインスペクションのための専用の役割と、革新的なエラー検出と修正機構を組み込んだ。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:39:19 GMT)
Detecting Functional Bugs in Smart Contracts through LLM-Powered and Bug-Oriented Composite Analysis [34.8] スマートコントラクトにおける機能的バグを検出する自動化およびスケーラブルなシステムである PROMFUZZ の設計と実装を行う。
まず,デュアルエージェント・プロンプト・エンジニアリング・ストラテジーを活用するLarge Language Model (LLM) 駆動分析フレームワークを提案する。
最後に,高レベルのビジネスモデルから低レベルのスマートコントラクト実装へ論理情報をマッピングする,バグ指向ファジリングエンジンを設計する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:39:51 GMT)
Boosting MLLM Reasoning with Text-Debiased Hint-GRPO [34.2] GRPOアルゴリズムは、困難で複雑なマルチモーダル推論タスクを扱うのに苦労する。
本研究は,様々な困難サンプルに対するヒントを適応的に提供することにより,データ利用を改善するHint-GRPOを提案する。
提案手法は,既存のMLLM推論手法よりも優れた性能を示すとともに,従来のMLLMの推論能力を大きなマージンで向上させる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:54:55 GMT)
Backdoor Detection through Replicated Execution of Outsourced Training [34.2] 複数のクラウドプロバイダにアクセス可能なクライアントは、トレーニング手順から逸脱を検出するために、複数のサーバにまたがるトレーニングステップのサブセットを複製できることを示す。
バックドアに要するモデル更新とクリーンなトレーニングの結果のモデルアップデートとで、悪意のあるサーバを特定します。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:26:34 GMT)
Entanglement Distribution in Lossy Quantum Networks [33.7] エンタングルメント分布は、分散量子情報処理の可能性を解き放つために不可欠である。
我々は、損失チャネル上の中央ソースを介して絡み合いを分散する$N$-partiteネットワークを考える。
損失分布で共有される最適平均二部絡み合いを評価するための一般的な数学的枠組みを開発する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:32:18 GMT)
FlexiMo: A Flexible Remote Sensing Foundation Model [33.0] FlexiMoはフレキシブルなリモートセンシング基盤モデルであり、任意の空間解像度に対応する柔軟性を備えた事前訓練されたモデルを提供する。
Central to FlexiMoは空間分解能を意識したモジュールで、パラメータフリーアライメントの埋め込み機構を採用している。
多様なマルチモーダル、マルチレゾリューション、マルチスケールデータセットの実験により、FlexiMoはモデルの一般化とロバスト性を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:46:05 GMT)
Inference-Time Scaling for Complex Tasks: Where We Stand and What Lies Ahead [33.0] 推論時間スケーリングは、大きな言語モデルの推論能力を高めることができる。
本研究では,9つの最先端モデルと8つの課題にまたがるスケーリング手法の利点と限界について検討する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:40:28 GMT)
$\textit{Agents Under Siege}$: Breaking Pragmatic Multi-Agent LLM Systems with Optimized Prompt Attacks [32.4] マルチエージェント大規模言語モデル(LLM)システムは,エージェント間の通信や分散推論に依存するため,新たな敵対的リスクを生み出す。
本研究では,トークンの帯域幅の制限,メッセージ配信のレイテンシ,防御機構といった制約のある実用的システムへの攻撃に革新的な焦点をあてる。
我々は、レイテンシと帯域幅制約のあるネットワークトポロジ間の迅速な分散を最適化し、分散安全機構をバイパスする、$textitpermutation-invariant adversarial attack$を設計する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:43:56 GMT)
Implementation and readout of maximally entangled two-qubit gates quantum circuits in a superconducting quantum processor [32.4] トランスモンベースの5量子ビット超伝導量子プロセッサにおいて,複雑性の増大に伴う量子回路の性能の比較を行った。
本稿では、2つの読み出しパラダイムを用いて量子回路の出力の分析結果について報告する。
第1の方法はシングルキュービット回路に適しているが、第2の方法は2キュービットゲートを含む回路の出力を正確に解釈するのに不可欠である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:20:56 GMT)
Pan-LUT: Efficient Pan-sharpening via Learnable Look-Up Tables [32.2] パンシャーピングのための学習可能なルックアップテーブルフレームワークであるPan-LUTを提案する。
Pan-LUTは高解像度リモートセンシング画像の性能と計算効率のバランスをとる。
提案手法は300K未満のパラメータを含み、8K解像度画像を1ms以下で処理する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:13:59 GMT)
ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion [31.4] LLM(Low-Rank Adaptation)は、大規模言語モデル(LLM)を進化させるためのローランク適応(LoRA)である。
これらの課題に対処する新しい$textbfconditional recurrentfusion$フレームワークである$textttORAL$を紹介します。
我々は、$textttORAL$が、バニラ訓練されたパラメータと同等または優れたパフォーマンスを達成する高品質なLoRAパラメータを生成することを実証した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:34:59 GMT)
VeriSplit: Secure and Practical Offloading of Machine Learning Inferences across IoT Devices [31.2] 多くのIoT(Internet-of-Things)デバイスは、機械学習推論を実行するためにクラウド計算リソースに依存している。
これは高価で、ユーザーのプライバシーを心配する可能性がある。
ローカルで利用可能なデバイスに機械学習推論をオフロードするフレームワークであるVeriSplitを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:32:49 GMT)
MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Few-Step Synthesis [31.2] オープンソースのビデオ拡散モデル(VDM)は100億以上のパラメータに拡張されている。
これらのモデルは、(1)高い推測オーバーヘッド、(2)ポートレートビデオ合成の制限の2つの大きな制限に直面している。
ポートレートビデオ合成のためのVDMの一般化を確保しつつ,推論オーバーヘッドを低減するための新しいフレームワークであるMagicDistillationを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:03:18 GMT)
A Concise Survey on Lane Topology Reasoning for HD Mapping [30.7] レーントポロジ推論技術はハイデフィニション(HD)マッピングや自律運転アプリケーションにおいて重要な役割を担っている。
近年、この分野で重要な進歩が見られたが、これらを包括的にまとめる努力は限られている。
本研究は,レーントポロジー推論手法の進化と現状を体系的にレビューする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:30:40 GMT)
Towards Benchmarking and Assessing the Safety and Robustness of Autonomous Driving on Safety-critical Scenarios [30.4] 自律運転の現在の評価は、通常、自然運転のシナリオで行われる。
多くの事故は、安全クリティカルシナリオとしても知られるエッジケースで発生することが多い。
現在、安全クリティカルなシナリオを構成するものを明確に定義していない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:13:32 GMT)
CASA: Class-Agnostic Shared Attributes in Vision-Language Models for Efficient Incremental Object Detection [30.3] Class-Agnostic Shared Attribute Baseは、インクリメンタルクラス間で共有されるカテゴリに依存しない属性を学ぶことをモデルに推奨する。
その後のタスクでは、保持された属性は凍結され、残りの候補から新しい属性が選択される。
COCOデータセットの実験により,本手法の最先端性能が実証された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:30:45 GMT)
GP-MoLFormer: A Foundation Model For Molecular Generation [30.1] 我々は、大規模化学データセット上で化学言語変換器を訓練するパラダイムを、生成タスクにまで拡張する。
具体的にはGP-MoLFormerを提案する。GP-MoLFormerは1.1B(ビリオン)以上の化学SMILESで訓練される自己回帰型分子弦発生器である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:16:41 GMT)
GyralNet Subnetwork Partitioning via Differentiable Spectral Modularity Optimization [30.0] 本稿では,GyralNet内の3HGの組織をモジュール化するための,差別化可能なサブネットワークフレームワークを提案する。
トポロジカルな構造的類似性とDTI由来の接続パターンを属性特性として組み込むことにより,本手法は皮質組織を生物学的に意味のある表現を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:17:19 GMT)
InteractiveSurvey: An LLM-based Personalized and Interactive Survey Paper Generation System [29.9] 大規模言語モデル(LLM)と検索強化世代(RAG)は、複数の参照から調査論文を合成する研究を促進する。
本稿では,LLMに基づくパーソナライズされたインタラクティブな調査用紙生成システムであるInteractiveSurveyを紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:23:22 GMT)
Free360: Layered Gaussian Splatting for Unbounded 360-Degree View Synthesis from Extremely Sparse and Unposed Views [29.9] 本研究では,非有界な360degシーンにおいて,非有界かつ極めてスパースな3次元再構成を実現するための新しいニューラルネットワークレンダリングフレームワークを提案する。
密集したステレオ再構成モデルを用いて粗い形状を復元し, ノイズを低減し, 閉塞領域を埋めるために, 層特異的なブートストラップ最適化を導入する。
提案手法は,レンダリング品質と表面再構成精度において,既存の最先端手法よりも優れる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:25 GMT)
Decoupled Distillation to Erase: A General Unlearning Method for Any Class-centric Tasks [29.6] 本稿では,クラス中心タスクの学習方法として,Decoupled Distillation to Erase (DELETE)を提案する。
保持ロジットから忘れ物とを分離するためにマスクを適用することにより, 忘れ物と洗練物の両方を同時に最適化する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:02:27 GMT)
BeMERC: Behavior-Aware MLLM-based Framework for Multimodal Emotion Recognition in Conversation [29.5] 本稿では,ビニラMLLMに基づくMERCモデルに話者の振る舞いを組み込む行動認識型MLLMベースのフレームワーク(BeMERC)を提案する。
BeMERCは2つのベンチマークデータセットの最先端手法よりも優れた性能を実現している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:04:53 GMT)
Get the Agents Drunk: Memory Perturbations in Autonomous Agent-based Recommender Systems [29.4] 大規模言語モデルベースのエージェントは、パーソナライズされた振る舞いモデリングを実現するために、リコメンデータシステム(Agent4RS)でますます使われている。
私たちの知る限りでは、Agent4RSがいかに堅牢かは未解明のままです。
本稿では,エージェントの記憶を乱すことによってエージェント4RSを攻撃するための最初の取り組みを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:35:40 GMT)
Over-the-Air Edge Inference via End-to-End Metasurfaces-Integrated Artificial Neural Networks [29.3] エッジ推論(EI)のための準曲面統合ニューラルネットワーク(MINN)の枠組みを提案する。
MINNは、EI要求を大幅に単純化し、トレーニングに比べて50ドル以下で、ほぼ最適性能を達成できる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:14:09 GMT)
MultiBooth: Towards Generating All Your Concepts in an Image from Text [29.0] 本稿では,テキストからの画像生成において,マルチコンセプトをカスタマイズするための新しい,効率的な手法であるMultiBoothを紹介する。
単一概念学習フェーズでは,多モード画像エンコーダと効率的な概念符号化技術を用いて,各概念の簡潔かつ識別的な表現を学習する。
多概念統合フェーズでは、有界ボックスを用いて、相互注意マップ内の各概念の生成領域を定義する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:30:53 GMT)
Exploring Reliable PPG Authentication on Smartwatches in Daily Scenarios [29.0] Photoplethysmography (PPG)センサーはスマートウォッチに広く採用されており、日常的に使用するためのシンプルで非侵襲的な認証アプローチを提供する。
本稿では,PPG認証モデルであるMTL-RAPIDを提案する。
MTL-RAPIDは,動作アーチファクト,時間変化,ユーザの嗜好に関する総合的なユーザスタディにおいて,99.2%,EER3.5%を達成し,既存のベースラインを上回った。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:25:48 GMT)
Learning a Canonical Basis of Human Preferences from Binary Ratings [29.0] 本稿では、そのようなデータセットに符号化された嗜好を理解し、共通の人間の嗜好を特定することに焦点を移す。
21の選好カテゴリーの小さなサブセットは、個人間での選好の変化の89%を捉えていることがわかった。
この小さな嗜好のセットは、人間の嗜好の標準的基礎と類似しており、心理学や顔認識の研究における人間の変動を特徴づける確立された発見と類似している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:35:48 GMT)
PolypSegTrack: Unified Foundation Model for Colonoscopy Video Analysis [28.8] 大腸内視鏡検査におけるポリープの早期,正確な分画,分類,追跡は大腸癌予防に重要である。
大腸内視鏡ビデオを分析するための多くのディープラーニングベースの手法は、タスク固有の微調整、トラッキング能力の欠如、ドメイン固有の事前トレーニングに依存している。
textitPolypSegTrackは,大腸内視鏡ビデオにおけるポリープ検出,セグメンテーション,分類,教師なし追跡を共同で扱う新しい基礎モデルである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:00:21 GMT)
Gaussian Eigen Models for Human Heads [28.5] 現在のパーソナライズされたニューラルヘッドアバターはトレードオフに直面している。軽量モデルは詳細とリアリズムを欠いているが、高品質でアニマタブルなアバターは計算資源がかなり必要である。
本稿では,高品質で軽量で制御しやすい頭部アバターを提供するガウス固有モデル(GEM)を紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:32:40 GMT)
StochasticSplats: Stochastic Rasterization for Sorting-Free 3D Gaussian Splatting [28.5] 3D Gaussian splatting (3DGS) は、多くのアプリケーション固有の拡張を持つ一般的な放射場法である。
ほとんどの変種は、同じコアアルゴリズムに依存している: ガウススプラッターの深さソートを行い、プリミティブな順序でレンダリングする。
3Dスプラッティングとレンダリングを組み合わせることで、上記の制限に対処する。
我々の手法はソートよりも4倍以上高速である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:46:18 GMT)
Effective Cloud Removal for Remote Sensing Images by an Improved Mean-Reverting Denoising Model with Elucidated Design Space [28.3] クラウド除去(CR)は、リモートセンシング画像処理において依然として困難な課題である。
我々は,平均回帰拡散モデル(MRDM)に基づく新しいCRモデルEMMDMを開発し,雲と雲の無い画像の直接拡散過程を確立する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:37:18 GMT)
HumanDreamer: Generating Controllable Human-Motion Videos via Decoupled Generation [28.0] 本稿では、まずテキストプロンプトから多様なポーズを生成する、疎結合なヒューマンビデオ生成フレームワークを提案する。
我々は、テキストプロンプトから構造化された人間のポーズを生成するためにトレーニングされたMotionDiTを提案する。
さまざまなPose-to-Videoベースラインにわたる実験により,提案手法によって生成されたポーズが,多種多様な高品質な人力動画を生成できることが実証された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:51:45 GMT)
Adaptive Layer-skipping in Pre-trained LLMs [27.9] FlexiDepthはテキスト生成で使用されるTransformerレイヤの数を動的に調整するメソッドである。
プラグインルータとアダプタを組み込むことで、FlexiDepthは大きな言語モデルで適応的なレイヤスキッピングを可能にする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:20:58 GMT)
Leveraging Diffusion Model and Image Foundation Model for Improved Correspondence Matching in Coronary Angiography [27.4] 冠動脈造影像における正確な対応は,3次元冠動脈構造の再構築に不可欠である。
自然画像の従来のマッチング手法は、テクスチャの欠如、コントラストの低さ、重なり合う構造といった固有の違いのために、X線画像への一般化に失敗することが多い。
本研究では,3次元再構成メッシュの2次元投影に条件付き拡散モデルを用いて,リアルな冠動脈造影画像を生成するパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:58:06 GMT)
Studying the Interplay Between the Actor and Critic Representations in Reinforcement Learning [27.3] 我々は、俳優と批評家が、共有された表現よりも、別々に利益を得るかどうかを調査する。
我々の主要な発見は、分離されると、アクターと批評家の表現が、異なる種類の情報を取り出すことを体系的に専門化することである。
我々は、異なる表現学習アプローチが俳優や批評家の専門性にどのように影響するかを理解するために、厳密な実証的研究を行う。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:56:08 GMT)
Continuous Speech Tokenizer in Text To Speech [27.1] 本稿では,Cont-SPTという連続音声トークン化手法と,連続音声トークンに基づく音声合成モデルを提案する。
この結果から,連続音声認識を用いた音声モデルの方が連続性が高く,平均オピニオンスコア(MoS)が高いことがわかった。
この拡張は、周波数領域における低周波および高周波の両方にわたる連続音声認識器の情報保存率の向上に起因する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:57:49 GMT)
Implicit Bias and Fast Convergence Rates for Self-attention [26.8] 本稿では,変圧器の定義機構である自己注意の基本的な最適化原理について考察する。
線形分類におけるデコーダを用いた自己アテンション層における勾配ベースの暗黙バイアスを解析する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:17:02 GMT)
Value of Information-based Deceptive Path Planning Under Adversarial Interventions [26.5] 本稿では,新たなマルコフ決定プロセス (MDP) モデルを提案する。
我々の提案するVoI目標を用いて、経路計画エージェントは、敵の観察者を騙して、最適下介入を選択する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:31:29 GMT)
Beyond Walking: A Large-Scale Image-Text Benchmark for Text-based Person Anomaly Search [25.9] そこで本研究では,日常的・異常な活動に従事する歩行者をテキストで検索するタスクを提案する。
このタスクのトレーニングと評価を可能にするため,大規模画像テキストによる歩行者異常行動ベンチマークを構築した。
提案したベンチマーク実験により, 合成学習データにより詳細な動作の検索が容易となり, 提案手法は84.93%のリコール@1精度で到達した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:47:48 GMT)
DOMAC: Differentiable Optimization for High-Speed Multipliers and Multiply-Accumulators [25.9] DOMACは、特定の技術ノードで乗算器とMACを設計するための微分可能な最適化を利用する新しいアプローチである。
この洞察に基づいて、DOMACは、異なるタイミングと領域の目的を取り入れることで、離散最適化の課題を継続的問題に再構成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:49:05 GMT)
Every Painting Awakened: A Training-free Framework for Painting-to-Animation Generation [25.8] I2V(Image-to-Video)合成により,実世界の静的絵画を生かしたトレーニングフリーフレームワークを提案する。
既存のI2V手法は、主に自然なビデオデータセットに基づいて訓練されており、静的な絵画から動的出力を生成するのに苦労することが多い。
我々のフレームワークは既存のI2V手法とプラグイン・アンド・プレイの統合を可能にし、現実世界の絵画をアニメーション化するのに理想的なソリューションとなる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:25:49 GMT)
Tackling Copyright Issues in AI Image Generation Through Originality Estimation and Genericization [25.7] 本稿では, 生成モデルの出力を一般化し, 著作権物質を模倣しにくくする汎用化手法を提案する。
そこで本研究では,ジェネリゼーション手法と既存の緩和手法を組み合わせたPrepreGenを紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:53:45 GMT)
Interact with me: Joint Egocentric Forecasting of Intent to Interact, Attitude and Social Actions [25.5] SocialEgoNetはグラフベースのフレームワークで、階層的な学習アプローチを通じてタスク依存を利用する。
SocialEgoNetは、高い推論速度のためにビデオ入力のわずか1秒から抽出されたボディスケルトン(顔、手、体からキーポイント)を使用する。
評価のために、新しいクラスラベルとバウンディングボックスアノテーションとの既存のエゴセントリックなヒューマンエージェントインタラクションを強化する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:33:59 GMT)
Policy Gradient for LQR with Domain Randomization [25.4] ドメインランダム化(DR)は、シミュレーション環境の分布に基づいて、コントローラをトレーニングすることで、sim-to-real転送を可能にする。
ドメインランダム化線形二次規則(LQR)のためのポリシー勾配法(PG法)の第1収束解析を提供する。
我々は,サンプル平均値と集団レベルの目標値の差を小さくすることに伴う試料複雑度を定量化する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:51:00 GMT)
An Annotated Dataset of Errors in Premodern Greek and Baselines for Detecting Them [25.2] 我々は、前近代ギリシア語で実際の誤りの最初のデータセットを紹介した。
このデータセットを作成するために、BERT条件から派生したメトリクスを使用して、エラーを含む可能性が高い単語1000語をサンプリングする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:00:17 GMT)
H2VU-Benchmark: A Comprehensive Benchmark for Hierarchical Holistic Video Understanding [25.1] 既存のビデオ理解評価ベンチマークでは、カバレッジ、タスクの多様性、シーン適応性に大きな制限がある。
本稿では,一般的なビデオとオンラインストリーミングの両方の理解度を評価するために,階層的・全体論的ビデオ理解ベンチマークを提案する。
このベンチマークは、拡張ビデオの長さ、包括的なアセスメントタスク、エンリッチ化ビデオデータという3つの重要な特徴に寄与する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:32:51 GMT)
Interpreting Low-level Vision Models with Causal Effect Maps [25.1] 低レベル視覚モデルを理解するために因果理論を導入する。
因果効果マップ(CEM)と呼ばれるモデル/タスク非依存の手法を提案する。
CEMは、正か負かのいずれかの効果で入力と出力の関係を可視化し、定量化する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:04:08 GMT)
InPK: Infusing Prior Knowledge into Prompt for Vision-Language Models [24.2] 学習可能なトークンにクラス固有の事前知識を注入するInPKモデルを提案する。
また、テキスト調整に対応するための学習可能なテキスト・ツー・ビジョン・プロジェクション・レイヤも導入する。
実験では、InPKは複数のゼロ/ファウショット画像分類タスクにおいて最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:44:28 GMT)
Many-to-Many Matching via Sparsity Controlled Optimal Transport [24.1] 多対多のマッチングは、1つの集合における複数の点と、別の集合における複数の点とを一致させようとする。
本稿では,多対多の制約を明示的に符号化し,デジェネレーションを1対1のマッチングに防止する新しい多対多マッチング法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:22:02 GMT)
Evolutionary Optimization of Physics-Informed Neural Networks: Survey and Prospects [23.9] 物理インフォームドニューラルネットワーク(PINN)は、数学的に表現可能な自然法則をそれらのトレーニング損失関数に注入する。
PINNは、データリミットにおける純粋にデータ駆動モデルよりも利点がある。
本稿では,モデル最適化と一般化の観点から初めてPINNについて検討する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:37:28 GMT)
ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery [23.8] 我々は、データ駆動科学発見のための言語エージェントを評価するための新しいベンチマークであるScienceAgentBenchを紹介する。
44の査読論文から4つの分野の102の課題を抽出し,9つの課題の専門家による検証を行った。
ScienceAgentBenchを使って、オープンウェイトでプロプライエタリなLLMを5つ評価し、それぞれにダイレクトプロンプト、OpenHands CodeAct、セルフAIの3つのフレームワークを持つ。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:39:44 GMT)
AlpaCare:Instruction-tuned Large Language Models for Medical Application [23.7] GPT-4 と ChatGPT を用いた多種多様な医療用 IFT データセット MedInstruct-52k の作成を提案する。
次に、データセット上のLLaMA系列モデルを微調整してAlpaCareを開発する。
ドメイン固有のデータセットが小さいにもかかわらず、AlpaCareは医療アプリケーションで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:04:11 GMT)
PTDiffusion: Free Lunch for Generating Optical Illusion Hidden Pictures with Phase-Transferred Diffusion Model [23.5] 光錯視隠れ画像は、画像が他の画像に巧妙に統合される興味深い視覚現象であり、視聴者にとってすぐには明らかではない。
隠れアート合成のための新しいトレーニングフリーなテキスト誘導画像変換フレームワークである textbfPhase-textbfTransferred textbfDiffusion Model (PTDiffusion) を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:04:24 GMT)
Rethinking Key-Value Cache Compression Techniques for Large Language Model Serving [23.2] キーバリューキャッシュ(textttKV texttcache)圧縮は、LLM(Large Language Model)サービスを最適化するための有望なテクニックとして登場した。
主にtextttKV textttcache のメモリ消費を削減し、計算コストを削減する。
多くの圧縮アルゴリズムが開発されているが、本番環境での応用はまだ一般的ではない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:23:31 GMT)
ACPBench Hard: Unrestrained Reasoning about Action, Change, and Planning [22.5] ACPBenchデータセットは、効率的な計画に必要なアトミック推論タスクを提供する。
このデータセットは、複雑なプラン生成タスクを別々のアトミック推論タスクに蒸留することを目的としている。
ACPBench Hard は ACPBench の生成版であり,モデルが答える必要のある質問に対してオープンに回答する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:58:25 GMT)
MaintainCoder: Maintainable Code Generation Under Dynamic Requirements [22.4] 最小限の再作業で動的要求を処理するために MaintainCoder を提案する。
ウォーターフォールモデル、デザインパターン、マルチエージェントコラボレーションを統合する。
私たちの仕事は、保守可能なコード生成の基礎を提供するだけでなく、より包括的なコード品質の研究の必要性も強調しています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:06:47 GMT)
Better wit than wealth: Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement [22.4] Retrieval-augmented Generation (RAG)は、関連するドキュメントを外部ソースから取得し、コンテキストに組み込むことで、大きな言語モデル(LLM)を強化する。
文書をパラメトリックな知識に効率的に変換する軽量パラメータトランスレータモデルを活用する新しいフレームワークであるDynamic Parametric RAG(DyPRAG)を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:46:35 GMT)
Does "Reasoning" with Large Language Models Improve Recognizing, Generating, and Reframing Unhelpful Thoughts? [22.2] 認知的リフレーミング(Cognitive Reframing)は、ポジティブな意味を見出すことによって、ネガティブな経験を再解釈するのに役立つ。
近年のLarge Language Models (LLMs) の進歩は、推論に基づく戦略による性能向上を実証している。
これにより、LCMの推論能力を活用してCBTとメンタルリフレーミングを改善するという、有望な方向性がもたらされる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:19:34 GMT)
Building Instruction-Tuning Datasets from Human-Written Instructions with Open-Weight Large Language Models [22.2] 我々は、人間による命令から得られた最先端の命令チューニングデータセットを構築した。
LLMは私たちのデータセットで微調整され、既存のデータセットで微調整されています。
分析によれば、新しい言語での命令チューニングにより、LLMは命令に従うことができるが、チューニングされたモデルは、その言語における文化固有の知識の欠如を顕著に示している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:28:38 GMT)
You Cannot Feed Two Birds with One Score: the Accuracy-Naturalness Tradeoff in Translation [21.6] 我々は,情報理論の最近の進歩を数学的に証明し,そのような単一スコアの要約がシステムの性能の完全な図面を与えていないことを実証するために構築した。
例えば、特定の精度のメートル法(BLEUなど)に翻訳システムを最適化することは、当初はシステムの自然性を改善するが、"オーバーフィッティング"のシステムは、その自然性を大幅に低下させる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:39:51 GMT)
MuseFace: Text-driven Face Editing via Diffusion-based Mask Generation Approach [21.5] MuseFaceはテキスト駆動の顔編集フレームワークで、顔編集を可能にするためにテキストプロンプトのみに依存する。
我々のフレームワークは、きめ細かいセマンティックマスクを作成でき、正確な顔編集を可能にします。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:41:09 GMT)
COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation [21.4] VLN(Vision-and-Language Navigation)タスクは、ホームアシスタントなどの分野に応用される可能性があるため、人工知能研究において注目されている。
本稿では,COSMO(Combination of Selective MemOrization)を組み込んだ新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:24:10 GMT)
LLMigrate: Transforming "Lazy" Large Language Models into Efficient Source Code Migrators [21.1] RustでCコードを書き直すことでメモリの安全性が向上するが、32万行のLinuxカーネルのような大規模なマイグレーションは依然として困難である。
最近のLarge Language Model (LLM)アプローチは、より慣用的で安全なRustプログラムを生成するが、しばしば"遅延"を示す。
LLMベースのC-to-Rust翻訳ツールはモジュールを個別の関数に分割し、個別に翻訳し、再統合する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:09:07 GMT)
Enhancing Intent Understanding for Ambiguous prompt: A Human-Machine Co-Adaption Strategy [21.0] ユーザのプロンプトと修正中の画像の相互情報を用いた人間機械協調型適応戦略を提案する。
改良されたモデルにより、複数ラウンドの調整の必要性が軽減されることが判明した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:06:33 GMT)
VERA: Explainable Video Anomaly Detection via Verbalized Learning of Vision-Language Models [20.9] 本稿では、視覚言語モデルによるビデオ異常検出を可能にするVERAという言語学習フレームワークを提案する。
VERAは、VADに必要な複雑な推論を、よりシンプルでより焦点を絞った質問のリフレクションに分解する。
推論中、VERAは学習した質問をモデルプロンプトに埋め込んで、セグメントレベルの異常スコアを生成するVLMをガイドする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:17:27 GMT)
Learning Algorithms for Verification of Markov Decision Processes [20.6] マルコフ決定過程(MDP)の検証に学習アルゴリズムを適用するための一般的な枠組みを提案する。
提案するフレームワークは,検証における中核的な問題である確率的到達性に重点を置いている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:51:46 GMT)
Resonance: Drawing from Memories to Imagine Positive Futures through AI-Augmented Journaling [20.3] ResonanceはAIを利用したジャーナリングツールで、この能力を増強する。
新しいメモリがログされ、ユーザが提案を実行することを想像するプロンプトが続くと、提案が提示される。
2週間のランダム化対照研究において、Resonanceの使用はメンタルヘルスの結果を大幅に改善した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:30:47 GMT)
Learning 3D-Gaussian Simulators from RGB Videos [20.3] 3DGSimは、多視点RGBビデオからオブジェクトダイナミクスをエンドツーエンドに学習する3D物理シミュレータである。
画像を3Dガウス粒子表現にエンコードし、トランスフォーマーを介してダイナミクスを伝播し、3Dガウススプレイティングを用いてフレームをレンダリングする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:33:59 GMT)
Adapting Vision Foundation Models for Real-time Ultrasound Image Segmentation [20.0] 既存の超音波セグメンテーション法は、しばしば新しいタスクへの適応性に苦しむ。
視覚基盤モデルHieraを応用した適応型フレームワークを導入し,マルチスケールな特徴を抽出する。
これらのリッチな機能は、精密で堅牢なセグメンテーションを生成するためにデコードされる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:47:42 GMT)
A Benchmark for Vision-Centric HD Mapping by V2I Systems [20.0] 車両と道路インフラストラクチャの両方からの協調的なカメラフレームを含む実世界のデータセットをリリースする。
ベクトル化マップの構築に視覚中心のV2Iシステムを利用するエンドツーエンドのニューラルネットワークフレームワーク(V2I-HD)を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:24:53 GMT)
RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy [19.7] アクションの前に推論し、潜在的な成果を想像することは、複雑なオープンワールド環境で動作するエンボディエージェントにとって不可欠である。
本稿では,レアソン化とイマジネーションをエンド・ツー・エンドのジェネラル・ポリシーで相乗化するための最初の試みを行う。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:52 GMT)
PharmAgents: Building a Virtual Pharma with Large Language Model Agents [19.6] マルチエージェントコラボレーションによる仮想医薬エコシステムであるPharmAgentsを紹介する。
このシステムは、特殊な機械学習モデルと計算ツールを備えた、説明可能なLCM駆動エージェントを統合している。
潜在的な治療標的を特定し、有望な鉛化合物を発見し、結合親和性と重要な分子特性を高め、毒性と合成可能性のシリコ分析を行う。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:26:42 GMT)
Video-based Traffic Light Recognition by Rockchip RV1126 for Autonomous Driving [19.5] リアルタイムの交通信号認識は、都市環境における自動運転の安全性とナビゲーションに不可欠である。
我々は、複数の連続するフレームを処理し、堅牢なトラフィック光検出と状態分類を実現する、ビデオベースの新しいエンドツーエンドニューラルネットワークであるtextitViTLRを提案する。
我々は、自走運転用HDマップを用いて、TextitViTLRをエゴレーン交通信号認識システムに統合することに成功している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:27:48 GMT)
Traffic Engineering in Large-scale Networks with Generalizable Graph Neural Networks [19.4] TELGENは、大規模なネットワークにおいてTE問題を効率的に解くことを学習する新しいTEアルゴリズムである。
最大5000ノード、106リンクのランダムおよび実世界のネットワーク上でTELGENを訓練し評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:21:22 GMT)
3D Dental Model Segmentation with Geometrical Boundary Preserving [19.2] 3次元口腔内スキャンメッシュはデジタル歯科診断において広く使われており、3次元口腔内スキャンメッシュの分節化は重要な予備課題である。
深層学習に基づく手法はクラウンの高精度なセグメンテーションを可能にする。
しかし、クラウンとガムの接合部のセグメンテーション精度は依然として平均以下である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:00:11 GMT)
DANTE-AD: Dual-Vision Attention Network for Long-Term Audio Description [19.1] DANTE-ADは、デュアルビジョントランスフォーマーアーキテクチャを利用した拡張ビデオ記述モデルである。
そこで本研究では,音素の微粒な記述生成のためのコンテキストグラウンド化を実現するために,シーケンシャルなクロスアテンションのための新しい最先端手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:49:43 GMT)
DenseFormer: Learning Dense Depth Map from Sparse Depth and Image via Conditional Diffusion Model [18.7] 本稿では,拡散モデルを深度完了タスクに統合する新しい手法であるDenseFormerを提案する。
DenseFormerは、複数の反復を通して初期ランダムな深さ分布を漸進的に精製することで、密度の深い深さマップを生成する。
本稿では,拡散過程によって生じる深部深部処理に多段階反復改良を適用した深部改良モジュールを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:11:01 GMT)
Style Quantization for Data-Efficient GAN Training [18.4] 限られたデータ設定の下では、GANは入力潜在空間をナビゲートし効果的に活用するのに苦労することが多い。
一貫性の整合性を高める新しいアプローチである textitSQ-GAN を提案する。
実験は判別器の堅牢性と生成品質の両方において顕著な改善を示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:28:44 GMT)
LANID: LLM-assisted New Intent Discovery [18.2] 新しいIntent Discovery(NID)は、既存のものを認識する能力を維持しながら、新しい意図を識別することを目的とした重要なタスクである。
TODSを新しい意図に適応しようとするこれまでの努力は、意味表現の不十分さに悩まされてきた。
我々は,大規模言語モデルを用いた軽量NIDエンコーダのセマンティック表現を強化するフレームワークであるLANIDを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:34:32 GMT)
WHERE and WHICH: Iterative Debate for Biomedical Synthetic Data Augmentation [18.0] 本稿では,バイオメディカルな有理量に基づく合成データ拡張法を提案する。
生体相関と強い相関関係を有する拡張インスタンスを保持するために, 特定の生体相関類似度を測定した。
提案手法をBLURBおよびBigBIOベンチマークで評価し、4つの主要なBioNLPタスクにまたがる9つの共通データセットを含む。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:36:30 GMT)
MetaCLBench: Meta Continual Learning Benchmark on Resource-Constrained Edge Devices [17.8] エッジデバイスのためのエンドツーエンドのMeta-CLベンチマークフレームワークを開発し、システムオーバーヘッドを評価し、性能、計算コスト、メモリ要求間のトレードオフを調査する。
以上の結果から,Meta-CL法は画像とオーディオの両モードで新しいクラスを学習できるが,エッジデバイスでは計算とメモリのコストが著しく高いことが判明した。
また,デプロイ前のソースデータに基づく事前学習とメタトレーニングの手順により,メタCLの性能が向上することが判明した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:31:49 GMT)
GenSwarm: Scalable Multi-Robot Code-Policy Generation and Deployment via Language Models [17.5] GenSwarmは、自然言語のシンプルなユーザ命令に基づいて、マルチロボットタスクの制御ポリシーを生成し、デプロイするエンドツーエンドシステムである。
マルチ言語エージェントシステムとして、GenSwarmはゼロショット学習を実現し、変更や未確認タスクへの迅速な適応を可能にする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:26:34 GMT)
SwiftCoder: Enhancing Code Generation in Large Language Models through Efficiency-Aware Fine-tuning [17.4] 現在の手法は主に正確さに重点を置いており、しばしば効率性を見落としている。
データセットは、AI駆動のコード生成を進めるためのスケーラブルで効果的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:00:08 GMT)
Cascade Reward Sampling for Efficient Decoding-Time Alignment [17.3] 復号時間アライメントにおける効率の両立を図るためにカスケード逆サンプリング(CARDS)を導入する。
CARDSは、大きな言語モデル(LLM)と報酬モデル(RM)の両方の冗長な計算を最小化する
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:07:35 GMT)
Unimodal-driven Distillation in Multimodal Emotion Recognition with Dynamic Fusion [17.2] 会話におけるマルチモーダル感情認識(MERC)は、テキスト、音声、ビデオ間で感情状態を認識する。
既存の方法は、クロスモーダルな統合のために直接不均一なモーダル融合を強調するが、多モーダル学習における不向きさに悩まされることが多い。
階層的クロスモーダルフュージョンと対話的知識蒸留によるエキスパートの混合を利用した新しいフレームワークであるSUMMERを提案する。
IEMOCAPとMELDの実験では、SUMMERは最先端の手法、特にマイノリティとセマンティックに類似した感情の認識において優れていた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:43:10 GMT)
LangYa: Revolutionizing Cross-Spatiotemporal Ocean Forecasting [17.1] 海洋予報システムであるLangYaを紹介した。
結果は、LangYaが1日から7日間のリードタイムで1つのモデルで予測できることを示した。
既存の数値およびAIベースの海洋予測システムと比較して、LangYaはGlobal Ocean Reanalysis and Simulationバージョン12から27年間の地球海洋データを使用している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:24:30 GMT)
SciReplicate-Bench: Benchmarking LLMs in Agent-driven Algorithmic Reproduction from Research Papers [16.8] 本研究では,最近のNLP論文のアルゴリズム記述からコードを生成する際の言語モデル (LLM) を評価する。
厳密な評価を容易にするため、2024年に発行された36のNLP論文から100のタスクのベンチマークであるSciReplicate-Benchを紹介する。
SciReplicate-Bench上に構築されたSci-Reproducerは,論文からアルゴリズムの概念を解釈するPaper Agentと,リポジトリから依存関係を検索してソリューションを実装するCode Agentから構成されるマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:02:24 GMT)
CrossFormer: Cross-Segment Semantic Fusion for Document Segmentation [16.7] テキストセマンティックセグメンテーションは、文書を連続的なセマンティクスで複数の段落に分割する。
従来のアプローチは、入力長の制約に対処するために、文書をセグメントに前処理することに頼っていた。
我々は,新しいクロスセグメント融合モジュールを備えたトランスフォーマーベースモデルであるCrossFormerを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:27:49 GMT)
Learning Velocity and Acceleration: Self-Supervised Motion Consistency for Pedestrian Trajectory Prediction [16.5] 本稿では,自己監督型歩行者軌道予測フレームワークを提案する。
我々は速度と加速度情報を利用して位置予測を強化する。
ETH-UCYとStanford Droneのデータセットについて実験を行った。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:17:45 GMT)
CL-Attack: Textual Backdoor Attacks via Cross-Lingual Triggers [16.4] CLアタックは、複数の言語を含む特定の構造を持つテキストを使用することでバックドアを注入する。
CL攻撃は, 分類タスクと生成タスクの両方において, 毒性率の低い攻撃成功率をほぼ100%達成できることを示す。
我々はさらに、CL攻撃の影響を部分的に軽減できるTranslateDefenseと呼ばれる新しい防衛装置を開発する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:48:28 GMT)
TeleAntiFraud-28k: A Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection [16.4] 本稿では,TeleAntiFraud-28kについて紹介する。
本データセットは,(1)自動音声認識(ASR)で書き起こされた通話記録(匿名化元音声)を用いたプライバシ保存テキストトラス・サンプル生成,(2)大規模言語モデル(LLM)に基づく自己指示サンプリングによるシナリオカバレッジの拡大,の3つの戦略により構築されている。
生成されたデータセットは、厳密に処理された28,511の音声テキストペアを含み、不正推論のための詳細なアノテーションを完備している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:06:17 GMT)
Navigating Decentralized Online Social Networks: An Overview of Technical and Societal Challenges in Architectural Choices [16.2] 分散オンラインソーシャルネットワークは、実験段階から前例のない規模の運用へと進化してきた。
フェデレーション、ピアツーピア、ブロックチェーン、ハイブリッドの4つの主要なアーキテクチャについて検討する。
これらのアーキテクチャ的側面を現実世界のケースにリンクすることで、分散化社会プラットフォームにおける社会的意味を理解するための基盤を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:39:55 GMT)
EQ-Negotiator: An Emotion-Reasoning LLM Agent in Credit Dialogues [16.1] 本稿では,事前学習した言語モデルからの感情知覚とゲーム理論と隠れマルコフモデルに基づく感情推論を組み合わせたEQ-negotiatorを提案する。
クライアントの現在の感情と過去の感情の両方を考慮して、インタラクション中の否定的な感情を管理し、対処する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:55:35 GMT)
CF-CAM: Gradient Perturbation Mitigation and Feature Stabilization for Reliable Interpretability [16.0] モデル決定を視覚化するための重要なアプローチとして、クラス活性化マッピング(CAM)技術が登場した。
勾配に基づくCAM変種は、勾配の摂動に対する感受性に悩まされ、不安定で信頼性の低い説明をもたらす。
本稿では,勾配に基づく重み付けを再導入する新しいフレームワークであるCluster Filter Class Activation Map (CF-CAM)を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:20:59 GMT)
NeuRaLaTeX: A machine learning library written in pure LaTeX [16.0] 我々は,完全に韻律で書かれた最初のディープラーニングライブラリであるNeuRaLaを紹介する。
ドキュメントの一部として、ニューラルネットワークのアーキテクチャとその損失関数を指定することができる。
ドキュメントがコンパイルされると、コンパイラはトレーニングデータを生成し、ロードし、ネットワークをトレーニングし、実験を行い、図を生成する。
論文はコンパイルに48時間かかり、NeuRaLaのソースコード全体が論文のソースコードに含まれている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:05:19 GMT)
DiffDenoise: Self-Supervised Medical Image Denoising with Conditional Diffusion Models [15.9] DiffDenoiseは、医用画像に適した強力な自己監督型認知的アプローチである。
以上の結果から,DiffDenoiseは,医用画像の合成と実世界の両面で,既存の最先端の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:15:53 GMT)
Theoretical Foundations of Conformal Prediction [15.9] コンフォーマルな予測と関連する推論技術は、多様なタスクの配列で有用である。
コンフォーマル予測の主な魅力は、正式な有限サンプル保証を提供する能力である。
本書の目的は、共形予測を研究する際に生じる基本的な技術的議論について読者に教えることである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:50:37 GMT)
ZeroMimic: Distilling Robotic Manipulation Skills from Web Videos [15.8] ZeroMimicは、複数の共通操作タスクに対して、イメージ目標条件のスキルポリシーを生成する。
我々は,ZeroMimicのアウト・オブ・ボックス性能を実環境やシミュレートされたキッチン設定で評価した。
他のタスク設定やロボット上でZeroMimicポリシーをプラグアンドプレイで再利用するために、ソフトウェアとポリシーチェックポイントをリリースする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:27:00 GMT)
AI2Agent: An End-to-End Framework for Deploying AI Projects as Autonomous Agents [15.8] 本稿では、ガイドライン駆動実行を通じてAIプロジェクトのデプロイメントを自動化するエンドツーエンドフレームワークであるAI2Agentを紹介する。
我々は、TTS、テキスト・ツー・イメージ生成、画像編集、その他のAIアプリケーションをカバーする、30のAIデプロイメントケースの実験を行った。
その結果、AI2Agentはデプロイメント時間を大幅に短縮し、成功率を向上させることがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:58:34 GMT)
Reversible Decoupling Network for Single Image Reflection Removal [15.8] 本稿では, 可逆エンコーダを提案し, 透過・反射関連特性を柔軟に分離する。
RDNet は NTIRE 2025 Single Image Reflection removal in the Wild Challenge において、忠実さと知覚的比較の両方において最高のパフォーマンスを達成している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:19:14 GMT)
Contextual Preference Collaborative Measure Framework Based on Belief System [15.7] 本稿では、更新された信条システムに基づく嗜好協調測度フレームワークを提案する。
また、選好測度アルゴリズムの精度と効率を向上させることができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:17:45 GMT)
STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding? [15.4] MLLM(Multimodal Large Language Models)は、Embodied AIとAutonomous Drivingのためのエンドツーエンドソリューションである。
MLLMの時空間的理解を評価するためのベンチマークであるSTI-Benchを紹介する。
私たちのベンチマークでは、デスクトップ、屋内、屋外のシナリオにまたがる幅広いロボットと車両の操作を網羅しています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:30:35 GMT)
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging [15.4] Hi3DGenは、画像から通常のブリッジを通して高忠実度3D幾何を生成するための新しいフレームワークである。
本研究は,中間表現として正規写像を利用することにより,画像から高忠実度3次元幾何を生成するための新たな方向を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:41:01 GMT)
Pay More Attention to the Robustness of Prompt for Instruction Data Mining [15.4] 本稿では,高品質なオンライン指導データマイニングの先駆的フレームワークを提案する。
我々の特筆すべき革新は、オンラインのインストラクションデータのプロンプトに対する攻撃を行うことで、敵のインストラクションデータを生成することである。
2つのベンチマークデータセットで広範な実験を行い、性能を評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:53:08 GMT)
BIGbench: A Unified Benchmark for Evaluating Multi-dimensional Social Biases in Text-to-Image Models [15.3] 画像生成のバイアスの統一ベンチマークであるBIGbenchを紹介する。
既存のベンチマークとは異なり、BIGbenchは4次元にわたるバイアスを分類し評価する。
BIGbenchを用いて8つの代表的T2Iモデルと3つのデバイアス法を評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:33:40 GMT)
Grasping a Handful: Sequential Multi-Object Dexterous Grasp Generation [15.2] 本稿では,多目的ロボットグリップサンプリングアルゴリズムSeqGraspについて紹介する。
本研究では,SeqGraspとSeqDiffuserをシミュレーションおよび実ロボット上で,最先端の非逐次的マルチオブジェクトグリップ生成法であるMultiGraspに対して実験的に評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:06:26 GMT)
Entropy-Based Adaptive Weighting for Self-Training [15.1] 自己学習のためのエントロピーに基づく適応重み付け(EAST)を提案する。
EASTは、自己学習中に不確実なデータを優先順位付けするために設計された適応的な重み付け戦略である。
我々はGSM8KおよびMATHベンチマークに対するアプローチを評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:04:35 GMT)
Surgical Action Planning with Large Language Models [15.0] 手術行動計画(SAP)タスクを導入し、視覚入力から将来の行動計画を生成し、現在のインテリジェントアプリケーションにおける術中予測計画の欠如に対処する。
LLMは外科的ビデオの内容を理解することを約束するが、SAPにおける予測的意思決定には未熟である。
LLM-SAPは,外科的目標の自然言語プロンプトを解釈することで,将来の行動を予測するとともに,テキスト応答を生成するフレームワークである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:29:24 GMT)
Self-Calibrating 4D Novel View Synthesis from Monocular Videos Using Gaussian Splatting [14.8] 本稿では,カメラパラメータの自己校正による高忠実度 4D GS シーン表現の学習手法を提案する。
3次元構造を頑健に表現する2次元点特徴の抽出を含む。
その結果,4次元新規ビュー合成における最先端手法の大幅な改善が示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:19:31 GMT)
Rubrik's Cube: Testing a New Rubric for Evaluating Explanations on the CUBE dataset [14.6] 本稿では、RubrikのCUBEについて紹介する。教育にインスパイアされたルーリックで、26k説明のデータセットで、後に品質アノテートを行う。
Rubrikを用いることで、説明はタスクと知覚の難しさの両方に影響されていることがわかった。
低品質は、主に結束や単語選択よりも、LCMが生成した説明の簡潔さの欠如に起因する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:48:59 GMT)
Is LLM the Silver Bullet to Low-Resource Languages Machine Translation? [14.6] 低リソース言語(LRL)は、言語資源の制限と標準データセットの表現不足により、自然言語処理において重大な課題を呈している。
本稿では,FLORES-200などのベンチマークを用いて,200言語にわたる現在の大規模言語モデル(LLM)の限界を体系的に評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:56:03 GMT)
Spatio-temporal Prediction of Fine-Grained Origin-Destination Matrices with Applications in Ridesharing [14.5] 本稿では,データ空間の疎結合を緩和するための教師なし空間粗大化技術と,意味的および地理的依存関係の両方をキャプチャするエンコーダ・デコーダ・アーキテクチャとを組み合わせたOD-CEDを紹介する。
従来の統計手法に比べて、ルート平均二乗誤差が最大45%減少し、平均絶対パーセンテージ誤差が60%減少した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:52:27 GMT)
Image as an IMU: Estimating Camera Motion from a Single Motion-Blurred Image [14.5] 本研究では,動きのぼかしを動き推定のためのリッチキューとして活用する新しいフレームワークを提案する。
提案手法は, 単一動画像から直接, 濃密な運動流場と単眼深度マップを推定することにより機能する。
本手法は,高速でアグレッシブなカメラの動きを強く捉えるIMUライクな計測法である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:52:51 GMT)
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics [14.3] 音声信号と3次元顔メッシュの複雑な対応をキャプチャする音声-メシュ同期表現を提案する。
実験の結果, 知覚的損失を伴う3次元音声音声生成モデルの訓練は, 知覚的に正確な唇同期の3つの側面を著しく改善することがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:08:23 GMT)
LITA-GS: Illumination-Agnostic Novel View Synthesis via Reference-Free 3D Gaussian Splatting and Physical Priors [14.2] LITA-GSは、参照不要な3DGSおよび物理前駆体を用いた、照度に依存しない新規なビュー合成法である。
我々は、シーン構造とオブジェクトの外観の最適化を容易にする照明に依存しない構造描画戦略を開発した。
我々はLITA-GSの訓練のための教師なし戦略を採用し、LITA-GSが最先端(SOTA)のNeRF法を超越していることを示す広範な実験を行った。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:44:39 GMT)
A Formal Framework for Understanding Length Generalization in Transformers [14.2] 因果変換器における長さ一般化を解析するための厳密な理論的枠組みを導入する。
我々は,この理論を,アルゴリズムおよび形式言語タスクにおける長さ一般化の成功と失敗の予測器として実験的に検証した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:57:06 GMT)
FineCausal: A Causal-Based Framework for Interpretable Fine-Grained Action Quality Assessment [13.9] 我々はFineing-HMCaデータセット上で最先端のパフォーマンスを実現する新しい因果ベースのフレームワークであるFineusDivalを紹介する。
当社のアプローチでは,Graph Attention Networkベースの因果介入モジュールを活用して,バックグラウンド共同設立者から人間中心の手がかりを遠ざけている。
当社のデュアルモジュール戦略により、FinCausalは、最先端のスコアリング性能を達成するだけでなく、どの機能が評価を駆動するかを透過的かつ解釈可能なフィードバックを提供する、詳細な時間的表現を生成することができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:02:29 GMT)
CIBR: Cross-modal Information Bottleneck Regularization for Robust CLIP Generalization [13.9] 本稿では,暗黙的な情報ボトルネック最適化として,クロスモーダル・インフォメーション・ボトルネック(CIB)フレームワークを提案する。
この観点では、モデルはモダリティ固有の冗長性を捨てながら、共有モダリティ情報の最大化を行う。
我々は、これらのICB原則をトレーニング中に明示的に適用するクロスモーダル情報ボトルネック規則化(CIBR)手法を導入する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:00:01 GMT)
StrokeFusion: Vector Sketch Generation via Joint Stroke-UDF Encoding and Latent Sequence Diffusion [13.9] StrokeFusionはベクトルスケッチ生成のための2段階のフレームワークである。
デュアルモードのスケッチ機能学習ネットワークがあり、ストロークを高品質の潜伏空間にマッピングする。
これは、生成中のストローク位置、スケール、軌道を同時に調整するストロークレベルの潜在拡散モデルを利用する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:03:03 GMT)
Skip-Vision: Efficient and Scalable Acceleration of Vision-Language Models via Adaptive Token Skipping [13.8] 重要なボトルネックは、きめ細かい画像理解に必要な視覚トークンの拡散に起因する。
視覚言語モデルにおけるトレーニングと推論の非効率性に対処する統合フレームワークであるSkip-Visionを提案する。
実験の結果,Skip-Visionはトレーニング時間を最大35%短縮し,FLOPを75%,レイテンシを45%短縮した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:19:29 GMT)
Satori: Towards Proactive AR Assistant with Belief-Desire-Intention User Modeling [13.6] 本稿では,ユーザの心理状態と環境状況の両方をモデル化し,ユーザを積極的に誘導する新しいARシステムである佐取について紹介する。
SatoriはBreief-Desire-Intention (BDI)フレームワークと最先端のマルチモーダル言語モデル(LLM)を統合し、文脈的に適切なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:31:22 GMT)
An Integrated AI-Enabled System Using One Class Twin Cross Learning (OCT-X) for Early Gastric Cancer Detection [13.6] 胃癌の早期発見は、現在の診断技術の限界によって妨げられている。
本稿では,高速化のバランスをとるため,高度なハードウェアとソフトウェア技術を統合した統合システムを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:37:17 GMT)
Choco-Q: Commute Hamiltonian-based QAOA for Constrained Binary Optimization [13.5] 本稿では,制約付きバイナリ最適化問題に対する形式的で普遍的なフレームワークであるChoco-Qを提案する。
Choco-Qの主な革新は、通勤ハミルトニアンをドライバーハミルトニアンとして埋め込むことであり、その結果より一般的な符号化形式が作られる。
我々の分解法は線形時間だけを要し、エンドツーエンドの加速を実現している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:47:20 GMT)
Teola: Towards End-to-End Optimization of LLM-based Applications [13.5] 大規模言語モデル(LLM)ベースのアプリケーションは、エンドツーエンドのレイテンシに寄与する。
既存のフレームワークでは,タスクモジュールによる粗粒度のオーケストレーションが採用されている。
タスクプリミティブを基本単位として,各クエリのワークフローをプリミティブレベルのデータフローグラフとして表現する,詳細なエンドツーエンドオーケストレーションを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:33:54 GMT)
SuperEvent: Cross-Modal Learning of Event-based Keypoint Detection [13.4] SuperEventは、表現力のある記述子で安定したキーポイントを予測するための、データ駆動のアプローチである。
我々は SuperEvent を,現代的なスパースキーポイントとディスクリプタベースのSLAM フレームワークに統合することで,その有用性を実証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:46:02 GMT)
Graph neural networks extrapolate out-of-distribution for shortest paths [13.3] グラフニューラルネットワーク(GNN)は、短いパスインスタンスの小さなセットに対して、スパーシリティ規則化された損失を最小限に抑えるために訓練される。
勾配降下により訓練されたGNNは、この損失を最小限に抑え、実際に外挿することができることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:46:30 GMT)
Federated Learning for Cross-Domain Data Privacy: A Distributed Approach to Secure Collaboration [13.2] 本稿では,フェデレート学習に基づくデータプライバシ保護フレームワークを提案する。
分散学習によるデータプライバシの確保を前提として、効果的なクロスドメインデータコラボレーションを実現することを目的としている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:04:45 GMT)
JointTuner: Appearance-Motion Adaptive Joint Training for Customized Video Generation [13.2] JointTunerは、新しい適応型ジョイントトレーニングフレームワークである。
我々は文脈認識型ゲーティング機構を組み込んだAdaptive LoRAを開発した。
内在性外見から運動パターンを分離するために出現非依存の時間損失を導入する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:04:07 GMT)
Mitigating Cache Noise in Test-Time Adaptation for Large Vision-Language Models [13.2] 下流タスクにおける分散シフトに起因する性能劣化に対する解決策として,視覚言語モデルのテスト時適応(TTA)が注目されている。
我々は、包括的で信頼性の高いキャッシュ機構を導入し、キャッシュ、残留、ガウス(CRG)と呼ばれる新しいゼロショットTTA手法を提案する。
13のベンチマーク実験の結果、CRGは最先端のTTA法よりも優れており、例外的な堅牢性と適応性を示している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:28:04 GMT)
SAVeD: Learning to Denoise Low-SNR Video for Improved Downstream Performance [13.2] ファンデーションモデルは自然画像の視覚タスクに優れるが、低信号対雑音比(SNR)ビデオでは失敗する。
本稿では,低SNRセンサビデオの自己監督手法であるビデオ・フォー・ダウンストリーム・タスク(SAVeD)の時空間拡張とデノベーションについて紹介する。
提案手法は,より少ないリソース要件で,分類,検出,追跡,カウントを改良し,最先端のビデオ復号化手法より優れる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:14:48 GMT)
Consistency-aware Self-Training for Iterative-based Stereo Matching [13.1] 本稿では,反復型ステレオマッチングのための一貫性を考慮した自己学習フレームワークを提案する。
まず, 誤差が大きい地域では, モデル予測時により顕著な発振特性を示す傾向が見られた。
そこで我々は,疑似ラベルの重み付けを調整し,誤りの蓄積と性能劣化問題を軽減するために,整合性を考慮したソフトウェイトド・ロスを導入する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:58:25 GMT)
Steering Large Agent Populations using Mean-Field Schrodinger Bridges with Gaussian Mixture Models [13.0] Mean-Field Schrodinger Bridge (MFSB) 問題は、最小の作業制御ポリシーを見つけることを目的とした最適化問題である。
マルチエージェント制御の文脈において、目的は同一の相互作用する協調エージェントの群の構成を制御することである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:01:04 GMT)
Online Reinforcement Learning in Non-Stationary Context-Driven Environments [13.0] 非定常環境におけるオンライン強化学習(RL)について検討する。
オンラインRLは「破滅的忘れ」 (CF) によってこのような環境において困難である
我々は,従来の経験に則った政策出力を固定することでCFと戦うオンラインRLアプローチであるローカル制約政策最適化(LCPO)を提示する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:46:23 GMT)
OrchMLLM: Orchestrate Multimodal Data with Batch Post-Balancing to Accelerate Multimodal Large Language Model Training [12.9] モータリティ構成不整合によるMLLMトレーニングにおける非効率性を軽減するためのフレームワークであるOrchMLLMを紹介する。
Batch Post-Balancing DispatcherとMLLM Global Orchestratorは、シーケンシャルデータにおけるミニバッチの不均衡を取り除くために使用される。
OrchMLLMは、84B MLLMを2560ドルのH100 GPUで3つのモダリティでトレーニングする際に、MFU(Model FLOPs utilization)を41.6%で達成し、Megatron-LMを最大3.1倍のスループットで上回っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:24:23 GMT)
Quantifying the Capability Boundary of DeepSeek Models: An Application-Driven Performance Analysis [12.8] 我々は、DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwenシリーズ、DeepSeek-R1-Distill-Llamaシリーズおよび推論モデルQwQ-32Bの体系的評価を行う。
性能階層分類によるDeepSeekモデルの能力境界の定量化を行う。
我々はモデル選択ハンドブックを開発し、モデル間の関係、その能力、実用性を明確に示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:29:01 GMT)
Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback [12.7] 本稿では、推論タスク検証器(RTV)と生成報酬モデル(GenRM)を組み合わせたハイブリッド報酬システムを導入し、報酬ハッキングを緩和する。
また,応答の多様性を維持し,学習効率を高めるために,新しいプロンプト選択手法であるPre-PPOを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:09:14 GMT)
SALT: A Flexible Semi-Automatic Labeling Tool for General LiDAR Point Clouds with Cross-Scene Adaptability and 4D Consistency [12.5] 一般のLiDAR点雲に対するフレキシブルな半自動ラベリングツール(SALT)を提案する。
SALTは、生のLiDARデータを直接操作し、自動でプリセグメンテーション結果を生成する。
私たちは、SALTのオープンソース化が現在のLiDARデータセットの大幅な拡張を触媒することを期待しています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:46:55 GMT)
VL-ICL Bench: The Devil in the Details of Multimodal In-Context Learning [12.5] 大規模言語モデル(LLM)は、創発的な文脈内学習(ICL)を示すことで有名である。
本研究では,マルチモーダルインコンテキスト学習のためのベンチマークVL-ICL Benchを提案する。
我々は,このベンチマークスイートに対して最先端のVLLMの能力を評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:03:34 GMT)
RingMo-Aerial: An Aerial Remote Sensing Foundation Model With A Affine Transformation Contrastive Learning [12.4] 本稿では,ARSビジョンの分野における基礎モデル研究のギャップを埋めることを目的としたRingMo-Aerialモデルを提案する。
小型目標に対するモデルの検出能力を向上し、ARSの特徴となる傾いた視角に最適化する。
実験により、RingMo-Aerialは複数の下流タスクにおいてSOTA性能を達成することを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:07:12 GMT)
Learning the closest product state [12.4] 我々は、$rho$のコピーを与えられた未知の$n$-qubit量子状態$rho$に最適な(純粋な)積状態を求める問題を研究する。
我々は、$N = ntextpoly (1/varepsilon)$コピーの$rho$と$textpoly(N)$クラシックオーバーヘッドを使って、製品フィデリティの$varepsilon$-closeを最適に見つけるアルゴリズムを与える。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:34:13 GMT)
A Channel-Triggered Backdoor Attack on Wireless Semantic Image Reconstruction [12.4] 本稿では,新しい攻撃パラダイムであるChannel-Triggered Backdoor Attack (CT-BA)を提案する。
我々は、異なる色相分布のチャネルゲインや、異なるパワースペクトル密度のチャネルノイズを電位トリガとして利用する。
我々は,3つのデータセットにまたがるジョイントソース・チャネル符号化(JSCC)モデルにおいて,CT-BAのロバスト性を評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:17:10 GMT)
Disentangled 4D Gaussian Splatting: Towards Faster and More Efficient Dynamic Scene Rendering [12.3] 2次元画像から動的シーンを合成する新アンタングルビュー合成(NVS)は重要な課題である。
時間的および空間的変形を両立させる新しい表現・レンダリング手法であるDisentangled 4D Gaussianting(Disentangled4DGS)を導入する。
提案手法は,3090 GPU上での1352times1014$の解像度で,343FPSの平均レンダリング速度を実現している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:03:33 GMT)
Grounding Agent Reasoning in Image Schemas: A Neurosymbolic Approach to Embodied Cognition [12.3] 本稿では,認知理論とエージェントシステムを橋渡しする新しい枠組みを提案する。
我々は、エージェントの基本的な概念構造に対する理解を基盤として、ニューロシンボリックシステムを構築することができるだろう。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:01:39 GMT)
A Survey of Reinforcement Learning-Based Motion Planning for Autonomous Driving: Lessons Learned from a Driving Task Perspective [12.2] 自律運転(AD)における運動計画(MoP)課題に対処するための有望なアプローチとして強化学習(RL)が登場した。
RLとADの急速な進歩にもかかわらず、RLの設計プロセスの体系的な記述と解釈はまだ未開発である。
この調査は、タスク固有の視点から学ぶことに焦点を当てた、RLベースのMoP for ADの包括的なレビューを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:31:14 GMT)
ElimPCL: Eliminating Noise Accumulation with Progressive Curriculum Labeling for Source-Free Domain Adaptation [12.1] Source-Free Domain Adaptation (SFDA)は、ソースデータなしでターゲットモデルをトレーニングすることを目的としており、キーは擬似ラベルを生成することである。
情報源モデルは、ハードサンプル、特にドメインシフトに大きく影響されたサンプルに対して、非常に不確実な擬似ラベルを生成することが多いことを観察する。
本稿では,信頼に値する疑似ラベル付きサンプルを反復的にフィルタリングする新しいプログレッシブ・キュリキュラム・ラベリング法を提案する。
広範囲にわたる実験により、ElimPCLの有効性が検証され、課題に対して最大3.4%の改善が達成された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:28:27 GMT)
A Deep Learning Approach to Anomaly Detection in High-Frequency Trading Data [12.1] 本稿では,外国為替市場のマイクロ構造における異常な挙動を検出するための,段階的スライディングウインドウトランスフォーマーアーキテクチャに基づくアルゴリズムを提案する。
本手法は,多段階の時間的特徴を段階的スライディングウィンドウを通じて捕捉し,トランスフォーマーの自己注意機構と重み付けされた注意機構を組み合わせることで,グローバルおよびローカルな依存関係を抽出する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:14:31 GMT)
An extrapolated and provably convergent algorithm for nonlinear matrix decomposition with the ReLU function [12.1] 2つの定式化は、特に低ランクの $Theta を生じる可能性がある。
また、$Theta$をパラメータ化する3B-ReLUNMDと呼ばれる別のモデルも検討する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:27:41 GMT)
Solving the Best Subset Selection Problem via Suboptimal Algorithms [12.0] 提案手法を他のアルゴリズムと比較し,最適選択問題の解法を提案する。
新たな手法は最適な部分集合問題を解くための競合的部分最適アルゴリズムであることが観察された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:43:33 GMT)
EMForecaster: A Deep Learning Framework for Time Series Forecasting in Wireless Networks with Distribution-Free Uncertainty Quantification [11.9] 我々は、textitEMForecasterと呼ばれるディープラーニング(DL)時系列予測フレームワークを開発した。
EMForecasterは、短期と長期の両方の予測地平線にまたがって、さまざまなデータセットで優れたパフォーマンスを実現している。
ポイント予測タスクでは、EMForecasterは現在の最先端のDLアプローチを大きく上回り、Transformerアーキテクチャよりも53.97%、ベースラインモデルの平均より38.44%改善している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:10:08 GMT)
Node Embeddings via Neighbor Embeddings [11.8] 本稿では,高次元ノード表現を生成するグラフt-SNEとグラフCNEを紹介する。
グラフt-SNEとグラフCNEはどちらも局所構造保存の点で最先端のアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:16:03 GMT)
Beijing Normal University 12 meter Interferometric kHz GW Detector Prototype [11.8] 高周波体制、特にキロヘルツ(kHz)の範囲では、未探索のままである。
北京師範大学(BNU)の試作機は、専用のkHz GW検出器を開発する先駆的な試みである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:54:53 GMT)
FreqX: Analyze the Attribution Methods in Another Domain [11.8] PFLは、非IID、異種デバイス、公正性の欠如、不明瞭な貢献に悩まされている。
本稿では,信号処理と情報理論を導入した新しい解釈可能性手法であるemphFreqXを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:28:48 GMT)
Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents [11.7] 大規模言語モデル(LLM)は、重要なタスクを自動化する科学的エージェントへと進化している。
汎用LLMとは異なり、特殊エージェントはドメイン固有の知識、高度なツールセット、堅牢な検証メカニズムを統合する。
一般的なエージェントと異なる理由と、さまざまな科学分野の研究を進める方法を強調します。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:11:28 GMT)
AirCache: Activating Inter-modal Relevancy KV Cache Compression for Efficient Large Vision-Language Model Inference [11.7] 本稿では,LVLM推論の高速化を目的とした新しいKVキャッシュ圧縮手法であるAirCacheを提案する。
本手法は,視覚的KVキャッシュの10%を保ちながら,フルキャッシュに匹敵する性能を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:13:18 GMT)
UniOcc: A Unified Benchmark for Occupancy Forecasting and Prediction in Autonomous Driving [11.6] 占領予測のための総合的統一ベンチマークUniOcc(歴史的情報に基づく将来の占領予測)を紹介する。
UniOccは複数の実世界のデータセット(nuScenes、コラボレーティブ)と高忠実度運転シミュレータ(CARLA、OpenCOOD)からのデータを統合する。
評価の面では、評価のために最適でない擬似ラベルに依存する既存の研究とは異なり、UniOccは地道の占有に依存しない新しい指標を取り入れている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:24 GMT)
A Framework for Evaluating Emerging Cyberattack Capabilities of AI [11.6] 本研究は,(1)エンド・ツー・エンド・エンド・アタック・チェーンの検証,(2)AI脅威評価のギャップの同定,(3)目標とする緩和の優先順位付けを支援する,という制約に対処する新たな評価フレームワークを導入する。
私たちは、GoogleのThreat Intelligence Groupがカタログ化したサイバー攻撃で12,000以上の実世界のAIインスタンスを分析しました。
私たちのベンチマークは、さまざまなサイバー攻撃フェーズにまたがる50の新たな課題で構成されています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:35:02 GMT)
Dynamics of Spinning Test Body in quadratic Einstein-Cartan Theory and its Free-fall Test [11.5] アインシュタイン・カルタン理論の枠組みにおける非相対論的スピン試験体(STB)の力学について検討する。
STBの軌道は伝統的なMathissontextendash Papapetrou方程式から逸脱している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:41:00 GMT)
Are Domain Generalization Benchmarks with Accuracy on the Line Misspecified? [11.5] 従来の知恵は、急激な相関関係に依存するモデルは、分配のアウト・オブ・ディストリビューションを一般化できないことを示唆している。
相関関係に対するロバスト性を評価するために広く用いられている多くのベンチマークが不明確であることを示す。
我々は、刺激的な相関性に対する堅牢性がどのように評価されるかを再考する必要性を強調し、フィールドが優先順位付けすべき適切に特定されたベンチマークを特定し、分散シフトの下でロバスト性を有意義に反映する将来のベンチマークを設計するための戦略を列挙する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:50:04 GMT)
Evil twins are not that evil: Qualitative insights into machine-generated prompts [11.4] 我々は不透明な機械生成プロンプト(オートプロンプト)を初めて網羅的に分析した。
機械生成プロンプトは、しばしば理解不能で、生成に強く影響を及ぼす最後のトークンによって特徴づけられる。
人間の専門家は、後部のオートプロンプトの中で最も影響力のあるトークンを確実に特定することができ、これらのプロンプトが完全に不透明ではないことを示唆している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:33:26 GMT)
InstructRestore: Region-Customized Image Restoration with Human Instructions [11.3] InstructRestoreと呼ばれる新しいフレームワークを提案し、人間の指示に従って領域調整可能な画像復元を行う。
まず、高品質な画像、対象領域の記述、および対応する領域マスクからなるトレーニング三重項を生成するデータ生成エンジンを開発する。
次に、制御ネットアーキテクチャの下で低画質の画像機能を統合する方法を検討し、画像詳細化の度合いを調整した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:36:05 GMT)
Self-Supervised Pretraining for Aerial Road Extraction [11.3] 航空画像分割のための深層ニューラルネットワークのための自己教師付き事前学習法を提案する。
提案手法では,空中画像の欠落した領域の再構成をモデルで学習する。
実験により、特に低データ状態において、プレトレーニングがセグメンテーションの精度を大幅に向上させることが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:14:08 GMT)
Controlled Latent Diffusion Models for 3D Porous Media Reconstruction [11.3] 多孔質媒体の3次元デジタル再構成は、地球科学の根本的な課題である。
本稿では,EDMフレームワーク内で動作する潜伏拡散モデルを用いて,この問題に対処する計算フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:36:55 GMT)
HumanAesExpert: Advancing a Multi-Modality Foundation Model for Human Image Aesthetic Assessment [11.3] HumanBeautyはHuman Image Aesthetic Assessment (HIAA)のために構築された最初のデータセット
我々は人間の画像の美的評価のための強力な視覚言語モデルであるHumanAesExpertを提案する。
我々のモデルはHIAAにおいて、他の最先端モデルよりもはるかに優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:58:11 GMT)
Towards Adversarially Robust Dataset Distillation by Curvature Regularization [11.0] 蒸留したデータセットに対向ロバスト性を組み込むことで、これらのデータセットでトレーニングされたモデルが高い精度を維持し、より良い対向ロバスト性を得る。
そこで本研究では, 従来の逆算法よりも計算オーバーヘッドの少ない蒸留プロセスに曲率正規化を組み込むことにより, この目標を達成する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:23:30 GMT)
Dataset Distillation via Knowledge Distillation: Towards Efficient Self-Supervised Pre-Training of Deep Networks [10.9] SSL事前トレーニングのための最初の有効なDD法を提案する。
具体的には、SSLでトレーニングされたより大きな教師モデルの表現に合わせるために、小さな学生モデルを訓練する。
KDの目的はSSLよりもかなり分散度が低いため、我々の手法は、高品質エンコーダの事前訓練に成功できる合成データセットを生成することができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:01:30 GMT)
Digital Quantum Simulation of the Nonlinear Lindblad Master Equation Based on Quantum Trajectory Averaging [10.6] 量子軌道平均化に基づく非線形リンドブラッドマスター方程式(NLME)の2次元ディジタルシミュレーション手法を提案する。
提案手法は,複数のジャンプ演算子を持つLMEの効率的な長期シミュレーションを可能にする。
実演として、オープン量子系における新しい理論予測をシミュレートする数値実験を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:11:48 GMT)
Adaptive Attention-Based Model for 5G Radio-based Outdoor Localization [10.3] 我々は、浅い注意に基づくモデルと単一層パーセプトロン(SLP)に基づくルータ/スイッチング機構を組み合わせた適応的ローカライゼーションフレームワークを開発した。
これにより、異なる条件に最適化された特殊なローカライゼーションモデル間のシームレスな遷移を可能にし、精度、計算効率、環境変動に対する堅牢さのバランスをとることができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:44:14 GMT)
MolGround: A Benchmark for Molecular Grounding [10.2] そこで本研究では,モデル参照能力の評価を目的とした分子基盤ベンチマークを提案する。
我々はこれまでに79kのQAペアからなる分子理解ベンチマークを構築した。
我々のシステムはGPT-4oを含む既存のモデルよりも優れており、その基盤出力は従来のタスクを強化するために統合されている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:23:16 GMT)
DT-DDNN: A Physical Layer Security Attack Detector in 5G RF Domain for CAVs [10.2] 妨害攻撃は5Gネットワークに重大なリスクをもたらす。
本研究は, CAVネットワークにおけるジャマー検出のための, 深層学習に基づく新しい手法を提案する。
提案手法は, 余剰低妨害電力の96.4%検出率を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:18:39 GMT)
MAQA: Evaluating Uncertainty Quantification in LLMs Regarding Data Uncertainty [10.2] データ不確実性の存在下での過去の不確実性定量化手法について検討する。
以上の結果から,従来の手法はシングル・アンサー・セッティングに比べて比較的困難であったことが示唆された。
我々は,データ不確実性が存在する場合でも,エントロピーと一貫性に基づく手法がモデル不確実性を効果的に推定することを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:03:14 GMT)
Spectral-Adaptive Modulation Networks for Visual Perception [9.9] グラフスペクトル分析を用いて、2次元畳み込みと自己意図の周波数応答を理論的にシミュレートし比較する。
以上の結果から,ウィンドウサイズによって変調されたノード接続が,スペクトル関数形成の鍵となる要因であることが判明した。
SPAMに基づいて,新しいビジョンバックボーンとしてSPANetV2を開発した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:53:42 GMT)
Deep Nets as Hamiltonians [9.9] ディープラーニング理論における多くの先行研究は、一連の入力の固定セットにおけるネットワーク出力の分布を分析する。
ランダムに多層パーセプトロン(MLP)をハミルトニアンとみなす。
ネットワークパラメータの典型的な実現法として、このハミルトニアンによって誘導されるエネルギー景観の特性について研究する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:51:10 GMT)
Relieving the post-selection problem by quantum singular value transformation [9.9] 完全量子アプローチに基づく選択自由な実験戦略を提案する。
我々は、量子特異値変換アルゴリズムを適用して、選択後の量子状態を決定論的にシミュレートする。
また、測定誘起量子テレポーテーションのための擬似逆デコーダも導入する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:31 GMT)
On Creating a Causally Grounded Usable Rating Method for Assessing the Robustness of Foundation Models Supporting Time Series [9.8] 本稿では,時系列の基本モデルが持つロバスト性を研究するための,因果的基盤評価フレームワークを提案する。
我々は、三つの産業にまたがる6つの著名な株式の6つの最先端(幾らかのマルチモーダル)FMTSを評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:32:58 GMT)
The fundamental localization phases in quasiperiodic systems: A unified framework and exact results [9.8] 混乱した量子系は、拡張、局所化、臨界の3種類の量子状態を持つ。
臨界状態を含む量子相は特に重要であるが、他の相に比べて理解されていない。
基本アンダーソン相のすべての実現を統一するスピンフル準周期系に基づく統一的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:02 GMT)
Pre-training with 3D Synthetic Data: Learning 3D Point Cloud Instance Segmentation from 3D Synthetic Scenes [9.6] 本稿では,3次元クラウドインスタンスセグメンテーションモデルをトレーニングするために,3次元合成データを用いた事前学習を提案する。
我々は、生成したデータを3Dシーンに挿入するために、Point-Eで直接3Dポイントクラウドデータを生成する。
実験では,事前学習法とベースライン法を比較し,性能改善を示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:42:10 GMT)
CTSketch: Compositional Tensor Sketching for Scalable Neurosymbolic Learning [9.5] 我々は、新しいスケーラブルなニューロシンボリック学習アルゴリズムであるCTSketchを紹介する。
CTSketchは, これまで達成できなかった新しい尺度に, ニューロシンボリックラーニングを推し進めている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:08:58 GMT)
Singular Value Scaling: Efficient Generative Model Compression via Pruned Weights Refinement [9.5] 生成モデルは、しばしば支配的な特異ベクトルを示し、微調整効率を阻害し、最適以下の性能をもたらす。
SVS(Singular Value Scaling, Singular Value Scaling, SVS)は, 両モデルタイプに適用可能な, プレナードウェイトを精製する多用途技術である。
SVSは、追加のトレーニングコストなしでモデルタイプ間の圧縮性能を改善する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:10:55 GMT)
Pro-Routing: Proactive Routing of Autonomous Multi-Capacity Robots for Pickup-and-Delivery Tasks [9.4] 本稿では,リアルタイムな要求に適応するプロアクティブなロールアウトベースのルーティングフレームワークを提案する。
我々は,艦隊規模のアルゴリズムを提案することにより,提案手法の信頼性保証を導出する。
私たちのフレームワークは,十分に大きな艦隊サイズを使用すると,安定性を維持します。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:14:07 GMT)
Order Matters: On Parameter-Efficient Image-to-Video Probing for Recognizing Nearly Symmetric Actions [9.4] STEP(Self-attentive Temporal Embedding Probing)は、パラメータ効率のよい画像間転送において時間感度を強制するように設計されている。
STEPは4つのアクティビティ認識ベンチマークで既存の画像とビデオの探索メカニズムを3~15%上回っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:42:38 GMT)
On noise in swap ASAP repeater chains: exact analytics, distributions and tight approximations [9.3] 損失は量子ネットワークにおける絡み合いの分布の主要なボトルネックの1つである。
等間隔リピータの事例を解析的に検討する。
最大25セグメントまでの忠実度の全モーメントについて、正確な解析公式を求める。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:00:15 GMT)
Is analogy enough to draw novel adjective-noun inferences? [9.3] 本研究は, 合成を必要とせず, 既知の推論に類似して推論を導出できるかどうかを考察する。
人間とLLMの両方が収束推論を導出するが、アナロジーではうまく扱えない新しい組み合わせが存在することがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:41:16 GMT)
Resilient Sensor Fusion under Adverse Sensor Failures via Multi-Modal Expert Fusion [9.3] 我々は,多種多様な専門家のアプローチにより,高効率で堅牢なLiDARカメラ3Dオブジェクト検出器であるMoMEを導入し,堅牢な性能を実現する。
カメラ機能,LiDAR機能,あるいはそれらを組み合わせてオブジェクトクエリをデコードする3つの並列専門家デコーダを使って,MoMEはモダリティ依存関係を完全に分離する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:12:56 GMT)
Dynamic High-Order Control Barrier Functions with Diffuser for Safety-Critical Trajectory Planning at Signal-Free Intersections [9.0] 信号のない交差点を通る安全かつ効率的な軌道を計画することは、自動運転車にとって重要な課題である。
本研究では,動的高次制御バリア関数(DHOCBF)と拡散モデル(DSC-Diffuser)を統合する安全クリティカルプランニング手法を提案する。
動的環境における運転安全をより確実にするために,提案したDHOCBFフレームワークは周囲の車両の動きを考慮した動的調整を行う。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:57:52 GMT)
Accelerating High-Efficiency Organic Photovoltaic Discovery via Pretrained Graph Neural Networks and Generative Reinforcement Learning [8.9] 我々は,グラフニューラルネットワーク(GNN)の大規模事前学習とGPT-2に基づく強化学習(RL)戦略を統合するフレームワークを提案する。
このアプローチは予測効率が21%に近づいた候補分子を生成するが、さらなる実験的な検証が必要である。
私たちは現在、3000近いドナー-アクセプタペアを含む、最大のオープンソースOPVデータセットを構築しています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:31:15 GMT)
From Colors to Classes: Emergence of Concepts in Vision Transformers [8.9] 視覚変換器(ViT)は、その強力な表現能力のために、様々なコンピュータビジョンタスクでますます活用されている。
本稿では、ニューロンラベリングを用いて、最先端のViTで符号化された概念を階層的に解析する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:28:43 GMT)
An Explainable Neural Radiomic Sequence Model with Spatiotemporal Continuity for Quantifying 4DCT-based Pulmonary Ventilation [8.8] 本稿では, 妥協された肺換気領域を同定するために, 説明可能なニューラル・ラジオミック・シーケンス・モデルを提案する。
VAMPIREデータセットから45人の肺癌患者のコホートを分析した。
提案モデルでは,25例のPETでは0.78(0.74-0.79),20例のSPECTでは0.78(0.74-0.82)のDice類似係数が得られた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:47:03 GMT)
Conformal uncertainty quantification to evaluate predictive fairness of foundation AI model for skin lesion classes across patient demographics [8.7] 我々は、コンフォメーション解析を用いて、視覚変換器に基づく基礎モデルの予測不確かさを定量化する。
基礎モデルの特徴埋め込みの堅牢性を評価するために、公正度測定としてどのように使用できるかを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:06:00 GMT)
Generating Mitigations for Downstream Projects to Neutralize Upstream Library Vulnerability [8.7] サードパーティのライブラリは、開発者が既存の機能を再現する必要がなくなるため、ソフトウェア開発において不可欠である。
セキュリティバージョンへの依存関係のアップグレードは、パッチや特定のバージョン要件のプロジェクトなしに脆弱性を中和することは不可能である。
最先端の自動脆弱性修復と自動プログラム修復はどちらもこの問題に対処できない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:20:29 GMT)
Model Selection for Inverse Reinforcement Learning via Structural Risk Minimization [8.6] 逆強化学習(IRL)は通常、報酬関数モデルが重み付けされた特徴の和として事前に指定されていると仮定する。
単純化されたモデルは理想的な報酬関数を含まないが、複雑さの高いモデルは相当なコストと潜在的な過度なオーバーフィッティングをもたらす。
本稿では、構造リスク最小化フレームワークを導入することにより、IRL問題のモデル選択におけるこのトレードオフを解決する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:05:28 GMT)
Data-driven construction of a generalized kinetic collision operator from molecular dynamics [8.6] 分子動力学から一般化された運動衝突作用素を学習するためのデータ駆動型手法を提案する。
その結果、衝突エネルギー移動の広く見過ごされた異方性の性質を保存することは、非無視相関によるプラズマ運動の予測に不可欠であることが示唆された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:26:06 GMT)
Text2Tracks: Prompt-based Music Recommendation via Generative Retrieval [8.4] 本稿では,生成的検索タスクとして,プロンプトベースの楽曲レコメンデーションの課題に対処することを提案する。
本研究では,ユーザの楽曲レコメンデーションプロンプトから関連するトラックIDへのマッピングを直接学習する生成的検索モデルであるText2Tracksを紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:09:19 GMT)
Learning Beamforming Codebooks for Active Sensing with Reconfigurable Intelligent Surface [8.3] 本稿では,ベースステーション (BS) と再構成可能な知的表面 (RIS) のためのビームフォーミングコードブックの設計を,アップリンクローカライゼーションのためのアクティブセンシング方式で検討する。
BSとRISは、それぞれのコードブックからBSビームフォーミングコードワードとRISコードワードを慎重に選択して適応的に構成される。
本稿では,コードブック構築のための学習的アプローチと,アクティブセンシングのためのコードワード選択を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:10:57 GMT)
Scalable Multi-modal Model Predictive Control via Duality-based Interaction Predictions [8.3] RAID-Netは、モデル予測制御(MPC)予測地平線に沿って関連する相互作用を予測する、注目に基づく新しいリカレントニューラルネットワークである。
本手法は, 移動計画問題の解法において, 12倍のスピードアップを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:38:57 GMT)
PDSL: Privacy-Preserved Decentralized Stochastic Learning with Heterogeneous Data Distribution [8.1] 分散学習では、エージェントのグループが協力して、中央サーバーなしで分散データセットを使用してグローバルモデルを学ぶ。
本稿では、不均一なデータ分布を持つ新しいプライバシー保護型分散学習アルゴリズムであるPを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:58:05 GMT)
Adaptive Quantum Scaling Model for Histogram Distribution-based Quantum Watermarking [8.0] 透かし画像のスクランブルには,新しい適応量子スケーリングモデル (AQSM) が提案されている。
固定埋め込みスケールを持つ既存の量子透かし方式とは異なり、提案手法は異なる大きさの透かしを柔軟に埋め込むことができる。
提案手法の有効性とロバスト性を評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:10:33 GMT)
ADMM for Structured Fractional Minimization [7.9] 本稿では,構成された分数問題の一類について考察する。
sf FADMM - 数値問題に対する最初の交互方向乗算器。
sf FADMM は $eps$-ilon に収束する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:26:37 GMT)
DSU-Net:An Improved U-Net Model Based on DINOv2 and SAM2 with Multi-scale Cross-model Feature Enhancement [7.9] 本稿では,DINOv2によるSAM2用マルチスケール機能協調フレームワークを提案する。
コストのかかるトレーニングプロセスを必要とせず、カモフラージュ目標検出や有能なオブジェクト検出といった下流タスクにおいて、既存の最先端のメソオードを超越している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:41:23 GMT)
PixelCAM: Pixel Class Activation Mapping for Histology Image Classification and ROI Localization [7.9] 弱教師付きオブジェクトローカライゼーション(WSOL)メソッドは、トレーニングモデルで画像の分類とROIのローカライズを可能にする。
標準WSOL法は, クラスアクティベーションマッピング(CAM)法に依存し, 単一または2段階の戦略に従って空間的局所化マップを生成する。
我々は,空間オブジェクトの局所化が可能な画素特徴空間における,コスト効率の良いフォアグラウンド/バックグラウンドの画素ワイズ分類器であるPixelCAMを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:18:01 GMT)
Learning a Single Index Model from Anisotropic Data with vanilla Stochastic Gradient Descent [7.8] ニューラルネットワークが特徴を学習する能力を研究するためのシングルインデックスモデル(SIM)の学習問題について検討する。
本研究では,異方性入力データを用いたSIM下でのバニラグラディエントDescent(SGD)の学習動態を解析した。
共分散行列の構造によって決定される実効次元の概念を用いて、サンプルの複雑さの上下境界を導出する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:07:30 GMT)
Advanced Quantum Annealing Approach to Vehicle Routing Problems with Time Windows [7.8] 本稿では,Traveing Salesman Problem with Time WindowsとCapacitated Vehicle Routing Problem with Time Windowsの2つのNP-Hard問題に焦点をあてる。
D-WaveのQuantum Annealer と Constrained Quadratic Model (CQM) をハイブリッドフレームワークに利用してこれらの問題を解決する。
我々は、CQMソルバがルートコストを効果的に最小化する一方で、問題のサイズが大きくなるにつれて時間窓の実現可能性を維持するのに苦労していることを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:32:40 GMT)
A Comparative Study of Scanpath Models in Graph-Based Visualization [7.6] アイトラッキング(ET)データは、コスト、プライバシ、スケーラビリティに関する課題を提示する。
本研究では,40名の参加者を対象に,グラフ解析を行ったET実験を行った。
我々は,DeepGaze,UMSS,Gazeformerなどのモデルで生成したヒトスキャンパスと合成パスを比較した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:43:42 GMT)
TestART: Improving LLM-based Unit Testing via Co-evolution of Automated Generation and Repair Iteration [7.5] 大規模言語モデル(LLM)は、単体テストケースを生成する際、顕著な能力を示した。
本研究では,新しい単体テスト生成法であるTestARTを提案する。
TestARTは、自動生成と修復の反復の共進化を通じて、LLMベースのユニットテストを改善している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:13:27 GMT)
Constraints on Velocity and Spin Dependent Exotic Interaction at the Millimeter Scale with a Diamagnetic-levitated Force Sensor [7.5] 光ボソンは電子スピンと核子の間の速度とスピン依存エキゾチック相互作用を媒介する。
本研究では, 磁気浮上型力センサを用いたエキゾチック相互作用をミリスケールで検出する手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:20:34 GMT)
Foundation Models For Seismic Data Processing: An Extensive Review [7.5] その重要性にもかかわらず、従来の地震処理技術はノイズや損傷データといった課題に直面している。
ディープラーニングアプローチは、効率的でユーザフレンドリな代替手段を導入している。
ファンデーションモデルは、自然画像化の成功により、地震の領域で勢いを増している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:48:31 GMT)
Navi-plus: Managing Ambiguous GUI Navigation Tasks with Follow-up [7.5] 本稿では,GUIエージェント内に対話型情報補完機能を組み込んだ$textbfSelf-Correction GUI Navigationについて紹介する。
この結果から,GUIフォローアップ質問機能を備えたエージェントが,不明瞭なユーザタスクに直面した場合に,そのパフォーマンスを回復できることが示唆された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:56:24 GMT)
Feature learning from non-Gaussian inputs: the case of Independent Component Analysis in high dimensions [7.2] 我々は、最も人気のあるICAアルゴリズムであるFastICAと勾配降下(SGD)のための特徴学習におけるデータ構造間の相互作用について検討する。
我々は、バニラオンラインSGDがFastICAより優れており、損失を平滑にすることで最適なサンプルの複雑さが$ngtrsim d2$に達することを証明している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:46:47 GMT)
Distributed Fractional Bayesian Learning for Adaptive Optimization [7.2] 本稿では,各エージェントが共通パラメータを持つローカルコスト関数にのみアクセス可能な分散適応最適化問題について考察する。
分散最適化問題におけるパラメータの不確実性に対処し、同時に最適解を見つけるための貴重な洞察を提供することを目的としている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:02:37 GMT)
AMMSM: Adaptive Motion Magnification and Sparse Mamba for Micro-Expression Recognition [7.1] 本稿では,Adaptive Motion Magnification and Sparse Mambaというマルチタスク学習フレームワークを提案する。
この枠組みは, 自己監督型微妙な動きの倍率化により, マイクロ表現の精度を高めることを目的としている。
空間選択の倍率係数と空間選択の余剰比を最適化するために進化的探索を用い、さらに性能を向上させるために微調整を行った。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:17:43 GMT)
HyperGLM: HyperGraph for Video Scene Graph Generation and Anticipation [7.0] ビデオシーングラフ生成(VidSGG)は、ビデオフレーム間のマルチオブジェクト関係をキャプチャするために登場した。
Scene HyperGraph (HyperGLM) 上でのマルチモーダル LLM を提案する。
我々は,3人称,自我中心,ドローンビューから1.9Mフレームを備えた新しいビデオシーングラフ推論データセットを紹介した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:16:49 GMT)
MGD-SAM2: Multi-view Guided Detail-enhanced Segment Anything Model 2 for High-Resolution Class-agnostic Segmentation [7.0] MGD-SAM2は、SAM2とグローバルイメージとローカルパッチ間のマルチビュー特徴相互作用を統合し、正確なセグメンテーションを実現する。
HRCS画像の局所的詳細や大域的意味を抽出するために,まずMPAdapterを導入し,SAM2エンコーダを適応させる。
そこで, MCEM と HMIM は, 局所的なテクスチャとグローバルなコンテキストをさらに活用するために, マルチスケールにおける多視点特徴を集約することを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:02:32 GMT)
Hamiltonian Dynamics Learning: A Scalable Approach to Quantum Process Characterization [6.7] 短時間のハミルトン力学に特化して設計された効率的な量子プロセス学習法を提案する。
我々は、量子機械学習の応用を実証し、このプロトコルは、ユニタリ変換を直接学習することで、変分量子ニューラルネットワークの効率的なトレーニングを可能にする。
この研究は、実用的な量子力学学習のための新しい理論的基盤を確立し、短期的およびフォールトトレラントな量子コンピューティングの両方においてスケーラブルな量子プロセスのキャラクタリゼーションの道を開いた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:50:00 GMT)
Smart Contracts in the Real World: A Statistical Exploration of External Data Dependencies [6.7] 10,500件のスマートコントラクトを分析し,古いものや誤ったものを除くと,9,356件の有効契約を保持できた。
コントラクトコードを抽象構文木に変換するためにコード解析を採用し、外部データ依存関係に関連するキーワードを特定しました。
9,356の有効なスマートコントラクトを手作業で分類し、アプリケーションドメインと外部データとの典型的なインタラクション方法を確認しました。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:53:40 GMT)
Optimization of Layer Skipping and Frequency Scaling for Convolutional Neural Networks under Latency Constraint [6.7] 本稿では,PLS(Proportional Layer Skipping)に関わるアプローチを提案し,周波数スケーリング(FS)を調整する。
PLSはネットワーク層を選択的にバイパスすることで計算複雑性を減らし、一方レイテンシ制約下でのエネルギー使用を最適化するためにプロセッサの周波数を周波数スケーリングする。
CIFAR-10データセットを用いたResNet-152の実験では、計算要求とエネルギー消費が最小限の精度で大幅に削減された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:40:11 GMT)
Combining Query Performance Predictors: A Reproducibility Study [6.7] 早ければ2009年にも、予測品質を改善するために異なるQPP手法を組み合わせることができるかどうかをHauffらは検討した。
本研究は,新たな予測手法,評価指標,データセットを照らして,Hauffらの研究結果の程度を評価するものである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:01:58 GMT)
CrowdVLM-R1: Expanding R1 Ability to Vision Language Model for Crowd Counting using Fuzzy Group Relative Policy Reward [6.7] Fuzzy Group Relative Policy Reward (FGRPR)
本稿では,グループ相対政策最適化とファジィ報酬関数を統合し,学習効率を向上させる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:57:16 GMT)
ElaLoRA: Elastic & Learnable Low-Rank Adaptation for Efficient Model Fine-Tuning [6.7] ElaLoRA は適応的な低ランク適応フレームワークであり、勾配依存の重要度スコアに基づいて動的に順応し、ランクを拡大する。
ElaLoRAは、異なるパラメータ予算で既存のPEFTメソッドを一貫して上回っている。
原則的かつ適応的なランク割り当て機構を導入することで、ElaLoRAはスケーラブルで効率的な微調整ソリューションを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:58:25 GMT)
Are Large Language Models Memorizing Bug Benchmarks? [6.6] 大規模言語モデル(LLM)は、コード生成、バグ検出、修復など、様々なソフトウェアエンジニアリングタスクに不可欠なものになっている。
ソフトウェアエンジニアリングコミュニティの懸念は、ベンチマークがデータ漏洩のリスクのため、真のLLMパフォーマンスを確実に反映していないことだ。
一般的なLSMを系統的に評価し、広く使われているバグベンチマークからデータ漏洩に対する感受性を評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:02:51 GMT)
Coherent manipulation of interacting electron qubits on solid neon [6.6] 単一電子オンソリッドネオン (eNe) 電荷量子ビットは、極端に長いコヒーレンス時間と高い操作率を示す。
このプラットフォームの2量子ゲートは、現実的な量子情報処理の次の大きなステップである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:27:23 GMT)
Uni-Render: A Unified Accelerator for Real-Time Rendering Across Diverse Neural Renderers [6.6] 本稿では,ニューラルネットワークの一般的なパイプラインを対象とする,統一型ニューラルネットワークレンダリングアクセラレータを提案する。
提案されたアクセラレータは、エッジデバイス上のさまざまな代表パイプラインをまたいだリアルタイムニューラルネットワークレンダリングを実現するための、最初のソリューションとして際立っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:14:15 GMT)
Rec-R1: Bridging Generative Large Language Models and User-Centric Recommendation Systems via Reinforcement Learning [6.4] Rec-R1は大規模言語モデル(LLM)をクローズドループ最適化を通じてレコメンデーションシステムでブリッジする。
プロンプトや教師付き微調整(SFT)とは異なり、Rec-R1は固定ブラックボックスレコメンデーションモデルからのフィードバックを使って直接LLM生成を最適化する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:36:00 GMT)
Integrating Large Language Models with Human Expertise for Disease Detection in Electronic Health Records [6.4] 本研究は, EHR臨床ノートから複数の条件を同定するための, 先進的な大規模言語モデルに基づく効率的な戦略を考案した。
EHRノートの分析,理解,解釈にLLM(Generative Large Language Model)を利用したパイプラインを開発した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:19:18 GMT)
DH-Mamba: Exploring Dual-domain Hierarchical State Space Models for MRI Reconstruction [6.3] 本稿では,効率的なMRI再構成のための選択状態空間モデル(Mamba)について検討する。
マンバは通常、2D画像を行と列に沿って異なる1D配列に平坦化し、k空間のユニークなスペクトルを乱す。
既存のアプローチでは、画素レベルで画像を展開するために、多方向の長軸走査を採用しており、長距離の忘れ込みと計算負荷が高い。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:41:34 GMT)
Local Information Matters: Inference Acceleration For Grounded Conversation Generation Models Through Adaptive Local-Aware Token Pruning [6.3] Grounded Conversation Generation (GCG)は、オブジェクトセグメンテーションマスクとシームレスに連動する自然言語応答を生成するモデルを必要とする、新たなビジョンタスクである。
GLaMMやOMG-LLaVAといった最近のモデルは、多数の視覚トークンを処理するため、ピクセルレベルのグラウンド化を実現するが、かなりの計算コストがかかる。
FastV や PyramidDrop のような既存のトークンプルーニング手法は、正確な接地に不可欠な局所的な視覚的特徴を保存できない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:18:27 GMT)
Advances in Continual Graph Learning for Anti-Money Laundering Systems: A Comprehensive Review [6.1] 我々は、アンチマネーロンダリングアプリケーションのための最先端の連続グラフ学習アプローチを批判的に評価する。
分析の結果,連続学習は,過度のクラス不均衡や不正パターンの進化に直面して,モデルの堅牢性と適応性を向上することが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:06:47 GMT)
A Plasticity-Aware Method for Continual Self-Supervised Learning in Remote Sensing [6.0] リモートセンシング(RS)における連続自己教師学習(CSSL)手法の注目度が高まっている。
既存のCSSLメソッドは、新しいタスクを学習しながら、破滅的な忘れを防ぐことに重点を置いている。
本稿では,タスクの逐次学習を目的とした新しいCSSL手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:42:06 GMT)
Boost Your Human Image Generation Model via Direct Preference Optimization [6.0] 人間の画像生成は、幅広い応用のために画像合成に重要な焦点をあてるが、解剖学、ポーズ、詳細のわずかな不正確さでさえ、現実主義を損なう可能性がある。
提案手法は,好ましくない(損失)画像から分岐しながら,好ましくない(勝利)画像を生成するようにモデルを訓練するDPO(Direct Preference Optimization)を提案する。
本稿では,高品質な実画像を勝利画像として取り入れたDPO手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:55:01 GMT)
Synthesizing Public Opinions with LLMs: Role Creation, Impacts, and the Future to eDemorcacy [5.9] 本稿では,世論データを合成する大規模言語モデルについて検討する。
応答率の低下や非応答バイアスといった従来の調査手法の課題に対処する。
本稿では,知識注入に基づく役割創出という新しい手法を紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:21:52 GMT)
CryptoPulse: Short-Term Cryptocurrency Forecasting with Dual-Prediction and Cross-Correlated Market Indicators [5.9] 本稿では、マクロ経済変動、技術的指標、個別の暗号通貨価格変化を取り入れて、翌日の閉値を予測する二重予測機構を提案する。
実験により,提案モデルが最先端の性能を達成し,連続して10つの比較法より優れた結果が得られた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:58:17 GMT)
MultiMorph: On-demand Atlas Construction [5.8] MultiMorphは、ハエの解剖学的アトラスを構築するための高速で効率的な方法である。
高品質で集団固有のアトラスを単一の前方通過で生成し、任意の3D脳データセットを生成する。
最先端の最適化と学習に基づくアトラス構築手法を、小規模と大規模の両方で上回っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:35:24 GMT)
Attacker Control and Bug Prioritization [5.6] 脆弱性のパラメータに対する攻撃者の制御は、しばしば見過ごされるエクスプロイラビリティの要因である。
テナントだけでなく、単純な定性的かつ定量的な制御概念は、脆弱性を効果的に区別するのに十分なものではないことを示す。
我々は、脅威モデルや専門家の洞察を考慮に入れた上で、制御領域と呼ばれる実現可能な価値セットの分析に焦点を合わせることを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:56:21 GMT)
3D-GSW: 3D Gaussian Splatting for Robust Watermarking [5.5] 本稿では,モデルとレンダリング画像の両方の著作権を確保する3D-GSのロバストな透かし手法を提案する。
本稿では、そのレンダリング品質に対する貢献に基づいて、3次元ガウスを除去する周波数ガイドデンシフィケーション(FGD)を提案する。
本手法は,リアルタイムのレンダリング効率を向上しつつ,レンダリング品質と透かしの堅牢性の両方において優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:34:03 GMT)
Who is in Charge here? Understanding How Runtime Configuration Affects Software along with Variables&Constants [5.4] 本稿では,構成が実行時のソフトウェアにどのように影響するかについて,包括的で詳細な研究を行った。
解析の結果,構成パラメータの大部分は定数/変数と相互作用することがわかった。
以上の結果から,PCVインタラクションの「二重エッジ」が明らかとなり,新たな洞察が得られ,新たな自動化技術の開発が動機となった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:48:58 GMT)
LoRA Subtraction for Drift-Resistant Space in Exemplar-Free Continual Learning [5.4] 本稿では,機能モデリングや前処理の保存を必要とせず,機能ドリフトを効果的に処理するDrift-Resistant Space(DRS)を提案する。
提案手法は,複数のデータセットにまたがって,特に長いタスクシーケンスに対して,最先端の結果を一貫して達成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:47:09 GMT)
Privacy Vulnerabilities in Marginals-based Synthetic Data [5.4] 最強の合成データ生成アルゴリズムは, テクスチャマージの確率を保っていることを示す。
そこで本研究では,MAMA-MIAという新たなメンバシップ推論攻撃を提案し,これを3つのセミナルDPアルゴリズムに対して評価する。
当社のアプローチは、最初のSNAKE(SaNitization Algorithm under attacK... $varepsilon$)コンペに勝ちました。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:23:51 GMT)
EmoVerse: Exploring Multimodal Large Language Models for Sentiment and Emotion Understanding [5.4] Emotion Universe (EmoVerse) は、感情や感情に関連する幅広いタスクを扱うためのMLLMである。
EmoVerseは感情状態の根本原因を深く分析することができる。
また、Affective Multitask (AMT)データセットについても紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:15:17 GMT)
Towards a cognitive architecture to enable natural language interaction in co-constructive task learning [5.4] 本研究では,ココンストラクティブ・タスク・ラーニング(CCTL)における自然言語の利点を活用しなければならない認知的アーキテクチャの特徴について考察する。
まず、対話型タスク学習(ITL)、ヒューマンメモリシステムのメカニズム、自然言語とマルチモーダリティの重要性について論じる。
次に,認知アーキテクチャの現状を考察し,その能力を分析し,複数の情報源に根ざしたCCTLの概念を提示する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:23:14 GMT)
ADMM Algorithms for Residual Network Training: Convergence Analysis and Parallel Implementation [5.3] 残差ニューラルネットワークを訓練するための乗算器アルゴリズム(ADMM)のシリアルおよび並列近距離(線形化)の交互方向法を提案する。
提案アルゴリズムは反復点と目的関数の値の両方に対してR-線形(サブ線形)で収束することを示す。
実験により提案したADMMアルゴリズムの有効性を検証し, 高速で安定な収束, 性能向上, 高い計算効率を示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:37:38 GMT)
Gen3DSR: Generalizable 3D Scene Reconstruction via Divide and Conquer from a Single View [5.2] シングルビュー3D再構成は現在、2つの主要な視点からアプローチされている。
分割・分散戦略に従うハイブリッド手法を提案する。
我々は,合成シーンと実世界のシーンの両方において,我々のアプローチの再構築性能を実証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:42:34 GMT)
A Minimal Control Family of Dynamical Systems for Universal Approximation [5.2] 普遍近似特性(UAP)は、ディープラーニングにおいて基本的な位置を占める。
コンパクト領域上の連続函数を近似できることを示す。
この結果から,ニューラルネットワークと制御系との近似力の相関関係が明らかとなった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:01:12 GMT)
Biologically Inspired Spiking Diffusion Model with Adaptive Lateral Selection Mechanism [5.1] 我々はスパイキングニューラルネットワーク(SNN)に基づく新しい拡散モデルを開発する。
我々は,このスパイク内ループと横方向接続機構を併用して,サブ構造選択ネットワークを反復的に洗練する。
我々のモデルは、複数のベンチマークデータセットにまたがる最先端のSNNベースの生成モデルを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:31:50 GMT)
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary [5.1] 強化学習(RL)と大規模言語モデル(LLM)を組み合わせた新しい注釈手法を提案する。
本システムでは,RLを利用して複雑なカード再生シナリオを生成し,LLMを用いて対応する注釈文を生成する。
オープンソース LLM に適用した場合,提案する注釈フレームワークによって達成される性能の大幅な向上を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:17:35 GMT)
Frequency-Aware Attention-LSTM for PM$_{2.5}$ Time Series Forecasting [5.1] FALNetは周波数対応LSTMネットワークであり、周波数領域の分解、時間的モデリング、注意に基づく改善を統合している。
実世界の都市大気質データセットで実施された実験は、FALNetが従来のモデルより一貫して優れていることを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:07:33 GMT)
Few-Shot Generation of Brain Tumors for Secure and Fair Data Sharing [5.1] 本研究では,プライバシを保ちながら脳腫瘍像を合成する分散型小ショット生成モデル(DFGM)を提案する。
DFGMは、複数の医療センターから公開された共有可能な健康な画像とプライベートな腫瘍データを調和させ、腫瘍前景と健康な背景を混ぜて新しいデータセットを構築する。
UNetを用いてDFGMの脳腫瘍セグメンテーションにおける有効性を評価し,Diceスコアの改善はデータ拡張で3.9%,フェアネスでは4.6%であった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:59:15 GMT)
Can Zero-Shot Commercial APIs Deliver Regulatory-Grade Clinical Text DeIdentification? [4.8] John Snow Labsの医療言語モデルソリューションは、最高の精度を達成する。
AzureやGPT-4oに比べて80%以上安く、トークンによる価格設定ができない唯一のソリューションである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:44:35 GMT)
Self-Vocabularizing Training for Neural Machine Translation [4.7] トレーニングされた翻訳モデルは、元のBPE語彙とは別個のBPE語彙反復を用いて、バイトペア符号化サブセット(BPE)を使用するように誘導される。
我々は,より小さく,より最適な語彙を自己選択する反復的手法である自己語彙学習を提案し,最大1.49BLEUの改善をもたらす。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:56:52 GMT)
Head and Neck Tumor Segmentation of MRI from Pre- and Mid-radiotherapy with Pre-training, Data Augmentation and Dual Flow UNet [4.7] 放射線前療法 (pre-RT) と中放射線中療法 (mid-RT) のセグメンテーションに対する複数戦略の効果を検討した。
そこで我々は,中RT画像の分離エンコーダとラベル付きPre-RT画像の登録を行う,新しい計算フレンドリなネットワークアーキテクチャを導入した。
我々のモデルは,HiLabとして集計したDice similarity Coefficient (DSC)上で,プレRTでは82.38%,ミッドRTでは72.53%のセグメンテーション性能を達成した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:02:07 GMT)
Integrating Quantum-Classical Attention in Patch Transformers for Enhanced Time Series Forecasting [4.6] QCAAPatchTFは、高度なパッチベースの変換器と統合された量子アテンションネットワークである。
量子重ね合わせ、絡み合い、および変分量子固有解法原理を活用すること。
QCAAPatchTFは、長期および短期の予測、分類、異常検出タスクにおいて最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:23:36 GMT)
Enhancing Time Series Forecasting with Fuzzy Attention-Integrated Transformers [4.6] FANTF (Fuzzy Attention Network-Based Transformers) はファジィ論理と既存のトランスアーキテクチャを統合する新しいアプローチである。
このフレームワークはファジィ強化された注意と既存のトランスフォーマーベースのアーキテクチャのベンチマークを組み合わせることで、効率的な予測、分類、異常検出を提供する。
いくつかの実世界のデータセットに対する実験的評価により、FANTFは予測、分類、異常検出タスクのパフォーマンスを著しく向上させることが明らかになった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:33:50 GMT)
Comparing representations of long clinical texts for the task of patient note-identification [4.6] 患者ノートの識別には、匿名化された臨床ノートを対応する患者と正確に一致させ、関連するノートのセットで表現する。
BERTモデルを含む様々な埋め込み手法を探索し,中長期臨床テキストを効果的に処理する。
以上の結果から,BERTをベースとした埋め込みは従来型および階層型モデル,特に長期臨床ノートの処理において優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:31:44 GMT)
Integral regularization PINNs for evolution equations [4.5] 本稿では,損失関数に積分的残差項を組み込むことにより,時間的精度を高める新しい手法を提案する。
この方法は時間間隔全体をより小さな部分間隔に分割し、これらの部分間隔に制約を課し、時間ダイナミクスの分解と相関を改善する。
ベンチマーク問題に関する数値実験により、IR-PINNは、長年の振る舞いを捉えるために、元のPINNや他の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:02:59 GMT)
Evaluating the Feasibility and Accuracy of Large Language Models for Medical History-Taking in Obstetrics and Gynecology [4.5] 効果的な医師と患者のコミュニケーションは重要であるが、多くの時間を消費するので、クリニックは非効率になる。
近年のLarge Language Models (LLMs) の進歩は、医療履歴の自動作成と診断精度の向上のための潜在的なソリューションを提供する。
ChatGPT-4oとChatGPT-4o-miniとの医師と患者との相互作用をシミュレートするAI駆動型会話システムを開発した。
両モデルとも不妊の履歴取り出しを自動化できる可能性を示し、ChatGPT-4o-miniは完全性と抽出精度に優れていた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:09:53 GMT)
Forgetting Transformer: Softmax Attention with a Forget Gate [4.5] 我々はこの注意機構を Forgetting Attention と Forgetting Transformer (FoX) と命名する。
FoXは、長文言語モデリング、長さ補間、短文下流タスクでTransformerより優れている。
FoXはFlashAttentionアルゴリズムと互換性があり、位置埋め込みを必要としない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:41:52 GMT)
Crossmodal Knowledge Distillation with WordNet-Relaxed Text Embeddings for Robust Image Classification [4.5] クロスモーダル知識蒸留は,マルチモーダル教師モデルを用いた一助学生の育成を目的としている。
本稿では,CLIP画像埋め込みと学習可能なWordNet関連テキスト埋め込みを階層的損失下で統合するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:41:26 GMT)
Interpretable Few-shot Learning with Online Attribute Selection [4.5] 本稿では,人間に親しみやすい属性をベースとした,少数ショット学習のための本質的に解釈可能なモデルを提案する。
提案手法は,広範に使用されている4つのデータセット上で,ブラックボックス数ショット学習モデルと同等の結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:41:59 GMT)
DeepDubber-V1: Towards High Quality and Dialogue, Narration, Monologue Adaptive Movie Dubbing Via Multi-Modal Chain-of-Thoughts Reasoning Guidance [4.5] 異なるダビングスタイルへの適応、対話、ナレーション、モノローグを効果的に扱うといった重要な側面は、十分に研究されていない。
この課題に対処するために,マルチモーダルな大規模言語モデルの枠組みを提案する。
マルチモーダル条件で導かれる大きな音声生成モデルを通して高品質なダビングを生成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:51:09 GMT)
Opportunistic Screening for Pancreatic Cancer using Computed Tomography Imaging and Radiology Reports [4.4] 膵管腺癌(PDAC)は非常に攻撃的ながんであり,ステージIVで診断され,生存率は5%未満であった。
PDACリスクを予測するため,放射線画像とCT画像を統合した深層学習融合モデルの開発と評価を行った。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:13:42 GMT)
Banyan: Improved Representation Learning with Explicit Structure [4.4] 明示的な階層構造を利用して意味表現を効率的に学習するモデルであるBanyanを提案する。
リソース制約のある環境での効率よく解釈可能なNLPの可能性を強調している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:41:31 GMT)
Pharmolix-FM: All-Atom Foundation Models for Molecular Modeling and Generation [4.4] 我々は全原子基盤モデルを構築するための統一フレームワークであるPharMolixFMを提案する。
我々のフレームワークは、最先端のマルチモーダル生成モデルを用いた3つの変種を含む。
PharMolixFM-Diffはタンパク質-小分子ドッキングにおける競合予測精度を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:10:11 GMT)
Insight-RAG: Enhancing LLMs with Insight-Driven Augmentation [4.4] 本稿では,インサイトに基づく文書検索のための新しいフレームワークであるInsight-RAGを提案する。
Insight-RAG の初期段階では,従来の検索手法の代わりに LLM を用いて入力クエリとタスクを解析する。
従来のRAG手法と同様に、元のクエリを抽出した洞察と統合することにより、最終的なLCMを用いて、文脈的に豊かで正確な応答を生成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:50:27 GMT)
Hypothesis testing of symmetry in quantum dynamics [4.4] 限られたクエリ数を用いた量子力学対称性の仮説検証フレームワークを開発した。
我々は,時間反転対称性(T対称性)と対角対称性(Z対称性)を限られたクエリでテストするために,最適なタイプIIエラー確率を実現する最適アンシラフリープロトコルを構築した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:11:20 GMT)
ExScene: Free-View 3D Scene Reconstruction with Gaussian Splatting from a Single Image [4.4] 既存の方法は、単一視点からの視野が狭い低一貫性の3Dシーンを再構成するためにしばしば制限される。
任意の単視点画像から没入型3Dシーンを再構成する2段階パイプラインであるExSceneを提案する。
ExSceneは単一ビュー入力のみを使用して一貫した没入的なシーン再構築を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:33:22 GMT)
GIScience in the Era of Artificial Intelligence: A Research Agenda Towards Autonomous GIS [4.3] 自律型GISの概念を詳述するとともに,その5つの目標,5レベルの自律性,5つのコア機能,3つの運用規模を定義する枠組みを提案する。
我々は,4つの概念実証GISエージェントを用いて,自律型GISがデータ検索,空間解析,マップ作成を行う方法を示した。
本稿は、GISが従来のものから自律的な理由づけ、導出、革新、先進的なソリューションを超えて世界的課題を推し進める未来を構想する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:12:48 GMT)
Boundless Byte Pair Encoding: Breaking the Pre-tokenization Barrier [4.3] 事前トークン化は、コーパス内のトークンの分布を一般的なフル長の単語に歪ませる原因となる。
本研究では,境界制約を緩和する改良型BPEアルゴリズムであるBoundlessBを提案する。
我々のアプローチは、2つの完全プレトケンを選択的にスーパーワードと呼ぶより大きな単位にマージする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:36:29 GMT)
Crossing Boundaries: Leveraging Semantic Divergences to Explore Cultural Novelty in Cooking Recipes [4.3] 社会的要因、特に文化的背景は、新規性と革新に対する認識に大きな影響を及ぼす。
文化的ノベルティは、異なるコミュニティ間の距離によって形成されたサリエンスとノベルティの相違から生じる。
本稿では,社会学と経営学の知識を統合する学際的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:52:52 GMT)
Adversarially Robust Learning with Optimal Transport Regularized Divergences [4.3] 本稿では,情報ばらつきと最適輸送(OT)コストの両立によって構築された,最適輸送規則分岐のクラスである$Dc$を紹介する。
特に、ディープラーニングモデルの対角的堅牢性を高めるための新しいアプローチとして、$ARMOR_D$法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:34:34 GMT)
How Does A Text Preprocessing Pipeline Affect Ontology Syntactic Matching? [4.2] テキスト前処理における標準化の欠如は、マッピング結果の多様性を生み出します。
第1相テキスト前処理(トークン化・正規化)は第2相テキスト前処理(ストップワード除去・ステミング・レマトゼーション)よりも効果的である
本稿では,ポストホックチェックを用いた文脈に基づくパイプライン修復手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:35:00 GMT)
New Statistical Framework for Extreme Error Probability in High-Stakes Domains for Reliable Machine Learning [4.1] 極端な価値理論(EVT)は、最悪のケースの失敗を推定するための厳密なアプローチを提供する統計フレームワークである。
EVTを合成および実世界のデータセットに適用することにより、破滅的故障確率のロバストな推定を可能にする。
この作業は、EVTをモデルの信頼性を評価し、新しいテクノロジにおけるより安全なAIデプロイメントを保証するための基本的なツールとして確立する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:08:11 GMT)
Distance Estimation to Support Assistive Drones for the Visually Impaired using Robust Calibration [4.1] キャンパス環境における障害物から絶対距離を推定するために深度マップを用いた頑健な校正手法であるNOVAを提案する。
我々はNOVAとSOTA深度マップのアプローチ、および幾何学的および回帰的ベースラインモデルを比較し、VIPや他の障害物への距離推定を行う。
NOVAは、最大5.3-14.6倍のSOTA深度マップ法より明らかに優れている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:56:17 GMT)
The BIG Argument for AI Safety Cases [4.1] BIGの議論は、さまざまな能力、自律性、臨界性を持つAIシステムの安全ケースを構築するためのシステム全体のアプローチを採用する。
安全性と、プライバシーや株式といった他の重要な倫理的問題に対処することでバランスがとれる。
安全保証の社会的、倫理的、技術的側面を、追跡可能で説明可能な方法でまとめることによって統合される。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:28:25 GMT)
Deterministic quantum trajectory via imaginary time evolution [4.1] 近年の研究では、個々の量子軌道が重要な物理情報を符号化していることが強調されている。
この効果の直接観測は指数的なポスト選択障壁によって妨げられる。
本稿では,仮想時間進化を用いた結果の確率の量子軌道を効率的に作成する決定論的手法を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:33:55 GMT)
Features that Make a Difference: Leveraging Gradients for Improved Dictionary Learning [4.1] スパースオートエンコーダ(SAE)は、ニューラルネットワーク表現を抽出するための有望なアプローチである。
我々は、TopKアクティベーション関数を増強することにより、$k$-sparseのオートエンコーダアーキテクチャを変更するGradient SAEを紹介する。
g-SAEが任意の文脈でモデルを操る上で平均的に効果的である潜伏者を学ぶ証拠が見つかる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:36:37 GMT)
LLM4FS: Leveraging Large Language Models for Feature Selection and How to Improve It [4.0] 現状のDeepSeek-R1, GPT-o3-mini, GPT-4.5の特徴選択法について検討した。
従来のデータ駆動手法とLCMを統合したLSM4FSと呼ばれる新しいハイブリッド戦略を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:40:31 GMT)
Permutation polynomials over finite fields from low-degree rational functions [4.0] 置換二項式の2つのクラスと置換五項式の6つのクラスを$F_q2$で得られる。
得られた二項式および五項式は,文献で知られているものと同等の準乗法であることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:51:18 GMT)
Accelerated Smoothing: A Scalable Approach to Randomized Smoothing [4.0] 本稿では,モンテカルロサンプリングを代理ニューラルネットワークのトレーニングに置き換える新しい手法を提案する。
提案手法はロバスト半径認定プロセスを大幅に加速し,600ドル近い改善が得られた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:10:57 GMT)
Evaluating and Designing Sparse Autoencoders by Approximating Quasi-Orthogonality [3.9] そこで本研究では,スパース特徴ベクトルの大きさを,その正則な閉形式誤差境界を持つ密度ベクトルを用いて近似できることを示す。
本稿では,AFA (Approximate Activation Feature) を提案する。
トップAFA SAE は最先端の最先端 SAE に匹敵する再構築損失を達成できることを実証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:22:11 GMT)
Translating Multimodal AI into Real-World Inspection: TEMAI Evaluation Framework and Pathways for Implementation [3.8] 本稿では,インスペクションフレームワークにおけるマルチモーダルAIの翻訳評価について紹介する。
インダストリアルインスペクション実装でマルチモーダルAI機能をブリッジする。
このフレームワークは、技術的能力だけで、対応する採用メカニズムなしで限られた価値が得られることを実証している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:30:56 GMT)
DebFlow: Automating Agent Creation via Agent Debate [3.8] DebFlowは、リフレクションを最適化し、統合して改善するための議論のメカニズムを使用するフレームワークである。
提案手法は,HotpotQA,MATH,ALFWorldを含む6つのベンチマークデータセットで評価した。
トレーニング中、我々のフレームワークは最先端のベースラインと比較してリソース消費を37%削減します。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:56:13 GMT)
Towards Precise Action Spotting: Addressing Temporal Misalignment in Labels with Dynamic Label Assignment [3.8] 本研究では,トレーニング中の地中行動時間から時間的オフセットを予測できる新しい動的ラベル割り当て戦略を提案する。
本手法は、特に、事象が視覚的に区別され、ラベルの時間的ずれが一般的である状況において、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:57:57 GMT)
Learned Image Compression and Restoration for Digital Pathology [3.7] デジタル病理画像は医療診断において重要な役割を担っているが、その超高解像度と大きなファイルサイズは、ストレージ、トランスミッション、リアルタイム可視化に重大な課題をもたらす。
スライド画像全体(WSI)に特化して設計された新しいディープラーニングベースの画像圧縮フレームワークCLERICを提案する。
CLERICは学習可能なリフトスキームと高度な畳み込み技術を統合し、重要な病理情報を保存しながら圧縮効率を向上させる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:09:09 GMT)
Learning out-of-time-ordered correlators with classical kernel methods [3.7] XZ-OTOCと特定のOTOCの和を正確に学習できるかを検討する。
この問題を回帰タスクとして、ラベル付きデータの小さなバッチを生成する。
我々は、様々な標準カーネルマシンを訓練し、ラプラシアンおよびラジアル基底関数(RBF)カーネルが最高の性能を発揮することを観察する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:00:35 GMT)
Tensor-Based Binary Graph Encoding for Variational Quantum Classifiers [3.5] 変分量子(VQC)を用いたグラフ分類のための新しい量子符号化フレームワークを提案する。
グラフ符号化に適したより複雑な回路を構築することにより、VQCが現在の量子ハードウェアの制約内でグラフを効果的に分類できることを実証する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:00:56 GMT)
Internet of Things-Based Smart Precision Farming in Soilless Agriculture:Opportunities and Challenges for Global Food Security [3.5] 世界人口の急激な増加と耕作可能な土地の継続的な減少は、食料安全保障に重大な脅威をもたらす。
土壌のない農業、例えばヒドロポニックス、エアロポニックス、アクアポニックスは持続可能なソリューションを提供する。
本稿は、IoTベースの土壌のない農業の機会と課題について考察する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:13:56 GMT)
Efficient Learning for Entropy-Regularized Markov Decision Processes via Multilevel Monte Carlo [3.4] 本稿では,固定点反復とベルマン作用素の一般近似を融合したマルチレベルモンテカルロアルゴリズムを提案する。
本稿では,Bellman演算子に対する偏平MC推定値を用いることで,準ポリノミカル標本の複雑さが生じることを示す。
特に、これらのアルゴリズムは状態空間や作用空間の次元や濃度に依存しない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:04:54 GMT)
ShapG: new feature importance method based on the Shapley value [3.4] 特徴量を測定するために,ShapG (Shapley value for Graphs) と呼ばれる新しい説明可能な人工知能 (XAI) 手法を提案する。
最初の段階では、データセットに基づいて、ノードが機能を表し、エッジが追加される非指向グラフを定義する。
第2段階では、このグラフ構造を考慮したデータをサンプリングすることにより、近似されたシェープ値を算出する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:57:08 GMT)
Quantum Conference Key Agreement with Classical Advantage Distillation [3.4] 古典的有利蒸留(CAD)プロトコルを付加した量子会議鍵契約(QCKA)プロトコルの安全性を実証する。
我々は、セキュリティの証明を有限のキー設定で導き、一般的な、一貫性のある攻撃に対して安全なキーレートを拘束することができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:07:36 GMT)
Enhancing Image Resolution of Solar Magnetograms: A Latent Diffusion Model Approach [3.4] 超解法のための新しい拡散モデル手法を提案する。
ヘリオサイスミック・磁気画像装置(HMI)の高分解能に合わせるためにMDI磁図に適用する。
再建画像の品質を古典的指標を用いて評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:16:26 GMT)
GNN-Based Candidate Node Predictor for Influence Maximization in Temporal Graphs [3.4] 本稿では,グラフネットワークとBidirectional Long Short-Term Memory (BiLSTM)モデルを統合する学習ベースアプローチを提案する。
BiLSTMは、過去と将来のネットワーク状態からパターンを分析し、時間の経過とともに変更への適応性を保証します。
本手法は,時間的ダイナミクスの理解が不可欠であるバイラルマーケティングやソーシャルネットワーク分析などの分野において,特に有効である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:28:37 GMT)
Sample-Optimal Private Regression in Polynomial Time [3.4] アルゴリズムのサンプル複雑性の改善は,統計的クエリや情報理論的下位境界に反することを示した。
アルゴリズムは任意の外れ値の小さな部分に対して頑健であり、外れ値の小さな部分の関数として最適誤差率を達成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:08:12 GMT)
Exploring Temporal Dynamics in Event-based Eye Tracker [3.3] アイトラッキングは、特にAR、VR、XRといったウェアラブルデバイスにおいて、人間とコンピュータのインタラクションにとって重要な技術である。
フレームベース画像センサを用いた高速かつ高精度なアイトラッキングの実現は、時間分解能の制限により制限される。
TDTrackerは、時間的ダイナミクスを徹底的にモデル化することで、目の動きを素早く捉える効果的なアイトラッキングフレームワークである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:57:13 GMT)
4D mmWave Radar in Adverse Environments for Autonomous Driving: A Survey [3.3] 4Dミリ波(mmWave)レーダーは3Dセンシングとさらなる速度測定を提供する。
この調査は特に、自動運転車の悪環境における4D mmWaveレーダーに焦点を当てている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:42:50 GMT)
All You Need is Sally-Anne: ToM in AI Strongly Supported After Surpassing Tests for 3-Year-Olds [3.3] 心の理論 (Theory of Mind, ToM) は人間の認知の目印であり、個人が他人の信念や意図について考えることを可能にする。
人工知能(AI)の最近の進歩は、同等の機能を示している。
本稿では,3歳児を対象とした従来のToMテストを超えるモデルを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:32:10 GMT)
Towards Geometric-Photometric Joint Alignment for Facial Mesh Registration [3.2] 本稿では,GPJA法を提案する。
幾何学的情報と測光的情報を組み合わせることで、個々の人間の表情をピクセルレベルの精度で整列する。
この一貫性は、フェースアニメーション、再パラメータ化、およびフェースモデリングおよび効率を向上したアプリケーションのためのその他のバッチ操作の恩恵を受ける。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:37:29 GMT)
Do Chinese models speak Chinese languages? [3.2] 言語能力は、事前トレーニングデータキュレーションに関する洞察を提供する。
中国は、少数言語の傾向とマンダリン第一政策の間で異なる、明示的な言語政策の長い歴史を持っている。
アジア地域および中国のマイノリティ言語を対象とした,中国と西欧のオープンソースLLMの性能を検証した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:19:08 GMT)
Which LIME should I trust? Concepts, Challenges, and Solutions [3.1] LIME(Local Interpretable Model-Agnostic Explanations)は、最も顕著なモデル-Agnosticアプローチの一つである。
その人気にもかかわらず、LIMEはドメイン固有の問題に対する忠実さ、安定性、適用性に関連する課題に直面している。
LIMEの基本概念と既知の制限を包括的に探求し、収集する最初の調査である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:44:39 GMT)
AMB-FHE: Adaptive Multi-biometric Fusion with Fully Homomorphic Encryption [3.1] 完全同相暗号(AMB-FHE)を用いた適応型多生体融合を提案する。
AMB-FHEは、CAIAアイリスとMCYT指紋データセットからなるバイモーダルバイオメトリックデータベースに対してベンチマークされる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:00:08 GMT)
On-device Sora: Enabling Training-Free Diffusion-based Text-to-Video Generation for Mobile Devices [3.0] In-device Soraは拡散型オンデバイス・テキスト・ビデオ・ジェネレーションのための最初のモデルフリー・トレーニング・ソリューションである。
また,iPhone 15 ProでオンデバイスSoraを実装し,実験結果から高品質な動画を生成可能であることが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:19:09 GMT)
On-device Sora: Enabling Training-Free Diffusion-based Text-to-Video Generation for Mobile Devices [3.0] In-device Soraは拡散型オンデバイス・テキスト・ビデオ・ジェネレーションのための最初のモデルフリー・トレーニング・ソリューションである。
また,iPhone 15 ProでオンデバイスSoraを実装し,実験結果から高品質な動画を生成可能であることが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:22:14 GMT)
Severing Spurious Correlations with Data Pruning [2.9] 深層ニューラルネットワークは、トレーニングされているデータに現れる刺激的な相関を学習し、依存することが示されている。
このような相関関係は、これらの相関関係がもはや保たない実世界において、これらのネットワークが機能不全を引き起こす可能性がある。
我々はこれらのサンプルを含むトレーニングデータの小さなサブセットを識別し、プーンする新しいデータプルーニング手法を開発した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:11:52 GMT)
PAARS: Persona Aligned Agentic Retail Shoppers [2.9] 電子商取引では、行動データは意思決定のために収集される。
匿名化された履歴ショッピングデータを自動マイニングすることで、合成ショッピングエージェントを作成するフレームワークを提案する。
本稿では,自動エージェントA/Bテストのためのフレームワークの初期応用について紹介し,その結果と人的結果を比較した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:41:51 GMT)
Mapping Geopolitical Bias in 11 Large Language Models: A Bilingual, Dual-Framing Analysis of U.S.-China Tensions [2.8] 本研究は,11大言語モデル(LLM)における地政学的バイアスを系統的に解析する。
モデル出力のイデオロギー的傾きを検出するために,19,712個のプロンプトを作成した。
米国をベースとしたモデルは、主に米国支持の姿勢を好んでおり、一方中国のモデルでは、中国支持の偏見が顕著であった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:38:17 GMT)
Undecidable problems associated with variational quantum algorithms [2.8] 変分量子アルゴリズム(VQA)は、短期量子優位性の候補として広く研究されている。
近年の研究では、VQAのトレーニングは一般にNPハードであることが示されている。
本稿では,VQAのトレーニングが,理想化されたノイズレス設定であっても決定不可能であることを示す条件付き結果を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:52:43 GMT)
An End-to-End Comprehensive Gear Fault Diagnosis Method Based on Multi-Scale Feature-Level Fusion Strategy [2.7] 加速度信号を用いたギアのインテリジェントな故障診断手法を提案する。
本手法は、歯車におけるエンドツーエンドの故障診断の要件を効果的に満たすものである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:40:06 GMT)
KOFFVQA: An Objectively Evaluated Free-form VQA Benchmark for Large Vision-Language Models in the Korean Language [2.6] 韓国語における汎用的自由形視覚質問応答ベンチマークKOFFVQAを提案する。
私たちのベンチマークでは、画像とグレーティングの基準を合わせた275の質問を慎重に作成しています。
我々は,既存の評価基準を既存の手法よりもはるかに信頼性の高い評価基準として用いる手法を実験的に検証した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:04:25 GMT)
SoftCVI: Contrastive variational inference with self-generated soft labels [2.5] 変分推論とマルコフ連鎖モンテカルロ法がこのタスクの主要なツールである。
ソフトコントラスト変動推論(SoftCVI)を導入し、コントラスト推定フレームワークを用いて変動対象のファミリーを導出する。
我々は、SoftCVIを用いて、訓練や大量発見に安定な目標を定式化することができ、他の変分アプローチよりも頻繁に優れた推論が可能であることを発見した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:00:43 GMT)
CASTLE: Benchmarking Dataset for Static Code Analyzers and LLMs towards CWE Detection [2.5] 本稿では,異なる手法の脆弱性検出能力を評価するためのベンチマークフレームワークであるCASTLEを紹介する。
我々は,25個のCWEをカバーする250個のマイクロベンチマークプログラムを手作りしたデータセットを用いて,静的解析ツール13,LLM10,形式検証ツール2を評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:07:10 GMT)
On Speedups for Convex Optimization via Quantum Dynamics [2.5] 量子ハミルトニアンDescentフレームワークの離散シミュレーションを用いて凸最適化における量子速度の可能性を探る。
連続時間において、適切なパラメータを持つQHDは、任意に高速な収束率が得られることを示す。
QHDは、この評価ノイズのレベルを許容する既知の全ての古典的アルゴリズムに対して、超クアドラルなクエリの利点を提供することを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:21:12 GMT)
A Systematic Evaluation of LLM Strategies for Mental Health Text Analysis: Fine-tuning vs. Prompt Engineering vs. RAG [2.5] 本研究では,大規模言語モデル(LLM)を用いたメンタルヘルステキスト分析における3つのアプローチの体系的比較を行った。
感情分類と精神状態検出タスクを2つのデータセットに分けて評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:54:04 GMT)
Agent-Based Simulations of Online Political Discussions: A Case Study on Elections in Germany [2.5] 本研究では,ユーザインタラクションをモデル化するエージェントベースのシミュレーション手法を提案する。
我々は、感情分析、皮肉検出、攻撃性分類を取り入れ、投稿や返信を生成するためにAIモデルを微調整する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:17:04 GMT)
Enhancing Object Coherence in Layout-to-Image Synthesis [2.4] 本稿では,オブジェクトのコヒーレンスを導くために,効果的なグローバルセマンティックフュージョン(GSF)と自己相似特徴拡張モジュールを用いた新しい拡散モデルを提案する。
セマンティックコヒーレンスについては,イメージキャプションには画像内のオブジェクト内のセマンティックな関係を定義するための豊富な情報が含まれていると論じる。
物理コヒーレンスを改善するため,各画素の生成プロセスに局所的な物理的コヒーレンス関係を明示的に統合する自己相似コヒーレンスアテンション合成(SCA)モジュールを開発した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:32:16 GMT)
Fuzzing-based Mutation Testing of C/C++ CPS [2.4] CとC++ソフトウェアの最先端の突然変異テスト技術は、シンボリック実行に依存している。
本稿では,C および C++ ソフトウェアにおけるファジテストの有効性を実証したファジテストに依存することを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:55:27 GMT)
SonarSplat: Novel View Synthesis of Imaging Sonar via Gaussian Splatting [2.4] 本研究では,ガウススプレイティングフレームワークSonarSplatのアジマスストリーキングをモデル化するための新しいアプローチを開発した。
最先端と比較して、SonarSplatは改良された画像合成機能(+2.5dB PSNR)を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:13:45 GMT)
The impact of internal variability on benchmarking deep learning climate emulators [2.3] 完全複雑地球系モデル(ESM)は計算に非常に高価であり、複数の放出経路の気候結果の探索に使用を制限している。
ESMを近似したより効率的なエミュレータは、排出ガスを直接気候の結果にマッピングすることができ、ベンチマークを使用して標準化されたタスクやデータセットの精度を評価する。
我々は、データ駆動型気候エミュレーションの一般的なベンチマークであるClimateBenchを調査し、ディープラーニングベースのエミュレータが現在、最高のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:06:28 GMT)
Beyond a Single Mode: GAN Ensembles for Diverse Medical Data Generation [2.3] Generative Adversarial Networks (GAN) は、様々なアプリケーションで約束されている。
GANは、モード崩壊や実際のデータ分散の不十分なカバレッジといった課題に直面している。
本研究は,これらの限界,特に医用画像の文脈において,これらの限界を克服するためにGANアンサンブルを用いることを探求する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:06:01 GMT)
Green MLOps to Green GenOps: An Empirical Study of Energy Consumption in Discriminative and Generative AI Operations [2.3] 本研究では,実世界のMLOpsパイプラインにおける識別型および生成型AIモデルのエネルギー消費について検討する。
さまざまな構成、モデル、データセットにわたるレプリケーションの容易性を保証するために、ソフトウェアベースのパワー測定を採用しています。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:28:04 GMT)
BBoxCut: A Targeted Data Augmentation Technique for Enhancing Wheat Head Detection Under Occlusions [2.2] 葉や近隣の小麦の頭部から発生する閉塞をランダムな局所化マスキングでシミュレートする新しいデータ拡張手法であるBBoxCutを提案する。
我々の増強技術は質的にも量的にも大きな改善をもたらした。
特に、この改良は、コムギの頭を取り囲むシナリオにおいて特に顕著であった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:59:02 GMT)
Dynamic Operating System Scheduling Using Double DQN: A Reinforcement Learning Approach to Task Optimization [2.2] 実験の結果,Double DQNアルゴリズムは軽負荷,中負荷,重負荷シナリオ下でのスケジューリング性能が高いことがわかった。
このアルゴリズムはまた、資源利用における高い最適化能力を示し、システム状態に応じてリソース割り当てをインテリジェントに調整することができる。
今後の研究では、より複雑なシステム、特にクラウドコンピューティングや大規模分散環境におけるアルゴリズムの適用について検討する予定である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:48:21 GMT)
On the Reproducibility of Learned Sparse Retrieval Adaptations for Long Documents [2.2] 長い文書にLearned Sparse Retrieval(LSR)を適用するメカニズムを再現し検討する。
実験の結果,文書検索性能は第1セグメントが支配的であり,各セグメントの重要性が確認された。
提案手法であるExactSDMとSoftSDMを文書の長さによって再評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:19:31 GMT)
Query and Conquer: Execution-Guided SQL Generation [2.1] 本稿では,テキスト・ツー・タスクの精度を大幅に向上させる複雑な出力を生成する新しい手法を提案する。
提案手法は,複数の候補から最もセマンティックに一貫性のあるクエリを選択するために,実行結果を活用する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:43:36 GMT)
HaSPeR: An Image Repository for Hand Shadow Puppet Recognition [2.0] シャドウグラフィー(Shadowgraphy)またはボンボマニー(ombromanie)は、演劇芸術とストーリーテリングの一形態である。
プロとアマチュアの両方の手影人形クリップから抽出した15のクラスに15,000枚の手影人形画像からなる新しいデータセットを提案する。
本研究は,注目型トランスアーキテクチャよりも,スキップ接続型畳み込みモデルの大幅な性能上の優位性を示すものである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:29:48 GMT)
A Benchmark for Scalable Oversight Protocols [2.0] エージェントスコア差(ASD)測定値に基づいて,人間のフィードバックメカニズムを評価するための原則的枠組みを提案する。
スケーラブルな監視プロトコルの迅速かつ競合的な評価を容易にするために,Pythonパッケージを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:32:59 GMT)
WinoWhat: A Parallel Corpus of Paraphrased WinoGrande Sentences with Common Sense Categorization [2.0] 人気のWinoGrandeベンチマークを用いて,異なるサイズの生成モデルの評価を行った。
新しいコーパスであるWinoWhatをリリースし、WinoGrande検証セットの各インスタンスがパラフレーズ化されます。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:53:53 GMT)
General reproducing properties in RKHS with application to derivative and integral operators [2.0] 最小条件下で合成作用素の組合せのクラスを閉包する再生特性を確立する。
これにより、再生プロパティが導関数演算子を保持するのに十分な条件を再考することができる。
その結果,正規化学習アルゴリズムに対する代表者定理の適用の枠組みが得られた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:39:18 GMT)
Data-driven Power Loss Identification through Physics-Based Thermal Model Backpropagation [2.0] 電力エレクトロニクス用のデジタルツインは、実世界の応用では直接測定が非現実的または不可能な正確な電力損失を必要とする。
本稿では,物理に基づく熱モデルとデータ駆動の手法を組み合わせることで,温度測定のみを用いて電力損失を正確に検出・補正するハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:37:14 GMT)
Learning Color Equivariant Representations [2.0] 色変化に同値なグループ畳み込みニューラルネットワーク(GCNN)を導入する。
GCNNは、2次元と3次元の回転群からスケールのような半群への様々な幾何学的変換のために設計されている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:04:41 GMT)
When Counterfactual Reasoning Fails: Chaos and Real-World Complexity [1.9] 構造因果モデルの枠組みにおける反実的推論の限界について検討する。
低次モデル不確実性やカオス力学といった現実的な仮定は、直観に反する結果をもたらす。
この研究は、カオスと不確実性を特徴とする設定に反実的推論を適用する際に注意を促している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:14:51 GMT)
Comparison of Metadata Representation Models for Knowledge Graph Embeddings [1.9] ハイパーリレーショナル知識グラフ(HRKG)は、従来のKGを二項関係を超えて拡張する。
本研究では,異なるメタデータ表現モデル(MRM)がKG埋め込み(KGE)およびリンク予測(LP)モデルに与える影響を評価する。
潜在空間における3つのMRMの知識表現を効果的に反映する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:31:23 GMT)
Preparing graph states forbidding a vertex-minor [1.9] 測定に基づく量子コンピューティングは、準備された安定化状態に非クリフォード測定を加えることでプリフォームされる。
すべての安定化状態はグラフ状態と局所クリフォード同値であるため、グラフ状態$leftvert G rightrangle$にフォーカスすることができる。
グラフの特定の固有クラスに$G$が含まれているとき、かなり改善された境界を得る。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:25:35 GMT)
Context-Independent OCR with Multimodal LLMs: Effects of Image Resolution and Visual Complexity [1.8] マルチモーダル大規模言語モデル (LLM) は様々な産業分野において大きな注目を集めている。
本研究では,多様な視覚的複雑度を持つ単一文字画像を用いた文脈非依存のOCRタスクについて検討する。
以上の結果から, マルチモーダルLLMは従来のOCR法と約300ppiで一致するが, 性能は150ppi以下であった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:09:19 GMT)
GLane3D : Detecting Lanes with Graph of 3D Keypoints [1.8] 本稿では,レーンのキーポイントを検出し,その間の連続的な接続を予測して3次元レーンを構築する手法を提案する。
PointNMSは、重複する提案キーポイントを排除し、推定されたBEVグラフの冗長性を減少させる。
提案モデルでは,ApolloとOpenLaneの両データセットの最先端手法を上回り,優れたF1スコアと強力な一般化能力を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:33:26 GMT)
Integrating electrocardiogram and fundus images for early detection of cardiovascular diseases [1.7] 心臓血管疾患 (CVD) は世界中で主要な健康上の問題であり、高度な診断技術の必要性を強調している。
本稿では,心電図読影と底面画像とを相乗的に統合し,早期の疾患タグ付けとCVDのトリアージを優先的に行うアバンギャルド手法を提案する。
予備試験では84%の補正精度が得られ、この組み合わせの診断戦略の可能性を強調した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:53:36 GMT)
BAR-Analytics: A Web-based Platform for Analyzing Information Spreading Barriers in News: Comparative Analysis Across Multiple Barriers and Events [1.7] BAR-Analyticsプラットフォームを使用して、地理的、経済的、政治的、文化的境界におけるニュース拡散を分析します。
イスラエルとパレスチナの対立は人権に焦点を絞ってより否定的な感情を抱く傾向にあり、一方ロシアとウクライナの対立はより肯定的であり、選挙妨害を強調している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:36:55 GMT)
A distance for mixed-variable and hierarchical domains with meta variables [1.7] 不均一データセットは、さまざまな機械学習および最適化アプリケーションに現れる。
最初の主な貢献は、階層的、木構造的、変数サイズ、条件付き検索フレームワークを一般化するモデリングフレームワークである。
2つ目の寄与は、同じ変数を共有しない混合変数の任意の対を比較する新しい距離である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:41:59 GMT)
ERUPT: Efficient Rendering with Unposed Patch Transformer [1.7] この研究は、RGB画像の小さなコレクションから、多様なシーンにおける新しいビュー合成の問題に対処する。
本研究では,非ポーズ画像を用いたシーンレンダリングを効率的に行うことのできる,最先端のシーン再構成モデルであるERUPTを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:53:05 GMT)
Are clinicians ethically obligated to disclose their use of medical machine learning systems to patients? [1.6] 臨床医は、医療機械学習システムの使用を患者に開示する義務を負うことが一般的である。
これを「開示論」と呼ぶ。
これら4つの議論はいずれも議論の余地がなく、開示論は否決されるべきである、と私は主張する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:12:18 GMT)
How interacting Bose gases scatter light [1.6] 準同質ボースガス中における非共鳴光と原子の散乱と波長可変相互作用について検討した。
運動量分布が著しく変化しない弱い相互作用でさえ、原子-光散乱に劇的な影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:59:48 GMT)
Variational Perturbation Theory in Open Quantum Systems for Efficient Steady State Computation [1.6] 摂動理論は参照パラメータの周りの定常状態を拡張することができる。
擬逆数に依存し、収束半径が有限である。
擬似逆計算を不要とする2つの数値戦略を考案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:01 GMT)
Non-classical optimization through complex media [1.5] 本稿では,複合メディアにおける光学的非古典的最適化の概念を紹介する。
非古典的な光の制御と再焦点を実験的に実証する。
このアプローチは複雑な問題に取り組む可能性がある。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:31:18 GMT)
AI in radiological imaging of soft-tissue and bone tumours: a systematic review evaluating against CLAIM and FUTURE-AI guidelines [1.5] 軟部腫瘍と骨腫瘍 (STBT) は稀で, 診断に難渋する病変であり, 様々な臨床症状と治療のアプローチがある。
本稿では,これらの腫瘍の診断と予後のための放射線画像を用いた人工知能(AI)法の概要について概説する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:58:36 GMT)
Federated Structured Sparse PCA for Anomaly Detection in IoT Networks [1.5] 本稿では,IoTネットワークにおける新しいフェデレーション型異常最小化手法を提案する。
提案したモデルは,$ell_2, sparse$で管理される行単位の空間性を統合する。
実験により、構造的疎結合が両方のモデルの解釈可能性を高めることが証明された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:50:21 GMT)
Rubric Is All You Need: Enhancing LLM-based Code Evaluation With Question-Specific Rubrics [1.4] LLMに基づくコード評価に注力し、既存のギャップを埋めようとしている。
本稿では,問題文に適合した疑問特化ルーブを用いたマルチエージェントな新しい手法を提案する。
包括的分析により,問題固有のルーリックは,学習環境におけるコードの論理的評価を著しく向上させることが示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:59:43 GMT)
VidHalluc: Evaluating Temporal Hallucinations in Multimodal Large Language Models for Video Understanding [1.2] ビデオ理解のためにMLLMの幻覚を調べるために設計された最大のベンチマークであるVidHallucを紹介する。
VidHallucは、(1)行動、(2)時間的シーケンス、(3)シーン遷移の3つの重要な次元にわたる幻覚を評価する。
DINO-HEALは,DINOv2からの空間塩分を推論時の視覚的特徴に組み込むことで幻覚を軽減できる訓練不要な方法である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:07:49 GMT)
MAD Chairs: A new tool to evaluate AI [1.2] 本稿では,AI評価問題への新たな貢献について述べる。
チェスにおけるマシンのパフォーマンスを評価できる限り、このアプローチでは「MADチェア」と呼ばれるゲームでマシンのパフォーマンスを評価する。
執筆時点で、このゲームによる評価は、Claude、Gemini、ChatGPT、Qwen、DeepSeekを改善する機会を明らかにした。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:52:10 GMT)
Practical Quantum Advantage for Boosting Citations [1.1] 近年の量子技術の発展は、量子情報研究の指数的な成長を促している。
学界において、引用数は研究影響を評価する重要な指標である。
本稿では,励磁促進のための実用的な量子優位性のための潜在的プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:13:48 GMT)
Creation of a black hole bomb instability in an electromagnetic system [1.1] 回転金属または損失シリンダーによる電磁放射の増幅と生成は、1970年代にツェルドヴィッチによって初めて理論化された。
ここでは、機械的に回転する金属シリンダが、回転するエレクトロ電磁場モードの増幅器として機能することを示した。
ノイズによる指数的増幅はブラックホールの不安定性の理論的な研究を支持し、将来の実験の開発を約束している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:00:10 GMT)
Exploring Cognitive Paradoxes in Video Games: A Quantum Mechanical Perspective [1.0] 本稿では,認知と量子力学の領域を橋渡しする量子力学モデルを提案する。
決定論的異常に対処する量子理論と、"Deal or No Deal"のような没入型ビデオゲームの例を統合することで、複雑な人間の認知行動の解明を目指す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:13:16 GMT)
Enhancing Trust in Inter-Organisational Data Sharing: Levels of Assurance for Data Trustworthiness [1.0] データレベルでの信頼性向上対策,すなわちデータの信頼性について検討することを目的とする。
既存のデータ信頼性向上ソリューションは、組織間データ共有の領域の要件を満たしていないことがわかった。
この研究は、データ信頼性の保証の新たなレベルを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:35:23 GMT)
GAL-MAD: Towards Explainable Anomaly Detection in Microservice Applications Using Graph Attention Networks [1.0] ネットワークとパフォーマンスの問題に起因する異常は素早く特定され、対処されなければならない。
既存の異常検出技術は統計モデルや機械学習手法に依存していることが多い。
グラフ注意とLSTMに基づくマイクロサービス異常検出(GAL-MAD)と呼ばれる新しい異常検出モデルを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:11:31 GMT)
Decoherence-induced self-dual criticality in topological states of matter [1.0] 測定誘起相転移はデコヒーレンス誘起混合状態とみなすことができる。
これらの接続を統合することで、混合状態における自己双対対称性の役割を解明する。
我々の結果は、オープン量子系における混合状態臨界性の一般的な理解への道を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:59:58 GMT)
Large Language Models Pass the Turing Test [0.9] 独立集団を対象とした2つのチューリング試験において,ELIZA, GPT-4o, LLaMa-3.1-405B, GPT-4.5の4つのシステムについて検討した。
結果は、あらゆる人工システムが標準の3要素チューリングテストに合格するという最初の実証的な証拠である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:37:45 GMT)
Do Large Language Models Exhibit Spontaneous Rational Deception? [0.9] 大規模言語モデル (LLM) は、そのように促されるときの判断に有効である。
しかし、どんな条件で自然に騙されるのか?
本研究は, LLMが生み出す自発誤を, 予め登録した実験プロトコルで評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:10:56 GMT)
Output Constraints as Attack Surface: Exploiting Structured Generation to Bypass LLM Safety Mechanisms [0.9] 我々は、従来のデータプレーンの脆弱性に対して、重要な制御プレーン攻撃面を明らかにする。
本稿では、構造的出力制約を武器として安全機構をバイパスする新しいジェイルブレイククラスであるConstrained Decoding Attackを紹介する。
本研究は, 現状のLLMアーキテクチャにおける重要なセキュリティ盲点を明らかにし, 制御面脆弱性に対処するため, LLM安全性のパラダイムシフトを促すものである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:08:06 GMT)
Performance Analysis and Industry Deployment of Post-Quantum Cryptography Algorithms [0.9] NIST(National Institute of Standards and Technology)は、鍵交換とデジタル署名のための標準化されたPQCアルゴリズムとして、CRYSTALS-KyberとCRYSTALS-Dilithiumを選択した。
本研究は,暗号処理における実行時間をベンチマークすることで,これらのアルゴリズムの総合的な性能解析を行う。
その結果, Kyber と Dilithium は効率的な実行時間を実現し,RSA や ECDSA などの古典暗号方式を同等のセキュリティレベルで上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:36:36 GMT)
Cal or No Cal? -- Real-Time Miscalibration Detection of LiDAR and Camera Sensors [0.8] 安全の観点からは、センサーのキャリブレーションは自動運転の鍵となる。
オンラインキャリブレーションは厳格なリアルタイムとリソースの制約を受ける。
校正パラメータの直接回帰から校正状態のバイナリ分類に焦点を移す誤校正検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:13:23 GMT)
CaLiV: LiDAR-to-Vehicle Calibration of Arbitrary Sensor Setups via Object Reconstruction [0.8] 自律システムでは、ダイナミック環境における安全で効率的なナビゲーションにはセンサキャリブレーションが不可欠である。
既存のLiDARキャリブレーション法の多くは、重なり合う視野を必要とするが、外部センサーデバイスを使ったり、機能豊富な環境を仮定するものもある。
本研究では,CaLiVと呼ばれるマルチLiDARシステムの外部センサ・センサ・センサ・バイヒクルキャリブレーションのための新しいターゲットベース手法を提案する。
このアルゴリズムは、重複しないFoVや任意のキャリブレーションターゲットに対して機能し、外部センサーデバイスを必要としない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:08:21 GMT)
A Multi-Stage Auto-Context Deep Learning Framework for Tissue and Nuclei Segmentation and Classification in H&E-Stained Histological Images of Advanced Melanoma [0.8] メラノーマは皮膚がんで最も致命的な形態であり、世界中で発生率が高くなっている。
組織情報と核情報を組み合わせた多段階深層学習手法を提案する。
我々のアプローチはPUMAチャレンジで2位と1位を獲得した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:15:50 GMT)
Demolition measurement protocol for transmon qubits [0.8] 本稿では、キュービットの読み出しとリセット処理を統合して、キュービットのアイドル時間を最小化するトランスモンキュービットのテキストデモルション測定のためのプロトコルを提案する。
このプロトコルは、95ドル以上で$9,500,%のリセットフィデリティと99,%の読み取りフィデリティで実装でき、一般的に使用されるもの以上のハードウェアオーバーヘッドを伴わない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:46:50 GMT)
SE Arena: An Interactive Platform for Evaluating Foundation Models in Software Engineering [0.8] ソフトウェアエンジニアリング活動の基盤モデル(FM)を評価するために設計されたインタラクティブなプラットフォームであるSE Arenaを紹介する。
SE Arenaは透明でオープンソースのリーダーボードを提供し、マルチラウンドの会話チャットボットをサポートし、エンドツーエンドのモデル比較を可能にする。
本稿では,SE Arenaの設計と機能について概説し,ソフトウェア工学におけるFMの評価と実用化を前進させる可能性を強調した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:39:16 GMT)
Universal algorithm for transforming Hamiltonian eigenvalues [0.7] 我々は、その固有状態を不変に保ちながら、その固有値を変換することで、ハミルトニアンを操作する新しい方法を提供する。
我々は、未知のハミルトニアンの固有値上の任意の所望の関数を決定的に実装する普遍的アルゴリズムを開発する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:09:57 GMT)
LLMs for Explainable AI: A Comprehensive Survey [0.7] 大規模言語モデル(LLM)は、説明可能なAI(XAI)を強化するための有望なアプローチを提供する
LLMは複雑な機械学習出力を理解しやすい物語に変換する。
LLMは洗練されたモデル行動と人間の解釈可能性のギャップを埋めることができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:19:41 GMT)
Investigation of intelligent barbell squat coaching system based on computer vision and machine learning [0.7] 本研究では,リアルタイムモードを用いた人工知能とコンピュータビジョンに基づくバーベルスクワットコーチングシステムを開発した。
バーベルスクワットの4つの特徴は, 関節角度, 背屈, 膝とヒップの移動比, バーベルの安定性である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 05:08:52 GMT)
cozy: Comparative Symbolic Execution for Binary Programs [0.7] cozyは、ソフトウェアバイナリの2つのバージョンの違いを分析し、視覚化するツールである。
cozyにはWebベースのビジュアルインターフェースがあり、比較結果を見ることができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:59:30 GMT)
Contradiction Detection in RAG Systems: Evaluating LLMs as Context Validators for Improved Information Consistency [0.7] Retrieval Augmented Generation (RAG) システムは,大規模言語モデル(LLM)を最新情報で拡張するための強力な手法として登場した。
RAGは、特にニュースのような急速に進化する領域において、矛盾する情報を含む文書を提示することがある。
本研究では,RAGシステムの検索段階において発生する様々な矛盾をシミュレートする新しいデータ生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:41:15 GMT)
The Mathematical Relationship Between Layer Normalization and Dynamic Activation Functions [0.7] 最近の論文では、レイヤ正規化(LN)のドロップイン代替としてDynamic Tanh (DyT)を提案する。
我々は,層正規化と動的活性化関数の関係に光を当てた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:10:24 GMT)
Emergent representations in networks trained with the Forward-Forward algorithm [0.7] 我々は,フォワード・フォワードアルゴリズムが,高い空間性を示すカテゴリ固有のアンサンブルに編成可能であることを示す。
この状況は皮質感覚野で観察されたことを思い出させる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:13:53 GMT)
Times2D: Multi-Period Decomposition and Derivative Mapping for General Time Series Forecasting [0.7] 時系列予測は、エネルギー管理、交通計画、金融市場、気象学、医学などの分野において重要な応用である。
1次元時系列表現に依存する以前のモデルは、通常複雑な時間変動に苦しむ。
本研究では,1次元時系列を2次元空間に変換するTimes2D法を紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:08:30 GMT)
Position-Momenta Uncertainties in Classical Systems [0.6] このような浴槽に浸漬された古典粒子は, 位置モメンタムの不確かさを示す。
比例定数$c$は無次元であり、系のパラメータとは独立である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:08:41 GMT)
The Cursive Transformer [0.6] ペンストロークオフセットを極座標に変換し、それらをビンに識別し、トークンのシーケンスに変換する新しいトークン化スキームを導入する。
わずか3500個の手書き文字と数個の単純なデータ拡張で、リアルなカーシブな手書きを生成するモデルを訓練することができます。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:22:27 GMT)
XAMBA: Enabling Efficient State Space Models on Resource-Constrained Neural Processing Units [0.6] 状態空間モデル(SSM)は、シーケンシャルなデータタスクのためのトランスフォーマーの効率的な代替手段として登場した。
XAMBAは、商用オフザシェルフ(COTS)のSOTA(State-of-the-art)NPU上でSSMを有効にし、最適化する最初のフレームワークである。
XAMBAはCumBAとReduBAを使用して鍵ボトルネックを緩和し、シーケンシャルなCumSumとReduceeSumを行列ベースの計算に置き換える。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:26:29 GMT)
TuRTLe: A Unified Evaluation of LLMs for RTL Generation [0.6] 本研究では,主要なRTL生成タスク間でLLMを評価するための統合評価フレームワークTuRTLeを提案する。
オープンLLMの多様なセットをベンチマークし、EDA固有のタスクの長所と短所を分析します。
以上の結果から,DeepSeek R1のような推論モデルの方が,複数の評価基準で常に優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:43:12 GMT)
Multiphoton Quantum Interference at Ultracompact Inverse-Designed Multiport Beam Splitter [0.6] 我々は8.0$rmmu$mの位相最適化トリッターを用いた多光子量子干渉の実証を行った。
また、三光子による3光子量子干渉も行う。
我々の研究は、超コンパクト干渉計における多光子量子干渉の成功を確認した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:04:07 GMT)
Synthetic News Generation for Fake News Classification [0.5] 本研究では,事実に基づく操作による合成偽ニュースの生成と評価について検討する。
実記事から重要な事実を抽出し、修正し、コンテンツを再生して偽ニュースをシミュレートする新しい手法を提案する。
生成したコンテンツの質を評価するために,評価指標の一貫性,相似性,正しさのセットを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:24:05 GMT)
WaveFormer: A 3D Transformer with Wavelet-Driven Feature Representation for Efficient Medical Image Segmentation [0.5] トランスフォーマーベースのアーキテクチャは、長距離依存を効果的にモデル化することで、高度な医用画像解析を行うが、しばしば3D設定で苦労する。
i) 人間の視覚認識システムのトップダウン機構にインスパイアされた特徴の基本的な周波数領域特性を活用できる新しい3DトランスフォーマーであるWaveFormerを用いて、これらのリミ・テイションに対処する。
WaveFormerは、重層を効率的なウェーブレットベースの要約と再構成に置き換えながら、グローバルコンテキストと高周波デサンプリングテールの両方を保存する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:28:41 GMT)
Unified Preference Optimization: Language Model Alignment Beyond the Preference Frontier [0.5] 大規模言語モデル(LLM)の整合化のための統一的アプローチを提案する。
好みと補助目的の単純な分解に基づいて、ユーザとデザイナーの好みを最適化するためにLLMをチューニングできる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:58:31 GMT)
Predicting Targeted Therapy Resistance in Non-Small Cell Lung Cancer Using Multimodal Machine Learning [0.5] 肺がんは世界中でがん死の主要な原因であり、非小細胞肺癌(NSCLC)は最も一般的な亜型である。
第3世代EGFR-チロシンキナーゼ阻害剤(TKI)であるオシメルチニブ(Osimertinib)はNSCLC患者の治療において顕著な効果を示した。
効果が確立されているにもかかわらず、薬剤耐性はオシメルチニブから完全に利益を得る上で大きな課題となる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:47:02 GMT)
A Comparison of Parametric Dynamic Mode Decomposition Algorithms for Thermal-Hydraulics Applications [0.5] この研究は、現場にデプロイされた異なるアルゴリズムを比較して、利用可能なデータから学習モデルの研究に寄与する。
この目的のために, FEniCS有限要素ソルバを用いてそれぞれデータセットを取得し, CFDbenchデータセットから抽出した3つの異なる熱水和問題について検討した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:23:22 GMT)
Safe Policy Learning through Extrapolation: Application to Pre-trial Risk Assessment [0.5] 米国刑事司法制度におけるアルゴリズムによる事前審理リスク評価の特定の事例について検討する。
我々は,アルゴリズムによる事前審理前リスク評価のフィールド実験からデータを分析し,スコアとレコメンデーションを改善することができるかどうかを検証した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:43:58 GMT)
CITRAS: Covariate-Informed Transformer for Time Series Forecasting [0.5] CITRASはパッチベースのTransformerで、複数のターゲットを柔軟に活用し、過去と将来の水平線の両方をカバーする。
共変量インフォームドおよび多変量予測における最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:32:23 GMT)
IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration [0.5] IMPACT(Image Metric with Pretrained Model-Agnostic Comparison for Transmodality registration)は、意味論的類似度尺度である。
タスク固有のトレーニングを必要とせずに、医療画像から抽出したディープラーニングベースの特徴を比較する。
マルチモーダル画像登録のための堅牢でスケーラブルで効率的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:08:21 GMT)
Empirical Analysis of Digital Innovations Impact on Corporate ESG Performance: The Mediating Role of GAI Technology [0.5] 本研究では,企業におけるデジタルイノベーションと環境・社会・ガバナンス(ESG)のパフォーマンスとの関係について検討する。
我々は、2015年から2023年までのCMARSとWINDデータベースから8000の観測データからなる包括的なパネルデータセットを使用する。
以上の結果から,デジタルイノベーションは企業ESGのパフォーマンスを著しく向上させ,GAI技術の採用が重要な媒介メカニズムであることが明らかとなった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:34:02 GMT)
Efficient Construction of Feasible Solutions in Column Generation using Quantum Annealing [0.4] 本研究では,CG による連続緩和から実現可能な 0-1 解を構築するための後処理法を提案する。
乱数生成問題に関する数値実験により,提案した後処理によるCGは,計算時間を大幅に短縮した商用解法に匹敵する解が得られることを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:00:12 GMT)
YOLO11 and Vision Transformers based 3D Pose Estimation of Immature Green Fruits in Commercial Apple Orchards for Robotic Thinning [0.4] 商業用果樹果樹における未熟リンゴ(フルーツレット)の3次元ポーズ推定法を開発した。
YOLO11(またはYOLOv11)オブジェクト検出とポーズ推定アルゴリズムとViT(Vision Transformers)を併用して深度推定を行う。
YOLO11nは、ボックス精度と精度の点で、YOLO11とYOLOv8のすべての構成を上回った。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:41:02 GMT)
LiM-Loc: Visual Localization with Dense and Accurate 3D Reference Maps Directly Corresponding 2D Keypoints to 3D LiDAR Point Clouds [0.4] 本稿では,3次元LiDAR点雲をキーポイントに割り当てて,高密度かつ高精度な3次元参照マップを生成する手法を提案する。
広い範囲でカメラのポーズを推定するために、広領域のLiDAR点雲を用いて、カメラに見えない点を除去し、2D-3D対応誤差を低減する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:01:39 GMT)
Inductive Graph Representation Learning with Quantum Graph Neural Networks [0.4] 量子グラフニューラルネットワーク(QGNN)は、量子コンピューティングとグラフ構造化データ処理を組み合わせるための有望なアプローチを示す。
本稿では,量子モデルをアグリゲータとして利用する,古典的なグラフSAGEアプローチにインスパイアされた汎用QGNNフレームワークを提案する。
我々の量子アプローチは、回路変更を必要とせず、様々な数の原子を持つ分子をまたいだ堅牢な一般化を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:04:08 GMT)
Nuclear Microreactor Control with Deep Reinforcement Learning [0.4] 本研究では,マイクロリアクターのドラム制御における深部強化学習(RL)の適用について検討する。
RLコントローラは従来の比例積分微分(PID)コントローラと同様またはそれ以上の負荷追従性能を達成できる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:11:19 GMT)
PIM-LLM: A High-Throughput Hybrid PIM Architecture for 1-bit LLMs [0.4] PIM-LLMは1ビット大言語モデル(LLM)を高速化するために開発されたハイブリッドアーキテクチャである。
我々の設計では、1秒あたりのトークンの約80倍の改善と、1ジュール当たりのトークンの70%の増加を実現している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:42:43 GMT)
AutoML Algorithms for Online Generalized Additive Model Selection: Application to Electricity Demand Forecasting [0.3] 電力需要の予測は、供給が需要を満たすことを保証するための鍵となる。
信頼性のある短期予測は、一般化付加モデル(GAM)と状態空間モデルを組み合わせることで得られる。
本研究は, 探索空間の効率的なモデリングを定義することにより, オンライン一般化加法モデル選択の自動化を一般化する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:46:33 GMT)
Remarks on the Polyak-Lojasiewicz inequality and the convergence of gradient systems [0.3] この研究は、ポリアック・ロジャシエヴィチ不等式(PLI)の一般化を探求する。
この研究は、より弱い条件は、コスト関数の臨界点の集合に対する大域収束と最適性に十分である一方で、勾配流解の「顕著」は、どの不等式の不等式がどのコストを満たすかによって大きく変化することを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:59:56 GMT)
Kernel-based dequantization of variational QML without Random Fourier Features [0.3] 回帰問題に対する変分QMLモデルの定式化に向けた最近の提案には、慎重に選択されたカーネル関数を持つカーネルメソッドに基づくアプローチが含まれる。
我々は、広範囲のインスタンスに対して、このアプローチを単純化できることを示します。
この結果により,カーネルベースの変分QMLの定式化のためのツールキットが強化された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:26:16 GMT)
Quantum algorithms for cooling: a simple case study [0.3] 低エネルギーの量子多体状態の合成は、量子情報処理や凝縮物質物理学に幅広い応用がある。
量子冷却アルゴリズムは、変分原理や断熱原理、散逸状態の準備に基づく他の方法に代わる有望な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:19:12 GMT)
Level the Level: Balancing Game Levels for Asymmetric Player Archetypes With Reinforcement Learning [0.3] この研究は、非対称なプレイヤーアーキタイプに合わせて調整されたバランスの取れたレベルを生成することに焦点を当てている。
我々は最近導入された強化学習を用いてタイルベースのゲームレベルのバランスをとる手法を拡張した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:55:04 GMT)
DiffScale: Continuous Downscaling and Bias Correction of Subseasonal Wind Speed Forecasts using Diffusion Models [0.3] 季節的・季節的な予測(S2S)は、エネルギーセクターに重大な社会経済的優位性をもたらす可能性がある。
DiffScaleは連続的なダウンスケール要因やリードタイムの空間情報を超解する拡散モデルである。
予測品質が大幅に向上し,ベースラインが最大3.5%向上した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:44:28 GMT)
Artificial Conversations, Real Results: Fostering Language Detection with Synthetic Data [0.3] 本研究では,合成データを生成するパイプラインと,大規模言語モデルが生成する合成データの有効性に影響を与える要因を総合的に検討する。
我々の結果は、ほとんどのケースと異なるメトリクスにおいて、合成データに基づいて訓練された微調整されたモデルが、実データと合成テストデータセットの両方において、他のモデルよりも一貫して優れていたことを示している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:22:34 GMT)
Efficient Hamiltonian Simulation: A Utility Scale Perspective for Covalent Inhibitor Reactivity Prediction [0.3] ノイズの多い中間スケール量子(NISQ)時代の量子コンピューティングアプリケーションは、今日の量子システムで実現可能なより浅い回路を生成するアルゴリズムを必要とする。
これは、分子系の固有の複雑さのため、量子化学の応用には特に困難である。
本稿では, 量子中心データ駆動R&Dフレームワークを用いた分子反応性予測の精度を維持しつつ, より大きな活性空間へのスケーリングを行うための系統的な回路縮小手法を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:23:05 GMT)
Direct observation of time-dependent coherent chiral tunneling dynamics [0.2] 配位分子状態の重ね合わせによってアキラルな固有状態が生まれ、トンネルによって二重井戸電位で非局在化される。
これらのエネルギー固有状態のコヒーレントな重ね合わせは、分子をキラル状態に動的に再局在させることができる。
マイクロ波6波混合ポンププローブを用いて、コヒーレントなカイラルトンネル力学を回転状態で生成・探究する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:26:06 GMT)
Testing Support Size More Efficiently Than Learning Histograms [0.2] 分布のヒストグラムを$p$で学習するよりも, より効率的にテストを行うことができることを示す。
この証明は、チェビシェフ近似が良い近似であるように設計されている範囲外の分析に依存する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:08:30 GMT)
Solving rescheduling problems in heterogeneous urban railway networks using hybrid quantum-classical approach [0.2] 整数線形プログラミングモデルを構築し、D-Waveの量子古典ハイブリッドソルバ(CQM)を用いて解く。
提案手法はポーランドにおける実生活異質都市ネットワーク上で実証されている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:38:36 GMT)
Faster Releases, Fewer Risks: A Study on Maven Artifact Vulnerabilities and Lifecycle Management [0.1] 私たちは1万のMavenアーティファクトのリリース履歴を分析し、203,000以上のリリースと170万の依存関係をカバーしています。
以上の結果から,リリース速度と依存性の陳腐化との間には逆の関係が認められた。
これらの知見は、セキュリティリスクの低減におけるリリース戦略の加速の重要性を強調している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:32:45 GMT)
AI-Assisted Colonoscopy: Polyp Detection and Segmentation using Foundation Models [0.1] 大腸内視鏡検査では、Deep Learningモデルの助けを借りて、欠落したポリープの80%を検出できた。
この課題に対処できるアルゴリズムの探索において、ファンデーションモデルは有望な候補として浮上する。
ゼロショットまたは少数ショットの学習機能により、広範囲の微調整なしに、新しいデータやタスクへの一般化が容易になる。
ポリプセグメンテーションの基礎モデルを総合的に評価し, 検出と分解の両面から評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:20:53 GMT)
Evaluation of the phi-3-mini SLM for identification of texts related to medicine, health, and sports injuries [0.1] 小言語モデル(SLM)は、医療・健康関連目的の側面を文書やウェブから自動的にラベル付けし識別するために使われる可能性がある。
我々は,Microsoft の phi-3-mini-4kinstruct のトピックネススコアと,医療・健康関連テキスト1144点,スポーツ障害テキスト1117点のトピックネススコアを比較した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:25:59 GMT)
MB-ORES: A Multi-Branch Object Reasoner for Visual Grounding in Remote Sensing [0.1] 本稿では,オブジェクト検出(OD)と視覚的接地(VG)を統合した統合フレームワークを提案する。
本モデルは,OPT-RSVGおよびDIOR-RSVGデータセットにおいて優れた性能を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:36:41 GMT)
Improving Predictions of Convective Storm Wind Gusts through Statistical Post-Processing of Neural Weather Models [0.1] ニューラル気象モデル(NWM)の最近の進歩は、0.25degのグローバルグリッド上での大気環境の予測に、計算的に安価で高速なアプローチを提供する。
雷雨の場合、これらの環境は特定の場所で風速分布を予測するために経験的に後処理することができる。
そこでPangu-Weather NWMでは,時間ごとの風速を最大3日前に予測するために,統計的および深層学習後処理手法の階層化を適用した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:25:35 GMT)
Human aversion? Do AI Agents Judge Identity More Harshly Than Performance [0.1] 我々は,大規模言語モデルに基づくAIエージェントがどのように人間の入力を評価し,統合するかを検討する。
AIシステムは人間のアドバイスを体系的に減らし、アルゴリズムの誤りよりも人間の誤りを厳しく罰する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:05:27 GMT)
Artificial Intelligence-Assisted Prostate Cancer Diagnosis for Reduced Use of Immunohistochemistry [0.0] 診断精度を損なうことなく、AIモデルのIHC使用を最小限に抑える能力を評価する。
感度優先診断閾値の適用により、調査された3つのコホートにおいて、ICC染色の必要性は44.4%、42.0%、20.7%減少した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:54:57 GMT)
Which features of quantum physics are not fundamentally quantum but are due to indeterminism? [0.0] 我々は、量子物理学に起因する特徴、問題、パラドックスのほとんどが古典的な類似性を持っていると主張している。
非古典的効果を本当に特徴付けるものは、相容れない物理量である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:47:40 GMT)
What the F*ck Is Artificial General Intelligence? [0.0] 私はインテリジェンスの定義を比較し、適応の観点からインテリジェンスを定め、人工知能としてAGIを比較します。
システムをよりインテリジェントに振る舞うための全体的なメタアパッチについて議論します。
スケール最大化の近似が支配的だが、AGIはツールとメタアポラッヒの融合である、と私は結論付けます。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:15:37 GMT)
WebMap -- Large Language Model-assisted Semantic Link Induction in the Web [0.0] 本稿では,Web上のセマンティックなオーバレイリンク構造であるWebMapの機能拡張を提案する。
これらのアドオンは、ドキュメントクラスタの動的決定と再グループ化、Webにおけるセマンティックなサインポストの作成、トピックの原点へのインタラクティブなトレースをサポートする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 04:40:45 GMT)
Wasserstein multivariate auto-regressive models for modeling distributional time series [0.0] 本稿では,複数の確率測度の集合からなるデータの統計的解析に着目する。
時間依存確率測度をワッサーシュタイン空間のランダムな対象としてモデル化することにより、新しい自己回帰モデルを提案する。
このようなモデルの解の存在、特異性、定常性に関する結果が提供される。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:39:34 GMT)
Wasserstein KL-divergence for Gaussian distributions [0.0] このバージョンはサンプル空間 $Bbb Rn$ の幾何と整合であることを示す。
特に、2点に集中したディラック測度のWKL偏差は、これらの点間の2乗距離に比例する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:49:01 GMT)
Universality of Rényi Entropy in Conformal Field Theory [0.0] d$次元の任意の共形体論における真空状態に対して、$n$-th R'enyi entropy $S_A(n)$ は$S_A(n) = fracf (2pi n)d-1 frac rm Area(partial A)(d-2)epsilond-2left (1+O(n)right)$ として振る舞う。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:34:59 GMT)
Unitary and non-unitary operators leverage perfect and imperfect single qutrit teleportation [0.0] 本稿では,Alice から Bob への単一キュートリットの送信方式について,二つのキュートリットの絡み合ったチャネルを資源として検討する。
テレポーテーションの成功のために、これらの絡み合った状態はアリスとボブの間で共有される量子チャネルとして選ばれた。
2つのクエット状態のもう1つの絡み合った基底は補助状態として使われており、アリスが彼女のチャネルで操作し、彼女が保持する1つのクットがボブにテレポートされるのに役立っている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:58:23 GMT)
Unbounded Quantum Advantage in Communication with Minimal Input Scaling [0.0] 一般の硬貨を使わずに関係の再構築を行う場合, 量子的に非有界な利点を示す。
また、このタスクの半デバイス非依存なディメンションの目撃や、ミューチュアル・アンバイアスド・ベースの検出への応用についても強調する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:38:33 GMT)
Timeseries Foundation Models for Mobility: A Benchmark Comparison with Traditional and Deep Learning Models [0.0] 本研究では、都市全体の移動時間を予測する従来の手法と比較して、TimeGPTの性能を評価する。
その結果,モビリティ予測の基礎モデルの可能性に加えて,実験の限界も明らかになった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:20:31 GMT)
Time-Series Forecasting via Topological Information Supervised Framework with Efficient Topological Feature Learning [0.0] トポロジカルデータ分析(TDA)は、複雑なデータ構造から意味のある特徴を抽出する強力なツールとして登場した。
その成功にもかかわらず、TDAと時系列予測の統合は未定である。
本研究では,ニューラルネットワークとCGANを利用して合成トポロジ的特徴を生成するトポロジカル情報監視(TIS)予測フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:16:19 GMT)
Threats and Opportunities in AI-generated Images for Armed Forces [0.0] 画像合成のための生成人工知能(AI)の分野での最近の進歩は、軍隊にいくつかの新しい課題をもたらしている。
本報告の目的は、軍隊におけるAI生成画像の役割を調査し、機会と脅威について概観することである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:46:02 GMT)
Thermodynamic and energetic constraints on transition probabilities of small-scale quantum systems [0.0] 量子系における2点測定の遷移確率について検討した。
異なる温度でシステムを構築した際の遷移確率の差には,2つの独立した制約がある。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:47:39 GMT)
The more the merrier: logical and multistage processors in credit scoring [0.0] 我々は、金融における公正MLの適用に焦点をあて、より具体的には、信用スコアの公平性技術の使用に焦点を当てる。
一方、文献における確立された手法の適用に関するギャップに対処する。
一方,マルチステージプロセッサ(MP)の新たな手法についても検討し,フェアネス法の組み合わせが有効かどうかを検証した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:44:17 GMT)
The Quantum Technology Job Market: Data Driven Analysis of 3641 Job Posts [0.0] 量子技術(QT)は、学術と産業にまたがる専門的な労働力への需要を増大させてきた。
本研究では、世界中の何千もの求職者を体系的に抽出し、分類することで、QT求職市場を定量的に分析する。
本研究は, 地域雇用分布, 学位, 技能要件, およびQT関連職種に対する需要の進展における重要な傾向を明らかにする。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:03:13 GMT)
The Möbius game and other Bell tests for relativity [0.0] 勝利確率が一定の限界を超えた場合、パーティーの因果関係と部分順序が一致しないことを証明できる多人数ゲームが導出される。
一般相対性理論において、これらのゲームは時空の動的性質をデバイスに依存しないテストとして論じる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:30:41 GMT)
The Kossakowski Matrix and Strict Positivity of Markovian Quantum Dynamics [0.0] 我々は,コサコフスキー行列の厳密な正性,既約性,マルコフ量子力学の正性改善特性の関係について検討した。
ガウス量子力学半群のコサコフスキー行列の厳密な正の正則性は既約性を意味し、追加の技術的仮定により、任意の初期状態の支持が任意の正の時間全体の空間であることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:07:26 GMT)
The Axiom-Based Atlas: A Structural Mapping of Theorems via Foundational Proof Vectors [0.0] 公理ベースアトラス(Axiom-Based Atlas)は、数学的定理を公理系上の証明ベクトルとして構造的に表現するフレームワークである。
数学的知識を可視化し、比較し、分析する新しい方法を提供する。
自然言語の定理を解釈するプロトタイプアシスタントを導入し、おそらく証明ベクトルを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:12:57 GMT)
Text Chunking for Document Classification for Urban System Management using Large Language Models [0.0] 都市システムは複雑なテキストドキュメンテーションを用いて管理され、要求を設定し、構築された環境性能を評価する。
本稿では,大規模言語モデル(LLM)を定性的な符号化活動に適用し,資源要求の低減に寄与する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:48:30 GMT)
Strain effects in a directly bonded diamond-on-insulator substrate [0.0] ダイヤモンドオン絶縁体(DOI)基板の直接結合は、量子コンピューティングのためのダイヤモンドフォトニック構造のモノリシック集積を可能にする。
本研究では,直接結合後のDOI基板のひずみ効果について検討した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:06:35 GMT)
Spontaneous Emission from Electronic Metastable Resonance States [0.0] 準安定共鳴状態から自然放出崩壊率を計算するには、全ての連続状態への遷移を検討する必要があることを実証する。
散乱行列の複素極の計算には、もともと励起境界状態のために設計された手法を用いる。
このアプローチの急速な数値収束は、現実のシステムにおける準安定状態からの自然放出を研究するための新たな道のりを浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:24:32 GMT)
Spin-Phonon Relaxation of Boron-Vacancy Centers in Two-Dimensional Boron Nitride Polytypes [0.0] 単層窒化ホウ素(BN)における負電荷のホウ素空孔欠陥の系統的第一原理による研究について述べる。
その結果,単層BNおよびhBNにおけるV$_textB-$のV$_textB-$の値は室温ではほぼ同一であることが判明した。
驚くべきことに、rBNが追加のスピン緩和チャネルを開くことで対称性が低下したにもかかわらず、V$_textB-$はhBNよりも長いT_$を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:06:47 GMT)
SmartScan: An AI-based Interactive Framework for Automated Region Extraction from Satellite Images [0.0] 我々は、最適なセンサー配置のためのデータ抽出を自動化するAIフレームワークSmartScanを紹介する。
SmartScanは、インタラクティブツールを使用して衛星画像から関心のサブスペースを特定し、施設固有の制約セットを効率的に作成する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:11:07 GMT)
Simulation of Shor algorithm for discrete logarithm problems with comprehensive pairs of modulo p and order q [0.0] 量子回路をシミュレートし、モジュロ$pの一般的なペアで動作させ、$qをオーダーする。
その結果,Shorのアルゴリズムが,$q$の順序で決定される非対称周期性(英語版)を解くための成功確率が外挿された。
特に、Shorのアルゴリズムの下で、$p=48$ビットのシュノーラー群において、搬送器が使われるとき、$p=$ビットのシュノーラー群のリップル強度は、$p=$ビットのセーフプライム群のものとほぼ同値であることが理論的に示されている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:39:10 GMT)
Simulation of Quantum Computers: Review and Acceleration Opportunities [0.0] 量子コンピューティングは、現在の古典的コンピュータでは合理的に解決できない複雑な問題を解くことで、複数の分野に革命をもたらす可能性がある。
現在、量子アルゴリズムを開発し、テストする最も実践的な方法は、量子コンピュータの古典的なシミュレータを使うことである。
このレビューでは、量子コンピュータのコンポーネントの概要、これらのコンポーネントと量子コンピュータ全体をシミュレートできるレベル、および異なる最先端の加速アプローチの分析について紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:51:58 GMT)
Shape Expressions with Inheritance [0.0] 形状表現言語(ShEx)の継承機構を導入する。
オブジェクト指向プログラミング言語の継承にインスパイアされ、再利用、モジュール性、より柔軟なデータモデリングなどの類似した利点を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:42:44 GMT)
Second-order correlation and squeezing of photons in cavities with ultrastrong magnon-photon interactions [0.0] 本研究は超強結合系における強磁性及び反強磁性キャビティに焦点をあてる。
対向回転するマグノン-光子相互作用はキャビティモードにおいて二次スキューズを誘導することを示す。
異方性マグノンキャビティ結合のチューニングは、スクイーズ効果を高める。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:41:18 GMT)
Scalable Geometric Learning with Correlation-Based Functional Brain Networks [0.0] 相関行列は神経画像における機能的脳ネットワークの中心的な表現である。
伝統的な分析はユークリッド環境では、しばしば対の相互作用を独立に扱う。
本稿では、ユークリッド空間に相関行列を埋め込む新しい幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:35:50 GMT)
Safeguarding Smart Inhaler Devices and Patient Privacy in Respiratory Health Monitoring [0.0] 推定75億台のデバイスが2025年に市場に投入される。
慢性呼吸器疾患は、患者が服用量を追跡するためにこれらのデバイスを使用する患者に苦しむのを世界中の5億4500万人が記録している。
IoT医療デバイスには多くのメリットがあるが、セキュリティ上の脆弱性もあり、患者のデータをサイバー攻撃に晒すことができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:16:06 GMT)
Riemannian Multiplicative Update for Sparse Simplex constraint using oblique rotation manifold [0.0] スパース単純制約を用いた低ランク問題の解法として,新しい多様体最適化法を提案する。
標準ユークリッド法と比較した合成データセット実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:31:05 GMT)
Resource reduction for variational quantum algorithms by non-demolition measurements [0.0] 本稿では、複雑な量子系のエネルギーを最小化することを目的とした変分量子アルゴリズムの2つの実装の比較研究について述べる。
両手法ともエネルギーの最小化は可能であるが, 計算資源全体の観点からは, 非破壊的手法が明らかな優位性を有することがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:42:21 GMT)
Resolving space-time structures of quantum impurities with a numerically-exact algorithm using few-body revealing [0.0] 大規模浴槽における量子不純物に対する数値的に正確なリアルタイム進化法を提案する。
このアルゴリズムは、時間依存の軌道回転によって(自明な生成状態において)不活性にできる電子軌道を識別する、ほとんど身体的でない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:15:18 GMT)
RelChaNet: Neural Network Feature Selection using Relative Change Scores [0.0] 本稿では,新規かつ軽量な教師付き特徴選択アルゴリズムであるRelChaNetを紹介する。
ニューロンのプルーニングにおいて、勾配和計量は、ある特徴が入力された後にネットワーク内で誘導される相対的な変化を測定する。
また、実行時に入力層のサイズを適応させる拡張も提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:43:53 GMT)
Randomness-free Detection of Non-projective Measurements: Qubits & beyond [0.0] 非射影測定は様々な情報処理プロトコルにおいて重要な役割を果たす。
本稿では,プロジェクティブでも古典的ポストプロセッシングでもない計測値を特定するための運用タスクを提案する。
任意の偏極雑音の下では、立方体非射影測定が頑健であることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:10:02 GMT)
RailGoerl24: Görlitz Rail Test Center CV Dataset 2024 [0.0] RailGoerl24(レールゴエル24)は、ドイツのGorlitzにあるT"UV S"UD Railの鉄道試験センターで記録された12205フレームのフルHDカメラデータセットである。
データセットには、オブジェクトクラス 'person' の合計で33556のボックスワイズアノテーションが含まれている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:18:39 GMT)
Quench dynamics via recursion method and dynamical quantum phase transitions [0.0] 再帰法の範囲を非平衡クエンチ力学に拡張する。
この方法の収束が動的量子相転移によって時間的に制限されているという明確な証拠が見つかる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:43:09 GMT)
Quantum-computing within a bosonic context: Assessing finite basis effects on prototypical vibrational Hamiltonian spectra [0.0] 我々は、調和第二量子化の下で振動モデルをシミュレートする際に生じる形式的な問題に対処する。
これは、はしご作用素の積の正規順序付けに密接に関係している。
また,現状の文脈において,適切な原始的基本セットを選択することの関連性についても論じる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:52:04 GMT)
Quantum states with a positive partial transpose are useful for metrology [0.0] 正の部分変換を持つ多部量子状態は、線形干渉計において分離可能な状態よりも優れていることを示す。
我々はそのような状態を見つけるために強力な反復法を導入する。
ベルの不等式に違反しない量子状態は、分離可能な状態メトロジカルに優れる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:16:06 GMT)
Quantum inputs in the prepare-and-measure scenario and stochastic teleportation [0.0] 本稿では,送信側と受信側が絡み合いを利用して,限られた容量のチャネル上で量子情報を送信する,準備・測定シナリオについて検討する。
この枠組みを定式化し、基本特性を特定し、汎用通信のための量子プロトコルを最適化するための数値ツールを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:17:32 GMT)
Quantum cryptography integrating an optical quantum memory [0.0] スケーラブル量子ネットワークの開発は、光量子メモリに大きく依存している。
本稿では,中間量子メモリ層を組み込んだ暗号プロトコルの最初のデモンストレーションを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:04 GMT)
Quantum Features of the Thermal Two-Qubit Quantum Rabi Model in Ultra- and Deep-Strong Regimes [0.0] 2量子ビット量子ラビモデル (2QQRM) は、単一のボソニックモードに結合された2つの量子ビットを記述する。
本研究では、熱平衡における2QQRMにおける量子相関と非古典状態の持続性について検討する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:38:16 GMT)
QIris: Quantum Implementation of Rainbow Table Attacks [0.0] 我々は量子虹彩テーブルの動作プロトタイプを開発する。
我々は、量子コンピューティングがパスワードクラッカーのようなサイバーツールの速度を大幅に改善することを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:22:00 GMT)
Proposed 2MW Wind Turbine for Use in the Governorate of Dhofar at the Sultanate of Oman [0.0] 本研究では, 水平軸風力タービン(HAWT)の予備設計をDhofar Wind Farmプロジェクトの候補として提案する。
この風力発電所は、GCC(Gulf Cooperation Council)地域で最初の商業・実用規模(50MW)の風力発電所であると考えられている。
提案された風力タービンは2MWの発電を期待している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:21:31 GMT)
Privacy-Preserving Secure Neighbor Discovery for Wireless Networks [0.0] 従来のND(Neighbor Discovery)とSND(Secure Neighbor Discovery)は、ネットワーク機能の主要な要素である。
本稿では、デバイスが実際の身元や位置を明らかにすることなくSNDを実行することのできる、新しいプライバシー保護型セキュリティ近傍発見(PP-SND)プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:56:29 GMT)
Privacy for Quantum Annealing. Attack on Spin Reversal Transformations in the case of cryptanalysis [0.0] SRTを用いて得られたIsing問題から元の問題を回復する方法を示す。
また,本手法は大規模問題にも有効であることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:36:12 GMT)
Predicting the von Neumann Entanglement Entropy Using a Graph Neural Network [0.0] 実験可能なビットストリングからフォン・ノイマンエントロピーを予測するために,グラフニューラルネットワークを用いた機械学習手法を提案する。
我々は、このアプローチをRydbergのはしごシステム上でテストし、0から1.9までのエントロピーを持つデータセット上でトレーニング範囲内でテストする場合、平均的な絶対誤差が3.7倍10-3$に達した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:38:42 GMT)
Physics-informed neural networks for hidden boundary detection and flow field reconstruction [0.0] 本研究では,静的あるいは運動する固体境界の存在,形状,運動を推定する物理インフォームドニューラルネットワーク(PINN)フレームワークを提案する。
このフレームワークは、圧縮不能なNavier-Stokesや圧縮可能なEulerフローなど、さまざまなシナリオで検証されている。
提案手法はロバスト性および汎用性を示し,実験データや数値データしか利用できない場合の応用の可能性を強調した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:30:46 GMT)
Optimizing Humor Generation in Large Language Models: Temperature Configurations and Architectural Trade-offs [0.0] 大規模言語モデル(LLM)は、ソフトウェア開発者にとって技術的に関係のあるユーモアを生み出す。
本研究は、5つの建築家族を対象とした13の最先端LCMの包括的分析である。
5つの重み付き基準(ユーモア品質、ドメイン関連性、概念の独創性、トーン精度、納品効率)を用いてモデル出力を評価する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:35:12 GMT)
One Person, One Bot [0.0] 提案されたモデルは、各市民に政治代表として機能するAIエージェントを割り当て、直接民主主義への復帰を可能にするものである。
本稿では,このモデルと既存研究,その潜在的な欠点と実現可能性について検討し,今後の発展を論じる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:49:47 GMT)
On the Random Schrödinger Equation and Geometric Quantum Control [0.0] ランダムなエルミート行列によって与えられる雑音項を雑音量子系をモデル化する手段として、ランダムなシュル「オーディンガー方程式を導入する。
合成ユニタリの誤差をノイズのノルム上の境界で導出し、特定のノイズ過程においてこれらの境界がきついことを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:41:50 GMT)
ObfusQate: Unveiling the First Quantum Program Obfuscation Framework [0.0] ObfusQateは、古典的および量子的プログラムのセキュリティを強化するために、量子プリミティブを使用して難読化を行う新しいツールである。
我々は、量子回路レベルの難読化とコードレベルの難読化という2つの主要な難読化のカテゴリを設計、実装した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:02:25 GMT)
Noise-aware Time-optimal Quantum Control [0.0] 雑音の存在下でCRAB(Chopped Random Basis)を最適化する効率的な手法を提案する。
このノイズ対応アプローチは、他の制御パラメータと共に進化時間の直接最適化を可能にする。
その結果, 最適化された忠実度は, 雑音, ドリフトハミルトン, 局所トラップによる進化時間に強く依存していることが示唆された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:59:22 GMT)
New universal operator approximation theorem for encoder-decoder architectures (Preprint) [0.0] 幅広いエンコーダ・デコーダアーキテクチャのクラスに対する新しい普遍作用素近似定理を提案する。
本研究では、$mathcalC(mathcalX, MathcalY)$で連続作用素を近似することに焦点を当て、$mathcalX$と$mathcalY$は無限次元ノルム空間または計量空間である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:43:21 GMT)
Music Information Retrieval on Representative Mexican Folk Vocal Melodies Through MIDI Feature Extraction [0.0] この研究はMIDIツールボックスを用いて音楽の特徴を抽出し、統計分析を行う。
ピッチクラスのエントロピーの分析は、Armando Manzanero's Somos Novios'が最も高いエントロピーを示すように、幅広いメロディックな複雑さを示している。
区間分布は主に素区間(P1)、主区間、短区間(M2,m2)を特徴とする。
統計分析では、アンビタスやエントロピーとSpotifyの演奏数との間に有意な相関関係は確立されていない。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:57:28 GMT)
Multiphoton quantum simulation of the generalized Hopfield memory model [0.0] 我々は,古典的ニューラルネットワークの多光子量子干渉とホップフィールド様ハミルトニアンとの接続を,導入,開発,検討する。
我々は,Mフィールドモード上の重畳におけるNph不連続光子,Mバイナリ位相シフト器の制御配列,および線形光干渉計からなるシステムを組み合わせることで,出力光子統計が得られることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:01:07 GMT)
Multi-Task Learning for Extracting Menstrual Characteristics from Clinical Notes [0.0] 月経の健康は女性医療の批判的側面であるが、しばしば見過ごされる側面である。
本稿では,重要な月経周期特性を抽出する自然言語処理パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:07:03 GMT)
Monotones in Resource Theories for Dynamical Decoupling [0.0] 修正された相対エントロピーに基づく資源定量化器を示し、それらが実際に資源理論において単調であることを証明する。
DDは時間的資源蒸留として理解でき, マルチスケール最適動的デカップリング法(MODD)によるノイズ低減は, 対応する非マルコビアン性モノトンの減少と一致する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:52:24 GMT)
Mitigation of correlated readout errors without randomized measurements [0.0] 単一キュービットパウリ測定のみを用いた読み出し誤り軽減プロトコルを提案する。
提案手法は、非常に広い種類の相関ノイズモデルを取得する。
これは、数量子の相関した正の作用素値測定の完全かつ効率的な評価に基づいている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:21:45 GMT)
Microring resonator-based photonic circuit for faithfully heralding NOON states [0.0] 我々はマイクロリング共振器(MRR)をベースとした高次NOON状態の選択をheraldingを介して行う装置を設計した。
我々の装置は、シーディング検出が成功すれば、100%確実な3光子NOON状態出力を生成できる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:19:08 GMT)
Mechanical Squeezed Kerr Oscillator based on Tapered Ion Trap [0.0] トラップ形状によって生じる軸方向モードと半径方向モードの運動結合は、トラップによって制御される大きさの半径方向モードのKerr非線形性をもたらすことを示す。
これにより非ガウス量子ゲートの実現が可能となり、連続変数量子ゲートの普遍集合において重要な役割を果たす。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:19:09 GMT)
Measurement-induced phase transitions for free fermions in a quasiperiodic potential [0.0] 準周期ポテンシャルにおける自由フェルミオンの連続測定の下でのダイナミクスについて検討する。
我々は,ロバストな対数的システムサイズスケーリングが臨界ポテンシャル強度$V_c/J sim 2.3$まで現れることを示した。
この結果は, 準周期ポテンシャルを導入し, 局所的占有数を連続的に監視することにより, 超低温原子で測定することができる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:42:24 GMT)
Machine Learning-assisted High-speed Combinatorial Optimization with Ising Machines for Dynamically Changing Problems [0.0] パラメータチューニングを伴わずに多種多様な問題を高速に解くため,組込みIsing マシンを用いた手法を提案する。
無線マルチホップネットワークのTDMAスケジューリングにおいて,従来の手法よりも高速に処理できることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:31:36 GMT)
Machine Learning for Identifying Potential Participants in Uruguayan Social Programs [0.0] 本研究は,ウルグアイの家族支援プログラムであるCrece Contigo Family Support Program(PAF)に参加するための家族選択プロセスの最適化について,機械学習を用いて検討する。
対象は4歳未満の妊婦と小児である。
主な目的は、家族がプログラムへの受け入れ条件を満たすかどうかを判断できる予測アルゴリズムを開発することである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:30:36 GMT)
MNT Elliptic Curves with Non-Prime Order [0.0] 一般化されたMNT曲線を生成する方法を提案する。
そのようなペアリーな曲線の順序は、2つの素数の積である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:10:42 GMT)
MKA: Leveraging Cross-Lingual Consensus for Model Abstention [0.0] 本研究は, LLMの多言語的知識を活用して, 示唆された場合の棄却や回答の決定を通知することに焦点を当てる。
モデルの信頼性を校正する多言語パイプラインを開発し、不確実な場合にはそれを棄却する。
パイプラインのパフォーマンスはモデルや言語によって異なります。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:38:12 GMT)
Learning to Play Two-Player Perfect-Information Games without Knowledge [0.0] 本稿では,強化によるゲーム状態評価関数の学習手法を提案する。
一つは木のブートストラップの一般化(ツリー学習)であり、知識のない強化学習の文脈に適応する。
2つ目は、最良な動作列を終端状態まで延ばす非有界深さを持つミニマックスの修正である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:50:04 GMT)
Learning dynamical systems with hit-and-run random feature maps [0.0] 本稿では,予測能力に優れる動的システムの予測に,ランダムな特徴マップを用いる方法を示す。
スキップ接続を導入し、複数のユニットを組み合わせることで、ランダム特徴写像の深い変種を構築する。
修正されたランダムな特徴マップは、統計特性の長期推定だけでなく、単一軌跡予測にも優れた予測技術を提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:59:06 GMT)
Large Language Models in Numberland: A Quick Test of Their Numerical Reasoning Abilities [0.0] ナンバーランド(Numberland)は、LSMをベースとしたエージェントの数値推論能力を評価するための100プロブレム試験である。
OpenAIのo1とo1-mini, Google Gemini, Microsoft Copilot, Anthropic Claudeの5つのLDMエージェントを評価した。
私たちは25の難しい問題に対してトップ24ソルバ(o1と73%の精度)をテストし、そのスコアは27%に低下し、ボトルネックとして検索を確認しました。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 21:06:39 GMT)
LSEAttention is All You Need for Time Series Forecasting [0.0] トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンにおいて顕著な成功を収めた。
これまでの研究では、伝統的な注意機構が、この領域におけるそれらの有効性を制限する重要な要素として特定されてきた。
本稿では,トランスフォーマーを用いた時系列予測において,エントロピー崩壊を緩和し,不安定性をトレーニングするための新しいアプローチであるLATSTを紹介する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:04:09 GMT)
Jordanian deformation of the non-compact and $\mathfrak{sl}_2 $-invariant $XXX_{-1/2}$ spin-chain [0.0] 非コンパクトかつ$mathfraksl$-invariant $XXX_-1/2$ spin-chain の変形を構成する。
ハミルトニアンは非エルミート的で非対角的であり、ヨルダン分解しか認めない。
変形したスピン鎖は、ねじれた境界条件を持つ未変形の鎖と同値であることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:38:04 GMT)
Introducing the Short-Time Fourier Kolmogorov Arnold Network: A Dynamic Graph CNN Approach for Tree Species Classification in 3D Point Clouds [0.0] 短時間フーリエ変換(STFT)を統合した新しいネットワークSTFT-KANを紹介する。
データを用いて樹木種を分類するために,DGCNNの軽量バージョンであるliteDGCNNにSTFT-KANを実装した。
実験の結果,STFT-KANは,モデルの複雑さと性能を効果的にバランスさせて,既存のKANモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:25:03 GMT)
Innovative LSGTime Model for Crime Spatiotemporal Prediction Based on MindSpore Framework [0.0] 本稿では,Long Short-Term Memory(LSTM)とGated Recurrent Unit(RU)とMultiheadparse Self-attentionメカニズムを統合した犯罪時空間予測モデルLGSTimeを提案する。
統合モデルは、複雑な時間的データを扱うために、それぞれのテクニックの強みを活用する。
CNNモデルと比較して、Mean Squared Error(MSE)、Mean Absolute Error(MAE)、Root Mean Squared Error(RMSE)の2.8%、1.9%、および1.4%のパフォーマンス向上を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:12:07 GMT)
Information Theoretic One-Time Programs from Geometrically Local $\text{QNC}_0$ Adversaries [0.0] ランダム線形コードと量子ランダムアクセスコード(QRAC)からワンタイムメモリを構築する。
我々は、敵の古典的な計算力、使用可能な量子ビットの数、およびその量子ビットのコヒーレンス時間に制限を課さない。
我々は、幾何学的に局所的な量子回路から理論的に1時間メモリを1つの時間情報で構築できるかどうかという疑問を解き放つ。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 02:28:39 GMT)
Implicit In-Context Learning: Evidence from Artificial Language Experiments [0.0] 人間は暗黙の学習を通じて言語を取得し、明白な認識なしに複雑なパターンを吸収する。
我々は3つの古典的人工言語学習実験を、形態学、形態素構文学、構文学に応用し、推論レベルで暗黙的な学習を評価する。
この結果から,モデルと人間の行動の言語的領域特異的なアライメントが明らかとなった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:07:08 GMT)
Impact of Amplitude and Phase Damping Noise on Quantum Reinforcement Learning: Challenges and Opportunities [0.0] 量子強化学習アルゴリズムにおける振幅と位相減衰ノイズの影響について検討する。
本研究は,量子学習アルゴリズムにおけるノイズの役割のより深い理解に寄与する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:27:30 GMT)
Identifying Sparsely Active Circuits Through Local Loss Landscape Decomposition [0.0] ローカルロスランドスケープ分解(L3D)と呼ばれる新しい分解手法を提案する。
L3Dは低ランクワークの集合を特定し、サンプルの出力と基準出力ベクトルの間の損失の勾配を再構成する。
実世界のトランスモデルと畳み込みニューラルネットワークにL3Dを適用し、パラメータ空間における解釈可能な回路と関連する回路を識別する可能性を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:04:39 GMT)
Harvesting Information Across the Horizon [0.0] 2+1)次元のバナドス・タイテルボイム・ザネリ(BTZ)ブラックホール付近に落下する検出器は、絡み合うことができる。
ブラックホールは、一定の曲率を持つ最も単純な種類のものであっても、真空状態における量子場の相関特性に顕著に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:01 GMT)
Graph Transformer-Based Flood Susceptibility Mapping: Application to the French Riviera and Railway Infrastructure Under Climate Change [0.0] 本研究は, 洪水に起因したフレンチ・リヴィエラへの洪水感受性マッピングのためのグラフトランスフォーマー(GT)アーキテクチャの最初の適用について紹介する。
GTはラプラシアン位置エンコーダ(PE)とアテンション機構を用いた流域トポロジーを取り入れている。
Laplacian PEの次元の減少は部分的なクラスターを示し、空間情報を捉えることができた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:04:04 GMT)
Giant counter-rotating oscillations on the attosecond timescale [0.0] 原子と紫外線の超強結合は、アト秒の時間スケールで巨大な人口の振動を引き起こす。
ヘリウム中の2光子ラビ振動(1s$2$-1s3d)は、このタイプの超強結合とリアルパルスの生成に適している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:01:32 GMT)
GPU-centric Communication Schemes for HPC and ML Applications [0.0] GPU対応の通信スキームは、ホストメモリをステージングすることなく、アプリケーション内のGPU対応の通信バッファを直接GPUからNICに移動させる。
CPUスレッドは、そのようなGPU認識のサポートがあっても、通信操作をオーケストレーションするために必要である。
本稿では,CPUからGPUへ通信操作の制御経路を移動させる,GPU中心の通信方式について検討する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:43:18 GMT)
From Quantum-Mechanical Acceleration Limits to Upper Bounds on Fluctuation Growth of Observables in Unitary Dynamics [0.0] 量子スピード限界(Quantum Speed Limits、QSL)は、量子力学、特にエネルギー時間不確実性原理のテネットと根本的に関連している。
近年、量子加速限界の概念は、任意の非定常ハミルトニアンによって支配される量子系の単位時間進化について提案されている。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:14:16 GMT)
Free Parametrization of L2-bounded State Space Models [0.0] 本稿では、入力出力安定性とロバスト性を保証する構造化状態空間モデル(SSM)の新たなパラメトリゼーションであるL2RUを紹介する。
L2-bound を指定した正方形離散時間 LTI システムの非保守的パラメトリゼーションを導出し,L2RU アーキテクチャの基礎となる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:56:17 GMT)
Float Lattice Gas Automata: A connection between Molecular Dynamics and Lattice Boltzmann Method for quantum computers [0.0] 本稿では,Lattice Gas Automataフレームワークの簡易かつ変動のない変種を紹介する。
このアプローチは浮動小数点数に依存し、Lattice Boltzmann Method (LBM) を密接に反映している。
本稿では,従来のLBM実装に代わる効率的な代替手段として,Float Lattice Gas Automata(FLGA)の衝突を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 06:02:16 GMT)
Finding Interest Needle in Popularity Haystack: Improving Retrieval by Modeling Item Exposure [0.0] 本稿では、アイテムの露出確率を明示的にモデル化し、推論時に検索ステージランキングを調整する、露出認識型検索スコアリング手法を提案する。
実世界のビデオレコメンデーションシステムにおけるオンラインA/B実験によるアプローチの有効性を検証し、一意に検索されたアイテムの25%増加と、過度な人気コンテンツの優位性の40%低下を実証した。
本研究は,検索段階で人気バイアスを緩和するためのスケーラブルでデプロイ可能なソリューションを構築し,バイアス認識のパーソナライゼーションのための新しいパラダイムを提供する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:04:01 GMT)
Fermions in $(1+2)$-dimensions modified by nonminimal coupling and its applications to condensed matter physics [0.0] 本稿では,平面フェルミオン系の包括的理論的考察を行う。
ディラック方程式における非相対論的極限の2階補正の計算を含む。
また、調和ポテンシャルと電場の影響下でシュル「オーディンガー方程式」を探索する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:03:40 GMT)
Feedback Connections in Quantum Reservoir Computing with Mid-Circuit Measurements [0.0] フィードバック接続を統合する新しい量子貯水池計算方式について検討する。
モデルが過去の入力を記憶できるように,連続処理中にフィードバック接続が効果的に動作可能であることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:22:47 GMT)
FSOCO: The Formula Student Objects in Context Dataset [0.0] FSOCOデータセット(英: FSOCO dataset)は、フォーミュラ・ディレクタレス・コンペティションにおける視覚ベースのコーン検出システムのための協調データセットである。
それは、境界ボックスとインスタンスワイドセグメンテーションマスクの両方のための、人間の注釈付き接地真理ラベルを含んでいる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:32:59 GMT)
Exploring the Societal and Economic Impacts of Artificial Intelligence: A Scenario Generation Methodology [0.0] インパクト・不確実性マトリックスを適用してAIの統合と導入に影響を与える重要な要因を分類・分析する。
提案手法は,学術データベースのクエリ,新たなトレンドとトピックの識別,および影響不確実性フレームワークへの分類を含む。
論文では、AIが大きな変化をもたらす可能性のある重要な領域を特定し、これらの洞察に基づいて将来のシナリオを概説する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:49:46 GMT)
Exploration and Adaptation in Non-Stationary Tasks with Diffusion Policies [0.0] 本稿では,非定常視覚に基づくRL設定における拡散政策の適用について検討する。
我々はDiffusion Policy(拡散ポリシー)を適用し、ProcgenやPointMazeといったベンチマーク環境に反復的な denoising を利用して遅延アクション表現を洗練します。
計算要求が増大しているにもかかわらず,拡散ポリシはPPOやDQNなどの標準RL法を常に上回り,変動性を低減した平均値と最大値の報奨が得られることを示した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:00:07 GMT)
Experimental Measurement of Non-Hermitian Left Eigenvectors [0.0] エルミート系において、左右固有ベクトルは単にエルミート共役対である。
非エルミート固有状態は、互いに異なる左右の固有ベクトルを持つ。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 09:17:30 GMT)
Evaluating machine learning models for predicting pesticides toxicity to honey bees [0.0] 小分子は、生物医学、環境学、農業化学領域において重要な役割を担っている。
ApisToxは、ミツバチに対する化学毒性を実験的に検証した最も包括的なデータセットである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:51:12 GMT)
Evaluating Variational Quantum Eigensolver and Quantum Dynamics Algorithms on the Advection-Diffusion Equation [0.0] 本研究では3つの主要な量子力学アルゴリズムに対して基底状態アルゴリズムである変分量子固有解法(VQE)をベンチマークする。
VQEは、$O(10-9)$で、$N=4$ qubitsと適度な回路深さを持つ。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:09:59 GMT)
Estimation of nuclear polarization via discrete measurement of NV center spin evolution [0.0] 本研究では,NV中心スピン量子ビットのコヒーレンス変化の測定により,ダイヤモンド中の13C同位体のスピンフル核の初期偏極を推定する方法を提案する。
既存の偏光測定法は、量子ビットの環境に直接干渉する必要があるため、実験的に実装することは困難である。
我々は、8個の核スピンの現実的でランダムに生成された環境におけるスキームの動作を例示し、初期偏極の合理的な推定値を得る。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:38:20 GMT)
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning [0.0] Entropy-Guided Sequence Weighting (EGSW) は、探査・探査のトレードオフを強化する新しいアプローチである。
EGSWは、ポリシー更新のバランスをとるために、エントロピー正規化とアドバンテージベースの重み付けを統合する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 10:13:48 GMT)
Enhancing the Performances of Autonomous Quantum Refrigerators via Two-Photon Transitions [0.0] 熱湯と冷湯との2光子遷移による相関熱伝達を利用した別個のクエット冷凍機を導入する。
これらの冷凍機は、従来に比べて冷却力と信頼性が少なくとも2倍向上する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:16 GMT)
Double commutator method for a two band Bose-Einstein condensate: superfluid density of a flat band superfluid [0.0] 超流動密度と正規密度の和が f-sum 則の重みに等しいことを証明している。
平面バンドBose-Einstein Condensate(BEC)の超流動密度について検討する。
その結果,超流動密度は音速と圧縮率の二乗の積と直接比例していることが示唆された。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 01:39:25 GMT)
Disinformation about autism in Latin America and the Caribbean: Mapping 150 false causes and 150 false cures of ASD in conspiracy theory communities on Telegram [0.0] 本研究では, ラテンアメリカとカリブ海における陰謀論コミュニティにおける自閉症関連情報の構造, 明瞭化, 促進について検討した。
2015年から2025年までの10年間で1,659のTelegramコミュニティの出版物を分析し、約530万人のユーザーから58万件以上の共有コンテンツを調査することにより、自閉症に関する虚偽の物語がいかに促進されるかを探る。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:18:51 GMT)
Digital Twins in Biopharmaceutical Manufacturing: Review and Perspective on Human-Machine Collaborative Intelligence [0.0] バイオ医薬品産業は、製造プロセスのデジタル化と自動化を行うデジタルツインの開発をますます進めている。
本稿では,デジタル双生児との連携を重視した協調インテリジェンスフレームワークを提案する。
オペレータ信頼とヒューマン・マシン・インタフェースのユーザビリティを高めるシステム設計へのアプローチを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:13:54 GMT)
Digital Nudges Using Emotion Regulation to Reduce Online Disinformation Sharing [0.0] 本研究の目的は、感情情報に注意を向けることで、議論を促すデジタルナッジが、オンライン偽情報の強い怒りによる共有を減らすことができるかどうかを評価することである。
デジタルナッジは、偽情報や感情制御メッセージに関する感情情報を表示するように設計された。
その結果,全てのデジタルナッジは偽情報の共有を著しく減らし,最も効果的であることがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:01:05 GMT)
Did ChatGPT or Copilot use alter the style of internet news headlines? A time series regression analysis [0.0] ChatGPTやCopilotといった先進的な大規模言語モデル(LLM)のリリースは、テキストの作成方法を変えつつある。
本研究は,この2つのLLMのリリースが,ニュースサイトにおける見出しやリンクの書き方の変化と一致したかどうかを考察した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:44:26 GMT)
Development of a bipolar 50 V output digital-to-analog converter system for ion-shuttling operations [0.0] フィールドプログラマブルゲートアレイ (FPGA) を用いたデジタルアナログ変換器 (DAC) システムを開発した。
16チャンネルのアナログ出力、最大更新レートは毎秒16メガ更新(MUPS)、スルーレートは20V/us、帯域幅は200kHzである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:31:23 GMT)
Detecting Malicious AI Agents Through Simulated Interactions [0.0] 本研究では、悪意あるAIアシスタントの操作特性と、人間のようなシミュレーションユーザーと対話する際に、その動作が検出できるかどうかを調査する。
我々は,AIアシスタントとユーザ間のインタラクションを,複雑さと利害関係の異なる8つの意思決定シナリオでシミュレートする。
悪意のあるAIアシスタントは、シミュレーションされたユーザの脆弱性と感情的なトリガーを利用する、ドメイン固有のペルソナ対応の操作戦略を採用している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:22:24 GMT)
Detecting Glioma, Meningioma, and Pituitary Tumors, and Normal Brain Tissues based on Yolov11 and Yolov8 Deep Learning Models [0.0] 本稿では,YoloV11およびYoloV8深層学習モデルを用いて,グリオーマ,髄膜腫,下垂体脳腫瘍を検出するための高度なAI駆動手法を提案する。
移動学習に基づく微調整手法を用いて、最先端の深層学習技術と医療画像を統合し、脳腫瘍をNo-Tumor, Glioma, Meningioma, Pituitary tumorの4つのカテゴリに分類する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:50:59 GMT)
Degeneracies In a Weighted Sum of Two Squares [0.0] この研究は、正の整数の2乗の重み付き和(3n_12+n_22$)が複数の方法で実現できる場合に、インスタンスを分類して定量化する試みである。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:30:09 GMT)
Deep Learning Model Deployment in Multiple Cloud Providers: an Exploratory Study Using Low Computing Power Environments [0.0] 本研究では,GPUを使わずにクラウドベースの機械学習推論ソリューションの実現可能性と実現可能性を示す。
クラウドプロバイダ毎のリアルタイムレイテンシ,ハードウェア使用量,コストを,10実験を再現した7つの実行環境で評価した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:58:37 GMT)
Data-Driven Forecasting of High-Dimensional Transient and Stationary Processes via Space-Time Projection [0.0] 時空間投影(STP)は,高次元および時間分解データに対するデータ駆動予測手法として導入された。
この方法は、後流と予測間隔の両方からなる予測水平線にまたがるトレーニングデータから、拡張時空間固有モードを算出する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:36:59 GMT)
Critical quantum metrology using non-Hermitian spin model with RT-symmetry [0.0] RT対称性を持つKaplan-Shekhtman-Entin-Wohlman-Aharony相互作用を用いた非エルミート的横XYモデルについて検討する。
系の磁場を正確に推定するために,iKSEAモデルの基底状態の量子フィッシャー情報(QFI)が,Nをシステムサイズとして$N2$までスケールできることを証明した。
システムと浴槽が接触すると、この非エルミートモデルとなり、貯水池工学はシステムパラメータの精度を向上できることを示している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:19:31 GMT)
Contrasting exchange-field and spin-transfer torque driving mechanisms in all-electric electron spin resonance [0.0] 我々は、単軌道アンダーソン不純物を用いて、偏光鉛に結合し、スピン遷移と共鳴によって変調された電圧によってバイアスを受ける駆動場の起源を研究する。
不純物の充電しきい値以下では、電子スピン共鳴は磁気交換駆動機構または磁場のようなトルクによって支配される。
電子スピン共鳴信号とスピンダイナミクスは、どの駆動機構が支配するかによって大きく異なり、電気駆動量子系における量子コヒーレント制御を最適化する可能性を強調している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:10:22 GMT)
Construction of new type of CNOT gate using cross-resonance pulse in the transmon-PPQ system [0.0] トランスモンとパリティ保護量子ビットからなる超伝導ハイブリッドシステムにおいて,新しいタイプのCNOTゲートの実装方法を示す。
我々の研究は、ハイブリッドシステムが量子コンピュータの新しいプラットフォームを提供する可能性を示唆している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:32:19 GMT)
Concept Navigation and Classification via Open-Source Large Language Model Processing [0.0] 本稿では,オープンソースのLarge Language Models (LLMs) を用いたテキストデータから潜在構造を検出・分類するための新しい手法を提案する。
提案手法は,自動要約とループ内検証を組み合わせることで,構造同定の精度と解釈性を向上させる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 14:37:40 GMT)
Computer Vision and Deep Learning for 4D Augmented Reality [0.0] この論文は、Microsoft Mixed Realityプラットフォームで4Dビデオをレンダリングできる可能性を示している。
深層学習モデルを用いた4次元映像系列の形状と外観のコンパクトな表現法を開発した。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:38:26 GMT)
Coherent microwave control of coupled electron-muon centers [0.0] 我々は、結合した電子-ムーンスピン状態、すなわち水素の軽い同位体であるモニウムからなる量子系を研究する。
スピン遷移のマイクロ波励起による最も基本的なコヒーレント制御手法を実証する。
これらの能力は、孤立結合スピンに対する環境の影響を調べる強力なツールとなると期待している。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:50:05 GMT)
Closing the detection loophole in the triangle network with high-dimensional photonic states [0.0] N00N 状態に基づく非局所性は、N=2$ の場合、光子損失に対して非常に高いロバスト性を有することを示す。
優先的なノイズ要因,伝送チャネルにおける単一光子損失に対して,ノイズを最大10%の損失に認定することができる。
また,SPDCに基づく不完全情報源においても頑健性は保たれることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:31:34 GMT)
Chemically Tuning Room Temperature Pulsed Optically Detected Magnetic Resonance [0.0] 分子システムは、室温光検出磁気共鳴(ODMR)ベースの量子センシングのための化学的に調整可能なプラットフォームを提供する。
ダイヤモンドの窒素空孔中心のような最先端の固体欠陥では、このコントラストは約30%である。
ここでは, 化学調整性を利用して, 室温のODMRコントラストの40%が分子中で達成可能であることを示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:25:46 GMT)
Bootstrapping the Electronic Structure of Quantum Materials [0.0] 本稿では,2電子還元密度行列(2-RDM)理論の周期的一般化について述べる。
翻訳対称性を利用して計算スケーリングを大幅に削減する。
本研究では, 水素鎖, ジスルフィドモリブデン, 酸化ニッケルに理論を適用することにより, このアプローチの有効性を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 17:04:41 GMT)
Bi-self-trapping of excitons via the long-living phonon mode and their superfluorescent markers [0.0] 同じ長寿命フォノンモードで絡み合った2つの自走励起子の形成と、超放射光ミラー対称構成への再配置という2段階のメカニズムを提供する。
その結果, 運動方程式の安定相ロック型定常解法により, 自己トラッピング励起体が説明できることが示唆された。
ミラー対称配置における双自己トラッピング励起子は、ディック・ハミルトンによって記述することができ、超蛍光の責任を負う。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:01:03 GMT)
Berry Phase in Non-Perturbative QED [0.0] 本研究は, Adiabatic approximation において QED$_4$ について検討し,$U(1)$ Berry 接続に関連する大域的トポロジカル効果を取り入れた。
この結果から,アベリアゲージ理論においても,赤外系は局所的あるいは摂動的記述の範囲を超えてグローバルな効果を発揮できることが明らかとなった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:13:08 GMT)
Benchmarking Large Language Models for Calculus Problem-Solving: A Comparative Analysis [0.0] 5つの主要大言語モデル (LLM) を, 微分問題を解く上での性能評価を行った。
Chat GPT 4oは最高成功率94.71%、Claude Pro(85.74%)、Gemini Advanced(84.42%)、Copilot Pro(76.30%)、Meta AI(56.75%)が続いた。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:39:40 GMT)
BEATS: Bias Evaluation and Assessment Test Suite for Large Language Models [0.0] 我々は、大規模言語モデル(LLM)におけるバイアス、倫理、公平性、現実性を評価するための新しいフレームワークBEATSを紹介する。
LLMのバイアスベンチマークを行い、29の異なるメトリクスのパフォーマンスを計測する。
これらの指標は、人口統計学、認知学、社会的偏見、倫理的推論、グループフェアネス、事実に関する誤情報リスクなど、幅広い特徴に及びます。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:56:52 GMT)
Axiomatic approach to measures of total correlations [0.0] 相関は科学の様々な分野、特に量子力学において重要な役割を果たす。
我々は、量子相互情報は完全な相関の有効な尺度であり続けていると論じる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:33:17 GMT)
Assessing Code Understanding in LLMs [0.0] 大規模言語モデルでは、文脈が提供されない場合の41%、単純な文脈が与えられた場合の29%で意味的等価性を判断できないことを示す。
精度を向上させるため,プログラム理解をより堅牢にするために,LLMをコード最適化ツールに統合することを提唱する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 16:08:58 GMT)
Analytically exact solution of the Schrodinger equation for neutral helium in the ground state [0.0] 本報告では、シュロディンガー方程式のアブ初期解析解とその基底状態における中性ヘリウムまたはヘリウム様原子に対する対応する波動関数について述べる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 20:13:31 GMT)
An interpretable approach to automating the assessment of biofouling in video footage [0.0] 国際船舶は、生物汚染管理の実践の証拠を提供することがますます義務付けられている。
活動が効果的であることの検証には、水中の水中映像を用いた検査が必要である。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 00:41:52 GMT)
An extension of linear self-attention for in-context learning [0.0] インコンテキスト学習は計算変換器の顕著な特性である。
注意機構は文中の単語間の関係を符号化し、文中の単語の重みとして使用される。
一般的なタスクにおいて,自己意識がコンテキスト内学習に適しているかは疑わしい。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 07:49:05 GMT)
Alternating Wentzel-Kramers-Brillouin Approximation to the Schrödinger Equation: Rediscover the Bremmers series and beyond [0.0] Wenzel-Kramers-Brillouin (WKB) 近似の拡張を提案し、シュリンガー方程式を解く。
幾何学的光学的物理を符号化した一般量子化公式が見つかる。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:08:06 GMT)
Adventures in FRET and Specification [0.0] システム要件を捉えるためにFRETを使用した4つのケーススタディについて論じる。
これらの形式化された要求はその後、形式的なパラダイムの組み合わせでケーススタディの仕様を導いた。
私たちの経験から、FRETが要求の啓発と理解の枠組みとして適していることが確認できます。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:03:34 GMT)
Advantages and limitations of channel multiplexing for discrete-variable quantum key distribution [0.0] 絡み合いに基づく量子鍵分布スキームでは、鍵生成率は極めて低い。
1つの潜在的な解決策は、波長分割多重化(WDM)モジュールを使用して、異なる波長で光子を分割して検出チャネルを分離し、複数のキーを並列に生成することである。
パルスレーザーが自発パラメトリックダウンコンバージョン源のポンプに使用される場合のこの考え方を理論的に検討する。
解析の結果,提案手法は暗号鍵の生成を著しく高速化するが,その潜在能力を最大限に活用するためには,光子対光源の適切な最適化が必要であることがわかった。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 12:36:33 GMT)
Accelerated Airfoil Design Using Neural Network Approaches [0.0] 目標圧力分布(吸気面と圧力面)から翼形状を予測し,その逆を実証する。
1600の翼形状のデータセットが生成されます
入力/出力パラメータに依存する5つの異なるCNNモデルとDNNモデルを開発する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 13:14:14 GMT)
A discrete physics-informed training for projection-based reduced order models with neural networks [0.0] 本稿では、投影型リダクションオーダーモデル(ROM)のための物理インフォームドトレーニングフレームワークを提案する。
我々は、FEMベースの離散物理インフォームド残留損失を用いてスナップショットベースのトレーニングを補完することにより、PROM-ANNアーキテクチャを拡張した。
修正されたPROM-ANNは、スナップショット再構成精度でPODを桁違いに上回る。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 23:46:39 GMT)
A Scalable Predictive Modelling Approach to Identifying Duplicate Adverse Event Reports for Drugs and Vaccines [0.0] 薬物移動の実践は、個々のケースセーフティレポートの大規模なデータベースに依存している。
重複報告は、統計分析と誤診を妨げます。
本稿では,アートモデルであるvigiMatchをベースとして,既存機能の変更と新機能の導入を行う。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:24:29 GMT)
A Quantum Walk Inspired Qubit Lattice Algorithm for Simulating Electromagnetic Wave Propagation and Scattering in Conservative and Dissipative Magnetized Plasmas [0.0] 我々は、電磁プラズマ中の不均一性から電磁波の伝搬と散乱をシミュレートするのに適した、空間時間、離散的な量子ウォークインスパイアされたアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 15:28:41 GMT)
A Practical Rollup Escape Hatch Design [0.0] ロールアップネットワークは、ERC-721トークンのような汎用の"Layer 1"ブロックチェーンのための一般的な"Layer 2"スケーリングソリューションの一種です。
本稿では,時間ベースのトリガMerkleと新しいリゾルバ契約を用いて,これらのネットワークに対して実用的なエスケープハッチを実装することを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 11:55:10 GMT)
A Low-complexity Structured Neural Network to Realize States of Dynamical Systems [0.0] 本稿では,構造化ニューラルネットワーク(StNN)を用いたデータ駆動学習から動的システムの先進的状態への導出を行う。
ハンケル作用素をベースとしたStNNを用いた力学系の数値シミュレーションを行った。
提案したStNNは,将来状態の予測と理解を可能にする低複雑さ学習により,状態空間の動的システムを実現する方法を示す。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 03:52:38 GMT)
A Hybrid Measurement Scheme for Generating nonGaussian Spin States [0.0] 本稿では,原子スピンアンサンブルの非古典状態を生成するプロトコルを提案する。
我々は、光の偏光回転を測定することによってスピン圧縮状態を生成する。
信号モードに散乱する単一光子を検出する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 19:17:37 GMT)
A First-Principles Based Risk Assessment Framework and the IEEE P3396 Standard [0.0] 生成人工知能(AI)は、コンテンツ作成と意思決定支援において前例のない自動化を可能にしている。
本稿では、IEEE P3396 Recommended Practice for AI Risk, Safety, Trustworthiness, and Responsibilityの基礎となる第一原理リスク評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 18:00:03 GMT)
A Clue on Small-Capacitance Josephson Junction: What to Expect from Cooper Pair Ideal Conductor and Ohmic Resistor in Parallel? [0.0] 量子相ゆらぎと準粒子サブギャップ, 抵抗シャントが結合した量子相揺らぎによる小さな容量ジョセフソン接合への影響について検討した。
量子ジョセフソン接合における位相粒子運動は拡散性から局所化に変化せず、絶縁体-超伝導体遷移をもたらす。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 22:08:39 GMT)
"Nonlocality-of-a-single-photon'' based Quantum Key Distribution and Random Number Generation schemes and their device-independent security analysis [0.0] スキームは1つの光子50-50ビームを2つのモードに分割し、2つの空間的に分離された観測ステーションに伝播する。
そのような配置の物理学と非古典性は、最近まで理解されてきた。
単一光子に基づくデバイス非依存の量子鍵分布方式を提案する。
論文参考訳(メタデータ) (Mon, 31 Mar 2025 08:00:12 GMT)