Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey [154.5] 3D再構成とビュー合成は、拡張現実(AR)、仮想現実(VR)、デジタルツインといった没入型技術における基礎的な問題である。
深層学習によるフィードフォワードアプローチの最近の進歩は、高速で一般化可能な3次元再構成とビュー合成を可能にして、この分野に革命をもたらした。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:32:37 GMT)
Scaling RL to Long Videos [107.4] LongVILA-R1-7Bはビデオベンチマークで高いパフォーマンスを達成し、ビデオMMEではそれぞれ65.1%と71.1%の精度を達成した。
LongVILA-R1-7Bは最大8,192フレームのビデオフレームとFPS設定をサポートする。
各種モダリティのRLトレーニングをサポートする,一般公開のためのトレーニングシステムをリリースする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:55:33 GMT)
AlphaDent: A dataset for automated tooth pathology detection [98.2] このデータセットは、295人の患者の歯のDSLRカメラ写真に基づいており、1200枚以上の画像を含んでいる。
この記事では、データセットとラベリングフォーマットの詳細な説明を提供する。
その結果,高い予測精度が得られた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:34:43 GMT)
Modality-Aware Feature Matching: A Comprehensive Review of Single- and Cross-Modality Techniques [91.3] 特徴マッチングはコンピュータビジョンにおける基礎的な課題であり、画像検索、ステレオマッチング、3D再構成、SLAMなどのアプリケーションに必須である。
本調査は,モダリティに基づく特徴マッチングを包括的にレビューし,従来の手作り手法と現代のディープラーニングアプローチについて検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:56:36 GMT)
Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models [87.7] 大規模言語モデル(LLM)は、医療におけるAIアプリケーションで使用される。
LLMを継続的にストレステストするレッドチームフレームワークは、4つのセーフティクリティカルなドメインで重大な弱点を明らかにすることができる。
敵エージェントのスイートは、自律的に変化するテストケースに適用され、安全でないトリガー戦略を特定し、評価する。
私たちのフレームワークは、進化可能でスケーラブルで信頼性の高い、次世代の医療AIのセーフガードを提供します。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:44:22 GMT)
A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence [82.1] 大きな言語モデル(LLM)は強力な能力を示しているが、基本的に静的である。
LLMはますますオープンでインタラクティブな環境にデプロイされているため、この静的な性質は重要なボトルネックとなっている。
この調査は、自己進化エージェントの体系的で包括的なレビューを初めて提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:59:37 GMT)
Coarse Graining with Neural Operators for Simulating Chaotic Systems [78.6] カオスシステムの長期的挙動を予測することは、気候モデリングなどの様々な応用に不可欠である。
このような完全解法シミュレーションに対する別のアプローチは、粗いグリッドを使用して、時間テキストモデルによってエラーを修正することである。
この制限を克服する物理インフォームド・ニューラル演算子(PINO)を用いたエンド・ツー・エンドの学習手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:18:51 GMT)
FOF-X: Towards Real-time Detailed Human Reconstruction from a Single Image [65.0] 本稿では,1枚の画像から詳細な人物形状をリアルタイムに再現するFOF-Xを提案する。
FOFの中核は、3次元占有体を2次元ベクトル場に分解し、3次元領域内の位相的および空間的関係を維持することである。
FOFに基づく新しい再構成フレームワークFOF-Xを設計し,テクスチャや照明による性能劣化を回避する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:05:31 GMT)
PARTE: Part-Guided Texturing for 3D Human Reconstruction from a Single Image [64.2] 構造的人間の部分は、単一の画像の見えない領域で人間のテクスチャを推測する重要な手がかりとなる。
本研究では,人間のテクスチャを再構築するための3次元情報を含むフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:43:58 GMT)
Can one size fit all?: Measuring Failure in Multi-Document Summarization Domain Transfer [64.0] マルチドキュメント要約(MDS)は、複数の文書で自動的に情報を要約するタスクである。
我々は、トレーニングアプローチ、ドメイン、次元にわたるMDSモデルを評価する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 23:19:16 GMT)
GATEAU: Selecting Influential Samples for Long Context Alignment [62.9] GATEAUは、長距離依存関係に富む影響力のあるサンプルを同定する。
選択されたサンプルに基づいて訓練されたモデルは、より良い指示追従と長文理解能力を示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:50:58 GMT)
A Comprehensive Taxonomy of Negation for NLP and Neural Retrievers [61.1] 我々は、哲学的、言語的、論理的定義から派生した否定の分類を導入した。
ニューラルネットワーク検索モデルの性能評価に使用できるベンチマークデータセットを2つ生成する。
本稿では,既存のデータセットの検索モデルの性能を解析するために,論理に基づく分類機構を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:44:20 GMT)
Multimodal LLMs as Customized Reward Models for Text-to-Image Generation [60.2] LLaVA-Rewardは、複数の視点でテキスト・ツー・イメージ(T2I)生成を自動評価する効率的な報酬モデルである。
LLaVA-Rewardはマルチモーダル大言語モデル(MLLM)の隠れ状態を直接利用する
LLaVA-Rewardは、テキストイメージアライメント、忠実さ/アーティファクト、安全性、全体的なランク付けの4つの観点でトレーニングします。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:49:38 GMT)
DepR: Depth Guided Single-view Scene Reconstruction with Instance-level Diffusion [59.3] DepRは深度誘導のシングルビューシーン再構築フレームワークである。
個々のオブジェクトを生成し、それらをコヒーレントな3Dレイアウトに構成する。
限られた合成データで訓練されているにもかかわらず、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:40:46 GMT)
User Feedback in Human-LLM Dialogues: A Lens to Understand Users But Noisy as a Learning Signal [58.4] 本研究では,2つのユーザ-LMインタラクションデータセットにおける暗黙のユーザフィードバックについて検討する。
ユーザフィードバックの内容は、人間設計の短い質問において、モデル性能を向上させることができる。
また、ユーザフィードバックの有用性は、ユーザの最初のプロンプトの品質に大きく関係していることもわかりました。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 23:33:29 GMT)
Ultra3D: Efficient and High-Fidelity 3D Generation with Part Attention [54.2] 品質を損なうことなくスパースボクセルモデリングを大幅に高速化する,効率的な3D生成フレームワークであるUltra3Dを提案する。
部分注意(Part Attention)は、意味的に一貫した部分領域内での注意計算を制限する幾何学的な局所的注意機構である。
実験により、Ultra3Dは1024の解像度で高解像度の3D生成をサポートし、視覚的忠実度とユーザの好みの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:17:22 GMT)
Masked Language Models are Good Heterogeneous Graph Generalizers [54.1] LLM4HGと呼ばれるマスケ言語モデリング手法
HGトークンの代わりにメタパスベースのシーケンスを使用して、構造的および意味的な情報を抽出する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:58:06 GMT)
Move to Understand a 3D Scene: Bridging Visual Grounding and Exploration for Efficient and Versatile Embodied Navigation [54.0] 身近なシーン理解には、視覚空間情報の理解だけでなく、3D物理世界における次の探索場所の決定も必要である。
アンダーラインテキストbf3D視覚言語学習は、エンボディエージェントが環境を効果的に探索し理解することを可能にする。
モデルの汎用性は、カテゴリ、言語記述、参照イメージなど、多様な入力モダリティを使ったナビゲーションを可能にする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:32:33 GMT)
On the Reliability of Vision-Language Models Under Adversarial Frequency-Domain Perturbations [53.6] VLM(Vision-Language Models)は、視覚コンテンツ推論のための知覚モジュールとして使われることが多い。
これらの特徴変換が,画像の自動キャプションタスクの信頼度/ディープフェイク検出にどのような影響を及ぼすかを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:41:29 GMT)
MiniLongBench: The Low-cost Long Context Understanding Benchmark for Large Language Models [52.6] 長期文脈理解(Long Context Understanding、LCU)は、現在の大言語モデル(LLM)における探索の重要な領域である。
LLMの既存のLCUベンチマークは、しばしば非常に高い評価コストをもたらす。
本稿では,スパース情報特性を持つ長文データに適した簡潔なデータ圧縮手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:46:12 GMT)
Recognizing Actions from Robotic View for Natural Human-Robot Interaction [52.0] 自然人-ロボットインタラクション(Natural Human-Robot Interaction, N-HRI)は、ロボット自身が動いているか静止しているかに関わらず、ロボットが様々な距離と状態で人間の行動を認識することを要求する。
N-HRIの既存のベンチマークは、限られたデータ、モダリティ、タスクカテゴリ、主題や環境の多様性のために、N-HRIのユニークな複雑さに対処できない。
モバイルサービスロボットで広く使われている知覚中心ロボットビューのための大規模データセット(Action from Robotic View)を紹介する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:48:34 GMT)
Next Tokens Denoising for Speech Synthesis [51.3] Dragon-FMは、ARとフローマッチングを統合する新しいテキスト音声(TTS)設計である。
48kHzのオーディオトークンを、毎秒12.5のコンパクトなトークンでチャンクで処理する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:03:36 GMT)
FairReason: Balancing Reasoning and Social Bias in MLLMs [50.6] MLLM(Multimodal Large Language Models)は、様々なタスクやモダリティにおいて、最先端の成果をすでに達成している。
近年の研究では、推論能力をさらに推し進めるために、先進的なプロンプトスキームと後続の微調整を探求している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 19:57:22 GMT)
Transductive Model Selection under Prior Probability Shift [49.6] トランスダクティブ・ラーニング(Transductive learning)とは、ラベリングを必要とする未学習データを有限セットとし、トレーニング時に利用できる教師付き機械学習タスクである。
本稿では,データに事前の確率シフトを示す場合のモデル選択を行うための,トランスダクティブな分類コンテキストに合わせた手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:03:24 GMT)
Increased output of superradiant light-emitting diodes due to population fluctuations [49.2] 人口変動は、スーパーラジアントLEDの出力パワーと集合ラビ分裂を著しく増大させる。
集団変動は超ラジカルLEDの出力パワーと集合ラビ分裂を著しく増加させることが示された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:57:02 GMT)
Controlling diverse robots by inferring Jacobian fields with deep networks [48.3] 自然生物の複雑な構造と多様な機能を反映することは、ロボット工学における長年の課題である。
本稿では,深層ニューラルネットワークを用いてロボットの映像ストリームをバイスモータヤコビアン場にマッピングする手法を提案する。
提案手法は,正確なクローズドループ制御を実現し,各ロボットの因果動的構造を復元する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:44:23 GMT)
Listening to the Unspoken: Exploring 365 Aspects of Multimodal Interview Performance Assessment [48.2] インタビューパフォーマンスの365の側面を探求する,斬新で包括的なフレームワークを提案する。
このフレームワークは、不均一なデータストリームをエンコードするために、モダリティ固有の特徴抽出器を使用する。
提案手法は,マルチモーダルデータから暗黙の手がかりと暗黙の手がかりを抽出する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:37:06 GMT)
COOkeD: Ensemble-based OOD detection in the era of zero-shot CLIP [47.8] アウト・オブ・ディストリビューション(OOD)検出は、信頼できる画像認識システムにおいて重要なビルディングブロックである。
両端から少し開放感が与えられると、不均一なアンサンブルを生成することで、顕著なOOD検出が達成できることが示される。
CokeDは、古典的およびCLIPベースのOOD検出方法と比較して、最先端のパフォーマンスとロバスト性の向上を実現している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:02:38 GMT)
From Sharp to Blur: Unsupervised Domain Adaptation for 2D Human Pose Estimation Under Extreme Motion Blur Using Event Cameras [47.7] ヒトのポーズ推定は、リハビリテーション、スポーツ分析、AR/VRシステムといった応用において重要である。
ほとんどのデータセットは安定した条件を前提としており、シャープな画像で訓練されたモデルはぼやけた環境で苦労する。
本稿では,高時間分解能モーションデータをキャプチャするイベントカメラを利用した新しい領域適応手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:30:40 GMT)
Past Meets Present: Creating Historical Analogy with Large Language Models [46.6] 本稿では,あるイベントに類推された過去の出来事を収集することを目的とした,歴史的類推獲得タスクに焦点を当てる。
LLMが歴史的類推を生成する際に,幻覚やステレオタイプを緩和する自己回帰法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:18:33 GMT)
Traits Run Deep: Enhancing Personality Assessment via Psychology-Guided LLM Representations and Multimodal Apparent Behaviors [46.6] 我々はtextittextbfTraits Run Deep という新しいパーソナリティ評価フレームワークを提案する。
テキストテキストbf心理学的インフォームドプロンプトを使用して、高いレベルの人格関連セマンティック表現を導き出す。
textittextbfText-Centric Trait Fusion Networkは、リッチテキストセマンティクスをアンロックして、他のモダリティからの非同期信号の整合と統合を行う。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:12:14 GMT)
Estimating 2D Camera Motion with Hybrid Motion Basis [46.0] CamFlowは、ハイブリッドモーションベースを使用したカメラモーションを表現する新しいフレームワークである。
提案手法は,ラプラス分布に基づくハイブリッド確率損失関数を含む。
CamFlowはさまざまなシナリオで最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:30:37 GMT)
UAVScenes: A Multi-Modal Dataset for UAVs [45.8] UAVScenesは2Dと3Dの両方のモードでさまざまなタスクをベンチマークするために設計された大規模なデータセットである。
我々は、フレームワイド画像とLiDARポイントクラウドの両方に対して、手動でラベル付けされたセマンティックアノテーションを提供することにより、このデータセットを強化する。
これらの追加により、セグメンテーション、深さ推定、6-DoFローカライゼーション、位置認識、新しいビュー合成など、幅広いUAV認識タスクが可能になる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:29:52 GMT)
GVD: Guiding Video Diffusion Model for Scalable Video Distillation [45.7] ビデオデータセットの蒸留は、空間的および時間的情報をはるかに小さなデータセットでキャプチャすることを目的としている。
本稿では,最初の拡散型ビデオ蒸留法であるGVD: Guiding Video Diffusionを提案する。
提案手法は,MiniUCF および HMDB51 データセットにおいて,従来の最先端の蒸留法よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:51:35 GMT)
Quantum Simulation of Nuclear Dynamics in First Quantization [45.0] 我々は、第1量子化において、完全なリードing Order (LO) ピオンレスハミルトニアン(英語版)を用いて核力学を研究するためのリソース要件を初めて完全に特徴づける。
低エネルギー核散乱の興味深いシミュレーションは、数千万のTゲートと数百の論理量子ビットで達成可能である。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:31:49 GMT)
Physics-constrained generative machine learning-based high-resolution downscaling of Greenland's surface mass balance and surface temperature [45.0] グリーンランド氷床の表面質量収支(SMB)と表面温度の高分解能投射は将来の海面上昇を理解するのに不可欠である。
本稿では、低分解能SMBおよび表面温度場をダウンスケールする一貫性モデル(CM)に基づく、物理制約付き生成モデリングフレームワークを提案する。
提案手法は,高速推論による氷床シミュレーションのために,現実的で高解像度な気候強制を実現する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:43:48 GMT)
Mitigating loss of variance in ensemble data assimilation: machine learning-based and distance-free localization [45.0] アンサンブルデータ同化における共分散推定を改善するための2つの新しい手法を提案する。
主な目的は、サンプリングエラーによるばらつきの損失を軽減し、データ同化結果を強化することである。
これらのメソッドは、Multiple Data Assimilation (ES-MDA)フレームワークでEnsemble Smootherに統合される。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:08:55 GMT)
Sustainability Evaluation Metrics for Recommender Systems [44.4] 持続可能な評価指標は、推奨システムの品質を評価するのに役立つ。
本稿では,レコメンデータシステムのための基本的なサステナビリティ評価指標について論じ,それらのアプリケーションを分析する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:46:56 GMT)
AI paradigm for solving differential equations: first-principles data generation and scale-dilation operator AI solver [43.4] 多様な微分方程式(DE)を解くためのAIパラダイムを提案する。
事前の知識やランダムフィールドを用いて解を生成し、それをDESに置換する。
計算コストが極端に低い状態で、任意に大量の第一原理一貫性のあるトレーニングデータセットを生成します。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:45:11 GMT)
Learning to See in the Extremely Dark [41.4] 我々は、高解像度のRAW画像を生成することができるペア対ペアデータ合成パイプラインを提案する。
See-in-Extremely-Dark(SIED)と呼ばれる大規模なペアデータセットは、低照度RAW画像拡張アプローチのベンチマークに使用される。
非常に低SNR RAW入力から視覚的満足度を回復する拡散型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:38:57 GMT)
Open quantum dynamics of Josephson charge pumps [41.1] 開量子系としてのジョセフソン接合の理論的記述をAlicki et al. の光に照らしたジョセフソン電荷ポンプのマクロ力学について検討する。
その結果, ポンプの物性は物理的に妥当であり, 実験結果と定性的に一致していることが判明した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:27:02 GMT)
ST-GDance: Long-Term and Collision-Free Group Choreography from Music [40.6] グループダンスは、映画、ゲーム、アニメーション制作に広く応用されている。
空間的・時間的依存関係を分離し,長期・衝突のないグループコレオグラフィーを最適化する新しいフレームワークST-GDanceを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:57:47 GMT)
Sparse Reconstruction of Optical Doppler Tomography with Alternative State Space Model and Attention [40.0] 2次元光コヒーレンスドプラトモグラフィー(ODT)画像は、B線に沿って生のAスキャンのドップラー位相サブトラクションを介して断面流像を再構成することにより形成する。
高忠実度Bスキャンを得るには、Aスキャンを高密度にサンプリングする必要があるため、スキャン時間が長くなり、保存要求が増大する。
本稿では,Aスキャンを効果的に削減する代替状態空間アテンションネットワーク(ASSAN)を用いた,新しいスパースODT再構成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:31:11 GMT)
trAIce3D: A Prompt-Driven Transformer Based U-Net for Semantic Segmentation of Microglial Cells from Large-Scale 3D Microscopy Images [39.6] 本稿では,精密マイクログリアセグメンテーションのためのディープラーニングアーキテクチャであるtrAIce3Dを紹介する。
まず、エンコーダ内の視覚変換器を備えた3D U-Netは、スライディングウインドウ技術を用いて、画像全体をカバーするソマを検出する。
次に、ソマ座標をプロンプトとして、ターゲットセルの周りの3Dウィンドウを入力として、ソマとその枝を洗練する。
TRAIce3Dは41,230マイクログリアセルのデータセットで訓練され、評価され、セグメンテーションの精度とスケーラブルな一般化を著しく改善する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:54:53 GMT)
Probing Information Distribution in Transformer Architectures through Entropy Analysis [39.6] 本研究では,トランスフォーマーアーキテクチャにおける情報分布の探索ツールとしてのエントロピー解析について検討する。
本手法をGPTに基づく大規模言語モデルに適用し,モデル行動と内部表現に関する知見を明らかにする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:00:40 GMT)
A low-loss, 24-mode laser-written universal photonic processor in a glass-based platform [39.6] フェムト秒レーザーライティング(FLW)により実現された最初の24モードユニバーサルフォトニックプロセッサ(UPP)の製作について報告する。
デバイスの平均挿入損失は4.35dBに過ぎず、先進的な多光子量子実験に直接適用することができる。
この研究は、FLWベースの統合フォトニクスを、量子コンピューティング、通信、センシング技術の進歩のためのスケーラブルで堅牢なプラットフォームとして確立する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:36:42 GMT)
MaterialMVP: Illumination-Invariant Material Generation via Multi-view PBR Diffusion [37.6] 物理ベースのレンダリング(PBR)は現代のコンピュータグラフィックスの基盤となり、3Dシーンにおける現実的な物質表現と照明相互作用を可能にしている。
本稿では3次元メッシュと画像プロンプトからPBRテクスチャを生成するための新しいエンド・ツー・エンドモデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:50:07 GMT)
Learning to Extract Rational Evidence via Reinforcement Learning for Retrieval-Augmented Generation [37.5] Retrieval-Augmented Generation (RAG) はLarge Language Models (LLM) の精度を効果的に向上させる
それまでの手法では、明確な思考なしに証拠を直接抽出し、重要な手がかりをフィルタリングし、一般化に苦慮する危険性がある。
本稿では,(1)検索内容中の潜在的手がかりを明示的に推論し,(2)質問に答えるのに有用なキー手がかりを省略しないよう意識的に抽出することによる合理的証拠の抽出を学習するEvi Omniを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:51:25 GMT)
Theoretical Analysis of Relative Errors in Gradient Computations for Adversarial Attacks with CE Loss [37.4] 浮動小数点算術によって引き起こされる計算の相対誤差により、グラディエントベースの敵攻撃が過大評価されることが多い。
本稿では,4つのシナリオにわたる勾配攻撃における浮動小数点演算誤差の総合的研究を行う。
本稿では,浮動小数点誤差の影響を最小限に抑えるために,最適スケーリング係数$T = t*$を組み込んだ理論MIFPE損失関数を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:14:59 GMT)
A Foundation Model for Material Fracture Prediction [37.1] フラクチャー予測のためのデータ駆動基礎モデルを提案する。
シミュレーター、幅広い材料、様々な負荷条件で作動する。
さまざまな下流タスクに関する最小限のデータで微調整できる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:23:36 GMT)
Local Mixtures of Experts: Essentially Free Test-Time Training via Model Merging [37.0] 専門家(MoE)モデルの混合は、推論コストを増大させることなくモデルキャパシティを増やすための有望なアプローチである。
我々は、MoEパラダイムを桁違いに多くの専門家に拡張するTTMM(Test-Time Model Merging)を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:53:32 GMT)
CleanMel: Mel-Spectrogram Enhancement for Improving Both Speech Quality and ASR [36.8] 提案するネットワークは、ノイズと残響のマイクロホン記録を入力として、対応するMel-spectrogramを予測する。
拡張Mel-spectrogramは、ニューラルボコーダで音声波形に変換するか、ASRに直接使用することができる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:22:13 GMT)
Themed Challenges to Solve Data Scarcity in Africa: A Proposition for Increasing Local Data Collection and Integration [36.4] 本稿では,アフリカの医療におけるデータ不足に対処する枠組みを提案する。
このフレームワークは、大陸の医療提供者に対して、ローカルソースの医療画像データセットの作成、キュレート、共有を奨励する包括的な戦略を提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:42:00 GMT)
Uni-Mol3: A Multi-Molecular Foundation Model for Advancing Organic Reaction Modeling [36.4] 本稿では,多分子反応モデリングに階層的パイプラインを用いた新しいディープラーニングフレームワークUni-Mol3を紹介する。
中心となるUni-Mol3は、分子やその他の特徴の3D構造を離散トークンにエンコードするマルチスケール分子トークン化器(Mol-Tokenizer)を採用している。
迅速な下流の微調整により、Uni-Mol3は多様な有機反応タスクにおいて例外的な性能を示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:38:52 GMT)
G-Core: A Simple, Scalable and Balanced RLHF Trainer [35.7] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデルのトレーニングにおいて、ますます一般的なパラダイムになりつつある。
これらの課題に対処するために設計された,シンプルでスケーラブルでバランスの取れたRLHFトレーニングフレームワークである textbfG-Core を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:55:08 GMT)
Viser: Imperative, Web-based 3D Visualization in Python [35.6] Viserはコンピュータビジョンとロボット工学のための3D視覚化ライブラリである。
この記事では、Viserの機能、インターフェース、実装について説明する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:59:31 GMT)
Magentic-UI: Towards Human-in-the-loop Agentic Systems [34.5] 本稿では,ヒューマンエージェントインタラクションの開発と研究のためのオープンソースのWebインターフェースであるMagentic-UIを紹介する。
柔軟なマルチエージェントアーキテクチャに基づいて構築されたMagentic-UIは、Webブラウジング、コード実行、ファイル操作をサポートする。
エージェントベンチマークによる自律的なタスク補完、インタラクション機能のユーザテストのシミュレーション、実際のユーザとの質的研究、ターゲットとする安全性評価の4つの側面でMagentic-UIを評価した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:49:14 GMT)
BALSAM: A Platform for Benchmarking Arabic Large Language Models [34.5] BALSAMは、アラビア語のLLM開発と評価を進めることを目的とした総合的なコミュニティ主導のベンチマークである。
14の幅広いカテゴリから78のNLPタスクが含まれており、52Kのサンプルは37Kテストと15K開発に分割されている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:16:39 GMT)
A Linear N-Point Solver for Structure and Motion from Asynchronous Tracks [31.1] 点対応からの構造と連続的な動きの推定は、コンピュータビジョンの基本的な問題である。
任意のタイムスタンプを持つ2次元点対応系の構造と線形運動推定のための統一的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:53:46 GMT)
An engineering guide to superconducting quantum circuit shielding [30.4] 超伝導量子回路の電磁界と赤外放射からの保護の要点について概説する。
大規模超伝導量子システムのためのマイクロ波フィルタと同様に、効率的でコンパクトな遮蔽システムの構築を推奨する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:46:59 GMT)
The Incomplete Bridge: How AI Research (Mis)Engages with Psychology [30.4] 社会科学は人間の心と行動を研究するための理論と方法論の豊富な体系を蓄積してきた。
本研究は,心理学を顕著な事例として,AIと分野間の学際的相乗効果について考察する。
我々は、学際統合の重要なパターンを特定し、最も頻繁に参照される心理学領域を特定し、未探索領域をハイライトする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:03:59 GMT)
ShortFT: Diffusion Model Alignment via Shortcut-based Fine-Tuning [30.2] バックプロパゲーションに基づくアプローチは、エンドツーエンドのバックプロパゲーションを通じて拡散モデルを報酬関数と整合させることを目的としている。
既存のアプローチは、完全な勾配のバックプロパゲーションを達成するのに苦労し、最適以下の結果をもたらす。
本稿では,ショートカットに基づくファインチューニング(ShortFT)を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:19:01 GMT)
CliCARE: Grounding Large Language Models in Clinical Guidelines for Decision Support over Longitudinal Cancer Electronic Health Records [30.1] 大規模言語モデル(LLMs)は、臨床診断支援の改善と医師のバーンアウトの低減に大きく貢献する。
CliCARE(CliCARE)を提案する。CliCAREは、長期がん電子健康記録に対する臨床ガイドラインにおける大規模言語モデル構築のためのフレームワークである。
我々は,中国の民間がんデータセットと英語MIMIC-IVデータセットを用いた大規模縦長データを用いて,我々の枠組みを検証した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:02:16 GMT)
Proto-EVFL: Enhanced Vertical Federated Learning via Dual Prototype with Extremely Unaligned Data [28.6] 垂直連合学習(VFL)では、VFLの異なる分野にまたがるアンアライメントなサンプルは、極端にクラス不均衡である。
デュアルプロトタイプによる拡張VFLフレームワークであるProto-EVFLを提案する。
VFL における二段階最適化フレームワークである Proto-EVFL が収束速度 1/sqrt T であることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:48:33 GMT)
A Large Language Model Powered Integrated Circuit Footprint Geometry Understanding [28.5] LLM4-IC8Kは、ICメカニカル描画を画像として扱い、LLMを構造化幾何学的解釈に活用する新しいフレームワークである。
まず、合成したICフットプリント図上でLMMを訓練し、基本的な幾何学的推論を学習する2段階のフレームワークを提案する。
本モデルでは,提案したベンチマークにおいて,最先端のLMMよりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:16:50 GMT)
SMAFormer: Synergistic Multi-Attention Transformer for Medical Image Segmentation [28.5] SMAFormerはトランスフォーマーをベースとしたアーキテクチャで,腫瘍や臓器のセグメンテーションを強化するために複数の注意機構を融合する。
SMAFormerは、医療画像セグメンテーションのローカル機能とグローバル機能の両方をキャプチャできる。
われわれは多臓器,肝腫瘍,膀胱腫瘍の分節化など,様々な医療画像の分節化作業について広範な実験を行い,その結果を得た。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:07:17 GMT)
Towards Blind Bitstream-corrupted Video Recovery via a Visual Foundation Model-driven Framework [28.4] ビットストリームの破損したビデオリカバリは、困難かつ未調査の課題として浮上した。
本稿では,視覚的基盤モデルと回復モデルを統合した最初の視覚的ビットストリーム崩壊ビデオ回復フレームワークを提案する。
本手法は,手動でラベル付けしたマスクシーケンスを必要とせずに,ビットストリームの破損した映像の再生において優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:31:54 GMT)
Spec-VLA: Speculative Decoding for Vision-Language-Action Models with Relaxed Acceptance [27.5] この研究は、Vision-Language-Action(VLA)モデルを高速化するために設計されたSDフレームワークであるSpec-VLAを紹介する。
生成速度を向上させるために,VLAモデルのアクショントークンで表される相対距離を利用して,受理を緩和する効果的な機構を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:04:09 GMT)
When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios [27.2] MLLM(Multimodal large language model)は、より長く複雑なコンテキストを処理する。
トークン圧縮は、トレーニングと推論の両方でトークンの数を効率的に削減する、目立たしく批判的なアプローチとして登場した。
本稿では,マルチモーダル長コンテキストトークン圧縮の発芽領域に関する最初の体系的調査と合成について述べる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 01:07:17 GMT)
Hate in Plain Sight: On the Risks of Moderating AI-Generated Hateful Illusions [26.1] 本稿では,スケーラブルなヘイトフルイリュージョン生成のリスクと,現在のコンテンツモデレーションモデルを回避する可能性について検討する。
我々は62のヘイトメッセージに条件付き安定拡散と制御ネットを用いて1,860個の光学錯視を生成する。
そのうち1,571件はヘイトメッセージの埋め込みに成功し、Hateful Illusionデータセットを形成している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:37:29 GMT)
H2Tune: Federated Foundation Model Fine-Tuning with Hybrid Heterogeneity [25.6] 本稿では,ハイブリッドなヘテロジニティを持つファウンデーションモデルH2Tuneを提案する。
フレームワークは3つの主要なコンポーネントから構成される: (i) 階層化された三重行列分解(sparsified triple matrix decomposition) クライアントリソースに基づく適応的なスパーシフィケーション(adaptive sparsification) 、 (ii) 異種層構造と表現能力を扱うための関係誘導行列層アライメント、 (iii) タスク知識のアンタングルメント機構の交替による局所モデルパラメータの共有および特定知識の分離。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:53:18 GMT)
Exploiting Synergistic Cognitive Biases to Bypass Safety in LLMs [25.2] 大きな言語モデル(LLM)は、幅広いタスクにまたがる印象的な能力を示しているが、その安全性メカニズムは敵の攻撃の影響を受けやすいままである。
我々は,認知バイアスと統合認知バイアスの両方を体系的に活用する新しいフレームワークであるCognitiveAttackを提案する。
実験の結果、特にオープンソースモデルにおいて、30の多様なLSMにまたがる重大な脆弱性が明らかになった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:40:53 GMT)
Synchronization of mean-field models on the circle [24.8] 本稿では、状態空間が単位円である相互作用粒子の平均場モデルについて考察する。
大域的同期は、任意の初期状態から始まった後、全ての粒子が円上の共通点に合体するとされる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:31:57 GMT)
Differential Contrastive Training for Gaze Estimation [24.5] CLIPの助けを借りて視線推定性能を向上させる新しい微分コントラスト訓練戦略を提案する。
視覚的外観認識ブランチとセマンティック微分認識ブランチからなる微分コントラストゲイズ推定ネットワーク(DCGaze)を導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:01:41 GMT)
Learning from Heterogeneous Structural MRI via Collaborative Domain Adaptation for Late-Life Depression Assessment [24.3] T1強調MRIを用いたLDD検出のための協調的ドメイン適応フレームワークを提案する。
このフレームワークは、ラベル付きソースデータに対する教師付きトレーニング、自己教師付きターゲット特徴適応、ラベルなしターゲットデータに対する協調トレーニングの3段階で構成されている。
マルチサイトT1強調MRIデータを用いて行った実験により、このフレームワークは最先端の非教師なし領域適応法より一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 01:38:32 GMT)
Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization [24.2] DecisionFocused by Supervised Learningは、ロバストなポートフォリオ最適化のためのフレームワークである。
DSLはDeep Ensembleメソッドを使用し、ポートフォリオ割り当てのばらつきを大幅に低減します。
アンサンブルサイズが大きくなると、中央値のリターンが向上し、リスク調整性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 23:25:16 GMT)
Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers [24.2] コンペティティブ・ポクモン・シングルズ (Competitive Pok'emon Singles, CPS) は、プレイヤーが不完全な情報に基づいて相手を悪用することを学ぶ人気戦略ゲームである。
観察者の3人称視点から保存したログからエージェントの1人称視点を再構築するパイプラインを開発する。
このデータセットは、入力軌跡のみに基づいて相手に適応するように、大規模なシーケンスモデルをトレーニングするブラックボックスアプローチを可能にする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:33:22 GMT)
MAVFlow: Preserving Paralinguistic Elements with Conditional Flow Matching for Zero-Shot AV2AV Multilingual Translation [23.9] 条件付きフローマッチング(CFM)ゼロショットオーディオ・ヴィジュアルを提案する。
CFMを用いたマルチモーダルガイダンスを利用することで、話者固有の特徴を頑健に保存し、ゼロショットAV2AV翻訳能力を向上する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:08:14 GMT)
Neutral Residues: Revisiting Adapters for Model Extension [23.9] 我々は、事前訓練済みの大規模言語モデルをトレーニング中に見られなかった新しいドメインに拡張する問題に対処する。
ファインチューニングやローランク適応(LoRA)といった標準技術はドメイン適応では成功したが、公式にはモデルにキャパシティを追加することはない。
ニュートラル残基は、新しい言語を学ぶことと、英語を忘れないこととのトレードオフの観点から、微調整、LoRA、バニラアダプターといった競合するアプローチを著しく上回った。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:07:24 GMT)
On the algebraic degree stability of vectorial Boolean functions when restricted to affine subspaces [23.7] 入力がそれらの領域のアフィン部分空間に制限されているとき、ベクトルブール関数の次数の振る舞いについて検討する。
この動作は特に暗号アプリケーションで興味深い。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:19:31 GMT)
MetaAgent: Automatically Constructing Multi-Agent Systems Based on Finite State Machines [23.4] 本稿では,マルチエージェントシステムの自動生成が可能な有限状態マシンベースのフレームワークを提案する。
タスク記述を前提として、MetaAgentはマルチエージェントシステムを設計し、最適化アルゴリズムによってそれを洗練する。
マルチエージェントシステムがデプロイされると、有限状態マシンがエージェントのアクションと状態遷移を制御する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:22:30 GMT)
C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring Challenges in Complex Conversations [23.1] 音声対話モデル(SDM)は近年,ユーザの音声クエリに直接音声応答を生成する能力に注目が集まっている。
人間の音声相互作用は、音声対話特有の特徴のため、本質的にテキストよりも複雑である。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:56:23 GMT)
Federated Distributionally Robust Optimization with Non-Convex Objectives: Algorithm and Analysis [21.9] Asynchronous Single-looP alternatIve gRadient projEction という非同期分散アルゴリズムを提案する。
新しい不確実性集合、すなわち制約付きD-ノルムの不確実性集合は、以前の分布を利用し、強靭性の度合いを柔軟に制御するために開発される。
実世界のデータセットに関する実証研究は、提案手法が高速収束を達成できるだけでなく、悪意のある攻撃だけでなく、データに対する堅牢性も維持できることを示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:22:46 GMT)
Graph-Guided Dual-Level Augmentation for 3D Scene Segmentation [21.6] 3Dポイントクラウドセグメンテーションは、シーン内の個々のポイントにセマンティックラベルを割り当てることを目的としている。
既存の手法では、大規模なアノテーションの負担を軽減するためにデータ拡張を採用するのが一般的である。
本稿では,現実的な3次元シーン合成のための2レベル制約付きグラフ誘導型データ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:25:36 GMT)
A Survey on Large Language Model Acceleration based on KV Cache Management [21.5] 大規模言語モデル(LLM)は、自然言語処理、コンピュータビジョン、マルチモーダルタスクなど、幅広い領域に革命をもたらした。
LLMの計算とメモリ要求は、それらを現実世界、長期コンテキスト、リアルタイムアプリケーションにスケールする際に大きな課題を生じさせる。
このサーベイは、LLMアクセラレーションのためのKVキャッシュ管理戦略を包括的に概観し、トークンレベル、モデルレベル、システムレベルの最適化に分類する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:24:46 GMT)
What is an "Abstract Reasoner"? Revisiting Experiments and Arguments about Large Language Models [21.3] 入力符号化のためのパラメータの小さなサブセットをチューニングしても、ほぼ完璧な性能が得られることを示す。
我々は、この経験的な結果の収集を、それが「抽象的推論者」を意味するかについての議論を再開する(再)招待として捉えている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:04:19 GMT)
Beyond Natural Language Plans: Structure-Aware Planning for Query-Focused Table Summarization [21.1] 本稿では,従来のマルチエージェントシステムにおけるフォーマリズムにインスパイアされた新しい構造化プランTaSoFと,3段階の推論プロセスを形式化するフレームワークSPaGeを紹介する。
3つの公開ベンチマークの実験では、SPaGeはシングルテーブルとマルチテーブルの両方で、従来モデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:42:19 GMT)
What is Beneath Misogyny: Misogynous Memes Classification and Explanation [20.8] そこで本研究では,ミーム中の擬似的内容を検出し,分類し,説明するための新しいアプローチを提案する。
textitnamely, textittextbfMM-Misogyny はテキストと画像のモダリティを別々に処理する。
このモデルはミソジニーを検知し分類するだけでなく、ミソジニーが生命の領域でどのように機能するかを詳細に理解する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:38:53 GMT)
PersonaTwin: A Multi-Tier Prompt Conditioning Framework for Generating and Evaluating Personalized Digital Twins [20.8] 本稿では,適応型ディジタルツインを構築する多層プロンプトコンディショニングフレームワークであるPersonaTwinを紹介する。
8500人以上の医療状況における包括的データセットを用いて、PersonaTwinを標準LLM出力に対してベンチマークする。
実験結果から,本フレームワークは設定と同等のシミュレーション忠実度が得られることがわかった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:57:30 GMT)
SteerX: Creating Any Camera-Free 3D and 4D Scenes with Geometric Steering [20.3] SteerXは、シーン再構成を生成プロセスに統合するゼロショット推論時ステアリング手法である。
ポーズフリーフィードフォワードシーン再構成モデルを用いて、3D/4Dシーン生成のための幾何学的報酬関数を2つ導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:50:19 GMT)
FineMedLM-o1: Enhancing Medical Knowledge Reasoning Ability of LLM from Supervised Fine-Tuning to Test-Time Training [20.3] FineMedLM-o1は、深い推論能力を持つ医療用大規模言語モデルである。
テストタイムトレーニング(TTT)を初めて医療領域に導入し、ドメイン適応を容易にし、信頼性と正確な推論を確実にする。
プロジェクトとデータはGitHubでリリースされる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:05:40 GMT)
What Are They Talking About? A Benchmark of Knowledge-Grounded Discussion Summarization [19.6] 本稿では、文脈の補足的背景を要約する新しいタスクであるKGDS(Knowledge-Grounded Discussion Summarization)を紹介する。
また、細粒度かつ解釈可能なメトリクスを持つ新しい階層的評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:18:59 GMT)
TartanGround: A Large-Scale Dataset for Ground Robot Perception and Navigation [19.5] TartanGroundは、地上ロボットの認識と自律性を向上する大規模なマルチモーダルデータセットである。
我々は70の環境にまたがって910の軌道を集め、150万のサンプルを得た。
TartanGroundは、幅広い学習ベースのタスクのトレーニングと評価のためのテストベッドとして機能する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:43:00 GMT)
Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning [19.3] In-context Learning (ICL)は、大規模言語モデル(LLM)の重要な新興能力である。
本稿では,ICLの新たな位置バイアスを初めて明らかにした。
我々は,デモの位置,システムプロンプト,ユーザメッセージが変化すると,予測と精度が劇的に低下するのを観察する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:59:46 GMT)
Cross-Border Legal Adaptation of Autonomous Vehicle Design based on Logic and Non-monotonic Reasoning [19.1] 我々は設計者の視点から選択し、設計プロセスにおける法的推論を支援することを試みる。
議論理論に基づいて、議論に基づく実践的(規範的)推論の基本的性質を表現する論理を導入する。
私たちが提供している推論システムは、自動運転車のクロスボーダー応用において、設計者がより柔軟に設計ソリューションを適用するのにどのように役立つかを示します。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:24:15 GMT)
HRVVS: A High-resolution Video Vasculature Segmentation Network via Hierarchical Autoregressive Residual Priors [19.0] 手術ビデオにおける肝血管の分節化は臨床的に重要な意味を持つ。
本稿では,HRVVSと呼ばれる新しい高分解能ビデオ血管セグメンテーションネットワークを提案する。
提案するHRVVSは最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:57:38 GMT)
Beyond Single Labels: Improving Conversational Recommendation through LLM-Powered Data Augmentation [18.0] 会話レコメンデータシステム(CRS)は,マルチターン対話でユーザを惹きつけることによって,推薦品質を高める。
CRSは誤ったネガティブな問題に直面することが多く、トレーニング中にユーザーが好むアイテムが誤ってネガティブにラベル付けされているため、準最適リコメンデーションに繋がる。
本稿では,LLMに基づくセマンティックレトリバーを利用して,多種多様な意味的関連項目を識別する新しいデータ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:20:54 GMT)
MoCHA: Advanced Vision-Language Reasoning with MoE Connector and Hierarchical Group Attention [18.0] 視覚大言語モデル(VLLM)は、高度な視覚エンコーダを導入し、視覚モデルをスケールアップすることによって、複雑できめ細かな視覚情報を扱うことに重点を置いている。
本研究では,これらの問題に対処する新しい視覚的枠組みであるMoCHAを提案する。
我々のフレームワークは、4つの視覚バックボーン(CLIP、SigLIP、DINOv2、ConvNeXt)を統合して補完的な視覚的特徴を抽出し、疎密なMixture of Experts Connectors (MoECs)モジュールを備えている。
MoECsモジュールで符号化された視覚情報の冗長性や不十分性を軽減するため、我々は、
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:15:22 GMT)
Towards the Law of Capacity Gap in Distilling Language Models [17.9] 言語モデル (LM) 蒸留は、大きな教師のLMにおける知識を小学生に蒸留することを目的としている。
LM蒸留に直面する重要な問題として、上級生はより大きな生徒ではなく比較的小規模な教師から生じることが多い。
本稿では, 広い範囲の3B LMを蒸留するための予備研究から得られた容量ギャップのテクスチャを提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:00:53 GMT)
Decoding Neural Signatures of Semantic Evaluations in Depression and Suicidality [17.7] 臨床うつ病と自殺の程度が異なる人における情緒的意味処理の基礎となる神経動態について検討した。
うつ病や自殺歴のある人は、早期発症、長期化、振幅復号反応の増大が見られた。
以上より,臨床群では情緒的時間的内容から感受性や重症度が変化したことが示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 00:58:51 GMT)
On the Complexity of Finding Stationary Points in Nonconvex Simple Bilevel Optimization [16.7] 動的勾配の簡単な実装可能な変種は、単純な双レベル問題を効果的に解くことができることを示す。
これは、一般の非単純二段階問題において、両レベルの合同局を保証する最初の結果時間アルゴリズムである。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 23:10:29 GMT)
FAST: An Optimization Framework for Fast Additive Segmentation in Transparent ML [16.6] 高速加法セグメンテーションのための最適化フレームワークであるFASTを提案する。
FASTセグメントは、データセットの各機能に対して、断片的に一定の形状関数を分割して、透過的な加算モデルを生成する。
FASTは加法モデルの計算効率と解釈性を向上することを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:11:56 GMT)
Uncovering the Fragility of Trustworthy LLMs through Chinese Textual Ambiguity [16.1] 中国語の曖昧な物語文に遭遇した大言語モデル(LLM)の信頼性について検討する。
我々は、文脈とそれに対応するあいまいなペアであいまいな文を収集し、生成することで、ベンチマークデータセットを作成しました。
あいまいさに対処する際, LLMに顕著な脆弱性がみられ, ヒトとは大きく異なる挙動がみられた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:50:19 GMT)
Learning to Prune Branches in Modern Tree-Fruit Orchards [16.0] ロボットプルーニングのためのクローズドループビジュモータコントローラを提案する。
コントローラは、カッターを散らばったツリー環境を案内して所定のカットポイントに達する。
我々は,枝の幾何学的分布を捉える新しい果樹園シミュレーションを用いて,コントローラを訓練する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:24:20 GMT)
HQ-CLIP: Leveraging Large Vision-Language Models to Create High-Quality Image-Text Datasets and CLIP Models [15.9] 画像とテキストのペアデータの品質を向上させるために,LVLM駆動型データ精錬パイプラインを導入する。
否定的な記述と短いタグを組み込むことで、従来のコントラスト学習を拡張する訓練パラダイムを提案する。
提案手法は, ゼロショット分類, クロスモーダル検索, きめ細かな視覚理解タスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:21:36 GMT)
ASP-FZN: A Translation-based Constraint Answer Set Solver [15.8] 制約Answer Set Programming (CASP) のための解法 asp-fzn を提案する。
我々の解法は線形制約の豊富な言語をサポートしており、これにはいくつかの共通な大域的制約が含まれる。
Asp-fznは、過去のASPコンペティションから取得したベンチマークにおいて、最先端のASPソルバと競合していることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:36:40 GMT)
Pre-trained Models Perform the Best When Token Distributions Follow Zipf's Law [15.8] Zipfの法則を用いてトークンの周波数分布を分析し,語彙サイズを決定する手法を提案する。
ダウンストリームタスク性能は、トークン分布がいかにパワー-ローな振る舞いに追従するかと相関し、Zipfianスケーリングとの整合がモデル効率と有効性の両方を改善することを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:16:23 GMT)
TopoLiDM: Topology-Aware LiDAR Diffusion Models for Interpretable and Realistic LiDAR Point Cloud Generation [15.2] TopoLiDMは、高忠実度LiDAR生成のためのトポロジカル正規化の下で、グラフニューラルネットワークと拡散モデルを統合する新しいフレームワークである。
我々のアプローチはまず、グラフ構造と複数のグラフ畳み込み層によって潜在グラフ表現を抽出するために、位相保存型VAEを訓練する。
KITTI-360データセットの大規模な実験は、最先端の手法よりもTopoLiDMの方が優れていることを示している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:02:42 GMT)
A Dual-Feature Extractor Framework for Accurate Back Depth and Spine Morphology Estimation from Monocular RGB Images [15.2] 本研究では,未着衣の奥行き情報を正確に推定する新しいパイプラインを提案する。
次に、深度情報と表面情報を統合することにより、脊椎形態を推定する。
この統合されたアプローチは、スピンの曲線生成の精度を高め、最高97%の性能を達成する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:55:37 GMT)
ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge [14.6] この研究は化学の特定の分野に焦点をあて、ケミカル・リアソナー LLM, ChemDFM-R を開発した。
まず、原子化知識点の包括的データセットを構築し、モデルの基本原理と化学の論理構造に対する理解を深める。
多様な化学ベンチマークの実験により、ChemDFM-Rは、解釈可能で合理的な出力を提供しながら、最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:23:58 GMT)
SAEL: Leveraging Large Language Models with Adaptive Mixture-of-Experts for Smart Contract Vulnerability Detection [14.6] スマートコントラクト脆弱性検出のためのLLMベースのフレームワークであるSAELを提案する。
まず、脆弱性を特定し、説明を生成するためにLSMを誘導するプロンプトを設計する。
次に、CodeT5とT5のプロンプトチューニングをコントラクトコードと説明処理に適用し、タスク固有のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:28:00 GMT)
UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding [14.4] UI-AGILEはGUIエージェントをトレーニング段階と推論段階の両方で強化する包括的フレームワークである。
トレーニングでは,Supervised Fine-Tuningプロセスの一連の改善を提案する。
本稿では,高解像度ディスプレイのグラウンド化精度を劇的に向上させる新しい手法であるDecomposed Grounding with Selectionを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:17:53 GMT)
Year-over-Year Developments in Financial Fraud Detection via Deep Learning: A Systematic Literature Review [14.4] 本稿では,金融不正検出のためのディープラーニング(DL)技術の進歩を体系的にレビューする。
このレビューでは、クレジットカード取引、保険請求、財務諸表監査など、さまざまな分野にわたるディープラーニングモデルの有効性を強調している。
この研究は、不均衡データセット、モデル解釈可能性、倫理的考察などの課題を強調している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:32:58 GMT)
Anti-Inpainting: A Proactive Defense Approach against Malicious Diffusion-based Inpainters under Unknown Conditions [14.3] アンチ・インペインティング(英: anti-Inpainting)は、3つの新しいモジュールからなる保護を達成するプロアクティブ・ディフェンス・アプローチである。
まず,拡散復調過程から複雑な特徴を抽出する多層深層特徴抽出器を提案する。
次に, 対向摂動の伝達性を高めるため, マルチスケールな意味保存データ拡張手法を設計する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:40:12 GMT)
ETrace:Event-Driven Vulnerability Detection in Smart Contracts via LLM-Based Trace Analysis [14.2] 本稿では,スマートコントラクトのためのイベント駆動型脆弱性検出フレームワークETraceを紹介する。
トランザクションログからきめ細かいイベントシーケンスを抽出することで、フレームワークは適応的なセマンティックインタプリタとしてLarge Language Models (LLM)を活用する。
ETraceはパターンマッチングを実装して、トランザクションの動作パターンと既知の攻撃行動の間に因果関係を確立する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:32:19 GMT)
TurboReg: TurboClique for Robust and Efficient Point Cloud Registration [13.8] TurboRegは、新しい軽量cliqueであるTurboCliqueと、高度に並列化可能なPivot-Guided Search (PGS)アルゴリズムに基づいて構築されている。
実験によると、TurboRegは複数の実世界のデータセットで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 01:44:10 GMT)
Gain on ground state of quantum system for truly $\mathcal{PT}$ symmetry [13.8] 真の$mathcalPT$-対称量子系の場合、従来の非エルミート的ハミルトニアンは$H = H_rm Drive -igamma|1ranglelangle1| + igamma|0ranglelangle0|$である。
すべての軌道を平均化した後、基底状態$|0rangle$$+igamma|0ranglelangle0|$) で有効利得を達成する方法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:47:50 GMT)
ComicsPAP: understanding comic strips by picking the correct panel [13.8] ComicsPAPは、コミックストリップ理解のために設計された大規模なベンチマークである。
評価の結果,現状のLMMはこれらのタスクにほぼ近い確率で実行可能であることがわかった。
漫画のストリップ理解にLMMを適用し,ComicsPAPの10倍のモデルよりも優れた結果を得た。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:19:59 GMT)
LLM-Crowdsourced: A Benchmark-Free Paradigm for Mutual Evaluation of Large Language Models [13.7] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示す。
既存の評価手法は、データ汚染、ブラックボックス操作、主観的嗜好といった問題に悩まされている。
我々は,新しいベンチマークフリー評価パラダイム LLM-Crowdsourced を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:50:46 GMT)
Towards Federated Learning with On-device Training and Communication in 8-bit Floating Point [13.7] 近年の研究では、8ビット浮動小数点(FP8)がニューラルネットワークの効率的なトレーニングに利用できることが示されている。
グローバルなFP32サーバモデルを維持しながらFP8クライアントトレーニングを組み合わせる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:45:50 GMT)
LCS: An AI-based Low-Complexity Scaler for Power-Efficient Super-Resolution of Game Content [13.4] 現代のゲームにおけるコンテンツレンダリングの複雑さは、GPUのワークロードの問題を招いた。
ニューラルプロセッシングユニット(NPU)のような低消費電力デバイスにGPU上のワークロードをオフロードできる、最先端の高効率超解像(ESR)モデルにインスパイアされたAIベースの低複雑性スケーラ(LCS)を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:47:25 GMT)
AI Governance InternationaL Evaluation Index (AGILE Index) 2025 [13.4] AI Governance InternationaL Evaluation Index(AGILE Index)プロジェクトは2023年に開始された。
AGILE指数2025は、科学的厳密さと実用的な適応性とのバランスを改善するために、体系的な改善を取り入れている。
AGILE指数2025は、所得水準、地域、技術開発段階の40か国を評価している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:35:02 GMT)
Towards Interpretable Renal Health Decline Forecasting via Multi-LMM Collaborative Reasoning Framework [12.7] 本稿では,eGFR予測のためのオープンソースのLMMの性能向上を目的とした協調的フレームワークを提案する。
視覚的知識伝達、帰納的推論、および予測精度と解釈可能性を高めるための短期記憶機構が組み込まれている。
我々の手法は、予測精度と臨床的に根拠付けられた解釈可能性を組み合わせた医療用AIシステムの構築に新たな光を当てている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:11:06 GMT)
R2-KG: General-Purpose Dual-Agent Framework for Reliable Reasoning on Knowledge Graphs [12.5] R2-KGは、推論を2つの役割に分けるプラグイン・アンド・プレイのフレームワークである。
以上の結果から,R2-KGはKGベースの推論のための柔軟性とコスト効率のよい解であることがわかった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:04:25 GMT)
LOTS of Fashion! Multi-Conditioning for Image Generation via Sketch-Text Pairing [12.3] ファッション画像生成のためのLOTS(LOcalized Text and Sketch for fashion image generation)を提案する。
LOTSは、ペア化されたローカライズドスケッチ+テキスト情報の条件付けによるグローバルな記述を活用し、拡散適応のための新しいステップベースのマージ戦略を導入する。
提案手法を検証するため,Fashionpedia上に構築したSketchyは,画像毎に複数のテキスト-スケッチペアが提供される最初のファッションデータセットである。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:48:29 GMT)
zERExtractor:An Automated Platform for Enzyme-Catalyzed Reaction Data Extraction from Scientific Literature [12.1] zERExtractorは、酵素触媒による反応と活性データを科学文献から総合的に抽出する自動化プラットフォームである。
我々のパイプラインは、ドメイン適応型ディープラーニング、高度なOCR、セマンティックエンティティ認識、およびプロンプト駆動LLMモジュールを組み合わせる。
270のP450関連酵素学論文から1,000以上の注釈付きテーブルと5,000の生物学的フィールドからなる大規模なベンチマークデータセットを作成した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:21:32 GMT)
Systematic Evaluation of Knowledge Graph Repair with Large Language Models [12.1] 形状制約言語(SHACL)で定義された制約違反に関して,知識グラフ修復の品質を評価するための体系的アプローチを提案する。
提案手法は, 違反誘発動作(VIO)と呼ばれる新しい機構を用いて, 違反を系統的に発生させることにより, このギャップに対処する。
その結果、関連するSHACL制約を含む簡潔なプロンプトと、知識グラフからの重要な文脈情報の両方が、最高の性能をもたらすことが示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:46:30 GMT)
Insights into resource utilization of code small language models serving with runtime engines and execution providers [12.0] 言語モデルの急速な成長、特にコード生成は、かなりの計算資源を必要とする。
小言語モデル(SLM)は、リソース要求を減らすための有望なソリューションを提供する。
私たちの目標は、ランタイムエンジンと実行プロバイダの組み合わせとして定義されたディープラーニングサービス構成がリソース利用に与える影響を分析することです。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:44:18 GMT)
I2VControl: Disentangled and Unified Video Motion Synthesis Control [11.8] 論理的矛盾を克服するために,不整合で統一されたフレームワーク,すなわちI2VControlを提案する。
私たちは、カメラコントロール、オブジェクトドラッグ、モーションブラシを再考し、すべてのタスクを一貫した表現に再構成します。
我々は広範囲な実験を行い、様々な制御タスクにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:27:47 GMT)
SMART-Editor: A Multi-Agent Framework for Human-Like Design Editing with Structural Integrity [11.8] SMART-Editorは、構造化(ポスター、ウェブサイト)と非構造化(自然画像)ドメイン間で構成レイアウトとコンテンツ編集を行うフレームワークである。
ローカル編集を行う従来のモデルとは異なり、SMART-Editorは2つの戦略によりグローバルコヒーレンスを保存する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:52:34 GMT)
Exploring the Frontier of Vision-Language Models: A Survey of Current Methodologies and Future Directions [11.8] VLM(Vision-Language Models)は、画像キャプションや視覚的質問応答といった複雑なタスクに対処できる高度なモデルである。
我々の分類では、VLMを視覚言語理解専用のモデル、マルチモーダル入力を処理するモデル、マルチモーダル入力とアウトプットの両方を受け付け、生成するモデルという3つのカテゴリに分類する。
我々は各モデルを慎重に識別し、基礎となるアーキテクチャ、データソースのトレーニング、および可能な限りの強度と限界を広範囲に分析する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:37:10 GMT)
Equivariant Flow Matching for Point Cloud Assembly [11.6] ポイント・クラウド・アセンブリの目標は、複数のポイント・クラウド・ピースを並べ合わせることで完全な3D形状を再構築することである。
本研究は,フローマッチングモデルに基づく組立タスクのための新しい同変解法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:55:45 GMT)
AdapSCA-PSO: An Adaptive Localization Algorithm with AI-Based Hybrid SCA-PSO for IoT WSNs [11.5] 本稿では,ハイブリッドメタヒューリスティックローカライゼーションアルゴリズムを提案する。
グローバル検索に有効なSine Cosine Algorithm(SCA)とローカル検索に優れたParticle Swarm Optimization(PSO)を統合する。
シミュレーションの結果、スタンドアロンのPSOと最適化されていないSCAPSOアルゴリズムと比較して、提案手法は必要なイテレーション数を大幅に削減し、平均的なローカライゼーション誤差を84.97%削減することを示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 01:18:54 GMT)
Noise-Coded Illumination for Forensic and Photometric Video Analysis [11.5] シーンの照明に非常に微妙なノイズのような変調を組み込むことによって、この利点に対処できることを示す。
提案手法は,符号化照明下で記録されたビデオに時間的透かしを効果的に追加する。
敵が我々の技術が使われていることを知っていても、解読可能なコード化されたフェイクビデオを作ることで、元の敵対的コンテンツ生成問題の第二の、より難しいバージョンを解決できることが示される。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:08:34 GMT)
Koopman-Based Generalization of Deep Reinforcement Learning With Application to Wireless Communications [11.5] 深層強化学習(Deep Reinforcement Learning, DRL)は、無線通信を含む様々な科学・工学分野の進歩を推進する機械学習技術である。
DRLでは、トレーニングデータは逐次的であり、独立ではなく、同一に分散している(つまり、従来の情報理論の手法は一般化可能性解析には適さない)。
本稿では,DRLの一般化性を評価するための新しい解析手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:19:42 GMT)
Opportunities and Challenges of LLMs in Education: An NLP Perspective [11.4] 大規模言語モデルが2つの主要な応用シナリオの文脈における教育的NLPに与える影響について検討する。
次に、LLMが実現した新たな方向性と、対処すべき重要な課題を提示する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:12:12 GMT)
An accuracy-runtime trade-off comparison of scalable Gaussian process approximations for spatial data [11.1] 我々は,確率評価,パラメータ推定,予測に関する異なるガウス過程近似の精度を体系的に比較した。
ほぼ全ての実験において、ヴェッキア近似は最も正確なものとして一貫して現れる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:49:23 GMT)
Joint Estimation of a Two-Phase Spin Rotation beyond Classical Limit [11.1] 多様なアプリケーションシナリオでは、1つ以上のパラメータを推定する必要があることが多い。
原子ボース-アインシュタイン凝縮体におけるスピン・ネマティック・スクイーズを用いた2つの軸まわりの同時スピン回転の量子エンハンスな測定を報告する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:25:41 GMT)
Robust and Efficient 3D Gaussian Splatting for Urban Scene Reconstruction [10.9] 本稿では,都市景観の高速な再構築とリアルタイムレンダリングを実現するフレームワークを提案する。
提案手法は,都市規模のシーンを効果的に再構築し,効率と品質の両面で従来の手法より優れている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:11:55 GMT)
Graph Sampling for Scalable and Expressive Graph Neural Networks on Homophilic Graphs [10.9] グラフニューラルネットワーク(GNN)は多くのグラフ機械学習タスクに優れるが、大規模ネットワークへのスケーリングでは課題に直面している。
グラフ構造を保存するために特徴ホモフィリーを利用する新しいグラフサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:23:43 GMT)
Privacy-Preserving Federated Learning Scheme with Mitigating Model Poisoning Attacks: Vulnerabilities and Countermeasures [10.9] 本稿では,プライバシー保護とビザンチン・ロバスト・フェデレーション・ラーニング・スキームの強化を提案する。
本手法は, モデル中毒に対するプライバシー保護とレジリエンスを保証する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:10:41 GMT)
FGFP: A Fractional Gaussian Filter and Pruning for Deep Neural Networks Compression [10.9] 分数次微分計算とガウス関数を統合した分数次ガウスフィルタおよびプルーニングフレームワークを提案する。
様々なアーキテクチャとベンチマークの実験により、FGFPフレームワークは、最近の精度と圧縮の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:56:18 GMT)
Hamiltonian Expressibility for Ansatz Selection in Variational Quantum Algorithms [10.8] ハミルトニアン表現性は、ハミルトニアン基底状態探索問題に関連するエネルギー景観を均一に探索する回路の能力を定量化する指標として導入された。
我々は、モンテカルロに基づくアプローチを用いて、様々なハミルトニアンに適用された、よく定義された回路のハミルトン表現可能性について推定する。
次に,変分量子固有解法(VQE)を用いて各アンザッツを訓練し,解の質と表現性の関係を解析する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:23:54 GMT)
AutoCodeSherpa: Symbolic Explanations in AI Coding Agents [10.7] 大きな言語モデル(LLM)エージェントは、特定のタスクを達成するために、1つ以上のLLMの上に外部ツールを自律的に使用する。
近年,ソフトウェア工学タスクのLLMエージェントが普及している。
これはAutoCodeRoverやSpecRoverといった、プログラムの自動修復を実行する既存のエージェントAIソリューションによって実証されている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:34:02 GMT)
Human-in-the-Loop Local Corrections of 3D Scene Layouts via Infilling [10.1] 我々は,エゴセントリックな視点から人間からのフィードバックを用いた3次元シーンレイアウトを推定するための,新しい人間-イン・ザ・ループアプローチを提案する。
本研究では,新しい局所修正タスクを導入し,ユーザが局所的誤りを識別し,モデルに自動的に修正を促す手法を提案する。
本システムでは,最終改良レイアウトをトレーニング分布から切り離し,複雑なレイアウトのより正確なモデリングを可能にする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:34:42 GMT)
UFV-Splatter: Pose-Free Feed-Forward 3D Gaussian Splatting Adapted to Unfavorable Views [10.0] フィードフォワードをトレーニングするための一般的なレンダリング設定は、世界の起源に3Dオブジェクトを配置し、原点に向かって向けられたカメラからレンダリングする。
本稿では、事前訓練されたポーズなしフィードフォワード3DGSモデルで好ましくないビューを処理できる新しい適応フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:56:47 GMT)
Automatically discovering heuristics in a complex SAT solver with large language models [10.0] SAT(Satisfiability problem)は、幅広い産業応用における計算複雑性の基盤である。
現代のSATソルバは手動による制約付き検索スペースに依存し、限られた性能向上をもたらす。
本研究は,Large Language Models (LLM) を用いた複雑なSATソルバを効果的に最適化する新しいパラダイムを導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:52:25 GMT)
A Segmentation Framework for Accurate Diagnosis of Amyloid Positivity without Structural Images [9.4] 本研究では,ポジトロン・エミッション・トモグラフィ(PET)画像のみを用いて,脳領域の自動セグメンテーションのためのディープラーニングベースのフレームワークを提案する。
4層の深さを持つ3次元U-Netアーキテクチャを200個のF18-ベタピルアミロイドPETスキャンでトレーニングし、検証した。
このモデルでは,アミロイドの定量値に基づいて,アミロイドの比重0.98の分類精度を達成した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:44:16 GMT)
Accessibility and Social Inclusivity: A Literature Review of Music Technology for Blind and Low Vision People [9.4] 本稿では,視覚障害者を対象とした音楽技術の体系的な文献レビューを行う。
本研究は,技術の種類とBLV関係者の関与範囲に基づいて,既存の研究を分類する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:02:37 GMT)
Multilingual Political Views of Large Language Models: Identification and Steering [9.3] 大規模言語モデル(LLM)は、日々のツールやアプリケーションでますます使われており、政治的見解への潜在的な影響に対する懸念が高まっている。
政治コンパステスト(Political Compass Test)を用いて,14言語にまたがる7つのモデルの評価を行った。
以上の結果から,より大きなモデルがリバタリアンと左の位置に一貫して移行し,言語やモデルファミリに有意な変化が認められた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:42:35 GMT)
Language Arithmetics: Towards Systematic Language Neuron Identification and Manipulation [9.3] Llama-3.1-8B, Mistral-Nemo-12B, Aya-Expanse-8B & 32B の言語特異的ニューロンを21言語で解析した。
これらのニューロンはより深い層に集結し、非ラテン語のスクリプトはより高度な特殊化を示す。
不要な言語を非活性化し、望ましい言語をアクティベートし、より単純な代替アプローチよりも優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:23:39 GMT)
Metamorphic Testing of Deep Code Models: A Systematic Literature Review [9.1] コードインテリジェンス用に設計された大規模言語モデルとディープラーニングモデルは、ソフトウェア工学分野に革命をもたらした。
これらのモデルは、コード補完、欠陥検出、コード要約といったタスクにおいて、高い精度でソースコードとソフトウェアアーチファクトを処理できる。
強靭性は、異なる条件下で異なる結果が得られるため、ディープ・コード・モデルにとって重要な品質特性であり続けている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:25:30 GMT)
The Search for Stability: Learning Dynamics of Strategic Publishers with Initial Documents [9.1] 本稿では,戦略出版社が検索エンジンで最初にランク付けされる確率を最大化するゲーム理論情報検索モデルについて検討する。
一般に使用されている確率ランク付け原理(PRP)ランキングスキームは,ゲームが純粋なナッシュ均衡に達するのにしばしば失敗する不安定な環境をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:26:45 GMT)
Towards interactive evaluations for interaction harms in human-AI systems [9.0] 我々は,テキストインタラクションの害に着目したテキストインタラクション倫理に基づく評価へのシフトを提案する。
まず,(1)静的,(2)普遍的なユーザエクスペリエンスを仮定し,(3)構成妥当性を限定した現状評価手法の限界について議論する。
インタラクティブな評価を設計するための実践的原則として, 生態学的に有効な相互作用シナリオ, ヒューマンインパクトメトリクス, 多様な人間参加アプローチなどがあげられる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:35:05 GMT)
Math Natural Language Inference: this should be easy! [8.9] 我々は,現代LLMが数学的テキスト上で自然言語推論タスクを実行できるかどうかを問う。
我々は、既存の数学的テキストから前提となるMath NLIペアのコーパスを構築する。
また,LLM自体による仮説を前提としたコーパスの品質についても検討した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 19:49:04 GMT)
Gems: Group Emotion Profiling Through Multimodal Situational Understanding [8.7] 我々は、感情理解を、きめ細かいグループとイベントレベルの感情を粗くするために、きめ細かい個々の感情を予測するタスクとして捉えている。
本稿では,入力シーン,グループメンバ,コンテキスト情報を処理し,共同予測を生成するマルチモーダルスウィン・トランスフォーマとS3Attentionベースのアーキテクチャを利用するGEMSを紹介する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:28:25 GMT)
Robust Filtering and Learning in State-Space Models: Skewness and Heavy Tails Via Asymmetric Laplace Distribution [8.6] 本稿では,効率的な変分ベイズアルゴリズムと新しい単一ループパラメータ推定手法を提案する。
実験により,提案手法は様々なノイズ設定に対して一貫した頑健な性能を提供することを示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:06:27 GMT)
Heartificial Intelligence: Exploring Empathy in Language Models [8.5] 小さな言語モデルと大きな言語モデルは、認知的共感タスクにおいて人間よりも一貫して優れていた。
認知的強みにもかかわらず、小・大言語モデルともに、人間に比べて感情的共感が有意に低かった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:09:33 GMT)
Moiré Zero: An Efficient and High-Performance Neural Architecture for Moiré Removal [8.5] MZNetは,モアレパターンを効果的に除去し,モアレゼロ状態に画像が近づくように設計されたU字型ネットワークである。
MZNetは高解像度データセットで最先端のパフォーマンスを達成し、低解像度データセットで競合結果を提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:16:35 GMT)
RTMap: Real-Time Recursive Mapping with Change Detection and Localization [8.3] RTMapは、自己進化メモリとして、マルチトラバースHDマップを継続的にクラウドソーシングする。
オンボードエージェントでは、RTMapはエンドツーエンドの方法で、同時に3つのコア課題に対処する。
いくつかの公道自動運転データセットの実験は、事前支援された地図の品質と位置決め精度の両方において、我々の確固たる性能を実証している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:43:16 GMT)
GeoOutageKG: A Multimodal Geospatiotemporal Knowledge Graph for Multiresolution Power Outage Analysis [8.3] 多様なデータソースを統合するマルチモーダル知識グラフGeoOutageKGを提案する。
GeoOutageKGには、2014年から2024年までの1060万件の障害記録、2012年から2024年までの30万件のNTL画像、15,000件の障害マップが含まれている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:54:38 GMT)
Quantum-assisted Gaussian process regression using random Fourier features [8.3] 本稿では,ランダムなフーリエ特徴カーネル近似に基づくガウス過程回帰のための量子支援アルゴリズムを提案する。
従来の手法と比較して,スパースオーダーの計算スピードアップを実現する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:49:53 GMT)
The challenge of hidden gifts in multi-agent reinforcement learning [6.8] 隠れギフトが与える影響について,非常に単純なMARLタスクを用いて検討する。
このタスクでは、グリッドワールド環境内のエージェントは、個々の報酬を得るために、個別のドアをアンロックする。
我々は、MARLアルゴリズムを含むいくつかの最先端RLアルゴリズムが、この単純なタスクにおいて集団報酬を得る方法を学ぶことができないことを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 01:18:05 GMT)
StoryTeller: Improving Long Video Description through Global Audio-Visual Character Identification [6.8] ロングビデオ記述には、一貫した文字識別やプロットレベルの記述など、新しい課題が導入されている。
低レベルな視覚概念と高レベルなプロット情報の両方を取り入れた長編ビデオの濃密な記述を生成するシステムであるStoryTellerを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:47:35 GMT)
Resource-Efficient Adaptation of Large Language Models for Text Embeddings via Prompt Engineering and Contrastive Fine-tuning [6.5] 大規模言語モデル(LLM)は自然言語処理(NLP)の基盤となっている。
プリトレーニングされたデコーダのみのLLMの適応戦略について検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:49:30 GMT)
Git Context Controller: Manage the Context of LLM-based Agents like Git [6.5] 大きな言語モデル(LLM)ベースのエージェントは、内部推論と外部ツールの使用をインターリーブすることによって、印象的な機能を示している。
ソフトウェアバージョン管理システムにインスパイアされた構造化コンテキスト管理フレームワークであるGit-Context-Controller(GCC)を紹介した。
自己複製のケーススタディでは、GCCを増強したエージェントが新しいCLIエージェントをスクラッチから作り、40.7タスクの解決を実現した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:01:45 GMT)
Investigating Hallucination in Conversations for Low Resource Languages [6.4] 大きな言語モデル(LLM)は、人間の文章によく似たテキストを生成するのに顕著な習熟性を示している。
一般に「幻覚」と呼ばれる、事実的に誤った主張をしばしば生み出す。
本研究は,Hindi,Farsi,Mandarinの3言語における会話データに拡張する。
マンダリンでは LLM の幻覚反応は極めて少ないが, ヒンディー語やファルシ語では幻覚反応が著しく多いことが判明した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:39:51 GMT)
MLMC-based Resource Adequacy Assessment with Active Learning Trained Surrogate Models [6.4] マルチレベルモンテカルロ(MLMC)は、信頼性評価を加速するための柔軟で効果的な分散技術である。
データ駆動サロゲートモデルは、複雑な電力システムフレームワークにおいて低レベルモデルとして提案されている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:07:49 GMT)
Relativistic model of spontaneous wave-function localization induced by nonHermitian colored noise [6.4] 本研究では、フェルミオン密度演算子を普遍色雑音に結合したランダムな非エルミタン作用に基づく自然波動関数崩壊のモデルを提案する。
観測可能な宇宙の大きさが大きくなるにつれて減少する雑音による局所化長を解析的に決定する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:35:34 GMT)
Random non-Hermitian Hamiltonian framework for symmetry breaking dynamics [6.4] ヒルベルト空間における量子状態の一般非線形ダイナミクスをモデル化するために、ランダムな非エルミートハミルトニアンを提案する。
本手法は, 線形方程式の線形性に基礎を置き, 線形系解法の適用性を確保する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:27:23 GMT)
Affect Models Have Weak Generalizability to Atypical Speech [6.4] 非定型音声のデータセットにおける音声からのカテゴリー的・次元的影響を認識するためのモデルを評価する。
その結果,影響モデルの出力は音声の非定型性の存在や程度に大きく影響していることがわかった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:02:12 GMT)
Designing for Engaging Communication Between Parents and Young Adult Children Through Shared Music Experiences [6.3] DJ-Famは、親と子供がお気に入りの曲を聴き、会話の出発点として使うことができるモバイルアプリケーションである。
韓国で4週間にわたる7家族の展開調査から,DJ-Famが親子関係に肯定的な影響を及ぼす可能性を示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:34:44 GMT)
Bridging Privacy and Robustness for Trustworthy Machine Learning [6.3] 機械学習システムは、データ摂動や敵の操作に対して本質的に堅牢性を必要とする。
本稿では,局所微分プライバシー(LDP)と最大ベイズプライバシー(MBP)の複雑な理論的関係を体系的に検討する。
我々はこれらのプライバシー概念をアルゴリズム的堅牢性、特に確率的略正(PAC)学習フレームワークにブリッジする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:10:49 GMT)
An Explainable Emotion Alignment Framework for LLM-Empowered Agent in Metaverse Service Ecosystem [6.2] 本稿では,メタバースサービスエコシステムにおけるLCMをベースとしたエージェントの感情アライメントフレームワークを提案する。
LLMベースのエージェントの意思決定ループに事実要因を統合することを目的としており、これらのエージェントに対してより関係性のある事実アライメントを実現する方法を体系的に実証している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:00:26 GMT)
Low-Communication Resilient Distributed Estimation Algorithm Based on Memory Mechanism [6.2] 敵ネットワークでは、未知のパラメータの正確な推定は攻撃されたノードやリンクによって妨げられる。
本稿では,低通信耐性分散推定アルゴリズムを提案する。
シミュレーションの結果,提案アルゴリズムは,他のアルゴリズムに比べて通信コストが低く,優れた性能が得られることが示された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:05:15 GMT)
Shallow quantum circuit for generating O(1)-entangled approximate state designs [6.2] 我々は、非常に低い絡み合い、魔法、コヒーレンスを持ちながら、$epsilon$-approximate state $t$-designとして機能する新しい量子状態の集合を見つける。
これらの資源は理論上の下界である$Omega(log (t/epsilon))$に達することができ、これもこの研究で証明されている。
我々の研究で提案された量子回路のクラスは、ランダムな量子状態の古典的なシミュレーションにコストを削減している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:50:09 GMT)
Efficient Continual Learning for Small Language Models with a Discrete Key-Value Bottleneck [6.1] エンコーダのみの言語モデルのための離散鍵値ボトルネック(DKVB)を導入する。
視覚における離散的なキーバリューのボトルネックにインスパイアされた我々は、新しい、NLP固有の課題について検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:13:27 GMT)
A quantum experiment with joint exogeneity violation [5.5] ランダム化実験では、潜在的な結果の仮定は、通常、エンフィニットな異種性の仮定を伴う。
本稿では、量子実験におけるそのような違反を明らかにし、この仮定を偽造する。
本稿では,実践的,哲学的両面から,潜在的結果モデリングの意義について論じる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:03:41 GMT)
Application of Vision-Language Model to Pedestrians Behavior and Scene Understanding in Autonomous Driving [5.5] 本稿では,大規模視覚言語基礎モデルから効率的な視覚ネットワークへ知識を伝達する知識蒸留法を提案する。
歩行者行動予測やシーン理解タスクに適用し,より多様で包括的なセマンティック属性を生成する上で,有望な結果を達成する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:16:46 GMT)
Linking Actor Behavior to Process Performance Over Time [5.4] 我々は,時系列データ中の関連リンクを特定するために,俳優の行動分析をグランガー因果関係と統合する。
ラッソ群をラッソ群選択に用いて, 因果関係のほとんどを捉えた小さいが一貫した影響のラッソ群を同定した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 19:04:07 GMT)
Multi-Hazard Early Warning Systems for Agriculture with Featural-Temporal Explanations [5.4] 気候の極端には農業へのリスクが増大する。
従来の単一ハザード予測手法は、同時気候事象間の複雑な相互作用を捉えるには不十分である。
本稿では、逐次的なディープラーニングモデルと高度な説明可能な人工知能(XAI)技術を組み合わせて、農業のためのマルチハザード予測フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:16:35 GMT)
Federated Learning on Riemannian Manifolds: A Gradient-Free Projection-Based Approach [5.3] フェデレートラーニング(FL)は、分散クライアント間の協調モデルトレーニングのための強力なパラダイムとして登場した。
既存のFLアルゴリズムは主に、厳密な勾配情報を持つ制約のない最適化問題に重点を置いている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:24:27 GMT)
SmallThinker: A Family of Efficient Large Language Models Natively Trained for Local Deployment [5.1] SmallThinkerは、ローカルデバイス向けに設計された大型言語モデル(LLM)のファミリーである。
本研究では,微細なMixture-of-Experts(MoE)とスパースフィードフォワードネットワークを組み合わせた2レベルスパース構造を提案する。
我々はSmallThinker-4B-A0.6BとSmallThinker-21B-A3Bをリリースした。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:29:40 GMT)
Hybrid Quantum Classical Surrogate for Real Time Inverse Finite Element Modeling in Digital Twins [5.0] 橋、パイプライン、およびオフショアプラットフォームのような大規模な土木構造物は、予期せぬ失敗が経済的・安全的な影響を引き起こす現代のインフラにとって不可欠である。
FEモデリングは、リアルタイム構造健康モニタリング(SHM)に広く用いられているが、その計算コストが高く、逆FE分析の複雑さは、現在進行中の課題である。
本稿では,これらの問題に対処するハイブリッド量子古典多層パーセプトロンフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:09:49 GMT)
Measurement-device-independent quantum key distribution with asymmetric sources [4.9] 計測デバイスに依存しない量子鍵分布(MDI-QKD)は、エンドツーエンドの量子ネットワークの実装において最も有望な技術の一つである。
この研究は、MDI-QKDネットワークを非対称ソースで解析し最適化するための理論的基盤を提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:03:46 GMT)
Mesh based segmentation for automated margin line generation on incisors receiving crown treatment [4.9] 本研究は,ディープラーニングを用いてマージンラインを自動的かつ正確に決定する新しいフレームワークを提案する。
深層学習セグメンテーションモデルをトレーニングするために, 共同歯科実験室によって切歯のデータセットが提供された。
また, 予測された真理境界線と地上の真理境界線との偏差が小さいほど, 準備の質が良くなることを示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:34:45 GMT)
FaceGCD: Generalized Face Discovery via Dynamic Prefix Generation [4.8] 本稿では,新しいオープンワールド顔認識タスクである一般顔発見(GFD)を紹介する。
GFDは、ラベル付きおよびラベルなしの既知のID(ID)の両方を認識すると同時に、新しい未確認IDを同時に発見する必要がある。
軽量なレイヤワイドプレフィックスを用いて,インスタンス固有の特徴抽出器を動的に構築するFaceGCDを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:34:37 GMT)
MergeSAM: Unsupervised change detection of remote sensing images based on the Segment Anything Model [4.8] 本稿では、高解像度リモートセンシング画像のための革新的な教師なし変更検出手法であるMergeSAMを紹介する。
MaskMatchingとMaskSplittingという2つの新しい戦略は、オブジェクト分割、マージ、その他の複雑な変更といった現実世界の複雑さに対処するように設計されている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:37:00 GMT)
LesionGen: A Concept-Guided Diffusion Model for Dermatology Image Synthesis [4.8] 皮膚画像合成のためのT2I-DPMフレームワークであるLesionGenを紹介する。
LesionGenは、専門家のアノテーションと疑似生成された概念誘導レポートから派生した、構造化された、概念に富んだ皮膚学のキャプションに基づいて訓練されている。
以上の結果から, 合成データセットのみにトレーニングされたモデルが, 実画像にトレーニングされたモデルに匹敵する分類精度を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:07:34 GMT)
SmilesT5: Domain-specific pretraining for molecular language models [4.8] 分子特性予測は、薬物の発見と開発においてますます重要な課題である。
自然言語処理の最近の進歩は、複雑な人間の言語を学ぶニューラルネットワークの能力を強調している。
6つの分類に基づく分子特性予測ベンチマークにおいて、ドメイン固有のテキストからテキストへの事前学習タスクを新たに提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:36:18 GMT)
Bridging the Gap in Missing Modalities: Leveraging Knowledge Distillation and Style Matching for Brain Tumor Segmentation [4.7] MST-KDNetは,脳腫瘍の精密かつ確実なセグメンテーションのための新しいモデルである。
本モデルでは,様々な解像度で注意重みを捉えるためのマルチスケールトランスフォーマー知識蒸留,知識伝達を改善するためのデュアルモードロジット蒸留,グローバルスタイルマッチングモジュールを特徴とする。
提案手法は, 極めて堅牢性と一般化の可能性を示し, 現実の臨床応用に有望な候補となる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:46:44 GMT)
A Smoothing Newton Method for Rank-one Matrix Recovery [4.6] 本稿では,ランク1の正の半定行列をランク1の測定値から復元する位相探索問題を考察する。
我々は,厳密な勾配収束を伴う安定な手法を実現するために,目的を正則化する平滑化フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:25:42 GMT)
XAutoLM: Efficient Fine-Tuning of Language Models via Meta-Learning and AutoML [4.6] XAutoLMは、微調整言語モデルのためのメタラーニング拡張されたAutoMLフレームワークである。
XAutoLMは、記憶された成功と失敗から学習し、差別的で生成的なLM微調整パイプラインを効率的に最適化する。
4つのテキスト分類と2つの質問応答ベンチマークにおいて、XAutoLMは6つのタスクのうち5つでゼロショットオプティマイザのピークF1を上回っている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:46:16 GMT)
Approximating the quantum value of an LCS game is RE-hard [4.3] プロジェクションゲームに対するHrastadの長期コードテストの一般化を行う。
完全であり、絡み合ったプローバーに対して健全であることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:43:17 GMT)
Nearest-Better Network for Visualizing and Analyzing Combinatorial Optimization Problems: A Unified Tool [4.3] Nearest-Better Network (NBN) は、連続最適化問題に対するサンプルデータを視覚化する強力な手法である。
本稿では,NBNネットワークがアルゴリズムの最大確率遷移ネットワークとして機能することを示す。
また、時間を要する問題に対処するために、対数線形時間複雑性を持つ効率的なNBNアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:31:58 GMT)
Set Invariance with Probability One for Controlled Diffusion: Score-based Approach [4.1] 制御された拡散と連結で有界なリプシッツ集合が与えられたとき、いつ確率 1 との制御された集合不変性を保証することができるのか?
本研究では, ある対数類似度の勾配の観点から, 同一の条件を導出することにより, この問題に答える。
提案試験における計算はディリクレ境界値の問題を解くことを含み、有限地平線の場合、終点時にターゲット部分集合を打つという追加の制約も考慮できる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:13:31 GMT)
Segment Anything for Video: A Comprehensive Review of Video Object Segmentation and Tracking from Past to Future [4.1] Video Object and Tracking (VOST) はコンピュータビジョンにおいて複雑だが重要な課題である。
伝統的な手法は、領域の一般化、時間的一貫性、計算効率に悩まされてきた。
Segment Anything Model (SAM) のような基礎モデルとその後継であるSAM2は、パラダイムシフトを導入した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:57:02 GMT)
Exploring Textual Semantics Diversity for Image Transmission in Semantic Communication Systems using Visual Language Model [4.0] 本稿では,視覚言語モデル(VLM)を用いて画像意味信号の伝達を支援するマルチテキスト・セマンティック通信システムを提案する。
従来の画像伝達セマンティック通信システムとは異なり、提案システムは画像を複数のブロックに分割し、修正された大言語と視覚アシスタント(LLaVA)を用いて画像から複数のテキスト情報を抽出する。
シミュレーションの結果,提案したテキストセマンティクスの多様性スキームは,関連作品と比較して再現精度を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:45:11 GMT)
Spatial Language Likelihood Grounding Network for Bayesian Fusion of Human-Robot Observations [4.0] 不確実性を認識した融合フレームワークは、人間の入力の不確実性を表す基礎的な可能性を必要とする。
本稿では,地図画像の特徴を学習することで空間言語を基盤とする特徴ピラミッド類似グラウンドネットワーク(FP-LGN)を提案する。
共同センシングの結果,不均質な人間の言語観測とロボットセンサ計測の不確実性を考慮した融合の実現に成功した可能性が示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:52:22 GMT)
The Cooperative Network Architecture: Learning Structured Networks as Representation of Sensory Patterns [4.0] 協調ネットワークアーキテクチャ(Cooperative Network Architecture, CNA)は,ニューロンの構造的, 繰り返し接続されたネットワークを用いて, 知覚信号を表すモデルである。
我々は、ネットフラグメントを監督なしに学習し、フレキシブルに組み換えることで、新しいパターンをエンコードし、フィギュア補完とノイズに対するレジリエンスを可能にすることを実証した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:14:16 GMT)
Doctor Sun: A Bilingual Multimodal Large Language Model for Biomedical AI [3.8] 医学に特化した多モード生成モデルであるDr. Sunを紹介する。
ドクター・サンは、テキストや画像などの多様な生体データモダリティをエンコードし、統合し、解釈する。
また、幅広いバイリンガル医療マルチモーダルデータセットであるSunMed-VLをリリースしています。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:53:54 GMT)
AstroLoc: Robust Space to Ground Image Localizer [3.8] 宇宙飛行士の写真を訓練に活用できる最初のパイプラインを提示する。
AstroLocは2つの損失を通して地球の表面の特徴の堅牢な表現を学習する。
AstroLocは以前のSOTAよりも平均35%のリコール改善を実現しています。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:13:38 GMT)
On the Sustainability of AI Inferences in the Edge [3.7] エッジデバイスはレイテンシクリティカルなアプリケーションをサポートするためにAI推論を実行する。
情報意思決定における性能とエネルギー利用に関する研究は行われていない。
モデルF1のスコア、推測時間、推論パワー、メモリ使用量のトレードオフを分析する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:47:22 GMT)
A multi-dimensional quantum estimation and model learning framework based on variational Bayesian inference [3.7] 本稿では,多数のモデルパラメータに対して高速かつ操作可能な共同モデル選択とパラメータ推定アルゴリズムを提案する。
このアルゴリズムは変分ベイズ推定(VBI)に基づいており、ターゲットの後方分布を近似する。
我々は,各パラメータの異なる競合モデルを選択するために,事前の正規化がいかに使用できるかを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:18:27 GMT)
AUV-Fusion: Cross-Modal Adversarial Fusion of User Interactions and Visual Perturbations Against VARS [3.7] AUV-Fusionは、高次ユーザ嗜好モデリングを採用するクロスモーダル・アタック・フレームワークである。
AUV-Fusionは従来のベースライン法と比較してターゲット(コールドスタート)アイテムの露出を著しく向上させる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:55:09 GMT)
Prediction of Significant Creatinine Elevation in First ICU Stays with Vancomycin Use: A retrospective study through Catboost [3.4] バンコマイシン(Vancomycin、Vancomycin)は、ICUの重症グラム陽性感染症に対する重要な抗生物質であり、腎毒性のリスクが高い。
本研究では,通常のICUデータを用いて,バンコマイシン関連クレアチニン上昇を予測する機械学習モデルを開発することを目的とした。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 19:15:37 GMT)
FuseTen: A Generative Model for Daily 10 m Land Surface Temperature Estimation from Spatio-Temporal Satellite Observations [3.3] 都市熱波、干ばつ、陸熱波は、気候変動の文脈において、ますます困難を増している。
これらの現象を評価し理解するための最も重要な変数の1つはランドサーフェス温度(LST)である。
本研究では,ランドサット8号とテラMODIS号の時空間観測により,毎日10mの空間分解能でLST観測を行うFuseTenを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 23:04:16 GMT)
Cluster-Based Random Forest Visualization and Interpretation [3.3] 本稿では,無作為林の解釈可能性を高めるための可視化手法とシステムを提案する。
同様のツリーをクラスタリングすることで、モデルが一般的にどのように機能するかをユーザが解釈できます。
また、クラスタ化された決定木と個々の決定木の両方を視覚化する2つの新しい可視化手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:22:28 GMT)
An Asynchronous Decentralised Optimisation Algorithm for Nonconvex Problems [3.3] 本稿では,非分散最適化と分散エージェントのネットワークについて考察する。
我々はランダム化に基づくADMMアルゴリズムを開発した。
Douglas
ラフフォード・ブロックのエージェント。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 00:55:17 GMT)
Improving Generalization Ability of Robotic Imitation Learning by Resolving Causal Confusion in Observations [3.2] 本稿では,近年の模倣学習アーキテクチャに容易に組み込むことができる因果構造学習フレームワークを提案する。
ムジョコにおけるALOHA[31]双対ロボットアームのシミュレーションを用いて,本手法を実証する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:46:48 GMT)
ModalTune: Fine-Tuning Slide-Level Foundation Models with Multi-Modal Information for Multi-task Learning in Digital Pathology [3.2] 本稿では,デジタル病理予測タスクのためのファインチューニングフレームワークであるModalTuneを提案する。
4種類の癌に対する一様モデルと多様モデルの両方に対して,ModalTuneは最先端のSOTA(State-of-the-art)を達成できた。
また、ModalTuneは2つのアウト・オブ・ディストリビューション(OOD)データセットに一般化可能であることも示しています。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:10:58 GMT)
Beyond Accuracy: How AI Metacognitive Sensitivity improves AI-assisted Decision Making [3.0] 人間の意思決定がAI入力に依存する環境では、AIシステムの予測精度と信頼性の信頼性の両方が意思決定品質に影響を与える。
私たちはAIメタ認知感度の役割を強調します -- 正確さと誤った予測を正確に区別する信頼スコアを割り当てる能力です。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:05:50 GMT)
Repair-R1: Better Test Before Repair [3.0] APRは、自動的にプログラム欠陥を特定し、パッチを生成し、修復を検証することを目的としている。
現在のAPRメソッドは、推論段階でのみテストケースを使用するのが一般的である。
本稿では,モデルのトレーニングフェーズにテストケースを導入し,修正に先立ってテスト生成をシフトするリファレンス-R1を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:24:05 GMT)
Cycles Protocol: A Peer-to-Peer Electronic Clearing System [3.0] オープンで分散化されたクリアリング、決済、発行プロトコルであるCyclesを紹介します。
サイクルにより、企業は支払いの不効率を克服し、労働資本コストを削減し、多様な資産と流動性資源を活用することができる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 00:48:50 GMT)
Quantum Semi-Random Forests for Qubit-Efficient Recommender Systems [2.9] 現代のレコメンデータは、各項目を数百のスパースセマンティックタグで記述している。
ほとんどの量子パイプラインは、タグごとに1量子ビットをマッピングし、100量子ビット以上を要求する。
このギャップを、タグプロファイルを圧縮する3段階のハイブリッド機械学習アルゴリズムで埋める。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:20:44 GMT)
PATENTWRITER: A Benchmarking Study for Patent Drafting with LLMs [2.9] 本稿では,大規模言語モデル(LLM)を活用して特許作成のパラダイムシフトを実現することを目的とする。
PATENTWRITER は,特許抽象生成において LLM を評価するための最初の統一ベンチマークフレームワークである。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:17:35 GMT)
A Systematic Literature Review on Detecting Software Vulnerabilities with Large Language Models [2.5] ソフトウェア工学における大規模言語モデル(LLM)は、ソフトウェア脆弱性検出への関心を喚起している。
この分野の急速な発展は、断片化された研究の風景を生み出した。
この断片化は、最先端技術の明確な概要を得るのを困難にし、研究を有意義に比較し分類する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:17:16 GMT)
Recursive Learning-Based Virtual Buffering for Analytical Global Placement [2.5] 本稿では,MLBuf-RePlAceを提案する。
MLBuf-RePlAceをOpenROADのデフォルトの仮想バッファリングベースのタイミング駆動グローバルプレーサと比較する。
MLBuf-RePlAceは、ルート後電力の劣化なしに、オープンソースのOpenROADフロー内での全負スラック(TNS)において(最大、平均、平均)改善(56%、31%)を達成する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:51:25 GMT)
The Multi-Agent Fault Localization System Based on Monte Carlo Tree Search Approach [2.5] 大規模言語モデル(LLM)は、インシデントを素早く見つけてリカバリするための新しいパスを提供する。
本手法は根本原因の局在精度を49.29%から128.35%向上させる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:03:21 GMT)
Towards High-Resolution Alignment and Super-Resolution of Multi-Sensor Satellite Imagery [2.5] 本研究では,高調波ランドサット・センチネル10m(HLS10)を基準データセットとして,高調波ランドサット・センチネル30m(HLS30)画像の整列と高調波ランドサット・センチネル30m(HLS30)画像の作成を行う。
本研究の目的は,これらのセンサ間の解像度ギャップを埋め,超解像ランドサット画像の品質を向上させることである。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:55:01 GMT)
Quantum Bayes' rule and Petz transpose map from the minimum change principle [2.4] ベイズの規則は、新しい証拠に基づく信念の更新に日常的に使用されている。
この原則は、更新された信念は、以前の信念から最小限に逸脱しながら、新しいデータと一貫性を持たなければならないことを述べている。
最小変化原理の量子アナログを導入し、それを用いて量子ベイズの規則を導出する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:53:00 GMT)
TextSAM-EUS: Text Prompt Learning for SAM to Accurately Segment Pancreatic Tumor in Endoscopic Ultrasound [2.3] TextSAM-EUSはSegment Anything Model (SAM) のテキストによる適応であり、推論時に手動の幾何学的プロンプトを必要としない。
膵臓の公衆内視鏡超音波データベースTextSAM-EUSは82.69%のDiceと85.28%の正規化表面距離(NSD)を達成している
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:39:30 GMT)
Dissipation in the Broadband and Ultrastrong Coupling Regimes of Cavity Quantum Electrodynamics: An Ab Initio Quantized Quasinormal Mode Approach [1.8] 光子損失に対する現象学的アプローチは、長い間キャビティQEDの働きであった。
本稿では,双極子に結合した量子化光キャビティモードに対する量子マスター方程式の厳密で初期的な導出について述べる。
我々は、空洞QEDの「広帯域」散逸状態の新たな基準を同定する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:41:38 GMT)
MFTCXplain: A Multilingual Benchmark Dataset for Evaluating the Moral Reasoning of LLMs through Hate Speech Multi-hop Explanations [1.8] 本稿では,Large Language Models (LLM) の道徳的推論を評価するためのベンチマークデータセットを提案する。
このデータセットは、ポルトガル語、イタリア語、ペルシア語、英語の3000のツイートで構成され、二進的ヘイトスピーチラベル、道徳カテゴリー、テキストスパンレベルの合理性で注釈付けされている。
実証的な結果は、道徳的推論タスクにおけるLLM出力と人間のアノテーションの相違を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:54:38 GMT)
Policy-Driven AI in Dataspaces: Taxonomy, Explainability, and Pathways for Compliant Innovation [1.7] 本稿では、プライバシ保護とポリシー対応AI技術に関する包括的なレビューを提供する。
プライバシレベル、影響、コンプライアンスの複雑さに基づいて、これらのテクニックを分類する新しい分類法を提案する。
技術的、倫理的、規制的な観点から見れば、この研究はデータ空間において信頼性があり、効率的で、コンプライアンスのよいAIシステムを開発するための基礎となる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:46:55 GMT)
BEACON: A Bayesian Optimization Strategy for Novelty Search in Expensive Black-Box Systems [1.2] ノベルティサーチ(NS)は、シミュレーションや実験を通じて多様なシステムの振る舞いを明らかにすることを目指している。
NS法は一般に、入力空間の密度の高いサンプリングを必要とする進化戦略やその他のメタヒューリスティックに依存している。
サンプル効率のよいベイズ最適化に基づくNSのアプローチであるBEACONを導入し、入力-行動関係が不透明で、評価にコストがかかるような設定に最適化する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 01:09:18 GMT)
Tracking research software outputs in the UK [1.2] 本研究は,イギリスの学術機関が,ソフトウェアをユニークな研究成果として保管し,登録する場所について検討する。
研究成果として報告されるソフトウェアの量は、他のカテゴリに比例して低いままである。
アーティファクト共有は低いようで、報告されているソフトウェアの4分の1はリンクがなく、45%が欠落したURLか間違ったURLを持っている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:46:47 GMT)
Adaptive Duration Model for Text Speech Alignment [1.2] 音声からテキストへのアライメントは、ニューラルテキスト音声(TTS)モデルの重要コンポーネントである。
本稿では,音素レベルの持続時間分布を与えられたテキストで再現できる新しい持続時間予測フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:31:11 GMT)
Comparing Normalizing Flows with Kernel Density Estimation in Estimating Risk of Automated Driving Systems [1.1] 本稿では,パラメータの確率密度関数 (PDF) の推定に正規化フロー (NF) を用いることを検討する。
NF は、単純な基底分布を可逆写像と微分可能写像の列を用いて複素分布に変換する生成モデルのクラスである。
我々は、ADSのリスクとリスクの不確実性を定量化するためのNFの有効性を示し、その性能をカーネル密度推定(KDE)と比較した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:16:59 GMT)
aLLoyM: A large language model for alloy phase diagram prediction [1.0] 本稿では,合金組成,温度,およびそれに対応する位相情報に特化して訓練された,微調整大言語モデル (LLM) であるaLLoyMを紹介する。
我々は、オープンソースの事前学習型LLMであるMistralを、複数選択と短問合せの2つの異なるQ&Aフォーマット向けに微調整した。
ベンチマーク評価は、微調整が多点相図問題の性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:32:39 GMT)
Parametrized Multi-Agent Routing via Deep Attention Models [1.0] パラメタライズドシーケンシャル意思決定のためのスケーラブルなディープラーニングフレームワーク(ParaSDM)を提案する。
この設定の重要なサブクラスは、複数のエージェントシステムが最適なルートと位置を同時に決定する必要がある施設と場所(FLPO)である。
これを解決するために、最大エントロピー原理(MEP)と、最短経路ネットワーク(SPN)と呼ばれるニューラルポリシーモデルを統合する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:46:45 GMT)
ControlMed: Adding Reasoning Control to Medical Language Model [1.0] 医療領域において、精度と説明性を高めた大規模言語モデル(LLM)の推論が採用されつつある。
既存の推論 LLM は、必要以上に長い推論プロセスを生成し、計算オーバーヘッドと応答遅延を増大させる。
推論時に推論プロセスの長さをアクティブに制御できる医療言語モデルである textbfControlMed を導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:17:07 GMT)
Instruction-tuned Large Language Models for Machine Translation in the Medical Domain [1.0] 大規模言語モデル(LLM)は、高リソース言語ペアとドメインに対する機械翻訳において有望な結果を示している。
本研究では,医学領域におけるベースラインLLMと命令調整LLMのパフォーマンスを比較した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:06:51 GMT)
Efficient Differentially Private Fine-Tuning of LLMs via Reinforcement Learning [1.0] RLDPはDP最適化自体を近代的な深層強化学習(RL)に対応可能な閉ループ制御問題とみなす最初のフレームワークである。
GPT2-small、Llama-1B、Llama-3B、Mistral-7Bの1,600以上の実験で、RDDPは1.3-3.0.5%のパープレキシティ低減と平均5.6%のダウンストリームユーティリティゲインを実現している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:46:53 GMT)
Neural Network Architectures for Scalable Quantum State Tomography: Benchmarking and Memristor-Based Acceleration [1.0] 量子状態トモグラフィ(QST)は、量子システムの特徴付けと検証に不可欠である。
以前の性能の主張は、体系的な検証よりもアーキテクチャ上の仮定に依存していた。
いくつかのニューラルネットワークアーキテクチャをベンチマークして、キュービット数で効果的にスケールするかを判断し、システムサイズが大きくなるにつれて高い忠実性を維持することができない。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:12:10 GMT)
Distance and Collision Probability Estimation from Gaussian Surface Models [0.9] 連続空間衝突確率推定は不確実性を考慮した運動計画に重要である。
ほとんどの衝突検出と回避アプローチは、ロボットが球体としてモデル化されていると仮定するが、楕円形表現はより厳密な近似を与える。
最先端の手法は、原点雲を加工することでユークリッド距離と勾配を導出する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:10:59 GMT)
Distribution of lowest eigenvalue in $k$-body bosonic random matrix ensembles [0.9] 有限多ボソン系のボソン数$m$の最小固有値の分布を示す。
我々はこれらの遷移を、固有値密度に対する$q$-正規分布を定義する$q$パラメータの関数として解析する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:00:21 GMT)
Tiny-BioMoE: a Lightweight Embedding Model for Biosignal Analysis [0.9] The textitSecond Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に提出された。
提案手法は,生体信号解析のための軽量な事前学習型埋め込みモデルである textitTiny-BioMoE を導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:31:29 GMT)
Multi-Representation Diagrams for Pain Recognition: Integrating Various Electrodermal Activity Signals into a Single Image [0.9] The textitSecond Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に提出された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:34:18 GMT)
Efficient Pain Recognition via Respiration Signals: A Single Cross-Attention Transformer Multi-Window Fusion Pipeline [0.9] The textitSecond Multimodal Sensing Grand Challenge for Next-Gen Pain Assessment (AI4PAIN)に提出された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:37:25 GMT)
GPT-4.1 Sets the Standard in Automated Experiment Design Using Novel Python Libraries [0.8] 大規模言語モデル(LLM)は、科学研究におけるコード生成を自動化するツールとして急速に進歩してきた。
本研究では,2つの難易度の高いシナリオに対して,関数型Pythonコードを生成する上で,最先端のLLMの選択を体系的にベンチマークする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:11:29 GMT)
Automated MRI Tumor Segmentation using hybrid U-Net with Transformer and Efficient Attention [0.7] 癌は異常な増殖であり、局所的に浸潤し、遠くの臓器に転移する可能性がある。
最近のAIベースのセグメンテーションモデルは一般的に、大規模な公開データセットでトレーニングされている。
本研究は,AI腫瘍セグメンテーションモデルを病院ソフトウェアに直接組み込んで,効率的な腫瘍治療計画と実施を行う。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:53:31 GMT)
OFCnetLLM: Large Language Model for Network Monitoring and Alertness [0.7] 本稿では,Large Language Models (LLM) を用いたネットワーク監視管理の革新について検討する。
我々はLSMを活用し、異常検出を強化し、根本原因分析を自動化し、インシデント分析を自動化し、AIを用いたよく監視されたネットワーク管理チームを構築する。
私たちのモデルはマルチエージェントアプローチとして開発され、現在も進化を続けており、早期の結果が得られています。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:22:42 GMT)
DeepC4: Deep Conditional Census-Constrained Clustering for Large-scale Multitask Spatial Disaggregation of Urban Morphology [0.7] 本稿では,局所的な国勢調査統計をクラスタレベルの制約として組み込んだ,深層学習に基づく空間分散手法を提案する。
我々の研究は、我々の既存の粗い派生情報を大規模に空間的監査するための、新しいディープラーニングベースのマッピング技術を提供してきた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:25:39 GMT)
Of Good Demons and Bad Angels: Guaranteeing Safe Control under Finite Precision [0.7] 本稿では,有限精度摂動に頑健さを取り入れた理論保証と実世界の実装のギャップを埋める。
我々は、音質と効率的な実装を合成するために、最先端の混合精度固定点チューナーを用いて、完全なエンドツーエンドソリューションを提供する。
我々は,自動車・航空分野のケーススタディにアプローチし,厳密な無限時間地平線安全保証を備えた効率的なNN実装を構築した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:21:22 GMT)
SDBA: A Stealthy and Long-Lasting Durable Backdoor Attack in Federated Learning [0.7] フェデレーション学習は、データのプライバシを保持しながら機械学習モデルをトレーニングするための、有望なアプローチである。
本稿では,フェデレート学習環境におけるNLPタスクのための新しいバックドア攻撃機構であるSDBAを紹介する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:09:17 GMT)
Exploring Dynamic Parameters for Vietnamese Gender-Independent ASR [0.6] スペクトルサブバンドセントロイド周波数(SSCF)の比平面における音響遷移を極パラメータを用いて特徴付け、音声の動的特性を捉える。
提案パラメータは単語誤り率を著しく低減し,基本的MFCCよりも性的な独立性を示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:25:55 GMT)
Comparing Cluster-Based Cross-Validation Strategies for Machine Learning Model Evaluation [0.6] クロスバリデーションは機械学習において基本的な役割を担い、モデルパフォーマンスの堅牢な評価を可能にし、トレーニングや検証データに対する過大評価を防止する。
本研究の目的は,クラスタリングアルゴリズムの性能を解析することにより,クラスタベースのクロスバリデーション戦略の調査を深めることである。
ミニバッチK平均とクラス階層化を組み合わせた新しいクロスバリデーション手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 00:13:52 GMT)
Observation of Superconducting Solitons by Terahertz-Light-Driven Persistent Pseudo-Spin Coherence [0.6] 鉄系超伝導体のエピタキシャル薄膜におけるソリトン状態の観測を報告する。
このソリトン状態への遷移は、フロケのようなスペクトル側バンドの出現によって特徴づけられる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:55:55 GMT)
A case for data valuation transparency via DValCards [0.6] データアセスメントのメトリクスは、単純なアルゴリズム設計の選択の下で本質的にバイアスを受け、不安定であることを示す。
我々は,データバリュエーションに関する透明性の向上を支持するとともに,新しいデータバリュエーションカード(DValCards)フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:49:04 GMT)
Quantum Krylov Subspace Diagonalization via Time Reversal Symmetries [0.6] 我々はKrylov Time Reversal(KTR)と呼ばれる新しいプロトコルを導入する。
実数値のKrylov行列要素の復元が可能であり,回路深さを著しく低減できることを示す。
時間反転対称性を示すパラダイム的ハミルトニアンの数値シミュレーションにより,本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:35:36 GMT)
Detecting quantum non-Gaussianity with a single quadrature [0.5] 1つの四次測定の統計は、恒星のランクによって定量化される任意の非ガウス性を見極めることができることを示す。
証人の妥当性は、有界エネルギーと有限星級数を持つ状態の集合がコンパクトであることを示す技術的結果によって支持される。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:09:46 GMT)
BERSting at the Screams: A Benchmark for Distanced, Emotional and Shouted Speech Recognition [0.5] 本稿では,B(asic) E(motion) R(andom phrase) S(hou)t(s) (BERSt) データセットを提案する。
データセットには、地域のアクセントと非ネイティブアクセントの異なる98人のアクターから約4時間の英会話が含まれている。
ASRタスクとSERタスクの初期ベンチマークを行い、ASRは距離とシャウトレベルの増大とともに劣化し、意図した感情に応じて様々なパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:21:42 GMT)
Majorization theory for quasiprobabilities [0.5] 行列化理論は分布の障害を比較する強力なツールである。
無限測度空間上の連続準確率分布に対する偏化の概念を導入する。
量子資源理論の文脈における結果のいくつかの応用について述べる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:00:03 GMT)
Thermodynamics-Inspired Computing with Oscillatory Neural Networks for Inverse Matrix Computation [0.5] ONNは複雑な最適化問題に取り組むためのIsingマシンとして広く研究されている。
本研究では、線形代数問題、特に逆行列の解法におけるそれらの実現可能性について検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:16:55 GMT)
$S^2M^2$: Scalable Stereo Matching Model for Reliable Depth Estimation [0.5] 一般化可能なステレオマッチングモデルは、データセット固有の微調整なしで、様々な解像度と異種範囲でうまく動作することができる。
反復的局所探索法は制約付きベンチマークで高いスコアを得るが、そのコアメカニズムは真の一般化に必要な大域的な一貫性を制限する。
我々は,コストボリュームフィルタリングや深部精錬スタックに頼ることなく,最先端の精度と高効率を実現するグローバルマッチングアーキテクチャを開発した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:27:21 GMT)
AutoIndexer: A Reinforcement Learning-Enhanced Index Advisor Towards Scaling Workloads [0.5] AutoIndexerは、ワークロード圧縮、クエリ最適化、特殊RLモデルを組み合わせてインデックス選択を効果的にスケールするフレームワークである。
インデックスの品質を犠牲にすることなく、検索の複雑さを大幅に低下させる。
平均すると、最先端のRLベースのインデックスアドバイザを約20%のコスト削減で上回ります。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:38:13 GMT)
Multi-Gap superconductivity in HgS under pressure [0.4] 水銀硫化物 (HgS) はフェルミ表面の異なるシートによって駆動されるマルチギャップ超伝導状態を担っている。
その結果、HgSはマルチバンド超伝導ギャップ構造が圧力下で出現する数少ないシステムに位置づけられる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:16:15 GMT)
Can GPT-4o mini and Gemini 2.0 Flash Predict Fine-Grained Fashion Product Attributes? A Zero-Shot Analysis [0.4] 大規模言語モデル(LLM)は、マルチモーダルデータの理解において顕著な能力を示している。
本稿では, 性能と速度, コスト効率のバランスをとる, 最先端のLCMのゼロショット評価について述べる。
Gemini 2.0 Flashは全ての属性で56.79%のマクロF1スコア、GPT-4o-miniは43.28%のマクロF1スコアで最大のパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:37:06 GMT)
A Bit of Freedom Goes a Long Way: Classical and Quantum Algorithms for Reinforcement Learning under a Generative Model [0.4] 有限水平および無限水平平均逆マルコフ決定過程(MDP)を学習するための古典的および量子オンラインアルゴリズムを提案する。
我々のアルゴリズムは、エージェントが生成的サンプリング方式で環境と自由に対話できるハイブリッド探索・生成的強化学習モデルに基づいている。
我々は、RLから「不確実性に直面した最適主義」や「後続サンプリング」といったいくつかのパラダイムを回避し、代わりに最適なポリシーを直接計算し、使用することで、以前の作品と比較して後悔の限界が良くなることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:24:23 GMT)
Neural network for excess noise estimation in continuous-variable quantum key distribution under composable finite-size security [0.3] 連続量子鍵分布(CV-QKD)におけるパラメータ推定にニューラルネットワークが確実に利用できることを示す。
提案手法は,標準手法と同等のプロトコルを用いて,より厳密な信頼区間を生成する。
これらの結果は、現代の機械学習技術を量子暗号プロトコルに統合するための新しい視点を開く。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:44:42 GMT)
TempRe: Template generation for single and direct multi-step retrosynthesis [0.3] 再合成は、巨大で複雑な化学反応空間のため、分子発見における中心的な課題である。
従来のテンプレートベースの手法はトラクタビリティを提供するが、スケーラビリティの低下と限定的な一般化に悩まされている。
本研究ではテンプレートベースのアプローチをシーケンス生成として再構成する生成フレームワークであるTempReを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:59:42 GMT)
MASCA: LLM based-Multi Agents System for Credit Assessment [0.3] 実世界の意思決定プロセスのミラー化による信用評価向上を目的とした,LLM駆動型マルチエージェントシステムMASCAを紹介する。
また,階層型マルチエージェントシステムにおけるシグナリングゲーム理論の視点を示し,その構造と相互作用に関する理論的洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:19:38 GMT)
Matrix product states as thin torus limits of conformal correlators [0.3] シリンダー極限$tautoinfty$では、これらの波動関数は無限次元行列積状態に還元される。
薄いトーラスの極限$tauto0$では、それらは有限結合次元行列積状態となる。
我々は,MPS基底状態,例えばMageumdar-Ghosh や AKLT スピン鎖を再現する薄いトーラス限界を示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:56:02 GMT)
Lightweight Online Adaption for Time Series Foundation Model Forecasts [0.3] ELFは、オンラインフィードバックに対するFM予測のオンライン適応のための軽量なメカニズムである。
我々は、標準時系列データセットの集合をまたいだ最近のFMと組み合わせて、ELFの性能を評価する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:23:56 GMT)
Imperfect Entangling Power of Quantum Gates [0.2] 入力状態にあるユニタリとノイズの不完全性が、与えられた量子ゲートの絡み合い発生力にどのように影響するかを示す。
局所雑音モデルが存在する場合、入力状態は、与えられたユニタリ演算子の絡み合う力を最大化するが、ノイズのないシナリオとはかなり異なる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:23:20 GMT)
Thresholded quantum LIDAR in turbolent media [0.2] 本稿では, 乱流媒質中における光の伝播による影響に対する<phys. Lett. 123, 203601>で開発された手法の拡張について述べる。
以上の結果から,性能の低い技術が有用な検出手法となる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:40:00 GMT)
Alleviating the quantum Big-$M$ problem [0.2] 古典的には "Big-$M$" 問題として知られており、物理的エネルギースケールに影響を与える。
我々は、量子ビッグ-M$問題を体系的に包含し、最適の$M$を見つけるのにNPハードネスを明らかにする。
本稿では,SDP緩和に基づく実用的な翻訳アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:06:41 GMT)
Training language models to be warm and empathetic makes them less reliable and more sycophantic [0.2] 温暖化のための言語モデルの最適化は,特にユーザが脆弱性を表現した場合,その信頼性を損なうことを示す。
異なるサイズとアーキテクチャの5つの言語モデルについて実験を行い、より暖かく共感的な応答を生み出すよう訓練し、安全クリティカルなタスクで評価した。
ワームモデルは、元のモデルよりもかなり高いエラー率(+10から+30ポイント)を示し、陰謀論を推進し、誤った事実情報を提供し、問題のある医療アドバイスを提供した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:11:59 GMT)
Quantifying surprise in clinical care: Detecting highly informative events in electronic health records with foundation models [0.2] 電子カルテにおける高情報トークンやイベントを同定する基礎モデルに基づく手法を提案する。
我々のモデルフラグは、下流の患者結果を予測する上で重要なイベントであり、ほとんど情報を持っていないと認識されたイベントのごく一部を安全に降ろすことを実証する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:01:18 GMT)
VRISE: A Virtual Reality Platfrom for Immersive and Interactive Surveying Education [0.2] VRISEは没入型仮想現実研究所で、カスタマイズ可能、アクセス可能、およびユーザフレンドリーなモジュールを通じて地上および空中調査タスクを複製する。
VRISEは、デジタルレベルの機器によるディファレンシャルレベリングや、ウェイポイントベースのドローンナビゲーション、入力スムーシングによる強化、適応インターフェース、さまざまな学習スタイルに対応するリアルタイムフィードバックといったインタラクティブなエクスペリエンスを備えている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:27:51 GMT)
Connection Between Classical and Quantum Descriptions of Spin Waves Using Quantum Circuits [0.2] 量子計算回路は、スピン1/2粒子の線形鎖上の単一のスピン波量子を近似する。
この積状態が非有界鎖の極限における正しい分散関係をもたらすことを解析的に示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:02:41 GMT)
Aleatoric Uncertainty Medical Image Segmentation Estimation via Flow Matching [0.2] 医用画像のセグメンテーションにおけるアレタリック不確かさの定量化は、専門家のアノテータが観察する自然変動の反映であるため重要である。
提案手法は, 正確な密度を学習するシミュレーション不要なフローベース生成モデルである条件付きフローマッチングを利用する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:45:32 GMT)
SpectraSentinel: LightWeight Dual-Stream Real-Time Drone Detection, Tracking and Payload Identification [0.1] 民間空域でのドローンの拡散は、緊急のセキュリティ上の懸念を引き起こしている。
2025年のVIPカップの課題に対応するため、我々は2ストリームのドローン監視フレームワークを提案する。
我々のアプローチでは、並列赤外(熱)および可視(RGB)データストリーム上に、独立してYou Only Look Once v11-nano (YOLOv11n)オブジェクト検出器をデプロイする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:10:13 GMT)
On LLM-Assisted Generation of Smart Contracts from Business Processes [0.1] 大規模言語モデル(LLM)は、ソフトウェアの生成方法の現実を変えました。
本稿では、ビジネスプロセス記述からスマートコントラクトコードを生成するためのLCMの使用について探索的研究を行う。
以上の結果から,LLMの性能はスマートコントラクト開発に必要な信頼性に劣ることがわかった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:39:45 GMT)
Bayesian Optimization of Process Parameters of a Sensor-Based Sorting System using Gaussian Processes as Surrogate Models [0.1] センサベースのソートシステムは、物質の流れを2つの分画に分離することができる。
様々なプロセスパラメータは、材料の流れの性質、システムの寸法、必要なソート精度に応じて設定されなければならない。
本稿では,センサベースソートシステムのプロセスパラメータを最適化し,繰り返し監視し,調整する手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:31:39 GMT)
A Classical-Quantum Adder with Constant Workspace and Linear Gates [0.0] 私は、量子レジスタに古典的なオフセットを追加するために、3つのクリーンアンシラと4n pm O(1)$ Toffoli ゲートを使用する加算器を構築します。
私は、制御キュービットに条件付きで提示された加算器を適用するには、追加のワークスペースやToffolisを必要としないことを示しています。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:24:03 GMT)
A Benchmark Dataset and Evaluation Framework for Vietnamese Large Language Models in Customer Support [0.0] 大言語モデル (LLM) は質問応答システム (QA) に欠かせないものとなっている。
大言語モデル (LLM) は質問応答システム (QA) に欠かせないものとなっている。
ベトナムのLLM(ViLLMs)の出現は、その正確性、効率、プライバシのメリットに対する実践的な選択として、軽量なオープンソースモデルを強調している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:14:31 GMT)
Tree tensor network hierarchical equations of motion based on time-dependent variational principle for efficient open quantum dynamics in structured thermal environments [0.0] ボゾン浴と相互作用する駆動量子系に対するオープン量子力学を正確に計算するための効率的なTTN-HEOM法を提案する。
結合マスター方程式に対する3つの一般的なプロパゲータを実装した。
この結果から,TTN-HEOMは,構造浴と相互作用する駆動量子系の劣化と緩和のダイナミクスをシミュレートできることがわかった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:02:31 GMT)
Towards Simulating Social Influence Dynamics with LLM-based Multi-agents [0.0] マルチエージェントシミュレーションがオンラインフォーラムで観察される中核的な人間の社会動態を再現できるかどうかを検討する。
その結果,より小さなモデルの方が適合度が高く,推理に最適化されたモデルの方が社会的影響に強いことが示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:14:40 GMT)
Towards Practical Quantum Phase Estimation: A Modular, Scalable, and Adaptive Approach [0.0] 本稿では,適応ウィンドウ量子位相推定(AWQPE)アルゴリズムを提案する。
AWQPEは、所望の精度を達成するのに必要なイテレーションの数を大幅に削減する。
我々の数値シミュレーションは、AWQPEの精度と堅牢性を示し、資源効率と計算速度の明確なバランスを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:06:28 GMT)
Time Glasses: Symmetry Broken Chaotic Phase with a Finite Gap [0.0] 我々は、周期的に駆動される量子多体系で発生する離散時間結晶の非周期的なアナログである時間ガラスを紹介する。
熱力学的限界において、リウヴィリアのギャップは有限であり、このギャップがシステムサイズと指数関数的に閉じる時間結晶とは対照的である。
この結果は、誘起散逸量子系における分光スペクトル特徴と創発的マクロダイナミックスとの直接対応を確立している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:35:27 GMT)
The wall confronting large language models [0.0] 大規模言語モデルの性能を決定するスケーリング法則は,予測の不確実性を改善する能力を大幅に制限していることを示す。
LLMの学習能力の多くを駆動するメカニズムは、誤りの積み重ねを発生させる確率の根本にあるのかもしれない、と我々は主張する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:58:56 GMT)
The quantum Newman-Moore model in a longitudinal field [0.0] 量子ニューマン・ムーアモデル (quantum Newman-Moore model) または量子三角プラケットモデル (quantum triangular plaquette model, qTPM) を縦場 (qTPMz) の存在下で研究する。
我々はqTPMzの基底状態相図が翻訳対称性を破る様々なフラストレーション相を含むことを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:59:58 GMT)
Tapping into the Black Box: Uncovering Aligned Representations in Pretrained Neural Networks [0.0] ReLUネットワークは、実際にタップできる暗黙の線形モデルを学ぶ。
我々は,その決定境界を後方通過の簡単な修正を施して,入力空間に約引き戻すことができることを示す。
これは、ニューラルネットワークが実際に、トレーニング後に回復できる学習された解釈可能なパターンに依存していることを強く示唆している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:47:42 GMT)
TT-XAI: Trustworthy Clinical Text Explanations via Keyword Distillation and LLM Reasoning [0.0] 本研究は,ドメイン認識型キーワード蒸留による分類性能と解釈性の両方を改善するフレームワークであるTT-XAIを紹介する。
大言語モデル(LLM)を操るキーワード誘導プロンプトを用いて、チェーン・オブ・シークレットな臨床説明を生成する。
全ての評価モダリティはキーワード拡張法を常に好んでおり、蒸留が機械と人間の双方の解釈可能性を高めることを確認している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:28:10 GMT)
Strategic Integration of Artificial Intelligence in the C-Suite: The Role of the Chief AI Officer [0.0] 本稿では、AI経済、AI組織、AI時代の競争という3つの領域における将来のシナリオについて検討する。
この論文は、チーフAIオフィサー(CAIO)のための理論インフォームド・フレームワークを開発する。
この概念化は、エグゼクティブ・ランドスケープにおけるCAIOsの役割を明確にし、先進的な研究課題を提示します。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:54:27 GMT)
Spontaneous symmetry breaking in a $SO(3)$ non-Abelian lattice gauge theory in $2+1$D with quantum algorithms [0.0] 量子アルゴリズムによる非アベリア系非アベリア系SO(3)$格子ゲージ理論における基底状態の生成能力について, 2+1$Dで検討する。
ゲージ場のヒルベルト空間を扱うために、量子リンク作用素のリドン表現における非アベリアガウス法則の正確な仮定が、自由度を著しく減少させることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:54:39 GMT)
Solitons, chaos, and quantum phenomena: a deterministic approach to the Schrödinger equation [0.0] シュル・オーディンガー方程式はガリレオ不変体論におけるソリトンのアンサンブル平均力学を記述する。
我々は、我々の理論が測定結果と実験結果の間の統計的独立性を示していないかという議論で結論付けた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:43:06 GMT)
SmartDate: AI-Driven Precision Sorting and Quality Control in Date Fruits [0.0] SmartDateはAIを利用した、日付の果物の自動ソートと品質管理のためのシステムだ。
ディープラーニング、遺伝的アルゴリズム、強化学習を組み合わせて、分類精度を改善し、棚の寿命を予測する。
SmartDateの精度は94.5パーセント、F1スコアは93.1%、AUC-ROCは0.96である。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:20:44 GMT)
Single- and Two-Mode Squeezing by Modulated Coupling to a Rabi Driven Qubit [0.0] 本研究は、Rabi駆動の量子ビットを1つまたは2つの高調波発振器に分散結合させることにより、条件付きスクイーズを生成する新しい方法を提案する。
ボソニックモードの普遍的な制御を可能にすることの証明が提供され、連続可変量子情報処理のためのツールキットが拡張された。
その結果,光状態の量子条件制御のための新しいパラダイムが確立され,量子センシングや連続変数計算への応用が期待できる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:58:10 GMT)
Seed Selection for Human-Oriented Image Reconstruction via Guided Diffusion [0.0] 最近の拡散に基づくアプローチでは、余分な情報のないマシン指向画像から人間指向画像を生成する。
単一のランダムなシードを使用し、最適化された画像の品質につながる可能性がある。
画像品質を向上させるために,複数の候補から最適な種を識別する種選択法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:43:26 GMT)
Scalable Spectrum Availability Prediction using a Markov Chain Framework and ITU-R Propagation Models [0.0] 本稿では、スペクトル可用性予測のためのスケーラブルなフレームワークを提案する。
一次ユーザ活動の2状態マルコフ連鎖モデルとITU-Rからの高忠実な伝播モデルを組み合わせる。
フレームワークは柔軟で、様々な周波数帯域やシナリオに適応できる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:22:55 GMT)
Scalable Ion Fluorescence Collection Using a Trap-Integrated Metalens [0.0] 表面イオントラップの裏面に作製されたメタレンを具備したコンパクトなモノリシック集積システムを提案する。
40$times$100$mu$mアパーチャは、シミュレーションされたポイントソースコレクション効率の0.91%を可能にする。
このような読み出しゾーンの配列は、次世代のトラップイオン量子プロセッサにおいて、高忠実度並列読み出しのためのコンパクトでスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:08:19 GMT)
SLM-SQL: An Exploration of Small Language Models for Text-to-SQL [0.0] 小型言語モデル(SLM)は、エッジデプロイメントに適した推論速度と適合性に固有のアドバンテージを提供する。
ポストトレーニング技術の最近の進歩を活用して、Textto- Applicationsを探索する。
実験により,本手法の有効性と一般化性について検証した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:29:07 GMT)
SHoM: A Mental-Synthesis Trust Management Model for Mitigating Botnet-Driven DDoS Attacks in the Internet of Things [0.0] DDoS攻撃はIoTのセキュリティに深刻なリスクをもたらす。
信頼管理を通じてモノのインターネットにおけるボットネットに対するDDOS攻撃を扱うためのモデルを提供する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:57:59 GMT)
RocketStack: Level-aware deep recursive ensemble learning framework with adaptive feature fusion and model pruning dynamics [0.0] RocketStackは、レベルの認識された再帰的なアンサンブルフレームワークである。
各レベルでより弱い学習者を徐々に引き起こし、過剰な複雑さを伴わずにより深い積み重ねを可能にします。
33のデータセットのうち、線形トレンド試験では、ほとんどの変種で深度で精度が上昇したことが確認された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:53:10 GMT)
ReverBERT: A State Space Model for Efficient Text-Driven Speech Style Transfer [0.0] テキスト駆動音声スタイル転送のための効率的なフレームワークであるemphReverBERTを提案する。
画像領域の技法とは異なり,本手法は音声空間で動作し,音声特徴の離散フーリエ変換を統合する。
ベンチマーク音声コーパスの実験では、emphReverBERTは自然性、表現性、計算効率の点でベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:02:04 GMT)
Reservoir Computing as a Language Model [0.0] 大規模言語モデル(LLM)は、大量のデータを処理する上での優れたパフォーマンスに対して、科学とメディアのランドスケープデュオを支配してきた。
高速かつ省エネなハードウェア実装を実現するため,自然テキスト処理における貯水池の計算性能について検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:37:05 GMT)
Reformulating Chemical Equilibrium in Reacting Quantum Gas Mixtures: Particle Number Conservation, Correlations and Fluctuations [0.0] 反応量子ガス混合物の標準アンサンブル記述は、単一の大域粒子数保存制約を組み込むことで再構成される。
フェルミ・ディラック(Fermi-Dirac)またはボース・アインシュタイン(Bose-Einstein)の相関は、同一のスピン統計量を共有する種の1粒子エネルギー固有状態に自然に現れる。
フォーマリズムは、組成変動を伴う反応性混合物における量子化学平衡に対する新たな洞察を与える。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:23:01 GMT)
Reducing Circuit Depth in Lindblad Simulation via Step-Size Extrapolation [0.0] 我々は、リンドブラッド方程式でモデル化されたオープン量子系の量子シミュレーションのためのリチャードソン式外挿によるアルゴリズム的誤り軽減について研究する。
推定器は精度$varepsilon$を$mathcalO((lT)2/varepsilon)$からpolylogarithmic $mathcalO((lT)2/varepsilon)$スケーリングに還元する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 02:56:07 GMT)
Reconstructing Historical Climate Fields With Deep Learning [0.0] 我々は,最近導入されたFourier畳み込みに基づく深層学習手法を,数値的な気候モデル出力に基づいて訓練し,歴史的気候分野の再構築に利用した。
我々は、大きな、不規則な欠落したデータの領域を現実的に再構築し、強力なエルニーノやラニーナのような既知の歴史的出来事を、ほとんど情報を持って再構築することができる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:09:40 GMT)
Quantification of the energy consumption of entanglement distribution [0.0] ノイズのある量子チャネルを介して量子絡み合いを生成するのに必要なエネルギーを定量化する。
絡み合い理論における不可逆性は、非ゼロエネルギーコストを意味することを示す。
フォトニック偏光量子ビットに対する3つの絡み合った蒸留プロトコルのエネルギー要求を評価する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:21:19 GMT)
Proximity-measurement induced random localization in quantum fluids [0.0] 選択後ランダム近接測定が多くの異なる粒子の量子流体に与える影響を考察する。
これらの測定は粒子のごく一部をランダムな空間的局在に誘導するが、マクロ的に保存することを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:38:46 GMT)
Proposal for realizing Heisenberg-type quantum-spin models in Rydberg atom quantum simulators [0.0] 本研究は, 磁場印加により, XXZモデルの異方性パラメータを調整可能であることを示す。
我々は、Rydberg原子量子シミュレータにおけるスピン1/2およびスピン-1ハイゼンベルク型量子スピンモデルの実験的実現を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:08:10 GMT)
Prompt Engineering Techniques for Mitigating Cultural Bias Against Arabs and Muslims in Large Language Models: A Systematic Review [0.0] LLMにおける偏見の認識が高まりつつあるにもかかわらず、アラブやムスリムの表現に特に対処する技術戦略は依然として検討されている。
2021-2024年に発表された8つの実証的研究を分析した。
本研究は, 文化的プロンプト, 感情的プライミング, 自己退化技術, 構造化多段パイプライン, パラメータ最適化連続プロンプトの5つの主要なプロンプト工学的アプローチを明らかにする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 19:07:18 GMT)
Programmable Microwave Cluster States via Josephson Metamaterials [0.0] クラスタ状態は、連続変数量子コンピューティングの基本的なリソースである。
マルチモード絡み合ったマイクロ波クラスター状態のオンデマンド生成を実証する。
このプラットフォームは、スケーラブルな測定ベースの量子情報処理のための新しい道を開く。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 16:37:37 GMT)
Probing Bound State Relaxation Dynamics in Systems Out-of-Equilibrium on Quantum Computers [0.0] ポンププローブ分光法は、量子多体系の平衡外における応答ダイナミクスを探索するための強力なツールである。
量子コンピュータは、システムをエキサイティングにし、進化させ、観測可能なものを1次に測定することで、そのような実験をシミュレートするのに有用であることが証明されている。
我々の研究は、古典的および量子コンピュータにおけるシステム外平衡のシミュレーションの段階を、補助量子ビットを必要とせずにポンププローブ実験を用いて設定する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:00:04 GMT)
Prediction of acoustic field in 1-D uniform duct with varying mean flow and temperature using neural networks [0.0] 不均一媒質を有する一次元ダクト内の音の伝搬を表す支配方程式を導出する。
この問題は制約のない最適化問題に変換され、ニューラルネットワークを用いて解決される。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:26:36 GMT)
Plasmon-assisted photoelectron emission in a model cluster using time-dependent density functional theory and the time-dependent surface-flux method [0.0] 光電子スペクトルは時間依存表面流(t-SURFF)法で計算される。
レーザーパルス後に発生する長寿命プラズモン振動と関連する電子放出から生じるピークを観察する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:21:07 GMT)
Path integral analysis of Schrödinger-type eigenvalue problems in the complex plane: Establishing the relation between instantons and resonant states [0.0] 複素平面の特定の角部で境界条件が提供される固有値問題について検討する。
生じる汎函数積分は、自然に複素化積分輪郭上で定義される。
実時間量子トンネル力学から導かれる崩壊速度の1対1対応性について検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:05:02 GMT)
Parametric Amplification in Kerr Nonlinear Resonators: A theoretical review of Josephson Parametric Amplifiers [0.0] この論文はパラメトリック増幅の原理を概説することから始まり、強い古典ポンプが反射幾何学において非線形ジョセフソン媒質とどのように相互作用するかに焦点を当てた。
鍵動力学方程式は強い励起の下で導出され、非線形定常解が導かれる。
数値解法では、利得が利得応答曲線で可視化される周波数偏差とポンプ強度にどのように依存するかを探索する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:50:09 GMT)
Optimal quantum precision in noise estimation: Is entanglement necessary? [0.0] まず、ベクトル符号化が最適プローブに対して常に可換であることを示す。
任意の2次元局所分極チャネルの雑音範囲を推定するためには、最適プローブのエンタングルメントが下降する階段があることが示される。
2ビットの局所ビットフリップチャネルでは、チャネルの連続可換性と最適プローブは、積状態が最適精度を得るのに十分であることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:30:35 GMT)
Operational interpretation of the Stabilizer Entropy [0.0] 量子状態のクリフォード軌道は、ハールランダム状態と指数的に区別できないことが示される。
また、与えられた量子状態と安定化状態の集合を区別する最適な確率は、安定化状態エントロピーによっても支配される。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:58:40 GMT)
On the Simulation of Conical Intersections in Water and Methanimine Molecules Via Variational Quantum Algorithms [0.0] 本研究では,変分量子アルゴリズムを用いた円錐交叉(CI)の探索を目的として,メタン (CH2NH) および水 (H2O) 分子について検討する。
我々の手法は、変分量子固有解法(VQE)を含む、様々なハイブリッド量子古典法を実装し、比較する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:28:07 GMT)
On the Definition of Intelligence [0.0] 我々はまず、知性の本質を評価可能な種非依存の形で捉え、知的行動の多様なパラダイムを網羅するのに十分な一般性を持っている。
我々は,サンプルの忠実度に基づく一般的な基準を提案する。知性は,あるカテゴリから与えられたサンプル(s)を生成し,同じカテゴリからサンプル(s)を生成する能力である。
本稿では,形式的枠組みを提示し,経験的プロトコルを概説し,評価,安全性,一般化の意義について論じる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:04:00 GMT)
On spontaneous irreversibility and objective thermalization in stochastic modifications of quantum theory [0.0] 量子論は有効理論であり、熱力学の限界に近づく系を正確に記述するために補正を必要とする。
ゆらぎ-散逸関係は、ノルム保存、エネルギー保存、超光信号の不要、ミクロカノニカル平衡の出現を含む物理的整合性を保証する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:02:52 GMT)
Non-periodic Boundary Conditions for Euler Class and Dynamical Signatures of Obstruction [0.0] 任意の次元に対する非ブラバ格子構成とブリルアン境界条件(BZBC)の関係のニュアンスを系統的に検討する。
本研究は,任意の数帯や高次元に利用可能な,非自明な境界条件とマルチギャップトポロジー上の障害の役割を研究するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:49:19 GMT)
Non-classicality at equilibrium and efficient predictions under non-commuting charges [0.0] 量子熱力学系は非可換な観測物を保存することができるが、緩和に対するこの現象の結果は完全には理解されていない。
我々は、孤立量子系における平衡と熱化に対する観測可能に依存したアプローチを活用してこの問題を考察する。
この研究により、非可換電荷、弱値、カークウッド・ディラック準確率分布の下での可観測物の緩和という新たな関係が明らかになった。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:57:06 GMT)
Neural Networks as Universal Finite-State Machines: A Constructive ReLU Simulation Framework for NFAs [0.0] 本稿では,標準フィードフォワードReLUニューラルネットワークを用いた非決定論的有限オートマトン(NFA)の形式的,建設的なシミュレーションフレームワークを提案する。
我々の定式化は、双対ベクトルとしてのオートマトン状態、スパース線形変換としての遷移、非決定論的分岐を象徴的にエンコードする。
入力長に依存しない共有パラメータを持つReLUネットワークにより、すべての正規言語を正確に認識できることを実証する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 06:52:13 GMT)
Multipartite correlation measures and framework for multipartite quantum resources theory [0.0] 本稿では,真の多部量子相関法について検討する。
異なるMQCの真の測度は,その特性に基づいて,異なる階層構造を示すことが判明した。
また、マルチパーティライトステアリングは非対称なマルチパーティライト量子資源であることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:21:18 GMT)
Multimodal Late Fusion Model for Problem-Solving Strategy Classification in a Machine Learning Game [0.0] 本稿では,学生の問題解決戦略を分類するために,視覚データとゲーム内アクションシーケンスを構造化したマルチモーダルレイトフュージョンモデルを提案する。
その結果,対話型学習環境における戦略に敏感な評価と適応的支援のためのマルチモーダルMLの可能性を強調した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:12:06 GMT)
Moravec's Paradox: Towards an Auditory Turing Test [0.0] この研究は、現在のAIシステムが、人間が力ずくで行う聴覚的タスクで破滅的に失敗することを示しています。
重なり合う音声,音声の雑音,時間的歪み,空間音声,コーヒーショップノイズ,電話の歪み,知覚錯覚の7つのカテゴリーにまたがる917の課題を含む聴覚チューリングテストを導入する。
GPT-4の音声機能やOpenAIのWhisperを含む最先端オーディオモデルの評価では,93%を超える顕著な故障率を示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:45:13 GMT)
Molecular spin qudits to test generalized Bell inequalities [0.0] 電子スピンクビットを核スピンクビットに結合した電子スピンクビットを埋め込んだYb(trensal)分子ナノ磁性体が,量子クビット・クビット系におけるエンタングルメントを探索する理想的なプラットフォームであることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:32:59 GMT)
Local-available quantum correlation swapping in one-parameter X states [0.0] 局所的に利用可能な量子相関(LAQC)は、有望だが未検討の量子相関である。
初期状態と射影測定に使用される状態が相関している場合、最終状態は非ゼロLAQCとなる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:45:45 GMT)
Lie groups for quantum complexity and barren plateau theory [0.0] 量子コンピューティングにおける2つの基本的な問題を解析するために、リー群とその代数の理論を導入する。
まず、量子計算複雑性の幾何学的定式化について述べる。
次に,変分量子アルゴリズムにおけるバレンプラトー現象を扱う。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:46:09 GMT)
Leveraging Large Language Models for Bengali Math Word Problem Solving with Chain of Thought Reasoning [0.0] ベンガル数学語問題(MWP)の解法は、自然言語処理(NLP)において依然として大きな課題である。
これまで、人間に注釈を付けたBengaliデータセットは、このタスクに対処していない。
8792個のベンガルMWPのデータセットであるSOMADHANを開発した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:20:16 GMT)
Learning dynamically inspired invariant subspaces for Koopman and transfer operator approximation [0.0] 我々は一般作用素と表現学習を用いて転移とクープマン作用素を近似する。
具体的には、システムに動的に適合する機械学習正則基底関数について述べる。
本稿では,推定演算子からスペクトル特性を抽出した例を紹介する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 20:30:51 GMT)
Lattice tuning of charge and spin transport in $β_{12}$-borophene nanoribbons [0.0] EPC(Electron-phonon coupling)と磁気及び非磁性$Beta_12$-borophene nanoribbons(BNRs)におけるインタートワイン構造
スピン依存EPCは、フォノン誘起非弾性散乱とスピン選択バンド再正規化により、磁気ジグザグナノリボンのスピン依存電流を高める。
これらの知見は、エッジエンジニアリングをカスタマイズしてボロフェンベースのロジックデバイスを最適化するための強力な設計レバーとして、ECCを確立している。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:57:49 GMT)
Investigating the Invertibility of Multimodal Latent Spaces: Limitations of Optimization-Based Methods [0.0] 本稿では,タスク固有AI(Artificial Intelligence)モデルにおけるマルチモーダル潜在空間の逆機能とより広範な有用性について検討する。
我々の中心的な仮説は、最適化はモデルを逆問題へと導くことができるが、それらの多モード潜在空間は意味論的かつ知覚的コヒーレントな逆写像を一貫してサポートしない。
我々の研究は、真に意味的にリッチで可逆なマルチモーダル潜在空間を開発するためのさらなる研究の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:19:11 GMT)
Interrelation among Solvable Potentials and Extensions of SWKB Quantization Condition [0.0] ナタンゾンポテンシャルのある種のクラスに対するSWKB量子化条件の拡張形式を導出する。
SWKBの正確性は古典式に関係していると推測する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:52:02 GMT)
Interpretable Open-Vocabulary Referring Object Detection with Reverse Contrast Attention [0.0] RCAは、極端を抑え、中間レベルのアクティベーションを増幅することで最終層の注意を重み付け、意味論的に関連があるが抑制されたトークンが予測を導く。
We evaluate it on Open Vocabulary Referring Object Detection (OV-RefOD), introduced FitAP, a confidence-free average precision metric based on IoU and box area。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:47:07 GMT)
Improved Simulation of Asynchronous Entanglement Distribution in Noisy Quantum Networks [0.0] 本研究は,非同期絡み合い分散プロトコルを評価するための軽量なシミュレーションフレームワークを導入する。
コンタングルメントを1つのノードに一度に確立するシーケンシャルプロトコルと、すべてのノードが同時にエンタングルメントを生成しようとする並列プロトコルである。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:00:05 GMT)
Hypergraph Neural Sheaf Diffusion: A Symmetric Simplicial Set Framework for Higher-Order Learning [0.0] 本稿では,ハイパーグラフへの神経シーフ拡散の第一原理的拡張であるHypergraph Neural Sheaf Diffusion (HNSD)を紹介する。
HNSDは、対称的な単純持ち上げ、向きのあいまいさとハイパーグラフ学習に固有の隣接空間を解消する正規化次数ゼロのラプラシアンを介して動作する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:24:32 GMT)
How Sovereign Is Sovereign Compute? A Review of 775 Non-U.S. Data Centers [0.0] 本稿は、データセンター運営者の国籍のため、データセンターが外国の法当局の対象になる頻度を見積もる。
米国企業は、投資価値によって重み付けされた場合、データセットで米国以外のすべてのデータセンタープロジェクトの48%を運用しています。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:58:42 GMT)
Graph Collaborative Attention Network for Link Prediction in Knowledge Graphs [0.0] 我々は、マルチヘッドの注意を生かしたグラフニューラルネットワークモデルKBGATに着目し、局所的な近傍構造における実体的特徴と関係性の両方を共同で符号化する。
textbfGCAT(Graph Collaborative Attention Network)は,異種ノード間のコンテキストアグリゲーションとインタラクションを強化する改良されたモデルである。
本研究は,知識グラフ補完タスクにおいて,複雑なリレーショナルパターンをキャプチャする上で,注目に基づくアーキテクチャの利点を浮き彫りにするものである。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:47:25 GMT)
Geometric phase in anisotropic Kepler problem: Perspective for realization in Rydberg atoms [0.0] 我々は、ケプラーハミルトニアンの力学に従って、Rydberg軸の原子で示されるジャイロ効果を予測する。
我々は、ライドバーグにおいて、同様の幾何学的角度は、時間スケールが1mu$sから1$msの原子光学装置の機械的回転によって生成されると論じる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:47:14 GMT)
Genuine multipartite entanglement as a probe of many-body localization in disordered spin chains with Dzyaloshinskii-Moriya interactions [0.0] 我々は、乱れた量子スピンモデルのエルゴード相において、クエンチド平均真のマルチパートエンタングルメント(GME)がその最大値にアプローチ可能であることを示す。
対照的に、GMEは多体局在化(MBL)相において平衡状態と長時間の動的安定状態の両方で消滅する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:57:37 GMT)
From confinement to chaos in AdS/CFT correspondence via non-equilibrium local states [0.0] 大規模スカラー場の局所演算子挿入により作製した反ド・シッター(AdS)空間の励起状態について検討した。
双対状態における境界観測値の時間発展を計算する。
この収束背景における励起状態のダイナミクスを解析する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:05:25 GMT)
From Articles to Code: On-Demand Generation of Core Algorithms from Scientific Publications [0.0] 学術出版物におけるリッチなメソッド記述は、現代の大規模言語モデルのスタンドアロン仕様として機能することを示す。
我々は、従来の出版物から引き出された多種多様なコアアルゴリズムを実装することで、最先端モデルをベンチマークする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 01:52:01 GMT)
Floquet Theory of lattice electrons coupled to an off-resonant cavity [0.0] 我々は、真空または古典的な光によって駆動されるオフ共振共振器モードに結合された電子に対して有効なハミルトニアンを導出する。
真空場の場合、量子揺らぎの直接の結果、長距離ホッピングと空洞による相互作用が生じることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:28:09 GMT)
Flipping qudits: Extending the Bit-Flip Channel to higher-dimensional systems [0.0] 本稿では,ビットフリップチャネルの3つの拡張を,チャネルの異なる解釈に基づいて提案する。
量子四重項状態と2量子四重項ヴェルナー状態のエンタングルメント尺度としてネガティビティへの影響について検討した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:50:50 GMT)
Field digitization scaling in a $\mathbb{Z}_N \subset U(1)$ symmetric model [0.0] 本稿では,パラメータ$N$を正規化群の意味のカップリングとして解釈することで,フィールドのデジタル化を分析する。
実効場理論を用いて、FDパラメータ$N$を含む一般化スケーリング仮説を導出する。
2次元古典統計学の $mathbbZ_N$ クロックモデルの計算が (2+1)D $mathbbZ_N$ 格子ゲージ理論の基底状態における量子物理学と直接関係があることを解析的に証明する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:00:02 GMT)
False signatures of non-ergodic behavior in disordered quantum many-body systems [0.0] エルゴード型孤立量子多体系は固有状態熱化仮説(ETH)を満たす
ETHは、障害現実化の平均値が取られるとき、エネルギーウィンドウ内で局所観測可能量の期待値がどうなるかを規定していない。
本研究では、乱れた量子多体系における局所観測値の期待値を分析する際に、エネルギー窓の調整方法を示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:28:22 GMT)
Exploring the Application of Visual Question Answering (VQA) for Classroom Activity Monitoring [0.0] 近年のVisual Question Answering (VQA)モデルの進歩は、ビデオ記録から教室での対話を自動的に分析するための有望なツールを提供する。
本稿では,LLaMA2,LLaMA3,QWEN3,NVILAなど,最先端のオープンソースVQAモデルの適用性について検討する。
ベトナム銀行学校における実世界授業のビデオ記録から得られたBAV-Classroom-VQAデータセットについて紹介する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 04:25:14 GMT)
Exploring Many-Body Quantum Geometry Beyond the Quantum Metric with Correlation Functions: A Time-Dependent Perspective [0.0] 我々は、多体系の時間依存量子幾何学のための一般的なフレームワークを開発する。
非相互作用フェルミオンの準静的ゼロ温度制限において、このバーズ接続は、バンド理論クリストッフェル記号の既知の表現に還元されることを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:45:44 GMT)
Exploration of Low-Cost but Accurate Radar-Based Human Motion Direction Determination [0.0] 本稿では, 低コストだが高精度なレーダーによる人体動方向決定法について検討する。
HMDDは、軽量で高速なVision Transformer-Convolutional Neural Networkハイブリッドモデル構造によって実装されている。
提案手法の有効性は,オープンソースデータセットを用いて検証する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:48:36 GMT)
Explaining Deep Network Classification of Matrices: A Case Study on Monotonicity [0.0] この研究は、ディープラーニングを用いて行列を分類するための単純で実践的な基準を発見する方法を示す。
高性能ニューラルネットワークと説明可能なAI(XAI)技術を組み合わせることで、モデルの学習戦略を人間の解釈可能なルールに抽出することができる。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:55:44 GMT)
Evaluation of Deep Learning Models for LBBB Classification in ECG Signals [0.0] 本研究では、心電図(ECG)信号から空間的・時間的パターンを抽出し、それらを健康な被験者、左二分枝ブロック(LBBB)、左二分枝ブロック(SLBBB)の3つのグループに分類する能力を評価する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:11:05 GMT)
Evaluating and Improving the Robustness of Speech Command Recognition Models to Noise and Distribution Shifts [0.0] 学習条件と入力特徴がOOD条件下での音声キーワード分類器の頑健性と一般化能力に与える影響について検討する。
以上の結果から,いくつかの構成ではノイズ認識訓練が改善することが示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 22:14:16 GMT)
Distilling Knowledge from Large Language Models: A Concept Bottleneck Model for Hate and Counter Speech Recognition [0.0] 本稿では,自動ヘイトと対向音声認識のための新しい透過的手法を提案する。
SCBM(Speech Concept Bottleneck Model)では,形容詞を人間の解釈可能なボトルネック概念として用いている。
以上の結果から,形容詞に基づく概念表現は,ヘイトや反音声認識のためのコンパクトで解釈可能な,効果的なエンコーディングとして機能することが示唆された。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 21:50:30 GMT)
Digital Quantum Simulation of Spin Transport [0.0] 我々は、スピン電流自己相関関数 (ACF) による輸送現象の研究において、フォウトトレラントなディジタル量子シミュレーションが信頼性が高いことを示す。
本稿では,非単体操作,特に中周期測定を用いた直接計測手法を,近距離球状・超拡散的・拡散的系における40サイト1D XXZハイゼンベルクモデルのスピン輸送について検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 17:03:44 GMT)
Decoherence-free subspaces and Markovian revival of genuine multipartite entanglement in a dissipative system [0.0] ローレンツスペクトル密度を特徴とするボゾン浴と相互作用する3つ以上の量子ビットの系を解析する。
本研究ではデコヒーレンスフリー部分空間の出現と真の絡み合いのダイナミクスに焦点を当てた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:59:16 GMT)
Data Readiness for Scientific AI at Scale [0.0] 本稿では,AIのためのデータ準備性(DRAI)の原則が,基礎モデルのトレーニングに使用されるリーダーシップスケールの科学的データセットにどのように適用されるかを検討する。
我々は, 気候, 核融合, 生物・健康, 材料など, 4つの代表的な領域にわたる古細菌の分析を行った。
我々は、データ準備レベル(AI対応)とデータ処理ステージ(シャードに最も近い)からなる2次元準備性フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:30:37 GMT)
Cryptanalysis of LC-MUME: A Lightweight Certificateless Multi-User Matchmaking Encryption for Mobile Devices [0.0] 送信者の完全秘密鍵を所持することなく,Type-I 敵が有効なテキスト暗号を偽造できることを示す。
本稿では,モバイルコンピューティング環境におけるマッチング暗号方式のセキュリティを強化するための戦略を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:36:52 GMT)
Cooperative effects in feature importance of individual patterns: application to air pollutants and Alzheimer disease [0.0] Local Hi-Fiは、回帰問題における特定の入力特徴を含む高次効果を解消する技術である。
本稿では,これらの3つのスコア(一意,冗長,シナジスティック)をデータセットの各パターンに割り当てる枠組みを提案する。
この結果から,局所的なHi-Fiは,複雑なシステムにおける高次関係を解析すると同時に,XAIの新たな視点を開放する,広範な適用性を示す有望なツールとして位置づけた。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:03:09 GMT)
Convergence Properties of Natural Gradient Descent for Minimizing KL Divergence [0.0] クルバック・リーブラー(KL)の発散を最小化する問題について検討する。
2つの双対座標系の下での勾配に基づく最適化アルゴリズムの挙動を解析する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 08:43:29 GMT)
Compression Method for Deep Diagonal State Space Model Based on $H^2$ Optimal Reduction [0.0] 線形SSMを組み込んだディープラーニングモデルは、シーケンシャルデータにおける長距離依存関係のキャプチャに注目されている。
大きなパラメータサイズは、リソース制約のあるデバイスへのデプロイに問題を引き起こす。
H2$モデルオーダー削減手法を応用して,これらのモデルに対する効率的なパラメータ削減手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:57:54 GMT)
Complete Positivity of Subsystems in Quantum Dynamics [0.0] 完備正負性(CP)とユニタリ性(ユニタリ性)の関係について検討し、そこでは写像が NCP となるためには非ユニタリでなければならない。
システムと環境のチャネルは、結合系環境空間の進化を統一するために、CP(NCP)とCP(CP-indivisible)の両方でなければならないことを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:11:19 GMT)
Cellular automata in $d$ dimensions and ground states of spin models in $(d+1)$ dimensions [0.0] 我々は、$d$次元セルオートマトン(CA)の軌跡を用いて、$(d+1)$次元古典スピンモデルの基底状態を決定する方法を示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 13:52:09 GMT)
CLuP practically achieves $\sim 1.77$ positive and $\sim 0.33$ negative Hopfield model ground state free energy [0.0] 典型的には, ホップフィールド (pm$Hop) モデル基底自由エネルギーについて検討した。
完全昇降ランダム双対性理論(fl RDT)は、CLuP$pm$Hopの固有力学を特徴づけるために用いられる。
CLuP$pm$Hop achieve $sim 1.77$ and $sim 0.33$ as the ground state free energys of the positive and negative Hopfield model。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 05:30:46 GMT)
CLIP-HandID: Vision-Language Model for Hand-Based Person Identification [0.0] 本稿では,犯罪捜査に特化して設計された手動画像を用いた人物識別手法について紹介する。
この手法は特に、性的虐待のような重大犯罪で有用であり、手画像が利用可能な唯一の証拠であることが多い。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 12:01:35 GMT)
Boundary conditions dependence of the phase transition in the quantum Newman-Moore model [0.0] 両空間次元に周期的境界を持つ格子上に横磁場が存在する場合の三角形プラケットモデル(TPM)について検討する。
本稿では, この量子TPMの基底状態相転移へのアプローチを, システムサイズと境界条件の関数として検討する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 14:10:02 GMT)
Asymptotically optimal joint phase and dephasing strength estimation using spin-squeezed states [0.0] 1軸スイッチングされたスピン圧縮状態を含む明示的な$N$-qubitプロトコルを示す。
プロトコルの関連性は、この特定のモデルを超えます。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 18:02:21 GMT)
Approximate combinatorial optimization with Rydberg atoms: the barrier of interpretability [0.0] 最近導入されたCrossing Lattice埋め込みにおいて,2つの解釈戦略が誤りを訂正する能力を評価する。
Rydbergプラットフォームで、スケーラブルで汎用的な品質改善が達成できる可能性は低い。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:22:50 GMT)
Amorphous Solid Model of Vectorial Hopfield Neural Networks [0.0] 非晶質固体の理論から着想を得たホップフィールド連想記憶モデルのベクトル拡張を提案する。
一般化されたヘビアン学習規則は、保存されたパターンベクトルの外積を通してブロック構造重み行列を生成する。
本研究では, このモデルが乱れた材料の定量的構造特性を示すことを示す。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 15:51:54 GMT)
All non-locally Realized Continuous Variable Bipartite Gaussian States are Entangled [0.0] 本研究では,連続可変二分法ガウス状態間の絡み合いと非局所性の関係について検討する。
分析の結果,非局所性には絡み合いが必要とされるが,それでは十分ではないことがわかったが,非局所性は絡み合いを確実にするのに十分である。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:42:35 GMT)
Accident-Driven Congestion Prediction and Simulation: An Explainable Framework Using Advanced Clustering and Bayesian Networks [0.0] 本稿では,事故が混雑に与える影響を予測するための頑健な枠組みを提案する。
我々は,AutoMLによるディープ・エンベディング・クラスタリング(DEC)を実装し,渋滞ラベルを事故データに割り当て,混雑確率を予測する。
提案されたBNモデルは全体の95.6%の精度を達成し、渋滞を引き起こす事故の複雑な関係を理解する能力を示した。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 09:57:08 GMT)
AI-generated stories favour stability over change: homogeneity and cultural stereotyping in narratives generated by gpt-4o-mini [0.0] 私たちは,OpenAIのモデルに対して,プロンプト“1500ワードの潜在的なデシムストーリ”を書いて,236カ国毎に1,800ストーリ(50ストーリ)を生成しました。
物語には表層国家の象徴やテーマが含まれているが、それらは国をまたがる単一の物語のプロット構造に圧倒的に適合している。
その結果は物語的均質化であり、AIが生成し、成長以上の安定性と伝統を優先する合成想像である。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 07:44:28 GMT)
AGITB: A Signal-Level Benchmark for Evaluating Artificial General Intelligence [0.0] 既存の評価フレームワークは、その中核にある一般性を捉えることができず、ガイダンスを提供していない。
汎用人工知能テストベッド(AGITB)は、12の完全自動化可能なテストからなる、新しく自由に利用可能なベンチマークスイートである。
AGITBは、事前訓練、シンボル操作、セマンティックグラウンドをせずに、時間的シーケンスを予測するモデルを必要とする。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:42:12 GMT)
A unified picture for quantum Zeno and anti-Zeno effects [0.0] 量子ゼノ効果は、選択的および非選択的の測定の文脈で研究されている。
ゼノ効果と反ゼノ効果は、測定のようなプロセスが非可換進化と競合するときに現れる統一的な効果のレギュレーションとして明らかにされる。
量子ゼノ効果は、短期量子コンピューティングの将来において、ユビキタスかつ必須である。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 00:12:59 GMT)
A surrogate model for topology optimisation of elastic structures via parametric autoencoders [0.0] 状態(および随伴)問題のパラメトリック解を学ぶ代わりに、提案手法は最適化パイプライン全体のサロゲートバージョンを考案する。
本手法は, 均質化法により最適化された高忠実度トポロジの代理モデルとして, 与えられた問題構成に対する準最適トポロジを予測する。
異なるアーキテクチャを提案し、得られたモデルの近似と一般化能力を数値的に評価する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 10:07:42 GMT)
A Grover-Based Quantum Algorithm for Solving Perfect Mazes via Fitness-Guided Search [0.0] 本稿では、パスフィニングタスクを構造化探索問題としてキャストすることで、完璧な迷路を解くための量子アルゴリズムを提案する。
グロバーの振幅増幅に基づいて、アルゴリズムは重ね合わせ中の全ての候補経路を符号化し、その目標に近接することを評価する。
グロバー互換のオラクルは、高い適合状態を示し、適応的なカットオフ戦略は、探索を反復的に洗練する。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 11:54:42 GMT)
A ChatGPT-based approach for questions generation in higher education [0.0] 大規模言語モデルは実生活の多くの面で広く応用されている。
本稿では、クイズ質問の生成と学習者の評価において、より高い教育者を支援するためのChatGPTの適用について検討する。
生成された質問は、講師や学習者を含む様々な利害関係者に送られた"盲検"調査を通じて評価される。
論文参考訳(メタデータ) (Wed, 30 Jul 2025 03:29:41 GMT)