Fugu-MT: arxivの論文翻訳(概要)

Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities [1584.5]
Gemini 2.5 Proは私たちの最も有能なモデルであり、フロンティアコーディングと推論ベンチマークでSoTAのパフォーマンスを実現しています。 Gemini 2.5 Flashは計算とレイテンシの要求のごく一部で優れた推論機能を提供する。 Gemini 2.0 FlashとFlash-Liteは低レイテンシと低コストでハイパフォーマンスを提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:36:04 GMT)
Embodied AI Agents: Modeling the World [188.9]
本稿では,視覚的,仮想的,物理的形態を具現化したAIエージェントの研究について述べる。我々は,世界モデルの開発が,具体的AIエージェントの推論と計画の中心であることを提案する。また,より優れた人間とエージェントのコラボレーションを実現するために,ユーザのメンタルワールドモデルを学ぶことを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:42:11 GMT)
VLM2Vec-V2: Advancing Multimodal Embedding for Videos, Images, and Visual Documents [105.4]
VLM2Vec-V2は、様々な視覚形態にまたがる埋め込みを学習するための統一的なフレームワークである。まず、MMEBを5つの新しいタスクタイプで拡張する包括的なベンチマークであるMMEB-V2を紹介する。次に、テキスト、画像、ビデオ、ビジュアルドキュメント入力をサポートする汎用埋め込みモデルであるVLM2Vec-V2を訓練する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:51:57 GMT)
Evaluation of OpenAI o1: Opportunities and Challenges of AGI [100.9]
o1-previewは目覚ましい能力を示し、しばしば人間レベルまたは優れたパフォーマンスを実現した。このモデルは、様々な分野にわたる複雑な推論と知識の統合を必要とするタスクに優れていた。総合的な結果は、人工知能への大きな進歩を示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:37:32 GMT)
QuTE: decentralized multiple testing on sensor networks with false discovery rate control [93.1]
本稿では、偽発見率(FDR)の証明可能な保証を備えたグラフ上での分散多重仮説検定法を設計する。異なるエージェントが無向グラフのノードに存在し、各エージェントはそのノードに局所的な1つ以上の仮説に対応するp値を持つ。各エージェントは、グラフ全体の大域的FDRが予め定義されたレベルで制御されなければならないという共同目的のもと、隣人とのみ通信することで、それぞれのローカル仮説の1つ以上の拒絶を個別に決めなければならない。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:51:13 GMT)
Enhancing Long Video Generation Consistency without Tuning [92.2]
単一のプロンプトまたは複数のプロンプトで生成されたビデオの一貫性とコヒーレンスを高めるための課題に対処する。本稿では,時間周波数に基づく時間的注意再重み付けアルゴリズム(TiARA)を提案する。複数のプロンプトによって生成されたビデオに対しては、プロンプトのアライメントがプロンプトの品質に影響を及ぼすといった重要な要因をさらに明らかにする。提案するPromptBlendは,プロンプトを系統的に整列させるプロンプトパイプラインである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:29:03 GMT)
Co-DETECT: Collaborative Discovery of Edge Cases in Text Classification [89.6]
Co-DETECT (Collaborative Discovery of Edge Case in TExt ClassificaTion)は、新しい混合開始型アノテーションフレームワークである。人間の専門知識と、大きな言語モデルでガイドされた自動アノテーションを統合する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:48:54 GMT)
AvatarMakeup: Realistic Makeup Transfer for 3D Animatable Head Avatars [89.3]
AvatarMakeupは、アニメーションを通して最先端のメイクアップ転送品質と一貫性を達成する。コヒーレント複製は、生成した化粧画像中の平均的な顔属性を復号することで、グローバルな紫外線マップを最適化する。実験によると、AvatarMakeupはアニメーションを通して、最先端のメイクアップの質と一貫性を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:53:32 GMT)
GaussRender: Learning 3D Occupancy with Gaussian Rendering [86.9]
GaussRenderは、投影的一貫性を強制することによって3D占有学習を改善するモジュールである。提案手法は,不整合な2次元プロジェクションを生成する3次元構成をペナライズすることにより,より一貫性のある3次元構造を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:05:33 GMT)
Distributional Diffusion Models with Scoring Rules [83.4]
拡散モデルは高品質な合成データを生成する。高品質な出力を生成するには、多くの離散化ステップが必要です。クリーンデータサンプルの後部エム分布を学習し,サンプル生成を実現することを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:03:14 GMT)
Probabilistically Tightened Linear Relaxation-based Perturbation Analysis for Neural Network Verification [83.3]
本稿では,LiRPAに基づく手法とサンプリングに基づく手法を組み合わせることで,厳密な中間到達性集合を計算できる新しいフレームワークを提案する。無視可能な計算オーバーヘッドでは、$textttPT-LiRPA$は推定された到達可能な集合を利用し、ニューラルネットワークの出力の上下線形境界を著しく締め付ける。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:45:53 GMT)
RewardAnything: Generalizable Principle-Following Reward Models [82.2]
リワードモデルは典型的には、固定された嗜好データセットに基づいて訓練される。これにより、様々な現実世界のニーズへの適応が、あるタスクにおける簡潔さから別のタスクにおける詳細な説明への適応を妨げる。一般化可能な原理追従型報酬モデルを導入する。 RewardAnythingは、自然言語の原則を明示的に追従するようにデザインされ、訓練された新しいRMである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:53:22 GMT)
Pre-Trained Policy Discriminators are General Reward Models [81.4]
政策差別学習(POLAR)という,スケーラブルな事前学習手法を提案する。 POLARは報酬モデル(RM)を訓練し、同一のポリシーを識別し、異なるポリシーを識別する。実証実験の結果、POLARは従来の非事前学習法よりも大幅に優れていた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:56:31 GMT)
Controlling What You Share: Assessing Language Model Adherence to Privacy Preferences [80.6]
プライバシプロファイルを使用してデータのコントロールを継続する方法について検討する。ローカルモデルがこれらの命令を使ってクエリを書き換えるフレームワークを構築します。本研究を支援するために,実ユーザクエリの多言語データセットを導入し,プライベートコンテンツをマークする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:22:55 GMT)
PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [80.1]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。 PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:21:05 GMT)
HV-MMBench: Benchmarking MLLMs for Human-Centric Video Understanding [79.1]
MLLM(Multimodal Large Language Models)は、画像とビデオの両方を含む視覚的理解タスクにおいて、大きな進歩を見せている。既存の人間中心のベンチマークは、主にビデオ生成の品質と行動認識を強調し、人間中心のシナリオに必要な知覚と認知の能力を見落としている。我々は,人間中心のビデオ理解におけるMLLMのより総合的な評価を提供するために,厳格にキュレートされたベンチマークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:52:24 GMT)
AIGI-Holmes: Towards Explainable and Generalizable AI-Generated Image Detection via Multimodal Large Language Models [78.1]
AI生成コンテンツ(AIGC)の急速な発展は、誤情報を拡散するAIGIの誤用につながった。大規模で包括的なデータセットであるHolmes-Setを導入し、画像がAI生成されているかどうかを解説したインストラクションチューニングデータセットを含む。本研究は,MLLMの構造化説明と品質管理によるデータ生成を効率化する,Multi-Expert Juryと呼ばれる効率的なデータアノテーション手法を提案する。さらに,視覚専門家による事前学習,教師付き微調整,直接選好最適化を含む3段階学習フレームワークであるHolmes Pipelineを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:00:38 GMT)
FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities [76.5]
MLLM(Multimodal large language model)は、単一のフレームワーク内で視覚的理解と画像生成を統一する言語である。ほとんどの既存のMLLMはAutore(AR)アーキテクチャに依存しており、将来の開発に固有の制限を課している。本稿では,離散フローマッチングに基づく統一マルチモーダルモデルであるFUDOKIを紹介する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:23:56 GMT)
Brain3D: Generating 3D Objects from fMRI [76.4]
被験者のfMRIデータを入力として利用する新しい3Dオブジェクト表現学習手法であるBrain3Dを設計する。我々は,人間の視覚系の各領域の異なる機能的特徴を,我々のモデルが捉えていることを示す。予備評価は、Brain3Dがシミュレーションシナリオで障害した脳領域を正常に識別できることを示唆している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:59:27 GMT)
MedGemma Technical Report [75.7]
MedGemmaは、Gemma 3 4Bと27Bをベースとした医療ビジョン言語基盤モデルの集合体である。 MedGemmaは、画像とテキストの高度な医学的理解と推論を実証する。また、SigLIPから派生した医用目視エンコーダであるMedSigLIPを紹介する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:01:44 GMT)
Model Compression using Progressive Channel Pruning [74.0]
畳み込みニューラルネットワーク(CNN)を高速化するPCP(Progressive Channel Pruning)というフレームワークを提案する。我々のフレームワークは、複数の選択された層から少数のチャンネルを反復的にプルークし、各イテレーションで3ステップの試行選択パイプラインで構成されています。 2つのベンチマークデータセットに関する包括的な実験は、PCPフレームワークが既存のチャネルプルーニングアプローチよりも優れていることを示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:12:03 GMT)
On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.9]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:40:28 GMT)
Bridging Prediction and Intervention Problems in Social Systems [71.4]
我々は,自動意思決定システム(ADS)の影響を考慮した場合,予測重視のパラダイムから介入主義パラダイムに移行する方法を検討する。我々は、予測を決定支援、最終決定、結果とみなすには、予測を超えた新たなデフォルトのADS問題設定が必要であると論じている。本稿では,ADSシステムの設計,実装,評価を行うため,この視点が現代の統計フレームワークや他のツールを統一する方法について述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:29:13 GMT)
Discrete Diffusion Trajectory Alignment via Stepwise Decomposition [70.9]
マスク付き離散拡散モデルに対する新しい選好最適化法を提案する。最終的な出力に報酬を適用し、離散化プロセス全体への勾配をバックプロパゲートする代わりに、問題を段階的にアライメントする目的のセットに分解する。 DNA配列設計、タンパク質の逆フォールディング、言語モデリングを含む複数の領域にわたる実験は、我々のアプローチの優位性を一貫して示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:52:56 GMT)
Heterogeneous User Modeling for LLM-based Recommendation [70.5]
オープンドメインレコメンデーションを進める上で重要な課題は、ユーザの不均一な振る舞いからユーザの好みを効果的にモデル化することだ。 IDベースやセマンティックベースモデリングなど、既存のアプローチでは、一般化の貧弱さに悩まされている。圧縮エンハンサーとロバストネスエンハンサーを組み込んだヘテロジニアス・ユーザ・モデリング(HUM)手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:08:28 GMT)
Physics-Guided Dual Implicit Neural Representations for Source Separation [70.4]
我々は,2つの暗黙的ニューラル表現フレームワークを用いて,ソース分離のための自己教師型機械学習手法を開発した。本手法は,復元に基づく損失関数の最小化により,生データから直接学習する。本手法は,様々な領域にまたがるソース分離問題に対処する汎用的なフレームワークを提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:56:31 GMT)
CritiQ: Mining Data Quality Criteria from Human Preferences [70.4]
人間の嗜好からデータ品質の基準を自動的にマイニングする新しいデータ選択手法であるCritiQを紹介する。 CritiQ Flowはマネージャエージェントを使用して品質基準を進化させ、ワーカーエージェントはペアで判断する。コード,数学,論理領域において,本手法の有効性を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:58:59 GMT)
Dynamic EventNeRF: Reconstructing General Dynamic Scenes from Multi-view RGB and Event Streams [69.7]
動的シーンのボリューム再構成はコンピュータビジョンにおいて重要な問題である。照明が悪く、動きが速い場合には特に困難である。本稿では,スパースなマルチビューイベントストリームとスパースなRGBフレームからシーンを時間的に再構築する手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:25:56 GMT)
CoSteer: Collaborative Decoding-Time Personalization via Local Delta Steering [68.9]
CoSteerは、ローカライズされたデルタステアリングを通じてデコード時のパーソナライズを可能にする、新しいコラボレーティブフレームワークである。トークンレベルの最適化をオンライン学習問題として定式化し、ローカルデルタベクトルがリモートLLMのロジットを動的に調整する。このアプローチは、生のデータや中間ベクトルではなく、最後のステアリングトークンのみを送信することで、プライバシを保護します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:32:29 GMT)
OminiControl: Minimal and Universal Control for Diffusion Transformer [68.3]
我々は,Diffusion Transformer(DiT)アーキテクチャに画像条件をどのように統合するかを再考する,新しいアプローチであるOminiControlを提案する。 OminiControlは3つの重要なイノベーションを通じて、これらの制限に対処する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:33:23 GMT)
Mastering Regional 3DGS: Locating, Initializing, and Editing with Diverse 2D Priors [67.2]
3Dセマンティックパーシングは2Dに比べて性能が劣ることが多く、3D空間内でのターゲット操作がより困難になり、編集の忠実さが制限される。本稿では,2次元拡散編集を利用して各ビューの修正領域を正確に同定し,次に3次元ローカライゼーションのための逆レンダリングを行う。実験により,提案手法は最新技術の性能を実現し,最大4倍のスピードアップを実現した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:15:43 GMT)
Identity-Preserving Text-to-Video Generation Guided by Simple yet Effective Spatial-Temporal Decoupled Representations [67.0]
アイデンティティ保存型テキスト・ツー・ビデオ(IPT2V)生成は、一貫した人間のアイデンティティを持つ高忠実度ビデオを作成することを目的としている。現在のエンドツーエンドフレームワークは、重要な空間的・時間的トレードオフを被る。本稿では,表現をレイアウトの空間的特徴と運動力学の時間的特徴に分解する,シンプルで効果的な空間時空間分離フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:54:44 GMT)
Semantic Frame Interpolation [66.8]
従来のフレームタスクは、主に少数のフレーム、テキストコントロールなし、第1フレームと第2フレームの最小差のシナリオに焦点を当てていた。最近のコミュニティ開発者は、フレーム・ツー・フレーム機能を実現するために、Wanによって表現された大きなビデオモデルを利用している。本稿では、まず、上記の2つの設定を網羅し、複数のフレームレートでの推論をサポートする、学術的定義の観点から、新しい実用的意味フレーム補間(SFI)タスクを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:25:47 GMT)
Enjoying Non-linearity in Multinomial Logistic Bandits [66.4]
我々は,学習者が環境と対話する一般化線形帯域幅の変種である多項ロジスティック帯域幅問題を考察する。我々は、$kappa_*$の定義を多項集合に拡張し、問題の非線形性を活用する効率的なアルゴリズムを提案する。我々のメソッドは、代入$ smashwidetildemathcalO(Kd sqrtT/kappa_*) $, $K$はアクションの数で、$kappa_*
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:18:25 GMT)
AXLearn: Modular Large Model Training on Heterogeneous Infrastructure [64.3]
AXLearnは大規模ディープラーニングモデルのスケーラブルで高性能なトレーニングを容易にする生産用ディープラーニングシステムである。他の最先端のディープラーニングシステムと比較して、AXLearnはモジュール性と異種ハードウェアインフラストラクチャのサポートにユニークな重点を置いている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:50:58 GMT)
Dynamic Regret Reduces to Kernelized Static Regret [63.4]
本研究では,オンライン凸最適化において,任意のベンチマークシーケンスに対して低累積損失を達成することを目的とした動的後悔について検討する。再生ケルネルヒルベルト空間 (RKHS) の形で適切な関数空間を構築することにより、最適$R_T(u_1,ldots,u_T) = MathcalO(sqrtsum_t|u_t-u_t-1|T)$ dynamic regret guarantee。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:09:33 GMT)
Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning [62.4]
本稿では,行動列上のQ値を出力する批判ネットワークを学習する,新しい値に基づく強化学習アルゴリズムを提案する。実験により、CQN-ASは、様々なスパース逆ヒューマノイド制御およびテーブルトップ操作タスクにおいて、いくつかのベースラインより優れていることが示された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:21:42 GMT)
Fast Monte Carlo Tree Diffusion: 100x Speedup via Parallel Sparse Planning [61.7]
最近提案されたモンテカルロ木拡散(MCTD)は,木に基づく探索と拡散を組み合わせて,有望な解を提供する。 Fast-MCTDは、遅延ツリー更新と冗長性認識による並列ロールアウトを可能にするParallel MCTDと、軌道粗大化によるロールアウト長の削減を行うSparse MCTDの2つの技術を統合する。実験により、Fast-MCTDは標準MCTDよりも最大100倍の高速化を実現し、計画性能を維持または改善した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:20:47 GMT)
Open Vision Reasoner: Transferring Linguistic Cognitive Behavior for Visual Reasoning [60.3]
本稿では,Qwen2.5-VL-7Bに基づく2段階のパラダイムを提案する。この先駆的な研究は、3つの基本的な洞察を明らかにしている: 1) 行動伝達は、言語的精神イメージによる冷戦開始時に驚くほど早く出現し、2) 冷戦開始は、視覚行動を広く記憶し、RLは、効果的パターンを批判的に識別し、スケールアップする。得られたモデルであるOpen-Vision-Reasoner (OVR)は、MATH500で95.3%、MathVisionで51.8%、54.6%を含む一連の推論ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:59:03 GMT)
Scaling Collapse Reveals Universal Dynamics in Compute-Optimally Trained Neural Networks [59.6]
計算最適化モデルでは, 極めて高精度な普遍性を示すことを示す。学習速度が減衰すると、崩壊は非常に厳しくなり、モデル間の正規化曲線の差はノイズフロアより下になる。これらの現象は、典型的なニューラルスケーリング法則において、崩壊とパワー・ロー構造を結びつけることによって説明される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:13:26 GMT)
From LLMs to Actions: Latent Codes as Bridges in Hierarchical Robot Control [58.7]
我々は,制限を克服する代替アーキテクチャとして,Learningable Latent Codes as Bridges (LCB)を導入した。 methodoutperforms baselines that leverage pure language as the interface layer on tasks that requires reasoning and multi-step behaviors。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:26:50 GMT)
Monte Carlo Tree Diffusion for System 2 Planning [57.5]
モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。本手法は,木構造化プロセスとしてデノナイジングを再認識し,部分的にデノナイジングした計画を反復的に評価し,刈り取り,精錬する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:30:41 GMT)
Holistic Tokenizer for Autoregressive Image Generation [56.8]
自己回帰(AR)画像生成のための新しい画像トークンであるtextitHita を紹介する。学習可能な全体的クエリとローカルパッチトークンを備えた、全体論的から局所的なトークン化スキームを導入している。実験では、HitaはARジェネレータのトレーニング速度を加速し、バニラ・トークンーザでトレーニングした者を上回る性能を発揮する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:10:39 GMT)
OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation [56.5]
OPERAは、ユーザペルソナ、ブラウザの観察、きめ細かいWebアクション、そして自己報告されたジャストインタイム論理を包括的にキャプチャする最初のパブリックデータセットである。我々は,現在のLCMがユーザの次の行動と合理的性をどの程度予測できるかを評価するための最初のベンチマークを確立する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:44:47 GMT)
NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.4]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:28:47 GMT)
End-to-End Evaluation for Low-Latency Simultaneous Speech Translation [55.5]
本稿では,低遅延音声翻訳の様々な側面を現実的な条件下で実行し,評価するための第1の枠組みを提案する。これには、オーディオのセグメンテーションと、異なるコンポーネントの実行時間が含まれる。また、このフレームワークを用いて低遅延音声翻訳の異なるアプローチを比較する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:47:24 GMT)
Computation-Aware Gaussian Processes: Model Selection And Linear-Time Inference [55.2]
我々は、1.8万のデータポイントでトレーニングされた計算対応GPのモデル選択が、1つのGPU上で数時間以内に可能であることを示す。この研究の結果、ガウス過程は、不確実性を定量化する能力を著しく妥協することなく、大規模なデータセットで訓練することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:51:15 GMT)
Why Do Open-Source LLMs Struggle with Data Analysis? A Systematic Empirical Study [55.1]
データ理解、コード生成、戦略的計画という3つの側面にわたるモデルを評価します。我々はこれらの知見を活用してデータ合成手法を開発し、オープンソースのLCMの分析的推論能力の大幅な改善を実証した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:20:16 GMT)
HiLa: Hierarchical Vision-Language Collaboration for Cancer Survival Prediction [55.0]
生存予測を改善するための新しい階層型視覚・言語協調フレームワークを提案する。具体的には、HiLaは事前訓練された特徴抽出器を使用して、パッチレベルとリージョンレベルの両方でWSIから階層的な視覚的特徴を生成する。このap-proachは、プロンプトから異なる生存関連属性に対応する識別的視覚特徴の包括的学習を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:06:25 GMT)
Attacker's Noise Can Manipulate Your Audio-based LLM in the Real World [54.7]
本稿では,Qwen2-Audioのような音声ベース大規模言語モデル(ALLM)の現実的脆弱性について検討する。敵はステルスなオーディオの摂動を巧みに作り、ALLMを操り、特定のターゲットの動作を示す。ユーザがALLMsと対話するときに、相手のバックグラウンドノイズを再生することで、応答品質を著しく低下させることができることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:29:52 GMT)
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment [54.7]
VideoLifterは、ローカルからグローバルへの戦略を断片的に活用する、新しいビデオから3Dパイプラインである。再建プロセスを大幅に加速し、訓練時間を82%以上削減し、現在のSOTA法よりも視覚的品質を向上した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:03:10 GMT)
RSPO: Regularized Self-Play Alignment of Large Language Models [54.6]
Regularized Self-Play Policy Optimization (RSPO) は、事前のメソッドを統一し、様々な正規化ツールのプラグイン・アンド・プレイ統合を可能にする汎用的でモジュール化されたフレームワークである。 20ドル以上の微調整Mistral-7B-Instructモデルに関する実証研究により、前方KL偏差正規化は応答長を減少させる一方、逆KL偏差は生の利得率を著しく向上させることが明らかとなった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:24:43 GMT)
Towards Exception Safety Code Generation with Intermediate Representation Agents Framework [54.0]
大規模言語モデル(LLM)は、しばしば生成されたコードの堅牢な例外処理に苦しむ。中間表現(IR)アプローチにより,LLM生成コードの例外安全性を実現する新しいマルチエージェントフレームワークであるSeekerを提案する。 Seekerは例外処理をScanner, Detector, Predator, Ranker, Handlerの5つの特殊エージェントに分解する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:56:37 GMT)
Interpretable Reward Modeling with Active Concept Bottlenecks [54.0]
本稿では,解釈可能な嗜好学習を可能にする報酬モデリングフレームワークであるConcept Bottleneck Reward Models (CB-RM)を紹介する。不透明報酬関数に依存する標準的なRLHF法とは異なり、CB-RMは報酬予測を人間の解釈可能な概念に分解する。我々は,最も情報性の高い概念ラベルを動的に取得する能動的学習戦略を定式化する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:26:04 GMT)
NTSFormer: A Self-Teaching Graph Transformer for Multimodal Cold-Start Node Classification [53.4]
隣接するグラフ変換器(NTSFormer) NTSFormerは、自己学習パラダイムを通じて、分離と欠落したモダリティの問題に共同で取り組みます。 NTSFormerはマルチモーダルコールドスタートノード分類タスクにおいて優れた性能を発揮することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:56:12 GMT)
The multimode conditional quantum Entropy Power Inequality and the squashed entanglement of the multimode extreme bosonic Gaussian channels [53.3]
不等式はボゾン量子モードの最も一般的な線形混合の出力の最小条件フォン・ノイマンエントロピーを決定する。ボソニック量子系は、量子状態における電磁放射の数学的モデルを構成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:48:46 GMT)
Parameterized Diffusion Optimization enabled Autoregressive Ordinal Regression for Diabetic Retinopathy Grading [53.1]
本研究は, AOR-DRと呼ばれる新しい自己回帰的順序回帰法を提案する。我々は,糖尿病網膜症分類タスクを,前ステップの予測と抽出画像の特徴を融合させることにより,一連の順序段階に分解する。拡散過程を利用して条件付き確率モデリングを行い、連続的グローバルな画像特徴を自己回帰に利用できるようにする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:22:35 GMT)
Identify, Isolate, and Purge: Mitigating Hallucinations in LVLMs via Self-Evolving Distillation [52.5]
幻覚の問題は信頼性と応用可能性を大幅に制限します既存の緩和方法は、外部ツールやマルチラウンド推論の比較に依存している。我々は, LVLMの内部知識における幻覚を識別し, 分離し, 浄化するtextbfSElf-textbfDistillation (textbfSEED)を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:56:19 GMT)
Multimodal Latent Diffusion Model for Complex Sewing Pattern Generation [52.1]
テキストプロンプト,体形,着物スケッチによって制御される縫製パターンを生成するマルチモーダル生成モデルであるSwingLDMを提案する。潜伏空間における縫製パターンの分布を学習するために,2段階のトレーニング戦略を設計する。総合的定性的および定量的実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:14:46 GMT)
QR-LoRA: Efficient and Disentangled Fine-tuning via QR Decomposition for Customized Generation [52.0]
ビジュアル属性を効果的に分離する構造化パラメータ更新にQR分解を利用する新しい微調整フレームワークであるQR-LoRAを提案する。我々の重要な洞察は、Q行列は自然に異なる視覚的特徴間の干渉を最小化し、上部三角R行列は属性固有の変換を効率的にエンコードするということである。 QR-LoRAは、コンテンツスタイルの融合タスクにおいて、より優れたアンタングル化を実現し、生成モデルにおけるパラメータ効率、非アンタングル化ファインタニングのための新しいパラダイムを確立する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:31:01 GMT)
Robust Molecular Property Prediction via Densifying Scarce Labeled Data [51.6]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。本稿では,未ラベルデータを利用したメタラーニングに基づく新しい手法を提案する。実世界のデータセットに挑戦する上で、大きなパフォーマンス向上を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:07:45 GMT)
Do We Really Need Specialization? Evaluating Generalist Text Embeddings for Zero-Shot Recommendation and Search [51.3]
汎用テキスト埋め込みモデル(GTE)は大規模コーパス上で事前訓練される。 GTEは特別な適応なしに強力なゼロショット性能を保証できることを示す。また、最も情報性の高い方向に着目して埋め込み寸法を圧縮することで、ノイズを効果的に低減できることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:41:52 GMT)
Interpretable Mnemonic Generation for Kanji Learning via Expectation-Maximization [51.3]
本稿では,共通ルールの集合によって駆動されるメニーモニックな構築過程を明示的にモデル化する生成フレームワークを提案する。提案手法は潜在構造と構成規則を学習し,解釈可能な,系統的な調波生成を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:49:23 GMT)
Neural-Driven Image Editing [51.1]
従来の画像編集は手動のプロンプトに依存しており、運動制御や言語能力に制限のある個人には労働集約的でアクセスできない。神経生理学的信号によるハンズフリー画像編集手法であるLoongXを提案する。 LoongXは、23,928の画像編集ペアの包括的なデータセットに基づいてトレーニングされた最先端の拡散モデルを使用している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:31:50 GMT)
Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage [50.8]
MLLM(Multimodal large language model)は、非常に詳細なキャプションを生成するのに優れるが、幻覚を引き起こすことが多い。我々は,LLM-MLLM協調を利用して与えられたキャプションを補正するマルチエージェント手法を提案する。提案手法は, キャプションの精度を向上し, GPT-4Vによるキャプションの精度を向上する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:27:08 GMT)
Accelerated Online Reinforcement Learning using Auxiliary Start State Distributions [50.4]
専門家によるデモンストレーションやシミュレータは任意の状態にリセットできる。この補助分布の選択を安全の概念を用いて通知することは、学習を著しく加速することを発見した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:54:05 GMT)
FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [50.4]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。 Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:09:45 GMT)
LLM Hypnosis: Exploiting User Feedback for Unauthorized Knowledge Injection to All Users [50.2]
ユーザフィードバックで訓練された言語モデルにおける脆弱性について説明する。単一ユーザは、LMの知識と振る舞いを永続的に変更することができる。この攻撃は、モデルがこれまで持っていなかった事実的知識を挿入するのに有効であることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:24:32 GMT)
Building Open-Retrieval Conversational Question Answering Systems by Generating Synthetic Data and Decontextualizing User Questions [49.4]
本稿では,アノテーション付きリアルなOR-CONVQAダイアログを自動生成するパイプラインを提案する。我々は,対話型質問応答対,自己完結型(Decontextualized,例:参照表現なし)バージョンのユーザ質問と提案を生成する。検索された情報と非文化された質問は、システムの応答を生成するLCMに渡される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:16:44 GMT)
Music Boomerang: Reusing Diffusion Models for Data Augmentation and Audio Manipulation [49.1]
音楽オーディオの生成モデルは、典型的にはテキストプロンプトやメロディのみに基づいて出力を生成するために使用される。画像領域に対して最近提案されたブーメランサンプリングでは,任意の事前学習拡散モデルを用いて,既存の例に近い出力を生成することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:46:07 GMT)
Put Teacher in Student's Shoes: Cross-Distillation for Ultra-compact Model Compression Framework [48.7]
We introduced Edge Ultra-lIte BERT framework with a novel cross-distillation method。我々は,自然言語理解(NLU)タスクにおいて,たった1.91MBの非常にコンパクトなBERTモデルを実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:38:09 GMT)
XiYan-SQL: A Novel Multi-Generator Framework For Text-to-SQL [48.5]
本稿では,複数の候補を効果的に生成・活用する革新的なフレームワークであるXiYan-を提案する。 XiYan-はBIRDベンチマークで75.63%の新しいSOTA性能を達成した。また、スパイダーテストセットのSOTA性能も89.65%の精度で達成した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:50:46 GMT)
ArtifactsBench: Bridging the Visual-Interactive Gap in LLM Code Generation Evaluation [48.2]
ArtifactsBenchは自動ビジュアルコード生成評価のためのフレームワークである。我々のフレームワークは、生成した各アーティファクトをレンダリングし、時間的スクリーンショットを通してその動的な振る舞いをキャプチャする。我々は1,825の多様なタスクの新しいベンチマークを構築し、30以上の主要な大規模言語モデルを評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:53:00 GMT)
Towards Solving More Challenging IMO Problems via Decoupled Reasoning and Proving [48.2]
最近の研究では、非公式な精度は80%を超え、公式な成功はPutnamBenchのようなベンチマークで8%以下である。低レベルの証明生成から高レベルの推論を分離する新しいフレームワークを提案する。提案手法は,2000年以降のIMO問題に対して,従来のオープンソース証明者が未報告の課題として評価した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:38:49 GMT)
Navigating Sparse Molecular Data with Stein Diffusion Guidance [48.2]
最適制御(SOC)は、微調整拡散モデルのための原則的フレームワークとして登場した。予測されたクリーンなサンプルに対して,既成の分類器を用いて拡散モデルを導出する,トレーニング不要な手法のクラスが開発されている。本稿では,サロゲート最適制御目標に基づく新しいトレーニングフリーガイダンスフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:14:27 GMT)
Boosting Temporal Sentence Grounding via Causal Inference [48.0]
テンポラル・センテンス・グラウンディング(Temporal Sentence Grounding)は、あるテキストクエリに意味的に対応するビデオ中の関連モーメントを特定することを目的としている。これらの素因的相関は,(1) 特定の動詞や句の頻繁な共起など,テキストデータに固有の偏り,(2) ビデオコンテンツにおける顕著なパターンや反復パターンに過度に適合する傾向,の2つの要因から生じる。本稿では, 因果推論を利用した新たなTSGフレームワーク, 因果介入, 反ファクト推論を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:01:06 GMT)
OpenS2S: Advancing Open-Source End-to-End Empathetic Large Speech Language Model [47.8]
我々は,共感型音声対話を実現するために設計された,完全にオープンソースで透明でエンドツーエンドのLSLMであるOpenS2Sを提案する。我々の共感型音声テキストモデルBLSP-Emoに基づいて、OpenS2Sは低レイテンシ音声生成を実現するためにストリーミングインターリーブデコードアーキテクチャを用いる。大規模言語モデルを利用して共感的コンテンツを生成し,テキスト音声システムを制御することにより,多言語多言語多様度を有するスケーラブルな学習コーパスを構築する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:31:37 GMT)
Fairness Evolution in Continual Learning for Medical Imaging [47.5]
本研究では、ドメイン固有の公平度指標を用いてタスク間でバイアスがどのように進化し、異なるCL戦略がこの進化にどのように影響するかを検討する。以上の結果から,擬似ラベルと擬似ラベルの学習は最適分類性能を実現するが,擬似ラベルの偏りは小さいことが示唆された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:41:32 GMT)
LVM4CSI: Enabling Direct Application of Pre-Trained Large Vision Models for Wireless Channel Tasks [47.2]
LVM4CSIは複雑なチャネル状態情報をコンピュータビジョン(CV)モデルと互換性のある視覚形式にマッピングするフレームワークである。タスク特化ニューラルネットワーク(NN)に匹敵する、あるいは優れたパフォーマンスを実現する。トレーニング可能なパラメータの数を大幅に削減し、タスク固有のNN設計の必要性を排除します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:33:55 GMT)
SciMaster: Towards General-Purpose Scientific AI Agents, Part I. X-Master as Foundation: Can We Lead on Humanity's Last Exam? [47.2]
本稿では,人間研究者をエミュレートするツール強化推論エージェントであるX-Masterを紹介する。 XマスターズはHumanity's Last Examに32.1%のスコアで最新記録を樹立した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:50:52 GMT)
Learn 3D VQA Better with Active Selection and Reannotation [46.7]
3D VQAでは、回答の自由な形式の性質は、データセット全体をトレーニングする際にモデルを混乱させたり誤解させたりする不適切なアノテーションにつながることが多い。本稿では,モデルのセマンティックな不確実性に基づいてデータを選択する多ターン対話型能動学習戦略を提案する。実験ではモデルの性能が向上し、トレーニングコストが大幅に削減され、比較的高い精度を達成するためのトレーニングコストが半減する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:18:54 GMT)
Early-Exit and Instant Confidence Translation Quality Estimation [46.1]
本研究では,(1)スケールにおける品質推定のコスト削減,(2)品質推定のための安価な不確実性推定手法の開発,という2つの課題に対処する。後者に対処するため,従来の手法の性能を若干のコストで一致させる不確実性を考慮した品質評価モデルであるInstant Confidence COMETを導入する。我々はこれを、初期のモデル層ですでに品質スコアと関連する信頼度を計算できる品質評価モデルであるEarly-Exit COMETに拡張し、計算の早期実行と評価コストの削減を可能にします。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:42:38 GMT)
Training-Free Query Optimization via LLM-Based Plan Similarity [46.0]
LLM-PM (LLM-based Plan Mapping) は,クエリのデフォルト実行プランを埋め込んだフレームワークである。 JOB-CEBベンチマークで評価したところ、LLM-PMは平均21%のレイテンシ低減を実現している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:14:21 GMT)
Multi-Photon Quantum Rabi Models with Center-of-Mass Motion [45.7]
本稿では,多価ロンバダの原子を空洞内で記述するための厳密な第二量子化フレームワークを提案する。このアプローチの重要な特徴は、ハミルトニアン平均化理論の原子場作用素への体系的応用である。顕著な発見は、粒子-粒子相互作用の出現である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:50:48 GMT)
Extended Inductive Reasoning for Personalized Preference Inference from Behavioral Signals [45.0]
本稿では,大規模言語モデル(LLM)の拡張帰納的推論について検討する。本稿では,ユーザのインタラクション履歴の行動信号から体系的な選好推定を可能にするモデルであるAlignXploreを提案する。我々は、AlignXploreが、ドメイン内およびドメイン外のベンチマークで平均15.49%、バックボーンモデルよりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:38:20 GMT)
VerifyLLM: LLM-Based Pre-Execution Task Plan Verification for Robots [45.0]
本研究では,シミュレータや実環境で実行する前に,タスクプランを自動的に検証するアーキテクチャを提案する。このモジュールは、Large Language Modelsの推論機能を使用して、論理的一貫性を評価し、計画の潜在的なギャップを特定する。我々は,タスク計画の信頼性と効率の向上に寄与し,自律システムにおける堅牢な事前実行検証の必要性に対処する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:31:36 GMT)
Engineering giant transmon molecules as mediators of conditional two-photon gates [45.0]
我々は、非局所結合トランスモン「分子」の配列を用いて、導波路光子の受動光制御ゲートを設計する方法を示す。我々の研究は、マイクロ波フォトニック量子コンピューティングデバイスの重要な要素として、巨大原子の使用を開放する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:03:59 GMT)
Foreground-aware Virtual Staining for Accurate 3D Cell Morphological Profiling [44.7]
スポットライト(Spotlight)は、モデルが関連する細胞構造に焦点を合わせるための仮想染色手法である。 Spotlightはピクセルレベルの精度を維持しながら形態表現を改善し、セグメント化やプロファイリングといった下流タスクに適した仮想染色を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:11:56 GMT)
Quantifying Robustness: A Benchmarking Framework for Deep Learning Forecasting in Cyber-Physical Systems [44.6]
我々は,産業用CPSに合わせて,分散ロバスト性に基づく実用的ロバスト性定義を導入する。本フレームワークは,センサドリフト,ノイズ,不規則サンプリングなどの現実的な乱れをシミュレートし,予測モデルの徹底的なロバスト性解析を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:25:29 GMT)
Tractable Transformers for Flexible Conditional Generation [44.5]
本稿では,異なる条件生成タスクに対してより堅牢なトランスフォーマーベース生成モデルであるTracformerを提案する。完全な入力から派生したグローバルコンテキスト機能のみに依存する既存のモデルとは異なり、Tracformersはスパーストランスフォーマーエンコーダを内蔵し、ローカルおよびグローバルコンテキスト情報の両方をキャプチャする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:57:56 GMT)
Mitigating Shortcut Learning with InterpoLated Learning [44.4]
経験的リスク最小化はショートカットを利用するモデルにインセンティブを与える。既存のショートカット緩和アプローチは、モデル固有であり、チューニングが困難であり、計算コストが高く、学習された表現を改善するのに失敗している。本稿では,多数例の表現を補間する補間学習を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:49:46 GMT)
Fine-Grained Captioning of Long Videos through Scene Graph Consolidation [44.3]
グラフ統合に基づく長大なビデオキャプションのための新しいフレームワークを提案する。提案手法はまず,個々のフレームや短いビデオ間隔に対応するセグメントレベルのキャプションを生成する。軽量なグラフからテキストへのデコーダが最後にビデオレベルのキャプションを生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:25:02 GMT)
Information-Guided Diffusion Sampling for Dataset Distillation [44.2]
拡散モデル(DM)はこのタスクを約束しているが、低画像/クラス(IPC)設定で苦労している。蒸留データセットが保持しなければならない2つの重要な種類の情報を特定する。 Tiny ImageNetおよびImageNetサブセットの実験では、情報誘導拡散サンプリング(IGDS)が既存の手法よりも大幅に優れていた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:27:08 GMT)
UniForm: A Unified Multi-Task Diffusion Transformer for Audio-Video Generation [44.2]
UniFormはマルチタスク拡散変換器であり、音声と視覚の両方を共有潜在空間で生成する。統一された認知ネットワークを使用することで、UniFormは音と視覚の固有の相関をキャプチャする。大規模言語モデルと大規模テキスト・オーディオ・ビデオ複合データセットを活用することで、UniFormは以前のアプローチよりも優れた生成多様性を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:40:56 GMT)
Beyond Simple Edits: X-Planner for Complex Instruction-Based Image Editing [43.4]
X-Plannerは、ユーザの意図をモデル機能の編集に橋渡しする計画システムである。 X-プラナーは、複雑な命令をより単純で明確なサブ命令に体系的に分解するために、チェーン・オブ・シント推論を用いる。各サブインストラクションに対して、X-Plannerは、自動的に正確な編集タイプとセグメンテーションマスクを生成し、手作業による介入を排除し、ローカライズされたアイデンティティ保存編集を保証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:59:56 GMT)
Robustifying 3D Perception through Least-Squares Multi-Agent Graphs Object Tracking [43.1]
本稿では,3次元LiDARシーンにおける対向雑音に対する新たな緩和フレームワークを提案する。我々は最小二乗グラフツールを用いて各検出の遠心点の位置誤差を低減する。実世界のV2V4Realデータセットに関する広範な評価研究は、提案手法がシングルエージェントとマルチエージェントの両方のトラッキングフレームワークよりも大幅に優れていることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:41:08 GMT)
Narrowing the Gap: Supervised Fine-Tuning of Open-Source LLMs as a Viable Alternative to Proprietary Models for Pedagogical Tools [42.8]
この研究は、Supervised Fine-Tuning (SFT)を通じて強化された、より小型で専門化された言語モデルが、教育ツールのより実用的な代替手段であることを示す。そこで本研究では,CS1/2(Real Introductory Programming)とCS1/2(Real Introductory Programming)を併用した,4万個のCコンパイラのエラー説明データセットを構築した。以上の結果から,SFTは小型モデルの教育的品質を著しく向上させ,より大きなモデルに匹敵する性能を実現している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:03:49 GMT)
Enabling Security on the Edge: A CHERI Compartmentalized Network Stack [42.8]
CHERIは、きめ細かい区画化とメモリ保護を可能にすることにより、ハードウェアレベルでの強力なセキュリティを提供する。ケーススタディでは,Arm Morelloプラットフォーム上にデプロイされたCheriBSDシステム上での分離アプリケーション,TCP/IPライブラリ,ネットワークドライバのトレードオフについて検討した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:37:59 GMT)
HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models [42.6]
テキストのプロンプトによって駆動される現実的な3次元物体間相互作用(HOI)を創出する問題に対処する。まず、入力テキストに条件付けされた人間と物体の両方の動きを生成するための二重分岐拡散モデル(HOI-DM)を開発する。また,人間と物体の接触領域を予測するためのアベイランス予測拡散モデル(APDM)を開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:09:32 GMT)
Looking elsewhere: improving variational Monte Carlo gradients by importance sampling [41.9]
ニューラルネットワーク量子状態(NQS)は、量子多体波動関数を表現するために強力で表現力のあるアンサッツを提供する。量子化学で現れる急激なピーク波動関数のようないくつかのシナリオは、変動最適化の有効性を阻害する高分散勾配推定器をもたらすことが知られている。本研究では、適応的に調整された重要度サンプリングを用いて、これらのサンプリング問題に取り組むための体系的戦略について検討する。提案手法により,バニラVMCの計算コストを,高ピークの量子化学波動関数をターゲットとした場合,最大100倍に削減できる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:03 GMT)
Can Prompt Difficulty be Online Predicted for Accelerating RL Finetuning of Reasoning Models? [41.7]
本研究では任意のプロンプトの反復的近似評価について検討する。 Model Predictive Prompt Selection (MoPPS)はベイズにおけるリスク予測フレームワークである。 MoPPSは迅速な困難を確実に予測し、ロールアウトを大幅に削減したトレーニングを加速する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:20:52 GMT)
Exploring Semantic Clustering and Similarity Search for Heterogeneous Traffic Scenario Graph [41.3]
まず,交通シナリオを表現するための表現的かつ柔軟な異種時間グラフモデルを提案する。次に,シナリオグラフに対する普遍的な埋め込み空間を学習するための自己教師付き手法を提案する。特に、ブートストラップに基づくアプローチとともに、対照的な学習を実装し、シナリオ空間に対するそれらの適合性を評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:10:03 GMT)
SMART: Simulated Students Aligned with Item Response Theory for Question Difficulty Prediction [41.3]
本稿では、シミュレーションされた学生を指導力で整列させる新しい方法SMART(Simulated Students Aligned with IRT)を提案する。 SMARTは、その改善された能力アライメントを活用することで、他の項目の難易度予測手法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:41:38 GMT)
Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards [41.1]
本稿では,人選好に基づく報酬関数のトレードオフを扱うための社会選択言語モデルを提案する。実験により、我々のモデルはより効果的で、整合性があり、バランスの取れた報酬関数を確実に選択できることを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:48:03 GMT)
VOTE: Vision-Language-Action Optimization with Trajectory Ensemble Voting [40.8]
視覚言語行動(VLA)モデルは、自然言語で案内されるロボット操作タスクにおいて優れた性能を示している。既存の多くのアプローチは、一般化を改善するために、深さ推定、セグメンテーション、あるいは拡散のような追加のコンポーネントを統合する。 VLAモデルの最適化と高速化のための効率的で汎用的なフレームワークVOTEを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:30:55 GMT)
Adversarial Machine Learning Attacks on Financial Reporting via Maximum Violated Multi-Objective Attack [40.4]
悪質な俳優は、主に苦しむ企業であり、彼らの苦悩を隠蔽し、個人の利益を導き出すために財務報告を操作したいというインセンティブと欲求を持っている。既存の攻撃方法は、攻撃者が成功するためにはどちらも満足しなければならない反相関的な目的のために、このデータでは機能しない。我々は,攻撃者の探索方向に応じた最大暴力的多目的攻撃(MVMO)を導入する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:45:46 GMT)
Riemannian Complex Hermit Positive Definite Convolution Network for Polarimetric SAR Image Classification [40.4]
我々はリーマン多様体上でHPD行列を直接処理する新しいフレームワークHPDNetを提案する。提案したHPDnetは複数のHPDマッピング層と整流層から構成され、データの幾何学的構造を保存できる。複雑なLogEig層は、多様体データを接空間に投影し、従来のユークリッドに基づくディープラーニングネットワークを適用して、分類のための文脈的特徴をさらに抽出することを保証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:20:28 GMT)
Exploring Core and Periphery Precepts in Biological and Artificial Intelligence: An Outcome-Based Perspective [40.2]
汎用インテリジェンスのエンジニアリングには,システム原則の新たなセットが必要だ,と私たちは主張する。我々は,抽象システム理論に根ざした新しい概念的枠組みである「中核と周辺」の原則と要求変数の法則を紹介する。本稿では,生物と人工知能の両方に適用性を示し,抽象理論を実世界の実装でブリッジする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:15:01 GMT)
ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment [40.1]
外科的スキル評価において、OATS(Objective Assessments of Technical Skills)とGRS(Global Rating Scale)は、訓練中の外科医を評価するための確立されたツールである。最近の研究は、運動データ、ビデオ、またはそれらの組み合わせからGRSスコアを回帰することに焦点を当てている。我々は,OSATSのスコアを集計し,外科的臨床試験において臨床的に有意な変動を見落としているため,GRSのみの回帰は限界であると主張している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:58:14 GMT)
Towards General Continuous Memory for Vision-Language Models [40.0]
言語モデル(LM)とその拡張である視覚言語モデル(VLM)は、様々なタスクで顕著なパフォーマンスを実現している。彼らはまだ、マルチモーダルまたはマルチリンガルな実世界の知識を必要とする複雑な推論タスクに苦慮している。本稿では,マルチモーダルおよび多言語知識を表現するために,連続記憶(continuous memory)という高密度埋め込みのコンパクトな集合を提案する。我々のアプローチであるCoMEMは、VLMの本来の能力を利用して、任意のマルチモーダルおよび多言語知識をたった8つの連続的な埋め込みにエンコードする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:01:47 GMT)
When Imitation Learning Outperforms Reinforcement Learning in Surgical Action Planning [39.9]
今回,CholecT50の手術行動計画において,ILとRLの総合的な比較を行った。 DARILベースラインは、34.6%のアクショントリプレット認識mAPと33.6%の次フレーム予測mAPを達成し、10秒水平線で29.2%のスムーズな計画劣化を実現した。分析の結果,有意なRLポリシーよりも,専門家アノテートされたテストセット上での分布マッチングがILを体系的に好んでいることが明らかとなった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:49:57 GMT)
Spin-dependent routing of optical beams in the bulk of twisted anisotropic media [39.6]
不均一な異方性材料内で伝播する光ビームに対する新しい種類のフォトニックスピンホール効果(PSHE)について論じる。回転角は有効ゲージ場の役割を担っている。ねじれ分布が奇対称であるとき、光学ビームはそのヘリシティに応じてミラー対称軌道に沿って移動する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:29:08 GMT)
SPATIA: Multimodal Model for Prediction and Generation of Spatial Cell Phenotypes [39.5]
本研究では,空間転写学のマルチスケール生成予測モデルであるSPATIAを紹介する。 SPATIAは、画像由来のモルフォロジートークンと転写ベクタートークンを融合させることで、細胞レベルの埋め込みを学習する。われわれはSPATIAを12のタスクにまたがる13の既存モデルに対してベンチマークする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:54:02 GMT)
DriveX: Driving View Synthesis on Free-form Trajectories with Generative Prior [39.2]
DriveXは、新しいフリーフォーム駆動ビュー合成フレームワークである。生成を最適化中に3次元ガウスモデルに蒸留する。記録された軌道を超える高品質なビュー合成をリアルタイムで達成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:47:54 GMT)
Model-free Posterior Sampling via Learning Rate Randomization [38.8]
我々は、マルコフ決定過程(MDP)における後悔最小化のための新しいランダム化モデルフリーアルゴリズムであるランダム化Q-ラーニング(RandQL)を紹介する。 RandQLはボーナスを使わずに楽観的な探索を実現し、代わりに学習率ランダム化という新しいアイデアに依存している。我々の実証的研究は、RandQLがベースライン探索環境における既存のアプローチより優れていることを示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:13:25 GMT)
Human2LocoMan: Learning Versatile Quadrupedal Manipulation with Human Pretraining [38.6]
我々は,人間とロコマンの双方から収集したデータを活用して,四面体操作のためのクロス・エボディメント・模倣学習システムを提案する。我々は,6つの実世界の操作タスクにおいて,平均成功率を41.9%向上させるシステムの有効性を検証した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:59:32 GMT)
Learn Globally, Speak Locally: Bridging the Gaps in Multilingual Reasoning [38.5]
ジオファクトX(GeoFact-X)は、5つの言語で注釈付き推論トレースを持つ地理ベースの多言語事実推論ベンチマークである。本稿では,教師付き微調整およびテスト時間強化学習を指導する新しいトレーニング手法BRIDGEを提案する。その結果,BRIDGEは多言語推論の忠実度を著しく向上させることがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:04:36 GMT)
ICAS: Detecting Training Data from Autoregressive Image Generative Models [38.2]
トレーニングデータ検出は、モデルトレーニングにおける不正なデータ使用を識別するための重要なタスクとして登場した。我々はこの領域に会員推定を適用した最初の研究を行う。我々の手法は、様々なデータ変換の下で強い堅牢性と一般化を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:50:42 GMT)
LoRA-Augmented Generation (LAG) for Knowledge-Intensive Language Tasks [38.0]
大規模知識ライブラリとタスク固有のLoRAアダプタを活用するために,LAG(LoRA-Augmented Generation)を提案する。我々は,各種知識集約タスクにおけるRAGの評価を行い,既存のデータフリー手法よりも優れた性能を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:01 GMT)
Beyond Features: How Dataset Design Influences Multi-Agent Trajectory Prediction Performance [37.9]
本研究は,マルチエージェント設定における特徴選択,クロスデータセット転送,地理的多様性が軌道予測精度に与える影響について検討する。我々は,ドイツと米国における我々のデータ記録に基づいて,我々の新しいL4モーション予測データセットを用いて最先端のモデルを評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:18:51 GMT)
Harnessing Pairwise Ranking Prompting Through Sample-Efficient Ranking Distillation [37.7]
Pairwise Ranking Prompting (PRP) with Large Language Models (LLMs) は、最も効果的なゼロショット文書ランキング手法の一つである。本稿では,PRPの対蒸留による有効性を活用することを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:38:43 GMT)
Active Stereo in the Wild through Virtual Pattern Projection [37.5]
本稿では、信頼できない物理パターンプロジェクタを深度センサに置き換えることで、アクティブステレオの原理を模倣する新しい汎用ステレオパラダイムを提案する。これは、従来のステレオカメラが取得した左右の画像にシーン形状と整合した仮想パターンを投影し、奥行きセンサーから得られたスパースヒントを用いて機能する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:07:56 GMT)
Epistemically-guided forward-backward exploration [37.5]
報酬のない最適政策を学習するための有望な方法として、フォワード・バックワード表現(FB)が出現している。我々は、より効率的に学習するために、FB表現は基本的に探索に使用されるべきであると論じる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:09:16 GMT)
SegmentDreamer: Towards High-fidelity Text-to-3D Synthesis with Segmented Consistency Trajectory Distillation [37.3]
テキスト・ツー・3D生成の最近の進歩は、スコア蒸留サンプリング(SDS)とそのバリエーションの視覚的品質を改善している。自己整合性と相互整合性の不均衡のため、CDベースの手法は本質的に不適切な条件ガイダンスに悩まされる。我々は,高忠実度テキスト・ツー・3D生成のための一貫性モデルの可能性を完全に解き放つために設計された新しいフレームワークであるSegmentDreamerを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:59:05 GMT)
Mirror Online Conformal Prediction with Intermittent Feedback [36.6]
本研究は、事前知識を統合する新しい実行時キャリブレーションフレームワークであるIM-OCP(Intermittent mirror online conformal prediction)を導入する。 IM-OCPは、任意のデータシーケンスに対して決定論的に保持する、長期にわたるカバレッジとサブ線形後悔を保証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:06:40 GMT)
MolX: Enhancing Large Language Models for Molecular Understanding With A Multi-Modal Extension [36.3]
タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。本研究は, 分子の理解能力を高めるために, MolX と呼ばれるマルチモーダル外部モジュールを組み込むことにより, LLM の分子理解能力を高めることを目的とする。手作りの分子指紋は、その埋め込みドメイン知識を活用するために組み込まれている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:25:24 GMT)
Interaction-Merged Motion Planning: Effectively Leveraging Diverse Motion Datasets for Robust Planning [35.6]
対象領域への適応中に異なる領域で訓練されたパラメータチェックポイントを活用する新しい手法であるInteraction-Merged Motion Planning (IMMP)を提案する。エージェントの動作とインタラクションをキャプチャし、ソースドメインから多種多様な情報を十分に抽出するためのマージと、適応可能なモデルを構築するためのマージである。提案手法は,様々な計画ベンチマークやモデルを用いて評価し,従来の手法に比べて優れた性能を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:11:45 GMT)
The Role of Deductive and Inductive Reasoning in Large Language Models [35.4]
本稿では,大規模言語モデル(LLM)推論を強化するために,DID法を提案する。 DIDはリトルストーン次元と情報エントロピーを組み合わせた2次元複雑度評価システムを実装している。その結果,推理精度と解の精度は有意に向上した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:41:53 GMT)
Bayesian Optimization for Controlled Image Editing via LLMs [34.6]
BayesGenieは、大規模言語モデルとベイズ最適化を統合する、既定のアプローチである。本手法により,手動の領域マークを使わずに,自然言語による画像の修正が可能となる。筆者らのフレームワークは,編集精度と意味保存の両面で,既存の手法を著しく上回っている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:39:40 GMT)
Structure-Guided Diffusion Models for High-Fidelity Portrait Shadow Removal [34.4]
拡散型ポートレートシャドウ除去手法を提案する。まず,種々の合成照明条件を持つ実世界のポートレートデータセット上で,影に依存しない構造抽出ネットワークを訓練する。その後、構造地図は、影を生成的に除去する構造誘導塗布拡散モデルを訓練するための条件として使用される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:19:07 GMT)
Why We Feel What We Feel: Joint Detection of Emotions and Their Opinion Triggers in E-commerce [34.3]
本稿では,感情検出とオピニオントリガー抽出を統合化するタスクを提案する。 EOT-Xは、微妙な感情と意見のトリガーを持つ2,400のレビューの人間による注釈付きコレクションである。本稿では,体系的推論と自己回帰を備えた構造化プロンプトフレームワークであるEOT-DETECTを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:59:37 GMT)
LLMs as Architects and Critics for Multi-Source Opinion Summarization [34.3]
M-OS(Multi-source Opinion Summarization)は、従来の意見要約を超えて拡張される。マルチソースの意見要約を評価するためのベンチマークデータセットであるM-OS-EVALを紹介する。我々の実験は、事実に富んだ要約によってユーザーのエンゲージメントが向上することを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:27:44 GMT)
"This Suits You the Best": Query Focused Comparative Explainable Summarization [34.3]
M-OS(Multi-Source Opinion Summarization)を用いたQF-CES(Query-Focused Comparison Explainable Summaries)の作成手法を提案する。 MS-Q2Pはメタデータを持つ22,500の推奨製品にマッピングされた7,500のクエリで構成されている。当社のアプローチはパーソナライズ、プライバシ保護、レコメンデーションエンジン非依存、カテゴリ非依存です。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:58:15 GMT)
Phantom Subgroup Poisoning: Stealth Attacks on Federated Recommender Systems [34.2]
フェデレートされたレコメンデーションシステム(FedRec)は、パーソナライズされたレコメンデーションを提供するための有望なソリューションとして登場した。既存の攻撃は通常、ユーザグループ全体を対象としており、ステルスを妥協し、検出のリスクを増大させる。特定のユーザサブグループのレコメンデーションを操作するために設計された最初の標的毒殺攻撃であるSp attackを導入する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:40:16 GMT)
PointGAC: Geometric-Aware Codebook for Masked Point Cloud Modeling [33.7]
仮面クラウドモデリング(MPM)手法は、マスクされた領域の詳細を学習するためにモデルを過剰に制約する傾向がある。マスク領域の特徴分布の整合化を目的とした,クラスタリングに基づく新しいMPM手法である textbftextitPointGAC を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:21:28 GMT)
SimLab: A Platform for Simulation-based Evaluation of Conversational Information Access Systems [33.5]
我々は,対話型システムとユーザシミュレータの両方を,制御および再現可能な環境でベンチマークする,最初のクラウドベースのプラットフォームであるSimLabを紹介した。我々は,SimLabの初期バージョンの設計と実装について紹介し,その特徴を対話型映画レコメンデーションの初期評価タスクで示す。本論文は,対話型情報アクセスとユーザシミュレーションの分野における進歩を促進するために,コミュニティがプラットフォームにコントリビュートするよう呼びかけるものである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:19:28 GMT)
DANCE: Resource-Efficient Neural Architecture Search with Data-Aware and Continuous Adaptation [33.1]
DANCE(Dynamic Architectures with Neural Continuous Evolution)を提案する。 DANCEでは、スムーズな適応を可能にする継続的アーキテクチャ分布、効率的なサンプリングのための学習された選択ゲートを備えた統一アーキテクチャ空間、効率的なデプロイメント最適化のためのマルチステージトレーニング戦略の3つの重要なイノベーションを紹介している。提案手法は,検索コストを大幅に削減しつつ,精度面で最先端のNAS手法より一貫して優れている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:22:55 GMT)
PLACE: Prompt Learning for Attributed Community Search [33.0]
PLACE(Prompt Learning for Attributed Community Search)は、ACSのための革新的なグラフプロンプト学習フレームワークである。 Placeは、構造的かつ学習可能なプロンプトトークンをクエリ依存の洗練メカニズムとしてグラフに統合し、プロンプト拡張グラフを形成する。 9つの実世界のグラフの実験において、PLACEは平均的な最先端のグラフに比べて22%高いF1スコアを達成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:48:09 GMT)
DC-AR: Efficient Masked Autoregressive Image Generation with Deep Compression Hybrid Tokenizer [32.6]
DC-ARは、マスク付き自己回帰(AR)テキスト・ツー・イメージ生成フレームワークである。優れた画像生成品質と計算効率を両立させる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:45:23 GMT)
AniCrafter: Customizing Realistic Human-Centric Animation via Avatar-Background Conditioning in Video Diffusion Models [32.3]
textbfAniCrafterは、最先端のImage-to-Video(I2V)拡散アーキテクチャ上に構築された、拡散に基づく人間中心のアニメーションモデルである。我々のモデルは、オープンドメインの人間中心のアニメーションを復元タスクとして再構成する、革新的な「アバターバックグラウンド」条件付け機構を組み込んでいる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:56:30 GMT)
ChipSeek-R1: Generating Human-Surpassing RTL with LLM via Hierarchical Reward-Driven Reinforcement Learning [32.1]
ChipSeek-R1は、大規模な言語モデルのための階層的な報酬駆動強化学習フレームワークである。関数的正当性とPPA最適化の両方のRTLコードを生成する。 RTLLMのベンチマークでは、ChipSeek-R1はオリジナルの人間の書いたコードのPPAメトリクスを超える27のRTL設計を作成した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:08:20 GMT)
LIFT: Automating Symbolic Execution Optimization with Large Language Models for AI Networks [31.7]
LIFT(Large- Language-model Integrated Functional-equivalent-IR Transformation)は、シンボル実行における中間表現(IR)の最適化を自動化する新しいフレームワークである。実世界のバイナリの実験では、パフォーマンスが大幅に向上した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:26:56 GMT)
Cascade: Token-Sharded Private LLM Inference [31.6]
本稿では,シークエンス次元のシャーディングを利用してプライバシを維持することで,時間的コストを回避するマルチパーティ推論プロトコルCascadeを提案する。我々はカスケードが他の統計的プライバシスキームに対して非常に効果的である最近の攻撃の一般化に耐性があることを実証した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:37:16 GMT)
Domain-Adaptive Diagnosis of Lewy Body Disease with Transferability Aware Transformer [31.5]
LBD診断における大きな障害は、深層学習の有効性を制限するデータ不足である。本稿では,アルツハイマー病(AD)からの知識を応用し,LBDの診断を促進するトランスファービリティ・アウェア・トランスフォーマー(TAT)を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:28:39 GMT)
CueLearner: Bootstrapping and local policy adaptation from relative feedback [31.0]
相対的なフィードバックは、ユーザビリティと情報豊かさのバランスを提供します。これまでの研究では、ポリシー探索手法の強化に相対的なフィードバックが利用できることが示されている。相対的なフィードバックから学習する新しい手法を導入し,それを非政治的強化学習と組み合わせる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:54:28 GMT)
EmbodieDreamer: Advancing Real2Sim2Real Transfer for Policy Training via Embodied World Modeling [30.7]
EmbodieDreamerは、Real2Sim2Realのギャップを物理と外観の両方の観点から減らす新しいフレームワークである。具体的には、Real2Sim物理ギャップを低減するために設計された微分可能な物理モジュールであるPhysAlignerを提案する。さらに、条件付きビデオ拡散モデルを用いて、Sim2Realの外観ギャップを埋めるVisAlignerを導入する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:58:17 GMT)
SPIDER: Structure-Preferential Implicit Deep Network for Biplanar X-ray Reconstruction [30.4]
SPIDERは、バイプレーンX線画像からCTボリュームを再構成するための教師付きフレームワークである。解剖学的制約を再構築プロセスに組み込み、構造的連続性を高め、軟質の人工物を減らす。提案手法は,ダウンストリームセグメンテーションタスクにおける強力な可能性を示し,パーソナライズされた治療計画と画像誘導型手術ナビゲーションにおけるその有用性を裏付けるものである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:06:28 GMT)
Deep Research Comparator: A Platform For Fine-grained Human Annotations of Deep Research Agents [30.4]
本稿では,ディープリサーチエージェントを評価するための総合的なフレームワークを提供するDeep Research Comparatorを紹介する。ユーザクエリが与えられた場合、プラットフォームは2つの異なるエージェントからの最終的なレポートと、生成中の中間ステップを表示する。アノテーションは、サイドバイサイド比較に基づいて最終レポートの全体的な品質を評価することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:35:09 GMT)
Deep Learning Framework Testing via Model Mutation: How Far Are We? [30.3]
既存の突然変異に基づく検査手法の欠陥検出機能を再検討する。わずか23モデルで39のユニークな欠陥を特定しました。そのうち31は開発者によって確認され、8つは修正されました。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:10:52 GMT)
LOOM-Scope: a comprehensive and efficient LOng-cOntext Model evaluation framework [29.5]
LOOM-Scopeは長期コンテキスト評価のための包括的で効率的なフレームワークである。 LOOM-Scopeは様々なベンチマークで評価設定を標準化する。効率的な長文推論促進手法の展開をサポートする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:33:24 GMT)
Learning Robust Stereo Matching in the Wild with Selective Mixture-of-Experts [29.5]
SMoEStereoは,Low-Rank Adaptation (LoRA) とMixture-of-Experts (MoE) モジュールの融合により,VFMをステレオマッチングに適用する新しいフレームワークである。提案手法は,データセット固有の適応を伴わない複数のベンチマークに対して,最先端のクロスドメインと共同一般化を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:19:04 GMT)
FedPall: Prototype-based Adversarial and Collaborative Learning for Federated Learning with Feature Drift [29.2]
フェデレートラーニング(FL)は、複数のパーティからのデータを備えた集中型サーバにおいて、グローバルモデルの協調的なトレーニングを可能にする。本稿では,FedPallを提案する。FedPallは,プロトタイプベースの対数学習を利用して特徴空間を統一し,協調学習によって特徴空間内のクラス情報を強化するためのフレームワークである。 3つの代表的な特徴ドリフトデータセットの評価結果は、FLシナリオにおける特徴ドリフトデータを用いた分類において、FedPallの一貫して優れた性能を示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:58:39 GMT)
S$^2$Edit: Text-Guided Image Editing with Precise Semantic and Spatial Control [29.0]
S$2$Editはテキストから画像への拡散モデルであり、正確な意味論と空間制御によるパーソナライズされた編集を可能にする。 S$2$Editは、学習した意味的に乱れ、空間的に焦点を絞ったアイデンティティトークンを用いて、元のアイデンティティを忠実に保存しながら、ローカライズされた編集を行うことを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:14:08 GMT)
Robust Incomplete-Modality Alignment for Ophthalmic Disease Grading and Diagnosis via Labeled Optimal Transport [29.0]
眼底画像と光コヒーレンス断層撮影(OCT)を併用したマルチモーダル眼底画像診断を行った。既存の一般的なパイプライン、例えばモダリティ計算や蒸留法は、顕著な制限に直面している。本稿では,眼科診断の課題において欠落したモダリティを頑健に扱える新しい多モードアライメントと融合フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:36:39 GMT)
Advancing Financial Engineering with Foundation Models: Progress, Applications, and Challenges [28.8]
ファイナンシャル・ファンデーション・モデル(英: Financial Foundation Models、FFM)は、金融のために明示的に設計された新しいモデルのクラスである。本調査では,FFMの包括的概要と,3つの主要な指標にまたがる分類について概説する。アーキテクチャ、トレーニング方法論、データセット、および現実世界のアプリケーションについてレビューする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:06:38 GMT)
Position: Machine Learning Conferences Should Establish a "Refutations and Critiques" Track [28.8]
機械学習のカンファレンスは、専用の"Refutations and Critiques"(R&C)トラックを確立するべきだ、と私たちは主張する。このR&Cトラックは、先行研究に挑戦する重要な研究を支援するために、注目に値するプラットフォームを提供する。 MLのカンファレンスは、ML研究の自己修正を支援する公式で信頼性の高いメカニズムを作成するべきだ、と私たちは結論付けています。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:00:46 GMT)
Optical pumping simulations and optical Rabi frequency measurements in $^{151}\mathrm{Eu}^{3+}\!:\mathrm{Y}_2\mathrm{SiO}_5$ under magnetic field [28.6]
本研究では,磁場印加による151mathrmEu3+!:mathrmYmathrmSiO_5$について検討する。単一周波数のイオンを分離できる光ポンピング方式の効果を計算するための簡単な数値シミュレータを提案する。我々は、36の可能な光-超微細遷移のうち21の遷移の光学ラビ周波数を測定し、6x6分岐比行列の構築を可能にした。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:51:04 GMT)
RoboMonkey: Scaling Test-Time Sampling and Verification for Vision-Language-Action Models [28.4]
我々は、Vision-Language-Action(VLA)モデルのテスト時間スケーリングフレームワークであるRoboMonkeyを紹介した。 RoboMonkeyは、VLAから小さなアクションの集合をサンプリングし、ガウス摂動と過半数投票を適用してアクション提案分布を構築し、次に視覚言語モデル(VLM)ベースの検証器を使用して最適なアクションを選択する。既存のVLAとRoboMonkeyのペアリングは大きなパフォーマンス向上をもたらし、アウト・オブ・ディストリビューションタスクでは25%、イン・ディストリビューションタスクでは9%の絶対的な改善を実現している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:08:10 GMT)
Self-Rectifying Diffusion Sampling with Perturbed-Attention Guidance [28.4]
Perturbed-Attention Guidance (PAG)は、無条件と条件の両方で拡散サンプルの品質を向上させる。 ADMとStable Diffusionの両方において、PAGは驚くほど、条件付きおよび条件なしのシナリオにおけるサンプル品質を改善します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:05:02 GMT)
MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [28.4]
心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。 LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:41:48 GMT)
Decoding Safety Feedback from Diverse Raters: A Data-driven Lens on Responsiveness to Severity [27.9]
本稿では,複数のデータセットの粒度評価を解釈するための新しいデータ駆動型手法を提案する。安全違反の度合いの異なるレベルを評価する際に,レーダの整合性を定量化する非パラメトリック応答性指標を蒸留する。提案手法は,異なる階層群をまたいだニュアンスな視点を捉えることで,レーダの選択やフィードバックの解釈に役立てることができることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:28:24 GMT)
PhoniTale: Phonologically Grounded Mnemonic Generation for Typologically Distant Language Pairs [27.7]
大規模言語モデル (LLM) は、学習者の第一言語から類似したキーワードを活用することで、キーワード・モニーモニックを生成するために使われている。音韻的類似性に基づいてL1キーワード列を検索する新しい言語間メタモニック生成システムであるPhoniTaleを提案する。以上の結果から, PhoniTale はヒトのmnemonics と同等に機能することが明らかとなった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:50:12 GMT)
StreamVLN: Streaming Vision-and-Language Navigation via SlowFast Context Modeling [27.5]
実世界の環境におけるVLN(Vision-and-Language Navigation)では、エージェントが連続的なビジュアルストリームを処理し、言語命令に基礎を置く低レイテンシでアクションを生成する必要がある。本稿では,ストリームVLNフレームワークについて紹介する。ストリームVLNは,マルチモーダル推論をサポートするために,低速コンテキストモデリングをハイブリッドで実現する。 VLN-CEベンチマークの実験では、最先端のパフォーマンスが安定した低レイテンシで、現実のデプロイメントにおける堅牢性と効率が保証されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:49:41 GMT)
ASSURE: Metamorphic Testing for AI-powered Browser Extensions [27.4]
従来のブラウザ拡張テストアプローチでは、AIによる拡張に固有の非決定的な振る舞い、コンテキスト感度、複雑なWeb環境の統合に対処できない。本稿では,AIを利用したブラウザエクステンション用に設計されたモジュール型自動テストフレームワークASSUREを紹介する。 ASSUREは手動によるアプローチと比較してテストのスループットを6.4倍改善し、平均12.4分以内に重大なセキュリティ脆弱性を検出する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:11:16 GMT)
From Fragments to Facts: A Curriculum-Driven DPO Approach for Generating Hindi News Veracity Explanations [27.2]
急激な誤報の時代には、特にヒンディー語のような表現不足の言語では、信頼できるニュース説明を生成することが不可欠である。本稿では,DPO(Direct Preference Optimization)とカリキュラム学習を統合した新しいフレームワークを提案する。 LLM (Mistral, Llama, Gemma) と PLM (mBART, mT5) による実験は、コヒーレントで文脈的に関係のある説明を生成する上で、フレームワークの有効性を確認している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:34:28 GMT)
Towards Cost-Effective Reward Guided Text Generation [27.1]
Reward-guided Text Generation (RGTG) は、人間のフィードバックからオフラインで強化学習を行うための代替手段として登場した。本稿では、Bradley-Terry損失を用いてトレーニングされた新たな報酬モデルアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:26:24 GMT)
Escaping Plato's Cave: JAM for Aligning Independently Trained Vision and Language Models [27.1]
単一モードモデルの潜在表現に対して、モダリティ固有のオートエンコーダを訓練するフレームワークを導入する。類推により、このフレームワークはプラトンの洞窟から逃れる方法として機能し、結合しない入力から共有構造の出現を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:37:17 GMT)
Going Beyond Heuristics by Imposing Policy Improvement as a Constraint [27.1]
Heuristic Enhanced Policy Optimizationは、強化学習における報酬ハッキングを活用するためのプラグアンドプレイ方式である。 HEPOは報酬ハッキングを効果的に活用し、報酬ハッキングを緩和するための先行手法の落とし穴を回避していることを示す。さらに驚くべきことに、HEPOは、報酬が熟練していない人間によって適切に設計され、設計されていなくても、ポリシーの最適化が優れたパフォーマンスを達成することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:52:53 GMT)
Judging the Judges: Can Large Vision-Language Models Fairly Evaluate Chart Comprehension and Reasoning? [26.9]
13個のオープンソースのLVLMを多彩なチャート理解および推論タスクの判断として評価した。我々は、事実の正しさ、情報性、関連性といった基準を網羅した、ペアワイズかつポイントワイズな評価タスクを設計する。我々は、研究開発と商業利用の両方に適した費用対効果のLVLMに焦点を当てる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:58:15 GMT)
UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification [26.8]
マルチモーダルオブジェクトReID(UGG-ReID)に対する不確実性誘導グラフモデルというロバストなアプローチを提案する。 UGG-ReIDは、ノイズ干渉を緩和し、効果的なマルチモーダル融合を促進するように設計されている。実験結果から,提案手法は全データセットに対して優れた性能を示すことがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:41:08 GMT)
All in One: Visual-Description-Guided Unified Point Cloud Segmentation [26.5]
VDG-Uni3DSegは、事前訓練された視覚言語モデルと大規模言語モデルを統合する新しいフレームワークである。提案手法はリッチなマルチモーダルキューを取り入れ,微細なクラスとインスタンス分離を容易にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:22:00 GMT)
Estimating Interventional Distributions with Uncertain Causal Graphs through Meta-Learning [26.4]
生物学から社会科学まで、科学分野では、多くの疑問がテキスト化されます。モデル平均因果推定変換器ニューラルプロセス(MACE-TNP)を用いたメタラーニングによるエンドツーエンドモデルの構築を提案する。我々の研究は、複雑なベイズ因果推論を近似するフレキシブルでスケーラブルなパラダイムとしてメタラーニングを確立している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:48:32 GMT)
ModelCitizens:Representing Community Voices in Online Safety [26.3]
ソーシャルメディア投稿6.8Kと多様なアイデンティティグループにまたがる40K毒性アノテーションのデータセットであるMODELCITIZENSを紹介する。本研究は,包括的コンテンツモデレーションのためのコミュニティインフォームドアノテーションとモデリングの重要性を強調した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:15:18 GMT)
What's Making That Sound Right Now? Video-centric Audio-Visual Localization [26.2]
AVLは、視覚的シーン内の音源を識別することを目的としている。 AVATARは高解像度の時間情報を含むビデオ中心のAVLベンチマークである。 TAVLOはビデオ中心のAVLモデルであり、時間情報を明示的に統合する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:12:34 GMT)
From Imitation to Innovation: The Emergence of AI Unique Artistic Styles and the Challenge of Copyright Protection [26.2]
ArtBulbは、AIアート著作権判断のための解釈可能かつ定量化可能なフレームワークである。 AICDは、アーティストや法律の専門家によって注釈付けされた、AIアート著作権のための最初のベンチマークデータセットである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:45:08 GMT)
A Visual Leap in CLIP Compositionality Reasoning through Generation of Counterfactual Sets [26.2]
視覚言語モデル(VLM)は、高品質な画像テキストデータが不足しているため、しばしば構成的推論に苦しむ。手動のアノテーションを使わずに反実データを自動的に生成するブロックベース拡散手法を提案する。提案手法は,既存の手法に比べてトレーニングデータを大幅に少なくしながら,複数のベンチマークにまたがる最先端の結果を達成している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:47:10 GMT)
Improving Graph Out-of-distribution Generalization Beyond Causality [26.0]
本稿では,環境-ラベル依存性と可変理性不変性の定理について述べる。分析研究に基づき, 実世界データ上でのOODグラフの確率依存性と合理性」という, 変分推論に基づく新しい手法を紹介した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:22:33 GMT)
Transfer Attack for Bad and Good: Explain and Boost Adversarial Transferability across Multimodal Large Language Models [25.9]
MLLM(Multimodal Large Language Models)は、相互モダリティ相互作用において例外的な性能を示すが、敵の脆弱性も抱える。本稿では,MLLM間の対向転写可能性の顕在化を解析し,その特性に影響を及ぼす要因を同定する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:28:58 GMT)
Reason to Rote: Rethinking Memorization in Reasoning [25.8]
大規模言語モデルは、ラベルノイズなどの任意のトレーニングインスタンスを覚えやすいが、推論タスクでは顕著に機能する。本研究では,言語モデルがラベルノイズを記憶する方法と,そのような記憶が一般化可能な推論能力に大きく影響しない理由について検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:59:06 GMT)
Reviving Cultural Heritage: A Novel Approach for Comprehensive Historical Document Restoration [25.4]
歴史文書は貴重な文化遺産であるが、涙、水浸食、酸化などを通じて時間の経過とともに著しく劣化している。既存の文書復元法(モダリティ)は主に単一ないし限定的な修復に重点を置いており、実際的な要求に応えていない。フルページHDRデータセット(FP)と新しい自動HDRソリューション(Auto)を提案する。 FPは1,633個の実画像と6,543個の合成画像と、文字レベルと行レベルの位置と、異なる損傷グレードの文字アノテーションから構成される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:26:17 GMT)
$\textit{Grahak-Nyay:}$ Consumer Grievance Redressal through Large Language Models [25.1]
Grahak-Nyayは、簡潔で最新の知識ベースを通じて、法的な複雑さを単純化する。我々は3つの新しいデータセットを紹介する: $textitGeneralQA$ (一般消費者法)、$textitSectoralQA$ (セクタ固有の知識)、$textitSyntheticQA$ (RAG評価のため)。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:26:42 GMT)
OpenWorldSAM: Extending SAM2 for Universal Image Segmentation with Language Prompts [25.0]
OpenWorldSAMは,Segment Anything Model v2 (SAM2) をオープン語彙シナリオに拡張するフレームワークである。 OpenWorldSAMは、カテゴリレベルの言語記述や文レベルの言語記述など、さまざまなプロンプトをサポートしている。 SAM2とVLMの事前学習されたコンポーネントを凍結することにより、COCO-stuffデータセット上で450万のパラメータのみをトレーニングする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:16:22 GMT)
Rule Learning for Knowledge Graph Reasoning under Agnostic Distribution Shift [24.8]
既存のKG推論法の主な制限は、I.I.D仮定に依存することである。本研究では,未知の選択バイアスによるKGからの学習論理則について検討した。本稿では,特徴デコリレーションとルール学習ネットワークを統合するエンドツーエンドの方法論である安定ルール学習(StableRule)フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:27:48 GMT)
MODA: MOdular Duplex Attention for Multimodal Perception, Cognition, and Emotion Understanding [24.7]
マルチモーダル大言語モデル(MLLM)は、最近、複数のモーダル間のデータ統合において強力な能力を示した。 Modular Duplex Attention (MODA)は、インナー・モーダル・リファインメントとインターモーダル・インタラクションを同時に行う。 21のベンチマークデータセットの実験は、知覚、認知、感情タスクにおけるMODAの有効性を検証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:37:42 GMT)
4DSloMo: 4D Reconstruction for High Speed Scene with Asynchronous Capture [24.7]
本稿では,低FPSカメラのみを用いた高速4D撮影システムを提案する。カメラをグループ化してベースフレームレートを25FPSとすることで,高速度カメラを必要としない100-200FPSのフレームレートを実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:18:35 GMT)
DynamicFace: High-Quality and Consistent Face Swapping for Image and Video using Composable 3D Facial Priors [24.7]
顔交換は、ターゲット顔の表情、ポーズ、髪、背景などの属性を保持しながら、ソース顔のアイデンティティをターゲット顔に転送する。拡散モデルとプラグイン・アンド・プレイアダプティブ・アダプティブ・アテンション・レイヤのパワーを活用して画像と映像のスワップを実現するDynamicFaceを提案する。私たちのフレームワークは、画像ドメインとビデオドメインの両方にシームレスに対応します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:31:41 GMT)
Distribution-dependent Generalization Bounds for Tuning Linear Regression Across Tasks [24.2]
L1係数とL2係数をチューニングする際の検証損失に対する一般化誤差の分布依存境界を求める。我々はその結果をリッジ回帰の一般化にまで拡張し、そこでは基底真理分布の平均を考慮に入れたより厳密な境界を達成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:08:45 GMT)
Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training [24.0]
本稿では,教師付きファインチューニング(SFT)と強化ファインチューニング(RFT)の2つのコアポストトレーニングパラダイムの比較分析を行った。本実験は,7つの多様なマルチモーダルタスクからなるベンチマークで実施した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:17:06 GMT)
Features are fate: a theory of transfer learning in high-dimensional regression [23.8]
対象タスクが事前学習されたモデルの特徴空間で適切に表現されている場合、転送学習はスクラッチからトレーニングに優れることを示す。本モデルでは, 音源と目標タスクの重なり合う特徴空間が十分に強い場合, 線形転送と微調整の両方で性能が向上することを確認した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:57:29 GMT)
A Deep Unfolding Framework for Diffractive Snapshot Spectral Imaging [23.8]
本稿では,DDU (diffractive Deep Unfolding) と呼ばれる,拡散システムのための効率的な深部展開フレームワークを提案する。本研究では,DSSIにおけるデータ忠実度項の解析解を導出し,反復的再構成プロセスにおける効率と有効性の両方を保証した。我々のフレームワークは、既存の最先端(SOTA)モデルと強い互換性を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:49:49 GMT)
BS-LDM: Effective Bone Suppression in High-Resolution Chest X-Ray Images with Conditional Latent Diffusion Models [23.8]
肺疾患は、Chest X-Ray(CXR)が重要な診断ツールであると共に、重要な世界的な健康上の課題である。肺病変の検出は、しばしばCXR画像の重なり合う骨構造によって妨げられ、潜在的な誤診につながる。我々は,高解像度CXR画像の骨を効果的に抑制するために,BS-LDMと呼ばれるエンドツーエンドのフレームワークを開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:27:34 GMT)
Disappearing Ink: Obfuscation Breaks N-gram Code Watermarks in Theory and Practice [23.8]
人間が書いたコードからAI生成コードを識別することは、著者の帰属、コンテンツ追跡、誤用検出に不可欠である。 N-gramベースの透かしは、世代中に検出される秘密の透かしを注入する顕著な方法として出現している。ほとんどのクレームは、攻撃のシミュレーションとして単純なコード変換やコードの最適化に対する防御にのみ依存しています。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:18:19 GMT)
Uncertainty in Real-Time Semantic Segmentation on Embedded Systems [23.5]
自動運転車や人間のコンピュータインタラクションなどの分野におけるセマンティックセグメンテーションモデルの適用には、リアルタイムの予測機能が必要である。リアルタイムアプリケーションに対処する上での課題は、リソース制約のあるハードウェアを操作する必要性によって増幅される。本稿では,事前学習モデルからの深い特徴抽出とベイズ回帰とモーメント伝搬を組み合わせることで,不確実性を考慮した予測を行う。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:32:39 GMT)
MAIN: Mutual Alignment Is Necessary for instruction tuning [23.4]
命令応答対の品質は,各コンポーネントの個々の品質ではなく,相互整合度によって決定される。本稿では,相互制約による命令と応答のコヒーレンスを強制する相互アライメントフレームワーク(MAIN)を提案する。 MAINはモデルアーキテクチャやサイズを多用し、LLaMA、Mistral、Qwenモデルで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:19:42 GMT)
Text Detoxification: Data Efficiency, Semantic Preservation and Model Generalization [23.3]
ソーシャルメディア上の有害コンテンツの普及は、オンライン環境や公衆の会話に深刻な脅威をもたらす。既存のアプローチは、強力なデトキシフィケーション性能、セマンティック保存、およびアウト・オブ・ディストリビューションデータを実現するのに苦労することが多い。本稿では,データ効率,セマンティック保存,モデル一般化を協調的に最適化する2段階トレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:48:05 GMT)
Method of Equal Shares with Bounded Overspending [23.2]
境界超過(BOS等分)による等分法の導入 BOS Equal Sharesは、厳密な比例公理によって示唆される非効率性に対処するが、このルールは、元の等式共有の方法と同様の公平性を保証する。分析の過程では、プロジェクトの部分的な資金提供を可能にする「等分法」の分数変種も提示し、検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:32:20 GMT)
Beyond One Shot, Beyond One Perspective: Cross-View and Long-Horizon Distillation for Better LiDAR Representations [23.2]
LiMAは、LiDAR表現学習を強化するために、より長い時間的相関をキャプチャする新しいフレームワークである。 LiMAは事前トレーニングの効率が高く、下流タスク中に計算オーバーヘッドを発生させることはない。主流のLiDARベースの知覚ベンチマークの実験により、LiMAはLiDARセマンティックセグメンテーションと3Dオブジェクト検出の両方を大幅に改善することが示された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:59:58 GMT)
Fine-Grained Vision-Language Modeling for Multimodal Training Assistants in Augmented Reality [22.7]
視覚言語モデル(VLM)は、マルチモーダル環境におけるAIによるスマートアシスタントの解釈と推論を可能にするために不可欠である。私たちの研究は、特に視覚障害者や視覚障害者がAIによる学習機会を平等に利用できるようにするための幅広い社会的意味を持っている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:29:01 GMT)
Hierarchical Intent-guided Optimization with Pluggable LLM-Driven Semantics for Session-based Recommendation [22.7]
セッションベースのレコメンデーション(SBR)は、匿名セッション内でのインタラクションシーケンスを使用して、ユーザが関与する可能性のある次の項目を予測することを目的としている。既存のSBRモデルは、セッション間の関係を無視し、価値あるクロスセッションの洞察を無視して、シングルセッションの情報のみに焦点を当てることが多い。 HIPHOPと呼ばれるセッションベースレコメンデーションのためのプラグイン型LLM型セマンティックラーニングを用いた階層型インテント誘導最適化手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:50:04 GMT)
INTER: Mitigating Hallucination in Large Vision-Language Models by Interaction Guidance Sampling [22.0]
大規模視覚言語モデル(LVLM)における幻覚は、現実世界のアプリケーションに重大な課題をもたらす。 textbfInter: textbfInteraction Guidance Samplingを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:38:53 GMT)
Gradient Purification: Defense Against Poisoning Attack in Decentralized Federated Learning [22.0]
本稿では,DFLにおけるデータ中毒対策として,GPDと呼ばれる新しい勾配浄化防御法を提案する。グラデーションの害を個別に軽減し、モデルの重みに埋め込まれた利益を維持することを目的としている。また、モデル精度の点で最先端の防御手法を著しく上回っている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:54:12 GMT)
Can Video LLMs Refuse to Answer? Alignment for Answerability in Video Large Language Models [22.0]
ビデオ大言語モデル(Video-LLM)は、主にビデオコンテンツから直接生成された質問に基づいて訓練される。現実世界のシナリオでは、ユーザーはしばしば、ビデオの情報範囲を超えて広がる質問をする。本稿では,ビデオLLMと,その映像に基づいて質問の関連性を評価するためのフレームワークである応答可能性のアライメントを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:19:43 GMT)
ABench-Physics: Benchmarking Physical Reasoning in LLMs via High-Difficulty and Dynamic Physics Problems [21.3]
大規模言語モデル(LLM)は、数学やプログラミングのような領域で顕著なパフォーマンスを示している。物理学は、正確な計算だけでなく、深い概念的理解と物理モデリングスキルも要求する固有の課題を提起する。既存のベンチマークは、制限された難易度、複数選択フォーマット、静的評価設定のために、しばしば不足する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:43:56 GMT)
RainShift: A Benchmark for Precipitation Downscaling Across Geographies [21.2]
地理的分布シフト下でのダウンスケーリングを評価するためのデータセットとベンチマークであるRainShiftを紹介した。我々は、グローバル・ノースとグローバル・サウスの間のデータギャップをまたいだ一般化において、GANや拡散モデルを含む最先端のダウンスケーリング手法を評価した。我々の研究は、ダウンスケーリング手法のグローバルな適用性を高め、高解像度の気候情報へのアクセスにおける不平等を減らすための一歩である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:25:14 GMT)
MindFlow: Revolutionizing E-commerce Customer Support with Multimodal LLM Agents [21.1]
我々は,eコマースに適したオープンソースのマルチモーダルLLMエージェントであるMindFlowを紹介する。メモリ、意思決定、アクションモジュールを統合し、視覚的テキスト推論に"MLLM-as-Tool"戦略を採用する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:53:55 GMT)
Multimodal LLM Integrated Semantic Communications for 6G Immersive Experiences [21.1]
6Gネットワークは、拡張現実(AR)、仮想現実(VR)、ホログラフィック通信などの革命的な没入型コミュニケーション体験を約束する。これらのアプリケーションは高次元マルチモーダルデータ伝送とインテリジェントデータ処理をリアルタイムに要求する。本稿では,MLLM-SCと呼ばれる新しいマルチモーダル大言語モデル(MLLM)の統合セマンティックコミュニケーションフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:42:35 GMT)
TeethGenerator: A two-stage framework for paired pre- and post-orthodontic 3D dental data generation [21.1]
TeethGeneratorは、歯列前と歯列後を合わせた3D歯のモデルを合成するために設計された新しいフレームワークである。本データセットは, 実際の矯正データの分布と密接に一致し, 実際のトレーニング用データと組み合わせることで, 歯列アライメント性能を著しく向上させる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:08:10 GMT)
RAM-W600: A Multi-Task Wrist Dataset and Benchmark for Rheumatoid Arthritis [20.8]
手首は関節リウマチ(RA)の診断における重要な領域であるこのデータセットは、4つの医療センターの患者227人の手首の従来のX線写真621枚からなる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:53:22 GMT)
A Text is Worth Several Tokens: Text Embedding from LLMs Secretly Aligns Well with The Key Tokens [20.4]
テキストを大きな言語モデルベースの埋め込み器に入力すると、得られたテキストの埋め込みは入力テキストのキートークンと一致させることができる。この現象は普遍的であり,モデルアーキテクチャ,トレーニング戦略,埋め込み手法の影響を受けないことを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:58:42 GMT)
MatDecompSDF: High-Fidelity 3D Shape and PBR Material Decomposition from Multi-View Images [20.2]
MatDecompSDFは、高忠実度3D形状を復元し、その物理的特性を多視点画像から分解するフレームワークである。本手法は,標準のグラフィックスパイプラインにシームレスに統合可能な,編集可能で再生可能なアセットを生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:22:32 GMT)
Llama Nemoretriever Colembed: Top-Performing Text-Image Retrieval Model [20.1]
llama-nemoretriever-colembedは、複数のベンチマークで最先端のパフォーマンスを提供する統一されたテキストイメージ検索モデルである。 3Bモデルは、ViDoRe V1でNDCG@5 91.0、ViDoRe V2で63.5、2025年6月27日現在、両リーダーボードで第1位となっている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:20:04 GMT)
Unleashing the Power of Neural Collapse: Consistent Supervised-Unsupervised Alignment for Generalized Category Discovery [19.9]
Generalized Category Discovery (GCD)は、未知のデータから新しいカテゴリを同時に発見しながら、既知のカテゴリを分類することに焦点を当てている。従来のGCD手法は、不整合最適化目標とカテゴリー混乱による課題に直面している。本稿ではニューラル・コラプスにインスパイアされた一般化カテゴリー発見(NC-GCD)フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:34:41 GMT)
Evaluating Memory in LLM Agents via Incremental Multi-Turn Interactions [19.5]
メモリ機構を持つエージェントをメモリエージェントと呼ぶ。本稿では,メモリエージェントに不可欠な4つのコア能力,すなわち,正確な検索,テスト時間学習,長距離理解,コンフリクト解決の4つを同定する。既存のデータセットは、限られたコンテキスト長に依存するか、書籍ベースのQAのような静的で長いコンテキスト設定用に調整されている。既存のベンチマークでは4つの能力をすべてカバーしていないため、メモリエージェント用に特別に設計された新しいベンチマークであるMemoryAgentBenchを紹介します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:59:54 GMT)
Train-before-Test Harmonizes Language Model Rankings [19.4]
既存の言語モデルベンチマークは、類似のスキルを捉えることを目的としたベンチマークであっても、矛盾するモデルランキングを提供する。最近の作業は、試験作業におけるトレーニングの現象によるランキングの不一致によるものである。それぞれのモデルに、評価の前に同じベンチマーク固有の微調整を与える。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:54:18 GMT)
Federated Learning for Big Data: A Survey on Opportunities, Applications, and Future Directions [19.0]
フェデレートラーニング(FL)は、機械学習のサブフィールドとして現れる。本稿では、ビッグデータ取得、ストレージ、ビッグデータ分析、さらなるプライバシー保護におけるFLの可能性についてレビューする。スマートシティ、スマートヘルスケア、スマートトランスポート、スマートグリッド、ソーシャルメディアなど、ビッグデータアプリケーションにおけるFLの可能性についても検討している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:45:16 GMT)
Follow-the-Perturbed-Leader Approaches Best-of-Both-Worlds for the m-Set Semi-Bandit Problems [18.7]
我々は、学習者が$m$の腕から$m$の腕を正確に選択する、$m$セット半帯域問題の一般的な場合を考える。また, Fr'echet 摂動を持つFTPL は, 対向的な設定で, $mathcalO(sqrtnm(sqrtdlog(d)+m5/6)$ をほぼ最適に再現できることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:25:36 GMT)
Adaptive Slimming for Scalable and Efficient Speech Enhancement [18.7]
音声強調(SE)は、音声認識、リアルタイムコミュニケーション、補聴器、その他の音声品質が重要となるアプリケーションを可能にする。我々は、人気のあるSEアーキテクチャであるDEMUCSに動的スリム化を導入し、スケーラブルでインプット・アダプティブにします。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:07:56 GMT)
Response Attack: Exploiting Contextual Priming to Jailbreak Large Language Models [17.9]
初期の刺激が後続の判断を隠蔽する文脈プライミングは、大言語モデル(LLM)に対する未探索の攻撃面を提供する。本稿では、補助LDMを用いて、元の悪意のあるクエリのパラフレーズ付きバージョンに対して、軽度に有害な応答を生成するレスポンスアタックを提案する。 RAは7つの最先端のジェイルブレイクテクニックを一貫して上回り、より高い攻撃成功率を達成している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:56:05 GMT)
Network Topology Inference from Smooth Signals Under Partial Observability [17.5]
部分的に観測されたノードを持つ滑らかな信号からネットワークトポロジを推定することは、データサイエンスとエンジニアリングにおいて重要な問題である。本稿では,列間隔正規化に基づく1次アルゴリズムフレームワークと,低ランク制約に基づく1次アルゴリズムフレームワークを提案する。我々は、理論収束保証を確立し、アルゴリズムの線形収束率を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:25:05 GMT)
SeqGrowGraph: Learning Lane Topology as a Chain of Graph Expansions [17.3]
本稿では,グラフ拡張の連鎖としてレーントポロジを学習する新しいフレームワークであるSeqGrowGraphを紹介する。 nuScenesとArgoverse 2のデータセットで評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:42:37 GMT)
Machine Learning from Explanations [17.3]
より小さなデータセット上で信頼性の高い分類モデルをトレーニングするための革新的なアプローチを導入する。提案手法は,モデル予測精度の向上と,説明に合うように注意を精査する2段階の学習サイクルを中心に展開する。トレーニングサイクルがより正確で信頼性の高いモデルへの収束を早めることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:09:52 GMT)
Decision Feedback In-Context Learning for Wireless Symbol Detection [17.3]
送信信号対と受信信号対の形式でパイロットデータからなるトランスフォーマーベースの無線受信機は、パイロットデータが豊富な場合に高い検出精度を示す。本稿では、チャネル推定を回避し、限られたパイロットデータを用いて直接シンボル検出を行う新しい無線受信機設計として、決定フィードバックIN-ContExt Detection (DEFINED)を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:56:44 GMT)
Language Models can Self-Improve at State-Value Estimation for Better Search [16.9]
本稿では、状態遷移ダイナミクスを利用して値モデルを改善する自己学習型ルック(STL)を提案する。 STLで学習した専門値モデルは計算量的に軽量な探索アルゴリズムで展開でき、より高価な木探索手法に匹敵する性能を実現することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:20:17 GMT)
Distributionally Robust Active Learning for Gaussian Process Regression [16.9]
本稿では,GPRの最悪の予測誤差を効果的に低減する2つのAL手法を提案する。最短ケースの予測二乗誤差の上限が上界であることを示し、この誤差は穏やかな条件下で有限個のデータラベルによって任意に小さくなることを示唆する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:24:47 GMT)
Balancing Efficiency and Expressiveness: Subgraph GNNs with Walk-Based Centrality [16.9]
サブグラフGNNは,グラフニューラルネットワーク(GNN)の限界を克服し,サブグラフの袋を処理する,有望なアーキテクチャとして登場した。サブグラフGNNは、ノード数で線形にサイズが大きくなるバッグを処理し、より大きなグラフの適用性を妨げている。本稿では,サブグラフGNNの計算コストを劇的に低減する,効果的で実装が容易な手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:34:36 GMT)
Dequantized particle algorithm for the nonlinear Vlasov-Poisson system [16.7]
本稿では,Vlasov--Poisson (VP) システムの復号化アルゴリズムを提案する。シュル「オーディンガー-ポアソン」(SP)方程式の構造保存離散化(英語版)(Structure-reserving discretization)を行うことを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:01:37 GMT)
PROTEAN: Federated Intrusion Detection in Non-IID Environments through Prototype-Based Knowledge Sharing [16.5]
PROTEANは,協調的かつプライバシ保護による侵入検出を容易にするための,プロトタイプ学習ベースのフレームワークである。我々は、IIoTと5G接続された参加者から収集された2つのサイバー侵入データセット上でProTEANをインスタンス化する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:44:04 GMT)
UNSURF: Uncertainty Quantification for Cortical Surface Reconstruction of Clinical Brain MRIs [16.5]
臨床脳MRI画像の皮質表面再構成のための新しい不確実性尺度であるUNSURFを提案する。実際の臨床検査では, ボクセルのモンテカルロ分散などの従来の不確実性測定は, 表面配置の不確かさのモデル化には適していないことが示された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:21:16 GMT)
MoDiT: Learning Highly Consistent 3D Motion Coefficients with Diffusion Transformer for Talking Head Generation [16.2]
MoDiT は 3D Morphable Model (3DMM) と Diffusion-based Transformer を組み合わせた新しいフレームワークである。 i) 時間的注意と偏りのある自己/横断的意識のメカニズムを改良した階層的認知戦略により, モデルによる唇同期の洗練が可能となった。 2) 空間的制約を明確化し, 正確な3次元インフォームド光流予測を実現するための3次元MM係数の統合。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:13:46 GMT)
A Robust Real-Time Lane Detection Method with Fog-Enhanced Feature Fusion for Foggy Conditions [15.9]
実世界の霧のシナリオで捉えたFogyLaneデータセットを導入し、FogyCULaneとFogyTusimpleという2つの追加データセットを合成する。我々は,Global Feature Fusion Module (GFFM) を組み込んで,霧画像のグローバルな関係を捉えることにより,車線検出のためのロバストなFog-Enhanced Networkを提案する。 F1スコアはFogyLaneで95.04、FogyCULaneで79.85、FogyTusimpleで96.95である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:04:20 GMT)
Critiques of World Models [15.9]
我々は、世界モデルの第一の目的は、目的的推論と行動のために、現実世界のあらゆる実行可能な可能性をシミュレートすることであると主張している。本稿では,階層的・多層的・混合的連続・離散的表現に基づく汎用世界モデルのための新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:23:46 GMT)
Who's the Mole? Modeling and Detecting Intention-Hiding Malicious Agents in LLM-Based Multi-Agent Systems [15.8]
大規模言語モデル(LLM-MAS)を用いたマルチエージェントシステムにおける意図隠蔽脅威について検討する。本稿では,HEXACOパーソナリティモデルとReid Techniqueを組み合わせた心理学的検出フレームワークAgentXposedを提案する。本研究は、意図的攻撃による構造的・行動的リスクを明らかにし、LLMベースのマルチエージェントシステムの安全性に関する貴重な知見を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:34:34 GMT)
TimeFlow: Longitudinal Brain Image Registration and Aging Progression Analysis [15.7]
TimeFlowは経時的脳MRI登録のための新しいフレームワークである。従来の方法とは異なり、TimeFlowは明示的な滑らかさ正規化器と高密度なシーケンシャルデータの需要を排除している。 TimeFlowは、新しい生物学的脳老化解析をサポートし、神経変性状態と健康な老化を効果的に区別する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:11:42 GMT)
wd1: Weighted Policy Optimization for Reasoning in Diffusion Language Models [15.6]
dLLMs確率関数の抽出可能性には、各ポリシー最適化ステップにおける現在の、古い、参照ポリシーの確率を近似する必要がある。我々は、目的を重み付けされた可能性として再構成する、新しいポリシー最適化アプローチである$mathttwd1$を導入する。広く使われている推論ベンチマークの実験では、$mathttwd1$は教師付き微調整(SFT)や教師付きデータなしで、dLLMの既存のRLメソッドよりも優れていた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:27:25 GMT)
Simultaneous Determination of Local Magnetic Fields and Sensor Orientation with Nitrogen-Vacancy Centers in Nanodiamond [15.6]
ナノダイヤモンド中の窒素空孔(NV)センターは、生体医用イメージングアプリケーションのための有望な量子センシングプラットフォームとして登場した。本研究では,各粒子の結晶軸と周辺ベクトル磁場を同時に決定する新しい手法を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:14 GMT)
PVChat: Personalized Video Chat with One-Shot Learning [15.1]
PVChatは単発の学習フレームワークで、被験者ごとに単一のビデオから回答できる。提案手法は、合成強化ビデオQAデータセット上で、Mixture-of-Heads(MoH)拡張ViLLMを最適化する。医療シナリオ,テレビシリーズ,アニメ,実世界の映像を対象とした多様なデータセットを用いてPVChatを評価した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:12:02 GMT)
Evaluating the Critical Risks of Amazon's Nova Premier under the Frontier Model Safety Framework [15.1]
Nova PremierはAmazonで最も有能なマルチモーダルファンデーションモデルである。テキスト、画像、動画を100万件のコンテキストウィンドウで処理する。我々は,ノバス・プレミアの臨界リスクプロファイルの総合評価を行った。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:33:35 GMT)
Mask Approximation Net: A Novel Diffusion Model Approach for Remote Sensing Change Captioning [15.0]
リモートセンシング画像変化記述は、リモートセンシング処理の領域における革新的なマルチモーダルタスクを表す。本稿では,周波数領域雑音フィルタリングにより強化された拡散モデルを用いたデータ分散学習へ移行するパラダイムを提案する。本稿では,リモートセンシングによる変化検出と記述のための提案手法の有効性を検証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:42:52 GMT)
DisMS-TS: Eliminating Redundant Multi-Scale Features for Time Series Classification [14.9]
時系列分類のための新しいエンドツーエンドのDistangled Multi-Scaleフレームワーク(DisMS-TS)を提案する。 DisMS-TSは、マルチスケール時系列における冗長な共有機能を排除し、予測性能を向上させるように設計されている。複数のデータセットで実施された実験は、DisMS-TSの競争基準よりも優れており、精度は9.71%まで向上した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:35:55 GMT)
Neural Velocity for hyperparameter tuning [14.9]
NeVeは、学習率を調整し、停止基準を定義する、ダイナミックなトレーニングアプローチである。神経速度は各ニューロンの伝達関数の変化率を測定する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:32:25 GMT)
Diffusion-based Adversarial Identity Manipulation for Facial Privacy Protection [14.8]
顔認識は、ソーシャルネットワーク上での不正な監視とユーザー追跡によって、深刻なプライバシー上の懸念を引き起こしている。既存のプライバシーを強化する方法は、顔のプライバシーを保護する自然な顔画像を生成するのに失敗する。そこで我々はDiffAIMを提案し、悪意のあるFRシステムに対して自然かつ高度に伝達可能な対向顔を生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:19:56 GMT)
pFedMMA: Personalized Federated Fine-Tuning with Multi-Modal Adapter for Vision-Language Models [14.8]
pFedMMAは、視覚言語タスクにマルチモーダルアダプタを活用する最初のパーソナライズされた学習フレームワークである。 pFedMMAはパーソナライゼーションと一般化の間の最先端のトレードオフを実現し、近年のフェデレーション・プロンプト・チューニング手法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:26:34 GMT)
CorrDetail: Visual Detail Enhanced Self-Correction for Face Forgery Detection [14.5]
顔偽造検出のための視覚的強調自己補正フレームワークであるCorrDetailを紹介した。 CorrDetailは、エラー誘導質問機能を備えた場合、真偽の詳細を精巧に修正するように設計されている。視覚的きめ細かい詳細拡張モジュールが組み込まれており、より正確な視覚的偽造の詳細をCorrDetailに提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:29:57 GMT)
Incorporating Interventional Independence Improves Robustness against Interventional Distribution Shift [14.5]
既存のアプローチは、基礎となる因果モデルが知られている場合でも、観察データのような介入データを扱う。本稿では、介入中の統計的独立性を明示するトレーニングアルゴリズムであるRepLInを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:51:20 GMT)
The Hidden Threat in Plain Text: Attacking RAG Data Loaders [14.4]
大型言語モデル(LLM)は、ChatGPTが2022年にデビューして以来、人間と機械の相互作用を変えてきた。 RAGの外部文書の取り込みへの依存は、新たな脆弱性をもたらす。本稿では、悪意あるアクターが文書の取り込みを利用してRAGパイプラインを盗むことができるデータローディング段階で重要なセキュリティギャップを明らかにする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:13:54 GMT)
Towards Explainable Fusion and Balanced Learning in Multimodal Sentiment Analysis [14.0]
Kan-MCP は Kolmogorov-Arnold Networks (KAN) の解釈可能性と Multimodal Clean Pareto (MCPareto) フレームワークの堅牢性を統合する新しいフレームワークである。本稿では, 特徴量次元を両立・縮小するDRD-MIB法を提案する。この解釈可能性と堅牢性の相乗効果は、CMU-MOSI、CMU-MOSEI、CH-SIMS v2などのベンチマークデータセットにおいて優れたパフォーマンスを実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:31:28 GMT)
DYNAMO: Dynamic Neutral Atom Multi-programming Optimizer Towards Quantum Operating Systems [14.0]
我々は中性原子量子コンパイルアーキテクチャ上でのマルチプログラミングを実現するDYNAMO(Dynamic Neutral Atom Multi-gramming)を提案する。 DYNAMOはコンパイル速度を最大14.39倍に向上し、実行段階を平均50.47%削減することを示した。効率的なマルチプログラミング機能を実現することで、DYNAMOは実用的な量子オペレーティングシステムの実現に向けた重要な基盤を確立する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:59:35 GMT)
Normality-Guided Distributional Reinforcement Learning for Continuous Control [13.8]
平均戻り値の予測モデル、すなわち値関数の学習は多くの強化学習アルゴリズムにおいて重要な役割を果たす。本研究では,複数の連続制御タスクにおける値分布について検討し,学習した値分布が正常に近いことを実証的に確認した。本稿では,標準値関数に存在しない値分布の構造的特性によって測定された正当性に基づくポリシー更新戦略を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:40:40 GMT)
Mind the Context: Attention-Guided Weak-to-Strong Consistency for Enhanced Semi-Supervised Medical Image Segmentation [13.7]
本稿では,AIGCMatch (Attention-Guided weak-to-strong Consistency Match) という,シンプルながら効率的な半教師付き学習フレームワークを提案する。 AIGCMatchフレームワークは、イメージレベルと特徴レベルの両方において注意誘導の摂動戦略を取り入れ、弱い一貫性の規則化を実現する。本手法は, ACDCデータセットの7ケースシナリオにおいて90.4%のDiceスコアを達成し, 最先端の手法を超越し, 臨床環境におけるその可能性と有効性を示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:28:59 GMT)
ST-LoRA: Low-rank Adaptation for Spatio-Temporal Forecasting [13.6]
モデルと呼ばれる既存の時間的予測モデルに対する低ランク適応フレームワークを提案する。具体的には、ノード適応型低ランク層とノード固有予測器を導入し、ノードの複雑な機能特性を捉える。本手法は,計算オーバーヘッドが最小限である様々な予測モデルに対して,常に優れた性能を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:07:02 GMT)
Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs [13.3]
適応型フレーム選択とマルチテンポラリスケーリングのための新しいアプローチであるビデオQFrameを紹介する。 Q-Frameは、CLIPのようなテキスト画像マッチングネットワークによって生成されたトレーニング不要のプラグイン・アンド・プレイ戦略を採用している。ベンチマークデータセットの広範な実験を通じて,Q-Frameの有効性を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:52:11 GMT)
SeaLion: Semantic Part-Aware Latent Point Diffusion Models for 3D Generation [13.3]
細かなセグメンテーションラベルを持つ点雲を生成するために設計された新しい拡散モデルSeaLionを提案する。 P-CD(Part-Aware Chamfer distance)と呼ばれる新しい点雲対距離計算法も導入する。大規模合成データセットShapeNetと実世界の医療データセットIntrAの実験は、SeaLionが世代品質と多様性において顕著なパフォーマンスを達成することを実証している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:54:21 GMT)
Breach in the Shield: Unveiling the Vulnerabilities of Large Language Models [13.2]
大規模言語モデル(LLMs)と視覚言語モデル(VLMs)は、幅広いタスクで素晴らしいパフォーマンスを実現しています。本研究では,このような摂動の影響を受けやすいパラメータや入力次元を同定することにより,この脆弱性の原因を特定することを目的とする。我々は、情報幾何学に根ざし、個々のパラメータと入力次元の感度を定量化する、textbfFI, textbf First order local textbfInfluence という安定性尺度を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:11:47 GMT)
Theoretical Learning Performance of Graph Neural Networks: The Impact of Jumping Connections and Layer-wise Sparsification [13.2]
ジャンプ接続により、Graph Convolutional Networks (GCN) はオーバースムーシングを克服できる。グラフスペーシフィケーションは、近傍の集約中にグラフ隣接行列のサブ行列を選択することで、計算要求を減らす。本稿では,グラフスペーシフィケーションを用いた跳躍接続を用いたGCNの学習力学と一般化解析について述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:10:53 GMT)
Inside you are many wolves: Using cognitive models to interpret value trade-offs in LLMs [13.1]
我々は,LLMが人間のようなトレードオフを表現する程度を,丁寧な発話の認知モデルを用いて解釈する。本研究は, 理論的推論モデルにおいて, ソーシャルユーティリティよりも高い情報ユーティリティのパターンと, 数学的推論においてより強力なオープンソースモデルを示すものである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:34:34 GMT)
Classification of autoimmune diseases from Peripheral blood TCR repertoires by multimodal multi-instance learning [12.9]
EAMilはTCRシークエンシングデータを利用して全身性エリテマトーデス(SLE)と慢性関節リウマチ(RA)の診断を行う多インスタンスディープラーニングフレームワークである SLEは98.95%,RAは97.76%であった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:24:41 GMT)
QuEst: Enhancing Estimates of Quantile-Based Distributional Measures Using Model Predictions [12.9]
提案するQuEstは、観測データとインプットデータをマージしてポイント推定を行う、原則化されたフレームワークである。 QuEstは、尾のリスク(CVaR)から、クォータイルのような人口セグメントまで、経済学、社会学、教育、医学などの分野の中心となる様々な手段をカバーしている。我々は、QuEstを多次元メトリクスに拡張し、これや他のハイブリッド推定器の分散をさらに低減するための追加の最適化手法を導入する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:33:18 GMT)
Dicke-Ising quantum battery of an ion chain driven by a mechanical oscillator [12.8]
量子電池を実現可能かつ制御可能なプラットフォームに実装する手法を提案する。二次イオン間のホッピング相互作用とイオンと外部機械振動子との結合相互作用が電池の充電過程に及ぼす影響について検討した。我々の理論的分析は、実用的な量子電池の開発に確固たる基盤を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:12:55 GMT)
Engineering a Multi-Mode Purcell Filter for Superconducting-Qubit Reset and Readout with Intrinsic Purcell Protection [12.8]
超伝導量子回路におけるマルチモードパーセルフィルタを用いて、量子ビットリセットと読み出しに対するモード効率のアプローチを示す。これはマイクロ波共振器の異なる順序モードを利用して異なる量子ビット演算を行う最初の実験である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:46:29 GMT)
Event-based Stereo Depth Estimation: A Survey [12.7]
ステレオプシスは、生物が私たちの3D世界をナビゲートする深度を知覚する主要な方法であるため、ロボット工学において広くアピールされている。イベントカメラは、非常に高時間分解能と高ダイナミックレンジで、ピクセルごとの明るさ変化を非同期に検出する、バイオインスパイアされた新しいセンサーである。高度の時間精度もステレオマッチングの恩恵を受けており、イベントカメラが登場して以来の一般的な研究領域として不透明度(深度)が評価されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:34:31 GMT)
A Survey of Pun Generation: Datasets, Evaluations and Methodologies [12.6]
パン世代は、ユーモアや二重の意味を誘発するために、文章の中で言語要素を創造的に修正しようと試みている。また、コヒーレンスとコンテキスト的適切性を維持することを目的としており、様々なメディアやコンテキストにわたるクリエイティブな執筆やエンターテイメントに有用である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:12:46 GMT)
Event-based Photometric Bundle Adjustment [12.5]
イベントベース光束調整(EPBA)は、イベントのみの光束調整法である。 EPBAは測光誤差を最大90%減らすのに有効である現代の高解像度イベントカメラの実験は、EPBAのパノラマイメージングへの適用性を示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:31:37 GMT)
Performance guarantees of light-cone variational quantum algorithms for the maximum cut problem [12.1]
変分量子アルゴリズム(VQA)は、古典的計算よりも短期的な量子コンピューティングの利点を実証することを約束している。本稿では,標準VQAの最適ゲート列を選択することで,光円錐VQAを提案する。 1ラウンドの光円錐VQAはMaxCut問題に対して0.7926の近似比が得られることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:09:13 GMT)
Retain or Reframe? A Computational Framework for the Analysis of Framing in News Articles and Reader Comments [12.0]
我々は、ソースコンテンツ(ニュース記事)とオーディエンス応答(読者コメント)にわたるフレーミングの大規模解析のための、最初の計算フレームワークを提示する。フレームワークを11のトピックと2つのニュースソースに適用すると、コメントのフレーム再利用はアウトレット間で非常に相関し、トピック固有のパターンは様々である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:05:56 GMT)
AuroraLong: Bringing RNNs Back to Efficient Open-Ended Video Understanding [12.0]
本稿では,任意の長さの入力シーケンスを一定サイズの隠れ状態で処理する線形RNN言語モデルを提案する。我々は、線形RNNベースのLLMバックボーンをLLaVAライクなモデルでオープンエンドビデオ理解に初めて使用しました。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:05:19 GMT)
Distilling High Diagnostic Value Patches for Whole Slide Image Classification Using Attention Mechanism [11.9]
MIL(Multiple Instance Learning)はWSI(Whole Slide Image)分類の分野で広く注目を集めている。バッグレベルのMILメソッドの欠点は、より冗長なパッチの導入であり、干渉につながる。我々は,高い診断値のパッチを抽出するAFD-MIL (Feature Respiration Multi-Instance Learning) アプローチを開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:42:11 GMT)
Gradient-guided Attention Map Editing: Towards Efficient Contextual Hallucination Mitigation [11.5]
GAME(Guided Attention Map Editing)は、XSum要約タスクにおいて、幻覚を10%削減する。 GAMEは、計算効率の7倍のスピードアップを達成しながら、XSum要約タスクにおいて幻覚を10%削減する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:16:05 GMT)
Multi-modal Representations for Fine-grained Multi-label Critical View of Safety Recognition [11.5]
腹腔鏡下胆嚢摘出術にはCVS(Critical View of Safety)が重要である。従来のCVS認識モデルは、高価で労働集約的な空間アノテーションで学習する視覚のみのモデルに依存している。本研究では,テキストをトレーニングと推論の両方の強力なツールとして活用する方法を検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:44:58 GMT)
Conversational Education at Scale: A Multi-LLM Agent Workflow for Procedural Learning and Pedagogic Quality Assessment [11.5]
大規模言語モデル(LLM)は高度な仮想教育者と学習者を持ち、AI4EducationでNLPをブリッジする。 LLMを利用して対話型学習会話をシミュレートするマルチエージェントワークフローWikiHowAgentを提案する。教師と学習エージェント、対話マネージャ、および評価装置を統合し、手続き的学習を促進し、教育的品質を評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:56:37 GMT)
Enhancing Personalized Multi-Turn Dialogue with Curiosity Reward [11.5]
本稿では,好奇心に基づく固有報酬をマルチターンRLHFに組み込むために,ユーザモデルを活用することを提案する。この新たな報酬機構により、LLMエージェントは会話を最適化してユーザモデルの精度を向上させることにより、ユーザ特性を積極的に推測することができる。提案手法の有効性は,会話推薦タスクにおけるパーソナライズ性能の大幅な向上と,教育環境における異なる学習スタイルにおける会話のパーソナライズという2つの領域で実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:32:51 GMT)
NativQA Framework: Enabling LLMs with Native, Local, and Everyday Knowledge [11.4]
本研究では,大規模,文化的,地域的に整合したQAデータセットをネイティブ言語でシームレスに構築できるNativQAフレームワークを提案する。このフレームワークは24か国と7か国で39か所で評価され、300万以上の質問応答対が得られた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:43:16 GMT)
Optimal Model Selection for Conformalized Robust Optimization [11.3]
不確実性のある意思決定において、コンテキストロバスト最適化は、予測セットに対する最悪の決定損失を最小限にして信頼性を提供する。本稿では,決定リスクの最小化とロバスト性制御を統一するCROのための新しいモデル選択フレームワークを提案する。数値解析の結果、様々な合成および実世界のアプリケーションにおいて、決定効率とロバスト性に大きな改善が見られた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:14:42 GMT)
Spatial-Temporal Conditional Random Field for Human Trajectory Prediction [11.3]
軌道予測はコンピュータビジョンにおいて重要である。本研究では,textbfS-Tjectory CRF: textbfSpatial-textbfTemporal textbfConditional textbfRandom textbfFieldを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:24:07 GMT)
Universal Bound States in Long-range Spin Chains with an Impurity [11.2]
我々は、不純物を媒介する2つのマグノン相互作用が共鳴しているときに、普遍的な3つのマグノン状態の異なるクラスが現れることを示した。この結果は将来的に量子シミュレーションプラットフォームで実験的に検証される可能性がある。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:31:45 GMT)
Random Walks with Tweedie: A Unified View of Score-Based Diffusion Models [11.2]
拡散モデルは、現実的な合成信号を生成する強力なツールとして登場した。本論文では,数個の教科書結果にのみ依存する,有意なスコアベース拡散モデルに対する簡潔な導出について述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:20:26 GMT)
Layered, Overlapping, and Inconsistent: A Large-Scale Analysis of the Multiple Privacy Policies and Controls of U.S. Banks [11.1]
銀行は現在、複雑なデータ共有プラクティスを含むウェブサイト、モバイルアプリ、その他のサービスを運営している。我々は米国最大の銀行2,067行のプライバシーポリシーを収集し、そのうち45.3%が複数のポリシーを提供していた。このポリシーの多重性と、それが引き起こす不整合は、消費者の混乱を招き、それらを必要とする法律の透明性の目標を損なう可能性がある。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:55:48 GMT)
Supported Abstract Argumentation for Case-Based Reasoning [11.1]
ケースベース推論(SAA-CBR)のための支援された抽象表現法について紹介する。サポートにより、sAA-CBRは前駆体であるAA-CBRの制限を克服する。 sAA-CBRはスパイクを含まないが,キーモデル特性のトレードオフは行わない。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:32:08 GMT)
CVFusion: Cross-View Fusion of 4D Radar and Camera for 3D Object Detection [11.1]
本稿では,CVFusionと呼ばれる2段階間核融合ネットワークを提案する。第1段階では、高リコール3D提案ボックスを生成するために、レーダ誘導反復(RGIter)BEV融合モジュールを設計する。第2段階では、各提案のポイント、イメージ、BEVを含む複数の異種ビューから特徴を集約する。提案手法は,ビュー・オブ・デルフト(VoD)とTJ4DRadSetでそれぞれ9.10%,3.68%のmAP改善を達成し,従来の最先端手法よりも優れていた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:45:53 GMT)
ChangeBridge: Spatiotemporal Image Generation with Multimodal Controls for Remote Sensing [11.1]
ChangeBridgeはリモートセンシングのためのマルチモーダル制御を備えた生成モデルである。イベントやイベント駆動のバックグラウンドのバリエーションを含む、所定の条件に沿った、高忠実な将来のシナリオをシミュレートすることができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:51:55 GMT)
SIGIR 2025 -- LiveRAG Challenge Report [11.1]
SIGIR 2025のLiveRAG Challengeは、Retrieval-Augmented Generation技術の発展のための競争プラットフォームを提供する。 27カ国から70チームが、厳格な2時間の時間枠内で500の目に見えない質問に回答と支援情報を提供した。ファイナリストは2025年6月12日に発表され、イタリアのパドヴァにあるSIGIR 2025のLiveRAGワークショップで受賞した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:38:53 GMT)
SurgiSR4K: A High-Resolution Endoscopic Video Dataset for Robotic-Assisted Minimally Invasive Procedures [11.0]
SurgiSR4Kは、ネイティブ4K解像度で撮影された、初めて公開された外科画像とビデオデータセットである。このデータセットは、高解像度データから恩恵を受ける可能性のある幅広いコンピュータビジョンタスクの可能性を開く。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:09:20 GMT)
When Chain of Thought is Necessary, Language Models Struggle to Evade Monitors [10.7]
CoT(Chain-of- Thought)モニタリングは、AIの安全性を擁護するものだ。この「不信」に関する最近の研究は、その信頼性に疑問を呈している。重要な特性は忠実さではなく監視性である、と我々は主張する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:54:52 GMT)
FrameShift: Learning to Resize Fuzzer Inputs Without Breaking Them [10.7]
カバー誘導ファズナーは、強力な自動バグフィニングツールである。プログラムのインプットをミュートし、カバレッジを観察し、将来の突然変異のために未探索のパスに到達したインプットを保存します。本稿では,関係フィールドの検出と利用により,突然変異時の入力構造を保全する,新しい軽量な手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:07:23 GMT)
A Tale of Two Scripts: Transliteration and Post-Correction for Judeo-Arabic [10.7]
ユダヤ・アラビア語はヘブライ語で書かれており、ユダヤ人の作家やユダヤ人の聴衆のために書かれている。アラビア語をアラビア語の文字に自動翻訳する2段階のアプローチを導入する。アラビアのNLPツールがモルフォシンタクティックタグ付けや機械翻訳を行うことができることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:19:08 GMT)
GlaGAN: A Generative Unsupervised Model for High-Precision Segmentation of Retinal Main Vessels toward Early Detection of Glaucoma [10.6]
網膜血管の構造変化は緑内障発症と進行にとって重要なバイオマーカーである。本稿では,OCTA画像の主血管分割のための教師なし生成AIモデルであるGlaGANを紹介する。また,鮮明な毛細管構造を有する2D/3D緑内障網膜データセットであるGAS-RetVeinも紹介した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:21:37 GMT)
NavigScene: Bridging Local Perception and Global Navigation for Beyond-Visual-Range Autonomous Driving [10.6]
NavigSceneは、自律運転システム内の人間のような運転環境をシミュレートする補助的なナビゲーション誘導自然言語データセットである。 NavigSceneを活用するための3つのパラダイムを開発する。(1)ナビゲーションコンテキストをプロンプトアプローチに組み込むことで視覚言語モデルを強化するナビゲーション誘導推論、(2)視覚言語モデル応答を改善するための直接参照最適化を拡張する強化学習手法であるナビゲーション誘導推論、(3)ナビゲーション誘導視覚言語モデルと特徴融合による従来の運転モデルを統合するナビゲーション誘導言語推論モデルである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:37:01 GMT)
OASBuilder: Generating OpenAPI Specifications from Online API Documentation with Large Language Models [10.5]
OASBuilderは、長く多様なAPIドキュメントページを一貫性のあるマシン可読性のAPI仕様に変換するフレームワークである。 OASBuilderはエンタープライズ環境でうまく実装されており、何千時間もの手作業が省かれています。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:36:13 GMT)
BiMa: Towards Biases Mitigation for Text-Video Retrieval via Scene Element Guidance [10.3]
BiMaは、視覚的およびテキスト的表現のバイアスを軽減するために設計された新しいフレームワークである。視覚障害者には、これらのシーン要素をビデオ埋め込みに統合し、きめ細かな細部と細部を強調できるようにします。テキストの偏りを解消するために,テキスト特徴をコンテンツやバイアス成分に分解する機構を導入し,意味のあるコンテンツに集中できるようにする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:47:46 GMT)
CLIP-Guided Backdoor Defense through Entropy-Based Poisoned Dataset Separation [10.2]
ディープニューラルネットワーク(Deep Neural Networks, DNN)は、バックドア攻撃の影響を受ける。有毒データに対する現在のバックドア防御は、しばしば高い計算コストや、クリーンラベルやクリーンイメージバックドアのような高度な攻撃に対する低い効果に悩まされる。 CLIP誘導型バックドアディフェンス(CGD)は,様々なバックドア攻撃を軽減し,効率的かつ効果的な方法である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:29:26 GMT)
Red Teaming AI Red Teaming [9.9]
我々は、レッド・チームリングの元々の意図と、生成的AIの文脈におけるモデルレベルの欠陥の発見に焦点を合わせることには、大きなギャップがあることを論じる。マクロレベルのシステム・レッド・チームとマイクロレベルのモデル・レッド・チームという2つのレベルで、AIシステムにおけるレッド・チーム化を運用する包括的なフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:23:40 GMT)
Vecchia-Inducing-Points Full-Scale Approximations for Gaussian Processes [9.9]
ガウス過程に対するVecchia-inducing-points full-scale (VIF)近似を提案する。我々は、VIF近似は計算効率が良く、また、最先端の代替手法よりも精度が高く、数値的に安定であることを示した。すべてのメソッドは、オープンソースのC++ライブラリGPBoostで実装され、ハイレベルなPythonとRインターフェースを持つ。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:49:06 GMT)
SPARC: Concept-Aligned Sparse Autoencoders for Cross-Model and Cross-Modal Interpretability [9.9]
Sparse Autoencoders for Aligned Representation of Concepts)は,多種多様なアーキテクチャで共有される単一で統一された潜在空間を学習する新しいフレームワークである。 Open Imagesでは、概念のアライメントが劇的に改善され、ジャカードの類似性が0.80に到達した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:29:00 GMT)
Kalman Filter Aided Federated Koopman Learning [9.9]
フェデレート・クープマン学習(KF-FedKL)を支援するカルマンフィルタを提案する。 KF-FedKLはカルマンフィルタと連合学習とクープマン解析の組み合わせの先駆者である。具体的には、線形化のためのディープクープマンネットワークのトレーニングを駆動するために、単純だが効率的な損失関数を用いる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:26:20 GMT)
Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation [9.9]
我々は、textbfMultimodal textbfStepwise textbfDecomposition Chain of Thought (MSD-CoT) を介して textbfRegion-constrained textbfDual-stream textbfVisual textbfPrompting (RDVP) を相乗化する新しいトレーニングフリーなテスト時間適応フレームワークを提案する。 RDVPは、前景と背景点の視覚的プロンプトを視覚的および独立的にサンプリングする空間的制約を注入し、意味的相違を効果的に緩和する
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:59:53 GMT)
From Vision To Language through Graph of Events in Space and Time: An Explainable Self-supervised Approach [9.8]
自然言語でビデオコンテンツを記述するタスクは、一般にビデオキャプションと呼ばれる。通常のビデオキャプションと異なり、短くて広く公開されているが、自然言語による長文の説明は少ない。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:33:19 GMT)
Pseudo-likelihood produces associative memories able to generalize, even for asymmetric couplings [9.7]
広く使われている回避策は、グローバル正規化をトラクタブルな局所正規化に置き換える擬似的様相を最大化することである。ゼロ温度制限下では、擬似的類似度を最大化するために訓練されたネットワークが自然に連想メモリを実装していることを示す。この結果から,擬似的な動作は効率的な推論ツールであり,メモリや一般化の原理的なメカニズムであることが明らかとなった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:57:44 GMT)
Supporting Software Formal Verification with Large Language Models: An Experimental Study [9.7]
SpecVerifyは、大規模な言語モデルと正式な検証ツールを統合している。このフレームワークは、Claude 3.5 SonnetとESBMC検証器を組み合わせて自動化ワークフローを形成する。ロッキード・マーティンの9つのサイバー物理システムで評価されたSpecVerifyは、NASAのCoCoSimに匹敵する46.5%の精度を達成している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:30:05 GMT)
EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework [9.7]
Group Relative Policy Optimization (GRPO) は、RLの計算コストを下げるPPOの効率的な変種である。 EFRame(Exploration-Filter-Replay)は,GRPOを3つの重要な次元で体系的に拡張するフレームワークである。実験の結果,EFRameはトレーニングの堅牢性や効率性を向上するだけでなく,より深い推論機能へのアクセスを可能にすることがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:27:02 GMT)
CycleVAR: Repurposing Autoregressive Model for Unsupervised One-Step Image Translation [9.6]
現在の条件付き自己回帰画像生成手法は有望な結果を示しているが、実際の教師なし画像翻訳領域では、その可能性はほとんど解明されていない。臨界制限は、伝統的なベクトル量子化に基づくフレームワークに固有の離散量子化に由来する。我々は,連続確率混合プロセスとしてコードブックの選択を再構成する新しい手法であるSoftmax Relaxed Quantizationを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:20:58 GMT)
Colorectal Cancer Tumor Grade Segmentation in Digital Histopathology Images: From Giga to Mini Challenge [9.5]
大腸癌(CRC)は、世界で3番目に診断されたがんであり、がん関連死亡の原因としては2番目に多い。 ICIP Grand Challenge on Colorectal Cancer tumor Grading を組織した。データセットは、5つの組織クラスに対して、専門家のピクセルレベルのアノテーションを備えた103枚の全スライド画像で構成されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:59:16 GMT)
A Generalised and Adaptable Reinforcement Learning Stopping Method [9.3]
本稿では、強化学習(RL)に基づく技術支援レビュー(TAR)停止手法を提案する。以前のアプローチでは、リコールやコストの最大化のために、ターゲットリコールとトレードオフの修正など、動作の停止を限定的に制御していた。これらの制限は、単一のモデルを複数のターゲットリコールに適用できる新しいRL環境であるGRLStopを導入することで克服される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:14:00 GMT)
A Novel Automatic Real-time Motion Tracking Method in MRI-guided Radiotherapy Using Enhanced Tracking-Learning-Detection Framework with Automatic Segmentation [9.3]
MRI誘導放射線療法(MRIgRT)における正確な運動追跡は効果的な治療デリバリーに不可欠である。本研究は,MRIgRTにおける運動追跡精度をリアルタイムマーカーレス自動追跡法により向上することを目的とした。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:03:30 GMT)
ViGiL3D: A Linguistically Diverse Dataset for 3D Visual Grounding [9.3]
3Dビジュアルグラウンドティングは、自然言語テキストによって参照される3Dシーンでエンティティをローカライズする。多様な言語パターンに対して視覚的接地手法を評価するための診断データセットである3D (ViGiL3D) の視覚的接地について紹介する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:17:31 GMT)
Toward Valid Measurement Of (Un)fairness For Generative AI: A Proposal For Systematization Through The Lens Of Fair Equality of Chances [9.2]
ジェネレーティブAI(GenAI)システムの社会的損害と影響の相違は、効果的な不公平性測定アプローチに対する重要なニーズを浮き彫りにする。本稿では,GenAIの不公平度評価のための新たな枠組みを提案する。我々の枠組みは不公平を3つの中核的な構成要素に分解する: システムの結果から生じる害と利益、害と利益の分配に不平等をもたらすべきでない道徳的任意の要因、そして、異なる治療を適切に受けられるサブセットを区別する道徳的決定的要因である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:49:58 GMT)
LLM-based Question-Answer Framework for Sensor-driven HVAC System Interaction [9.0]
JARVISは、センサーデータ駆動型HVACシステムインタラクションに適した2段階のLLMベースのQAフレームワークである。高レベルのユーザクエリを構造化実行命令に変換するのに、Expert-LLMと、データ検索、統計処理、レスポンス生成を行うエージェントを使用している。 JARVISは, 自動評価とユーザ中心評価の両方において, ベースラインとアブレーションの変種を一貫して上回っている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:19:17 GMT)
Spooky Action at a Distance: Normalization Layers Enable Side-Channel Spatial Communication [8.9]
畳み込み型アーキテクチャを用いておもちゃの局所化タスクについて検討し、正規化層が反復的なメッセージパッシング処理を可能にすることを示す。この結果から,拡散に基づく軌道生成などの応用において,正規化層は注意を要することが示唆された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:00:02 GMT)
Transformers Can Solve Non-Linear and Non-Markovian Filtering Problems in Continuous Time For Conditionally Gaussian Signals [8.9]
テキストフィルタフォーマと呼ばれる連続時間変換モデルのクラスは、広範に非マルコフ的および条件付きガウス的信号プロセスの条件法則を概ね実装できることを示す。我々の近似は、真の最適フィルタとディープラーニングモデルの間の最悪のケース2-ワッサーシュタイン距離が近似誤差を定量化するような、十分に定期的な連続時間パスのコンパクトな部分集合を均一に保持することを保証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:43:25 GMT)
Beyond Communication Overhead: A Multilevel Monte Carlo Approach for Mitigating Compression Bias in Distributed Learning [8.9]
本稿では, 統計的に偏りのない推定値を構築するために, バイアス圧縮機を利用する新しいマルチレベルモンテカルロ圧縮手法を提案する。提案手法の汎用性を示すため,Top-$k$やビットワイド圧縮機などの一般的な圧縮機に適用する。我々は、その性能をさらに向上させるために、我々のアプローチの適応バージョンを導出する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:06:04 GMT)
Modeling Latent Partner Strategies for Adaptive Zero-Shot Human-Agent Collaboration [8.8]
我々は、様々なパートナー戦略を表現、分類、適応する戦略条件付き協調作業フレームワークであるTALENTSを紹介した。提案手法は変分オートエンコーダを用いて軌道データから潜在戦略空間を学習する。未確認のパートナーに適応するために、我々は固定共有後悔最小化アルゴリズムを利用する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:53:13 GMT)
SEPSIS: I Can Catch Your Lies -- A New Paradigm for Deception Detection [8.8]
本研究は, 心理学のレンズを通して, 騙しの問題を探究するものである。そこで本研究では,NLP技術を利用した偽造検出のための新しいフレームワークを提案する。我々は、微調整言語モデルのデータレスマージを利用した、新しいマルチタスク学習パイプラインを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:24:36 GMT)
Understanding Everything as Code: A Taxonomy and Conceptual Model [8.8]
コード・アズ・コード(EaC)は、現代のソフトウェアシステムのあらゆる側面を体系化することを目的とした新しいパラダイムです。人気が高まっているにもかかわらず、包括的産業標準と査読された研究の範囲を明確にし、採用を導くことは少ないままである。本研究は、EaCの既存の知識と知覚を体系的に分析し、その範囲と境界を明らかにし、研究者や実践者に対して構造化されたガイダンスを提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:21:02 GMT)
GIST: Cross-Domain Click-Through Rate Prediction via Guided Content-Behavior Distillation [8.8]
クロスドメインクリックスルーレート予測は、オンライン広告システムにおけるデータ空間とコールドスタートの問題に対処することを目的としている。既存の方法の多くは、この転送を容易にするために重複したユーザーに依存している。 GISTは、ソースとターゲットドメインのトレーニングプロセスを分離するクロスドメインライフロングシーケンスモデルである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:51:27 GMT)
Weakly Supervised Segmentation Framework for Thyroid Nodule Based on High-confidence Labels and High-rationality Losses [8.8]
トポロジカルな情報と解剖学的な情報を表現し,多段階の識別特徴を捉えるために,高信頼な擬似ラベルを用いたフレームワークを提案する。提案手法は,TN3KおよびDDTIデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:10:58 GMT)
Meta-Learning Transformers to Improve In-Context Generalization [8.7]
インコンテキスト学習は、入力プロンプトのみに基づいて、トランスフォーマーモデルを新しいタスクに一般化することを可能にする。既存のトレーニングパラダイムは一般的に、保存にコストがかかる大規模で非構造的なデータセットに依存します。我々は、複数の、小規模、ドメイン固有のデータセットのコレクションを活用する、代替的なトレーニング戦略を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:02:22 GMT)
R1-RE: Cross-Domain Relationship Extraction with RLVR [8.6]
関係抽出は自然言語処理における中核的な課題である。本稿では,REタスクに対する検証可能な報酬(RLVR)フレームワークであるR1-REを紹介する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:50:59 GMT)
Zero-shot Medical Event Prediction Using a Generative Pre-trained Transformer on Electronic Health Records [8.6]
生成事前学習型トランス (GPT) は, EHRにおける時系列データを利用して, 将来の事象を予測できる。これらのモデルの微調整はタスク固有のパフォーマンスを高めるが、多くの臨床予測タスクに適用するとコストがかかる。事前訓練された基礎モデルはゼロショット予測設定で使用することができ、結果ごとに微調整された個別モデルに代わるスケーラブルな代替手段を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:33:54 GMT)
QMoE: A Quantum Mixture of Experts Framework for Scalable Quantum Neural Networks [8.5]
量子機械学習(QML)は、ノイズの多い中間スケール量子(NISQ)時代に有望な方向として登場した。本稿では、エキスパート(MoE)パラダイムの混合をQML設定に統合する新しい量子アーキテクチャである、エキスパート(QMoE)の量子混合を提案する。私たちの研究は、スケーラブルで解釈可能な量子学習フレームワークの道を開いたものです。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:49:07 GMT)
CTA: Cross-Task Alignment for Better Test Time Training [8.5]
テストタイムトレーニング(TTT)は、モデルロバスト性を高める効果的な方法として登場した。 CTA(Cross-Task Alignment)は,TTTを改善するための新しいアプローチである。いくつかのベンチマークデータセット上で、最先端技術よりもロバスト性や一般化が大幅に向上したことを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:33:20 GMT)
Intervening to learn and compose disentangled representations [8.5]
本稿では,非絡み付き潜在構造を同時に学習する任意表現型生成モデルの学習手法を提案する。これは、任意の複雑な既存のデコーダブロックのヘッドに単純なデコーダのみのモジュールを追加することで実現される。因果的グラフィカルモデルへの介入の概念に触発されて、我々のモジュールはトレーニング中にアーキテクチャを選択的に修正し、異なるコンテキストでコンパクトなジョイントモデルを学ぶことができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:30:27 GMT)
In-Context Learning as an Effective Estimator of Functional Correctness of LLM-Generated Code [8.4]
コード品質評価のためのテキスト内学習(ICL)手法を提案する。トレーニングセットから,機能的正当性のサンプルを少数提供することにより,既存のQPPアプローチの性能が向上することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:01:17 GMT)
HGNet: High-Order Spatial Awareness Hypergraph and Multi-Scale Context Attention Network for Colorectal Polyp Detection [8.4]
HGNetは高次空間認識ハイパーグラフとマルチスケールコンテキストアテンションを統合している。 HGNetは94%の精度、90.6%のリコール、90%のmAP@0.5を達成し、小さな病変の分化と臨床的解釈性を著しく改善した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:09:05 GMT)
When Federated Learning Meets Quantum Computing: Survey and Research Opportunities [8.3]
量子フェデレーションラーニング(QFL)は、分散フェデレーションラーニング(FL)モデルのスケーラビリティと効率を改善するために、量子コンピューティング(QC)の進歩を活用する新興分野である。本稿では,FLがQCに適合する際の課題と解決策について,体系的かつ包括的な調査を行う。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:12:40 GMT)
Computationally Differentially Private Inner Product Protocols Imply Oblivious Transfer [8.2]
分散差分プライバシーでは、複数のパーティが協力して組み合わせたデータを分析し、各パーティはデータの機密性を他のパーティから保護する。特に, 内部積関数については, 最良な定数加算誤差であっても, 難読化が必要とされるかどうかが従来は分かっていなかった。我々は、内部積が$-1,1n 倍 -1,1n$ の加算誤差が $O(n1/6)$ になるまで見積もる計算的に微分プライベートなプロトコルが、曖昧な転送を構築するのに利用できることを証明した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:36:40 GMT)
Vision-Language Models Can't See the Obvious [8.2]
このベンチマークでは、人間の視覚処理の基本となる色、強度、方向などの低レベルな特徴に焦点を当てている。私たちのSalBenchは、シーン内の珍しい、珍しい、予期せぬ要素をハイライトし、自然に人間の注意を引き付けるイメージで構成されています。 Odd-One-Out Detection, Referring Odd-One-Out, Visual Referring Odd-One-Outという,LVLMの知覚能力を評価するための3つの新しいタスクで構成されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:16:38 GMT)
Quantum Codes with Addressable and Transversal Non-Clifford Gates [8.2]
我々は、$textitaddressable$ logical gateを誘導するゲートをサポートするコードを研究する。我々は、$textitaddressable と $ell neq 2$ gates で量子コードを構築するフォーマリズムを開発する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:47:26 GMT)
Asymptotically Good Quantum Codes with Addressable and Transversal Non-Clifford Gates [8.2]
本稿では、アドレナブルな非クリフォードゲートをサポートする優れた量子符号の族を構築する。より正確には、1つ、2つまたは3つのコードにまたがる3つの論理量子ビットが与えられたとき、$mathsfCCZ$ gateは深度1の物理回路を介してこれらの3つの論理量子ビット上で実行される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:24:40 GMT)
Fully Automatic Neural Network Reduction for Formal Verification [8.0]
到達可能性解析を用いたニューラルネットワークの完全自動・音量低減手法を提案する。音質は、低減されたネットワークの検証が元のネットワークの検証を必要とすることを保証します。我々のアプローチは、大きなニューラルネットワークを元のニューロンのごく一部に減らし、検証時間を同様の程度に短縮する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:06:46 GMT)
LoomNet: Enhancing Multi-View Image Generation via Latent Space Weaving [8.0]
LoomNetは複数回同じ拡散モデルを適用してコヒーレントな画像を生成する新しい多視点拡散アーキテクチャである。実験では、LoomNetは画像の品質と再現のメトリクスの両方において最先端の手法より優れています。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:46:50 GMT)
Matrix Majorization in Large Samples with Varying Support Restrictions [8.0]
大規模試料および触媒系におけるマトリックスの偏化について検討した。量子熱力学における触媒状態変換理論の応用を見いだす。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:53:22 GMT)
A dimensionality reduction technique based on the Gromov-Wasserstein distance [7.9]
本稿では, 最適輸送理論とGromov-Wasserstein距離に基づく次元減少法を提案する。提案手法は,高次元データを低次元空間に埋め込み,複雑な高次元データセットを解析するための堅牢で効率的な解を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:54:25 GMT)
Fast-VGAN: Lightweight Voice Conversion with Explicit Control of F0 and Duration Parameters [7.9]
ピッチ、持続時間、発話速度などの音声特性の制御は、音声変換の分野において重要な課題である。本稿では、基本周波数(F0)、音素配列、強度、話者識別を改良する手段を提供することを目的とした畳み込みニューラルネットワークに基づくアプローチを提案する。提案手法は,高い可知性と話者類似性を維持しつつ,高い柔軟性を提供することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:36:00 GMT)
The Generalization Ridge: Information Flow in Natural Language Generation [7.8]
最終層で減少する一般化リッジを形成する上層層において,予測情報がいかにピークに達するかを示す。これらの知見は, 変圧器の内部機構に関する新たな知見を与え, 一般化を支える中間層の重要性を裏付けるものである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:18:51 GMT)
InfoSteer: Steering Information Utility in Language Model Post-Training [7.8]
本稿では,学習後の言語モデル(LM)におけるパラメトリック情報の利用を促す軽量な手法を提案する。この単純なガイダンスは、Qwen、Gemma、Llamaなど、さまざまなモデルファミリで一貫したパフォーマンス改善を提供します。我々の研究は、バニラポストトレーニングが事前学習の可能性を十分に活用していないこと、そして潜在表現空間におけるLMの操舵は、有望なアプローチであることを示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:13:21 GMT)
The Super Weight in Large Language Models [7.6]
単一のパラメータでしか実行できないことは、LLMがテキストを生成する能力を損なう可能性がある。超重みと呼ばれるパラメータを識別するためのデータフリー手法を提案する。重み量子化では、スーパーウェイトを保存し、他のウェイトアウトレーヤを切断することで、ラウンド・ツー・アネレスト量子化は以前考えられていたよりもはるかに大きなブロックサイズにスケールできる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:42:19 GMT)
$\varphi$-Adapt: A Physics-Informed Adaptation Learning Approach to 2D Quantum Material Discovery [7.6]
量子フレークのキャラクタリゼーションは量子ハードウェア工学における重要なステップである。 2次元の量子フレークを識別するコンピュータビジョン法が登場したが、それでもフレークの厚さを推定する上で大きな課題に直面している。これらの障害を克服する物理インフォームド・アダプティブ・ラーニング・アプローチを最初に導入する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:40:35 GMT)
Predicting Drivers' Route Trajectories in Last-Mile Delivery Using A Pair-wise Attention-based Pointer Neural Network [7.6]
最終マイルの配達では、道路や縁石のインフラについて暗黙の知識があるため、ドライバーは計画されたルートから逸脱する。人間のドライバーが従うような実際の停止シーケンスを予測することは、ラストマイル配送におけるルート計画を改善するのに役立つ。本稿では、ドライバーの過去の配送軌跡データを用いて、この予測タスクのためのペアワイズアテンションに基づくポインターニューラルネットワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:25:46 GMT)
Piggyback Camera: Easy-to-Deploy Visual Surveillance by Mobile Sensing on Commercial Robot Vacuums [7.6]
Piggyback Cameraは、商用のロボット掃除機を使った視覚監視システムである。弊社のアプローチでは、カメラと慣性測定ユニット(IMU)を内蔵したスマートフォンをロボットに搭載し、ハードウェアを改造せずに商用ロボットに適用する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:52:45 GMT)
A Tensor Network based Decision Diagram for Representation of Quantum Circuits [7.6]
本稿では、テンソルネットワークの原理的かつ便利な応用のために、TDDと呼ばれる決定図式データ構造を提案する。回路分割を利用することにより、量子回路のTDDを効率的に計算することができる。 TDDは量子回路に関連する様々な設計自動化タスクにおいて重要な役割を果たすことが期待されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:19:25 GMT)
Information Needs and Practices Supported by ChatGPT [7.5]
本研究では,ChatGPTの利用者がChatGPTに訪れる情報ニーズと,ChatGPTがサポートする情報実践について検討する。以上の結果から,ChatGPTは生活領域や人的ニーズの幅広い領域で使用されていることが示唆された。 AI時代においては、情報の必要性は、理解と行動の両方を含む概念として、世界に巧みに対処するものとして概念化されるべきである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:21:20 GMT)
UrbanMind: Towards Urban General Intelligence via Tool-Enhanced Retrieval-Augmented Generation and Multilevel Optimization [7.5]
アーバン・ジェネラル・インテリジェンス(UGI)とは、ダイナミックで複雑な都市環境の中で自律的に知覚、理性、行動を行うAIシステムの能力を指す。本稿では,UrbanMindについて紹介する。UrbanMindは,UGIを促進するためのツール強化検索拡張生成(RAG)フレームワークである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:57:34 GMT)
Large Language Models for Network Intrusion Detection Systems: Foundations, Implementations, and Future Directions [7.5]
大規模言語モデル (LLM) は、人間のようなテキストを理解し、処理し、生成する能力で様々な分野に革命をもたらした。本稿では,ネットワーク侵入検知システム(NIDS)の進展におけるLCMの可能性について検討し,現状の課題,方法論,今後の可能性について考察する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:28:07 GMT)
Synergistic Localization and Sensing in MIMO-OFDM Systems via Mixed-Integer Bilevel Learning [7.5]
高性能なローカライゼーションとセンシングシステムは、ネットワーク効率と新たなインテリジェントアプリケーションに不可欠である。チャネル状態情報(CSI)とディープラーニングを統合することが,近年,有望なソリューションとして浮上している。この研究は、その潜在的なシナジーを活用するために、局所化タスクとセンシングタスクを共同でモデル化し、最適化することを目的としている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:34:22 GMT)
Quantum Doeblin Coefficients: Interpretations and Applications [7.4]
古典情報理論において、古典的チャネルのドエブリン係数は、チャネルの総偏差収縮係数に効率よく計算可能な上限を与える。ここでは、古典的概念の一般化としての量子ドエブリン係数について検討する。量子機械学習アルゴリズムの制限からエラー軽減プロトコルまで、量子Doeblin係数の様々な応用を概説する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:24:58 GMT)
Stop treating `AGI' as the north-star goal of AI research [7.3]
我々は、人工知能(AGI)の話題に焦点をあてることが、効果的な目標を選択する能力を損なうと論じている。 AGIの談話によって増大する6つの重要なトラップ、すなわち生産目標設定の障害を特定します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:58:03 GMT)
Towards Practical Alzheimer's Disease Diagnosis: A Lightweight and Interpretable Spiking Neural Model [7.3]
アルツハイマー病 (AD) の早期診断は, 主観的評価やマルチモーダル画像モダリティの高コストにより, 極めて困難である。脳にインスパイアされたパラダイムとして、スパイキングニューラルネットワーク(SNN)は本質的にADにおける神経変性のスパースでイベント駆動パターンをモデル化するのに適している。我々は、生物にインスパイアされたLIFニューロンと、領域適応的畳み込みとマルチスケールのスパイク注意を統合するハイブリッドニューラルネットワークであるFasterSNNを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:47:01 GMT)
Special-Unitary Parameterization for Trainable Variational Quantum Circuits [7.3]
SUN-VQC は、基本層が対称性制限されたリー部分群の単指数である変分回路アーキテクチャである。本研究では, SUN-VQC が2--3$times$で収束し, 深度整合パウリ回路よりも高い最終忠実度に達することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:21:02 GMT)
Adaptive Variation-Resilient Random Number Generator for Embedded Encryption [7.2]
本稿では、物理的に駆動されるエントロピー源から不偏の暗号化グレードのランダムな乱数ストリームを抽出できる適応的変動耐性RNGを提案する。発生した未バイアスのビットストリームは、エントロピーが高いため、単純化された後処理を行う必要がある。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:42:49 GMT)
any4: Learned 4-bit Numeric Representation for LLMs [7.0]
大規模言語モデル(LLM)のための学習された4ビット重み量子化ソリューションである any4 を提示する。 any4は関連する4ビットの数値表現型であるint4、fp4、nf4よりも精度が高い。多くの量子化手法で行うように、データセットからの数百のサンプルではなく、単一のキュレートされたサンプルを用いて校正できることが示される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:59:47 GMT)
News Source Citing Patterns in AI Search Systems [7.0]
我々は,AI検索システムを対象としたヘッド・ツー・ヘッド評価プラットフォームであるAI Search Arenaのデータを分析した。データセットは、OpenAI、Perplexity、Googleの3大プロバイダにわたるモデルから24,000以上の会話と65,000のレスポンスで構成されている。異なる提供者によるモデルは、異なるニュースソースを引用する一方で、引用行動における共有パターンを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:17:57 GMT)
Tempo-R0: A Video-MLLM for Temporal Video Grounding through Efficient Temporal Sensing Reinforcement Learning [7.0]
時間的ビデオグラウンド(TVG)は、言語クエリに基づいて、ビデオから関連する時間的セグメントをピンポイントする必要がある。本稿では,時間的ビデオグラウンド処理のためのビデオマルチモーダル大言語モデルであるTempo-R0を提案する。本手法は,元のQVHighlightsテストベンチの約3.5%でSOTAソリューションに対する顕著な優位性を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:51:40 GMT)
Variational quantum algorithm for generalized eigenvalue problems of non-Hermitian systems [6.8]
非エルミート系における一般化固有値問題を解くための変分量子アルゴリズムを提案する。シミュレーションによりアルゴリズムの性能を数値的に検証し,その海洋音響における一般化固有値問題への応用を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:59:16 GMT)
LAID: Lightweight AI-Generated Image Detection in Spatial and Spectral Domains [6.7]
現在の最先端AIGI検出方法は、大規模で深いニューラルネットワークアーキテクチャに依存している。我々は、市販軽量ニューラルネットワークの検知性能と効率をベンチマークし、評価する最初のフレームワークであるLAIDを紹介する。本研究は, 競合条件下であっても, 軽量モデルが競合精度を達成できることを実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:18:19 GMT)
On Araki-Type Trace Inequalities [6.7]
トレース不等式 $textTr[f(A) As Bs ] leq textTr[g(A) (A1/2 B A1/2 )s ]$ を証明します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:51:50 GMT)
Driving as a Diagnostic Tool: Scenario-based Cognitive Assessment in Older Drivers From Driving Video [6.7]
本研究の目的は、アルツハイマー病(AD)と軽度認知障害(MCI)の機能低下と臨床特徴に相関する「デジタル指紋」を抽出することである。本研究では,大規模視覚モデルとナチュラル・ドライビング・ビデオを用いてドライバの動作を分析し,認知状態の分類と疾患進行の予測を行うフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:30:00 GMT)
PRIME: Large Language Model Personalization with Cognitive Memory and Thought Processes [6.6]
大規模言語モデル(LLM)のパーソナライゼーションは、モデルのアウトプットを個人の独特な好みや意見と整合させることを目的としている。本稿では,エピソードおよびセマンティックメモリ機構を用いた統一フレームワークPRIMEを提案する。実験はPRIMEの有効性を長文と短文の両方のシナリオで検証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:54:34 GMT)
Hear-Your-Click: Interactive Video-to-Audio Generation via Object-aware Contrastive Audio-Visual Fine-tuning [6.6]
Hear-Your-ClickはインタラクティブなV2Aフレームワークで、ユーザーはフレームをクリックするだけでビデオ内の特定のオブジェクトのサウンドを生成できる。そこで本稿では,MVE (Mask-guided Visual) を用いたOCAV (Object-Aware Contrastive Audio-Visual Fine-tuning) を提案する。当社のフレームワークは,さまざまなメトリクスに対して,より精密な制御と生成性能の向上を実現しています。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:01:50 GMT)
Gradient-Based Excitation Filter for Molecular Ground-State Simulation [6.6]
本稿では,従来のコンピュータ上での単一および二重励起(UCCSD)アンサッツを用いたユニタリ結合クラスタを効率的に単純化する手法を提案する。提案手法は,最大46%のパラメータ減少,60%の回路深さ減少,678タイムのランタイムを実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:20:02 GMT)
Word stress in self-supervised speech models: A cross-linguistic comparison [6.6]
自己教師型音声モデル(S3M)で学習した単語のストレス表現について検討する。 5つの異なる言語に対する単語ストレスのS3M表現について検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:10:26 GMT)
LTMSformer: A Local Trend-Aware Attention and Motion State Encoding Transformer for Multi-Agent Trajectory Prediction [6.5]
軌道予測のための時間空間相互作用特徴を抽出する軽量なフレームワークLTMSformerを提案する。また、アクセラレーション、ジャーク、誘導などの高次動作状態属性を組み込むモーションステートも構築しています。実験の結果,HVT-64法はベースラインよりも優れ,minADE法は約4.35%,minFDE法8.74%,MR法20%の低下を示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:33:14 GMT)
SenseCF: LLM-Prompted Counterfactuals for Intervention and Sensor Data Augmentation [6.5]
対実的説明(CF)は、結果を変えるために必要な最小限の変更を強調することによって、機械学習の予測に対する人間中心の洞察を提供する。本研究では,大規模言語モデル,特にGPT-4o-miniについて,ゼロショットおよび3ショット設定でCFを生成する方法について検討する。ストレス予測のためのAI-Readiフラッグシップデータセットと、心臓病検出のためのパブリックデータセットの2つのデータセットに対するアプローチを評価した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:45:40 GMT)
Empowering Healthcare Practitioners with Language Models: Structuring Speech Transcripts in Two Real-World Clinical Applications [6.4]
2つの高インパクトNLPタスクは、データの不足と感度のために未探索のままである。これらの現実の臨床的タスクに対する実践的な解決策は、医療提供者に対するドキュメントの負担を大幅に減らすことができる。我々は,看護師観察と医療秩序抽出のための最初のオープンソースデータセットであるSynURとSIMORDをリリースする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:29:29 GMT)
When Does Pruning Benefit Vision Representations? [6.3]
プルーニングは深層学習モデルの複雑さを軽減するために広く用いられているが、解釈可能性や表現学習への影響はいまだに理解されていない。本稿では,3つの重要な次元,すなわち (i) 解釈可能性, (ii) 教師なし物体発見, (iii) 人間の知覚との整合性において,プルーニングが視覚モデルにどのように影響するかを考察する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:20:02 GMT)
Spatio-Temporal LLM: Reasoning about Environments and Actions [6.2]
MLLMは、全体論的時間的理解を必要とするプロンプトに正しく答えるのに依然として苦労していることを示す。環境の空間的理解と最近の観測の時間的理解を両立させるプロジェクタを備えたモデル「s-temporal LLM」(LLM)を開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:59:55 GMT)
Geometric-Guided Few-Shot Dental Landmark Detection with Human-Centric Foundation Model [6.0]
GeoSapiensは,前歯のCBCTによる頑健な歯のランドマーク検出を目的とした,新規な数ショット学習フレームワークである。その結果,GeoSapiensが既存のランドマーク検出法を超越したことが明らかとなった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:01:44 GMT)
SEE-2-SOUND: Zero-Shot Spatial Environment-to-Spatial Sound [6.0]
SEE-2-SOUNDは,タスクを(1)視覚領域の識別,(2)これらの要素を3次元空間に配置すること,(3)モノオーディオを生成すること,(4)空間オーディオに統合すること,に分解するゼロショットアプローチである。本フレームワークを用いて,インターネットから高画質ビデオ,画像,ダイナミック画像,および学習手法によって生成されたメディアに対して,空間音声を生成するための説得力のある結果を提示する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:42:19 GMT)
Towards Clean-Label Backdoor Attacks in the Physical World [5.9]
本稿では,顔認証と動物分類に関する実験を通じて,新たな攻撃パラダイム,SMSbfclean-label physical backdoor attack (CLPBA)について検討する。 CLPBAは、正しい毒殺アルゴリズムと物理的トリガーで深刻な脅威になる可能性がある。本研究は,意図しないオブジェクトやクラスが対象クラスとして誤って分類される場合に発生する,CLPBAの制限として,偶然のバックドアアクティベーションが強調される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:30:12 GMT)
BackFed: An Efficient & Standardized Benchmark Suite for Backdoor Attacks in Federated Learning [5.9]
Federated Learning (FL) システムは、バックドア攻撃に対して脆弱である。 BackFedはFLのバックドア攻撃と防御を標準化し、合理化し、確実に評価するためのベンチマークスイートである。 BackFedは、研究者が新しい攻撃と防御を包括的かつ確実に評価するための、プラグアンドプレイ環境である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:40:45 GMT)
MurreNet: Modeling Holistic Multimodal Interactions Between Histopathology and Genomic Profiles for Survival Prediction [5.9]
本稿では,MurreNet(マルチモーダル表現デカップリングネットワーク)を提案する。 MurreNetはペア化された入力データをモダリティ固有表現とモダリティ共有表現に分解し、モダリティ間の冗長性を減少させる。 6つのTCGA癌コホートで行った実験は、MurreNetが生存予測において最先端(SOTA)のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:26:29 GMT)
Rethinking Detecting Salient and Camouflaged Objects in Unconstrained Scenes [5.9]
そこで我々はUSCNetと呼ばれるモデルを提案する。そこで我々は, CSCSと呼ばれる評価指標を設計し, モデルが有意な対象と偽装対象を区別する能力を評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:27:31 GMT)
LaCoOT: Layer Collapse through Optimal Transport [5.9]
本稿では,過度にパラメータ化された深層ニューラルネットワークの深さを削減するための最適輸送方式を提案する。提案手法は,既存の手法に比べて高い性能/深度トレードオフを実現することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:01:32 GMT)
EXPOTION: Facial Expression and Motion Control for Multimodal Music Generation [5.8]
本稿では,マルチモーダルな視覚制御,特に人間の表情と上半身の動きを利用した生成モデルを提案する。我々は、事前訓練されたテキスト-音楽生成モデルにパラメータ効率細調整(PEFT)を適用した。表情と上半身のジェスチャーを対応音楽に合わせる7時間の同期映像記録からなる新しいデータセットを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:56:20 GMT)
MCFormer: A Multi-Cost-Volume Network and Comprehensive Benchmark for Particle Image Velocimetry [5.8]
Particle Image Velocimetry (PIV)は流体力学の基礎であるが、ディープラーニングアプリケーションは大きなハードルに直面している。重要なギャップは、光学フローモデルがPIVデータに対してどのように機能するかを包括的に評価することの欠如である。この作業は、PIV課題に適した基礎ベンチマークリソースと最先端メソッドの両方を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:26:18 GMT)
Using Large Multimodal Models to Extract Knowledge Components for Knowledge Tracing from Multimedia Question Information [5.8]
本稿では,学習内容から知識コンポーネントを自動的に抽出する手法を提案する。以上の結果から,自動抽出した知識コンポーネントは,ラベルを効果的に置き換えることが可能であることが示唆された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:37:34 GMT)
Dynamic Campus Origin-Destination Mobility Prediction using Graph Convolutional Neural Network on WiFi Logs [5.8]
大学構内における建物占有率と建物間移動を予測するための統合グラフベースニューラルネットワークアーキテクチャを提案する。我々は、Wi-Fiログからトラフィックフローパターンを学習し、建物内での使用スケジュールと組み合わせる。実験の結果,統合型GTMモデルは従来の歩行者流量推定装置よりも有意に優れていた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:04:43 GMT)
Interleaving Logic and Counting [5.7]
自然言語における量化子表現との推論は論理的特徴と算術的特徴を組み合わせたものである。私たちのトピックは、共通言語で発生するスタイルの協調である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:30:29 GMT)
An Investigation into Maintenance Support for Neural Networks [5.7]
ニューラルネットワークの維持における研究と実践の現状について検討する。以上の結果から,既存のツールは主にモデルの構築とトレーニングに重点を置いていることが示唆された。我々の研究は、現在のプラクティスが不足している部分について開発者中心の視点を提供することを目的としており、ニューラルネットワークのメンテナンスサポートを改善する機会を強調している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:53:15 GMT)
Dialogue-Based Multi-Dimensional Relationship Extraction from Novels [5.7]
本研究では,新しい領域における関係抽出に着目し,Large Language Models(LLMs)に基づく手法を提案する。関係次元分離,対話データ構築,文脈学習戦略を取り入れることで,提案手法は抽出性能を向上させる。我々は,ラベル付き資源の欠如に対処するため,高品質な中国新奇関係抽出データセットを構築した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:20:16 GMT)
VectorLLM: Human-like Extraction of Structured Building Contours vis Multimodal LLMs [5.6]
本稿では,リモートセンシング画像からパターン抽出を行うためのMLLM(Multi-modal Large Language Model)として,VectorLLMを紹介する。私たちのアーキテクチャは、視覚基盤、コネクター、理解能力を向上させるための強化された位置埋め込みで構成されています。ベクターLLMは航空機、水車、石油タンクなどの見えない物体に対して強いゼロショット性能を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:10:15 GMT)
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval [5.6]
テキストと画像表現を統一するマルチモーダル埋め込みモデルであるjina-embeddings-v4を導入する。このモデルにはタスク固有のローランド適応(LoRA)アダプタが組み込まれ、さまざまな検索シナリオのパフォーマンスを最適化する。また、この機能の評価を容易にするために、視覚的にリッチな画像検索に特化した新しいベンチマークであるJina-VDRを導入する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:41:02 GMT)
X-ray transferable polyrepresentation learning [5.5]
ポリ表現は、異なるソースから抽出された同じモダリティの複数の表現を統合する。 X線画像の文脈では、生成されたポリ表現がより小さなデータセットに転送可能であることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:05:50 GMT)
Integrating Biological and Machine Intelligence: Attention Mechanisms in Brain-Computer Interfaces [5.5]
時間、周波数、空間チャネルにわたる脳波の変化を捉えることで、注意機構は特徴抽出、表現学習、モデルロバスト性を改善する。従来のアテンションメカニズムは、畳み込みネットワークやリカレントネットワーク、Transformerベースのマルチヘッド自己アテンションと統合されている。我々は、注目に基づく脳波モデリングにおける既存の課題と新たなトレンドについて論じ、BCI技術の進歩に向けた今後の方向性を浮き彫りにする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:47:31 GMT)
Bridging KAN and MLP: MJKAN, a Hybrid Architecture with Both Efficiency and Expressiveness [5.5]
Modulation Joint Kan (MJKAN)は、これらの課題を克服するために設計された新しいニューラルネットワーク層である。 MJKANは、FILM(Feature-wise Linear Modulation)のようなメカニズムと放射基底関数の活性化を統合している。我々は,関数回帰,画像分類(MNIST, CIFAR-10/100),自然言語処理(AG News, SMS)など,様々なベンチマークでMJKANの性能を実証的に検証した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:13:32 GMT)
Relative Overfitting and Accept-Reject Framework [5.5]
本稿では,性能向上のためにモデルをセグメント化する方法を管理するアンサンブルフレームワークを提案する。 NLPの領域におけるこのフレームワークのパターンを詳述し、コンピュータビジョン(CV)や科学のためのAIなど他の分野に簡単に説明します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:56:43 GMT)
ISLES'24: Final Infarct Prediction with Multimodal Imaging and Clinical Data. Where Do We Stand? [5.4]
ISLES24の課題は、予防的急性期脳梗塞画像と臨床データから最終梗塞量を予測することである。マルチモーダルnnU-Netベースのアーキテクチャであるトップパフォーマンスモデルは、98ケースの隠れテストセットに対してDiceスコア0.285を達成した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:34:46 GMT)
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models [5.3]
遅延チャンキングと呼ばれる新しい手法を導入し、長いコンテキストの埋め込みモデルを利用して、まず長いテキストのトークンを埋め込む。結果として得られたチャンク埋め込みは、コンテキスト情報を完全にキャプチャし、様々な検索タスクにおいて優れた結果をもたらす。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:49:51 GMT)
Improving BERT for Symbolic Music Understanding Using Token Denoising and Pianoroll Prediction [5.3]
本稿では,様々なダウンストリームタスクの競合性能を実現するための,BERTライクなシンボリック音楽理解モデルを提案する。我々はトークン補正とピアノロール予測という2つの新しい事前学習目標を設計する。その結果,提案した事前学習目標が下流作業に有効であることが確認された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:52:06 GMT)
Multilevel Picard approximations and deep neural networks with ReLU, leaky ReLU, and softplus activation overcome the curse of dimensionality when approximating semilinear parabolic partial differential equations in $L^p$-sense [5.2]
我々は,Lmathfrakp$-senseでKolmogorov PDEの解を近似できるマルチレベルPicard近似とReLUによるディープニューラルネットワーク,リークReLU,ソフトプラスアクティベーションを証明した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:16:55 GMT)
Optimizing Entanglement and Bell Inequality Violation in Top Anti-Top Events [5.2]
スピン-スピン相関を対角化する基礎は,スピン相関,絡み合い,ベル不等式違反の最大化に最適であることを示す。 LHCと将来の$e+e-$コライダーのイベントにおいて,絡み合いやベルの不等式違反に対する感受性を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:59:56 GMT)
The supersingular endomorphism ring problem given one endomorphism [5.0]
我々は、E の自己準同型環が古典的時間で計算できることを証明した。また、楕円曲線上の滑らかなイデアルの作用が時間内に計算できることも証明する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:04:32 GMT)
Graph-Assisted Stitching for Offline Hierarchical Reinforcement Learning [5.0]
Graph-Assisted Stitching (GAS)はグラフ探索問題としてサブゴール選択を定式化する新しいフレームワークである。ガスクラスターは、異なる軌道からのセマンティックに類似した状態を統一グラフノードに分割し、効率的な遷移縫合を可能にする。グラフ品質を改善するために,ノイズや非効率な遷移状態をフィルタする時間効率(TE)指標を導入する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:23:25 GMT)
Heat Diffusion Models -- Interpixel Attention Mechanism [4.9]
本研究では,HDM(Heat Diffusion Model)を提案し,画像の詳細を保存し,よりリアルな画像を生成する。 HDMでは,2次元熱方程式の離散形式をDDPMの拡散および生成公式に統合する。実験により, DDPM, Consistency Diffusion Models (CDM), Latent Diffusion Models (LDM), Vector Quantized Generative Adversarial Networks (VQGAN) などのモデルと比較して, HDMは高品質なサンプルを生成することができた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:51:16 GMT)
Inaugural MOASEI Competition at AAMAS'2025: A Technical Report [4.8]
オープンエージェントシステム評価イニシアチブ(MOASEI)の取り組みオープンワールド条件下での意思決定を評価するために設計された競争。国際機関の11チームが参加した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:44:16 GMT)
Activation Steering for Chain-of-Thought Compression [4.8]
Activation-Steered Compression (ASC) は、隠れた表現を直接修正することで、推論トレースを短縮する推論時間技術である。我々は, 冗長な英語重のCoTと簡潔な数学中心のCoTが, モデルの残差ストリーム活性化空間の異なる領域を占めることを観察した。トレーニング不要の方法として、ASCは無視可能なオーバーヘッドを導入し、MATH500では、エンドツーエンドのウォールクロック実行時に平均2.73倍のスピードアップを提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:16:54 GMT)
From Marginal to Joint Predictions: Evaluating Scene-Consistent Trajectory Prediction Approaches for Automated Driving [4.8]
マージナル予測モデルは、通常、各エージェントの将来の軌跡を独立して予測する。合同予測モデルは、エージェント間の相互作用を明示的に説明し、社会的および物理的に一貫した予測をもたらす。予測精度,多モード性,推論効率の観点から各手法の評価を行った。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:58:53 GMT)
Reinforcement Learning under State and Outcome Uncertainty: A Foundational Distributional Perspective [4.8]
我々は分散強化学習(DistRL)を部分的に観測可能なマルコフ決定プロセス(POMDP)に拡張する。我々は、部分可観測性のための新しい分布型ベルマン作用素を導入し、それらの収束を p-ワッサーシュタイン計量の上限の下で証明する。本研究では,DPBVI(Distributedal Point-Based Value Iteration)を開発し,Phi-vectorsを標準のポイントベースバックアッププロシージャブリジンDistRLとPMDPプランニングに統合する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:26:07 GMT)
Self-supervised Deep Learning for Denoising in Ultrasound Microvascular Imaging [4.8]
超音波微小血管イメージング(UMI)に特化して設計された自己教師型認知フレームワークであるHalf-Angle-to-Half-Angle(HA2HA)を提案する。 Ha2HAは、ビームフォーミングラジオ周波数(RF)血流データの相補的な角の部分集合からトレーニングペアを構築し、ノイズが変化する間に血管信号が一貫性を保つ。コントラスト・ツー・ノイズ比(CNR)とSNRの両方で15dBを超える改善が観察され,画質が著しく向上した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:08:39 GMT)
A Concise Lyapunov Analysis of Nesterov's Accelerated Gradient Method [4.8]
一般凸関数と強凸関数の両方に対するネステロフの加速勾配法の収束率を簡潔に解析する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:38:27 GMT)
"Lost-in-the-Later": Framework for Quantifying Contextual Grounding in Large Language Models [4.7]
モデルと言語間の文脈的知識を測定する新しい評価フレームワークであるCoPEを紹介する。大規模言語モデルがどのようにコンテキストを統合し、情報を優先順位付けし、PKをオープンな質問応答に組み込むかを分析する。推論モデルと、チェーン・オブ・シント(CoT)によって引き起こされた非推論モデルが、CoTのない非推論モデルよりもコンテキストを使用し、失われた後の効果を軽減できないことがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:13:20 GMT)
The Neural Networks with Tensor Weights and the Corresponding Fermionic Quantum Field Theory [4.7]
複素数値ニューラルネットワーク(CVNN)とフェルミオン量子場理論(QFT)の理論的関係を確立する。テンソル値の重みを持つCVNNは本質的にフェルミオン量子場を生成する。 NN-QFTをボソニック理論を超えて拡張し、フェミオン対称性を機械学習モデルに符号化するための道を開く。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:46:11 GMT)
AI for the Routine, Humans for the Complex: Accuracy-Driven Data Labelling with Mixed Integer Linear Programming [4.7]
OPALは人手によるラベリング手法であり、ラベリングに必要な手作業を最小限に抑えつつ、所望の精度レベルを目標にすることができる。本稿では,テストデータの自動ラベリングとテストデータの自動検証という,ビジョンシステムのコンテキストにおける2つのタスクに対するOPALの評価を行う。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:30:30 GMT)
GraphBrep: Learning B-Rep in Graph Structure for Efficient CAD Generation [4.6]
GraphBrepは、コンパクトトポロジを明示的に表現し、学習するB-Rep生成モデルである。グラフ拡散モデルを用いて表面特徴に基づく位相の学習を行う。明示的な表現は、コンパクトなデータ構造を保証し、トレーニングと推論の両方において、計算コストを効果的に削減する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:43:46 GMT)
Bridging Expressivity and Scalability with Adaptive Unitary SSMs [4.6]
適応ユニタリ状態空間モデル(AUSSM)は、一様進化と高表現力を達成するために、スキュー対称で入力依存の再現性を持つ新しいSSMのクラスである。この結果から,適応的ユニタリ再帰は,記号的および連続的シーケンスモデリングの両方において,強力かつ効率的なアルゴリズムバイアスを与えることが示された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:47:16 GMT)
LAPS-Diff: A Diffusion-Based Framework for Singing Voice Synthesis With Language Aware Prosody-Style Guided Learning [4.6]
LAPS-Diffは,言語認識の埋め込みと統合された拡散モデルであり,音声スタイルの指導型学習機構である。我々はHindi SVSデータセットをキュレートし、事前訓練された言語モデルを利用して、リッチな歌詞表現のための単語と電話レベルの埋め込みを抽出する。 LAPS-Diffは,制約付きデータセットに対するSOTAモデルと比較して,生成したサンプルの品質を著しく向上させることを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:09:36 GMT)
Fairness and Sparsity within Rashomon sets: Enumeration-Free Exploration and Characterization [4.6]
本研究では,数理プログラミングに基づく列挙自由法を導入し,公平さや疎さなどの諸特性を特徴付ける。提案手法を2つの仮説クラス(スコアリングシステムと決定図)に適用する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:35:57 GMT)
UDF-GMA: Uncertainty Disentanglement and Fusion for General Movement Assessment [4.5]
一般運動評価(GMA)は、脳機能障害の早期発見のための非侵襲的ツールである。ポーズベースの自動GMA法は、高品質なデータとノイズの多いポーズ推定のために不確実性が生じやすい。本稿では,ポーズベース自動GMAにおけるモデルパラメータのアレタリック不確かさとデータノイズからのアレタリック不確かさを明示的にモデル化するUDF-GMAを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:32:47 GMT)
CREW-WILDFIRE: Benchmarking Agentic Multi-Agent Collaborations at Scale [4.5]
我々は、次世代マルチエージェントエージェントAIフレームワークを評価するために設計されたオープンソースのベンチマークであるCREW-Wildfireを紹介する。 CREW-Wildfireは、大きな地図、異種エージェント、部分観測可能性、ダイナミックス、長期計画目的を含む手続き的に生成された山火事対応シナリオを提供する。我々は、最先端のLLMベースのマルチエージェントエージェントAIフレームワークの実装と評価を行い、重要なパフォーマンスギャップを明らかにした。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:33:42 GMT)
AI for the Open-World: the Learning Principles [4.4]
この論文は、オープンワールドのためのAIを構築するために必要な学習原則を探求する。学習原則を使用するためのテクニックを提案し、学習原則を検証するために大規模な実験を行う。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:26:30 GMT)
ResQuNNs: Towards Enabling Deep Learning in Quantum Convolution Neural Networks [4.3]
準進化ニューラルネットワーク(QuNN)の性能向上のための,トレーニング可能な準進化層の導入による新しいフレームワークを提案する。この制限を克服するために、これらのレイヤ内でのトレーニングを可能にし、QuNNの柔軟性とポテンシャルを大幅に向上させました。本稿では,Residual Quanvolutional Neural Networks (ResQuNNs)を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:34:42 GMT)
From General to Specialized: The Need for Foundational Models in Agriculture [4.3]
人口が増加し、気候変動が拡大するにつれて、食料の安全保障は世界的な関心事となっている。基礎モデルの最近の進歩は、リモートセンシングや気候科学において顕著な性能を示している。作物タイプマッピング, 作物の表現学推定, 作物の収量推定など, 農業に関わる課題へのそれらの適用について検討した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:22:22 GMT)
On the Bias of Next-Token Predictors Toward Systematically Inefficient Reasoning: A Shortest-Path Case Study [4.3]
大規模言語モデルにおける推論を改善するための2つの重要な要因について検討する。我々は、カスタムトークン化器を用いて、質問-トレース-回答三重項に対してデコーダのみの変換器を訓練する。同じトレーニングの予算で、非効率なトレースで訓練されたモデルは、目に見えないグラフよりも一般化される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:06 GMT)
An analysis of vision-language models for fabric retrieval [4.3]
情報検索やレコメンデーションシステムといったアプリケーションには,クロスモーダル検索が不可欠である。本稿では,ファブリックサンプルのゼロショットテキスト・ツー・イメージ検索におけるビジョン言語モデルの利用について検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:00:18 GMT)
Latent Motion Profiling for Annotation-free Cardiac Phase Detection in Adult and Fetal Echocardiography Videos [4.3]
本稿では,自己教師型学習によるエンドディストル(ED)とエンドシストル(ES)検出のための教師なしフレームワークを提案する。本手法は,ED ESインデックスやセグメンテーション,ボリューム測定など,手動のアノテーションを必要としない。 EDの3フレーム (5Phase ms) とES検出の2フレーム (38.8 ms) の平均絶対誤差 (MAE) を達成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:10:46 GMT)
Trojan Horse Prompting: Jailbreaking Conversational Multimodal Models by Forging Assistant Message [4.3]
本稿では,新しいジェイルブレイク技術であるトロイの木馬プロンプティングを紹介する。悪意のあるペイロードがモデル分散メッセージに注入され、続いて悪意のあるユーザプロンプトが有害なコンテンツ生成をトリガーする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:35:21 GMT)
TLB-VFI: Temporal-Aware Latent Brownian Bridge Diffusion for Video Frame Interpolation [4.3]
ビデオフレーム補間(VFI)は、2つの連続する隣接するフレームに基づいて中間フレーム$I_n$を予測することを目的としている。近年,この課題に拡散モデル(画像ベースとビデオベースの両方)を適用し,高い性能を実現している。ビデオフレーム補間(TLB-VFI)のための時間対応ラテントブラウン橋拡散モデルを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:25:32 GMT)
Fast online node labeling with graph subsampling [4.3]
ノード予測のようなグラフベースの手法は、グラフのサイズに関係なく計算効率を目標としている。本稿では,意図的にメッセージがランダムにドロップされるエンフォリンサブサンプリングAPPR法について考察する。グラフスペーサーと行列線型代数のツールを用いて、グラフのスペクトル特性に近似境界を与える。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:32:37 GMT)
Neuralocks: Real-Time Dynamic Neural Hair Simulation [4.2]
ジャンプやウォーキングといったキャラクターの動きに反応してバウンスや揺れなどの髪のダイナミックな振る舞いは、全体的なリアリズムと仮想体験の関与を高める上で重要な役割を担っている。髪をシミュレートする現在の手法は、高度に最適化された物理系とニューラルな方法の2つの主要なアプローチによって制約されている。本稿では,これらの限界を打破し,効率的で安定した動的毛髪シミュレーションを実現する新しいニューラル手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:49:19 GMT)
Autonomous Microscopy Experiments through Large Language Model Agents [4.2]
大規模言語モデル(LLM)は、材料研究のための自己運転実験室(SDL)に革命をもたらしている。 LLM駆動エージェントによる原子間力顕微鏡の自動化フレームワークであるArtificially Intelligent Lab Assistant (AILA)を紹介する。アートモデルの現状が,基本的なタスクや調整シナリオに苦労していることに気付きました。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:21:44 GMT)
Evolutionary and Coevolutionary Multi-Agent Design Choices and Dynamics [4.2]
エージェント学習は、一方が進化しない側と、他方が互いに共進化する側とを競うように訓練されたときに評価される。コードライクなロジックでコントローラを表現できる文法を用いた文法進化アルゴリズムの我々のバージョンは、最高のチームパフォーマンスを達成することができる。アルゴリズムと表現の全体にわたって、共進化は両面のパフォーマンス高や低を減少させ、一方、両面のゆらぎを誘発する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:14:51 GMT)
Emerging Frameworks for Objective Task-based Evaluation of Quantitative Medical Imaging Methods [4.2]
定量的イメージング(QI)は、複数の臨床応用において強い将来性を示している。 QI法の臨床翻訳には,臨床関連課題に対する客観的評価が不可欠である。 QI手法の評価研究を行うための4つの新しいフレームワークについて概説する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:52:52 GMT)
Shapley-Based Data Valuation with Mutual Information: A Key to Modified K-Nearest Neighbors [4.1]
Information-Modified KNN (IM-KNN) は、Mutual Information (mathcalI$) とShapley値を利用して、隣人に重み付けされた値を割り当てる新しいアプローチである。 IM-KNNは、12のベンチマークデータセットで、従来のKNNの精度、精度、リコールをそれぞれ16.80%、17.08%、16.98%改善している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:46:25 GMT)
Coherent Spins in van der Waals Semiconductor GeS2 at Ambient Conditions [4.1]
ファンデルワールス(vdW)物質の光活性スピン欠陥は、多用途量子センサーとして出現している。この研究は、ファン・デル・ワールス物質のスピン欠陥による量子センシングの分野の拡大に役立つ。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:45:10 GMT)
Thunder-DeID: Accurate and Efficient De-identification Framework for Korean Court Judgments [4.0]
韓国司法裁判所は、公にされる前に裁判所判決の非正当性を委任する。現在の非識別プロセスは、厳格な法的要件を遵守しながら、大規模に裁判所判断を扱うには不十分である。我々はサンダー・デID(Thunder-DeID, Thunder-DeID)と呼ばれる、関連する法律や慣習に適合する非識別化フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:35:33 GMT)
Operator-based machine learning framework for generalizable prediction of unsteady treatment dynamics in stormwater infrastructure [3.9]
コスト効率の高い設計と計画には,その場での処理性能の正確な評価が不可欠である。従来のループ型動的モデルは計算効率が良いが、輸送と反応のプロセスが単純化され、予測精度と洞察が制限される。本研究では,水理と粒子状物質(PM)の空間的・時間的ダイナミクスを予測するために,最先端の演算子学習を活用する複合演算子ベースニューラルネットワーク(CPNN)フレームワークを開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:02:42 GMT)
LCDS: A Logic-Controlled Discharge Summary Generation System Supporting Source Attribution and Expert Review [3.9]
LCDSは論理制御型放電概要生成システムである。異なる臨床分野に適した放電サマリーを生成する。生成されたコンテンツのソース属性をサポートし、専門家が効率的にレビューし、フィードバックを提供し、エラーを修正できる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:25:52 GMT)
Spec-TOD: A Specialized Instruction-Tuned LLM Framework for Efficient Task-Oriented Dialogue Systems [3.9]
Spec-TODは、限られたデータでエンドツーエンドのTODシステムをトレーニングするために設計された新しいフレームワークである。広く使われているTODベンチマークであるMultiWOZデータセットの実験は、Spec-TODが競合する結果を得ることを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:03:20 GMT)
Recovering Plasticity of Neural Networks via Soft Weight Rescaling [3.8]
無拘束の重量成長は、可塑性損失の主な原因の1つである。本稿では,情報を失うことなく未拘束の体重増加を防止する手法として,ソフトウェイト・リスケーリング(SWR)を提案する。 SWRは学習プロセスの各ステップの重みを単純にスケールダウンすることで、ネットワークの可塑性を回復する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:02:55 GMT)
Tool for Supporting Debugging and Understanding of Normative Requirements Using LLMs [3.8]
規範的要件は、社会、法的、倫理的、共感的、文化的(SLEEC)の規範を規定する。これらの要件は通常、さまざまな専門知識を持つ非技術システムのステークホルダによって定義される。 SLEEC-LLMは、規範的要求の導出と整合性解析の効率性と説明性を向上する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:57:28 GMT)
Smart Grid: Cyber Attacks, Critical Defense Approaches, and Digital Twin [3.8]
国家の重要インフラとして、スマートグリッドはサイバーセキュリティ問題で広く注目を集めている。知的でデジタルでインターネットに接続されたスマートグリッドに向けた開発は、悪意ある活動のために外部の敵を引き寄せている。新たな技術として、デジタルツイン(DT)はセキュリティ強化のためのイネーブラーであると考えられている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:28:14 GMT)
Improving Numerical Stability of Normalized Mutual Information Estimator on High Dimensions [3.8]
k-Nearest Neighbor (k-NN) に基づく手法を用いて正規化された相互情報を推定するには、スケーリング不変なk-NN半径の計算が必要となる。本研究では,高次元空間における半径計算の数値安定性を向上させる対数変換手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:44:22 GMT)
What Would You Ask When You First Saw $a^2+b^2=c^2$? Evaluating LLM on Curiosity-Driven Questioning [3.7]
大規模言語モデル(LLM)は膨大な量の知識を格納できるが、新しい知識を取得する可能性はまだ不明である。本稿では,この能力を評価する新しい評価フレームワークを提案する。 GPT-4 や Mistral 8x7b のような大規模モデルはコヒーレントで関連する質問を生成するには適しているが、より小さな Phi-2 モデルは等しく、より効果的である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:02:28 GMT)
PEVLM: Parallel Encoding for Vision-Language Models [3.7]
我々は,視覚言語モデルのプリフィル効率を高めるために,微調整不要な並列符号化方式である textbfPEVLM を紹介する。 PEVLMは、入力ビデオを共有シンクブロックでコンテキストブロックに分割し、シーケンシャルな位置埋め込みを保持して、注意重量分布をFull-Attentionと整合させる。実験により、PEVLMは既存の並列符号化手法を一貫して上回り、注目計算で textbf7.47x のスピードアップを達成し、 textbf40% でエンドツーエンドのレイテンシを削減した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:07:53 GMT)
InterGSEdit: Interactive 3D Gaussian Splatting Editing with 3D Geometry-Consistent Attention Prior [3.7]
InterGSEditは、ユーザの好みでキービューをインタラクティブに選択することで、高品質な3DGS編集のための新しいフレームワークである。我々は,意図融合ネットワーク(AFN)を介して2次元交差注意と融合した3次元制約された注意を得るために,GAP3D$を計画する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:04:26 GMT)
Uncovering Neuroimaging Biomarkers of Brain Tumor Surgery with AI-Driven Methods [3.6]
本稿では,XAI(Explainable AI)とニューロイメージングに基づく機能工学を統合し,生存評価を行うフレームワークを提案する。以上の結果から,生存は認知機能や感覚機能に関連する領域の変化の影響が示唆された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:11:55 GMT)
Computing $n$-time correlation functions without ancilla qubits [3.6]
興味あるシステム上でのユニタリ進化のみを用いて,$n$-timeの相関関数を計算する手法を提案する。このアプローチは、デジタルプロセッサのハードウェア接続要件を大幅に緩和する。我々は、シュウィンガーモデルの単一粒子スペクトルを測定するために、IBM量子ハードウェア上で最大12キュービットのプロトコルを実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:36:27 GMT)
Establishing Causal Relationship Between Whole Slide Image Predictions and Diagnostic Evidence Subregions in Deep Learning [3.6]
Causal Inference Multiple Instance Learning (CI-MIL)は、サブイメージの認識の混乱を軽減するために配布外一般化を利用する。 CI-MILは、その選択された領域が基底真理アノテーションと高い一貫性を示すため、優れた解釈可能性を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:40:55 GMT)
Efficient Unlearning with Privacy Guarantees [3.6]
プライバシー保証付き非学習(EUPG)について紹介する。 EUPGは、データが学習されていない個人に対して、正式なプライバシー保証を提供する。提案手法は,非学習手法に匹敵する有効性と有効性を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:46:02 GMT)
RIPE: Reinforcement Learning on Unlabeled Image Pairs for Robust Keypoint Extraction [3.5]
キーポイント抽出器の弱教師付きトレーニングのための革新的強化学習に基づくフレームワークについて紹介する。このフレームワークは、検出タスクと記述タスクの両方に優れています。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:01:30 GMT)
Interpretable Machine Learning for Urban Heat Mitigation: Attribution and Weighting of Multi-Scale Drivers [3.5]
都市熱島(UHI)は、しばしば熱波(HW)の間にアクセントを付け、公衆の健康リスクを引き起こす。本研究は、これらのドライバを運転(D)、都市(U)、局所(L)特徴に分類することを提案する。解釈可能性の向上と効率の向上を目的として,LUT識別機械学習手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:21:45 GMT)
AI-Driven Cytomorphology Image Synthesis for Medical Diagnostics [3.5]
本研究は急性骨髄性白血病(AML)などの血液疾患の診断における重要な要素である単一白血球の分類に焦点を当てる。本研究では,微調整された安定拡散モデルを用いて生成した合成画像が,限られたデータに対する分類器性能をいかに向上させるかを示す。本研究は, バイオメディカル研究のツールとして合成画像を確立し, 機械学習モデルの改良, 医療診断・研究の促進を目的としている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:49:05 GMT)
FurniMAS: Language-Guided Furniture Decoration using Multi-Agent System [3.4]
家具の自動装飾システムFurniMASを提案する。作業用デスクやテレビスタンドなどの家庭用家具品や人為的なプロンプトが与えられた場合,本システムでは,適切なスタイルや材料を用いて,関連資産を提案する。 FurniMASはLLMベースと非LLMエージェントのハイブリッドチームを編成し、それぞれが典型的な装飾プロジェクトにおいて異なる役割を担っている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:45:08 GMT)
Universal approximation results for neural networks with non-polynomial activation function over non-compact domains [3.3]
単一隠れ層フィードフォワードニューラルネットワークの普遍近似特性をコンパクト領域を超えて拡張する。活性化関数が非多項式であると仮定することにより、ユークリッド空間の非コンパクト部分集合上で定義される函数空間内での普遍近似結果を確立する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:23:41 GMT)
Towards a Unifying Reference Model for Digital Twins of Cyber-Physical Systems [3.3]
デジタルツイン(Digital twins)は、サイバー物理システムの表現、監視、制御のための高度なソフトウェアシステムである。デジタル双生児の既存の定義と参照モデルは過度に抽象的であり、その包括的理解と実装指導を妨げる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:57:00 GMT)
Violation of local realism with spatially multimode parametric down-conversion pumped by spatially incoherent light [3.3]
自然パラメトリックダウンコンバージョン(SPDC)を空間的に非コヒーレントな光源・発光ダイオード(LED)で励起した2光子状態の偏光絡み合った空間的ポストセレクションによる局所リアリズムの違反を実験的に実証した。我々の研究は、デバイス非依存の量子鍵分布や量子エンハンスドセンシングのような量子技術のための、新しい、実用的な絡み合った光子の源を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:25:21 GMT)
Helix Parallelism: Rethinking Sharding Strategies for Interactive Multi-Million-Token LLM Decoding [3.3]
Helix Feed-Forward Network(FFN)ウェイトにアクセスし、長いKVキャッシュを読み取る。 Helix Parallelism (TP) はFFN重み読み込みのコストを軽減するのに役立つが、注意を向けるには十分ではない。 HOP-Bは、固定バッチサイズで最大1.5倍、DeepSeek-R1と同じレイテンシ予算で最大32倍のバッチをサポートする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:47:24 GMT)
Predicting mutational effects on protein binding from folding energy [3.3]
本稿では,タンパク質配列モデリングと折り畳み安定性予測の進歩を活用するトランスファーラーニング手法を提案する。折りたたみエネルギーのプロキシとして,事前学習した逆折り畳みモデルを用いることで,ゼロショット性能が向上することを示す。得られた予測器 StaB-ddG は、最先端の実験力場法 FoldX の精度に適合する最初のディープラーニング予測器である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:55:57 GMT)
Spatial and Semantic Embedding Integration for Stereo Sound Event Localization and Detection in Regular Videos [3.2]
本報告では,DCASE2025 Task 3 Challenge: Stereo Sound Event Localization and Detection in regular Video Contentの音声のみおよび音声視覚トラックに提案するシステムについて述べる。 SELDは、時間的事象分類と空間的局所化を組み合わせた複雑なタスクであり、空間的、時間的、意味的な次元にわたって推論を必要とする。そこで本研究では,音声用CLAPと視覚入力用OWL-ViTという,事前学習型コントラスト言語対応モデルを統合することで,セマンティック情報を用いた標準的なSELDアーキテクチャを強化した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:08:57 GMT)
Label-free evaluation of lung and heart transplant biopsies using tissue autofluorescence-based virtual staining [3.2]
従来の組織化学的染色プロセスは、時間がかかり、費用がかかり、労働集約的である。肺・心臓移植生検における仮想染色ニューラルネットワークのパネルについて述べる。仮想染色ネットワークは、高い色均一性を持つ高品質な組織像を一貫して生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:59:30 GMT)
On the quality of randomized approximations of Tukey's depth [3.2]
タキー深度は多変量データの集中度を広く測定する尺度である。タキーの深さの正確な近似を高次元で計算することは困難である。ランダム化アルゴリズムは最大深さ1/2$と0に近い深さを正確に近似することを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:24:11 GMT)
Is Your AI Truly Yours? Leveraging Blockchain for Copyrights, Provenance, and Lineage [3.1]
textscIBisは、AIモデルのトレーニングに適したブロックチェーンベースのフレームワークである。 textscIBisは、データセット、ライセンス、モデルのオンチェーンレジストリと、オフチェーン署名サービスを統合する。私たちは、Cantonブロックチェーン上でDamlを使用してtextscIBisを実装します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:28:50 GMT)
Identifying visible tissue in intraoperative ultrasound: a method and application [3.1]
術中超音波検査は, 必要なビゾタクタクタブル・タスクである。根底にある可視組織を特定するために,反復フィルタリングとトポロジカル手法を提案する。プローブ組織接触の信頼性評価を行うための新しい枠組みを作成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:47:34 GMT)
A Query-Aware Multi-Path Knowledge Graph Fusion Approach for Enhancing Retrieval-Augmented Generation in Large Language Models [3.1]
QMKGFはクエリ対応マルチパス知識グラフフュージョンアプローチであり、検索拡張生成を促進する。我々はプロンプトテンプレートを設計し、汎用LLMを用いてエンティティや関係を抽出する。本稿では, ワンホップ関係, マルチホップ関係, 重要度に基づく関係を組み込んだマルチパスサブグラフ構築戦略を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:22:54 GMT)
EyeTrAES: Fine-grained, Low-Latency Eye Tracking via Adaptive Event Slicing [3.0]
EyeTrAESは、自然眼球運動の高忠実度追跡のためのニューロモルフィックイベントカメラを用いた新しいアプローチである。その結果,EyeTrAESの瞳孔追跡精度は6+%向上し,IoU=92%,IoU=32%向上した。頑健なユーザ認証のために,短期瞳孔運動学の特徴ベクトルを用いて,ユーザ当たりの軽量なランダムフォレスト分類器を訓練する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:22:09 GMT)
FinSurvival: A Suite of Large Scale Survival Modeling Tasks from Finance [2.9]
人工知能(AI)サバイバルモデルをベンチマークするために、大規模で現実的で自由に利用できるデータセットが必要である。分散ファイナンス(DeFi)における暗号通貨の貸与によって生成された公開取引データから16の生存モデリングタスクスイートを導出する。我々は16の生存時間予測タスクからなる生存ベンチマークを定式化する(FinSurvival)。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:48:47 GMT)
Principle of Relativity and The Renormalizable Quantum Gravity [2.9]
我々は、相対性理論という新しい相対性理論に基づいて純粋に量子論を発展させた。原理の本質を量子領域に拡張し、能動変換と受動変換の同一構造を維持することを実証する。量子重力効果は再正規化可能な理論の中で自然に実現され、一般相対性理論は大きな距離で現れる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:04:59 GMT)
Qwen vs. Gemma Integration with Whisper: A Comparative Study in Multilingual SpeechLLM Systems [2.9]
本稿では,MLC-SLM Challenge 2025のための大規模言語モデル(LLM)を用いた多言語音声認識と言語モデリングに焦点を当てた。本システムでは,Qwen2.5-7Bをデコーダのみの言語モデルとして,Gemma3-12Bと18.6%を用いて,プライベートテスト平均WER/CERの16.63%の競合性能を実現している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:09:16 GMT)
Physics Encoded Blocks in Residual Neural Network Architectures for Digital Twin Models [2.9]
物理インフォームド・機械学習は、デジタル双生児におけるモデリングとシミュレーションの一般的なアプローチとして登場した。本稿では,新しい物理符号化残差ニューラルネットワークアーキテクチャに基づく汎用的アプローチを提案する。本手法は、物理モデルとフィードフォワード学習ブロックとから、微分可能な物理ブロックを実装する数学的演算子を統合する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:30:17 GMT)
Beyond Training-time Poisoning: Component-level and Post-training Backdoors in Deep Reinforcement Learning [2.8]
深層強化学習(Dep Reinforcement Learning, DRL)システムは、安全クリティカルなアプリケーションでますます使われているが、そのセキュリティはいまだに過小評価されている。本研究は、特定の入力が観測空間に現れる場合にのみ悪意ある行為を引き起こす隠されたトリガーを埋め込むバックドア攻撃を調査する。 1) 完全モデル再訓練に耐える持続的バックドアを移植するためにコンポーネントレベルの欠陥を利用するTrojanentRLと,(2) トレーニングや検証,テストデータへのアクセスを必要としないトレーニング後のバックドア攻撃であるInfrectroRLである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:15:54 GMT)
CP-Dilatation: A Copy-and-Paste Augmentation Method for Preserving the Boundary Context Information of Histopathology Images [2.8]
本稿では,CP-Dilatation と呼ばれる従来の Copy and Paste (CP) Augmentation 技術に基づく新しいデータ拡張手法を提案する。従来のCP手法では,悪性度の境界コンテキスト情報を保存できる拡張演算が提案されている。病理組織学的ベンチマークを用いた実験では, 提案手法は, 比較のために選択された他の最先端ベースラインよりも優れていることがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:34:02 GMT)
A Cycle-Consistency Constrained Framework for Dynamic Solution Space Reduction in Noninjective Regression [2.8]
本稿では,サイクル一貫性に基づくデータ駆動トレーニングフレームワークを提案する。正規化合成およびシミュレーションデータセットの実験により,提案手法が0.003未満のサイクル再構成誤差を達成することを示した。このフレームワークは手動による介入への依存を著しく減らし、非インジェクティブ回帰タスクの潜在的な利点を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:28:01 GMT)
LumiCRS: Asymmetric Contrastive Prototype Learning for Long-Tail Conversational Movie Recommendation [2.8]
見出し映画の10%が言及のほぼ半分を占めており、テール映画の約70%はわずか26%しか注目されていない。この不均衡は、頭過剰適合、体表のドリフト、尾の間隔という3つの重要な課題を引き起こします。本稿では,LumiCRSを提案する。LumiCRS,LumiCRS,LumiCRS,LumiCRS,LumiCRS,LumiCRS,LumiCRS,LumiCRS,LumiCRS,LumiCRS,LumiCRS。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:33:00 GMT)
Are Information Retrieval Approaches Good at Harmonising Longitudinal Survey Questions in Social Science? [2.8]
本稿では,質問と回答の選択肢にまたがる概念等価性を識別する新しい情報検索タスクを提案する。本稿では1946-2020年の調査データセットにおける教師なしアプローチについて検討する。我々は、IR特化ニューラルモデルが、他のアプローチと相容れない性能で最高の総合的な性能を達成することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:58:36 GMT)
Mechanistic Indicators of Understanding in Large Language Models [2.8]
我々は,Large Language Models (LLM) が,接続の確認に係わる理解と機能的に類似した内部構造を発達させることを論じる。我々は「並列メカニズム」現象を探求し、LLMは理解の形式を示すが、認知アーキテクチャは我々のものとは相変わらず異なると論じる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:26:31 GMT)
Photon Splatting: A Physics-Guided Neural Surrogate for Real-Time Wireless Channel Prediction [2.7]
本稿では,複雑な環境下でのリアルタイム無線チャネル予測のための物理誘導型ニューラルサロゲートモデルであるPhoton Splattingを提案する。そこで本研究では,標準的な3Dシーンから,1000台の受信機を備えた複雑な屋内カフェまで,一連の実験を通じて,フレームワークの有効性を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:18:43 GMT)
Semantically Consistent Discrete Diffusion for 3D Biological Graph Modeling [2.7]
本稿では,構造的および意味的妥当性の条件に固執する3次元生物学的グラフ生成法を提案する。提案手法は,Willisと肺気道の人間円の2つの実世界のデータセットにおいて,優れた性能を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:29:54 GMT)
VCDiag: Classifying Erroneous Waveforms for Failure Triage Acceleration [2.7]
VCDiagは機械学習を使って、故障した波形を分類し、潜在的な故障箇所を特定できる。最上位3つのモジュールを識別する精度は94%を超えている。様々なVerilog/SystemVerilogの設計とテストベンチに統合できる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:56:18 GMT)
Domain Adaptation of VLM for Soccer Video Understanding [2.7]
視覚言語モデル(VLM)は、視覚的およびテキスト的表現を効果的に整合させることにより、マルチモーダルタスクにおいて強力な性能を示す。本研究は,オープンソースVLMの特定の領域への適応性について検討し,最初の事例研究としてサッカーに注目した。最終適応モデルは、20kビデオクリップのキュレートされたデータセットを使用してトレーニングされ、ベースモデルと比較してサッカー特有のタスクが大幅に改善されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:34:07 GMT)
DoPI: Doctor-like Proactive Interrogation LLM for Traditional Chinese Medicine [2.7]
現在の大規模言語モデル (LLM) は医学的応用において顕著な限界を呈している。本稿では,中国伝統医学(TCM)分野に特化して設計された新しいLLMシステムであるDoPIを提案する。指導モデルは患者とのマルチターン対話を行い,知識グラフに基づく質問を動的に生成する。エキスパートモデルは、深いTCMの専門知識を活用して、最終診断と治療計画を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:04:03 GMT)
On estimating the quantum $\ell_α$ distance [2.6]
時間複雑性を持つ$mathrmT_alpha(rho_0,rho_1)$に対する効率的なランク独立量子推定器を開発した。我々のアルゴリズムは、量子状態微分可能性問題の計算複雑性の2分法をSchatten $alpha$-norm (QSD$_alpha$)で明らかにしている。この硬さは、1leq α leq infty$ の量子 $ell_alpha$ 距離に対する新しい階数依存の不等式に基づく還元の結果に続く。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:48:44 GMT)
Hybrid Adversarial Spectral Loss Conditional Generative Adversarial Networks for Signal Data Augmentation in Ultra-precision Machining Surface Roughness Prediction [2.6]
本稿では,効率的なUPMデータ拡張のためのハイブリッド逆スペクトル損失CGANであるHAS-CGANを提案する。 Hass-CGANは、特に高周波信号に対して、1次元の力信号生成に優れる。従来のML(SVR, RF, LSTM)とディープラーニングモデル(BPNN, 1DCNN, CNN-Transformer)による実験では、520以上の合成サンプルでトレーニングデータを増強することで予測誤差が31.4%から9%に減少することを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:10:46 GMT)
One fish, two fish, but not the whole sea: Alignment reduces language models' conceptual diversity [2.6]
研究者は大規模言語モデル(LLM)を人間の行動研究の代替として使用することを提案した。トレーニング後のアライメント(RLHFまたはRLAIF)がモデルの内部多様性に影響を及ぼすかどうかが議論されている。我々は、シミュレーションされた個体の内部変動と集団レベルの変動を関連づけることで、合成合成LLMの「人口」の概念的多様性を測定する新しい方法を用いる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:34:06 GMT)
Anderson-Skin dualism [2.6]
非エルミート系と準周期結合系に出現する新たな局在化現象を報告し、アンダーソン・スキン(AS)双対論を提唱する。 AS双対論の出現は、非エルミート的トポロジカル系が障害系の非自明なトポロジカルトランスポートチャネルを提供するという事実による。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:50:58 GMT)
A Statistical Approach for Synthetic EEG Data Generation [2.6]
本研究では,相関解析とランダムサンプリングを組み合わせて,リアルな合成脳波データを生成する手法を提案する。生の脳波と生の脳波を区別するために訓練されたランダムフォレストモデルは、偶然に高い忠実度を示す。この方法は、脳波データセットを拡張するためのスケーラブルでプライバシー保護のアプローチを提供し、メンタルヘルス研究におけるより効率的なモデルトレーニングを可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:53:52 GMT)
Acquiring and Adapting Priors for Novel Tasks via Neural Meta-Architectures [2.5]
我々は、大量のデータが利用できない場合に、事前の効率的な取得を可能にするアーキテクチャの設計に重点を置いている。 MML(Model Agnostic Meta-Learning)でトレーニングした際、我々のハイパーネットワーク設計が標準ネットワークよりもより一般化可能な事前知識を得ることが実証された。従来から見てきたシーンからの先行情報を効率的に転送することで、限られたデータで新しいシーンで3Dセグメンテーションを行うためのハイパーネットワークフレームワークを拡張した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:48:09 GMT)
Hardware-efficient tractable probabilistic inference for TinyML Neurosymbolic AI applications [2.4]
ニューロシンボリックAI(NSAI)は、最近、ディープラーニング(DL)モデルに関連する制限を軽減するために登場した。 TinyMLハードウェアは、組み込みシナリオにNSAIをもたらすために、これらの象徴的なモデルをサポートする必要がある。 NSAIをTinyMLハードウェアで計算するための完全なフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:51:18 GMT)
Sequential Attention-based Sampling for Histopathological Analysis [2.4]
SASHAは病理像の効率的な解析のための深層強化学習手法である。軽量な階層的、注目に基づくマルチインスタンス学習(MIL)モデルで情報機能を学ぶ。 SASHAは,WSIを高精細度で解析する最先端の手法と一致し,計算コストとメモリコストのごく一部で一致していることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:03:12 GMT)
MMD-OPT : Maximum Mean Discrepancy Based Sample Efficient Collision Risk Minimization for Autonomous Driving [2.4]
MMD-OPTは任意の予測分布下での衝突のリスクを最小限に抑えるための試料効率のよい手法である。本稿では,これらの2つの概念を用いて衝突リスク推定のための効率的なサロゲートのサンプルを定義する方法について述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:36:56 GMT)
Replacing thinking with tool usage enables reasoning in small language models [2.4]
近年の進歩は、推論時間とトレーニング時間における計算のスケールアップに基づく、新しい機械学習パラダイムを確立している。本稿では,これらのトークンをステートフルツールを用いたマルチターンインタラクショントレースとしてフォーマットすることを提案する。各ターンで、ツールの新しい状態がモデルのコンテキストに追加され、そのジョブはカスタムDSLを介してツールを制御するのに必要なトークンを生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:49:18 GMT)
Time Crystal in the Nonlinear Phonon Mode of the Trapped Ions [2.3]
時間結晶は、時間-翻訳対称性の自発的な破れによって定義される新しい物質相を構成する。トラップイオン系の振動フォノンモードにおける連続時間結晶の実現手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:20:48 GMT)
Training-Conditional Coverage Bounds under Covariate Shift [2.3]
コンフォーマル予測法は訓練条件を含むように拡張されている。予測セットの品質と分布変化の重大度との関係を定量化し、より効率的な予測セットの計算に使用できる可能性がある。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:39:42 GMT)
Logit Reweighting for Topic-Focused Summarization [2.3]
生成中のトピック関連トークンのロジットを直接重み付けすることで、トピック関連性を高める軽量な手法を提案する。我々は、ロジットに一定の値を加える定数シフト、係数を乗算するファクタスケーリング、確率閾値を超えるロジットを選択的に向上するThreshold Selectionの3つの手法を評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:44:21 GMT)
Estimating Object Physical Properties from RGB-D Vision and Depth Robot Sensors Using Deep Learning [2.1]
慣性質量は、物体の把握、操作、シミュレーションなどのロボット応用において重要な役割を果たす。本稿では,深度画像とRGB画像との疎点クラウドデータを組み合わせて,物体の質量を推定する手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:11:47 GMT)
Hunting in the Dark: Metrics for Early Stage Traffic Discovery [2.1]
本研究では,暗号鍵マルウェアパッケージであるCrackonoshの検出について,その挙動を識別するためのさまざまな指標を用いて検討した。発見可能性の指標を用いて,マルウェアの数が減少するにつれて,防御者がCrackonoshトラフィックを測定する能力をモデル化する。異なる暗黒空間サイズがマルウェアを追跡する能力の両方にどう影響するかを実証するが、攻撃者のミスを悪用して突発的な行動を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:23:07 GMT)
Gendered Divides in Online Discussions about Reproductive Rights [2.0]
特に保守的な地域では,性差が中絶態度や感情表現を著しく低下させることが示された。これにより中絶態度の男女差が生じ、保守的な地域ではより顕著になる。 Dobbsの草案は、オンラインのエンゲージメントをさらに強化し、アクセスが脅かされている地域で、排他的女性を不当に動員した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:49:30 GMT)
iLSU-T: an Open Dataset for Uruguayan Sign Language Translation [2.0]
iLSU Tは、ウルグアイの手話RGBビデオに音声とテキストの書き起こしを加えたオープンデータセットである。このタイプのマルチモーダルおよびキュレートされたデータは、手話処理のためのツールを理解したり生成したりするための新しいアプローチを開発する上で最重要である。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:11:21 GMT)
A Generative Diffusion Model for Amorphous Materials [2.0]
従来のシミュレーションの1000倍の速度でアモルファス構造を確実に生成する拡散モデルを提案する。条件生成により、10$-2$ K/psの低い冷却速度で大型構造物をサンプリングし、延性-脆性遷移とメソポーラスシリカ構造を明らかにすることができた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:08:10 GMT)
Q-Detection: A Quantum-Classical Hybrid Poisoning Attack Detection Method [2.0]
データ中毒攻撃は、機械学習モデルに重大な脅威をもたらす。本稿では,量子古典的ハイブリッド防御法であるQ-Detectionを提案する。 Q-Detectionは量子コンピューティングデバイスで最適化されたQ-WANも導入している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:43:34 GMT)
Adaptation of Multi-modal Representation Models for Multi-task Surgical Computer Vision [1.9]
MML-SurgAdaptは、自然言語の監視を通じて様々な外科的タスクを処理するための統合マルチタスクフレームワークである。マルチタスク学習における重要な課題は、異なるタスクを統合する際に部分的なアノテーションが存在することである。本フレームワークは,複数の外科的タスクからのデータを単一の手順に統合し,不完全あるいはノイズの多いアノテーションにもかかわらず効果的な学習を可能にするため,このアプローチを拡張した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:03:10 GMT)
The Symmetry Taco: Equivalences between Gapped, Gapless, and Mixed-State SPTs [1.9]
我々は,SymTFTフレームワークの混合状態への自然な拡張を,テクスト対称性タコを導入して提案する。我々のフレームワークは、1+1$dの短距離相関を持つ$G$-symmetric Choi状態の分類を生成する。混合状態量子物質における双対性、異常、非平衡臨界性を探求するための新しい道を開く。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:00 GMT)
Simulating Refractive Distortions and Weather-Induced Artifacts for Resource-Constrained Autonomous Perception [1.8]
本稿では, 現実的な屈折歪みと気象にともなうアーティファクトを伴って, 低コストな単眼ダッシュカム撮影を可能にするプロシージャ拡張パイプラインを提案する。我々の屈折モジュールは、レンズ歪み、パーリンノイズ、薄膜スプライン(TPS)、ばらつきのない(非圧縮性)ワープなど、低品質レンズと空気乱流の光学効果をシミュレートする。コストのかかるデータ収集やラベリング、シミュレーションを伴わずに、表現の少ないアフリカの文脈における知覚研究を支援するため、歪みツールキット、データセット分割、ベンチマーク結果をリリースする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:21:19 GMT)
SOSAE: Self-Organizing Sparse AutoEncoder [1.8]
オートエンコーダ(SOSAE)の自己組織化正規化物理学の概念に触発されたSOSAEは、構造化された方法で特徴空間に空間を誘導する。様々なデータセットの実験により、SOSAEは最大130倍の浮動小数点演算(FLOP)を調整できることがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 03:55:02 GMT)
Enhancing variational quantum algorithms by balancing training on classical and quantum hardware [1.8]
量子ニューラルネットワークを用いた最大12キュービットハミルトニアンの変分量子固有解法(VQE)と量子位相分類量子ニューラルネットワークを用いた最大12量子ビットハミルトニアンのVQEと量子位相分類を用いた6-18量子ハミルトニアンの基底状態推定手法の数値評価を行った。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:24:45 GMT)
EAP4EMSIG -- Enhancing Event-Driven Microscopy for Microfluidic Single-Cell Analysis [1.8]
イベント駆動顕微鏡のための実験自動化パイプラインの3つのコンポーネントをスマートマイクロ流体単セル分析に導入する。 EAP4IG: フォーカスオフセットを予測する高速で正確なMulti-Layer Perceptron(MLP)ベースのオートフォーカス方式。自動焦点付けにより平均絶対誤差は0.105$mu$mで、推定時間は87msである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:01:58 GMT)
Representation learning with a transformer by contrastive learning for money laundering detection [1.8]
変圧器ニューラルネットワークを用いて定性的および定量的データの構造化時系列を利用する新しい手順が導入された。実験により、トランスフォーマーはマネーロンダリングパターンを利用するのに成功する一般的な表現を生成することができることを確認した。また、偽陽性率を抑えつつ、不正行為や不正行為を検知する新たな手順の能力も高めている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:16:11 GMT)
Self-Attention Based Multi-Scale Graph Auto-Encoder Network of 3D Meshes [1.6]
3D Geometric Mesh Network(3DGeoMeshNet)は、異方性畳み込み層を用いて空間領域内でグローバルな特徴とローカルな特徴を直接学習する新しいGCNベースのフレームワークである。我々のアーキテクチャはマルチスケールエンコーダ・デコーダ構造を特徴とし、大域的および局所的な経路は大規模な幾何学的構造と微細な局所的詳細の両方を捉えている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:36:03 GMT)
Dementia Detection using Multi-modal Methods on Audio Data [1.6]
本稿では,患者の音声記録を用いて認知症の発症を予測するために開発されたモデルについて述べる。音声ファイルからWhisperモデルを用いて書き起こしを生成し,RoBERTa回帰モデルを用いてMMSEスコアを生成するASRベースのモデルを開発した。 RMSEスコアは2.6911で、ベースラインよりも約10%低い。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:38:34 GMT)
LLMs on support of privacy and security of mobile apps: state of the art and research directions [1.5]
セキュリティとプライバシーのリスクは依然としてモバイルアプリのユーザーを脅かす。セキュリティリスクとプライバシ違反を特定するために,大規模言語モデルの適用について検討する。ユーザが画像をオンラインで共有する場合に,機密データ漏洩を検出する手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:36:57 GMT)
Differential Attention for Multimodal Crisis Event Analysis [1.5]
ソーシャルネットワークは危機時の貴重な情報源になり得る。危機データの分類を強化するために,視覚言語モデル(VLM)と高度な融合戦略を検討する。以上の結果から,事前学習されたVLM,リッチテキスト記述,適応融合戦略の組み合わせは,分類精度において常に最先端のモデルよりも優れていることがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:20:35 GMT)
Self-Supervised Real-Time Tracking of Military Vehicles in Low-FPS UAV Footage [1.5]
無人航空機(UAV)を実際の戦闘シナリオで移動させることで捉えた低フレームレートのビデオにオブジェクトを関連付けることは複雑である。単一フレームアノテーションからのインスタンス関連学習がこれらの課題を克服する方法について述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:39:11 GMT)
Bright squeezed light in the kilohertz frequency band [1.5]
本稿では,ハイブリッド雑音安定化技術を利用した新しい輝度抑圧型光発生方式を提案する。この方式はブロードバンド受動雑音安定化を同化し、非古典的アクティブ安定化のフィードバック周波数帯域をMHz帯域に拡張する。出力1mWの5.5dBの明るいシャープライトと、kHzからMHz帯間のスキーズ帯域が生成される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:40:48 GMT)
Mitigating Bias Using Model-Agnostic Data Attribution [1.5]
機械学習モデルにおけるバイアスの緩和は、公平性と公平性を保証するための重要な取り組みである。本稿では, 画素画像の属性を利用して, バイアス属性を含む画像の領域を特定し, 正規化することで, バイアスに対処する新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:13:27 GMT)
Modeling (Deontic) Modal Operators With the s(CASP) Goal-directed Predicated Answer Set Programming System [1.5]
デフォルトの否定と強い否定を用いて、(決定的な)モーダル作用素をエレガントに表現する方法を示す。本稿では、ASPのグローバル制約を用いて、デオン型モーダル論理の義務と不完全性を表現することを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:31:54 GMT)
ConBatch-BAL: Batch Bayesian Active Learning under Budget Constraints [1.5]
本研究は,制約下でのバッチ取得のためのベイズ的アクティブラーニング戦略を2つ導入する(ConBatch-BAL)。戦略は、2つの実世界のデータセットのランダムな取得ベースラインに対してベンチマークされる。その結果,開発したConBatch-BAL戦略により,実環境におけるアクティブな学習イテレーションとデータ取得コストを削減できることが示唆された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:25:12 GMT)
Learned enclosure method for experimental EIT data [1.5]
本稿では,池畑が提案する囲い込み法とニューラルネットワークを組み合わせることで,境界測定から包含物の凸包を推定する方法を提案する。最小二乗の整合性を持つ古典的閉包法と比較して, 学習された凸船体は, シミュレーションデータと実験データの両方において優れた性能を発揮する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:04:16 GMT)
SwiftSeg: Efficient Training-Free Open-Vocabulary Segmentation via Hierarchical Attention Refinement Method [1.5]
Open-vocabulary semantic segmentationは、厳密な注釈付きデータセットを必要とせずに、任意のテキストカテゴリからオブジェクトをセグメントすることを目的としている。 FastSegはトレーニング不要のフレームワークで、事前訓練された拡散モデルの逆過程の(1+1)ステップのみを持つ。最先端のトレーニングフリーのパフォーマンスを実現し、PASCAL VOC、PASCAL Context、COCO Objectベンチマークで平均43.8%のmIoUが得られる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:26:08 GMT)
Motion Generation: A Survey of Generative Approaches and Benchmarks [1.4]
我々は,その基盤となる生成戦略に基づいて,動作生成手法の詳細な分類を行う。我々の主な焦点は、2023年以降のトップレベルの会場で発行された論文であり、この分野の最新の進歩を反映している。アーキテクチャの原則、条件付け機構、生成設定を分析し、文献で使用される評価指標とデータセットの詳細な概要をコンパイルする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:04:56 GMT)
Physical Informed Neural Networks for modeling ocean pollutant [1.4]
本稿では,2次元対流拡散方程式により制御される汚染物質の分散をシミュレートする枠組みを提案する。このモデルは、物理法則を埋め込み、ノイズの多い合成データに適合させることで、物理的に一貫した予測を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:21:09 GMT)
Causal Foundation Models: Disentangling Physics from Instrument Properties [1.4]
コントラスト学習を訓練した二重エンコーダアーキテクチャを用いて,物理的要因と楽器的要因を分離する基礎モデルを提案する。提案手法は,下流予測タスクにおいて,従来の単一遅延空間基盤モデルよりも大幅に優れる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:00 GMT)
A Systematization of Security Vulnerabilities in Computer Use Agents [1.4]
我々は、現実のCUAのシステム的脅威分析と、敵条件下でのテストを行う。 CUAパラダイム特有のリスクのクラスを7つ同定し、3つの具体的なエクスプロイトシナリオを詳細に分析する。これらのケーススタディは、現在のCUA実装にまたがるより深いアーキテクチャ上の欠陥を明らかにします。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:50:21 GMT)
Massive MIMO-NOMA Systems Secrecy in the Presence of Active Eavesdroppers [1.4]
非直交多重アクセス(NOMA)とMIMO(Multiple-input multiple-output)システムは非常に効率的である。 Eavesdropperは、チャネル推定フェーズ中に、正当なユーザパイロット信号の組み合わせを送信することができる。このようにして、基地局を誤解させ、送信を自方向で回転させ、盗聴することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:18:27 GMT)
Learning Maximal Safe Sets Using Hypernetworks for MPC-based Local Trajectory Planning in Unknown Environments [1.3]
本稿では,未知の静的環境における局所軌道計画のための最適集合のオンライン推定のための学習に基づく新しいアプローチを提案する。モデル予測制御(MPC)ローカルプランナの終端セット制約として、集合の神経表現を用いる。我々は,提案手法であるNTC-MPCを物理ロボットに展開し,ベースラインが故障した場合の障害物を安全に回避できることを実証した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:05:03 GMT)
Role of scrambling and noise in temporal information processing with quantum systems [1.3]
時相情報処理のための効果的な基板として、スクランブル量子系が注目されている。量子システムを用いて、幅広い物理計算モデルをキャプチャする量子貯水池処理フレームワークについて検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:11:49 GMT)
MARBLE: A Multi-Agent Rule-Based LLM Reasoning Engine for Accident Severity Prediction [1.3]
交通安全システムにおいて,事故重大度予測が重要な役割を担っている。既存の方法はしばしばモノリシックモデルやブラックボックスプロンプトに依存している。本稿では,多エージェントルールに基づくLLMエンジンを提案し,その重大性予測タスクを,専門的推論エージェントのチーム間で分解する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:27:49 GMT)
A High-Level Compiler Integration Approach for Deep Learning Accelerators Supporting Abstraction and Optimization [1.3]
本稿では,GEMMに基づくディープラーニングアクセラレータを対象とするTVMベースのコンパイル統合手法を提案する。我々のアプローチは、コンパイラ統合の複雑さを抽象化し、アクセラレータのシームレスな統合を可能にします。我々のフレームワークはGemminiアクセラレータでベンチマークされており、手動で実装されたツールチェーンに匹敵するパフォーマンスを示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:50:15 GMT)
EduCoder: An Open-Source Annotation System for Education Transcript Data [1.2]
EduCoderは、教育対話の発話レベルアノテーションをサポートするように設計されたドメイン特化ツールである。研究者やドメインの専門家が、観測データに基づいたコードブックを共同で定義するためのプラットフォームを提供する。分類的およびオープンなアノテーションタイプと文脈的素材を取り入れている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:15:29 GMT)
Eka-Eval : A Comprehensive Evaluation Framework for Large Language Models in Indian Languages [1.2]
EKA-evalは、9つの主要な評価カテゴリに35以上のベンチマークを統合する統合評価フレームワークである。モジュールアーキテクチャによる11のコア機能、Hugging Faceとプロプライエタリなモデルとのシームレスな統合、プラグインとプレイのユーザビリティを提供する。フレームワークはオープンソースで、https://github.com/lingo-iitgn/eka-eval.comで公開されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:30:26 GMT)
Pensieve Grader: An AI-Powered, Ready-to-Use Platform for Effortless Handwritten STEM Grading [1.2]
我々は、STEMコースのためのAI支援グレーティングプラットフォームであるPensieveを紹介する。 Pensieveは、スキャンされた学生の応募から最終的なフィードバックを得るためのパイプライン全体をサポートしている。その結果,Pensieveは,高信頼度予測のためのインストラクター指定の成績と95.4%の合意率を維持しながら,平均65%のグルーピング時間を短縮した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:10:47 GMT)
Quantum Simulation of Charge and Exciton Transfer in Multi-mode Models using Engineered Reservoirs [1.1]
量子シミュレーションは、非摂動状態における開系分子動力学を研究するための経路を提供する。多モード線形ビブロニックカップリングモデルにおいて、電荷とエキシトン移動のオープンシステム量子シミュレーションを実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:44:41 GMT)
Can Local Representation Alignment RNNs Solve Temporal Tasks? [1.1]
リカレントニューラルネットワーク(RNN)は、リアルタイム処理、ストリーミングデータ、トレーニングサンプルの量を制限するケースに一般的に使用される。 BPTTはRNNを訓練するための主要なアルゴリズムであるが、爆発し、勾配が消えやすいとしばしば批判されている。本稿では,ローカル更新を用いて,その不安定性を低減しようとするRNNに対して,ターゲット伝搬に基づく手法を提示し,評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:21:08 GMT)
Integrating Spatiotemporal Features in LSTM for Spatially Informed COVID-19 Hospitalization Forecasting [1.1]
本研究は、米国における毎日の国家レベルの入院を予測するための、並列ストリーム長短期記憶(LSTM)フレームワークを提案する。当社のフレームワークには,Metaのソーシャル・コネクテッドネス・インデックス(Social Connectedness Index)から派生した,入院に対する社会的親和性(Social Proximity to Hospitalizations,SPH)という特徴が組み込まれている。我々のアーキテクチャは、短期的および長期的両方の時間的依存関係をキャプチャし、マルチホライゾン・アンサンブル・ストラテジーは一貫性とエラーのバランスをとる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:13:57 GMT)
Do LLMs Understand the Safety of Their Inputs? Training-Free Moderation via Latent Prototypes [1.1]
ラテントプロトタイプモデレータ (LPM) は、ラテント空間におけるマハラノビス距離を用いて入力安全性を評価する訓練のないモデレーション手法である。 LPMは、複数の安全ベンチマークで最先端のガードモデルと一致または超えている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:43:34 GMT)
DICE: Discrete inverse continuity equation for learning population dynamics [1.1]
与えられたサンプル集団から有限個の時間点でプロセスの進化を学習する生成的モデリング手法を導入する。 DICEは、人口動態を学習する他の方法が失敗する状況での訓練に安定している。 DICEは、時間に条件を定めなければならない方法よりも、桁違いのコストで代表サンプルを生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:25:54 GMT)
When do World Models Successfully Learn Dynamical Systems? [1.0]
低次元空間に投射時間スライスし,それを結合して歴史(「トークン化」)を形成することが,物理データセットの学習に非常に効果的である理由を説明する理論的枠組みを提案する。我々は、最小二乗回帰から始まり、単純な線形層、浅い逆数学習者、そして最終的にフルスケールな生成逆数ネットワーク(GAN)を通して進行する、複雑さを増す一連のモデルを開発する。熱・波動方程式の修正形式,カオス状態 2D 倉本-シヴァシンスキー方程式,計算流体力学など,様々なデータセット上でこれらのモデルを評価した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:29:18 GMT)
Girlhood Feminism as Soft Resistance: Affective Counterpublics and Algorithmic Negotiation on RedNote [1.0]
この記事は、ハッシュタグであるBaby Supplementary Food (BSF)の再予算に焦点を当てている。私たちは、自尊心、アルゴリズムプレイ、美的離脱を通じて、ユーザーがいかに女性中心の反パブリックを創出するかを分析します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:12:24 GMT)
3D SA-UNet: 3D Spatial Attention UNet with 3D Atrous Spatial Pyramid Pooling for White Matter Hyperintensities Segmentation [1.0]
コンピュータ技術を用いたWhite Matter Hyperintensity(WMH)の正確なセグメンテーションは早期診断に不可欠である。自動WMHセグメンテーションのための3次元空間注意U-Netと呼ばれる深層学習モデルを提案する。提案した3D SA-UNetモデルは,他の最先端の3D畳み込みニューラルネットワークと比較して精度が高いことを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:43:05 GMT)
Open-Set Gait Recognition from Sparse mmWave Radar Point Clouds [1.0]
スパースmmWaveレーダ点雲からの開集合ゲイト認識の問題に対処する。これは、スパースポイントクラウドデータによるオープンセット歩行認識に対処する最初の作業である。 10人の被験者から5時間以上の計測結果が得られた最初の人間の歩行データセットであるmmGait10をリリースする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:04:02 GMT)
Conditional Graph Neural Network for Predicting Soft Tissue Deformation and Forces [1.0]
この複雑さに対処するために、新しいデータ駆動モデル、条件付きグラフニューラルネットワーク(cGNN)を導入する。本モデルでは, 表面点と印加力の位置を計測し, 点の変形とそれらに作用する力を予測するように設計されている。軟組織ファントムの表面追跡データを実験で収集し,転送学習を用いてデータ不足を克服した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:33:39 GMT)
Perspectives on How Sociology Can Advance Theorizing about Human-Chatbot Interaction and Developing Chatbots for Social Good [1.0]
社会学は人間とチャットボットの相互作用の理解を深めることが示唆される。この分野では4つの社会学理論が現存している。本稿では,人間とチャットボットの相互作用を理論化するための社会学理論の適用価値について論じる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:12:03 GMT)
Markovian Transformers for Informative Language Modeling [1.0]
CoT(Chain-of-Thought)推論は、しばしば言語モデルの根底にある決定プロセスを忠実に反映しない。我々は、CoTを「マルコフ」言語モデルにおいて因果的に必要としており、中間のCoTを通して次のトークン予測を分解し、元のプロンプトとは無関係に将来のトークンを予測するよう訓練する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:36:11 GMT)
Structured Captions Improve Prompt Adherence in Text-to-Image Models (Re-LAION-Caption 19M) [0.9]
Re-LAION-Caption 19Mは,Mistral 7B Instruct-based LLaVA-Nextモデルで生成された19万の1024x1024画像からなる高品質なRe-LAION-5Bのサブセットである。各キャプションは4つのテンプレート(主題、設定、美学、カメラの詳細)に従う。 PixArt-$Sigma$とStable Diffusion 2を構造化キャプションとランダムにシャッフルしたキャプションの両方を用いて微調整し、構造化バージョンが視覚的質問応答(VQA)モデルを用いて高いテキスト画像アライメントスコアを得ることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:18:40 GMT)
Robust Learning on Noisy Graphs via Latent Space Constraints with External Knowledge [0.9]
本稿では,Latent Space Constrained Graph Neural Networks (LSC-GNN) を提案する。ベンチマークデータセットの実験では、LSC-GNNは標準よりも優れており、ノイズ耐性のGNNは中程度のノイズを受ける。以上の結果から,LSC-GNNがノイズのあるリレーショナル構造を持つ環境での予測性能と解釈可能性を高める可能性を強調した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:43:24 GMT)
The Forest Behind the Tree: Revealing Hidden Smart Home Communication Patterns [0.9]
スマートホームデバイスは、比較的シンプルで予測可能なネットワークアクティビティパターンを示す。これまでの研究は主に通常のネットワーク条件に焦点を合わせており、潜在的な隠れパターンを見下ろしている。本稿では,これらの隠れ通信パターンを体系的に,かつ自動的に明らかにするフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:28:00 GMT)
SV-DRR: High-Fidelity Novel View X-Ray Synthesis Using Diffusion Model [0.9]
単一視点からのマルチビューX線画像に対する新しいビュー条件付きモデルを提案する。提案手法ではディフュージョン変換器を用いて細部を保存し,高解像度画像の安定生成に弱いストロングトレーニング戦略を用いる。実験結果から,視角制御を改良した高分解能出力が得られた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:58:11 GMT)
O_FT@EvalLLM2025 : étude comparative de choix de données et de stratégies d'apprentissage pour l'adaptation de modèles de langue à un domaine [0.9]
本稿では,O_FTチームがOrangeとOuest-Franceと共同で行なった,防衛領域への言語モデルの適用について述べる。我々の適応の炭素フットプリントを考えると、この研究は比較的小さなモデルに対する領域適応の可能性を示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:28:08 GMT)
Enhancing Underwater Images Using Deep Learning with Subjective Image Quality Integration [0.8]
本稿では,水中画像の品質向上のための深層学習に基づくアプローチを提案する。専門家によってラベル付けされた水中画像を含む公開データセットを、高品質または低品質のいずれでも使用しています。その結果,提案手法は画像品質の認識と測定の両方において大幅な改善を達成できることが示唆された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:25:13 GMT)
Exploring Empathy in Software Engineering: Insights from a Grey Literature Analysis of Practitioners' Perspectives [0.8]
共感は、主要な社会的スキルであり、SEにおけるコミュニケーションとコラボレーションには不可欠であるが、まだ調査されていないトピックである。本研究は,SEにおける共感を実践者の視点から考察し,その意義を特徴づけ,障壁を特定し,克服するための実践について議論し,その効果を探求する。この研究では、SEにおける共感の定義を提案し、有害な文化や過剰な技術的焦点、チームの共感を促進するプラクティス、コラボレーションの改善、コミュニケーション、不安の低減、フラストレーション、ストレスといった成果を識別する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:35:37 GMT)
React-tRace: A Semantics for Understanding React Hooks [0.8]
React-tRaceという名前のReact Hooksの本質のセマンティクスを形式化します。我々のモデルは、Hooksの本質的な性質を具現化していることを理論的に示すことによって、Reactの挙動を捉えます。我々は,Hooksのセマンティクスをよりよく理解するための,形式化に基づく実用的な視覚化ツールを紹介した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:42:17 GMT)
Explainable Hierarchical Deep Learning Neural Networks (Ex-HiDeNN) [0.8]
この記事では、Explainable Hierarchical Deep Learning Neural NetworksまたはEx-HiDeNNと呼ばれる新しいアプローチを提案する。これは、限られた観測からクローズドフォーム表現を発見するために、正確な、フリガルで、高速で、分離可能で、スケーラブルなニューラルアーキテクチャとシンボリックレグレッションを使用する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:43:57 GMT)
FIDESlib: A Fully-Fledged Open-Source FHE Library for Efficient CKKS on GPUs [0.7]
FIDESlibは、最初のオープンソースのサーバサイドCKKS GPUライブラリである。ブートストラッピングでは、FIDESlibはAVX最適化OpenFHE実装よりも70倍のスピードアップを実現している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:51:14 GMT)
Heterogeneous Causal Learning for Optimizing Aggregated Functions in User Growth [0.7]
本稿では,ユーザ成長マーケティングを強化するために,新しい処理効果最適化手法を提案する。ディープラーニングを活用することで,過去の実験から学習し,ユーザの選択と報酬配分を最適化する。提案した制約付きおよび直接最適化アルゴリズムは,最先端の手法よりも20%以上優れた性能を示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:08:45 GMT)
Deep Learning of Continuous and Structured Policies for Aggregated Heterogeneous Treatment Effects [0.7]
複数の治療方針変数を個別および平均的な治療効果の関数形式に組み込むための定式化を導出する。次に、集約されたHTE関数を用いて被写体を直接ランク付けする手法を開発する。これらのアルゴリズムは、不均一な治療ポリシーの深層学習のための汎用的なフレームワークを構築する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:14:24 GMT)
The Case for Instance-Optimized LLMs in OLAP Databases [0.7]
大規模言語モデル(LLM)は、強力なデータ要約、クリーニング、セマンティックトランスフォーメーション機能を備えた分析システムを強化することができる。 IOLMDB は,クエリ固有モデル最適化により LLM 拡張データベースクエリを実用的なものにする新しいシステムである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:10:01 GMT)
Verified Language Processing with Hybrid Explainability: A Technical Report [0.7]
この問題に対処するために,ハイブリッドな説明責任を設計した新しいパイプラインを提案する。我々の手法はグラフと論理を組み合わせて一階述語論理表現を生成し、モンタギュー文法を通して機械的・人間的可読表現を生成する。予備的な結果は,本手法が全文類似性を捉える上での有効性を示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:00:05 GMT)
Multi-person Physics-based Pose Estimation for Combat Sports [0.7]
スパースマルチカメラを用いた戦闘スポーツにおける正確な3次元ポーズ推定のための新しい枠組みを提案する。提案手法は,トランスフォーマーを用いたトップダウン手法により,堅牢なマルチビュー2Dポーズトラッキングを実現する。我々はさらに、多対人物理に基づく軌道最適化のステップを導入することにより、ポーズリアリズムとロバスト性をさらに強化する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:54:56 GMT)
Strict hierarchy between $n$-wise measurement simulability, compatibility structures, and multi-copy compatibility [0.7]
量子測定の不適合性は、量子情報理論の基礎と応用に重要な意味を持つ特異な量子特徴である。量子論の開始以来、複数の測定の標準的な非互換性は注目の的となっているが、その一般化は近年まで提案されていない。すべての概念は、その操作的意味だけでなく、数学的にもそれらが記述する測定アセンブリの集合にも異なることが示される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:47:42 GMT)
AGACCI : Affiliated Grading Agents for Criteria-Centric Interface in Educational Coding Contexts [0.6]
本稿では,協調エージェント間で専門的な評価を分散するマルチエージェントシステムAGACCIを紹介する。 AGACCIは、ルーブリックとフィードバックの正確性、妥当性、一貫性、一貫性の点で、単一のGPTベースのベースラインを上回っている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:50:46 GMT)
Data Matters: The Case of Predicting Mobile Cellular Traffic [0.6]
本稿では, 人口動態データを用いて, 細胞負荷発生の過程を学習することを提案する。本研究では,スマート道路に着目し,道路交通対策を用いて予測精度を向上させる。総合的な実験により、道路の流れと速度を利用することで、セルラーネットワークのメトリクスに加えて、基地局の負荷予測誤差を大幅に低減できることが示された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:40:17 GMT)
UltraBoneUDF: Self-supervised Bone Surface Reconstruction from Ultrasound Based on Neural Unsigned Distance Functions [0.6]
骨表面の再構築はコンピュータによる整形外科手術において重要な役割を担っている。超音波イメージングの固有の限界のため、Bモード超音波は通常、部分的な骨表面のみを捉えている。骨表面を超音波で再構築するための自己教師型フレームワークであるUltraBoneUDFを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:53:07 GMT)
Beyond Scaling Curves: Internal Dynamics of Neural Networks Through the NTK Lens [0.6]
我々は、ニューラルネットワークがデータの下でどのように振る舞うかを経験的に分析し、ニューラル・タンジェント・カーネル(NTK)のレンズを通してモデルをスケーリングする。我々の標準的な視覚タスクの発見は、内部モデル力学が逆の挙動を示すにもかかわらず、同様のパフォーマンススケーリング指数が生じることを示している。また、無限幅制限への収束が有限幅モデルにおけるスケーリングの挙動にどのように影響するかという未解決のニューラルスケーリング問題にも対処する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:17:44 GMT)
Reviewing Scientific Papers for Critical Problems With Reasoning LLMs: Baseline Approaches and Automatic Evaluation [0.6]
本稿では,いくつかのベースラインアプローチと,トップ推論 LLM を判断として用いた拡張可能な自動評価フレームワークを提案する。 O3は、全てのモデルで最低限のコストで、最高の問題識別性能を示した。本稿では,文書に基づく科学的理解・推論に関する知見を提供し,今後の応用の基盤となる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:28:31 GMT)
Harvesting asymmetric steering via non-identical detectors [0.5]
エネルギーギャップの異なる2つの非識別慣性検出器を含む非対称ステアリング収穫現象について検討した。エネルギーギャップ差はArightarrow B$ステアリングの収穫可能範囲を大きくすることができる。最大ステアリング非対称性は、二方向ステアリングと一方向ステアリングの間の変換を示す場合もある。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:03:16 GMT)
Continuous-variable designs and design-based shadow tomography from random lattices [0.5]
n-モード系に対して、すべての GKP 状態の集合は、厳密な連続変数状態 2-設計を形成することを示す。これらの格子状態設計を用いて連続変数シャドウトモグラフィープロトコルを構築する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:28:19 GMT)
Bit-Flip Fault Attack: Crushing Graph Neural Networks via Gradual Bit Search [0.5]
グラフニューラルネットワーク(GNN)は、グラフ構造化データの強力な機械学習手法として登場した。本稿では,ハードウェアベースの障害攻撃に対するGNNモデルの脆弱性について検討する。階層型ビットフリップ障害攻撃(GBFA)を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 23:06:29 GMT)
OLG++: A Semantic Extension of Obligation Logic Graph [0.5]
OLG++は、市町村における規制と法的規則をモデル化するためのOligation Logic Graph(OLG)のセマンティック拡張である。 OLG++は、空間、時間、パーティグループ、デファシビリティ、論理的なグループ構造など、よりリッチなノードとエッジタイプを導入している。我々の例では、OLG++は法的な知識表現のための従来のグラフベースモデルよりも表現力が高い。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:24:52 GMT)
VaxPulse: Monitoring of Online Public Concerns to Enhance Post-licensure Vaccine Surveillance [0.4]
我々は,ヴィクトリアのワクチン安全サービスSAEFVICの報告監視システムをいかに強化したかを説明する。多段階のフレームワークであるVaxPulseを用いて、免疫後の有害事象と感情分析を統合する。我々は、民族言語コミュニティにまたがる懸念を階層化するために、非英語言語に対処する必要性を強調している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:18:08 GMT)
An approach to the timetabling problem in deregulated railway markets based on metaheuristic algorithms [0.4]
本稿では、規制緩和された鉄道システムの力学を再現するためのモジュラーシミュレーションフレームワークを提案する。 MEALPY Pythonライブラリを用いた10のメタヒューリスティックアルゴリズムが評価され、自由化されたスペインの鉄道市場における列車スケジュールを最適化する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:50:49 GMT)
Cyclic Equalizability of Words and Its Application to Card-Based Cryptography [0.4]
等長の2つの二項語とハミング重みの2つの二項語が巡回等化可能であることを示す。カードベースの暗号における巡回等化可能性の応用として、情報消去問題や全開プロトコルの単一カットへの応用について述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:03:36 GMT)
AI Generated Text Detection Using Instruction Fine-tuned Large Language and Transformer-Based Models [0.3]
大規模言語モデル (LLM) は文法的に正し、意味的に意味のあるテキストを生成する。 LLMは、非常に現実的なフィッシングメールの作成、フェイクニュースの拡散、サイバー犯罪の自動化のためのコードの生成、不正な科学論文の執筆に誤用されている。言語、統計、機械学習、アンサンブルに基づくアプローチを用いて、機械が生成したテキストと人間によるコンテンツとを区別する様々な試みがなされている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:13:13 GMT)
Quantum algorithms for optimizers [0.2]
これは、量子アルゴリズムの大学院レベルのコースのための講義ノートのセットです。応用数学者や技術者向けに開発されており、以前の量子力学の背景を必要としない。このコースの主なトピックは、厳密な計算モデルの導入に加えて、入出力モデル、量子探索、量子勾配アルゴリズム、行列演算アルゴリズム、半定値最適化のためのミラー降下フレームワークである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:23:35 GMT)
Complex Dynamics in Psychological Data: Mapping Individual Symptom Trajectories to Group-Level Patterns [0.2]
本研究では、因果推論、グラフ解析、時間的複雑性測定、機械学習を統合して、個々の症状軌跡が有意義な診断パターンを明らかにすることができるかどうかを検討する。一般不安障害(GAD)および/またはメジャーうつ病(MDD)に罹患したN=45人の縦断的データセットの検査を行った。新しいデータセットは、症状力学の分類において91%の精度を示し、効果的な診断支援ツールであることが証明された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:38:37 GMT)
Object-centric Denoising Diffusion Models for Physical Reasoning [0.1]
相互作用するオブジェクトの軌道に関する推論は、機械学習における物理的推論タスクに不可欠である。本稿では, 時間とともに変質する物理推論のためのオブジェクト中心の微分拡散モデルアーキテクチャを提案する。このモデルが複数の条件でタスクを解く方法を示し、オブジェクト数を変更する際の性能について検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:06:24 GMT)
Transcribing Spanish Texts from the Past: Experiments with Transkribus, Tesseract and Granite [0.1]
本稿では,IberLEF 2025の共有タスクである PastReader: Transcribing Texts from the Past で GRESEL チームが得られた実験結果を紹介する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:04:17 GMT)
Improving Predictions of Convective Storm Wind Gusts through Statistical Post-Processing of Neural Weather Models [0.1]
ニューラル気象モデル(NWM)の最近の進歩は、0.25degのグローバルグリッド上での大気環境の予測に、計算的に安価で高速なアプローチを提供する。雷雨の場合、これらの環境は特定の場所で風速分布を予測するために経験的に後処理することができる。そこでPangu-Weather NWMでは,時間ごとの風速を最大3日前に予測するために,統計的および深層学習後処理手法の階層化を適用した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:33:06 GMT)
Mutual Information Optimal Control of Discrete-Time Linear Systems [0.1]
離散時間線形システムに対する相互情報最適制御問題(MIOCP)を定式化する。この問題は、最大エントロピー最適制御問題(MEOCP)の拡張と見なすことができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:04:27 GMT)
Taming the Tri-Space Tension: ARC-Guided Hallucination Modeling and Control for Text-to-Image Generation [0.1]
テキスト・ツー・イメージ(T2I)拡散モデルでは持続的な「幻覚」が示される本稿では,幻覚を潜在アライメント空間内の軌跡ドリフトとして再解釈する認知的な視点を提案する。我々は,潜在空間で完全に動作する軽量コントローラであるTensionModulator (TM-ARC) を開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:43:09 GMT)
Embedding-Based Approaches to Hyperpartisan News Detection [0.1]
過党派のニュースは、大衆に政治的分裂を起こそうとする極端に分極化された政治的立場を取る。本論では、あるニュース記事が過党派とみなすことができるかどうかを判断することを目的とするシステムについて述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:36:04 GMT)
ReLoop: "Seeing Twice and Thinking Backwards" via Closed-loop Training to Mitigate Hallucinations in Multimodal understanding [0.1]
MLLM(Multimodal Large Language Models)は、オープンな視覚的質問応答において顕著な進歩を遂げている。 MLLMは幻覚に弱いままであり、信頼性と事実の整合性にとって重要な課題である。クロスモーダル理解のためのマルチモーダル整合性を促進する統合クローズドループトレーニングフレームワークであるReLoopを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:40:48 GMT)
YOLO-APD: Enhancing YOLOv8 for Robust Pedestrian Detection on Complex Road Geometries [0.0]
本稿では,この課題に特化してYOLOv8フレームワークを改良した新しいディープラーニングアーキテクチャであるYOLO-APDを紹介する。 YOLO-APDは最先端の精度を達成し、77.7% mAP@0.5:0.95、例外的な歩行者リコールは96%を超えた。リアルタイム処理能力を100 FPSで維持し、精度と効率のバランスが優れていることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:03:40 GMT)
Work and entropy of mixing in isolated quantum systems [0.0]
2つの異なる気体の混合は、CO$$の捕獲から水質浄化まで、最も一般的な自然現象の1つである。伝統的に、混合は局所的な熱平衡の文脈で分析され、そこではシステムは熱浴とエネルギーを交換する。そこで本研究では, マクロな可観測物によって特徴付けられる, 潜在的に非平衡な初期状態を持つ孤立系における混合について検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:38:40 GMT)
Wigner's friend's black hole adventure: an argument for complementarity? [0.0]
ブラックホール物理学とウィグナーの友人のシナリオの両方の中心にあるユニタリティ。我々は、ブラックホール物理学とウィグナーの友人シナリオの非局所的な拡張を融合して、統一された議論へと導く新しいパラドックスを構築した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:01:17 GMT)
VERITAS: Verification and Explanation of Realness in Images for Transparency in AI Systems [0.0]
我々は、小さな(32x32)画像がAI生成されているかどうかを正確に検出する包括的フレームワークVERITASを提案する。 VERITASは、合成画像のキーアーティファクトを記述する人間可読な説明を生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:57:05 GMT)
Universality in the Anticoncentration of Chaotic Quantum Circuits [0.0]
ランダムな量子回路における反集中を規定するインフニバーショナル関数形式を同定する。我々は、ランダムテンソルネットワーク状態とランダムフェーズモデルのアンサンブルに関する解析結果を通じて、この主張を支持する。本研究は, 量子デバイスを浅回路でベンチマークするための実用的枠組みを導入することを目的とした。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:31:45 GMT)
Unified Framework for Quantum Code Embedding [0.0]
出力コードと入力コードの間の自然な同型を保証する統一的なフレームワークを提供する。これまでの作業が私たちのフレームワークにどのように当てはまるかを明確に示します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:06 GMT)
Towards a consistent Semiclassical Theory of Gravity [0.0]
我々は、量子系が安定な決定連鎖と相互作用するときのみ重力場を放出すると仮定することで、半古典重力を一貫した表現が可能であると論じる。これは重力の普遍性を否定し、同値原理のバージョンを掲げる。この条件のサブセットが、半古典的な重力を一貫させる以上の多くの利点をもたらすことを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:46:42 GMT)
Towards Human-in-the-Loop Onset Detection: A Transfer Learning Approach for Maracatu [0.0]
Afro-Brazilian Maracatu の伝統における音楽のオンセット検出のための伝達学習戦略について検討する。我々は2つの時間的畳み込みネットワークアーキテクチャを適用した。1つはオンセット検出(intra-task)、もう1つはビートトラッキング(inter-task)である。 5秒のアノテートスニペットのみを用いて,従来の5種類の打楽器の層方向のトレーニング戦略により,これらのモデルを微調整する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:32:26 GMT)
Topological schemes in spacetime for the electrodynamic Aharonov-Bohm effect [0.0]
A $mathbf108$, 062218 (2023)
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:50:55 GMT)
Tool-to-Tool Matching Analysis Based Difference Score Computation Methods for Semiconductor Manufacturing [0.0]
半導体製造装置におけるツール・ツー・ツール・マッチング(TTTM)の問題点を考察する。これらの問題を解決するために,新しいTTTM解析パイプラインを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:52:01 GMT)
The Emotional Alignment Design Policy [0.0]
情緒的アライメントデザインポリシー(Emotional Alignment Design Policy)によると、人工的な実体は、その実体の能力と道徳的地位を適切に反映したユーザーから感情的な反応を引き出すよう設計されるべきである。この原則は、その能力と道徳的地位保証(オーバーシューティングまたはアンダーシューティング)よりも強い感情反応を誘発する人工システムや、間違ったタイプの感情反応を誘発するシステム(間違ったターゲットを隠蔽する)を設計することで、2つの方法で破ることができる。ユーザの自律性を尊重し、適切な対応を促進するには、どうすればよいのか?
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:26:21 GMT)
The Author Is Sovereign: A Manifesto for Ethical Copyright in the Age of AI [0.0]
AIの時代、著者はアルゴリズムによるコンテンツスクラップ、"フェアユース"のような法的グレーゾーン、そして同意や補償なしに創造的な労働から利益を得るプラットフォームによって静かに浸食されている。この短い宣言は、著者が知的ドメインの主権を持つシステムという、過激な代替案を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:20:34 GMT)
Temporal Conformal Prediction (TCP): A Distribution-Free Statistical and Machine Learning Framework for Adaptive Risk Forecasting [0.0]
有限サンプルの有効性を保証した金融時系列の予測区間を構築するための時間的等角予測(TCP)を提案する。 TCPは量子レグレッションを共形キャリブレーション層と統合し、減衰する学習速度を介してオンラインに適応する。 GARCH, Historical Simulation, static Quantile Regression across equities (S&P 500), Crypto (Bitcoin), and commodities (Gold)などの既存の手法に対してTCPをベンチマークする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:44:31 GMT)
Teaching Sustainable Creative Technologies [0.0]
アーティストにとって、新しい、より持続可能な技術との関わり方を開発し、共有し、促進することは重要である。本稿では, コンピュート・リユース, 持続可能なWeb開発, フラジカル・コンピューティングの技術的アプローチとの関係を考慮し, アーティストがより持続可能な方法を実現する方法について検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:38:38 GMT)
Synthesising Activity Participations and Scheduling with Deep Generative Machine Learning [0.0]
我々は、人間の活動への参加とスケジューリング、すなわち、どの活動に参加するか、いつ参加するかの選択を合成する。我々のデータ駆動型アプローチは、人間の好みやスケジューリングロジックから得られる分布を直接学習する。これにより、既存のスケジュールデータの合成や匿名化アプローチよりも、アプローチが大幅に高速で、操作が簡単になります。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:30:44 GMT)
SymTFT Approach for Mixed States with Non-Invertible Symmetries [0.0]
我々は、強い対称性と弱い対称性を持つ混合状態の相を研究するための枠組みを開発する。この枠組みは群対称性だけでなく、非可逆対称性にも適用される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:00:02 GMT)
Sure Convergence and Constructive Universal Approximation for Multi-Layer Neural Networks [0.0]
我々は、インジケータ活性化ニューロン上に構築された新しいニューラルネットワークモデル01Neuroを提案する。その強化された変種は2つの重要な統計的性質を持っている: 絶対収束と構成的普遍近似である。無限サンプル設定では、モデルは任意の可測関数の有限和を近似することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:55:28 GMT)
Strategic Alignment Patterns in National AI Policies [0.0]
本稿では,国家人工知能政策における戦略的整合性を評価するための新しい視覚マッピング手法を提案する。行列に基づく可視化とネットワーク分析を組み合わせた15～20の全国的AI戦略を分析し,アライメントとアライメントのパターンを同定する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:36:30 GMT)
Statistical characterization of valley coupling in Si/SiGe quantum dots via $g$-factor measurements near a valley vortex [0.0]
Si/SiGeヘテロ構造における低エネルギーバレー励起はスピン量子ビットを失敗させる。谷のエネルギー分布の現実的な大きさのサンプリングは、平均的な谷の結合を劇的に過大評価する傾向にある。簡単な$g$-factor の測定値を用いて,量子井戸を横切る谷相の地形を探索する新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:16:48 GMT)
Solving Large-Scale Vehicle Routing Problems with Hybrid Quantum-Classical Decomposition [0.0]
車両ルーティング問題(VRP)を解決するための2段階分解戦略を提案する。問題レベル分解は13ノード(156キュービット)のVRPを小さなトラベリングセールスマン問題(TSP)インスタンスに分割する。提案手法は,回路深さの最大95%の低減,キュービット数の96%の削減,および2キュービットゲート数の99.5%の削減を実現している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:02:13 GMT)
Solar Flare Prediction Using LSTM and DLSTM with Sliding Window Pattern Recognition [0.0]
データセットは2003年から2023年までで、151,071のフレアイベントを含む。スライディングウインドー技術は、不規則および規則化されたフレア時系列の時間準パターンを検出するために用いられる。 LSTMとDLSTMモデルは不規則時系列からのピークフラックスと待ち時間のシーケンスに基づいてトレーニングされ、LSTMとDLSTMはアンサンブルアプローチと統合され、3時間間隔の正規化時系列のスライディングウィンドウに適用される。正規化された時系列に対するアンサンブルアプローチによるDLSTMは他のモデルよりも優れており、不規則な時系列で訓練されたモデルと比較して誤りが少なく、より正確な大きめの予測を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:17:38 GMT)
Several types of quantum Wasserstein distance based on an optimization over separable states [0.0]
我々は、与えられた限界を持つ一般二部量子状態に対する最適化に基づいて、量子ワッサーシュタイン距離のいくつかの定義を考察する。我々は、Uhlmann-Jozsa量子忠実度が与えられた限界を持つ分離可能な状態に対する最適化としても記述できることを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:31:52 GMT)
Selective and efficient quantum state tomography for multi-qubit systems [0.0]
任意の$N$-qubit 密度行列の複数の選択要素を効率的に推定する手法である選択的かつ効率的な QST (SEEQST) を導入する。任意の$N$-qubit密度行列は、それぞれ2N$要素を含む2N$サブセットに分割可能であることを示す。 SEEQSTでは、そのような部分集合はたった2つの実験から正確に推定できる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:06:58 GMT)
Seed Selection for Human-Oriented Image Reconstruction via Guided Diffusion [0.0]
拡散に基づく手法は、余分な情報のないマシン指向画像から人間指向画像を生成する。この方法は1つのランダムなシードを使用し、最適化された画像の品質につながる可能性がある。画像品質を向上させるために,複数の候補から最適な種を識別する種選択法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:16:04 GMT)
Secure Quantum Relay Networks Using Distributed Entanglement without Classical Authentication [0.0]
現在の量子通信プロトコルは、メッセージ元検証の古典的な認証に大きく依存している。古典的認証を完全に回避するセキュアな量子中継ネットワークのための新しいフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:25:10 GMT)
Scalable Simulation of Fermionic Encoding Performance on Noisy Quantum Computers [0.0]
本研究では,Derby-Klassen符号化と呼ばれる局所符号化の性能について検討する。我々は,Derby-Klassenエンコーディングを用いたポストセレクション手法の高サンプリング要求が,その適用性に限界をもたらすことを見出した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:16:52 GMT)
Scalable Multi-Task Learning for Particle Collision Event Reconstruction with Heterogeneous Graph Neural Networks [0.0]
マルチプライオリティは、データ取得段階でレイテンシとストレージ要件を緊張させています。背景レベルが高く、粒子の誤結合が頻発するなど、新たな合併症が出現している。本稿では,多様な粒子衝突関係のユニークな表現を特徴とする新しい不均一グラフニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:11:25 GMT)
Satellite-based Rabi rice paddy field mapping in India: a case study on Telangana state [0.0]
本研究は、2018-19年米の季節にインドの32の地域におけるアグロ・エコロジーの変動に適応する表現学主導の枠組みを開発した。地域別校正法は,従来の地域クラスタリング法に比べて93.3%の精度で8.0ポイント改善した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:47:37 GMT)
Role of phase of optimal probe in noncommutativity vs coherence in quantum multiparameter estimation [0.0]
任意の量子ハミルトニアンを符号化した2つの位相の同時推定について検討する。また、符号化されたハミルトニアンをSU(2)生成子として選択する単一量子プローブについても検討する。量子ビットと量子ビットの両方のシナリオにおいて、最適プローブは、最大かつ最小の固有値に対応する固有状態のコヒーレントな重ね合わせである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:42:56 GMT)
Robotic System with AI for Real Time Weed Detection, Canopy Aware Spraying, and Droplet Pattern Evaluation [0.0]
我々は,雑草の存在を検知し,天蓋の大きさを推定し,ノズルのアクティベーションをリアルタイムで動的に調整できる,視覚誘導型AI駆動可変速度噴霧装置を開発した。このシステムは軽量のYOLO11nとYOLO11nセグ深層学習モデルを統合し、NVIDIA Jetson Orin Nano上に展開して推論を行う。今後の研究は、サウスダコタ州で一般的な雑草3種を含む検出能力を拡大することに焦点を当てる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:27:29 GMT)
Review, Remask, Refine (R3): Process-Guided Block Diffusion for Text Generation [0.0]
反復テキスト生成の鍵となる課題は、モデルが自身のエラーを効率的に識別し、修正できるようにすることである。本稿では、追加のモデルトレーニングを必要としないフレームワークであるReview, Remask, Refine (R3)を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:18:54 GMT)
Real-Time Stochastic Terrain Mapping and Processing for Autonomous Safe Landing [0.0]
本稿では,新しいリアルタイムな惑星地形マッピングアルゴリズムを開発した。サンプル点間の地形的不確実性や、スパース3次元測定による不確かさを考慮に入れている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:23:41 GMT)
Real-Time AI-Driven Pipeline for Automated Medical Study Content Generation in Low-Resource Settings: A Kenyan Case Study [0.0]
JuvenotesはAI駆動のリアルタイムパイプラインで、学術文書の構造化試験スタイルの質問銀行への変換を自動化する。ケニアの低リソース医療教育に最適化されている。ケニアの医療機関で7ヶ月以上試験されたJuvenotesは、コンテンツを数日から数分に短縮し、毎日のアクティブユーザーを40%増やした。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:22:17 GMT)
Random weights of DNNs and emergence of fixed points [0.0]
本稿では,入力と出力が同じ次元を持つディープニューラルネットワーク(DNN)の特殊なクラスについて述べる。そのようなネットワークのトレーニングは、その固定点(FP)によって特徴づけられる。我々は、重みと軽い尾の分布を持つi.d.ランダムウェイトを考える。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:24:15 GMT)
Quantum-Inspired Tensor-Network Fractional-Step Method for Incompressible Flow in Curvilinear Coordinates [0.0]
カービリニア座標における没入物体まわりの流体の流れを計算するためのテンソルネットワークに基づくアルゴリズムフレームワークを提案する。ストローハル数, 力, 速度場に対する有限差分シミュレーションと比較して, 優れた定量的一致が得られた。我々のフレームワークは量子コンピュータに直接移植可能であり、さらなるスケーリングの利点をもたらす。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:33:44 GMT)
Quantum computational speedup and retrocausality [0.0]
通勤可能な可観測物の測定のみを含むことは、古典論理に従わなければならない。これにより、慣習的な量子記述を古典的な論理記述で表すことができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:36:32 GMT)
Quantum advantage from negativity of work quasiprobability distributions [0.0]
量子電池は、多数のセルが存在する場合、直ちに「作業」を行うことで充電することができる。ここでは、これらの量子熱力学の2つの概念は、明らかに非連結であるように見えるが、単純な関係を示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:18:49 GMT)
Quantum Spin Glass in the Two-Dimensional Disordered Heisenberg Model via Foundation Neural-Network Quantum States [0.0]
本稿では,最近導入されたファンデーションニューラルネットワーク量子状態フレームワークを用いて,結合障害を伴うフラストレーション量子ハイゼンベルクモデルについて検討する。スピンガラス相が任意の有限温度で消失する古典的な場合とは異なり、量子ゆらぎに対して安定であることを示す説得力のある証拠が見つかる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:00:55 GMT)
Quantum Quasinormal Mode Theory for Dissipative Nano-Optics and Magnetodielectric Cavity Quantum Electrodynamics [0.0]
マクロなQEDと複雑な座標変換に基づく統一理論フレームワークを提案する。複雑な座標変換は、放射損失を非放射物質散逸に効果的に変換する。磁気誘電体cQEDの完全量子理論におけるモード損失の複雑さに直接対処することにより、我々のアプローチは現代の量子ナノ光学実験の探索を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:42:10 GMT)
Quantum PCPs: on Adaptivity, Multiple Provers and Reductions to Local Hamiltonians [0.0]
非適応型量子PCPは、証明クエリ数が一定である場合に適応型量子PCPをシミュレートできることを示す。また、ある量子PCPステートメントが偽であるような(量子)オラクルが存在することも示している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:28:01 GMT)
Quantum Enhanced Sensitivity through Many-Body Bloch Oscillations [0.0]
ブロッホ振動を示す量子系における非平衡力学の知覚能力について検討する。この結果は、時間、プローブサイズ、励起数の観点から量子フィッシャー情報に対する定量的アンサッツを提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:29:35 GMT)
Probing Defects with Quantum Simulator Snapshots [0.0]
本稿では、スナップショットを用いて欠陥の物理を実験的に探索するための簡単なプロトコルを提案する。我々のプロトコルは、欠陥を明示的に導入することなく、バルクシステムからのスナップショットに依存する。例えば、Rydberg原子が量子イジング臨界性を実現するときの局所スピン配置のスナップショットで、欠陥エントロピーを抽出できることを実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:05:04 GMT)
Prethermal inverse Mpemba effect [0.0]
逆ムペンバ効果(英: inverse Mpemba effect)は、システムが低い初期温度から始めると、より早く最終状態に緩和する反直感現象である。我々はこの概念を、孤立量子系における前熱状態への緩和へと拡張する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:20:28 GMT)
Plasmon Mode Engineering with Electrons on Helium [0.0]
超流動ヘリウム上に閉じ込められた電子の集合は、集合電荷力学を制御するためのパラダイムシステムを提供する。マイクロ波プラズモンをホストする電子オンヘリウムマイクロチャネルデバイスを用いて実験を行った。これらのモードのパワー依存は、スペクトル拡大の均一性および不均一性の両方の源を調べるのに利用できる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:51:27 GMT)
Phenomenological quantum mechanics II: deducing the formalism from experimental observations [0.0]
結果の形式主義がヒルベルト空間との親和性を示すことを示す。新しい形式と標準形式は概念レベルで大きく異なる。新たなアプローチは、確立された理論フレームワーク内の解決に抵抗する問題に対処する上で、より成功している可能性がある、と期待されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:31:32 GMT)
Phenomenological quantum mechanics I: phenomenology of quantum observables [0.0]
ヒルベルト空間の構造に根ざした完備かつ完備な形式主義を導出することは可能であることを示す。結果として得られる形式主義(二軌道形式主義)は、標準的な状態中心の定式化と大きく異なる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:51:58 GMT)
Performance Evaluation of General Purpose Large Language Models for Basic Linear Algebra Subprograms Code Generation [0.0]
我々は,CPU用BLASコード生成のための既存の汎用LLMの性能を評価する。定期的な名前しか与えられていない場合でも、正しいコードが生成できることがわかりました。また,OpenMP,SIMDベクトル化,キャッシュブロッキングによるスレッド並列化をある程度実装できることを確認した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:33:59 GMT)
Optimizing Bidding Strategies in First-Price Auctions in Binary Feedback Setting with Predictions [0.0]
本稿では,バイナリフィードバック下でのVickreyファーストプライスオークションについて検討する。新しいアルゴリズムは過去の情報を用いて、BROAD-OMDアルゴリズムの残差を改善する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:29:36 GMT)
On the Semantics of Large Language Models [0.0]
大規模言語モデル(LLM)は、技術を通して人間の言語能力を再現する可能性を実証した。これらのシステムが言語をどの程度理解しているかについては議論の余地がある。質問を単語と文のレベルで LLM の意味論に絞り込むことで,この問題を考察する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:02:57 GMT)
Old Quantum Mechanics by Bohr and Sommerfeld from a Modern Perspective [0.0]
ボーアの原子モデルとソマーフェルトによる拡張について、波動力学の数学的観点から検討する。量子化規則とエネルギー準位の導出は、半古典的手法を用いて再検討される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:54:18 GMT)
OGF: An Online Gradient Flow Method for Optimizing the Statistical Steady-State Time Averages of Unsteady Turbulent Flows [0.0]
乱流はカオス的で非定常であるが、その統計分布は統計的に安定な状態に収束する。既存の計算手法では、グリッド点の物理的に代表される数へのスケーリングが不可能である。我々は,大規模自由度システムにスケーラブルな新しいオンライン勾配流(OGF)法を開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:00:15 GMT)
Nonlocal characteristics and argand diagram of two-qubit gates [0.0]
2ビットゲートの絡み合う力は、弦の1組の2乗の長さで表すことができる。 2ビットゲートの線形エントロピーは、弦の両組の平方長を用いて表すことができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:04:18 GMT)
Non-ergodic one-magnon magnetization dynamics of the kagome lattice antiferromagnet [0.0]
平らなバンドによる非平衡ダイナミクスの例として, かごめ格子反強磁性体の1-マグノンダイナミクスの側面を示す。局所化マグノンとも呼ばれる一次元デルタ鎖局所化固有状態と同様に、無秩序な局在が生じ、系が平衡するのを防ぐ。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:48:20 GMT)
NRXR-ID: Two-Factor Authentication (2FA) in VR Using Near-Range Extended Reality and Smartphones [0.0]
本稿では,拡張現実感システムとスマートフォンを用いて2要素認証を実現するNRXR-IDを提案する。提案手法により,HMDを除去することなくスマートフォンによる認証課題を完了することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:00:09 GMT)
Multiresonator quantum memory with atomic ensembles [0.0]
原子アンサンブルを用いたマルチ共振器量子メモリの理論が開発されている。このようなメモリの基本物理特性を解析し,その実装に最適な条件を決定する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:46:25 GMT)
Multipartite Entanglement Structure of Fibered Link States [0.0]
我々は、ゼーファート面上のファイバーとしてトポロジ的に記述できるリンク補集合に焦点をあてる。このようなファイバーリンク補完状態の絡み合い構造は、位相不変量、すなわちフィブレーションのモノドロミーによって制御されることを示す。特に、任意のリンクが、グリーンベルガー-ホーネ-ザイリンガー状態(GHZ)のような絡み合いにつながる背景に埋め込まれていることが示される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:15:34 GMT)
Multi-photon emission from a resonantly pumped quantum dot [0.0]
共鳴駆動型2レベル人工原子における多光子放射統計の定量化を行う。単一光子源の純度を高めるために,取得時間ゲーティングに基づく手法を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:03:52 GMT)
Multi-Disease Deep Learning Framework for GWAS: Beyond Feature Selection Constraints [0.0]
厳密な非推論条件下では、アーキテクチャの選択が既存の手法より優れていることを示す。我々は5つの疾患を共同でモデル化するマルチラベルフレームワークへのアプローチを拡張し、共有遺伝アーキテクチャを活用して効率と発見を改善した。提案手法は,マルチディスクGWAS解析において,スケーラブルで漏れのない,生物学的に意味のあるアプローチを提供する競争予測性能(AUC 0.68-0.96)を実現する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:55:13 GMT)
Moderate Adaptive Linear Units (MoLU) [0.0]
深層ニューラルネットワークのための新しい高性能アクティベーション関数であるModrate Adaptive Linear Unit (MoLU)を提案する。 MoLUはシンプルで美しく強力なアクティベーション関数であり、数百のアクティベーション関数の中で優れたメインアクティベーション関数となる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:44:01 GMT)
Mitigating quantum operation infidelity through engineering the distribution of photon losses [0.0]
マルチポート干渉計は2ポートコンポーネントから構築することができる。本研究では,この選択が干渉計による操作の質に与える影響について検討する。非対称に設計された干渉計の恩恵を受ける操作もある。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:24:00 GMT)
Machine-Learning-Enhanced Entanglement Detection Under Noisy Quantum Measurements [0.0]
雑音耐性の絡み合い分類を実現するための機械学習に基づく手法を提案する。本プロトコルは,従来手法の分類精度を著しく向上させる。この研究は機械学習と量子情報科学を橋渡しし、ノイズロスの量子キャラクタリゼーションのための実用的なツールを提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:08:23 GMT)
Losing Control: Data Poisoning Attack on Guided Diffusion via ControlNet [0.0]
テキストトリガを使わずに特定のコンテンツを含む画像を生成するために,コントロールネットを操作する新しいデータ中毒手法を提案する。大規模で高品質なデータセットでは、我々のバックドアは、生の入力では認識できないまま、高い攻撃成功率を達成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:36:20 GMT)
LibAFL-DiFuzz: Advanced Architecture Enabling Directed Fuzzing [0.0]
我々は、他の技術と簡単に組み合わせられるコンポーネントで直接ファジィングを行うための柔軟なツールを構築した。我々は,AFLGoやBEACONと比較してファジィザを評価し,いくつかのベンチマークで露出に間に合うスピードアップを明らかにした。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:56:46 GMT)
Leveraging Self-Supervised Features for Efficient Flooded Region Identification in UAV Aerial Images [0.0]
この研究は、無人航空機の空中画像の浸水領域を正確に識別するために、自己監督機能を活用することに焦点を当てている。非航空画像に基づいて訓練されたDINOv2モデルによる空中画像のセグメンテーションにおける特徴の有効性を評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:02:35 GMT)
Leadership Detection via Time-Lagged Correlation-Based Network Inference [0.0]
本研究では,速度,加速度,方向といった複数の変数にまたがる時間差相関を用いた動的ネットワーク推定手法を提案する。提案手法は,データ量やパラメータ依存の離散化を必要とせずに,指導パターンの識別を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:04:10 GMT)
Knowledge-Aware Self-Correction in Language Models via Structured Memory Graphs [0.0]
大規模言語モデル(LLM)は強力であるが、幻覚と呼ばれる事実的誤りを引き起こす傾向にある。 RDFトリプルに基づく構造化メモリグラフを用いたLLM出力の知識認識自己補正のためのフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:55:12 GMT)
Interest Networks (iNETs) for Cities: Cross-Platform Insights and Urban Behavior Explanations [0.0]
位置情報に基づくソーシャルネットワーク(LBSN)は、iNETによる都市行動モデリングのためのリッチな基盤を提供する(関心ネットワーク) この研究は、プラットフォーム間のiNET(Google PlacesとFoursquare)と空間的粒度を比較し、粗いレベルがより一貫性のあるクロスプラットフォームパターンを示すことを示している。我々は,異なるユーザタイプに対して,高関心の都市部を予測するマルチレベル・説明可能なレコメンデーションシステムを開発した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:34:15 GMT)
Infrastructuring Contestability: A Framework for Community-Defined AI Value Pluralism [0.0]
AI駆動システムの普及は、人間とコンピュータのインタラクションとコンピュータが支援する協調作業に課題をもたらす。集中型のトップダウン定義に依存している現在の価値アライメントへのアプローチには、意味のある競争性のためのメカニズムが欠如している。本稿では,このギャップに対処する社会技術フレームワークであるCommunity-Defined AI Value Pluralismを紹介する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:45:50 GMT)
Inductive randomness predictors: beyond conformal [0.0]
本稿では、帰納的共形予測器の適切なスーパーセットを形成する帰納的ランダム性予測器を紹介する。その結果、すべての非自明な帰納的共形予測器は、帰納的ランダム性予測器によって厳密に支配されていることがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:47:24 GMT)
Hybrid Quantum Cryptosystems: Integration of Entanglement-Assisted Decryption and Physical Phase Obfuscation [0.0]
本研究では,量子通信のためのハイブリッド暗号フレームワークを提案する。エンタングルメント支援復号と位相ベースの物理的難読化を統合している。大規模なセキュアな量子ネットワークに適している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:32:53 GMT)
Hybrid Approach to Directed Fuzzing [0.0]
そこで本研究では,新しいシードスケジューリングアルゴリズムを用いた双方向ファジリングのハイブリッド手法を提案する。 LibAFL-DiFuzz を有向ファザとして,Sydr-Fuzz を動的シンボリックエグゼキュータとして,Sydr-Fuzz ツールに実装した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:29:16 GMT)
How Rules Represent Causal Knowledge: Causal Modeling with Abductive Logic Programs [0.0]
本稿では,階層化帰納論理プログラムの設定に対するパールの因果性と介入のアプローチを拡張した。これは、そのようなプログラムの安定なモデルが、哲学的基礎の上に構築することで因果的解釈を与えることができることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:12:01 GMT)
High Order Collaboration-Oriented Federated Graph Neural Network for Accurate QoS Prediction [0.0]
Federated Graph Neural Networks(FGNN)は、データの予測とユーザのプライバシの維持を可能にする。既存のFGNNベースの予測器は、散在する明示的なユーザサービスグラフ上でデバイス上でのトレーニングを行うのが一般的である。本研究では,高次協調指向グラフニューラルネットワーク(HCFGNN)を提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:28:49 GMT)
Geometry-Induced Chiral Currents in a Mesoscopic Helicoidal Quantum Well [0.0]
有限ヘリコダル計量の内在的ねじれからのみ、閉じ込めとキラリティが現れるメソスコピック量子井戸を導入する。本稿では,光トラップ中の超低温原子,フェムト秒書き型フォトニック導波路,ひずみ駆動型半導体ナノロールの3つの実験プラットフォームを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:56:16 GMT)
Generated multi-transparency windows, Fano resonances, and slow/fast light in an opto-magnomechanical system through magnon Squeezing [0.0]
本研究は, ハイブリッドオポマグノメカニカルシステムにおけるマグノメカニカルな透過性, ファノ共鳴, 遅い・速い光現象に関する理論的研究である。光子、フォノン、マグノン、および空洞内のマイクロ波間の相互作用は、光学的誘起透明性(OMIT)、磁気力学的誘起透明性(MMIT)、およびマグノン誘起透明性(MIT)を引き起こす。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:48:19 GMT)
Gaussian Open Quantum Dynamics and Isomorphism to Superconformal Symmetry [0.0]
我々は、ガウス性を保存するすべての超作用素からなる$n$モード状態、$mathfrakgo(n)$のリー代数を構成する。これにより、任意の非ガウス状態に対して二次レッドフィールド方程式を解くことができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:27:11 GMT)
GPU-based complete search for nonlinear minimization subject to bounds [0.0]
本稿では, 非線形関数の最小値を包含するGPUを用いた完全探索手法を提案する。区間解析を用いて、GPUの計算能力とアーキテクチャを組み合わせ、探索領域内の領域を反復的に制御する。効率性のために、新しいGPUベースのシングルプログラム、単一データ並列プログラミングスタイル、可変サイクリング技術を採用している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:10:52 GMT)
GCN-Driven Reinforcement Learning for Probabilistic Real-Time Guarantees in Industrial URLLC [0.0]
我々は,Deep Q-Network(DQN)強化学習フレームワークと統合されたグラフ畳み込みネットワーク(GCN)を導入することにより,ローカルデッドライン分割(LDP)アルゴリズムを強化する。我々は,GCN-DQNモデルにより,3つのネットワーク構成において,平均SINRが179.6%,197.4%,LDPが175.2%向上したことを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:38:38 GMT)
From Wavefunctional Entanglement to Entangled Wavefunctional Degrees of Freedom [0.0]
光子間の絡み合いが、それらの特性体モード間の絡み合いと等価かどうかという問題は、鍵となるオープンな問題である。私は、この微妙で永続的な問題に関して、光学モード間の相互作用を真の絡み合いに蒸留できる状況を説明することによって、新しく、より深く、物理的な洞察を提供する。私は、文脈的におよび非局所的に絡み合った光子から、分離不能なフィールドモード内で量子魔法を蒸留するための新しい種類のプロトコルを定式化するために応用されるかもしれない。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:09:20 GMT)
From Autonomy to Agency: Agentic Vehicles for Human-Centered Mobility Systems [0.0]
本稿ではエージェント車両(AgV)を特徴付けるシステムレベルの枠組みを提案する。 AgVはエージェントAIを統合し、複雑な環境で推論、適応、相互作用を行う。論文は、AgVsの開発とガバナンスにおける重要な課題を特定することで締めくくっている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:34:49 GMT)
Fine-tuning on simulated data outperforms prompting for agent tone of voice [0.0]
本研究では,言語モデルと特定の行動目標との整合性を考慮した微調整とシステムプロンプトの有効性について検討した。この結果から,微調整システムの性能が向上し,会話応答の比率が高くなったことが示唆された。シミュレーションデータ上の細調整された小型オープンウェイトLMは、特定のスタイリスティックな振る舞いを注入するための非常に効果的でデータ効率のよい方法である、と結論付けた。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:23:20 GMT)
FAMOUS: Flexible Accelerator for the Attention Mechanism of Transformer on UltraScale+ FPGAs [0.0]
Transformer Neural Network(TNN)は、自然言語処理(NLP)、機械翻訳、コンピュータビジョン(CV)など、幅広いアプリケーション領域に応用されている。本稿では、フィールドプログラマブルゲートアレイ(FPGA)上でのTNNの重み付きマルチヘッドアテンション計算のためのフレキシブルハードウェアアクセラレータである textitFamous を提案する。並列性を改善し、レイテンシを低減するために、処理要素とオンチップメモリの高利用に最適化されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:46:59 GMT)
Extreme Learning Machine Based System for DDoS Attacks Detections on IoMT Devices [0.0]
Internet of Medical Things (IoMT)は、医療分野におけるパラダイムシフトである。 IoMT接続デバイスにいくつかの脆弱性があるため、IoMTネットワークに対する分散型サービス拒否(DDoS)攻撃が急速に増加している。本稿では,IoMTデバイスに対するDDoS攻撃を検出するための極端学習マシンを探索することで,命を救うことを目的とする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:44:52 GMT)
Exploring Responsible Innovation efforts in Canada and the world [0.0]
責任あるイノベーション(RI)アプローチと指針原則が、この開発に対応するために提案されている。我々は,産業から研究,政府に至るまで,世界及びカナダにおける実践的な取り組みについて検討し,RI枠組みの下での量子技術の進歩の現状を分析する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:52:04 GMT)
Exploring Agentic Artificial Intelligence Systems: Towards a Typological Framework [0.0]
本稿では,エージェントAIシステムのタイプを考案し,その認知・環境機関を日常構造として定義する8つの次元を紹介した。このフレームワークは、研究者や実践者がAIシステムのさまざまなレベルのエージェンシーを分析することを可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:05:30 GMT)
Experimental investigation of single qubit quantum classifier with small number of samples [0.0]
シリコンフォトニック集積回路上に実装された単一量子量子分類器を実験的に検討した。入力あたりの平均光子サンプル数が約2つに減らされたとしても、分類器の精度は90%近く向上した。これらの知見は、統合フォトニックプラットフォーム上での資源効率の高い量子機械学習の実現可能性を支持する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:42:58 GMT)
Experimental entropic uncertainty relations in dimensions three to five [0.0]
本研究では、高次元の互いに偏りのない固有状態を持つ観測対象のシャノンエントロピーに対する密なエントロピー不確実性関係の実験的検証を行う。エントロピーの和の上限は決して破られず、不確実性関係を最小化する状態によって飽和している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:08:38 GMT)
Experimental data re-uploading with provable enhanced learning capabilities [0.0]
本稿では,フォトニック集積プロセッサにおけるデータ再ロード方式の実装について述べる。この結果は, このアルゴリズム, 訓練性, 一般化性に関する新たな理論的知見を提供する。これは、よりリソース効率のよい機械学習アルゴリズムを開発するための基礎となる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:33:36 GMT)
Exact solution of Schrödinger equation for the complex Morse potential to investigate physical systems with position-dependent complex mass [0.0]
本稿では,複雑なモースポテンシャルの作用下で位置依存的な複素質量を持つ二原子粒子系の正確な基底状態解を提案する。非エルミート・ハミルトニアンに固有の正規化の挑戦に焦点が当てられている。このモデルは高エネルギーおよび宇宙物理学、特に暗黒物質のようなエキゾチックなシステムの量子的記述における潜在的な応用を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 04:23:15 GMT)
Evolution of tripartite entanglement in three-qubit Quantum Gravity-Induced Entanglement of Masses (QGEM) with quantum decoherence [0.0]
量子ビット間の重力相互作用は、それらの間の真の三部構造が絡み合っていることを示す。我々は,3つの量子ビットの可能な実験構成の性能を比較し,絡み込み証人による真の絡み合いの検出を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:27:17 GMT)
Evaluating Fake Music Detection Performance Under Audio Augmentations [0.0]
複数のシステムを用いて生成した実・合成音楽の双方からなるデータセットを構築した。次に、様々なオーディオ変換を適用し、それらが分類精度にどのように影響するかを分析する。我々は,近年の最先端音楽ディープフェイク検出モデルの性能を,音声拡張の有無で検証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:15:02 GMT)
Entropy from decoherence: a case study using glasma-based occupation numbers [0.0]
環境と相互作用するコヒーレント状態のデコヒーレンスによって生成されるエントロピー当たりの粒子である$S/N$を計算する。コヒーレント状態は、高エネルギー核衝突の初期段階で発生したグラスマフィールドから借用された占有数によって特徴づけられる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:26:23 GMT)
Engineering of self-bending surface plasmon polaritons through Hermite-Gaussian mode expansion [0.0]
我々は、新しいタイプの構造を持つ表面プラズモンビームの設計に適した新しい理論的枠組みを導入する。この方法はハーマイト-ガウスモード展開に頼り、新しいタイプの構造を持つ準同軸プラズモンビームを生成できる完全な基底を構成する。概念実証として,エアリー系表面プラズモン偏光子を空気-銀界面に沿って伝播させることにより,本手法の有効性の数値的証明を行う。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:35:40 GMT)
EmissionNet: Air Quality Pollution Forecasting for Agriculture [0.0]
農業排ガスからの大気汚染は、環境問題や公衆衛生問題に大きく貢献するが、しばしば見落とされがちである。従来の空気質予測モデルは、複雑な非線形汚染物質相互作用を捉えるのに苦労する物理に基づくアプローチに依存している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:58:22 GMT)
Emergent Semantics Beyond Token Embeddings: Transformer LMs with Frozen Visual Unicode Representations [0.0]
埋め込み層が完全に凍結されたTransformerモデルを構築します。我々の手法は、Unicode中心の新しいトークン化器を含む任意のトークン化器と互換性がある。トレーニング可能なセマンティックな埋め込みがないにもかかわらず、私たちのモデルは収束し、一貫性のあるテキストを生成します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:17:32 GMT)
Electron-molecule scattering via R-matrix variational algorithms on a quantum computer [0.0]
本稿では,変分量子固有解法(VQE)とその変分を利用して制限を克服する量子計算手法を提案する。水素分子からの電子散乱モデル問題に対する本手法の有効性を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:25:11 GMT)
Efficient SAR Vessel Detection for FPGA-Based On-Satellite Sensing [0.0]
我々は,共通衛星電力制約(10W)内でFPGAベースの処理に特化して最適化されたYOLOv8アーキテクチャを用いて,新しい効率的で高性能なSAR容器検出モデルを開発し,展開する。検出・分類性能は,2～3桁の規模で,最先端のGPUベースモデルよりわずか2%,3%低かった。この研究は、より自律的で応答性があり、スケーラブルな地球観測システムを実現するための、時間クリティカルなSAR分析のための、小型で高性能なMLモデルを実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:03:31 GMT)
Efficient Quantum Lattice Gas Automata [0.0]
このアルゴリズムは、衝突、マッピング、伝播の3つの主要なステップで構成されている。ノイズの影響にもかかわらず、現在のノイズのあるデバイスでは、正確なシミュレーションがすでに達成されていることが示唆された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:53:37 GMT)
Efficacy of Image Similarity as a Metric for Augmenting Small Dataset Retinal Image Segmentation [0.0]
合成画像の品質を評価するための一般的な指標は、2つの画像データセットの類似度を測定するFr'echet Inception Distance (FID)である。本研究は, 標準画像と合成画像との強化動作が, 従来実施されていた実験と一致していることを示す。トレーニングと増分データセットの間のFIDが減少するにつれて、増分データセットは画像セグメンテーションの重要かつ堅牢な改善に寄与することが示されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:38:45 GMT)
Effects of Unplanned Incoming Flights on Airport Relief Processes after a Major Natural Disaster [0.0]
本研究の目的は, 自然災害後の空港における貨物取扱業務の遂行に, 着信便に関する不完全な知識が与える影響を理解することである。エージェントベースのモデルが作成され、情報の不確実性の度合いが異なる現実的なオフロード戦略が実装される。その結果、1機の無人機の効果は無視できることがわかった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:00:26 GMT)
Dual-Attention U-Net++ with Class-Specific Ensembles and Bayesian Hyperparameter Optimization for Precise Wound and Scale Marker Segmentation [0.0]
本稿では,チャネルワイズ(SCSE)と空間アテンション機構を統合した,新しいデュアルアテンション型U-Net++アーキテクチャを提案する。提案手法はF1スコア0.8640を達成し、複雑な医療セグメンテーションタスクに対する効果を実証した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:24:15 GMT)
Dual frequency calibration to build a portable vapor cell optical clock with improved stability and without a frequency comb [0.0]
本稿では、2つのレーザー周波数を同時に正確に校正する新しい2重干渉計法を提案する。 2つの周波数校正レーザーは混合され、無線周波数でビート信号を生成し、ポータブルな光原子時計を作る。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:56:05 GMT)
Disentangling strategies and entanglement transitions in unitary circuit games with matchgates [0.0]
ユニタリ回路ゲームでは、2つの競合するパーティ、すなわち「絡み合い」と「絡み合い」は、量子多体系において絡み合い相転移を誘導することができる。我々は、相互作用しないフェルミオンの進化と等価に一致するマッチゲートダイナミクスの文脈内でそのようなゲームを分析する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:38:50 GMT)
DeepRetro: Retrosynthetic Pathway Discovery using Iterative LLM Reasoning [0.0]
DeepRetroはオープンソースの反復型ハイブリッドLLMベースのレトロシンセティックフレームワークである。提案手法は,従来のテンプレートベース/モンテカルロ木探索ツールの強みを,ステップワイドなフィードバック駆動ループでLLMの生成能力と統合する。このアプローチは、複雑な天然物化合物のための新しい経路をうまく生成する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:41:39 GMT)
DeepCS-TRD, a Deep Learning-based Cross-Section Tree Ring Detector [0.0]
Deep CS-TRDは全断面の木の輪を検出する新しい自動アルゴリズムである。深層学習に基づくアプローチ(U-Net)によりCS-TRDのエッジ検出ステップを置換する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:38:00 GMT)
Deep Learning to Automate Parameter Extraction and Model Fitting of Two-Dimensional Transistors [0.0]
電気的測定から2次元トランジスタの物理パラメータを抽出する深層学習手法を提案する。物理に基づくデバイスシミュレータを近似するために、二次ニューラルネットワークを訓練する。この方法は、500台のデバイスのシミュレーションから生成された電気データに基づいてニューラルネットワークをトレーニングした後、高品質な適合を可能にする。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:46:25 GMT)
Deep Learning for Absorption-Image Analysis [0.0]
画像回帰のための改良型ディープラーニング画像分類モデルを提案する。データ収集における課題を克服するために、シミュレーション吸収画像のモデルを訓練する。ディープラーニングモデルの性能を最小二乗法と比較し、ディープラーニングモデルが最小二乗法と同様の精度を達成することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:02:59 GMT)
Dataless Neural Networks for Resource-Constrained Project Scheduling [0.0]
本稿では,資源制約型プロジェクトスケジューリング問題(RCPSP)に対する最初のデータレスニューラルネットワーク手法を提案する。我々は、離散的なスケジューリング制約を勾配に基づく最適化に適した微分可能な目的に変換する完全な数学的枠組みを提供する。本稿では,メモリ効率の高い高密度時間グリッド表現を含む,資源制約および資源制約の数学的定式化について述べる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:59:57 GMT)
Curvature-Induced Nonclassicality in a Generalized Jaynes-Cummings Model [0.0]
空間曲率がJaynes-Cummingsモデルに与える影響について検討する。本研究では,空間曲率がマンデルパラメータ,エントロピー,ウィグナー分布関数の挙動に与える影響について検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:46:42 GMT)
Cultivating Multimodal Intelligence: Interpretive Reasoning and Agentic RAG Approaches to Dermatological Diagnosis [0.0]
2025年のImageCLEF MEDIQA-MAGIC チャレンジの第2版では、マルチモーダル皮膚科の質問応答とセグメンテーションに焦点を当てている。本研究はCVQA(Closed Visual Question Answering)課題に対処し,複数項目の臨床質問に対する正しい回答を選択することを目的としている。チームは6得点を挙げて2位となり、競争力と高い精度を誇った。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 22:31:56 GMT)
Contextual Light-Particle Interference [0.0]
我々は、検出器が電磁界の電気的成分と磁気的成分を同時に結合する光検出モデルを提案し、解析する。グラウバーのセミナル理論を拡張して、これらの検出器は、現在、メタマテリアルを介して実験的に実現可能であり、検出器の内部反応に強く依存する干渉パターンを生じさせることを示した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:31:15 GMT)
Condensed Encodings of Projective Clifford Operations in Arbitrary Dimension [0.0]
我々は、$n$-qudit射影クリフォード群に対する構造定理の注意深い解析と、その要素に対する様々な符号化スキームを提供する。我々の結果はすべての整数に$dgeq2$、特に偶数の場合に適用されます。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:36:32 GMT)
Comprehensive Modeling of Camera Spectral and Color Behavior [0.0]
本稿では,RGBデジタルカメラのスペクトル応答をモデル化する新しい手法を提案する。その結果,色忠実度とスペクトル精度を向上させる効果が示された。このアプローチは、科学的、工業的、創造的な領域でカメラシステムを最適化するための強力なツールを提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 02:24:42 GMT)
Coherent information for CSS codes under decoherence [0.0]
Calderbank-Shor-Steane (CSS) コードと呼ばれるクラスには、トーリックコード、カラーコード、フラクトンなど多くの重要な例が含まれている。近年の研究では、これらのQECCの復号化遷移は、混合状態から情報理論量を計算することによって本質的に捕捉できることが示されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 01:45:40 GMT)
Cloud Diffusion Part 1: Theory and Motivation [0.0]
画像集合にノイズを段階的に付加し、信号とノイズを分離するモデルを訓練することにより、画像生成機能の拡散モデルを構築する。これらのモデルはより高速な推論、高周波の詳細の改善、制御性の向上につながると我々は主張する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:36:16 GMT)
Charge transport limited by nonlocal electron-phonon interaction. II. Numerically exact quantum dynamics in the slow-phonon regime [0.0]
断熱限界付近の1次元ピエルスモデルにおけるキャリア輸送について検討した。過渡的局所化シナリオ (TLS) はHEOM力学を高温および強い相互作用において非常によく近似する。この適度な状態における我々の発見はTLSの限界を示し、最も先進的な量子古典シミュレーションの結果を支持する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:50:37 GMT)
Charge transport limited by nonlocal electron-phonon interaction. I. Hierarchical equations of motion approach [0.0]
相関関数は階層的な運動方程式から得ることができることを示す。 1次元ピエルスモデルにおけるキャリアの正確な運動量を計算する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:43:13 GMT)
CMET: Clustering guided METric for quantifying embedding quality [0.0]
クラスタリングガイドMETric(CMET)は埋め込み品質を定量化する指標である。 CMETは, 局所的および大域的形状保存能力を測定する2つのスコア, viz., CMET_L, CMET_Gからなる。その結果、CMETの最先端手法に対する良好な性能が反映された。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:02:34 GMT)
Bullshark on Narwhal: Implementation-level Workflow Analysis of Round-based DAG Consensus in Theory and Practice [0.0]
Narwhal mempool上のラウンドベースのDAG BFTプロトコルであるBullsharkは、最適なパフォーマンスを実現している。アルゴリズムのワークフローを、トランザクションの提出からブロックチェーンのコミットメントまで分析し、機能レベルで層ごとに分割します。今後の研究は、ビザンチン断層環境の性能向上とCAP定理のトレードオフの最適化を目的としている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 12:56:45 GMT)
Building up spacetime with quantum entanglement [0.0]
古典的に連結された時空の出現は、量子重力の非摂動的記述における自由度の量子的絡み合いと密接に関連していると論じる。時空の2つの領域に付随する自由度を遠ざけると、これらの領域は互いに引き離し、互いに挟み合うことができ、標準的絡み合いの測度によって定量化できる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:31:58 GMT)
Blind Targeting: Personalization under Third-Party Privacy Constraints [0.0]
主要な広告プラットフォームは、広告主の個人レベルのデータへのアクセスを制限することで、最近プライバシー保護を強化した。本稿では,これらの制限されたプライバシ保護データ環境において,広告主が効果的なターゲティングポリシーを設計できるかどうかについて検討する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:30:40 GMT)
Bardeen-Cooper-Schrieffer State Representation and Pairing in the Fermionic Tonks-Girardeau Gas [0.0]
フェルミオン型トンクス・ジラルドーガスの基底状態波動関数の代替式を提案する。第二量子化の枠組みで提案された波動関数を表現することにより、フェルミオン型トンクス・ジラルドーガスの基底状態が数保存状態であることを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:35:57 GMT)
Augmenting software engineering with AI and developing it further towards AI-assisted model-driven software engineering [0.0]
本稿は,AIを活用したソフトウェア工学の現状を概説し,それに対応する分類学であるai4seを開発した。ソフトウェア開発におけるAI支援型ビッグデータのビジョンは、両方のアプローチに固有の利点を活かすことを目的としている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 08:58:47 GMT)
Assessing the Ecological Impact of AI [0.0]
テクノロジーの哲学者は最近、AIの環境への影響に注意を払っている。本提案は, 哲学的思想を取り入れたgenAIの持続可能性的側面の実際的分析を奨励するものである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 11:50:18 GMT)
Application and Evaluation of Large Language Models for Forecasting the Impact of Traffic Incidents [0.0]
本研究では,大規模言語モデル(LLM)の適用可能性について検討した。本稿では,交通機能とLLM抽出インシデント機能の組み合わせによるインシデント影響を予測する,完全なLLMベースのソリューションを提案する。実トラフィックインシデントデータセットを用いて、3つの高度なLCMと2つの最先端機械学習モデルの性能を評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:22:06 GMT)
Analise Semantica Automatizada com LLM e RAG para Bulas Farmaceuticas [0.0]
本研究では,大規模言語モデル(LLM)と組み合わせたRAGアーキテクチャを用いて,PDF形式の文書解析を自動化する。本提案では, 埋め込み, 意味データ抽出, 文脈化自然言語応答の生成によるベクトル探索手法を統合する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:48:15 GMT)
An order-theoretic circuit syntax and characterisation of the concept lattice [0.0]
我々は、回路(弦図)の構文に順序論的アプローチを採り、回路を追加の入力出力構造で部分順序として扱う。我々は、回路間の射を定義し、これらが有限の場合において、構文的回路書き換えの概念を定式化できることを示す分解定理を証明する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 19:18:37 GMT)
An Evaluation of Large Language Models on Text Summarization Tasks Using Prompt Engineering Techniques [0.0]
大規模言語モデル(LLM)は、人間のようなテキストを生成する能力を持って、自然言語処理の進歩を続けている。 CNN/Daily MailとNewsRoom(ニューズ)、SAMSum(ダイアログ)、ArXiv(サイエンティフィック)の4つのデータセットにまたがる6つのLCMを体系的に評価する。本研究では,ROUGEとBERTScoreの測定値を用いて評価を行った。 Longドキュメントには、短いコンテキストウィンドウを持つLLMが複数の段階で拡張入力を要約できる文ベースのチャンキング戦略が導入されている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:34:05 GMT)
Alternating minimization for computing doubly minimized Petz Renyi mutual information [0.0]
2倍に最小化された$alpha$のPetz Renyi相互情報(PRMI)は、固定二部量子状態$rho_AB$の$alpha$のPetz分散の最小化として定義される。現在までに、この測度に対する閉形式表現は発見されておらず、計算のための数値法の開発が必要とされる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:11:58 GMT)
Advocate for Complete Benchmarks for Formal Reasoning with Formal/Informal Statements and Formal/Informal Proofs [0.0]
私たちは、オープンコード、オープンデータ、そして、完全でエラーのないベンチマークがこの分野の進歩を加速する立場を取っています。私たちは、この分野に貢献するための障壁を生み出すプラクティスを特定し、それらを取り除く方法を提案します。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 07:27:45 GMT)
Advancing AI Negotiations: New Theory and Evidence from a Large-Scale Autonomous Negotiations Competition [0.0]
我々は国際AIネゴシエーションコンペティションを実施し、参加者はAI交渉エージェントのためのプロンプトを設計・洗練した。次に、さまざまな特徴と目的を持つ複数のシナリオにわたる、これらのエージェント間の180,000以上の交渉を支援しました。驚くべきことに、温暖化 — 伝統的に人間関係を構築する特性 — は、すべての主要なパフォーマンス指標において、常に優れた結果に結びついています。一方、支配的な代理人は特に価値を主張するのに効果的だった。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 21:41:49 GMT)
Action Space Reduction Strategies for Reinforcement Learning in Autonomous Driving [0.0]
強化学習(RL)は自動運転のための有望なフレームワークを提供する。きめ細かい制御を支援するためにしばしば使われる大型で高次元のアクションスペースは、訓練の効率を阻害し、探査コストを増大させる。我々は、自律運転におけるRLのための2つの新しい構造化された行動空間修正戦略を導入し、評価する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:58:08 GMT)
Accuracy and Consumption analysis from a compressed model by CompactifAI from Multiverse Computing [0.0]
本研究では,Llama 3.1 8Bcitellamaに適用した圧縮手法であるCompactifAIの性能評価を行った。この結果から,CompactifAIを用いた圧縮モデルでは,計算資源を大幅に削減するだけでなく,モデル精度も向上し,より効率的でスケーラブルでコスト効率の高いモデルであることが判明した。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:01:39 GMT)
Accessible Quantum Gates on Classical Stabilizer Codes [0.0]
$[n,k,d]$-classical stabler codes addressing bit-flip error where $n$, $k$, $d$は、それぞれ物理的および論理的キュービットの数であり、コード距離である。普遍論理ゲート集合を達成するために必要となる演算は、実装すべき複雑なユニタリ回路を必要とすることを証明している。同様の制約は、位相フリップ誤差を修正するために設計された古典符号だけでなく、バイアスノイズに合わせた量子安定化符号にも適用される。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 18:47:58 GMT)
AI Mother Tongue: Self-Emergent Communication in MARL via Endogenous Symbol Systems [0.0]
エージェントが内因性記号系を持つ場合、その神経表現は自然に自発的な意味的圧縮とナッシュ平衡による意味的収束を示す。この発見は、象徴主義と接続主義を橋渡しするための新しい道を提供する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:52:49 GMT)
A streamlined demonstration that stabilizer circuits simulation reduces to Boolean linear algebra [0.0]
Gottesman-Knillの定理は、安定化回路上の計算は古典的なコンピュータ上でシミュレートできるというものである。このノートは、安定化回路とブール線型代数の間の接続をより明確にすることを目的としている。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:54:40 GMT)
A generalized Wasserstein-2 distance approach for efficient reconstruction of random field models using stochastic neural networks [0.0]
ニューラルネットワークは,非制限条件下でのワッサーシュタイン2距離距離のランダム場モデルを再構成可能であることを証明した。このニューラルネットワークは、提案した一般化された局所的なWasserstein-2損失関数を最小化することにより、効率的に訓練することができる。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:53:13 GMT)
A Runtime-Adaptive Transformer Neural Network Accelerator on FPGAs [0.0]
ADAPTORは、FPGA上のトランスフォーマーエンコーダとデコーダの高密度行列計算のためのランタイム適応型アクセラレータである。 FPGAプラットフォームにリソースを分散するための効率的な行列タイリングが組み込まれている。最新のFPGAベースのアクセラレータと比べて1.7～2.25$times$のスピードアップを実現している。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 06:11:30 GMT)
A Novel Approach for Estimating Positive Lyapunov Exponents in One-Dimensional Chaotic Time Series Using Machine Learning [0.0]
一次元時系列から正のリャプノフ指数(MLE)を推定するための機械学習に基づく新しい手法を提案する。本手法は,従来の分析手法に代えて,頑健でデータ駆動型な手法を提供することにより,科学的妥当性を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 10:53:02 GMT)
A Note on Runtime Verification of Concurrent Systems [0.0]
本稿では,トレースベースの論理を利用して並列システムの検証を行う方法を提案する。本稿は,LTrL式のためのトレース一貫性B"uchi Automaticaの構築を思い出し,よく理解されたモニタ合成手順でどのように利用するかを説明する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 09:50:59 GMT)
A Lightweight Deep Learning Model for Automatic Modulation Classification using Dual Path Deep Residual Shrinkage Network [0.0]
自動変調分類(AMC)はスペクトル効率を高める上で重要な役割を果たしている。低複雑性と高い分類精度のバランスをとる軽量AMCモデルの必要性が高まっている。本稿では,資源制約エッジデバイスに最適化された低複雑さ,軽量深層学習(DL)AMCモデルを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 00:37:54 GMT)
A General Class of Model-Free Dense Precision Matrix Estimators [0.0]
本稿では,経済学に広く応用可能なモデルフリーで高精度な行列推定器の試作について紹介する。 i) 精度行列推定誤差の非漸近境界、(ii) 固有信号対雑音の存在を明らかにし、(iv) 正確な集団空間性仮定を避けることができる。その望ましい理論的性質に加えて、S&P 500指数の徹底的な実験的研究により、一般推定器のチューニングパラメータフリーな特殊ケースはシャープ比が2倍に上昇することを示す。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 05:07:17 GMT)
A Framework for Synthetic Audio Conversations Generation using Large Language Models [0.0]
Conversa Synthは、複数のペルソナ設定を持つ大規模言語モデル(LLM)を使用して合成会話音声を生成するように設計されたフレームワークである。このフレームワークはまず、さまざまなトピックにわたる多様で一貫性のあるテキストベースの対話を生成し、その後、TTS(text-to-speech)システムを使用して音声に変換する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 13:57:37 GMT)
A Dynamical Systems Perspective on the Analysis of Neural Networks [0.0]
動的システムを用いて機械学習アルゴリズムのいくつかの側面を分析する。我々は、ディープニューラルネットワーク、(確率的な)勾配降下、および関連するトピックから動的ステートメントまで、さまざまな課題を再フォーマットする方法を実証する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 16:18:49 GMT)
A Comparative Study of Machine Learning Algorithms for Stock Price Prediction Using Insider Trading Data [0.0]
本研究は、インサイダー取引情報による株価の予測を行う機械学習アルゴリズムを実験的に検討する。本研究では、決定木、ランダムフォレスト、異なるカーネルを持つサポートベクターマシン(SVM)、K平均クラスタリングなどのアルゴリズムの有効性について検討する。本研究の目的は、金融アナリストや投資家が投資戦略を最適化する強力なアルゴリズムを選択するのを支援することである。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 15:33:52 GMT)
A COMPASS to Model Comparison and Simulation-Based Inference in Galactic Chemical Evolution [0.0]
textttCOMPASSは、新しいシミュレーションベースの推論フレームワークである。 textttCOMPASSは、高次元、不完全、可変サイズの恒星量データセットを処理する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 14:45:41 GMT)
A 3D Machine Learning based Volume Of Fluid scheme without explicit interface reconstruction [0.0]
三次元領域上での多物質フローをシミュレーションする機械学習に基づくVolume of Fluid法を提案する。この手法の斬新な点の1つは、以前に訓練されたニューラルネットワークを評価してフラックス分数を計算することである。メッシュのサイズが0$h=1/N_hsearrow 0$になる傾向にあるため、数値収束は2つの参照スキームよりもよい。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 17:30:00 GMT)
2048: Reinforcement Learning in a Delayed Reward Environment [0.0]
遅延とスパース報酬は、強化学習(RL)エージェントの基本的な障害となる。本稿では,長距離性能を直接最適化するための分散分散多段階RLフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 07 Jul 2025 20:33:12 GMT)