Evaluation of OpenAI o1: Opportunities and Challenges of AGI [100.9] o1-previewは目覚ましい能力を示し、しばしば人間レベルまたは優れたパフォーマンスを実現した。
このモデルは、様々な分野にわたる複雑な推論と知識の統合を必要とするタスクに優れていた。
総合的な結果は、人工知能への大きな進歩を示している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:37:32 GMT)
QuTE: decentralized multiple testing on sensor networks with false discovery rate control [93.1] 本稿では、偽発見率(FDR)の証明可能な保証を備えたグラフ上での分散多重仮説検定法を設計する。
異なるエージェントが無向グラフのノードに存在し、各エージェントはそのノードに局所的な1つ以上の仮説に対応するp値を持つ。
各エージェントは、グラフ全体の大域的FDRが予め定義されたレベルで制御されなければならないという共同目的のもと、隣人とのみ通信することで、それぞれのローカル仮説の1つ以上の拒絶を個別に決めなければならない。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:51:13 GMT)
Enhancing Long Video Generation Consistency without Tuning [92.2] 単一のプロンプトまたは複数のプロンプトで生成されたビデオの一貫性とコヒーレンスを高めるための課題に対処する。
本稿では,時間周波数に基づく時間的注意再重み付けアルゴリズム(TiARA)を提案する。
複数のプロンプトによって生成されたビデオに対しては、プロンプトのアライメントがプロンプトの品質に影響を及ぼすといった重要な要因をさらに明らかにする。
提案するPromptBlendは,プロンプトを系統的に整列させるプロンプトパイプラインである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:29:03 GMT)
Co-DETECT: Collaborative Discovery of Edge Cases in Text Classification [89.6] Co-DETECT (Collaborative Discovery of Edge Case in TExt ClassificaTion)は、新しい混合開始型アノテーションフレームワークである。
人間の専門知識と、大きな言語モデルでガイドされた自動アノテーションを統合する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:48:54 GMT)
AvatarMakeup: Realistic Makeup Transfer for 3D Animatable Head Avatars [89.3] AvatarMakeupは、アニメーションを通して最先端のメイクアップ転送品質と一貫性を達成する。
コヒーレント複製は、生成した化粧画像中の平均的な顔属性を復号することで、グローバルな紫外線マップを最適化する。
実験によると、AvatarMakeupはアニメーションを通して、最先端のメイクアップの質と一貫性を実現する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:53:32 GMT)
GaussRender: Learning 3D Occupancy with Gaussian Rendering [86.9] GaussRenderは、投影的一貫性を強制することによって3D占有学習を改善するモジュールである。
提案手法は,不整合な2次元プロジェクションを生成する3次元構成をペナライズすることにより,より一貫性のある3次元構造を実現する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:05:33 GMT)
Pre-Trained Policy Discriminators are General Reward Models [81.4] 政策差別学習(POLAR)という,スケーラブルな事前学習手法を提案する。
POLARは報酬モデル(RM)を訓練し、同一のポリシーを識別し、異なるポリシーを識別する。
実証実験の結果、POLARは従来の非事前学習法よりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:56:31 GMT)
Controlling What You Share: Assessing Language Model Adherence to Privacy Preferences [80.6] プライバシプロファイルを使用してデータのコントロールを継続する方法について検討する。
ローカルモデルがこれらの命令を使ってクエリを書き換えるフレームワークを構築します。
本研究を支援するために,実ユーザクエリの多言語データセットを導入し,プライベートコンテンツをマークする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:22:55 GMT)
PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [80.1] PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:21:05 GMT)
HV-MMBench: Benchmarking MLLMs for Human-Centric Video Understanding [79.1] MLLM(Multimodal Large Language Models)は、画像とビデオの両方を含む視覚的理解タスクにおいて、大きな進歩を見せている。
既存の人間中心のベンチマークは、主にビデオ生成の品質と行動認識を強調し、人間中心のシナリオに必要な知覚と認知の能力を見落としている。
我々は,人間中心のビデオ理解におけるMLLMのより総合的な評価を提供するために,厳格にキュレートされたベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:52:24 GMT)
AIGI-Holmes: Towards Explainable and Generalizable AI-Generated Image Detection via Multimodal Large Language Models [78.1] AI生成コンテンツ(AIGC)の急速な発展は、誤情報を拡散するAIGIの誤用につながった。
大規模で包括的なデータセットであるHolmes-Setを導入し、画像がAI生成されているかどうかを解説したインストラクションチューニングデータセットを含む。
本研究は,MLLMの構造化説明と品質管理によるデータ生成を効率化する,Multi-Expert Juryと呼ばれる効率的なデータアノテーション手法を提案する。
さらに,視覚専門家による事前学習,教師付き微調整,直接選好最適化を含む3段階学習フレームワークであるHolmes Pipelineを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:00:38 GMT)
FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities [76.5] MLLM(Multimodal large language model)は、単一のフレームワーク内で視覚的理解と画像生成を統一する言語である。
ほとんどの既存のMLLMはAutore(AR)アーキテクチャに依存しており、将来の開発に固有の制限を課している。
本稿では,離散フローマッチングに基づく統一マルチモーダルモデルであるFUDOKIを紹介する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:23:56 GMT)
Brain3D: Generating 3D Objects from fMRI [76.4] 被験者のfMRIデータを入力として利用する新しい3Dオブジェクト表現学習手法であるBrain3Dを設計する。
我々は,人間の視覚系の各領域の異なる機能的特徴を,我々のモデルが捉えていることを示す。
予備評価は、Brain3Dがシミュレーションシナリオで障害した脳領域を正常に識別できることを示唆している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:59:27 GMT)
Model Compression using Progressive Channel Pruning [74.0] 畳み込みニューラルネットワーク(CNN)を高速化するPCP(Progressive Channel Pruning)というフレームワークを提案する。
我々のフレームワークは、複数の選択された層から少数のチャンネルを反復的にプルークし、各イテレーションで3ステップの試行選択パイプラインで構成されています。
2つのベンチマークデータセットに関する包括的な実験は、PCPフレームワークが既存のチャネルプルーニングアプローチよりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:12:03 GMT)
On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.9] エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:40:28 GMT)
Bridging Prediction and Intervention Problems in Social Systems [71.4] 我々は,自動意思決定システム(ADS)の影響を考慮した場合,予測重視のパラダイムから介入主義パラダイムに移行する方法を検討する。
我々は、予測を決定支援、最終決定、結果とみなすには、予測を超えた新たなデフォルトのADS問題設定が必要であると論じている。
本稿では,ADSシステムの設計,実装,評価を行うため,この視点が現代の統計フレームワークや他のツールを統一する方法について述べる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:29:13 GMT)
AXLearn: Modular Large Model Training on Heterogeneous Infrastructure [64.3] AXLearnは大規模ディープラーニングモデルのスケーラブルで高性能なトレーニングを容易にする生産用ディープラーニングシステムである。
他の最先端のディープラーニングシステムと比較して、AXLearnはモジュール性と異種ハードウェアインフラストラクチャのサポートにユニークな重点を置いている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:50:58 GMT)
Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning [62.4] 本稿では,行動列上のQ値を出力する批判ネットワークを学習する,新しい値に基づく強化学習アルゴリズムを提案する。
実験により、CQN-ASは、様々なスパース逆ヒューマノイド制御およびテーブルトップ操作タスクにおいて、いくつかのベースラインより優れていることが示された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:21:42 GMT)
Fast Monte Carlo Tree Diffusion: 100x Speedup via Parallel Sparse Planning [61.7] 最近提案されたモンテカルロ木拡散(MCTD)は,木に基づく探索と拡散を組み合わせて,有望な解を提供する。
Fast-MCTDは、遅延ツリー更新と冗長性認識による並列ロールアウトを可能にするParallel MCTDと、軌道粗大化によるロールアウト長の削減を行うSparse MCTDの2つの技術を統合する。
実験により、Fast-MCTDは標準MCTDよりも最大100倍の高速化を実現し、計画性能を維持または改善した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:20:47 GMT)
Open Vision Reasoner: Transferring Linguistic Cognitive Behavior for Visual Reasoning [60.3] 本稿では,Qwen2.5-VL-7Bに基づく2段階のパラダイムを提案する。
この先駆的な研究は、3つの基本的な洞察を明らかにしている: 1) 行動伝達は、言語的精神イメージによる冷戦開始時に驚くほど早く出現し、2) 冷戦開始は、視覚行動を広く記憶し、RLは、効果的パターンを批判的に識別し、スケールアップする。
得られたモデルであるOpen-Vision-Reasoner (OVR)は、MATH500で95.3%、MathVisionで51.8%、54.6%を含む一連の推論ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:59:03 GMT)
From LLMs to Actions: Latent Codes as Bridges in Hierarchical Robot Control [58.7] 我々は,制限を克服する代替アーキテクチャとして,Learningable Latent Codes as Bridges (LCB)を導入した。
methodoutperforms baselines that leverage pure language as the interface layer on tasks that requires reasoning and multi-step behaviors。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:26:50 GMT)
Monte Carlo Tree Diffusion for System 2 Planning [57.5] モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
本手法は,木構造化プロセスとしてデノナイジングを再認識し,部分的にデノナイジングした計画を反復的に評価し,刈り取り,精錬する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:30:41 GMT)
OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation [56.5] OPERAは、ユーザペルソナ、ブラウザの観察、きめ細かいWebアクション、そして自己報告されたジャストインタイム論理を包括的にキャプチャする最初のパブリックデータセットである。
我々は,現在のLCMがユーザの次の行動と合理的性をどの程度予測できるかを評価するための最初のベンチマークを確立する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:44:47 GMT)
NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.4] 我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:28:47 GMT)
Computation-Aware Gaussian Processes: Model Selection And Linear-Time Inference [55.2] 我々は、1.8万のデータポイントでトレーニングされた計算対応GPのモデル選択が、1つのGPU上で数時間以内に可能であることを示す。
この研究の結果、ガウス過程は、不確実性を定量化する能力を著しく妥協することなく、大規模なデータセットで訓練することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:51:15 GMT)
Why Do Open-Source LLMs Struggle with Data Analysis? A Systematic Empirical Study [55.1] データ理解、コード生成、戦略的計画という3つの側面にわたるモデルを評価します。
我々はこれらの知見を活用してデータ合成手法を開発し、オープンソースのLCMの分析的推論能力の大幅な改善を実証した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:20:16 GMT)
HiLa: Hierarchical Vision-Language Collaboration for Cancer Survival Prediction [55.0] 生存予測を改善するための新しい階層型視覚・言語協調フレームワークを提案する。
具体的には、HiLaは事前訓練された特徴抽出器を使用して、パッチレベルとリージョンレベルの両方でWSIから階層的な視覚的特徴を生成する。
このap-proachは、プロンプトから異なる生存関連属性に対応する識別的視覚特徴の包括的学習を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:06:25 GMT)
Attacker's Noise Can Manipulate Your Audio-based LLM in the Real World [54.7] 本稿では,Qwen2-Audioのような音声ベース大規模言語モデル(ALLM)の現実的脆弱性について検討する。
敵はステルスなオーディオの摂動を巧みに作り、ALLMを操り、特定のターゲットの動作を示す。
ユーザがALLMsと対話するときに、相手のバックグラウンドノイズを再生することで、応答品質を著しく低下させることができることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:29:52 GMT)
VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment [54.7] VideoLifterは、ローカルからグローバルへの戦略を断片的に活用する、新しいビデオから3Dパイプラインである。
再建プロセスを大幅に加速し、訓練時間を82%以上削減し、現在のSOTA法よりも視覚的品質を向上した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:03:10 GMT)
RSPO: Regularized Self-Play Alignment of Large Language Models [54.6] Regularized Self-Play Policy Optimization (RSPO) は、事前のメソッドを統一し、様々な正規化ツールのプラグイン・アンド・プレイ統合を可能にする汎用的でモジュール化されたフレームワークである。
20ドル以上の微調整Mistral-7B-Instructモデルに関する実証研究により、前方KL偏差正規化は応答長を減少させる一方、逆KL偏差は生の利得率を著しく向上させることが明らかとなった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:24:43 GMT)
The multimode conditional quantum Entropy Power Inequality and the squashed entanglement of the multimode extreme bosonic Gaussian channels [53.3] 不等式はボゾン量子モードの最も一般的な線形混合の出力の最小条件フォン・ノイマンエントロピーを決定する。
ボソニック量子系は、量子状態における電磁放射の数学的モデルを構成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:48:46 GMT)
Identify, Isolate, and Purge: Mitigating Hallucinations in LVLMs via Self-Evolving Distillation [52.5] 幻覚の問題は 信頼性と応用可能性を大幅に制限します
既存の緩和方法は、外部ツールやマルチラウンド推論の比較に依存している。
我々は, LVLMの内部知識における幻覚を識別し, 分離し, 浄化するtextbfSElf-textbfDistillation (textbfSEED)を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:56:19 GMT)
Multimodal Latent Diffusion Model for Complex Sewing Pattern Generation [52.1] テキストプロンプト,体形,着物スケッチによって制御される縫製パターンを生成するマルチモーダル生成モデルであるSwingLDMを提案する。
潜伏空間における縫製パターンの分布を学習するために,2段階のトレーニング戦略を設計する。
総合的定性的および定量的実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:14:46 GMT)
QR-LoRA: Efficient and Disentangled Fine-tuning via QR Decomposition for Customized Generation [52.0] ビジュアル属性を効果的に分離する構造化パラメータ更新にQR分解を利用する新しい微調整フレームワークであるQR-LoRAを提案する。
我々の重要な洞察は、Q行列は自然に異なる視覚的特徴間の干渉を最小化し、上部三角R行列は属性固有の変換を効率的にエンコードするということである。
QR-LoRAは、コンテンツスタイルの融合タスクにおいて、より優れたアンタングル化を実現し、生成モデルにおけるパラメータ効率、非アンタングル化ファインタニングのための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 01:31:01 GMT)
Robust Molecular Property Prediction via Densifying Scarce Labeled Data [51.6] 薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では,未ラベルデータを利用したメタラーニングに基づく新しい手法を提案する。
実世界のデータセットに挑戦する上で、大きなパフォーマンス向上を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:07:45 GMT)
Do We Really Need Specialization? Evaluating Generalist Text Embeddings for Zero-Shot Recommendation and Search [51.3] 汎用テキスト埋め込みモデル(GTE)は大規模コーパス上で事前訓練される。
GTEは特別な適応なしに強力なゼロショット性能を保証できることを示す。
また、最も情報性の高い方向に着目して埋め込み寸法を圧縮することで、ノイズを効果的に低減できることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:41:52 GMT)
Interpretable Mnemonic Generation for Kanji Learning via Expectation-Maximization [51.3] 本稿では,共通ルールの集合によって駆動されるメニーモニックな構築過程を明示的にモデル化する生成フレームワークを提案する。
提案手法は潜在構造と構成規則を学習し,解釈可能な,系統的な調波生成を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:49:23 GMT)
LLM Hypnosis: Exploiting User Feedback for Unauthorized Knowledge Injection to All Users [50.2] ユーザフィードバックで訓練された言語モデルにおける脆弱性について説明する。
単一ユーザは、LMの知識と振る舞いを永続的に変更することができる。
この攻撃は、モデルがこれまで持っていなかった事実的知識を挿入するのに有効であることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:24:32 GMT)
Building Open-Retrieval Conversational Question Answering Systems by Generating Synthetic Data and Decontextualizing User Questions [49.4] 本稿では,アノテーション付きリアルなOR-CONVQAダイアログを自動生成するパイプラインを提案する。
我々は,対話型質問応答対,自己完結型(Decontextualized,例:参照表現なし)バージョンのユーザ質問と提案を生成する。
検索された情報と非文化された質問は、システムの応答を生成するLCMに渡される。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:16:44 GMT)
Music Boomerang: Reusing Diffusion Models for Data Augmentation and Audio Manipulation [49.1] 音楽オーディオの生成モデルは、典型的にはテキストプロンプトやメロディのみに基づいて出力を生成するために使用される。
画像領域に対して最近提案されたブーメランサンプリングでは,任意の事前学習拡散モデルを用いて,既存の例に近い出力を生成することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:46:07 GMT)
Put Teacher in Student's Shoes: Cross-Distillation for Ultra-compact Model Compression Framework [48.7] We introduced Edge Ultra-lIte BERT framework with a novel cross-distillation method。
我々は,自然言語理解(NLU)タスクにおいて,たった1.91MBの非常にコンパクトなBERTモデルを実現する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:38:09 GMT)
XiYan-SQL: A Novel Multi-Generator Framework For Text-to-SQL [48.5] 本稿では,複数の候補を効果的に生成・活用する革新的なフレームワークであるXiYan-を提案する。
XiYan-はBIRDベンチマークで75.63%の新しいSOTA性能を達成した。
また、スパイダーテストセットのSOTA性能も89.65%の精度で達成した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:50:46 GMT)
ArtifactsBench: Bridging the Visual-Interactive Gap in LLM Code Generation Evaluation [48.2] ArtifactsBenchは自動ビジュアルコード生成評価のためのフレームワークである。
我々のフレームワークは、生成した各アーティファクトをレンダリングし、時間的スクリーンショットを通してその動的な振る舞いをキャプチャする。
我々は1,825の多様なタスクの新しいベンチマークを構築し、30以上の主要な大規模言語モデルを評価する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:53:00 GMT)
Towards Solving More Challenging IMO Problems via Decoupled Reasoning and Proving [48.2] 最近の研究では、非公式な精度は80%を超え、公式な成功はPutnamBenchのようなベンチマークで8%以下である。
低レベルの証明生成から高レベルの推論を分離する新しいフレームワークを提案する。
提案手法は,2000年以降のIMO問題に対して,従来のオープンソース証明者が未報告の課題として評価した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:38:49 GMT)
Navigating Sparse Molecular Data with Stein Diffusion Guidance [48.2] 最適制御(SOC)は、微調整拡散モデルのための原則的フレームワークとして登場した。
予測されたクリーンなサンプルに対して,既成の分類器を用いて拡散モデルを導出する,トレーニング不要な手法のクラスが開発されている。
本稿では,サロゲート最適制御目標に基づく新しいトレーニングフリーガイダンスフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:14:27 GMT)
OpenS2S: Advancing Open-Source End-to-End Empathetic Large Speech Language Model [47.8] 我々は,共感型音声対話を実現するために設計された,完全にオープンソースで透明でエンドツーエンドのLSLMであるOpenS2Sを提案する。
我々の共感型音声テキストモデルBLSP-Emoに基づいて、OpenS2Sは低レイテンシ音声生成を実現するためにストリーミングインターリーブデコードアーキテクチャを用いる。
大規模言語モデルを利用して共感的コンテンツを生成し,テキスト音声システムを制御することにより,多言語多言語多様度を有するスケーラブルな学習コーパスを構築する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:31:37 GMT)
Fairness Evolution in Continual Learning for Medical Imaging [47.5] 本研究では、ドメイン固有の公平度指標を用いてタスク間でバイアスがどのように進化し、異なるCL戦略がこの進化にどのように影響するかを検討する。
以上の結果から,擬似ラベルと擬似ラベルの学習は最適分類性能を実現するが,擬似ラベルの偏りは小さいことが示唆された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:41:32 GMT)
LVM4CSI: Enabling Direct Application of Pre-Trained Large Vision Models for Wireless Channel Tasks [47.2] LVM4CSIは複雑なチャネル状態情報をコンピュータビジョン(CV)モデルと互換性のある視覚形式にマッピングするフレームワークである。
タスク特化ニューラルネットワーク(NN)に匹敵する、あるいは優れたパフォーマンスを実現する。
トレーニング可能なパラメータの数を大幅に削減し、タスク固有のNN設計の必要性を排除します。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:33:55 GMT)
SciMaster: Towards General-Purpose Scientific AI Agents, Part I. X-Master as Foundation: Can We Lead on Humanity's Last Exam? [47.2] 本稿では,人間研究者をエミュレートするツール強化推論エージェントであるX-Masterを紹介する。
XマスターズはHumanity's Last Examに32.1%のスコアで最新記録を樹立した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:50:52 GMT)
Learn 3D VQA Better with Active Selection and Reannotation [46.7] 3D VQAでは、回答の自由な形式の性質は、データセット全体をトレーニングする際にモデルを混乱させたり誤解させたりする不適切なアノテーションにつながることが多い。
本稿では,モデルのセマンティックな不確実性に基づいてデータを選択する多ターン対話型能動学習戦略を提案する。
実験ではモデルの性能が向上し、トレーニングコストが大幅に削減され、比較的高い精度を達成するためのトレーニングコストが半減する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:18:54 GMT)
VerifyLLM: LLM-Based Pre-Execution Task Plan Verification for Robots [45.0] 本研究では,シミュレータや実環境で実行する前に,タスクプランを自動的に検証するアーキテクチャを提案する。
このモジュールは、Large Language Modelsの推論機能を使用して、論理的一貫性を評価し、計画の潜在的なギャップを特定する。
我々は,タスク計画の信頼性と効率の向上に寄与し,自律システムにおける堅牢な事前実行検証の必要性に対処する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:31:36 GMT)
Engineering giant transmon molecules as mediators of conditional two-photon gates [45.0] 我々は、非局所結合トランスモン「分子」の配列を用いて、導波路光子の受動光制御ゲートを設計する方法を示す。
我々の研究は、マイクロ波フォトニック量子コンピューティングデバイスの重要な要素として、巨大原子の使用を開放する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:03:59 GMT)
Foreground-aware Virtual Staining for Accurate 3D Cell Morphological Profiling [44.7] スポットライト(Spotlight)は、モデルが関連する細胞構造に焦点を合わせるための仮想染色手法である。
Spotlightはピクセルレベルの精度を維持しながら形態表現を改善し、セグメント化やプロファイリングといった下流タスクに適した仮想染色を実現する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:11:56 GMT)
Quantifying Robustness: A Benchmarking Framework for Deep Learning Forecasting in Cyber-Physical Systems [44.6] 我々は,産業用CPSに合わせて,分散ロバスト性に基づく実用的ロバスト性定義を導入する。
本フレームワークは,センサドリフト,ノイズ,不規則サンプリングなどの現実的な乱れをシミュレートし,予測モデルの徹底的なロバスト性解析を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:25:29 GMT)
Fine-Grained Captioning of Long Videos through Scene Graph Consolidation [44.3] グラフ統合に基づく長大なビデオキャプションのための新しいフレームワークを提案する。
提案手法はまず,個々のフレームや短いビデオ間隔に対応するセグメントレベルのキャプションを生成する。
軽量なグラフからテキストへのデコーダが最後にビデオレベルのキャプションを生成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:25:02 GMT)
Robustifying 3D Perception through Least-Squares Multi-Agent Graphs Object Tracking [43.1] 本稿では,3次元LiDARシーンにおける対向雑音に対する新たな緩和フレームワークを提案する。
我々は最小二乗グラフツールを用いて各検出の遠心点の位置誤差を低減する。
実世界のV2V4Realデータセットに関する広範な評価研究は、提案手法がシングルエージェントとマルチエージェントの両方のトラッキングフレームワークよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:41:08 GMT)
Narrowing the Gap: Supervised Fine-Tuning of Open-Source LLMs as a Viable Alternative to Proprietary Models for Pedagogical Tools [42.8] この研究は、Supervised Fine-Tuning (SFT)を通じて強化された、より小型で専門化された言語モデルが、教育ツールのより実用的な代替手段であることを示す。
そこで本研究では,CS1/2(Real Introductory Programming)とCS1/2(Real Introductory Programming)を併用した,4万個のCコンパイラのエラー説明データセットを構築した。
以上の結果から,SFTは小型モデルの教育的品質を著しく向上させ,より大きなモデルに匹敵する性能を実現している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:03:49 GMT)
Enabling Security on the Edge: A CHERI Compartmentalized Network Stack [42.8] CHERIは、きめ細かい区画化とメモリ保護を可能にすることにより、ハードウェアレベルでの強力なセキュリティを提供する。
ケーススタディでは,Arm Morelloプラットフォーム上にデプロイされたCheriBSDシステム上での分離アプリケーション,TCP/IPライブラリ,ネットワークドライバのトレードオフについて検討した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:37:59 GMT)
HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models [42.6] テキストのプロンプトによって駆動される現実的な3次元物体間相互作用(HOI)を創出する問題に対処する。
まず、入力テキストに条件付けされた人間と物体の両方の動きを生成するための二重分岐拡散モデル(HOI-DM)を開発する。
また,人間と物体の接触領域を予測するためのアベイランス予測拡散モデル(APDM)を開発した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:09:32 GMT)
Looking elsewhere: improving variational Monte Carlo gradients by importance sampling [41.9] ニューラルネットワーク量子状態(NQS)は、量子多体波動関数を表現するために強力で表現力のあるアンサッツを提供する。
量子化学で現れる急激なピーク波動関数のようないくつかのシナリオは、変動最適化の有効性を阻害する高分散勾配推定器をもたらすことが知られている。
本研究では、適応的に調整された重要度サンプリングを用いて、これらのサンプリング問題に取り組むための体系的戦略について検討する。
提案手法により,バニラVMCの計算コストを,高ピークの量子化学波動関数をターゲットとした場合,最大100倍に削減できる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:00:03 GMT)
Can Prompt Difficulty be Online Predicted for Accelerating RL Finetuning of Reasoning Models? [41.7] 本研究では任意のプロンプトの反復的近似評価について検討する。
Model Predictive Prompt Selection (MoPPS)はベイズにおけるリスク予測フレームワークである。
MoPPSは迅速な困難を確実に予測し、ロールアウトを大幅に削減したトレーニングを加速する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:20:52 GMT)
SMART: Simulated Students Aligned with Item Response Theory for Question Difficulty Prediction [41.3] 本稿では、シミュレーションされた学生を指導力で整列させる新しい方法SMART(Simulated Students Aligned with IRT)を提案する。
SMARTは、その改善された能力アライメントを活用することで、他の項目の難易度予測手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:41:38 GMT)
Spin-dependent routing of optical beams in the bulk of twisted anisotropic media [39.6] 不均一な異方性材料内で伝播する光ビームに対する新しい種類のフォトニックスピンホール効果(PSHE)について論じる。
回転角は有効ゲージ場の役割を担っている。
ねじれ分布が奇対称であるとき、光学ビームはそのヘリシティに応じてミラー対称軌道に沿って移動する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:29:08 GMT)
SPATIA: Multimodal Model for Prediction and Generation of Spatial Cell Phenotypes [39.5] 本研究では,空間転写学のマルチスケール生成予測モデルであるSPATIAを紹介する。
SPATIAは、画像由来のモルフォロジートークンと転写ベクタートークンを融合させることで、細胞レベルの埋め込みを学習する。
われわれはSPATIAを12のタスクにまたがる13の既存モデルに対してベンチマークする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:54:02 GMT)
Harnessing Pairwise Ranking Prompting Through Sample-Efficient Ranking Distillation [37.7] Pairwise Ranking Prompting (PRP) with Large Language Models (LLMs) は、最も効果的なゼロショット文書ランキング手法の一つである。
本稿では,PRPの対蒸留による有効性を活用することを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:38:43 GMT)
Active Stereo in the Wild through Virtual Pattern Projection [37.5] 本稿では、信頼できない物理パターンプロジェクタを深度センサに置き換えることで、アクティブステレオの原理を模倣する新しい汎用ステレオパラダイムを提案する。
これは、従来のステレオカメラが取得した左右の画像にシーン形状と整合した仮想パターンを投影し、奥行きセンサーから得られたスパースヒントを用いて機能する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:07:56 GMT)
The Role of Deductive and Inductive Reasoning in Large Language Models [35.4] 本稿では,大規模言語モデル(LLM)推論を強化するために,DID法を提案する。
DIDはリトルストーン次元と情報エントロピーを組み合わせた2次元複雑度評価システムを実装している。
その結果,推理精度と解の精度は有意に向上した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:41:53 GMT)
Bayesian Optimization for Controlled Image Editing via LLMs [34.6] BayesGenieは、大規模言語モデルとベイズ最適化を統合する、既定のアプローチである。
本手法により,手動の領域マークを使わずに,自然言語による画像の修正が可能となる。
筆者らのフレームワークは,編集精度と意味保存の両面で,既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:39:40 GMT)
Why We Feel What We Feel: Joint Detection of Emotions and Their Opinion Triggers in E-commerce [34.3] 本稿では,感情検出とオピニオントリガー抽出を統合化するタスクを提案する。
EOT-Xは、微妙な感情と意見のトリガーを持つ2,400のレビューの人間による注釈付きコレクションである。
本稿では,体系的推論と自己回帰を備えた構造化プロンプトフレームワークであるEOT-DETECTを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:59:37 GMT)
LLMs as Architects and Critics for Multi-Source Opinion Summarization [34.3] M-OS(Multi-source Opinion Summarization)は、従来の意見要約を超えて拡張される。
マルチソースの意見要約を評価するためのベンチマークデータセットであるM-OS-EVALを紹介する。
我々の実験は、事実に富んだ要約によってユーザーのエンゲージメントが向上することを示した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:27:44 GMT)
PointGAC: Geometric-Aware Codebook for Masked Point Cloud Modeling [33.7] 仮面クラウドモデリング(MPM)手法は、マスクされた領域の詳細を学習するためにモデルを過剰に制約する傾向がある。
マスク領域の特徴分布の整合化を目的とした,クラスタリングに基づく新しいMPM手法である textbftextitPointGAC を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:21:28 GMT)
SimLab: A Platform for Simulation-based Evaluation of Conversational Information Access Systems [33.5] 我々は,対話型システムとユーザシミュレータの両方を,制御および再現可能な環境でベンチマークする,最初のクラウドベースのプラットフォームであるSimLabを紹介した。
我々は,SimLabの初期バージョンの設計と実装について紹介し,その特徴を対話型映画レコメンデーションの初期評価タスクで示す。
本論文は,対話型情報アクセスとユーザシミュレーションの分野における進歩を促進するために,コミュニティがプラットフォームにコントリビュートするよう呼びかけるものである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:19:28 GMT)
DANCE: Resource-Efficient Neural Architecture Search with Data-Aware and Continuous Adaptation [33.1] DANCE(Dynamic Architectures with Neural Continuous Evolution)を提案する。
DANCEでは、スムーズな適応を可能にする継続的アーキテクチャ分布、効率的なサンプリングのための学習された選択ゲートを備えた統一アーキテクチャ空間、効率的なデプロイメント最適化のためのマルチステージトレーニング戦略の3つの重要なイノベーションを紹介している。
提案手法は,検索コストを大幅に削減しつつ,精度面で最先端のNAS手法より一貫して優れている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:22:55 GMT)
PLACE: Prompt Learning for Attributed Community Search [33.0] PLACE(Prompt Learning for Attributed Community Search)は、ACSのための革新的なグラフプロンプト学習フレームワークである。
Placeは、構造的かつ学習可能なプロンプトトークンをクエリ依存の洗練メカニズムとしてグラフに統合し、プロンプト拡張グラフを形成する。
9つの実世界のグラフの実験において、PLACEは平均的な最先端のグラフに比べて22%高いF1スコアを達成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:48:09 GMT)
Domain-Adaptive Diagnosis of Lewy Body Disease with Transferability Aware Transformer [31.5] LBD診断における大きな障害は、深層学習の有効性を制限するデータ不足である。
本稿では,アルツハイマー病(AD)からの知識を応用し,LBDの診断を促進するトランスファービリティ・アウェア・トランスフォーマー(TAT)を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:28:39 GMT)
CueLearner: Bootstrapping and local policy adaptation from relative feedback [31.0] 相対的なフィードバックは、ユーザビリティと情報豊かさのバランスを提供します。
これまでの研究では、ポリシー探索手法の強化に相対的なフィードバックが利用できることが示されている。
相対的なフィードバックから学習する新しい手法を導入し,それを非政治的強化学習と組み合わせる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:54:28 GMT)
EmbodieDreamer: Advancing Real2Sim2Real Transfer for Policy Training via Embodied World Modeling [30.7] EmbodieDreamerは、Real2Sim2Realのギャップを物理と外観の両方の観点から減らす新しいフレームワークである。
具体的には、Real2Sim物理ギャップを低減するために設計された微分可能な物理モジュールであるPhysAlignerを提案する。
さらに、条件付きビデオ拡散モデルを用いて、Sim2Realの外観ギャップを埋めるVisAlignerを導入する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:58:17 GMT)
SPIDER: Structure-Preferential Implicit Deep Network for Biplanar X-ray Reconstruction [30.4] SPIDERは、バイプレーンX線画像からCTボリュームを再構成するための教師付きフレームワークである。
解剖学的制約を再構築プロセスに組み込み、構造的連続性を高め、軟質の人工物を減らす。
提案手法は,ダウンストリームセグメンテーションタスクにおける強力な可能性を示し,パーソナライズされた治療計画と画像誘導型手術ナビゲーションにおけるその有用性を裏付けるものである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:06:28 GMT)
Deep Research Comparator: A Platform For Fine-grained Human Annotations of Deep Research Agents [30.4] 本稿では,ディープリサーチエージェントを評価するための総合的なフレームワークを提供するDeep Research Comparatorを紹介する。
ユーザクエリが与えられた場合、プラットフォームは2つの異なるエージェントからの最終的なレポートと、生成中の中間ステップを表示する。
アノテーションは、サイドバイサイド比較に基づいて最終レポートの全体的な品質を評価することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:35:09 GMT)
Deep Learning Framework Testing via Model Mutation: How Far Are We? [30.3] 既存の突然変異に基づく検査手法の欠陥検出機能を再検討する。
わずか23モデルで39のユニークな欠陥を特定しました。そのうち31は開発者によって確認され、8つは修正されました。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:10:52 GMT)
LOOM-Scope: a comprehensive and efficient LOng-cOntext Model evaluation framework [29.5] LOOM-Scopeは長期コンテキスト評価のための包括的で効率的なフレームワークである。
LOOM-Scopeは様々なベンチマークで評価設定を標準化する。
効率的な長文推論促進手法の展開をサポートする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:33:24 GMT)
Learning Robust Stereo Matching in the Wild with Selective Mixture-of-Experts [29.5] SMoEStereoは,Low-Rank Adaptation (LoRA) とMixture-of-Experts (MoE) モジュールの融合により,VFMをステレオマッチングに適用する新しいフレームワークである。
提案手法は,データセット固有の適応を伴わない複数のベンチマークに対して,最先端のクロスドメインと共同一般化を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:19:04 GMT)
FedPall: Prototype-based Adversarial and Collaborative Learning for Federated Learning with Feature Drift [29.2] フェデレートラーニング(FL)は、複数のパーティからのデータを備えた集中型サーバにおいて、グローバルモデルの協調的なトレーニングを可能にする。
本稿では,FedPallを提案する。FedPallは,プロトタイプベースの対数学習を利用して特徴空間を統一し,協調学習によって特徴空間内のクラス情報を強化するためのフレームワークである。
3つの代表的な特徴ドリフトデータセットの評価結果は、FLシナリオにおける特徴ドリフトデータを用いた分類において、FedPallの一貫して優れた性能を示している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:58:39 GMT)
S$^2$Edit: Text-Guided Image Editing with Precise Semantic and Spatial Control [29.0] S$2$Editはテキストから画像への拡散モデルであり、正確な意味論と空間制御によるパーソナライズされた編集を可能にする。
S$2$Editは、学習した意味的に乱れ、空間的に焦点を絞ったアイデンティティトークンを用いて、元のアイデンティティを忠実に保存しながら、ローカライズされた編集を行うことを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:14:08 GMT)
Robust Incomplete-Modality Alignment for Ophthalmic Disease Grading and Diagnosis via Labeled Optimal Transport [29.0] 眼底画像と光コヒーレンス断層撮影(OCT)を併用したマルチモーダル眼底画像診断を行った。
既存の一般的なパイプライン、例えばモダリティ計算や蒸留法は、顕著な制限に直面している。
本稿では,眼科診断の課題において欠落したモダリティを頑健に扱える新しい多モードアライメントと融合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:36:39 GMT)
Advancing Financial Engineering with Foundation Models: Progress, Applications, and Challenges [28.8] ファイナンシャル・ファンデーション・モデル(英: Financial Foundation Models、FFM)は、金融のために明示的に設計された新しいモデルのクラスである。
本調査では,FFMの包括的概要と,3つの主要な指標にまたがる分類について概説する。
アーキテクチャ、トレーニング方法論、データセット、および現実世界のアプリケーションについてレビューする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:06:38 GMT)
Position: Machine Learning Conferences Should Establish a "Refutations and Critiques" Track [28.8] 機械学習のカンファレンスは、専用の"Refutations and Critiques"(R&C)トラックを確立するべきだ、と私たちは主張する。
このR&Cトラックは、先行研究に挑戦する重要な研究を支援するために、注目に値するプラットフォームを提供する。
MLのカンファレンスは、ML研究の自己修正を支援する公式で信頼性の高いメカニズムを作成するべきだ、と私たちは結論付けています。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:00:46 GMT)
Optical pumping simulations and optical Rabi frequency measurements in $^{151}\mathrm{Eu}^{3+}\!:\mathrm{Y}_2\mathrm{SiO}_5$ under magnetic field [28.6] 本研究では,磁場印加による151mathrmEu3+!:mathrmYmathrmSiO_5$について検討する。
単一周波数のイオンを分離できる光ポンピング方式の効果を計算するための簡単な数値シミュレータを提案する。
我々は、36の可能な光-超微細遷移のうち21の遷移の光学ラビ周波数を測定し、6x6分岐比行列の構築を可能にした。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:51:04 GMT)
RoboMonkey: Scaling Test-Time Sampling and Verification for Vision-Language-Action Models [28.4] 我々は、Vision-Language-Action(VLA)モデルのテスト時間スケーリングフレームワークであるRoboMonkeyを紹介した。
RoboMonkeyは、VLAから小さなアクションの集合をサンプリングし、ガウス摂動と過半数投票を適用してアクション提案分布を構築し、次に視覚言語モデル(VLM)ベースの検証器を使用して最適なアクションを選択する。
既存のVLAとRoboMonkeyのペアリングは大きなパフォーマンス向上をもたらし、アウト・オブ・ディストリビューションタスクでは25%、イン・ディストリビューションタスクでは9%の絶対的な改善を実現している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:08:10 GMT)
MEIT: Multimodal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [28.4] 心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:41:48 GMT)
Decoding Safety Feedback from Diverse Raters: A Data-driven Lens on Responsiveness to Severity [27.9] 本稿では,複数のデータセットの粒度評価を解釈するための新しいデータ駆動型手法を提案する。
安全違反の度合いの異なるレベルを評価する際に,レーダの整合性を定量化する非パラメトリック応答性指標を蒸留する。
提案手法は,異なる階層群をまたいだニュアンスな視点を捉えることで,レーダの選択やフィードバックの解釈に役立てることができることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:28:24 GMT)
From Fragments to Facts: A Curriculum-Driven DPO Approach for Generating Hindi News Veracity Explanations [27.2] 急激な誤報の時代には、特にヒンディー語のような表現不足の言語では、信頼できるニュース説明を生成することが不可欠である。
本稿では,DPO(Direct Preference Optimization)とカリキュラム学習を統合した新しいフレームワークを提案する。
LLM (Mistral, Llama, Gemma) と PLM (mBART, mT5) による実験は、コヒーレントで文脈的に関係のある説明を生成する上で、フレームワークの有効性を確認している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:34:28 GMT)
Towards Cost-Effective Reward Guided Text Generation [27.1] Reward-guided Text Generation (RGTG) は、人間のフィードバックからオフラインで強化学習を行うための代替手段として登場した。
本稿では、Bradley-Terry損失を用いてトレーニングされた新たな報酬モデルアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:26:24 GMT)
Escaping Plato's Cave: JAM for Aligning Independently Trained Vision and Language Models [27.1] 単一モードモデルの潜在表現に対して、モダリティ固有のオートエンコーダを訓練するフレームワークを導入する。
類推により、このフレームワークはプラトンの洞窟から逃れる方法として機能し、結合しない入力から共有構造の出現を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:37:17 GMT)
Going Beyond Heuristics by Imposing Policy Improvement as a Constraint [27.1] Heuristic Enhanced Policy Optimizationは、強化学習における報酬ハッキングを活用するためのプラグアンドプレイ方式である。
HEPOは報酬ハッキングを効果的に活用し、報酬ハッキングを緩和するための先行手法の落とし穴を回避していることを示す。
さらに驚くべきことに、HEPOは、報酬が熟練していない人間によって適切に設計され、設計されていなくても、ポリシーの最適化が優れたパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:52:53 GMT)
Judging the Judges: Can Large Vision-Language Models Fairly Evaluate Chart Comprehension and Reasoning? [26.9] 13個のオープンソースのLVLMを多彩なチャート理解および推論タスクの判断として評価した。
我々は、事実の正しさ、情報性、関連性といった基準を網羅した、ペアワイズかつポイントワイズな評価タスクを設計する。
我々は、研究開発と商業利用の両方に適した費用対効果のLVLMに焦点を当てる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:58:15 GMT)
UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification [26.8] マルチモーダルオブジェクトReID(UGG-ReID)に対する不確実性誘導グラフモデルというロバストなアプローチを提案する。
UGG-ReIDは、ノイズ干渉を緩和し、効果的なマルチモーダル融合を促進するように設計されている。
実験結果から,提案手法は全データセットに対して優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:41:08 GMT)
All in One: Visual-Description-Guided Unified Point Cloud Segmentation [26.5] VDG-Uni3DSegは、事前訓練された視覚言語モデルと大規模言語モデルを統合する新しいフレームワークである。
提案手法はリッチなマルチモーダルキューを取り入れ,微細なクラスとインスタンス分離を容易にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:22:00 GMT)
Estimating Interventional Distributions with Uncertain Causal Graphs through Meta-Learning [26.4] 生物学から社会科学まで、科学分野では、多くの疑問がテキスト化されます。
モデル平均因果推定変換器ニューラルプロセス(MACE-TNP)を用いたメタラーニングによるエンドツーエンドモデルの構築を提案する。
我々の研究は、複雑なベイズ因果推論を近似するフレキシブルでスケーラブルなパラダイムとしてメタラーニングを確立している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:48:32 GMT)
ModelCitizens:Representing Community Voices in Online Safety [26.3] ソーシャルメディア投稿6.8Kと多様なアイデンティティグループにまたがる40K毒性アノテーションのデータセットであるMODELCITIZENSを紹介する。
本研究は,包括的コンテンツモデレーションのためのコミュニティインフォームドアノテーションとモデリングの重要性を強調した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:15:18 GMT)
What's Making That Sound Right Now? Video-centric Audio-Visual Localization [26.2] AVLは、視覚的シーン内の音源を識別することを目的としている。
AVATARは高解像度の時間情報を含むビデオ中心のAVLベンチマークである。
TAVLOはビデオ中心のAVLモデルであり、時間情報を明示的に統合する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:12:34 GMT)
From Imitation to Innovation: The Emergence of AI Unique Artistic Styles and the Challenge of Copyright Protection [26.2] ArtBulbは、AIアート著作権判断のための解釈可能かつ定量化可能なフレームワークである。
AICDは、アーティストや法律の専門家によって注釈付けされた、AIアート著作権のための最初のベンチマークデータセットである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:45:08 GMT)
A Visual Leap in CLIP Compositionality Reasoning through Generation of Counterfactual Sets [26.2] 視覚言語モデル(VLM)は、高品質な画像テキストデータが不足しているため、しばしば構成的推論に苦しむ。
手動のアノテーションを使わずに反実データを自動的に生成するブロックベース拡散手法を提案する。
提案手法は,既存の手法に比べてトレーニングデータを大幅に少なくしながら,複数のベンチマークにまたがる最先端の結果を達成している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:47:10 GMT)
Transfer Attack for Bad and Good: Explain and Boost Adversarial Transferability across Multimodal Large Language Models [25.9] MLLM(Multimodal Large Language Models)は、相互モダリティ相互作用において例外的な性能を示すが、敵の脆弱性も抱える。
本稿では,MLLM間の対向転写可能性の顕在化を解析し,その特性に影響を及ぼす要因を同定する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:28:58 GMT)
Reason to Rote: Rethinking Memorization in Reasoning [25.8] 大規模言語モデルは、ラベルノイズなどの任意のトレーニングインスタンスを覚えやすいが、推論タスクでは顕著に機能する。
本研究では,言語モデルがラベルノイズを記憶する方法と,そのような記憶が一般化可能な推論能力に大きく影響しない理由について検討する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:59:06 GMT)
Reviving Cultural Heritage: A Novel Approach for Comprehensive Historical Document Restoration [25.4] 歴史文書は貴重な文化遺産であるが、涙、水浸食、酸化などを通じて時間の経過とともに著しく劣化している。
既存の文書復元法(モダリティ)は主に単一ないし限定的な修復に重点を置いており、実際的な要求に応えていない。
フルページHDRデータセット(FP)と新しい自動HDRソリューション(Auto)を提案する。
FPは1,633個の実画像と6,543個の合成画像と、文字レベルと行レベルの位置と、異なる損傷グレードの文字アノテーションから構成される。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:26:17 GMT)
$\textit{Grahak-Nyay:}$ Consumer Grievance Redressal through Large Language Models [25.1] Grahak-Nyayは、簡潔で最新の知識ベースを通じて、法的な複雑さを単純化する。
我々は3つの新しいデータセットを紹介する: $textitGeneralQA$ (一般消費者法)、$textitSectoralQA$ (セクタ固有の知識)、$textitSyntheticQA$ (RAG評価のため)。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:26:42 GMT)
OpenWorldSAM: Extending SAM2 for Universal Image Segmentation with Language Prompts [25.0] OpenWorldSAMは,Segment Anything Model v2 (SAM2) をオープン語彙シナリオに拡張するフレームワークである。
OpenWorldSAMは、カテゴリレベルの言語記述や文レベルの言語記述など、さまざまなプロンプトをサポートしている。
SAM2とVLMの事前学習されたコンポーネントを凍結することにより、COCO-stuffデータセット上で450万のパラメータのみをトレーニングする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:16:22 GMT)
Rule Learning for Knowledge Graph Reasoning under Agnostic Distribution Shift [24.8] 既存のKG推論法の主な制限は、I.I.D仮定に依存することである。
本研究では,未知の選択バイアスによるKGからの学習論理則について検討した。
本稿では,特徴デコリレーションとルール学習ネットワークを統合するエンドツーエンドの方法論である安定ルール学習(StableRule)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:27:48 GMT)
4DSloMo: 4D Reconstruction for High Speed Scene with Asynchronous Capture [24.7] 本稿では,低FPSカメラのみを用いた高速4D撮影システムを提案する。
カメラをグループ化してベースフレームレートを25FPSとすることで,高速度カメラを必要としない100-200FPSのフレームレートを実現する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:18:35 GMT)
DynamicFace: High-Quality and Consistent Face Swapping for Image and Video using Composable 3D Facial Priors [24.7] 顔交換は、ターゲット顔の表情、ポーズ、髪、背景などの属性を保持しながら、ソース顔のアイデンティティをターゲット顔に転送する。
拡散モデルとプラグイン・アンド・プレイアダプティブ・アダプティブ・アテンション・レイヤのパワーを活用して画像と映像のスワップを実現するDynamicFaceを提案する。
私たちのフレームワークは、画像ドメインとビデオドメインの両方にシームレスに対応します。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:31:41 GMT)
Distribution-dependent Generalization Bounds for Tuning Linear Regression Across Tasks [24.2] L1係数とL2係数をチューニングする際の検証損失に対する一般化誤差の分布依存境界を求める。
我々はその結果をリッジ回帰の一般化にまで拡張し、そこでは基底真理分布の平均を考慮に入れたより厳密な境界を達成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:08:45 GMT)
Features are fate: a theory of transfer learning in high-dimensional regression [23.8] 対象タスクが事前学習されたモデルの特徴空間で適切に表現されている場合、転送学習はスクラッチからトレーニングに優れることを示す。
本モデルでは, 音源と目標タスクの重なり合う特徴空間が十分に強い場合, 線形転送と微調整の両方で性能が向上することを確認した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:57:29 GMT)
A Deep Unfolding Framework for Diffractive Snapshot Spectral Imaging [23.8] 本稿では,DDU (diffractive Deep Unfolding) と呼ばれる,拡散システムのための効率的な深部展開フレームワークを提案する。
本研究では,DSSIにおけるデータ忠実度項の解析解を導出し,反復的再構成プロセスにおける効率と有効性の両方を保証した。
我々のフレームワークは、既存の最先端(SOTA)モデルと強い互換性を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:49:49 GMT)
BS-LDM: Effective Bone Suppression in High-Resolution Chest X-Ray Images with Conditional Latent Diffusion Models [23.8] 肺疾患は、Chest X-Ray(CXR)が重要な診断ツールであると共に、重要な世界的な健康上の課題である。
肺病変の検出は、しばしばCXR画像の重なり合う骨構造によって妨げられ、潜在的な誤診につながる。
我々は,高解像度CXR画像の骨を効果的に抑制するために,BS-LDMと呼ばれるエンドツーエンドのフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 01:27:34 GMT)
Disappearing Ink: Obfuscation Breaks N-gram Code Watermarks in Theory and Practice [23.8] 人間が書いたコードからAI生成コードを識別することは、著者の帰属、コンテンツ追跡、誤用検出に不可欠である。
N-gramベースの透かしは、世代中に検出される秘密の透かしを注入する顕著な方法として出現している。
ほとんどのクレームは、攻撃のシミュレーションとして単純なコード変換やコードの最適化に対する防御にのみ依存しています。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:18:19 GMT)
Uncertainty in Real-Time Semantic Segmentation on Embedded Systems [23.5] 自動運転車や人間のコンピュータインタラクションなどの分野におけるセマンティックセグメンテーションモデルの適用には、リアルタイムの予測機能が必要である。
リアルタイムアプリケーションに対処する上での課題は、リソース制約のあるハードウェアを操作する必要性によって増幅される。
本稿では,事前学習モデルからの深い特徴抽出とベイズ回帰とモーメント伝搬を組み合わせることで,不確実性を考慮した予測を行う。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:32:39 GMT)
MAIN: Mutual Alignment Is Necessary for instruction tuning [23.4] 命令応答対の品質は,各コンポーネントの個々の品質ではなく,相互整合度によって決定される。
本稿では,相互制約による命令と応答のコヒーレンスを強制する相互アライメントフレームワーク(MAIN)を提案する。
MAINはモデルアーキテクチャやサイズを多用し、LLaMA、Mistral、Qwenモデルで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:19:42 GMT)
Text Detoxification: Data Efficiency, Semantic Preservation and Model Generalization [23.3] ソーシャルメディア上の有害コンテンツの普及は、オンライン環境や公衆の会話に深刻な脅威をもたらす。
既存のアプローチは、強力なデトキシフィケーション性能、セマンティック保存、およびアウト・オブ・ディストリビューションデータを実現するのに苦労することが多い。
本稿では,データ効率,セマンティック保存,モデル一般化を協調的に最適化する2段階トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:48:05 GMT)
Method of Equal Shares with Bounded Overspending [23.2] 境界超過(BOS等分)による等分法の導入
BOS Equal Sharesは、厳密な比例公理によって示唆される非効率性に対処するが、このルールは、元の等式共有の方法と同様の公平性を保証する。
分析の過程では、プロジェクトの部分的な資金提供を可能にする「等分法」の分数変種も提示し、検討する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:32:20 GMT)
Beyond One Shot, Beyond One Perspective: Cross-View and Long-Horizon Distillation for Better LiDAR Representations [23.2] LiMAは、LiDAR表現学習を強化するために、より長い時間的相関をキャプチャする新しいフレームワークである。
LiMAは事前トレーニングの効率が高く、下流タスク中に計算オーバーヘッドを発生させることはない。
主流のLiDARベースの知覚ベンチマークの実験により、LiMAはLiDARセマンティックセグメンテーションと3Dオブジェクト検出の両方を大幅に改善することが示された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:59:58 GMT)
Fine-Grained Vision-Language Modeling for Multimodal Training Assistants in Augmented Reality [22.7] 視覚言語モデル(VLM)は、マルチモーダル環境におけるAIによるスマートアシスタントの解釈と推論を可能にするために不可欠である。
私たちの研究は、特に視覚障害者や視覚障害者がAIによる学習機会を平等に利用できるようにするための幅広い社会的意味を持っている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:29:01 GMT)
Can Video LLMs Refuse to Answer? Alignment for Answerability in Video Large Language Models [22.0] ビデオ大言語モデル(Video-LLM)は、主にビデオコンテンツから直接生成された質問に基づいて訓練される。
現実世界のシナリオでは、ユーザーはしばしば、ビデオの情報範囲を超えて広がる質問をする。
本稿では,ビデオLLMと,その映像に基づいて質問の関連性を評価するためのフレームワークである応答可能性のアライメントを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:19:43 GMT)
ABench-Physics: Benchmarking Physical Reasoning in LLMs via High-Difficulty and Dynamic Physics Problems [21.3] 大規模言語モデル(LLM)は、数学やプログラミングのような領域で顕著なパフォーマンスを示している。
物理学は、正確な計算だけでなく、深い概念的理解と物理モデリングスキルも要求する固有の課題を提起する。
既存のベンチマークは、制限された難易度、複数選択フォーマット、静的評価設定のために、しばしば不足する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:43:56 GMT)
RainShift: A Benchmark for Precipitation Downscaling Across Geographies [21.2] 地理的分布シフト下でのダウンスケーリングを評価するためのデータセットとベンチマークであるRainShiftを紹介した。
我々は、グローバル・ノースとグローバル・サウスの間のデータギャップをまたいだ一般化において、GANや拡散モデルを含む最先端のダウンスケーリング手法を評価した。
我々の研究は、ダウンスケーリング手法のグローバルな適用性を高め、高解像度の気候情報へのアクセスにおける不平等を減らすための一歩である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:25:14 GMT)
MindFlow: Revolutionizing E-commerce Customer Support with Multimodal LLM Agents [21.1] 我々は,eコマースに適したオープンソースのマルチモーダルLLMエージェントであるMindFlowを紹介する。
メモリ、意思決定、アクションモジュールを統合し、視覚的テキスト推論に"MLLM-as-Tool"戦略を採用する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:53:55 GMT)
TeethGenerator: A two-stage framework for paired pre- and post-orthodontic 3D dental data generation [21.1] TeethGeneratorは、歯列前と歯列後を合わせた3D歯のモデルを合成するために設計された新しいフレームワークである。
本データセットは, 実際の矯正データの分布と密接に一致し, 実際のトレーニング用データと組み合わせることで, 歯列アライメント性能を著しく向上させる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:08:10 GMT)
RAM-W600: A Multi-Task Wrist Dataset and Benchmark for Rheumatoid Arthritis [20.8] 手首は関節リウマチ(RA)の診断における重要な領域である
このデータセットは、4つの医療センターの患者227人の手首の従来のX線写真621枚からなる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:53:22 GMT)
A Text is Worth Several Tokens: Text Embedding from LLMs Secretly Aligns Well with The Key Tokens [20.4] テキストを大きな言語モデルベースの埋め込み器に入力すると、得られたテキストの埋め込みは入力テキストのキートークンと一致させることができる。
この現象は普遍的であり,モデルアーキテクチャ,トレーニング戦略,埋め込み手法の影響を受けないことを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:58:42 GMT)
MatDecompSDF: High-Fidelity 3D Shape and PBR Material Decomposition from Multi-View Images [20.2] MatDecompSDFは、高忠実度3D形状を復元し、その物理的特性を多視点画像から分解するフレームワークである。
本手法は,標準のグラフィックスパイプラインにシームレスに統合可能な,編集可能で再生可能なアセットを生成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:22:32 GMT)
Train-before-Test Harmonizes Language Model Rankings [19.4] 既存の言語モデルベンチマークは、類似のスキルを捉えることを目的としたベンチマークであっても、矛盾するモデルランキングを提供する。
最近の作業は、試験作業におけるトレーニングの現象によるランキングの不一致によるものである。
それぞれのモデルに、評価の前に同じベンチマーク固有の微調整を与える。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:54:18 GMT)
Federated Learning for Big Data: A Survey on Opportunities, Applications, and Future Directions [19.0] フェデレートラーニング(FL)は、機械学習のサブフィールドとして現れる。
本稿では、ビッグデータ取得、ストレージ、ビッグデータ分析、さらなるプライバシー保護におけるFLの可能性についてレビューする。
スマートシティ、スマートヘルスケア、スマートトランスポート、スマートグリッド、ソーシャルメディアなど、ビッグデータアプリケーションにおけるFLの可能性についても検討している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:45:16 GMT)
Decision Feedback In-Context Learning for Wireless Symbol Detection [17.3] 送信信号対と受信信号対の形式でパイロットデータからなるトランスフォーマーベースの無線受信機は、パイロットデータが豊富な場合に高い検出精度を示す。
本稿では、チャネル推定を回避し、限られたパイロットデータを用いて直接シンボル検出を行う新しい無線受信機設計として、決定フィードバックIN-ContExt Detection (DEFINED)を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:56:44 GMT)
Language Models can Self-Improve at State-Value Estimation for Better Search [16.9] 本稿では、状態遷移ダイナミクスを利用して値モデルを改善する自己学習型ルック(STL)を提案する。
STLで学習した専門値モデルは計算量的に軽量な探索アルゴリズムで展開でき、より高価な木探索手法に匹敵する性能を実現することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:20:17 GMT)
Distributionally Robust Active Learning for Gaussian Process Regression [16.9] 本稿では,GPRの最悪の予測誤差を効果的に低減する2つのAL手法を提案する。
最短ケースの予測二乗誤差の上限が上界であることを示し、この誤差は穏やかな条件下で有限個のデータラベルによって任意に小さくなることを示唆する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:24:47 GMT)
Balancing Efficiency and Expressiveness: Subgraph GNNs with Walk-Based Centrality [16.9] サブグラフGNNは,グラフニューラルネットワーク(GNN)の限界を克服し,サブグラフの袋を処理する,有望なアーキテクチャとして登場した。
サブグラフGNNは、ノード数で線形にサイズが大きくなるバッグを処理し、より大きなグラフの適用性を妨げている。
本稿では,サブグラフGNNの計算コストを劇的に低減する,効果的で実装が容易な手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:34:36 GMT)
Dequantized particle algorithm for the nonlinear Vlasov-Poisson system [16.7] 本稿では,Vlasov--Poisson (VP) システムの復号化アルゴリズムを提案する。
シュル「オーディンガー-ポアソン」(SP)方程式の構造保存離散化(英語版)(Structure-reserving discretization)を行うことを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:01:37 GMT)
wd1: Weighted Policy Optimization for Reasoning in Diffusion Language Models [15.6] dLLMs確率関数の抽出可能性には、各ポリシー最適化ステップにおける現在の、古い、参照ポリシーの確率を近似する必要がある。
我々は、目的を重み付けされた可能性として再構成する、新しいポリシー最適化アプローチである$mathttwd1$を導入する。
広く使われている推論ベンチマークの実験では、$mathttwd1$は教師付き微調整(SFT)や教師付きデータなしで、dLLMの既存のRLメソッドよりも優れていた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:27:25 GMT)
Simultaneous Determination of Local Magnetic Fields and Sensor Orientation with Nitrogen-Vacancy Centers in Nanodiamond [15.6] ナノダイヤモンド中の窒素空孔(NV)センターは、生体医用イメージングアプリケーションのための有望な量子センシングプラットフォームとして登場した。
本研究では,各粒子の結晶軸と周辺ベクトル磁場を同時に決定する新しい手法を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:00:14 GMT)
PVChat: Personalized Video Chat with One-Shot Learning [15.1] PVChatは単発の学習フレームワークで、被験者ごとに単一のビデオから回答できる。
提案手法は、合成強化ビデオQAデータセット上で、Mixture-of-Heads(MoH)拡張ViLLMを最適化する。
医療シナリオ,テレビシリーズ,アニメ,実世界の映像を対象とした多様なデータセットを用いてPVChatを評価した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:12:02 GMT)
Evaluating the Critical Risks of Amazon's Nova Premier under the Frontier Model Safety Framework [15.1] Nova PremierはAmazonで最も有能なマルチモーダルファンデーションモデルである。
テキスト、画像、動画を100万件のコンテキストウィンドウで処理する。
我々は,ノバス・プレミアの臨界リスクプロファイルの総合評価を行った。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:33:35 GMT)
Mask Approximation Net: A Novel Diffusion Model Approach for Remote Sensing Change Captioning [15.0] リモートセンシング画像変化記述は、リモートセンシング処理の領域における革新的なマルチモーダルタスクを表す。
本稿では,周波数領域雑音フィルタリングにより強化された拡散モデルを用いたデータ分散学習へ移行するパラダイムを提案する。
本稿では,リモートセンシングによる変化検出と記述のための提案手法の有効性を検証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:42:52 GMT)
DisMS-TS: Eliminating Redundant Multi-Scale Features for Time Series Classification [14.9] 時系列分類のための新しいエンドツーエンドのDistangled Multi-Scaleフレームワーク(DisMS-TS)を提案する。
DisMS-TSは、マルチスケール時系列における冗長な共有機能を排除し、予測性能を向上させるように設計されている。
複数のデータセットで実施された実験は、DisMS-TSの競争基準よりも優れており、精度は9.71%まで向上した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 01:35:55 GMT)
Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs [13.3] 適応型フレーム選択とマルチテンポラリスケーリングのための新しいアプローチであるビデオQFrameを紹介する。
Q-Frameは、CLIPのようなテキスト画像マッチングネットワークによって生成されたトレーニング不要のプラグイン・アンド・プレイ戦略を採用している。
ベンチマークデータセットの広範な実験を通じて,Q-Frameの有効性を実証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:52:11 GMT)
SeaLion: Semantic Part-Aware Latent Point Diffusion Models for 3D Generation [13.3] 細かなセグメンテーションラベルを持つ点雲を生成するために設計された新しい拡散モデルSeaLionを提案する。
P-CD(Part-Aware Chamfer distance)と呼ばれる新しい点雲対距離計算法も導入する。
大規模合成データセットShapeNetと実世界の医療データセットIntrAの実験は、SeaLionが世代品質と多様性において顕著なパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:54:21 GMT)
Breach in the Shield: Unveiling the Vulnerabilities of Large Language Models [13.2] 大規模言語モデル(LLMs)と視覚言語モデル(VLMs)は、幅広いタスクで素晴らしいパフォーマンスを実現しています。
本研究では,このような摂動の影響を受けやすいパラメータや入力次元を同定することにより,この脆弱性の原因を特定することを目的とする。
我々は、情報幾何学に根ざし、個々のパラメータと入力次元の感度を定量化する、textbfFI, textbf First order local textbfInfluence という安定性尺度を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:11:47 GMT)
Theoretical Learning Performance of Graph Neural Networks: The Impact of Jumping Connections and Layer-wise Sparsification [13.2] ジャンプ接続により、Graph Convolutional Networks (GCN) はオーバースムーシングを克服できる。
グラフスペーシフィケーションは、近傍の集約中にグラフ隣接行列のサブ行列を選択することで、計算要求を減らす。
本稿では,グラフスペーシフィケーションを用いた跳躍接続を用いたGCNの学習力学と一般化解析について述べる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:10:53 GMT)
Inside you are many wolves: Using cognitive models to interpret value trade-offs in LLMs [13.1] 我々は,LLMが人間のようなトレードオフを表現する程度を,丁寧な発話の認知モデルを用いて解釈する。
本研究は, 理論的推論モデルにおいて, ソーシャルユーティリティよりも高い情報ユーティリティのパターンと, 数学的推論においてより強力なオープンソースモデルを示すものである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:34:34 GMT)
Classification of autoimmune diseases from Peripheral blood TCR repertoires by multimodal multi-instance learning [12.9] EAMilはTCRシークエンシングデータを利用して全身性エリテマトーデス(SLE)と慢性関節リウマチ(RA)の診断を行う多インスタンスディープラーニングフレームワークである
SLEは98.95%,RAは97.76%であった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:24:41 GMT)
QuEst: Enhancing Estimates of Quantile-Based Distributional Measures Using Model Predictions [12.9] 提案するQuEstは、観測データとインプットデータをマージしてポイント推定を行う、原則化されたフレームワークである。
QuEstは、尾のリスク(CVaR)から、クォータイルのような人口セグメントまで、経済学、社会学、教育、医学などの分野の中心となる様々な手段をカバーしている。
我々は、QuEstを多次元メトリクスに拡張し、これや他のハイブリッド推定器の分散をさらに低減するための追加の最適化手法を導入する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:33:18 GMT)
Dicke-Ising quantum battery of an ion chain driven by a mechanical oscillator [12.8] 量子電池を実現可能かつ制御可能なプラットフォームに実装する手法を提案する。
二次イオン間のホッピング相互作用とイオンと外部機械振動子との結合相互作用が電池の充電過程に及ぼす影響について検討した。
我々の理論的分析は、実用的な量子電池の開発に確固たる基盤を提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:12:55 GMT)
Engineering a Multi-Mode Purcell Filter for Superconducting-Qubit Reset and Readout with Intrinsic Purcell Protection [12.8] 超伝導量子回路におけるマルチモードパーセルフィルタを用いて、量子ビットリセットと読み出しに対するモード効率のアプローチを示す。
これはマイクロ波共振器の異なる順序モードを利用して異なる量子ビット演算を行う最初の実験である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:46:29 GMT)
A Survey of Pun Generation: Datasets, Evaluations and Methodologies [12.6] パン世代は、ユーモアや二重の意味を誘発するために、文章の中で言語要素を創造的に修正しようと試みている。
また、コヒーレンスとコンテキスト的適切性を維持することを目的としており、様々なメディアやコンテキストにわたるクリエイティブな執筆やエンターテイメントに有用である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:12:46 GMT)
Performance guarantees of light-cone variational quantum algorithms for the maximum cut problem [12.1] 変分量子アルゴリズム(VQA)は、古典的計算よりも短期的な量子コンピューティングの利点を実証することを約束している。
本稿では,標準VQAの最適ゲート列を選択することで,光円錐VQAを提案する。
1ラウンドの光円錐VQAはMaxCut問題に対して0.7926の近似比が得られることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:09:13 GMT)
Retain or Reframe? A Computational Framework for the Analysis of Framing in News Articles and Reader Comments [12.0] 我々は、ソースコンテンツ(ニュース記事)とオーディエンス応答(読者コメント)にわたるフレーミングの大規模解析のための、最初の計算フレームワークを提示する。
フレームワークを11のトピックと2つのニュースソースに適用すると、コメントのフレーム再利用はアウトレット間で非常に相関し、トピック固有のパターンは様々である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:05:56 GMT)
AuroraLong: Bringing RNNs Back to Efficient Open-Ended Video Understanding [12.0] 本稿では,任意の長さの入力シーケンスを一定サイズの隠れ状態で処理する線形RNN言語モデルを提案する。
我々は、線形RNNベースのLLMバックボーンをLLaVAライクなモデルでオープンエンドビデオ理解に初めて使用しました。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:05:19 GMT)
Distilling High Diagnostic Value Patches for Whole Slide Image Classification Using Attention Mechanism [11.9] MIL(Multiple Instance Learning)はWSI(Whole Slide Image)分類の分野で広く注目を集めている。
バッグレベルのMILメソッドの欠点は、より冗長なパッチの導入であり、干渉につながる。
我々は,高い診断値のパッチを抽出するAFD-MIL (Feature Respiration Multi-Instance Learning) アプローチを開発した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:42:11 GMT)
NativQA Framework: Enabling LLMs with Native, Local, and Everyday Knowledge [11.4] 本研究では,大規模,文化的,地域的に整合したQAデータセットをネイティブ言語でシームレスに構築できるNativQAフレームワークを提案する。
このフレームワークは24か国と7か国で39か所で評価され、300万以上の質問応答対が得られた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:43:16 GMT)
Optimal Model Selection for Conformalized Robust Optimization [11.3] 不確実性のある意思決定において、コンテキストロバスト最適化は、予測セットに対する最悪の決定損失を最小限にして信頼性を提供する。
本稿では,決定リスクの最小化とロバスト性制御を統一するCROのための新しいモデル選択フレームワークを提案する。
数値解析の結果、様々な合成および実世界のアプリケーションにおいて、決定効率とロバスト性に大きな改善が見られた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:14:42 GMT)
Spatial-Temporal Conditional Random Field for Human Trajectory Prediction [11.3] 軌道予測はコンピュータビジョンにおいて重要である。
本研究では,textbfS-Tjectory CRF: textbfSpatial-textbfTemporal textbfConditional textbfRandom textbfFieldを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:24:07 GMT)
Universal Bound States in Long-range Spin Chains with an Impurity [11.2] 我々は、不純物を媒介する2つのマグノン相互作用が共鳴しているときに、普遍的な3つのマグノン状態の異なるクラスが現れることを示した。
この結果は将来的に量子シミュレーションプラットフォームで実験的に検証される可能性がある。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:31:45 GMT)
Random Walks with Tweedie: A Unified View of Score-Based Diffusion Models [11.2] 拡散モデルは、現実的な合成信号を生成する強力なツールとして登場した。
本論文では,数個の教科書結果にのみ依存する,有意なスコアベース拡散モデルに対する簡潔な導出について述べる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:20:26 GMT)
Layered, Overlapping, and Inconsistent: A Large-Scale Analysis of the Multiple Privacy Policies and Controls of U.S. Banks [11.1] 銀行は現在、複雑なデータ共有プラクティスを含むウェブサイト、モバイルアプリ、その他のサービスを運営している。
我々は米国最大の銀行2,067行のプライバシーポリシーを収集し、そのうち45.3%が複数のポリシーを提供していた。
このポリシーの多重性と、それが引き起こす不整合は、消費者の混乱を招き、それらを必要とする法律の透明性の目標を損なう可能性がある。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:55:48 GMT)
CVFusion: Cross-View Fusion of 4D Radar and Camera for 3D Object Detection [11.1] 本稿では,CVFusionと呼ばれる2段階間核融合ネットワークを提案する。
第1段階では、高リコール3D提案ボックスを生成するために、レーダ誘導反復(RGIter)BEV融合モジュールを設計する。
第2段階では、各提案のポイント、イメージ、BEVを含む複数の異種ビューから特徴を集約する。
提案手法は,ビュー・オブ・デルフト(VoD)とTJ4DRadSetでそれぞれ9.10%,3.68%のmAP改善を達成し,従来の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:45:53 GMT)
ChangeBridge: Spatiotemporal Image Generation with Multimodal Controls for Remote Sensing [11.1] ChangeBridgeはリモートセンシングのためのマルチモーダル制御を備えた生成モデルである。
イベントやイベント駆動のバックグラウンドのバリエーションを含む、所定の条件に沿った、高忠実な将来のシナリオをシミュレートすることができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:51:55 GMT)
SurgiSR4K: A High-Resolution Endoscopic Video Dataset for Robotic-Assisted Minimally Invasive Procedures [11.0] SurgiSR4Kは、ネイティブ4K解像度で撮影された、初めて公開された外科画像とビデオデータセットである。
このデータセットは、高解像度データから恩恵を受ける可能性のある幅広いコンピュータビジョンタスクの可能性を開く。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:09:20 GMT)
When Chain of Thought is Necessary, Language Models Struggle to Evade Monitors [10.7] CoT(Chain-of- Thought)モニタリングは、AIの安全性を擁護するものだ。
この「不信」に関する最近の研究は、その信頼性に疑問を呈している。
重要な特性は忠実さではなく監視性である、と我々は主張する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:54:52 GMT)
FrameShift: Learning to Resize Fuzzer Inputs Without Breaking Them [10.7] カバー誘導ファズナーは、強力な自動バグフィニングツールである。
プログラムのインプットをミュートし、カバレッジを観察し、将来の突然変異のために未探索のパスに到達したインプットを保存します。
本稿では,関係フィールドの検出と利用により,突然変異時の入力構造を保全する,新しい軽量な手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:07:23 GMT)
A Tale of Two Scripts: Transliteration and Post-Correction for Judeo-Arabic [10.7] ユダヤ・アラビア語はヘブライ語で書かれており、ユダヤ人の作家やユダヤ人の聴衆のために書かれている。
アラビア語をアラビア語の文字に自動翻訳する2段階のアプローチを導入する。
アラビアのNLPツールがモルフォシンタクティックタグ付けや機械翻訳を行うことができることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:19:08 GMT)
GlaGAN: A Generative Unsupervised Model for High-Precision Segmentation of Retinal Main Vessels toward Early Detection of Glaucoma [10.6] 網膜血管の構造変化は緑内障発症と進行にとって重要なバイオマーカーである。
本稿では,OCTA画像の主血管分割のための教師なし生成AIモデルであるGlaGANを紹介する。
また,鮮明な毛細管構造を有する2D/3D緑内障網膜データセットであるGAS-RetVeinも紹介した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:21:37 GMT)
NavigScene: Bridging Local Perception and Global Navigation for Beyond-Visual-Range Autonomous Driving [10.6] NavigSceneは、自律運転システム内の人間のような運転環境をシミュレートする補助的なナビゲーション誘導自然言語データセットである。
NavigSceneを活用するための3つのパラダイムを開発する。(1)ナビゲーションコンテキストをプロンプトアプローチに組み込むことで視覚言語モデルを強化するナビゲーション誘導推論、(2)視覚言語モデル応答を改善するための直接参照最適化を拡張する強化学習手法であるナビゲーション誘導推論、(3)ナビゲーション誘導視覚言語モデルと特徴融合による従来の運転モデルを統合するナビゲーション誘導言語推論モデルである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:37:01 GMT)
OASBuilder: Generating OpenAPI Specifications from Online API Documentation with Large Language Models [10.5] OASBuilderは、長く多様なAPIドキュメントページを一貫性のあるマシン可読性のAPI仕様に変換するフレームワークである。
OASBuilderはエンタープライズ環境でうまく実装されており、何千時間もの手作業が省かれています。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:36:13 GMT)
BiMa: Towards Biases Mitigation for Text-Video Retrieval via Scene Element Guidance [10.3] BiMaは、視覚的およびテキスト的表現のバイアスを軽減するために設計された新しいフレームワークである。
視覚障害者には、これらのシーン要素をビデオ埋め込みに統合し、きめ細かな細部と細部を強調できるようにします。
テキストの偏りを解消するために,テキスト特徴をコンテンツやバイアス成分に分解する機構を導入し,意味のあるコンテンツに集中できるようにする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:47:46 GMT)
Red Teaming AI Red Teaming [9.9] 我々は、レッド・チームリングの元々の意図と、生成的AIの文脈におけるモデルレベルの欠陥の発見に焦点を合わせることには、大きなギャップがあることを論じる。
マクロレベルのシステム・レッド・チームとマイクロレベルのモデル・レッド・チームという2つのレベルで、AIシステムにおけるレッド・チーム化を運用する包括的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:23:40 GMT)
Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation [9.9] 我々は、textbfMultimodal textbfStepwise textbfDecomposition Chain of Thought (MSD-CoT) を介して textbfRegion-constrained textbfDual-stream textbfVisual textbfPrompting (RDVP) を相乗化する新しいトレーニングフリーなテスト時間適応フレームワークを提案する。
RDVPは、前景と背景点の視覚的プロンプトを視覚的および独立的にサンプリングする空間的制約を注入し、意味的相違を効果的に緩和する
論文参考訳(メタデータ) (Mon, 07 Jul 2025 01:59:53 GMT)
From Vision To Language through Graph of Events in Space and Time: An Explainable Self-supervised Approach [9.8] 自然言語でビデオコンテンツを記述するタスクは、一般にビデオキャプションと呼ばれる。
通常のビデオキャプションと異なり、短くて広く公開されているが、自然言語による長文の説明は少ない。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:33:19 GMT)
Pseudo-likelihood produces associative memories able to generalize, even for asymmetric couplings [9.7] 広く使われている回避策は、グローバル正規化をトラクタブルな局所正規化に置き換える擬似的様相を最大化することである。
ゼロ温度制限下では、擬似的類似度を最大化するために訓練されたネットワークが自然に連想メモリを実装していることを示す。
この結果から,擬似的な動作は効率的な推論ツールであり,メモリや一般化の原理的なメカニズムであることが明らかとなった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:57:44 GMT)
Supporting Software Formal Verification with Large Language Models: An Experimental Study [9.7] SpecVerifyは、大規模な言語モデルと正式な検証ツールを統合している。
このフレームワークは、Claude 3.5 SonnetとESBMC検証器を組み合わせて自動化ワークフローを形成する。
ロッキード・マーティンの9つのサイバー物理システムで評価されたSpecVerifyは、NASAのCoCoSimに匹敵する46.5%の精度を達成している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:30:05 GMT)
Colorectal Cancer Tumor Grade Segmentation in Digital Histopathology Images: From Giga to Mini Challenge [9.5] 大腸癌(CRC)は、世界で3番目に診断されたがんであり、がん関連死亡の原因としては2番目に多い。
ICIP Grand Challenge on Colorectal Cancer tumor Grading を組織した。
データセットは、5つの組織クラスに対して、専門家のピクセルレベルのアノテーションを備えた103枚の全スライド画像で構成されている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:59:16 GMT)
A Generalised and Adaptable Reinforcement Learning Stopping Method [9.3] 本稿では、強化学習(RL)に基づく技術支援レビュー(TAR)停止手法を提案する。
以前のアプローチでは、リコールやコストの最大化のために、ターゲットリコールとトレードオフの修正など、動作の停止を限定的に制御していた。
これらの制限は、単一のモデルを複数のターゲットリコールに適用できる新しいRL環境であるGRLStopを導入することで克服される。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:14:00 GMT)
A Novel Automatic Real-time Motion Tracking Method in MRI-guided Radiotherapy Using Enhanced Tracking-Learning-Detection Framework with Automatic Segmentation [9.3] MRI誘導放射線療法(MRIgRT)における正確な運動追跡は効果的な治療デリバリーに不可欠である。
本研究は,MRIgRTにおける運動追跡精度をリアルタイムマーカーレス自動追跡法により向上することを目的とした。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:03:30 GMT)
ViGiL3D: A Linguistically Diverse Dataset for 3D Visual Grounding [9.3] 3Dビジュアルグラウンドティングは、自然言語テキストによって参照される3Dシーンでエンティティをローカライズする。
多様な言語パターンに対して視覚的接地手法を評価するための診断データセットである3D (ViGiL3D) の視覚的接地について紹介する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:17:31 GMT)
Toward Valid Measurement Of (Un)fairness For Generative AI: A Proposal For Systematization Through The Lens Of Fair Equality of Chances [9.2] ジェネレーティブAI(GenAI)システムの社会的損害と影響の相違は、効果的な不公平性測定アプローチに対する重要なニーズを浮き彫りにする。
本稿では,GenAIの不公平度評価のための新たな枠組みを提案する。
我々の枠組みは不公平を3つの中核的な構成要素に分解する: システムの結果から生じる害と利益、害と利益の分配に不平等をもたらすべきでない道徳的任意の要因、そして、異なる治療を適切に受けられるサブセットを区別する道徳的決定的要因である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:49:58 GMT)
Spooky Action at a Distance: Normalization Layers Enable Side-Channel Spatial Communication [8.9] 畳み込み型アーキテクチャを用いておもちゃの局所化タスクについて検討し、正規化層が反復的なメッセージパッシング処理を可能にすることを示す。
この結果から,拡散に基づく軌道生成などの応用において,正規化層は注意を要することが示唆された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:00:02 GMT)
Transformers Can Solve Non-Linear and Non-Markovian Filtering Problems in Continuous Time For Conditionally Gaussian Signals [8.9] テキストフィルタフォーマと呼ばれる連続時間変換モデルのクラスは、広範に非マルコフ的および条件付きガウス的信号プロセスの条件法則を概ね実装できることを示す。
我々の近似は、真の最適フィルタとディープラーニングモデルの間の最悪のケース2-ワッサーシュタイン距離が近似誤差を定量化するような、十分に定期的な連続時間パスのコンパクトな部分集合を均一に保持することを保証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:43:25 GMT)
Beyond Communication Overhead: A Multilevel Monte Carlo Approach for Mitigating Compression Bias in Distributed Learning [8.9] 本稿では, 統計的に偏りのない推定値を構築するために, バイアス圧縮機を利用する新しいマルチレベルモンテカルロ圧縮手法を提案する。
提案手法の汎用性を示すため,Top-$k$やビットワイド圧縮機などの一般的な圧縮機に適用する。
我々は、その性能をさらに向上させるために、我々のアプローチの適応バージョンを導出する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:06:04 GMT)
SEPSIS: I Can Catch Your Lies -- A New Paradigm for Deception Detection [8.8] 本研究は, 心理学のレンズを通して, 騙しの問題を探究するものである。
そこで本研究では,NLP技術を利用した偽造検出のための新しいフレームワークを提案する。
我々は、微調整言語モデルのデータレスマージを利用した、新しいマルチタスク学習パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:24:36 GMT)
Understanding Everything as Code: A Taxonomy and Conceptual Model [8.8] コード・アズ・コード(EaC)は、現代のソフトウェアシステムのあらゆる側面を体系化することを目的とした新しいパラダイムです。
人気が高まっているにもかかわらず、包括的産業標準と査読された研究の範囲を明確にし、採用を導くことは少ないままである。
本研究は、EaCの既存の知識と知覚を体系的に分析し、その範囲と境界を明らかにし、研究者や実践者に対して構造化されたガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:21:02 GMT)
Zero-shot Medical Event Prediction Using a Generative Pre-trained Transformer on Electronic Health Records [8.6] 生成事前学習型トランス (GPT) は, EHRにおける時系列データを利用して, 将来の事象を予測できる。
これらのモデルの微調整はタスク固有のパフォーマンスを高めるが、多くの臨床予測タスクに適用するとコストがかかる。
事前訓練された基礎モデルはゼロショット予測設定で使用することができ、結果ごとに微調整された個別モデルに代わるスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:33:54 GMT)
QMoE: A Quantum Mixture of Experts Framework for Scalable Quantum Neural Networks [8.5] 量子機械学習(QML)は、ノイズの多い中間スケール量子(NISQ)時代に有望な方向として登場した。
本稿では、エキスパート(MoE)パラダイムの混合をQML設定に統合する新しい量子アーキテクチャである、エキスパート(QMoE)の量子混合を提案する。
私たちの研究は、スケーラブルで解釈可能な量子学習フレームワークの道を開いたものです。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:49:07 GMT)
CTA: Cross-Task Alignment for Better Test Time Training [8.5] テストタイムトレーニング(TTT)は、モデルロバスト性を高める効果的な方法として登場した。
CTA(Cross-Task Alignment)は,TTTを改善するための新しいアプローチである。
いくつかのベンチマークデータセット上で、最先端技術よりもロバスト性や一般化が大幅に向上したことを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:33:20 GMT)
Intervening to learn and compose disentangled representations [8.5] 本稿では,非絡み付き潜在構造を同時に学習する任意表現型生成モデルの学習手法を提案する。
これは、任意の複雑な既存のデコーダブロックのヘッドに単純なデコーダのみのモジュールを追加することで実現される。
因果的グラフィカルモデルへの介入の概念に触発されて、我々のモジュールはトレーニング中にアーキテクチャを選択的に修正し、異なるコンテキストでコンパクトなジョイントモデルを学ぶことができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:30:27 GMT)
In-Context Learning as an Effective Estimator of Functional Correctness of LLM-Generated Code [8.4] コード品質評価のためのテキスト内学習(ICL)手法を提案する。
トレーニングセットから,機能的正当性のサンプルを少数提供することにより,既存のQPPアプローチの性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:01:17 GMT)
LoomNet: Enhancing Multi-View Image Generation via Latent Space Weaving [8.0] LoomNetは複数回同じ拡散モデルを適用してコヒーレントな画像を生成する新しい多視点拡散アーキテクチャである。
実験では、LoomNetは画像の品質と再現のメトリクスの両方において最先端の手法より優れています。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:46:50 GMT)
Matrix Majorization in Large Samples with Varying Support Restrictions [8.0] 大規模試料および触媒系におけるマトリックスの偏化について検討した。
量子熱力学における触媒状態変換理論の応用を見いだす。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:53:22 GMT)
A dimensionality reduction technique based on the Gromov-Wasserstein distance [7.9] 本稿では, 最適輸送理論とGromov-Wasserstein距離に基づく次元減少法を提案する。
提案手法は,高次元データを低次元空間に埋め込み,複雑な高次元データセットを解析するための堅牢で効率的な解を提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:54:25 GMT)
Fast-VGAN: Lightweight Voice Conversion with Explicit Control of F0 and Duration Parameters [7.9] ピッチ、持続時間、発話速度などの音声特性の制御は、音声変換の分野において重要な課題である。
本稿では、基本周波数(F0)、音素配列、強度、話者識別を改良する手段を提供することを目的とした畳み込みニューラルネットワークに基づくアプローチを提案する。
提案手法は,高い可知性と話者類似性を維持しつつ,高い柔軟性を提供することを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:36:00 GMT)
The Generalization Ridge: Information Flow in Natural Language Generation [7.8] 最終層で減少する一般化リッジを形成する上層層において,予測情報がいかにピークに達するかを示す。
これらの知見は, 変圧器の内部機構に関する新たな知見を与え, 一般化を支える中間層の重要性を裏付けるものである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:18:51 GMT)
InfoSteer: Steering Information Utility in Language Model Post-Training [7.8] 本稿では,学習後の言語モデル(LM)におけるパラメトリック情報の利用を促す軽量な手法を提案する。
この単純なガイダンスは、Qwen、Gemma、Llamaなど、さまざまなモデルファミリで一貫したパフォーマンス改善を提供します。
我々の研究は、バニラポストトレーニングが事前学習の可能性を十分に活用していないこと、そして潜在表現空間におけるLMの操舵は、有望なアプローチであることを示している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:13:21 GMT)
The Super Weight in Large Language Models [7.6] 単一のパラメータでしか実行できないことは、LLMがテキストを生成する能力を損なう可能性がある。
超重みと呼ばれるパラメータを識別するためのデータフリー手法を提案する。
重み量子化では、スーパーウェイトを保存し、他のウェイトアウトレーヤを切断することで、ラウンド・ツー・アネレスト量子化は以前考えられていたよりもはるかに大きなブロックサイズにスケールできる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:42:19 GMT)
$\varphi$-Adapt: A Physics-Informed Adaptation Learning Approach to 2D Quantum Material Discovery [7.6] 量子フレークのキャラクタリゼーションは量子ハードウェア工学における重要なステップである。
2次元の量子フレークを識別するコンピュータビジョン法が登場したが、それでもフレークの厚さを推定する上で大きな課題に直面している。
これらの障害を克服する物理インフォームド・アダプティブ・ラーニング・アプローチを最初に導入する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:40:35 GMT)
Predicting Drivers' Route Trajectories in Last-Mile Delivery Using A Pair-wise Attention-based Pointer Neural Network [7.6] 最終マイルの配達では、道路や縁石のインフラについて暗黙の知識があるため、ドライバーは計画されたルートから逸脱する。
人間のドライバーが従うような実際の停止シーケンスを予測することは、ラストマイル配送におけるルート計画を改善するのに役立つ。
本稿では、ドライバーの過去の配送軌跡データを用いて、この予測タスクのためのペアワイズアテンションに基づくポインターニューラルネットワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 01:25:46 GMT)
Piggyback Camera: Easy-to-Deploy Visual Surveillance by Mobile Sensing on Commercial Robot Vacuums [7.6] Piggyback Cameraは、商用のロボット掃除機を使った視覚監視システムである。
弊社のアプローチでは、カメラと慣性測定ユニット(IMU)を内蔵したスマートフォンをロボットに搭載し、ハードウェアを改造せずに商用ロボットに適用する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:52:45 GMT)
A Tensor Network based Decision Diagram for Representation of Quantum Circuits [7.6] 本稿では、テンソルネットワークの原理的かつ便利な応用のために、TDDと呼ばれる決定図式データ構造を提案する。
回路分割を利用することにより、量子回路のTDDを効率的に計算することができる。
TDDは量子回路に関連する様々な設計自動化タスクにおいて重要な役割を果たすことが期待されている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:19:25 GMT)
Information Needs and Practices Supported by ChatGPT [7.5] 本研究では,ChatGPTの利用者がChatGPTに訪れる情報ニーズと,ChatGPTがサポートする情報実践について検討する。
以上の結果から,ChatGPTは生活領域や人的ニーズの幅広い領域で使用されていることが示唆された。
AI時代においては、情報の必要性は、理解と行動の両方を含む概念として、世界に巧みに対処するものとして概念化されるべきである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:21:20 GMT)
UrbanMind: Towards Urban General Intelligence via Tool-Enhanced Retrieval-Augmented Generation and Multilevel Optimization [7.5] アーバン・ジェネラル・インテリジェンス(UGI)とは、ダイナミックで複雑な都市環境の中で自律的に知覚、理性、行動を行うAIシステムの能力を指す。
本稿では,UrbanMindについて紹介する。UrbanMindは,UGIを促進するためのツール強化検索拡張生成(RAG)フレームワークである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:57:34 GMT)
Large Language Models for Network Intrusion Detection Systems: Foundations, Implementations, and Future Directions [7.5] 大規模言語モデル (LLM) は、人間のようなテキストを理解し、処理し、生成する能力で様々な分野に革命をもたらした。
本稿では,ネットワーク侵入検知システム(NIDS)の進展におけるLCMの可能性について検討し,現状の課題,方法論,今後の可能性について考察する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:28:07 GMT)
Synergistic Localization and Sensing in MIMO-OFDM Systems via Mixed-Integer Bilevel Learning [7.5] 高性能なローカライゼーションとセンシングシステムは、ネットワーク効率と新たなインテリジェントアプリケーションに不可欠である。
チャネル状態情報(CSI)とディープラーニングを統合することが,近年,有望なソリューションとして浮上している。
この研究は、その潜在的なシナジーを活用するために、局所化タスクとセンシングタスクを共同でモデル化し、最適化することを目的としている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:34:22 GMT)
Stop treating `AGI' as the north-star goal of AI research [7.3] 我々は、人工知能(AGI)の話題に焦点をあてることが、効果的な目標を選択する能力を損なうと論じている。
AGIの談話によって増大する6つの重要なトラップ、すなわち生産目標設定の障害を特定します。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:58:03 GMT)
Towards Practical Alzheimer's Disease Diagnosis: A Lightweight and Interpretable Spiking Neural Model [7.3] アルツハイマー病 (AD) の早期診断は, 主観的評価やマルチモーダル画像モダリティの高コストにより, 極めて困難である。
脳にインスパイアされたパラダイムとして、スパイキングニューラルネットワーク(SNN)は本質的にADにおける神経変性のスパースでイベント駆動パターンをモデル化するのに適している。
我々は、生物にインスパイアされたLIFニューロンと、領域適応的畳み込みとマルチスケールのスパイク注意を統合するハイブリッドニューラルネットワークであるFasterSNNを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:47:01 GMT)
On Araki-Type Trace Inequalities [6.7] トレース不等式 $textTr[f(A) As Bs ] leq textTr[g(A) (A1/2 B A1/2 )s ]$ を証明します。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:51:50 GMT)
Driving as a Diagnostic Tool: Scenario-based Cognitive Assessment in Older Drivers From Driving Video [6.7] 本研究の目的は、アルツハイマー病(AD)と軽度認知障害(MCI)の機能低下と臨床特徴に相関する「デジタル指紋」を抽出することである。
本研究では,大規模視覚モデルとナチュラル・ドライビング・ビデオを用いてドライバの動作を分析し,認知状態の分類と疾患進行の予測を行うフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:30:00 GMT)
PRIME: Large Language Model Personalization with Cognitive Memory and Thought Processes [6.6] 大規模言語モデル(LLM)のパーソナライゼーションは、モデルのアウトプットを個人の独特な好みや意見と整合させることを目的としている。
本稿では,エピソードおよびセマンティックメモリ機構を用いた統一フレームワークPRIMEを提案する。
実験はPRIMEの有効性を長文と短文の両方のシナリオで検証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 01:54:34 GMT)
Word stress in self-supervised speech models: A cross-linguistic comparison [6.6] 自己教師型音声モデル(S3M)で学習した単語のストレス表現について検討する。
5つの異なる言語に対する単語ストレスのS3M表現について検討する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:10:26 GMT)
LTMSformer: A Local Trend-Aware Attention and Motion State Encoding Transformer for Multi-Agent Trajectory Prediction [6.5] 軌道予測のための時間空間相互作用特徴を抽出する軽量なフレームワークLTMSformerを提案する。
また、アクセラレーション、ジャーク、誘導などの高次動作状態属性を組み込むモーションステートも構築しています。
実験の結果,HVT-64法はベースラインよりも優れ,minADE法は約4.35%,minFDE法8.74%,MR法20%の低下を示した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:33:14 GMT)
SenseCF: LLM-Prompted Counterfactuals for Intervention and Sensor Data Augmentation [6.5] 対実的説明(CF)は、結果を変えるために必要な最小限の変更を強調することによって、機械学習の予測に対する人間中心の洞察を提供する。
本研究では,大規模言語モデル,特にGPT-4o-miniについて,ゼロショットおよび3ショット設定でCFを生成する方法について検討する。
ストレス予測のためのAI-Readiフラッグシップデータセットと、心臓病検出のためのパブリックデータセットの2つのデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:45:40 GMT)
Empowering Healthcare Practitioners with Language Models: Structuring Speech Transcripts in Two Real-World Clinical Applications [6.4] 2つの高インパクトNLPタスクは、データの不足と感度のために未探索のままである。
これらの現実の臨床的タスクに対する実践的な解決策は、医療提供者に対するドキュメントの負担を大幅に減らすことができる。
我々は,看護師観察と医療秩序抽出のための最初のオープンソースデータセットであるSynURとSIMORDをリリースする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:29:29 GMT)
When Does Pruning Benefit Vision Representations? [6.3] プルーニングは深層学習モデルの複雑さを軽減するために広く用いられているが、解釈可能性や表現学習への影響はいまだに理解されていない。
本稿では,3つの重要な次元,すなわち (i) 解釈可能性, (ii) 教師なし物体発見, (iii) 人間の知覚との整合性において,プルーニングが視覚モデルにどのように影響するかを考察する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:20:02 GMT)
Spatio-Temporal LLM: Reasoning about Environments and Actions [6.2] MLLMは、全体論的時間的理解を必要とするプロンプトに正しく答えるのに依然として苦労していることを示す。
環境の空間的理解と最近の観測の時間的理解を両立させるプロジェクタを備えたモデル「s-temporal LLM」(LLM)を開発した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:59:55 GMT)
Geometric-Guided Few-Shot Dental Landmark Detection with Human-Centric Foundation Model [6.0] GeoSapiensは,前歯のCBCTによる頑健な歯のランドマーク検出を目的とした,新規な数ショット学習フレームワークである。
その結果,GeoSapiensが既存のランドマーク検出法を超越したことが明らかとなった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:01:44 GMT)
LaCoOT: Layer Collapse through Optimal Transport [5.9] 本稿では,過度にパラメータ化された深層ニューラルネットワークの深さを削減するための最適輸送方式を提案する。
提案手法は,既存の手法に比べて高い性能/深度トレードオフを実現することを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:01:32 GMT)
EXPOTION: Facial Expression and Motion Control for Multimodal Music Generation [5.8] 本稿では,マルチモーダルな視覚制御,特に人間の表情と上半身の動きを利用した生成モデルを提案する。
我々は、事前訓練されたテキスト-音楽生成モデルにパラメータ効率細調整(PEFT)を適用した。
表情と上半身のジェスチャーを対応音楽に合わせる7時間の同期映像記録からなる新しいデータセットを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:56:20 GMT)
MCFormer: A Multi-Cost-Volume Network and Comprehensive Benchmark for Particle Image Velocimetry [5.8] Particle Image Velocimetry (PIV)は流体力学の基礎であるが、ディープラーニングアプリケーションは大きなハードルに直面している。
重要なギャップは、光学フローモデルがPIVデータに対してどのように機能するかを包括的に評価することの欠如である。
この作業は、PIV課題に適した基礎ベンチマークリソースと最先端メソッドの両方を提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:26:18 GMT)
Using Large Multimodal Models to Extract Knowledge Components for Knowledge Tracing from Multimedia Question Information [5.8] 本稿では,学習内容から知識コンポーネントを自動的に抽出する手法を提案する。
以上の結果から,自動抽出した知識コンポーネントは,ラベルを効果的に置き換えることが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:37:34 GMT)
An Investigation into Maintenance Support for Neural Networks [5.7] ニューラルネットワークの維持における研究と実践の現状について検討する。
以上の結果から,既存のツールは主にモデルの構築とトレーニングに重点を置いていることが示唆された。
我々の研究は、現在のプラクティスが不足している部分について開発者中心の視点を提供することを目的としており、ニューラルネットワークのメンテナンスサポートを改善する機会を強調している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:53:15 GMT)
Dialogue-Based Multi-Dimensional Relationship Extraction from Novels [5.7] 本研究では,新しい領域における関係抽出に着目し,Large Language Models(LLMs)に基づく手法を提案する。
関係次元分離,対話データ構築,文脈学習戦略を取り入れることで,提案手法は抽出性能を向上させる。
我々は,ラベル付き資源の欠如に対処するため,高品質な中国新奇関係抽出データセットを構築した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:20:16 GMT)
VectorLLM: Human-like Extraction of Structured Building Contours vis Multimodal LLMs [5.6] 本稿では,リモートセンシング画像からパターン抽出を行うためのMLLM(Multi-modal Large Language Model)として,VectorLLMを紹介する。
私たちのアーキテクチャは、視覚基盤、コネクター、理解能力を向上させるための強化された位置埋め込みで構成されています。
ベクターLLMは航空機、水車、石油タンクなどの見えない物体に対して強いゼロショット性能を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:10:15 GMT)
Bridging KAN and MLP: MJKAN, a Hybrid Architecture with Both Efficiency and Expressiveness [5.5] Modulation Joint Kan (MJKAN)は、これらの課題を克服するために設計された新しいニューラルネットワーク層である。
MJKANは、FILM(Feature-wise Linear Modulation)のようなメカニズムと放射基底関数の活性化を統合している。
我々は,関数回帰,画像分類(MNIST, CIFAR-10/100),自然言語処理(AG News, SMS)など,様々なベンチマークでMJKANの性能を実証的に検証した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:13:32 GMT)
ISLES'24: Final Infarct Prediction with Multimodal Imaging and Clinical Data. Where Do We Stand? [5.4] ISLES24の課題は、予防的急性期脳梗塞画像と臨床データから最終梗塞量を予測することである。
マルチモーダルnnU-Netベースのアーキテクチャであるトップパフォーマンスモデルは、98ケースの隠れテストセットに対してDiceスコア0.285を達成した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:34:46 GMT)
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models [5.3] 遅延チャンキングと呼ばれる新しい手法を導入し、長いコンテキストの埋め込みモデルを利用して、まず長いテキストのトークンを埋め込む。
結果として得られたチャンク埋め込みは、コンテキスト情報を完全にキャプチャし、様々な検索タスクにおいて優れた結果をもたらす。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:49:51 GMT)
Improving BERT for Symbolic Music Understanding Using Token Denoising and Pianoroll Prediction [5.3] 本稿では,様々なダウンストリームタスクの競合性能を実現するための,BERTライクなシンボリック音楽理解モデルを提案する。
我々はトークン補正とピアノロール予測という2つの新しい事前学習目標を設計する。
その結果,提案した事前学習目標が下流作業に有効であることが確認された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:52:06 GMT)
Multilevel Picard approximations and deep neural networks with ReLU, leaky ReLU, and softplus activation overcome the curse of dimensionality when approximating semilinear parabolic partial differential equations in $L^p$-sense [5.2] 我々は,Lmathfrakp$-senseでKolmogorov PDEの解を近似できるマルチレベルPicard近似とReLUによるディープニューラルネットワーク,リークReLU,ソフトプラスアクティベーションを証明した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:16:55 GMT)
Optimizing Entanglement and Bell Inequality Violation in Top Anti-Top Events [5.2] スピン-スピン相関を対角化する基礎は,スピン相関,絡み合い,ベル不等式違反の最大化に最適であることを示す。
LHCと将来の$e+e-$コライダーのイベントにおいて,絡み合いやベルの不等式違反に対する感受性を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:59:56 GMT)
The supersingular endomorphism ring problem given one endomorphism [5.0] 我々は、E の自己準同型環が古典的時間で計算できることを証明した。
また、楕円曲線上の滑らかなイデアルの作用が時間内に計算できることも証明する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:04:32 GMT)
From Marginal to Joint Predictions: Evaluating Scene-Consistent Trajectory Prediction Approaches for Automated Driving [4.8] マージナル予測モデルは、通常、各エージェントの将来の軌跡を独立して予測する。
合同予測モデルは、エージェント間の相互作用を明示的に説明し、社会的および物理的に一貫した予測をもたらす。
予測精度,多モード性,推論効率の観点から各手法の評価を行った。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:58:53 GMT)
Reinforcement Learning under State and Outcome Uncertainty: A Foundational Distributional Perspective [4.8] 我々は分散強化学習(DistRL)を部分的に観測可能なマルコフ決定プロセス(POMDP)に拡張する。
我々は、部分可観測性のための新しい分布型ベルマン作用素を導入し、それらの収束を p-ワッサーシュタイン計量の上限の下で証明する。
本研究では,DPBVI(Distributedal Point-Based Value Iteration)を開発し,Phi-vectorsを標準のポイントベースバックアッププロシージャブリジンDistRLとPMDPプランニングに統合する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:26:07 GMT)
Self-supervised Deep Learning for Denoising in Ultrasound Microvascular Imaging [4.8] 超音波微小血管イメージング(UMI)に特化して設計された自己教師型認知フレームワークであるHalf-Angle-to-Half-Angle(HA2HA)を提案する。
Ha2HAは、ビームフォーミングラジオ周波数(RF)血流データの相補的な角の部分集合からトレーニングペアを構築し、ノイズが変化する間に血管信号が一貫性を保つ。
コントラスト・ツー・ノイズ比(CNR)とSNRの両方で15dBを超える改善が観察され,画質が著しく向上した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:08:39 GMT)
A Concise Lyapunov Analysis of Nesterov's Accelerated Gradient Method [4.8] 一般凸関数と強凸関数の両方に対するネステロフの加速勾配法の収束率を簡潔に解析する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:38:27 GMT)
"Lost-in-the-Later": Framework for Quantifying Contextual Grounding in Large Language Models [4.7] モデルと言語間の文脈的知識を測定する新しい評価フレームワークであるCoPEを紹介する。
大規模言語モデルがどのようにコンテキストを統合し、情報を優先順位付けし、PKをオープンな質問応答に組み込むかを分析する。
推論モデルと、チェーン・オブ・シント(CoT)によって引き起こされた非推論モデルが、CoTのない非推論モデルよりもコンテキストを使用し、失われた後の効果を軽減できないことがわかった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:13:20 GMT)
The Neural Networks with Tensor Weights and the Corresponding Fermionic Quantum Field Theory [4.7] 複素数値ニューラルネットワーク(CVNN)とフェルミオン量子場理論(QFT)の理論的関係を確立する。
テンソル値の重みを持つCVNNは本質的にフェルミオン量子場を生成する。
NN-QFTをボソニック理論を超えて拡張し、フェミオン対称性を機械学習モデルに符号化するための道を開く。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:46:11 GMT)
AI for the Routine, Humans for the Complex: Accuracy-Driven Data Labelling with Mixed Integer Linear Programming [4.7] OPALは人手によるラベリング手法であり、ラベリングに必要な手作業を最小限に抑えつつ、所望の精度レベルを目標にすることができる。
本稿では,テストデータの自動ラベリングとテストデータの自動検証という,ビジョンシステムのコンテキストにおける2つのタスクに対するOPALの評価を行う。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:30:30 GMT)
Bridging Expressivity and Scalability with Adaptive Unitary SSMs [4.6] 適応ユニタリ状態空間モデル(AUSSM)は、一様進化と高表現力を達成するために、スキュー対称で入力依存の再現性を持つ新しいSSMのクラスである。
この結果から,適応的ユニタリ再帰は,記号的および連続的シーケンスモデリングの両方において,強力かつ効率的なアルゴリズムバイアスを与えることが示された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:47:16 GMT)
LAPS-Diff: A Diffusion-Based Framework for Singing Voice Synthesis With Language Aware Prosody-Style Guided Learning [4.6] LAPS-Diffは,言語認識の埋め込みと統合された拡散モデルであり,音声スタイルの指導型学習機構である。
我々はHindi SVSデータセットをキュレートし、事前訓練された言語モデルを利用して、リッチな歌詞表現のための単語と電話レベルの埋め込みを抽出する。
LAPS-Diffは,制約付きデータセットに対するSOTAモデルと比較して,生成したサンプルの品質を著しく向上させることを示した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:09:36 GMT)
Fairness and Sparsity within Rashomon sets: Enumeration-Free Exploration and Characterization [4.6] 本研究では,数理プログラミングに基づく列挙自由法を導入し,公平さや疎さなどの諸特性を特徴付ける。
提案手法を2つの仮説クラス(スコアリングシステムと決定図)に適用する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:35:57 GMT)
UDF-GMA: Uncertainty Disentanglement and Fusion for General Movement Assessment [4.5] 一般運動評価(GMA)は、脳機能障害の早期発見のための非侵襲的ツールである。
ポーズベースの自動GMA法は、高品質なデータとノイズの多いポーズ推定のために不確実性が生じやすい。
本稿では,ポーズベース自動GMAにおけるモデルパラメータのアレタリック不確かさとデータノイズからのアレタリック不確かさを明示的にモデル化するUDF-GMAを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:32:47 GMT)
AI for the Open-World: the Learning Principles [4.4] この論文は、オープンワールドのためのAIを構築するために必要な学習原則を探求する。
学習原則を使用するためのテクニックを提案し、学習原則を検証するために大規模な実験を行う。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:26:30 GMT)
ResQuNNs: Towards Enabling Deep Learning in Quantum Convolution Neural Networks [4.3] 準進化ニューラルネットワーク(QuNN)の性能向上のための,トレーニング可能な準進化層の導入による新しいフレームワークを提案する。
この制限を克服するために、これらのレイヤ内でのトレーニングを可能にし、QuNNの柔軟性とポテンシャルを大幅に向上させました。
本稿では,Residual Quanvolutional Neural Networks (ResQuNNs)を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:34:42 GMT)
From General to Specialized: The Need for Foundational Models in Agriculture [4.3] 人口が増加し、気候変動が拡大するにつれて、食料の安全保障は世界的な関心事となっている。
基礎モデルの最近の進歩は、リモートセンシングや気候科学において顕著な性能を示している。
作物タイプマッピング, 作物の表現学推定, 作物の収量推定など, 農業に関わる課題へのそれらの適用について検討した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:22:22 GMT)
On the Bias of Next-Token Predictors Toward Systematically Inefficient Reasoning: A Shortest-Path Case Study [4.3] 大規模言語モデルにおける推論を改善するための2つの重要な要因について検討する。
我々は、カスタムトークン化器を用いて、質問-トレース-回答三重項に対してデコーダのみの変換器を訓練する。
同じトレーニングの予算で、非効率なトレースで訓練されたモデルは、目に見えないグラフよりも一般化される。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:00:06 GMT)
An analysis of vision-language models for fabric retrieval [4.3] 情報検索やレコメンデーションシステムといったアプリケーションには,クロスモーダル検索が不可欠である。
本稿では,ファブリックサンプルのゼロショットテキスト・ツー・イメージ検索におけるビジョン言語モデルの利用について検討する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:00:18 GMT)
Improving Numerical Stability of Normalized Mutual Information Estimator on High Dimensions [3.8] k-Nearest Neighbor (k-NN) に基づく手法を用いて正規化された相互情報を推定するには、スケーリング不変なk-NN半径の計算が必要となる。
本研究では,高次元空間における半径計算の数値安定性を向上させる対数変換手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:44:22 GMT)
What Would You Ask When You First Saw $a^2+b^2=c^2$? Evaluating LLM on Curiosity-Driven Questioning [3.7] 大規模言語モデル(LLM)は膨大な量の知識を格納できるが、新しい知識を取得する可能性はまだ不明である。
本稿では,この能力を評価する新しい評価フレームワークを提案する。
GPT-4 や Mistral 8x7b のような大規模モデルはコヒーレントで関連する質問を生成するには適しているが、より小さな Phi-2 モデルは等しく、より効果的である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:02:28 GMT)
FurniMAS: Language-Guided Furniture Decoration using Multi-Agent System [3.4] 家具の自動装飾システムFurniMASを提案する。
作業用デスクやテレビスタンドなどの家庭用家具品や人為的なプロンプトが与えられた場合,本システムでは,適切なスタイルや材料を用いて,関連資産を提案する。
FurniMASはLLMベースと非LLMエージェントのハイブリッドチームを編成し、それぞれが典型的な装飾プロジェクトにおいて異なる役割を担っている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:45:08 GMT)
Universal approximation results for neural networks with non-polynomial activation function over non-compact domains [3.3] 単一隠れ層フィードフォワードニューラルネットワークの普遍近似特性をコンパクト領域を超えて拡張する。
活性化関数が非多項式であると仮定することにより、ユークリッド空間の非コンパクト部分集合上で定義される函数空間内での普遍近似結果を確立する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:23:41 GMT)
Towards a Unifying Reference Model for Digital Twins of Cyber-Physical Systems [3.3] デジタルツイン(Digital twins)は、サイバー物理システムの表現、監視、制御のための高度なソフトウェアシステムである。
デジタル双生児の既存の定義と参照モデルは過度に抽象的であり、その包括的理解と実装指導を妨げる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:57:00 GMT)
Violation of local realism with spatially multimode parametric down-conversion pumped by spatially incoherent light [3.3] 自然パラメトリックダウンコンバージョン(SPDC)を空間的に非コヒーレントな光源・発光ダイオード(LED)で励起した2光子状態の偏光絡み合った空間的ポストセレクションによる局所リアリズムの違反を実験的に実証した。
我々の研究は、デバイス非依存の量子鍵分布や量子エンハンスドセンシングのような量子技術のための、新しい、実用的な絡み合った光子の源を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:25:21 GMT)
Predicting mutational effects on protein binding from folding energy [3.3] 本稿では,タンパク質配列モデリングと折り畳み安定性予測の進歩を活用するトランスファーラーニング手法を提案する。
折りたたみエネルギーのプロキシとして,事前学習した逆折り畳みモデルを用いることで,ゼロショット性能が向上することを示す。
得られた予測器 StaB-ddG は、最先端の実験力場法 FoldX の精度に適合する最初のディープラーニング予測器である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:55:57 GMT)
Spatial and Semantic Embedding Integration for Stereo Sound Event Localization and Detection in Regular Videos [3.2] 本報告では,DCASE2025 Task 3 Challenge: Stereo Sound Event Localization and Detection in regular Video Contentの音声のみおよび音声視覚トラックに提案するシステムについて述べる。
SELDは、時間的事象分類と空間的局所化を組み合わせた複雑なタスクであり、空間的、時間的、意味的な次元にわたって推論を必要とする。
そこで本研究では,音声用CLAPと視覚入力用OWL-ViTという,事前学習型コントラスト言語対応モデルを統合することで,セマンティック情報を用いた標準的なSELDアーキテクチャを強化した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:08:57 GMT)
Label-free evaluation of lung and heart transplant biopsies using tissue autofluorescence-based virtual staining [3.2] 従来の組織化学的染色プロセスは、時間がかかり、費用がかかり、労働集約的である。
肺・心臓移植生検における仮想染色ニューラルネットワークのパネルについて述べる。
仮想染色ネットワークは、高い色均一性を持つ高品質な組織像を一貫して生成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:59:30 GMT)
On the quality of randomized approximations of Tukey's depth [3.2] タキー深度は多変量データの集中度を広く測定する尺度である。
タキーの深さの正確な近似を高次元で計算することは困難である。
ランダム化アルゴリズムは最大深さ1/2$と0に近い深さを正確に近似することを示した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:24:11 GMT)
Is Your AI Truly Yours? Leveraging Blockchain for Copyrights, Provenance, and Lineage [3.1] textscIBisは、AIモデルのトレーニングに適したブロックチェーンベースのフレームワークである。
textscIBisは、データセット、ライセンス、モデルのオンチェーンレジストリと、オフチェーン署名サービスを統合する。
私たちは、Cantonブロックチェーン上でDamlを使用してtextscIBisを実装します。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:28:50 GMT)
Identifying visible tissue in intraoperative ultrasound: a method and application [3.1] 術中超音波検査は, 必要なビゾタクタクタブル・タスクである。
根底にある可視組織を特定するために,反復フィルタリングとトポロジカル手法を提案する。
プローブ組織接触の信頼性評価を行うための新しい枠組みを作成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:47:34 GMT)
A Query-Aware Multi-Path Knowledge Graph Fusion Approach for Enhancing Retrieval-Augmented Generation in Large Language Models [3.1] QMKGFはクエリ対応マルチパス知識グラフフュージョンアプローチであり、検索拡張生成を促進する。
我々はプロンプトテンプレートを設計し、汎用LLMを用いてエンティティや関係を抽出する。
本稿では, ワンホップ関係, マルチホップ関係, 重要度に基づく関係を組み込んだマルチパスサブグラフ構築戦略を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:22:54 GMT)
FinSurvival: A Suite of Large Scale Survival Modeling Tasks from Finance [2.9] 人工知能(AI)サバイバルモデルをベンチマークするために、大規模で現実的で自由に利用できるデータセットが必要である。
分散ファイナンス(DeFi)における暗号通貨の貸与によって生成された公開取引データから16の生存モデリングタスクスイートを導出する。
我々は16の生存時間予測タスクからなる生存ベンチマークを定式化する(FinSurvival)。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:48:47 GMT)
Principle of Relativity and The Renormalizable Quantum Gravity [2.9] 我々は、相対性理論という新しい相対性理論に基づいて純粋に量子論を発展させた。
原理の本質を量子領域に拡張し、能動変換と受動変換の同一構造を維持することを実証する。
量子重力効果は再正規化可能な理論の中で自然に実現され、一般相対性理論は大きな距離で現れる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 03:04:59 GMT)
Qwen vs. Gemma Integration with Whisper: A Comparative Study in Multilingual SpeechLLM Systems [2.9] 本稿では,MLC-SLM Challenge 2025のための大規模言語モデル(LLM)を用いた多言語音声認識と言語モデリングに焦点を当てた。
本システムでは,Qwen2.5-7Bをデコーダのみの言語モデルとして,Gemma3-12Bと18.6%を用いて,プライベートテスト平均WER/CERの16.63%の競合性能を実現している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:09:16 GMT)
Physics Encoded Blocks in Residual Neural Network Architectures for Digital Twin Models [2.9] 物理インフォームド・機械学習は、デジタル双生児におけるモデリングとシミュレーションの一般的なアプローチとして登場した。
本稿では,新しい物理符号化残差ニューラルネットワークアーキテクチャに基づく汎用的アプローチを提案する。
本手法は、物理モデルとフィードフォワード学習ブロックとから、微分可能な物理ブロックを実装する数学的演算子を統合する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:30:17 GMT)
Beyond Training-time Poisoning: Component-level and Post-training Backdoors in Deep Reinforcement Learning [2.8] 深層強化学習(Dep Reinforcement Learning, DRL)システムは、安全クリティカルなアプリケーションでますます使われているが、そのセキュリティはいまだに過小評価されている。
本研究は、特定の入力が観測空間に現れる場合にのみ悪意ある行為を引き起こす隠されたトリガーを埋め込むバックドア攻撃を調査する。
1) 完全モデル再訓練に耐える持続的バックドアを移植するためにコンポーネントレベルの欠陥を利用するTrojanentRLと,(2) トレーニングや検証,テストデータへのアクセスを必要としないトレーニング後のバックドア攻撃であるInfrectroRLである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:15:54 GMT)
CP-Dilatation: A Copy-and-Paste Augmentation Method for Preserving the Boundary Context Information of Histopathology Images [2.8] 本稿では,CP-Dilatation と呼ばれる従来の Copy and Paste (CP) Augmentation 技術に基づく新しいデータ拡張手法を提案する。
従来のCP手法では,悪性度の境界コンテキスト情報を保存できる拡張演算が提案されている。
病理組織学的ベンチマークを用いた実験では, 提案手法は, 比較のために選択された他の最先端ベースラインよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:34:02 GMT)
A Cycle-Consistency Constrained Framework for Dynamic Solution Space Reduction in Noninjective Regression [2.8] 本稿では,サイクル一貫性に基づくデータ駆動トレーニングフレームワークを提案する。
正規化合成およびシミュレーションデータセットの実験により,提案手法が0.003未満のサイクル再構成誤差を達成することを示した。
このフレームワークは手動による介入への依存を著しく減らし、非インジェクティブ回帰タスクの潜在的な利点を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:28:01 GMT)
Are Information Retrieval Approaches Good at Harmonising Longitudinal Survey Questions in Social Science? [2.8] 本稿では,質問と回答の選択肢にまたがる概念等価性を識別する新しい情報検索タスクを提案する。
本稿では1946-2020年の調査データセットにおける教師なしアプローチについて検討する。
我々は、IR特化ニューラルモデルが、他のアプローチと相容れない性能で最高の総合的な性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:58:36 GMT)
Mechanistic Indicators of Understanding in Large Language Models [2.8] 我々は,Large Language Models (LLM) が,接続の確認に係わる理解と機能的に類似した内部構造を発達させることを論じる。
我々は「並列メカニズム」現象を探求し、LLMは理解の形式を示すが、認知アーキテクチャは我々のものとは相変わらず異なると論じる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:26:31 GMT)
Hybrid Adversarial Spectral Loss Conditional Generative Adversarial Networks for Signal Data Augmentation in Ultra-precision Machining Surface Roughness Prediction [2.6] 本稿では,効率的なUPMデータ拡張のためのハイブリッド逆スペクトル損失CGANであるHAS-CGANを提案する。
Hass-CGANは、特に高周波信号に対して、1次元の力信号生成に優れる。
従来のML(SVR, RF, LSTM)とディープラーニングモデル(BPNN, 1DCNN, CNN-Transformer)による実験では、520以上の合成サンプルでトレーニングデータを増強することで予測誤差が31.4%から9%に減少することを示した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:10:46 GMT)
One fish, two fish, but not the whole sea: Alignment reduces language models' conceptual diversity [2.6] 研究者は大規模言語モデル(LLM)を人間の行動研究の代替として使用することを提案した。
トレーニング後のアライメント(RLHFまたはRLAIF)がモデルの内部多様性に影響を及ぼすかどうかが議論されている。
我々は、シミュレーションされた個体の内部変動と集団レベルの変動を関連づけることで、合成合成LLMの「人口」の概念的多様性を測定する新しい方法を用いる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:34:06 GMT)
MMD-OPT : Maximum Mean Discrepancy Based Sample Efficient Collision Risk Minimization for Autonomous Driving [2.4] MMD-OPTは任意の予測分布下での衝突のリスクを最小限に抑えるための試料効率のよい手法である。
本稿では,これらの2つの概念を用いて衝突リスク推定のための効率的なサロゲートのサンプルを定義する方法について述べる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:36:56 GMT)
Replacing thinking with tool usage enables reasoning in small language models [2.4] 近年の進歩は、推論時間とトレーニング時間における計算のスケールアップに基づく、新しい機械学習パラダイムを確立している。
本稿では,これらのトークンをステートフルツールを用いたマルチターンインタラクショントレースとしてフォーマットすることを提案する。
各ターンで、ツールの新しい状態がモデルのコンテキストに追加され、そのジョブはカスタムDSLを介してツールを制御するのに必要なトークンを生成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:49:18 GMT)
Time Crystal in the Nonlinear Phonon Mode of the Trapped Ions [2.3] 時間結晶は、時間-翻訳対称性の自発的な破れによって定義される新しい物質相を構成する。
トラップイオン系の振動フォノンモードにおける連続時間結晶の実現手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:20:48 GMT)
Estimating Object Physical Properties from RGB-D Vision and Depth Robot Sensors Using Deep Learning [2.1] 慣性質量は、物体の把握、操作、シミュレーションなどのロボット応用において重要な役割を果たす。
本稿では,深度画像とRGB画像との疎点クラウドデータを組み合わせて,物体の質量を推定する手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:11:47 GMT)
Hunting in the Dark: Metrics for Early Stage Traffic Discovery [2.1] 本研究では,暗号鍵マルウェアパッケージであるCrackonoshの検出について,その挙動を識別するためのさまざまな指標を用いて検討した。
発見可能性の指標を用いて,マルウェアの数が減少するにつれて,防御者がCrackonoshトラフィックを測定する能力をモデル化する。
異なる暗黒空間サイズがマルウェアを追跡する能力の両方にどう影響するかを実証するが、攻撃者のミスを悪用して突発的な行動を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:23:07 GMT)
Gendered Divides in Online Discussions about Reproductive Rights [2.0] 特に保守的な地域では,性差が中絶態度や感情表現を著しく低下させることが示された。
これにより中絶態度の男女差が生じ、保守的な地域ではより顕著になる。
Dobbsの草案は、オンラインのエンゲージメントをさらに強化し、アクセスが脅かされている地域で、排他的女性を不当に動員した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:49:30 GMT)
iLSU-T: an Open Dataset for Uruguayan Sign Language Translation [2.0] iLSU Tは、ウルグアイの手話RGBビデオに音声とテキストの書き起こしを加えたオープンデータセットである。
このタイプのマルチモーダルおよびキュレートされたデータは、手話処理のためのツールを理解したり生成したりするための新しいアプローチを開発する上で最重要である。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:11:21 GMT)
A Generative Diffusion Model for Amorphous Materials [2.0] 従来のシミュレーションの1000倍の速度でアモルファス構造を確実に生成する拡散モデルを提案する。
条件生成により、10$-2$ K/psの低い冷却速度で大型構造物をサンプリングし、延性-脆性遷移とメソポーラスシリカ構造を明らかにすることができた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:08:10 GMT)
Representation learning with a transformer by contrastive learning for money laundering detection [1.8] 変圧器ニューラルネットワークを用いて定性的および定量的データの構造化時系列を利用する新しい手順が導入された。
実験により、トランスフォーマーはマネーロンダリングパターンを利用するのに成功する一般的な表現を生成することができることを確認した。
また、偽陽性率を抑えつつ、不正行為や不正行為を検知する新たな手順の能力も高めている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:16:11 GMT)
Self-Attention Based Multi-Scale Graph Auto-Encoder Network of 3D Meshes [1.6] 3D Geometric Mesh Network(3DGeoMeshNet)は、異方性畳み込み層を用いて空間領域内でグローバルな特徴とローカルな特徴を直接学習する新しいGCNベースのフレームワークである。
我々のアーキテクチャはマルチスケールエンコーダ・デコーダ構造を特徴とし、大域的および局所的な経路は大規模な幾何学的構造と微細な局所的詳細の両方を捉えている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:36:03 GMT)
Dementia Detection using Multi-modal Methods on Audio Data [1.6] 本稿では,患者の音声記録を用いて認知症の発症を予測するために開発されたモデルについて述べる。
音声ファイルからWhisperモデルを用いて書き起こしを生成し,RoBERTa回帰モデルを用いてMMSEスコアを生成するASRベースのモデルを開発した。
RMSEスコアは2.6911で、ベースラインよりも約10%低い。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:38:34 GMT)
LLMs on support of privacy and security of mobile apps: state of the art and research directions [1.5] セキュリティとプライバシーのリスクは依然としてモバイルアプリのユーザーを脅かす。
セキュリティリスクとプライバシ違反を特定するために,大規模言語モデルの適用について検討する。
ユーザが画像をオンラインで共有する場合に,機密データ漏洩を検出する手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:36:57 GMT)
Self-Supervised Real-Time Tracking of Military Vehicles in Low-FPS UAV Footage [1.5] 無人航空機(UAV)を実際の戦闘シナリオで移動させることで捉えた低フレームレートのビデオにオブジェクトを関連付けることは複雑である。
単一フレームアノテーションからのインスタンス関連学習がこれらの課題を克服する方法について述べる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:39:11 GMT)
Bright squeezed light in the kilohertz frequency band [1.5] 本稿では,ハイブリッド雑音安定化技術を利用した新しい輝度抑圧型光発生方式を提案する。
この方式はブロードバンド受動雑音安定化を同化し、非古典的アクティブ安定化のフィードバック周波数帯域をMHz帯域に拡張する。
出力1mWの5.5dBの明るいシャープライトと、kHzからMHz帯間のスキーズ帯域が生成される。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:40:48 GMT)
Mitigating Bias Using Model-Agnostic Data Attribution [1.5] 機械学習モデルにおけるバイアスの緩和は、公平性と公平性を保証するための重要な取り組みである。
本稿では, 画素画像の属性を利用して, バイアス属性を含む画像の領域を特定し, 正規化することで, バイアスに対処する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:13:27 GMT)
Modeling (Deontic) Modal Operators With the s(CASP) Goal-directed Predicated Answer Set Programming System [1.5] デフォルトの否定と強い否定を用いて、(決定的な)モーダル作用素をエレガントに表現する方法を示す。
本稿では、ASPのグローバル制約を用いて、デオン型モーダル論理の義務と不完全性を表現することを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:31:54 GMT)
ConBatch-BAL: Batch Bayesian Active Learning under Budget Constraints [1.5] 本研究は,制約下でのバッチ取得のためのベイズ的アクティブラーニング戦略を2つ導入する(ConBatch-BAL)。
戦略は、2つの実世界のデータセットのランダムな取得ベースラインに対してベンチマークされる。
その結果,開発したConBatch-BAL戦略により,実環境におけるアクティブな学習イテレーションとデータ取得コストを削減できることが示唆された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:25:12 GMT)
Learned enclosure method for experimental EIT data [1.5] 本稿では,池畑が提案する囲い込み法とニューラルネットワークを組み合わせることで,境界測定から包含物の凸包を推定する方法を提案する。
最小二乗の整合性を持つ古典的閉包法と比較して, 学習された凸船体は, シミュレーションデータと実験データの両方において優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:04:16 GMT)
Causal Foundation Models: Disentangling Physics from Instrument Properties [1.4] コントラスト学習を訓練した二重エンコーダアーキテクチャを用いて,物理的要因と楽器的要因を分離する基礎モデルを提案する。
提案手法は,下流予測タスクにおいて,従来の単一遅延空間基盤モデルよりも大幅に優れる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:00:00 GMT)
A Systematization of Security Vulnerabilities in Computer Use Agents [1.4] 我々は、現実のCUAのシステム的脅威分析と、敵条件下でのテストを行う。
CUAパラダイム特有のリスクのクラスを7つ同定し、3つの具体的なエクスプロイトシナリオを詳細に分析する。
これらのケーススタディは、現在のCUA実装にまたがるより深いアーキテクチャ上の欠陥を明らかにします。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:50:21 GMT)
Massive MIMO-NOMA Systems Secrecy in the Presence of Active Eavesdroppers [1.4] 非直交多重アクセス(NOMA)とMIMO(Multiple-input multiple-output)システムは非常に効率的である。
Eavesdropperは、チャネル推定フェーズ中に、正当なユーザパイロット信号の組み合わせを送信することができる。
このようにして、基地局を誤解させ、送信を自方向で回転させ、盗聴することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:18:27 GMT)
Learning Maximal Safe Sets Using Hypernetworks for MPC-based Local Trajectory Planning in Unknown Environments [1.3] 本稿では,未知の静的環境における局所軌道計画のための最適集合のオンライン推定のための学習に基づく新しいアプローチを提案する。
モデル予測制御(MPC)ローカルプランナの終端セット制約として、集合の神経表現を用いる。
我々は,提案手法であるNTC-MPCを物理ロボットに展開し,ベースラインが故障した場合の障害物を安全に回避できることを実証した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:05:03 GMT)
Role of scrambling and noise in temporal information processing with quantum systems [1.3] 時相情報処理のための効果的な基板として、スクランブル量子系が注目されている。
量子システムを用いて、幅広い物理計算モデルをキャプチャする量子貯水池処理フレームワークについて検討する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:11:49 GMT)
A High-Level Compiler Integration Approach for Deep Learning Accelerators Supporting Abstraction and Optimization [1.3] 本稿では,GEMMに基づくディープラーニングアクセラレータを対象とするTVMベースのコンパイル統合手法を提案する。
我々のアプローチは、コンパイラ統合の複雑さを抽象化し、アクセラレータのシームレスな統合を可能にします。
我々のフレームワークはGemminiアクセラレータでベンチマークされており、手動で実装されたツールチェーンに匹敵するパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:50:15 GMT)
EduCoder: An Open-Source Annotation System for Education Transcript Data [1.2] EduCoderは、教育対話の発話レベルアノテーションをサポートするように設計されたドメイン特化ツールである。
研究者やドメインの専門家が、観測データに基づいたコードブックを共同で定義するためのプラットフォームを提供する。
分類的およびオープンなアノテーションタイプと文脈的素材を取り入れている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:15:29 GMT)
Eka-Eval : A Comprehensive Evaluation Framework for Large Language Models in Indian Languages [1.2] EKA-evalは、9つの主要な評価カテゴリに35以上のベンチマークを統合する統合評価フレームワークである。
モジュールアーキテクチャによる11のコア機能、Hugging Faceとプロプライエタリなモデルとのシームレスな統合、プラグインとプレイのユーザビリティを提供する。
フレームワークはオープンソースで、https://github.com/lingo-iitgn/eka-eval.comで公開されている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:30:26 GMT)
Quantum Simulation of Charge and Exciton Transfer in Multi-mode Models using Engineered Reservoirs [1.1] 量子シミュレーションは、非摂動状態における開系分子動力学を研究するための経路を提供する。
多モード線形ビブロニックカップリングモデルにおいて、電荷とエキシトン移動のオープンシステム量子シミュレーションを実証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:44:41 GMT)
Can Local Representation Alignment RNNs Solve Temporal Tasks? [1.1] リカレントニューラルネットワーク(RNN)は、リアルタイム処理、ストリーミングデータ、トレーニングサンプルの量を制限するケースに一般的に使用される。
BPTTはRNNを訓練するための主要なアルゴリズムであるが、爆発し、勾配が消えやすいとしばしば批判されている。
本稿では,ローカル更新を用いて,その不安定性を低減しようとするRNNに対して,ターゲット伝搬に基づく手法を提示し,評価する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:21:08 GMT)
Integrating Spatiotemporal Features in LSTM for Spatially Informed COVID-19 Hospitalization Forecasting [1.1] 本研究は、米国における毎日の国家レベルの入院を予測するための、並列ストリーム長短期記憶(LSTM)フレームワークを提案する。
当社のフレームワークには,Metaのソーシャル・コネクテッドネス・インデックス(Social Connectedness Index)から派生した,入院に対する社会的親和性(Social Proximity to Hospitalizations,SPH)という特徴が組み込まれている。
我々のアーキテクチャは、短期的および長期的両方の時間的依存関係をキャプチャし、マルチホライゾン・アンサンブル・ストラテジーは一貫性とエラーのバランスをとる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 22:13:57 GMT)
Do LLMs Understand the Safety of Their Inputs? Training-Free Moderation via Latent Prototypes [1.1] ラテントプロトタイプモデレータ (LPM) は、ラテント空間におけるマハラノビス距離を用いて入力安全性を評価する訓練のないモデレーション手法である。
LPMは、複数の安全ベンチマークで最先端のガードモデルと一致または超えている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:43:34 GMT)
DICE: Discrete inverse continuity equation for learning population dynamics [1.1] 与えられたサンプル集団から有限個の時間点でプロセスの進化を学習する生成的モデリング手法を導入する。
DICEは、人口動態を学習する他の方法が失敗する状況での訓練に安定している。
DICEは、時間に条件を定めなければならない方法よりも、桁違いのコストで代表サンプルを生成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:25:54 GMT)
When do World Models Successfully Learn Dynamical Systems? [1.0] 低次元空間に投射時間スライスし,それを結合して歴史(「トークン化」)を形成することが,物理データセットの学習に非常に効果的である理由を説明する理論的枠組みを提案する。
我々は、最小二乗回帰から始まり、単純な線形層、浅い逆数学習者、そして最終的にフルスケールな生成逆数ネットワーク(GAN)を通して進行する、複雑さを増す一連のモデルを開発する。
熱・波動方程式の修正形式,カオス状態 2D 倉本-シヴァシンスキー方程式,計算流体力学など,様々なデータセット上でこれらのモデルを評価した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:29:18 GMT)
Girlhood Feminism as Soft Resistance: Affective Counterpublics and Algorithmic Negotiation on RedNote [1.0] この記事は、ハッシュタグであるBaby Supplementary Food (BSF)の再予算に焦点を当てている。
私たちは、自尊心、アルゴリズムプレイ、美的離脱を通じて、ユーザーがいかに女性中心の反パブリックを創出するかを分析します。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:12:24 GMT)
3D SA-UNet: 3D Spatial Attention UNet with 3D Atrous Spatial Pyramid Pooling for White Matter Hyperintensities Segmentation [1.0] コンピュータ技術を用いたWhite Matter Hyperintensity(WMH)の正確なセグメンテーションは早期診断に不可欠である。
自動WMHセグメンテーションのための3次元空間注意U-Netと呼ばれる深層学習モデルを提案する。
提案した3D SA-UNetモデルは,他の最先端の3D畳み込みニューラルネットワークと比較して精度が高いことを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:43:05 GMT)
Open-Set Gait Recognition from Sparse mmWave Radar Point Clouds [1.0] スパースmmWaveレーダ点雲からの開集合ゲイト認識の問題に対処する。
これは、スパースポイントクラウドデータによるオープンセット歩行認識に対処する最初の作業である。
10人の被験者から5時間以上の計測結果が得られた最初の人間の歩行データセットであるmmGait10をリリースする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:04:02 GMT)
Perspectives on How Sociology Can Advance Theorizing about Human-Chatbot Interaction and Developing Chatbots for Social Good [1.0] 社会学は人間とチャットボットの相互作用の理解を深めることが示唆される。
この分野では4つの社会学理論が現存している。
本稿では,人間とチャットボットの相互作用を理論化するための社会学理論の適用価値について論じる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:12:03 GMT)
Markovian Transformers for Informative Language Modeling [1.0] CoT(Chain-of-Thought)推論は、しばしば言語モデルの根底にある決定プロセスを忠実に反映しない。
我々は、CoTを「マルコフ」言語モデルにおいて因果的に必要としており、中間のCoTを通して次のトークン予測を分解し、元のプロンプトとは無関係に将来のトークンを予測するよう訓練する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:36:11 GMT)
Robust Learning on Noisy Graphs via Latent Space Constraints with External Knowledge [0.9] 本稿では,Latent Space Constrained Graph Neural Networks (LSC-GNN) を提案する。
ベンチマークデータセットの実験では、LSC-GNNは標準よりも優れており、ノイズ耐性のGNNは中程度のノイズを受ける。
以上の結果から,LSC-GNNがノイズのあるリレーショナル構造を持つ環境での予測性能と解釈可能性を高める可能性を強調した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 23:43:24 GMT)
The Forest Behind the Tree: Revealing Hidden Smart Home Communication Patterns [0.9] スマートホームデバイスは、比較的シンプルで予測可能なネットワークアクティビティパターンを示す。
これまでの研究は主に通常のネットワーク条件に焦点を合わせており、潜在的な隠れパターンを見下ろしている。
本稿では,これらの隠れ通信パターンを体系的に,かつ自動的に明らかにするフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:28:00 GMT)
SV-DRR: High-Fidelity Novel View X-Ray Synthesis Using Diffusion Model [0.9] 単一視点からのマルチビューX線画像に対する新しいビュー条件付きモデルを提案する。
提案手法ではディフュージョン変換器を用いて細部を保存し,高解像度画像の安定生成に弱いストロングトレーニング戦略を用いる。
実験結果から,視角制御を改良した高分解能出力が得られた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:58:11 GMT)
O_FT@EvalLLM2025 : étude comparative de choix de données et de stratégies d'apprentissage pour l'adaptation de modèles de langue à un domaine [0.9] 本稿では,O_FTチームがOrangeとOuest-Franceと共同で行なった,防衛領域への言語モデルの適用について述べる。
我々の適応の炭素フットプリントを考えると、この研究は比較的小さなモデルに対する領域適応の可能性を示している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:28:08 GMT)
Enhancing Underwater Images Using Deep Learning with Subjective Image Quality Integration [0.8] 本稿では,水中画像の品質向上のための深層学習に基づくアプローチを提案する。
専門家によってラベル付けされた水中画像を含む公開データセットを、高品質または低品質のいずれでも使用しています。
その結果,提案手法は画像品質の認識と測定の両方において大幅な改善を達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:25:13 GMT)
Exploring Empathy in Software Engineering: Insights from a Grey Literature Analysis of Practitioners' Perspectives [0.8] 共感は、主要な社会的スキルであり、SEにおけるコミュニケーションとコラボレーションには不可欠であるが、まだ調査されていないトピックである。
本研究は,SEにおける共感を実践者の視点から考察し,その意義を特徴づけ,障壁を特定し,克服するための実践について議論し,その効果を探求する。
この研究では、SEにおける共感の定義を提案し、有害な文化や過剰な技術的焦点、チームの共感を促進するプラクティス、コラボレーションの改善、コミュニケーション、不安の低減、フラストレーション、ストレスといった成果を識別する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:35:37 GMT)
React-tRace: A Semantics for Understanding React Hooks [0.8] React-tRaceという名前のReact Hooksの本質のセマンティクスを形式化します。
我々のモデルは、Hooksの本質的な性質を具現化していることを理論的に示すことによって、Reactの挙動を捉えます。
我々は,Hooksのセマンティクスをよりよく理解するための,形式化に基づく実用的な視覚化ツールを紹介した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:42:17 GMT)
Data Matters: The Case of Predicting Mobile Cellular Traffic [0.6] 本稿では, 人口動態データを用いて, 細胞負荷発生の過程を学習することを提案する。
本研究では,スマート道路に着目し,道路交通対策を用いて予測精度を向上させる。
総合的な実験により、道路の流れと速度を利用することで、セルラーネットワークのメトリクスに加えて、基地局の負荷予測誤差を大幅に低減できることが示された。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:40:17 GMT)
UltraBoneUDF: Self-supervised Bone Surface Reconstruction from Ultrasound Based on Neural Unsigned Distance Functions [0.6] 骨表面の再構築はコンピュータによる整形外科手術において重要な役割を担っている。
超音波イメージングの固有の限界のため、Bモード超音波は通常、部分的な骨表面のみを捉えている。
骨表面を超音波で再構築するための自己教師型フレームワークであるUltraBoneUDFを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:53:07 GMT)
Beyond Scaling Curves: Internal Dynamics of Neural Networks Through the NTK Lens [0.6] 我々は、ニューラルネットワークがデータの下でどのように振る舞うかを経験的に分析し、ニューラル・タンジェント・カーネル(NTK)のレンズを通してモデルをスケーリングする。
我々の標準的な視覚タスクの発見は、内部モデル力学が逆の挙動を示すにもかかわらず、同様のパフォーマンススケーリング指数が生じることを示している。
また、無限幅制限への収束が有限幅モデルにおけるスケーリングの挙動にどのように影響するかという未解決のニューラルスケーリング問題にも対処する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:17:44 GMT)
Reviewing Scientific Papers for Critical Problems With Reasoning LLMs: Baseline Approaches and Automatic Evaluation [0.6] 本稿では,いくつかのベースラインアプローチと,トップ推論 LLM を判断として用いた拡張可能な自動評価フレームワークを提案する。
O3は、全てのモデルで最低限のコストで、最高の問題識別性能を示した。
本稿では,文書に基づく科学的理解・推論に関する知見を提供し,今後の応用の基盤となる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:28:31 GMT)
VaxPulse: Monitoring of Online Public Concerns to Enhance Post-licensure Vaccine Surveillance [0.4] 我々は,ヴィクトリアのワクチン安全サービスSAEFVICの報告監視システムをいかに強化したかを説明する。
多段階のフレームワークであるVaxPulseを用いて、免疫後の有害事象と感情分析を統合する。
我々は、民族言語コミュニティにまたがる懸念を階層化するために、非英語言語に対処する必要性を強調している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:18:08 GMT)
An approach to the timetabling problem in deregulated railway markets based on metaheuristic algorithms [0.4] 本稿では、規制緩和された鉄道システムの力学を再現するためのモジュラーシミュレーションフレームワークを提案する。
MEALPY Pythonライブラリを用いた10のメタヒューリスティックアルゴリズムが評価され、自由化されたスペインの鉄道市場における列車スケジュールを最適化する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:50:49 GMT)
Cyclic Equalizability of Words and Its Application to Card-Based Cryptography [0.4] 等長の2つの二項語とハミング重みの2つの二項語が巡回等化可能であることを示す。
カードベースの暗号における巡回等化可能性の応用として、情報消去問題や全開プロトコルの単一カットへの応用について述べる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:03:36 GMT)
AI Generated Text Detection Using Instruction Fine-tuned Large Language and Transformer-Based Models [0.3] 大規模言語モデル (LLM) は文法的に正し、意味的に意味のあるテキストを生成する。
LLMは、非常に現実的なフィッシングメールの作成、フェイクニュースの拡散、サイバー犯罪の自動化のためのコードの生成、不正な科学論文の執筆に誤用されている。
言語、統計、機械学習、アンサンブルに基づくアプローチを用いて、機械が生成したテキストと人間によるコンテンツとを区別する様々な試みがなされている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:13:13 GMT)
Transcribing Spanish Texts from the Past: Experiments with Transkribus, Tesseract and Granite [0.1] 本稿では,IberLEF 2025の共有タスクである PastReader: Transcribing Texts from the Past で GRESEL チームが得られた実験結果を紹介する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:04:17 GMT)
Improving Predictions of Convective Storm Wind Gusts through Statistical Post-Processing of Neural Weather Models [0.1] ニューラル気象モデル(NWM)の最近の進歩は、0.25degのグローバルグリッド上での大気環境の予測に、計算的に安価で高速なアプローチを提供する。
雷雨の場合、これらの環境は特定の場所で風速分布を予測するために経験的に後処理することができる。
そこでPangu-Weather NWMでは,時間ごとの風速を最大3日前に予測するために,統計的および深層学習後処理手法の階層化を適用した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:33:06 GMT)
Mutual Information Optimal Control of Discrete-Time Linear Systems [0.1] 離散時間線形システムに対する相互情報最適制御問題(MIOCP)を定式化する。
この問題は、最大エントロピー最適制御問題(MEOCP)の拡張と見なすことができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:04:27 GMT)
Taming the Tri-Space Tension: ARC-Guided Hallucination Modeling and Control for Text-to-Image Generation [0.1] テキスト・ツー・イメージ(T2I)拡散モデルでは持続的な「幻覚」が示される
本稿では,幻覚を潜在アライメント空間内の軌跡ドリフトとして再解釈する認知的な視点を提案する。
我々は,潜在空間で完全に動作する軽量コントローラであるTensionModulator (TM-ARC) を開発した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:43:09 GMT)
ReLoop: "Seeing Twice and Thinking Backwards" via Closed-loop Training to Mitigate Hallucinations in Multimodal understanding [0.1] MLLM(Multimodal Large Language Models)は、オープンな視覚的質問応答において顕著な進歩を遂げている。
MLLMは幻覚に弱いままであり、信頼性と事実の整合性にとって重要な課題である。
クロスモーダル理解のためのマルチモーダル整合性を促進する統合クローズドループトレーニングフレームワークであるReLoopを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:40:48 GMT)
Work and entropy of mixing in isolated quantum systems [0.0] 2つの異なる気体の混合は、CO$$の捕獲から水質浄化まで、最も一般的な自然現象の1つである。
伝統的に、混合は局所的な熱平衡の文脈で分析され、そこではシステムは熱浴とエネルギーを交換する。
そこで本研究では, マクロな可観測物によって特徴付けられる, 潜在的に非平衡な初期状態を持つ孤立系における混合について検討する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:38:40 GMT)
Wigner's friend's black hole adventure: an argument for complementarity? [0.0] ブラックホール物理学とウィグナーの友人のシナリオの両方の中心にあるユニタリティ。
我々は、ブラックホール物理学とウィグナーの友人シナリオの非局所的な拡張を融合して、統一された議論へと導く新しいパラドックスを構築した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:01:17 GMT)
VERITAS: Verification and Explanation of Realness in Images for Transparency in AI Systems [0.0] 我々は、小さな(32x32)画像がAI生成されているかどうかを正確に検出する包括的フレームワークVERITASを提案する。
VERITASは、合成画像のキーアーティファクトを記述する人間可読な説明を生成する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:57:05 GMT)
Universality in the Anticoncentration of Chaotic Quantum Circuits [0.0] ランダムな量子回路における反集中を規定するインフニバーショナル関数形式を同定する。
我々は、ランダムテンソルネットワーク状態とランダムフェーズモデルのアンサンブルに関する解析結果を通じて、この主張を支持する。
本研究は, 量子デバイスを浅回路でベンチマークするための実用的枠組みを導入することを目的とした。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:31:45 GMT)
Towards a consistent Semiclassical Theory of Gravity [0.0] 我々は、量子系が安定な決定連鎖と相互作用するときのみ重力場を放出すると仮定することで、半古典重力を一貫した表現が可能であると論じる。
これは重力の普遍性を否定し、同値原理のバージョンを掲げる。
この条件のサブセットが、半古典的な重力を一貫させる以上の多くの利点をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:46:42 GMT)
Towards Human-in-the-Loop Onset Detection: A Transfer Learning Approach for Maracatu [0.0] Afro-Brazilian Maracatu の伝統における音楽のオンセット検出のための伝達学習戦略について検討する。
我々は2つの時間的畳み込みネットワークアーキテクチャを適用した。1つはオンセット検出(intra-task)、もう1つはビートトラッキング(inter-task)である。
5秒のアノテートスニペットのみを用いて,従来の5種類の打楽器の層方向のトレーニング戦略により,これらのモデルを微調整する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:32:26 GMT)
Topological schemes in spacetime for the electrodynamic Aharonov-Bohm effect [0.0] A $mathbf108$, 062218 (2023)
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:50:55 GMT)
The Author Is Sovereign: A Manifesto for Ethical Copyright in the Age of AI [0.0] AIの時代、著者はアルゴリズムによるコンテンツスクラップ、"フェアユース"のような法的グレーゾーン、そして同意や補償なしに創造的な労働から利益を得るプラットフォームによって静かに浸食されている。
この短い宣言は、著者が知的ドメインの主権を持つシステムという、過激な代替案を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:20:34 GMT)
Temporal Conformal Prediction (TCP): A Distribution-Free Statistical and Machine Learning Framework for Adaptive Risk Forecasting [0.0] 有限サンプルの有効性を保証した金融時系列の予測区間を構築するための時間的等角予測(TCP)を提案する。
TCPは量子レグレッションを共形キャリブレーション層と統合し、減衰する学習速度を介してオンラインに適応する。
GARCH, Historical Simulation, static Quantile Regression across equities (S&P 500), Crypto (Bitcoin), and commodities (Gold)などの既存の手法に対してTCPをベンチマークする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:44:31 GMT)
Strategic Alignment Patterns in National AI Policies [0.0] 本稿では,国家人工知能政策における戦略的整合性を評価するための新しい視覚マッピング手法を提案する。
行列に基づく可視化とネットワーク分析を組み合わせた15~20の全国的AI戦略を分析し,アライメントとアライメントのパターンを同定する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 18:36:30 GMT)
Statistical characterization of valley coupling in Si/SiGe quantum dots via $g$-factor measurements near a valley vortex [0.0] Si/SiGeヘテロ構造における低エネルギーバレー励起はスピン量子ビットを失敗させる。
谷のエネルギー分布の現実的な大きさのサンプリングは、平均的な谷の結合を劇的に過大評価する傾向にある。
簡単な$g$-factor の測定値を用いて,量子井戸を横切る谷相の地形を探索する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:16:48 GMT)
Solar Flare Prediction Using LSTM and DLSTM with Sliding Window Pattern Recognition [0.0] データセットは2003年から2023年までで、151,071のフレアイベントを含む。
スライディングウインドー技術は、不規則および規則化されたフレア時系列の時間準パターンを検出するために用いられる。
LSTMとDLSTMモデルは不規則時系列からのピークフラックスと待ち時間のシーケンスに基づいてトレーニングされ、LSTMとDLSTMはアンサンブルアプローチと統合され、3時間間隔の正規化時系列のスライディングウィンドウに適用される。
正規化された時系列に対するアンサンブルアプローチによるDLSTMは他のモデルよりも優れており、不規則な時系列で訓練されたモデルと比較して誤りが少なく、より正確な大きめの予測を提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:17:38 GMT)
Several types of quantum Wasserstein distance based on an optimization over separable states [0.0] 我々は、与えられた限界を持つ一般二部量子状態に対する最適化に基づいて、量子ワッサーシュタイン距離のいくつかの定義を考察する。
我々は、Uhlmann-Jozsa量子忠実度が与えられた限界を持つ分離可能な状態に対する最適化としても記述できることを示した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:31:52 GMT)
Selective and efficient quantum state tomography for multi-qubit systems [0.0] 任意の$N$-qubit 密度行列の複数の選択要素を効率的に推定する手法である選択的かつ効率的な QST (SEEQST) を導入する。
任意の$N$-qubit密度行列は、それぞれ2N$要素を含む2N$サブセットに分割可能であることを示す。
SEEQSTでは、そのような部分集合はたった2つの実験から正確に推定できる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:06:58 GMT)
Seed Selection for Human-Oriented Image Reconstruction via Guided Diffusion [0.0] 拡散に基づく手法は、余分な情報のないマシン指向画像から人間指向画像を生成する。
この方法は1つのランダムなシードを使用し、最適化された画像の品質につながる可能性がある。
画像品質を向上させるために,複数の候補から最適な種を識別する種選択法を提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:16:04 GMT)
Secure Quantum Relay Networks Using Distributed Entanglement without Classical Authentication [0.0] 現在の量子通信プロトコルは、メッセージ元検証の古典的な認証に大きく依存している。
古典的認証を完全に回避するセキュアな量子中継ネットワークのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:25:10 GMT)
Scalable Simulation of Fermionic Encoding Performance on Noisy Quantum Computers [0.0] 本研究では,Derby-Klassen符号化と呼ばれる局所符号化の性能について検討する。
我々は,Derby-Klassenエンコーディングを用いたポストセレクション手法の高サンプリング要求が,その適用性に限界をもたらすことを見出した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:16:52 GMT)
Satellite-based Rabi rice paddy field mapping in India: a case study on Telangana state [0.0] 本研究は、2018-19年米の季節にインドの32の地域におけるアグロ・エコロジーの変動に適応する表現学主導の枠組みを開発した。
地域別校正法は,従来の地域クラスタリング法に比べて93.3%の精度で8.0ポイント改善した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:47:37 GMT)
Role of phase of optimal probe in noncommutativity vs coherence in quantum multiparameter estimation [0.0] 任意の量子ハミルトニアンを符号化した2つの位相の同時推定について検討する。
また、符号化されたハミルトニアンをSU(2)生成子として選択する単一量子プローブについても検討する。
量子ビットと量子ビットの両方のシナリオにおいて、最適プローブは、最大かつ最小の固有値に対応する固有状態のコヒーレントな重ね合わせである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:42:56 GMT)
Robotic System with AI for Real Time Weed Detection, Canopy Aware Spraying, and Droplet Pattern Evaluation [0.0] 我々は,雑草の存在を検知し,天蓋の大きさを推定し,ノズルのアクティベーションをリアルタイムで動的に調整できる,視覚誘導型AI駆動可変速度噴霧装置を開発した。
このシステムは軽量のYOLO11nとYOLO11nセグ深層学習モデルを統合し、NVIDIA Jetson Orin Nano上に展開して推論を行う。
今後の研究は、サウスダコタ州で一般的な雑草3種を含む検出能力を拡大することに焦点を当てる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:27:29 GMT)
Real-Time Stochastic Terrain Mapping and Processing for Autonomous Safe Landing [0.0] 本稿では,新しいリアルタイムな惑星地形マッピングアルゴリズムを開発した。
サンプル点間の地形的不確実性や、スパース3次元測定による不確かさを考慮に入れている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:23:41 GMT)
Real-Time AI-Driven Pipeline for Automated Medical Study Content Generation in Low-Resource Settings: A Kenyan Case Study [0.0] JuvenotesはAI駆動のリアルタイムパイプラインで、学術文書の構造化試験スタイルの質問銀行への変換を自動化する。
ケニアの低リソース医療教育に最適化されている。
ケニアの医療機関で7ヶ月以上試験されたJuvenotesは、コンテンツを数日から数分に短縮し、毎日のアクティブユーザーを40%増やした。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:22:17 GMT)
Random weights of DNNs and emergence of fixed points [0.0] 本稿では,入力と出力が同じ次元を持つディープニューラルネットワーク(DNN)の特殊なクラスについて述べる。
そのようなネットワークのトレーニングは、その固定点(FP)によって特徴づけられる。
我々は、重みと軽い尾の分布を持つi.d.ランダムウェイトを考える。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:24:15 GMT)
Quantum advantage from negativity of work quasiprobability distributions [0.0] 量子電池は、多数のセルが存在する場合、直ちに「作業」を行うことで充電することができる。
ここでは、これらの量子熱力学の2つの概念は、明らかに非連結であるように見えるが、単純な関係を示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:18:49 GMT)
Quantum Spin Glass in the Two-Dimensional Disordered Heisenberg Model via Foundation Neural-Network Quantum States [0.0] 本稿では,最近導入されたファンデーションニューラルネットワーク量子状態フレームワークを用いて,結合障害を伴うフラストレーション量子ハイゼンベルクモデルについて検討する。
スピンガラス相が任意の有限温度で消失する古典的な場合とは異なり、量子ゆらぎに対して安定であることを示す説得力のある証拠が見つかる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:00:55 GMT)
Quantum Quasinormal Mode Theory for Dissipative Nano-Optics and Magnetodielectric Cavity Quantum Electrodynamics [0.0] マクロなQEDと複雑な座標変換に基づく統一理論フレームワークを提案する。
複雑な座標変換は、放射損失を非放射物質散逸に効果的に変換する。
磁気誘電体cQEDの完全量子理論におけるモード損失の複雑さに直接対処することにより、我々のアプローチは現代の量子ナノ光学実験の探索を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:42:10 GMT)
Quantum PCPs: on Adaptivity, Multiple Provers and Reductions to Local Hamiltonians [0.0] 非適応型量子PCPは、証明クエリ数が一定である場合に適応型量子PCPをシミュレートできることを示す。
また、ある量子PCPステートメントが偽であるような(量子)オラクルが存在することも示している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:28:01 GMT)
Performance Evaluation of General Purpose Large Language Models for Basic Linear Algebra Subprograms Code Generation [0.0] 我々は,CPU用BLASコード生成のための既存の汎用LLMの性能を評価する。
定期的な名前しか与えられていない場合でも、正しいコードが生成できることがわかりました。
また,OpenMP,SIMDベクトル化,キャッシュブロッキングによるスレッド並列化をある程度実装できることを確認した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:33:59 GMT)
Optimizing Bidding Strategies in First-Price Auctions in Binary Feedback Setting with Predictions [0.0] 本稿では,バイナリフィードバック下でのVickreyファーストプライスオークションについて検討する。
新しいアルゴリズムは過去の情報を用いて、BROAD-OMDアルゴリズムの残差を改善する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:29:36 GMT)
On the Semantics of Large Language Models [0.0] 大規模言語モデル(LLM)は、技術を通して人間の言語能力を再現する可能性を実証した。
これらのシステムが言語をどの程度理解しているかについては議論の余地がある。
質問を単語と文のレベルで LLM の意味論に絞り込むことで,この問題を考察する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:02:57 GMT)
Old Quantum Mechanics by Bohr and Sommerfeld from a Modern Perspective [0.0] ボーアの原子モデルとソマーフェルトによる拡張について、波動力学の数学的観点から検討する。
量子化規則とエネルギー準位の導出は、半古典的手法を用いて再検討される。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:54:18 GMT)
OGF: An Online Gradient Flow Method for Optimizing the Statistical Steady-State Time Averages of Unsteady Turbulent Flows [0.0] 乱流はカオス的で非定常であるが、その統計分布は統計的に安定な状態に収束する。
既存の計算手法では、グリッド点の物理的に代表される数へのスケーリングが不可能である。
我々は,大規模自由度システムにスケーラブルな新しいオンライン勾配流(OGF)法を開発した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:00:15 GMT)
Nonlocal characteristics and argand diagram of two-qubit gates [0.0] 2ビットゲートの絡み合う力は、弦の1組の2乗の長さで表すことができる。
2ビットゲートの線形エントロピーは、弦の両組の平方長を用いて表すことができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:04:18 GMT)
Non-ergodic one-magnon magnetization dynamics of the kagome lattice antiferromagnet [0.0] 平らなバンドによる非平衡ダイナミクスの例として, かごめ格子反強磁性体の1-マグノンダイナミクスの側面を示す。
局所化マグノンとも呼ばれる一次元デルタ鎖局所化固有状態と同様に、無秩序な局在が生じ、系が平衡するのを防ぐ。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:48:20 GMT)
NRXR-ID: Two-Factor Authentication (2FA) in VR Using Near-Range Extended Reality and Smartphones [0.0] 本稿では,拡張現実感システムとスマートフォンを用いて2要素認証を実現するNRXR-IDを提案する。
提案手法により,HMDを除去することなくスマートフォンによる認証課題を完了することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:00:09 GMT)
Moderate Adaptive Linear Units (MoLU) [0.0] 深層ニューラルネットワークのための新しい高性能アクティベーション関数であるModrate Adaptive Linear Unit (MoLU)を提案する。
MoLUはシンプルで美しく強力なアクティベーション関数であり、数百のアクティベーション関数の中で優れたメインアクティベーション関数となる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:44:01 GMT)
Mitigating quantum operation infidelity through engineering the distribution of photon losses [0.0] マルチポート干渉計は2ポートコンポーネントから構築することができる。
本研究では,この選択が干渉計による操作の質に与える影響について検討する。
非対称に設計された干渉計の恩恵を受ける操作もある。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:24:00 GMT)
Infrastructuring Contestability: A Framework for Community-Defined AI Value Pluralism [0.0] AI駆動システムの普及は、人間とコンピュータのインタラクションとコンピュータが支援する協調作業に課題をもたらす。
集中型のトップダウン定義に依存している現在の価値アライメントへのアプローチには、意味のある競争性のためのメカニズムが欠如している。
本稿では,このギャップに対処する社会技術フレームワークであるCommunity-Defined AI Value Pluralismを紹介する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:45:50 GMT)
From Wavefunctional Entanglement to Entangled Wavefunctional Degrees of Freedom [0.0] 光子間の絡み合いが、それらの特性体モード間の絡み合いと等価かどうかという問題は、鍵となるオープンな問題である。
私は、この微妙で永続的な問題に関して、光学モード間の相互作用を真の絡み合いに蒸留できる状況を説明することによって、新しく、より深く、物理的な洞察を提供する。
私は、文脈的におよび非局所的に絡み合った光子から、分離不能なフィールドモード内で量子魔法を蒸留するための新しい種類のプロトコルを定式化するために応用されるかもしれない。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:09:20 GMT)
From Autonomy to Agency: Agentic Vehicles for Human-Centered Mobility Systems [0.0] 本稿ではエージェント車両(AgV)を特徴付けるシステムレベルの枠組みを提案する。
AgVはエージェントAIを統合し、複雑な環境で推論、適応、相互作用を行う。
論文は、AgVsの開発とガバナンスにおける重要な課題を特定することで締めくくっている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:34:49 GMT)
Fine-tuning on simulated data outperforms prompting for agent tone of voice [0.0] 本研究では,言語モデルと特定の行動目標との整合性を考慮した微調整とシステムプロンプトの有効性について検討した。
この結果から,微調整システムの性能が向上し,会話応答の比率が高くなったことが示唆された。
シミュレーションデータ上の細調整された小型オープンウェイトLMは、特定のスタイリスティックな振る舞いを注入するための非常に効果的でデータ効率のよい方法である、と結論付けた。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:23:20 GMT)
FAMOUS: Flexible Accelerator for the Attention Mechanism of Transformer on UltraScale+ FPGAs [0.0] Transformer Neural Network(TNN)は、自然言語処理(NLP)、機械翻訳、コンピュータビジョン(CV)など、幅広いアプリケーション領域に応用されている。
本稿では、フィールドプログラマブルゲートアレイ(FPGA)上でのTNNの重み付きマルチヘッドアテンション計算のためのフレキシブルハードウェアアクセラレータである textitFamous を提案する。
並列性を改善し、レイテンシを低減するために、処理要素とオンチップメモリの高利用に最適化されている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:46:59 GMT)
Extreme Learning Machine Based System for DDoS Attacks Detections on IoMT Devices [0.0] Internet of Medical Things (IoMT)は、医療分野におけるパラダイムシフトである。
IoMT接続デバイスにいくつかの脆弱性があるため、IoMTネットワークに対する分散型サービス拒否(DDoS)攻撃が急速に増加している。
本稿では,IoMTデバイスに対するDDoS攻撃を検出するための極端学習マシンを探索することで,命を救うことを目的とする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:44:52 GMT)
Exploring Responsible Innovation efforts in Canada and the world [0.0] 責任あるイノベーション(RI)アプローチと指針原則が、この開発に対応するために提案されている。
我々は,産業から研究,政府に至るまで,世界及びカナダにおける実践的な取り組みについて検討し,RI枠組みの下での量子技術の進歩の現状を分析する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:52:04 GMT)
Exploring Agentic Artificial Intelligence Systems: Towards a Typological Framework [0.0] 本稿では,エージェントAIシステムのタイプを考案し,その認知・環境機関を日常構造として定義する8つの次元を紹介した。
このフレームワークは、研究者や実践者がAIシステムのさまざまなレベルのエージェンシーを分析することを可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:05:30 GMT)
Experimental investigation of single qubit quantum classifier with small number of samples [0.0] シリコンフォトニック集積回路上に実装された単一量子量子分類器を実験的に検討した。
入力あたりの平均光子サンプル数が約2つに減らされたとしても、分類器の精度は90%近く向上した。
これらの知見は、統合フォトニックプラットフォーム上での資源効率の高い量子機械学習の実現可能性を支持する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:42:58 GMT)
Experimental entropic uncertainty relations in dimensions three to five [0.0] 本研究では、高次元の互いに偏りのない固有状態を持つ観測対象のシャノンエントロピーに対する密なエントロピー不確実性関係の実験的検証を行う。
エントロピーの和の上限は決して破られず、不確実性関係を最小化する状態によって飽和している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:08:38 GMT)
Exact solution of Schrödinger equation for the complex Morse potential to investigate physical systems with position-dependent complex mass [0.0] 本稿では,複雑なモースポテンシャルの作用下で位置依存的な複素質量を持つ二原子粒子系の正確な基底状態解を提案する。
非エルミート・ハミルトニアンに固有の正規化の挑戦に焦点が当てられている。
このモデルは高エネルギーおよび宇宙物理学、特に暗黒物質のようなエキゾチックなシステムの量子的記述における潜在的な応用を提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 04:23:15 GMT)
Evolution of tripartite entanglement in three-qubit Quantum Gravity-Induced Entanglement of Masses (QGEM) with quantum decoherence [0.0] 量子ビット間の重力相互作用は、それらの間の真の三部構造が絡み合っていることを示す。
我々は,3つの量子ビットの可能な実験構成の性能を比較し,絡み込み証人による真の絡み合いの検出を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:27:17 GMT)
Evaluating Fake Music Detection Performance Under Audio Augmentations [0.0] 複数のシステムを用いて生成した実・合成音楽の双方からなるデータセットを構築した。
次に、様々なオーディオ変換を適用し、それらが分類精度にどのように影響するかを分析する。
我々は,近年の最先端音楽ディープフェイク検出モデルの性能を,音声拡張の有無で検証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:15:02 GMT)
Entropy from decoherence: a case study using glasma-based occupation numbers [0.0] 環境と相互作用するコヒーレント状態のデコヒーレンスによって生成されるエントロピー当たりの粒子である$S/N$を計算する。
コヒーレント状態は、高エネルギー核衝突の初期段階で発生したグラスマフィールドから借用された占有数によって特徴づけられる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:26:23 GMT)
Efficacy of Image Similarity as a Metric for Augmenting Small Dataset Retinal Image Segmentation [0.0] 合成画像の品質を評価するための一般的な指標は、2つの画像データセットの類似度を測定するFr'echet Inception Distance (FID)である。
本研究は, 標準画像と合成画像との強化動作が, 従来実施されていた実験と一致していることを示す。
トレーニングと増分データセットの間のFIDが減少するにつれて、増分データセットは画像セグメンテーションの重要かつ堅牢な改善に寄与することが示されている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:38:45 GMT)
Effects of Unplanned Incoming Flights on Airport Relief Processes after a Major Natural Disaster [0.0] 本研究の目的は, 自然災害後の空港における貨物取扱業務の遂行に, 着信便に関する不完全な知識が与える影響を理解することである。
エージェントベースのモデルが作成され、情報の不確実性の度合いが異なる現実的なオフロード戦略が実装される。
その結果、1機の無人機の効果は無視できることがわかった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:00:26 GMT)
Dual-Attention U-Net++ with Class-Specific Ensembles and Bayesian Hyperparameter Optimization for Precise Wound and Scale Marker Segmentation [0.0] 本稿では,チャネルワイズ(SCSE)と空間アテンション機構を統合した,新しいデュアルアテンション型U-Net++アーキテクチャを提案する。
提案手法はF1スコア0.8640を達成し、複雑な医療セグメンテーションタスクに対する効果を実証した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:24:15 GMT)
Dual frequency calibration to build a portable vapor cell optical clock with improved stability and without a frequency comb [0.0] 本稿では、2つのレーザー周波数を同時に正確に校正する新しい2重干渉計法を提案する。
2つの周波数校正レーザーは混合され、無線周波数でビート信号を生成し、ポータブルな光原子時計を作る。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:56:05 GMT)
Disentangling strategies and entanglement transitions in unitary circuit games with matchgates [0.0] ユニタリ回路ゲームでは、2つの競合するパーティ、すなわち「絡み合い」と「絡み合い」は、量子多体系において絡み合い相転移を誘導することができる。
我々は、相互作用しないフェルミオンの進化と等価に一致するマッチゲートダイナミクスの文脈内でそのようなゲームを分析する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:38:50 GMT)
DeepCS-TRD, a Deep Learning-based Cross-Section Tree Ring Detector [0.0] Deep CS-TRDは全断面の木の輪を検出する新しい自動アルゴリズムである。
深層学習に基づくアプローチ(U-Net)によりCS-TRDのエッジ検出ステップを置換する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:38:00 GMT)
Deep Learning to Automate Parameter Extraction and Model Fitting of Two-Dimensional Transistors [0.0] 電気的測定から2次元トランジスタの物理パラメータを抽出する深層学習手法を提案する。
物理に基づくデバイスシミュレータを近似するために、二次ニューラルネットワークを訓練する。
この方法は、500台のデバイスのシミュレーションから生成された電気データに基づいてニューラルネットワークをトレーニングした後、高品質な適合を可能にする。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:46:25 GMT)
Deep Learning for Absorption-Image Analysis [0.0] 画像回帰のための改良型ディープラーニング画像分類モデルを提案する。
データ収集における課題を克服するために、シミュレーション吸収画像のモデルを訓練する。
ディープラーニングモデルの性能を最小二乗法と比較し、ディープラーニングモデルが最小二乗法と同様の精度を達成することを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:02:59 GMT)
Condensed Encodings of Projective Clifford Operations in Arbitrary Dimension [0.0] 我々は、$n$-qudit射影クリフォード群に対する構造定理の注意深い解析と、その要素に対する様々な符号化スキームを提供する。
我々の結果はすべての整数に$dgeq2$、特に偶数の場合に適用されます。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:36:32 GMT)
Comprehensive Modeling of Camera Spectral and Color Behavior [0.0] 本稿では,RGBデジタルカメラのスペクトル応答をモデル化する新しい手法を提案する。
その結果,色忠実度とスペクトル精度を向上させる効果が示された。
このアプローチは、科学的、工業的、創造的な領域でカメラシステムを最適化するための強力なツールを提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 02:24:42 GMT)
Coherent information for CSS codes under decoherence [0.0] Calderbank-Shor-Steane (CSS) コードと呼ばれるクラスには、トーリックコード、カラーコード、フラクトンなど多くの重要な例が含まれている。
近年の研究では、これらのQECCの復号化遷移は、混合状態から情報理論量を計算することによって本質的に捕捉できることが示されている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 01:45:40 GMT)
Cloud Diffusion Part 1: Theory and Motivation [0.0] 画像集合にノイズを段階的に付加し、信号とノイズを分離するモデルを訓練することにより、画像生成機能の拡散モデルを構築する。
これらのモデルはより高速な推論、高周波の詳細の改善、制御性の向上につながると我々は主張する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:36:16 GMT)
Charge transport limited by nonlocal electron-phonon interaction. II. Numerically exact quantum dynamics in the slow-phonon regime [0.0] 断熱限界付近の1次元ピエルスモデルにおけるキャリア輸送について検討した。
過渡的局所化シナリオ (TLS) はHEOM力学を高温および強い相互作用において非常によく近似する。
この適度な状態における我々の発見はTLSの限界を示し、最も先進的な量子古典シミュレーションの結果を支持する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:50:37 GMT)
Charge transport limited by nonlocal electron-phonon interaction. I. Hierarchical equations of motion approach [0.0] 相関関数は階層的な運動方程式から得ることができることを示す。
1次元ピエルスモデルにおけるキャリアの正確な運動量を計算する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:43:13 GMT)
Bullshark on Narwhal: Implementation-level Workflow Analysis of Round-based DAG Consensus in Theory and Practice [0.0] Narwhal mempool上のラウンドベースのDAG BFTプロトコルであるBullsharkは、最適なパフォーマンスを実現している。
アルゴリズムのワークフローを、トランザクションの提出からブロックチェーンのコミットメントまで分析し、機能レベルで層ごとに分割します。
今後の研究は、ビザンチン断層環境の性能向上とCAP定理のトレードオフの最適化を目的としている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 12:56:45 GMT)
Building up spacetime with quantum entanglement [0.0] 古典的に連結された時空の出現は、量子重力の非摂動的記述における自由度の量子的絡み合いと密接に関連していると論じる。
時空の2つの領域に付随する自由度を遠ざけると、これらの領域は互いに引き離し、互いに挟み合うことができ、標準的絡み合いの測度によって定量化できる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:31:58 GMT)
Bardeen-Cooper-Schrieffer State Representation and Pairing in the Fermionic Tonks-Girardeau Gas [0.0] フェルミオン型トンクス・ジラルドーガスの基底状態波動関数の代替式を提案する。
第二量子化の枠組みで提案された波動関数を表現することにより、フェルミオン型トンクス・ジラルドーガスの基底状態が数保存状態であることを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:35:57 GMT)
Augmenting software engineering with AI and developing it further towards AI-assisted model-driven software engineering [0.0] 本稿は,AIを活用したソフトウェア工学の現状を概説し,それに対応する分類学であるai4seを開発した。
ソフトウェア開発におけるAI支援型ビッグデータのビジョンは、両方のアプローチに固有の利点を活かすことを目的としている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 08:58:47 GMT)
Assessing the Ecological Impact of AI [0.0] テクノロジーの哲学者は最近、AIの環境への影響に注意を払っている。
本提案は, 哲学的思想を取り入れたgenAIの持続可能性的側面の実際的分析を奨励するものである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 11:50:18 GMT)
Application and Evaluation of Large Language Models for Forecasting the Impact of Traffic Incidents [0.0] 本研究では,大規模言語モデル(LLM)の適用可能性について検討した。
本稿では,交通機能とLLM抽出インシデント機能の組み合わせによるインシデント影響を予測する,完全なLLMベースのソリューションを提案する。
実トラフィックインシデントデータセットを用いて、3つの高度なLCMと2つの最先端機械学習モデルの性能を評価する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:22:06 GMT)
Analise Semantica Automatizada com LLM e RAG para Bulas Farmaceuticas [0.0] 本研究では,大規模言語モデル(LLM)と組み合わせたRAGアーキテクチャを用いて,PDF形式の文書解析を自動化する。
本提案では, 埋め込み, 意味データ抽出, 文脈化自然言語応答の生成によるベクトル探索手法を統合する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:48:15 GMT)
An order-theoretic circuit syntax and characterisation of the concept lattice [0.0] 我々は、回路(弦図)の構文に順序論的アプローチを採り、回路を追加の入力出力構造で部分順序として扱う。
我々は、回路間の射を定義し、これらが有限の場合において、構文的回路書き換えの概念を定式化できることを示す分解定理を証明する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 19:18:37 GMT)
An Evaluation of Large Language Models on Text Summarization Tasks Using Prompt Engineering Techniques [0.0] 大規模言語モデル(LLM)は、人間のようなテキストを生成する能力を持って、自然言語処理の進歩を続けている。
CNN/Daily MailとNewsRoom(ニューズ)、SAMSum(ダイアログ)、ArXiv(サイエンティフィック)の4つのデータセットにまたがる6つのLCMを体系的に評価する。
本研究では,ROUGEとBERTScoreの測定値を用いて評価を行った。
Longドキュメントには、短いコンテキストウィンドウを持つLLMが複数の段階で拡張入力を要約できる文ベースのチャンキング戦略が導入されている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:34:05 GMT)
Advocate for Complete Benchmarks for Formal Reasoning with Formal/Informal Statements and Formal/Informal Proofs [0.0] 私たちは、オープンコード、オープンデータ、そして、完全でエラーのないベンチマークがこの分野の進歩を加速する立場を取っています。
私たちは、この分野に貢献するための障壁を生み出すプラクティスを特定し、それらを取り除く方法を提案します。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 07:27:45 GMT)
Advancing AI Negotiations: New Theory and Evidence from a Large-Scale Autonomous Negotiations Competition [0.0] 我々は国際AIネゴシエーションコンペティションを実施し、参加者はAI交渉エージェントのためのプロンプトを設計・洗練した。
次に、さまざまな特徴と目的を持つ複数のシナリオにわたる、これらのエージェント間の180,000以上の交渉を支援しました。
驚くべきことに、温暖化 — 伝統的に人間関係を構築する特性 — は、すべての主要なパフォーマンス指標において、常に優れた結果に結びついています。
一方、支配的な代理人は特に価値を主張するのに効果的だった。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 21:41:49 GMT)
Action Space Reduction Strategies for Reinforcement Learning in Autonomous Driving [0.0] 強化学習(RL)は自動運転のための有望なフレームワークを提供する。
きめ細かい制御を支援するためにしばしば使われる大型で高次元のアクションスペースは、訓練の効率を阻害し、探査コストを増大させる。
我々は、自律運転におけるRLのための2つの新しい構造化された行動空間修正戦略を導入し、評価する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:58:08 GMT)
Accuracy and Consumption analysis from a compressed model by CompactifAI from Multiverse Computing [0.0] 本研究では,Llama 3.1 8Bcitellamaに適用した圧縮手法であるCompactifAIの性能評価を行った。
この結果から,CompactifAIを用いた圧縮モデルでは,計算資源を大幅に削減するだけでなく,モデル精度も向上し,より効率的でスケーラブルでコスト効率の高いモデルであることが判明した。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:01:39 GMT)
AI Mother Tongue: Self-Emergent Communication in MARL via Endogenous Symbol Systems [0.0] エージェントが内因性記号系を持つ場合、その神経表現は自然に自発的な意味的圧縮とナッシュ平衡による意味的収束を示す。
この発見は、象徴主義と接続主義を橋渡しするための新しい道を提供する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:52:49 GMT)
A streamlined demonstration that stabilizer circuits simulation reduces to Boolean linear algebra [0.0] Gottesman-Knillの定理は、安定化回路上の計算は古典的なコンピュータ上でシミュレートできるというものである。
このノートは、安定化回路とブール線型代数の間の接続をより明確にすることを目的としている。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:54:40 GMT)
A generalized Wasserstein-2 distance approach for efficient reconstruction of random field models using stochastic neural networks [0.0] ニューラルネットワークは,非制限条件下でのワッサーシュタイン2距離距離のランダム場モデルを再構成可能であることを証明した。
このニューラルネットワークは、提案した一般化された局所的なWasserstein-2損失関数を最小化することにより、効率的に訓練することができる。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:53:13 GMT)
A Runtime-Adaptive Transformer Neural Network Accelerator on FPGAs [0.0] ADAPTORは、FPGA上のトランスフォーマーエンコーダとデコーダの高密度行列計算のためのランタイム適応型アクセラレータである。
FPGAプラットフォームにリソースを分散するための効率的な行列タイリングが組み込まれている。
最新のFPGAベースのアクセラレータと比べて1.7~2.25$times$のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 06:11:30 GMT)
A Novel Approach for Estimating Positive Lyapunov Exponents in One-Dimensional Chaotic Time Series Using Machine Learning [0.0] 一次元時系列から正のリャプノフ指数(MLE)を推定するための機械学習に基づく新しい手法を提案する。
本手法は,従来の分析手法に代えて,頑健でデータ駆動型な手法を提供することにより,科学的妥当性を実証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 10:53:02 GMT)
A Note on Runtime Verification of Concurrent Systems [0.0] 本稿では,トレースベースの論理を利用して並列システムの検証を行う方法を提案する。
本稿は,LTrL式のためのトレース一貫性B"uchi Automaticaの構築を思い出し,よく理解されたモニタ合成手順でどのように利用するかを説明する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 09:50:59 GMT)
A Lightweight Deep Learning Model for Automatic Modulation Classification using Dual Path Deep Residual Shrinkage Network [0.0] 自動変調分類(AMC)はスペクトル効率を高める上で重要な役割を果たしている。
低複雑性と高い分類精度のバランスをとる軽量AMCモデルの必要性が高まっている。
本稿では,資源制約エッジデバイスに最適化された低複雑さ,軽量深層学習(DL)AMCモデルを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 00:37:54 GMT)
A General Class of Model-Free Dense Precision Matrix Estimators [0.0] 本稿では,経済学に広く応用可能なモデルフリーで高精度な行列推定器の試作について紹介する。
i) 精度行列推定誤差の非漸近境界、(ii) 固有信号対雑音の存在を明らかにし、(iv) 正確な集団空間性仮定を避けることができる。
その望ましい理論的性質に加えて、S&P 500指数の徹底的な実験的研究により、一般推定器のチューニングパラメータフリーな特殊ケースはシャープ比が2倍に上昇することを示す。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 05:07:17 GMT)
A Framework for Synthetic Audio Conversations Generation using Large Language Models [0.0] Conversa Synthは、複数のペルソナ設定を持つ大規模言語モデル(LLM)を使用して合成会話音声を生成するように設計されたフレームワークである。
このフレームワークはまず、さまざまなトピックにわたる多様で一貫性のあるテキストベースの対話を生成し、その後、TTS(text-to-speech)システムを使用して音声に変換する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 13:57:37 GMT)
A Dynamical Systems Perspective on the Analysis of Neural Networks [0.0] 動的システムを用いて機械学習アルゴリズムのいくつかの側面を分析する。
我々は、ディープニューラルネットワーク、(確率的な)勾配降下、および関連するトピックから動的ステートメントまで、さまざまな課題を再フォーマットする方法を実証する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 16:18:49 GMT)
A Comparative Study of Machine Learning Algorithms for Stock Price Prediction Using Insider Trading Data [0.0] 本研究は、インサイダー取引情報による株価の予測を行う機械学習アルゴリズムを実験的に検討する。
本研究では、決定木、ランダムフォレスト、異なるカーネルを持つサポートベクターマシン(SVM)、K平均クラスタリングなどのアルゴリズムの有効性について検討する。
本研究の目的は、金融アナリストや投資家が投資戦略を最適化する強力なアルゴリズムを選択するのを支援することである。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 15:33:52 GMT)
A COMPASS to Model Comparison and Simulation-Based Inference in Galactic Chemical Evolution [0.0] textttCOMPASSは、新しいシミュレーションベースの推論フレームワークである。
textttCOMPASSは、高次元、不完全、可変サイズの恒星量データセットを処理する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 14:45:41 GMT)
A 3D Machine Learning based Volume Of Fluid scheme without explicit interface reconstruction [0.0] 三次元領域上での多物質フローをシミュレーションする機械学習に基づくVolume of Fluid法を提案する。
この手法の斬新な点の1つは、以前に訓練されたニューラルネットワークを評価してフラックス分数を計算することである。
メッシュのサイズが0$h=1/N_hsearrow 0$になる傾向にあるため、数値収束は2つの参照スキームよりもよい。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 17:30:00 GMT)
2048: Reinforcement Learning in a Delayed Reward Environment [0.0] 遅延とスパース報酬は、強化学習(RL)エージェントの基本的な障害となる。
本稿では,長距離性能を直接最適化するための分散分散多段階RLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 07 Jul 2025 20:33:12 GMT)