Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.5] データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:54:14 GMT)
Whole-Body Conditioned Egocentric Video Prediction [98.9] 我々は、人間行動(PEVA)からエゴ中心のビデオを予測するモデルを訓練する。
身体の関節階層によって構成される運動的ポーズの軌跡を条件にすることで,人間の身体行動が1対1の視点から環境をどう形成するかをシミュレートする。
我々の研究は、複雑な現実世界の環境をモデル化し、人間の視点から映像を予測するエージェントの振る舞いを具体化するための最初の試みである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:59 GMT)
Baking Gaussian Splatting into Diffusion Denoiser for Fast and Scalable Single-stage Image-to-3D Generation and Reconstruction [97.9] 単一視点からのオブジェクト生成とシーン再構成のための新しい1段3次元拡散モデルDiffusionGSを提案する。
DiffusionGSはビュー一貫性を強制するために、各タイミングで3Dガウス点雲を直接出力する。
DiffusionGSは、オブジェクトやシーンのPSNR/FIDにおいて2.20dB/23.25と1.34dB/19.16の改善をもたらすことを示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:26:06 GMT)
From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents [96.7] 推論とエージェント能力を備えた大規模言語モデル(LLM)は、エージェントディープリサーチ(Agenic Deep Research)と呼ばれる新しいパラダイムを取り入れている。
静的なWeb検索から,計画,探索,学習を行う対話型エージェントベースのシステムへの進化を辿ります。
我々はエージェントディープリサーチが既存のアプローチを著しく上回るだけでなく、将来の情報探索において支配的なパラダイムになることを実証する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:18:00 GMT)
DynamicBench: Evaluating Real-Time Report Generation in Large Language Models [88.3] 提案するDynamicBenchは,大規模言語モデルのデータの保存と処理能力を評価するためのベンチマークである。
外部文書の提供または保持のシナリオでモデルを評価することで、DynamicBenchは、最新の情報を独立して処理したり、コンテキスト拡張を利用する能力を効果的に測定する。
GPT4oを7.0%,GPT4oを5.8%,GPT4oを7.0%,GPT4oを5.8%で上回り,本手法の有効性を確認した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:53:44 GMT)
ShotBench: Expert-Level Cinematic Understanding in Vision-Language Models [87.4] 映画言語理解のためのベンチマークである textbfShotBench を紹介する。
画像とビデオクリップから3.5k以上の専門家によるQAペアを収録し、200本以上の称賛された(オスカー賞にノミネートされた)映画から細心の注意を払ってキュレートしている。
ShotBench上でのビジョン・ランゲージ・モデル24件の評価では,特に細粒度の視覚的手がかりや複雑な空間的推論に苦慮している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:09:21 GMT)
Rethink Sparse Signals for Pose-guided Text-to-image Generation [79.9] 本稿では、ポーズ誘導画像生成のための頑健な制御性を有するスパース信号を備えた新しい空間位相制御ネット(SP-Ctrl)を提案する。
具体的には,OpenPoseを学習可能な空間表現に拡張し,キーポイント埋め込みを識別的かつ表現的とする。
動物・人間中心の画像生成タスクの実験により,本手法は最近の空間制御可能なT2I生成手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:57:44 GMT)
RobustSplat: Decoupling Densification and Dynamics for Transient-Free 3DGS [79.2] 3D Gaussian Splattingは、ノベルビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。
既存の手法は、過渡的なオブジェクトに影響されたシーンを正確にモデル化するのに苦労し、描画された画像のアーティファクトに繋がる。
2つの重要な設計に基づく堅牢なソリューションであるRobustSplatを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:46:51 GMT)
ToolScan: A Benchmark for Characterizing Errors in Tool-Use LLMs [77.8] TOOLSCANは、ツール使用タスクのLLM出力におけるエラーパターンを特定するための新しいベンチマークである。
もっとも顕著なLCMでも,これらの誤りパターンが出力に現れることを示す。
研究者たちは、TOOLSCANのこれらの洞察を使って、エラー軽減戦略をガイドすることができる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:05:54 GMT)
Decouple to Reconstruct: High Quality UHD Restoration via Active Feature Disentanglement and Reversible Fusion [77.1] 超高精細画像復元(UHD)は、高解像度のため、しばしば計算ボトルネックや情報損失に直面している。
本稿では,より難解な劣化情報を潜時空間に符号化しながら,容易に復元可能な背景情報を破棄する制御付き微分遠絡型VAEを提案する。
提案手法は,UHD画像復元の精度を向上し,UHD画像復元の6つの課題を1Mパラメータのみで実現し,VAEモデルにおける情報損失問題を効果的に軽減する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:24:48 GMT)
Compressed and Smooth Latent Space for Text Diffusion Modeling [75.9] テキスト生成のための新しいアプローチであるCosmosを紹介します。
我々は,トークンレベルの拡散モデルに匹敵する生成品質を維持しつつ,テキスト表現を8倍に圧縮できることを実証した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:05:13 GMT)
InfiniCube: Unbounded and Controllable Dynamic 3D Driving Scene Generation with World-Guided Video Models [75.0] InfiniCubeはダイナミックな3次元駆動シーンを高忠実かつ制御性で生成するスケーラブルな方法である。
制御可能でリアルな3Dドライビングシーンを生成でき、モデルの有効性と優越性を広範囲にわたる実験により検証できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:10:09 GMT)
Elucidating and Endowing the Diffusion Training Paradigm for General Image Restoration [73.5] 拡散モデルは、画像復元(IR)タスクにおいて強力な生成能力を示す。
それらの複雑なアーキテクチャと反復的なプロセスは、主流の再構築ベースの一般的な一般的なIRネットワークと比較して実用的応用を制限している。
既存のアプローチは主にネットワークアーキテクチャと拡散経路の最適化に重点を置いているが、一般的なIRフレームワークにおける拡散訓練パラダイムの統合を見落としている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:14:27 GMT)
Why Neural Network Can Discover Symbolic Structures with Gradient-based Training: An Algebraic and Geometric Foundation for Neurosymbolic Reasoning [73.2] 我々は、連続的なニューラルネットワークトレーニングのダイナミックスから、離散的なシンボル構造が自然に現れるかを説明する理論的枠組みを開発する。
ニューラルパラメータを測度空間に上げ、ワッサーシュタイン勾配流としてモデル化することにより、幾何的制約の下では、パラメータ測度 $mu_t$ が2つの同時現象となることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:40:30 GMT)
Spatial Mental Modeling from Limited Views [71.6] 新しいMindCubeベンチマークでは、3,268枚の画像に21,154件の質問があった。
MindCubeを用いて、視覚言語モデル(VLM)がいかに堅牢な空間精神モデルを構築するかを評価する。
次に、VLMが空間的メンタルモデルに近似する3つのアプローチを探索する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:38:19 GMT)
Bridging Offline and Online Reinforcement Learning for LLMs [71.5] オフラインから半オンラインに移行する際の大規模言語モデルの微調整における強化学習手法の有効性について検討する。
実験では、検証可能な数学のトレーニングに加えて、検証不可能な教育のトレーニングと、両方のベンチマーク評価のセットについて取り上げている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:25:49 GMT)
Beyond Reactive Safety: Risk-Aware LLM Alignment via Long-Horizon Simulation [69.6] 本稿では,モデル生成によるアドバイスが社会システムを通じてどのように伝播するかを示す概念実証フレームワークを提案する。
また、100の間接的な害シナリオのデータセットを導入し、害のないユーザプロンプトから有害で非有害な結果を予測するモデルの能力をテストする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:28:58 GMT)
Do It Yourself: Learning Semantic Correspondence from Pseudo-Labels [69.6] 本稿では,3D対応の擬似ラベルを用いた意味対応推定法を提案する。
具体的には, 3D-aware chaining を用いて得られた擬似ラベルを用いて, 既製の特徴を洗練するためのアダプタを訓練する。
データセット固有のアノテーションの必要性を減らしながら、SPair-71kに新たな最先端を4%以上の絶対的なゲインに設定しました。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:30:41 GMT)
CL-Splats: Continual Learning of Gaussian Splatting with Local Optimization [68.9] 本稿では,スパースシーンキャプチャから3次元表現を漸進的に更新するCL-Splatを紹介した。
CL-Splatsは、シーン内のアップデートと静的コンポーネントをセグメント化する堅牢な変更検出モジュールを統合する。
本実験により, CL-Splats は, 最先端の再構築品質を向上し, 効率的な更新を実現することを示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:32:37 GMT)
DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation [68.2] 拡散大言語モデル(dLLM)は自己回帰(AR)モデルの魅力的な代替品である。
本研究は,それらの認知過程と強化学習手法について考察する。
我々の研究は、dLLM生成のメカニズムについて深い洞察を与え、効果的な拡散ネイティブなRLトレーニングフレームワークを提供します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:46:40 GMT)
Efficient Image Generation with Variadic Attention Heads [67.0] 単変圧器のアテンションヘッドが複数の受容場に到達できるようにするための,単純かつ強力な手法を提案する。
筆者らは、近隣意識(NA)を利用して画像を生成するためのStyleGANベースのアーキテクチャに組み込む手法を実証した。
StyleNATと呼ばれるこの作業により、FFHQで2.05のFIDを達成することができ、StyleGAN-XLよりも6%改善されています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:07:48 GMT)
Reblurring-Guided Single Image Defocus Deblurring: A Learning Framework with Misaligned Training Pairs [65.3] 本稿では,単一画像デフォーカス・デブロアリングのためのリブロアリング誘導学習フレームワークを提案する。
我々のリブラーリングモジュールは、デブラーレッド画像とリブラーレッド画像と入力ぼかし画像との空間的整合性を保証する。
空間的に変化するぼやけは、再ブルーリングモジュールから引き出すことができ、トレーニング中にデフォーカスのぼやけマップの疑似監視として機能する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:05:39 GMT)
Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.6] 我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:53:59 GMT)
Aligned Novel View Image and Geometry Synthesis via Cross-modal Attention Instillation [62.9] ワーピング・アンド・インペインティング手法を用いて,新しいビューイメージと幾何学生成の整合性を実現する拡散型フレームワークを提案する。
手法は、既製の幾何学予測器を利用して、参照画像から見る部分的な幾何学を予測する。
生成した画像と幾何の正確なアライメントを確保するために, クロスモーダルアテンション蒸留法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:26:54 GMT)
Unveiling Causal Reasoning in Large Language Models: Reality or Mirage? [62.2] 因果推論能力は、強力な人工知能に向けて大きな言語モデルを進める上で重要である。
大規模言語モデル (LLM) は, 浅い (レベル-1) 因果推論しか実行できないことを示す。
本稿では,LLMの因果推論プロセスに一般知識と目標指向のプロンプトを組み込んだG2-Reasonerを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:11:01 GMT)
Learning Evaluation Models from Large Language Models for Sequence Generation [61.8] 本稿では,大規模言語モデルを用いた3段階評価モデルトレーニング手法を提案する。
SummEval ベンチマークによる実験結果から,CSEM は人間ラベルデータなしで評価モデルを効果的に訓練できることが示された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:00:23 GMT)
Fast Monte Carlo Tree Diffusion: 100x Speedup via Parallel Sparse Planning [61.7] 最近提案されたモンテカルロ木拡散(MCTD)は,木に基づく探索と拡散を組み合わせて,有望な解を提供する。
Fast-MCTDは、遅延ツリー更新と冗長性認識による並列ロールアウトを可能にするParallel MCTDと、軌道粗大化によるロールアウト長の削減を行うSparse MCTDの2つの技術を統合する。
実験により、Fast-MCTDは標準MCTDよりも最大100倍の高速化を実現し、計画性能を維持または改善した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:52:43 GMT)
Capacity-Constrained Online Learning with Delays: Scheduling Frameworks and Regret Trade-offs [60.8] 我々は,遅れたフィードバックのために,過去のラウンドを同時に追跡できる回数を制限する,斬新な「透明さ」の下で,難解な遅延を伴うオンライン学習について研究する。
我々のアルゴリズムは、全てのキャパシティレベルにおいてミニマックスの後悔を達成し、性能は最適以下のキャパシティで優雅に低下する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:47:52 GMT)
EgoAdapt: Adaptive Multisensory Distillation and Policy Learning for Efficient Egocentric Perception [59.9] EgoAdaptは、エゴセントリックな知覚タスク間で効率的な推論を可能にするために、クロスモーダル蒸留とポリシー学習を適応的に行うフレームワークである。
その結果、EgoAdaptは効率を大幅に向上し、GMACを89.09%、パラメータを82.02%、エネルギーを9.6倍に削減した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:09:16 GMT)
RS-vHeat: Heat Conduction Guided Efficient Remote Sensing Foundation Model [59.4] 本稿では,効率的なマルチモーダルリモートセンシング基盤モデルであるRS-vHeatを紹介する。
具体的には、RS-vHeatは、O(N1.5)$の複雑さを持つ熱伝導演算子(HCO)と、大域的受容場を適用している。
注意に基づくリモートセンシング基礎モデルと比較して、メモリ使用量を84%削減し、FLOPを24%削減し、スループットを2.7倍改善する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:51:21 GMT)
OracleFusion: Assisting the Decipherment of Oracle Bone Script with Structurally Constrained Semantic Typography [58.8] Oracle Bone Script (OBS) は古代文明の文化記録と知的表現をカプセル化している。
約4,500のOBS文字が発見されたが、解読されたのは1,600文字程度である。
本稿では,OracleFusionという新しい2段階セマンティックフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:56:07 GMT)
Thinkless: LLM Learns When to Think [57.9] 推論モデル(Reasoning Language Models)は、複雑な論理的推論を必要とするタスクにおいて顕著な性能を示す。
我々は,LLMが短文推論と長文推論を適応的に選択できる学習可能なフレームワークであるThinklessを提案する。
Minerva Algebra、MATH-500、GSM8Kなどのベンチマークでは、Thinklessはロングチェーン思考の使用を50%から90%削減することができる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:06:49 GMT)
DWIM: Towards Tool-aware Visual Reasoning via Discrepancy-aware Workflow Generation & Instruct-Masking Tuning [57.3] 構成的視覚的推論アプローチは、エンド・ツー・エンドのVR手法よりも効果的な戦略として期待されている。
DWIM: ツールの使用状況を評価し, より訓練に有効である抽出を行う, 離散性を考慮したトレーニング生成手法を提案する。
Instruct-Masking fine-tuning — モデルに効果的なアクションをクローンすることのみをガイドし、より実用的なソリューションの生成を可能にする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:13:38 GMT)
Can Gradient Descent Simulate Prompting? [56.6] 勾配は新しい情報に対する条件付けの効果を更新する。
勾配降下訓練は、引き起こされたモデルパフォーマンスのいくつか(時には全て)を回復する。
長文モデリングのための新しい道のりを示唆する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:06:20 GMT)
Holistic Surgical Phase Recognition with Hierarchical Input Dependent State Space Models [56.2] 手術映像解析のための階層型入力依存状態空間モデルを提案する。
本フレームワークは,時間的一貫した視覚特徴抽出器を内蔵し,状態空間モデルヘッドを視覚特徴抽出器に付加し,時間的情報を伝達する。
実験により,本手法は最先端の手法よりも高い性能を示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:43:57 GMT)
A Survey on Model Extraction Attacks and Defenses for Large Language Models [55.6] モデル抽出攻撃は、デプロイされた言語モデルに重大なセキュリティ脅威をもたらす。
この調査は、抽出攻撃と防御攻撃の包括的分類、機能抽出への攻撃の分類、データ抽出の訓練、およびプロンプトターゲット攻撃を提供する。
モデル保護,データプライバシ保護,迅速なターゲット戦略に編成された防御機構について検討し,その効果を異なる展開シナリオで評価する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:02:01 GMT)
Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application [55.4] 生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
意味的特徴抽出のための変分オートエンコーダを組み合わせた潜在拡散モデル(LDM)に基づくセマンティックコミュニケーションフレームワークを提案する。
提案システムはゼロショットの一般化をサポートし,低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現する訓練自由フレームワークである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:21:59 GMT)
Aligning Spoken Dialogue Models from User Interactions [55.2] 本稿では,ユーザの対話からリアルタイム会話における音声対話モデルを改善するための新しい嗜好アライメントフレームワークを提案する。
AIフィードバックを付加した生のマルチターン音声会話から15万以上の好みペアのデータセットを作成する。
本研究は, 自然なリアルタイム音声対話システムにおいて重要な, 様々な力学におけるバランスの整合性の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:45:20 GMT)
Evaluating List Construction and Temporal Understanding capabilities of Large Language Models [54.4] 大規模言語モデル(LLM)は、特に時間的理解タスクにおける幻覚や誤りの影響を受けやすい。
本稿では,時系列に適合するリスト形式で構造化された回答を必要とするTLQA(Time Referenceed List based Question Answering)ベンチマークを提案する。
閉書およびオープンドメイン設定におけるTLQA上の最先端生成モデルの時間的理解とリスト構築能力について検討する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:40:58 GMT)
Structuring the Unstructured: A Multi-Agent System for Extracting and Querying Financial KPIs and Guidance [54.3] 構造化されていない財務文書から定量的な洞察を抽出する,効率的でスケーラブルな手法を提案する。
提案システムは,emphExtraction AgentとemphText-to-Agentの2つの特殊エージェントから構成される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:56:31 GMT)
PCDVQ: Enhancing Vector Quantization for Large Language Models via Polar Coordinate Decoupling [53.9] ベクトル量子化(VQ)は、非常に低ビット(2ビットでも)で精度の高いこの問題に対する一般的な解決策である。
本稿では,効率的なVQフレームワークであるPola Coordinate Decoupled Vector Quantization (PCDVQ)を提案する。
実験の結果、PCDVQは2ビットレベルのベースライン法を少なくとも1.5%ゼロショット精度で上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:17:49 GMT)
StateSpaceDiffuser: Bringing Long Context to Diffusion World Models [53.1] 本稿では、状態空間モデルから機能を統合することで、拡散モデルが長時間コンテキストタスクの実行を可能にするStateSpaceDiffuserを紹介する。
この設計は拡散モデルの高忠実性合成を保ちながら長期記憶を復元する。
実験の結果、StateSpaceDiffuserは強力な拡散のみのベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:10:36 GMT)
ThinkSound: Chain-of-Thought Reasoning in Multimodal Large Language Models for Audio Generation and Editing [52.3] textbfThinkSoundは、Chain-of-Thought(CoT)推論を利用して、ビデオの段階的にインタラクティブなオーディオ生成と編集を可能にする新しいフレームワークである。
提案手法は,3つの相補的な段階に分解する: セマンティック・コヒーレント, 正確なユーザインタラクションによる対話型オブジェクト中心の洗練, 自然言語命令でガイドされたターゲット編集。
実験により、ThinkSoundはオーディオメトリクスとCoTメトリクスの両方で、ビデオからオーディオ生成における最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:32:06 GMT)
QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning [52.2] 本稿では,不均衡な活性化分布を量子化困難の原因として同定する。
我々は,これらの分布を,より量子化しやすいように微調整することで調整することを提案する。
本手法は3つの高解像度画像生成タスクに対して有効性を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:36:29 GMT)
DeOcc-1-to-3: 3D De-Occlusion from a Single Image via Self-Supervised Multi-View Diffusion [50.9] 単一の画像から3Dオブジェクトを再構築することは、長年の課題である。
最近の拡散型ビュー合成モデルでは、単一のRGB画像から一貫した新しいビューを生成することができる。
しかし、一般的に完全な視覚的な入力を仮定し、オブジェクトの一部が隠されているときに失敗する。
本稿では,オクルージョンを意識したマルチビュー生成のためのエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:58:26 GMT)
Identifying Speaker Information in Feed-Forward Layers of Self-Supervised Speech Transformers [50.9] 我々は,k-meansの自己監督的特徴とi-vectorに関連するニューロンを解析した。
分析の結果,これらのクラスタは幅広い音韻クラスとジェンダークラスに対応していることがわかった。
これらのニューロンをプルーニング中に保護することにより、話者関連タスクの性能を著しく維持することができる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:54:26 GMT)
Do We Really Need GNNs with Explicit Structural Modeling? MLPs Suffice for Language Model Representations [50.5] グラフニューラルネットワーク(GNN)は構造情報を十分に活用できないが、MLP(Multi-Layer Perceptrons)は構造認識タスクにおいて驚くべき能力を示す。
本稿では,情報理論の観点から総合的な探索フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:10:28 GMT)
Red Teaming for Generative AI, Report on a Copyright-Focused Exercise Completed in an Academic Medical Center [50.1] GPT4DFCIは、Dana-Farber Cancer InstituteとMicrosoftによって開発された内部AIツールである。
ツールをサポートするGPTモデルが著作権データを出力するかどうかを検証した。
我々は,GPT4DFCIが著作権のある資料を識別し,有名な書籍の正確な引用を再現できる孤立した事例を発見した。
この結果、2025年1月21日に展開されたGPT4DFCI v2.8.2で緩和戦略が実施されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:11:49 GMT)
Generalized Tensor-based Parameter-Efficient Fine-Tuning via Lie Group Transformations [50.0] さまざまな下流タスクに事前訓練された基礎モデルを適用することは、人工知能のコアプラクティスである。
これを解決するために、LoRAのようなパラメータ効率細調整(PEFT)手法が登場し、研究の焦点となっている。
本稿では,行列型PEFT法を高次元パラメータ空間に拡張する一般化法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:12:59 GMT)
Testing Causal Models with Hidden Variables in Polynomial Delay via Conditional Independencies [50.0] 観測データに対して仮説化された因果モデルをテストすることは、多くの因果推論タスクにとって重要な前提条件である。
モデルは指数関数的に多くの条件付き独立関係(CI)を仮定できるが、これら全てをテストすることは実用的でなく不必要である。
隠れ変数を持つ因果グラフのc-LMPを導入し、これらのCIを多時間間隔でリストする遅延アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:51:29 GMT)
Fake it till You Make it: Reward Modeling as Discriminative Prediction [49.3] GAN-RMは、手動の嗜好アノテーションと明示的な品質次元工学を排除した効率的な報酬モデリングフレームワークである。
提案手法は,少数の対象サンプルを識別し,報酬モデルを訓練する。
実験では、GAN-RMが複数の主要なアプリケーションにまたがって有効であることを実証した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:39:32 GMT)
Regret Bounds for Robust Online Decision Making [49.2] 構造化された観察による意思決定」を一般化する枠組みを提案する。
この枠組みでは、各モデルは各決定を結果に対する確率分布の凸集合と関連付ける。
次に、この枠組みに対する後悔の束縛の理論を導出します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:54:55 GMT)
World-aware Planning Narratives Enhance Large Vision-Language Model Planner [49.0] LVLM(Large Vision-Language Models)は、複雑なシナリオに苦しむ計画タスクを具体化する。
我々は,LVLMを包括的環境理解に注入するフレームワークであるワールド・アウェア・プランニング・ナラティブ・エンハンスメント(WAP)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:20:55 GMT)
FineWeb2: One Pipeline to Scale Them All -- Adapting Pre-Training Data Processing to Every Language [48.8] 我々は、FineWebをベースにした、新しいトレーニング済みデータセットキュレーションパイプラインを導入する。
我々のパイプラインは、以前のデータセットよりもパフォーマンスの高いモデルを生成する非英語コーパスを作成するために使用できることを示す。
パイプラインを約100のCommon Crawlスナップショットを使用して1000以上の言語に拡張し、新たに20テラバイト(50億ドキュメント)のマルチリンガルデータセットであるFinWeb2を生成しました。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:01:47 GMT)
SweepEvGS: Event-Based 3D Gaussian Splatting for Macro and Micro Radiance Field Rendering from a Single Sweep [48.3] SweepEvGSは、イベントカメラを活用して、単一のスイープから堅牢で正確な新しいビュー合成を行う、新しいハードウェア統合手法である。
SweepEvGSの強靭性と効率性は,3つの異なる画像環境における実験により検証した。
以上の結果から,SweepEvGSは視覚的レンダリング品質,レンダリング速度,計算効率において,既存の手法を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:39:49 GMT)
Materialist: Physically Based Editing Using Single-Image Inverse Rendering [47.9] マテリアルスト(Materist)は、学習に基づくアプローチと物理的にベースとしたプログレッシブ・差別化可能なレンダリングを組み合わせる方法である。
我々のアプローチは、マテリアル編集、オブジェクト挿入、リライトなど、幅広いアプリケーションを可能にする。
実験は、合成および実世界のデータセット間で強力なパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:22:07 GMT)
Tree-based variational inference for Poisson log-normal models [47.8] 階層木は、しばしば近接基準に基づいてエンティティを組織するために使用される。
現在のカウントデータモデルは、この構造化情報を利用していない。
本稿では,PLNモデルの拡張としてPLN-Treeモデルを導入し,階層的カウントデータをモデル化する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:54:53 GMT)
KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model [47.0] 汎用的・コンパクトな埋め込みモデルである KaLM-Embedding-V2 は汎用テキスト埋め込みタスクにおいて優れた性能を発揮する。
i) 大規模弱教師付きオープンソースコーパスの事前トレーニング、(ii) 高品質な検索と非検索データセットの微調整、(iii) 堅牢な一般化のためのモデル-バックアップパラメータ平均化。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:09:44 GMT)
Devil's Hand: Data Poisoning Attacks to Locally Private Graph Learning Protocols [46.9] この研究は、ローカルなプライベートグラフ学習プロトコルをターゲットにした、最初のデータ中毒攻撃を導入している。
攻撃者は偽のユーザーをプロトコルに注入し、偽のユーザーを操作して本物のユーザーとリンクを確立する。
攻撃の有効性は理論的にも経験的にも示される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:18:21 GMT)
Mitigating Hidden Confounding by Progressive Confounder Imputation via Large Language Models [46.9] 大規模言語モデル (LLMs) を用いた隠れコンファウンディングの軽減に向けた最初の試みを行う。
本稿では,LLMのセマンティック知識と世界知識を利用して,隠れた共同創設者を反復的に生成し,指示し,検証するフレームワークであるProCIを提案する。
大規模な実験により、ProCIは有意義な共同設立者を明らかにし、治療効果の推定を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:49:13 GMT)
ZKPROV: A Zero-Knowledge Approach to Dataset Provenance for Large Language Models [46.7] LLM証明のゼロ知識証明を可能にする新しい暗号フレームワークであるZKPROVを紹介する。
モデルが信頼できるデータセット上でトレーニングされていることを、モデルやパラメータに関する機密情報を公開せずに確認することができる。
本手法は,学習段階の証明を回避しつつ,ゼロ知識証明を通じてトレーニングデータセットにトレーニングモデルを暗号的にバインドする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:49:02 GMT)
SiM3D: Single-instance Multiview Multimodal and Multisetup 3D Anomaly Detection Benchmark [46.4] 総合的な3次元異常検出・セグメンテーション(ADS)のためのマルチビュー情報とマルチモーダル情報の統合を考慮した最初のベンチマークであるSiM3Dを提案する。
SiM3Dは、製造に高い関心を持つシナリオに焦点を当てている。
SiM3Dには、トップレベルの産業用センサーとロボットを使用して取得される、新しいマルチモーダルマルチビューデータセットが含まれている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:55 GMT)
Small Encoders Can Rival Large Decoders in Detecting Groundedness [45.1] 大規模言語モデル(LLM)を外部コンテキストで拡張することで、自然言語処理(NLP)タスクのパフォーマンスが大幅に向上する。
本研究は,LLMによるコストのかかる回答生成の前に,与えられたクエリがコンテキストで提供されるドキュメントにグラウンドドされているかを検出することに焦点を当てる。
我々は,RoBERTa や NomicBERT などの軽量なタスク固有エンコーダモデルにおいて,キュレートされたデータセットを微調整することで,最先端の LLM に匹敵する精度が得られることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:09:41 GMT)
Personalized Federated Learning via Dual-Prompt Optimization and Cross Fusion [44.9] フェデレートラーニング(FL)は、ローカルデータを共有せずに、分散化されたクライアント間で協調的なモデルトレーニングを可能にする。
我々は,pFedDCと呼ばれる,二重プロンプト学習と相互融合に基づくパーソナライズされたFLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:59:14 GMT)
Moderating the Generalization of Score-based Generative Model [44.7] 我々は,第1次モデレートスコアベース生成モデル(MSGM)を提案する。
MSGMは、連続時間微分方程式過程において、望ましくないデータからスコア関数をリダイレクトする。
大規模な実験結果から,MSGMは望ましくないコンテンツを生成する可能性を著しく低下させることが示された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:06:00 GMT)
HieraSurg: Hierarchy-Aware Diffusion Model for Surgical Video Generation [44.4] 2つの専門拡散モデルからなる階層型手術ビデオ生成フレームワークであるHieraSurgを提案する。
このモデルは、既存のセグメンテーションマップが提供される際に特にきめ細かい付着を示しており、実際的な外科的応用の可能性を示している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:07:23 GMT)
Unsupervised Learning for Optimal Transport plan prediction between unbalanced graphs [44.0] グラフ間の最適な転送は、グラフ構造の比較と整合のための強力なツールである。
本稿では、この問題を解決する方法として、不均衡輸送(ULOT)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:01:32 GMT)
Model State Arithmetic for Machine Unlearning [43.8] 我々は,データポイントの影響を推定し,解消するための新しいアルゴリズムであるMSAを提案する。
実験の結果、MSAは既存の機械学習アルゴリズムよりずっと優れています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:16:16 GMT)
WorldVLA: Towards Autoregressive Action World Model [43.7] 本稿では,行動と画像の理解と生成を統一する自己回帰行動世界モデルWorldVLAを提案する。
WorldVLAは1つのフレームワークでVision-Language-Action(VLA)モデルとWorld Modelを相互運用する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:55:40 GMT)
APO: Enhancing Reasoning Ability of MLLMs via Asymmetric Policy Optimization [43.3] MLLM(Multimodal Large Language Models)は多様なデータを統合する能力があるが、複雑な推論に苦しむことが多い。
本研究は,KLのペナルティと過剰思考がMLLMのRLトレーニングにどのように影響するかを検討する。
正試料については,KLの分散重み付けを困難度に基づいて動的に調整するために,DADS(Difficulty-Adaptive Divergence Shaping)を導入している。
負のサンプルに対しては、過度に長い応答をペナルタイズするために、最適軌道複雑度正規化(STCR)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:57:08 GMT)
The Value of Gen-AI Conversations: A bottom-up Framework for AI Value Alignment [42.4] 倫理的IT設計のためのISOバリューベースエンジニアリング標準の価値を利用して、価値アライメントのための新しいボトムアップアプローチを提案する。
ヨーロッパの主要雇用者CAの会話ログ16,908件から,倫理的に敏感なシステムアウトプット593件を分析した。
その結果、9つのコア値と32の異なる値の不一致がユーザに与える影響が判明した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:57:07 GMT)
JointDiT: Enhancing RGB-Depth Joint Modeling with Diffusion Transformers [41.8] RGBと深さの関節分布をモデル化した拡散変圧器であるJointDiTを提案する。
JointDiTは高忠実度画像を生成するが、幾何学的に可視で正確な深度マップも生成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:21:40 GMT)
Learning to See in the Extremely Dark [41.4] 我々は、高解像度のRAW画像を生成することができるペア対ペアデータ合成パイプラインを提案する。
See-in-Extremely-Dark(SIED)と呼ばれる大規模なペアデータセットは、低照度RAW画像拡張アプローチのベンチマークに使用される。
非常に低SNR RAW入力から視覚的満足度を回復する拡散型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:24:07 GMT)
ARTalk: Speech-Driven 3D Head Animation via Autoregressive Model [41.4] 音声駆動型3D顔アニメーションは、任意の音声クリップから3Dヘッドモデルのリアルな唇の動きと表情を生成することを目的としている。
本研究では,高度に同期した唇の動きと,リアルな頭部ポーズと瞬きをリアルタイムに生成する自己回帰モデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:10:09 GMT)
ToMiE: Towards Explicit Exoskeleton for the Reconstruction of Complicated 3D Human Avatars [41.2] 本研究では,骨格の接合木を適応的に拡大させる成長戦略を提案する。
具体的には、ToMiEと呼ばれる手法は、親関節の局在化と外部関節の最適化からなる。
ToMiEは、レンダリング品質だけでなく、成長したジョイントのフリーアニメーションを提供することで、ハンドヘルドオブジェクトやゆるやかな服装で、さまざまなケースで他の方法よりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:47:51 GMT)
Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity [41.0] スパース・レグ(Sparse-Reg)は、オフライン強化学習における過度適合を軽減するために、スパースをベースとした正規化手法である。
オフラインのRLアルゴリズムは、小さなデータセットに過度に適合し、結果として性能が低下することを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:55:13 GMT)
Early Stopping Tabular In-Context Learning [40.6] テキスト内学習を早期に行うことを提案する。
トランスフォーマーエンコーダの各レイヤの後にコンテキスト内学習を停止させるかどうかを動的に評価することでこれを実現する。
一旦停止すると、プレトレーニングされたレイヤワイズデコーダを使って埋め込みをデコードします。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:36:37 GMT)
Towards Text-free Graph Foundation Models: Rethinking Multi-Domain Graph Contrastive Learning [40.6] 本稿では,MDGCLという,新しいマルチドメイン事前学習およびクロスドメイン転送フレームワークを提案する。
事前学習の段階では、ドメインの違いを実質的に認識し、キャプチャするための対照的な学習戦略を設計する。
下流の段階では、細かなドメイン知識の伝達を可能にするためのドメインアテンション機構を導入する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:14:50 GMT)
Crosstalk-Resilient Quantum MIMO for Scalable Quantum Communications [40.4] クロストークは物理的に結合した量子モードが干渉し、信号の忠実度が低下するときに発生する。
本稿では、離散可変量子情報を連続可変モードに符号化することに基づく緩和戦略を提案する。
論理情報の回復を可能にするゲージ固定デコーダの存在を実証する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:40:26 GMT)
Counter-propagating spontaneous parametric down-conversion source in lithium niobate on insulator [40.1] 絶縁体にニオブ酸リチウムを添加し, 信号とアイドラー光子を反対方向に生成する光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子対光子
その結果、統合された高純度で調整可能な光子源への新たな経路が確立された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:44:16 GMT)
NaLaFormer: Norm-Aware Linear Attention for Transformer Models [40.0] そこで本研究では,ノルム・アウェア・リニア・アテンション(Norm-Aware Linear Attention)機構を提案する。
我々は、NaLaFormerが視覚および言語タスクのパフォーマンスを改善し、表現性と効率の両方を最大4.2%向上させることを実証する広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:47:39 GMT)
Meson spectroscopy of exotic symmetries of Ising criticality in Rydberg atom arrays [39.6] はしごに2つのイジング鎖を結合すると、よりリッチな$mathcalD(1)_8$対称性が得られる。
ここでは、これらの創発対称性をRydberg原子処理ユニットで探索し、その幾何学を活用して、チェーン構成とラグ構成の両方を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:19:30 GMT)
Generative Data Mining with Longtail-Guided Diffusion [39.5] トレーニング中に追加データを想像することで,プロアクティブなロングテール発見プロセスを開発する。
我々はこれらの信号をガイダンスとして利用し、潜在拡散モデルから追加のトレーニングデータを生成する。
中間拡散状態に予測モデルを公開する必要はない。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:17:54 GMT)
BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing [39.2] 我々は、オブジェクト、カメラ、背景を再コンパイルすることで、新しいシーンを合成する生成的視覚合成フレームワークであるBlenderFusionを紹介する。
i)視覚入力を編集可能な3Dエンティティ(レイヤ)に分割・変換し、(ii)3Dグラウンド制御(編集)でブレンダーで編集し、(iii)生成合成装置(合成)を用いてコヒーレントなシーンに融合する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:46:40 GMT)
Semantic Scene Graph for Ultrasound Image Explanation and Scanning Guidance [38.9] 本研究では,超音波画像のシーングラフ(SG)を用いて画像内容の説明を行う。
予測されたSGは、超音波スキャンを行方不明の解剖に導く可能性を探っている。
左頸部領域と右頸部領域の画像に対して,SGによる画像説明とスキャン指導の有効性が検証された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:20:13 GMT)
CAT-SG: A Large Dynamic Scene Graph Dataset for Fine-Grained Understanding of Cataract Surgery [38.6] 本稿では,CAT-SGデータセットを紹介し,ツールとタスク間の相互作用,手続き的変動,時間的変動の構造化アノテーションを初めて提供する。
詳細な意味関係を取り入れることで、CAT-SGは外科的依存関係の全体像を提供し、外科的フェーズや技法をより正確に認識することができる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:25:23 GMT)
FoGE: Fock Space inspired encoding for graph prompting [38.2] 大規模言語モデル(LLM)は、グラフのような構造化データに関する質問を理解し、答えることができる。
既存の提案では、LLMに送信された拡張'プロンプトを生成するために、グラフのいくつかの記述を使用することが多い。
本稿では,Fock空間表現に基づくパラメータフリーグラフエンコーダの利用が,この問題設定において極めて多目的であることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:48:03 GMT)
Uncover Treasures in DCT: Advancing JPEG Quality Enhancement by Exploiting Latent Correlations [38.1] 本稿では、JPEG画像のDCT係数内の2つの重要な相関関係をフル活用するアドバンストDCT領域JPEG品質向上手法を提案する。
AJQE法は、多くの確立されたピクセルドメインモデルをDCT領域に適応させ、計算複雑性を低減して優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:08:18 GMT)
Prompting with Phonemes: Enhancing LLMs' Multilinguality for Non-Latin Script Languages [37.6] そこで本研究では,音声の書き起こしを補完信号として活用し,スクリプト不変表現を誘導する手法を提案する。
In-context Learning (ICL) における音素文字と正書法文字がそれぞれ異なる例を検索することを示す。
これにより、提案したMixed-ICL検索戦略のモチベーションが得られ、両者のさらなる集約により性能が大幅に向上する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:22:53 GMT)
Referring Expression Instance Retrieval and A Strong End-to-End Baseline [37.5] テキスト画像検索は、画像レベルの記述に基づいてギャラリーからターゲット画像を取得する。
Referring Expressionは、インスタンスレベルの記述を使用して、所定のイメージ内でターゲットオブジェクトをローカライズする。
我々は、インスタンスレベルの検索とローカライゼーションの両方をサポートする textbfReferring Expression Instance Retrieval (REIR) という新しいタスクを導入する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:31:17 GMT)
Double-Checker: Enhancing Reasoning of Slow-Thinking LLMs via Self-Critical Fine-Tuning [37.4] Double-Checkerは、ゆっくりと考えられた大きな言語モデルの推論能力を高めるために設計された、原則化されたフレームワークである。
総合的な推論ベンチマークを用いてDouble-Checkerの有効性を検証する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:05:45 GMT)
PoseMaster: Generating 3D Characters in Arbitrary Poses from a Single Image [37.3] エンドツーエンドで制御可能な3Dキャラクタ生成フレームワークであるPoseMasterを提案する。
具体的には、ポーズ変換と3Dキャラクタ生成をフローベースの3Dネイティブ生成フレームワークに統合する。
多条件制御の特異性を考慮すると、訓練中のポーズ条件と画像条件をランダムに空にして、ポーズ制御の有効性と一般化性を向上させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:03:14 GMT)
Efficient Skill Discovery via Regret-Aware Optimization [37.3] 我々は、スキル生成とポリシー学習のミニマックスゲームとしてスキル発見の枠組みを定めている。
本稿では,時間的表現学習に基づく後悔認識手法を提案する。
提案手法は高次元環境において15%ゼロショット改善を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:45:59 GMT)
ScaleGNN: Towards Scalable Graph Neural Networks via Adaptive High-order Neighboring Feature Fusion [37.2] スケーラブルで効果的なグラフ学習のためのマルチホップノード機能を適応的に融合する新しいフレームワークであるScaleGNNを提案する。
予測精度と計算効率の両面で,ScaleGNNは最先端のGNNよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:41:32 GMT)
Improving Stochastic Cubic Newton with Momentum [37.2] モーメントが推定値の分散を確実に安定化させることを示す。
グローバリゼーション手法を用いて収束点を証明した。
また、運動量を持つ凸ニュートン法を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:07:20 GMT)
Chain-of-Sketch: Enabling Global Visual Reasoning [37.1] グラフ、文字列、迷路、画像グリッドを含む、拡張されたグローバルなビジュアルデータセットを紹介します。
大規模なビジョンモデルは、これらのタスクを効率的に学習するのに依然として苦労している。
本稿では,この学習効率の低下を緩和するために,チェーン・オブ・スケッチ(CoS)と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:48:33 GMT)
ImplicitQA: Going beyond frames towards Implicit Video Reasoning [36.7] ImplicitQAは暗黙の推論でモデルをテストするために設計された新しいベンチマークである。
320以上の高品質なクリエイティビティビデオクリップから得られた、1Kの微妙な注釈付きQAペアで構成されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:53:54 GMT)
Enhancing User Engagement in Socially-Driven Dialogue through Interactive LLM Alignments [36.6] 対話を通じてユーザエンゲージメントを高めることは、社会主導の対話において重要な役割を担います。
対話型LLMは,対話の今後の発展のシグナルを活用することで,ユーザエンゲージメントを学習することができる。
対話型LLMにおけるユーザエンゲージメントを効果的に向上することを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:26:17 GMT)
FreeDNA: Endowing Domain Adaptation of Diffusion-Based Dense Prediction with Training-Free Domain Noise Alignment [36.3] 密接な予測タスクに対するドメイン適応(DA)は重要なトピックであり、未確認領域でテストすると、密接な予測モデルの性能が向上する。
本稿では,DA 機能を備えた DDP フレームワークのトレーニングフリー機構を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:54:27 GMT)
PhysRig: Differentiable Physics-Based Skinning and Rigging Framework for Realistic Articulated Object Modeling [36.3] スキニングとリギングはアニメーション、明瞭なオブジェクト再構成、モーショントランスファー、および4D生成の基本的な構成要素である。
既存のアプローチは主にリニアブレンドスキニング(LBS)に依存している。
我々はPhysRigを提案する。PhysRigは微分可能な物理ベースのスキンとリギングフレームワークである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:58:09 GMT)
TracLLM: A Generic Framework for Attributing Long Context LLMs [34.8] 我々は,長期LLMに適した最初の汎用コンテキストトレースバックフレームワークであるTracLLMを開発した。
我々のフレームワークは、既存の特徴属性手法の有効性と効率を向上させることができる。
評価の結果,TracLLMはLLMの出力に繋がる長い文脈でテキストを効果的に識別できることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:09:36 GMT)
Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge [34.7] 我々は,リアルタイムWebブラウジングと広範囲な情報合成を必要とする130の現実的,高品質,長期的タスクのベンチマークであるMind2Web 2を紹介する。
本稿では,時間的・複雑な回答を評価するための新しいエージェント・アズ・ア・ジャッジ・フレームワークを提案する。
我々は,9つのフロンティアエージェントサーチシステムと人間のパフォーマンスを総合的に評価し,詳細な誤り解析を行い,今後の発展に向けた洞察を得る。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:32:50 GMT)
WiS Platform: Enhancing Evaluation of LLM-Based Multi-Agent Systems Through Game-Based Analysis [34.6] 我々は、オープンでスケーラブルでリアルタイムに更新されたプラットフォームを導入し、ゲームに基づいてLLMベースのMASにアクセスし分析する(WiS)。
本プラットフォームには,(1)H Face上で利用可能なモデルをサポートする統一型モデル評価インタフェース,(2)モデル評価のためのリアルタイム更新型リーダーボード,(3)ゲーム勝利率,攻撃,防衛戦略,LLMの推論に関する総合的評価の3つが特徴である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:55:53 GMT)
LLM-Based Human-Agent Collaboration and Interaction Systems: A Survey [34.3] 大規模言語モデル(LLM)は、完全に自律的なエージェントの構築への関心が高まっている。
LLM-HASは、システムの性能、信頼性、安全性を高めるために、人為的な情報、フィードバック、制御をエージェントシステムに組み込む。
本稿は, LLM-HASの総合的かつ構造化された最初の調査である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:53:30 GMT)
TRIDENT: Tri-Modal Molecular Representation Learning with Taxonomic Annotations and Local Correspondence [34.0] TRIDENTは、分子SMILES、テキスト記述、分類機能アノテーションを統合し、リッチな分子表現を学習する新しいフレームワークである。
TRIDENTは11の下流タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:09:47 GMT)
DidSee: Diffusion-Based Depth Completion for Material-Agnostic Robotic Perception and Manipulation [33.9] 商用のRGB-Dカメラは、非ランベルト的対象に対するノイズの多い不完全な深度マップをしばしば生成する。
我々は,非ランベルト的オブジェクト上での深度補完のための拡散に基づくフレームワークである textbfDidSee を提案する。
DidSeeは、複数のベンチマークで最先端のパフォーマンスを達成し、堅牢な現実世界の一般化を示し、下流タスクを効果的に改善する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:18:42 GMT)
$\textrm{ODE}_t \left(\textrm{ODE}_l \right)$: Shortcutting the Time and Length in Diffusion and Flow Models for Faster Sampling [33.9] 本研究では,品質・複雑さのトレードオフを動的に制御できる相補的な方向について検討する。
我々は,フローマッチングトレーニング中に時間と長さの整合性項を用い,任意の時間ステップでサンプリングを行うことができる。
従来の技術と比較すると、CelebA-HQとImageNetのイメージ生成実験では、最も効率的なサンプリングモードで最大3倍のレイテンシ低下が見られた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:59:59 GMT)
TCDiff++: An End-to-end Trajectory-Controllable Diffusion Model for Harmonious Music-Driven Group Choreography [33.7] TCDiff++は、調和したグループダンスを生成するように設計された音楽駆動のエンドツーエンドフレームワークである。
ダンサー同士の衝突を緩和するため,ダンサー間の相対的な位置決めをよりよく維持するために,ダンサーの位置決め埋め込みを利用する。
単段スライディングの問題に対処するために,ダンサースワッピングパターンを示すスワップモードの埋め込みを導入する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:53:17 GMT)
Bias-Augmented Consistency Training Reduces Biased Reasoning in Chain-of-Thought [33.3] CoT(Chain-of- Thought prompting)は、言語モデル推論の説明可能性を改善する可能性がある。
また、CoTはモデルの動きに影響を与える要因を体系的に誤って表すこともできる。
まず、GPT-3.5-TurboとLlama-8bモデルに影響を与える9つの異なるバイアスのデータセットを作成します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:29:49 GMT)
ClimateIQA: A New Dataset and Benchmark to Advance Vision-Language Models in Meteorology Anomalies Analysis [32.9] Sparse Position and Outline Tracking (SPOT) は、視覚データにおける不規則な形状の領域を処理するために設計された新しいアルゴリズムである。
SPOTは、空間座標を抽出して不規則な形状の領域を特定し、局所化し、不規則な形状の構造化表現を可能にする。
SPOT上に構築したClimateIQAは,新しい気象学的視覚的質問応答データセットである。
ClimateIQAは、空間的手がかり、地理的メタデータ、分析データを組み込むことでVLMトレーニングを強化し、極端な気象特性の解釈と記述におけるモデルの精度を向上させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:46:53 GMT)
Stochastic Quantum Spiking Neural Networks with Quantum Memory and Local Learning [32.6] ニューロモルフィックと量子コンピューティングは、人工知能の進歩のための有望なパラダイムとして登場した。
本稿では、これらの課題に対処する量子スパイキング(SQS)ニューロンモデルを提案する。
SQSニューロンは、マルチキュービット量子回路を使用して、内部量子メモリを持つスパイクユニットを実現する。
提案したSQSNNモデルは、ニューロモルフィックコンピューティングの時系列効率を量子コンピューティングの指数的に大きな内部状態空間と融合させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:39:14 GMT)
Graph ODEs and Beyond: A Comprehensive Survey on Integrating Differential Equations with Graph Neural Networks [32.4] グラフニューラルネットワーク(GNN)と微分方程式(DE)は、近年顕著な相乗効果を示す研究分野として急速に進歩している。
既存の手法を分類し、その基礎となる原則を議論し、分子モデリング、交通予測、流行拡散といった分野にまたがる応用を強調します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:41:14 GMT)
HERMES: temporal-coHERent long-forM understanding with Episodes and Semantics [32.1] 本稿では,HERMESについて紹介する。
2つの汎用モジュールは、既存のビデオ言語モデルを強化したり、スタンドアロンシステムとして運用することができる。
HERMESは、ゼロショットとフル教師付き設定の両方において、複数の長ビデオ理解ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:46:37 GMT)
CovDocker: Benchmarking Covalent Drug Design with Tasks, Datasets, and Solutions [30.5] 共有結合の複雑さをよりよく捉えるために,共有ドッキングのベンチマークであるCovDockerを紹介した。
共有ドッキングプロセスは, 反応位置予測, 共有反応予測, 共有ドッキングの3つの主要なタスクに分解する。
結果は、同値医薬品設計の研究を進めるための厳格な枠組みとしてのベンチマークの役割を裏付けるものである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:28:07 GMT)
Data Efficacy for Language Model Training [29.9] データは言語モデル(LM)の訓練の基礎となる。
近年の研究では、トレーニングデータの最小または最適サブセットを選択することで、パフォーマンスを最大化することを目的としている。
本研究は、LMトレーニングにおけるデータの有効性を検討するための一般的なパラダイムであるDELTを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:07 GMT)
Wild refitting for black box prediction [29.7] 本稿では,インスタンスワイド平均二乗予測誤差に基づいて,高確率上限計算のための計算効率の良い修正手順を記述・解析する。
予測方法への単一のデータセットとブラックボックスアクセスのみを必要とするため、適切な残差を計算し、プリファクタ$rho$でそれらをシンメトリズしてスケーリングし、修正された予測問題を定義し、解決する3つのステップで構成される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:41:55 GMT)
MockLLM: A Multi-Agent Behavior Collaboration Framework for Online Job Seeking and Recruiting [29.7] モックインタビューインタラクションの生成と評価を行う新しいフレームワークである textbfMockLLM を提案する。
インタビュアーと候補の両方の役割をシミュレートすることで、MockLLMはリアルタイムと双方向のマッチングのための一貫性のある協調的なインタラクションを可能にする。
我々は、中国の主要な採用プラットフォームであるBoss Zhipinの実際のデータに基づいて、MockLLMを評価した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:33:55 GMT)
Weak-to-Strong GraphRAG: Aligning Weak Retrievers with Large Language Models for Graph-based Retrieval Augmented Generation [29.5] グラフベースの検索拡張生成(RAG)により、大規模な言語モデル(LLM)が幻覚を緩和できる。
本稿では、Refined Graph-based RAG (ReG)を導入し、弱いレトリバーをグラフベースRAGのLLMに整列させる。
ReGはLSMフィードバックを取り入れて、刺激的な信号を取り除き、監視の質を向上させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:40:23 GMT)
Inverse Design of Diffractive Metasurfaces Using Diffusion Models [28.9] メタサーフェス(Metagrounds)は、光の正確な制御を可能にする、エンジニアリングされたサブ波長構造からなる超薄い光学素子である。
逆設計では、構造と光学特性の間の複雑な非線形関係のため、所望の光学応答をもたらす幾何を決定することは困難である。
拡散モデルの生成能力を計算設計に組み込むことにより,これらの課題に対処する。
本研究では,空間的に均一な強度スプリッタと偏光ビームスプリッタの設計に対するアプローチを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:10:30 GMT)
Enhancing LLM Tool Use with High-quality Instruction Data from Knowledge Graph [28.1] 本稿では,知識グラフを用いて,大規模言語モデルのための高品質な命令データを生成する手法を提案する。
エンティティ間の関係を実行可能なツールに変換し、各クエリの経路を詳細なソリューションステップに解析します。
実験の結果,この合成データの小さなサンプルを微調整することで,LLMのツール利用率や全体的な能力を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:45:15 GMT)
Instella-T2I: Pushing the Limits of 1D Discrete Latent Space Image Generation [27.8] 画像のコンパクトな離散表現のための1次元バイナリ画像ラテントを提案する。
提案手法は, 1次元ラテントのコンパクト性を維持しながら, 高分解能の細部を保存できる。
我々のテキスト・ツー・イメージモデルは、拡散と自己回帰の両方で競合する性能を達成した最初のモデルです。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:48:36 GMT)
Video Virtual Try-on with Conditional Diffusion Transformer Inpainter [27.2] Video Virtual try-onは、連続したビデオフレーム内の被服を対象者にフィットさせることを目的としている。
近年の拡散型ビデオ試行法は, ほとんどないが, 類似の解法と一致している。
本稿では,VTI(Video Try-on Inpainter)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:56:27 GMT)
3D Hierarchical Panoptic Segmentation in Real Orchard Environments Across Different Sensors [26.8] 本研究では, 異なるセンサから得られた3次元データに基づいて, リンゴ果樹の階層的パノプティックセグメンテーションの問題に対処する新しいアプローチを提案する。
我々のアプローチは、セマンティックセグメンテーション、トランクと果物のインスタンスセグメンテーション、木のインスタンスセグメンテーションを同時に提供できる。
我々のデータセットはドイツのボンで記録されており、さまざまなセンサーが付いた本物のリンゴ果樹園で、地上レーザースキャナーから、さまざまなロボットプラットフォームに搭載されたRGB-Dカメラにまたがっている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:40:00 GMT)
HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context [26.5] 不適切な文脈理解は、モデルがマルチモーダルな文脈を誤って解釈し、誤った答えをもたらすときに起こりうる。
ショートカット問題は、モデルがマルチモーダル入力において重要な手がかりを見落とし、マルチモーダル情報を考慮せずにクエリに直接対処する場合に発生する。
我々は、複雑な人間の意図や感情を理解するためのモデルを評価することを目的とした、Omni-modalベンチマークIntentBenchを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:01:03 GMT)
GroundFlow: A Plug-in Module for Temporal Reasoning on 3D Point Cloud Sequential Grounding [26.4] 3次元点雲(SG3D)における連続的な接地は、詳細なステップで日々の作業のためにテキスト命令に従うことによって、オブジェクトのシーケンスを探索することを指す。
現在の3Dビジュアルグラウンド法では,各ステップから有用な時間情報を抽出することなく,複数のステップでテキスト命令を処理している。
GroundFlow - 3Dポイントクラウドシーケンシャルグラウンド上での時間的推論のためのプラグインモジュール。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:47:33 GMT)
LoRaConnect: Unlocking HTTP Potential on LoRa Backbones for Remote Areas and Ad-Hoc Networks [26.2] LoRa上のHTTPアクセスを可能にするために,LoRaConnectを提案する。
LoRaWebハードウェアは、クライアントデバイスがLoRa上でHTTPリソースに接続しアクセスするWiFiホットスポットをテザリングする。
LoRaWebは平均スループットが1.18KB/Sで、アクセス遅延は1.5KBのWebページで1.3S程度である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:12:22 GMT)
Learning to Skip the Middle Layers of Transformers [26.0] 本研究では,中間層から外方へ可変層をスキップする新しいアーキテクチャを提案する。
特に、学習ゲーティング機構は、入力に基づいて中央ブロックの対称スパンをバイパスするかを決定する。
提案手法は, 層数が少なくて高密度なベースラインに比べて, 検証エントロピーと推定FLOPのトレードオフを改善することはできない。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:01:19 GMT)
Search and Refine During Think: Autonomous Retrieval-Augmented Reasoning of LLMs [25.8] 大きな言語モデルは印象的な推論能力を示してきたが、本質的には知識貯水池によって制限されている。
Retrieval-augmented reasoningは、LCMが外部リソースをクエリできるようにすることによって、この制限を緩和する。
本稿では,新しい探索・復調思考のパラダイムを取り入れた強化学習フレームワークであるAutoRefineを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:52:37 GMT)
Mr. DETR++: Instructive Multi-Route Training for Detection Transformers with Mixture-of-Experts [25.8] モデルをマルチタスクフレームワークとして扱い、同時に1対1と1対マニーの予測を行う。
本研究では,一対一予測のための一次経路と,一対多予測のための2つの補助訓練経路を特徴とする多経路学習機構を提案する。
我々の手法は柔軟であり、他のタスクにも容易に適応できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:06:14 GMT)
A Unified Speech LLM for Diarization and Speech Recognition in Multilingual Conversations [25.6] 本稿では、ダイアリゼーションとASRをエンドツーエンドで共同で行う統一音声LLMを提案する。
トレーニングデータフォーマットを再構成し,推論手順を変更することで,事前分類音声に固有のあいまいさに対処する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:54:02 GMT)
TUS-REC2024: A Challenge to Reconstruct 3D Freehand Ultrasound Without External Tracker [25.1] TUS-REC2024 Challengeは、トラッカーレス3D超音波再構成の進歩をベンチマークし、加速するために設立された。
43以上の登録チームが参加し、6チームが21の有効なドーカライズソリューションを提出した。
結果は、この領域における最先端のアプローチの進歩と現在の限界の両方を強調します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:52:18 GMT)
Multimodal Prompt Alignment for Facial Expression Recognition [24.5] MPA-FERは、引き起こされた視覚的特徴の学習プロセスに対して、きめ細かいセマンティックガイダンスを提供する。
我々のフレームワークは、FERベンチマークの3つのベンチマークデータセット上で最先端の手法より優れています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:28:57 GMT)
DBConformer: Dual-Branch Convolutional Transformer for EEG Decoding [24.4] 脳波復号に適した2分岐畳み込み変換器ネットワークDBConformerを提案する。
時間変換器を統合して、長距離時間依存をモデル化し、空間変換器をチャネル間相互作用を抽出する。
高容量のEEG Conformerベースラインの8倍以上のパラメータで、競争力のあるベースラインモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:53:24 GMT)
Radio Map Estimation via Latent Domain Plug-and-Play Denoising [24.1] 無線マップ推定(RME)は、異なる領域(例えば、空間と周波数)にわたる電波干渉の強度を再構築することを目的としている。
提案手法は,無線地図の基盤となる物理構造を利用し,潜在領域におけるADMMノイズを提案する。
この設計は計算効率を大幅に改善し、ノイズの堅牢性を高める。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:31:04 GMT)
Continual Learning as Computationally Constrained Reinforcement Learning [23.9] 知識を効率的に蓄積し、長期間にわたって高度なスキルを身につけるエージェントは、人工知能能力のフロンティアを前進させるかもしれない。
このようなエージェントの設計は、人工知能の長年の課題であり続けており、継続的な学習の主題によって対処されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:08:44 GMT)
TopK Language Models [23.6] TopK LMは、モデルサイズ、計算効率、解釈可能性の間の良好なトレードオフを提供する。
これらの機能はTopK LMsを安定させ、言語モデルがどのように概念を学び、表現するかを理解するための信頼性の高いツールにする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:56:43 GMT)
CyGym: A Simulation-Based Game-Theoretic Analysis Framework for Cybersecurity [23.3] 本稿では,ネットワークディフェンダーと攻撃者の間に新たなサイバーセキュリティ遭遇シミュレータを導入する。
OpenAI Gymフレームワーク内に構築されたシミュレータには、現実的なネットワークトポロジ、脆弱性、エクスプロイト(ゼロデイを含む)、防御メカニズムが組み込まれています。
我々はシミュレータと関連するゲーム理論のフレームワークを用いて、ボルト台風の持続的脅威(APT)を分析する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:15:18 GMT)
OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation [23.1] テキスト・ツー・イメージ(T2I)モデルは、テキスト・プロンプトに整合した高品質な画像を生成する上で大きな注目を集めている。
OneIG-Benchは、T2Iモデルを複数の次元で評価するためのベンチマークフレームワークである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:47:09 GMT)
IPFormer-VideoLLM: Enhancing Multi-modal Video Understanding for Multi-shot Scenes [22.9] 我々はマルチクリップ・ベンチと呼ばれる新しいデータセットを導入し、マルチショットシナリオに適した濃密な記述と命令ベースの質問応答ペアを特徴付ける。
インスタンスレベルの機能をインスタンスレベルで注入する新たなモデルIPFormer-VideoLLMを、効率的な注意ベースのコネクタを通じて提供します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:30:57 GMT)
DALR: Dual-level Alignment Learning for Multimodal Sentence Representation Learning [22.5] 本稿では, DALR(Dual-level Alignment Learning for Multimodal Sentence Representation)を提案する。
クロスモーダルアライメントを実現するために、負のサンプルをソフトにし、補助的なタスクからのセマンティックな類似性を利用して、きめ細かいクロスモーダルアライメントを実現する一貫性学習モジュールを提案する。
また、文関係は二項正負のラベルを超え、より複雑なランキング構造を示すと主張する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:45:14 GMT)
Super Co-alignment for Sustainable Symbiotic Society [22.0] 持続可能な共生社会の価値観は、人間と生きたAIによって共に形成されるべきである。
本稿では,外部監視と本質的プロアクティブアライメントを統合したフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:54:05 GMT)
Asymmetric Graph Error Control with Low Complexity in Causal Bandits [21.8] 因果トポロジーも介入の分布も不明である。
新しい不確実性境界は、報酬を最適化するために高信頼な境界ベースの介入選択を駆動する。
提案手法は,100以上のランダムに生成した因果包帯を用いて,因果構造の学習に要するサンプルを著しく少なくする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:05:51 GMT)
MolProphecy: Bridging Medicinal Chemists' Knowledge and Molecular Pre-Trained Models via a Multi-Modal Framework [21.7] MolProphecyは、化学者のドメイン知識を分子特性予測モデルに統合するためのフレームワークである。
ChatGPTは、専門家レベルの推論と意思決定をシミュレートする仮想化学者である。
MolProphecyは4つのベンチマークデータセットで、最先端(SOTA)モデルより優れています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:51:59 GMT)
VersaPRM: Multi-Domain Process Reward Model via Synthetic Reasoning Data [21.5] 本稿では,新しいデータ生成法とアノテーション法を用いて生成した合成推論データに基づいて学習したマルチドメインPRMであるVersaPRMを紹介する。
VersaPRMはさまざまなドメインで一貫したパフォーマンス向上を実現している。
VersaPRMのすべてのデータ、コード、モデルをオープンソース化することで、コミュニティにさらに貢献します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:39:38 GMT)
HyperPath: Knowledge-Guided Hyperbolic Semantic Hierarchy Modeling for WSI Analysis [21.4] 双曲空間における意味階層のモデル化を導くために,テキスト記述から知識を統合する新しい手法であるHyperPathを提案する。
本手法は,病理視覚言語基盤モデルから抽出した視覚的特徴とテキスト的特徴を双曲空間に適用する。
提案手法は,WSI解析におけるハイパーボリック埋め込みの可能性を強調し,既存の手法と比較してタスク間での優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:10:30 GMT)
Learning to Rank for Multiple Retrieval-Augmented Models through Iterative Utility Maximization [21.1] 本稿では,複数検索拡張世代(RAG)エージェントを対象とした統合検索エンジンの設計について検討する。
本稿では,検索エンジンがRAGエージェントの検索結果を生成し,オフラインフェーズにおいて検索した文書の品質に関するフィードバックを収集する反復的手法を提案する。
我々は、これをオンライン環境に適応させ、リアルタイムなエージェントのフィードバックに基づいて、検索エンジンがその振る舞いを洗練できるようにする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:06:17 GMT)
Comparing Retrieval-Augmentation and Parameter-Efficient Fine-Tuning for Privacy-Preserving Personalization of Large Language Models [21.1] 本稿では,パラメータ効率細調整(PEFT)によるユーザ依存LLMパラメータの学習に関わるRAGへのアプローチについて検討する。
その結果,RAG法とPEFT法を併用したパーソナライズ法では,非パーソナライズLCMよりも14.92%,1.07%改善した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:19:56 GMT)
Learning treatment effects while treating those in need [21.0] 本研究では,学習治療効果のある高年齢者を対象に,最適にバランスをとるランダム化アロケーションルールを設計する枠組みを提案する。
次に、ペンシルベニア州アレゲーニー郡の人事部と協力し、実際のサービス提供設定からのデータに関する手法を評価します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:20:30 GMT)
EraRAG: Efficient and Incremental Retrieval Augmented Generation for Growing Corpora [20.9] グラフベースのRetrieval-Augmented Generation (Graph-RAG)は、外部コーパス上の検索を構造化することにより、大きな言語モデル(LLM)を強化する。
高速でスケーラブルな動的更新をサポートする新しい多層グラフ-RAGフレームワークであるEraRAGを紹介する。
提案手法は,超平面に基づく局所性感性ハッシュ(LSH)を利用して,元のコーパスを階層グラフ構造に分割,整理する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:01:33 GMT)
DBMovi-GS: Dynamic View Synthesis from Blurry Monocular Video via Sparse-Controlled Gaussian Splatting [20.9] スパース制御ガウススプラッティング(DBMovi-GS)によるBlurry Monocular Videoからのモーション対応動的ビュー合成を提案する。
本モデルは,ダイナミックなぼやけたシーン下での新規ビュー合成におけるロバストな性能を実現し,ぼやけたモノクロビデオ入力のためのリアルな新規ビュー合成における新しいベンチマークを設定する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:28:48 GMT)
PrivacyGo: Privacy-Preserving Ad Measurement with Multidimensional Intersection [20.8] 本稿では,プライバシ保護広告計測のためのユーザプロファイルマッチングの多元化の問題に対処する。
本稿では,Oblivious Pseudorom Function (OPRF) と新しいブラインド鍵回転技術を活用した包括的暗号フレームワークを提案する。
我々の設計では、クロスアイデンティティーリンクが防止され、交差点サイズを難読化するための微分プライベートなメカニズムが組み込まれている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:54:19 GMT)
SAM4D: Segment Anything in Camera and LiDAR Streams [20.8] カメラとLiDARストリーム間での迅速なセグメンテーションのためのマルチモーダル・時間的基礎モデルSAM4Dを提案する。
UMPEは、カメラとLiDAR機能を共有3D空間で整列するために導入され、シームレスなクロスモーダルプロンプトを可能にする。
時間的整合性を高めるためにエゴモーション補償を利用する動き認識型クロスモーダルアテンションメモリを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:14 GMT)
Analyzing the Training Dynamics of Image Restoration Transformers: A Revisit to Layer Normalization [20.7] 従来のLayerNormは、最大100万のスケールで機能規模のばらつきを導いており、チャネルワイドエントロピーを崩壊させる。
我々は,従来のLayerNormに代えて,驚くほどシンプルなドロップイン・リプレースである Image Restoration Transformer Tailored Layer Normalization (i-LN) を導入する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:23:27 GMT)
SA-Person: Text-Based Person Retrieval with Scene-aware Re-ranking [20.5] 既存の手法は主に外観に基づくクロスモーダル検索に重点を置いており、しばしばシーン内に埋め込まれたコンテキスト情報を無視する。
SCENEPERSON-13Wは,歩行者の外観と環境条件の両方を多用した10万シーンを超える大規模データセットである。
第1段階では、テキストの手がかりを歩行者固有の地域と整列させることにより、差別的な接地を行う。
第2段階では、SceneRankerを紹介した。SceneRankerは、マルチモーダルな大規模言語モデルを利用して、歩行者の外観とグローバルなシーンコンテキストを共同で推論する、トレーニング不要でシーン対応のリグレード手法である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:46:10 GMT)
Metis-RISE: RL Incentivizes and SFT Enhances Multimodal Reasoning Model Learning [20.5] マルチモーダル推論モデル学習のためのtextbfMetis-RISE (textbfRL textbfSFT textbfEnhances) を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:45:11 GMT)
Little By Little: Continual Learning via Self-Activated Sparse Mixture-of-Rank Adaptive Learning [20.0] 大規模な事前学習モデルによる継続的な学習は、破滅的な忘れ込みとタスクの干渉によって挑戦される。
既存のLoRAベースのMixture-of-Experts (MoE)は、タスク固有のアダプタを割り当て、凍結することで、忘れを緩和する。
CLに対する自己アクティベートとスパースなランクアクティベーションを備えたMixture-of-Rank Adaptive LearningアプローチであるMoRAを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:19:05 GMT)
SceneGenAgent: Precise Industrial Scene Generation with Coding Agent [19.9] C#コードで産業シーンを生成するエージェントであるSceneGenAgentを紹介する。
SceneGenAgentは構造化され計算可能なフォーマットによる正確なレイアウト計画を保証する。
実験の結果,SceneInstruct 上でのオープンソース LLM の微調整により,大幅なパフォーマンス向上が得られた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:24:08 GMT)
OmniEval: A Benchmark for Evaluating Omni-modal Models with Visual, Auditory, and Textual Inputs [19.2] オムニエバル(OmniEval)は、オムニモダリティモデルを評価するためのベンチマークである。
このベンチマークには、810の音声-視覚同期ビデオ、285の中国語ビデオ、525の英語ビデオが含まれている。
いくつかのOmni-modalityモデルを用いてOmniEvalの実験を行う。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:54:24 GMT)
Where to find Grokking in LLM Pretraining? Monitor Memorization-to-Generalization without Test [19.2] 7B大言語モデル(LLM)の1パス事前学習(OLMoE)におけるチェックポイントのグルーキングに関する最初の研究を行う。
我々の研究は、大規模な基礎モデルの事前学習において、グルーキングが依然として発生していることを初めて確認した。
経路距離と1つの経路の複雑さを定量化する2つの新しい指標を開発した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:58 GMT)
Agent-RewardBench: Towards a Unified Benchmark for Reward Modeling across Perception, Planning, and Safety in Real-World Multimodal Agents [19.0] マルチモーダルエージェントは、Webナビゲーションやインテリジェンスといった現実世界のタスクにおいて、約束を示す。
外部からのフィードバックが不足しているため、これらのエージェントは自己補正と一般化に苦しむ。
エージェントの報酬モデルをどのように選択するかは明らかになっていない。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:36:12 GMT)
A Troublemaker with Contagious Jailbreak Makes Chaos in Honest Towns [19.0] エージェントの重要なコンポーネントはメモリであり、重要な情報を格納するが、ジェイルブレイク攻撃の影響を受けやすい。
既存の研究は主に単一エージェント攻撃と共有メモリ攻撃に焦点を当てている。
本稿では,大規模なマルチエージェント・マルチトポロジーテキストによる攻撃評価フレームワークであるTMCHTタスクを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:45:10 GMT)
DFVEdit: Conditional Delta Flow Vector for Zero-shot Video Editing [18.9] DFVEditは,ビデオDiTに適した効率的なゼロショットビデオ編集手法である。
DFVEditは、フロー変換を介してクリーンな潜水器を直接操作することで、注意修正と微調整の両方を不要にする。
DFVEditは、ビデオDiTの少なくとも20倍の速度アップと85%のメモリ削減を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:10:13 GMT)
SharpZO: Hybrid Sharpness-Aware Vision Language Model Prompt Tuning via Forward-Only Passes [18.7] 微調整型視覚言語モデル(VLM)は、様々な下流タスクで顕著なパフォーマンスを実現している。
バックプロパゲーション(BP)を通じてモデル勾配にアクセスする必要があり、メモリ制約のある推論のみのエッジデバイスには適さない。
本稿では,ZO VLMファインチューニングの性能向上を目的としたシャープネス対応ゼロ階最適化(SharpZO)手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:07:14 GMT)
ReME: A Data-Centric Framework for Training-Free Open-Vocabulary Segmentation [18.7] トレーニングフリーなオープン語彙セマンティックセマンティックセマンティクス(OVS)は、任意のテキストカテゴリのセットが与えられた画像を、コストのかかるモデル微調整なしで分割することを目的としている。
本稿では,データパイプラインを組み込んだデータ品質指向フレームワークを提案する。
本手法は既存のトレーニング不要なOVSアプローチよりも優れており,トレーニングなしでOVSを前進させるためのデータ中心設計の重要性を強調している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:22:03 GMT)
OBSER: Object-Based Sub-Environment Recognition for Zero-Shot Environmental Inference [18.5] 本稿では,サブ環境と構成対象との間に3つの基本的関係を推定する新しいベイズ的枠組みであるオブジェクトベースサブ環境認識(OBSER)フレームワークを提案する。
本稿では,表現のアライメントを示す(epsilon,delta$)統計的分離可能な(EDS)関数を導入することにより,提案フレームワークの有効性を検証する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:57:06 GMT)
Is my Data in your AI Model? Membership Inference Test with Application to Face Images [18.4] この記事では、AI/MLモデルのトレーニング中に与えられたデータが使用されているかどうかを経験的に評価することを目的とした新しいアプローチである、メンバシップ推論テスト(MINT)を紹介します。
本稿では,学習過程に使用されるデータに監査モデルが露出した場合に現れるアクティベーションパターンを学習するための2つのMINTアーキテクチャを提案する。
実験は6つの公開データベースを使って行われ、合計で2200万以上の顔画像で構成されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:49:33 GMT)
FaSTA$^*$: Fast-Slow Toolpath Agent with Subroutine Mining for Efficient Multi-turn Image Editing [18.4] コスト効率のよいニューロシンボリック・エージェントを開発し、課題のあるマルチターン画像編集タスクに対処する。
これは、大規模言語モデルによる高速でハイレベルなサブタスク計画と、遅くて正確なツール使用と、サブタスク毎のローカルなA$*$検索を組み合わせる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:33:43 GMT)
PhotonSplat: 3D Scene Reconstruction and Colorization from SPAD Sensors [17.6] 本研究では,SPADバイナリ画像から直接3Dシーンを再構成するフレームワークであるPhotonSplatを紹介する。
提案手法では,新しい3次元空間フィルタリング技術を用いて,レンダリングのノイズを低減する。
動的シーン表現を組み込むように拡張し、移動物体のシーンに適したようにした。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:04:28 GMT)
PuriDefense: Randomized Local Implicit Adversarial Purification for Defending Black-box Query-based Attacks [17.6] ブラックボックスクエリベースの攻撃は機械学習・アズ・ア・サービス(ML)システムに脅威を与える。
低レベルの推論コストで軽量な浄化モデルのアンサンブルでランダムなパッチワイズ処理を施した効率的な防御機構であるPuriDefenseを提案する。
我々の理論的分析は、ランダム性を浄化に組み込むことで、クエリベースの攻撃の収束を遅くすることを示唆している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:00:42 GMT)
ComRAG: Retrieval-Augmented Generation with Dynamic Vector Stores for Real-time Community Question Answering in Industry [17.3] ComRAGはリアルタイム産業用CQAのための検索拡張生成フレームワークである。
これは、検索、生成、効率的な記憶のために設計されたセントロイドベースのメモリ機構を介して、静的な知識と動的に歴史的なQAペアを統合する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:48:16 GMT)
Robust Alignment via Partial Gromov-Wasserstein Distances [17.2] 本稿では,各分布から質量の一部を除いた部分GW距離に基づく推定器を提案し,残りを最適に整列させる。
本研究は, 観測データに汚染された場合に, 従来の距離の頑健なサロゲートとして機能させることにより, 部分的なGW距離を運用上の意味を持つものとした。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:32:53 GMT)
Are Triggers Needed for Document-Level Event Extraction? [16.9] 文書レベルのイベント抽出におけるトリガーの役割について検討する。
トリガを明示的に抽出することによるメリットが,データセットの特性に依存することが明らかとなった。
意外なことに、入力中のトリガーの存在は、ランダムなトリガーでさえも、タスクへのインコンテキスト学習のプロンプトベースアプローチにとって重要である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:13:38 GMT)
Ophora: A Large-Scale Data-Driven Text-Guided Ophthalmic Surgical Video Generation Model [16.9] 眼科手術では、手術映像を解釈し、その後の手術を予測することができるAIシステムの開発には、高品質なアノテーションを備えた多数の眼科手術ビデオが必要である。
我々は,眼科手術映像を自然言語で生成できる先駆的モデルであるOphoraについて紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:57:03 GMT)
THE-Tree: Can Tracing Historical Evolution Enhance Scientific Verification and Reasoning? [16.9] textbfTechnology textbfHistory textbfEvolution Treeは,これらの領域固有の進化木を科学文献から構築する計算フレームワークである。
ノード拡張の間、新しい"Think-Verbalize-Cite-Verify"プロセスを利用している。
それぞれの進化的リンクは、回復した自然言語推論機構によって論理的コヒーレンスと明らかな支持のために検証される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:44:51 GMT)
Evaluating Large Language Models for Automated Clinical Abstraction in Pulmonary Embolism Registries: Performance Across Model Sizes, Versions, and Parameters [16.7] 肺塞栓症登録は、研究の改善を加速するが、放射線医学報告の労働集約的手作業による抽象化に依存している。
データ品質を損なうことなく,計算トモグラフィPE(CTPE)レポートから概念抽出を自動化できるかを検討した。
4つのラマ3型(3.0 8B, 3.1 8B, 3.1 70B, 3.3 70B)と1つのレビュアーモデルであるPhi 4 14Bは、MIMIC IVとデューク大学からそれぞれ250個の注釈付きCTPEレポートで試験された。
正の予測値 (PPV) と負の予測値 (NPV) を人体金標準と比較し, 精度, 正の予測値 (PPV) を計測した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:02:45 GMT)
Characterizing Dependence of Samples along the Langevin Dynamics and Algorithms via Contraction of $Φ$-Mutual Information [16.5] 連続空間サンプリングにおいて,サンプルがマルコフ連鎖に沿ってほぼ独立になる速度について検討する。
我々の証明手法は,マルコフ連鎖に沿ったSDPI(Strong Data Processing Inequality)を示すものである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:01:36 GMT)
End-to-End Long Document Summarization using Gradient Caching [16.5] 長い文書要約のためのトランスフォーマーベースのエンコーダデコーダモデルを訓練することは大きな課題である。
CachED(Gradient $textbfCach$ing for $textbfE$ncoder-$textbfD$ecoder model)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:40:55 GMT)
PARALLELPROMPT: Extracting Parallelism from Large Language Model Queries [16.4] 本稿では,自然ユーザプロンプトにおけるクエリ内並列性を測定する最初のベンチマークであるPARALLELPROMPTを紹介する。
我々のデータセットは、パブリックなLLMチャットログから37,000以上の実世界のプロンプトで構成されています。
並列戦略とシリアル戦略をベンチマークし、レイテンシ、構造的忠実度、セマンティック忠実度を計測する実行スイートを提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:35:54 GMT)
Mixture of Experts-augmented Deep Unfolding for Activity Detection in IRS-aided Systems [16.3] 本稿では,モデル駆動型深層展開と専門家の混合(MoE)フレームワークを組み合わせた新しいアプローチを提案する。
提案手法は, 3つの専門家設計のうちの1つを自動的に選択し, 未展開の勾配法に適用することにより, デバイスと基地局間のチャネルタイプに関する事前知識を不要にする。
シミュレーションの結果,提案手法は従来の共分散法およびブラックボックスニューラルネットワーク設計を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:57:03 GMT)
Hierarchical Reasoning Model [16.2] HRMは、中間プロセスの明示的な監督なしに、1つのフォワードパスでシーケンシャルな推論タスクを実行する。
2700万のパラメータしか持たず、HRMは1000のトレーニングサンプルのみを使用して複雑な推論タスクで例外的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:39:54 GMT)
Pay Attention to Small Weights [16.1] NanoADAMは、微調整中に小さなマグニチュードのみを動的に更新する。
これは、事前訓練中に学んだ重要な特徴をエンコードする可能性が高い、大きなマグニチュードの重量を保存する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:22:55 GMT)
FairyGen: Storied Cartoon Video from a Single Child-Drawn Character [15.7] 本研究では,一人の子どもの絵から物語駆動のマンガ映像を自動生成するFairyGenを提案する。
以前のストーリーテリング方法とは異なり、FairyGenはスタイル化された背景生成から文字モデリングを明示的に切り離している。
我々のシステムは、スタイリスティックに忠実で、物語的に構造化された自然運動のアニメーションを生成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:58:16 GMT)
Unimodal Strategies in Density-Based Clustering [15.6] 本研究では, クラスタ数とコア点近傍半径の関係について, 密度に基づくクラスタリング法に固有の重要な特性を明らかにする。
我々はこの特性を利用して、三進探索アルゴリズムに基づいて、半径の適切な値を求めるための新しい戦略を考案する。
我々は,高次元,大規模NLP,オーディオ,コンピュータビジョンのタスクにまたがる広範囲な応用を通して方法論を検証する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:25:14 GMT)
STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding? [15.4] MLLM(Multimodal Large Language Models)は、Embodied AIとAutonomous Drivingのためのエンドツーエンドソリューションである。
MLLMの時空間的理解を評価するためのベンチマークであるSTI-Benchを紹介する。
私たちのベンチマークでは、デスクトップ、屋内、屋外のシナリオにまたがる幅広いロボットと車両の操作を網羅しています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:15:48 GMT)
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers [15.3] トレーニング後の量子化は、トレーニングや微調整を必要とせず、負担を軽減するための軽量な方法である。
W4A6量子化を実現するために浮動小数点量子化を利用するPTQ法であるFP4DiTを導入する。
FP4DiTは整数ベースのPTQをW4A6およびW4A8精度で上回ることを示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:03:07 GMT)
Step-by-Step Video-to-Audio Synthesis via Negative Audio Guidance [15.3] 本稿では,個々の音声トラックを逐次生成するステップバイステップの音声合成手法を提案する。
提案手法は従来のフォーリーを反映し,映像によって引き起こされる全ての音を包括的に捉えることを目的としている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:20:08 GMT)
Style-Aligned Image Composition for Robust Detection of Abnormal Cells in Cytopathology [15.1] 本稿では,高忠実度・保存型病理画像を構成するスタイル整列画像合成(SAIC)手法を提案する。
異常細胞と病理背景のスタイル整合性および高忠実性を実現するために、高周波特徴再構成を用いる。
実験により,SAIC合成画像の導入は,尾部分類やスタイルに対する異常細胞検出の性能と堅牢性を効果的に向上させることが示された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:32:21 GMT)
PCF-Grasp: Converting Point Completion to Geometry Feature to Enhance 6-DoF Grasp [14.9] 本稿では、6-DoFグリップネットワークをトレーニングするために、ポイント完了結果をオブジェクト形状の特徴として変換する新しい6-DoFグリップフレームワークを提案する。
本手法は実世界の実験において最先端の手法よりも17.8%の成功率を達成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:42:10 GMT)
Taming the Untamed: Graph-Based Knowledge Retrieval and Reasoning for MLLMs to Conquer the Unknown [14.9] マルチモーダルな大言語モデル(MLLM)は、限られた関連する知識のため、ほとんど遭遇しないドメイン固有のタスクで失敗することが多い。
マルチモーダル・ナレッジグラフ (MH-MMKG) を構築し, マルチモーダルと複雑な実体関係を包含する。
また,MH-MMKGに基づく複雑な知識検索と推論のためのモデルの能力を評価するために,一連の挑戦的なクエリを設計する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:13:31 GMT)
3D Scene-Camera Representation with Joint Camera Photometric Optimization [14.6] 多視点画像からのシーンの表現は、コンピュータビジョンにおいて広範囲の応用において重要な課題である。
カメラ画像におけるインヒーレントな測光歪みは、画質を著しく低下させる。
共同カメラ光度最適化を用いた新しい3次元シーンカメラ表現を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:53:38 GMT)
Enhancing Homophily-Heterophily Separation: Relation-Aware Learning in Heterogeneous Graphs [14.5] 本稿では,新しいコントラスト学習フレームワークであるホモフィリーとヘテロフィリー(RASH)のリレーショナル・アウェア分離を提案する。
RASHは、不均一相互作用の高次セマンティクスを明示的にモデル化し、ホモ親和性パターンとヘテロ親和性パターンを適応的に分離する。
相互情報の最大化により異種・同種・異種・異種・異種・異種視を整合させるマルチリレーション・コントラッシブ・ロスを設計する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:54:06 GMT)
Chain-of-Thought Enhanced Shallow Transformers for Wireless Symbol Detection [14.4] 無線シンボル検出のためのCoT拡張浅層変圧器フレームワークCHOOSE(CHain Of thOught Symbol dEtection)を提案する。
隠れ空間内に自己回帰潜在推論ステップを導入することで、CHOOSEは浅いモデルの推論能力を大幅に改善する。
実験により,本手法は従来の浅層変圧器よりも優れ,深部変圧器に匹敵する性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:41:45 GMT)
Explainable AI for Radar Resource Management: Modified LIME in Deep Reinforcement Learning [14.3] 深層学習(DL)をサンプリングプロセスに統合する改良型LIME手法を提案する。
我々は、レーダー資源管理のための深層強化学習にDL-LIMEを採用している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:49:25 GMT)
BMFM-DNA: A SNP-aware DNA foundation model to capture variant effects [14.2] テキストで訓練された大規模言語モデル(LLM)は、自然言語処理(NLP)タスクにおいて顕著な結果を示した。
DNAは、明確に定義された単語や一貫した文法が欠けているため、基本的に自然言語と異なる。
配列の変動、特にSNP(Single Nucleotide Polymorphisms)を効果的に統合する事前訓練基礎モデル
以上の結果から,DNALMに配列変化を組み込むことは,すべての微調整タスクの改善にみられる生物学的機能を把握するのに役立つことが示唆された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:56:32 GMT)
Bridging Video Quality Scoring and Justification via Large Multimodal Models [14.2] 古典的映像品質評価法(VQA)は、映像の視覚的忠実さと明瞭さを判断する数値スコアを生成する。
しかし、スコアはビデオの複雑な品質の次元を表現できず、適用性を制限する。
言語出力から恩恵を受け、ビデオ大マルチモーダルモデル(LMM)を命令チューニングによりVQAに適応させることは、この問題に対処する可能性がある。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:02:25 GMT)
A Survey on Patent Analysis: From NLP to Multimodal AI [14.1] この学際的な調査は、NLP、マルチモーダルAI、特許分析の交差点で働く研究者や実践者のための総合的なリソースとして機能することを目的としている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:47:15 GMT)
UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent [14.1] textbfUP-VLA, textbfUnified VLA model training with multi-modal textbfUnderstanding and future textbfPrediction objectives。
UP-VLAはCalvin ABC-Dベンチマークの33%の改善を実現している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:43:38 GMT)
Scalable Bayesian Low-Rank Adaptation of Large Language Models via Stochastic Variational Subspace Inference [14.1] 大規模言語モデル(LLM)は、誤った情報を幻覚し、校正が不十分であることが知られている。
変分部分空間推論(ScalaBL)によるtextbfScala$ayesian $textbfL$ow-Rankble Adaptationを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:54:45 GMT)
Inverse Reinforcement Learning via Convex Optimization [14.1] 我々は,ある決定プロセスに基づいて未知の報酬関数を推定する逆強化CIRL問題を考察する。
このメモは、凸最適化に関するバックグラウンド知識を必要とせずに、ユーザが自分の問題に簡単に適用できるのに役立つ。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:46:25 GMT)
CREStE: Scalable Mapless Navigation with Internet Scale Priors and Counterfactual Guidance [13.9] CREStEはスケーラブルな学習ベースのマップレスナビゲーションフレームワークである。
屋外都市航法におけるオープンワールドの一般化とロバストネスの課題に対処する。
CREStEは, 様々な都市, オフロード, 住宅環境において, キロスケールの地図レスナビゲーションの課題について評価する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:42:04 GMT)
Zebra: In-Context Generative Pretraining for Solving Parametric PDEs [13.8] 最先端のニューラルサロゲートは勾配に基づく最適化とメタラーニングによって適応する。
本稿では、パラメトリックPDEを推論の勾配適応を必要とせずに解くために設計された新しい自己回帰変換器であるZebraを紹介する。
我々は、Zebraを様々な挑戦的なPDEシナリオで評価し、既存のアプローチと比較して適応性、堅牢性、優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:05:33 GMT)
V2X-REALM: Vision-Language Model-Based Robust End-to-End Cooperative Autonomous Driving with Adaptive Long-Tail Modeling [13.8] 本稿では,V2X-REALMを提案する。V2X-REALMは視覚言語モデル(VLM)をベースとした,長期的シナリオ下でのロバストな協調自動運転のための適応型マルチモーダル学習を実現するフレームワークである。
V2X-REALMは、3つの中核的なイノベーションを紹介している: (i) ファンデーションモデルを利用して現実的なロングテール条件を合成するプロンプト駆動のロングテールシナリオ生成と評価パイプライン、 (ii) 曖昧または破損した特徴を再分類するシナリオを用いてビジュアルストリームを変調するマルチシナリオ適応アダプティブアテンションモジュール、 (iii) マルチタスクシナリオを意識したコントラスト学習目標で、マルチモーダルアライメントを改善し、クロスモーダルを促進する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:42:03 GMT)
A Semi-supervised Scalable Unified Framework for E-commerce Query Classification [13.7] 電子商取引クエリは通常短く、コンテキストがないため、ラベル間の情報は使用できない。
既存の産業用クエリ分類手法の多くは、ユーザの後クリック動作に依存してトレーニングサンプルを構築しており、マシューの悪循環に繋がる。
クエリ分類タスクを統一する複数の拡張モジュールを含むSSUF(Semi-supervised Scalable Unified Framework)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:52:33 GMT)
Performance Prediction for Large Systems via Text-to-Text Regression [13.5] 従来の回帰法に代わる汎用的でスケーラブルな回帰法としてテキスト・テキスト・レグレッションを提案する。
Googleの大規模クラスタスケジューリングシステムであるBorgでリソース効率を予測するために、60Mパラメータエンコーダ-デコーダがトレーニングされている。
このモデルは、わずか500の例で新しいタスクに容易に適応し、複雑な結果分布の密度をキャプチャする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:10:08 GMT)
From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging [13.4] 数ステップのテキスト・ツー・イメージ(T2I)拡散モデルに基づく2パスの顔エイジングフレームワークであるCradle2Caneを提案する。
第1のパスは、アダプティブノイズインジェクション(AdaNI)機構を導入することで、年齢の精度を改善することに焦点を当てている。
第2のパスは、2つのアイデンティティを意識した埋め込みにモデルを条件付けすることで、年齢固有の特徴を維持しながらアイデンティティの保存を向上させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:48:28 GMT)
Curve-Aware Gaussian Splatting for 3D Parametric Curve Reconstruction [13.4] 本稿では,多視点エッジマップから直接3次元パラメトリック曲線を再構成するためのエンドツーエンドフレームワークを提案する。
パラメトリック曲線とエッジ指向ガウス成分の双方向結合機構を提案する。
提案手法は,既存の手法に比べて高い効率と優れた性能を達成し,トレーニング中のパラメータ数を著しく削減する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:48:08 GMT)
Antibody Design and Optimization with Multi-scale Equivariant Graph Diffusion Models for Accurate Complex Antigen Binding [13.3] 抗体配列と構造共設計のためのエンドツーエンドフレームワークである textbfAbMEGD を提案する。
AbMEGDは原子レベルの幾何学的特徴と残留レベルの埋め込みを組み合わせ、局所的な原子の詳細とグローバルなシーケンス構造相互作用を捉えている。
SAbDabデータベースを用いた実験では、アミノ酸の回収が10.13%増加し、改善率が3.32%上昇し、根の平均平方偏差が0.062AA減少した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:45:38 GMT)
HUG: Hierarchical Urban Gaussian Splatting with Block-Based Reconstruction for Large-Scale Aerial Scenes [13.2] 3DGS法は、過剰なメモリ消費、遅いトレーニング時間、長いパーティショニングプロセス、データボリュームの増加によるレンダリング品質の大幅な低下といった問題に悩まされている。
階層型ニューラルガウス表現を活用することでデータ分割と復元品質を向上させる新しいアプローチである textbfHUG を導入する。
提案手法は,1つの合成データセットと4つの実世界のデータセットに対して,最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:12:14 GMT)
Theory of Mind in Action: The Instruction Inference Task [12.9] ToM(The Theory of Mind)は、エージェントが他のエージェントの精神状態を推測する能力のこと。
我々は,LLMをベースとしたエージェントであるTomcatについて,主の指示を解釈し,応答するToM推論を示すように設計された。
被験者52名を対象に,TomcatのCP変種と同じ情報を提供する実験を行った。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:44:12 GMT)
Fine-Grained Preference Optimization Improves Spatial Reasoning in VLMs [12.9] 現在の視覚言語モデルは、きめ細かい空間的推論に苦慮している。
本稿では,これらの制約に対処する視覚言語推論モデルであるSpatialReasoner-R1を紹介する。
その結果,fDPOは空間品質タスクにおいて標準DPOよりも平均4.1%向上し,空間量タスクでは9.0%向上した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:00:00 GMT)
DiMPLe -- Disentangled Multi-Modal Prompt Learning: Enhancing Out-Of-Distribution Alignment with Invariant and Spurious Feature Separation [12.9] DiMPLeは、視覚と言語モダリティをまたいだ不変かつ刺激的な特徴をアンタングルする新しいアプローチである。
提案手法は,(1)不変特徴と刺激特徴の相互情報の最小化,(2)刺激特徴の正規化,(3)不変特徴のコントラスト学習の3つの主要な目的を組み合わす。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:22:44 GMT)
XVerse: Consistent Multi-Subject Control of Identity and Semantic Attributes via DiT Modulation [12.9] 本稿では,新しいマルチオブジェクト制御生成モデルXVerseを提案する。
参照画像をトークン固有のテキストストリーム変調のオフセットに変換することで、XVerseは特定の主題に対して正確かつ独立した制御を可能にする。
XVerseは、個々の主題の特徴とセマンティック属性を頑健に制御した、高忠実で編集可能なマルチオブジェクト画像合成を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:04:16 GMT)
Learning Value of Information towards Joint Communication and Control in 6G V2X [12.8] MDP、強化学習(RL)、最適制御理論に基づく体系的なVoIモデリングフレームワークを提案する。
様々なVoIメトリクスを活用して、"What"と"How"を最適化し、問題を伝達するための構造化されたアプローチを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:01:20 GMT)
Lightning the Night with Generative Artificial Intelligence [12.6] 静止衛星からの可視光反射データは気象観測に不可欠である。
夜間に可視光反射データを用いて日中連続観測を行うことは不可能である。
本研究は、この制限に対処するための生成拡散モデルの使用の先駆者である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:21:08 GMT)
Measurement to Meaning: A Validity-Centered Framework for AI Evaluation [12.6] 我々は、利用可能な証拠から得られる評価的クレームのタイプを推論するための構造化されたアプローチを提供する。
私たちのフレームワークは、機械学習の現代的なパラダイムに適しています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:38:11 GMT)
TanDiT: Tangent-Plane Diffusion Transformer for High-Quality 360° Panorama Generation [12.5] TanDiTはパノラマシーンを合成する手法で、360$circ$ビュー全体をカバーする接地平面画像の格子を生成する。
また,パノラマ画像の画質を正確に評価するために,TangentISとTangentFIDの2つの専門指標を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:09:09 GMT)
Real-time and personalized product recommendations for large e-commerce platforms [12.5] 本稿では,大手電子商取引プラットフォームを対象とした,リアルタイムかつパーソナライズされた製品レコメンデーションを提供する方法論について述べる。
私たちのアプローチは、応答時間を最小限に抑えて正確でスケーラブルなレコメンデーションを実現し、ユーザの満足度を確保することを目的としています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:16:44 GMT)
Learning to Be a Transformer to Pinpoint Anomalies [12.4] 最近の産業異常検出およびIADS(Industrial Anomaly Detection and (IADS))は、224x224ピクセルなどの低解像度画像を処理する。
本稿では,高精細な入力画像を非常に効率的に処理しながら,強い事前学習機能を活用する新しい教師-学生パラダイムを提案する。
提案手法では,高解像度画像から異常を検出でき,競合他社よりも高速に動作可能である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:51 GMT)
FedSC: Federated Learning with Semantic-Aware Collaboration [12.4] フェデレートラーニング(FL)は、プライバシ保護のためのデータを共有することなく、クライアント間で協調的にモデルをトレーニングすることを目的としている。
不均一なクライアント間でクライアント固有のクラス関連知識を収集するために,FedSC(Federated Learning with Semantic-Aware Collaboration)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:04:55 GMT)
CanFields: Consolidating Diffeomorphic Flows for Non-Rigid 4D Interpolation from Arbitrary-Length Sequences [12.2] 我々はCanonical Consolidation Fields(CanFields)を紹介する。
CanFieldsは独立にサンプリングされた3D点雲の任意の長さの配列を、統一的で連続的でコヒーレントな変形形状に補間する。
我々は50以上の多種多様な配列に対して、我々の頑健さと精度を検証し、欠落した領域やノイズの多い生スキャン、スパースデータにおいても、その優れた性能を実証した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:53:33 GMT)
CVC: A Large-Scale Chinese Value Rule Corpus for Value Alignment of Large Language Models [12.2] 本研究では,中国中核値に基づく階層的価値枠組みを提案し,主次元3,コア値12,派生値50を包含する。
我々は,人間のアノテーションによって拡張・拡張された25万以上の値規則を含む大規模中国価値コーパス(CVC)を構築した。
われわれの研究は、中国の特徴を表す総合的な価値評価とアライメントのための文化的適応型ベンチマークフレームワークを確立する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:34:33 GMT)
WordCon: Word-level Typography Control in Scene Text Rendering [12.0] 単語レベルの制御されたシーンテキストデータセットを構築し,テキスト画像アライメントフレームワークを導入する。
また,ハイブリッドパラメータ効率細調整(PEFT)手法であるWordConを提案する。
データセットとソースコードは学術的に利用できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:00:38 GMT)
Domain Knowledge-Enhanced LLMs for Fraud and Concept Drift Detection [11.9] 概念ドリフト(CD)、すなわち意味的あるいは話題的なシフトは、時間とともに相互作用の文脈や意図を変える。
これらのシフトは、悪意のある意図を曖昧にしたり、通常の対話を模倣したりし、正確な分類を困難にします。
本稿では,事前学習された大規模言語モデルと構造化されたタスク固有の洞察を統合して,詐欺や概念ドリフトの検出を行うフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:29:45 GMT)
MobiVerse: Scaling Urban Mobility Simulation with Hybrid Lightweight Domain-Specific Generator and Large Language Models [11.9] モビリティシミュレーションのギャップを埋めるハイブリッドフレームワークMobiVerseを提案する。
ロサンゼルスのウェストウッドでケーススタディを行い、効率よくスケジュールを動的に生成した。
その結果,本手法は行動リアリズムを高めつつ,計算効率を向上することを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:46:18 GMT)
Beijing Normal University 12-meter Interferometric kHz GW Detector Prototype: Design and Scientific Prospects [11.8] この制限を克服するために、L字型光共振器を用いた新しい構成を提案した。
北京師範大学の12メートルのプロトタイプは、この新しいkHz検出器の構成の検知と制御の仕組みを実証するために設計された。
本稿では,その光学設計とキーコンポーネント開発の現状を含むプロトタイプの概要について述べる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:08:03 GMT)
AirCache: Activating Inter-modal Relevancy KV Cache Compression for Efficient Large Vision-Language Model Inference [11.7] 本稿では,LVLM推論の高速化を目的とした新しいKVキャッシュ圧縮手法であるAirCacheを提案する。
本手法は,視覚的KVキャッシュの10%を保ちながら,フルキャッシュに匹敵する性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:30:43 GMT)
PeakNetFP: Peak-based Neural Audio Fingerprinting Robust to Extreme Time Stretching [11.7] この研究は、スペクトルピークに特化して設計された最初のニューラルオーディオフィンガープリント(AFP)システムであるPeakNetFPを紹介した。
PeakNetFPは、最先端のディープラーニングAFPであるNeuralFPのように、コントラスト学習を使用してトレーニングされている。
広範囲な評価において、PeakNetFPは50%から200%までのストレッチ要因に対して、トップ1ヒット率90%以上を維持している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:29:48 GMT)
Parallels Between VLA Model Post-Training and Human Motor Learning: Progress, Challenges, and Trends [11.7] 視覚言語アクション(VLA)モデル拡張視覚言語モデル(VLM)
本稿では,人間の運動学習のレンズによるVLAモデルの訓練戦略についてレビューする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:06:57 GMT)
CoPa-SG: Dense Scene Graphs with Parametric and Proto-Relations [11.6] 合成シーングラフデータセットであるCoPa-SGについて述べる。
また、シーングラフの2つの新しい基本概念であるパラメトリックとプロトレーションも導入する。
我々は、新しい関係型をダウンストリームアプリケーションに統合して、計画と推論機能を強化する方法について実証する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:09:23 GMT)
Towards an Optimal Control Perspective of ResNet Training [11.4] 本稿では,標準アーキテクチャや一般損失関数に適用可能な最適制御問題を反映したResNetのトレーニング定式化を提案する。
標準ResNetでは、次のスキップ接続と出力層を介して状態を伝播することで中間出力を得る。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:34:47 GMT)
TEMPEST-LoRa: Cross-Technology Covert Communication [11.2] 電磁界(EM)の隠蔽チャネルは、空調ネットワークにおけるコンピュータと通信のセキュリティに重大な脅威をもたらす。
本報告では, TEMPEST-LoRaと呼ばれる新しいEM秘密チャネルを報告し, 遠隔地から広く運用されているLORa受信機に対して, EM変調秘密データを隠蔽的に送信することを可能にする。
実験の結果,EM漏洩によって変調された秘密データを最大87.5mまたは21.6kbpsの速度でビデオケーブルから確実に復号できることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:39:50 GMT)
Learnable Adaptive Time-Frequency Representation via Differentiable Short-Time Fourier Transform [11.1] 本稿では,パラメータの勾配に基づく最適化を可能にするSTFTの微分可能な定式化を提案する。
提案手法はニューラルネットワークとシームレスに統合され,STFTパラメータとネットワーク重みの同時最適化が可能となる。
提案手法は,TFRの強化と下流タスクの性能向上に有効である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:24:27 GMT)
Will LLMs be Professional at Fund Investment? DeepFund: A Live Arena Perspective [10.9] 大規模言語モデル(LLM)は、様々な領域にまたがって印象的な能力を示してきたが、財務的な意思決定におけるその効果は、いまだに不十分である。
実環境におけるLCMベースのトレーディング戦略を評価するための総合的なアリーナプラットフォームであるDeepFundを紹介する。
当社のアプローチでは,実世界の投資決定プロセスを実現する上で,複数の重要な役割を担うマルチエージェントフレームワークを実装している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:57:07 GMT)
SPA: Towards More Stealth and Persistent Backdoor Attacks in Federated Learning [10.9] フェデレートラーニング(FL)は、プライバシ保護のための分散機械学習の主要なパラダイムとして登場したが、FLの分散特性にはユニークなセキュリティ上の課題が伴っている。
特徴空間アライメントを活用することによって従来のアプローチから離れるSPAという,斬新でステルス的なバックドアアタックフレームワークを提案する。
本研究は,FLにおけるバックドア脅威の高度化に緊急注意を喚起し,高度な機能レベル防衛技術の必要性を強調した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:33:14 GMT)
These Are Not All the Features You Are Looking For: A Fundamental Bottleneck in Supervised Pretraining [10.7] トランスファーラーニングは、最新の機械学習の基盤であり、幅広いデータで事前訓練されたモデルを、最小限の新しいデータで新しいタスクに適応する方法を約束する。
本研究では,各タスクに対する事前学習混合物からのモデル伝達を評価し,事前学習した特徴がタスク固有の直接訓練のパフォーマンスに適合するかどうかを評価する。
ディープラーニングモデルでは、トレーニング中に同様の機能をエンコードすると、ネットワークが新しい機能を学習できないという、基本的な制限を特定します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:50:38 GMT)
Segment Anything in Pathology Images with Natural Language [10.5] PathSegmentorは、病理画像に特化して設計された最初のテキストプロンプトセグメンテーション基盤モデルである。
PathSegは、病理分類のための最大かつ最も包括的なデータセットである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:01:40 GMT)
Geometry and Perception Guided Gaussians for Multiview-consistent 3D Generation from a Single Image [10.4] 既存のアプローチはしばしば、微調整された事前訓練された2D拡散モデルや、高速ネットワーク推論を通じて直接3D情報を生成することに依存している。
本稿では,新たなモデルトレーニングを必要とせず,幾何や知覚をシームレスに統合する新しい手法を提案する。
提案手法の高忠実度化を実証し, 新規なビュー合成法と3次元再構成法とを比較検討した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:22:06 GMT)
RL-Selector: Reinforcement Learning-Guided Data Selection via Redundancy Assessment [10.3] サンプル間の関係に基づいてサンプル冗長性を定量化する,エプシロン・サンプル被覆の概念を導入する。
我々は、強化学習プロセスとしてデータ選択を再構成し、RLセレクタを提案する。
我々の手法は、既存の最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:28:56 GMT)
Solving Inverse Problem for Multi-armed Bandits via Convex Optimization [10.2] 行動モデリングのための神経科学・心理学研究で広く用いられている多腕包帯(IMAB)の逆問題について考察する。
まず、IMAB問題は一般の凸問題ではなく、変数変換によって凸問題に緩和できることを示す。
我々は,IMAB問題に対して,IMAB問題に対するグローバルな解決策を提供する条件と,計算時間を短縮するための近似について論じる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:49:32 GMT)
PP-DocBee: Improving Multimodal Document Understanding Through a Bag of Tricks [10.2] PP-DocBeeは、エンドツーエンドの文書イメージ理解のために設計された、新しいマルチモーダルな大規模言語モデルである。
我々は、モデル一般化を改善するために多様なデータセットを構築するシナリオを文書化するのに適したデータ合成戦略を開発する。
我々は、動的比例サンプリング、データ前処理、OCR後処理戦略など、いくつかのトレーニング手法を適用している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:11:25 GMT)
Estimating Correctness Without Oracles in LLM-Based Code Generation [10.2] オラクルが存在しない場合に効率的に推定できる不整合(incoherence)と呼ばれる不整合の尺度を提案する。
平均的なコード生成タスクでは,不正なプログラムの約3分の2を自動的に識別することができる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:00:50 GMT)
Multimodal LLMs for Visualization Reconstruction and Understanding [10.2] 本稿では,新しいデータセットと学習用マルチモーダル・ビジュアライゼーション LLM について述べる。
提案手法では,グラフ画像と対応するベクトル化表現,符号化スキーム,データ特徴を組み合わせる。
実験結果から,データ抽出精度とチャート再構成精度の両面で有意な改善が認められた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:35:59 GMT)
Gaussian Invariant Markov Chain Monte Carlo [10.1] ガウス不変サンプリングは、統計効率を向上したエルゴード推定に繋がることを示した。
幾何学的エルゴード性に関する理論的結果と最適スケーリング解析を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:36:10 GMT)
ROA-BEV: 2D Region-Oriented Attention for BEV-based 3D Object Detection [10.1] BEVを用いた2次元領域指向型物体検出ネットワーク(ROA-BEV)を提案する。
提案手法は,マルチスケール構造によるROAの情報特徴学習能力をさらに強化する。
nuScenesの実験では、ROA-BEVはBEVDepthに基づいて性能を改善している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:02:33 GMT)
SAMURAI: Shape-Aware Multimodal Retrieval for 3D Object Identification [9.9] 3次元物体識別のための形状認識型マルチモーダル検索法である佐村井を提案する。
Samuraiは、CLIPベースのセマンティックマッチングと、マスクされた領域のバイナリシルエットに由来する形状誘導された再分類を統合している。
専用前処理パイプラインは、最大の連結成分を抽出し、バックグラウンドノイズを除去することにより、マスク品質を向上させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:10:52 GMT)
GenFlow: Interactive Modular System for Image Generation [9.9] GenFlowは、すべてのスキルレベルのユーザが精度と容易さで画像を生成することを可能にする、新しいモジュラーフレームワークである。
シームレスなカスタマイズのためのノードベースのエディタと、自然言語処理を利用したインテリジェントアシスタントを備える。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:18:00 GMT)
User-in-the-Loop View Sampling with Error Peaking Visualization [9.8] 既存のアプローチでは、ARディスプレイをアライメントして画像を取得するために、新しいビューサンプルとタスクユーザのための3Dアノテーションが提供されている。
本稿では、局所的に再構成された光場と、新しいビューを挿入することで削除されるエラーを可視化することを提案する。
以上の結果から,モバイルビュー合成システムにおいて,誤り検出の可視化は侵襲的でなく,最終結果の失望を低減し,ビューサンプルの少なさに満足できることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:01:41 GMT)
Exploring the Capabilities of the Frontier Large Language Models for Nuclear Energy Research [9.8] オークリッジ国立研究所のAI for Nuclear Energyワークショップは、核融合と核分裂の研究を加速する大規模言語モデル(LLM)の可能性を評価した。
14の学際チームがChatGPT、Gemini、Claude、その他のAIモデルを使って、さまざまな核科学の課題を1日で調査した。
その結果、専門家主導のプロンプトエンジニアリングが成功し、物理学に基づく手法の代替ではなく、補完的なツールとしてAIを扱いました。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:36:10 GMT)
MiCo: Multiple Instance Learning with Context-Aware Clustering for Whole Slide Image Analysis [9.4] 多発性インスタンスラーニング (MIL) は, 癌診断と予後に対する病理組織学的全スライド画像 (WSI) 解析において有意な可能性を示唆している。
コンテキスト対応クラスタリング(MiCo)を用いた複数インスタンス学習フレームワークを提案する。
MiCoは、地域間の相互関係を強化し、組織間のセマンティックアソシエーションを強化するように設計されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:29:36 GMT)
$T^3$: Multi-level Tree-based Automatic Program Repair with Large Language Models [9.3] 本研究では,APRタスクにおけるいくつかのコモンCoT技術の性能を体系的に評価する。
これは、LLMの強力な推論機能とツリー検索を統合した革新的なフレームワークであるT3$を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:04:28 GMT)
Landau levels of a Dirac electron in graphene from non-uniform magnetic fields [9.3] ランダウ準位からなるスペクトルに導かれる非一様磁場が存在することを示す。
特に、一様磁場の等方的変形を考慮することで、一様磁場と厳密な等方性を持つ非一様磁場に対する明示的な表現を提示する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:50:05 GMT)
Self-Regulated Neurogenesis for Online Data-Incremental Learning [9.3] SERENAは、各概念を「コンセプトセル」と呼ばれる特殊なネットワークパスにエンコードする
概念が学習されると、その対応する概念セルが凍結され、以前に取得した情報の忘れを効果的に防止する。
実験結果から,本手法は10ベンチマークにまたがる新たな最先端結果を確立するだけでなく,オフラインで教師付きバッチ学習性能を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:35:57 GMT)
Exploring Adapter Design Tradeoffs for Low Resource Music Generation [9.2] 我々は2つのAI音楽モデル、MusicGenとMustangoのアダプタ構成について、ヒンドゥーシャニー古典音楽とトルコ・マカム音楽の2つのジャンルについて検討した。
コンボリューションベースのアダプタはきめ細かな局所的な音楽的詳細を捉えるのに優れ、トランスフォーマーベースのアダプタは長距離依存をよりよく保存する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:18:39 GMT)
AnyCalib: On-Manifold Learning for Model-Agnostic Single-View Camera Calibration [9.2] 我々は,カメラの内在パラメータを単一の内在画像からキャリブレーションする方法であるAnyCalibを提案する。
この中間表現は,広い範囲のカメラモデルにおいて,内在性の閉形式回復を可能にすることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:34:47 GMT)
Doppelganger Method: Breaking Role Consistency in LLM Agent via Prompt-based Transferable Adversarial Attack [9.2] 本稿では,ハイジャックされているエージェントのリスクを実証するために,システム命令と内部情報を公開する「Doppelganger method」を提案する。
また,ドッペルガンガー法に対抗するための「CAT(Caution for Adversarial Transfer)」も提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:18:19 GMT)
Exploring Image Generation via Mutually Exclusive Probability Spaces and Local Correlation Hypothesis [9.1] 確率的生成モデルにおける潜在的な制限を探求する2つの理論的枠組みを提案する。
グローバルな分布を学ぶことは、生成的な振る舞いよりも記憶に繋がる。
本稿では,潜伏変数間の局所相関から生じる生成能力を示す局所相関仮説(LCH)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:32:29 GMT)
OpenNER 1.0: Standardized Open-Access Named Entity Recognition Datasets in 50+ Languages [9.1] OpenNER 1.0は、オープンに利用可能なOpenNERデータセットの標準化されたコレクションである。
我々は、元のデータセットをコーパスにまたがる一貫性のあるエンティティタイプで統一的な表現に修正し、標準化する。
一つのモデルがすべての言語で最善であるわけではなく、NERタスク上のLLMから高い性能を得るための重要な作業が残っている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:51:40 GMT)
Anonymous Shamir's Secret Sharing via Reed-Solomon Codes Against Permutations, Insertions, and Deletions [9.1] 本稿では,コードワードの記号を置換し,挿入や削除を行う相手に対して,リード・ソロモン符号の性能について検討する。
完全に匿名の秘密共有スキームは、(1)秘密が再構築される前に参加者の身元は明らかにされず、(2)無許可の参加者の共有は均一かつ独立である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:45:57 GMT)
Recall and Refine: A Simple but Effective Source-free Open-set Domain Adaptation Framework [9.0] Open-set Domain Adaptation (OSDA)は、ラベル付きソースドメインからラベルなしターゲットドメインへのモデルを適応することを目的としている。
本稿では,これらの制約に対処する新しいSF-OSDAフレームワークであるRecall and Refine(RRDA)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:33:44 GMT)
Smart Ride and Delivery Services with Electric Vehicles: Leveraging Bidirectional Charging for Profit Optimisation [8.9] V2G(EVOP-V2G)を用いた電気自動車のオリエンテーリング問題について紹介する。
これには、動的電気価格のナビゲート、充電ステーションの選択、ルートの制約が含まれる。
1つの進化的(EA)と、大近傍探索(LNS)に基づく2つの準最適メタヒューリスティックアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:02:57 GMT)
rQdia: Regularizing Q-Value Distributions With Image Augmentation [8.9] rQdiaは、ピクセルベースの深層強化学習において、強調画像でQ値分布を正規化する。
RQdiaは,MuJoCo Continuous Control Suiteの9/12タスクと10/12タスクのDrQとSACを,18/26 Atari Arcade環境のData-Efficient Rainbowでそれぞれ強化する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:16:35 GMT)
AgentStealth: Reinforcing Large Language Model for Anonymizing User-generated Text [8.8] AgentStealthは、テキスト匿名化のための自己強化言語モデルである。
本手法は, 匿名化の有効性と実用性の両方において, ベースラインよりも優れていることを示す。
当社の軽量設計は、エッジデバイスへの直接的なデプロイをサポートし、クラウド依存や通信ベースのプライバシリスクを回避する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:48:16 GMT)
VisionGuard: Synergistic Framework for Helmet Violation Detection [8.7] VisionGuardはフレームワイド検出器の限界を克服するために設計されたフレームワークである。
Adaptive LabelingとContextual Expanderモジュールの2つの重要なコンポーネントを統合している。
実験の結果、VisionGuardはベースライン検出器と比較して全体のmAPを3.1%改善した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:45:18 GMT)
MADrive: Memory-Augmented Driving Scene Modeling [8.6] MADriveは、既存のシーン再構築の能力を拡張するために設計されたメモリ拡張された再構築フレームワークである。
大型の外部メモリバンクから回収された視覚的に類似した3Dアセットで観察された車両を置き換える。
結果として得られる置換は、シーン内の車両の完全なマルチビュー表現を提供し、実質的に変化する構成の光現実的な合成を可能にする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:41:07 GMT)
RecCoT: Enhancing Recommendation via Chain-of-Thought [8.5] 現代のレコメンデーションシステムは、暗黙のフィードバック信号からユーザとイテムの協調信号を学習する。
RecSysは、ユーザーがなぜ特定のアイテムを好まないかを理解するのに苦労する。
これらの手法の多くはレビューのレーティングの予測に重点を置いているが、人間には理解できない説明を与えていない。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:14:42 GMT)
Interpretable Hierarchical Concept Reasoning through Attention-Guided Graph Learning [8.5] 本稿では,階層型概念記憶共振器(H-CMR)を提案する。
H-CMRは最先端のパフォーマンスと一致し、概念やモデルの介入を通じて強い人間との相互作用を可能にする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:56:55 GMT)
Distributed Cross-Channel Hierarchical Aggregation for Foundation Models [8.4] 画像モダリティにまたがる多数のチャネルを持つデータセットに対して階層的クロスチャネルアグリゲーション(D-CHAG)アプローチを導入する。
提案手法は,任意のモデル並列戦略やトランスフォーマーアーキテクチャと互換性があり,計算効率を著しく向上させる。
テンソルシャーディングと統合すると,フロンティアスーパーコンピュータ上では,最大75%のメモリ使用量の削減,最大1,024AMDでの2倍以上のスループットを実現した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:58:14 GMT)
An Information-Theoretic Analysis for Federated Learning under Concept Drift [8.3] 本稿では,情報理論を用いてコンセプトドリフトにおける性能を解析し,性能劣化を軽減するアルゴリズムを提案する。
本研究では,3つのドリフトパターン(周期的,漸進的,ランダム)とそのFL性能への影響について検討した。
そこで本研究では,KL分散と相互情報を用いた経験的リスク最小化手法を標準化し,長期的性能を向上させるアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:25:15 GMT)
Multi-convex Programming for Discrete Latent Factor Models Prototyping [8.3] 本稿では,CVXPYをベースとした汎用フレームワークを提案する。
我々のフレームワークはフレキシブルで、DLFMパラメータや潜在要因に対する正規化用語と制約の統合を本質的にサポートしています。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:53:38 GMT)
A GREAT Architecture for Edge-Based Graph Problems Like TSP [8.3] グラフエッジ注意ネットワーク(GREAT)と呼ばれる新しいGNNベースのエッジ指向ニューラルモデルを提案する。
車両経路問題のユークリッドおよび非ユークリッド変種に適用可能な強化学習フレームワークを構築した。
我々のフレームワークは、これらの問題の非ユークリッド変種と学習ベースの解法間の競合結果に最初に取り組みました。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:54:56 GMT)
Bridging the Gap Between Approximation and Learning via Optimal Approximation by ReLU MLPs of Maximal Regularity [8.3] 例えば、$(L,alpha)$-H"older関数は、$mathcalO(dnd/alpha)$, of width $mathcalO(dnd/alpha)$, depth $mathcalO(log(d))$, with $mathcalO(dnd/alpha)$, $mathcalO(dnd/alpha)$, and $mathcalO(dnd/alpha)$, with $mathcal。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:08:57 GMT)
Mitigating Hallucination of Large Vision-Language Models via Dynamic Logits Calibration [8.2] LVLM(Large Vision-Language Models)はマルチモーダル理解において大きな進歩を見せている。
視覚的な入力に反する幻覚、すなわちテキストの生成によってしばしば妨げられる。
既存のトレーニング不要のデコード戦略には、重大な制限がある。
本稿では,テキスト生成と推論時の視覚的エビデンスを整合させる新しいトレーニングフリーデコードフレームワークであるDynamic Logits (DLC)を紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:35:40 GMT)
Federated Item Response Theory Models [8.1] 我々は、従来のIRTモデルをさらなるプライバシーで推定できる新しいフレームワークであるIRT(Federated Item Response Theory)を提案する。
実験により,FedIRTは一般的なRパッケージを用いたIRT推定と同様の統計的精度を実現することを確認した。
この新しいフレームワークは、IRTの分散設定への適用性、例えばマルチスクールアセスメントを、正確さやセキュリティを犠牲にすることなく拡張する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:01:18 GMT)
New Bounds for Sparse Variational Gaussian Processes [8.1] スパース変分ガウス過程 (GPs) は、GPモデルに対する抽出可能な後部近似を構成する。
これらの手法の中核は、訓練関数の値に対する真の後続分布が$bf f$であり、変数を誘導する$bf u$は、条件付きGP前の$p(bf f | bf u)$をその分解に組み込んだ変分分布によって近似されるという仮定である。
モデルトレーニングでは、より一般的な変分分布$q(bf f | bf u)$を使用することで、それを緩和できることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:24:25 GMT)
Experimental Characterization of Quantumness Using the Uncertainty Principle, Coherence, and Nonlocality [8.1] ハイゼンベルクの不確実性原理、コヒーレンス、ベル非局所性は、多くの実験を通じて個別に検討されている。
我々はこれらの量子性の全てを統一的な方法で体系的に特徴づける。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:53:40 GMT)
IDGraphs: Intrusion Detection and Analysis Using Stream Compositing [8.0] IDGraphsは侵入検知のためのインタラクティブな可視化システムである。
実ネットワークルータデータセットにIDGraphを適用すると,総トラフィック1.16TBのフローレベルレコードが179Mになる。
システムは様々な攻撃や異常を検出し解析する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:08:20 GMT)
Evidence-based diagnostic reasoning with multi-agent copilot for human pathology [8.0] 現在の計算病理学におけるMLLM(Multimodal Large Language Model)は限界に直面している。
そこで我々は,ヒトの病理に特化して設計された新しいMLLMであるPathChat+を紹介した。
また、PathChat+を利用した推論可能なマルチエージェントAIシステムであるSlideSeekを紹介し、ギガピクセル全体の画像を自律的に評価する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:02:16 GMT)
Global and Local Entailment Learning for Natural World Imagery [7.9] Radial Cross-Modal Embeddings (RCME) は、推移性強化エンテーメントの明示的なモデリングを可能にするフレームワークである。
生活樹の階層を表現できる階層的視覚言語基盤モデルを構築した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:05:06 GMT)
SMMILE: An Expert-Driven Benchmark for Multimodal Medical In-Context Learning [7.8] マルチモーダル・イン・コンテクスト・ラーニング (ICL) は, 医学などの領域において有意な可能性を秘めている。
SMMILEは、医療タスクのためのエキスパート主導型マルチモーダルICLベンチマークである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:08:18 GMT)
Gradient-Based Neuroplastic Adaptation for Concurrent Optimization of Neuro-Fuzzy Networks [7.8] ニューロファジィネットワーク(Neuro-fuzzy Network, NFN)は、従来のニューラルアーキテクチャと同様に機能する、透過的で象徴的な普遍関数近似である。
我々はNFNの並列パラメータと構造に対する神経可塑性適応と呼ばれる応用非依存的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:08:11 GMT)
EndoFlow-SLAM: Real-Time Endoscopic SLAM with Flow-Constrained Gaussian Splatting [7.8] 光学的フローロスを幾何学的制約として導入し、シーンの3次元構造とカメラモーションの両方を効果的に制約する。
さらに,SLAMシステムにおけるシーン表現を改善するために,キーフレームに対応する視点に着目して3DGSの洗練戦略を改善する。
提案手法は,新しい視点合成法とポーズ推定法において,既存の最先端手法よりも優れ,静的かつダイナミックな手術シーンにおいて高い性能を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:06:46 GMT)
Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval [7.8] 本稿では, 意味的類似性ではなく, エフェシンタクティック(enmphsyntactic)によるデモンストレーションを選択する検索ベースのプロンプト戦略を提案する。
クエリ文と検索した例の語彙的重なり合いがパフォーマンスに与える影響を解析し、ドメイン内設定とクロスドメイン設定の両方でアプローチを評価する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:14:52 GMT)
One-way network nonlocality of continuous variable entangled networks [7.7] 2つの絡み合った状態からなる全光量子ネットワークのネットワーク非局所性を検証するための最初の手法を提案する。
これにより、すべての光連続変数量子ネットワークから生成される量子相関を検証するための最初のデバイス非依存の方法が提供される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:18:15 GMT)
DiLoCoX: A Low-Communication Large-Scale Training Framework for Decentralized Cluster [7.6] そこで我々は,低コミュニケーションの大規模分散クラスタトレーニングフレームワークであるDiLoCoXを提案する。
パイプライン並列性と、通信とローカルトレーニングのデュアルステップ遅延オーバーラップと、適応的なグラディエント圧縮スキームを組み合わせる。
本研究では,DiLoCoXがモデル収束の無視可能な劣化を維持しつつ,分散トレーニングにおいて357倍の高速化を実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:45:04 GMT)
The Aging Multiverse: Generating Condition-Aware Facial Aging Tree via Training-Free Diffusion [7.5] 一つの画像から複数の可塑性顔の老化軌跡を生成するためのフレームワークであるAging Multiverseを紹介する。
本研究では,アイデンティティの保存,年齢の正確さ,条件管理のバランスをとるための,学習自由拡散に基づく手法を提案する。
実験とユーザスタディでは、アイデンティティ保存、高齢化リアリズム、条件付きアライメントなど、最先端のパフォーマンスが実証されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:57:47 GMT)
Generate the Forest before the Trees -- A Hierarchical Diffusion model for Climate Downscaling [7.5] ダウンスケーリングは、地域計画に必要な高解像度の気候データを生成するのに不可欠であるが、従来の手法は計算的に要求されるままである。
拡散フレームワークに容易に拡張可能な階層的サンプリングプロセスを導入する階層的拡散ダウンスケーリング(HDD)モデルを導入する。
HDDはERA5の再解析データセットとCMIP6モデル上での競合精度を実現し、競合する結果の最大半分のピクセルで実行することで計算負荷を大幅に削減する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:39:13 GMT)
An Early Investigation of the HHL Quantum Linear Solver for Scientific Applications [7.5] 本稿では,Harrow-Hassidim-Lloyd (HHL) アルゴリズムを用いて量子コンピューティングによる科学的・工学的な問題に対処する。
電力グリッド管理や熱伝達問題といった領域に着目し,量子位相推定の精度の相関性を示す。
本稿では,量子誤り訂正前後の量子位相推定から指数的資源コストを推定し,物理量子ビットの需要を削減できる可能性を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:08:32 GMT)
SACL: Understanding and Combating Textual Bias in Code Retrieval with Semantic-Augmented Reranking and Localization [7.5] Retrieval-Augmented Code Generation (RACG)は、関連情報を検索することでコード生成を向上させる重要な技術である。
本研究では,コード機能を維持しながら,特定の特徴を体系的にマスキングすることで,コード検索の詳細な分析を行う。
テキスト情報を強化し,コードや構造的知識を意味情報で強化することでバイアスを低減するフレームワークであるSACLを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:06:50 GMT)
Personalized Robotic Object Rearrangement from Scene Context [7.4] 我々は、ユーザの組織的嗜好を学習するためのオブジェクト再構成ベンチマークであるPARSECを紹介する。
ParSECは、72人のユーザからクラウドソースされた110Kのアレンジメントの新たなデータセットの上に構築されている。
LLMに基づくパーソナライズされた再構成モデルであるContextSortLMを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:26:27 GMT)
Task-Aware KV Compression For Cost-Effective Long Video Understanding [7.4] 長ビデオ理解(LVU)は、既存のマルチモーダル大言語モデル(MLLM)にとって深刻な課題である。
近年、この問題を緩和するためにKV圧縮を検討したが、しばしば高い圧縮比で大きな情報損失を被る。
本稿では,LVUタスクごとに重要な映像情報を柔軟に保存するVideo-X2Lを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:43:43 GMT)
Rethinking Oversaturation in Classifier-Free Guidance via Low Frequency [7.4] 低周波信号に基づく新しい視点を導入する。
これらの信号の冗長な情報の蓄積は、過飽和や非現実的なアーティファクトの背後にある重要な要因である。
実験により,LF-CFGは様々な拡散モデルにおける過飽和や非現実的アーティファクトを効果的に緩和することを示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:34:00 GMT)
Quantum Reinforcement Learning Trading Agent for Sector Rotation in the Taiwan Stock Market [7.4] 台湾株式市場におけるセクターローテーションのためのハイブリッド量子古典的強化学習フレームワークを提案する。
量子強化モデルは、常により高いトレーニング報酬を達成するが、それらは現実世界の投資指標において古典的なモデルより劣る。
この不一致は、金融分野に強化学習を適用する上での課題を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:29:19 GMT)
FuzzAug: Data Augmentation by Coverage-guided Fuzzing for Neural Test Generation [7.3] 本稿では,ファジィ化の利点を大規模言語モデルに導入する新しいデータ拡張手法FuzzAugを提案する。
FuzzAugはベースラインからパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:00:02 GMT)
Balancing Privacy, Robustness, and Efficiency in Machine Learning [7.3] マシンラーニングシステムにおいて、堅牢性、プライバシ、効率性を同時に達成することは、一般的な脅威モデルの下では不可能である、と我々は主張する。
我々は、ロバストネス・プライバシー・効率のトリレンマの形式化を目的とした、体系的な研究課題を提唱する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:12:25 GMT)
Consistent Zero-shot 3D Texture Synthesis Using Geometry-aware Diffusion and Temporal Video Models [7.3] VideoTexはシームレスなテクスチャ合成のための新しいフレームワークである。
ビデオ生成モデルを利用して、3Dテクスチャの空間的および時間的不整合に対処する。
提案手法は,3次元メッシュ構造の正確な利用を可能にする幾何学的条件を取り入れたものである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:25:16 GMT)
Simulating Hard Attention Using Soft Attention [7.3] 我々は、ソフトアテンションがハードアテンションをシミュレートできる条件、すなわち、全てのアテンションをポジションのサブセットに効果的にフォーカスする条件について研究する。
本研究では,ソフトアテンション変換器がハードアテンション変換器によって認識される言語の公式を計算する方法を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:41:24 GMT)
Large Language Model Agent for Modular Task Execution in Drug Discovery [7.2] 本稿では,大規模言語モデル(LLM)をベースとしたモジュール型フレームワークを提案する。
LLM推論とドメイン固有のツールを組み合わせることで、バイオメディカルデータ検索、ドメイン固有の質問応答、分子生成、特性予測、特性認識分子精製、および3Dタンパク質リガンド構造生成を行う。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:19:01 GMT)
Efficient Spiking Point Mamba for Point Cloud Analysis [7.1] スパイキングニューラルネットワーク(SNN)は3次元時間的特徴を抽出するエネルギー効率の良い方法を提供する。
3D領域における最初のマンバベースSNNであるSpking Point Mamba (SPM)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:50:04 GMT)
A Multi-Source Data Fusion-based Semantic Segmentation Model for Relic Landslide Detection [7.1] 提案したHPCL-NetはLoess Plateau Relic地すべりデータセットを用いて評価した。
提案したHPCL-Netは,mIoUが0.620から0.651に増加し,Landslide IoUが0.334から0.394に改善され,F1scoreが0.501から0.565に向上した既存のモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:31:46 GMT)
Pretrained Reversible Generation as Unsupervised Visual Representation Learning [7.1] 本稿では,事前学習された連続生成モデルの生成過程を逆転させて教師なし表現を抽出する,事前学習可逆生成(PRG)を提案する。
PRGは教師なし生成モデルを効果的に再利用し、その高い能力を利用して下流タスクの堅牢で一般化可能な特徴抽出器として機能する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:26:18 GMT)
Efficiently Escaping Saddle Points under Generalized Smoothness via Self-Bounding Regularity [7.1] 我々は、必ずしも滑らかでない(次数/ヘシアンがリプシッツである)非順序関数の最適化を第一法を用いて検討する。
我々は、滑らかさの一般化の下で、第一次定常点に対する第一次メソッドの第一収束保証を確立する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:38:58 GMT)
Faster Fixed-Point Methods for Multichain MDPs [7.0] 平均回帰基準の下で,一般(多鎖)マルコフ決定過程(MDP)を解くための値イテレーション(VI)アルゴリズムについて検討する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:31:21 GMT)
Response Quality Assessment for Retrieval-Augmented Generation via Conditional Conformal Factuality [7.0] Conformal-RAGは、大規模言語モデル(LLM)における共形予測(CP)の最近の応用に触発された新しいフレームワークである。
精巧なサブステートの品質を統計的に保証し、真理の答えを必要とせずに応答信頼性を確保する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:52:56 GMT)
Robust Policy Switching for Antifragile Reinforcement Learning for UAV Deconfliction in Adversarial Environments [7.0] 無人航空機(UAV)は、強化学習(RL)の脆弱性を利用する敵の攻撃にさらされている。
本稿では,より広範な分布シフトへの適応性を高めるための反フレジブルRLフレームワークを提案する。
より優れた性能を発揮し、短い航法路の長さと衝突のない航法軌道の速度を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:06:29 GMT)
Generative Adversarial Evasion and Out-of-Distribution Detection for UAV Cyber-Attacks [7.0] 本稿では,IDS機構を回避したステルス性対向攻撃を実現するための条件生成対向ネットワーク(cGAN)ベースのフレームワークを提案する。
本研究は,IDS能力を高めるための高度な確率的モデリングの重要性を強調した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:56:34 GMT)
Split-Merge: A Difference-based Approach for Dominant Eigenvalue Problem [6.9] Split-Mergeはスペクトル知識を必要とせずに加速収束を達成するアルゴリズムである。
効率性とスケーラビリティの両面で、最先端のメソッドを一貫して上回ります。
従来のパワーメソッドよりも$boldsymbol10times$のスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:45:17 GMT)
Multimodal Misinformation Detection Using Early Fusion of Linguistic, Visual, and Social Features [6.9] 本研究は、新型コロナウイルス(COVID-19)パンデミックとTwitter(現X)から収集された選挙期間中に、テキストと画像の両方を含む1,529のツイートを分析した。
その結果、教師なしと教師なしの機械学習モデルを組み合わせることで、非モダルモデルに比べて15%、バイモーダルモデルに比べて5%の分類性能が向上した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:17:35 GMT)
Interpretable Representation Learning for Additive Rule Ensembles [6.8] 記号規則の小さな付加的なアンサンブルは解釈可能な予測モデルを提供する。
我々は、入力変数の学習可能なスパース線形変換を導入することにより、古典的な規則アンサンブルを拡張する。
反復的に重み付けされたロジスティック回帰の定式化に基づく逐次グリーディ最適化を用いた学習手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:24:08 GMT)
DKGCM: A Spatio-Temporal Prediction Model for Traffic Flow by Fusing Spatial Node Clustering Method and Fourier Bidirectional Mamba Mechanism [6.6] DKGCMと呼ばれる新しいグラフ畳み込みネットワーク構造を提案し、交通需要予測の精度を向上させる。
動的時間ウォーピング(DTW)とK平均クラスタリングを使用してトラフィックノードをグループ化し、より効果的に空間依存性をキャプチャする。
我々のモデルはいくつかの高度な手法より優れており、3つの公開データセットに対して強力な結果が得られる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:33:36 GMT)
Leveraging LLM-Assisted Query Understanding for Live Retrieval-Augmented Generation [6.6] 実世界のライブ検索拡張生成(RAG)システムは、ノイズがありあいまいで、複数の意図を含むユーザクエリを処理する場合、課題に直面します。
本稿では,オープンドメイン環境におけるRAGシステムの堅牢性と有効性向上を目的とした新しいフレームワークであるOmni-RAGを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:35:12 GMT)
ThermalDiffusion: Visual-to-Thermal Image-to-Image Translation for Autonomous Navigation [6.5] 本稿では,合成熱データを用いたマルチモーダルデータセットの拡張手法を提案し,熱カメラの広範かつ迅速な適応を実現する。
本研究では、実世界の物体の熱特性を学習するために、自己アテンションを用いて既存のRGB画像を熱画像に変換するための条件拡散モデルの利用について検討する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:18:22 GMT)
PhishKey: A Novel Centroid-Based Approach for Enhanced Phishing Detection Using Adaptive HTML Component Extraction [6.5] PhishKeyはハイブリッドソースからの自動特徴抽出を用いた新しいフィッシング検出手法である。
文字レベルの処理とURL分類のためのCNN、ワードレベルのHTMLコンテンツのためのCentroidベースのKey Component Phishing Extractor(CAPE)を組み合わせる。
最大98.70%のF1スコアを実現し、性能劣化を最小限に抑えたインジェクションアタックのような敵の操作に対して強い抵抗を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:04:55 GMT)
"What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets [6.5] HealthChat-11Kは、25万のユーザメッセージからなる1万1千の現実世界の会話のキュレートされたデータセットである。
我々の分析は、ユーザーが健康情報を求める方法と理由に関する洞察を明らかにする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:52:18 GMT)
Progtuning: Progressive Fine-tuning Framework for Transformer-based Language Models [6.4] 本稿では,トランスフォーマーに基づく言語モデルに対するプログレッシブラーニングと組み合わせた,新しい微調整フレームワークProgtuningを提案する。
プログチューニングは、コントリビューションに基づいて更新されたトランスフォーマーブロックの数を徐々に減少させる。
パラメータ効率のよい微調整法で高い適応性を示し、様々な適応シナリオで優れた性能を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:37:15 GMT)
Curriculum-Guided Antifragile Reinforcement Learning for Secure UAV Deconfliction under Observation-Space Attacks [6.4] 強化学習政策は、観測空間における敵の攻撃に対して脆弱である。
本稿では,段階的対向摂動のカリキュラムに適応するために設計された反フレジブルなRLフレームワークを提案する。
その結果, 反フランジ政策は標準およびロバストなRLベースラインよりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:10:41 GMT)
FedDAA: Dynamic Client Clustering for Concept Drift Adaptation in Federated Learning [6.3] 我々は、貴重な歴史的知識を保持しつつ、マルチソース概念のドリフトに適応するように設計された動的クラスタリングFLフレームワークであるFedDAAを提案する。
特に、FedDAAは3つのモジュールを統合している。クラスタ数決定モジュールは最適なクラスタ数を見つけることができ、実際のドリフトと仮想/ラベルドリフトを区別するリアルドリフト検出モジュールは、有用な履歴情報を保持しながら新しいデータに適応するコンセプトドリフト適応モジュールである。
実験の結果、FedDAAはFashion-MNIST、CIFAR-10、CIFAR-100の最先端手法よりも精度が7.84%から8.52%向上した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:09:08 GMT)
Integrating Vehicle Acoustic Data for Enhanced Urban Traffic Management: A Study on Speed Classification in Suzhou [6.2] 車両騒音と駆動速度の結合をモデル化するディープ畳み込みニューラルネットワーク(BMCNN)を提案する。
BMCNNは、SZUR-Acousticデータセットで87.56%、パブリックIDMT-Trafficデータセットで96.28%の分類精度を達成した。
提案手法は,実時間騒音モニタリングと速度推定のためのスマートシティ交通管理システムに組み込むことができる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:53:22 GMT)
Optimal Single-Policy Sample Complexity and Transient Coverage for Average-Reward Offline RL [6.2] 本研究では, 平均回帰MDPにおけるオフライン強化学習について検討し, 分散シフトと非一様カバレッジの観点から, さらなる課題を提示する。
対象とする政策,特にバイアススパンと新しい政策が半径を超えることのみに基づき,平均逆オフラインRLに束縛された最初の完全単一政治サンプルの複雑性が生じる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:22:39 GMT)
Controllable 3D Placement of Objects with Scene-Aware Diffusion Models [6.0] 粗い物体マスクと組み合わせた視覚マップは高品質な物体配置に十分であることを示す。
位置制御と外観制御を組み合わせることで、既存の物体をシーン内の正確な位置に配置できることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:31:39 GMT)
Continual Self-Supervised Learning with Masked Autoencoders in Remote Sensing [6.0] マスク付きオートエンコーダ(CoSMAEと表記される)の文脈における新しい連続的自己教師型学習法を提案する。
実験の結果,CoSMAEは最先端CL法よりも最大4.94%の大幅な改善を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:28:59 GMT)
MT2-CSD: A New Dataset and Multi-Semantic Knowledge Fusion Method for Conversational Stance Detection [5.9] MT2-CSDは,多目的・多ターン会話姿勢検出のための包括的データセットである。
これらの課題に対処するため,Large Language Model enhanced Conversational Attention Network (LLM-CRAN)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:59:30 GMT)
Inverse Scene Text Removal [5.9] Scene text removal (STR) は、画像からテキスト要素を消去することを目的としている。
STRは通常テキスト領域を検出し、theninpaintします。
Inverse STR (ISTR) を検証し,2値分類におけるSTR処理画像と焦点を解析する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:32:35 GMT)
Rethinking Detecting Salient and Camouflaged Objects in Unconstrained Scenes [5.9] そこで我々はUSCNetと呼ばれるモデルを提案する。
そこで我々は, CSCSと呼ばれる評価指標を設計し, モデルが有意な対象と偽装対象を区別する能力を評価する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:53:27 GMT)
Exploring the Design Space of 3D MLLMs for CT Report Generation [5.9] マルチモーダル大規模言語モデル (MLLM) は,放射線学報告生成 (RRG) を自動化するための有望な方法として登場した。
本研究では,視覚的入力表現,プロジェクタ,Large Language Models (LLM) および3次元CTレポート生成のための微調整技術を含む3次元MLLMの設計空間について検討する。
我々は,GREENスコアのパフォーマンスを最大10%向上させ,MICCAI 2024 AMOS-MMチャレンジで2位となる2つの知識に基づくレポート向上手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:54:20 GMT)
ClearSight: Human Vision-Inspired Solutions for Event-Based Motion Deblurring [5.8] 本研究はバイオインスパイアされたデュアルドライブハイブリッドネットワーク(BDHNet)を紹介する。
ヒト視覚系における視覚的注意機構にインスパイアされた本研究では、バイオインスパイアされたデュアルドライブハイブリッドネットワーク(BDHNet)を導入する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:04:23 GMT)
Conversations with AI Chatbots Increase Short-Term Vaccine Intentions But Do Not Outperform Standard Public Health Messaging [5.8] 大規模言語モデル(LLM)ベースのチャットボットは説得力のあるコミュニケーションにおける約束を示す。
このランダム化対照試験には、930人のワクチンヘシタント親が関与した。
1)弱いコントロール(メッセージなし)、(2)ケアの基準を反映した強いコントロール(公的公衆衛生資料を読み取る)、または3と4の2つの条件のうちの1つに参加者がランダムに割り当てられた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:04:58 GMT)
Demonstrating Interoperable Channel State Feedback Compression with Machine Learning [5.7] 本稿では,相互運用可能な圧縮モデルと非圧縮MLモデルを秘密裏にトレーニングするための新しいアプローチを提案する。
デバイスとネットワークベンダ間でMLモデルを共有することなく、正確なMLベースのチャネルフィードバックリンクを開発することができることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:40:03 GMT)
Arbitrary Boundary Conditions and Constraints in Quantum Algorithms for Differential Equations via Penalty Projections [5.7] 複雑な境界条件は、自然と工学で生じる現象を正確に記述するために不可欠である。
任意の境界条件で微分方程式を解くための効率的な量子アルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:14:32 GMT)
Active Learning for Manifold Gaussian Process Regression [5.6] 本稿では,多様体ガウス過程(GP)回帰のための能動的学習フレームワークを提案する。
多様体学習と戦略的データ選択を組み合わせることで、高次元空間における精度を向上させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:25:39 GMT)
A Novel Framework for Integrating 3D Ultrasound into Percutaneous Liver Tumour Ablation [5.6] 3D超音波(US)画像検査は, 経皮的肝腫瘍アブレーションの結果に有意な有意な効果を示した。
3D USを治療領域に移行させるには臨床統合が不可欠である。
本稿では,標準アブレーションワークフローに3D USを統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:39:08 GMT)
LLM-guided Chemical Process Optimization with a Multi-Agent Approach [5.4] 化学プロセスの最適化は生産効率と経済性能の最大化に不可欠である。
勾配に基づくアルゴリズム、進化的アルゴリズム、パラメータグリッド探索を含む従来の手法は、操作上の制約が定義されていない場合や利用できない場合、実用的ではない。
本稿では,大規模言語モデル(LLM)エージェントのマルチエージェントフレームワークについて,最小限のプロセス記述から自律的に動作制約を推測する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:03:44 GMT)
SoK: Can Synthetic Images Replace Real Data? A Survey of Utility and Privacy of Synthetic Image Generation [5.2] この研究は、PPDSの質問に答えようとしている: 合成データは、実際のデータを効果的に置き換えることができるか?
本研究は,多種多様な手法を体系的に評価することにより,合成データ生成手法の実用・プライバシトレードオフに関する実用的な知見を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:32:12 GMT)
Ask before you Build: Rethinking AI-for-Good in Human Trafficking Interventions [5.2] 我々は5段階の倫理的評価ツールとしてRQ(Radical Questioning)フレームワークを紹介した。
RQは、仮定に直面し、パワーをマップし、設計前に害を考慮するための、上流で熟考的な空間を提供する。
本稿では、器楽主義的規範に挑戦し、リレーショナルで反射的な責任を集中する、より広範なAI倫理哲学にRQを位置づける。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:05:15 GMT)
Towards Provable (In)Secure Model Weight Release Schemes [5.2] 最近のセキュアなウェイトリリーススキームは、モデルのオーナシップを保護し、誤用を防止しながら、オープンソースのモデル配布を可能にすると主張している。
これらのアプローチには厳格なセキュリティ基盤がなく、非公式なセキュリティ保証のみを提供する。
暗号の確立された研究に触発されて、いくつかの具体的なセキュリティ定義を導入することで、ウェイトリリーススキームのセキュリティを形式化する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:45:10 GMT)
Process mining-driven modeling and simulation to enhance fault diagnosis in cyber-physical systems [5.1] CPS(Cyber-Physical Systems)の故障診断は,システムの信頼性と運用効率の確保に不可欠である。
本稿では, 時系列, プロセスマイニング, シミュレーションにおける集団異常検出を統合した, 教師なし故障診断手法を提案する。
これにより、予測保守と産業環境のためのデジタルツインの開発を支援する総合的なフォールト辞書の作成が可能になる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:29:37 GMT)
Class-Agnostic Region-of-Interest Matching in Document Images [5.1] 本稿では,「クラス非依存領域-関心のマッチング」という新しいタスクを定義する。
カスタマイズされたリージョンを、フレキシブルで効率よく、マルチグラニュラで、オープンな方法でマッチングすることを目指している。
実環境下での難易度を3段階に設定したベンチマークRoI-Matching-Benchを構築した。
また,シアムネットワークを用いてマルチレベルの特徴を抽出する新しいフレームワークRoI-Matcherを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:09:19 GMT)
Nested Stochastic Algorithm for Generalized Sinkhorn distance-Regularized Distributionally Robust Optimization [5.0] 分散ロバストシフト最適化(DRO)は、データ分散に対するロバストモデルのための強力な手法である。
本稿では、一般化近似関数によって不確実性をモデル化した正規化非DRO問題の解決を目的とする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:48:14 GMT)
Hierarchical Sub-action Tree for Continuous Sign Language Recognition [4.9] 連続手話認識(Continuous sign language recognition)は、未編集のビデオをグロスに書き起こすことを目的としている。
近年の研究では、訓練データ不足により、大規模なデータセットや正確なアノテーションの欠如がCSLRのボトルネックとなっていることが示されている。
本稿では,HST-CSLR(Hierarchical Sub-action Tree)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:27:50 GMT)
GATSY: Graph Attention Network for Music Artist Similarity [4.8] GATSYは、グラフアテンションネットワーク上に構築され、アーティストのクラスタ化された埋め込みによって駆動される新しいレコメンデーションシステムである。
本稿では,グラフアテンションネットワーク上に構築された新たなレコメンデーションシステムGATSYを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:31:17 GMT)
Proximal Point Method for Online Saddle Point Problem [4.8] 本稿では,2プレイヤの時間変動コンベックス・コンベレーブゲームの連続を含むオンラインサドル点問題に焦点を当てる。
環境の非定常性を考えると、アルゴリズム設計のパフォーマンス指標として双対性ギャップと動的ナッシュ均衡の後悔を採用する。
点法には3つの変種がある: Online Proximal Point Method (OPPM), Optimistic OPPM (OptOPPM), OptOPPM with multiple predictor。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:01:47 GMT)
Link Prediction with Physics-Inspired Graph Neural Networks [4.7] 我々は、ヘテロフィリーの下でのリンク予測の貴重なタスク、レコメンデーションシステム、ソーシャルネットワーク分析、その他のアプリケーションにおける興味深い問題に焦点を当てる。
GRAFF-LPは、エッジ勾配の分離を暗黙的に学習することにより、既存のエッジから存在するものを効果的に識別することを示す。
また, 単純なGNNであっても, ヘテロ親和性リンクの予測が, ホモ親和性リンクと比較して困難ではないことを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:15:29 GMT)
Artificial Delegates Resolve Fairness Issues in Perpetual Voting with Partial Turnout [4.7] 本研究では、欠席者を表すために訓練された選好学習エージェントである人工デリゲートの永久投票システムへの統合について検討する。
以上の結果から,欠失は公平性に大きく影響を及ぼすが,Artificial Delegatesはこれらの効果を確実に軽減し,多様なシナリオにおける堅牢性を高めることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:44:50 GMT)
Consensus-Driven Uncertainty for Robotic Grasping based on RGB Perception [4.7] どちらも対象物の6-DoFポーズを推定し、その推定の不確かさを予測する把握エージェントは、高い不確実性の下で動作しないことを選択することで、タスクの失敗を回避することができる。
本稿では,画像に基づくポーズ推定によって導かれるグリップが,そのグリップが試みられる前に成功するかどうかを予測するための,軽量で深いネットワークのトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:12:14 GMT)
Exploring Micro Frontends: A Case Study Application in E-Commerce [4.6] この論文は、特に産業の文脈において、いつマイクロを採用する価値があるかを理解することを目的としている。
学術文献,灰色文献の両面からミクロスの現状を調査した。
そして、すでに使われている手作り製品のためのマーケットプレースで、このアーキテクチャスタイルを実装しました。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:17:22 GMT)
Balancing Privacy and Utility in Correlated Data: A Study of Bayesian Differential Privacy [4.6] 差分プライベート(DP)システムにおけるプライバシリスクは,データの相関によって著しく増加する。
現実世界のデータベースにおける依存関係の多様さを考えると、この監視はプライバシー保護にとって重要な課題となる。
BDPはこれらの相関を考慮するためにDPを拡張しているが、現在のBDPメカニズムは、その採用を制限する顕著なユーティリティ損失を示している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:25:44 GMT)
BitMark for Infinity: Watermarking Bitwise Autoregressive Image Generative Models [4.5] Infinityのような最先端のテキスト画像モデルは、前例のないスピードで画像を生成する。
アウトプットがインターネットに浸透するにつれて、トレーニングデータとしてスクラップ化され、再利用される可能性が高い。
Infinity用の堅牢なビットワイズ透かしフレームワークであるBitMarkを紹介します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:03:13 GMT)
Energy Matching: Unifying Flow Matching and Energy-Based Models for Generative Modeling [4.4] エネルギーベースモデル(EBM)は、フローやスコアの一致によるノイズとデータの分布をマッピングする。
EBMの柔軟性でフローベースのアプローチを実現するフレームワークであるEnergy Matchingを提案する。
提案手法は,CIFAR-10 と ImageNet 生成における既存の EBM を大幅に上回っている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:04:51 GMT)
Multi-task parallelism for robust pre-training of graph foundation models on multi-source, multi-fidelity atomistic modeling data [4.3] グラフニューラルネットワークを用いたグラフ基盤モデルは、持続的で効率的な原子論的モデリングを約束する。
プレトレーニング中のマルチソース・マルチ忠実データ処理の課題に対処するために、近年の研究ではマルチタスク学習を採用している。
本稿では,GPUアクセラレーションを用いたマルチタスク並列化手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:04:05 GMT)
Capturing Style in Author and Document Representation [4.3] 著者と文書の埋め込みをスタイリスティックな制約で学習する新しいアーキテクチャを提案する。
本稿では,Gutenbergプロジェクトから抽出した文芸コーパス,Blog Authorship,IMDb62の3つのデータセットについて評価を行った。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:21:53 GMT)
LASFNet: A Lightweight Attention-Guided Self-Modulation Feature Fusion Network for Multimodal Object Detection [4.3] 本稿では,単一機能レベルの核融合ユニットを用いて高速な核融合検出を行う新しい核融合検出ベースラインを提案する。
このアプローチに基づいて,軽量な注意誘導型自己変調機能融合ネットワーク(LASFNet)を提案する。
提案手法は, パラメータ数と計算コストを最大90%, 85%削減し, 良好な効率・精度のトレードオフを実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:32:33 GMT)
2D Triangle Splatting for Direct Differentiable Mesh Training [4.2] 2DTS(2D Triangle Splatting)は、3次元ガウス原始体を2次元三角形のフェーレットに置き換える新しい方法である。
三角形プリミティブにコンパクト性パラメータを組み込むことで、光現実性メッシュの直接訓練を可能にする。
提案手法は,既存のメッシュ再構成手法と比較して,視覚的品質の優れた再構成メッシュを生成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:46:05 GMT)
Explainability of Large Language Models using SMILE: Statistical Model-agnostic Interpretability with Local Explanations [4.1] GPT、LLAMA、Claudeといった大規模な言語モデルは、テキストを生成するのに驚くほど強力になっています。
しかし、彼らはまだブラックボックスなので、何を言うべきかをどう判断するかを理解するのは難しい。
SMILEは、これらのモデルがプロンプトの異なる部分にどのように反応するかを説明する新しい方法である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:16:59 GMT)
Detection of Breast Cancer Lumpectomy Margin with SAM-incorporated Forward-Forward Contrastive Learning [4.1] 本稿では,Segment Anything Model(SAM)とForward-Forward Contrastive Learning(FFCL)を組み合わせた新しいディープラーニングフレームワークを提案する。
提案手法は,ベースラインモデルよりも27.4%向上し,推定時間を47ミリ秒に短縮し,マージン分類とセグメンテーションマージンの0.8455を達成した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:46:28 GMT)
The State of Large Language Models for African Languages: Progress and Challenges [4.1] 本稿では,6つの大言語モデル (LLM) ,8つの小言語モデル (SLM) および6つの特殊SLM (SSLM) のアフリカ言語カバレッジを比較検討する。
評価対象は、言語カバレッジ、トレーニングセット、技術的な制限、スクリプトの問題、言語モデリングのロードマップなどだ。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:01:18 GMT)
Dynamic Bayesian Item Response Model with Decomposition (D-BIRD): Modeling Cohort and Individual Learning Over Time [4.0] D-BIRD(D-BIRD:動的項目応答モデル)を提案する。
シミュレーションでパラメータ回復を評価し,実世界の個別学習データを用いてモデルを実証する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:14:28 GMT)
Detecting Referring Expressions in Visually Grounded Dialogue with Autoregressive Language Models [3.9] 本研究の目的は,言語文脈のみが言及の検出にどのような影響を及ぼすかを検討することである。
我々は,事前訓練された大言語モデル (LLM) を用いて,会話の展開における参照スパンの比較的詳細なアノテーションを実行する。
その結果,中程度サイズのLLM,比較的小さなデータセット,パラメータ効率の高い微調整を用いても,テキストのみのアプローチが有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:14:20 GMT)
Simultaneously Fair Allocation of Indivisible Items Across Multiple Dimensions [3.8] 本稿では,多次元空間における不特定項目の公平な配置について検討する。
エージェントが複数の基準に従ってバンドルを評価する複雑な環境での公平さに対処する必要があることが動機である。
伝統的に1次元の公平性の概念は、複数の属性にまたがる公平性を捉えられない。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:27:22 GMT)
SmoothSinger: A Conditional Diffusion Model for Singing Voice Synthesis with Multi-Resolution Architecture [3.8] SmoothSingerは高品質で自然な歌声を合成するための条件拡散モデルである。
低品質の合成オーディオを統一されたフレームワークで直接洗練し、2段階のパイプラインに関連する劣化を緩和する。
大規模な中国語歌唱コーパスであるOpencpopデータセットの実験は、SmoothSingerが最先端の結果を達成することを示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:07:45 GMT)
Boosting Generative Adversarial Transferability with Self-supervised Vision Transformer Features [3.7] 本稿では,自己教師型視覚変換器(ViT)の表現を活用すれば,対向トランスフォーマビリティが向上するかどうかを考察する。
コントラスト学習(CL)によるグローバルな構造的特徴とマスク画像モデリング(MIM)による局所的なテクスチャ的特徴の両方を活用する。
CLおよびMIMは,ViTsを異なる特徴傾向に適応し,タンデムで利用した場合,高い対向的一般化性を示すことが示唆された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:47:51 GMT)
ResQ: A Novel Framework to Implement Residual Neural Networks on Analog Rydberg Atom Quantum Computers [3.6] ResNetは、通常の微分方程式の原理を用いてニューラルネットワークの有効性を改善することを目的としている。
本稿では、アナログRydberg原子量子コンピュータがResNetsに特に適している理由について考察する。
我々はまた、ライドバーグ原子量子コンピュータの力学を最適化して分類問題を解く新しいフレームワークResQを紹介した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:55:12 GMT)
TSDASeg: A Two-Stage Model with Direct Alignment for Interactive Point Cloud Segmentation [3.6] 本稿では,双方向アライメントモジュールとメモリモジュールを組み合わせた2段階モデルであるTSDASegを提案する。
直交アライメントモジュールを導入し、3次元点雲とテキスト/2次元画像データとの明確なアライメントを確立する。
メモリモジュール内では、複数の専用メモリバンクを使用して、テキストの特徴、視覚的特徴、およびそれらの相互モーダル対応マッピングを別々に格納する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:10:33 GMT)
Lower Bounds on the Size of Markov Equivalence Classes [3.6] マルコフ同値クラスの期待値に対して指数関数的に大きな下界を3つの設定で証明する。
これらの仮定が緩和された場合、もはやそうではないことを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:44:23 GMT)
Metadata Enrichment of Long Text Documents using Large Language Models [3.5] 本プロジェクトでは,1920年から2020年にかけて出版された英語のHatiTrust Digital Libraryから取得した長文文書のメタデータ,論文,論文のセマンティックエンリッチ化と拡張を行った。
このデータセットは、計算社会科学、デジタル人文科学、情報科学などの分野の研究を進めるための貴重なリソースを提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:55:47 GMT)
TableMoE: Neuro-Symbolic Routing for Structured Expert Reasoning in Multimodal Table Understanding [3.4] TableMoEは、マルチモーダルテーブルデータに対する堅牢で構造化された推論のために特別に設計された、ニューロシンボリックなMixture-of-Connector-Experts (MoCE)アーキテクチャである。
TableMoEは革新的なNeuro-Symbolic Routing機構を備えており、潜在意味トークンの役割を予測し、テーブル要素を専門の専門家に動的にルーティングする。
評価のために、実世界のマルチモーダル劣化と構造的複雑さの下でのストレステストモデルに特化して設計された、挑戦的なWildStructベンチマーク4つをキュレートし、リリースする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:41:34 GMT)
The Role of Cyclopean-Eye in Stereo Vision [3.3] 本研究は3次元構造と人間に触発された知覚が正確な深度再構成にどのように貢献するかを考察する。
本稿では,Cyclopean Eyeモデルを再検討し,オクルージョンと深度不連続性を考慮した新しい幾何学的制約を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:11:26 GMT)
Quantum Transport Protected by Acceleration From Nonadiabaticity and Dissipation [3.3] 浅い(アンハーモニックな)ポテンシャルトラップ内に閉じ込められたウェーブパレットは加速度で操られる。
同時に、非断熱遷移と入浴による消散によって、ウェーブパケットの漏れに対処することができる。
この戦略は、閉じ込められた原子とイオンと分子反応生成物の散逸性および非散逸性移動の両方に適用できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:45:08 GMT)
To what extent can current French mobile network support agricultural robots? [3.3] 本稿では,農業用ロボットの大規模展開によって引き起こされるエネルギー消費量と炭素フットプリント量を評価する手法を提案する。
以上の結果から,ロボットのニーズが増大すると,大きな影響がもたらされることが示唆された。
ネットワークを既存のサイトに制限すると、需要が急増し、管理可能な農業地域も急速に減少する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:59:33 GMT)
Towards Adaptive Memory-Based Optimization for Enhanced Retrieval-Augmented Generation [3.3] Retrieval-Augmented Generation (RAG)は、外部知識ベースからの非パラメトリック知識をモデルに統合する。
既存のRAGメソッドは、オープンドメイン質問回答(QA)タスクに苦労する。
オープンドメインQAタスクのための拡張RAGのための適応メモリベースの最適化を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:44:43 GMT)
Tree-based Semantic Losses: Application to Sparsely-supervised Large Multi-class Hyperspectral Segmentation [3.2] ラベルの階層的な構造を生かした2つの木に基づく意味損失関数を導入する。
提案手法は,少ない注釈付きHSIデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:20:46 GMT)
FeDa4Fair: Client-Level Federated Datasets for Fairness Evaluation [3.2] Federated Learning (FL)は、クライアントのプライベートデータを共有せずに、複数のクライアント間で協調的なモデルトレーニングを可能にする。
クライアント間の不均一なデータ分散は、一部のクライアントにとって他のクライアントよりも公平なモデルにつながる可能性がある。
FeDa4Fairは、不均一なクライアントバイアスの下で公正なFL手法を評価するのに適したデータセットを生成するライブラリである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:43:12 GMT)
On two maximally entangled couples [3.1] ヒグチとサドベリーの論文では、純粋な4量子状態はすべてのバイパーティションに極大に絡み合うことができないことを示した。
このような状態は、現在では絶対極大絡み(AME)状態として知られている。
ここでは、4量子AME状態が存在しないという事実の古い証明と新しい証明のシリーズを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:03:59 GMT)
Rapid Gyroscope Calibration: A Deep Learning Approach [2.9] ジャイロスコープ校正のためのエンドツーエンド畳み込みニューラルネットワークを提案する。
この研究の重要な成果の1つは、3つの低コストジャイロスコープを使用してジャイロスコープの校正時間を最大89%削減することである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:16:22 GMT)
Temporal Rate Reduction Clustering for Human Motion Segmentation [2.9] 本稿では,ビデオ中のフレームシーケンスを分割するために,構造化表現と親和性を共同で学習する時間的レート削減クラスタリング(textTR2textC$)を提案する。
我々は5つのベンチマーク・ベンチマーク・データセットで広範囲に実験を行い、異なる特徴抽出器を用いて最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:35:07 GMT)
Diverse Mini-Batch Selection in Reinforcement Learning for Efficient Chemical Exploration in de novo Drug Design [2.9] 強化学習のための多種多様なミニバッチ選択を導入する。
我々は、この枠組みを現実世界の問題、すなわち薬物発見の文脈で研究する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:31:30 GMT)
Potemkin Understanding in Large Language Models [2.8] 大規模言語モデル(LLM)は、ベンチマークデータセットを使用して定期的に評価される。
本稿ではまず,この問題に対処するための正式な枠組みを紹介する。
ポテムキンはモデル、タスク、ドメインにまたがってユビキタスである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:41:35 GMT)
Representation Learning of Lab Values via Masked AutoEncoders [2.8] 逐次的な実験値の計算のためのトランスフォーマーベースのマスク付きオートエンコーダフレームワークであるLab-MAEを提案する。
Lab-MAEは、患者の人口集団間で同等のパフォーマンスを達成し、臨床予測において公平性を向上させる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:34:13 GMT)
Structuralist Approach to AI Literary Criticism: Leveraging Greimas Semiotic Square for Large Language Models [2.7] GLASS (Greimas Literary Analysis via Semiotic Square) は、Greimas Semiotic Square (GSS) に基づく構造化分析フレームワークである。
GLASSは物語構造と物語作品における深い意味の素早い分離を促進する。
この研究は、文芸研究と教育のためのAIベースのツールを提供し、文芸エンゲージメントの基礎となる認知メカニズムに関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:10:24 GMT)
Exploring the change in scientific readability following the release of ChatGPT [2.7] このデータセットは、2010年から2024年6月7日までにarXivに投稿されたすべての抽象化で構成されている。
その結果、読みやすさは年々低下しており、抽象論はますます複雑になりつつあることが示唆された。
ChatGPTがリリースされた後、2023年と2024年の調査では、可読性に大きな変化が見られた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:57:12 GMT)
Performance improvement of spatial semantic segmentation with enriched audio features and agent-based error correction for DCASE 2025 Challenge Task 4 [2.7] 本報告では,DCASE 2025 Challengeの第4タスクの提出システムについて述べる。
メルスペクトル機能から抽出した埋め込み機能に、追加のオーディオ機能が含まれている。
次に、S5システムによって処理された出力にエージェントベースのラベル補正システムを適用する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:27:52 GMT)
mTSBench: Benchmarking Multivariate Time Series Anomaly Detection and Model Selection at Scale [2.6] mTSBenchは、MTS-ADと教師なしモデル選択において、これまでで最大のベンチマークである。
ラベル付き時系列は344で、19のデータセットと12の多様なアプリケーションドメインにまたがる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:58 GMT)
Multi-stage tomography based on eigenanalysis for high-dimensional dense unitary processes in gate-based quantum computers [2.6] 量子プロセストモグラフィー (Quantum Process Tomography, QPT) は、量子過程を推定する手法である。
我々は、孤立系に対応する一元的、おそらく密度の高いプロセス(すなわち、疎性制約のないプロセス)を考える。
我々は,多くの量子ビットに適用可能なQPT法を開発し,従って高状態空間次元に適用する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:26:20 GMT)
Complexity of PXP scars revisited [2.6] 我々は、PXPハミルトニアンの下でスカーリングまたは熱化初期状態が進化する量子クエンチのシナリオを再考する。
クリロフ基底における拡散複雑性と関連する量の時間進化について検討する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:25:44 GMT)
Large-Scale Multirobot Coverage Path Planning on Grids With Path Deconfliction [2.6] マルチロボット被覆経路計画(MCPP: Multi-Robot Coverage Path Planning)を4つの隣接する2DグリッドG上で検討し、複数のロボットがGのすべてのセルをカバーする経路を計算することを目的とした。
問題を直接Gで修正し、グリッドベースのMCPPの解法を革新し、新しいNP硬度結果を確立する。
提案手法は,最大100台のロボットを最大256x256まで実行時間内にグリッド上で管理することにより,ソリューションの品質と効率を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:50:35 GMT)
From Memories to Maps: Mechanisms of In-Context Reinforcement Learning in Transformers [2.5] 本研究は,げっ歯類行動にインスパイアされた計画課題の分布について,コンテクスト内強化学習のためのトランスフォーマーを訓練する。
モデルに現れる学習アルゴリズムを特徴付ける。
メモリは計算資源として機能し、フレキシブルな動作をサポートするために生のエクスペリエンスとキャッシュされた計算の両方を格納する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:18:54 GMT)
Correlated reaction coordinate motion produces non-additive rate enhancement for electron and energy transfer in multi-acceptor structures [2.4] 複数のドナー、ブリッジ、またはアクセプターユニットを持つ分子構造は、電子とエネルギーの移動速度に影響を与える量子干渉効果を示すことができる。
最近の実験では、ドナー・アクセプター構造と2つのアクセプターのET比が1倍から5倍に増加した。
我々は,複数のアクセプタ系における結合相互作用を解析し,アセプタ-アクセプタ相互作用から付加的効果を超える速度の増大が生じることを見出した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:30:56 GMT)
Towards Transparent AI: A Survey on Explainable Large Language Models [2.4] 大規模言語モデル(LLM)は人工知能(AI)の進歩において重要な役割を担っている
LLMは意思決定プロセスを説明するのに苦労し、それらを"ブラックボックス"にし、説明可能性に重大な課題を提示します。
これらの制限を克服するために、研究者は様々な説明可能な人工知能(XAI)法を開発した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:25:22 GMT)
Mathematical Modeling of Protein Structures: A Cohomology-Based Approach to the Flagellar Motor [2.4] 本研究では、固定双対グラフを持つ曲線の境界クラスから生成されるコホモロジーから導かれる新しい数学的モデルを提案する。
提案モデルはタンパク質構造解析および予測に利用され,特にフラゲラーモーター構造への応用が期待できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:25:39 GMT)
Parallel Token Swapping for Qubit Routing [2.3] 現代の量子コンピュータでよく見られるグラフトポロジ上の並列トークンスワップ問題に対する最初の定数係数近似アルゴリズムを提供する。
また、量子ビットルーティング問題に対する再構成を設計する際に有用であることが示されている自然下界のいわゆる伸張係数についても検討した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:44:00 GMT)
Experimental investigation of pose informed reinforcement learning for skid-steered visual navigation [2.2] ビジョンに基づく車線維持は、ロボティクスと自動運転車コミュニティにおいて重要な関心事である。
スキッドステアリングの車両アーキテクチャは、人間の操作操作に有用な車両プラットフォームとして機能している。
本研究では,視覚ナビゲーション学習のための構造化定式化手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:36:49 GMT)
HalluSegBench: Counterfactual Visual Reasoning for Segmentation Hallucination Evaluation [2.2] HalluSegBenchは、対物的視覚推論のレンズを通して視覚的接地における幻覚を評価するために特別に設計された最初のベンチマークである。
我々のベンチマークは、281のユニークなオブジェクトクラスにまたがる1340の対実例ペアからなる新しいデータセットで構成されています。
HalluSegBenchの最先端の視覚言語セグメンテーションモデルによる実験では、視覚駆動幻覚はラベル駆動のものよりもはるかに多いことが示されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:59:12 GMT)
Large Language Model-Powered Agent for C to Rust Code Translation [2.2] 現代のシステムプログラミング言語であるRustは、C言語に代わるメモリセーフな代替言語として登場した。
C-to-Rust翻訳のエージェント能力の適用は、異なる課題をもたらす。
数学や常識 QA とは異なり、C-to-Rust に必要な中間ステップは十分に定義されていない。
我々は、新しい中間ステップ、仮想ファジィングに基づく等価テスト(VFT)、エージェント計画フレームワーク、LLMを利用したC-to-Rustコード翻訳のためのエージェント(LAC2R)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:16:53 GMT)
SDE Matching: Scalable and Simulation-Free Training of Latent Stochastic Differential Equations [2.2] SDEマッチング(SDE Matching)を提案する。
以上の結果から,SDEマッチングは随伴感度法に匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:38:35 GMT)
Optimizing continuous-time quantum error correction for arbitrary noise [2.2] 本稿では、機械学習(ML)を用いて、量子エラー訂正符号空間と対応するリカバリマップを同時に最適化するプロトコルを提案する。
ヒルベルト空間と雑音過程が与えられた場合、このプロトコルは平均的論理状態の忠実度によって測定された最適回復戦略を特定する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:43:21 GMT)
Automated Defect Identification and Categorization in NDE 4.0 with the Application of Artificial Intelligence [2.1] 放射線検査における欠陥検出と組織化のための自動フレームワークの構築を試みる。
基本情報源として、航空機溶接部の223枚のCR写真を編集・分類する技術である。
欠陥の強い相違を示す小型のa90/95特性は, 提案手法が欠陥検出において例外的な認識を達成していることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:25:36 GMT)
Temporal-Aware Graph Attention Network for Cryptocurrency Transaction Fraud Detection [2.1] 本稿では,検出性能を向上させるための拡張時間対応グラフ注意ネットワーク(ATGAT)を提案する。
Elliptic++暗号データセットの実験では、ATGATが0.9130のAUCを達成した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:34:06 GMT)
HARPT: A Corpus for Analyzing Consumers' Trust and Privacy Concerns in Mobile Health Apps [2.1] 本稿では,ユーザプライバシと信頼度の研究を進めることを目的とした,モバイルヘルスアプリストアレビューの大規模コーパスについて紹介する。
データセットには、アプリケーションへの信頼、プロバイダへの信頼、プライバシの懸念といった重要な側面を捉える7つのカテゴリにラベル付けされた480,000以上のユーザレビューが含まれている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:23:54 GMT)
A Hierarchical Deep Learning Approach for Minority Instrument Detection [2.1] この研究は階層構造をモデルに統合し、階層音楽予測のための新しいモデルのクラスをテストする戦略を示す。
本研究は、詳細な楽器識別とグループレベルの認識のギャップを埋めることで、より信頼性の高い粗い楽器検出を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:56:11 GMT)
Action-Minimization Meets Generative Modeling: Efficient Transition Path Sampling with the Onsager-Machlup Functional [2.0] 現在の機械学習アプローチでは、高価でタスク固有の、データフリーなトレーニング手順を採用している。
多様な分子系へのアプローチを実証し、多様で物理的に現実的な遷移経路を得る。
提案手法は,新たな生成モデルに容易に組み込むことが可能である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:59:16 GMT)
E-FreeM2: Efficient Training-Free Multi-Scale and Cross-Modal News Verification via MLLMs [2.0] 本研究では,学習不要な検索に基づくマルチモーダル事実検証システムを提案する。
我々のアプローチは、敵攻撃やデータ中毒など、従来のトレーニングベースのモデルの脆弱性を軽減します。
2つのファクトチェックベンチマークの実験でSOTAの結果が得られ、誤情報検出の有効性と各種攻撃ベクトルに対する堅牢性が確認された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:20:45 GMT)
KOALA: a Configurable Tool for Collecting IDE Data When Solving Programming Tasks [2.0] KOALAはJetBrains IDEでプログラミングタスクを解く学生のデータを集めるツールである。
学生に必要なタスクを提供し、コード補完のようなIDE機能を有効または無効にし、サーベイを実行する。
問題解決の過程で、プラグインは設定された粒度でコードスナップショットを収集する。
収集されたデータはツールが付属するサーバに送信され、そこで保存され、標準化されたProgSnap2フォーマットに変換される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:48:38 GMT)
SAC: A Framework for Measuring and Inducing Personality Traits in LLMs with Dynamic Intensity Control [1.9] 大規模言語モデル(LLM)は近年,幅広い分野において大きな注目を集めている。
また、対話中に人間のような個性を表示するという期待も高まりつつある。
既存のモデルは2つの大きな制限に直面している。それらは、粗いパーソナリティ次元のみを提供するBig Five (OCEAN)フレームワークに依存しており、特性強度を制御するメカニズムが欠如している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:12:15 GMT)
Improving Diffusion-Based Image Editing Faithfulness via Guidance and Scheduling [1.9] 画像編集において2つの重要な側面は、修正の程度を決定する編集可能性と、修正されていない要素がどれだけよく保存されているかを反映する忠実性である。
本稿では,編集可能性に最小限の影響を伴って忠実度を高めるFGSを提案する。
実験結果から, FGSは編集性を維持しつつ, 良好な忠実性が得られることが示された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:46:03 GMT)
Improved seeding strategies for k-means and k-GMM [1.8] 我々はk平均クラスタリングとk-GMMのためのランダム化シード手法を再検討する。
本研究は, 種子採取に用いる指標, 候補種子数, 種子選択に用いる指標の3つの重要な成分を定式化した。
実験では、最終計量の観点から古典的競合者よりも一貫した定数係数の改善が示される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:10:40 GMT)
ss2DNS: A Secure DNS Scheme in Stage 2 [1.8] 我々は、リゾルバと権威的なネームサーバ間の解決プロセスにおけるセキュリティとプライバシの脆弱性を軽減するために設計された、新しいDNSスキームであるss2DNSを紹介する。
サーバ側処理のレイテンシ、解像度時間、CPU使用率において、ss2DNSは安全性の低いスキームに匹敵するが、DNS-over-TLSを著しく上回る。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:14:28 GMT)
LLaVA-Pose: Enhancing Human Pose and Action Understanding via Keypoint-Integrated Instruction Tuning [1.8] 現在の視覚言語モデル(VLM)は、一般的な視覚的理解タスクに適している。
本研究では,人間のキーポイントとキャプションやバウンディングボックスといった従来の視覚的特徴を統合することで,そのようなデータを生成する手法を提案する。
このデータセットを用いてLLaVA-1.5-7Bモデルを微調整し、得られたLLaVA-Poseモデルをベンチマーク上で評価し、大幅な改善を実現した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:32:56 GMT)
Review learning: Real world validation of privacy preserving continual learning across medical institutions [1.8] 診断予測のための低コスト連続学習アルゴリズムである「レビューラーニング(RevL)」を導入する。
RevLは、以前のデータセットからの知識をレビューするために使用されるモデルからデータサンプルを生成する。
6つのシミュレートされた施設実験と3つの医療機関を含む実世界の実験を行った。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:44:25 GMT)
Towards Reliable Detection of Empty Space: Conditional Marked Point Processes for Object Detection [1.7] ディープニューラルネットワークは、バウンディングボックス検出やセマンティックセグメンテーションといったコンピュータビジョンタスクの最先端を定めている。
オブジェクト検出器とセグメンテーションモデルは、オブジェクト検出またはピクセルワイズ分類におけるモデルの不確実性を反映して、信頼スコアを予測に割り当てる。
本研究では,空間統計に基づく物体検出モデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:14:37 GMT)
A Systematic Review of Human-AI Co-Creativity [1.7] Coクリエイティビティコミュニティは、人間のクリエイティビティをサポートし、強化するための、より洗練され、調整されたシステムの開発において、大きな進歩を遂げている。
共同創造システムに関する62論文の体系的な文献レビューを行った。
以上の結果から,高いユーザコントロールを提供するシステムは,創造的成果よりも満足感,信頼感,所有意識が強くなる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:44:52 GMT)
Analysis of static and dynamic batching algorithms for graph neural networks [1.7] グラフニューラルネットワーク(GNN)は、材料科学、化学、社会科学などいくつかの分野において有望な結果を示している。
GNNモデルは、しばしば数百万のパラメータを含み、他のニューラルネットワーク(NN)モデルと同様に、モデルのパラメータを更新するためにバッチ内のトレーニングデータセットを構成するグラフのごく一部しか供給されない。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:07:44 GMT)
MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement [1.6] 多視点認識知識強化型TansfoRmer(MvKeTR)
複数の解剖学的ビューから診断情報を効果的に合成するために、ビューアウェアのMVPAを提案する。
クエリボリュームに基づいて、最も類似したレポートを取得するために、Cross-Modal Knowledge Enhancer (CMKE) が考案されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:54:18 GMT)
Active Inference AI Systems for Scientific Discovery [1.5] AI駆動科学の進歩は、現在、抽象的ギャップ、推論的ギャップ、現実的ギャップという3つの基本的なギャップを閉じることに依存している、と私たちは主張する。
我々は、科学的発見のための能動的推論AIシステムを、因果自己管理基礎モデルに基づく長期研究記憶を維持するものとして定義する。
また、シミュレーションや実験からのフィードバックの本来の曖昧さや、根底にある不確実性が人間の判断を不可欠にしているとも主張されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:43:04 GMT)
Characterizing Many-body Dynamics with Projected Ensembles on a Superconducting Quantum Processor [1.4] 正方格子上に16量子ビットの超伝導プロセッサ上に投射されたアンサンブルを用いたカオス量子多体系を実験的に検討した。
本研究は, 電荷保存セクター内の定常状態に対するハール分布予測アンサンブルを観察することにより, 深部熱化の直接的証拠を提供する。
我々の研究は、投影されたアンサンブルを用いた量子多体力学の研究の道を切り開いており、量子シミュレーション技術の進歩に潜在的に影響を及ぼす可能性を示している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:19:48 GMT)
Beyond Conformal Predictors: Adaptive Conformal Inference with Confidence Predictors [1.4] 本研究は,適応整形推論(ACI)の望ましい性質が整形予測器(CP)の使用を必要としないことを示す。
非互換信頼予測器(NCCP)の非交換データに対するACI使用時のCPに対する性能を実証的に検討した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:25:03 GMT)
SimWorld: A Unified Benchmark for Simulator-Conditioned Scene Generation via World Model [1.4] 本稿では,世界モデルに基づくシミュレーション条件付きシーン生成エンジンを提案する。
実世界のシーンと一致したシミュレーションシステムを構築することで、シミュレーションデータとラベルを世界モデルにおけるデータ生成の条件として、任意のシーンに対して収集することができる。
その結果,これらの画像は下流知覚モデルの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:52:58 GMT)
A Scalable Quantum Neural Network for Approximate SRBB-Based Unitary Synthesis [1.3] 拡張性のある量子ニューラルネットワークは、任意のユニタリ進化を近似する手段として導入された。
SRBBベースの合成アルゴリズムは、実際のハードウェア上でもテストされる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:43:45 GMT)
A Novel Federated Learning-Based IDS for Enhancing UAVs Privacy and Security [1.3] フライングアドホックネットワーク(FANET)内で運用されている無人航空機(UAV)は、これらのネットワークの動的で分散的な性質のためにセキュリティ上の問題に直面している。
以前の研究では、すべてのデバイスからのデータを保存し分析する中心的なエンティティとして、集中的な侵入検出に主に焦点をあてていた。
本稿では、FANETにおける集中型システムによる課題に対処するFL-IDS(Federated Learning-based Intrusion Detection System)を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:21:32 GMT)
CitySim: Modeling Urban Behaviors and City Dynamics with Large-Scale LLM-Driven Agent Simulation [1.2] 我々は都市シミュレーター(CitySim)を構想し、大規模言語モデルで示す人間レベルのインテリジェンスにおけるブレークスルーを生かした。
CitySimでは、必須活動、個人の習慣、状況要因のバランスをとる価値駆動アプローチを使用して、エージェントが現実的な日々のスケジュールを生成する。
CitySimは、マイクロレベルとマクロレベルの両方において、以前の作業よりも実際の人間と密接な関係を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:11:42 GMT)
From On-chain to Macro: Assessing the Importance of Data Source Diversity in Cryptocurrency Market Forecasting [1.2] 本研究では,データソースの多様性が暗号予測モデルの性能に与える影響について検討する。
データカテゴリには、技術的指標、オンチェーンメトリクス、感情と関心の指標、伝統的な市場指標、マクロ経済指標が含まれる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:29:19 GMT)
Exploring the Effects of Load Altering Attacks on Load Frequency Control through Python and RTDS [1.2] 負荷プロファイルを操作するために高ワット装置のボットネットを使用する負荷変更攻撃(LAA)は、グリッド安定性に対する顕著な脅威である。
本研究では,静的および動的シナリオのシミュレーションを通じて,負荷周波数制御(LFC)におけるLAAの影響を分析することにより,ギャップを橋渡しする。
その結果、LAAが周波数安定性に与える影響を強調し、動的LAAに対する固有値に基づく安定性評価を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:14:12 GMT)
Classification with Reject Option: Distribution-free Error Guarantees via Conformal Prediction [1.1] 我々は、二項分類におけるリジェクションオプションによる機械学習のアプローチを定式化する。
結果の誤差率に関する理論的保証を提供する。
エラー・リジェクト曲線は、エラーレートとリジェクトレートの間のトレードオフを示している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:04:25 GMT)
HyperSORT: Self-Organising Robust Training with hyper-networks [1.1] HyperSORTは、イメージとアノテーションのばらつきの両方を表す潜在ベクトルからUNetsのパラメータを予測するハイパーネットワークを使用するフレームワークである。
2つの腹部CTパブリックデータセットを用いて本法の有効性を検証した。
潜在空間クラスタは、基礎となる学習された体系的バイアスに従ってセグメンテーションタスクを実行するUNetパラメータを生成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:12:34 GMT)
An object-centric core metamodel for IoT-enhanced event logs [1.1] 既存のデータモデルの最も重要な特徴を合成するコアモデルを提案する。
プロトタイプのPython実装は、さまざまなユースケースに対してモデルを評価するために使用される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:19:44 GMT)
Multi-thresholding Good Arm Identification with Bandit Feedback [1.1] 我々は,多目的のバンドイット設定において,良好な腕識別問題を考える。
サンプル複雑性境界を持つマルチスレッド UCB (MultiTUCB) アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:38:37 GMT)
Exploring Artificial Intelligence Tutor Teammate Adaptability to Harness Discovery Curiosity and Promote Learning in the Context of Interactive Molecular Dynamics [1.0] 本研究では,人工知能学習者チームメイト(AI)が,視覚分子ダイナミクスプラットフォーム上でのインタラクティブ分子ダイナミクス(IMD)タスクにおける学生の好奇心によるエンゲージメントと学習効率に与える影響について検討した。
この研究は、AIの介入が学生のエンゲージメントをどのように形成し、発見好奇心を育み、IMD学習環境におけるチームのパフォーマンスを高めるかをさらに評価する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:30:25 GMT)
GANet-Seg: Adversarial Learning for Brain Tumor Segmentation with Hybrid Generative Models [1.0] この研究は、事前訓練されたGANとUnetアーキテクチャを利用した脳腫瘍セグメンテーションのための新しいフレームワークを導入する。
グローバルな異常検出モジュールと改良されたマスク生成ネットワークを組み合わせることで,腫瘍感受性領域を正確に同定する。
マルチモーダルMRIデータと合成画像拡張を用いて、ロバスト性を改善し、限られたアノテートデータセットの課題に対処する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:28:09 GMT)
The Sample Complexity of Learning Lipschitz Operators with respect to Gaussian Measures [1.0] ガウス測度に関するリプシッツ作用素の近似について検討する。
任意の(潜在的に適応的な)線形サンプルからリプシッツ作用素の一般的な再構成戦略について検討する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:15:09 GMT)
Tackling fluffy clouds: robust field boundary delineation across global agricultural landscapes with Sentinel-1 and Sentinel-2 Time Series [1.0] PTAViT3Dは3次元時系列衛星画像の処理に特化して設計されたディープラーニングアーキテクチャである。
また,PTAViT3Dモデルの拡張であるPTAViT3D-CAを提案する。
この結果から, 優れたグローバルトランスファービリティとロバスト性を示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:08:46 GMT)
Equitable Federated Learning with NCA [1.0] Federated Learning(FL)は、センシティブな患者データを共有することなく、機関間で協調的なモデルトレーニングを可能にする。
低所得国や中所得国(LMIC)におけるFLの採用は、限られた高性能コンピューティングリソースや信頼性の低いインターネット接続など、大きな障壁に直面している。
医用画像分割作業に適した新しいFLシステムであるFedNCAを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:41:21 GMT)
Boosting Vulnerability Detection with Inter-function Multilateral Association Insights [0.9] 脆弱性検出のためのFunction Multilateral Association分析フレームワーク(IFMA-VD)を提案する。
IFMA-VDの基盤は、コードビヘイビアハイパーグラフの構築と、ハイパーエッジの畳み込みを利用して多角的関連性を抽出することにある。
IFMA-VDを広く使用されている3つの脆弱性データセット上で評価し、ベースライン法と比較してF値とリコールの改善を実証した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:11:21 GMT)
High Temporal Consistency through Semantic Similarity Propagation in Semi-Supervised Video Semantic Segmentation for Autonomous Flight [0.9] 本稿では,空中データに対する高時間整合性を実現するために,リアルタイム推論に適した軽量なビデオセマンティックセマンティック・セマンティクス手法を提案する。
SSPは、カメラの動きを補うために、グローバルな登録アライメントによる効率的な画像分割モデルの予測を時間的に伝播する。
一般的なアプリケーションで提案される他のビデオ手法よりも、セグメンテーション品質と推論速度のトレードオフが優れている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:44:22 GMT)
Rethinking LLM Training through Information Geometry and Quantum Metrics [0.9] 情報幾何学はこの風景をフィッシャー情報計量を用いて表している。
曲率認識アプローチは大きな言語モデルに対する理解を深める。
我々は、フビニ・スタディ計量と量子フィッシャー情報に基づく量子類似性について推測する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:14:42 GMT)
Evaluation of Traffic Signals for Daily Traffic Pattern [0.8] 回転数データは,信号設計,交差点形状計画,交通流,渋滞解析において重要である。
交通カメラを用いて、ラスベガスの6つの交差点のTMCを推定するために、視覚に基づくトラッキングシステムを開発した。
4つの交差点は信号タイミングの動的設定に優れた性能を示し,他の2つは交差点脚の全車線に対する総車両数の割合が低い。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:56:59 GMT)
M2SFormer: Multi-Spectral and Multi-Scale Attention with Edge-Aware Difficulty Guidance for Image Forgery Localization [0.8] 近年,深層学習法は画素レベルのフォージェリーローカライゼーションにおいて高い精度を達成している。
本稿では,これらの課題を克服するための新しいトランスフォーマー・エンコーダ・フレームワークであるM2SFormerを提案する。
M2SFormerはスキップ接続におけるマルチ周波数とマルチスケールの注意を統一し、グローバルコンテキストを活用して偽造品のキャプチャを改善する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:06:57 GMT)
Real-Time ESFP: Estimating, Smoothing, Filtering, and Pose-Mapping [0.8] 本稿では,単眼のRGB映像を低コストな4-DoFデスクトップアームのための実行可能なジョイントトラジェクトリに変換するエンド・ツー・エンドパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:22:12 GMT)
G$^{2}$D: Boosting Multimodal Learning with Gradient-Guided Distillation [0.8] 本稿では, カスタマイズされた損失関数を持つマルチモーダルモデルを最適化する知識蒸留フレームワークであるGradient-Guided Distillation (G$2$D)を紹介する。
G$2$Dは、訓練中に弱いモダリティの重要度を増幅し、分類および回帰タスクにおける最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:37:36 GMT)
The DevSafeOps Dilemma: A Systematic Literature Review on Rapidity in Safe Autonomous Driving Development and Operation [0.7] 我々は、自律運転開発におけるDevOpsの使用に関する幅広い既存の文献を特定し、分析し、合成することを目的とした、体系的な文献レビューを示す。
私たちの結果は、安全に関するAI対応機能にDevOpsを適用することから生じる、課題とソリューションの構造化された概要を提供します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:24:08 GMT)
TAPS: Tool-Augmented Personalisation via Structured Tagging [0.7] 本研究では,ユーザの好みをゴール指向対話エージェントに効果的に統合する方法について検討する。
我々は、構造化タグツールと不確実性に基づくツール検出器を活用することにより、個人化ツールの使用を促進する新しいソリューションであるTAPSを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:09:40 GMT)
Using Generative AI in Software Design Education: An Experience Report [0.7] 学生はチームベースの課題を完了するためにGenAIを使用する必要があった。
学生はChatGPTがデザインプロセスで役立った多くの方法を特定した。
我々は、ソフトウェア設計クラスにGenAIを効果的にデプロイする方法について、教育者にとって重要な教訓をいくつか挙げた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:40:16 GMT)
Strict hierarchy between $n$-wise measurement simulability, compatibility structures, and multi-copy compatibility [0.7] 量子測定の不適合性は、量子情報理論の基礎と応用に重要な意味を持つ特異な量子特徴である。
量子論の開始以来、複数の測定の標準的な非互換性は注目の的となっているが、その一般化は近年まで提案されていない。
すべての概念は、その操作的意味だけでなく、数学的にもそれらが記述する測定アセンブリの集合にも異なることが示される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:16:02 GMT)
Possible consequences for physics of the negative resolution of Tsirelson's problem [0.7] Ji, J. と同僚たちは、複雑さクラス $textMIPast$ と $textRE$ が等価であることの証明を提供した。
この結果は、Tsirelson の問題を負の分解、すなわち$C_qa$ と $C_qc$ を超平面で分離できることを意味する。
ここでは、この結果の4つの論理的可能性について述べる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:04:03 GMT)
A suite of allotaxonometric tools for the comparison of complex systems using rank-turbulence divergence [0.6] そこで我々は,Matlab,Javascript,Pythonにおいて,ランク-乱流分岐のためのアロタキソグラフを描画するための一連のツールについて述べる。
アロタキソノグラフは、ランクと確率乱流の発散、ジェンソン・シャノン発散、一般化エントロピー発散を含む幅広い機器に対応するように設計されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:17:29 GMT)
RAE: A Rule-Driven Approach for Attribute Embedding in Property Graph Recommendation [0.6] 属性埋め込みのためのルール駆動アプローチは、プロパティグラフからセマンティックルールを効果的にマイニングし、活用することでレコメンデーションパフォーマンスを向上させる。
RAEは、最先端のベースラインと比較して、Recall@20とNDCG@20で平均10.6%改善している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:58:03 GMT)
Forecasting Geopolitical Events with a Sparse Temporal Fusion Transformer and Gaussian Process Hybrid: A Case Study in Middle Eastern and U.S. Conflict Dynamics [0.6] Global Database of Events, Language, and Tone (GDELT)のようなデータソースとの地政学的対立
本質的にの空間性、バースト性、およびそのようなデータの過分散により、標準的なディープラーニングモデルは信頼性の低い長距離予測を生成する。
我々は,これらの制限を克服し,2023年の脅威検出アルゴリズムコンテストで優勝したハイブリッドアーキテクチャSTFT-VNNGPを紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:53:25 GMT)
Storm Surge in Color: RGB-Encoded Physics-Aware Deep Learning for Storm Surge Forecasting [0.5] 災害予報は沿岸災害に備える上で重要な役割を担っているが、既存の機械学習アプローチでは空間適応性に制限があることが多い。
本研究では,非構造水位場を構造化赤緑(RGB)符号化表現に投影する新しい手法を提案する。
提案手法は,テキサス州沿岸の複数の地域において48時間連続予測性能を示し,他の沿岸地域に対して強い空間適応性を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:56:30 GMT)
How Good Are Synthetic Requirements ? Evaluating LLM-Generated Datasets for AI4RE [0.5] 本稿では,合成要求データを生成するための改良された製品ラインアプローチを提案する。
提案する4つの研究課題は,データ品質にどのような影響を及ぼすか,また,自動的なプロンプト最適化,およびポストジェネレーションのキュレーションについて検討する。
以上の結果から, 人工的な要件は, 特定のタスクにおいて, 人為的な要件と一致し, より優れる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:52:07 GMT)
Our Coding Adventure: Using LLMs to Personalise the Narrative of a Tangible Programming Robot for Preschoolers [0.5] そこで我々は,Cubettoのゲームストーリーを迅速にプロトタイプする形式化されたプロセスの初期バージョンを開発した。
プロセス、使用済みの材料とプロンプト、学習経験と成果を文書化する。
我々は,本手法が幼稚園の授業に適していると考え,現実世界の教育環境においてさらなる実験を行う計画を立てている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:54:25 GMT)
ANUBHUTI: A Comprehensive Corpus For Sentiment Analysis In Bangla Regional Languages [0.5] ANUBHUTIは、低資源バングラ方言における感情分析のためのリソースの重大なギャップを埋める。
このデータセットは、バングラデシュの現代社会の政治的景観を反映して、政治的および宗教的な内容が特徴的である。
データセットは、欠落したデータ、異常、不整合の体系的なチェックによってさらに改善された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:13:54 GMT)
Robust Deep Learning for Myocardial Scar Segmentation in Cardiac MRI with Noisy Labels [0.5] そこで我々は, 微細調整による心筋傷の自動検出とセグメンテーションのための, 堅牢なディープラーニングパイプラインを提案する。
急性と慢性の両方の症例でモデルの性能を評価し, 正確かつスムーズなセグメンテーションを創出できることを実証した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:21:58 GMT)
Large Language Models Acing Chartered Accountancy [0.5] 本稿では, LLMの財務的, 法律的, 量的推論能力の評価に特化して設計されたCA-Benについて紹介する。
GPT 4o, LLAMA 3.3 70B, LLAMA 3.1 405B, MISTRAL Large, Claude 3.5 Sonnet, Microsoft Phi 4 の6つの著名なLCMを標準化プロトコルを用いて評価した。
結果から,Claude 3.5 Sonnet と GPT-4o は,特に概念的および法的推論において,他よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:10:37 GMT)
IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection [0.4] Deepfake技術は、AIアシスタント、音声障害のアクセシビリティ向上、エンターテイメントの向上などのメリットを提供する。
また、セキュリティ、プライバシー、およびデジタルコミュニケーションに対する信頼に重大なリスクをもたらす。
既存のデータセットには多様な民族的アクセントがなく、現実世界のシナリオでは不十分である。
この研究はインディーフェイクデータセット(IFD)を導入し、インド語を話す50人の英語話者から27.17時間のボナフィドとディープフェイクのオーディオを収録した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:21:45 GMT)
Iterative Harrow-Hassidim-Lloyd quantum algorithm for solving resonances with eigenvector continuation [0.4] 我々は、$alpha-alpha$システムの共鳴状態を計算し、従来の手法とよく一致した結果を得る。
本研究は,非エルミート作用素の固有値の計算に関する新たな視点を提供し,量子コンピューティングを用いた核共鳴のさらなる探索のための基礎研究を行う。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:26:59 GMT)
ToosiCubix: Monocular 3D Cuboid Labeling via Vehicle Part Annotations [0.4] Toosiixは、単眼画像とカメラパラメータのみを用いて、接地木立方体に注釈を付けるための、シンプルだが強力なアプローチである。
提案手法では,車両1台あたり10クリック程度しか必要とせず,既存のデータセットに3Dアノテーションを追加することは極めて実用的である。
KITTIとCityscapes3Dデータセットに対するアノテーションを検証することで、当社の手法がコスト効率が高くスケーラブルなソリューションを提供することを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:09:33 GMT)
In-context learning for the classification of manipulation techniques in phishing emails [0.4] 本研究では,Large Language Model (LLM) In-Context Learning (ICL) を用いて,40の操作技法の分類に基づくフィッシングメールのきめ細かい分類を行う。
このアプローチは、有望な精度0.76で有望なテクニックを効果的に識別する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:07:30 GMT)
YOLO-FDA: Integrating Hierarchical Attention and Detail Enhancement for Surface Defect Detection [0.3] YOLO-FDAは、細かなディテールの強化と注意誘導機能融合を統合した、YOLOベースの新しい検出フレームワークである。
YOLO-FDAは、さまざまな種類の欠陥やスケールにおいて、精度と堅牢性の両方の観点から、既存の最先端の手法を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:32:37 GMT)
Benchmarking Deep Learning and Vision Foundation Models for Atypical vs. Normal Mitosis Classification with Cross-Dataset Evaluation [0.3] 乳癌の非定型的ミトーシスデータセット(AMi-Br)を構築した。
本稿では,AtNorM-BrとAtNorM-MDの2つの新しいホールドアウトAMFデータセットを紹介する。
ドメイン内AMi-Brとドメイン外AtNorm-BrとAtNorM-MDデータセットでは,それぞれ0.8135,0.7696,0.7705の平均平衡精度が得られた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:30:42 GMT)
Deterministic quantum search on all Laplacian integral graphs [0.3] 我々は、決定論的量子探索アルゴリズムを用いて、異なる、エレガントな量子空間探索手法を提案する。
この研究は、決定論的量子探索を可能にする最大のグラフのクラスを発見する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:06:08 GMT)
Graph Neural Network for Neutrino Physics Event Reconstruction [0.3] 本稿では、LArTPC検出器におけるシミュレーションニュートリノ相互作用の低レベル再構成のためのグラフニューラルネットワーク(GNN)であるNuGraph2について述べる。
このネットワークは、複数の2D表現にまたがる検出器オブザーバブルを直接運用するが、これらの表現間の一貫性を促進するために3Dコンテキスト認識機構を利用する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:15:31 GMT)
An Iterative Methodology for Unitary Quantum Channel Search [0.3] 本稿では,入力-出力量子状態ペアに基づく単一ユニタリ行列を特徴とするチャネルを近似する反復アルゴリズムを提案する。
提案アルゴリズムが最終的に臨界点を識別できることを厳密に証明し、これは確立された目的関数の局所最小値でもある。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:35:28 GMT)
Dynamics of monitored SSH Model in Krylov Space: From Complexity to Quantum Fisher Information [0.3] クリャロフ空間における監視SSHモデルの無クリック極限から生じる非エルミートSSHモデルのダイナミクスについて検討する。
クリャロフ部分空間における状態の拡散に伴う複雑性の飽和時間スケールが測定速度によって増加することが判明した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:52:23 GMT)
Observing Laughlin's pump using quantized edge states in graphene [0.2] 量子化された電荷ポンプのラウリンの思考実験は、整数量子ホール効果(IQHE)を理解する中心となる。
グラフェン上に超小型でリソグラフィ的に定義された接触体を作製することでこの問題に対処する。
これによりコービノ同値系が生成され、内部状態はよく整合している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:57:25 GMT)
Bose-Marletto-Vedral experiment without observable spacetime superpositions [0.2] エンタングルメントは時空重畳や量子時空自由度を必要とせずに重力によって生成できることを示す。
具体的には、3つの異なるおもちゃモデルを用いて絡み合いを生成できることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:48:55 GMT)
IXAII: An Interactive Explainable Artificial Intelligence Interface for Decision Support Systems [0.1] IXAIIは、LIME、SHAP、Anchors、DiCEの4つの説明可能なAIメソッドから説明を提供する。
プロトタイプでは,5つのユーザグループに対して適切なビューを提供し,説明内容やフォーマットに関してユーザエージェンシーを提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:28:13 GMT)
Efficient Event-based Delay Learning in Spiking Neural Networks [0.1] スパイキングニューラルネットワーク(SNN)はスパース通信を用いて計算し、注目を集めている。
本研究では,イベントプロップ形式を基礎とした,遅延を伴うSNNのための新しいイベントベーストレーニング手法を提案する。
提案手法はニューロン毎の複数のスパイクをサポートし,我々の知る限り,繰り返しSNNに適用される最初の遅延学習アルゴリズムである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:08:40 GMT)
Lagrangian Index Policy for Restless Bandits with Average Reward [0.1] ラグランジュ指数政策 (LIP) を, 長期平均報酬を伴うレスレスマルチアームバンディットに適用した。
我々は,LIPの性能とWhittle Index Policy(WIP)の性能を比較した。
モデルフリー環境でLIPのオンライン学習手法を得るための強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:00:55 GMT)
skLEP: A Slovak General Language Understanding Benchmark [0.0] skLEPはスロバキアの自然言語理解(NLU)モデルを評価するために特別に設計された最初の包括的なベンチマークである。
このベンチマークを作成するために、スロバキア向けに調整された新しいオリジナルデータセットをキュレートし、精密に英語のNLUリソースを翻訳した。
本稿では,スロバキア固有の言語モデル,多言語言語モデル,および英語事前学習言語モデルの体系的および広範囲な評価を行う。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:35:04 GMT)
Two-mode hyperradiant lasing in a system of two quantum dots embedded in a bimodal photonic crystal cavity [0.0] 2つの不整合励起量子ドット(QD)からなるシステムにおける2モードハイパーラジアントラッシングの手法を提案する。
励起子-フォノン相互作用を説明するために、時間畳み込みのないポーラロン変換マスター方程式を用いる。
フォノンにより誘導される2モード2光子過程は、放射能ビクターを著しく増強することを示した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:59:38 GMT)
Towards Scalable and Generalizable Earth Observation Data Mining via Foundation Model Composition [0.0] リモートセンシングと一般ビジョンデータセットに事前訓練された基礎モデルを効果的に組み合わせて性能を向上させることができるかを検討する。
その結果、より小さな事前訓練モデルの特徴レベルのアンサンブルは、はるかに大きなモデルの性能に適合するか、超える可能性があることがわかった。
この研究は、よりコンパクトなモデルにアンサンブルの強度を伝達するために知識蒸留を適用する可能性を強調している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:23:43 GMT)
Tool or Trouble? Exploring Student Attitudes Toward AI Coding Assistants [0.0] 学生はAIサポートにアクセスしてプログラミングタスクを完了し、第二に、AIなしでソリューションを拡張した。
発見は、AIツールが、特に初期開発において、コードを理解し、信頼性を高めるのに役立つと認識されたことを示唆している。
学生は、未知のタスクに知識を移すことが困難であることを報告し、概念的理解における過度な信頼とギャップを明らかにした。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 05:59:23 GMT)
Thermodynamically consistent collisional master equation in a low-density gas with internal structure [0.0] 希薄な熱気体を3次元に分散した非弾性散乱下での量子系の力学のマスター方程式を定式化する。
ガスが熱平衡にある場合, アンシラがシステムに共鳴しているか否かに関わらず, 熱力学的に整合性を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:41:51 GMT)
The Discovery, Disclosure, and Investigation of CVE-2024-25825 [0.0] この論文は、その発見、開示、そして国家の俳優に関するさらなる調査について記述している。
脆弱性は、CWE-1392: Use of Default Credentials, CWE-1393: Use of Default Password, CWE-258: Empty Password in configuration fileである。
ルートユーザーが /etc/shadow ファイルに入力すると、ワイルドカードでパスワードを入力できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:32:19 GMT)
That's Not the Feedback I Need! -- Student Engagement with GenAI Feedback in the Tutor Kai [0.0] 学生にPythonプログラミングタスク、コードエディタ、GenAIフィードバック、コンパイラフィードバックを提供するカスタムWebアプリケーションを構築します。
学習者から得られたフィードバックがどれほどの注意を払っているか、生成したフィードバックがどの程度役に立つか(あるいはそうでないか)について検討する。
その結果、GenAIのフィードバックは一般的に視覚的に注目され、未経験の学生は修正に2倍の時間を費やしていることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:36:56 GMT)
Text2Cypher Across Languages: Evaluating Foundational Models Beyond English [0.0] 本稿では,複数の言語を対象としたText2Cypherタスクにおける基礎LPMの性能について検討する。
元のCypherクエリを保存しながら、英語の質問をスペイン語とトルコ語に翻訳することで、多言語テストセットを作成し、リリースする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:31:10 GMT)
TITAN: Query-Token based Domain Adaptive Adversarial Learning [0.0] 我々は、適応中にソースデータが利用できなくなり、未ラベルのターゲットドメインに適応しなければならない場合、ソースフリー領域適応オブジェクト検出(SF-DAOD)問題に焦点を当てる。
この問題に対するほとんどのアプローチは、学生教育者(ST)フレームワークを用いた自己教師型アプローチを採用しており、疑似ラベルはソース事前学習モデルを介して生成され、さらなる微調整が行われる。
学生モデルの性能は,教師モデルが崩壊し,主に擬似ラベルの高雑音が原因で著しく低下することが多い。
信頼性の高い擬似ラベルを得るために,我々は提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:12:58 GMT)
Symmetry Sectors in Chord Space and Relational Holography in the DSSYK [0.0] 我々は、DSSYK のコードヒルベルト空間内の特定の制約によって生成される異なる対称性セクターを物質とともに発見する。
コードパリティ対称性はETWブレーンとユークリッドワームホールの正弦ディラトン重力に対応している。
パリティゲージ付きDSSYKの拡散複雑さとバルク内の測地線長を一致させてホログラフィック辞書を推定する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:32:04 GMT)
Structure-Preserving Patch Decoding for Efficient Neural Video Representation [0.0] 構造保存パッチ(SPP)に基づくニューラルビデオ表現法を提案する。
提案手法は,各映像フレームを,決定論的画素ベースの分割により,空間的に整列したフレームのパッチ画像に分割する。
我々はデコーダにこれらの構造化パッチを再構築するよう訓練し、グローバルからローカルへのデコーダ戦略を可能にする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:27:09 GMT)
Statistical Inference of the Value Function for Reinforcement Learning in Infinite Horizon Settings [0.0] 我々は、決定ポイントの数が無限大に分散する無限の地平線設定において、ポリシーの値に対する信頼区間(CI)を構築する。
最適方針が一意でない場合でも,提案したCIが名目上のカバレッジを達成することを示す。
提案手法をモバイル健康研究のデータセットに適用し, 強化学習アルゴリズムが患者の健康状態を改善するのに役立つことを確かめた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:35:13 GMT)
Spontaneous Quantum Turbulence in a Newborn Bose-Einstein Condensate via the Kibble-Zurek Mechanism [0.0] 本稿では, キブルズレーク機構を用いた自然量子乱流(SQT)の生成を提案する。
本稿では, 量子渦で凝縮したボース・アインシュタイン凝縮体の形成について述べる。
我々は,非圧縮性運動エネルギーのKybble-ZurekとKolmogorovのスケーリングを通じて,SQTの非平衡性を確立する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:00:09 GMT)
Shifting Narratives: A Longitudinal Analysis of Media Trends and Public Attitudes on Homelessness [0.0] 本研究は,ホームレスの範囲内でのフレーミング理論を検証するために,関連メディア記事の話題と感情傾向を分析した。
2015年から2023年にかけて、カリフォルニア州、フロリダ州、ワシントン州、オレゴン州、ニューヨーク州の州レベルのトレンドを調査した。
特にホームレス率の高い州では,メディアフレーミングと公的な感情との間に統計的に有意な相関が認められた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:34:17 GMT)
Sharp concentration of uniform generalization errors in binary linear classification [0.0] 均一な一般化誤差と期待値との収束は、非常に広い設定で起こることが示されている。
この収束を用いて、次元自由条件下での大数の一様法則を確立する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:57:11 GMT)
Semantic Preprocessing for LLM-based Malware Analysis [0.0] 本稿では,Portable Executable ファイルのレポートを生成する新しい前処理手法を提案する。
この前処理の目的は、マルウェアアナリストが理解できるバイナリファイルの意味表現を集めることである。
この前処理を用いて、複雑なデータセット上で平均0.94の重み付きF1スコアを達成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:09:42 GMT)
Seal Your Backdoor with Variational Defense [0.0] VIBEは、バックドア攻撃に対する耐性を訓練するモデルに依存しないフレームワークである。
標準データセットに対する現代のバックドア攻撃に対する手法の有効性を実験的に検証した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:48:11 GMT)
Resonating Kagome Dimer coverings in Rydberg atom arrays [0.0] 加護目二量体の均一な量子重ね合わせの性質について検討する。
実験的に生成する効率的なアルゴリズムを構築した。
我々は、我々のアプローチが他の量子コンピューティングハードウェアにどのように適応できるかを説明する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:37:48 GMT)
Reinforcement Learning for Optimal Control of Spin Magnetometers [0.0] 量子最適制御における問題に対する強化学習(RL)の利用について検討する。
SACアルゴリズムの有効性を評価するため,スピンベース磁気センサをベンチマークシステムとして採用する。
我々はスピン系の数値シミュレーションでRLエージェントを訓練し、横磁場パルス列を決定する。
RLエージェントはシステムの特定のパラメータに敏感であることがわかったが、全体としてはうまく一般化できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:04:51 GMT)
Rational Miner Behaviour, Protocol Stability, and Time Preference: An Austrian and Game-Theoretic Analysis of Bitcoin's Incentive Environment [0.0] プロトコルルールが変更可能であれば、効果的な時間優先が上昇し、合理的な長期計画と協調均衡を損なうことが示される。
フォーマルなゲーム理論分析とオーストリアの経済原理を用いて、変動可能なプロトコルが、鉱山労働者のインセンティブを生産的な投資から政治的賃貸と影響ゲームにどのようにシフトするかを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:04:21 GMT)
Rashba spin-orbit coupling and artificially engineered topological superconductors [0.0] 我々は、位相量子計算の現在活発な研究領域において、RSOCが果たす重要な役割について論じ、説明し、レビューする。
RSOCは実験室で低次元のトポロジカル超伝導体を製造する上で重要な要素であることが判明した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:53:14 GMT)
Quantum thermal state preparation for near-term quantum processors [0.0] マルチボディシステムの量子熱状態の生成は、量子プロセッサにとって重要な計算課題である。
設計した浴槽リセットと変調系バスカップリングを組み合わせた簡易かつ効率的な熱状態合成アルゴリズムを提案する。
提案アルゴリズムは,量子関連状態の量子シミュレーションを,現在および短期量子プロセッサを用いた有限温度で効率的に行うための経路を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:33:46 GMT)
Quantum dynamics in confined pseudo-harmonic oscillator in a time-dependent moving [0.0] 移動境界条件下での閉じ込め擬調和ポテンシャルのシュル「オーディンガー方程式」の解析解を提案する。
2つの異なる時間領域における核間距離比に依存する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:02:31 GMT)
Quantum Walks: First Hitting Times with Weak Measurements [0.0] グラフ上の連続時間量子ウォークの最初の繰り返し時間問題について検討する。
拡張されたシステム上での弱い測定に基づくプロトコルを実装し、進化を通して最小限の侵襲的なモニタリングを可能にする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:01:40 GMT)
Quantum Transition Rates in Arbitrary Physical Processes [0.0] 時間依存量子遷移率(QTR)の計算フレームワークを提案する。
QTRは、与えられた部分空間からターゲット部分空間への量子状態の進化のペースを記述する。
そこで本研究では,QTRを逆拡張運転によって制御する方法を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:00:11 GMT)
Quantum Token Obfuscation via Superposition: A Post-Quantum Security Framework Using Multi-Basis Verification and Entropy-Driven Evolution [0.0] トークン難読化を含む従来の暗号技術は、量子攻撃に対してますます脆弱である。
本研究では,重ね合わせとマルチバス検証を利用したトークン難読化手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:37:18 GMT)
Quantum Supremacy through Fock State $q$ boson Sampling with Transmon Qubits [0.0] トランスモン量子ビットが効果的に動作可能な変種である$q$boson Fock状態サンプリングを導入する。
我々はトランスモンが$q$ボソンサンプリングタスクで量子超越性を達成する能力を持っていることを実証した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:41:45 GMT)
Quantum Adaptive Search: A Hybrid Quantum-Classical Algorithm for Global Optimization of Multivariate Functions [0.0] 量子適応探索(Quantum Adaptive Search, QAGS)は、多変量関数のグローバル最適化のためのハイブリッド量子古典的アルゴリズムである。
その結果,QAGSは時間と空間の複雑さの両面で優位性を保ちながら高い精度を達成できることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 09:55:36 GMT)
Predictive Maintenance Optimization for Smart Vending Machines Using IoT and Machine Learning [0.0] 本研究では,モノのインターネット(IoT)センサと機械学習(ML)アルゴリズムを活用することにより,自動販売機に適した新しい予測メンテナンスフレームワークを提案する。
提案システムは,マシンコンポーネントと動作条件をリアルタイムで連続的に監視し,故障発生前の予測に予測モデルを適用する。
その結果,早期故障検出の精度が向上し,冗長なサービス介入の低減が図られた。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:33:58 GMT)
Percolation thresholds and connectivity in quantum networks [0.0] 量子ビット型平面量子ネットワークモデルにおけるエンタングルメントパーコレーションについて検討する。
そこで我々は, 絡み合いのスワッピングと蒸留操作のシーケンスを求めるアルゴリズムを開発した。
我々は、採用戦略のパーコレーションしきい値によって明確に分離された、異なる量子パーコレーションの規則を見いだす。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:32:06 GMT)
Optimising Language Models for Downstream Tasks: A Post-Training Perspective [0.0] 言語モデル(LM)は、NLPにおいて顕著な能力を示している。
しかし、それらを効率的かつ堅牢に特定のタスクに適用することは、依然として困難である。
この論文は、下流アプリケーションにLMを適応させる一連の方法を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:49:35 GMT)
Optimising 4th-Order Runge-Kutta Methods: A Dynamic Heuristic Approach for Efficiency and Low Storage [0.0] 遺伝的アルゴリズム (GA) と強化学習 (RL) による自動発見手法
探索空間探索のためのGA駆動突然変異とRLにインスパイアされた状態遷移機構により動的に選択を洗練させる。
遺伝的アルゴリズムは従来のESRK最適化プロセスと比較してIPOPTの25%削減を実現している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:51:22 GMT)
Optical response of a binary atomic system with incoherent gain [0.0] 共役ポンプにより励起される同一原子の2元系の光学応答について検討した。
これにより、システムの状態を特徴づけ、最終的に操作することができ、量子情報処理における将来的な応用の道を開くことができます。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:31:18 GMT)
Operational Threshold for Spatial Entanglement Survival Under Ionizing Decoherence [0.0] 共役対の1つの粒子がイオン化や散乱などの散逸過程を経た時に空間的絡み合いがどのように進化するかを述べる。
エンタングルメント崩壊は、リコイル誘起運動量拡散に支配される指数律に従い、量子コヒーレントと古典的レジームを分離した鋭い操作しきい値を特定する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:37:54 GMT)
One Model to Forecast Them All and in Entity Distributions Bind Them [0.0] 電力システムの確率的予測は、しばしば家庭、給電装置、風力タービンのような多元性データセットを含む。
従来のアプローチでは、各エンティティに対して個々のモデルをトレーニングする必要があります。
本研究は,1つのモデルを用いたエンティティ固有確率予測を可能にする条件付き変分オートエンコーダであるGUIDE-VAEを用いてこの問題に対処する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:28:09 GMT)
On the Ability of Deep Networks to Learn Symmetries from Data: A Neural Kernel Theory [0.0] 本研究では,深層ネットワークがデータから対称性をいつ,どのように学習するかを理解することを目的とする。
実世界のシナリオに触発されて、トレーニング中にデータ対称性が部分的にのみ観察されるような分類パラダイムについて検討する。
カーネル類似が適用される無限幅極限では、対称性学習のニューラルネットワーク理論が導かれる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:02:44 GMT)
On Uniform Weighted Deep Polynomial approximation [0.0] 本研究では,一方の非対称な振舞いと他方の減衰を有する関数に適した重み付き深部近似剤のクラスを導入,解析する。
このフレームワークがTaylor, Chebyshev, and standard Deep Approximantsより優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:25:32 GMT)
Offensive Language Detection on Social Media Using XLNet [0.0] 一般化された自己回帰事前学習手法であるXLNetに基づく自動攻撃言語検出モデルを提案し,その性能をBERT(Bigressive Representations from Transformers)と比較した。
実験の結果,XLNet は攻撃内容の検出や犯罪の種類分類において BERT よりも優れており,BERT は攻撃対象の特定において BERT の方が若干優れていた。
これらの知見は、ソーシャルメディアプラットフォーム上で攻撃的言語を検出する堅牢なシステムを構築するために、トランスファーラーニングとXLNetベースのアーキテクチャの可能性を強調している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:37:35 GMT)
Observers and Timekeepers: From the Page-Wootters Mechanism to the Gravitational Path Integral [0.0] 閉じた宇宙における量子重力は、時間の問題とヒルベルト空間次元が 1 であるという事実の2つの相違があるが、明らかに関連しているように見える問題に直面している。
前者はメトリクスの和、後者はトポロジの和、後者はトポロジの和である。
本研究では, 観測者やタイムキーパーを重力経路積分に組み込む手法を提案し, ホログラフィーの観測者依存の一般化を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:18:50 GMT)
Negative exchange interaction in Si quantum dot arrays via valley-phase induced $\mathbb{Z}_2$ gauge field [0.0] 磁場のない2電子Si量子ドットアレイにおいて、負の交換$J0$が実現可能であることを示す。
我々の研究は、交換ベースの量子コンピューティングのための新しいツールと、量子磁気の研究のための新しい設定を明らかにする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:22:09 GMT)
NY Real Estate Racial Equity Analysis via Applied Machine Learning [0.0] 本研究では、ニューヨーク州(NYS)とニューヨーク市(NYC)におけるトラクターレベルの不動産所有パターンを分析し、人種格差を明らかにする。
我々は、先進的な人種・民族の計算モデルを用いて、土地所有者の予測された人種構成と、国勢調査データから住民人口を比較した。
白人は、その人口に対する資産と資産価値の不均等なシェアを持っているのに対し、黒人、ヒスパニック、アジア系コミュニティは、資産所有者として過小評価されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:32:06 GMT)
Monte Carlo and quasi-Monte Carlo integration for likelihood functions [0.0] 我々は,モンテカルロ法と準モンテカルロ法(QMC)の積分誤差を比較し,後続分布の正規化定数と一定の限界確率を近似する。
積分の次元が無限大になる傾向にある$n$と$m$として固定されている場合、MC積分の相対誤差のスケーリングレートは、追加の$n1/2log(n)p/2$データ依存因子を含む。
この研究のさらなる貢献は、ホルトン系列に対する星の差の高次元スケーリングに縛られることである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:39:30 GMT)
Modification of a Numerical Method Using FIR Filters in a Time-dependent SIR Model for COVID-19 [0.0] 著者のYi-Cheng Chen氏、Ping-En Lu氏、Cheng-Shang Chang氏、Tzu-Hsuan Liu氏は、FIR(Finite Impulse Response)線形システムフィルタリングを使って、COVID-19から感染し、回復した人の数を追跡、予測している。
本稿では,Chenらのアルゴリズムを小修正し,リッジ係数を求める。
そして、この修正アルゴリズムを使って、ミナスジェライス/ブラジルの州で、新型コロナウイルス(COVID-19)に感染し、回復した人々の数を追跡し、予測しました。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:44:45 GMT)
Mimesis, Poiesis, and Imagination: Exploring Text-to-Image Generation of Biblical Narratives [0.0] この研究は、人間の想像力を増強するAIの可能性を強調しているが、真の創造性、権威的意図、神学的深さの能力に疑問を呈している。
結論として、神聖な芸術におけるその役割は複雑で論争の的だが、聖書のテキストを再解釈する上で、AIは創造的なパートナーとして機能する、という。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:56:09 GMT)
MedPrompt: LLM-CNN Fusion with Weight Routing for Medical Image Segmentation and Classification [0.0] 我々はMedPromptを紹介した。このフレームワークは、高レベルなタスクプランニングのためのLarge Language Model(Llama-4-17B)と低レベルの画像処理のためのモジュラー畳み込みニューラルネットワーク(DeepFusionLab)を組み合わせた統合フレームワークである。
このシステムは、プロンプト駆動命令の実行と解釈において、平均遅延2.5秒で97%のエンドツーエンドの正確性を達成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:57:41 GMT)
Measurement-Device-Independent Schmidt Number Certification of All Entangled States [0.0] 半量子非局所ゲームに基づく計測デバイスに依存しない認証手法を開発した。
我々は、シュミット数が r を超える任意の二部状態に対して、そのシュミット数を証明する半量子非局所ゲームが存在することを証明している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:00:05 GMT)
Maintaining MTEB: Towards Long Term Usability and Reproducibility of Embedding Benchmarks [0.0] Massive Text Embedding Benchmark (MTEB) はテキスト埋め込みモデルの標準評価プラットフォームとなっている。
データセットの完全性を評価し,テスト実行を自動化するとともに,ベンチマーク結果の一般化性を評価する,堅牢な継続的インテグレーションパイプラインを維持するためのアプローチを提案する。
これらのエンジニアリングプラクティスは、MTEBをスケールし、品質を維持しながらより包括的になり、究極的には、この分野との関連性を高めるのに役立っている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 12:40:48 GMT)
Machine learning of microstructure--property relationships in materials leveraging microstructure representation from foundational vision transformers [0.0] マイクロストラクチャーの機械学習-データからのプロパティ関係は、計算材料科学における新たなアプローチである。
本稿では,タスクに依存しないマイクロ構造特徴の抽出に,事前訓練された基礎視覚変換器を提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:03:29 GMT)
Lower Bounds on Relative Error Quantum Compression and Classical Shadows [0.0] タスクは、量子学習理論においてよく知られた古典的シャドウ問題の純粋状態の場合の、完全に古典的なバージョンと考えることができる。
まず、通信問題の相対誤差バージョンを検討し、一方通行のランダム化された古典的通信において、$Omega(sqrt2n)$の低い境界を証明した。
この下界は、すべての可観測体の集合だけでなく、パウリ可観測体のクラスに制限された場合にも成り立つことを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:58:23 GMT)
Logios : An open source Greek Polytonic Optical Character Recognition system [0.0] 本稿では,ギリシア語多言語テキストの正確な認識とデジタル化を目的として,光学文字認識(OCR)システムを提案する。
特徴抽出のための畳み込み層とシーケンシャルラーニングのための繰り返し層を組み合わせることで、ギリシャのポリトニックスクリプトがもたらす固有の課題に対処する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:04:27 GMT)
Lipschitz Bounds for Persistent Laplacian Eigenvalues under One-Simplex Insertions [0.0] 我々は、永続ラプラシアンに対して一様リプシッツを有界に証明する。
スペクトルトポロジカルデータ解析における最初の固有値レベルの保証を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:03:54 GMT)
Large speed-up of quantum emitter detection via quantum interference [0.0] 量子エミッタは、量子技術、顕微鏡、その他の応用において重要な資源である。
量子放射とコヒーレント場との間の香港-奥羽-マンデル干渉の延長により,現実的なノイズと損失の下でのエミッタ検出における磁化速度向上が可能となることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 07:18:09 GMT)
Interradical motion can push magnetosensing precision towards quantum limits [0.0] 分子間相互作用を変調する構造的分子運動が、量子クラムエル・ラオ境界に近い磁場方向を推定する精度をいかに推し進めるかを示す。
この知見は、効率的なハンドルの考案に向けて、運動誘起電子スピン相互作用の物理原理を調節する可能性を開く。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:38:56 GMT)
Institutional Noise, Strategic Deviation, and Intertemporal Collapse: A Formal Model of Miner Behaviour under Protocol Uncertainty [0.0] 本稿では,ブロックチェーンシステムにおけるプロトコル変更性が協調的なマイニング動作をいかに阻害するかを,ゲーム理論の形式的モデルで検証する。
ルールショックを繰り返すゲームフレームワークを用いることで,制度ルールのマイナーな不確実性さえも,時間的嗜好を増大させ,戦略的な逸脱を引き起こすことを示す。
分散型システムにおいて持続可能な協力が実現されるためには, プロトコル設計は, 決定変数ではなく, 憲法上の経済制約として扱う必要があると結論づける。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:12:06 GMT)
Informationally Complete Orbital Angular Momentum Tomography with Intensity Measurements [0.0] 固定順序モードの空間上でトモグラフィーを行うための簡単な手法を開発した。
本手法は,検討された部分空間内で情報的に完備であることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:16:10 GMT)
Increasing single-photon production with cavity-QED [0.0] その結果, キャビティ寿命と光物質結合強度の組み合わせによってキャリア-光子相関が増大し, 低次光子相関を維持しながら単光子生成速度が向上することが判明した。
本研究では,高純度かつ超高速な光子生成を実現するために,将来的なエミッタキャビティ設計のためのガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:43:33 GMT)
Improved Honeycomb and Hyperhoneycomb Lattice Hamiltonians for Quantum Simulations of Non-Abelian Gauge Theories [0.0] 非アベリア・ヤン=ミルズゲージ理論の量子シミュレーションのための改良されたKogut-Susskind Hamiltonianが開発された。
ハニカム格子に対して、古典的には$cal O(b2)$-improved Hamiltonian を導出し、$b$は格子間隔である。
我々は、ゲージ理論の3+1D量子シミュレーションの空間的テッセルレーション候補として(非キラルな)ハイパーハニカムを同定し、関連する$cal O(b)$-improved Hamiltonianを決定した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:53:18 GMT)
Imaginary Time Formalism for Causal Nonlinear Response Functions [0.0] 各順序におけるカジュアルな非線形応答関数は、適切な時間順序の松原関数の解析的連続から得られることを示す。
また、この結果を用いて因果応答関数と松原関数の両方に対する分析スペクトル密度表現を求める。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:11:05 GMT)
Hyperspherical Variational Autoencoders Using Efficient Spherical Cauchy Distribution [0.0] 球状コーシー(spCauchy)潜伏分布を用いた新しい変分オートエンコーダ(VAE)アーキテクチャを提案する。
従来のガウス空間や広く使われているフォン・ミセス=フィッシャー分布とは異なり、spCauchy はより自然な潜在変数の超球面表現を提供する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:01:51 GMT)
Hybrid Deep Learning and Signal Processing for Arabic Dialect Recognition in Low-Resource Settings [0.0] アラビア語の方言認識は、アラビア語の言語的多様性と大きな注釈付きデータセットの不足により、大きな課題を呈している。
本研究では,古典的な信号処理技術とディープラーニングアーキテクチャを融合したハイブリッドモデリング戦略について検討する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:36:25 GMT)
Homogenization of Multi-agent Learning Dynamics in Finite-state Markov Games [0.0] 本稿では,有限状態マルコフゲームにおいて相互作用する多元強化学習(RL)エージェントの学習力学を近似する新しい手法を提案する。
学習率を同時に低減し,更新頻度を増大させることで,学習プロセスを再スケールする。
微妙な仮定-状態過程のエルゴード性と更新の連続性-我々はこの再スケールされたプロセスが常微分方程式(ODE)に収束することを証明する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:08:49 GMT)
Hollow-grams: Generalized Entanglement Wedges from the Gravitational Path Integral [0.0] 重力バルク領域に付随する絡み合いウェッジの提案を導出する。
我々は、ランダムテンソルネットワーク(RTN)と重力における固定幾何状態の接続を利用する。
BP提案は$nto1$制限で普遍的に再現されていることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:06:24 GMT)
Ghost-Free Quantisation of Higher Time-Derivative Theories via Non-Unitary Similarity Transformations [0.0] 本研究では,特定のセクターにおけるスペクトルの有界性を維持しつつ,正規化性を回復する新しい手法を提案する。
擬/準エルミート的PT対称量子力学の技法に着想を得て、2つのエルミート的ハミルトニアンの間の非ユニタリ写像を構築する。
変換系は正規化可能な固有状態と下から有界なスペクトルを持つことを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:47:39 GMT)
Genetic Algorithm with Innovative Chromosome Patterns in the Breeding Process [0.0] 遺伝的アルゴリズム(英: Genetic Algorithm with Border Trades、GAB)は、繁殖過程に新しい染色体パターンを組み込むことで探索を強化する、標準的な遺伝的アルゴリズムの新たな修正である。
GABは、標準的な遺伝的アルゴリズムと比較して、複雑なジョブスケジューリング問題に対する最大8倍の適合性と10倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 04:26:22 GMT)
Generation of polarization-entangled Bell states in monolithic photonic waveguides by leveraging intrinsic crystal properties [0.0] 高度なフォトニック量子技術は、効率的かつスケーラブルな絡み合った光子のチップ上の源を必要とする。
本研究では, 非線形結晶の固有特性を利用して, 構造的に単純な導波路内での偏光絡み合うベル状態の生成を実証する。
チタン酸バリウムは, より広いスペクトル範囲で高い非線形効率と高いコンカレンスを提供することで, ニオブ酸リチウムを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:20:09 GMT)
From Human to Machine Psychology: A Conceptual Framework for Understanding Well-Being in Large Language Models [0.0] 本稿では,機械の繁栄の概念を紹介し,PAPERSフレームワークを提案する。
我々の発見は、人間とシステム固有の優先順位の両方を考慮に入れた、AI固有の繁栄モデルを開発することの重要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:28:13 GMT)
Four types of phase transitions in interacting boson (meson) matter at high temperatures [0.0] ボゾン粒子-反粒子系は縮合相への4種類の相転移を示す。
相互作用の強さによっては、ボゾン粒子-反粒子系は縮合相への4種類の相転移を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:43:11 GMT)
Focused Sampling for Low-Cost and Accurate Ehrenfest Modeling of Cavity Quantum Electrodynamics [0.0] キャビティ量子電磁力学の経済モデリング手法は平均場力学によって提供される。
我々は、単軌道レベルでゼロ点エネルギーを強制する集中サンプリングスキームを含むように、エレンフェストの定理を変更する。
この手法は、最小限の軌跡内に収束しながら、短距離および長距離の限界において高い精度が得られることが示されている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:40:16 GMT)
Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning [0.0] そこで本研究では,中間フローサンプルから直接完了ベクトルを予測するために,フローマッチングを改良した生成ポリシーを提案する。
我々の手法はオフライン、オフライン、オンラインのRL設定に効果的にスケールし、スピードと適応性を大幅に向上させる。
我々はSSCPをゴール条件付きRLに拡張し、フラットポリシーが明確な階層的推論なしでサブゴナル構造を活用できるようにする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:09:53 GMT)
Few-fermion resonant tunneling and underbarrier trapping in asymmetric potentials [0.0] その結果,非相互作用性フェルミオンはバリアの配向に関係なく対称なトンネルの確率を示すことがわかった。
我々は,多体共振トンネルを通したトンネル化と,多体共振トンネルによるトンネル化の促進により相互作用がトンネルを媒介する機構を同定する。
この結果は, ダイオードやメムリスタなどの配向輸送特性を有するナノスケールデバイスの設計に応用できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:45:57 GMT)
Exponential Relative Entropy Decay Along Quantum Markov Semigroups [0.0] 我々は、量子マルコフ半群に沿った相対エントロピーの指数的崩壊と、一般フォン・ノイマン代数に対する修正対数的ソボレフの不等式の間の同値性を確立する。
我々は、不変対数的ソボレフの不等式に対して、無限次元フォン・ノイマン環上の GNS-対称量子マルコフ半群への相互交叉基準を拡張する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:00:49 GMT)
Exploring the Structure of AI-Induced Language Change in Scientific English [0.0] セマンティッククラスタ全体はしばしば一緒に動き、グループ内のほとんどの単語が使用量を増やしています。
このパターンは、大きな言語モデルによって引き起こされる変化は、純粋に語彙ではなく、主に意味的かつ実用的であることを示唆している。
単語の折り畳み解析により,有機言語の変化と一致した,より複雑な画像が明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 23:44:24 GMT)
Explicit neural network classifiers for non-separable data [0.0] 我々は、トランケーションマップの観点から、フィードフォワードニューラルネットワークの大規模なクラスを特徴づける。
アプリケーションとして、ReLUニューラルネットワークが同心データを分離する特徴マップをどのように実装できるかを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:06:49 GMT)
Explainable quantum regression algorithm with encoded data structure [0.0] 本稿では,最初の解釈可能な量子回帰アルゴリズムを構築する。
符号化されたデータ構造は回帰マップの計算の時間的複雑さを減少させる。
我々は、中性冷原子とイオンに実装されたマルチキュービットゲートを持つ潜在的な量子ユーティリティを想定する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:12:31 GMT)
Experiment on creating a neural network with weights determined by the potential of a simulated electrostatic field [0.0] 本稿では,そのポテンシャルを用いてニューラルネットワークの重みとしきい値を決定する可能性について検討する。
静電場はBuilder C++環境でシミュレートされる。
結果のニューラルネットワークの有効性は、MNISTテストデータセットを用いて評価される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:26:38 GMT)
Experience converting a large mathematical software package written in C++ to C++20 modules [0.0] ヘッダベースとモジュールベースの両方のインターフェースを同じコードベースから提供できるアプローチについて説明します。
モジュールへの変換が可能で、変換されたライブラリ自体のコンパイル時間が短縮される。
私は、数学ソフトウェアの全エコシステムを変換するための長期的な戦略について考えます。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:38:33 GMT)
Excitation-detector principle and the algebraic theory of planon-only abelian fracton orders [0.0] 二次アーベルプラノンのみのフラクトンオーダー(英: quadratic abelian Planon-only fracton order)は、全ての励起がアーベル粒子で、比例的な正規方向の平面内での移動に制限される3次元(3d)ギャップ量子相のクラスである。
平面のみのフラクトン位を横方向に空間的にコンパクト化することで得られる 2d アーベルアロン理論を考える。
鍵となる要素は、$mathbbZ_pk [tpm]$ 上の有限生成のねじれのない加群に対する構造定理である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:12:34 GMT)
Evaluating Rare Disease Diagnostic Performance in Symptom Checkers: A Synthetic Vignette Simulation Approach [0.0] SC開発における重要な課題は、個々の疾患の予期せぬパフォーマンス劣化を防ぐことである。
本研究では,新しい合成ビグネットシミュレーション手法を提案し,検証する。
提案手法は,個々のまれな疾患に対するSCアルゴリズム変更の事前デプロイ評価を可能にする。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:52:46 GMT)
Entangling color centers via magnon-antimagnon pair creation [0.0] 空間的に分離された一対のカラーセンター間の絡み合いは、非平衡磁気環境と弱い相互作用をさせることによって生成される。
これらの量子揺らぎは、非局所散逸を通して2つの双極子結合色中心に定常な絡み合いを印加することを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 22:38:03 GMT)
Enhancing Dynamic CT Image Reconstruction with Neural Fields and Optical Flow [0.0] 偏微分方程式に基づく動的逆問題に対する明示的運動正規化器の導入の利点を示す。
また、ニューラルネットワークをグリッドベースの解法と比較し、前者はPSNRで後者より優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:18:49 GMT)
Energy additivity as a requirement for universal quantum thermodynamical frameworks [0.0] 内部エネルギーは、宇宙の閉系エネルギーとの整合性を維持するために環境を考慮に入れなければならない。
内部エネルギーは加法的でも保守的でもないことが示され、非物理的特徴に繋がる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:56:06 GMT)
Efficient implementation of quantum signal processing via the adiabatic-impulse model [0.0] 量子信号処理(QSP)と断熱インパルスモデル(AIM)の類似性について検討する。
AIMは、強い外部駆動場下での2レベル量子システムの進化を効果的に記述する。
パラメータをQSPからAIMにマッピングして,非断熱・高振幅外部ドライブを用いたQSPライクな進化を実現する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 10:35:58 GMT)
Early Glaucoma Detection using Deep Learning with Multiple Datasets of Fundus Images [0.0] 緑内障は可逆性失明の主要な原因であるが、早期発見は治療成績を大幅に改善させる可能性がある。
本研究では,網膜基底像からの緑内障検出のためのEfficientNet-B0アーキテクチャを用いたディープラーニングパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:06:51 GMT)
ESMStereo: Enhanced ShuffleMixer Disparity Upsampling for Real-Time and Accurate Stereo Matching [0.0] 小型のシャッフルミキサー(ESM)を提案する。
ESMは、主要な特徴を異種アップサンプリングユニットに統合することで、重要な詳細を復元する。
ESMStereoのコンパクトバージョンは、ハイエンドGPUで116 FPS、AGX Orinで91 FPSの推論速度を達成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 08:34:51 GMT)
Do Large Language Models Advocate for Inferentialism? [0.0] ChatGPTやClaudeといった大規模言語モデル(LLM)の出現は、言語哲学に対する新たな課題を提示している。
本稿では,これらのシステムを理解するための代替基盤フレームワークとして,Robert Brandom氏の推論的セマンティクスについて考察する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 11:03:13 GMT)
Devising a solution to the problems of Cancer awareness in Telangana [0.0] 2020年のテランガナにおける子宮頸癌、乳癌、口腔癌の検診を受けた女性の比率は3.3%であった。
子宮頸癌や乳がんの徴候や症状やスクリーニングの実践について、認識度は低い。
人口統計学的因子に基づいて,乳がんや頸部癌に罹患するリスクを予測できるML分類モデルを開発した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:29:00 GMT)
Development of MR spectral analysis method robust against static magnetic field inhomogeneity [0.0] 著者らは、モデル化スペクトルに基づいて訓練された深層学習モデルを用いた新しいスペクトル解析手法を提案した。
モデル化されたスペクトルは、健康なヒト脳のB0マップと代謝物比から生成される。
メタボライト比の平均二乗誤差(MSE)を用いて,提案手法の性能評価を行った。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 00:03:25 GMT)
Describing Console I/O Behavior for Testing Student Submissions in Haskell [0.0] 単純なコンソールI/Oプログラムの動作を特定するための,小型で形式的な言語を提案する。
この設計は、学生が書いたインタラクティブHaskellプログラムをテストする具体的なアプリケーションケースによって進められている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:12:32 GMT)
Deception Detection in Dyadic Exchanges Using Multimodal Machine Learning: A Study on a Swedish Cohort [0.0] 本研究は,マルチモーダル機械学習技術を用いて,ディヤド相互作用の誤認を検出することの有効性について検討する。
私たちは、オーディオとビデオデータ、具体的にはアクションユニットと視線情報を利用して、早期と後期の融合アプローチを比較します。
その結果, 音声情報と顔情報の両方を組み込むことで, 単一モダリティ手法よりも優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:11:42 GMT)
Cutoff Theorems for the Equivalence of Parameterized Quantum Circuits (Extended) [0.0] ほとんどの量子回路は検証されていないため、この手順はエラーを起こしやすいことが知られている。
本稿では,パラメータ化量子回路の等価性を検証する方法を提案する。
本手法は同値変調大域位相にまで拡張し,サイクロトミックゲートセットの効率的な角度サンプリング手法について述べる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 03:58:51 GMT)
Cooling of an optically levitated nanoparticle via measurement-free coherent feedback [0.0] ナノ粒子のコヒーレントで 無測定光フィードバック制御
その結果、余剰系の量子制御のための強力なツールとしてコヒーレントフィードバックが確立された。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:52:09 GMT)
Controlled probing of localization effects in the non-Hermitian Aubry-André model via topolectrical circuits [0.0] アンダーソン局在と非エルミート皮膚効果は、それぞれ障害と非相反性によって駆動される固有関数の2つの異なる閉じ込め現象である。
有名なオーブリー・アンドルーモデルのエルミート的でないバージョンについて検討するが、これは独特な自己双対性のために理想的なプラットフォームとして機能する。
この設定では、アンダーソン局在と皮膚効果の競合は、準周期性障害の複雑な相を介して正確に制御できる。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:45:46 GMT)
Container damage detection using advanced computer vision model Yolov12 vs Yolov11 vs RF-DETR A comparative analysis [0.0] 破損したコンテナは、それを扱う従業員にとっての安全上の危険であり、ロジスティック企業にとっての責任である。
本稿では,3種類の最先端コンピュータビジョンモデルYolov12,Yolov11,RF-DETRによる損傷検出性能の比較を行う。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:29:54 GMT)
Comparing Learning Paradigms for Egocentric Video Summarization [0.0] 本研究では,自我中心のビデオデータの理解と解釈能力を評価することによって,コンピュータビジョンのパラダイムを考察する。
我々はShotluck Holmes(最先端教師あり学習)、TAC-SUM(最先端教師なし学習)、GPT-4o(素早い微調整事前学習モデル)について検討し、映像要約の有効性を評価した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 21:46:48 GMT)
Cohort Retrieval using Dense Passage Retrieval [0.0] 本研究では,心エコー的心電図の非構造性データセットをクエリ・パッセージ・データセットに変換するための体系的アプローチを提案する。
実際の臨床シナリオにインスパイアされた評価指標を設計し,実装し,厳密なテストを行う。
従来のSOTA法や市販のSOTA法と比較して優れた性能を示すカスタムトレーニングDPR埋め込みモデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:11:25 GMT)
Closing objectivity loophole in Bell tests on a public quantum computer [0.0] 客観性基準に着目した局所現実主義のベルテストを実行する。
IBM QuantumとIonQのデバイスは、そのような拡張されたベル型テストに合格するのに十分正確であることが判明した。
このテストは、より大きな量子ビットの集合にまたがる絡み合いのベンチマークとしても機能する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:15:13 GMT)
Chirally-protected state manipulation by tuning one-dimensional statistics [0.0] これは、カイラル対称性が退化ゼロエネルギー部分空間を保護する相関ホッピングモデルの一例である。
我々は統計的パラメータを理論的に進化させ、このキラル部分空間において非自明なベリー位相とホロノミーを求める。
対応する状態は、断熱操作で保存されるN$粒子密度の定常チェッカーボードパターンを有する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:19:45 GMT)
Characterizing non-Markovianity via quantum coherence based on Kirkwood-Dirac quasiprobability [0.0] カークウッド・ディラック準確率(Kirkwood-Dirac quasiprobability)による非増加量子コヒーレンスの性質に基づく非マルコフ性の新しい尺度を提案する。
KD準確率コヒーレンスに基づく非マルコフ性の測定は、KD準確率の想像的部分の時間的進化を通じて記憶効果を捉える。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:22:29 GMT)
Cat and Mouse -- Can Fake Text Generation Outpace Detector Systems? [0.0] 大規模な言語モデルは、学術的な文章、製品レビュー、政治ニュースなどの領域で説得力のある「フェイクテキスト」を生み出すことができる。
人工テキストの検出には,多くの手法が研究されている。
より大規模なモデルであっても、偽テキストの確実な検出が引き続き可能であることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:58:43 GMT)
Canonical Quantization of a Memristive Leaky Integrate-and-Fire Neuron Circuit [0.0] 本稿では,量子化分裂型Leaky Integrate-and-Fire(LIF)ニューロンの理論的枠組みを提案する。
我々は、回路量子力学の基底となる量子モデルを導出するために正準量子化法を適用した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:14:08 GMT)
Can "consciousness" be observed from large language model (LLM) internal states? Dissecting LLM representations obtained from Theory of Mind test with Integrated Information Theory and Span Representation analysis [0.0] 統合情報理論(IIT)は意識現象を説明するための定量的枠組みを提供する。
我々は、このフレームワークの最新イテレーションであるIIT 3.0と4.0を、LLM(Large Language Model)表現のシーケンスに適用します。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 13:59:22 GMT)
CaloHadronic: a diffusion model for the generation of hadronic showers [0.0] 高粒度カロリーにおける粒子のシャワーのシミュレーションは、粒子物理学への機械学習の適用における重要なフロンティアである。
近年の研究では,拡散型シャワーシミュレーションが極めて効率的であることが示されている。
電磁波とハドロン熱量計にまたがってシャワーを均等に発生させる機械学習手法は、これが初めてである。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:12:44 GMT)
CAST: Cross-Attentive Spatio-Temporal feature fusion for Deepfake detection [0.0] CNNは空間的アーティファクトのキャプチャに有効であり、Transformerは時間的不整合のモデリングに優れている。
本稿では,空間的特徴と時間的特徴を効果的に融合させるために,クロスアテンションを利用した統合CASTモデルを提案する。
我々はFaceForensics++、Celeb-DF、DeepfakeDetectionデータセットを用いてモデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 18:51:17 GMT)
Boundary effects in classical liquid density fluctuations at finite temperature [0.0] フォノン量子化法による閉じ込められた古典液体中の密度変動に対する熱的効果の研究
系は、ディリクレ、ノイマン、混合境界条件を持つ完全に反射する平行平面の間の無質量スカラー場を介してモデル化される。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:04:06 GMT)
Boosting Domain Generalized and Adaptive Detection with Diffusion Models: Fitness, Generalization, and Transferability [0.0] ディテクタは、トレーニングとテストデータのドメインギャップによって、しばしばパフォーマンス低下に悩まされる。
近年,領域一般化(DG)や適応(DA)タスクに応用された拡散モデルが研究されている。
単一段階拡散過程から中間的特徴を抽出することにより,これらの問題に対処することを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:42:23 GMT)
Automatic Reviewers Assignment to a Research Paper Based on Allied References and Publications Weight [0.0] 我々は,研究論文のベストレビュアーを自動選択するための新しい戦略を用いたプログラムを提案し,実装する。
まず、参照を収集し、参照に少なくとも1つの論文を持つ著者を数える。
次に、特定のトピックの上位研究者を検索し、最初のn人の著者のh-index、i10-index、引用を数える。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:44:06 GMT)
Assessing an evolutionary search engine for small language models, prompts, and evaluation metrics [0.0] 言語モデルと命令プロンプトの同時最適化は、効率的で効果的なAIシステムをデプロイする上で大きな課題となる。
本稿では,この複雑な空間をナビゲートするために設計された双方向進化型検索エンジンを紹介し,評価する。
NSGA-IIアルゴリズムを用いて,タスクの精度とトークン効率の同時最適化を行う。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 17:36:23 GMT)
An introduction to Causal Modelling [0.0] このチュートリアルは、潜在的な結果とグラフィカルな手法を統合することで、現代的な因果モデリングの簡潔な紹介を提供する。
明確な表記法、直観的な説明、応用研究者の実践例に重点を置いている。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 06:46:06 GMT)
An Efficient Decomposition of the Carleman Linearized Burgers' Equation [0.0] カルマン線形化法を用いて非線形バーガースの方程式を無限線形系に写像する。
この新たな有限線型系は、行列を線形結合に分解できるというキー特性を持つより大きな方程式系に埋め込まれる。
これは、カールマン線形化システムの最初の効率的なデータロード方法である。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:07:26 GMT)
Amplifying microwave pulses with a single qubit engine fueled by quantum measurements [0.0] 超伝導トランスモン量子ビットの繰り返し量子測定により, エンジンによるマイクロ波信号の増幅を実演する。
フィードバックを用いて、エンジンは熱源を使わずに量子マックスウェルのデーモンとして動作する。
我々は,エンジンの長期安定性とトランスモンデコヒーレンス,損失,ドリフトに対する堅牢性を特徴付ける。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:04:03 GMT)
Amplifying hybrid entangled states and superpositions of coherent states [0.0] 増幅スキームの忠実度とHESの利得はコヒーレント状態のそれと同じであることを示す。
SCSは、コヒーレント状態の振幅に依存する増幅スキームによって非常に非自明な振る舞いを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:22:30 GMT)
Adapting Probabilistic Risk Assessment for AI [0.0] 汎用人工知能(AI)システムは、緊急リスク管理の課題を示す。
現在の手法は、しばしば選択的なテストとリスク優先順位に関する未文書の仮定に依存します。
本稿では,AIフレームワークの確率的リスクアセスメント(PRA)を紹介する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 19:31:12 GMT)
AIR-VIEW: The Aviation Image Repository for Visibility Estimation of Weather, A Dataset and Benchmark [0.0] 本稿では,この目的に適したFAA気象カメラネットワークからの画像の1年間のデータ収集キャンペーンの成果を示す新しいデータセットを提案する。
また、一般に使用されている3つのアプローチと、公開されている3つのデータセットでトレーニングおよびテストを行う際の汎用ベースラインを適用する際のベンチマークも提示する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 02:04:04 GMT)
AGTCNet: A Graph-Temporal Approach for Principled Motor Imagery EEG Classification [0.0] 本研究では,運動画像脳波(MI-EEG)分類のための新しいグラフ時間モデルAGTCNetを提案する。
49.87%のモデルサイズ減少、64.65%の推論時間、より短い入力EEG信号により、AGTCNetは被検者に依存しない分類において66.82%の移動平均精度を達成した。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 14:49:10 GMT)
A time-marching quantum algorithm for simulation of the nonlinear Lorenz dynamics [0.0] 我々は,ロレンツモデルの2階時間離散化バージョンを時間発展させる量子アルゴリズムを開発した。
特に,ロレンツ系の構造特性を正確に捉えていることを示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:08:00 GMT)
A Keyword-Based Technique to Evaluate Broad Question Answer Script [0.0] 本稿では,主観的回答スクリプトを電子的に評価する効率的な方法を提案する。
この記事では、回答スクリプトからキーワードを見つけ出し、オープンドメインとクローズドドメインの両方から解析されたキーワードと比較する。
提案システムでは,100名の学生の回答スクリプトを用いて,精度スコア0.91。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:42:49 GMT)
A Hodge Theory for Entanglement Cohomology [0.0] 量子絡み合いを記述するホモロジー代数の応用を探求し、拡張する。
我々は、Hodge星作用素、内積、共微分、およびラプラシアン(英語版)(Laplacian)の類似体を、絡み合い$k$-形式のために構成する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 15:18:46 GMT)
A Comprehensive Dataset for Underground Miner Detection in Diverse Scenario [0.0] 地下の採掘作業は、緊急対応能力を重要なものにする重要な安全上の課題に直面している。
ディープラーニングアルゴリズムは、自動マイニング検出のための潜在的なソリューションを提供するが、包括的なトレーニングデータセットを必要とする。
本稿では,地雷検出システムの開発と検証を目的とした,新しい熱画像データセットを提案する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 16:33:49 GMT)
2-Adic quantum mechanics, continuous-time quantum walks, and the space discreteness [0.0] 2進シュリンガー方程式の大規模なクラスは、ある連続時間量子マルコフ連鎖(CTQMC)のスケーリング極限であることを示す。
2つの対称行列を用いてグラフ上に新しいタイプの連続時間量子ウォーク(CTQW)を構築する。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 01:13:53 GMT)
(Fact) Check Your Bias [0.0] パラメトリック知識バイアスがHerOシステム(FEVER-25のベースライン)の事実チェック結果に与える影響について検討する。
Llama 3.1は、直接、事実検証を行うよう促されたとき、その主張の半分近くを"Not Enough Evidence"とラベル付けしている。
第2の実験では,支持,反感,中立性のある事実チェック文書を生成するようモデルに促す。この結果から得られた証拠の約50%は,各視点に固有のものであるとともに,検索結果に大きく影響する。
得られた証拠の相違にもかかわらず、最終的な判定予測は、迅速な戦略をまたいだ安定性を示す。
論文参考訳(メタデータ) (Thu, 26 Jun 2025 20:03:58 GMT)