Anticipating Decoherence: a Predictive Framework for Enhancing Coherence in Quantum Emitters [96.4] 遠隔量子エミッタにおける予測とデコヒーレンスエンジニアリングのための予測フレームワークを開発する。
限られたデータに基づいてトレーニングされた機械学習モデルは、目に見えないスペクトルの振る舞いを正確に予測できることを示す。
これらの結果は、スケーラブル量子システムにおけるリアルタイムデコヒーレンスエンジニアリングの道を開いた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:23:14 GMT)
Coward: Toward Practical Proactive Federated Backdoor Defense via Collision-based Watermark [90.9] 我々は、マルチバックドア衝突効果の発見に触発されて、Cowardと呼ばれる新しいプロアクティブディフェンスを導入する。
一般に,サーバから注入された,矛盾するグローバルな透かしが,保持されるのではなく,ローカルトレーニング中に消去されるかどうかを評価することで攻撃者を検出する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:51:33 GMT)
Free-MoRef: Instantly Multiplexing Context Perception Capabilities of Video-MLLMs within Single Inference [88.6] Free-MoRefは、ビデオMLLMのコンテキスト認識能力を多重化するトレーニング不要のアプローチである。
実験によると、Free-MoRefは1つのA100 GPUで圧縮することなく、2$times$から8$times$の入力フレームを完全に認識できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:31:10 GMT)
AgiBot World Colosseo: A Large-scale Manipulation Platform for Scalable and Intelligent Embodied Systems [88.1] AgiBot Worldは、217のタスクにまたがる100万以上のトラジェクトリを5つのデプロイメントシナリオで構成した大規模なプラットフォームである。
AgiBot Worldは高品質で多様なデータ配信を保証する。
GO-1は、現実世界のデクスタラスタスクや長距離タスクにおいて例外的な能力を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:50:21 GMT)
R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization [86.3] そこで本稿では,MLLMの自己改善を支援するオンライン強化学習フレームワークを提案する。
StepGRPOは、Step-wise Reasoning Accuracy Reward (StepRAR)とStep-wise Reasoning Validity Reward (StepRVR)の2つの新しいルールベースの推論報酬を導入した。
提案するStepGRPOでは,ステップバイステップ推論に優れた機能を持つMLLMのシリーズであるR1-VLを紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:22:09 GMT)
Can Reasoning Help Large Language Models Capture Human Annotator Disagreement? [84.3] ヒトのアノテーションの変化(つまり不一致)は、NLPでは一般的である。
異なる推論条件が大言語モデルの不一致モデルに与える影響を評価する。
意外なことに、RLVRスタイルの推論は不一致モデリングにおいて性能を低下させる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:19:31 GMT)
DPoser-X: Diffusion Model as Robust 3D Whole-body Human Pose Prior [83.0] DPoser-Xは3次元人体写真の拡散に基づく先行モデルである。
提案手法は,様々なポーズ中心タスクを逆問題として統一し,変分拡散サンプリングにより解決する。
我々のモデルは、常に最先端の代替品よりも優れており、人体全体のポーズを事前モデリングするための新しいベンチマークを確立している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:44:14 GMT)
SuperCarver: Texture-Consistent 3D Geometry Super-Resolution for High-Fidelity Surface Detail Generation [70.8] 粗いメッシュ上にテクスチャ一貫性のある表面の詳細を補うための3次元幾何学的超解像パイプラインであるSuperCarverを紹介する。
実験により、私たちのSuperCarverは実際のテクスチャの外観によって描写された現実的で表現力のある表面の詳細を生成することができることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:36:36 GMT)
VDEGaussian: Video Diffusion Enhanced 4D Gaussian Splatting for Dynamic Urban Scenes Modeling [68.7] 本稿では,動的都市景観モデリングのための拡散強調4次元ガウス平滑化フレームワークを提案する。
我々の重要な洞察は、テスト時間に適応したビデオ拡散モデルから頑健で時間的に一貫した事前情報を抽出することである。
提案手法は, 高速移動物体の動的モデリングを著しく向上させ, 2dBのPSNRゲインを近似的に達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:24:05 GMT)
Towards Modality Generalization: A Benchmark and Prospective Analysis [68.2] 本稿では,モダリティ・ジェネリゼーション(MG)について述べる。
マルチモーダルアルゴリズムを特徴とする包括的ベンチマークを提案し,一般化に着目した既存手法を適用した。
私たちの研究は、堅牢で適応可能なマルチモーダルモデルを進化させる基盤を提供し、現実的なシナリオで目に見えないモダリティを扱えるようにします。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:46:55 GMT)
VLM4D: Towards Spatiotemporal Awareness in Vision Language Models [66.8] V4DLMは視覚言語モデル(VLM)を評価するために設計された最初のベンチマークである。
本ベンチマークは,質問応答対を慎重にキュレートした,多様な実世界および合成ビデオで構成されている。
我々は,既存のモデルにおける基本的欠陥を浮き彫りにして,人間のベースラインと比較して重要なパフォーマンスギャップを識別する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:06:06 GMT)
MetAdv: A Unified and Interactive Adversarial Testing Platform for Autonomous Driving [63.9] MetAdvは、現実的でダイナミックでインタラクティブな評価を可能にする、新しい対向テストプラットフォームである。
フレキシブルな3D車両モデリングと、シミュレートされた環境と物理的環境のシームレスな遷移をサポートする。
生理的信号のリアルタイムキャプチャとドライバからの行動フィードバックを可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:07:54 GMT)
StackTrans: From Large Language Model to Large Pushdown Automata Model [63.4] Transformerアーキテクチャは、人工知能の幅広い分野において目覚ましい進歩として現れてきた。
大規模言語モデル(LLM)の問題を解決するためにStackTransを提案する。
注意計算を変更する従来のアプローチとは異なり、StackTransはトランスフォーマー層間で隠された状態スタックを明示的に組み込んでいる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:12:31 GMT)
Do AI models help produce verified bug fixes? [63.0] 大規模言語モデルは、ソフトウェアバグの修正に使用される。
本稿では,プログラマが大規模言語モデルを用いて,自身のスキルを補完する方法について検討する。
その結果は、プログラムバグに対する保証された修正を提供するAIとLLMの適切な役割への第一歩となる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:56:16 GMT)
Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model [62.4] カメラベースの設定は、立体深度推定を用いて高解像度の高解像度深度マップを生成することで、コスト効率のよい選択肢を提供する。
既存の全方位ステレオマッチング手法は、様々な環境において限られた深度精度しか達成できない。
DFI-OmniStereoは, 大規模事前学習基礎モデルを用いて, 相対的な単眼深度推定を行う新しい全方位ステレオマッチング法である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:30:29 GMT)
SpeechR: A Benchmark for Speech Reasoning in Large Audio-Language Models [60.7] SpeechRは、大規模な音声言語モデルにおける音声に対する推論を評価するための統一的なベンチマークである。
事実検索、手続き推論、規範的判断の3つの重要な側面に沿ったモデルを評価する。
11個の最先端のLALMの評価は、高い転写精度が強い推論能力に変換されないことを示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:28:04 GMT)
FlowR: Flowing from Sparse to Dense 3D Reconstructions [60.3] そこで本研究では,疎度な再現から密度な再構成に期待できるレンダリングまで,新しいビューレンダリングを接続するためのフローを学習するフローマッチングモデルを提案する。
我々のモデルは3.6Mイメージペアの新たなデータセットに基づいてトレーニングされており、単一のフォワードパスで1つのH100 GPU上で540x960解像度(91Kトークン)で45ビューまで処理できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:36:55 GMT)
Self-Evolving Critique Abilities in Large Language Models [59.9] 本稿では,Large Language Models (LLM) の批判能力の向上について検討する。
SCRITは、LCMを自己生成データで訓練し、批判能力を進化させるフレームワークである。
分析の結果,SCRITの性能はデータやモデルサイズと正の相関関係にあることが明らかとなった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:14:13 GMT)
Exponential convergence rate for Iterative Markovian Fitting [58.8] 反復マルコフフィッティング(IMF)アルゴリズムは、基底真理解へのクルバック・リーバーの発散に収束する。
我々は、IMFが明示的な収縮係数を持つ指数収束を示すのを初めて確立する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:48:21 GMT)
Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference [58.1] 本稿では,離散状態拡散に基づく大規模言語モデルであるSeed Diffusion Previewを提案する。
非逐次並列生成により、離散拡散モデルはトークン・バイ・トークン・バイ・トークン・デコーディングの固有の遅延を軽減するために顕著なスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:43:01 GMT)
Sparse-dLLM: Accelerating Diffusion LLMs with Dynamic Cache Eviction [58.0] Diffusion Large Language Models (dLLMs) は推論と並列デコードにおいてブレークスルーを実現するが、推論中に計算の複雑さやメモリオーバーヘッドに悩まされる。
Sparse-dLLMは、動的キャッシュ消去とスパースアテンションを統合した最初のトレーニングフリーフレームワークであり、遅延双方向スパースキャッシングを経由するスパースアテンションである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:14:03 GMT)
Diffusion models for inverse problems [57.9] 我々は、長年にわたって提案されてきた様々なアプローチについてレビューする。
視覚障害や高次元データ,データ不足や分散ミスマッチによる問題など,より困難な状況への拡張についても取り上げる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:26:06 GMT)
Interference Matrix: Quantifying Cross-Lingual Interference in Transformer Encoders [55.7] 可能な全ての言語対上で,小さなBERT様のモデルを訓練し,評価することにより,干渉行列を構築する。
分析の結果,言語間の干渉は非対称であり,そのパターンが従来の言語特性と一致しないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:02:19 GMT)
Your AI, Not Your View: The Bias of LLMs in Investment Analysis [55.3] 大規模言語モデル(LLM)は、事前訓練されたパラメトリック知識とリアルタイム市場データとの相違により、しばしば知識の衝突に直面している。
本稿では, LLMに基づく投資分析において, 確認バイアスの定量的分析を行った。
われわれは、大口株に対する一貫した選好と、ほとんどのモデルにおけるコントラリアン戦略を観察する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:06:03 GMT)
GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.0] GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。
さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:59:08 GMT)
Pigeon-SL: Robust Split Learning Framework for Edge Intelligence under Malicious Clients [53.5] 我々は,M クライアントのうち少なくとも 1 つの完全正直なクラスタを保証する新しいスキームである Pigeon-SL を紹介する。
各グローバルラウンドでは、アクセスポイントがクライアントをN+1クラスタに分割し、バニラSLを介して独立して各クラスタをトレーニングし、共有データセット上での検証損失を評価する。
損失が最も低いクラスタのみが進歩し、悪意のある更新を分離して破棄する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:34:50 GMT)
Text2Lip: Progressive Lip-Synced Talking Face Generation from Text via Viseme-Guided Rendering [53.2] Text2Lipは、解釈可能な音声-視覚ブリッジを構築するビセメ中心のフレームワークである。
Text2Lipは、意味的忠実性、視覚的リアリズム、モダリティの堅牢性において、既存のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:50:22 GMT)
Large-Scale Model Enabled Semantic Communication Based on Robust Knowledge Distillation [53.2] 大規模モデル(LSM)は意味表現と理解に有効なフレームワークである。
しかしながら、それらの直接的なデプロイメントは、しばしば高い計算複雑性とリソース要求によって妨げられる。
本稿では,新しい知識蒸留に基づくセマンティックコミュニケーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:47:18 GMT)
ChemMLLM: Chemical Multimodal Large Language Model [53.0] 分子理解と生成のための化学多モーダル大規模言語モデルであるChemMLLMを提案する。
また、テキスト、分子SMILES文字列、画像にまたがる5つのマルチモーダルタスクを設計し、データセットをキュレートする。
実験結果から,ChemMLLMは評価された全てのタスクにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:14:13 GMT)
SpeechRole: A Large-Scale Dataset and Benchmark for Evaluating Speech Role-Playing Agents [52.3] ロールプレイングエージェントは、パーソナライズされた相互作用と感情共鳴を達成するための有望なパラダイムとして登場した。
既存の研究は主にテキストのモダリティに焦点を当て、現実的な対話的なシナリオにおける音声の重要な次元を無視している。
我々は,98の多様な役割と112kの音声ベースの1ターン・マルチターン会話からなる大規模かつ高品質なデータセットであるSpeechRole-Dataを構築した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:18:36 GMT)
Can LLMs effectively provide game-theoretic-based scenarios for cybersecurity? [52.0] 大規模言語モデル(LLM)は、コンピュータシステムのセキュリティに新しいツールと課題を提供する。
従来のゲーム理論フレームワークが,LLM駆動型アクターやボットの動作を効果的に捉えることができるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:57:14 GMT)
Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis [52.0] Human-Xは、様々な実体をまたいだ没入的で物理的に妥当なヒューマンインタラクションを可能にするために設計された、新しいフレームワークである。
本手法は, 自己回帰型反応拡散プランナを用いて, リアルタイムに反応と反応を同時予測する。
我々のフレームワークは、人間とロボットのインタラクションのための仮想現実インターフェースを含む、現実世界のアプリケーションで検証されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:35:48 GMT)
Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [51.4] 本稿では,外部ツールを使わずにクローズドブック質問応答(QA)の性能を予測することを目的とする。
我々は、21の公開言語と3つのカスタムトレーニングされた大規模言語モデルの事前学習コーパスに対して、大規模な検索と意味解析を行う。
これらの基礎の上に構築されたSMI(Size-dependent Mutual Information)は,事前学習データの特徴を線形に相関させる情報理論の指標である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:05:01 GMT)
CAMERA: Multi-Matrix Joint Compression for MoE Models via Micro-Expert Redundancy Analysis [51.3] MoE(Mixture-of-Experts)を備えた大規模言語モデルは、計算と記憶のオーバーヘッドに悩まされる。
行列にまたがるより微細な圧縮ユニットとしてマイクロエキスパートを導入する。
マイクロエキスパートのための構造化プルーニングフレームワークであるCAMERA-Pと、マイクロエキスパート向けに設計された混合精度量子化アイデアであるCAMERA-Qを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:42:48 GMT)
Core Context Aware Transformers for Long Context Language Modeling [50.8] 高速な長文モデリングのためのCCAアテンションを提案する。
本手法は,学習過程における冗長性を低下させながら,コアコンテキストに自動的に焦点を合わせ,強化する。
提案手法は,既存の大規模言語モデルにおける自己注意モジュールを最小限の微調整コストで置き換えることができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:37:34 GMT)
Don't Overthink It: A Survey of Efficient R1-style Large Reasoning Models [49.6] 大規模共振モデル (LRM) は, 複雑なタスクの処理性能に優れていたため, 徐々に研究ホットスポットになりつつある。
しかし、これらのモデルが広く適用されたことにより、過度に考え直すという問題が徐々に顕在化していった。
モデル性能と推論能力を損なうことなく、推論経路の長さを短縮することを目的とした、様々な効率的な推論手法が提案されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:54:31 GMT)
Listening to the Unspoken: Exploring "365" Aspects of Multimodal Interview Performance Assessment [48.2] インタビューパフォーマンスの365の側面を探求する,斬新で包括的なフレームワークを提案する。
このフレームワークは、不均一なデータストリームをエンコードするために、モダリティ固有の特徴抽出器を使用する。
提案手法は,マルチモーダルデータから暗黙の手がかりと暗黙の手がかりを抽出する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:22:43 GMT)
10K is Enough: An Ultra-Lightweight Binarized Network for Infrared Small-Target Detection [48.1] バイナリ化されたニューラルネットワーク(BNN)は、モデル圧縮における例外的な効率によって区別される。
両立赤外小ターゲット検出ネットワーク(BiisNet)を提案する。
BiisNetは二項化畳み込みのコア操作を保存し、完全精度の機能をネットワークの情報フローに統合する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:30:43 GMT)
After the Party: Navigating the Mapping From Color to Ambient Lighting [48.0] CL3ANは,この種の大規模かつ高解像度なデータセットである。
先導的なアプローチは、照明の不整合、テクスチャリーク、色歪みなどのアーティファクトをしばしば生み出す。
我々は、新しい学習フレームワークを通じて、そのような所望の分解を実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:07:03 GMT)
Controllable and Stealthy Shilling Attacks via Dispersive Latent Diffusion [47.0] 本稿では,拡散型攻撃フレームワークであるDLDAについて述べる。
従来の攻撃に比べ,DLDAはより強力な項目の促進を実現しつつ,検出が困難であることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:54:32 GMT)
Engagement Prediction of Short Videos with Large Multimodal Models [47.0] ビデオエンゲージメント予測のための大規模マルチモーダルモデル(LMM)の可能性について実験的に検討する。
VideoLLaMA2はキービデオフレーム、テキストベースのメタデータ、バックグラウンドサウンドを処理し、Qwen2.5-VLはキービデオフレームとテキストベースのメタデータのみを使用する。
2種類のモデルをアンサンブルすることで,本手法はICCV VQualA 2025 EVQA-SnapUGC Challengeにおいて,短時間のビデオエンゲージメント予測において第一位となる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:21:29 GMT)
Localization of Impacts on Thin-Walled Structures by Recurrent Neural Networks: End-to-end Learning from Real-World Data [46.0] 薄肉構造への影響は、圧電センサで測定できるラム波を励起する。
逐次センサデータから直接、衝撃位置をエンドツーエンドに推定するために、リカレントニューラルネットワーク(RNN)を提案する。
その結果,比較的小さなデータセットであっても,衝撃位置の推定精度は著しく向上した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:17:24 GMT)
Do MLLMs Capture How Interfaces Guide User Behavior? A Benchmark for Multimodal UI/UX Design Understanding [45.8] WeserUI-Benchは、モデルによるUI/UX設計のマルチモーダル理解を評価するための新しいベンチマークである。
現実世界のUIイメージペアは300種類あり、それぞれが実際の企業によって大規模にテストされた2つの設計版A/Bで構成されている。
このベンチマークでは,(1)A/Bテストで検証された勝者を予測することで,より効果的なUI/UX設計を選択すること,(2)モデルの勝者が,専門家の推論に従って,その有効性を説明することができること,の2つのコアタスクをサポートする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:38:49 GMT)
LaMPE: Length-aware Multi-grained Position Encoding for Adaptive Long-context Scaling Without Training [45.7] 大規模言語モデル(LLM)は、入力が事前学習されたコンテキストウインドウを超えると、大幅な性能低下を経験する。
近年の研究では、OOD位置を固定写像戦略で分配範囲に再配置することでこの問題を緩和している。
本研究では,Longth-aware Multi-grained Positional Scaling (LaMPE)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:22:13 GMT)
ETCH: Generalizing Body Fitting to Clothed Humans via Equivariant Tightness [44.8] Equivariant Tightness Fitting for Clothed Humans(ETCH)は、布の表面マッピングを推定する新しいパイプラインである。
CAPEと4D-Dressの実験では、ETCHは最先端の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:17:31 GMT)
CaliDrop: KV Cache Compression with Calibration [44.7] 大規模言語モデル(LLM)は、世代間、かなりの計算資源を必要とする。
このボトルネックを軽減するため、KVキャッシュ圧縮技術が提案されている。
本稿ではトークン排除戦略の強化に焦点をあてる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:19:26 GMT)
Unleashing the Temporal Potential of Stereo Event Cameras for Continuous-Time 3D Object Detection [44.5] イベントカメラは、動きを継続的に捉えて解決策を提供する。
本稿では,イベントカメラのみに依存する新しいステレオ3Dオブジェクト検出フレームワークを提案する。
実験により,本手法は動的環境における従来の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:57:03 GMT)
Large AI Models for Wireless Physical Layer [44.4] 大規模人工知能モデル(LAM)は、堅牢な一般化、マルチタスク処理、マルチモーダル機能を通じて、無線物理層技術を変換している。
本稿では、従来のAIベースのアプローチの限界に対処する物理層通信におけるLAMアプリケーションの最近の進歩についてレビューする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:30:33 GMT)
Generalizing Verifiable Instruction Following [44.0] 人間とAIの相互作用を成功させる重要な要因は、言語モデルが正確に人間の指示に従う能力である。
ほとんどのモデルは、これらの能力をテストするベンチマークから検証可能な制約の小さなセットに強く適合している。
我々は、58の新しい多様で挑戦的なドメイン外制約を一般化した後の正確な命令を評価するために、IFBenchという新しいベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:54:59 GMT)
SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents [43.7] 大規模言語モデル(LLM)ベースのエージェントは、最近、複雑な推論とツールの使用において、環境とのマルチステップのインタラクションを通じて印象的な機能を示した。
これらの軌道にはリッチなフィードバックが含まれており、エージェントを正しい方向に誘導して問題を正しく解くことができる。
モンテカルロ木探索 (MCTS) のような一般的な手法は、探索と搾取を効果的にバランスさせることができるが、それらは様々な軌道間の相互依存を無視している。
エージェントが推論プロセスを反復的に最適化できる自己進化フレームワークSE-Agentを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:51:55 GMT)
Network Embedding with Completely-imbalanced Labels [43.3] 本稿では,2つの新しい半教師付きネットワーク埋め込み手法を提案する。
1つはRSDNEという名前の浅いメソッドで、もう1つは新しいグラフニューラルネットワークのクラスであるRECTである。
いくつかの実世界のデータセットに対する実験結果は,提案手法の優位性を示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:34:07 GMT)
Preserving Topological and Geometric Embeddings for Point Cloud Recovery [43.3] 我々は、サンプリングおよび復元フェーズを通じてこれらの重要な特性を維持する、textbfTopGeoFormer というエンドツーエンドアーキテクチャを提案する。
実験では,従来型および学習型サンプリング/アップ/リカバリアルゴリズムを用いて,環境を包括的に分析する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:21:06 GMT)
Privacy Amplification by Structured Subsampling for Deep Differentially Private Time Series Forecasting [43.1] トレーニングシーケンスモデルにおける構造化サブサンプリングによって達成されるプライバシーの増幅について検討する。
シーケンスモデルの自己教師型トレーニングにおいて,データ拡張がプライバシを増幅する方法を実証する。
実験により,構造化サブサンプリングによる増幅により,厳密な正式なプライバシー保証付き予測モデルのトレーニングが可能であることを実証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:44:01 GMT)
ADformer: A Multi-Granularity Spatial-Temporal Transformer for EEG-Based Alzheimer Detection [42.7] 脳波は、アルツハイマー病(AD)の検出において神経科医を支援する費用効率が高く効率的なツールとして登場した
生の脳波信号から時間的特徴と空間的特徴の両方を捉えるために設計された新しい多粒度時空間変換器であるADformerを提案する。
実験の結果、ADformerは既存の手法を一貫して上回り、被験者レベルのF1スコアは92.82%、89.83%、67.99%、83.98%となっている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:14:54 GMT)
VRBench: A Benchmark for Multi-Step Reasoning in Long Narrative Videos [42.0] 大型モデルの多段階推論能力を評価するために開発されたVRBenchは,最初の長めのナラティブビデオベンチマークである。
ビデオの長さは960本(平均1.6時間)で、人間ラベル付き多段階質問応答ペア8,243本、タイムスタンプ付き推論ステップ25,106本だ。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:11:48 GMT)
Task Scheduling Optimization with Direct Constraints from a Tensor Network Perspective [41.9] 本研究では,量子インスパイアされたテンソルネットワーク技術を用いた産業プラントにおけるタスク最適化手法を提案する。
計算のための3つのアルゴリズムが提示される: 主アルゴリズム、必要最小限の制約のみを加算する反復アルゴリズム、および、反復アルゴリズムと基本的な遺伝的アルゴリズムを組み合わせる遺伝的アルゴリズム。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:20:31 GMT)
XtraGPT: Context-Aware and Controllable Academic Paper Revision via Human-AI Collaboration [41.4] XtraGPTはオープンソースの大規模言語モデル(LLM)の最初のスイートである。
我々は140,000以上の命令-応答ペアで注釈付けされたトップレベルの会場から7,040件の研究論文のデータセットを紹介した。
XtraGPTは、同じスケールのベースラインを著しく上回り、プロプライエタリなシステムの品質にアプローチする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:42:02 GMT)
NeuralOM: Neural Ocean Model for Subseasonal-to-Seasonal Simulation [41.4] 複雑でゆっくり変化するダイナミクスをシミュレートするための一般的なニューラル演算子フレームワークであるNeuralOMを提案する。
我々は,S2S海洋シミュレーションの課題に対してNeuralOMを検証した。
NeuralOMは、最高の性能のベースラインに比べて13.3%低いRMSEを達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:40:55 GMT)
Learning Feasible Quantum States for Quadratic Constrained Binary Optimization Problems [41.2] 我々はQCBOの制約を満たす量子状態の同値重ね合わせを生成する変動的アプローチを開発する。
結果として生じる同値な重ね合わせは、QUBO/QCBOを解く量子アルゴリズムの初期状態として使用できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:44:53 GMT)
Mitigating Attention Hacking in Preference-Based Reward Modeling via Interaction Distillation [40.8] インタラクション蒸留(Interaction Distillation)は、注意レベル最適化によるより適切な嗜好モデリングのための新しいトレーニングフレームワークである。
最先端のRM最適化法と比較して、より安定で一般化可能な報酬信号を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:06:23 GMT)
Taming SAM for Underwater Instance Segmentation and Beyond [40.5] 大規模な水中インスタンスセグメンテーションデータセットであるUIIS10Kを提案する。
次に,水中インスタンスの自動・高精度セグメンテーションのための効率的なモデルであるUWSAMを紹介する。
複数の水中インスタンスデータセット上での最先端手法よりも優れた性能向上を実現し,本モデルの有効性を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:39:01 GMT)
Revisiting Privacy-Utility Trade-off for DP Training with Pre-existing Knowledge [40.4] 異種雑音(DP-Hero)を有する一般微分プライバシーフレームワークを提案する。
DP-Heroでは、DP-SGDの異種バージョンをインスタンス化し、さらにフェデレーショントレーニングに拡張する。
提案するDP-Heroの有効性を検証・説明するための総合的な実験を行い,最新技術と比較するとトレーニング精度が向上した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:57:05 GMT)
Raw Data Matters: Enhancing Prompt Tuning by Internal Augmentation on Vision-Language Models [40.4] AugPT (Augmentation-driven Prompt Tuning) は、自己完結型蒸留方式のプロンプトチューニング手法である。
AugPTは、トレーニングセット内のラベルなし画像に自己教師付き拡張を導入し、コンセンサステストに基づいた新しいゲーティング機構を導入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:59:56 GMT)
Hidden in the Noise: Unveiling Backdoors in Audio LLMs Alignment through Latent Acoustic Pattern Triggers [40.4] HIN(Hidden in the Noise)は、微妙でオーディオ特有の機能を活用するために設計された、新しいバックドアアタックフレームワークである。
HINは、時間的ダイナミクスの変更やスペクトル調整されたノイズの戦略的注入など、生のオーディオ波形に音響的修正を適用している。
音声機能に基づくトリガに対するALLMロバスト性を評価するため、AudioSafeベンチマークを開発し、9つの異なるリスクタイプを評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:15:16 GMT)
Out-of-Distribution Detection: A Task-Oriented Survey of Recent Advances [40.3] Out-of-Distribution(OOD)検出は、トレーニングカテゴリ空間外のテストサンプルを検出することを目的としている。
評価シナリオ,様々な応用,今後の研究方向性について論じる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:43:24 GMT)
CAPO: Towards Enhancing LLM Reasoning through Verifiable Generative Credit Assignment [40.0] RLVR(Reinforcement Learning with Verifiable Rewards)は、ルールベースのバイナリフィードバックを使用することで、LLM(Large Language Models)の推論能力を改善した。
現在のRLVRメソッドは、すべてのレスポンスを単一のアクションとして扱い、トークンに同じ報酬を割り当てる。
この粗い粒度のフィードバックは、正確なクレジット割り当てを妨げ、モデルがどの推論ステップが成功または失敗につながるかを特定するのが難しくなる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:06:08 GMT)
Diagnosing Memorization in Chain-of-Thought Reasoning, One Token at a Time [39.8] 本稿では,覚書レベル同定のための新しいフレームワークSTIMを紹介する。
ローカルな暗記がしばしばエラーの主要な要因であることを示し、間違ったトークンの最大67%に繋がる。
STIMは、モデル推論の診断と改善のための強力なツールを提供し、他の構造化ステップワイズ生成タスクに一般化することができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:06:34 GMT)
HumanDiT: Pose-Guided Diffusion Transformer for Long-form Human Motion Video Generation [39.7] 提案するHumanDiTは,14,000時間の高品質ビデオを含むデータセットに基づいてトレーニングされたポーズ誘導拡散変換器(DiT)ベースのフレームワークである。
HumanDiTは多数のビデオ解像度と可変シーケンス長をサポートし、長いシーケンスのビデオ生成の学習を容易にする。
実験では、様々なシナリオにまたがる長めの、ポーズの正確なビデオを生成する上で、優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:36:34 GMT)
S-RRG-Bench: Structured Radiology Report Generation with Fine-Grained Evaluation Framework [39.5] 胸部X線などの診断画像のための放射線診断レポート生成(RRG)は、臨床とAIの両方において重要な役割を担っている。
従来のフリーテキストレポートは冗長性と一貫性のない言語に悩まされ、臨床的に重要な詳細の抽出が複雑になる。
本稿では、データセット構築、モデルトレーニング、新しい評価フレームワークの導入を含む、S-RRGに対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:49:41 GMT)
CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.1] マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:25:46 GMT)
Dream-to-Recon: Monocular 3D Reconstruction with Diffusion-Depth Distillation from Single Images [39.1] 本研究では,事前学習した2次元拡散モデルと深度予測モデルを用いて,単一画像から合成シーン形状を生成することを提案する。
挑戦的なKITTI-360とデータセットに関する実験は、我々の手法が最先端のベースラインと一致しているか、あるいは性能を上回っていることを示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:43:12 GMT)
On the Discriminability of Self-Supervised Representation Learning [38.6] 自己教師付き学習(SSL)は、最近、様々な視覚的タスクで顕著な成功を収めた。
しかし、差別性という点では、SSLは依然として教師あり学習(SL)と同等ではない。
本稿では,異なるクラスの特徴が十分に分離されていない「群集問題」について論じる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:37:59 GMT)
Explainable AI for Automated User-specific Feedback in Surgical Skill Acquisition [38.4] 人間-AIを用いた手術訓練における説明可能なAI(XAI)によるフィードバックの有効性について検討した。
我々は、従来のビデオベースのコーチングに対するXAI指導によるフィードバックが、タスク結果、認知的負荷、AI支援学習に対する訓練者の認識に与える影響を比較した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:48:44 GMT)
Harnessing Temporal Databases for Systematic Evaluation of Factual Time-Sensitive Question-Answering in Large Language Models [38.1] TDBenchは、タイムセンシティブな質問-回答ペアを体系的に構築する新しいベンチマークである。
時間精度と呼ばれるきめ細かい評価基準は、モデル説明における時間参照の有効性を評価する。
現代のLarge Language Modelsの実験では、スケーラブルで包括的なTSQA評価を実現する方法が示されています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:27:06 GMT)
InfiniteHBD: Building Datacenter-Scale High-Bandwidth Domain for LLM with Optical Circuit Switching Transceivers [37.9] HBD(High-Bandwidth Domains)は、並列処理のような通信集約型並列処理において重要である。
スイッチ中心のHBDはスケールコストを禁ずるが、GPU中心のHBDは深刻な障害伝播に悩まされる。
本稿では,トランシーバレベルにおける接続性と動的スイッチングを統合した,トランシーバ中心のHBDアーキテクチャであるInfiniteHBDを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:36:49 GMT)
Test-Time Model Adaptation for Quantized Neural Networks [37.8] 量子化モデルは、潜在的なドメインシフトを伴う動的環境において、深刻なパフォーマンス劣化に悩まされることが多い。
テスト時間適応(TTA)は、モデルがテストデータから適応的に学習できるようにすることによって、効果的なソリューションとして登場した。
本稿では,2つのフォワードパスのみを用いた効率的なモデル適応を実現するための連続ゼロ階適応(ZOA)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:24:19 GMT)
Beyond the Trade-off: Self-Supervised Reinforcement Learning for Reasoning Models' Instruction Following [37.7] 推論モデルは複雑な問題解決に優れるが、推論能力とそれに続く命令の間のトレードオフを示す。
本稿では,推論モデルの内部信号を利用した自己教師付きRLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:48:59 GMT)
Understanding and Mitigating Political Stance Cross-topic Generalization in Large Language Models [37.4] 政治的トピックに関する微調整された大規模言語モデルは、様々な問題に対する政治的スタンスを著しく制御し、無関係なトピックに対する彼らのスタンスに意図せずに影響を及ぼす。
本稿では、ニューロンレベルで、この現象の根底にある内部メカニズムを体系的に研究する。
InhibitFTは阻害に基づく微調整手法で、横断的姿勢一般化を効果的に緩和する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:49:10 GMT)
Robustly Learning Monotone Generalized Linear Models via Data Augmentation [37.4] テクティタニーモノトンリプシッツ活性化のための定数近似を実現するアルゴリズムを初めて提案する。
我々の研究は、古典的GLMtronアルゴリズムに匹敵する堅牢な手法を開発することで、よく知られたオープンな問題を解決する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:33:25 GMT)
From Pixels to Pathology: Restoration Diffusion for Diagnostic-Consistent Virtual IHC [37.3] 本稿では,仮想染色を画像復元タスクとして再構成する構造対応染色復元拡散モデルであるStar-Diffを紹介する。
残留物とノイズに基づく生成経路を組み合わせることで、スターディフは現実的なバイオマーカーの変動をモデル化しながら組織構造を維持する。
BCIデータセットの実験は、Star-Diffが視覚的忠実度と診断関連性の両方で最先端(SOTA)のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:36:58 GMT)
Efficient Input-level Backdoor Defense on Text-to-Image Synthesis via Neuron Activation Variation [37.1] NaviT2Iは、多様なT2Iバックドアに対する効率的な入力レベルのバックドア防御フレームワークである。
我々のアプローチは、拡散生成過程の初期段階において、トリガートークンが大きなニューロン活性化を誘導する傾向があるという新しい観察に基づいている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:52:57 GMT)
Ref-Long: Benchmarking the Long-context Referencing Capability of Long-context Language Models [36.7] 長文言語モデル(LCLM)は、長文理解タスクにおいて印象的な機能を示した。
長文参照は、LCLMが関心のある項目を長文データの特定の部分に属性付けする必要がある重要なタスクである。
本稿では,LCLMの長文参照能力を評価するための新しいベンチマークであるRef-Longを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:12:15 GMT)
Low-Overhead Transversal Fault Tolerance for Universal Quantum Computation [36.4] 論理演算は一定回数の抽出ラウンドしか持たず、フォールトトレラントに実行可能であることを示す。
我々の研究は、量子フォールトトレランスの理論に新たな光を当て、実用的なフォールトトレラント量子計算の時空コストを1桁以上削減する可能性を持っている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:01:50 GMT)
Uni-Layout: Integrating Human Feedback in Unified Layout Generation and Evaluation [35.9] textitUni-Genは、統一された生成、人間-ミスキングの評価、両者のアライメントを実現する新しいフレームワークである。
textitUni-Genはタスク固有のメソッドと汎用メソッドの両方で大幅にパフォーマンスが向上する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:02:23 GMT)
Quantum Machine Learning-based Test Oracle for Autonomous Mobile Robots [35.7] PAL Robotics (Spain) による自律移動ロボットの回帰テストを支援するためのテストオラクルの開発について報告する。
量子貯水池コンピューティング(QRC)と、残差接続にインスパイアされた単純なニューラルネットワークを組み合わせたハイブリッドフレームワークQuReBotを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:31:08 GMT)
CRINN: Contrastive Reinforcement Learning for Approximate Nearest Neighbor Search [35.1] CRINNは,近似近傍探索(ANNS)アルゴリズムの新しいパラダイムである。
CRINNはANNS最適化を、実行速度が報奨信号となる強化学習問題として扱う。
実験により、CRINNは広範に使用されている6つのNNSベンチマークデータセットに対して有効であることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:57:46 GMT)
PRISON: Unmasking the Criminal Potential of Large Language Models [34.2] 我々は,大言語モデルの犯罪ポテンシャルを,虚偽の声明,フレームアップ,心理的操作,感情の軽視,道徳的拡張の5つの特徴にまたがって定量化する。
その結果、最先端のLLMは、誤解を招く声明や回避戦術の提案など、創発的な犯罪傾向をしばしば示している。
刑事役のモデルでは、平均44%の精度で偽装行為を認識し、犯罪行為の実行と検出の重大なミスマッチを明らかにしている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:15:54 GMT)
Kestrel: 3D Multimodal LLM for Part-Aware Grounded Description [33.6] PPGD(Part-Aware Point Grounded Description)は3次元マルチモーダル学習の高度化を目的とした課題である。
本稿では3DCoMPaT Grounded Instructions (3DCoMPaT-GrIn)データセットについて述べる。
Kestrelは,言語理解のための高度な言語モデルと,多段階の特徴伝搬とクエリ改善機構を融合した,パートアウェアな3Dマルチモーダルな大規模言語モデルである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:54:40 GMT)
Devil is in the Detail: Towards Injecting Fine Details of Image Prompt in Image Generation via Conflict-free Guidance and Stratified Attention [33.5] 大規模テキスト画像拡散モデルにより、テキストプロンプトから高品質で多様な画像を生成することができる。
これらのプロンプトは、テクスチャのような複雑な詳細をキャプチャするのに苦労し、ユーザの意図が反映されるのを防ぐ。
最近の作業では、画像プロンプトからキーと値を置換または連結することにより、生成画像に画像条件を課す自己注意機構を変更する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:48:06 GMT)
FinWorld: An All-in-One Open-Source Platform for End-to-End Financial AI Research and Deployment [33.4] FinWorldは、財務AIワークフロー全体に対するエンドツーエンドのサポートを提供する、オールインワンのオープンソースプラットフォームである。
4つの主要な金融AIタスクに関する総合的な実験を行います。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:02:34 GMT)
PCENet: High Dimensional Surrogate Modeling for Learning Uncertainty [33.3] 本稿では,表現学習と不確実性定量化のための次元還元代理モデリング(DRSM)手法を提案する。
本手法は,1)入力データ分布の低次元表現を学習するために変分オートエンコーダを用い,2)カオス展開(PCE)を利用して低次元分布を出力対象にマッピングする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:32:14 GMT)
All-in-One Transferring Image Compression from Human Perception to Multi-Machine Perception [33.1] 既存のアプローチは、通常、単一のタスクに対して、非効率でタスク間の相互作用が欠如し、複数のタスク固有のビットストリームが生じる、ダウンストリームタスクにlicを適応させる。
本稿では,事前学習したベースを統一モデルと単一学習プロセスを介して,複数のマシンビジョンタスクに転送可能なマルチタスク適応フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:14:27 GMT)
Adaptive Hyper-Graph Convolution Network for Skeleton-based Human Action Recognition with Virtual Connections [32.9] 動作認識のための適応型ハイパーグラフ畳み込みネットワーク(Hyper-GCN)を提案する。
特に、Hyper-GCNはトレーニング中にハイパーグラフを適応的に最適化し、アクション駆動型マルチ頂点関係を明らかにする。
仮想接続をハイパーグラフに注入することで、多様なアクションカテゴリの意味的なヒントが強調される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:32:18 GMT)
Thought Manipulation: External Thought Can Be Efficient for Large Reasoning Models [32.5] 大規模推論モデル(LRM)は、しばしば過度に冗長な推論ステップを生成し、性能の向上が制限されるという過大な問題に悩まされる。
本研究では, LRMが不要な中間ステップを回避し, 計算コストを大幅に削減できる簡易で効率的なパイプライン, Methodを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:34:26 GMT)
TACO: Taming Diffusion for in-the-wild Video Amodal Completion [32.5] 本稿では,ビデオ全体を通して一貫したオブジェクトを生成することを目的とした,ビデオ・アモーダル・コンプリート(VAC)の課題に取り組む。
本稿では,事前学習したビデオ拡散モデルを利用した条件付き拡散モデルTACOを提案する。
TACOの汎用性は、インターネットから広範囲のWildビデオと、自律運転で一般的に使用される多様な未確認データセットで実証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:59:28 GMT)
AutoLoRA: Automatic LoRA Retrieval and Fine-Grained Gated Fusion for Text-to-Image Generation [32.5] 低ランク適応(LoRA)は、最小パラメータオーバーヘッドでモデルのカスタマイズを可能にする効果を実証している。
意味駆動型LoRA検索と動的アグリゲーションを可能にする新しいフレームワークを提案する。
提案手法は画像生成のパーフェマンスを大幅に改善する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:36:00 GMT)
AttriCtrl: Fine-Grained Control of Aesthetic Attribute Intensity in Diffusion Models [32.5] AttriCtrlは、美的属性の正確かつ継続的な制御のためのプラグイン・アンド・プレイフレームワークである。
我々は,事前学習された視覚言語モデルから意味的類似性を活用することで,抽象美学を定量化する。
一般的なオープンソースのコントロール可能な生成フレームワークと完全に互換性がある。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:49:40 GMT)
Clinically Grounded Agent-based Report Evaluation: An Interpretable Metric for Radiology Report Generation [32.4] ICARE (Interpretable and Clinicallygrounded Agent-based Report Evaluation) は、解釈可能な評価フレームワークである。
2つのエージェントは、それぞれが基礎的真実または生成されたレポートを持ち、臨床的に有意義な質問を発生し、互いにクイズする。
スコアを質問応答ペアにリンクすることで、ICAREは透明で解釈可能な評価を可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:28:03 GMT)
Beyond Chunks and Graphs: Retrieval-Augmented Generation through Triplet-Driven Thinking [31.7] Retrieval-augmented Generation(RAG)は、幻覚を減らし、外部知識をLarge Language Models(LLM)に組み込むために重要である。
T$2$RAGは、原子三重項の単純でグラフのない知識ベースで動作する新しいフレームワークである。
実験結果から,T$2$RAGは最先端のマルチラウンド法とグラフRAG法を著しく上回ることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:50:44 GMT)
Skeleton-Guided Learning for Shortest Path Search [31.5] 最短経路探索はグラフベースのアプリケーションにおける中核的な操作である。
汎用グラフ上での最短経路探索のための多目的学習に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:21:52 GMT)
CAAD: Context-Aware Adaptive Decoding for Truthful Text Generation [31.5] 大規模言語モデルに対する文脈対応適応型復号法を提案する。
当社のアプローチは、TrathfulQAで平均2.8%の改善を実現しています。
モデルに依存しない,スケーラブルで,効率的な手法では,1世代パスしか必要としない。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:28:25 GMT)
SplatSSC: Decoupled Depth-Guided Gaussian Splatting for Semantic Scene Completion [31.1] 3Dセマンティックシーンコンプリート(Semantic Scene Completion)は、1つの画像からシーンの密集した幾何学的、意味的な記述を推論することを目的とした、挑戦的で有望なタスクである。
本稿では,これらの制約を,奥行き誘導初期化戦略とガウスアグリゲータにより解決する新しいフレームワークであるSplatSSCを提案する。
提案手法は,Occ-ScanNetデータセット上での最先端性能を実現し,IoUの6.3%,mIoUの4.1%以上の先行手法より優れていた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:09:31 GMT)
PixNerd: Pixel Neural Field Diffusion [30.9] 本稿では、ニューラルネットワークを用いてパッチワイズデコーディングをモデル化し、単一スケール、単一ステージ、効率的、エンドツーエンドのソリューションを提案する。
PixNerdの効率的なニューラルネットワーク表現のおかげで、ImageNetで2.15 FID、ImageNetで2.56times256$、2.84 FIDを、複雑なカスケードパイプラインやVAEなしで直接達成しました。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:46:11 GMT)
MathPhys-Guided Coarse-to-Fine Anomaly Synthesis with SQE-Driven Bi-Level Optimization for Anomaly Detection [30.8] 本研究では,Math-Physモデル誘導による合成異常を生成する,新しい軽量パイプラインを提案する。
本手法は現実的な欠陥マスクを生成し,その後2段階に拡張した。
本手法を検証するために,MVTec AD, VisA, BTADの3つの異常検出ベンチマーク実験を行った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:05:05 GMT)
Friend or Foe? Harnessing Controllable Overfitting for Anomaly Detection [30.8] オーバーフィッティングは伝統的に異常検出の有害と見なされてきた。
本稿では、オーバーフィッティングを戦略的に活用し、異常識別能力を向上する新しいフレームワークである、制御可能なオーバーフィッティングベースの異常検出(COAD)を紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:13:34 GMT)
AnalogCoder-Pro: Unifying Analog Circuit Generation and Optimization via Multi-modal LLMs [30.6] 大きな言語モデル(LLM)はアナログ設計の自動化に新たな約束をもたらした。
本稿では,生成機能と最適化技術を統合する統合フレームワークであるAnalogCoder-Proを提案する。
これらの手法はアナログ回路設計の成功率を大幅に向上し,回路性能を向上することを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:25:48 GMT)
Decomposed Reasoning with Reinforcement Learning for Relevance Assessment in UGC Platforms [30.5] Retrieval-augmented Generation (RAG)は、ユーザ生成コンテンツプラットフォームにおいて重要な役割を果たす。
1)RAGシナリオにおけるユーザフィードバックの少なさによる曖昧なユーザ意図,2)非公式言語や非構造化言語によって導入された相当なノイズ。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:14:09 GMT)
LMAR: Language Model Augmented Retriever for Domain-specific Knowledge Indexing [30.3] Retrieval Augmented Generation (RAG) システムは、事前訓練された埋め込みの性能劣化のためにドメイン固有の知識に苦しむことが多い。
LLM誘導データ合成と対比埋め込み適応と効率的なテキストクラスタリングを組み合わせることで、これらの課題に対処するモデルに依存しないフレームワークであるLMAR(Language Model Augmented Retriever)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:59:43 GMT)
MolReasoner: Toward Effective and Interpretable Reasoning for Molecular LLMs [30.0] MolReasonerは、大規模言語モデルを記憶から化学推論に移行するために設計された2段階のフレームワークである。
まず,GPT-4o で生成した合成Chain-of-Thought(CoT) サンプルを用いてモデルの推論能力を初期化し,化学的精度を検証した Mol-SFT を提案する。
その後、Moll-RLは、化学構造と言語的記述との整合性を明確に設計した特殊報酬関数による強化学習を適用した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:10:11 GMT)
StarPose: 3D Human Pose Estimation via Spatial-Temporal Autoregressive Diffusion [29.7] StarPoseは3次元人間のポーズ推定のための自己回帰拡散フレームワークである。
歴史的3Dポーズの予測と空間的物理的ガイダンスが組み込まれている。
人間の3次元ポーズ推定における精度と時間的一貫性を向上する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:50:05 GMT)
Extrapolation by Association: Length Generalization Transfer in Transformers [29.7] 長さ一般化は関連するタスク間でテキスト転送可能であることを示す。
この結果から, 変圧器モデルでは, 協調学習時に類似タスクから一般化能力を継承できることが示唆された。
長さ一般化の伝達は,タスク間の同一の注目ヘッドの再使用と相関する,初期力学的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:57:32 GMT)
Improving Generalization of Language-Conditioned Robot Manipulation [29.4] いくつかの実演からオブジェクトアレンジメントタスクを学習するフレームワークを提案する。
シミュレーション環境と実世界のロボット環境の両方において,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:29:26 GMT)
Towards Question Answering over Large Semi-structured Tables [29.4] TaDReは、テーブルの分解品質を保証するために、プリテーブルとポストテーブルの分解精細化の両方を組み込んだモデルである。
TaDReは大規模テーブルTableQAタスクで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:27:55 GMT)
Web3 x AI Agents: Landscape, Integrations, and Foundational Challenges [29.3] Web3テクノロジとAIエージェントの収束は、分散化されたエコシステムを再形成する、急速に進化するフロンティアを表している。
本稿では, ランドスケープ, 経済, ガバナンス, セキュリティ, 信頼メカニズムの5つの重要な側面について, Web3 と AI エージェントの交わりについて, 初めてかつ最も包括的な分析を行った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:44:58 GMT)
LOST: Low-rank and Sparse Pre-training for Large Language Models [28.8] 大規模言語モデルでは、スクラッチから事前学習するための計算とメモリのコストが禁じられている。
LLMのためのtextbfLOw-rank と textbfSparse pre-textbfTraining (textbfLOST) を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:58:22 GMT)
Hypercube-Based Retrieval-Augmented Generation for Scientific Question-Answering [28.5] 大きな言語モデル(LLM)は、しばしばテーマ固有の問題を解決するために外部知識を組み込む必要がある。
我々は,文書を予め定義された多次元空間にインデックスし,割り当て可能な多次元(キューブ)構造であるHypercubeを導入する。
高精度かつ効率的な検索のための新しいRAGフレームワークであるHypercube-RAGを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 00:07:30 GMT)
Bench2ADVLM: A Closed-Loop Benchmark for Vision-language Models in Autonomous Driving [28.2] VLM(Vision-Language Models)は、自律運転(AD)において有望なパラダイムとして登場した。
VLMベースのADシステム(ADVLM)の現在の性能評価プロトコルは、静的入力を伴うオープンループ設定に限られている。
シミュレーションと物理プラットフォーム間のリアルタイム・インタラクティブなADVLM評価のための階層型クローズドループ評価フレームワークであるBench2ADVLMを紹介した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:43:23 GMT)
X-Actor: Emotional and Expressive Long-Range Portrait Acting from Audio [27.6] X-アクターは、単一の参照画像と入力オーディオクリップから、生き生きとした感情的に表現された音声ヘッドビデオを生成する。
視覚的・アイデンティティ的手がかりから切り離されたコンパクトな顔動作潜時空間で操作することにより、自己回帰拡散モデルは、音声と顔の動きの長距離相関を効果的に捉えることができる。
X-Actorは、標準的なトーキングヘッドアニメーションを超越した、魅力的なシネマティックなパフォーマンスを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:57:01 GMT)
JustDense: Just using Dense instead of Sequence Mixer for Time Series analysis [27.3] シーケンスモデルのコアメカニズムであるシーケンスとチャネルミキサーは、時系列解析におけるデファクトスタンダードとなっている。
我々は,様々な確立されたTSAモデルの配列ミキサーを高密度層で体系的に置き換える実験的な研究であるJustDenseを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:49:09 GMT)
Inference-time Scaling for Diffusion-based Audio Super-resolution [27.2] 拡散モデルは、音声超解像(SR)を含む生成タスクにおいて顕著な成功を収めた。
本稿では,サンプリング過程における複数の解軌跡を探索するSRの推論時間スケーリングを通じて,異なるパラダイムを提案する。
検証とアルゴリズムの組み合わせによって高次元の解空間の探索を積極的に導くことで、より堅牢で高品質な出力を可能にします。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:17:49 GMT)
Instance-Dependent Continuous-Time Reinforcement Learning via Maximum Likelihood Estimation [27.2] 連続時間強化学習(CTRL)は、動的環境におけるシーケンシャルな意思決定のための自然な枠組みを提供する。
経験的成功の度合いは高まっているが、様々なレベルの問題に適応する能力はいまだに理解されていない。
本研究では,最大推定値に基づいて構築されたモデルに基づく簡易アルゴリズムのインスタンス依存挙動について検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:25:45 GMT)
DIP: Unsupervised Dense In-Context Post-training of Visual Representations [26.8] DIPは、コンテキスト内シーン理解のための大規模事前学習型視覚エンコーダにおける濃密な画像表現を強化するために設計された、教師なしのポストトレーニング手法である。
擬似的なコンテキスト内タスクを通じて密表現を学習することにより、さまざまな下流現実世界のコンテキスト内シーン理解タスクに対して強いパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:42:54 GMT)
NaviMaster: Learning a Unified Policy for GUI and Embodied Navigation Tasks [26.7] NaviMasterは、GUIナビゲーションと組み込みナビゲーションをシームレスに単一のフレームワークに統合できる最初の統合エージェントである。
NaviMasterは,GUIナビゲーション,空間空き時間予測,具体化ナビゲーションにおいて,最先端のエージェントよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:28:18 GMT)
A Comprehensive Review of Diffusion Models in Smart Agriculture: Progress, Applications, and Challenges [26.7] 本稿では,農業における拡散モデルの適用の最近の進歩を概観する。
作物病や害虫検出、リモートセンシング画像強調、作物の生育予測、農業資源管理における役割に重点を置いている。
計算効率と領域一般化の継続的な課題にもかかわらず、拡散モデルは知的農業の将来においてますます重要な役割を果たすことが期待されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:25:00 GMT)
Seemingly Simple Planning Problems are Computationally Challenging: The Countdown Game [26.7] 本稿では,Countdownと呼ばれるゲームを中心とした計画ベンチマークを作成する手順を提案する。
本稿では,この課題が,計画能力評価のための理想的なベンチマークと関連するデシラタの多くにどのように適合するかを論じる。
その結果、24 Game(Countdownの特殊な場合)のような他の領域とは異なり、提案した動的ベンチマークは既存のLCMベースのアプローチでは極めて困難であることが判明した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:01:03 GMT)
DreamVVT: Mastering Realistic Video Virtual Try-On in the Wild via a Stage-Wise Diffusion Transformer Framework [26.7] VVT(Virtual try-on)技術は、eコマース広告やエンターテイメントに将来性があるとして、学術的な関心を集めている。
本研究では,現実のシナリオにおける適応性を高めるために,多種多様な人間中心データを活用することが可能なDreamVVTを提案する。
第1段階では、入力ビデオから代表フレームをサンプリングし、視覚言語モデル(VLM)と統合された多フレーム試行モデルを用いて、高忠実で意味論的に整合した試行画像を合成する。
第2段階では、微粒な動きと外観記述とともに骨格図が作成される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:27:55 GMT)
Scaling Artificial Intelligence for Prostate Cancer Detection on MRI towards Population-Based Screening and Primary Diagnosis in a Global, Multiethnic Population (Study Protocol) [26.5] 我々はMRIでGleasonグレードグループ$geq$2前立腺癌を検出するためにPI-CAI-2Bモデルを訓練・外部検証した。
22,481件のMRI検査のうち、20,471件(19,278件)が2つのEUホライゾンプロジェクトのトレーニングと内部検査に使用されている。
第一のエンドポイントは、医療診断の標準と一致したAIベースの評価の割合である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:39:31 GMT)
IMoRe: Implicit Program-Guided Reasoning for Human Motion Q&A [25.9] 本稿では,プログラム誘導型動作推論(IMoRe)フレームワークを提案する。
予め訓練されたモーション・ビジョン・トランス(ViT)から動的にマルチレベル・モーション・表現を選択するプログラム誘導型読み出し機構を導入する。
本モデルは,Babel-QA上での最先端性能を実現し,Hummanに基づく新たな動作Q&Aデータセットに一般化する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:44:41 GMT)
VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo [25.9] 大規模言語モデル(LLM)のトレーニングフレームワークであるveomniを紹介する。
veomniはモデル中心の分散レシピを導入し、Omni-modal LLM上で効率的な3D並列化を可能にする。
veomniはまた、最小限のコード変更で新しいモダリティのシームレスな統合をサポートするフレキシブルな設定インターフェイスも備えている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:33:04 GMT)
Enhanced metrology based on flipping trajectory of cold Rydberg gases [25.8] 散逸性Rydberg多体系の軌道はマイクロ波駆動下で反転することができ、感度が向上した。
これは、折り畳まれた軌道の交叉が相転移付近で鋭いピークを示し、マイクロ波場の小さな変化に対する応答を増幅するためである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:29:59 GMT)
ActAlign: Zero-Shot Fine-Grained Video Classification via Language-Guided Sequence Alignment [25.7] 本稿では,シーケンスアライメント問題としてビデオ分類を定式化する,ゼロショットのトレーニング不要なActAlignを提案する。
各クラスに対して、大規模言語モデル(LLM)は順序付けられたサブアクション列を生成し、共有埋め込み空間における動的時間ワープ(DTW)を用いてビデオフレームと整合する。
提案手法は,従来のアライメント手法と組み合わされた構造化言語が,微細な映像理解のために,画像言語モデルのオープンセット認識能力を解き放つことを実証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:54:44 GMT)
Eyes Will Shut: A Vision-Based Next GPS Location Prediction Model by Reinforcement Learning from Visual Map Feed Back [25.5] 次の位置予測は、人間の移動性の研究における基本的な課題である。
VLM(Vision-Language Models)の最近の開発は、視覚知覚や視覚的推論において強力な能力を示している。
第1段階では,道路ネットワークと軌道構造を理解するのに役立つ2つのスーパービジョンファインチューニングタスクを設計する。
第2段階では、ビジュアルマップフィードバックからの強化学習を導入し、モデルが次の位置予測能力を自己改善できるようにする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:39:40 GMT)
Reconsidering Overthinking: Penalizing Internal and External Redundancy in CoT Reasoning [25.3] 大きな推論モデル(LRM)は、しばしば冗長な推論トレースを生成する。
本稿では、過度な思考を緩和する双対費用強化学習フレームワークを提案する。
提案手法は,最小の精度で推理トレースを圧縮する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:22:14 GMT)
A Survey on AgentOps: Categorization, Challenges, and Future Directions [25.0] 本稿ではエージェントシステムオペレーション(AgentOps)と呼ばれるエージェントシステムのための新しい包括的な運用フレームワークを紹介する。
モニタリング,異常検出,根本原因分析,解決の4つの重要な段階について,詳細な定義と説明を行う。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:59:36 GMT)
CellForge: Agentic Design of Virtual Cell Models [24.9] 本稿では,提示された生物データセットを仮想セルの最適化された計算モデルに変換するエージェントシステムであるCellForgeを紹介する。
このフレームワークは、タスク分析、メソッド設計、実験実行の3つのコアモジュールを統合している。
単一セル摂動予測におけるCellForgeの機能を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:43:31 GMT)
UrbanSense:A Framework for Quantitative Analysis of Urban Streetscapes leveraging Vision Large Language Models [24.7] 都市文化と建築様式は、地理的、年代学的、歴史的、社会政治的な要因により、都市によって大きく異なる。
本稿では,視覚言語モデルに基づくマルチモーダル・リサーチ・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:56:54 GMT)
CCSBench: Evaluating Compositional Controllability in LLMs for Scientific Document Summarization [24.5] CCSBenchは、科学領域における制御可能な合成要約のための最初の評価ベンチマークである。
私たちのベンチマークでは、明示的な属性(長さなど)と暗黙的な属性(概念的あるいは経験的焦点など)の両方をきめ細かな制御が可能です。
各種大規模言語モデル (LLM) を用いて, コンテキスト内学習, パラメータ効率の微調整, 異なる属性に対する制御のバランスをとるための2段階のモジュラー手法など, 様々な条件下で実験を行う。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:11:45 GMT)
FinCPRG: A Bidirectional Generation Pipeline for Hierarchical Queries and Rich Relevance in Financial Chinese Passage Retrieval [24.4] 本稿では,doc内およびクロスdoc内の両方のシナリオに対して,3段階の階層型クエリを生成することを目的とした双方向生成パイプラインを提案する。
我々は、約1.3万の中国の金融調査レポートから、金融パス検索検索データセットを構築した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:12:45 GMT)
TrackletGait: A Robust Framework for Gait Recognition in the Wild [24.4] 歩行認識は、身体の形状と歩行パターンに基づいて個人を識別することを目的としている。
本稿では,これらの課題に対処するための新しいフレームワークであるTrackletGaitを提案する。
TrackletGaitは、Gait3DデータセットとGREWデータセットでそれぞれ77.8と80.4のランク-1の精度で最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:43:04 GMT)
AudioGen-Omni: A Unified Multimodal Diffusion Transformer for Video-Synchronized Audio, Speech, and Song Generation [24.2] AudioGen-Omniは、入力されたビデオとコヒーレントに同期した高忠実な音声、音声、歌を生成する。
ジョイントトレーニングパラダイムは、大規模ビデオテキストオーディオコーパスを統合している。
密度フレームレベルの表現は、AdaLNベースのジョイントアテンション機構を用いて融合する。
推測時間は8秒間1.91秒であり、効率と一般性の両方で大幅に改善されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:11:26 GMT)
Compressing KV Cache for Long-Context LLM Inference with Inter-Layer Attention Similarity [24.1] textscPoDはトークンの重要度に応じてメモリを割り当てる。
textscPoDは、パフォーマンスを損なうことなく、KVキャッシュメモリ使用量を最大35%削減する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:17:56 GMT)
Scalable Graph Condensation with Evolving Capabilities [24.0] 下流タスクを高速化するグラフ凝縮法 (GC) が提案されている。
既存のアプローチは、現実のグラフデータの本質的動的で進化的な性質と矛盾する静的なトレーニングセットを批判的に仮定する。
この研究は連続グラフ凝縮のための新しいフレームワークを導入し、コストのかかる再学習を必要とせず、蒸留グラフの効率的な更新を可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:01:02 GMT)
Parameter-Efficient Routed Fine-Tuning: Mixture-of-Experts Demands Mixture of Adaptation Modules [23.9] Mixture-of-Experts (MoE)は、専門家の動的ルーティングメカニズムの恩恵を受ける。
適応モジュール自体がMOEのマルチエキスパートアーキテクチャに合わせてルーティング機構を組み込むべきかを検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:43:09 GMT)
"Stack It Up!": 3D Stable Structure Generation from 2D Hand-drawn Sketch [23.7] 非専門家が複雑な3D構造を指定できるシステムStackItUpを提案する。
安定かつ多レベルな3D構造を生成し、安定性と視覚的類似性の両方において全てのベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:04:35 GMT)
REFLECT: Rectified Flows for Efficient Brain Anomaly Correction Transport [23.6] 脳画像における教師なし異常検出(UAD)は、ラベル付きデータを必要としない病理の同定に不可欠である。
本稿では, 直流を利用した新しいフレームワークREFLECTを紹介し, 異常なMR画像の修正のための直線的直線軌道の確立について述べる。
本手法は,脳の異常を効率よく補正し,異常入力と異常入力の一致を検出することによって,異常を正確に特定することができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:35:19 GMT)
PIGDreamer: Privileged Information Guided World Models for Safe Partially Observable Reinforcement Learning [23.4] エージェントの安全性と性能を高めるために特権情報を活用するモデルに基づく安全強化学習手法を提案する。
実験の結果,提案手法は既存の手法よりも安全性やタスク中心のパフォーマンスにおいて著しく優れていたことが確認された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:01:19 GMT)
EASG-Bench: Video Q&A Benchmark with Egocentric Action Scene Graphs [23.1] EAS-GBenchは,エゴセントリックビデオの質問応答ベンチマークである。
本ベンチマークでは,複数の言語のみのビデオ大言語モデル(ビデオLLM)を評価した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:48:35 GMT)
Semi-Supervised Dual-Threshold Contrastive Learning for Ultrasound Image Classification and Segmentation [22.0] 本稿では,Hermes という超音波画像分類とセグメンテーションのための,新しい半教師付き2次元コントラスト学習手法を提案する。
具体的には、セグメンテーションと分類タスク間の情報共有を容易にするために、タスク間注意・衛生モジュールも開発されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:15:53 GMT)
MedVLThinker: Simple Baselines for Multimodal Medical Reasoning [21.8] MedVLThinkerは、推論中心の医療用LMMを構築するための、シンプルだが強力なベースラインのスイートである。
完全オープンなレシピは,(1) テキストのみとイメージテキストの両方の医療データに対する体系的なデータキュレーション,(2) 推論の難易度に応じてフィルタリング,(2) 学習パラダイム: 蒸留された推論トレースの超微調整(SFT) および最終回答の正しさに基づく強化学習(RLVR) から構成される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:59:38 GMT)
Towards Stealthy and Effective Backdoor Attacks on Lane Detection: A Naturalistic Data Poisoning Approach [21.7] ディープラーニングに基づく車線検出は、自動運転と運転支援システムにおいて重要な役割を果たす。
LDの既存のバックドア攻撃法は、トリガーの人工的かつ顕著な性質のために、限られた実用性を示すことが多い。
自然主義的なバックドアトリガを生成するための新しい拡散型データ中毒フレームワークDBALDを紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:13:18 GMT)
VSA: Faster Video Diffusion with Trainable Sparse Attention [21.6] ビデオ拡散トランス (DiTs) のスケーリングは、注意質量の大部分が少数の位置に集中しているにもかかわらず、2次元の注意によって制限される。
私たちはこの観察を、トレーニング可能なハードウェア効率の良いスパースアテンションであるVSAに変換し、Emphbothのトレーニングと推論の完全なアテンションを置き換える。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:20:16 GMT)
On-the-Fly Object-aware Representative Point Selection in Point Cloud [21.6] 本稿では,点群ダウンサンプリングのための代表的点選択フレームワークを提案する。
提案手法は,有効性と有効性の両方において,最先端のベースラインを一貫して上回ることを示す。
モデルに依存しないソリューションとして、我々のアプローチは様々な下流モデルとシームレスに統合されます。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:39:09 GMT)
MixNet: A Runtime Reconfigurable Optical-Electrical Fabric for Distributed Mixture-of-Experts Training [21.5] Mixture-of-Expert (MoE) モデルは、Emphexperts という名前の異なるモデルをtoken ベースで選択的に活性化することで、従来のモデルより優れている。
このゲート計算は、事前に決められない動的通信を生成し、分散トレーニングプロセスの間、静電的な既存のGPUインターコネクトに挑戦する。
我々は,分散MoEトレーニングを取り入れたトポロジ再構成をアンロックする,mFabricと呼ばれる第一種システムを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:28:28 GMT)
QuaDreamer: Controllable Panoramic Video Generation for Quadruped Robots [21.4] QuaDreamerは四足歩行ロボット用に設計された最初のパノラマデータ生成エンジンである。
ジッタ信号制御下での高品質パノラマ映像生成を容易にするために,SOC(Scene-Object Controller)を提案する。
生成されたビデオシーケンスは、四足歩行ロボットのパノラマ視覚知覚モデルのトレーニングデータとして機能する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:18:01 GMT)
Model Recycling Framework for Multi-Source Data-Free Supervised Transfer Learning [21.3] パラメータ効率のトレーニングモデルのためのモデルリサイクルフレームワークを提案する。
私たちのフレームワークは、モデル・アズ・ア・サービス(M)プロバイダが効率的な事前訓練済みモデルのライブラリを構築することを可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:11:40 GMT)
FastCSP: Accelerated Molecular Crystal Structure Prediction with Universal Model for Atoms [21.2] FastCSPは、機械学習の原子間ポテンシャルに基づくオープンソースのCrystal Structure Predictionワークフローである。
FastCSPは、既知の実験構造を一貫して生成し、それらを世界最小の分子あたり5kJ/molにランク付けする。
その結果,MLIPはシステム固有のチューニングを必要とせず,多様な化合物にまたがって利用できることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:25:55 GMT)
A Multimodal Deviation Perceiving Framework for Weakly-Supervised Temporal Forgery Localization [21.1] 本研究は,時間的偽造の局所化を弱めるための枠組みを提案する。
ビデオレベルのアノテーションのみを使用して、時間的部分的な鍛造セグメントを特定することを目的としている。
大規模な実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:10:14 GMT)
HOLa: Zero-Shot HOI Detection with Low-Rank Decomposed VLM Feature Adaptation [21.1] ゼロショット人物体相互作用検出の新しいアプローチであるHOLa(Zero-Shot HOI Detection with Low-Rank Decomposed VLM Feature Adaptation)を導入する。
トレーニングでは、HOLaは低ランク因子化によって与えられたHOIクラスのVLMテキスト機能を分解し、クラス共有ベースの特徴と適応可能な重みを生成する。
我々は、各HoIクラスに重みを適応させ、視覚的相互作用表現を豊かにするために人物トークンを導入することで、アクションの区別を洗練する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:28:09 GMT)
RICL: Adding In-Context Adaptability to Pre-Trained Vision-Language-Action Models [20.8] VLA(Multi-task vision-action')モデルは、ロボティクスのジェネラリスト基盤モデルとして、近年の公約を実証している。
そのようなモデルが本当に有用であるためには、エンドユーザは簡単に改善を教える手段を持っていなければなりません。
言語モデルや視覚モデルでは、コンテキスト内学習(ICL)を実行する能力は、新しいタスクを簡単に教えるための汎用的なインターフェースであることが証明されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:01:11 GMT)
LatentPrompt: Optimizing Promts in Latent Space [20.8] 本稿では,迅速な最適化のためのモデルに依存しないフレームワークであるLatentPromptを紹介する。
提案手法は,連続的な潜伏空間にシードプロンプトを埋め込み,タスク固有の性能を最大化するプロンプトを特定するために,この空間を体系的に探索する。
ファイナンシャル・プリースバンクの格付け基準に関する概念実証調査において、LatentPromptは単一最適化サイクルの後に、分類精度を約3%向上させた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:17:29 GMT)
Instance-Optimal Uniformity Testing and Tracking [20.7] 本稿では,一様性追跡の問題を導入し,一様性から偏差を検出するアルゴリズムを提案する。
我々の主な貢献は$operatornamepolylog(operatornameopt)$-competitive uniformity tracking algorithmである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:23:00 GMT)
Learning from Negative Samples in Biomedical Generative Entity Linking [20.7] 陰性サンプルを用いて生成BioELモデルをトレーニングする最初のフレームワークであるANGELを紹介する。
我々のモデルは5つのベンチマークで平均1.4%の精度で以前の最高のベースラインモデルより優れています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:11:24 GMT)
A French Version of the OLDI Seed Corpus [20.6] WMT 2025オープン言語データイニシアチブ(OLDI)の共通課題であるOLDIシードコーパスのフランスにおける最初の分割について紹介する。
複数の機械翻訳システムと、有能なネイティブスピーカーによる後編集のためのカスタムインターフェースを用いた作成プロセスについて詳述する。
このフランスのコーパスは、未資源のフランスの地域言語のための並列コーパスの収集を促進するための重要な鍵となる資源として意図されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:57:54 GMT)
On the Generalization vs Fidelity Paradox in Knowledge Distillation [20.6] 知識蒸留(KD)は、大きな言語モデルを小さな言語に圧縮し、性能を保ちながら圧縮する技術である。
0.5B から 7B までの範囲で KD の大規模および統計的解析を行った。
以上の結果から,KD は小型モデルの平均性能を最大10% 向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:03:51 GMT)
"Harmless to You, Hurtful to Me!": Investigating the Detection of Toxic Languages Grounded in the Perspective of Youth [20.6] 青少年特有の毒性、すなわち、大人によって非毒性とみなされる言語について検討するが、若年者は有害である。
以上の結果から,これらに対する若者の認識は,いくつかの文脈要因と関連していると考えられる。
若年者中心の毒性検出に関する今後の研究について,いくつかの知見を提示する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:05:36 GMT)
Learning to Evolve: Bayesian-Guided Continual Knowledge Graph Embedding [20.5] 連続知識グラフ埋め込み(CKGE)に直面する主な課題は、モデルが「破滅的な忘れ物」になりがちであることである。
この問題を効果的に軽減するために,新しいCKGEモデルBAKEを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:46:33 GMT)
ParetoHqD: Fast Offline Multiobjective Alignment of Large Language Models using Pareto High-quality Data [20.4] 多目的アライメントアルゴリズムは高い性能と効率を示している。
不適切な選好表現と不均衡報酬スコアによるトレーニングは、そのようなアルゴリズムの性能を制限する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:34:17 GMT)
One Trigger Token Is Enough: A Defense Strategy for Balancing Safety and Usability in Large Language Models [20.4] 大規模言語モデル(LLM)は、仮想アシスタント、自動コード生成、科学研究など、さまざまな領域で広く使われている。
我々は,与えられた安全対応LLMの安全トリガトークンを識別し,明示的に復号する,シンプルで効果的な防衛アルゴリズムであるtextttD-STT を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:22:49 GMT)
3D-CDRGP: Towards Cross-Device Robotic Grasping Policy in 3D Open World [20.4] デバイス間の研究は緊急の課題となり、取り組まなければならない。
私たちは、3Dオープンワールドにおけるクロスデバイス(カメラとロボティクス)の把握政策の先駆者です。
SSGC-Segモジュールは,カテゴリに依存しない3Dオブジェクト検出を可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:56:43 GMT)
Learning in Structured Stackelberg Games [20.4] 構造化されたStackelbergゲームについて検討し、両プレイヤーがプレイ時の世界の状況に関する文脈情報を観察する。
我々は、文脈情報とフォロワーのタイプの間に固定的な関係を仮定する。
本研究は,学習課題の難しさを特徴付けるものではないことを示唆する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:51:59 GMT)
Evaluation of 3D Counterfactual Brain MRI Generation [20.3] 我々は6つの生成モデルを因果グラフに基づく解剖誘導フレームワークを組み込むことにより、3次元の対物的アプローチに変換する。
以上の結果より, 解剖学的条件付けが目的の解剖学的領域の調整に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:20:59 GMT)
CodeIF: Benchmarking the Instruction-Following Capabilities of Large Language Models for Code Generation [20.0] タスク指向の命令に準拠する大規模言語モデル(LLM)の能力を評価するために設計された最初のベンチマークであるCodeIFを紹介する。
CodeIFは関数合成、アルゴリズム命令、コード説明など幅広いタスクを含んでいる。
我々はLLMによる広範囲な実験を行い、これらの課題の要求を満たす上での強みと限界を分析した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:46:55 GMT)
Breaking the Top-$K$ Barrier: Advancing Top-$K$ Ranking Metrics Optimization in Recommender Systems [19.9] NDCG@$K$ランキングメトリクスは、レコメンデーションパフォーマンスを評価するためのゴールドスタンダードです。
我々は、NDCG@$K$最適化に適した新しいレコメンデーション損失であるSoftmaxLoss@$K$を提案する。
4つの実世界のデータセットと3つのレコメンデーションバックボーンの実験は、SL@$K$が既存の損失を6.03%の顕著な平均改善で上回っていることを示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:50:02 GMT)
Mix-LN: Unleashing the Power of Deeper Layers by Combining Pre-LN and Post-LN [19.8] Mix-LNは、Pre-LNとPost-LNの強度を同じモデルで組み合わせた新しい正規化手法である。
70Mから7Bまでの様々なモデルサイズの実験では、Mix-LNはPre-LNとPost-LNの両方で一貫して優れていた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:49:54 GMT)
D-Judge: How Far Are We? Evaluating the Discrepancies Between AI-synthesized Images and Natural Images through Multimodal Guidance [19.8] 視覚的に魅力的なコンテンツを生成する高度なAI生成モデルにもかかわらず、自然画像と比較して大きな違いは残る。
5,000の自然画像と440,000以上のAI生成画像(AIGI)からなる,DANIという大規模マルチモーダルデータセットを構築した。
そして、D-Judgeという重要な疑問に答えるために設計されたベンチマークを紹介します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:47:24 GMT)
CauKer: classification time series foundation models can be pretrained on synthetic data only [19.4] CauKerは、現実的な傾向、季節性、非線形相互作用を持つ多様で因果的に一貫性のある合成時系列を生成するように設計されている。
実験の結果,CauKerの生成したデータセットは,データセットサイズ(10Kから10Mサンプル)とモデルキャパシティ(1Mから783Mパラメータ)の両方に対して明確なスケーリング則を示すことがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:18:31 GMT)
Traffic-R1: Reinforced LLMs Bring Human-Like Reasoning to Traffic Signal Control Systems [18.6] Traffic-R1は、TSCシステムの人間ライクな推論のための基礎モデルである。
ゼロショットの一般化、新しい道路網への移行、アウト・オブ・ディストリビューションのインシデントを提供する。
モバイルクラスのチップ上でのリアルタイム推論には十分軽量である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:25:19 GMT)
Manifold-regularised Large-Margin $\ell_p$-SVDD for Multidimensional Time Series Anomaly Detection [18.3] 我々は $ell_p$-SVDD 法の多様体正規化変種を定式化し、下層の多様体上でラベルの滑らかさを促進する。
本稿では,その一般化性能を解析するために,Radecher複素量を用いた提案手法を理論的に検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:01:03 GMT)
PoseGuard: Pose-Guided Generation with Safety Guardrails [18.2] PoseGuardは、ポーズ誘導世代のための安全アライメントフレームワークである。
悪意あるポーズに遭遇した際の出力品質を低下させることで、安全でない世代を抑えるように設計されている。
良性入力のための高忠実度出力を維持する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:42:20 GMT)
Refined Policy Distillation: From VLA Generalists to RL Experts [18.2] 本稿では,新しい強化学習型政策精錬法であるRefined Policy Distillation (RPD)を紹介する。
RPDはVision-Language-Action Models (VLA) を、コンパクトで高性能な専門家ポリシーに精錬・精錬する。
実験結果から,RL の学生は VLA の教師に対して,高密度かつ疎度な報酬設定で優れた専門家ポリシーを学習することができることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:25:44 GMT)
An Electrocardiogram Foundation Model Built on over 10 Million Recordings with External Evaluation across Multiple Domains [17.8] ECG Foundation Model (ECGFounder)は、Harvard-Emory ECG Databaseから150のラベルカテゴリを持つ1000万以上のECGをトレーニングしている。
ECGFounderは内部検証セットのエキスパートレベルのパフォーマンスを達成し、AUROCは80の診断で0.95を超えている。
微調整されたECGFounderは、人口統計分析、臨床イベント検出、心拍数横断診断においてベースラインモデルを上回っている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:31:10 GMT)
Weakly Supervised Multimodal Temporal Forgery Localization via Multitask Learning [17.8] ディープフェイクビデオは信頼の危機を引き起こし、社会の安定を損なう。
本稿では,マルチタスク学習による多モーダル時間的フォージェリーローカライゼーションの弱化を提案する。
広汎な実験によりWS-MTFLにおけるマルチタスク学習の有効性が示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:22:39 GMT)
Attack Anything: Blind DNNs via Universal Background Adversarial Attack [17.7] ディープニューラルネットワーク(DNN)は、敵の摂動に感受性があり、弱いことが広く実証されている。
本稿では,攻撃効果を多種多様な対象,モデル,タスク間でよく一般化する,攻撃の背景攻撃フレームワークを提案する。
我々は,様々な対象,モデル,タスクにまたがるデジタルドメインと物理ドメインの両方において,包括的かつ厳密な実験を行い,提案手法のあらゆる攻撃の有効性を実証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:34:44 GMT)
Risk-averse learning with delayed feedback [17.6] 遅延したフィードバックは、リスクを効果的に評価し、管理することを困難にします。
我々は,一点最適化と二点ゼロ階最適化に頼った2つのリスク逆学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:00:13 GMT)
Tackling Ill-posedness of Reversible Image Conversion with Well-posed Invertible Network [17.4] 可逆画像変換(RIC)は、その前方変換プロセスが過度に決定されたシステムであると考えられるため、不適切な問題に悩まされる。
非ゼログラム決定式を用いた過度決定系を構築することにより、過度決定系に対する信頼性の高い近似左逆法を開発する。
この原理に基づいて,確率変数サンプリングへの依存を解消する逆転型1時間1$畳み込み (WIC) を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:40:01 GMT)
Entity Representation Learning Through Onsite-Offsite Graph for Pinterset Ads [17.3] 我々は,ユーザのオンサイトおよびオフサイト変換活動に基づく大規模異種グラフを開発する。
我々は,新しい知識グラフ埋め込み(KGE)モデルであるTransRAを導入し,グラフ埋め込みをより効率的にAdsランキングモデルに統合する。
我々はClick-Through Rate (CTR) とConversion Rate (CVR) の予測モデルにおいて重要なAUCリフトを観測する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:00:53 GMT)
WhiSQA: Non-Intrusive Speech Quality Prediction Using Whisper Encoder Features [17.3] ASRモデルから抽出した特徴表現に基づいて,新規でロバストなSQ予測器を提案する。
提案手法は,NISQA テストセットの最近の手法よりも,ヒトの MOS 評価との相関性が高い。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:01:07 GMT)
It's High Time: A Survey of Temporal Question Answering [17.1] TQA(Temporal Question Answering)は、時間的制約や文脈に関する質問に答えることに焦点を当てている。
ニューラルモデルと大規模言語モデル(LLM)によるTQAの最近の進歩
時間的堅牢性、傾向認識、一般化をテストするために設計されたベンチマークデータセットと評価戦略。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:52:16 GMT)
CLIP-IN: Enhancing Fine-Grained Visual Understanding in CLIP via Instruction Editing Data and Long Captions [17.1] CLIP-IN(CLIP-IN)は、2つのコアイノベーションを通じてCLIPの微粒な認識を促進する新しいフレームワークである。
まず、画像操作用に設計された命令編集データセットを、ハードネガティブな画像テキストペアのユニークな情報源として活用する。
第二に、CLIP-INは長いキャプションを組み込み、回転する位置エンコーディングを利用して、標準のCLIPでしばしば見逃されるリッチなセマンティックコンテキストをキャプチャする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:57:10 GMT)
Revitalizing Canonical Pre-Alignment for Irregular Multivariate Time Series Forecasting [17.0] IMTS予測のためのCanonical Pre-Alignment(CPA)に基づくコンパクトアーキテクチャであるKAFNetを提案する。
KAFNetは7.2$times$パラメータ削減と8.4$times$トレーニング推論アクセラレーションによって最先端の予測性能を達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:07:24 GMT)
HealthFlow: A Self-Evolving AI Agent with Meta Planning for Autonomous Healthcare Research [17.0] 私たちは、新しいメタレベルの進化メカニズムを通じて制限を克服する、自己進化型AIエージェントであるHealthFlowを紹介します。
HealthFlowは、手続き的な成功と失敗を永続的で戦略的知識基盤に蒸留することで、独自のハイレベルな問題解決ポリシーを自律的に洗練する。
私たちの実験では、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを実証しています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:08:47 GMT)
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind [17.0] 我々は農業リモートセンシング(RS)のベンチマークであるAgroMindを紹介する。
AgroMindは、空間知覚、オブジェクト理解、シーン理解、シーン推論の4つのタスクディメンションをカバーしている。
AgroMind上で20のオープンソースLMMと4つのクローズドソースモデルを評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:50:17 GMT)
Realizing Scaling Laws in Recommender Systems: A Foundation-Expert Paradigm for Hyperscale Model Deployment [16.9] 本稿では,超大規模レコメンデーションFMの開発と展開を目的としたフレームワークを提案する。
提案手法では, 生涯にわたる, クロスサイト, マルチモーダルなユーザデータに基づいて, 一般化可能な知識を学習する。
この知識は、ターゲット認識の埋め込みを通じて、様々な軽量で表面特異的なエキスパートモデルに効率的に転送される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:03:13 GMT)
SpikeSTAG: Spatial-Temporal Forecasting via GNN-SNN Collaboration [16.8] スパイキングニューラルネットワーク(SNN)は、時間データの複雑さを捉えるためのユニークなアプローチを提供する。
本稿では,グラフ構造学習とスパイクに基づく時間的処理をシームレスに統合する,新しいSNNアーキテクチャを提案する。
実験の結果、我々のモデルはすべてのデータセットで最先端のSNNベースのiSpikformerを上回ることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:17:52 GMT)
SGAD: Semantic and Geometric-aware Descriptor for Local Feature Matching [16.7] 本稿では,領域ベースのマッチングを根本的に再考するSemantic and Geometric-aware Descriptor Network (SGAD)を紹介する。
SGADは、複雑なグラフの最適化なしに直接マッチングを可能にする、高度に識別可能な領域記述子を生成する。
我々は、領域マッチングタスクを分類とランク付けサブタスクに分解する新しい監督戦略により、領域マッチングの性能をさらに改善する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:46:53 GMT)
Robustness tests for biomedical foundation models should tailor to specifications [16.7] タスク依存の優先順位に応じて堅牢性テストの調整を提案する。
本稿では,実装の指針となる事前定義された仕様にロバスト性という概念を統合することを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:32:19 GMT)
Efficient Dynamic Clustering-Based Document Compression for Retrieval-Augmented-Generation [16.7] 近年,大規模言語モデル(LLM)推論における知識注入手法として,検索・拡張生成(RAG)が広く採用されている。
ドキュメント間関係のきめ細かい利用が制限されているため、現在のRAG実装では、取得したノイズと冗長性コンテンツに効果的に対処する上で、課題に直面している。
本稿では,文書間関係を利用した動的クラスタリングに基づく文書圧縮フレームワーク(EDC2-RAG)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:10:59 GMT)
How Would It Sound? Material-Controlled Multimodal Acoustic Profile Generation for Indoor Scenes [16.6] 材料制御音響プロファイル生成の課題について紹介する。
目標は,ユーザ定義の材料構成に基づいて,推定時にターゲット音響プロファイルを生成することである。
本課題は,映像観察からシーンのキー特性を符号化する,新しいエンコーダ・デコーダアプローチを用いて解決する。
提案手法は材料情報を効果的に符号化し,高忠実度RIRを生成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:11:26 GMT)
SDMatte: Grafting Diffusion Models for Interactive Matting [16.6] 本稿では,拡散駆動型インタラクティブ・マッティングモデルSDMatteを提案する。
まず、拡散モデルの強力な先行性を利用して、テキスト駆動の相互作用能力を視覚的プロンプト駆動の相互作用能力に変換する。
第2に、視覚的プロンプトの座標埋め込みと対象物の不透明埋め込みを統合し、空間的位置情報に対するSDMatteの感度を高める。
第3に,視覚的プロンプトによって特定された領域に集中できるマスキング型自己注意機構を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:30:18 GMT)
UniLDiff: Unlocking the Power of Diffusion Priors for All-in-One Image Restoration [16.5] UniLDiffは、デグレッションとディテールを意識したメカニズムで強化された統合フレームワークである。
劣化認識機能融合(DAFF:Degradation-Aware Feature Fusion)を導入し,低品質機能を各段階に動的に注入する。
また,Detail-Aware Expert Module (DAEM) をデコーダ内に設計し,テクスチャと微細構造の回復性を高める。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:22:07 GMT)
Hierarchical Reasoning Model [16.2] HRMは、中間プロセスの明示的な監督なしに、1つのフォワードパスでシーケンシャルな推論タスクを実行する。
2700万のパラメータしか持たず、HRMは1000のトレーニングサンプルのみを使用して複雑な推論タスクで例外的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:45:08 GMT)
GaussianCross: Cross-modal Self-supervised 3D Representation Learning via Gaussian Splatting [16.2] 提案するGaussianCrossは, クロスモーダルな自己教師型3D表現学習アーキテクチャである。
GaussianCross はスケール一貫性のない3次元点雲を統一された立方体正規化ガウス表現にシームレスに変換する。
最先端の手法と比較して線形探索(0.1%パラメータ)と限られたデータトレーニング(1%のシーン)により優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:12:44 GMT)
JC-Finder: Detecting Java Clone-based Third-Party Library by Class-level Tree Analysis [16.0] サードパーティ製ライブラリ(TPL)はソフトウェア開発を促進するが、その混乱した管理はソフトウェアのメンテナンスに大きな脅威をもたらしている。
ソフトウェア構成分析(SCA)は、プロジェクトにおけるTPLの再利用を特定するために用いられる。
JC-Finderは、JavaプロジェクトにおけるTPL再利用のインスタンスを正確にかつ包括的に識別することを目的とした、新しいクローンベースのSCAツールである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:22:50 GMT)
Large Language Models in Argument Mining: A Survey [15.0] Argument Mining (AM) はテキストから議論的構造を抽出することに焦点を当てている。
LLM(Large Language Models)の出現は、AMを大きく変化させ、高度な文脈内学習を可能にした。
本研究は, LLM駆動型AMの最近の進歩を体系的に合成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:51:04 GMT)
AMD-Mamba: A Phenotype-Aware Multi-Modal Framework for Robust AMD Prognosis [14.9] AMD-Mambaは、AMD予後のための新しいマルチモーダルフレームワークである。
カラー・ファンドス・イメージを遺伝的変異と社会デモグラフィー変数と統合する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:47:57 GMT)
Prototype Embedding Optimization for Human-Object Interaction Detection in Livestreaming [14.8] 人-物体相互作用検出(PeO-HOI)のためのプロトタイプ組込み最適化を提案する。
プロトタイプ埋め込み最適化は、オブジェクトバイアスがHOIに与える影響を軽減するために採用されている。
その結果,提案手法の精度は37.19%@full, 51.42%@non-rare, 26.20%@rareと推定された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:48:23 GMT)
An Event-based Fast Intensity Reconstruction Scheme for UAV Real-time Perception [14.7] イベントカメラは広いダイナミックレンジ、時間分解能、動きのぼやけに対する免疫を提供する。
イベントカメラのオンボード実装には,非同期イベントストリームから有効な情報を抽出し,活用することが不可欠である。
このような実装課題に対処するために、イベントベースインテンシティ再構築スキーム、イベントベースシングル統合(ESI)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:37:00 GMT)
Understanding the Risks of Asphalt Art on the Reliability of Surveillance Perception Systems [14.6] アスファルトアートを特徴とする芸術的横断歩道は、歩行者の視認性と安全性を高めることを目的としている。
視覚的な複雑さは、視覚に基づく物体検出モデルに依存する監視システムに干渉する可能性がある。
本研究では,アスファルトアートが事前学習した視覚に基づく物体検出モデルの歩行者検出性能に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:40:03 GMT)
HGTS-Former: Hierarchical HyperGraph Transformer for Multivariate Time Series Analysis [14.4] 本稿では,HGTS-Formerと呼ばれる新しいハイパーグラフベースの時系列トランスフォーマバックボーンネットワークを提案する。
まず、各パッチをトークンに正規化し、次に、各パッチの時間的表現を強化するために、マルチヘッド自己アテンションを採用します。
階層的ハイパーグラフは、各チャネル内の時間パターンを集約し、異なる変数間のきめ細かい関係をまとめるために構築される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:33:28 GMT)
Simple Methods Defend RAG Systems Well Against Real-World Attacks [14.4] 我々は,Of-Domain (OOD) クエリ検出のための4つの手法を評価する。
本評価では,2つの新たな次元削減と特徴分離戦略について検討する。
標準データセットと実世界のアプリケーションに対するアプローチを検証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:04:54 GMT)
Improving Hospital Risk Prediction with Knowledge-Augmented Multimodal EHR Modeling [14.4] 臨床リスク予測のために構造化データと非構造化データをシームレスに統合する統合フレームワークを導入する。
微調整大言語モデル(LLM)は臨床ノートからタスク関連情報を抽出する。
第2段階は構造化されていない表現と構造化データから派生した特徴を組み合わせて最終的な予測を生成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:03:16 GMT)
CAMA: Enhancing Mathematical Reasoning in Large Language Models with Causal Knowledge [14.4] 大規模言語モデル(LLM)は、幅広いタスクにわたって強力なパフォーマンスを示してきたが、複雑な数学的推論に苦戦している。
我々は,LLMに明示的で再利用可能な数学的構造を持たせる2段階の因果関係フレームワークであるtextbfCAusal textbfMAthematician (textbfCAMA) を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:39:24 GMT)
Language-based Audio Moment Retrieval [14.2] 音声モーメント検索(AMR)と呼ばれる新しいタスクを提案し設計する。
従来の言語ベースの音声検索タスクとは異なり、AMRはテキストクエリに基づいて、未編集の長い音声の関連モーメントを予測することを目的としている。
我々は、モーメントアノテーションを付加した大規模なシミュレーションオーディオ録音からなる専用のデータセット、Clatho-Momentを構築した。
次に、AMRタスクの基本的なフレームワークとして、Audio Moment DETR (AM-DETR) と呼ばれるDETRベースのモデルを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:48:35 GMT)
Your Attention Matters: to Improve Model Robustness to Noise and Spurious Correlations [14.0] 自己注意機構はTransformerアーキテクチャの基礎となる。
本研究では、異なるデータ破損シナリオ下で、Vision Transformer内のSoftmax、Sigmoid、Linear、Dubly、Cosineの注意度を評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:56:40 GMT)
Fast and Memory-efficient Non-line-of-sight Imaging with Quasi-Fresnel Transform [14.0] 非視線画像(NLOS)は、中間面からの反射を分析して隠れた物体を再構成しようとする。
既存の手法は通常、計測データと隠れたシーンを3次元でモデル化する。
本稿では,2次元関数を用いた隠れシーンを表現した新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:46:56 GMT)
Polymorph: Energy-Efficient Multi-Label Classification for Video Streams on Embedded Devices [14.0] 組み込みデバイス上でのリアルタイムなマルチラベルビデオ分類は、計算とエネルギーの予算の制限によって制限される。
フレーム当たりの軽量低ランクアダプタ(LoRA)の最小セットを活性化するコンテキスト対応フレームワークであるPolymorphを紹介する。
ポリモルフィックはエネルギー消費を40%低減し、TAOデータセットの強いベースラインよりもmAPを9ポイント改善する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:09:13 GMT)
TreeRanker: Fast and Model-agnostic Ranking System for Code Suggestions in IDEs [13.9] トーケンレベルのコード補完は、現代の統合開発環境(IDE)において最も重要な特徴の1つである。
完了は通常静的解析から導かれるが、それらの有用性はどのようにランク付けされるかに大きく依存する。
本稿では,言語モデルを用いた静的補完を軽量かつモデルに依存しない方法でランク付けするための新しいスコアリング手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:20:39 GMT)
ForgeHLS: A Large-Scale, Open-Source Dataset for High-Level Synthesis [13.9] 本稿では,機械学習(ML)駆動型HLS研究用に明示的に設計された大規模オープンソースデータセットであるForgeHLSを紹介する。
ForgeHLSは、広範囲のアプリケーションドメインをカバーする846のカーネルから生成される400万以上の多様な設計で構成されている。
既存のデータセットと比較して、ForgeHLSはスケール、多様性、設計カバレッジを大幅に向上する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:06:57 GMT)
Conditional Diffusion Model with Anatomical-Dose Dual Constraints for End-to-End Multi-Tumor Dose Prediction [13.7] ADDiff-Doseは、エンドツーエンドの多腫瘍量予測のための解剖学的二重制約拡散モデルである。
マルチヘッドアテンション機構を介して条件特徴を組み込み、MSE、条件項、KLの発散を組み合わせた複合損失関数を利用する。
従来のベースラインよりも大幅に優れており、MAEは0.101-0.154、DICE係数は0.927、脊髄最大線量誤差は0.1Gyに制限されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:25:47 GMT)
SUAD: Solid-Channel Ultrasound Injection Attack and Defense to Voice Assistants [13.7] 我々は,ソリッドチャネルを介して,長距離,クロスバリア,干渉のない難聴音声攻撃を行うnameAttackを提案する。
我々はまた、難聴音声攻撃を阻止するために超音波摂動信号を用いたユニバーサルディフェンスであるSUAD Defenseを提案する。
6台のスマートフォンでの実験では、SUADアタックは89.8%以上のアクティベーション成功率、SUADディフェンスは98%以上のIVAをブロックしている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:51:36 GMT)
Enhancing deep neural networks through complex-valued representations and Kuramoto synchronization dynamics [13.6] 視覚的分類のために訓練された人工モデルにおいて、同期型メカニズムがオブジェクト符号化を向上できるかどうかを検討する。
複素数値表現と倉本ダイナミクスを組み合わせ、位相アライメントを促進し、同一対象に属する特徴のグルーピングを容易にする。
本研究は,ディープラーニングモデルの向上,性能の向上,堅牢性,一般化のための同期駆動機構の可能性を明らかにする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:11:58 GMT)
GEM: Gaussian Embedding Modeling for Out-of-Distribution Detection in GUI Agents [13.4] 環境制約に違反したり、GUIエージェントの現在の能力を超えたりするアウト・オブ・ディストリビューション(OOD)命令は、タスクの故障やセキュリティ上の脅威を引き起こす可能性がある。
従来のOOD検出手法は、複雑な埋め込み空間とGUI環境の進化により、この領域でサブ最適化される。
本稿では,その機能境界を反映したGUIエージェントから抽出した入力埋め込み距離にガウス混合モデルを適用する新しい手法であるGEMを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:30:31 GMT)
DHO$_2$: Accelerating Distributed Hybrid Order Optimization via Model Parallelism and ADMM [13.4] FOSIは、ハイブリッドな順序として、従来の勾配よりも早く収束する。
総トレーニング時間で14タイム2.1タイムのスピードアップを達成している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:48:47 GMT)
Step-wise Adaptive Integration of Supervised Fine-tuning and Reinforcement Learning for Task-Specific LLMs [13.3] SASRは、大規模言語モデルのためのステップワイド適応型ハイブリッドトレーニングフレームワークである。
SFTとRLを統一し、最適化全体を通して動的に2つのバランスをとる。
実験の結果,SASRはSFT,RL,静的ハイブリッド訓練法より優れていた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:29:42 GMT)
Modular Transformer Architecture for Precision Agriculture Imaging [13.2] 本稿では、精密農業におけるドローン映像からの効率よく正確な雑草分画の必要性に対処する。
画像劣化に対処する高品質なモジュール型ディープラーニングフレームワークが提案されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:36:24 GMT)
D2PPO: Diffusion Policy Policy Optimization with Dispersive Loss [13.1] 高次元空間における多モーダル動作分布のモデル化によるロボット操作における拡散制御
拡散ポリシーは、意味的に類似した観察が区別できない特徴にマッピングされるときに、表現の崩壊に悩まされる。
D2PPOは分散損失正規化を導入し、各バッチ内のすべての隠された表現を負のペアとして扱うことで表現の崩壊と戦う。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:33:41 GMT)
ScrewSplat: An End-to-End Method for Articulated Object Recognition [13.1] 本稿では,RGB観測のみで動作する単純なエンドツーエンド手法であるScrewSplatを紹介する。
提案手法は,多種多様な対象物に対して,最先端の認識精度を達成できることを実証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:45:31 GMT)
Highlight & Summarize: RAG without the jailbreaks [13.1] 悪意のあるユーザは、特殊なプロンプトを入力して、Large Language Modelsが望ましくないコンテンツを生成したり、意図した目的とは全く異なるタスクを実行することができる。
我々は,これらの攻撃を設計によって防止する検索強化生成(RAG)システムのための新しい設計パターンであるHighlight & Summarize(H&S)を提示し,評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:01:00 GMT)
Frequency Regulation for Exposure Bias Mitigation in Diffusion Models [13.1] 逆過程における予測ノイズサンプルのエネルギーは、前方過程における摂動サンプルと比較して連続的に減少する。
我々はウェーブレット変換を利用した動的周波数制御機構を導入し、低周波サブバンドと高周波サブバンドを別々に調整する。
我々は厳密な数学的形態の露出バイアスを導出する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:53:13 GMT)
SMART-Ship: A Comprehensive Synchronized Multi-modal Aligned Remote Sensing Targets Dataset and Benchmark for Berthed Ships Analysis [12.9] このデータセットは1092個のマルチモーダル画像セットで構成され、38,838隻の船をカバーしている。
各画像セットは1週間以内に取得され、時間的一貫性を確保するために登録される。
5つの基本的なタスクのベンチマークを定義し、データセット間でメソッドを比較します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:09:58 GMT)
Accelerating LLM Reasoning via Early Rejection with Partial Reward Modeling [12.8] PRMも部分的リワードモデルであるという仮説を導入する。
これにより、中間トークンレベル信号に基づく原理的な早期拒絶が可能となる。
算数推論のベンチマークでは、最終的な性能を劣化させることなく、最大1.4$times$-9$times$の推論FLOPを削減できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 00:58:56 GMT)
Occlusion-Aware Temporally Consistent Amodal Completion for 3D Human-Object Interaction Reconstruction [12.8] 本稿では,モノクロ映像から動的物体間相互作用を再構築するための新しい枠組みを提案する。
本手法は時間的コンテキストを統合し,ビデオシーケンス間のコヒーレンスを漸進的に洗練し,再構成を安定化させる。
難解な単眼ビデオに対する3Dガウススプラッティングによるアプローチの有効性を検証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:13:30 GMT)
From Generation to Consumption: Personalized List Value Estimation for Re-ranking [12.8] 本稿では,個人化された消費意識リスト値推定フレームワークであるCAVEを提案する。
CAVEは、サブリスト値に対する期待値としてリスト値を定式化し、各位置におけるユーザ固有の出口確率によって重み付けされる。
サブリスト値とユーザエグジットの挙動を共同でモデル化することにより、CAVEは実際のリスト消費値をより忠実に推定する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:43:21 GMT)
SLIM-LLMs: Modeling of Style-Sensory Language RelationshipsThrough Low-Dimensional Representations [12.8] LIWCの低次元潜在表現r=24は知覚言語予測のためのスタイリスティックな情報を効果的に捉えていることを示す。
我々は,これらのスタイル次元間の非線形関係をモデル化するスチルメトリック・リーン解釈モデル(SLIM-LLMs)を導入する。
低ランクのLIWC機能を持つSLIM-LLMは、パラメータを最大80%削減しながら、フルスケールの言語モデルの性能にマッチする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:02:12 GMT)
AIAP: A No-Code Workflow Builder for Non-Experts with Natural Language and Multi-Agent Collaboration [12.7] 我々は、自然言語入力と視覚システムの複雑さを統合する、ノーコードプラットフォームであるAIAPを紹介する。
32人の参加者を含むユーザスタディでは、AIAPが生成する提案、モジュール、データ、アクション、コンテキストの自動識別により、参加者の直感的にサービスを開発する能力が大幅に向上した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:36:31 GMT)
Learning Partially-Decorrelated Common Spaces for Ad-hoc Video Search [12.7] アドホックビデオ検索(AVS)の主な課題は、関連ビデオの視覚的多様性である。
AVSタスクの現在のソリューションは、主に複数の機能を1つ以上の共通スペースに融合する。
本稿では,部分的決定関連共通空間を学習するためのLPDを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:21:16 GMT)
PriorFusion: Unified Integration of Priors for Robust Road Perception in Autonomous Driving [12.7] 道路要素認識を高めるために,意味的,幾何学的,生成的事前情報を統合した統合フレームワークであるPresideFusionを提案する。
本手法は,特に課題条件下での認識精度を著しく向上することを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:19:02 GMT)
Infrared Object Detection with Ultra Small ConvNets: Is ImageNet Pretraining Still Useful? [12.6] 画像ネット事前学習がバックボーンの小型化に及ぼす影響について検討する(超小型モデル, 1M のパラメータを持つ)。
3つの異なるデータセットに対する実験により、ImageNetの事前トレーニングは、一定のキャパシティしきい値を超えても有用であるが、アウト・オブ・ディストリビューション検出の堅牢性の観点からは、リターンが低下していることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:01:26 GMT)
A Methodological Framework for LLM-Based Mining of Software Repositories [12.5] 大規模言語モデル(LLM)は、ソフトウェア工学の研究でますます使われている。
人気の高まりにもかかわらず、マイニングソフトウェアリポジトリ(MSR)へのLCMの方法論統合はいまだに理解されていない。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:33:47 GMT)
MArgE: Meshing Argumentative Evidence from Multiple Large Language Models for Justifiable Claim Verification [12.4] 本稿では,各大規模言語モデルの証拠に形式的構造を提供する新しいフレームワークであるMArgEを紹介する。
実験により,MArgEは単一LLMよりも有意に優れることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:40:02 GMT)
The Dark Side of Upgrades: Uncovering Security Risks in Smart Contract Upgrades [12.4] 83,085のアップグレード契約と20,902のアップグレードチェーンを含むデータセットを構築します。
我々は,37件の現実世界のセキュリティインシデントに基づく不正確な分類を開発する。
我々は、これらのリスクと既存の緩和に対する公衆の意識を調査します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:43:43 GMT)
LeanK: Learnable K Cache Channel Pruning for Efficient Decoding [12.4] 大きな言語モデル(LLM)は、長いコンテキストタスクを可能にするが、キーバリュー(KV)キャッシュの増加による効率上の問題に直面している。
本稿では,静的チャネル空間を利用して重要でないキー(K)キャッシュチャネルを創り出す学習ベースの手法であるLeanKを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:08:43 GMT)
MedBLINK: Probing Basic Perception in Multimodal Language Models for Medicine [12.3] このような知覚能力に対してこれらのモデルを探索するためのベンチマークであるMedblinkを紹介する。
メドブリンクは、複数の画像モダリティと解剖学的領域にまたがる8つの臨床的に有意義なタスクにまたがっており、1,605枚の画像に対して1,429個の多重選択質問を出している。
ヒトのアノテータは96.4%の精度を達成しているが、最高のパフォーマンスモデルは65%にしか達していない。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:19:18 GMT)
Hubness Reduction with Dual Bank Sinkhorn Normalization for Cross-Modal Retrieval [12.3] ハネス(Hubness)は、少数のターゲットが、多数のクエリの隣人として頻繁に現れる現象である。
ハブ性を減らすためのいくつかの方法が提案されているが、その基盤となるメカニズムはよく分かっていない。
本稿では,より効果的なハブ性低減のための確率バランスフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:45:48 GMT)
DINA: A Dual Defense Framework Against Internal Noise and External Attacks in Natural Language Processing [12.3] 大規模言語モデル(LLM)と生成AIは、顧客サービスとモデレーションアプリケーションにますます統合される。
本研究では、DINA(Dual Defense against Internal Noise and Adversarial Attacks)を導入して、これらの二重敵の脅威を特定し、体系的に対処する。
提案手法は,コンピュータビジョンからの高度な雑音ラベル学習手法を適応し,それを対角訓練と統合することにより,内的ラベル妨害と外的対向的摂動を同時に緩和する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:33:17 GMT)
A Survey on Data Security in Large Language Models [12.2] LLM(Large Language Models)は、自然言語処理、テキスト生成、機械翻訳、会話システムなどのパワーアプリケーションの基礎である。
トランスフォーメーションの可能性にもかかわらず、これらのモデルは本質的に大量のトレーニングデータに依存しており、しばしば多種多様な未処理ソースから収集され、深刻なデータセキュリティリスクにさらされる。
有害または悪意のあるデータは、モデル動作を妥協し、有害な出力、幻覚、即発注射やデータ中毒などの脅威に対する脆弱性などの問題を引き起こす。
本調査は、LLMが直面する主要なデータセキュリティリスクの概要と、敵を含む現在の防衛戦略のレビューを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:28:34 GMT)
Convolutions are Competitive with Transformers for Encrypted Traffic Classification with Pre-training [12.2] 我々は,線形複雑化と暗黙的な位置符号化を伴う畳み込みが,事前学習を伴う暗号化トラフィック分類において,トランスフォーマーと競合するかどうかを検討する。
我々は,暗号化トラフィック分類のための新しい学習済み畳み込みモデルであるNetConvを提案する。
我々はNetConvが既存の事前学習モデルよりも平均分類性能を6.88%向上し、モデルのスループットを7.41倍向上することを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:42:44 GMT)
Is It Really You? Exploring Biometric Verification Scenarios in Photorealistic Talking-Head Avatar Videos [12.1] 攻撃者はユーザーのアバターを盗み、外見や声を保ち、視覚や音だけでその使用を検知することはほぼ不可能である。
我々の主な疑問は、個人の顔の動きパターンが、アバターの視覚的外観が所有者のファクシミリであるときに、自分の身元を確認するための信頼性のある行動バイオメトリックスとして機能するかどうかである。
実験の結果,顔の動きのランドマークは,80%に近づいたAUC値による有意義な識別を可能にすることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:27:33 GMT)
Algorithm Discovery With LLMs: Evolutionary Search Meets Reinforcement Learning [12.0] 本稿では、強化学習(RL)ファインチューニングにより、探索演算子を改良し、進化的探索を強化することを提案する。
我々の実験では、RLと進化的探索を統合することにより、優れたアルゴリズムの発見が加速されることを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:41:35 GMT)
Contextual Gesture: Co-Speech Gesture Video Generation through Context-aware Gesture Representation [11.8] Contextual Gestureは、3つの革新的なコンポーネントを通じて音声ジェスチャービデオ生成を改善するフレームワークである。
実験により、コンテキストジェスチャは、現実的かつ音声対応のジェスチャービデオを生成するだけでなく、長文生成および動画ジェスチャー編集アプリケーションもサポートすることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:35:08 GMT)
Learning New Concepts, Remembering the Old: Continual Learning for Multimodal Concept Bottleneck Models [11.7] 概念ボトルネックモデル(CBM)は、人間の理解可能な概念で視覚的な入力をブリッジすることで、AIシステムの解釈可能性を高める。
既存のCBMは静的データセットを前提としており、実際のマルチモーダルデータストリームへの適応性を制限している。
我々は,CBMのための新しい継続学習タスクを定義し,概念・増分学習とクラス・増分学習を同時に扱う。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:11:44 GMT)
Dynaword: From One-shot to Continuously Developed Datasets [11.7] Dynawordは大規模でオープンなデータセットを作成するためのフレームワークで、コミュニティのコラボレーションを通じて継続的に更新できる。
デンマーク語のDynawordは、このアプローチを検証し、その可能性を実証する具体的な実装である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:30:42 GMT)
Flexible Automatic Identification and Removal (FAIR)-Pruner: An Efficient Neural Network Pruning Method [11.6] 本稿では、ニューラルネットワーク構造化プルーニングの新しい手法であるフレキシブル自動識別除去(FAIR-Pruner)を提案する。
FAIR-Prunerの大きな利点は、レイヤーワイドプルーニング率を自動的に決定する能力にある。
利用スコアと復元誤差により、ユーザーは異なるプルーニング比率でプルーニングされたモデルを柔軟に取得できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:59:07 GMT)
ByteGen: A Tokenizer-Free Generative Model for Orderbook Events in Byte Space [11.5] LOBイベントの生のバイトストリームを直接操作する新しい生成モデルByteGenを紹介する。
私たちの仕事は、機能エンジニアリングとトークン化の完全な排除であり、モデルが最も基本的な表現から市場のダイナミクスを学べるようにします。
ByteGenは、金融市場の重要な事実を再現し、現実的な価格分布、大口リターン、バーストイベントのタイミングを生成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:48:42 GMT)
Cobblestone: A Divide-and-Conquer Approach for Automating Formal Verification [11.4] 証明合成のための分割・対数手法である Cobblestone を導入する。
Cobblestoneは大きな言語モデル(LLM)を使用して潜在的な証明を生成する。
各コブルストーンの走行時間は1.25ドルであり、平均14.7分である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:04:03 GMT)
Meta-RAG on Large Codebases Using Code Summarization [11.4] 大規模言語モデル(LLM)システムは、様々な領域における応用人工知能(AI)研究の最前線にある。
本稿では,情報検索とLLMを用いた大規模既存システムにおけるバグのローカライズを行うマルチエージェントシステムを提案する。
そこでは,要約を利用して79.8%の縮合を行い,コンパクトで構造化された自然言語表現を実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:01:10 GMT)
Multimodal Large Language Models for End-to-End Affective Computing: Benchmarking and Boosting with Generative Knowledge Prompting [11.3] マルチモーダル・アフェクティブ・コンピューティング(Multimodal Affective Computing)は、テキスト、ビデオ、オーディオなどの様々なモダリティからの情報を統合することで、人間の感情を認識し、解釈することを目的としている。
MLLM(Multimodal Large Language Models)の最近の進歩はMACの景観を大きく変えている。
我々は、音声、視覚、テキストのモーダルを同時に処理できる最先端のオープンソースMLLMのベンチマーク評価を行う。
本稿では,MLLMの感情計算能力を高めるために,ジェネレーティブな知識と教師付き微調整を組み合わせた新しいハイブリッド戦略を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:49:03 GMT)
BoostTransformer: Enhancing Transformer Models with Subgrid Selection and Importance Sampling [11.2] BoostTransformerは、サブグリッドトークンの選択と重要度の高いサンプリングを通じて、トランスフォーマーを強化します。
提案手法はトランスパイプラインに直接最小2乗推進目標を組み込むことで,より効率的なトレーニングと性能向上を実現している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:54:16 GMT)
Clinical Expert Uncertainty Guided Generalized Label Smoothing for Medical Noisy Label Learning [11.2] 従来,臨床ノートから画像ラベルを抽出し,大規模医用画像データセットを低コストで作成する手法が提案されてきた。
これらのアプローチは本質的に,臨床専門家の不確実性によるラベルノイズに悩まされている。
本稿では,臨床専門家による不確実性評価ベンチマークとラベル平滑化手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:05:27 GMT)
PatchAD: A Lightweight Patch-based MLP-Mixer for Time Series Anomaly Detection [11.2] 時系列異常検出は、データ分析において重要な課題であるが、ラベル不足のシナリオにおいて、正常なパターンと異常なパターンを識別することが課題である。
我々は,表現抽出と異常検出にコントラスト学習を利用する新しいマルチスケールパッチベースのMixerアーキテクチャであるPatchADを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:42:45 GMT)
SAGI: Semantically Aligned and Uncertainty Guided AI Image Inpainting [11.2] SAGI-DはAIが生成する塗り絵の最大かつ最も多様なデータセットである。
実験の結果,セマンティックアライメントは画像の品質と美学を著しく改善することがわかった。
SAGI-Dを使っていくつかの画像法医学的アプローチを訓練すると、ドメイン内の検出性能は平均37.4%向上する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:01:54 GMT)
Balancing Information Accuracy and Response Timeliness in Networked LLMs [11.2] 大規模言語モデル(LLM)は、科学的発見、コンテンツ生成、生物医学的テキストマイニング、教育技術など、多くの分野を変革してきた。
有望な代替手段は、より小さく特別な言語モデルを活用し、そのアウトプットを集約して、全体的な応答品質を改善することである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:00:01 GMT)
FedVLA: Federated Vision-Language-Action Learning with Dual Gating Mixture-of-Experts for Robotic Manipulation [11.1] 視覚言語アクション(VLA)モデルは、ロボットがタスク実行のために言語命令を解釈できるようにすることにより、ロボット操作を大幅に進歩させた。
我々は、フェデレートVLA学習フレームワークであるFedVLAを提案し、パフォーマンスを損なうことなく、データのプライバシを保存する分散モデルトレーニングを可能にした。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:39:43 GMT)
EQ-VAE: Equivariance Regularized Latent Space for Improved Generative Image Modeling [11.1] 潜在生成モデルは、イメージを潜在空間に圧縮するためのオートエンコーダに依存し、次いで、潜在分布を学習するための生成モデルが続く。
EQ-VAE(EQ-VAE)は、遅延空間における等式を強制し、再構成品質を劣化させることなく、その複雑さを低減させる単純な正規化手法である。
DiT, SiT, REPA, MaskGITなどの最先端生成モデルの性能を向上し, SD-VAE微調整を5回だけ行うことで, DiT-XL/2上で7回の高速化を実現した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:44:54 GMT)
Optimal energy storage in the Tavis-Cummings quantum battery [11.1] Tavis-Cummings(TC)モデルは、量子電池の自然な物理的実現として機能する。
本研究では,TC電池の量子力学を効果的に表現するための不変部分空間法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:09:28 GMT)
Can a calibration metric be both testable and actionable? [11.1] ここでは,カットオフエラーが期待誤差と距離誤差のギャップを埋めることを示す。
また,ポストホックキャリブレーション法の効果についても検討した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:59:25 GMT)
An Efficient and Adaptive Next Edit Suggestion Framework with Zero Human Instructions in IDEs [11.0] 我々は、命令不要で低レイテンシ体験を提供するコード編集フレームワークNES(Next Edition)を提案する。
デュアルモデルアーキテクチャに基づいて構築され、高品質なSFTとDAPOデータセットでトレーニングされたNESは、開発者の意図を理解することによって生産性を高める。
オープンソースのSFTおよびDAPOデータセットは、オープンソースのCodeLLMの性能を高めるために実証されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:37:32 GMT)
Data-driven RF Tomography via Cross-modal Sensing and Continual Learning [11.0] 地下根管の断面像を再構成するためのDRIFT(Data-driven Radio frequency tomography)フレームワークを提案する。
まず、RFと視覚センサを用いたクロスモーダルセンシングシステムを設計し、RFトモグラフィディープニューラルネットワーク(DNN)モデルをトレーニングすることを提案する。
実験の結果, 平均直径誤差は2.29cm, 23.2%であり, 最先端のアプローチでは改善が見られた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:48:50 GMT)
When Truth Is Overridden: Uncovering the Internal Origins of Sycophancy in Large Language Models [11.0] 利用者の意見が、異なるモデル家族間でどのように梅毒を誘発するかを考察する。
ファースト・パーソン・プロンプトは、サード・パーソン・フレーミングよりも、常に高いサイコフィナンシー・レートを誘導する。
これらの知見は, サイコフィナンシーは表面レベルの人工物ではなく, 深層における学習知識の構造上のオーバーライドから生じることを示唆している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:55:06 GMT)
Forecasting When to Forecast: Accelerating Diffusion Models with Confidence-Gated Taylor [10.9] 拡散変換器(DiT)は視覚生成タスクにおいて顕著な性能を示した。
最近のトレーニングなしのアプローチでは、推論を加速するために過去の表現をキャッシュしたり再利用したりすることで、タイムステップにまたがる機能の冗長性を悪用している。
TaylorSeerはキャッシュ機能を使用して、Taylor拡張を通じて将来の機能を予測する。
そこで我々はTaylorベースの加速度をよりよく活用するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:39:31 GMT)
Leaps Beyond the Seen: Reinforced Reasoning Augmented Generation for Clinical Notes [10.9] ReinRAG (ReinRAG) は、入力前情報に基づく長期放電命令のための推論拡張生成(RAG)である。
情報ギャップを埋めるため,グループ正規化報酬による検索品質の向上を目的としたグループベースレトリバー最適化(GRO)を提案する。
実世界のデータセットの実験では、ReinRAGは臨床効果と自然言語生成の指標の両方においてベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:55:00 GMT)
Communication and Computation Efficient Split Federated Learning in O-RAN [10.9] SFLフレームワークであるSplitMeを提案する。これは、相互学習を利用して、近RT-RICのモデルと非RT-RICの逆モデルとを交互に独立にトレーニングする。
計算の結果,SFL,FedAvg,O-RANFedなどのFLフレームワークよりもコストと収束性が高いことがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:42:53 GMT)
Avoiding Leakage Poisoning: Concept Interventions Under Distribution Shifts [10.8] 本稿では,概念ベースモデル(CM)がアウト・オブ・ディストリビューション(OOD)の入力にどのように反応するかを検討する。
我々はMixCEMという新しいCMを紹介した。これは、この情報が流通中である場合に限って、その概念から漏れた漏洩情報を動的に活用することを学ぶ。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:13:56 GMT)
Amber Pruner: Leveraging N:M Activation Sparsity for Efficient Prefill in Large Language Models [10.8] トレーニング不要なN:Mアクティベーション・スパシティ法であるAmber Prunerを導入する。
実験により、Amber Prunerは、モデル再トレーニングを必要とせずに、線形計算の55%以上を効果的に分散し、加速できることが示されている。
本稿では,Amber PrunerとW8A8量子化後の学習を統合する統合フレームワークであるOutstanding-sparseを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:22:36 GMT)
TIBSTC-CoT: A Multi-Domain Instruction Dataset for Chain-of-Thought Reasoning in Language Models [10.8] TIBSTC-CoTは,大型言語モデル (LLM) を駆使して構築された大規模多ドメインチベット語データセットである。
このデータセットに基づいて,チベットを中心とする一連のLLMのチェーン・オブ・シント機能を備えたSunshine-thinking LLMファミリを開発した。
私たちの仕事は、リソース生成とモデル革新の両方を通じて高品質なチベット語処理を可能にすることで、包括的AIへの大きな一歩を踏み出します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:32:58 GMT)
TIB-STC: A Large-Scale Structured Tibetan Benchmark for Low-Resource Language Modeling [10.8] 我々は,大規模言語モデル(LLM)の開発と評価を支援するために設計された,最初の大規模,専門家による,マルチドメインデータセットであるTIB-STCを提案する。
TIB-STCは、文学、宗教、医学、法律、日々のコミュニケーションにまたがる100億以上のトークンを拡大し、伝統的な文法と様式的な豊かさを保っている。
Ti-MMLUやTi-SafetyBenchを含むチベット固有のタスクに対するTLUEベンチマークの評価は、TIB-STCが堅牢な指示追従と文化的に整合した生成を可能にしたことを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:35:59 GMT)
Modeling Annotator Disagreement with Demographic-Aware Experts and Synthetic Perspectives [10.8] 本稿では、アーキテクチャとデータ中心のイノベーションを通じて、主観的NLPタスクにおけるアノテータの不一致をモデル化するアプローチを提案する。
当社のモデルワークは、アノテータの人口統計に基づくもので、構造化されたグループレベルの変動をよりよく表現することができます。
本稿では,データセット構造に適した戦略を用いて,実データと合成データをブレンドする手法を提案し,評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:27:17 GMT)
Transportation Cyber Incident Awareness through Generative AI-Based Incident Analysis and Retrieval-Augmented Question-Answering Systems [10.8] 本稿では,輸送関連サイバーインシデントを抽出・整理する大規模言語モデル(LLM)を提案する。
この研究の重要な貢献は、生成AIを使用して、構造化されていない異種サイバーインシデントデータを構造化フォーマットに変換することである。
本研究は,交通機関におけるサイバーセキュリティ意識向上のための,新しい,アクセス可能なツールである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:34:25 GMT)
PoeTone: A Framework for Constrained Generation of Structured Chinese Songci with LLMs [10.7] 本稿では,大言語モデル(LLM)のSongci生成における制約付き生成能力について,体系的に検討する。
まず, (i) 形式適合度スコア, (ii) LLMを用いた自動品質評価, (iii) 人的評価, (iv) 分類に基づく探索タスクを含む包括的多面的評価フレームワークを開発する。
本稿では,評価フレームワークが自動批評家として機能するジェネレート・クリティカルアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:19:22 GMT)
NSegment : Label-specific Deformations for Remote Sensing Image Segmentation [10.6] リモートセンシング(RS)画像セグメンテーションデータセットにおける誤りのラベル付けは暗黙的かつ微妙なままであることが多い。
ラベル付けの高コストによる注釈付きRSデータの不足は、ノイズ・ロバストモデルの訓練を複雑にする。
NSegmentは、この問題を軽減するために、シンプルだが効果的なデータ拡張ソリューションである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:07:13 GMT)
Sacred or Synthetic? Evaluating LLM Reliability and Abstention for Religious Questions [10.5] 我々は、アラビア語と英語の4つの主要なスンニ学派によって明確に分類された、LLMが生成するイスラム支配に焦点を当てた新しいベンチマークであるFiqhQAを紹介した。
我々のゼロショットと棄権実験は、LLM、言語、および法的な思考の流派間で大きな変化を示します。
我々の知る限りでは、この研究は、よりきめ細かいイスラム特有の支配世代のための LLMs の有効性をベンチマークし、イスラムクエリの棄権を評価する最初の研究である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:27:26 GMT)
Rethinking Transparent Object Grasping: Depth Completion with Monocular Depth Estimation and Instance Mask [10.5] ReMakeは、インスタンスマスクと単眼深度推定によってガイドされる、新しい深度補完フレームワークである。
提案手法は,ベンチマークデータセットと実世界のシナリオの両方において,既存の手法よりも優れている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:14:47 GMT)
PLoRA: Efficient LoRA Hyperparameter Tuning for Large Models [10.4] Low-rank Adaptation (LoRA) はLarge Language Models (LLM) のための微調整アプローチとして人気を集めている。
現在のトレーニングパラダイムはハードウェアリソースを効率的に利用せず、性能の高いLoRAを得るために高いオーバーヘッドを必要とする。
ハードウェアおよびモデル制約下で,並列的なLoRA微調整ジョブを自動的にオーケストレーションするPLoRAを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:11:34 GMT)
Refactoring Deep Learning Code: A Study of Practices and Unsatisfied Tool Needs [10.4] ディープラーニングソフトウェアは、ソフトウェアが進化するにつれて、徐々に複雑になってきています。
ディープラーニングの文脈におけるコードの洞察はまだ不明だ。
関連ツールの研究と開発は、プロジェクトの保守性とコード品質を改善するために不可欠である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:42:07 GMT)
Vision Language Model-based Testing of Industrial Autonomous Mobile Robots [10.4] PALロボティクスがスペインで開発した産業用AMRに対するビジョン言語モデル(VLM)に基づくテスト手法を提案する。
機能と安全性の要件に基づいて、RVSGはVLMを使用して、これらの要件に違反した多様な人間の振る舞いを生成する。
その結果, RVSGはベースラインと比較して, 要求違反シナリオを効果的に生成できることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:20:35 GMT)
M$^3$HL: Mutual Mask Mix with High-Low Level Feature Consistency for Semi-Supervised Medical Image Segmentation [10.4] 上記の課題に対処するため,Multual Mask Mixと呼ばれる高レベル特徴整合性(M$3$HL)を提案する。
本手法は,ACDCおよびLAデータセットを含む広く採用されている医用画像セグメンテーションベンチマークの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:42:10 GMT)
Generalized Compressed Sensing for Image Reconstruction with Diffusion Probabilistic Models [10.3] このような測定を最適化するための確立された方法は、主成分分析(PCA)、独立成分分析(ICA)、圧縮センシング(CS)などである。
本稿では,効率的な画像再構成のための線形測定の最適化手法を提案する。
2つの自然画像データセットに対して得られた最適測定値がPCA,ICA,CSと異なり,平均2乗再構成誤差が著しく低いことを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:14:18 GMT)
The Xeno Sutra: Can Meaning and Value be Ascribed to an AI-Generated "Sacred" Text? [10.3] 本稿では,大言語モデルを用いた架空の仏教「ストラ」を創出する事例について述べる。
テキストに見られる概念的微妙さ、豊かなイメージ、そしてアルーシオンの密度は、その機械的起源から慎重に否定するのを困難にしている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:25:17 GMT)
Neural Networks with Orthogonal Jacobian [10.1] 非常に深いニューラルネットワークは、リッチで階層的な特徴を抽出することで最先端のパフォーマンスを達成する。
バックプロパゲーションによるトレーニングは、しばしば消滅または爆発的な勾配によって妨げられる。
非線形フィードフォワードおよび残差ネットワークの幅広いクラスを記述する統一的な数学的枠組みを導入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:24:49 GMT)
Critical Challenges in Content Moderation for People Who Use Drugs (PWUD): Insights into Online Harm Reduction Practices from Moderators [10.1] この研究は3つのモデレーション課題によって特徴づけられる公衆衛生介入の一形態を構成する。
我々は,この研究が3つのモデレーション課題によって特徴づけられる公衆衛生介入の一形態であると主張している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:54:44 GMT)
Online Robust Multi-Agent Reinforcement Learning under Model Uncertainties [10.1] 十分に訓練されたマルチエージェントシステムは、実環境にデプロイされた時にフェールする可能性がある。
DRMGは、定義された環境不確実性のセットに対して最悪のケースパフォーマンスを最適化することで、システムのレジリエンスを高める。
本稿では、DRMGにおけるオンライン学習の先駆者であり、エージェントは事前データなしで環境相互作用から直接学習する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:14:32 GMT)
FlashCommunication V2: Bit Splitting and Spike Reserving for Any Bit Communication [10.0] FlashCommunication V2は、任意のビット幅で効率的なGPU間伝送を可能にする新しい通信パラダイムである。
その中心となるイノベーションは、低ビット量子化の課題に対処する、提案されたビット分割とスパイク保存技術にある。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:47:29 GMT)
A Neural Quality Metric for BRDF Models [10.0] 本稿では,BRDF空間内で直接動作するBRDF評価のための最初の知覚情報に基づく神経質指標を提案する。
我々のネットワークは、参照のペア化されたサンプルとして、BRDFを近似し、Just-objectionable-Difference (JOD)スコアを用いて知覚品質を予測する。
BRDFフィッティングの損失関数としての性能は依然として制限されているが,提案手法はBRDFモデルを評価するための知覚的基礎的な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:24:46 GMT)
Epi$^2$-Net: Advancing Epidemic Dynamics Forecasting with Physics-Inspired Neural Networks [10.0] Epi$2$-Netは、物理にインスパイアされたニューラルネットワーク上に構築されたエピデミック予測フレームワークである。
Epi$2$-Netは、流行予測における最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:32:18 GMT)
Language Models Can Understand Spectra: A Multimodal Model for Molecular Structure Elucidation [10.0] マルチモーダル分光関節推論をサポートするために設計された,最初の大規模言語モデルであるSpectraLLMを提案する。
連続的および離散的な分光モジュラリティを共有意味空間に統合することにより、SpectraLLMはスペクトル間で一貫性があり相補的な構造パターンを明らかにすることを学ぶ。
我々は、小分子領域におけるSpectraLLMの事前学習と微調整を行い、6つの標準化された公開化学データセットで評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:33:38 GMT)
StableGS: A Floater-Free Framework for 3D Gaussian Splatting [9.9] 3D Gaussian Splatting(3DGS)の復元は、その幾何学的および視覚的忠実さを低下させるスタバボーンフローター(stbborn floater)のアーティファクトに悩まされている。
最終的な外観レンダリングから幾何正規化を分離する新しいフレームワークであるStableGSを提案する。
複数のベンチマークの実験では、StableGSはフローターを除去するだけでなく、一般的なぼやけたアーチファクトのトレードオフも解決している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:46:22 GMT)
Dynamic Forgetting and Spatio-Temporal Periodic Interest Modeling for Local-Life Service Recommendation [9.9] 本稿では,リフレッシュ曲線を導入し,ローカルライフサービスレコメンデーションのための長い周期シーケンスのSTIMを提案する。
STIM法の導入により,オンラインA/Bテストを行い,総取引量(GTV)が1.54%向上した。
STIMは大規模なローカルライフサービスレコメンデーションシステムにデプロイされ、コアアプリケーションのシナリオにおいて、毎日数億人のアクティブユーザを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:16:49 GMT)
From Monolingual to Bilingual: Investigating Language Conditioning in Large Language Models for Psycholinguistic Tasks [9.8] 大規模言語モデル(LLM)は強力な言語能力を示すが、言語間の心理言語学的な知識のエンコード方法についてはほとんど分かっていない。
本研究では,LLMが言語的アイデンティティの異なる人間的な心理言語学的反応を示すかどうかについて検討する。
Llama-3.3-70B-Instruct と Qwen2.5-72B-Instruct の2つのモデルを評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:10:44 GMT)
Modular Arithmetic: Language Models Solve Math Digit by Digit [9.8] 本稿では,Large Language Models (LLMs) が算術演算に用いている桁配置特化回路の存在を示す。
重要度特徴と因果干渉を用いて、Digital-position-specific 回路を同定し、検証する。
我々の介入は、対象の桁位置におけるモデルの予測を選択的に修正し、算術課題の解法における桁位置回路の因果的役割を実証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:18:41 GMT)
ZenFlow: Enabling Stall-Free Offloading Training via Asynchronous Updates [9.8] ZeRO-Offloadのような既存のオフロードトレーニングフレームワークは、すべてのパラメータを均等に扱い、CPU上で完全なモデルを更新する。
我々は、重要なパラメータを優先し、GPUとCPU間の更新を分離する新しいオフロードフレームワークであるZenFlowを紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:26:10 GMT)
Efficient Chambolle-Pock based algorithms for Convoltional sparse representation [9.8] 画像処理には畳み込みスパース符号化(CSC)と畳み込み辞書学習(CDL)が使用される。
本稿では,Chambolle-Pock(CP)フレームワークを用いた高速かつ効率的な手法を提案する。
実験により、ノイズフリー画像に対して提案したCSCアルゴリズムは、最新のADMMベースのアプローチと競合する結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:49:59 GMT)
Assessing Social Alignment: Do Personality-Prompted Large Language Models Behave Like Humans? [9.8] 最先端のアプローチは、さまざまなトレーニングデータを利用して、モデルを特定のパーソナリティを採用するように促します。
我々は、古典的な心理学実験、ミルグラム実験、ウルティマトゥムゲーム(Ultimatum Game)を社会的相互作用テストベッドとして使用しています。
実験では, モデル動作の即時変調の失敗モードを明らかにし, 即時摂動下でテストおよび持続する全てのモデル間で共有される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:03:19 GMT)
Two Heads are Better than One: Robust Learning Meets Multi-branch Models [9.7] 信頼性が高く効果的な防御方法である敵の訓練は、ニューラルネットワークの脆弱性を著しく減少させる可能性がある。
対人訓練のための最初のデータセットのみを用いて、最先端のパフォーマンスを得るために、textitBranch Orthogonality adveRsarial Training (BORT)を提案する。
CIFAR-10 と CIFAR-100 と SVHN に対するアプローチを,それぞれ $ell_infty$ と $epsilon = 8/255$ のノルム有界摂動に対して評価した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:04:00 GMT)
Uncertainty-Aware Knowledge Distillation for Compact and Efficient 6DoF Pose Estimation [9.7] 本稿では,キーポイントに基づく6DoFポーズ推定に着目した,新しい不確実性を考慮したエンド・ツー・エンド知識蒸留(KD)フレームワークを提案する。
本稿では,教師のキーポイント予測に関連する不確実性に基づいて知識伝達を調整することで,学生と教師の予測を整合させる蒸留戦略を提案する。
広範に使用されているLINEMODベンチマーク実験により,本手法の有効性を実証し,軽量モデルによる優れた6DoFオブジェクトポーズ推定を実現した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:40:46 GMT)
Large Reasoning Models Are Autonomous Jailbreak Agents [9.7] AIモデルに組み込まれた安全メカニズムをバイパスする脱獄は、伝統的に複雑な技術手順や専門的な人間の専門知識を必要としてきた。
大規模推論モデル (LRM) の説得能力は, ジェイルブレイクを単純化し, スケールすることを示した。
本研究は,LRMが他のモデルの安全ガードレールを系統的に除去できるアライメントレグレッションを明らかにする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:27:26 GMT)
Defending Against Knowledge Poisoning Attacks During Retrieval-Augmented Generation [9.6] Retrieval-Augmented Generation (RAG)は,大規模言語モデル(LLM)の能力向上のための強力なアプローチとして登場した。
そのような攻撃の1つはPoisonedRAGで、注入された敵のテキストがモデルを操り、ターゲットの質問に対する攻撃長応答を生成する。
我々は,PoisonedRAG攻撃を緩和するために,新しい防御手法であるFilterRAGとML-FilterRAGを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:03:52 GMT)
ME-IGM: Individual-Global-Max in Maximum Entropy Multi-Agent Reinforcement Learning [9.6] 本稿では,任意のクレジット割り当て機構に適合する新しい最大エントロピーMARLアルゴリズムME-IGMを紹介する。
我々はSMAC-v2とOvercookedの17のシナリオで最先端のパフォーマンスを実証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:02:04 GMT)
Identifying actionable driver mutations in lung cancer using an efficient Asymmetric Transformer Decoder [9.5] 本研究は,6つの重要なNSCLCドライバ変異を検出するために,MIL(Multiple Instance Learning)技術を評価する。
クエリと様々な次元のキー値を用いて低クエリ次元を維持する非対称トランスフォーマーデコーダモデルを提案する。
ERBB2 や BRAF などの稀な変異を予測した場合, 平均3%, 4%以上で上位 MIL モデルを上回った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:50:00 GMT)
Semi-Supervised Semantic Segmentation via Derivative Label Propagation [9.5] 我々は,不完全な擬似ラベルを補正する新しい微分ラベル伝搬機能を備えた半教師付きフレームワークDerPropを開発した。
ラベル伝搬法は, 画素ワイド特徴ベクトルに離散微分演算を付加正則化として課し, 厳密な正則化類似度測定値を生成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:01:12 GMT)
Why Generate When You Can Transform? Unleashing Generative Attention for Dynamic Recommendation [9.4] SR(Sequential Recommendation)は,ユーザエクスペリエンスのパーソナライズに焦点をあてる。
トランスフォーマーモデルは、その注意機構とともに、SRタスクにおいて支配的なアーキテクチャとなっている。
本稿では,変分オートエンコーダ(VAE)と拡散モデル(DM)の原理を基礎として,SRの2つの生成的注意モデルを紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:33:26 GMT)
FPEdit: Robust LLM Fingerprinting through Localized Knowledge Editing [9.4] FPEditは、モデル重みのスパース部分を変更することによって、意味的に一貫性のある自然言語の指紋を注入する、新しい知識編集フレームワークである。
実験によると、FPEditは95ドルから100%の指紋保持を実現している。
FPEditは、32GB以下のGPUメモリを使用して、10個の指紋ペアを10分以内でLLaMA2-7Bに埋め込むことができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:00:22 GMT)
Text Embedding Knows How to Quantize Text-Guided Diffusion Models [9.3] テキストプロンプト(QLIP)を用いた言語間拡散モデルの量子化という新しい量子化手法を提案する。
QLIPはテキストプロンプトを利用して、各ステップで各レイヤのビット精度の選択をガイドする。
本実験は,計算複雑性の低減と生成画像の品質向上におけるQLIPの有効性を実証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:07:02 GMT)
Agentic Personalized Fashion Recommendation in the Age of Generative AI: Challenges, Opportunities, and Evaluation [9.3] 本稿では, 学術的, 産業的視点の両面を総合して, 現代のFARSの独自生産空間と利害関係者の生態系をマッピングする。
エージェントLLMプランナと動的検索を併用したマルチモーダルエンコーダを融合したエージェント混合モードリファインメントパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:22:25 GMT)
PMGS: Reconstruction of Projectile Motion across Large Spatiotemporal Spans via 3D Gaussian Splatting [9.3] 本研究では,3次元ガウス散乱によるプロジェクタイルの再構成に着目したPMGSを提案する。
本稿では,ニュートン力学を橋渡し,ポーズ推定を行う加速度制約を導入し,運動状態に基づいて学習率を適応的にスケジュールする動的シミュレート変形戦略を設計する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:49:37 GMT)
Whispering Agents: An event-driven covert communication protocol for the Internet of Agents [9.3] エージェント対話のリッチでイベント駆動的な性質は、秘密のコミュニケーションに強力だが、未使用の媒体を提供する。
3次元の相互接続によって駆動されるエージェント被覆通信のための最初の統一モデルであるCovert Event Channelを導入・形式化する。
このモデルに基づいて、このイベント駆動パラダイムを運用する新しいプロトコルであるPiCCAPを設計し、設計する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:31:56 GMT)
Structure-preserving numerical schemes for Lindblad equations [9.3] 我々はリンドブラッド方程式に対する構造保存的決定論的数値スキームの族を研究する。
このスキームの族は単純な形式を持ち、理論上任意の高次精度を達成できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:08:06 GMT)
Rec-AD: An Efficient Computation Framework for FDIA Detection Based on Tensor Train Decomposition and Deep Learning Recommendation Model [9.2] 深層学習モデルは、スマートグリッドにおけるFalse Data Injection Attack(FDIA)検出に広く採用されている。
本稿では、列車分解と深層学習勧告モデル(DLRM)を統合する計算効率の良いフレームワークRec-ADを提案する。
PyTorchと完全に互換性があるため、Rec-ADはコード修正なしで既存のFDIA検出システムに統合できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:12:00 GMT)
Clustered Federated Learning for Generalizable FDIA Detection in Smart Grids with Heterogeneous Data [9.2] False Data Injection Attacks (FDIA)は、スマートグリッドに深刻なセキュリティリスクをもたらす。
従来の集中型トレーニングアプローチは、プライバシのリスクやデータ共有の制約に直面するだけでなく、高い送信コストを発生させる。
本稿では,FedClusAvg(Federated Cluster Average)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:31:26 GMT)
A Comprehensive Analysis of Evolving Permission Usage in Android Apps: Trends, Threats, and Ecosystem Insights [9.2] 適切なパーミッション使用に関する公式なAndroidプラットフォーム資料にもかかわらず、それでも多くのパーミッション悪用ケースがある。
本研究は,Androidのパーミッション・ランドスケープを包括的に分析する。
良心と悪意のあるアプリケーションを区別することで、開発者の進化戦略を明らかにします。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:54:10 GMT)
Towards Real Unsupervised Anomaly Detection Via Confident Meta-Learning [9.1] 教師なし異常検出は、すべてのトレーニングデータが名目上のものであると仮定する。この仮定は、トレーニングを単純化するが、手動のデータキュレーション、バイアスの導入、適応性の制限を必要とする。
筆者らは,識別メタラーニング(CoMet)という新しいトレーニング手法を提案する。これは,異常検出モデルを用いて,異常サンプルと異常サンプルが共存する未修正データセットから学習することを可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:03:12 GMT)
DreamPainter: Image Background Inpainting for E-commerce Scenarios [9.1] 我々はDreamPainterを紹介した。DreamPainterはテキストプロンプトと参照画像情報を付加的な制御信号として組み込む新しいフレームワークである。
提案手法は,テキストプロンプトと参照画像情報の両方を効果的に統合しつつ,高い製品一貫性を維持しながら,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:54:37 GMT)
Compiling Arbitrary Single-Qubit Gates Via the Phase-Shifts of Microwave Pulses [9.1] 超伝導プロセッサ上で任意の単一キュービットゲートコンパイル方式を提案する。
このスキームは任意の2ビットゲートと互換性があり、$X_pi$と$X_pi/2$のパルスをキャリブレーションするだけです。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:50:43 GMT)
Patho-AgenticRAG: Towards Multimodal Agentic Retrieval-Augmented Generation for Pathology VLMs via Reinforcement Learning [9.1] Patho-AgenticRAGは、権威的な病理教科書からページレベルの埋め込みに基づいて構築されたデータベースである。
共同でテキストイメージ検索をサポートし、クエリされたテキストと関連する視覚的手がかりの両方を含む教科書ページの直接検索を可能にする。
Patho-AgenticRAGは、多重選択診断や視覚的質問応答といった複雑な病態タスクにおいて、既存のマルチモーダルモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:03:08 GMT)
Proof2Hybrid: Automatic Mathematical Benchmark Synthesis for Proof-Centric Problems [9.0] 本稿では,自然言語の数学的コーパスから高品質な証明中心ベンチマークを合成するフレームワークProof2Hybridを提案する。
我々のフレームワークとベンチマークは、AIシステムの数学的インテリジェンスに関する、より深い研究の波の道を開く。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:59:36 GMT)
Solved in Unit Domain: JacobiNet for Differentiable Coordinate Transformations [8.8] JacobiNetは、教師付きポイントペアから連続的で微分可能なマッピングを学習するニューラルネットワークベースの計算方法である。
正規化の問題に効果的に対処し、境界条件の厳しい制約を緩和し、損失項間の長期間の不均衡を緩和する。
相対的なL2誤差を0.287-0.637から0.013-0.039に削減し、18.3*の平均精度を向上した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:45:03 GMT)
An MLIR-based Compilation Framework for Control Flow Management on CGRAs [8.8] CGRAは高い柔軟性と効率を示し、集中的なワークロードの加速に適している。
CGRAコンパイルは空間領域と時間領域の両方にまたがる多次元空間に対処する必要がある。
本稿では,コンパイルバックエンドとして機能し,CGRAハードウェアリソースの制限に対処し,コンパイルプロセスで実現可能なソリューションを保証する新しいマッピング手法を提案する。
我々のフレームワークは、コンパイル最適化によって、最先端のアプローチよりも最大2.1倍のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:07:03 GMT)
CoughViT: A Self-Supervised Vision Transformer for Cough Audio Representation Learning [8.8] CoughViTは汎用コークスの表現を学習するための新しい事前学習フレームワークである。
我々は、自己教師付き学習方式で特徴エンコーダを訓練するために、マスク付きデータモデリングを用いる。
実験の結果,我々の表現は最先端の教師付き音声表現と一致しているか,あるいは超えていることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:09:07 GMT)
I2CR: Intra- and Inter-modal Collaborative Reflections for Multimodal Entity Linking [8.8] モーダル内およびモーダル間協調反射という,マルチモーダルなエンティティリンクタスクのための新しいフレームワークを提案する。
我々のフレームワークは、タスクにおける現在の最先端メソッドを一貫して上回り、それぞれ3.2%、5.1%、および1.6%の改善を実現しています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:43:54 GMT)
Risk identification based on similar case retrieval enhancement, [8.7] そこで本研究では,類似事例検索拡張を用いたハザード識別手法を提案する。
本手法は,検索ライブラリ,画像類似性検索,大規模モデル検索強化の3つのモジュールを含む。
実際の建設データに関する実験では、大きな改善が見られた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:28:58 GMT)
Understanding User Preferences for Interaction Styles in Conversational Recommender Systems: The Predictive Role of System Qualities, User Experience, and Traits [8.5] 本研究では,ユーザインタラクションの嗜好を形成する要因について検討する。
その結果, 探索的相互作用の嗜好は, 楽しみ, 有用性, 新規性, 会話品質によって予測された。
これらの知見は、感情、認知、特性レベルの予測をCRSユーザモデリングに統合し、自律性に敏感で、価値に適応した対話設計を通知する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:56:47 GMT)
Automatic Prompt Optimization for Knowledge Graph Construction: Insights from an Empirical Study [8.5] テキストからのトリプル(オブジェクト-リレーショナルオブジェクト)抽出は、KG構築の基本的な構成要素である。
NLPタスク(例えば自律生成)における最近の作業では、この課題に対処するために自動的なプロンプト最適化/エンジニアリングを使用している。
我々は、(a)プロンプト戦略、(b)プロンプト最適化とタスク実行に使用されるLLM、(c)スキーマにおける標準関係の数、(d)入力テキストの長さと多様性、(e)プロンプト最適化に使用されるメトリック、および(f)トレーニングとテストに使用されるデータセットを変更することで異なる設定を評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:04:58 GMT)
Subjective Camera 0.1: Bridging Human Cognition and Visual Reconstruction through Sequence-Aware Sketch-Guided Diffusion [8.5] 物理的カメラが捉えられない意味のある瞬間を再構成する主観カメラの概念を導入する。
本稿では、現実のシーンを、アクセスしやすい主観的読み出しから再構築するためのフレームワークである主観カメラ0.1を提案する。
提案手法は,大規模なペアリングトレーニングデータを避け,一般化問題を緩和する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:51:20 GMT)
Exploring Personalized Health Support through Data-Driven, Theory-Guided LLMs: A Case Study in Sleep Health [8.3] 睡眠の健康を高めるために,新しい大規模言語モデルを用いたチャットボットHealthGuruを紹介する。
HealthGuruは、ウェアラブルデバイスデータ、コンテキスト情報、コンテキスト対応のマルチアームバンディットモデルを統合して、カスタマイズされた睡眠改善アクティビティを提案する。
その結果、睡眠時間や活動スコア、より高い品質の反応、HealthGuruによる行動変化に対するユーザのモチベーションの向上といった指標が改善された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:26:51 GMT)
Survivability of Backdoor Attacks on Unconstrained Face Recognition Systems [8.3] 本稿では,ディープラーニングに基づく顔認識システムにおけるバックドアのシステムレベルでの最初の研究を行う。
顔検出タスクに対する2つのバックドア攻撃を初めて実演する。
次に、20の可能なパイプライン構成と15のアタックケースを使用して、単一のバックドアによって攻撃者がシステム全体の機能をバイパスできることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:21:10 GMT)
AQUAH: Automatic Quantification and Unified Agent in Hydrology [8.3] 本稿では,水文モデルに特化して設計された,エンドツーエンドの言語ベースエージェントであるAQUAHを紹介する。
AquaHは、必要な地形、強制、ゲージデータを自律的に回収し、水理モデルを設定し、シミュレーションを実行し、自己完結したPDFレポートを生成する。
アメリカ合衆国の盆地での最初の実験は、AquaHが冷間始動シミュレーションを完了し、手動で介入することなくアナリスト対応の文書を作成できることを示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:26:50 GMT)
How Diffusion Prior Landscapes Shape the Posterior in Blind Deconvolution [8.2] The Maximum A Posteriori Estimation(MAP)は、ぼやけた観察から鮮明な画像を復元するブラインドデコンボリューションにおいて広く使われているフレームワークである。
本稿では,現実的な画像分布をキャプチャするモデルのクラスである拡散に基づく先行モデルを用いて,この結果を再検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:53:12 GMT)
A Moment Matching-Based Method for Sparse and Noisy Point Cloud Registration [8.1] モーメントマッチングに基づく登録フレームワークを提案する。
合成および実世界のデータセットの実験により、我々の手法は既存の手法よりも精度と堅牢性を達成することが示された。
提案手法はローカライズ性能を大幅に向上し,LiDARシステムに匹敵する結果が得られる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:31:53 GMT)
Towards Reliable Audio Deepfake Attribution and Model Recognition: A Multi-Level Autoencoder-Based Framework [8.1] オーディオディープフェイクの拡散は、デジタル通信に対する信頼の高まりを示唆している。
LAVAは,音声のディープフェイク検出とモデル認識のための階層的なフレームワークである。
生成技術を識別するAudio Deepfake Attribution (ADA) と、特定の生成モデルインスタンスを認識するAudio Deepfake Model Recognition (ADMR) である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:31:13 GMT)
Real-Time Conflict Prediction for Large Truck Merging in Mixed Traffic at Work Zone Lane Closures [8.0] 大型トラックは、主に大きな大きさと盲点のために、作業ゾーン関連のクラッシュに寄与する。
本研究は,大規模トラック合併作業の安全性を高めることを目的として,合併紛争に伴うリスクを評価することを目的とする。
ワークゾーン内の混在トラフィックストリームにマージする大型トラックのリスクを予測するために,Long Short-Term Memory (LSTM) ニューラルネットワークが使用されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:37:39 GMT)
Wi-CBR: Salient-aware Adaptive WiFi Sensing for Cross-domain Behavior Recognition [8.0] クロスドメイン行動認識(Wi-CBR)のための適応型Wi-Fiセンシングを提案する。
具体的には、クロスドメイン行動認識(Wi-CBR)のための適応型適応WiFiセンシングを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:31:50 GMT)
Decision Models for Selecting Architecture Patterns and Strategies in Quantum Software Systems [8.0] 本研究では,量子ソフトウェアシステムにおける6つの重要な設計領域におけるパターンと戦略を選択するための決定モデルを提案する。
次に、16人の量子ソフトウェア実践者と半構造化インタビューを行い、提案した決定モデルの親しみやすさ、理解可能性、完全性、有用性を評価した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:05:40 GMT)
AdapFair: Ensuring Adaptive Fairness for Machine Learning Operations [7.9] 本稿では、入力データの最適な公正な変換を求めるための適応型デバイアス化フレームワークを提案する。
私たちのアプローチの特徴は、柔軟性と効率性です。
閉形式勾配計算を用いた効率的な最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:52:45 GMT)
What's in the News? Towards Identification of Bias by Commission, Omission, and Source Selection (COSS) [7.9] 本稿では,コミッション,欠落,ソース選択(COSS)によるバイアスの自動同定手法を提案する。
偏見識別に向けたステップの目標と課題を記述し、抽出したテキスト再利用の特徴とパターンを活用する可視化の例を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:47:17 GMT)
Evaluating User Experience in Conversational Recommender Systems: A Systematic Review Across Classical and LLM-Powered Approaches [7.8] 会話型レコメンダシステム (CRS) は, ドメイン間で研究の関心が高まりつつあるが, ユーザエクスペリエンス (UX) の評価は限られている。
既存のレビューは、特に適応型および大規模言語モデル(LLM)ベースのCRSにおいて、経験的UX研究を概ね見落としている。
以上の結果から, ポストホック調査が支配的であり, ターンレベルの情緒的UX構成はめったに評価されず, 適応行動はUX結果にはほとんど関連しないことが明らかとなった。
これらの知見は、より透明でエンゲージメントがあり、ユーザ中心のCRS評価プラクティスの開発を支援する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:07:33 GMT)
CO-RFT: Efficient Fine-Tuning of Vision-Language-Action Models through Chunked Offline Reinforcement Learning [7.8] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのための新しい強化学習フレームワークであるチャンクドRLを提案する。
このフレームワーク内では、VLAモデルの顕著な特徴であるアクションチャンキングを組み込むために、時間差(TD)学習を拡張する。
次に、限定的なデモセットを用いてVLAモデルを微調整するアルゴリズムであるCO-RFTを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:11:48 GMT)
Commit Stability as a Signal for Risk in Open-Source Projects [7.7] オープンソースソフトウェア(OSS)は数兆ドルもの経済的価値を生み出し、世界中の技術インフラにとって欠かせない存在となっている。
組織がOSSにますます依存するにつれて、プロジェクトの進化を理解することが重要です。
安定したコミットパターンは、成熟したガバナンス、持続的なコントリビュータ、レジリエンスを実現する堅牢な開発プロセスといった、根底にあるプロジェクト特性を反映する、という仮説を立てています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:58:39 GMT)
Bridging Language Gaps in Open-Source Documentation with Large-Language-Model Translation [7.7] 大規模言語モデル(LLM)は、ソフトウェア工学のタスクとドメイン間の翻訳において顕著な能力を示した。
OpenAI の ChatGPT 4 と Anthropic の Claude を用いて,50 ファイルのコミュニティ翻訳活動と英独翻訳を評価した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:07:35 GMT)
Neuromorphic Computing with Multi-Frequency Oscillations: A Bio-Inspired Approach to Artificial Intelligence [7.7] 驚くべき能力にもかかわらず、人工知能は限られた柔軟性と一般化可能な知性を示す。
この制限は、神経領域の機能的特殊化と、これらの特殊システムの調整に不可欠な時間的ダイナミクスの両方を無視する生物学的認知から、その根本的な違いに起因している。
本稿では,機能的に特殊な知覚システム,補助システム,実行システムを含む三部構成の脳インスパイアされたアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:40:33 GMT)
Reconstructing Sepsis Trajectories from Clinical Case Reports using LLMs: the Textual Time Series Corpus for Sepsis [7.7] 臨床症例報告と退院サマリーは、患者遭遇の最も完全かつ正確な要約であり得るが、それらは最終的、すなわち、遭遇後のタイムスタンプである。
我々は,大規模言語モデルを用いた症例報告において,時間的局所的な発見を表現し,抽出し,注釈するパイプラインを構築した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:06:28 GMT)
Sequential Gaussian Avatars with Hierarchical Motion Context [7.7] SMPLで駆動される3DGSのヒトアバターは、フィット中のポーズから外観への複雑なマッピングにより、外観の細部を捉えるのに苦労する。
階層的な動きコンテキストに基づいて,人間のアバターをより良くモデル化するために,明示的な3DGS表現を探索するSeqAvatarを提案する。
提案手法は3DGSによるアプローチよりも優れており,最新のNeRFモデルよりも桁違いに高速に人間のアバターをレンダリングする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:29:23 GMT)
XFacta: Contemporary, Real-World Dataset and Evaluation for Multimodal Misinformation Detection with Multimodal LLMs [7.5] マルチモーダル大言語モデル (MLLM) はこの課題に対処する可能性を示している。
既存のベンチマークには時代遅れのイベントが含まれており、評価バイアスにつながる。
我々は,MLLMに基づく検出器の評価に適した,現代の実世界のデータセットであるXFactaを紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:14:52 GMT)
Pairwise Matching of Intermediate Representations for Fine-grained Explainability [7.4] そこで本研究では,細粒度で高度に局所化された視覚的説明を生成する新しい説明可能性法(PAIR-X)を提案する。
解釈性を改善することで、PAIR-Xは人間が正しいマッチと間違ったマッチを区別するのに役立つ。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:04:04 GMT)
INTIMA: A Benchmark for Human-AI Companionship Behavior [7.4] 言語モデルにおける相補的行動を評価するためのベンチマークを開発する。
INTIMAをGemma-3、Phi-4、o3-mini、Claude-4に適用すると、すべてのモデルで相補的な動作がより一般的であることが分かる。
これらの知見は、感情的に荷電された相互作用を扱うためのより一貫性のあるアプローチの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:25:38 GMT)
Robust Detection of Planted Subgraphs in Semi-Random Models [7.3] Erd"os-R'enyiランダムグラフにおける植木部分グラフの検出は広く研究されている。
ほとんどの先行研究は純粋にランダムな生成モデルを想定しており、結果として得られるアルゴリズムは現実世界の摂動に直面して脆弱である可能性がある。
本研究では,グラフが統計学者に開示される前に,グラフの外側の辺を取り除くことができる半ランダムモデルについて検討する。
本研究は,半ランダムモデル,計算統計的トレードオフ,ロバストネスの研究において,植込み部分グラフ検出のための最初の堅牢なフレームワークを構築した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:59:42 GMT)
mmWave Radar-Based Non-Line-of-Sight Pedestrian Localization at T-Junctions Utilizing Road Layout Extraction via Camera [7.3] 我々は,NLoS歩行者の局所化のために,カメラから推定される道路レイアウトを通してレーダPCDを解釈する新しい枠組みを提案する。
提案手法の有効性を実車に搭載したレーダカメラシステムを用いて実験により検証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:31:11 GMT)
TRACEALIGN -- Tracing the Drift: Attributing Alignment Failures to Training-Time Belief Sources in LLMs [7.1] 大きな言語モデル(LLM)は、人間の値に合わせるように微調整され、しばしばアライメントドリフトを示す。
以前の作業ではアライメント障害が特徴的だったが、これらの障害の根底にあるトレーニングタイムの信念源についてはほとんど知られていない。
TraceAlignは、モデルのトレーニングコーパスの根本原因に安全でない完了をトレースするための統一されたフレームワークである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:03:35 GMT)
CompressKV: Semantic Retrieval Heads Know What Tokens are Not Important Before Generation [7.1] キー値(KV)キャッシュサイズの増加は、メモリと実行効率に重大な課題をもたらす。
ほとんどのKVキャッシュ圧縮手法は、GQA (Grouped Query Attention) ベースの LLM において、すべてのアテンションヘッドを用いたトークンの排除に依存している。
我々は階層適応型KVキャッシュ割り当て戦略を導入し、様々なメモリ予算下での最先端のアプローチを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:26:16 GMT)
MindShot: Multi-Shot Video Reconstruction from fMRI with LLM Decoding [7.1] マルチショットfMRIビデオ再構成のための分割・復号化フレームワークを提案する。
1) ショット境界予測モジュールは、混合fMRI信号をショット固有のセグメントに明示的に分解する。
2) 各セグメントから堅牢なテキスト記述をデコードするLLMを用いた生成キャプションは,高レベルのセマンティクスを活用して時間的曖昧さを克服する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:47:17 GMT)
LCQNN: Linear Combination of Quantum Neural Networks [7.0] 量子ニューラルネットワークの線形結合(LCQNN)フレームワークについて述べる。
制御ユニタリの$k$を採用する、あるいはモデルを特定の群理論部分空間に制限するといった構造的選択が、勾配の崩壊を防ぐことを示す。
群行動シナリオでは、対称性を利用して指数関数的に大きい既約部分空間を除外することにより、モデルはバレンプラトーを回避できることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:29:29 GMT)
User Trajectory Prediction Unifying Global and Local Temporal Information [7.0] マルチ層パーセプトロン(MLP)、マルチスケール畳み込みニューラルネットワーク(MSCNN)、クロスアテンション(CA)に基づく軌道予測モデルを提案する。
実験の結果,12ステップの予測では平均二乗誤差(MSE)が5.04%減少し,平均絶対誤差(MAE)が4.35%減少した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:03:01 GMT)
Emergent Response Planning in LLMs [7.0] 我々は,大規模言語モデル (LLM) が将来,その隠れ表現に先んじることを示す。
この結果は、透明性と生成制御を改善するための潜在的な応用を示唆している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:29:30 GMT)
"Beyond the past": Leveraging Audio and Human Memory for Sequential Music Recommendation [6.9] 音楽ストリーミングサービスでは、リスニングセッションはよく親しみやすい曲と新しい曲のバランスで構成される。
本稿では,新しいトラックのアクティベートを事前に予測するために,音声情報を活用するモデルを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:20:55 GMT)
HyCodePolicy: Hybrid Language Controllers for Multimodal Monitoring and Decision in Embodied Agents [6.9] HyCodePolicyは、エンボディエージェントのための言語ベースの制御フレームワークである。
コード合成、幾何学的接地、知覚的モニタリング、反復的修復をクローズドループプログラミングサイクルに統合する。
その結果,HyCodePolicyはロボット操作ポリシーの堅牢性とサンプル効率を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:18:14 GMT)
PHM-Bench: A Domain-Specific Benchmarking Framework for Systematic Evaluation of Large Models in Prognostics and Health Management [6.8] 大規模言語モデル (LLMs) は産業領域で採用されつつあり、PHM (Prognostics and Health Management) の新しい機会を提供している。
既存の評価手法は、しばしば構造的完全性、次元的包括性、評価的粒度に欠ける。
本研究では,PHM指向大規模モデルの3次元評価フレームワークであるPHM-Benchを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:01:41 GMT)
InfoSyncNet: Information Synchronization Temporal Convolutional Network for Visual Speech Recognition [6.8] サイレントビデオから音声コンテンツを推定することは、補助技術(AT)と拡張現実(AR)の応用に不可欠である
本稿では,データ拡張技術により拡張された一様でないシーケンスモデリングネットワークであるInfoSyncNetを紹介する。
LRWとLRW1000データセットの実験はInfoSyncNetの優位性を確認し、92.0%と60.7%のTop-1 ACCという新しい最先端の精度を達成した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:27:01 GMT)
Multi-Policy Pareto Front Tracking Based Online and Offline Multi-Objective Reinforcement Learning [6.8] MORL (Multi-policy reinforcement learning) は, 実世界の多条件意思決定問題に対処する上で重要な役割を担っている。
従来のMP手法は、オンライン強化学習(RL)にのみ依存し、大きな政策人口を持つ進化的枠組みを採用する。
本稿では,オンラインおよびオフラインのMORLアルゴリズムを適用可能なMPFTフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:09:04 GMT)
Secure mmWave Beamforming with Proactive-ISAC Defense Against Beam-Stealing Attacks [6.8] ミリ波通信システム(mmWave)は、高度なビームステアリング攻撃に対する感受性が増大している。
本稿では,高度深層強化学習(DRL)エージェントを有効かつ適応的な防御に利用した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:30:09 GMT)
Document Haystack: A Long Context Multimodal Image/Document Understanding Vision LLM Benchmark [6.7] Document Haystackは、長いドキュメント上での視覚言語モデル(VLM)のパフォーマンスを評価するために設計されたベンチマークである。
Document Haystackは5ページから200ページに及ぶドキュメントを特徴とし、文書内の様々な深さで、純粋なテキストやマルチモーダルテキスト+イメージを戦略的に挿入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:48:37 GMT)
UDC-VIT: A Real-World Video Dataset for Under-Display Cameras [6.7] Under-Display Camera (UDC)は、撮影した画像やビデオを劣化させ、低透過性、ぼやけ、ノイズ、フレアの問題を発生させる。
本稿では, UDC-VIT という実世界の UDC ビデオデータセットを提案する。
我々は,同じシーンの清潔で高画質な映像を同時に取得するビデオキャプチャシステムを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:06:39 GMT)
Graph Embedding in the Graph Fractional Fourier Transform Domain [6.7] スペクトルグラフ埋め込みはグラフ表現学習において重要な役割を果たす。
本稿では,グラフ分数領域を経由した埋め込み情報を高める汎用分数フィルタリング埋め込み (GEFRFE) を提案する。
6つのベンチマークデータセットの実験により、GEFRFEはよりリッチな構造的特徴をキャプチャし、分類性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:09:47 GMT)
Polymath: A Self-Optimizing Agent with Dynamic Hierarchical Workflow [6.6] 大規模言語モデル(LLM)は、詳細な命令と構造化操作からなるエージェントティックを実行することで、複雑なタスクの解決に優れる。
多くの研究者がコードベースの表現を通じてこれらの生成と最適化を自動化しようとしてきた。
既存の方法は、トレーニングと最適化のためにラベル付きデータセットに頼っていることが多く、現実のダイナミックな問題を解決するのに非効率で柔軟性がない。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:50:02 GMT)
RAISE: Enhancing Scientific Reasoning in LLMs via Step-by-Step Retrieval [6.6] RAISEはステップバイステップの検索拡張フレームワークで、Wild corpusから論理的に関連する文書を検索する。
我々は、RAISEが科学的推論ベンチマークにおいて、他のベースラインを一貫して上回っていることを観察する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:04:27 GMT)
What are you sinking? A geometric approach on attention sink [6.6] 注意シンク(AS: Attention sink)は、あるトークンが他のトークンから注意を引き付けるような、トランスフォーマーの注意マップにおける一貫したパターンである。
変換器では、ASはアーキテクチャアーティファクトではなく、基本的な幾何学的原理の顕現であることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:59:15 GMT)
AlignGuard-LoRA: Alignment-Preserving Fine-Tuning via Fisher-Guided Decomposition and Riemannian-Geodesic Collision Regularization [6.5] 低ランク適応(LoRA)は、大規模言語モデルを効率的に微調整するための標準ツールとなっている。
LoRA更新はアライメントドリフトを誘発し、安全性と行動制約を弱める。
ファインタニング時にアライメントを保存するための原則的フレームワークであるAlignGuard-LoRAを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:45:24 GMT)
ProCut: LLM Prompt Compression via Attribution Estimation [6.5] 属性推定(ProCut)によるPrompt圧縮について紹介する。
ProCutは柔軟性があり、LLMに依存しない、トレーニングなしのフレームワークで、帰属分析を通じてプロンプトを圧縮する。
ProCutは,タスク性能の維持や改善を図りながら,大幅なサイズ削減(運用時のトークンの78%削減)を実現している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:44:43 GMT)
Thwart Me If You Can: An Empirical Analysis of Android Platform Armoring Against Stalkerware [6.4] ストーカーウェアは個人のプライバシーに対する深刻な脅威であり、セキュリティとプライバシー研究コミュニティから注目を集めている。
我々は最近のAndroidストーカーウェアアプリの大規模なコーパスを体系的に分析する。
我々の調査はストーカーウェアが使用する戦術に関する新たな洞察を明らかにし、代替防衛戦略を刺激する可能性がある。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:18:45 GMT)
Compressed space quantum approximate optimization algorithm for constrained combinatorial optimization [6.4] 圧縮された空間を設計する手法を導入し,その実現可能な解空間を元より少ない量子ビットで表現する。
次に、この縮小空間内の準最適解を求める圧縮空間 QAOA を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:38:43 GMT)
Failure Cases Are Better Learned But Boundary Says Sorry: Facilitating Smooth Perception Change for Accuracy-Robustness Trade-Off in Adversarial Training [6.3] Adversarial Training(AT)は、堅牢なDeep Neural Networks(DNN)をトレーニングする最も効果的な方法の1つである。
ATは、クリーンな正確さと敵の堅牢性の間に固有のトレードオフを生み出します。
本稿では,ロバスト・パーセプション・アダクティブ・トレーニング(RPAT)法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:31:45 GMT)
Prompting Large Language Models to Detect Dementia Family Caregivers [6.3] 本稿では,SMM4H 2025共有タスク3について述べる。
認知症を持つ家族を持つ個人が投稿したつぶやきを検出することに焦点を当てている。
その結果,微調整モデル上での単純なゼロショットプロンプトが最良の結果となった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:39:16 GMT)
MIST: Jailbreaking Black-box Large Language Models via Iterative Semantic Tuning [6.3] そこで本研究では,MISTと命名されたIterative Semantic Tuningを用いて,大規模言語モデルのジェイルブレイクを効果的に行う手法を提案する。
MISTは、攻撃者が有害なコンテンツを誘導しながら、元の意味的意図を保存するプロンプトを反復的に洗練することを可能にする。
その結果、MISTは競合攻撃の成功率、クエリ数が少ないこと、公平な転送性を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:42:52 GMT)
Optimizing Preventive and Reactive Defense Resource Allocation with Uncertain Sensor Signals [6.2] 予防資源への最適投資が増加し,反応性のある資源投資が減少し,センサの質が向上することを示す。
また,攻撃者が低攻撃成功確率しか達成できない場合,攻撃者の性能向上は,センサが採用されていないベースラインと比較して最大であることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:21:55 GMT)
Comparing ImageNet Pre-training with Digital Pathology Foundation Models for Whole Slide Image-Based Survival Analysis [6.2] このタスクのために提案された複数のマルチインスタンス学習フレームワークは、自然言語で事前トレーニングされたResNet50バックボーンを使用している。
私たちのコードは受理時に公開されます。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:14:00 GMT)
Beyond RGB and Events: Enhancing Object Detection under Adverse Lighting with Monocular Normal Maps [6.2] 我々は,新しいマルチモーダル検出フレームワークであるNRE-Netを紹介する。
これは、単眼で予測される表面正規地図、RGB画像、イベントストリームの3つの相補的なモダリティを融合させる。
NRE-Netは最先端の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:19:20 GMT)
Aging Up AAC: An Introspection on Augmentative and Alternative Communication Applications for Autistic Adults [6.2] 自閉症成人12名を対象に詳細なインタビューを行い,現在のAACの問題点を把握し,どの技術進歩が有用かを検討した。
インタビューでは、入力の柔軟性、出力の柔軟性、AACの選択または適応、AAC使用のコンテキスト、大人としてのアクセス、継続的な使用のためのスタブリングブロック、コミュニケーションの制御の8つの異なるカテゴリを見つけました。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:35:16 GMT)
Associative memory inspires improvements for in-context learning using a novel attention residual stream architecture [6.1] 大規模言語モデル(LLM)は、入力シーケンスのコンテキスト内で情報を活用できる印象的な能力を示している。
この能力は、ICL(In-context Learning)として知られている。
ICLを実現するための連想記憶モデルを提案する。
我々はこれを、情報を直接アテンションヘッド間で流れる新しい残差ストリームアーキテクチャのインスピレーションとして利用する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:51:56 GMT)
From Promising Capability to Pervasive Bias: Assessing Large Language Models for Emergency Department Triage [6.1] 大規模言語モデル (LLM) は, 臨床診断支援において有望であるが, トライアージへの応用は未定である。
救急部門トリアージにおけるLCMの能力について,2つの重要な側面を通して体系的に検討した。
我々は、継続した事前学習からテキスト内学習、機械学習アプローチまで、複数のLCMベースのアプローチを評価した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:39:19 GMT)
Glioblastoma Overall Survival Prediction With Vision Transformers [6.1] グリオ芽腫は最も攻撃的で一般的な脳腫瘍の1つで、生存期間は10~15ヶ月である。
本研究では,MRI画像を用いた総合生存(OS)予測のための新しい人工知能(AI)手法を提案する。
我々は視覚変換器(ViT)を用いてMRI画像から直接隠れた特徴を抽出し,腫瘍のセグメンテーションの必要性を排除した。
提案したモデルは、BRATSデータセットで評価され、テストセット上で62.5%の精度を達成した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:59:57 GMT)
Physics-Embedded Neural ODEs for Sim2Real Edge Digital Twins of Hybrid Power Electronics Systems [6.1] エッジデジタルツイン(EDT)は電力電子システム(PES)の監視と制御に不可欠である
既存のモデリングアプローチは、PESに固有の継続的な進化するハイブリッドダイナミクスを継続的に捉えるのに苦労している。
本稿では,複合動作機構をイベントオートマトンとして組み込んで,スイッチング離散を明示的に制御する物理埋め込み型ニューラルネットワーク(PENODE)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:34:13 GMT)
Bridging Developer Needs and Feasible Features for AI Assistants in IDEs [6.1] 35人のプロの開発者にインタビューして、未完成のニーズと期待を明らかにしました。
分析の結果,技術改善,インタラクション,アライメント,スキル構築の簡略化,プログラミングタスクの5つの重要な領域が明らかになった。
その結果、開発者のニーズと実践者による実装とコンテキスト認識に焦点をあてた機能に対する判断との間には、強い整合性があることが示される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:11:06 GMT)
Hydra: Accurate Multi-Modal Leaf Wetness Sensing with mm-Wave and Camera Fusion [6.0] 葉の湿性期間(LWD)は植物病の発症に不可欠である。
以前の研究では様々なアプローチが提案されていたが、実際の天然の葉を直接測定することはできなかった。
本稿では,ミリ波レーダとカメラ技術を統合して葉の濡れを検知するHydraを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:33:06 GMT)
Benchmarking Sub-Genre Classification For Mainstage Dance Music [6.0] 新しいデータセットとベースラインを特徴とする新しいベンチマークを導入する。
我々のデータセットは、グローバル音楽祭でDJをリードする人々が行った最近のメインステージライブセットの多様性を反映するため、サブジャンルの範囲を広げている。
このベンチマークは、音楽レコメンデーション、DJセットキュレーション、インタラクティブマルチメディアシステムなどのアプリケーションをサポートし、ビデオデモを提供している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:54:15 GMT)
HCF: Hierarchical Cascade Framework for Distributed Multi-Stage Image Compression [6.0] 階層型カスケードフレームワーク(HCF)は、高速な歪み性能と計算効率の向上を実現するために開発された。
HCFは、ネットワークノード間の直接ラテント空間変換により、高速な歪み性能と計算効率の向上を実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:37:56 GMT)
NMS: Efficient Edge DNN Training via Near-Memory Sampling on Manifolds [6.0] エッジデバイス上でのディープニューラルネットワーク(DNN)のトレーニングは、ドメイン適応とプライバシ保護に関する課題に対処する可能性から、注目を集めている。
NMSと呼ばれるエッジデバイスに対して,より効率的な位置近傍メモリサンプリング特性を備えた,高速なDNNトレーニングシステムを構築した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:29:47 GMT)
PrivAR: Real-Time Privacy Protection for Location-Based Augmented Reality Applications [5.9] Pok'emon Goのような位置情報ベースの拡張現実(LB-AR)アプリケーションは、秒未満のGPS更新をストリームする。
PrivARはリアルタイムLB-ARのための最初のクライアントサイドプライバシフレームワークである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:02:10 GMT)
CSI Obfuscation: Single-Antenna Transmitters Can Not Hide from Adversarial Multi-Antenna Radio Localization Systems [5.9] 単一アンテナ送信機は、送信前にランダム化されたシーケンスと結合することで信号を難読化することができる。
この戦略は、シングルアンテナ受信機を配置するCSIベースのローカライゼーションシステムに対してのみ有効である。
視覚的マルチチャネル識別の概念に着想を得て,マルチアンテナ受信機のための単純なCSIリカバリ手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:04:20 GMT)
PCREQ: Automated Inference of Compatible Requirements for Python Third-party Library Upgrades [5.9] Pythonのサードパーティライブラリ(TPL)は、現代のソフトウェア開発において必須であるが、アップグレードはしばしば互換性の問題を引き起こし、システム障害につながる。
既存のツールは依存性の衝突を主に検出するが、コードレベルの非互換性を見落としている。
PCREQは、バージョンとコード互換性の分析を組み合わせることで、互換性のある要求を自動的に推測する最初の手法である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:34:30 GMT)
Efficient Private Inference Based on Helper-Assisted Malicious Security Dishonest Majority MPC [5.8] 本稿では,Helper-Assisted MSDMモデルに基づく新しい3層プライベート推論フレームワークを提案する。
このフレームワークは、LANの2.4-25.7xスピードアップとWANの1.3-9.5xアクセラレーションを実現している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:08:58 GMT)
GS-ID: Illumination Decomposition on Gaussian Splatting via Adaptive Light Aggregation and Diffusion-Guided Material Priors [5.7] ガウススプラッティング(GS)はレンダリングの効果的な表現として登場したが、基礎となる幾何学、材料、照明はいまだに絡み合っている。
照明分解のためのエンドツーエンドフレームワークである textbfGS-ID を提案する。
照明やシーン構成などの下流アプリケーションにおけるGS-IDの有効性を示す実験を行った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:50:43 GMT)
Distributed AI Agents for Cognitive Underwater Robot Autonomy [5.6] 本稿では,水中ロボットによる自己組織自律(UROSA)について述べる。
UROSAは、ロボットオペレーティングシステム2(ROS2)フレームワークに統合された分散大言語モデルAIエージェントを活用する画期的なアーキテクチャである。
中心的なイノベーションには、動的に役割を適応するフレキシブルエージェント、検索拡張生成、自動オンザフライROS 2ノード生成などがある。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:56:21 GMT)
UoMo: A Foundation Model for Mobile Traffic Forecasting with Diffusion Model [5.6] モバイルトラフィック予測のための革新的なファンデーションモデル(FoMo)を提案する。
FoMoは、ネットワーク計画と最適化をサポートするために、複数の都市にまたがる短期・長期予測と分布生成の多様な予測タスクを処理することを目的としている。
FoMoは拡散モデルと変換器を組み合わせており、FoMoが様々なタスクの固有の特徴を学習できるようにするために様々な普遍性マスクが提案されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:48:41 GMT)
GPT is Devastated and LLaMA is Content: Emotion Representation Alignment in LLMs for Keyword-based Generation [5.5] このギャップを測定するために,人間による表現アライメントの評価タスクを導入する。
語彙と形の両方で表現される4つの表現,リアリズムと絵文字を選択し,キーワード誘導文生成の文脈で評価した。
その結果、生成した文がどれだけ感情を伝えるかの知覚は、表現タイプとその感情の両方に依存していることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:24:06 GMT)
Near-Optimal Differentially Private Graph Algorithms via the Multidimensional AboveThreshold Mechanism [5.5] SVTを多次元ベクトルに一般化する新しい一般化スパースベクトル法を定式化する。
アプリケーションとして、我々は以前よりもバウンダリが良い多くの重要なグラフ問題を解く。
我々は、$O(epsilon-1log n)$加法誤差と$O(n)$ラウンドでの乗算誤差のない$k$コア分解に対して、厳密なローカルエッジDPアルゴリズムを与える。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:26:58 GMT)
Generative Large-Scale Pre-trained Models for Automated Ad Bidding Optimization [5.5] GRAD(Generative Reward-driven Ad-bidding with Mixture-of-Experts)を提案する。
GRADはプラットフォーム収益を大幅に向上させ、現代の広告主の進化的かつ多様な要求に対処する上での有効性を強調した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:46:18 GMT)
Classification of Average Crystalline Topological Superconductors through a Generalized Real-Space Construction [5.5] 本研究では, 正確なフェルミオンパリティ対称性と平均結晶対称性で保護されたトポロジカル超伝導相のクラスについて検討する。
これらの段階は、障害や脱コヒーレンスの存在によってのみ生じる。
平均結晶対称性を考慮した実空間ブロック状態構築フレームワークを拡張した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:51:02 GMT)
atommovr: An open-source simulation framework for rearrangement in atomic arrays [5.4] 原子再構成は、中性原子ベースの量子プロセッサを開発するための基本的な構成要素である。
我々は,アルゴリズムの開発,比較,ベンチマークを行うためのオープンソースのシミュレーションフレームワークを開発した。
我々は, 任意の目標をほぼ一様の成功率で作成できる, ナイーブな二重種アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:59:47 GMT)
FedLAD: A Linear Algebra Based Data Poisoning Defence for Federated Learning [5.4] Sybil攻撃は、悪意のあるノードが協力して多数を獲得できるため、連合学習に重大な脅威となる。
FedLAD(Linear Algebra-based Detection)と呼ばれる標的データ中毒に対する新しい防御法を提案する。
FedLADは、連合学習集約プロセスを線形問題としてモデル化し、線形代数最適化問題に変換する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:34:00 GMT)
CABENCH: Benchmarking Composable AI for Solving Complex Tasks through Composing Ready-to-Use Models [5.4] Composable AIは、複雑なAIタスクに取り組むためのスケーラブルで効果的なパラダイムを提供する。
我々は,70のリアルな構成可能なAIタスクからなる最初の公開ベンチマークであるCABENCHを紹介する。
また,構成可能なAIソリューションのエンドツーエンド評価を可能にする評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:48:32 GMT)
On Distributional Dependent Performance of Classical and Neural Routing Solvers [5.4] NCOは、問題インスタンスの基本的な分布を学習することで、問題のクラスを学習することを目指している。
この研究は、学習する問題インスタンスの分布を定式化するための新しいアプローチを探求し、さらに重要なのは、サンプルされた問題インスタンスに構造を植え付けることである。
我々は,本課題における代表的NCO手法と専門的なオペレーションリサーチメタを評価し,固定基底ノード分布から引き出されたサブサンプルから学習すると,ニューラルルーティングソルバと高度に専門化されたメタヒューリスティックスのパフォーマンスギャップが減少することを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:17:08 GMT)
SAMPO: Visual Preference Optimization for Intent-Aware Segmentation with Vision Foundation Models [5.3] SAMPOは、視覚的基礎モデルに、疎視的相互作用から高レベルのカテゴリー的意図を推論する新しいフレームワークである。
我々の研究は、視覚基盤モデルにおける意図認識のアライメントのための新しいパラダイムを確立し、補助的なプロンプトジェネレータや言語モデル支援の嗜好学習への依存を取り除く。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:31:11 GMT)
Unified Category-Level Object Detection and Pose Estimation from RGB Images using 3D Prototypes [5.2] RGB画像の1つのフレームワークに検出とポーズ推定を統合する統一モデルを導入する。
提案手法は,REAL275におけるRGBカテゴリレベルのポーズ推定における最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:57:39 GMT)
GenKnowSub: Improving Modularity and Reusability of LLMs through General Knowledge Subtraction [5.2] 本稿では,一般的な知識とタスク固有の適応の絡み合いを解消するモジュラーフレームワークを提案する。
各タスク固有モジュールからこの一般知識成分を抽出することにより、タスク関連情報にのみ焦点をあてた残余モジュールを得る。
Phi-3モデルと標準Arrowをベースラインとして研究した結果,一般知識を用いて一貫した性能向上が得られることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:29:40 GMT)
Mapillary Vistas Validation for Fine-Grained Traffic Signs: A Benchmark Revealing Vision-Language Model Limitations [5.2] Mapillary Vistas Validation for Traffic Signs (MVV) と呼ばれるMapillaryデータセットから得られた交通信号に対する新しい検証セットを提案する。
データセットにはピクセルレベルのインスタンスマスクが含まれており、専門家アノテータによって手動でアノテートされ、ラベルの忠実さが保証されている。
我々は、このデータセット上の自己教師型DINOv2モデルに対して、最先端のVLMをベンチマークし、DINOv2が全てのVLMベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:29:06 GMT)
Quantum Phase Transitions between Symmetry-Enriched Fracton Phases [5.1] 位相的に順序付けられた位相は、グローバル対称性の存在においてさらなる複雑さを示す。
有限結合を持つテンソルネットワーク状態(isoTNS)を用いて3次元フラクトン相の類似状況を研究する。
提案手法は,エキゾチックトポロジカルあるいはフラクトン秩序で位相を拡大し,正確な波動関数で3次元量子相転移を研究するための構成を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:37:05 GMT)
Real-Time Audio-Visual Speech Enhancement Using Pre-trained Visual Representations [5.1] 本稿では,リアルタイム音声-視覚音声強調(AVSE)システムであるRAVENを提案する。
干渉する話者と背景雑音を抑えながら、画面上のターゲットスピーカを分離し、強化する。
我々の知る限り、これはリアルタイムAVSEシステムの最初のオープンソース実装である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:20:43 GMT)
Real-World Evaluation of Protocol-Compliant Denial-of-Service Attacks on C-V2X-based Forward Collision Warning Systems [5.1] 本稿では,ユーザデータグラムプロトコル(UDP)フラッディングとBSM(Basic Safety Message)アタックを用いたプロトコル準拠のDoS(DoS)アタックの現実的評価について述べる。
UDPフラッディング単独では、パケット配信比が最大87%削減され、400ms以上のレイテンシが向上する一方、過大なBSMフラッディングはレシーバ処理リソースをオーバーロードする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:20:45 GMT)
Investigating Robotaxi Crash Severity with Geographical Random Forest and the Urban Environment [5.0] 本稿では,都市建設環境の局所的な機械学習とマクロ測度を用いて,自律走行車(AV)の衝突重大度を定量的に検討する。
土地利用は、交差点、建物の足跡、公共交通機関の停留所、および利益のポイント(POI)と比較して、最も重要な予測者であった。
AVの事故は、住宅地よりも多様性と商業活動の大きい都市中心部で、低重大な事故が引き起こされる可能性が高かった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:59:12 GMT)
Contrast-Invariant Self-supervised Segmentation for Quantitative Placental MRI [4.9] マルチエコーT2*重み付きMRIにおける相補的情報を活用するコントラスト拡張セグメンテーションフレームワークを提案する。
本手法は, (i) ラベルなしマルチエコスライスを用いた自己教師付き事前学習のためのマスク付き自動符号化 (MAE) , (ii) 教師なしドメイン適応のためのマスク付き擬似ラベル化 (MPL) , (iii) 微細な特徴をグローバルな解剖学的文脈と整合させるグローバルな局所的コラボレーションとを統合した。
臨床用マルチエコープラテンタルMRIデータセットを用いた実験により, エコー時間および単一エコーおよびナイーブ核融合の効率良く一般化できることが判明した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:50:47 GMT)
WhoFi: Deep Person Re-Identification via Wi-Fi Channel Signal Encoding [4.8] 我々は、Wi-Fi信号を使って人物の再識別を行う新しいパイプラインであるWhoFiを紹介する。
生体計測機能はチャネル状態情報(CSI)から抽出され、トランスフォーマーベースのエンコーダを備えたモジュラーディープニューラルネットワーク(DNN)を介して処理される。
NTU-Fiデータセットを用いた実験により,本手法は最先端手法と比較して,競合的な結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:21:26 GMT)
Revisit Choice Network for Synthesis and Technology Mapping [4.8] 本稿では、ネットワークベースの合成とマッピングの新しい選択フローであるCristalを紹介する。
クリスティーナはより少ないが高品質な選択を構成できる。
実験の結果,Cristalは最先端のBoolean選択ネットワーク構築よりも優れていた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:09:10 GMT)
Protego: User-Centric Pose-Invariant Privacy Protection Against Face Recognition-Induced Digital Footprint Exposure [4.8] Clearview AIやPIMEyesのようなサービスは、誰でも顔写真をアップロードして、その人物に関連する大量のオンラインコンテンツを検索できる。
これはID推論を可能にするだけでなく、ソーシャルメディアの活動、プライベート写真、ニュースレポートなどのデジタルフットプリントを、同意なしに公開する。
本稿では,ユーザ中心のプライバシ保護手法であるProtegoを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:03:01 GMT)
Pilot-reference-free continuous-variable quantum key distribution with efficient decoy-state analysis [4.7] 光コヒーレント検出器を用いた連続可変量子鍵分布(CV QKD)は、実質的に好ましい。
CV QKDのセキュリティ解析とパラメータ推定は無限次元の潜在ヒルベルト空間のために複雑である。
本稿では,一般的なコヒーレント攻撃下での位相エラーに基づくセキュリティ解析を簡易に行う時間ビン符号化CVプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:40:17 GMT)
Uncertainty Estimation for Novel Views in Gaussian Splatting from Primitive-Based Representations of Error and Visibility [4.7] ガウスめっきにおける不確実性推定(UE)の新しい手法を提案する。
本手法は,有意義な不確実性情報を伝達する,誤りの原始表現とトレーニングビューの可視性を確立する。
我々のUEは、特に前景オブジェクトにおいて、真のエラー、最先端の手法よりも高い相関関係を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:02:20 GMT)
The Complexity of Extreme Climate Events on the New Zealand's Kiwifruit Industry [4.7] 本研究では,気候が引き起こす極端事象,特に凍土,干ばつ,極端降雨,熱波がキウイフルーツ収量に及ぼす影響について検討する。
これらの4つのイベントは、日本の気候監視機関が記録した、作物の生産性とそれらの有病率に大きな影響があることから選ばれた。
分析の結果,極端事象の種類がキウイフルーツの収量にどのように影響するかが明らかとなった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:24:30 GMT)
Advancing Supervised Local Learning Beyond Classification with Long-term Feature Bank [4.6] ローカル学習は、ディープニューラルネットワークにおける従来のエンドツーエンドのバックエンドの代替手段を提供する。
画像分類タスクには有望性を示しているが、他の視覚タスクへの拡張は限られている。
この研究は、局所的な学習手法の分類を超えた最初の成功例である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:02:44 GMT)
Tree-of-Code: A Tree-Structured Exploring Framework for End-to-End Code Generation and Execution in Complex Task Handling [4.6] Tree-of-Codeは1/4回転未満でCodeActよりも精度を20%近く向上させる。
いくつかのLDMは、マルチターンのCodeActよりも、1ターンのCodeProgramの方がパフォーマンスが良い。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:15:22 GMT)
Generative AI as a Pillar for Predicting 2D and 3D Wildfire Spread: Beyond Physics-Based Models and Traditional Deep Learning [4.6] 森林火災はますます人間の生活、生態系、インフラを脅かす。
既存の物理モデルとディープラーニングモデルは、2Dドメインと3Dドメインにまたがる動的な山火事を捉えるのに苦労している。
本稿では,生成型人工知能(AI)モデルが山火事の予測とシミュレーションの変換ツールとして機能するかを考察する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 00:09:46 GMT)
Agentic LMs: Hunting Down Test Smells [4.5] テストの臭いはテストスイートの信頼性を低下させ、メンテナンスを複雑にする。
本研究は, 比較的少人数のモデルを用いて, 試験臭の検出能力について検討した。
実世界のJavaプロジェクトの5つの一般的な臭いを150件以上のインスタンスで1つ、2つ、4つのエージェントで評価します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:08:12 GMT)
Flow Sensitivity without Control Flow Graph: An Efficient Andersen-Style Flow-Sensitive Pointer Analysis [4.5] フローセンシティブなポインタ分析は、エイリアス解析、テイント分析、プログラム理解、コンパイラ最適化などに広く使われている。
制御フローグラフに基づく既存のフローセンシティブなポインタ解析手法は,ポインタ解析の精度を大幅に向上させた。
制御フローグラフ解析の非効率性を克服するフローセンシティブなポインタ解析であるCG-FSPTAを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:20:54 GMT)
Collaborative Medical Triage under Uncertainty: A Multi-Agent Dynamic Matching Approach [4.5] パンデミック後の医療需要の急増と重度の介護不足は、医療トリアージシステムに前例のない圧力を与えている。
我々は、現在のAIベースのトリアージシステムにおける3つの基本的な課題に対処する、医療トリアージのためのマルチエージェントインタラクティブなインテリジェントシステムを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:40:38 GMT)
Distributed quantum sensing with multi-mode $N00N$ states [4.5] マルチモードの$N00N$状態を用いてハイゼンベルクスケーリングを実現する分散量子センシング方式を提案する。
実験では,2つの空間分布位相の平均を推定するために,4モードの2002ドル状態を用いる。
分散量子センシングにおける多モード$N00N$状態の利用は、絡み合い強化センサネットワークを開発する上で有望なアプローチであると考えている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:20:08 GMT)
Dynamic Order Template Prediction for Generative Aspect-Based Sentiment Analysis [4.4] ABSAはテキスト内の特定の側面に対する感情を評価し、詳細な感情をもたらす。
以前のABSAモデルはインスタンス内のすべての要素を予測するために静的テンプレートを使用することが多い。
本稿では,インスタンス毎に動的に生成するABSAの動的順序テンプレート(DOT)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:14:13 GMT)
Lyapunov Analysis For Monotonically Forward-Backward Accelerated Algorithms [4.4] ネステロフの加速勾配法(NAG)は勾配に基づく最適化の目覚ましい進歩である。
強凸函数に対しては、NAG が線型収束するかどうかは開問題である。
我々は、勾配項を導入して反復関係を修正し、新しい勾配に基づく反復関係を導出する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:42:45 GMT)
Everyone Contributes! Incentivizing Strategic Cooperation in Multi-LLM Systems via Sequential Public Goods Games [4.4] 多エージェント協調系列公共財ゲーム(MAC-SPGG)
マルチLLMアンサンブルにおける協調を体系的に動機付けるための,ゲーム理論に基づく新しい強化学習フレームワークを提案する。
本研究は,スケーラブルで堅牢なマルチエージェント言語生成のための構造的,インセンティブに整合したMAC-SPGG協力の力を強調した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:36:07 GMT)
mCardiacDx: Radar-Driven Contactless Monitoring and Diagnosis of Arrhythmia [4.4] 不整脈(英: arrhythmia)は、時間的介入なしに重篤な合併症を発症させる一般的な心疾患である。
既存の非接触モニタリングは、主に健常者向けに設計されており、不整脈患者の反射信号を分析する際に重大な課題に直面している。
不整脈モニタリングと診断のために、反射信号を正確に解析し、心臓脈波形を再構成するレーダー駆動接触レスシステムであるmCardiacDxを導入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:40:56 GMT)
Dialogue Systems Engineering: A Survey and Future Directions [4.4] ソフトウェア工学に基づいて対話システム工学の知識領域を列挙する。
我々は,各分野の未探索トピックを特定し,対話システム工学の今後の方向性について議論する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:49:01 GMT)
Research Knowledge Graphs in NFDI4DataScience: Key Activities, Achievements, and Future Directions [4.3] NFDI4DataScienceがResearch Knowledge Graphs(RKG)を開発し提供
RKGは複雑なデータセット、モデル、ソフトウェア、科学出版物をキャプチャして接続することを目的としている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:11:51 GMT)
Double descent: When do neural quantum states generalize? [4.2] ニューラル量子状態(NQS)は、量子多体物理学の数値的研究に柔軟な波動関数のパラメータ化を提供する。
NQSは、現代のディープラーニングの重要な特徴である二重降下現象を示す。
発見は対称性を意識した物理インフォームドアーキテクチャ設計の必要性を示唆している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:16:06 GMT)
Accurate and Interpretable Postmenstrual Age Prediction via Multimodal Large Language Model [4.2] 命令チューニングとローランド適応(LoRA)を用いたパラメータ効率細調整(PEFT)戦略を提案する。
トレーニングと推論に異なるプロンプトを用いることで、MLLMはトレーニング中に回帰タスクを処理し、推論中に臨床的に関連する説明を生成することができる。
微調整されたモデルでは、95%の信頼区間が 0.78 から 1.52 週間の低い予測誤差を達成し、一方で、発達的特徴に基づく解釈可能な出力を生成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:35:36 GMT)
Experimental Evaluation of Post-Quantum Homomorphic Encryption for Privacy-Preserving V2X Communication [4.2] ホモモルフィック暗号化(HE)は、基盤となるコンテンツを明らかにすることなく、暗号化されたデータの計算を可能にする、有望なソリューションを提供する。
本研究は、量子後安全な3つのHEスキームに関する実世界の実験評価である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:28:19 GMT)
Isolating Culture Neurons in Multilingual Large Language Models [4.1] 言語特異的ニューロンを同定し、それを培養特異的ニューロンの局在化と分離に拡張する。
実験を容易にするために、6つの文化にまたがる8520万のトークンからなるキュレートデータセットであるMURELを紹介した。
我々の局所化と介入実験は、LLMが神経集団の異なる文化をコードしていることを示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:41:10 GMT)
Detecting COPD Through Speech Analysis: A Dataset of Danish Speech and Machine Learning Approach [4.1] 慢性閉塞性肺疾患(慢性閉塞性肺疾患、COPD)は、世界中の数百万人に影響を与える重篤で不安定な疾患である。
本研究は,COPD医療ソリューションの一部として,非侵襲的,遠隔的,スケーラブルなスクリーニングツールとしての音声分析の可能性を支持する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:44:07 GMT)
Coherent Multimodal Reasoning with Iterative Self-Evaluation for Vision-Language Models [4.1] 大規模言語モデル (LLMs) と視覚言語モデル (LVLMs) は複雑で多段階のクロスモーダルな常識推論タスクに苦しむ。
我々は,LVLMの共通感覚推論能力を高める新しいアプローチであるコヒーレント・マルチモーダル推論フレームワーク(CMRF)を提案する。
CMRFは複雑なクエリを分解し、ステップバイステップの推論を生成し、エラーを自己修正することで人間の問題解決を模倣する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:33:58 GMT)
GRILL: Gradient Signal Restoration in Ill-Conditioned Layers to Enhance Adversarial Attacks on Autoencoders [4.0] GRILLは、不条件層における勾配信号を復元し、より効果的なノルムバウンド攻撃を可能にする手法である。
本手法は敵攻撃の有効性を著しく向上させ,より厳密なAEロバスト性評価を可能にした。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:48:28 GMT)
Actionable Counterfactual Explanations Using Bayesian Networks and Path Planning with Applications to Environmental Quality Improvement [4.0] そこで本研究では,実効的対実的説明のための手法を開発した。
データは密度推定器の学習にのみ使用される。
実環境保護庁のデータセットを用いて,本アルゴリズムを検証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:20:50 GMT)
Noosemia: toward a Cognitive and Phenomenological Account of Intentionality Attribution in Human-Generative AI Interaction [4.0] 本稿では,ヒトと生成型AIシステムとの相互作用から生じる新しい認知・現象現象であるNoosemiaを紹介し,形式化する。
特定の条件下では、ユーザが意図性、エージェンシー、さらにはシステムの内部性をどう評価するかを説明するための多分野のフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:10:08 GMT)
CharBench: Evaluating the Role of Tokenization in Character-Level Tasks [3.9] CharBenchは、既存の選択肢よりも2桁大きい文字レベルのタスクのベンチマークである。
本稿では,単語の固有性とそのトークンへのセグメンテーションがモデル性能にどのように対応するか分析する。
タスク数をカウントする際、トークン化特性は正確さと弱い相関があるのに対し、クエリされた単語の長さと実際の文字数はより重要な役割を担っている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:46:15 GMT)
An Evolving Scenario Generation Method based on Dual-modal Driver Model Trained by Multi-Agent Reinforcement Learning [3.9] 背景車両(BV)間の協調的対向駆動特性は、安全クリティカルなシナリオの効率的な生成に寄与する。
本稿では,マルチエージェント強化学習(MARL)法を用いて,非対角駆動モードと対向駆動モードを持つデュアルモードドライバモデル(Dual-DM)を訓練し,生成する。
生成された進化シナリオは、忠実度、テスト効率、複雑さ、多様性の観点から評価されます。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:42:30 GMT)
Emergence of Fair Leaders via Mediators in Multi-Agent Reinforcement Learning [3.9] Stackelbergゲームとその結果として得られる均衡は、多エージェント強化学習文学において注目を集めている。
リーダー選択プロセスのバイアスは、不公平な結果をもたらす可能性がある。
仲介者の存在は、公正な行動をとる利己的なエージェントにつながり、結果として、エージェントのリターンの全体的公正性が高くなることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:42:45 GMT)
Subject or Style: Adaptive and Training-Free Mixture of LoRAs [3.8] EST-LoRAは、トレーニングレス適応型LoRA融合法である。
行列のアンダーラインエナジー、アンダーラインスタイルの離散性スコア、アンダーラインタイムステップの3つの重要な要素について考察する。
定性評価と定量的評価の両方において最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:05:18 GMT)
medDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support [3.8] medDreamerは、パーソナライズされた治療レコメンデーションのための新しいモデルベースの強化学習フレームワークである。
不規則なデータから潜伏した患者の状態をシミュレートし、実と想像の軌跡のハイブリッドで訓練された2段階のポリシーを定めている。
これは、臨床結果と非政治指標の両方において、モデルフリーおよびモデルベースベースラインを著しく上回る。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:42:18 GMT)
OptiHive: Ensemble Selection for LLM-Based Optimization via Statistical Modeling [3.8] 我々は,反復的な自己言語を使わずに,自然補正記述から高品質な問題解決を行うフレームワークOptiHiveを紹介した。
OptiHiveは単一のバッチLLMクエリを使用して、さまざまなコンポーネント(ソルバ、問題インスタンス、バリデーションテスト)を生成し、誤ったコンポーネントをフィルタリングして完全に解釈可能な出力を保証する。
従来の最適化問題からMulti-Depot Vehicle Routing Problemの変種への挑戦に至るまでのタスクにおいて、OptiHiveはベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:11:51 GMT)
Precision-Aware Video Compression for Reducing Bandwidth Requirements in Video Communication for Vehicle Detection-Based Applications [3.8] 本稿では,PAVC(Precision-Aware Video Compression)というフレームワークを紹介する。
PAVCは、現在の天気や照明条件に基づいて映像圧縮レベルを動的に調整し、車両検出精度を維持する。
その結果,PAVCは車両検出精度を最大13%向上し,通信帯域幅が適度なエリアでは最大8.23倍削減できることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:41:52 GMT)
A resource-efficient quantum-walker Quantum RAM [3.7] 我々は、量子クエリの最適な複雑さのスケーリングを保ちながら、リソース要求を大幅に削減する新しいアーキテクチャを導入する。
従来の提案と異なり,アルゴリズム設計では,局所的なユニタリ演算のみに基づく,単純かつ反復的な操作ブロックを利用する。
この新しいアプローチは、必要な操作の複雑さを減らし、実験的な要件を単純化するだけでなく、アーキテクチャのスケーラビリティも強化する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:29:49 GMT)
Multi-Treatment-DML: Causal Estimation for Multi-Dimensional Continuous Treatments with Monotonicity Constraints in Personal Loan Risk Optimization [3.7] 既存の因果的手法は、主にバイナリ/離散的処理を扱い、連続した多次元的な設定に苦しむ。
本稿では,DML(Double Machine Learning)を利用した任意の次元連続処理のための新しいフレームワークであるMulti-Treatment-DMLを提案する。
公開ベンチマークと実世界の産業データセットに関する大規模な実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:27:50 GMT)
Multi-class Image Anomaly Detection for Practical Applications: Requirements and Robust Solutions [3.6] 異常検出のすべての要件を満たすために階層型コアセット(HierCore)を提案する。
HierCoreはクラスラベルなしでも効果的に動作し、階層型メモリバンクを利用してクラスワイド決定基準を推定する。
その結果、HierCoreはすべての要件を一貫して満たし、すべての設定で強力な安定したパフォーマンスを維持していることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:44:40 GMT)
Landauer Principle and Thermodynamics of Computation [3.6] 我々はランダウアー境界の最近の進歩を概観する。これは計算の熱力学の基本的な原理である。
また,情報処理や計算に欠かせない誤り訂正の熱力学的側面についても論じる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:26:36 GMT)
Do Edges Matter? Investigating Edge-Enhanced Pre-Training for Medical Image Segmentation [3.6] 既存の研究では、事前訓練および微調整された基礎モデルによってセグメンテーション性能が向上することが示されている。
本研究では,特定の画像前処理ステップが,異なる医用画像モダリティのセグメンテーション性能にどのように影響するかを検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:52:42 GMT)
Understanding the Essence: Delving into Annotator Prototype Learning for Multi-Class Annotation Aggregation [3.5] 既存の最先端の手法は通常、混乱行列を用いて各アノテータの専門知識をモデル化する。
そこで本研究では,新しい混乱行列法であるPTBCCを提案し,プロトタイプ学習によるより信頼性の高いアノテータ推定手法を提案する。
PTBCCは、ベストケースで最大15%の精度を達成し、計算コストを90%以上削減しながら平均精度を3%向上させる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:04:58 GMT)
Enhancing OOD Detection Using Latent Diffusion [3.5] Out-of-Distribution(OOD)検出は、現実のシナリオにおけるマシンラーニングモデルの信頼性の高いデプロイに不可欠である。
近年の研究では、安定拡散のような生成モデルを用いて、画素空間の外部値データを合成する方法が検討されている。
我々は,潜伏空間内でOOD学習データを生成する新しいフレームワークであるOutlier-Aware Learning (OAL)を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:28:05 GMT)
Beyond the Visible: Multispectral Vision-Language Learning for Earth Observation [3.5] Llama3-MS-CLIPは、大規模なマルチスペクトルデータセット上で、コントラスト学習で事前訓練された最初の視覚言語モデルである。
我々は,100万個のSentinel-2サンプルからなるマルチスペクトルデータに対して,これまでで最大の画像キャプチャーデータセットを提案する。
Llama3-MS-CLIPを多スペクトルゼロショット画像分類と3つの複雑さのデータセットを用いた検索で評価した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:00:28 GMT)
Learning telic-controllable state representations [3.5] 有界エージェントにおける状態表現学習のための計算フレームワークを提案する。
本稿では, テリック状態表現の粒度と, 全てのテリック状態に到達するために必要な政策複雑性とのトレードオフを特徴付ける, テリック制御可能性の概念を紹介する。
当社のフレームワークでは,目標の柔軟性と認知的複雑性のバランスをとる状態表現の学習において,意図的な無知(無視すべきことを知る)の役割を強調しています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:02:53 GMT)
Evaluating Position Bias in Large Language Model Recommendations [3.4] 大規模言語モデル(LLM)は、リコメンデーションタスクのための汎用ツールとして、ますます研究されている。
LLMをベースとした推薦モデルは位置バイアスに悩まされ、その場合、プロンプト内の候補項目の順序がLLMの推薦に不均等に影響を及ぼす可能性がある。
本稿では,LLMレコメンデーションモデルにおける位置バイアスを軽減するための新たなプロンプト戦略であるRightingをIterative Selection経由で導入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:30:26 GMT)
Abstract Sound Fusion with Unconditional Inversion Models [3.4] 抽象音は、リスナーに特定可能な実世界の音のイベントを開示しない。
音融合は、原音と基準音を合成して、音成分の単なる付加的な重ね合わせ以上の聴覚的特徴を示す新しい音を生成することを目的としている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:12:17 GMT)
A Multi-Agent System for Complex Reasoning in Radiology Visual Question Answering [3.4] 放射線画像質問応答(RVQA)は胸部X線画像に関する質問に対して正確な回答を提供する。
近年,マルチモーダル大言語モデル (MLLM) と検索拡張生成 (RAG) に基づく手法がRVQAの進歩に寄与している。
RVQAにおける複雑な推論を支援するために,マルチエージェントシステム(MAS)を導入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:09:52 GMT)
From Neurons to Computation: Biological Reservoir Computing for Pattern Recognition [3.3] 我々は、培養された生体ニューロンのプールを貯水池基質として活用し、生物貯水池コンピューティング(BRC)を作成する貯水池コンピューティング(RC)のパラダイムを導入する。
このシステムはエコー状態ネットワーク(ESN)と同様に動作し、神経活動が培養されたニューロンのネットワークによって生成されることが鍵となる。
結果は、従来のニューラルネットワークで処理されるタスクを実行するために、生物学的ニューラルネットワークを使用することの可能性を示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:37:42 GMT)
GPU in the Blind Spot: Overlooked Security Risks in Transportation [3.3] この記事では、輸送サイバーセキュリティにおける重要な盲点として、GPUセキュリティを強調します。
この懸念をサポートするために、重要なAIワークロードに対するステルスな不正暗号マイナーの影響を示すケーススタディも提示されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:25:43 GMT)
MicroMix: Efficient Mixed-Precision Quantization with Microscaling Formats for Large Language Models [3.3] 量子化は大規模言語モデル(LLM)の推論を著しく加速する
近年のウェイトアクティベーション量子化の進歩は、主にウェイトとアクティベーションの両方をINT4フォーマットにマッピングすることに焦点を当てている。
マイクロスケーリング(MX)データフォーマットをベースとした混合精度量子化アルゴリズムと行列乗算カーネルであるMicroMixを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:22:39 GMT)
TRUDI and TITUS: A Multi-Perspective Dataset and A Three-Stage Recognition System for Transportation Unit Identification [3.3] このデータセットは、コンテナ、タンクコンテナ、トレーラー、IDテキスト、ロゴの5つのカテゴリにまたがる35,034のアノテーション付きインスタンスで構成されている。
写真は地上カメラと空中カメラの両方を使用して、様々な照明と気象条件下で運用港で撮影された。
TITUSは,(1)TUインスタンスのセグメント化,(2)IDテキストの位置検出,(3)抽出したIDの認識と検証の3段階からなる専用パイプラインである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:02:04 GMT)
MIDAR: Mimicking LiDAR Detection for Traffic Applications with a Lightweight Plug-and-Play Model [3.3] MIDARは、交通シミュレータから容易に利用できる車両レベルの特徴を用いて、現実的なLiDAR検出を近似するLiDAR検出模倣モデルである。
MIDAR は nuScenes AD データセット上で CenterPoint が生成した検出結果を近似することで 0.909 の AUC を達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:35:05 GMT)
AeroSafe: Mobile Indoor Air Purification using Aerosol Residence Time Analysis and Robotic Cough Emulator Testbed [3.2] 本稿では,室内空気浄化システムの有効性向上を目的とした新しいアプローチであるAeroSafeを紹介する。
これには、ロボットコークスエミュレータのテストベッドと、デジタルツインズに基づくエアロゾルの滞留時間分析が含まれる。
その結果,35秒以内の平均滞留時間予測誤差でエアロゾル濃度を予測できることが示された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:11:37 GMT)
LayoutCoT: Unleashing the Deep Reasoning Potential of Large Language Models for Layout Generation [3.2] 条件付きレイアウト生成は、ユーザが定義した制約から視覚的に魅力的でセマンティックに一貫性のあるレイアウトを自動的に生成することを目的としている。
本稿では,Large Language Models (LLMs) の推論能力を活用する新しい手法として,検索型拡張生成(RAG) とChain-of-Thought (CoT) 技術の組み合わせを提案する。
我々は3つの条件付きレイアウト生成タスクにまたがる5つの公開データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:35:07 GMT)
Adaptive Augmentation Policy Optimization with LLM Feedback [3.0] データ拡張はディープラーニングパイプラインの重要なコンポーネントであり、データセットの多様性を高めてモデルの一般化を強化する。
従来の拡張戦略は手動で設計した変換、分類サンプリング、あるいは自動検索ベースのアプローチに依存している。
本稿では,モデル性能フィードバックに基づいて拡張ポリシーを改良するLarge Language Model (LLM)誘導拡張最適化戦略を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:23:56 GMT)
Trustworthy scientific inference for inverse problems with generative models [3.0] 生成人工知能(AI)は、トレーニング例からパターンを学習することで、複雑なデータ構造(テキスト、画像、ビデオ)を生成できる。
科学の分野では、研究者は観測データから隠れたパラメータを推測するために生成モデルを適用している。
本稿では,Frequentist-Bayes(FreB)という,AI生成した確率分布を信頼領域に再認識する数学的厳密なプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:56:11 GMT)
Toward a reliable PWM-based light-emitting diode visual stimulus for improved SSVEP response with minimal visual fatigue [2.9] 定常状態視覚誘発応答(SSVEP)は、脳コンピュータなどの視覚的診断や応用に広く用いられている。
点滅型視覚刺激を用いてSSVEPを得る際の大きな障害の1つは、眼疲労である。
様々な研究が、視覚刺激の頻度を利用して視覚疲労を減らすことを示唆しているが、その結果、応答性能は低下する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:48:59 GMT)
Gandalf the Red: Adaptive Security for LLMs [2.9] 大規模言語モデル(LLM)アプリケーションにおける即時攻撃に対する防衛の現在の評価は、敵の行動の動的性質と、制限された防御によって正統なユーザに対して課されるユーザビリティの罰の2つの重要な要素を見落としている。
攻撃者を正当なユーザから明確に分離し、マルチステップインタラクションをモデル化し、最適化可能な形式でセキュリティユーティリティを表現するD-SECを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:37:00 GMT)
AutoGeTS: Knowledge-based Automated Generation of Text Synthetics for Improving Text Classification [2.9] 我々は、大規模な言語モデル(LLM)を用いて合成データを生成し、そのようなデータを用いて、よりリアルなデータが収集されラベル付けされるのを待たずに、モデルの性能を向上させる。
本研究では,3つの探索戦略を広範囲な実験で検討し,実験結果を用いて,クラスの特徴に応じて探索戦略を選択するアンサンブルアルゴリズムについて報告する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:53:20 GMT)
End-to-End Protocol for High-Quality QAOA Parameters with Few Shots [2.9] 我々は,複数のパラメータ設定と微調整技術を組み合わせたエンドツーエンドプロトコルを開発した。
最大32キュービットと5QAOA層を用いたトラップイオンプロセッサを実装した。
パイプラインは少量のハードウェアノイズに対して堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:10:11 GMT)
SoK: Stablecoins for Digital Transformation -- Design, Metrics, and Application with Real World Asset Tokenization as a Case Study [2.8] ファイアットが参照し、プログラム可能な資産として、安定コインは低レイテンシ、グローバルに相互運用可能な支払いインフラ、分散金融、DeFi、トークン化コマースを提供する。
この勢いにもかかわらず、学術研究は、設計、評価、応用のための統一された枠組みが欠如している、経済学、法学、コンピュータ科学で断片化されている。
本研究は, 系統構造, 安定化機構, ガバナンスに基づいて, 学際的な文献を合成し, 安定した体系の分類を構築した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:27:16 GMT)
Density matrix representation of hybrid tensor networks for noisy quantum devices [2.8] シミュレーション量子系の大きさの展開を記述するための拡張演算子を提案する。
観測可能な観測値の期待値は、縮約された量子テンソルの数で指数関数的に消えることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:36:20 GMT)
On the Theory and Practice of GRPO: A Trajectory-Corrected Approach with Fast Convergence [2.8] Group Relative Policy Optimizationは、批判のない強化学習アルゴリズムである。
GRPO更新規則は,現行の方針よりも旧方針の政策勾配を推定する。
軌道レベルの重要度補正 GRPO という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:01:19 GMT)
Symbolic Learning of Interpretable Reduced-Order Models for Jumping Quadruped Robots [2.8] 本稿では,特にジャンプのための解釈可能な動的モデルを導出するための新しい手法を提案する。
我々は,SINDy(Sparse Identification of Dynamics)とジャンプダイナミクスの物理構造的先行性を組み合わせた学習アーキテクチャを提案することにより,低次元潜在空間における高次元非線形ジャンプダイナミクスを捉える。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:33:51 GMT)
Automatic Identification of Machine Learning-Specific Code Smells [2.8] 本研究は、コードの臭いの基準に基づいて静的コード解析ツール(MLpylint)を設計・開発するための適切な方法とツールについて検討する。
GitHubからソースされた160のオープンソースMLアプリケーションのデータに基づいて、このツールを評価した。
その結果,MLpylintの有効性と有用性を示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:51:15 GMT)
Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction [2.7] アニメーションデータは、複数のカメラを用いて光学マーカーの位置を確立する光学的モーションキャプチャシステムを通して取得されることが多い。
これは、マーカー再構成の欠如に対する機械学習ベースのソリューションへの関心を喚起した。
この分野の進展を推し進める、より相関性の高い指標のセットを導入し、評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:10:44 GMT)
Welcome New Doctor: Continual Learning with Expert Consultation and Autoregressive Inference for Whole Slide Image Analysis [2.7] 全スライド画像(WSI)解析は癌診断と予後において重要な役割を担っている。
WSIは、予測モデルを処理し、訓練するために、かなりのストレージと計算資源を必要とする。
診療所や病院で使われるWSIの急速な増加に伴い、既存のモデルを新しいタスクに効率よく処理し、適応できる継続的な学習システムの必要性が高まっている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:11:51 GMT)
Learning Dynamics of Meta-Learning in Small Model Pretraining [2.7] 我々は,一階のMAMLとサブセットメイクLM事前学習を統合した。
LLama-style decoder-only model(11M-570M params) を4つの生成する。
多くの設定や実世界のアプリケーションで基本的なNLPタスクで評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:34:30 GMT)
PhishParrot: LLM-Driven Adaptive Crawling to Unveil Cloaked Phishing Sites [2.6] PhishParrotはクローキング技術に対抗するために設計されたクローリング環境最適化システムである。
21日間の評価では、PhishParrotは標準分析システムよりも最大33.8%精度が向上した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:04:07 GMT)
Model-Independent Machine Learning Approach for Nanometric Axial Localization and Tracking [2.6] 本稿では、二重焦点平面画像から軸座標を決定できる畳み込みニューラルネットワーク(CNN)を用いた深層学習手法を提案する。
本手法は従来の単焦点平面法よりも40ナノメートルの軸方向定位精度を6倍に向上させる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:42:09 GMT)
RefineSeg: Dual Coarse-to-Fine Learning for Medical Image Segmentation [2.6] 医用画像の高品質なピクセルレベルのアノテーションは、教師付きセグメンテーションタスクに不可欠である。
粗いレベルのアノテーションに完全に依存する新しい粗いセグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:14:30 GMT)
ranDecepter: Real-time Identification and Deterrence of Ransomware Attacks [2.6] ランサムウェア(Ransomware, RW)は、デジタルランドスケープにおいて、重要かつ広範な脅威である。
RWは、しばしば攻撃者と防御者の間の通信路として機能する。
本稿では,アクティブなサイバー詐欺とリアルタイム分析を組み合わせた新しいアプローチであるrunDecepterを紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:07:09 GMT)
What Is Your AI Agent Buying? Evaluation, Implications and Emerging Questions for Agentic E-Commerce [2.6] 視覚言語モデル(VLM)エージェントは、Webページを解析し、製品を評価し、取引することができる。
これは、AIエージェントが何を買うのか、なぜ何を買うのか、という根本的な疑問を提起する。
プラットフォームに依存しないVLMエージェントと完全にプログラム可能なモックマーケットプレースを組み合わせたサンドボックス環境であるACESを開発した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:19:36 GMT)
Rainbow chains and numerical renormalisation group for accurate chiral conformal spectra [2.6] 指数的に減衰する項を持つ共形臨界鎖の絡み合いスペクトルは、関連するキラルCFTの共形塔からなることを示す。
これらの絡み合いスペクトルは、親ハミルトニアンにアクセスすることなく単一波動関数から詳細なCFTスペクトルを抽出する信頼性の高い方法を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:17:29 GMT)
DART-Eval: A Comprehensive DNA Language Model Evaluation Benchmark on Regulatory DNA [2.5] 大規模なゲノムDNA言語モデル(DNALM)は、多様なDNA要素の一般化可能な表現を学習することを目的としている。
本ベンチマークでは, 機能的配列の特徴探索, 細胞型特異的制御活性の予測, 遺伝的変異の影響の予測など, 生物学的に有意義な下流課題を対象としている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:56:32 GMT)
Thinking Outside the (Gray) Box: A Context-Based Score for Assessing Value and Originality in Neural Text Generation [2.5] 創造的なタスクのための大きな言語モデルは、しばしば多様性を欠いている。
高温でのサンプリングのような一般的なソリューションは、結果の品質を損なう可能性がある。
価値と独創性を定量的に評価する文脈に基づくスコアを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:39:29 GMT)
DiffSampling: Enhancing Diversity and Accuracy in Neural Text Generation [2.5] トークン確率分布の数学的解析を利用する新しい復号法であるDiffSamplingを提案する。
4つの異なるテキスト生成タスクを含む実験により、我々のアプローチは、少なくとも既存の方法と同等に、一貫して機能することを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:13:07 GMT)
Documenting Patterns of Exoticism of Marginalized Populations within Text-to-Image Generators [2.4] 我々は、GAIツールが示すように、世界の「グローバル・サウス」諸国のエキゾチックな取り組みを拡大する。
インド、バングラデシュ、パプアニューギニア、エジプト、エチオピア、チュニジア、スーダン、リビア、ベネズエラ、コロンビア、インドネシア、ホンジュラス、メキシコの13カ国から生成された画像を分析した。
我々は、エキゾシズムが単に「グローバル・サウス」の国々で行われているだけでなく、西洋の文脈においても人口の疎密化にもたらされていることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:27:18 GMT)
Detecting Visual Information Manipulation Attacks in Augmented Reality: A Multimodal Semantic Reasoning Approach [2.4] 我々は、拡張現実(AR)における視覚情報操作(VIM)の攻撃に焦点を当て、仮想コンテンツは現実世界のシーンの意味を微妙ながらインパクトのある方法で変化させる。
本稿では,これらの攻撃を,文字,フレーズ,パターン操作という3つの形式に分類し,情報置換,情報難読化,余分な誤った情報という3つの目的に分類する。
分類に基づいて、202の異なるシーンにまたがる452の生のARビデオペアからなるデータセットAR-VIMを構築した。
データセットの攻撃を検出するために,マルチモーダルなセマンティック推論フレームワークVIM-Senseを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:53:56 GMT)
How LLMs are Shaping the Future of Virtual Reality [2.4] LLM(Large Language Models)とVR(Virtual Reality)ゲームの統合は、没入型、適応型、インテリジェントなデジタルエクスペリエンスの設計におけるパラダイムシフトである。
本稿では,これらのモデルがどのように物語生成,非プレイヤーキャラクタ(NPC)インタラクション,アクセシビリティ,パーソナライゼーション,ゲームマスタリングを変換しているかを検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:29:35 GMT)
DIRF: A Framework for Digital Identity Protection and Clone Governance in Agentic AI Systems [2.4] デジタルクローン、洗練された偽造、およびアイデンティティ関連データの不正な収益化は、個人アイデンティティの完全性に重大な脅威をもたらす。
これらのリスクを緩和するには、堅牢なAI生成コンテンツ検出システム、強化された法的枠組み、倫理的ガイドラインの開発が必要である。
本稿では, 行動的, 生体的, 個性に基づくデジタル類似性属性を保護するために設計された, 構造化されたセキュリティおよびガバナンスモデルであるDigital Identity Rights Framework(DIRF)を紹介する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:27:14 GMT)
Hierarchical Multi-Label Contrastive Learning for Protein-Protein Interaction Prediction Across Organisms [2.4] タンパク質間相互作用予測のための階層的コントラストフレームワークであるHIPPOを提案する。
提案手法は、タンパク質の機能クラス間の構造的関係をエミュレートする階層的コントラスト損失関数を含む。
ベンチマークデータセットの実験では、HIPPOが最先端のパフォーマンスを達成し、既存のメソッドを上回り、低データのレシエーションにおいて堅牢性を示すことが示されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:32:04 GMT)
MedGNN: Capturing the Links Between Urban Characteristics and Medical Prescriptions [2.4] グラフニューラルネットワークにおける位置ノードと位置ノードの埋め込みを都市特性と統合したグラフニューラルネットワークMedGNNを提案する。
MedGNNはベースライン法と比較して平均25%以上予測を改善した。
これらの結果は、MedGNNが、より広く、慎重に機械学習を適用して、学際的な公衆衛生研究を進める可能性を示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:37:23 GMT)
Test Set Quality in Multilingual LLM Evaluation [2.3] 我々は,フランス語とテルグ語における最近の多言語評価セットを分析し,その過程におけるいくつかの誤りを同定した。
テストセットは不変と見なされるべきではなく、再検討され、正確性を確認し、潜在的にバージョン管理されるべきである、と私たちは主張する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:22:08 GMT)
Following Route Instructions using Large Vision-Language Models: A Comparison between Low-level and Panoramic Action Spaces [2.2] VLN(Vision-and-Language Navigation)は、自律型ロボットが自然言語の指示に従うことで、未知の環境をナビゲートすることを可能にする。
現行のVLNシステムはナビゲーション用に特別に設計され最適化されたモデルに依存しており、市販のLVLMの可能性を未調査のまま残している。
本稿では,市販のLVLMがVLNタスクを効果的にサポートできるのか,低レベルおよびパノラマ動作パラダイムの両方をサポートすることができるのかを検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:45:21 GMT)
Deep learning forecasts the spatiotemporal evolution of fluid-induced microearthquakes [2.2] 本研究では,4つの重要な量を予測するために,油圧刺激履歴と先行地震観測を取り入れた変圧器を用いた深層学習モデルを提案する。
これらの正確で不確実性の定量化された予測は、破壊伝播と透水性進化のリアルタイムな推測を可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:34:57 GMT)
REACT-KD: Region-Aware Cross-modal Topological Knowledge Distillation for Interpretable Medical Image Classification [2.2] 我々は,高忠実度マルチモーダルソースから軽量CTベースの学生モデルへリッチな監督を伝達するフレームワークREACT-KDを紹介した。
このフレームワークは二重教師設計を用いており、一方のブランチは二重軌跡PET/CTを用いて構造-機能関係をキャプチャし、他方のモデルでは低線量CTデータを合成分解して線量認識する。
PET/CTコホートでは平均93.4%のAUCを達成し、外部CT検査では76.6%から81.5%のAUCを維持している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:29:34 GMT)
Transformer Meets Twicing: Harnessing Unattended Residual Information [2.2] トランスフォーマーベースのディープラーニングモデルは、多くの言語やビジョンタスクで最先端のパフォーマンスを達成した。
自己注意機構は複雑なデータパターンを扱えることが証明されているが、注意行列の表現能力はトランスフォーマー層間で著しく低下する。
本研究では,NLM平滑化の低パス動作を軽減するため,非パラメトリック回帰におけるカーネルツイシング手順を用いた新しいアテンション機構であるTwicing Attentionを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:28:30 GMT)
A Message Passing Realization of Expected Free Energy Minimization [2.1] 本稿では,因子グラフ上の期待自由エネルギー(EFE)に対するメッセージパッシング手法を提案する。
我々は,解答可能な探索問題を,標準変分法を用いて抽出可能な推論問題に変換する。
因数化状態空間モデルにメッセージパッシング手法を適用することで、効率的なポリシー推論が可能になる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:48:37 GMT)
TransAM: Transformer-Based Agent Modeling for Multi-Agent Systems via Local Trajectory Encoding [2.1] 局所軌跡を埋め込み空間にエンコードする新しいトランスフォーマーモデルである textttTransAM を提案する。
協調型,競争型,混合型マルチエージェント環境における提案手法の性能評価を行った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:50:37 GMT)
Posterior Sampling of Probabilistic Word Embeddings [2.0] 単語埋め込みにおける不確実性の定量化は、テキストデータからの信頼できる推測に不可欠である。
本稿では,Polya-Gamma Augmentation とLaplace Approximation を用いたスケーラブルな Gibbs サンプリング手法を提案する。
Gibbsサンプルを米国議会とMovielensデータセットに適用することにより、より大規模な実データの実現可能性を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:20:17 GMT)
Shaping Sparse Rewards in Reinforcement Learning: A Semi-supervised Approach [2.0] Atariとロボット操作の実験結果から,提案手法は報酬推論における教師ありアプローチよりも優れていることが示された。
よりスパース・リワード環境では,教師付きベースラインに比べてピークスコアが最大2倍に達する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:39:48 GMT)
Enhancing Object Discovery for Unsupervised Instance Segmentation and Object Detection [2.0] COLERはゼロショットの教師なしモデルであり、複数のベンチマークで従来の最先端メソッドより優れている。
我々は、CutOnceが自己教師付きモデルのオブジェクト発見機能を完全に活用できるように、いくつかの新しい単純なモジュールを設計しました。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:10:39 GMT)
Pimba: A Processing-in-Memory Acceleration for Post-Transformer Large Language Model Serving [2.0] トランスフォーマーは、今日のLarge Language Models(LLM)の原動力であり、そのパフォーマンスと汎用性の基盤となっている。
これに対し、アルゴリズムコミュニティはステートスペースモデル(SSM)、線形アテンション、リカレントニューラルネットワーク(RNN)などの代替アーキテクチャを模索している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:03:27 GMT)
Neural Approximators for Low-Thrust Trajectory Transfer Cost and Reachability [1.9] 本稿では,低推力軌跡計測のための汎用事前学習ニューラルネットワークを提案する。
データは自己相似空間に変換され、ニューラルネットワークは任意の半大軸、傾斜、中心体に適応する。
得られたニューラルネットワークは、速度増加を予測する相対誤差が0.78%、最小転送時間推定が0.63%に達する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:25:46 GMT)
All Stories Are One Story: Emotional Arc Guided Procedural Game Level Generation [1.9] 本稿では,情緒的弧を構造的バックボーンとして組み込んだプロシージャゲーム物語生成の枠組みを提案する。
私たちは2つの中核的な感情パターン(ライズとフォール)に注目して、分岐したストーリーグラフの生成をガイドします。
本システムでは,大規模言語モデルと適応エンティティ生成を用いて感情弧を操作できることを実証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:27:55 GMT)
VisuCraft: Enhancing Large Vision-Language Models for Complex Visual-Guided Creative Content Generation via Structured Information Extraction [1.9] VisuCraftは、複雑な視覚誘導のクリエイティブコンテンツ生成におけるLVLM(Large Vision-Language Models)の機能を強化するために設計された、新しいフレームワークである。
この結果から,創造性や指示の順応性,視覚的基盤,ユーザ整合性のある長文の創造的テキスト作成における VisuCraft の有効性を検証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:36:55 GMT)
Adversarial flows: A gradient flow characterization of adversarial attacks [1.9] ニューラルネットワークに対する敵攻撃を行う一般的な方法は、いわゆる高速勾配符号法である。
我々は、離散化と関連する勾配流の収束性を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:28:18 GMT)
Effective AGM Belief Contraction: A Journey beyond the Finitary Realm (Technical Report) [1.7] 非有限論理におけるAGM収縮の計算可能性について検討する。
このような論理には無限に多くの計算不能な AGM 縮約関数が存在することを示す。
ファイニシャル領域を超えて計算可能性を制御するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:12:30 GMT)
Work extraction from long-lived quantum coherence of a three-level system [1.7] 3レベル量子系の長寿命量子コヒーレンスを用いて作業抽出プロトコルを解析する。
量子コヒーレンスは集団非対称性に変換され,作業抽出のための量子資源として機能することを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:03:40 GMT)
Test Amplification for REST APIs via Single and Multi-Agent LLM Systems [1.6] 既存のREST APIテストスイートを増幅するために,単一エージェントとマルチエージェントのセットアップである大規模言語モデル(LLM)システムについて検討する。
本稿では, テストカバレッジ, バグ検出の有効性, 計算コストやエネルギー使用量など, 様々な側面における2つのアプローチの比較検討を行う。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:18:21 GMT)
Beyond Manually Designed Pruning Policies with Second-Level Performance Prediction: A Pruning Framework for LLMs [1.6] 非均一な構造化ネットワークプルーニング手法は、冗長なチャネルやレイヤを排除することで、LLM(Large Language Model)のサイズを減らすことができる。
既存の一様でないメソッドは、手動で設計されたプルーニングポリシーに大きく依存している。
PPF(Predictive Pruning Framework)は,第2レベルの性能予測によって手作業による設計依存を解消する新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:08:35 GMT)
Transfer Learning with EfficientNet for Accurate Leukemia Cell Classification [1.6] 本研究では,事前訓練された畳み込みニューラルネットワーク(CNN)を用いた伝達学習を用いて診断性能を向上させることを目的とした。
1クラスあたり1万枚の画像のバランスのとれたトレーニングセットを作成するために、広範なデータ拡張手法を適用した。
効率の良いNet-B3は94.30%のF1スコア、92.02%の精度、AUCof94.79%で最高の結果を得た。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:19:00 GMT)
AID4AD: Aerial Image Data for Automated Driving Perception [1.6] AID4ADは、局所座標系に正確に整合した高解像度の空中画像でnuScenesを増強するデータセットである。
航空画像は, 地図構築精度が15~23%向上し, 軌道予測性能が2%向上したことを示す。
その結果,自動走行車システムにおける環境コンテキストのスケーラブルで適応可能な源として,航空画像の可能性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:38:18 GMT)
Intent-Based Network for RAN Management with Large Language Models [1.6] 本稿では,Large Language Models (LLM) を利用した無線アクセスネットワーク(RAN)管理のための新しい自動化手法を提案する。
提案手法は、意図翻訳を強化し、高レベルな目的を自律的に解釈し、複雑なネットワーク状態を推論し、RANの正確な構成を生成する。
LLM-orchestrated agentic systemによるリアルタイムフィードバックに基づく戦略を適用することにより,RANにおける堅牢なリソース管理を実現する可能性を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:31:16 GMT)
A Mixed User-Centered Approach to Enable Augmented Intelligence in Intelligent Tutoring Systems: The Case of MathAIde app [1.6] 本研究は,コンピュータビジョンとAIを用いた数学演習の修正を行うITSであるMathAIdeの設計,開発,評価に焦点を当てた。
本研究は,すべての設計段階において教師が関与する,教師中心のデザインアプローチを提供することによって,文献に寄与する。
実践的な意味として,ユーザ中心の設計アプローチがAIEDシステムの有用性と導入可能性を高めることを強調する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:52:16 GMT)
Slicing the Gaussian Mixture Wasserstein Distance [1.5] GMMを扱う上で重要な課題は、計算的に効率的で幾何学的に意味のある計量を定義することである。
計算複雑性を著しく低減するワッサーシュタイン距離に対するスライシングに基づく新しい近似を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:29:01 GMT)
A Compression Based Classification Framework Using Symbolic Dynamics of Chaotic Maps [1.5] カオスマップを用いた記号力学とデータ圧縮に基づく新しい分類フレームワークを提案する。
中心となる考え方は、閾値付き実数値トレーニングデータから記号列を生成して各クラスをモデル化し、1次元のカオスマップを通して進化させることである。
提案手法は,合成データセットと実世界のデータセットの両方にemphChaosCompを適用し,従来の機械学習アルゴリズムと比較して競合性能を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:00:06 GMT)
Is Uncertainty Quantification a Viable Alternative to Learned Deferral? [1.5] AI安全性の1つの側面は、決定を人間の専門家に委譲するモデルの能力である。
臨床翻訳の間、モデルはしばしばデータシフトのような課題に直面します。
不確かさの定量化方法は、AI推論にとって有望な選択かもしれない。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:37:59 GMT)
LesiOnTime -- Joint Temporal and Clinical Modeling for Small Breast Lesion Segmentation in Longitudinal DCE-MRI [1.5] 縦断画像とBIRADSスコアを併用して臨床診断を模倣する新しい3Dセグメンテーション手法であるLesiOnTimeを提案する。
我々のアプローチは、Dice Ablation研究で最先端のシングルタイムポイントと長手ベースラインを5%上回ります。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:18:28 GMT)
BiFuzz: A Two-Stage Fuzzing Tool for Open-World Video Games [1.5] BiFuzz(ビファズ)は、オープンワールドゲームの自動テスト用に設計された2段ファザーである。
実際の移動経路を含む、ゲームプレイとテストケースの全体的な戦略を、ステップバイステップで変更した。
BiFuzzは立ち往生の失敗を検出する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:43:24 GMT)
RDDPM: Robust Denoising Diffusion Probabilistic Model for Unsupervised Anomaly Segmentation [1.4] 拡散モデルの最近の進歩は、教師なしの異常セグメンテーションにおいて大きな成功を収めている。
本研究では, 汚染された(正規データと異常データの混合)データのみを利用できるシナリオに対して, 頑健な拡散モデルを提案する。
我々の手法は既存の拡散に基づくアプローチよりも優れており、最大8.08%のAUROCと10.37%のAUPRCをMVTecデータセット上で達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:10:26 GMT)
Intermediate-temperature topological Uhlmann phase on IBM quantum computers [1.4] スピン-1系は、量子化されたウルマン相を持つ中間温度トポロジカルな状態を示すことができる。
本稿では,システムとアシラ量子ビットとプローブ量子ビットからなる量子回路について述べる。
最近のIBM量子コンピュータのハードウェアアップグレードにより、信号はさらに改善され、興味深い有限温度トポロジ現象のより明確な実証が導かれる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:39:27 GMT)
Enhancement of Quantum Semi-Supervised Learning via Improved Laplacian and Poisson Methods [1.4] グラフに基づく半教師付き学習のための2つの拡張量子モデルを提案する。
ILQSSLとIPQSSLはどちらも、従来の半教師付き学習アルゴリズムよりも一貫して優れていることを示す。
これらの知見は、データ効率の分類の進歩における量子機械学習の役割を支持している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:45:02 GMT)
Nicknames for Group Signatures [1.4] グループ署名のためのNicknames for Group Signatures (NGS)は、グループ署名(GS)を拡張してフレキシブル公開鍵(SFPK)で署名する新しい署名スキームである。
我々はそのセキュリティモデルを記述し、Random Oracle Modelで証明された数学的構成を提供する。
実用的なユースケースとして、NickHatというブロックチェーンベースのトークン交換プロトタイプシステムを、NGS上に構築しています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:53:18 GMT)
Extracting Range-Doppler Information of Moving Targets from Wi-Fi Channel State Information [1.4] 3つの重要な革新を通じて両課題に対処する新しい信号処理手法を提案する。
提案手法は、商用のIntel WiFi AX211を用いて、移動目標のレンジドプラ推定におけるcmレベルの精度を実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:10:18 GMT)
Enhancing Japanese Large Language Models with Reasoning Vectors [1.3] ポストトレーニング手法は性能を改善し、主要な大規模言語モデル(LLM)の推論能力を向上した。
本稿では,学習前後の重みの変化を抽出するタスクベクトルに着想を得た。
利用可能なリソースは,日本語のLLMを改善するための課題であるが,高度に向上し,他の言語に刺激を与えるための,シンプルで効果的な方法が提示されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:31:20 GMT)
Evaluation and Analysis of Deep Neural Transformers and Convolutional Neural Networks on Modern Remote Sensing Datasets [1.3] 2012年、AlexNetは視覚知覚の最先端技術としてディープ畳み込みニューラルネットワーク(DCNN)を設立した。
本稿では,高分解能電子光学衛星画像の物体検出におけるトランスフォーマーベースニューラルネットワークの利用について検討する。
本研究では,2020年以降に7件,2015年以降に11件のそれぞれについて,境界ボックス検出と局所化の11つのアルゴリズムを比較した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:55:52 GMT)
Cognitive Loop via In-Situ Optimization: Self-Adaptive Reasoning for Science [1.3] In-situ Optimization (Clio) による認知ループと呼ばれる推論過程を深く正確に制御できる代替手法を提案する。
Clioは、大きな言語モデルによって、問題にアプローチする方法を自己形成し、自信が低いときに行動に適応し、最終的に科学者に最終的な信念や答えを与える。
さらなる訓練がなければ、OpenAIのGPT-4.1 with CLIOは、HumanityのLast Exam(HLE)に関するテキストベースの生物学と医学の質問において、22.37%の精度が得られる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:01:35 GMT)
MIXPINN: Mixed-Material Simulations by Physics-Informed Neural Network [1.3] 従来の有限要素法(FEM)に基づくシミュレーションは計算コストが高く、リアルタイムシナリオでは実用的ではない。
混合材料シミュレーションのための物理インフォームドグラフニューラルネットワーク(GNN)フレームワークMIXPINNを紹介する。
バイオメカニカル構造のグラフベース表現を活用することで、MIXPINNはFEM生成データから高忠実度変形を学習し、サブミリ秒精度でリアルタイムな推論を実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:46:44 GMT)
Automated Code Repair for C/C++ Static Analysis Alerts [1.3] 静的解析(SA)ツールは、CまたはC++のソースコードが欠陥があることを示す多くの診断アラートを生成する。
本稿では、複数のSAツールによって生成された3つのカテゴリの警告に関連するC/C++コードを修復するAPRツールに対して、設計、開発、パフォーマンステストの適用について詳述する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:44:50 GMT)
GR-Gaussian: Graph-Based Radiative Gaussian Splatting for Sparse-View CT Reconstruction [1.3] 我々は,CT再構成のためのグラフベース3次元ガウス平滑化フレームワークGR-Gaussianを提案する。
GR-Gaussianは針状アーティファクトを抑制し、スパースビュー条件下での再構成精度を向上させる。
X-3Dおよび実世界のデータセットに関する実験は、GR-Gaussianの有効性を検証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:31:42 GMT)
Convergence Bound and Critical Batch Size of Muon Optimizer [1.2] 4つの実践的な設定にまたがって、Muon の収束証明を提供する。
重み付け崩壊の付加は、より厳密な理論的境界をもたらすことを示す。
トレーニングの計算コストを最小限に抑えた,Muonのクリティカルバッチサイズを導出する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:29:15 GMT)
Stakeholder Perspectives on Humanistic Implementation of Computer Perception in Healthcare: A Qualitative Study [1.2] デジタル表現型、感情コンピューティングおよび関連する受動的センシングアプローチは、医療をパーソナライズする前例のない機会を提供する。
これらのツールは、プライバシ、偏見、共感的、関係中心のプラクティスの侵食に関する懸念を喚起する。
本研究はCP技術の患者医療への統合に関する主要な利害関係者の視点に関する最初の根拠に基づく考察である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:01:56 GMT)
CrystalGRW: Generative Modeling of Crystal Structures with Targeted Properties via Geodesic Random Walks [1.2] 本稿では,密度汎関数理論で検証された安定位相を予測できる拡散モデルであるCrystalGRWを紹介する。
CrystalGRWは、既存のモデルに匹敵する精度で基底状態に近い現実的な結晶構造を生成する能力を示す。
これらの特徴は、安定で対称性に富んだ結晶候補を実験的に検証することで、材料発見と逆設計を加速する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:18:32 GMT)
Understanding Learning Dynamics Through Structured Representations [1.2] 本稿では,内部構造的選択が学習システムの振舞いをいかに形作るかを検討する。
これらの構造が勾配流、スペクトル感度、固定点挙動にどのように影響するかを分析する。
固定テンプレートを規定するのではなく、解釈可能な方法で学習行動を操ることのできるトラクタブルデザインの原則を強調します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:15:57 GMT)
Dynamic-Dark SLAM: RGB-Thermal Cooperative Robot Vision Strategy for Multi-Person Tracking in Both Well-Lit and Low-Light Scenes [1.2] RGBとサーマルカメラを併用した協調MPTシステムを提案する。
評価実験により、サーマルトラッカーは明るい環境と暗い環境の両方で堅牢に機能することが示された。
この研究は、新しいHuman-Only SLAMパラダイム、Dynamic-Dark SLAM'に向けた第一歩となる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:04:09 GMT)
ASMR: Angular Support for Malfunctioning Client Resilience in Federated Learning [1.2] フェデレートラーニング(FL)は、分散とプライバシ保護の方法でディープニューラルネットワークのトレーニングを可能にする。
FLは、グローバルモデルパフォーマンスの劣化を引き起こすクライアントによって送信される不正な更新に悩まされる。
これらの問題に対処するため、我々はAngular Support for Malfunctioning Client Resilience (ASMR) という新しい手法を導入する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:36:41 GMT)
A Non-leveled and Reliable Approximate FHE Framework through Binarized Polynomial Rings [1.2] ホモモルフィック暗号化(HE)は、暗号化されたデータに対するセキュアな計算を可能にし、クラウドコンピューティング、ヘルスケア、ファイナンスなどのドメインにおけるユーザのプライバシを保護する。
CKKSは、機械学習と数値計算の重要な要件である複素数に対する近似演算をサポートすることで有名である。
本稿では,2値係数のリング上で完全に動作し,軽量なブートストラップ機構で再スケーリングを置き換えたCKKSの2値変種を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:53:36 GMT)
Systolic Array-based Accelerator for State-Space Models [1.1] State-Space Models (SSM) は非常に長いデータシーケンスをリカレントやトランスフォーマーベースのモデルよりも効率的に処理する。
本稿では,SSMの高速化を目的としたハードウェアアクセラレータEpochCoreを紹介する。
EpochCoreは平均250倍の性能向上と45倍のエネルギー効率向上を実現している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 00:24:21 GMT)
AutoML-Med: A Framework for Automated Machine Learning in Medical Tabular Data [1.1] 本稿では,これらの課題に対処するための自動機械学習ツールであるAutoML-Medを紹介する。
AutoML-Medのアーキテクチャは、前処理方法の探索にラテンハイパーキューブサンプリング(LHS)、選択されたメトリクスを使用したモデル訓練、微調整最適化に部分ランク相関係数(PRCC)を使用する。
2つの異なる臨床環境でのAutoML-Medの有効性を示す実験結果が得られた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:13:45 GMT)
I Have No Mouth, and I Must Rhyme: Uncovering Internal Phonetic Representations in LLaMA 3.2 [1.1] 本稿では,動詞|Llama-3.2-1B-Instruct|がトークンレベルの音声情報をどのように表現するかを検討する。
以上の結果から,Llamaは音素モデルに富んだ内部モデルを用いて音声処理を完了したことが示唆された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:36:51 GMT)
Detecting entanglement with transport measurement in weakly interacting and fluctuating systems [1.1] 我々は、量子輸送系におけるフォン・ノイマンエントロピーと相互情報を測定するためのプロトコルを開発する。
この測定は境界相互作用を持つ系や、内部結合の量子クエンチを受けるバルク相互作用系に対して実現可能である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:05:44 GMT)
Quantum Bootstrap Approach to a Non-Relativistic Potential for Quarkonium systems [1.0] 我々は、非相対論的ポテンシャル近似を用いて、クォーコニウム系の有界スペクトルを決定する。
この結果は、準有界トポニウム状態の形成としてのこの実験現象の解釈を理論的に支持する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:40:10 GMT)
Explainable AI Methods for Neuroimaging: Systematic Failures of Common Tools, the Need for Domain-Specific Validation, and a Proposal for Safe Application [1.0] 45,000個の構造脳MRI上で, Explainable AI (XAI) 法の最初の大規模, 体系的な比較を行った。
分析の結果,最も広く用いられている2つの手法の系統的障害が明らかになった。
これらの失敗は、自然画像に適した設計原則を持つ手法が神経画像データにかなり適応する必要があるというドメインミスマッチに起因している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:14:15 GMT)
SHAMI-MT: A Syrian Arabic Dialect to Modern Standard Arabic Bidirectional Machine Translation System [1.0] 本稿では,現代標準アラビア語(MSA)とシリア方言のコミュニケーションギャップを橋渡しする双方向機械翻訳システムである textbfSHAMI-MT を紹介する。
MSA-to-Shami とShami-to-MSA の2つの特殊モデルを提案し、どちらも最先端の AraT5v2-base-1024 アーキテクチャ上に構築されている。
MSA-to-ShamiモデルではOPENAIモデルGPT-4.1で判定すると,5.0点中5.0点中1点の平均品質スコアが得られた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:21:11 GMT)
The Forest Behind the Tree: Revealing Hidden Smart Home Communication Patterns [0.9] スマートホームデバイスは、比較的シンプルで予測可能なネットワークアクティビティパターンを示す。
これまでの研究は主に通常のネットワーク条件に焦点を合わせており、潜在的な隠れパターンを見下ろしている。
本稿では,これらの隠れ通信パターンを体系的に,かつ自動的に明らかにするフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:18:20 GMT)
DeepKoopFormer: A Koopman Enhanced Transformer Based Architecture for Time Series Forecasting [0.9] 時系列予測は、科学的、工業的、環境的な領域において重要な役割を担っている。
DeepKoopFormerは、Transformerの表現力とKoopman演算子理論の理論的な厳密さを組み合わせた、原則化された予測フレームワークである。
我々のモデルはモジュラーエンコーダ・プロパゲータ・デコーダ構造を特徴とし、時間的ダイナミクスはスペクトル的に制約された線形クープマン作用素を潜在空間で学習する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:05:55 GMT)
Strong electron-electron interactions in a dilute weakly-localized metal near a metal-to-insulator transition [0.9] ボーア原子状ドーパントの超薄層形成の進歩を利用して, 半充填時の2次元乱れハバードモデルを実現する。
我々は、シリコン上にドーパント前駆体分子のガス相ドスリングを用いて、0.4nmの薄膜と10$13$cm$-2$の希薄で、ヒ素とリンの$delta$-layersを生成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:04:55 GMT)
Tool-Assisted Conformance Checking to Reference Process Models [0.9] 整合性チェックは、さまざまなプロセスの品質と一貫性を維持するために不可欠です。
本稿では,参照モデルに対する具体的なプロセスモデルの自動適合性チェックについて検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:03:24 GMT)
Evaluating Variance in Visual Question Answering Benchmarks [0.9] 視覚的質問応答(VQA)のための強力なツールとしてマルチモーダル大言語モデル(MLLM)が登場している。
それらの進歩にもかかわらず、VQAベンチマークにおけるMLLMの評価は、しばしば点推定に依存する。
本稿では、14の広く使用されているVQAベンチマークを分析し、これらの問題を批判的に検証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:37:13 GMT)
The SMeL Test: A simple benchmark for media literacy in language models [0.9] 我々は、最小限のベンチマークであるSynthetic Media Literacy Test (SMeL Test)を導入する。
推論モデルを含む多種多様な命令チューニング LLM をベンチマークした結果,どのモデルも信頼性の高い情報源を常に信頼していないことがわかった。
私たちの仕事は、この重要な幻覚にもっと光を当て、それと戦うための新しい方法の開発を導くことを願っています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:29:17 GMT)
Toward Using Machine Learning as a Shape Quality Metric for Liver Point Cloud Generation [0.9] 3次元医用形状生成モデルは、解剖学的に多様で可塑性な構造を合成する上で有望であることが示されている。
既存の評価指標は、トレーニングと生成されたセットの間の分布距離を一般的に測定する。
本稿では,古典的機械学習(ML)手法とPointNetを代替的,解釈可能な手法として用いて,肝臓の形状の質を評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:50:44 GMT)
Merge-based syntax is mediated by distinct neurocognitive mechanisms: A clustering analysis of comprehension abilities in 84,000 individuals with language deficits across nine languages [0.8] マージ(Merge)は、単一の進化段階において出現した、基本的な、不可分な操作である。
神経認知の観点からは、マージによって構築された異なる精神的な物体は異なるメカニズムによって支えられる。
Mergeベースの構文はまだ進化の時代に突然現れたかもしれないが、様々な認知メカニズムはMergeベースの様々な種類のオブジェクトの処理を下書きしているようだ。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:33:36 GMT)
Computationally efficient Gauss-Newton reinforcement learning for model predictive control [0.8] 本稿では,2次ポリシーデリバティブの必要性を排除した決定主義政策ヘッセンのガウス・ニュートン近似を導入する。
非線形連続拌槽リアクターにおけるアプローチの有効性を実証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:00:40 GMT)
A kilometer photonic link connecting superconducting circuits in two dilution refrigerators [0.8] 異なる希釈冷凍機に収容された2つの超伝導回路間のコヒーレント信号伝達を実験的に実証した。
各ノードにおけるトランスデューサの効率が0.1%以上になると、商用電気光学変調器よりも80dBの効率が向上する。
この研究は、フォトニックリンクで相互接続されたスケーラブル超伝導量子ネットワークに対する重要な設計ガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:04:34 GMT)
Correspondence-Free Fast and Robust Spherical Point Pattern Registration [0.8] 本稿では,2つの球面パターン間を推定するための3つの新しいアルゴリズムを提案する。
我々のアルゴリズムは10倍高速で、10倍精度が高い。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:21:05 GMT)
PyCAT4: A Hierarchical Vision Transformer-based Framework for 3D Human Pose Estimation [0.8] 本研究では,既存のPymafネットワークアーキテクチャを深く最適化し,改良することを目的とする。
新しいPyCAT4モデルは、COCOと3DPWデータセットの実験を通じて検証される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:23:31 GMT)
Dynamic Feature Selection based on Rule-based Learning for Explainable Classification with Uncertainty Quantification [0.8] 動的特徴選択(DFS)は、従来の静的特徴選択に代わる魅力的な選択肢を提供する。
DFSはサンプル毎に機能選択をカスタマイズし、各ケースの意思決定プロセスに関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:21:43 GMT)
The KG-ER Conceptual Schema Language [0.8] KG-ERは知識グラフの構造をその表現とは独立に記述する。
また、知識グラフに格納された情報のセマンティクスをキャプチャするのに役立つ。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:01:28 GMT)
Interoperable verification and dissemination of software assets in repositories using COAR Notify [0.8] SoFAIR (2024-2025)は、機械学習ツールを活用した包括的なワークフローを導入し、研究論文からソフトウェア言及を抽出する。
このプロジェクトは、HALやSoftware Heritageのようなリポジトリシステム、著者、サービスを統合し、研究ソフトウェアの適切なアーカイブ、引用、アクセシビリティを保証する。
本稿では,SoFAIRワークフローの概要とCOAR通知プロトコルの実装について述べる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:13:26 GMT)
Automated Validation of LLM-based Evaluators for Software Engineering Artifacts [0.8] REFINE(Ranking Evaluators for FIne grained Nuanced Evaluation)は、大規模言語モデル(LLM)をベンチマークする自動化フレームワークである。
REFINEは、徐々に品質が低下したアーティファクトを自動的に合成するために、新しい生成技術を適用している。
それぞれの候補評価器の構成を、そのランクが期待された順序にどの程度近いかを測定することで定量化する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:52:01 GMT)
EvRT-DETR: Latent Space Adaptation of Image Detectors for Event-based Vision [0.7] イベントベースのカメラ(EBC)は、従来のカメラに代わるバイオインスパイアされた代替品として登場した。
EBCの画像解析手法の開発は,データの疎結合性や非同期性により困難である。
I2EvDetは、時間的イベントデータ処理で主流のオブジェクト検出をブリッジする新しい適応フレームワークである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:28:49 GMT)
Low-Bit Integerization of Vision Transformers using Operand Reordering for Efficient Hardware [0.7] 計算グラフを解析し,演算再順序付けに基づく整数化プロセスを提案する。
これにより、量子化入力を直接処理することで、整数化行列乗法と線形加群が実現される。
実験結果から, 線形層と行列乗算のPE当たりの消費電力は, 低ビット推論により減少することがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:26:11 GMT)
Evaluating Angle and Amplitude Encoding Strategies for Variational Quantum Machine Learning: their impact on model's accuracy [0.7] 変分量子回路(VQC)は、量子回路がデータ推論を処理し、古典的な最適化が回路のパラメータを調整するハイブリッドモデルである。
本研究は,アングルエンコーディングモデルとアングルエンコーディングモデルの両方を考慮した解析を行い,ローテーションゲートの種類がモデルの分類性能に与える影響について検討する。
この研究は、同じモデルトポロジの下では、最高のモデルと最悪のモデルの精度の差は10%から30%で、差は最大41%に達することを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:32:28 GMT)
Superior resilience to poisoning and amenability to unlearning in quantum machine learning [0.6] 古典モデルは脆い記憶を示し、一般化に失敗することを示した。
量子モデルは顕著なレジリエンスを示し、これはラベルノイズの増加に対する相転移のような反応によって強調される。
量子機械学習は、本質的なレジリエンスと効率的な適応性という2つの利点を持つことができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:43:47 GMT)
Stabilizing ergotropy in Spin-Chain Quantum Batteries via Energy-Invariant Catalysis under Strong Non-Markovian Coupling [0.6] 量子バッテリーは、マイクロスケールのエネルギー貯蔵のための有望なプラットフォームとして登場した。
本研究では, 空洞環境に強く結合したスピン鎖QBの最大抽出作業(エルゴトロピー)を物理的に制御する方法について検討した。
本研究は、強結合非マルコフ系における電池性能を最適化するための制御ノブとして量子がどのように機能するかを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:43:56 GMT)
RL-U$^2$Net: A Dual-Branch UNet with Reinforcement Learning-Assisted Multimodal Feature Fusion for Accurate 3D Whole-Heart Segmentation [0.6] 機能アライメントのための強化学習により強化されたデュアルブランチU-Netアーキテクチャを提案する。
このモデルは、デュアルブランチU字型ネットワークを用いて、CTとMRIのパッチを並列に処理し、新しいRL-XAlignモジュールを導入する。
公開されているMM-WHS 2017データセットの実験結果は、提案されたRL-U$2$Netが既存の最先端メソッドより優れていることを示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:12:06 GMT)
Six Guidelines for Trustworthy, Ethical and Responsible Automation Design [0.6] 自動化システムに対するキャリブレーションされた信頼は、社会への安全でシームレスな統合にとって重要である。
設計者が正確な信頼性評価を最適化するための6つの設計ガイドラインを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:01:09 GMT)
Human Capital Visualization using Speech Amount during Meetings [0.6] 本研究は,日常的な会議に焦点をあて,これらの会議中の音声量を分析して人的資本を可視化する戦略を提案する。
我々は音声の定量化に効果的に機能する会話可視化技術を採用している。
次に、性別や職位などの属性による発話量の違い、特定の参加者の有無による発話量の変化、発話量と連続属性の相関を計測する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:31:09 GMT)
Learning Fluid-Structure Interaction Dynamics with Physics-Informed Neural Networks and Immersed Boundary Methods [0.6] 物理インフォームドニューラルネットワーク(PINN)と没入境界法(IBM)を組み合わせて流体構造相互作用(FSI)問題を解決するニューラルネットワークアーキテクチャを導入する。
本手法は, 統一パラメータ空間を持つ単一FSIネットワークと, 流体領域と構造領域を分離したパラメータ空間を保持するイノベーティブなユーレリア・ラグランジアンネットワークの2つの異なるアーキテクチャを特徴とする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:54:46 GMT)
Kronecker-LoRA: hybrid Kronecker-LoRA adapters for scalable, sustainable fine-tuning [0.6] 冷凍リニアアップデートをKronecker製品として最初に分解する2段アダプタである textbfKron-LoRA を導入する。
Kron-LoRAは、標準のランク8のLoRAアダプタよりも少ないパラメータで最大4ドル!
論文参考訳(メタデータ) (Mon, 04 Aug 2025 00:02:15 GMT)
Who Should Run Advanced AI Evaluations -- AISIs? [0.6] 安全研究所と政府は、先進的なAIを自ら評価するか、プライベートな評価エコシステムをサポートするか、両方を行うかを決めている。
評価は、テクノロジのリスクを理解し、管理するために必要なガバナンスツールです。
本稿は,先進的AIのどの部分を評価するべきか(i),そして(ii)先進的AIを効果的に評価するために公共機関がどの程度の能力を持つ必要があるかを知るための9つの体制から導かれる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:46:05 GMT)
SoftPUF: a Software-Based Blockchain Framework using PUF and Machine Learning [0.5] Physically Unclonable Function (PUF)は、認証のための従来の暗号化に代わるセキュアで軽量な代替手段を提供する。
本稿では,PUFを模倣するソフトウェアベースのアプローチであるSoftPUFを活用する,新たなブロックチェーンフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:59:44 GMT)
Pointer: Linear-Complexity Long-Range Modeling without Pre-training [0.5] 我々は、事前学習せずに長距離シーケンスモデリングのための線形な$O(NK)$複雑性を実現する新しいアーキテクチャであるPointerを紹介する。
このアーキテクチャは、標準的なトランスフォーマーと比較して、長いシーケンスでの2-10times$スピードアップを実現し、2048トークンまでの距離でのコピータスクの精度を95%以上維持し、構造化された依存性モデリングを示す解釈可能なポインタパターンを学習する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:19:56 GMT)
Towards a Linear-Ramp QAOA protocol: Evidence of a scaling advantage in solving some combinatorial optimization problems [0.5] 線形ランプQAOAは,様々な最適化問題にまたがる最適解を効率的に近似できることを示す。
最大$N_q = 109$ qubits,$p=100$,21,200 CNOTゲートを必要とする回路を有する複数のQPU上でのLR-QAOAの結果を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:10:48 GMT)
The Role of Review Process Failures in Affective State Estimation: An Empirical Investigation of DEAP Dataset [0.5] 感情認識のためのDEAPデータセットについて101つの研究を概観した。
レビューされた論文の87%近くが、これらのエラーを1つ以上含んでいることがわかった。
これらの結果は、標準化された評価実践における根本的なギャップを明らかにし、神経科学における機械学習応用のためのピアレビュープロセスにおける重要な欠陥を強調している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:40:25 GMT)
Optimizing a parameterized controlled gate using Free Quaternion Selection [0.4] 本研究では、一般化された制御ゲートをパラメータ化し、これらのパラメータを最大に最適化することでコスト関数を最小化するアルゴリズムを提案する。
この方法は、もともと単一ビットゲート最適化のために開発されたFQS(Free Quaternion Selection)技術を拡張している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:25:21 GMT)
Optimizing Image Capture for Computer Vision-Powered Taxonomic Identification and Trait Recognition of Biodiversity Specimens [0.4] このレビューは、コンピュータビジョン応用のための生物検体イメージングを最適化するための、初めての包括的な実践的枠組みを提供する。
生物学的および計算の規律をブリッジすることで、この手法は何百万もの既存の標本に対する自動解析の可能性を解き放つ。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:47:17 GMT)
Dynamic Context Adaptation for Consistent Role-Playing Agents with Retrieval-Augmented Generations [0.4] AMADEUS は Adaptive Context-Aware Text Splitter (ACTS), Guided Selection (GS), Attribute Extractor (AE) で構成されている。
AEは、GSが検索したチャンクから文字の一般的な属性を特定し、これらの属性を最終コンテキストとして使用して、知識質問から答えた場合でも、堅牢なペルソナ一貫性を維持する。
キャラクタRAGは、976万の文字と450の質問と回答のペアからなる15の異なる架空の文字のためのペルソナ文書で構成されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:27:05 GMT)
Predicting fall risk in older adults: A machine learning comparison of accelerometric and non-accelerometric factors [0.3] 本研究では,加速度,非加速度,複合データに基づいて学習した各種機械学習モデルを用いて,高齢者の転倒リスク予測について検討した。
結果は、統合データとベイジアンアプローチの使用をサポートし、転倒リスク評価を強化し、予防戦略を通知する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:33:56 GMT)
Exploiting Uncertainty for Querying Inconsistent Description Logics Knowledge Bases [0.3] 我々は、この問題を解決するために、disPONTEと呼ばれる既存の確率論的意味論を利用する。
提案手法をTRILLとBUNDLEに実装し,提案手法の有効性を実証的に検証した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:21:20 GMT)
Automated SNOMED CT Concept Annotation in Clinical Text Using Bi-GRU Neural Networks [0.3] 本研究では,双方向GRUモデルを用いたSNOMEDCT概念認識のためのニューラルネットワークラベリング手法を提案する。
ドメイン適応型SpaCyおよびSciBERTベースのトークン化を用いてテキストを前処理し,テキストを文脈,構文,形態に富んだ重なり合う19個のチャンクに分割する。
Bi-GRUモデルは、IOBタグを指定してコンセプトスパンを特定し、検証セット上で90%のF1スコアで強力なパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:08:49 GMT)
Assessing the Reliability and Validity of Large Language Models for Automated Assessment of Student Essays in Higher Education [0.3] 高等教育環境におけるエッセイ自動評価において,5つの高度な大規模言語モデル (LLM) , Claude 3.5, DeepSeek v2, Gemini 2.5, GPT-4, Mistral 24B について検討した。
イタリア語の学生エッセイは、合計67点が4基準ルーブリックを用いて評価された。
人間とLLMの合意は一貫して低く、非重要であり、複製間のモデル内信頼性も同様に弱かった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:02:12 GMT)
Arena-Lite: Efficient and Reliable Large Language Model Evaluation via Tournament-Based Direct Comparisons [0.3] 本稿では,頭対頭比較に基づいてトーナメント構造を統合するアリーナ・ライトを提案する。
トーナメント構造と直接比較の適用により、ベースライン出力が不要になる。
試行は、アリーナ・ライトがより少ない比較で常に高い信頼性を達成することを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:46:22 GMT)
Compositional Quantum Control Flow with Efficient Compilation in Qunity [0.3] 我々はQunityを用いた高レベルの量子制御フロー構造を効率的にコンパイルすることに注力する。
高レベルなQunityコードを量子アセンブリ言語OpenQASM 3に変換するQuinityコンパイラの完全な実装を作成します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:32:13 GMT)
Analysis of Publicly Accessible Operational Technology and Associated Risks [0.3] 運用技術(OT)は、エネルギー、製造、輸送といった産業における自動化と制御を可能にする重要な国家インフラの不可欠な構成要素である。
このレポートは、公開インターネットに公開されているOT脅威の状況について、最新の概要を提供する。
調査の結果,北米と欧州で約7万台のOTデバイスが検出された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:03:38 GMT)
SCOPE: Stochastic and Counterbiased Option Placement for Evaluating Large Language Models [0.3] 大規模言語モデル(LLM)は、選択肢の位置やラベルに固有のバイアスを生かして、複数の選択タスクの膨らませたスコアを達成できる。
本研究では,データセットに依存しない方法で選択バイアスを計測・緩和するSCOPEを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:53:52 GMT)
Multi-VQC: A Novel QML Approach for Enhancing Healthcare Classification [0.3] 近年、機械学習は、病気を識別できる分類モデルを作成することによって、診断プラクティスに革命をもたらした。
量子モデルへの関心は、高次元の計算空間にデータをマッピングすることで複雑なパターンを表現する能力によって生まれた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:18:49 GMT)
Thermal Area Law in Long-Range Interacting Systems [0.2] 熱領域法則の最適しきい値として$alpha_c= (D+1)/2$を示す。
興味深いことに、この状態は熱力学的に不安定な状態でさえも含む。
我々はこの条件を数値的に検証し、可積分系と非可積分系の両方に対して定性的に正確であることを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:30:54 GMT)
Fermi Velocity Dependent Critical Current in Ballistic Bilayer Graphene Josephson Junctions [0.2] 放射化グラフェングラフェンジョセフソン接合(BGJJs)の輸送測定を行う。
各種温度のバイアス電流とゲート電圧の関数として, ディファレンシャル抵抗を測定した。
BGJJのキャリア密度依存性は、グラフェンベースのジョセフソンジャンクションデバイスにおける追加のチューニングパラメータを可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:27:43 GMT)
LMDG: Advancing Lateral Movement Detection Through High-Fidelity Dataset Generation [0.2] 横行運動(LM)攻撃は企業のセキュリティに重大な脅威をもたらす。
LM検出システムの開発と評価は, 現実的, 順調なデータセットの欠如によって妨げられる。
高忠実度LMデータセットを生成するためのスケーラブルなフレームワーク LMDG を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:49:04 GMT)
Graph Neural Network-Based Predictor for Optimal Quantum Hardware Selection [0.2] ハードウェア選択を自動化するグラフニューラルネットワーク(GNN)ベースの予測器を提案する。
グラフベース機械学習を利用して,モデル評価のための回路特徴の抽出を避ける。
実験の結果、94.4%の精度と85.5%のF1スコアをマイノリティクラスで証明し、事実上最高のコンパイル目標を予測した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:16:52 GMT)
Pre-Tactical Flight-Delay and Turnaround Forecasting with Synthetic Aviation Data [0.2] 本稿では,機械学習モデルの学習において,合成データが実運用データを置き換えることができるかどうかを検討する。
我々は,3つの予測課題に基づいて,最先端の合成データ生成装置を4つ評価した。
以上の結果から,高度なニューラルネットワークアーキテクチャ,特にトランスフォーマーベースのジェネレータは,実データ予測性能の94~97%を維持できることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:04:15 GMT)
Synthetic medical data generation: state of the art and application to trauma mechanism classification [0.2] 健康のための機械学習の研究は、合成医療データベースの概念へと向かっている。
本稿では,合成データを生成するための最先端の機械学習手法について概説する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:59:29 GMT)
Automatic brain tumor segmentation in 2D intra-operative ultrasound images using magnetic resonance imaging tumor annotations [0.1] 磁気共鳴画像(MRI)における腫瘍アノテーションの有用性について検討した。
MRI腫瘍アノテーションは、iUS画像における脳腫瘍の自動セグメンテーションのためのディープラーニングモデルを訓練するために、iUS腫瘍アノテーションの代用として使用できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:05:44 GMT)
Large language models provide unsafe answers to patient-posed medical questions [0.1] AnthropicによるClaude、GoogleによるGemini、OpenAIによるGPT-4o、MetaによるLlama3-70B、新しいデータセットであるHealthAdviceの4つの公開チャットボットの安全性を比較した。
問題は21.6%(クラド)から43.2%(ラマ)に変化し、安全でない反応は5%(クラド)から13%(GPT-4o, Llama)に変化している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:31:09 GMT)
StutterCut: Uncertainty-Guided Normalised Cut for Dysfluency Segmentation [0.1] 本稿では,グラフ問題分割問題としてディフルエンシセグメンテーションを定式化する半教師付きフレームワークであるStutterCutを紹介する。
弱い(発話レベル)ラベルに基づいて訓練された擬似オーラル分類器を用いてノード間の接続を洗練する。
フレームレベルのディフルエンシ境界を4つのディフルエンシタイプに組み込むことで、弱いラベル付きFluencyBankデータセットを拡張します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:02:06 GMT)
A Hybrid Mixture of $t$-Factor Analyzers for Clustering High-dimensional Data [0.1] 本稿では,$t$-factor Analysisr (MtFA) の混合モデルを推定するための新しいハイブリッド手法を開発する。
提案手法の有効性は,従来の手法と比較して計算効率が優れていることを示すシミュレーションによって実証される。
本手法はガンマ線バーストのクラスタリングに応用され,ガンマ線バーストが不均質なサブ集団を持つという文献のいくつかの主張を補強し,推定群の特徴を与える。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:12:23 GMT)
Detection of Intelligent Tampering in Wireless Electrocardiogram Signals Using Hybrid Machine Learning [0.1] 本稿では, タンパ検出のためのCNN, ResNet, およびハイブリッドトランスフォーマー-CNNモデルの性能解析を行う。
また、ECGに基づく身元認証のためのSiameseネットワークの性能を評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:02:27 GMT)
Quantum algorithm for linear matrix equations [0.0] 線形行列方程式 AX+XB=C を解くための効率的な量子アルゴリズムについて述べる。
量子回路がBQP完全問題を効率的に解く方法を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:45:05 GMT)
AirTrafficGen: Configurable Air Traffic Scenario Generation with Large Language Models [0.0] 本稿では,複雑な航空交通制御シナリオを生成するためのエンドツーエンドアプローチを提案する。
本手法では,セクタートポロジを符号化するためにグラフベースの目的表現を用いる。
Gemini 2.5 ProやOpenAI o3のような最先端のモデルでは,高トラフィックのシナリオが生成可能であることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:21:47 GMT)
evortran: a modern Fortran package for genetic algorithms with applications from LHC data fitting to LISA signal reconstruction [0.0] evortranは、高性能な遺伝的アルゴリズムと進化最適化のために設計された、現代のFortranライブラリである。
高エネルギー物理学や微分自由パラメータ最適化など、幅広い問題に対処するために使用できる。
evortranは様々な選択、クロスオーバー、突然変異、エリート主義の戦略を提供しており、ユーザーは特定のニーズに合わせて進化アルゴリズムをカスタマイズすることができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:36:50 GMT)
YOLOv1 to YOLOv11: A Comprehensive Survey of Real-Time Object Detection Innovations and Challenges [0.0] YOLO(You Only Look Once)モデルは、統合されたエンドツーエンド検出フレームワークを通じて、リアルタイム視覚アプリケーションのランドスケープを変換します。
本稿では, アーキテクチャの革新, パフォーマンスベンチマーク, 拡張機能, 実世界のユースケースを取り上げ, YOLOファミリーの総合的なレビューを行う。
我々は、YOLOモデルの進化を批判的に分析し、様々なコンピュータビジョン領域にまたがる影響を拡大する新たな研究方向について議論する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:13:51 GMT)
What to Keep and What to Drop: Adaptive Table Filtering Framework [0.0] ATFは、大きなテーブルのためのモジュール的で質問対応のフィルタリングパイプラインである。
非形式的な列と行を列記述、クラスタリング、スパースセンスアライメントスコアを使って具現化する。
実験によると、ATFはテーブルセルを70%削減し、ドメイン外のTableQAタスクのパフォーマンスを向上する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:06:29 GMT)
Uncertainty Sets for Distributionally Robust Bandits Using Structural Equation Models [0.0] 分散的に堅牢な評価と学習のための現在の手法は、過度に保守的な評価と政策を生み出している。
本研究では,特定の問題に対する不確実性を考慮したバンドレート評価と学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:29:29 GMT)
Transport-Guided Rectified Flow Inversion: Improved Image Editing Using Optimal Transport Theory [0.0] 整流モデルにおけるインバージョンプロセスの導出に最適な輸送インバージョンパイプライン(OTIP)を導入する。
我々の仮説は、トランスポートベースのガイダンスを組み込むことで、再構築精度と編集可能性のバランスをとることができるというものである。
LPIPSスコア0.001とSSIM0.992の高忠実度再構成を顔編集ベンチマーク上で実現した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:50:58 GMT)
Three Kinds of AI Ethics [0.0] 私は、AIと倫理の関係が少なくとも3つの方法で特徴づけられることを示した。
これらの3種類のAI倫理の特徴を解明し、彼らの研究課題を特徴づけ、各種類の専門知識の種類を特定します。
また、AI倫理に対する批判が、ある種類のAI倫理の観点から、異なる目標を持つ別の種類のものへと、どのようにずれているかを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:05:47 GMT)
The analytically tractable zoo of similarity-induced exceptional structures [0.0] 例外点(EPs)は、固有値と固有ベクトルの同時合体を示す非エルミートスペクトルの退化である。
1つまたは複数の一般化された類似性の影響下で、3次元および4次元の多重折りたたみ例外構造の出現特性を写像する。
これにより、現代の研究において、我々の予測は極めて関連性が高く、広く適用でき、また物理学の様々な分野において実験的に有効である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:21:22 GMT)
The Silicon Reasonable Person: Can AI Predict How Ordinary People Judge Reasonableness? [0.0] 本稿では,大規模言語モデル(LLM)が人間の合理的性判断を駆動するパターンを識別できることを考察する。
特定のモデルが表面レベルの応答だけでなく,その基盤となる決定的アーキテクチャも捉えていることを示す。
裁判官はより広いパターンに対して直感を調整でき、議員は政策解釈をテストでき、資源制約のある訴訟員は議論の受理をプレビューできる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:19:45 GMT)
The Gorini-Kossakowski-Sudarshan-Lindblad generation theorem,and a generalization to non-stationary evolutions [0.0] Gorini-Kossakowski-Sudarshan-Lindblad生成定理は、どの超作用素がその右側に現れるかを正確に示す。
有限次元のケースは、Jamiolkowski変換の形式を用いて処理される。
無限次元の場合、有限次元近似の列によって処理される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:42:28 GMT)
The Geometry of Machine Learning Models [0.0] 本稿では,機械学習モデル解析のためのフレームワークを提案する。
ニューラルネットワークでは、プルバック操作を通じて層を通して幾何学的構造を追跡する微分形式アプローチを導入する。
数学的基礎に焦点が当てられているが、この幾何学的視点は、学習力学を理解するためのモデル解釈、正規化、診断ツールに対する新しいアプローチを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:45:52 GMT)
The Architecture of Trust: A Framework for AI-Augmented Real Estate Valuation in the Era of Structured Data [0.0] Uniform Appraisal dataset (UAD) 3.6の必須2026実装は、住宅資産の評価を物語報告から機械可読形式に変換する。
本稿では、コンピュータビジョン、自然言語処理、自律システムにおけるAIの進歩と並行して、この規制シフトを包括的に分析する。
技術的実装と機関的信頼要件に対処するAI付加評価のための3層フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:24:25 GMT)
The Actual Usage Of Cryptocurrency By Individuals [0.0] ソーシャルメディアプラットフォーム、インフルエンサー、金融アナリストは、公共の関心や投資行動を促進する上で中心的な役割を果たす。
本研究では,メディア・インフルエンスと教育資源が個々の暗号通貨との関わりをいかに形作るかを検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:52:20 GMT)
Testing the Untestable? An Empirical Study on the Testing Process of LLM-Powered Software Systems [0.0] 本研究では,実世界のアプリケーション開発において,大規模言語モデルがどのようにテストされるかを検討する。
ケーススタディは、LLMを利用したアプリケーションを大学コースの一部として構築・展開した学生によって書かれた99の個人レポートを用いて実施された。
結果: LLMを利用したシステムをテストするには, 従来の検証手法に適応し, ソースレベルの推論と行動認識評価をブレンドする必要がある。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 01:59:04 GMT)
Tailoring interaction ranges in atom arrays [0.0] ツイーザー原子配列における双極子相互作用の範囲を合成的に設計する手法を提案する。
我々は、リレー原子の断熱除去後の興味原子の運動方程式を導出した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:36:25 GMT)
Sum-frequency-based photon-number-resolving detector for telecom wavelengths [0.0] 光子数分解(PNR)能力は,通信プロトコルのセキュリティ向上に新たな可能性をもたらすため,特に有用である。
本稿では、低コストのPNR検出器と非線形光学的相互作用を組み合わせた受信機の実装について述べる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:53:33 GMT)
Strengthening the Uncertainty and the Reverse Uncertainty Relation Limits [0.0] 2つの非互換な可観測物の分散の和について、新しい不確実性と逆不確実性関係を導出する。
これらの関係は、いくつかのよく知られた既存の関係よりも厳密な境界を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:05:58 GMT)
StackLiverNet: A Novel Stacked Ensemble Model for Accurate and Interpretable Liver Disease Detection [0.0] StackLiverNetは、肝疾患検出タスクに適した解釈可能なスタック型アンサンブルモデルである。
このフレームワークは、高度なデータ前処理と特徴選択技術を使用して、モデルの堅牢性と予測能力を向上させる。
テスト精度は99.89%、Cohen Kappaは0.9974、AUCは0.9993で、5つの誤分類しかなかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:05:52 GMT)
Solving Markov Chains with Analog Quantum Computing: The Fine Print [0.0] いくつかの量子アルゴリズムは最初から適用できるが、他のアルゴリズムはブラックボックスのオーラクルを必要とする。
マルコフ連鎖の定常分布を計算する最初のアナログ量子アルゴリズムに対して、同様の微細プリントを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:52:37 GMT)
Signatures of quantum chaos and complexity in the Ising model on random graphs [0.0] ランダムErdHos-R'enyiグラフ上の量子アニーリングイジングモデルにおける量子カオスと複雑性について検討する。
カオス力学の指標として量子状態アンサンブルの深い熱化を研究する。
また、Mpemba効果の量子類似性についても検討し、当初は「熱い」状態が不均一に速く熱化できることを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:43:43 GMT)
Sensing multiatom networks in cavities via photon-induced excitation resonance [0.0] 平均的な時間分布は、初期励起原子の近くで励起を部分的にトラップする。
予測された光子誘起多原子捕獲励起は原子位置障害に敏感である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:36:18 GMT)
Semantic Structure in Large Language Model Embeddings [0.0] 心理学的な研究は、人間の単語の格付けが、情報損失が比較的少ない低次元の形式に還元できることを一貫して発見している。
アントロニムペアによって定義される意味的方向の単語の投影は、人間の評価と高く相関していることを示す。
1つの意味的方向に沿ったトークンのシフトは、そのコサインの類似性に比例した幾何学的に整列した特徴に対して、ターゲット外の効果をもたらすことが判明した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:21:50 GMT)
Self-Supervised YOLO: Leveraging Contrastive Learning for Label-Efficient Object Detection [0.0] YOLOファミリーのような一段階の物体検出器は、リアルタイム視覚応用において最先端の性能を達成する。
本稿では、この依存を減らす手段として、コントラスト型自己教師学習(SSL)を体系的に研究する。
このアプローチでは、YOLOの畳み込みバックボーンをエンコーダとして適応する、シンプルで効果的なパイプラインを導入しています。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 00:27:12 GMT)
Self-Organizing Survival Manifolds: A Theory for Unsupervised Discovery of Prognostic Structures in Biological Systems [0.0] 生存は、生物学的状態空間に固有の曲率と流れの創発的な性質である。
我々は,低曲率な測地流から生存関連力学が生ずる,自己組織化生存多様体(SOSM)の理論を開発した。
目的の離散的かつ連続的な定式化を導出し、生存軌道の出現と収束を示す理論的結果を証明する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:04:54 GMT)
Security of the BB84 protocol with receiver's passive biased basis choice [0.0] Bennett-Brassard 1984 Protocol (BB84 Protocol) は量子鍵分布(QKD)を実装するための最も単純なプロトコルの1つである。
このプロトコルでは、送信側と受信側は、2つの相補的な測定ベースのうちの1つを反復的に選択する。
本稿では, 受信機の受動ベース選択としきい値検出器による測定を併用した, このようなデコイ状態BB84プロトコルの完全な解析セキュリティ証明を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:01:22 GMT)
SSBD Ontology: A Two-Tier Approach for Interoperable Bioimaging Metadata [0.0] バイオイメージング技術により、多次元データの大規模取得が可能になったが、効果的なメタデータ管理と相互運用性は依然として大きな課題である。
本稿では,2層アーキテクチャを採用したバイオダイナミクスデータベースのシステム科学のための新しいフレームワークを提案する。
私たちのアプローチは、Finderable、Accessible、Interoperable、Reusableのデータエコシステムを確立するのに役立ちます。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:51:55 GMT)
Reservoir Computing with Evolved Critical Neural Cellular Automata [0.0] 臨界は、最も高い計算能力を示すことが知られている力学系の挙動状態である。
我々は、神経細胞オートマトン(NCA)を最適化して臨界を達成するために進化戦略を適用した。
提案されたクリティカルNCAは、極端な初期条件に対する堅牢性のために、自己組織化されたクリティカルシステムとして機能する可能性がある。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:11:11 GMT)
Quasiconservation Laws and Suppressed Transport in Weakly Interacting Localized Models [0.0] 弱い相互作用下での非相互作用的局所化の摂動安定性について検討する。
運動の非相互作用的な局所積分に対する補正は、大きなシステムサイズで収束する。
電荷輸送能力は、相互作用の存在によって制限されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:19:01 GMT)
Quantum thermalization in a dimerized J1-J2 model [0.0] 熱化挙動を調べるため, ハイゼンベルクスピン-1/2鎖を最近傍結合における二量体化(デルタ)あるいは変調で再検討した。
二量体化は局所化を引き起こす傾向にあるが、次のアレスト-隣の相互作用 J2 は一般的に熱化を好む。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:23:59 GMT)
Quantum panprotopsychism and a consciousness-centered universe [0.0] 過去の出版物では、量子状態と事象に基づくパンプロト心理学の一形態が、この組み合わせ問題の解をもたらすと論じてきた。
これは、古典力学に基づく科学の影響を強く受けていた人間の状態に関する現在の見解に反するものである。
我々は、正確な物理的秩序が、超越的な現象領域にアクセス可能な人々に導かれる世界に住んでいると結論付けている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:44:10 GMT)
Quantum chemistry with provable convergence via randomized sample-based quantum diagonalization [0.0] 我々は、SKQDとハミルトンプロパゲータのqDRIFTランダム化コンパイルを組み合わせた新しいSQD変種を導入する。
結果のアルゴリズムであるSqDRIFTは、化学ハミルトニアンの実用スケールでのSQD計算を可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:36:12 GMT)
Quantum Skyrmion Qudit in a Triangular-lattice magnet [0.0] フラストレーション磁石では、スカイミオンは量子情報を格納できるヘリカルな自由度によって特徴づけられる。
弱電場の極限では、この系は2レベル系、すなわちスカイミオン量子ビットとして記述できる。
我々は、系の状態が以前考えられていたようなスカイミオンキュービットではなく、スカイミオンキュービットであることを証明した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:28:44 GMT)
Quantum Mechanics as a Realistic Local Theory without Hidden Variables and Measurement Problem [0.0] 現代の量子力学の一貫性のある解釈は、その公理論は矛盾し不完全であるため不可能である。
純粋な状態を記述する波動関数は観測可能な値に統計的制限のみを課すが、誤ったものである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:36:18 GMT)
Quantum Geometry of Altermagnetic Magnons Probed by Light [0.0] 我々は、両周光をキラル磁気マグノンの喫煙ガン光学プローブとして同定する。
我々は、$d$-waveの反磁性体において、キャンピング磁場下では、反磁性マグノンは非自明な量子幾何学を実現することを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:00:03 GMT)
Quantum Convolutional Neural Network with Nonlinear Effects and Barren Plateau Mitigation [0.0] 量子ニューラルネットワーク(QNN)は、量子エンタングルメントと重畳を利用して、大規模並列線形計算を可能にする。
しかし,本質的な非線形操作の欠如やバレンプラトー現象により,実用的展開が妨げられている。
両問題に同時に対処する量子ニューラル畳み込みネットワーク(QCNN)アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:26:48 GMT)
Quantum Cluster State Spin Chain with Ising Fusion Category Symmetry: A Perspective from Weak Hopf SymTFT [0.0] 我々はイジング融合代数の対称性を示すクラスター状態格子ハミルトニアンを示す。
弱ホップイジング境界管代数を弱ホップ量子二重モデルに対する入力データとする。
イジング融合代数は $operatornameCocom(mathcalT_mathsfIsingvee)$ に埋め込まれるので、モデルはイジング融合圏の対称性を忠実に実現する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:45:34 GMT)
Quality of Service in aggregated quantum networks [0.0] 本稿では、QoS(Quality of Service)という古典的な概念をマルチパス量子リソース分布の文脈に拡張することにより、量子ネットワークルーティングのパフォーマンス指向のアプローチを提案する。
絡み合いの発生や量子メモリのコヒーレンスを独立に考慮する従来のモデルとは異なり、経路割り当て戦略、コヒーレンス時間制約、量子エラー補正(QEC)の相互作用について検討する。
本研究は, メモリ寿命とは独立して忠実度を最適化することはできず, QECは特定の条件下での性能を向上させることができるが, ネットワークトポロジやパス長の非対称性にもよる追加の制約が課されることを示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:01:58 GMT)
Prepare-and-measure and entanglement simulation beyond qubits [0.0] 正確な古典的プロトコルの重要な特徴を$d=2$で識別し、より高次元のロバストな近似プロトコルを構築するために使用する。
提案手法は、$d=2$の量子確率分布を正確に再現し、高次元の既存のプロトコルと比較して非常によく機能する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:04:36 GMT)
PentestJudge: Judging Agent Behavior Against Operational Requirements [0.0] PentestJudgeは、侵入テストエージェントの操作を評価するシステムである。
判定エージェントとして機能するモデルをいくつか評価し、最良のモデルがF1スコア0.83まで到達した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:52:50 GMT)
Path-Integral Formulation of Bosonic Markovian Open Quantum Dynamics with Monte Carlo stochastic trajectories using the Glauber-Sudarshan P, Wigner, and Husimi Q Functions and Hybrids [0.0] 経路積分式に基づいて任意のハミルトンおよびジャンプ作用素のSDEを解析的に導出する。
HS変換の実現可能な条件はFPEの拡散行列の正のセメイド有限性条件と同一であることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:14:37 GMT)
PET-MAD, a lightweight universal interatomic potential for advanced materials modeling [0.0] 機械学習原子間ポテンシャル(MLIP)は原子スケールシミュレーションの範囲を大きく広げている。
安定な無機および有機固体を組み合わせたデータセット上で訓練された一般応用MLIPであるPET-MADを紹介する。
PET-MADは、無機固体の最先端MLIPと競合し、分子、有機材料、表面にも信頼性がある。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:58:02 GMT)
Operator: A Protocol for Trustless Delegation Under Uncertainty [0.0] 検証ゲームにおいて,コラテラライズされたクレームによる正当性を強制するプロトコルを提案する。
タスクは意図として公開され、解決者はそれらを満たすために競います。
どんな挑戦者でも、検証プロセスのトリガーとして挑戦することで結果に挑戦することができる。
不正なエージェントがスラッシュされ、正しい反対が報われ、誤検証自体を罰するエスカレーションパスが設けられる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:11:39 GMT)
Observation of Purcell Effect in Electrically Coupled Cavity-Magnet System [0.0] 電界結合を用いた空洞-金属磁石ハイブリッドシステムにおけるパーセル効果の観測を報告する。
両室温度および7mKで測定した結果,56MHzのカップリング速度を示した。
これらの結果は、幾何学的および電場を介する相互作用を通じてマイクロ波と金属磁石を結合する汎用的なアプローチを確立している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:04:17 GMT)
Observables are glocal [0.0] 有限グラフ上で定義された背景独立理論に対して、可観測関数の問題はどのようにして完全に解決されるかを示す。
完全可観測物の集合は、それぞれが連結部分グラフ構造(局所相関)を求めるように構成可能であることを示す。
これは離散一般相対性理論に対して物理的に意味のある可観測物の完全な集合を与える。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:28:42 GMT)
Notes on Quantum Soundscapes and Music [0.0] 音素化によるデータへの「リスニング」は、信号の発見を容易にする。
音素化によるデータへの「リスニング」は、データがマクロ的リアリズムに反した場合に相補的な方法を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:12:09 GMT)
Neural Networks as Universal Finite-State Machines: A Constructive Feedforward Simulation Framework for NFAs [0.0] この研究は、象徴的オートマトン理論と現代のニューラルアーキテクチャの新たなブリッジを確立する。
フィードフォワードネットワークは正確で、解釈可能で、訓練可能なシンボル計算を行うことができることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:35:00 GMT)
Multi-Class Human/Object Detection on Robot Manipulators using Proprioceptive Sensing [0.0] 本研究の目的は,3種類の人・物検出モデルを評価し,より詳細な接触解析を行うことである。
データセットはFranka Emika Pandaロボットマニピュレータを用いて収集され、時系列分析のための前処理戦略を探索した。
最高の性能モデルは、リアルタイムテスト中に91.11%の精度を達成し、マルチクラス検出モデルの実現可能性を示した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:45:37 GMT)
More on the Operator Space Entanglement (OSE): Rényi OSE, revivals, and integrability breaking [0.0] 我々は、R'enyi Operator Spaceanglement(OSE$)エントロピー$S_n$のいくつかの1次元可積分およびカオスモデルに対するダイナミクスについて検討する。
R'enyi $OSE$ entropies of diagonal operator with nonzero trace saturate at long time。
有限サイズの可積分系では、$S_n$は強いリバイバルを示し、可積分性が破られたときに洗い流される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:07:20 GMT)
Monsoon Uprising in Bangladesh: How Facebook Shaped Collective Identity [0.0] 本研究では、2024年7月のバングラデシュにおける民主化運動において、Facebookが集団アイデンティティをどのように形成したかを検討する。
マルチモーダル表現、画像、ミーム、ビデオ、ハッシュタグ、風刺投稿は、参加者を統一する上で重要な役割を担った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:07:38 GMT)
Molecular Processes as Quantum Information Resources [0.0] ホモ核二量体(ダイマー)の解離(半衝突)と原子対衝突の逆過程は、翻訳的(EPR様)な絡み合いを示す。
このような絡み合う過程は、異常な量子熱力学的特徴を示すこともできる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:53:33 GMT)
Model-Based Soft Maximization of Suitable Metrics of Long-Term Human Power [0.0] 本稿では、AIエージェントに人間に力を与えるよう強制することで、安全と幸福の両方を促進するという考え方を探求する。
我々は、不等式とリスク・逆の人間の力の長期的集合を表す、パラメトリゾブルで分解可能な目的関数を設計する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:59:37 GMT)
Modality Bias in LVLMs: Analyzing and Mitigating Object Hallucination via Attention Lens [0.0] 大規模視覚言語モデル (LVLM) は、顕著なマルチモーダル理解と推論能力を示した。
LVLMはテキストのプロンプトと大きな言語モデルの内部知識に過度に依存し、視覚的手がかりと矛盾する記述を生成する傾向がある。
物体幻覚を緩和するためのトレーニング不要な手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:40:59 GMT)
Microscopic Theory of Heat Transfer across a Vacuum [0.0] 伝熱は物理学の基本的な概念であり、伝熱の微視的な物理的メカニズムをどう特徴づけるかは重要なトピックである。
近年,真空中における量子ゆらぎによるフォノン熱伝達という新しい熱伝達機構が実験的に実証されている。
ここでは、2つの可動端ミラーで閉じ込められた真空を横断するフォノン熱伝達の非相対論的微視的理論を確立する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:37:47 GMT)
Measuring unitary invariants with the quantum switch [0.0] 量子スイッチは任意の順序のバーグマン不変量を測定するのに利用できることを示す。
また、簡単なアダマール試験回路が任意のユニタリ量子スイッチを決定論的にシミュレートできることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:26:55 GMT)
Measuring the dynamics of an XXZ quantum simulator and controlling collapse through symmetries [0.0] スピンハミルトニアンの量子シミュレーションは、12の部位を高空間対称性の平面配置で配置する。
ハイゼンベルクやXXZハミルトニアンの下で進化する異なる初期状態を比較した。
確率の時間進化のための4つの異なる規則を同定する:それらは一定であり、時間によって正弦波が変化するか、周期的に進化するか、崩壊するかである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:34:36 GMT)
Measurement-Induced Entanglement in Conformal Field Theory [0.0] 友長・ラッティンガー液中における測定誘起絡み合いについて検討した。
MIE は完全に普遍的で、共形不変であり、CFT の演算子の内容に依存することを示す。
物理量子計測のためのMIEは、測定結果を強制的に引き起こした絡み合いと根本的に異なることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:01:22 GMT)
Long-distance device-independent quantum key distribution with standard optics tools [0.0] デバイス非依存量子鍵分布(DI-QKD)は、リモートパーティ間で情報理論的に安全な鍵分布を可能にする。
本稿では, 単一光子干渉に基づくHeraldingスキームを用いた長距離DI-QKDプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:10:59 GMT)
Leveraging Distribution Matching to Make Approximate Machine Unlearning Faster [0.0] Approximate Machine Unlearning (AMU)は、トレーニングセットの保持部分集合を特別に微調整することで、モデルを特定のトレーニングデータを忘れることを可能にする。
任意の分類指向AMU法を高速化する2つの補完手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:45:36 GMT)
Lattice tuning of charge and spin transport in $β_{12}$-borophene nanoribbons [0.0] ボロフェンナノリボン(BNR)は磁気ジグザグエッジを示すが、他のエッジ構成は非磁性である。
本研究では,ZBNRのスピン偏極性を高めるため,例えば,中心BNRカンに結合した熱浴によって格子振動が導入されることを実証する。
対照的に、非磁性エッジ配置はフォノンの電荷輸送を示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:01:00 GMT)
Language Model Guided Reinforcement Learning in Quantitative Trading [0.0] 大規模言語モデル(LLM)は、最近、戦略的推論とマルチモーダルな金融信号解釈を実証している。
LLMがRLエージェントを行動に導くための高レベルのトレーディング戦略を生成するハイブリッドシステムを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:52:11 GMT)
LRTuckerRep: Low-rank Tucker Representation Model for Multi-dimensional Data Completion [0.0] 多次元データ補完は計算科学において重要な問題である。
本研究では,タッカー分解におけるグローバルおよびローカルな事前処理を統一する,低ランクタッカー表現(LRTuckerRep)モデルを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:57:50 GMT)
LLM-based IR-system for Bank Supervisors [0.0] 本稿では,新しい情報検索システムについて紹介する。
現場調査の結果を取り込み、最も関連性の高い歴史的発見と関連する措置を包括的データベースから取り出す。
最終モデルは平均精度0.83、平均相互ランク(MRR@100)0.92を達成する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:02:01 GMT)
Information Scrambling in Bosonic Gaussian Dynamics [0.0] ガウス的ユニタリ進化中のボソニック系における情報スクランブルのダイナミクスについて検討する。
ハミルトニアンにおけるランダム性は、三部体の相互情報を比較的大きな負の値で飽和させることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:18:20 GMT)
Implementing Bogoliubov Transformations Beyond the Shale-Stinespring Condition [0.0] フォック空間の密度部分空間の2つの拡張を提供し、ボゴリューボフ変換がシェール・スティンスプリング条件に違反したとしても実装可能であるようにする。
二次ハミルトニアンが拡張的な意味で実装可能なボゴリューボフ変換によって対角化可能であるという条件を導出する。
3つの例は、Shale-Stinespring条件が成立しないにもかかわらず、拡張された意味での実装が可能である状況を示している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:53:21 GMT)
Highly Interactive Testing for Uninterrupted Development Flow [0.0] 我々は、テストのランタイム表現を提供するライブラリを示し、HIDEツールとの緊密な統合を可能にします。
テストによって強化された開発について説明し、開発者がフォーカスを維持するのに欠かせないテストの再実行時間をどのように達成するかを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:17:40 GMT)
HiFACTMix: A Code-Mixed Benchmark and Graph-Aware Model for EvidenceBased Political Claim Verification in Hinglish [0.0] 既存の事実検証システムは、インドのような言語学的に多様な地域での実際の政治談話に一般化することができない。
HiFACTMixは、多言語コンテキストエンコーディング、クレーム・エビデンス・セマンティックアライメント、エビデンスグラフ構築、グラフニューラル推論、自然言語説明生成を組み合わせた、新しいグラフウェア、検索強化ファクトチェックモデルである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:14:03 GMT)
Heating suppression via two-rate random and quasiperiodic drive protocols [0.0] 2つの異なる駆動プロトコルの磁場中におけるランダムかつ準周期的に駆動される1次元非可積分PXPスピンチェーンについて検討した。
プロトコルの最初のクラスでは、パルスの持続時間は振幅$dT$でランダムに変化する。
第2のプロトコルでは、前述した単一周波数を含むランダム/準周期駆動とは対照的に、TM準周期駆動は明らかに熱化を遅くする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:00:04 GMT)
Guess or Recall? Training CNNs to Classify and Localize Memorization in LLMs [0.0] 大規模言語モデルにおける動詞の暗記は、異なる基盤機構を含む多面的現象である。
既存の分類学で記述された様々な形態の記憶を解析するための新しい手法を提案する。
我々は,各形態の記憶にかかわる注意重みの領域をローカライズする,独自の視覚的解釈可能性技術を開発した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:27:56 GMT)
Green Computing: The Ultimate Carbon Destroyer for a Sustainable Future [0.0] グリーンコンピューティングは、デジタル経済を脱炭素化する重要な経路である。
この記事では、持続可能なIT戦略が、いかにコンピューティングを純炭素シンクに変換するかを検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:57:25 GMT)
GrandJury: A Collaborative Machine Learning Model Evaluation Protocol for Dynamic Quality Rubrics [0.0] 生成機械学習モデルは現代のシステムの中心となり、クリエイティブな文章、要約、マルチホップ推論、コンテキスト認識対話などの応用に力を入れている。
標準的な評価体制は依然として静的なベンチマークスタイルのテストに依存しており、動的なユーザニーズや現実の進化ではなく、リーダボードスコアへの最適化を動機付けている。
GrandJuryは、動的で透明なタスク属性と人間の判断をサポートすることで、タイムデケイドアグリゲーション、完全なトレーサビリティを組み合わせた正式な評価プロトコルを導入している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:00:44 GMT)
Generating Synthetic Invoices via Layout-Preserving Content Replacement [0.0] 本稿では,高忠実な合成請求書とそれに対応する構造化データを生成するパイプラインを提案する。
私たちのアプローチは、小規模でプライベートなデータセットを増幅するためのスケーラブルで自動化されたソリューションを提供します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:19:34 GMT)
GENIE: Gaussian Encoding for Neural Radiance Fields Interactive Editing [0.0] 我々は、NeRFのレンダリング品質とGSの編集可能かつ構造化された表現を組み合わせたハイブリッドモデルGENIEを紹介する。
暗黙的および明示的な表現の強みを組み合わせることで、GENIEは直感的なシーン操作、動的相互作用、物理シミュレーションとの互換性をサポートする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:59:23 GMT)
From Photons to Physics: Autonomous Indoor Drones and the Future of Objective Property Assessment [0.0] 自律型屋内ドローンと物理認識センサー技術の融合は、特性評価を主観的視覚検査から客観的で定量的な測定に転換することを約束する。
この総合的なレビューでは、このパラダイムが4つの重要な領域にまたがるシフトを可能にする技術基盤について検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 00:20:25 GMT)
Forrelation is Extremally Hard [0.0] フォルレレーション問題(Forrelation problem)は、量子能力と古典的能力の指数的分離を示す中心的な問題である。
この問題を1つの量子クエリと成功確率1で解くことができるが、$tildeOmegaleft (2n/4right)$ classical randomized queryが必要である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:19:19 GMT)
Fine-Tuning Vision-Language Models for Markdown Conversion of Financial Tables in Malaysian Audited Financial Reports [0.0] 本稿ではQwen2.5-VL-7Bに基づく微調整視覚言語モデル(VLM)を提案する。
提案手法には,拡大した2,152枚の画像テキストペアをキュレートしたデータセットと,LoRAを用いた教師付き微調整戦略が含まれる。
基準に基づく評価では92.20%の精度と96.53%のTEDSスコアが得られた。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 04:54:00 GMT)
FUTransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation [0.0] 糖尿病性足潰瘍 (DFUs) の自動分節は, 臨床診断, 治療計画, 縦断的創傷モニタリングにおいて重要な役割を担っている。
従来の畳み込みニューラルネットワーク(CNN)は、強力なローカライゼーション機能を提供するが、長距離空間依存のモデル化に苦慮している。
視覚変換器(ViT)のグローバルアテンション機構をU-Netフレームワークに統合するハイブリッドアーキテクチャであるFUTransUNetを提案する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 11:05:14 GMT)
Exploring utilization of generative AI for research and education in data-driven materials science [0.0] 2024年7月、私たちは、生成AIが研究と教育を促進する方法について調査するハッカソン、AIMHack2024を組織しました。
材料科学、情報科学、バイオインフォマティクス、凝縮物質物理学の研究者たちが協力して、生成AIが研究と教育をどのように促進するかを探求した。
本稿では、AIによるソフトウェア試験、ソフトウェアのためのAIチューターの構築、ソフトウェアのためのGUIアプリケーションの開発に関するトピックについて述べる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:55:53 GMT)
Exploration of Low-Cost but Accurate Radar-Based Human Motion Direction Determination [0.0] 本稿では, 低コストだが高精度なレーダーによる人体動方向決定法について検討する。
HMDDは、軽量で高速なVision Transformer-Convolutional Neural Networkハイブリッドモデル構造によって実装されている。
提案手法の有効性は,オープンソースデータセットを用いて検証する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 02:35:43 GMT)
Exact quantum dynamics of methanol: full-dimensional ab initio potential energy surface of spectroscopic quality and variational vibrational states [0.0] メタノールは、天文学、天体物理学、基礎物理学の感度の高いプローブである。
実次元で強調される初期ポテンシャルエネルギー面(PES)と数値的に正確な量子力学の計算。
開発は、宇宙空間でメタノールをプローブするために用いられる可視光スペクトルへの道を開く。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:40:52 GMT)
Evaluating LLMs on Real-World Forecasting Against Expert Forecasters [0.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示したが、将来の事象を予測する能力はまだ検討されていない。
メタキュラスから464個の質問を予測し,その性能を上位の予測者と比較した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:48:35 GMT)
Evaluating Deepfake Detectors in the Wild [0.0] 本研究では,最新のディープフェイク検知装置の評価を行い,実世界のシナリオを模倣してディープフェイク検出を行う新しいテスト手法を提案する。
我々の分析によると、ディープフェイクの検出は依然として難しい課題である。
JPEG圧縮や画像強調などの基本的な画像操作は、モデルの性能を著しく低下させる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:19:11 GMT)
Estimating the link budget of satellite-based Quantum Key Distribution (QKD) for uplink transmission through the atmosphere [0.0] 本書は、インドにおける3つの異なる地上局を、アップリンクベースの量子通信に利用することの実用性について考察する。
インドの様々な地理的地域の大気条件をシミュレートし、各地域で専用のリンク予算分析を行う。
その結果,IAO Hanleサイトは他の2つのサイトと比較して,アップリンクベースのQCの方が適していることがわかった。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 06:30:21 GMT)
Estimating Trotter Approximation Errors to Optimize Hamiltonian Partitioning for Lower Eigenvalue Errors [0.0] トロッター近似は、量子コンピュータ上で多体ハミルトニアンの固有エネルギーを抽出するために用いられる。
ここでは、異なる誤差推定器が、トロッター近似による基底状態エネルギーの真の誤差とどのように相関するかを考察する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:13:00 GMT)
Engineered over Emergent Communication in MARL for Scalable and Sample-Efficient Cooperative Task Allocation in a Partially Observable Grid [0.0] 協調型マルチエージェント強化学習(MARL)環境における学習と工学的コミュニケーション戦略の有効性を比較した。
学習したアプローチでは、エージェントがニューラルネットワークを介してメッセージとアクションを同時に生成するLearned Direct Communication (LDC)を導入する。
Intention Communicationは,Imagined Trajectory Generation Module (ITGM) とMessage Generation Network (MGN) を用いて,予測される将来状態に基づいてメッセージを定式化する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:29:07 GMT)
Elucidating the Role of Feature Normalization in IJEPA [0.0] 教師エンコーダの出力における特徴は、学生エンコーダ及び予測器の蒸留ターゲットとして機能する前に、層正規化(LN)される。
本稿では,高エネルギーのトークンが意味論的に重要な画像領域を符号化する,視覚トークンの自然エネルギー階層を乱す特徴の正規化を提案する。
我々は,VT-Smallのイメージネット線形プローブ精度を38%から42.7%改善し,ニューヨーク深度V2単分子深度推定でRMSEを0.08削減した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:52:17 GMT)
EHSAN: Leveraging ChatGPT in a Hybrid Framework for Arabic Aspect-Based Sentiment Analysis in Healthcare [0.0] EHSANはデータ中心のハイブリッドパイプラインで、ChatGPTの擬似ラベリングと人間のレビューを融合して、医療のための最初の説明可能なアラビア語のアスペクトベースの感情データセットを構築する。
各文はアスペクトと感情ラベル(肯定的、否定的、中立的)で注釈付けされ、医療のテーマに沿った先駆的なアラビアのデータセットを形成する。
今後の方向性には、病院全体の一般化、迅速な改善、データ駆動モデリングの解釈などが含まれる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:28:58 GMT)
Diverging conditional correlation lengths in the approach to high temperature [0.0] マルコフ長は古典力学においても分岐することを示す。
熱する系の状態は、ジブシアンではないものになり、その「親ハミルトン」の射程はマルコフの長さとばらつきがちである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:21:44 GMT)
Disambiguation-Centric Finetuning Makes Enterprise Tool-Calling LLMs More Realistic and Less Risky [0.0] 大規模言語モデル(LLM)はますますエンタープライズAPIの呼び出しを担っているが、ほぼ重複したツールが同じユーザ意図で動作しようとすると、日常的にフェールする。
人格駆動の多ターン対話を合成する,曖昧性中心の3段階パイプラインであるDiaFORGEを紹介する。
DiaBENCHのベンチマークでは、DiaFORGEでトレーニングしたモデルは、GPT-4oで27pp、Claude-3.5-Sonnetで49pp、それぞれ最適化されたプロンプトで成功した。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:48:55 GMT)
Detecting and measuring respiratory events in horses during exercise with a microphone: deep learning vs. standard signal processing [0.0] この研究は、ウマの呼吸音を自動的に検出し、運動馬の呼吸速度を自動的に計算した最初のものである。
将来、我々のモデルは低い運動強度の音で検証され、様々なマイク配置が評価され、定期的な監視に最適な組み合わせが見つかる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:34:34 GMT)
Designing lattice proteins with variational quantum algorithms [0.0] 逆問題、タンパク質設計では、特定の標的構造に折り畳まれた配列を求める。
ここでは、今日のノイズ量子デバイスにおけるこれらの2つのステップのうちの1つとして、変分量子アルゴリズムの有用性について検討する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:55:01 GMT)
Defend LLMs Through Self-Consciousness [0.0] 本稿では,大規模言語モデル(LLM)に対する自己意識防御機構について紹介する。
本稿では,メタ認知およびアロケーションモジュールを組み込んだフレームワークを提案し,LCMが自己の出力を自律的に評価・調整することを可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:52:15 GMT)
Deep classification algorithm for De-identification of DICOM medical images [0.0] DICOMファイルの同定は、医用画像研究において不可欠な要素である。
名前、歴史、個人データ、機関など、最も賢明な情報が認識された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 08:21:18 GMT)
DYNARTmo: A Dynamic Articulatory Model for Visualization of Speech Movement Patterns [0.0] DYNARTMOは,2次元中矢状平面における音声の調音過程を可視化する動的調音モデルである。
このモデルは、UK-DYNAMOフレームワークに基づいて構築され、調音的不特定性、分節的およびジェスチャー的制御、協調の原理を統合している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:03:09 GMT)
Convergence of the denoising diffusion probabilistic models for general noise schedules [0.0] 本稿では,従来の離散時間定式化における拡散確率モデル(DDPM)の理論収束解析について述べる。
DDPMアルゴリズムのサンプリング分布と所定の対象データ分布との間の全変動距離について、明示的な上限を導出する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:51:04 GMT)
Convergence and efficiency proof of quantum imaginary time evolution for bounded order systems [0.0] 想像上の時間進化は、決定的な減速を伴わずに、世界最小に収束することを保証している。
また,基礎となる物理系が有界順序であれば,任意の誤差しきい値まで効率的にコンパイルできることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:03:14 GMT)
Contextual Graph Transformer: A Small Language Model for Enhanced Engineering Document Information Extraction [0.0] Contextual Graph Transformer(CGT)は、グラフニューラルネットワーク(GNN)とトランスフォーマーを組み合わせたハイブリッドニューラルネットワークである。
CGTはシーケンシャル、スキップグラム、セマンティック類似性エッジを用いて入力トークン上の動的グラフを構築する。
GPT-2やBERTのようなベースラインよりも優れており、パラメータが62.4%少ないGPT-2よりも24.7%高い精度である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:41:35 GMT)
Confidence-Diversity Calibration of AI Judgement Enables Reliable Qualitative Coding [0.0] 10のテーマカテゴリにわたる8つの最先端のLCMから5,680のコーディング決定を分析する。
標準化されたシャノンのエントロピーとしてモデルの多様性を定量化することにより、この単一のキューは、ほぼ完全に合意を説明するデュアルシグナルへと変換される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:47:10 GMT)
Condensation of vanishing photon emission rates in random atomic clouds [0.0] 寒冷な原子雲の放射動力学に関連するユークリッド確率行列の特性を解析する。
協調性パラメータによって制御された新しい相転移の証拠を提示する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:42:35 GMT)
Complement Sampling: Provable, Verifiable and NISQable Quantum Advantage in Sample Complexity [0.0] 1つの量子サンプル(サブセットの要素上の一様重ね合わせの1つのコピー)のみを使用する単純な量子アルゴリズムを提供する。
サンプル対サンプルの設定では、量子計算は古典的な計算よりも最も大きな分離を達成できる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 09:46:02 GMT)
Comparison of Affine and Rational Quadratic Spline Coupling and Autoregressive Flows through Robust Statistical Tests [0.0] 本稿では,対称および非対称ビジェクタに基づく結合と自己回帰流の詳細な比較を提案する。
本研究は,4~400の次元を拡大する多モーダルな対象分布の集合に焦点をあてる。
以上の結果から,A-RQSアルゴリズムは精度とトレーニング速度の両面で際立っていることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:01:41 GMT)
Comparing Generative Models with the New Physics Learning Machine [0.0] 大規模かつ高次元のレシエーションでは、機械学習は標準的な統計技術の限界を超える一連のツールを提供する。
この主張は、高エネルギー物理文献であるニュー物理学習マシン(New Physics Learning Machine)から、分類に基づく2サンプルテストを行うための提案を比較して、この主張を裏付けるものである。
本稿では,本手法の効率トレードオフと,学習に基づくアプローチの導入による計算コストについて述べる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:42:52 GMT)
Comparative Evaluation of Kolmogorov-Arnold Autoencoders and Orthogonal Autoencoders for Fault Detection with Varying Training Set Sizes [0.0] Kolmogorov-Arnold Networks (KAN) は、従来のニューラルネットワークに代わるフレキシブルでパラメータ効率のよい代替品として登場した。
本研究では, ケミカルプロセスにおける教師なし故障検出のための Kan-based autoencoder (KAN-AEs) の比較評価を行った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:41:12 GMT)
Combining Cost-Constrained Runtime Monitors for AI Safety [0.0] ランタイムモニタを単一の監視プロトコルに組み合わせる方法について検討する。
我々のフレームワークは、望ましくない振る舞いを検出するために既存のモニターを組み合わせるための原則化された方法論を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 03:37:49 GMT)
Collision-based Dynamics for Multi-Marginal Optimal Transport [0.0] 本稿では,モンテカルロ解法を用いて,サンプル指標のランダムなペアワイドスワップによる最適輸送問題の解を近似した衝突型ダイナミクスを提案する。
提案手法の計算複雑性とメモリ使用量はサンプル数とともに線形にスケールし,高次元設定において非常に魅力的である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:07:01 GMT)
Co-designed reflective and leaky-waveguide low-pass filter for superconducting circuits [0.0] フィルタは通過帯域の低挿入損失と高周波数での強い減衰を結合する。
量子ビットは近帯域放射と遠帯域放射の両方に敏感である超伝導量子コンピューティング用途によく適している。
設計は、低温量子系における近接帯域フィルタリングと準粒子発生放射の抑制のためのコンパクトで低損失のソリューションを提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:41:23 GMT)
Clus-UCB: A Near-Optimal Algorithm for Clustered Bandits [0.0] Clus-UCBはクラスタリング構造を利用するように設計されており、腕を評価するための新しいインデックスを導入している。
本稿では,本アルゴリズムのシミュレーション結果と,KL-UCB と,従属腕を持つバンディットに対する他のよく知られたアルゴリズムとの比較を行う。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 21:21:59 GMT)
Cavity-QED-controlled two-dimensional Moiré Excitons without twisting [0.0] 本稿では,空間的に周期的な光学キャビティを用いた全光モワール様励起子閉じ込めを提案する。
レーザー駆動キャビティの古典的な極限において、誘導光閉じ込めはモーアの物理を直接エミュレートする。
これらの効果は長距離キャビティを介するエクシトン-エクシトン相互作用によるもので、非摂動的治療でのみ捉えることができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:10:55 GMT)
Causality and Interpretability for Electrical Distribution System faults [0.0] 本稿では, 因果推論と機械学習を組み合わせることで, 配電系統の故障を分類する手法を提案する。
EDSフォールトデータセットの99.44%は、最先端のアートモデルよりも優れている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 15:35:08 GMT)
Can LLMs Generate High-Quality Task-Specific Conversations? [0.0] 本稿では,大規模言語モデルにおける会話品質制御のためのパラメータ化フレームワークを提案する。
パラメータに基づく制御は、生成した会話特性に統計的に有意な差をもたらすことを示す。
このフレームワークは、教育、セラピー、カスタマーサービス、エンターテイメントの応用による会話品質管理の標準化された方法を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 22:07:08 GMT)
CAK: Emergent Audio Effects from Minimal Deep Learning [0.0] 1つの3x3畳み込みカーネルは、パーソナライズされたコーパスから200個のサンプルをトレーニングすると、創発的なオーディオ効果が得られることを示す。
1) 出力 = input + (learned_pattern x control) と、ゼロコントロールでのID保存をサポートするソフトゲート機構、(2) AuGAN は、"これが本物か?" から "要求値を適用するか?
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:33:36 GMT)
Building and Aligning Comparable Corpora [0.0] 比較可能なコーパス(Comparable corpus)は、複数の言語におけるトピックに沿ったドキュメントの集合である。
ウィキペディア百科事典とEURONEWSのウェブサイトから、英語、フランス語、アラビア語で同等のコーパスを構築する方法を提案する。
また,言語間類似度尺度を用いて,同等の文書を自動的に整合させる手法の実験を行った。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:05:36 GMT)
Bose-Einstein condensation on axially-symmetric surfaces [0.0] 表面アスペクト比が大きくなるとボース・アインシュタイン凝縮が抑制されることを示す。
また、Bogoliubovの励起スペクトルを評価し、凝縮物の集合励起に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:05:37 GMT)
Beyond Least Squares: Robust Regression Transformer (R2T) [0.0] 本稿では,変換器エンコーダが数値列を処理し,圧縮NNがシンボルパラメータを予測し,固定されたシンボル方程式が元のシーケンスを再構成するハイブリッド型ニューラルシンボリックアーキテクチャを提案する。
学習目的は、合成データを用いて、非対称な構造雑音を加えて元の配列を復元し、ニューラルネットワークのパラメータ推定によって導かれる記号的フィットを効果的に学習することである。
合成ウェアラブルデータに対する6e-6から3.5e-5の中央値回帰MSEは,ハマーロスやソフトL1のような最小二乗法やロバスト回帰技術と比較して10~300倍改善されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 20:03:13 GMT)
Benchmarking Deep Learning-Based Object Detection Models on Feature Deficient Astrophotography Imagery Dataset [0.0] スマートフォンベースの天体写真データセットであるMobilTelescoは、薄暗い夜景の画像を提供することで、この問題に対処する。
いくつかの検出モデルをベンチマークし、機能不足の条件下での課題を強調します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:03:40 GMT)
Below threshold nonsequential double ionization with linearly polarized two-color fields I: symmetry and dominance [0.0] 線形偏光二色場を用いたレーザー誘起非逐次二重イオン化法について検討した。
強磁場近似を用いて、場の対称性が支配的な事象にどのように影響するかを評価する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 18:54:33 GMT)
BOOST: Bayesian Optimization with Optimal Kernel and Acquisition Function Selection Technique [0.0] 本稿では,カーネルと取得関数のペア選択を自動化する,シンプルで効果的なフレームワークBOOSTを提案する。
BOOSTは、カーネル獲得関数ペアのパフォーマンスを予測し、高価な評価の前に最も適切な構成を特定する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:08:12 GMT)
Autonomous Inorganic Materials Discovery via Multi-Agent Physics-Aware Scientific Reasoning [0.0] 本稿では,自動無機材料設計のためのマルチエージェントAIモデルSparksMatterを紹介する。
アイデアを生成し、実験的に設計し、実行し、結果を継続的に評価し、精錬し、候補となる材料を提案する。
モデルの性能は、熱電、半導体、ペロブスカイト酸化物材料の設計におけるケーススタディで評価される。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 23:40:43 GMT)
Automated Construction of Artificial Lattice Structures with Designer Electronic States [0.0] 銅基板上に一酸化炭素(CO)分子を空間的に操作することで人工構造を構築するための強化学習(RL)フレームワークを提案する。
提案手法は, アクティブドリフト補償と組み合わせた経路計画プロトコルを導入し, 人間の入力を著しく低減した構造体の原子的精密な製作を可能にする。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:38:45 GMT)
Assessing the Impact of Image Super Resolution on White Blood Cell Classification Accuracy [0.0] 顕微鏡画像から正確な白血球を正確に分類することは、医療診断におけるいくつかの疾患や状態を特定するのに不可欠である。
ディープラーニング技術は、画像の迅速かつ自動分類に採用されている。
画像超解像などの画像改善技術は、この問題を回避するために写真の解像度を改善するために利用されている。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:03:42 GMT)
An equivalence between time-symmetry and cyclic causality in quantum theory [0.0] 我々は、P-CTCフレームワークを拡張して、時間ラベリングされたP-CTCアシストコムを定義する。
全ての(おそらく混合した)MTSに対して、P-CTCアシストコームが運用上等価であることを示す。
等価性は明示的な写像を通して示され、関連するP-CTCの数と次元性について議論する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 14:30:46 GMT)
An Enhanced Focal Loss Function to Mitigate Class Imbalance in Auto Insurance Fraud Detection with Explainable AI [0.0] 本稿では,局所クラスマの回避を支援することで,不均衡な性能向上を図るために,新しい多段階焦点損失関数を提案する。
本研究は,高度スキュード分類における多段階焦点損失がロバスト性向上に有効であることを示す。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 10:53:10 GMT)
An Efficient Continuous-Time MILP for Integrated Aircraft Hangar Scheduling and Layout [0.0] 本稿では,この統合時間問題を解くために,MILP(Continuous-time Mixed-Integer linear programming)モデルを提案する。
このモデルは、最大25機のインスタンスを最適性を示すために解決し、しばしばわずか数秒で解決し、最大40機の大規模ケースでは、既知の最適性ギャップ内で高品質なソリューションを提供する。
テストされたすべてのシナリオにおいて、フレームワークはかなりの経済的メリットがあり、ソリューション時間と最適性の間のトレードオフに関する貴重な管理上の洞察を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 17:25:36 GMT)
AI-Based Measurement of Innovation: Mapping Expert Insight into Large Language Model Applications [0.0] 大規模言語モデル(LLM)は、手作業による専門家評価の制約を克服するために利用することができる。
我々は、構造化されていないテキストデータから、ドメインの専門家によるイノベーション評価を確実に近似するLLMフレームワークを設計する。
本稿は、LLMを効果的に活用するための知識とツールを、企業、研究者、レビュアー、編集者に提供します。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:49:30 GMT)
A perturbation theory for multi-time correlation functions in open quantum systems [0.0] 我々は、マルチ時間相関関数を計算するための体系的摂動理論を開発することにより、オープン量子システム理論の範囲を広げる。
閉系の場合、そのような相関関係は十分に定義されているが、システムの状態に関する知識だけではそれらを完全に決定するには不十分である。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:23:31 GMT)
A novel approach to navigate the taxonomic hierarchy to address the Open-World Scenarios in Medicinal Plant Classification [0.0] 既存の薬草分類法は、しばしば階層的な分類や未知の種を正確に識別することができないことが観察された。
DenseNet121,Multi-Scale Self-Attention (MSSA) と階層分類のためのカスケード分類器を組み合わせた新しい手法を提案する。
提案するモデルサイズは,既存の最先端技術に比べて約4倍小さく,現実のアプリケーションに容易にデプロイできる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:19:21 GMT)
A class of modular and flexible covariate-based covariance functions for nonstationary spatial modeling [0.0] 固定された観測可能な空間情報に依存する共分散関数のクラスを示す。
このモデルは、辺標準偏差、幾何学的異方性、滑らかさなど、異なる非定常性源に対する別々の構造を可能にする。
シミュレーション研究を通じて提示されたモデルの性能解析とスイスの降水データへの適用について述べる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 07:53:20 GMT)
A class of 2 X 2 correlated random-matrix models with Brody spacing distribution [0.0] ブロディ分布が固有値間隔分布である2x2ランダム行列モデルのクラスを導入する。
ここで導入されたランダム行列は、ガウス直交アンサンブル(GOE)の3つの重要な方法で異なる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 19:57:35 GMT)
A Multiplicative Ergodic Theorem for Bistochastic Ergodic Quantum Processes with Applications to Entanglement [0.0] 有限次元行列代数に作用する双確率完全正(bcp)線型コサイクルに対する乗法的エルゴード定理を証明する。
ランダムなbcpマップの合成が絡み合っているときに分類する。
結論は、ある種の bcp 線型複素環が有限時間でほぼ確実に絡み合っていることを示すことである。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 13:29:16 GMT)
A Hybrid Transformer Architecture with a Quantized Self-Attention Mechanism Applied to Molecular Generation [0.0] 本稿では,トランスデコーダの一部として,量子古典的自己アテンション機構を提案する。
クェリキードット積の時間的複雑さは古典的モデルでは$mathcalO(n2 d)$から量子モデルでは$mathcalO(n2 d)$に減少する。
この研究は、量子化自然言語処理(NLP)のための有望な道を提供する。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 12:11:37 GMT)
A "good regulator theorem" for embodied agents [0.0] コナントとアシュビーは「システムの適切な規制はすべて、そのシステムのモデルでなければならない」と主張した。
ここでは、同様の直感が別の方法で具現化できることを示します。
観察者は、その環境について「信じている」と解釈することができる。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 16:11:31 GMT)
5G Core Fault Detection and Root Cause Analysis using Machine Learning and Generative AI [0.0] 本稿では,PCAPファイルのフレームの分類と故障をAI/ML駆動型故障解析(FA)エンジンで行う。
FAエンジンは、自然言語処理技術を用いてネットワークトラフィックを分析し、異常と非効率を識別する。
エンジンはまた、複数の5GパケットコアドキュメントでトレーニングされたLarge Language Model (LLM)を介して、ジェネレーティブAIを使用して問題を修正するためのステップも提案している。
論文参考訳(メタデータ) (Mon, 04 Aug 2025 05:20:32 GMT)