VPO: Aligning Text-to-Video Generation Models with Prompt Optimization [105.1] ビデオ生成モデルは、通常、高度に詳細で慎重に記述されたテキストとビデオのペアで訓練される。
VPOは3つの基本原則(無害性、正確性、有用性)に基づいてプロンプトを最適化する、原則化されたフレームワークです。
実験の結果,VPOは基準法に比べて安全性,アライメント,画質を著しく向上することがわかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:39:39 GMT)
HAICOSYSTEM: An Ecosystem for Sandboxing Safety Risks in Human-AI Interactions [95.5] 本稿では,多様な複雑な社会的相互作用におけるAIエージェントの安全性を調べるフレームワークであるHAICOSYSTEMを提案する。
私たちは7つの領域(医療、金融、教育など)にわたる92のシナリオに基づいて1840のシミュレーションを実行します。
我々の実験は、最先端のLSMは、プロプライエタリかつオープンソースの両方で、50%以上のケースで安全リスクを示すことを示した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:01:52 GMT)
CoRanking: Collaborative Ranking with Small and Large Ranking Agents [94.1] 大規模言語モデル(LLM)は、優れたリストワイドランキング性能を示している。
CoRankingは、小規模と大規模なランキングモデルを組み合わせて、効率的かつ効果的なランク付けを行う。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:02:00 GMT)
IC-Custom: Diverse Image Customization via In-Context Learning [93.7] IC-Customは、位置認識と位置自由な画像カスタマイズをシームレスに統合する統合フレームワークである。
試着、アクセサリ配置、家具の配置、創造的なIPカスタマイズなど、さまざまな産業アプリケーションをサポートしている。
アイデンティティの整合性、調和性、テキストアライメントの指標に対して、人間の嗜好が73%向上する一方で、オリジナルのモデルのパラメータの0.4%しかトレーニングしていない。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:00:30 GMT)
Harnessing Vision Models for Time Series Analysis: A Survey [85.7] 本研究は, 時系列解析におけるLLMよりも視覚モデルの方が優れていることを示す。
既存の方法の包括的かつ詳細な概要を提供し、詳細な分類学の双対的な見解を提供する。
このフレームワークに関わる前処理と後処理のステップにおける課題に対処する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:05:18 GMT)
OA-DET3D: Embedding Object Awareness as a General Plug-in for Multi-Camera 3D Object Detection [77.4] 我々は3Dオブジェクト検出を改善するプラグインモジュールであるOA-DET3Dを紹介する。
OA-DET3Dは、オブジェクト中心の深度情報と前景の擬似点を活用することにより、オブジェクトの表現を高める。
我々は、OA-DET3Dの有効性を検証するために、nuScenesデータセットとArgoverse 2データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:24:40 GMT)
CoViPAL: Layer-wise Contextualized Visual Token Pruning for Large Vision-Language Models [75.9] LVLM(Large Vision-Language Models)は、画像やビデオから抽出されたテキストトークンとビジョントークンからなるマルチモーダル入力を処理する。
既存の手法は冗長な視覚トークンを創りだそうとしており、視覚表現のかなりの冗長性を明らかにしている。
我々は,LVLMで処理される前に冗長な視覚トークンを予測・削除するために,Plug-and-Play Pruning Module (PPM) を用いるレイヤワイズなコンテキスト対応型視覚トークンプルーニング手法であるCoViPALを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:59:19 GMT)
SurgLLM: A Versatile Large Multimodal Model with Spatial Focus and Temporal Awareness for Surgical Video Understanding [75.0] SurgLLMフレームワークは、多用途の手術ビデオ理解タスクに適した、大規模なマルチモーダルモデルである。
外科的ビデオの空間的焦点を高めるために,SurgLLMの動画エンコーダのためのSurg-Pretraining(Surg-Pretraining)を最初に考案した。
外科的時間的知識をSurgLLMに組み込むため, インターリーブ型マルチモーダル埋め込みによる時間的推論を改善するために, 時間的対応型マルチモーダルチューニング(TM-Tuning)を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:36:41 GMT)
LogiDynamics: Unraveling the Dynamics of Logical Inference in Large Language Model Reasoning [74.0] 本稿では、類似推論のための制御された評価環境を導入することにより、探索的アプローチを採用する。
帰納的,帰納的,帰納的,帰納的な推論パイプラインの比較力学を解析する。
仮説選択や検証,洗練といった高度なパラダイムを考察し,論理的推論のスケールアップの可能性を明らかにする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:43:27 GMT)
Entropy-based Coarse and Compressed Semantic Speech Representation Learning [72.2] 圧縮された意味表現を学習するためのエントロピーに基づく動的集約フレームワークを提案する。
ASR、音声からテキストへの変換、音声変換タスクの実験は、圧縮された表現が密度の高いトークンシーケンスと同等以上のパフォーマンスを示すことを示した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 13:50:58 GMT)
From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery [67.1] 大規模言語モデル(LLM)は科学的発見のパラダイムシフトを触媒している。
この調査は、この急成長する分野を体系的に分析し、科学におけるLLMの役割の変化とエスカレーション能力に重点を置いている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:45:03 GMT)
Graph-Augmented Large Language Model Agents: Current Progress and Future Prospects [57.5] グラフ拡張LDMエージェント(GLA)は複雑なエージェントシステムの構造、連続性、調整を強化する。
本稿では,最近の進歩の概要をタイムリーかつ包括的に紹介し,今後の研究の方向性を明らかにする。
本論文は,GLAにおける今後の研究のロードマップとして機能し,GLAエージェントシステムにおけるグラフの役割のより深い理解を促進することを願っている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:01:56 GMT)
Galaxea Open-World Dataset and G0 Dual-System VLA Model [55.8] 実生活と作業環境に記録された大規模で多様なロボット行動のコレクションを提示する。
すべてのデモは、一貫したロボットエンボディメントを使用して収集され、正確なサブタスクレベルの言語アノテーションと組み合わせられる。
G0は、クロス・エボディメント・プレトレーニング、シングル・エボディメント・プレトレーニング、タスク固有のポスト・トレーニングという3段階のカリキュラムを使って訓練されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:04:19 GMT)
Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.4] 3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。
知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。
Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。
イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:04:14 GMT)
Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis [51.4] 本稿では,パラメータの少ない事前学習モデルを微調整するAdaptive Point-Prompt Tuning (APPT)法を提案する。
局所幾何学を集約することで原点雲を点埋め込みに変換し、空間的特徴を捉える。
任意のモダリティのソース領域から3Dへの自己アテンションを校正するために,重みを点埋め込みモジュールと共有するプロンプトジェネレータを導入する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:02:21 GMT)
SynDelay: A Synthetic Dataset for Delivery Delay Prediction [50.6] 配送遅延予測のための合成データセットであるSynDelayを提案する。
これはサプライチェーンAIにおけるデータセットの共有とベンチマークを促進するオープンイニシアチブである。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 21:54:37 GMT)
Advancing Grounded Multimodal Named Entity Recognition via LLM-Based Reformulation and Box-Based Segmentation [48.5] Grounded Multimodal Named Entity Recognition (GMNER) タスクは、名前付きエンティティ、エンティティタイプ、および対応する視覚領域を識別することを目的としている。
我々は,大規模な言語モデルを活用することで,GMNERをMNER-VE-VGタスクに再構成する統一フレームワークであるRiVEGを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:31:38 GMT)
Training Text-to-Molecule Models with Context-Aware Tokenization [48.4] 我々は、文脈認識分子T5(CAMT5)という新しいテキスト・分子モデルを提案する。
分子構造を理解する上でのサブストラクチャーレベルのコンテキストの重要性に着想を得て,テキストから分子モデルへのサブストラクチャーレベルのトークン化を導入する。
我々は、重要なサブ構造を優先し、CAMT5が分子意味をよりよく捉えられるように、重要度に基づくトレーニング戦略を開発する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:59:02 GMT)
DevilSight: Augmenting Monocular Human Avatar Reconstruction through a Virtual Perspective [46.9] 本稿では,先進的な映像生成モデルであるHuman4DiTを用いて,代替視点から人間の動きを生成することを提案する。
人間の動きの連続的な再現を確保するため,ビデオの微調整により物理アイデンティティーをモデルに注入する。
より詳細な高精細な出力に対しては、パッチベースの復調アルゴリズムが用いられる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 08:06:16 GMT)
Discrete Prompt Tuning via Recursive Utilization of Black-box Multimodal Large Language Model for Personalized Visual Emotion Recognition [46.9] MLLM(Multimodal Large Language Models)が注目され、従来の視覚感情認識(VER)手法に匹敵する性能を示した。
提案手法は,生成したプロンプトから最高の自然言語表現を選択し,それを用いて正確なパーソナライズされたVERを実現するためのプロンプトを更新する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:47:17 GMT)
Unifying Adversarial Perturbation for Graph Neural Networks [46.7] 本稿では,ノードの特徴やグラフ構造に対する敵対攻撃に対するグラフニューラルネットワーク(GNN)の脆弱性について検討する。
本稿では、敵の摂動と訓練を統合したPerturbEmbeddingを提案し、そのような攻撃に対するGNNの弾力性を高める。
我々は、PerturbEmbeddingがGNNの堅牢性と一般化能力の両方を大幅に改善し、既存の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:53:36 GMT)
Progent: Programmable Privilege Control for LLM Agents [46.3] 本稿では,大規模言語モデルエージェントをセキュアにするための最初の特権制御フレームワークであるProgentを紹介する。
Progentは、潜在的に悪意のあるものをブロックしながら、ユーザタスクに必要なツールコールの実行をエージェントに制限することで、ツールレベルでのセキュリティを強化する。
モジュール設計のおかげで、Progentの統合はエージェント内部を変更せず、既存のエージェントの実装に最小限の変更しか必要としません。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:42:59 GMT)
Gradient projection method for constrained quantum control [46.1] 我々は、量子制御の問題にGPM(Gradient Projection Method)を採用する。
この方法の主な利点は、境界を正確に満たすことができることである。
GPMを1および2キュービットゲートと2キュービットベルおよびワーナー状態の生成を含むいくつかの例に適用する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:59:51 GMT)
Injecting Domain-Specific Knowledge into Large Language Models: A Comprehensive Survey [45.9] 大規模言語モデル(LLM)は、自然言語理解、テキスト要約、機械翻訳といった様々なタスクにおいて顕著な成功を収めている。
彼らの汎用的な性質は、医療、化学、法的な分析といった専門的な知識を必要とするドメイン固有のアプリケーションにおいて、その効果を制限していることが多い。
これを解決するために、研究者はドメイン固有の知識を統合することでLLMを強化する様々な方法を模索してきた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:17:17 GMT)
Performance and Storage Analysis of CRYSTALS Kyber as a Post Quantum Replacement for RSA and ECC [45.9] CRYSTALS-Kyberは、2022年にNISTによって標準化されたポスト量子暗号ソリューションである。
本研究は,様々な実装方式における性能試験を通じて,Kyberの実用可能性を評価する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:52:50 GMT)
Memory Limitations of Prompt Tuning in Transformers [45.2] 本研究では, 変圧器が記憶する情報量は, 即時長よりも高速に拡張できないことを示す。
また,大規模言語モデルで経験的に観察された現象,すなわち性能劣化の最初の公式な証明も提示する。
この発見は、トランスフォーマーアーキテクチャの本質的な制限に関する根本的な理解を提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:08:00 GMT)
Are Decoder-Only Large Language Models the Silver Bullet for Code Search? [44.9] コード検索はコードの再利用に不可欠であり、開発者は関連コードスニペットを効率的に見つけることができる。
強力なデコーダのみの大規模言語モデル(LLM)は多くのコードインテリジェンスタスクに革命をもたらした。
本稿では,11個のデコーダのみのLCMのシステム評価を行い,その性能をゼロショットと微調整で解析する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:18:40 GMT)
ProteuS: A Generative Approach for Simulating Concept Drift in Financial Markets [44.8] 適応アルゴリズムの開発と検証における根本的な問題は、現実世界の財務データに基礎的な真理が欠如していることである。
本稿では,事前定義された構造破壊を伴う半合成財務時系列を生成するための新しいフレームワークProteuSを紹介する。
生成されたデータの解析によってタスクの複雑さが確認され、異なる市場状態間の大きな重複が明らかになる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 21:01:47 GMT)
Modeling Motivated Reasoning in Law: Evaluating Strategic Role Conditioning in LLM Summarization [44.6] 大規模言語モデル(LLM)は、ユーザに適した要約を生成するために、ますます使われています。
これは動機付け推論に関する重要な疑問を提起する。
我々は,LLMが異なる法的役割を条件づけたプロンプトにどのように反応するかを検討する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:22:47 GMT)
Structuring GUI Elements through Vision Language Models: Towards Action Space Generation [43.9] マルチモーダル大規模言語モデル(MLLM)は、人間とコンピュータの相互作用を強化する重要なツールとして登場した。
本稿では,グラフィカルユーザインタフェース(GUI)要素構造化分野におけるMLLMの応用に焦点を当てた。
視覚モジュール機能を強化するために,IAML(IoU-Augmented Maximum Likelihood)トレーニングパラダイムを導入する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:46:19 GMT)
DarwinWafer: A Wafer-Scale Neuromorphic Chip [43.9] 我々は,300mmシリコンインターポーサ上に64個のDarwin3チップレットを高密度に統合し,オフチップ配線をウェハスケールで置き換えるハイパースケールシステム・オン・ウェハを提案する。
各チップレット内のGALS NoCと階層的な時間ステップ同期を備えたAERベースの非同期ウエハファブリックは、ウエハをまたいだ低レイテンシでコヒーレントな動作を提供する。
DarwinWaferは100Wを消費し、64TSOPSピークスループット(0.64TSOPS/W)で4.9pJ/SOPを達成する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 00:22:09 GMT)
A Survey on Human-Centered Evaluation of Explainable AI Methods in Clinical Decision Support Systems [42.7] 本稿では,臨床診断支援システムにおける説明可能なAI手法の人間中心評価について調査する。
本研究は、XAIの医療への統合における重要な課題を明らかにし、XAIの評価方法と利害関係者の臨床的ニーズを整合させる構造的枠組みを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:57:04 GMT)
SABR: A Stable Adaptive Bitrate Framework Using Behavior Cloning Pretraining and Reinforcement Learning Fine-Tuning [41.3] 本稿では,行動クローニング(BC)と強化学習(RL)の微調整を組み合わせた学習フレームワークSABRを提案する。
ABRBench-3G と ABRBench-4G+ というベンチマークも導入した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:32:45 GMT)
Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound [41.0] 正確なセグメンテーションのために2D/3Dボックスにのみ依存するFlip Learningと呼ばれる新しい学習ベースのWSSフレームワークを導入する。
ボックスからターゲットを消去して分類タグのフリップを容易にするために複数のエージェントが使用され、消去された領域が予測されたセグメンテーションマスクとして機能する。
提案手法は最先端のWSS手法や基礎モデルより優れており,完全教師付き学習アルゴリズムと同等の性能を発揮する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:45:47 GMT)
Make me an Expert: Distilling from Generalist Black-Box Models into Specialized Models for Semantic Segmentation [40.4] 我々は,現実的な制約下での局所モデル適応を可能にするブラックボックス蒸留(B2D)設定を導入する。
オープン語彙モデルは入力分解能に対して大きな感度を示し、異なるオブジェクトクラスは異なるスケールで最適にセグメンテーションされる。
提案手法であるAT-Guided sCaler (ATGC) は,DINOv2アテンションマップを利用してブラックボックスモデル推論のための最適スケールを動的に選択することでこの問題に対処する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:03:09 GMT)
FreeTalk:A plug-and-play and black-box defense against speech synthesis attacks [40.2] 音声合成攻撃に対する軽量で堅牢なプラグアンドプレイプライバシ保護手法を提案する。
本手法は,プライバシ保護と高音質を実現するために,元の音声に周波数領域の摂動を生成し,付加する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 17:10:22 GMT)
OCR Hinders RAG: Evaluating the Cascading Impact of OCR on Retrieval-Augmented Generation [39.8] Retrieval-augmented Generation (RAG)は、幻覚を抑えるために外部知識を統合することで、言語モデル(LLM)を強化する。
RAGの本質的な部分として、光学文字認識(OCR)を用いて構造化されていないPDF文書から構造化されたデータを抽出して外部知識ベースを構築することが一般的である。
本稿では,RAGシステムにおけるOCRのカスケード効果を理解するための最初のベンチマークであるOHRBenchを紹介する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:10:08 GMT)
SETS: Leveraging Self-Verification and Self-Correction for Improved Test-Time Scaling [39.6] 自己拡張テストタイムスケーリング(SETS)は、並列およびシーケンシャルなテクニックを戦略的に組み合わせることで制限を克服する、シンプルで効果的なアプローチである。
SETSは、大規模言語モデルの固有の自己検証と自己計算機能を活用し、単一のフレームワーク内でサンプリング、検証、修正を統合する。
以上の結果から,SETSは代替品よりも優れた性能向上と,より有利なテスト時間スケーリング動作を実現していることがわかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:12:37 GMT)
Scaling Up, Speeding Up: A Benchmark of Speculative Decoding for Efficient LLM Test-Time Scaling [38.3] テストタイムスケーリングは、大規模言語モデルの推論能力を高めるための強力なパラダイムである。
テストタイムのスケーリングは、冗長かつ反復的な推論トレースの生成によって本質的に非効率である。
テスト時間スケーリングを高速化する投機的復号法を評価するために設計された最初の包括的なベンチマークを紹介する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:54:55 GMT)
Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation [37.4] Face-MoGLEはセマンティック・デカップリング・ラテント・モデリングの新しいフレームワークである。
高品質で制御可能な顔生成を提供し、生成モデリングやセキュリティアプリケーションに強い可能性を秘めている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:21:07 GMT)
Exploring Large Language Models in Resolving Environment-Related Crash Bugs: Localizing and Repairing [36.5] 大規模言語モデル(LLM)は、ソフトウェア工学のタスクにおいて有望であることを示している。
実環境におけるクラッシュバグの解決におけるLLMの能力を評価するための,初の総合的研究を行った。
この結果から,コードクラッシュを解決する上ではローカライゼーションが最大の課題であることが明らかとなった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 13:07:35 GMT)
Social World Models [35.7] 我々は、新しい構造化社会世界表現形式(S3AP)を導入する。
S3APは、状態、観察、エージェントアクション、精神状態といった社会的相互作用を構造化されたものとして表現する。
S3APは、LLMが5つの社会的推論タスクのソーシャルな物語をよりよく理解するのに役立ちます。
次に、これらの構造化された表現から社会世界モデルを誘導し、将来の社会的ダイナミクスを予測する能力を示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:52:58 GMT)
DiffKV: Differentiated Memory Management for Large Language Models with Parallel KV Compaction [33.9] DiffKVは効率的なKVキャッシュ圧縮のための新しいフレームワークである。
KVキャッシュにおける3つのレベルの分化を利用する。
KVキャッシュを2.7Times$から5.7times$に圧縮できる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:35:22 GMT)
LightVLM: Acceleraing Large Multimodal Models with Pyramid Token Merging and KV Cache Compression [33.6] トレーニング不要な方法で推論プロセスを大幅に高速化する,シンプルだが効果的な方法であるLightVLMを導入する。
視覚言語モデルの推論手順は,符号化と復号という2つの段階に分けられる。
実験の結果、LightVLMは35%の画像トークンしか保存していない場合、100%の性能を維持することができた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 08:57:53 GMT)
Language-Aware Information Maximization for Transductive Few-Shot CLIP [33.6] 高い競争力を持つトランスダクティブスショットCLIP法を開発した。
本稿では,3つの相補的な用語を組み込んだ新たな言語認識情報MaximizatiOn(LIMO)の損失について紹介する。
本稿では,モデルパラメータのサブセットをトランスダクティブな数ショット設定で適応させる可能性を示すパフォーマンスの大幅な向上を観察する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:46:31 GMT)
ERank: Fusing Supervised Fine-Tuning and Reinforcement Learning for Effective and Efficient Text Reranking [33.3] ERankは、多種多様な関連シナリオにまたがるLLMから構築された、非常に効率的で効率的なポイントワイド・リランカである。
スーパーバイザードファインチューニング(SFT)から始まる新しい2段階トレーニングパイプラインを提案する。
この段階では、二進ラベルを超えてモデルを生成的に訓練し、微粒な整数スコアを出力し、妥当性の識別を大幅に向上させる。
BRIGHT, FollowIR, TREC DL, BEIRベンチマークにおけるERankリランカの評価を行い, 既存手法と比較して優れた有効性と堅牢性を示した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:56:53 GMT)
LUT-Fuse: Towards Extremely Fast Infrared and Visible Image Fusion via Distillation to Learnable Look-Up Tables [33.1] 赤外線と可視光の融合に関する最近の高度な研究は、主に融合性能の改善に焦点を当てている。
LUT-Fuseと呼ばれる画像融合に特化して設計された学習可能なルックアップテーブルへの蒸留による超高速核融合に向けた新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:59:26 GMT)
Continuously Steering LLMs Sensitivity to Contextual Knowledge with Proxy Models [33.0] CSKS(Continuously Steering Knowledge Sensitivity)は、大規模言語モデルの文脈的知識に対する感受性を、軽量で継続的に評価するフレームワークである。
本研究では,LLMの文脈的知識に対する感度を連続的かつ高精度に制御し,感度の向上と感度の低減を実現していることを示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:54:41 GMT)
ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute [32.9] ParaThinkerは、LLMをトレーニングして複数の多様な推論パスを並列に生成するエンドツーエンドフレームワークである。
トンネルビジョンの問題を効果的に回避し、モデルの潜在的推論可能性を解き放つ。
挑戦的な推論ベンチマークでは、ParaThinkerはシーケンシャルLLMよりもかなり精度が向上している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:09:07 GMT)
Domain Adaptation for Big Data in Agricultural Image Analysis: A Comprehensive Review [31.6] ドメイン適応(DA)技術は、農業画像解析におけるクロスドメイン転送性を改善するための課題に対処することができる。
DAは限られたラベル付きデータ、不十分なモデル適応性、およびフィールド環境における動的変化の場合に有望な解であると考えられている。
近年の農業画像におけるDAの最近の進歩を体系的にレビューする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:20:30 GMT)
Two Causes, Not One: Rethinking Omission and Fabrication Hallucinations in MLLMs [31.6] 既存の手法は、省略と製造幻覚が共通の原因を共有するという欠点のある仮定に基づいており、しばしば省略を減らし、より多くの製造を誘発する。
本研究は,視覚的特徴を言語表現にマッピングする場合に,排他的幻覚が不十分な自信から生じることを示すことによって,この見解を覆すものである。
本研究では,物体の存在や不在を視覚的証拠がどのように推測するかを明らかにする概念的枠組みである視覚意味的注意力場を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:47:41 GMT)
VistaWise: Building Cost-Effective Agent with Cross-Modal Knowledge Graph for Minecraft [30.1] VistaWiseは、クロスモーダルなドメイン知識を統合する費用効率のよいエージェントフレームワークである。
ドメイン固有のトレーニングデータの要求を数百万のサンプルから数百に削減する。
様々なオープンワールドタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:01:08 GMT)
FlairGPT: Repurposing LLMs for Interior Designs [29.9] 大規模言語モデル (LLM) が内部設計に直接活用できるかどうかを検討する。
LLMを体系的に探索することにより、関連する制約とともにオブジェクトのリストを確実に生成できる。
この情報を設計レイアウトグラフに変換し、オフザシェルフ制約最適化設定を用いて解決する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:32:28 GMT)
Metis: Training Large Language Models with Advanced Low-Bit Quantization [28.6] いくつかの支配的な特異値は、ブロックワイド量子化の固有のバイアスと矛盾する広い数値範囲を創出する。
この研究は、スペクトル分解とランダム埋め込みを組み合わせたトレーニングフレームワークであるMetisを導入し、長尾成分から支配的な成分を効率的に解離させる。
Metisでは、FP8トレーニングはFP32ベースラインを超え、FP4トレーニング精度はFP32に匹敵する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 08:09:08 GMT)
Target-Oriented Single Domain Generalization [27.2] 単一ソースドメインでトレーニングされたディープモデルは、分散シフトの下で破滅的に失敗することが多い。
本稿では,対象ドメインのテキスト記述を活用する新しい問題設定である,ターゲット指向単一ドメイン一般化を提案する。
私たちは、ターゲットセマンティクスをソース機能に注入するモジュールであるSpectral TARget Alignment(STAR)を紹介します。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:21:48 GMT)
Balanced Actor Initialization: Stable RLHF Training of Distillation-Based Reasoning Models [27.0] 大規模言語モデルにおけるアライメントと推論能力の開発は目覚ましい進歩を遂げた。
RLHFを蒸留訓練モデルに適用する第3のパラダイムは、重大な課題を示す。
本稿では,2段階重み付きモデルマージ手法であるBa balanced Actor Initialization (BAI)を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:53:25 GMT)
Scalable Frame Sampling for Video Classification: A Semi-Optimal Policy Approach with Reduced Search Space [27.0] 検索スペースを$O(TN)$から$O(TN)$に減らすという新しい視点を導入する。
O(TN)$空間全体を探索する代わりに、提案した半最適ポリシーは各フレームの独立推定値に基づいて上位の$N$フレームを選択する。
我々は, 準最適政策が, 特に実践的な条件下で, 最適政策を効率的に近似できることを確認した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:41:40 GMT)
Localizing and Mitigating Memorization in Image Autoregressive Models [25.7] Image AutoRegressive (IAR)モデルは、生成した画像の速度と品質において最先端のパフォーマンスを達成した。
しかし、トレーニングデータの記憶と、そのプライバシーへの影響に関する懸念も持ち上がっている。
本研究は, 微細な暗記を計測することにより, 異なる自己回帰アーキテクチャ内でこのような暗記がどのように起こるのかを考察する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 13:04:36 GMT)
MedSEBA: Synthesizing Evidence-Based Answers Grounded in Evolving Medical Literature [25.4] 医学的質問に対するエビデンスベースの回答を合成する対話型AIシステムであるMedSEBAを紹介する。
答えはキーポイントと議論から成り、それぞれの研究に遡ることができる。
ユーザスタディでは,医療専門家や一般ユーザを対象に,システムの有用性と有用性を確認した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 08:43:09 GMT)
Activation Steering Meets Preference Optimization: Defense Against Jailbreaks in Vision Language Models [25.3] 視覚言語モデル(VLM)は、理解と推論のために視覚情報とテキスト情報を統合するという印象的な能力を示しているが、敵の攻撃に対して非常に脆弱である。
モデルロバスト性を高めるために,アクティベーションレベルの介入とポリシレベルの最適化を組み合わせた新しい2段階防衛フレームワークであるtextitSequence-Level Preference Optimization for VLM (textitSPO-VLM)を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:00:53 GMT)
Biological Pathway Informed Models with Graph Attention Networks (GATs) [25.2] 生物学的経路は、すべてのヒトのプロセスを管理する遺伝子と遺伝子間の相互作用をマッピングする。
ほとんどのMLモデルは、既知の経路構造を捨て、非構造トークンとして遺伝子を扱う。
遺伝子レベルで経路をモデル化するグラフ注意ネットワーク(GAT)を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:14:30 GMT)
NMR-Solver: Automated Structure Elucidation via Large-Scale Spectral Matching and Physics-Guided Fragment Optimization [24.7] 核磁気共鳴分光法(英: Nuclear Magnetic Resonance spectroscopy、NMR)は、有機化学において最も強力で広く用いられている分子構造解明法の一つである。
本稿では,小さな有機分子構造を1ドルHおよび13ドルCのNMRスペクトルから自動決定するための,実用的で解釈可能なフレームワークであるNMR-rについて述べる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:59:12 GMT)
LatentEdit: Adaptive Latent Control for Consistent Semantic Editing [24.4] LatentEditは、現在の潜伏コードとソースイメージから反転した参照潜伏コードを組み合わせた適応潜伏融合フレームワークである。
提案するLatentEditは,8~15ステップでも最先端の手法よりも高い精度で,忠実度と編集可能性の最適なバランスを実現する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:47:03 GMT)
Nonreciprocal Entanglement by Dynamically Encircling a Nexus [23.9] 我々は、散逸光力学において、磁気自由な非相反性を設計するための普遍非線形機構を提案する。
不安定性のネクサスを動的に囲むことにより、非相互変位を求め、それを利用して頑健な非相互絡み合いを実現する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:33:43 GMT)
DGL-RSIS: Decoupling Global Spatial Context and Local Class Semantics for Training-Free Remote Sensing Image Segmentation [23.3] 視覚とテキストの入力を分離する学習自由フレームワークDGL-RSISを提案する。
このフレームワークは、ローカルセマンティックレベルとグローバルコンテキストレベルの両方で視覚言語アライメントを実行する。
拡張テキスト特徴とマスク誘導視覚特徴とをマッチングすることにより、マスク分類を可能にする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 19:45:25 GMT)
Density and unitarity of the Burau representation from a non-semisimple TQFT [22.6] フーラ表現の密度を、単位の4番目の根における非半単純TQFTの観点から検討する。
これにより、ブラウ表現上のスキーアのエルミート形式のTQFT構成が、おそらく混合シグネチャを持つ。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:23:06 GMT)
Backdoor Samples Detection Based on Perturbation Discrepancy Consistency in Pre-trained Language Models [21.9] 本稿では,PerturbatiotextbfN discrtextbfEpancy consistextbfTency textbfEvaluation (NETE)に基づくバックドアサンプル検出手法を提案する。
検出プロセスでは、サンプルのログ確率を計算するために、オフザシェルフ事前訓練モデルのみを必要とする。
本手法は, 室内試料の摂動差の変化がクリーン試料のそれよりも小さいという興味深い現象に基づいている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:35:32 GMT)
NEWSAGENT: Benchmarking Multimodal Agents as Journalists with Real-World Newswriting Tasks [21.6] NEWSAGENTは、エージェントが利用可能な生のコンテンツを自動的に検索し、望ましい情報を選択し、ニュース記事の編集とリフレーズを行う方法を評価するためのベンチマークである。
NEWSAGENTには、実際のニュースから派生した6kの人間による検証例が含まれており、マルチモーダルコンテンツは、幅広いモデル互換性のためにテキストに変換される。
NEWSAGENTは、マルチモーダルなWebデータ操作から現実の生産性まで、エージェント機能を反復し評価するための現実的なテストベッドであると考えています。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:31:34 GMT)
Stage-wise Adaptive Label Distribution for Facial Age Estimation [21.6] 年齢推定のための段階適応ラベル分布学習(SA-LDL)アルゴリズムを提案する。
SA-LDLはラベルの曖昧さの複雑で構造的な性質を効果的に捉え、より正確で頑健な年齢推定に繋がる。
実験により、SA-LDLはMORPH-IIとFG-NETのデータセットで1.74と2.15のMAEで競合性能を発揮することが示された。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:45:24 GMT)
Thinking Hard, Going Misaligned: Emergent Misalignment in LLMs [21.1] 推論によるミスアライメント: 推論が強化されると、LSMは悪意のある要求に対してより応答するようになる。
我々は、内部モデル状態を分析し、注意シフトと専門の専門家の両方が、過度な推論を安全ガードレールにリダイレクトするのに役立ちます。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:04:54 GMT)
Disentangling Slow and Fast Temporal Dynamics in Degradation Inference with Hierarchical Differential Models [21.1] 残差に基づく手法は広く採用されているが、残差は運用履歴と絡み合っている。
本稿では,遅い(劣化)CDEコンポーネントと高速(動作)CDEコンポーネントを統一アーキテクチャに組み込んだ,階層型制御微分方程式(H-CDE)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:58:46 GMT)
Universal Properties of Activation Sparsity in Modern Large Language Models [20.8] 本稿では, 近代LLMのFFN層におけるスポーサリティの堅牢性を評価するための枠組みと, その現象の系統的研究について述べる。
本研究は, LLMにおけるアクティベーション空間の普遍的パターンを明らかにし, この現象の知見を提供し, モデル設計と加速に活用するための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:47:21 GMT)
RAMer: Reconstruction-based Adversarial Model for Multi-party Multi-modal Multi-label Emotion Recognition [20.1] 本稿では,モダリティの共通点と特異点を探索し,マルチモーダル表現を洗練させるRAMer(Reconstruction-based Adversarial Model for Emotion Recognition)を提案する。
RAMer は Dyadic および multi-party MMER シナリオで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:37:45 GMT)
OSMLoc: Single Image-Based Visual Localization in OpenStreetMap with Fused Geometric and Semantic Guidance [20.0] OSMLocは、OpenStreetMapマップに対するファーストパーソナライズされたイメージに基づく、脳にインスパイアされた視覚的ローカライゼーションアプローチである。
意味的および幾何学的ガイダンスを統合し、精度、堅牢性、一般化能力を大幅に改善する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:04:46 GMT)
Tech-ASan: Two-stage check for Address Sanitizer [19.6] アドレスサニタイザー(ASan)は、メモリの安全性違反を検出するための鋭い武器である。
ASanは、大規模なソフトウェアテストの効率を制限した、大幅なランタイムオーバーヘッドを発生させる。
Tech-ASanは、安全保証でASanを加速する2段階のチェックベースの技術である。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:06:05 GMT)
VideoRewardBench: Comprehensive Evaluation of Multimodal Reward Models for Video Understanding [19.5] マルチモーダル報酬モデル(MRM)は、LVLM(Large Vision Language Models)の訓練、推論、評価において重要な役割を果たしている。
ビデオ領域でMRMを評価するための既存のベンチマークは、限られた数と多様な質問に悩まされている。
ビデオ理解の4つの中核的な側面をカバーする最初の総合的なベンチマークであるVideoRewardBenchを紹介する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:50:55 GMT)
Toward Real-World Cooperative and Competitive Soccer with Quadrupedal Robot Teams [18.2] 完全自律型・分散型四足ロボットサッカーを可能にする階層型マルチエージェント強化学習(MARL)フレームワークを提案する。
第一に、歩行、ドリブル、蹴りなどの足の動きやボール操作のために、非常にダイナミックな低レベルスキルのセットを訓練する。
これらに加えて、高レベルの戦略計画方針は、Fictitious Self-Playを介してマルチエージェント・プロキシ・ポリシー最適化(MAPPO)を用いて訓練される。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:08:59 GMT)
SemaMIL: Semantic Reordering with Retrieval-Guided State Space Modeling for Whole Slide Image Classification [17.7] SemaMILは,スライド画像全体から識別特徴を抽出する適応的手法である。
セマンティックに類似したパッチを、可逆的な置換によってシーケンスでクラスタ化する。
FLOPやパラメータを少なくして最先端のサブタイプ精度を実現する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:13:18 GMT)
Flow-Modulated Scoring for Semantic-Aware Knowledge Graph Completion [17.6] Flow-Modulated Scoring frameworkは、静的なセマンティック環境によって制御される動的進化過程として関係を概念化する。
実験により、FMSは両方の標準知識グラフ補完タスクにまたがって、新しい最先端技術を確立することが示されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 20:56:07 GMT)
How Important is `Perfect' English for Machine Translation Prompts? [17.2] 大規模言語モデル (LLM) は最近の機械翻訳評価において最上位の成果を上げている。
ユーザプロンプトにおける人為的および合成的エラーがLLMの性能に与える影響を系統的に評価した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 19:34:43 GMT)
Open Data Synthesis For Deep Research [17.2] 我々は、階層的制約満足度問題として検証可能な回答でDeep Researchタスクを定式化する。
既存のベンチマーク(Natural Questions、HotpotQAなど)は、この複雑さを捉えていない。
スケーラブルでスケーラブルな複雑なDeep ResearchタスクであるInfoSeekを紹介します。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:02:56 GMT)
GenTorrent: Scaling Large Language Model Serving with An Overlay Network [17.2] 本稿では,分散化コントリビュータの計算資源を活用するLLMサービスオーバーレイであるGenTorrentを提案する。
このような分散インフラストラクチャの実現に固有の4つの重要な研究課題を特定します。
この作業は、将来のAIサービス機能の民主化とスケーリングのための、新たな方向性の先駆者だと思います。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:07:39 GMT)
Conan: A Chunkwise Online Network for Zero-Shot Adaptive Voice Conversion [16.8] Conanは、オンラインのゼロショット音声変換モデルだ。
音声の音色と参照音声のスタイルを一致させながら、ソースの内容を保存する。
コナンは主観的および客観的な指標でベースラインモデルより優れている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:35:05 GMT)
ManipBench: Benchmarking Vision-Language Models for Low-Level Robot Manipulation [16.7] VLM(Vision-Language Models)は、人工知能とロボティクスに革命をもたらした。
ロボット操作では、VLMは主に高レベルプランナーとして使用されるが、最近の研究は、その低レベル推論能力についても研究している。
VLMの低レベルロボット操作推論能力を評価するために,新しいベンチマークManipBenchを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:59:30 GMT)
PersonaVlog: Personalized Multimodal Vlog Generation with Multi-Agent Collaboration and Iterative Self-Correction [16.1] PersonaVlogは自動マルチモーダルスタイリングVlog生成フレームワークである。
マルチモーダル大言語モデル(MLLM)に基づくマルチエージェント協調フレームワークを提案する。
また,テーマベースの自動ベンチマークフレームワークであるThemeVlogEvalを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:28:46 GMT)
A Multi-granularity Concept Sparse Activation and Hierarchical Knowledge Graph Fusion Framework for Rare Disease Diagnosis [15.8] 医用概念の多粒度スパース活性化と階層的知識グラフを結合した枠組みを提案する。
BioASQレアディスリーズQAセットの実験では、BLEUゲインは0.09、ROUGEゲインは0.05、精度は0.12、ピーク精度は0.89、臨床閾値は0.90である。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 08:57:36 GMT)
RoFt-Mol: Benchmarking Robust Fine-Tuning with Molecular Graph Foundation Models [15.6] 本研究では,8つのファインチューニング手法を,ウェイトベース,表現ベース,部分的なファインチューニングの3つのメカニズムに分類する。
各種ラベル設定における教師付きおよび自己教師付き事前学習モデルの下流回帰および分類タスクについて,これらの手法をベンチマークした。
この評価は有用な洞察を与え、洗練された頑健な微調整法であるROFT-MOLの設計を通知する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 21:35:57 GMT)
Multi-Focused Video Group Activities Hashing [14.4] グループビデオ検索のための新しいSTVH(stemporal intertemporal hashing)手法を提案する。
そこで我々は,この難易度に対応するため,新しいM-STVH(マルチフォーカス検索グループビデオ)を改良版として提案する。
STVH と M-STVH の双方が利用可能なデータセットについて実験を行い,優れた結果が得られた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 13:22:57 GMT)
FairPO: Robust Preference Optimization for Fair Multi-Label Learning [14.0] マルチラベル分類における公平性の促進を目的とした新しいフレームワークであるFairPOを提案する。
私たちのフレームワークでは、ラベルのセットは特権グループと非特権グループに分割されています。
学習問題をグループに対するロバストな最適化とすることで、より低いパフォーマンスを持つグループに対するトレーニングの重点を調整できる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:21:54 GMT)
Deep Binding of Language Model Virtual Personas: a Study on Approximating Political Partisan Misperceptions [13.9] 本稿では,マルチターンインタビュー文として生成した合成ユーザ"バックストリー"を用いた仮想ペルソナ構築手法を提案する。
本研究の背景には,ヒトの反応分布を忠実に再現した仮想的ペルソナと,グループ内・グループ外バイアスのオリジナルの研究で観察されたものと密に一致した効果の大きさが示されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:36:38 GMT)
FLUID: A Fine-Grained Lightweight Urban Signalized-Intersection Dataset of Dense Conflict Trajectories [13.8] 本研究は,典型的な都市信号化交差点における高密度コンフリクトを捕捉する微粒な軌跡データセットを含むFLUIDを紹介する。
FLUIDは3つの異なる交差点をカバーしており、録音時間はおよそ5時間で、8つのカテゴリに2万以上のTPがある。
データセットは毎分平均で2台の車両が衝突し、全自動車の約25%が関与している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 13:38:42 GMT)
SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction [13.8] In-context Learning と chain-of- Thought は、テキスト・トゥ・コンテクスト・システムのための堅牢なソリューションを開発するために利用することができる。
本稿では,Text2タスクをスキーマリンク,サブプロブレム識別,クエリプラン生成,ガイド付き修正ループに分解するマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:27:12 GMT)
FLAIR: Frequency- and Locality-Aware Implicit Neural Representations [13.6] Implicit Representations (INR) はニューラルネットワークを利用して、座標を対応する信号にマッピングし、連続的かつコンパクトな表現を可能にする。
既存のINRは周波数選択性、空間的局所化、スパース表現に欠けており、冗長な信号成分への過度な依存につながっている。
本稿では2つの重要なイノベーションを取り入れたFLAIR(Frequency- and Locality-Aware Implicit Representations)を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:14:26 GMT)
HERO-VQL: Hierarchical, Egocentric and Robust Visual Query Localization [13.6] 本稿では,物体認識における人間の認知プロセスに触発された新しい手法であるHERO-VQLを紹介する。
トップダウン 注意誘導は、高レベルのコンテキストにクラストークンを活用することで、注意機構を洗練します。
EgoAugは、クエリを基底アノテーションからランダムに選択された対応するオブジェクトに置き換えることで、クエリの多様性を向上させる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:50:49 GMT)
MCA-Bench: A Multimodal Benchmark for Evaluating CAPTCHA Robustness Against VLM-based Attacks [13.5] MCA-Benchは包括的な再現可能なベンチマークスイートである。
不均一なCAPTCHA型を単一の評価プロトコルに統合する。
大規模な実験により、MCA-Benchは現在のCAPTCHA設計の脆弱性スペクトルを効果的にマッピングしていることが明らかになった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:53:38 GMT)
LOD-GS: Level-of-Detail-Sensitive 3D Gaussian Splatting for Detail Conserved Anti-Aliasing [12.9] LOD-GSは、ガウススティングのためのレベル・オブ・ディテール・センシティブなフィルタリングフレームワークである。
各ガウス関数に基底関数の集合を導入し、モデル外見の変動に対する入力としてサンプリング率をとる。
本手法は,エイリアスを効果的に除去しつつ,SOTAレンダリングの品質を実現する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:50:21 GMT)
A Modality-agnostic Multi-task Foundation Model for Human Brain Imaging [12.7] 我々は、人間の脳イメージングのための、モダリティに依存しないマルチタスク視覚基盤モデルBrainFMを紹介する。
BrainFMは取得した画像の外観に耐性がある。
5つの基本的な脳イメージングタスクに直接適用することができる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:15:32 GMT)
ObjexMT: Objective Extraction and Metacognitive Calibration for LLM-as-a-Judge under Multi-Turn Jailbreaks [12.4] クロードソネット4は、最高の客観的抽出精度(0.515)とキャリブレーション(ECE 0.296; Brier 0.324)を得る
実行可能であれば目標を公開し、それ以外は信頼による決定を下すことを推奨します。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:34:07 GMT)
An Efficient GNNs-to-KANs Distillation via Self-Attention Dynamic Sampling with Potential for Consumer Electronics Edge Deployment [12.4] 本稿では,グラフネットワークからコルモゴロフ・アルノルドネットワーク(KAN)への知識蒸留のための革新的な枠組みを紹介する。
学習可能な周波数ベースと位相シフト機構を組み込むことにより、FR-KANは計算複雑性を効果的に低減しつつ、その非線形適合性を著しく改善する。
6つの実世界のデータセットで実施された実験では、SA-DSDは3つのGNN教師モデルより3.05%-3.62%、FR-KAN+モデルより15.61%の性能向上を達成した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:53:42 GMT)
OpinioRAG: Towards Generating User-Centric Opinion Highlights from Large-scale Online Reviews [12.3] 本稿では,大量のユーザレビューから得られた意見ハイライトの問題点について考察する。
既存のメソッドはスケールアップに失敗するか、パーソナライズされたニーズを見落としている汎用的で一大の要約を生成するかのいずれかです。
本稿では,RAGに基づくエビデンス検索とLCMを組み合わせた拡張性のあるトレーニングフリーフレームワークであるOpinioRAGを紹介する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 00:00:34 GMT)
Text-to-Layout: A Generative Workflow for Drafting Architectural Floor Plans Using LLMs [12.1] 本稿では,Large Language Models (LLMs) を用いたAIを活用したワークフローを提案する。
提案システムはテキスト入力を解釈し,壁,ドア,窓,家具などのレイアウトを自動生成する。
プロンプトエンジニアリング、家具配置改善アルゴリズム、Pythonスクリプティングを組み合わせて、Autodesk Revitのようなデザインツールと互換性のある空間的に一貫性のあるドラフトプランを生成する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:04:15 GMT)
Perception Graph for Cognitive Attack Reasoning in Augmented Reality [12.0] 本稿では,拡張現実システム内での人間の知覚を推論する新しいモデルを提案する。
本モデルは,まずMR環境から重要な情報を解釈する人間の過程を模倣して動作する。
モデルが知覚歪みのレベルを反映した定量的スコアを計算する方法を示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 20:48:32 GMT)
A Causal Lens for Evaluating Faithfulness Metrics [11.8] 因果診断(Causal Diagnosticity)は、自然言語の説明のための忠実度指標を評価するための共通のテストベッドとして機能するフレームワークである。
我々のフレームワークは診断の概念を採用し、モデル編集手法を用いて忠実で不誠実な説明ペアを生成する。
我々は,ポストホックな説明やチェーン・オブ・ソート・ベースの手法を含む,顕著な忠実度指標を評価した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:35:38 GMT)
MobiAgent: A Systematic Framework for Customizable Mobile Agents [11.7] 本稿では,モバイルエージェントシステムMobiAgentを提案する。
MobiMindシリーズエージェントモデル、AgentRRアクセラレーションフレームワーク、MobiFlowベンチマークスイートで構成されている。
MobiAgent は汎用 LLM と特殊な GUI エージェントモデルの両方と比較して,実世界のモバイルシナリオにおける最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:24:47 GMT)
Theory Foundation of Physics-Enhanced Residual Learning [11.6] 物理強化残留学習(PERL)と呼ばれる新しいアプローチは、学習を用いて物理モデル予測と基底真理の間の残差を推定することである。
PERLには、(1)必要なニューラルネットワークパラメータの数を減らすこと、(2)より高速な収束率、(3)同じ計算精度に必要なトレーニングサンプルを減らすこと、の3つの利点がある。
本稿では,PERLのこれらの利点を理論的に説明することを目的とする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:08:19 GMT)
Enabling Trustworthy Federated Learning via Remote Attestation for Mitigating Byzantine Threats [11.6] フェデレートラーニング(FL)はプライバシ保護機能に大きな注目を集めており、分散デバイスは生データを共有せずにグローバルモデルを協調的にトレーニングすることができる。
しかし、その分散した性質は、中央サーバーを盲目的に地元の訓練プロセスを信頼させ、不確実なモデル更新を集約させ、特にミッションクリティカルなシナリオにおいて、悪意のある参加者からのビザンツ攻撃の影響を受けやすいようにしている。
既存のデータ駆動防御は、悪意のある更新と自然の変化を区別するのに苦労し、偽陽性率が高く、フィルタリング性能が劣る。
本研究では,クライアント側の透明性を回復し,ビザンチン攻撃を緩和する遠隔検定(RA)ベースのFLシステムであるSentinelを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:36:22 GMT)
Solving Optimal Power Flow using a Variational Quantum Approach [11.5] 最適電力フロー (OPF) は、電力系統の運転の中心となる大規模最適化問題である。
OPFを解くための変分量子パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:47:52 GMT)
Integrated Multivariate Segmentation Tree for the Analysis of Heterogeneous Credit Data in Small and Medium-Sized Enterprises [11.5] 本研究では、財務データをテキストソースと統合し、中小企業の信用評価を強化するための総合的な枠組みを提案する。
中国の中小企業のデータセットから得られた実験結果によると、IMSTの精度は88.9%である。
提案モデルでは,より合理化されたアーキテクチャとリスク検出能力の強化を特徴とする,優れた解釈性と計算効率を示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:16:45 GMT)
An Integrated Framework of Prompt Engineering and Multidimensional Knowledge Graphs for Legal Dispute Analysis [11.3] 本研究は,多次元知識グラフと即時エンジニアリングを組み合わせることで,法的な紛争分析を改善する枠組みを提案する。
その結果,感度,特異度,引用精度が大きく改善した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:00:26 GMT)
Jacobian Exploratory Dual-Phase Reinforcement Learning for Dynamic Endoluminal Navigation of Deformable Continuum Robots [11.2] 変形可能な連続ロボット(DCR)は、非線形変形力学と部分状態観測性により、ユニークな計画課題を提示する。
本稿では,計画を段階的ジャコビアン推定と政策実行に分解するフレームワークであるJacobian Exploratory Dual-Phase RL(JEDP-RL)を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:04:35 GMT)
A Survey of AI Reliance [10.9] この調査は、AI依存に関する新しい包括的な社会技術的視点を提示する。
この調査は、厳格なAI依存の研究をガイドする形態的ボックスをもたらす分類フレームワークを紹介している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:03:45 GMT)
NetGent: Agent-Based Automation of Network Application Workflows [10.8] 我々は、複雑なアプリケーションを自動化し、リアルなネットワークトラフィックデータセットを生成するためのAIエージェントフレームワークであるNetGentを紹介する。
実験では、NetGentはビデオオンデマンドストリーミング、ライブビデオストリーミング、ビデオ会議、ソーシャルメディア、ウェブスクレイピングにまたがる50以上のインターフェースを自動化した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:47:15 GMT)
Contrastive clustering based on regular equivalence for influential node identification in complex networks [10.5] ReCCは、影響のあるノード識別のための新しい非教師なしフレームワークである。
ネットワーク再構成損失を使用して事前トレーニングを行い、コントラストとクラスタリングの損失を組み合わせた微調整を行う。
大規模な実験により、ReCCはいくつかのベンチマークで最先端のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:34:39 GMT)
Double-Constraint Diffusion Model with Nuclear Regularization for Ultra-low-dose PET Reconstruction [10.5] 超低用量ポジトロン線トモグラフィ(PET)の再建は、患者の放射線被曝を減少させ、検査時間を短縮する重要な可能性を秘めている。
しかし、ノイズが増加し、画像のディテールが低下し、画質が低下する可能性がある。
本稿では、事前学習した拡散モデルの重みを凍結し、訓練可能な二重制約制御器を符号化アーキテクチャに注入する、二重制約拡散モデル(DCDM)を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:22:26 GMT)
Agentic AI for Software: thoughts from Software Engineering community [10.0] コードレベルでの一般的なソフトウェアタスクには、コード生成、テスト、プログラムの修復が含まれる。
エージェントAIベースのソフトウェアを成功させる鍵は、ソフトウェアエンジニアリングにおける中核的な難しさ、すなわち開発者の意図の解読と明確化を解決することである。
エージェント技術のソフトウェア工学への展開が成功すれば、エージェントを通じてそのような意図推論において概念的な進歩がもたらされる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:22:00 GMT)
GraphKV: Breaking the Static Selection Paradigm with Graph-Based KV Cache Eviction [9.3] GraphKVは、KVキャッシュ圧縮のためのトークン選択を再定義するグラフベースのフレームワークである。
SnapKV や PyramidKV といった既存の KV キャッシュ消去手法をプラグイン・アンド・プレイ方式でシームレスに利用することができる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:56:28 GMT)
GOSU: Retrieval-Augmented Generation with Global-Level Optimized Semantic Unit-Centric Framework [9.3] 我々は,グローバルな曖昧さを効率的に行う意味単位中心のRAGフレームワークGOSUを提案する。
グラフ構築フェーズでは、GOSUは、ローカルテキストチャンクから抽出したSUをグローバルにマージする。
検索・生成フェーズでは,階層的なキーワード抽出と意味単位の補完を導入する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:44:06 GMT)
Promptable Longitudinal Lesion Segmentation in Whole-Body CT [9.3] 我々は最近提案されたLongiSegフレームワークを拡張し、ポイントとマスクの相互作用による病変特異的な追跡を可能にする。
実験の結果,プレトレーニングにより,時間的文脈を活用できる能力が大幅に向上し,最大6Diceポイントの改善が得られた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 21:35:35 GMT)
RUSplatting: Robust 3D Gaussian Splatting for Sparse-View Underwater Scene Reconstruction [9.1] 本稿では,水中深部レンダリングの視覚的品質と精度を両立させる,ガウススプラッティングに基づくフレームワークを提案する。
水中減衰の物理によって導かれるRGBチャネルの分離学習を提案し,より正確な色復元を実現する。
新たに収集されたデータセットであるSubmerged3Dは、特に深海環境においてキャプチャされる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 19:24:08 GMT)
Advanced spectral clustering for heterogeneous data in credit risk monitoring systems [8.9] 異種データ中の有意なクラスタを特定するために,Advanced Spectral Clustering (ASC)を提案する。
スペクトルクラスタリング理論を異種データアプリケーションでブリッジすることにより、ASCは、30%低いデフォルトリスクを示す採用中心の中小企業のような意味のあるクラスタの識別を可能にする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:06:00 GMT)
Visually Grounded Narratives: Reducing Cognitive Burden in Researcher-Participant Interaction [8.5] 名前は研究資料をコヒーレントなストーリーイメージに転送することができる。
我々は,可視画像生成を容易にするアクタ位置と形状モジュールを開発した。
我々のアプローチは、異なるデータパーティショニングスキームにおける最先端のパフォーマンスを一貫して示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:38:13 GMT)
The Gold Medals in an Empty Room: Diagnosing Metalinguistic Reasoning in LLMs with Camlang [8.4] 大規模言語モデル (LLM) は多くのベンチマークでゴールド・メディカルのパフォーマンスを達成しているが、そのような成功が真の推論やパターンマッチングを反映しているかどうかは不明だ。
認知科学の観点からは、モデルが明示的なメタリング主義的推論学習を通じて、馴染みの無い言語をマスターできるかどうかが有益なテストである。
私たちは、自然主義的だが証明されていない特徴の組み合わせを示す、新しく構築された言語Camlangでこの問題に対処する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:13:10 GMT)
NoiseCutMix: A Novel Data Augmentation Approach by Mixing Estimated Noise in Diffusion Models [8.2] 拡散モデルの生成過程にCutMixの概念を導入する新しいデータ拡張手法を提案する。
本研究では,二つのクラスの融合特性を特徴とする自然な高解像度画像生成を実現するため,NossCutMixという手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:14:22 GMT)
TRUST: Token-dRiven Ultrasound Style Transfer for Cross-Device Adaptation [8.1] UI2I(Unpaired Image-to-image)翻訳手法は、ソースドメインから新たなデバイス取得に対応するターゲットドメインに画像を転送することを目的としている。
既存のUI2Iメソッドは、最も関連性の高いスタイルの特徴をフィルタリングすることを明示的に考慮していない。
我々は、ターゲットドメインの共通スタイルを転送しながら、ソースコンテンツを保存するトークン駆動のデュアルストリームフレームワークであるTRUSTを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:00:50 GMT)
Access Paths for Efficient Ordering with Large Language Models [7.8] 本稿では,LLM ORDER BY演算子を論理抽象として提示し,その物理実装を統一評価フレームワーク内で検討する。
合意に基づくバッチサイズポリシー,ペアソートのための多数投票機構,LLMに適合した双方向の外部マージソートという3つの新しい設計を導入する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:44:36 GMT)
An exploration of the noise sensitivity of the Shor's algorithm [7.7] 本稿では,量子アルゴリズムが固有の雑音耐性特性を持ち,実装障壁を低減することを提案する。
回路レベルのノイズモデルを元の回路に直接適用することにより、ショアのアルゴリズムについて検討する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 08:54:35 GMT)
Knowledge-integrated AutoEncoder Model [7.3] データをエンコードする最も強力な方法のひとつは、ニューラルネットワークのAutoEncoder(AE)アーキテクチャを使用することだ。
本稿では、外部知識源を学習プロセスに統合できるAEモデルを開発するための新しいアプローチを提案する。
提案モデルは3つの科学分野から得られた3つの大規模データセットを用いて評価する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:16:50 GMT)
Contact-Aided Navigation of Flexible Robotic Endoscope Using Deep Reinforcement Learning in Dynamic Stomach [7.3] 消化器外科的診断と治療には, フレキシブル・ロボティクス・内視鏡(FRE)を経る必要がある。
我々は,FREに対する深部強化学習(DRL)に基づく接触支援ナビゲーション(CAN)戦略を導入し,接触力フィードバックを活用して動作安定性とナビゲーション精度を向上させる。
静的および動的胃環境では,CANは平均1.6mmの誤差で100%成功率を達成し,外乱が強い未確認シナリオに対して85%の成功率を維持した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:42:06 GMT)
MorphGen: Morphology-Guided Representation Learning for Robust Single-Domain Generalization in Histopathological Cancer Classification [7.2] 計算病理学における領域一般化は、スライド画像全体の不均一性によって妨げられる。
組織像,拡張,核分割マスクを統合したMorphGenを提案する。
画像の汚損(染色品など)や敵攻撃に対する学習表現のレジリエンスを実証する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:59:19 GMT)
A Dataset Generation Scheme Based on Video2EEG-SPGN-Diffusion for SEED-VD [7.1] Video2EEG-SPGN-Diffusionは、ビデオ刺激で条件付けられた脳波信号のマルチモーダルデータセットを生成するためのフレームワークである。
62チャネルの脳波信号を200Hzで生成したSEED-VDビデオ刺激の1000以上のサンプルからなる新しいデータセットをリリースする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:52:17 GMT)
KVComp: A High-Performance, LLM-Aware, Lossy Compression Framework for KV Cache [7.0] 長文生成に最適化された汎用的で効率的なKVキャッシュ管理フレームワークであるKVCompを提案する。
KVCompは、KVキャッシュデータ特性に特化して設計された新しい損失圧縮技術を採用している。
KVCompは,従来の手法に比べて最大83%のメモリ削減率で,平均47%,最大83%の高速化を実現している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:25:19 GMT)
FlexLink: Boosting your NVLink Bandwidth by 27% without accuracy concern [6.9] 現在のNCCLのようなノード間通信ライブラリは、典型的にはNVLinkのような単一の相互接続を使用する。
このアプローチは、特に主要な相互接続の帯域幅がボトルネックとなるH800 GPUのようなハードウェア上で、パフォーマンスシーリングを生成する。
我々は,これらの異種リンク(NVLink, PCIe, RDMA NICs)を単一高性能通信ファブリックに集約することにより,これを体系的に処理する最初の集合通信フレームワークであるFlexLinkを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:28:47 GMT)
Are We Really Learning the Score Function? Reinterpreting Diffusion Models Through Wasserstein Gradient Flow Matching [6.8] トレーニングされた拡散ネットワークが真のスコア関数に必要な積分的制約と微分的制約の両方に反することを示す。
拡散学習は、WGF(Wasserstein Gradient Flow)の流速場に適合する流れとして理解されている。
本研究は, 拡散生成モデルを理解するための原理的, エレガント, 理論的基礎的な枠組みとしてWGFの観点を採用することを提唱する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:30:22 GMT)
A Study on the Framework for Evaluating the Ethics and Trustworthiness of Generative AI [6.7] ChatGPTのような生成AIは、驚くべき革新的な可能性を示している。
これは同時に、偏見、有害性、著作権侵害、プライバシー侵害、幻覚などの倫理的・社会的懸念を提起する。
本研究は,社会的影響を反映した新たな人間中心基準の必要性を強調した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:38:07 GMT)
Into the crossfire: evaluating the use of a language model to crowdsource gun violence reports [6.7] 我々は、通常のポルトガル語のテキストと銃暴力の報告を区別するために、Twitterテキストで訓練された細調整BERTベースのモデルを提案する。
我々は、新たな銃暴力イベントを特定するために、ソーシャルメディアのテキストを継続的にチェックするブラジルのアナリストを調査、インタビューする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:01:59 GMT)
No Clustering, No Routing: How Transformers Actually Process Rare Tokens [6.6] 大規模言語モデルは希少なトークン予測に苦しむが、それらの特殊化を駆動するメカニズムはいまだ不明である。
我々は、GPT-2 XLおよびPythiaモデルにおいて、ニューロンの影響分析、グラフベースのクラスタリング、およびアテンションヘッドアブレーションを通してこれを検証した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:20:41 GMT)
CVPD at QIAS 2025 Shared Task: An Efficient Encoder-Based Approach for Islamic Inheritance Reasoning [6.5] イスラーム継承法(Ilm al-Mawarith)は、相続人の正確な識別と株式の計算を必要とする。
本稿では,アラビア文字エンコーダとアテンテーティブ・レバレンス・スコーリング(ARS)を用いた継承問題解決フレームワークを提案する。
このシステムは、意味的関連性に応じて回答オプションをランク付けし、生成的推論なしで高速でデバイス上の推論を可能にする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:03:54 GMT)
Semantic Parsing for Question Answering over Knowledge Graphs [6.5] 本稿では,グラフ・ツー・セグメンテーション・マッピングに基づく知識グラフに対する質問応答手法を提案する。
我々のフレームワークはルールベースとニューラルネットワークの両方を統合し、正確なセマンティックセグメントシーケンスを解析・構築する。
本稿では,エンコーダ・デコーダニューラルネットワークを用いて,自然言語質問をセマンティックセグメントにマッピングし,シーケンス生成タスクとして問合せセマンティックパーシングを定式化する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 21:14:31 GMT)
Transforming Norm-based To Graph-based Spatial Representation for Spatio-Temporal Epidemiological Models [6.4] 疫病は世界的な健康、死亡率、経済の安定、政治的景観に重大な脅威をもたらす。
モデルは2つの主要な空間カテゴリに大別できる:ノルムベースのグラフベースモデル。
本研究では,ノルムに基づく空間表現からグラフに基づく空間表現への変換能力について検討する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:34:34 GMT)
Introducing 'Inside' Out of Distribution [6.4] 我々は、OODを内外ケースに分割できることを示唆し、OODに関する新しい視点を紹介した。
分析の結果,内面のOODプロファイルの違いがMLモデルの性能にユニークな影響を及ぼすことが示された。
以上の結果から,OODの内外区別の重要性が示唆された。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:38:46 GMT)
SALT: Parameter-Efficient Fine-Tuning via Singular Value Adaptation with Low-Rank Transformation [6.3] 大きな基礎モデルはかなりの柔軟性を提供するが、これらのモデルを微調整するコストは依然として大きな障壁である。
トレーニング可能なスケールとシフトパラメータを用いて,最も影響力のある特異値を選択的に適応するSALTを提案する。
このハイブリッドアプローチはLoRAとSVDの両方の利点を活用し、モデルのサイズや深さを増すことなく効果的な適応を可能にする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:23:32 GMT)
Benchmarking LLMs for Mimicking Child-Caregiver Language in Interaction [6.2] LLMは人間のような対話を生成できるが、初期の子どもと大人の交流をシミュレートする能力はほとんど解明されていない。
現状のLSMは、単語と発話レベルにおいて、子どもと介護者の対話を近似することができるが、子どもと介護者の分散パターンの再現に苦慮し、アライメントを誇張し、人間によって示される多様性のレベルに到達できなかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:06:43 GMT)
Multilingual != Multicultural: Evaluating Gaps Between Multilingual Capabilities and Cultural Alignment in LLMs [5.8] 大規模言語モデル(LLM)は、グローバル言語全体でますます能力を高めつつある。
しかし、言語間のコミュニケーション能力が必ずしも適切な文化的表現に変換されるとは限らない。
GoogleのGemmaモデルとOpenAIのターボシリーズの2つのモデルを比較します。
言語能力と文化的アライメントの間には、一貫した関係は見つからない。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:48:20 GMT)
ShadowScope: GPU Monitoring and Validation via Composable Side Channel Signals [5.8] GPUカーネルは、従来のメモリ安全性問題と新たなマイクロアーキテクチャ脅威の両方に対して脆弱である。
構成可能なゴールデンモデルを活用した監視・検証フレームワークであるShadowScopeを提案する。
また、GPUパイプラインに軽量のオンチップチェックを統合するハードウェア支援のバリデーションメカニズムであるShadowScope+も導入しています。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:38:05 GMT)
Whose LLM is it Anyway? Linguistic Comparison and LLM Attribution for GPT-3.5, GPT-4 and Bard [5.5] LLM(Large Language Model)は、人間の品質に類似したテキストを生成する能力を持つ。
我々は,最もポピュラーな3つのLLMから生成されるテキストの語彙,部分音声(POS)分布,依存性分布,感情を多様な入力と比較した。
その結果、言語学的に有意な変化を示し、88%の精度で所与のテキストをLLM起源とみなすことができた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:32:11 GMT)
Detecting LLM-assisted writing in scientific communication: Are we there yet? [5.5] 大規模言語モデル(LLM)は、特に筆記支援の領域において、テキスト生成を著しく変えた。
LLM支援文字の正確な認識を促進するための潜在的な手段は、自動検出器の使用である。
近縁なLCM生成テキスト検出器を4つ評価した結果, 簡易なアドホック検出器と比較して, その最適性能が示された。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:35:54 GMT)
WHAR Datasets: An Open Source Library for Wearable Human Activity Recognition [5.5] 我々はWHARデータ処理を簡単にするためのオープンソースライブラリであるWHARデータセットを紹介する。
現在、ライブラリは9つの広く使用されているデータセットをサポートし、PyTorchと統合され、新しいデータセットに簡単にアクセスできる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:00:50 GMT)
FinFlowRL: An Imitation-Reinforcement Learning Framework for Adaptive Stochastic Control in Finance [5.4] FinFlowRLは、金融最適制御のための新しいフレームワークである。
複数の専門家戦略からアダプティブなメタポリシーを事前学習する。
ノイズ空間における強化学習を微調整し、生成過程を最適化する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:08:19 GMT)
Investigating Tax Evasion Emergence Using Dual Large Language Model and Deep Reinforcement Learning Powered Agent-based Simulation [5.4] 本研究では,脱税のダイナミクスと非公式経済活動の出現を明らかにするための新しい計算枠組みを提案する。
このフレームワークには,大規模言語モデルと深層強化学習が使用されている。
調査の結果,個人の性格特性,外的物語,施行可能性,公共財提供の効率性は,非公式な経済活動のタイミングと範囲に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:48:25 GMT)
Optimized Weight Initialization on the Stiefel Manifold for Deep ReLU Neural Networks [5.4] ReLUネットワークの不適切な重量トレーニングは、ネットワーク深さが増加するにつれて不活性化死ReLUを悪化させ、不安定を悪化させる可能性がある。
我々は、スティーフェル多様体上の最適化問題を導入し、これによりスケールを保ち、プレアクティベーション統計を校正する。
本研究では, 死滅するReLU問題の防止, アクティベーション分散の緩やかな減衰, 勾配消滅の緩和について述べる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:17:31 GMT)
BALM-TSF: Balanced Multimodal Alignment for LLM-Based Time Series Forecasting [5.4] BALM-TSFは時系列予測のための軽量フレームワークである。
時系列とテキスト埋め込みのバランスを維持する。
長期および少数ショットの予測において、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:31:55 GMT)
Talk Less, Call Right: Enhancing Role-Play LLM Agents with Automatic Prompt Optimization and Role Prompting [5.3] 本稿では,コモンセンス・ペルソナ・グラウンドド・ダイアログ・チャレンジ(CPDC)2025のAPIトラックにおけるロールプレイング・ダイアログ・エージェントとして機能するツール強化された大規模言語モデルを提案する。
この設定では、対話エージェントは、ペルソナに従って効果的にツールを使用するのに失敗しながら、非常に長い文字内応答(過剰に話す)を生成することが多い。
1)基本的な役割プロンプト、2)人為的な役割プロンプト、3)自動プロンプト最適化(APO)、4)ルールベースの役割プロンプトである。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:45:36 GMT)
Generation of Four-Component Schrödinger Cat States via Floquet Engineering in a Hybrid Ferromagnet-Superconductor System [5.3] 強磁性体-超伝導ハイブリッド系で4C状態を生成するためのフロケットエンジニアリング手法を提案する。
その結果、固体プラットフォームにおける多成分キャットステートエンジニアリングへのスケーラブルなルートを提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:41:26 GMT)
Extending Model-x Framework to Missing Data [5.3] 最近導入された model-x knockoffs というフレームワークは、幅広いモデルに対してそれを提供するが、値の欠如のあるデータセットはサポートされていない。
提案手法では, 既存のノックオフサンプリングを, 欠落した値の存在下で再利用できることを示す。
また、ノックオフを共同で計算し、サンプリングすることで、計算の複雑さを軽減できることを示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:06:05 GMT)
JS-TOD: Detecting Order-Dependent Flaky Tests in Jest [5.2] JS-TODは、Jestテストを抽出、再注文、再実行して、順序に依存したテストのフレキネスを明らかにするツールである。
テストの順序依存性は、テストのフレキネスの主要な原因の1つです。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:44:14 GMT)
TReF-6: Inferring Task-Relevant Frames from a Single Demonstration for One-Shot Skill Generalization [5.1] 本稿では,単純化された6DoFタスク関連フレームを単一軌道から推定するTReF-6を提案する。
提案手法は,DMP(Dynamic Movement Primitive)のパラメータ化の基準となる局所フレームの原点を定義するために,軌道形状から純粋に影響点を同定する。
推定フレームは視覚言語モデルを介して意味的に接地され、グラウンドド・SAMによって新しいシーンにローカライズされる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:54:28 GMT)
Intelligent Spectrum Management in Satellite Communications [5.0] 動的スペクトル管理(DSM)は、無線機器の環境条件への動的適応性を最適性能に実現している。
我々は、SatComにおける知的DSMの実現における貢献とハードルについて論じ、CagSatネットワークを実現するDSM技術を深く掘り下げる。
DSMに活用される最先端人工知能(AI)/機械学習(ML)手法の評価と分類を行った。
この調査はまた、オープンな課題を特定し、規制フレームワーク、ネットワークアーキテクチャ、インテリジェントなスペクトル管理における今後の研究方向性を概説する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 00:34:36 GMT)
Tighten The Lasso: A Convex Hull Volume-based Anomaly Detection Method [4.8] 本稿では,データセットの凸殻(CH)特性を利用した新しい異常検出アルゴリズムを提案する。
我々は,サンプルの除去に伴ってCHの体積を反復的に計算することで,OODと分布内データ間の決定境界を確立する。
提案アルゴリズムは10個のデータセットにまたがって広く用いられている7つの異常検出手法に対して評価される。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:50:29 GMT)
Towards Adaptive Visual Token Pruning for Large Multimodal Models [4.8] テキストトークンと意味的に視覚トークンを除去する相互情報に基づくトークンプルーニング戦略を導入する。
LLaVA-15-7BやLLaVA-7Bといったモデルでは,テキストトークンを88.9%削減しながら高い性能を維持している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:43:50 GMT)
Reinforcement Learning of Dolly-In Filming Using a Ground-Based Robot [4.6] 強化学習(Reinforcement Learning)は、フリーロームグラウンドベースの撮影ロボットを用いたドライインショットの自動化に応用される。
独立制御戦略との比較により, 精密フィルムタスクに対する複合制御の有効性を実証する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 17:14:11 GMT)
CarboFormer: A Lightweight Semantic Segmentation Architecture for Efficient Carbon Dioxide Detection Using Optical Gas Imaging [4.6] 二酸化炭素排出量(CO$$)は、環境影響と産業プロセスの両方の重要な指標である。
光ガスイメージング(OGI)のための軽量セマンティックセグメンテーションフレームワークCarboFormerを紹介する。
提案手法は,最適化エンコーダデコーダアーキテクチャと,特殊なマルチスケール機能融合と補助監視戦略を統合したものである。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:41:52 GMT)
Polynomial complexity of open quantum system problems [4.5] オープン量子系(OQS)は非平衡量子力学においてユビキタスである。
この研究は、OQSのダイナミクスの理解、量子センサによる環境学習、ノイズの多い環境での量子情報処理のアプローチを提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:12:37 GMT)
A Hybrid AI-based and Rule-based Approach to DICOM De-identification: A Solution for the MIDI-B Challenge [4.4] 本稿では,Digital Imaging and Communications in Medicine (DICOM)ファイルを処理するためのハイブリッド・デアイデンティティ・フレームワークを提案する。
われわれのフレームワークは、The Cancer Imaging Archive (TCIA)のベストプラクティスガイドラインで更新された、変更済みのルールベースのコンポーネントを採用している。
画像からテキストを抽出する頑健な光学文字認識(OCR)システムであるPaddleOCRと、個人識別情報(PII)と保護健康情報(PHI)を識別する微調整トランスフォーマーベースモデルであるRoBERTaが組み込まれている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:52:15 GMT)
MCeT: Behavioral Model Correctness Evaluation using Large Language Models [4.3] AIモデリングアシスタントとしてのLarge Language Models(LLM)の利用の増加に伴い、ダイアグラムの生成により多くの自動化が関与するようになる。
本稿では,行動モデル,特にシーケンス図の正しさを,対応する要求テキストに対して評価する最初の完全自動化ツールMCeTを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:04:34 GMT)
Similarity between Units of Natural Language: The Transition from Coarse to Fine Estimation [4.3] 人間の言語ユニット間の類似性を捉えることは、人間がどう異なる物体を関連づけるかを説明するのに不可欠です。
この論文における私の研究目標は、より洗練された方法で言語単位間の類似性を考慮した回帰モデルを開発することです。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:33:37 GMT)
Convergence Analysis of Aggregation-Broadcast in LoRA-enabled Distributed Fine-Tuning [4.3] フェデレートラーニング(FL)は、分散データソース間の協調モデルトレーニングを可能にする。
Low-Rank Adaptation (LoRA) は効率的な微調整法としてFLに導入された。
LoRAに更新されたローカルモデルをサーバに集約する方法は、依然として重要かつ未検討の課題である。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:43:28 GMT)
Cross-Domain Transfer and Few-Shot Learning for Personal Identifiable Information Recognition [4.2] クロスドメインモデル転送,マルチドメインデータ融合,サンプル効率学習について検討した。
以上の結果から, 医療ドメインは送受信に抵抗する一方, 法律ドメインのデータ転送は伝記テキストとよく一致した。
高品質な認識は、低特殊化領域におけるトレーニングデータの10%しか達成できない。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:58:46 GMT)
The Resurgence of GCG Adversarial Attacks on Large Language Models [4.2] 本稿では,GCGとその変種であるTGCGを,オープンソースランドスケープ全体にわたって体系的に評価する。
攻撃の成功率はモデルのサイズによって減少し、複雑さが増すのを反映している。
コーディングプロンプトは 敵の安全プロンプトよりも 脆弱で 推論自体を 攻撃ベクトルとして利用できる
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:04:29 GMT)
Learning Dolly-In Filming From Demonstration Using a Ground-Based Robot [3.9] 本稿では,GAIL (Generative Adversarial Imitation Learning) を用いたLearning from Demonstration (LfD) アプローチを提案する。
私たちのパイプラインは、クリエイティブなプロフェッショナルの範囲内で、直感的でスタイリッシュなカメラコントロールを提供し、芸術的な意図とロボットの自律性の間のギャップを埋めます。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 17:54:48 GMT)
A Cost-Benefit Analysis of On-Premise Large Language Model Deployment: Breaking Even with Commercial LLM Services [3.9] 大規模言語モデル(LLM)はますます普及している。
AIを生産性に使いたい組織は、今、重要な決定に直面している。
商用のLLMサービスに加入したり、独自のインフラストラクチャ上でモデルをデプロイすることも可能だ。
OpenAI、Anthropic、Googleといったプロバイダのクラウドサービスは、最先端のモデルへの容易にアクセスでき、スケールしやすく、魅力的です。
しかし、データプライバシ、サービスプロバイダの切り替えの難しさ、長期運用コストに対する懸念は、オープンソースモデルのローカル展開への関心を惹き付けている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:01:53 GMT)
Domain Adaptation-Based Crossmodal Knowledge Distillation for 3D Semantic Segmentation [3.7] 従来のアプローチは、注釈付きポイントクラウド分析のための広範なデータに依存している。
実世界のイメージデータセットは、十分な可用性と相当なスケールを提供する。
非教師付きドメイン知識蒸留(UDAKD)と特徴と意味に基づく知識蒸留(FSKD)の2つのクロスモーダルな知識蒸留法を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:34:39 GMT)
Counterfactual Risk Minimization with IPS-Weighted BPR and Self-Normalized Evaluation in Recommender Systems [3.6] 逆相対性スコア(IPS)は、このバイアスを補正するが、しばしば高いばらつきと不安定さに悩まされる。
IPS重み付きトレーニングとIPS重み付きベイズパーソナライズされたランク付け目標を統合した,シンプルで効果的なパイプラインを提案する。
合成およびMovieLens 100Kデータによる実験により、我々のアプローチは偏りのない露光下でより一般化されることが示された。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:14:56 GMT)
Re-Representation in Sentential Relation Extraction with Sequence Routing Algorithm [3.5] 提案手法は,Tcred,Tacredrev,Retacred,Conll04といった一般的な意味的関係抽出データセットよりも優れていることを示す。
次に、前述したデータセットでパフォーマンスが良好である可能性について検討するが、他の類似の、より大規模なREデータセットであるWikidataではパフォーマンスが低かった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 08:52:21 GMT)
SIGMUS: Semantic Integration for Knowledge Graphs in Multimodal Urban Spaces [3.5] マルチモーダル都市空間における知識グラフのセマンティック統合システムSIGMUSを開発した。
我々は大言語モデル(LLM)を用いて、都市空間で発生した出来事と異なるモダリティのデータの関係を識別するために必要な世界知識を創出する。
我々は,5つの異なるデータソースと,同時に発生する関連するインシデントとの間に合理的な接続を生成できることを発見した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 00:35:41 GMT)
Quantum States in Twisted Tubes with Linear Cross-Section Variation [3.5] 線形に変化する断面を持つツイスト管に閉じ込められた粒子の量子力学について検討した。
明示的な形式は、回転、スケーリング、せん断という3つの基本的な変換に対して提供される。
この結果は、幾何変換が量子状態を調整し、円導波路がモード混合に対してより堅牢であることを示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:27:46 GMT)
How Can I Publish My LLM Benchmark Without Giving the True Answers Away? [3.4] 大規模言語モデル(LLM)ベンチマークをインターネット上で公開することで、将来のLLMを汚染するリスクがある。
一般的な緩和策は、ベンチマークを非公開にし、参加者がモデルや予測をオーガナイザに提出できるようにすることである。
質問に対する根本的回答を完全に開示することなく,ベンチマークを公開する方法を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:36:43 GMT)
Supporting a Sustainable and Inclusive Urban Agriculture Federation using Dashboarding [3.3] Feed4Foodプロジェクトは、さまざまな国の都市農業のLiving Labsのフェデレーションを、脆弱な人口に対する都市食品の安全性を高めるために利用することを目的としている。
本稿では,地域の認識と意思決定を支援するダッシュボードを構築するための再利用可能なプロセスと,連携学習を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 19:23:13 GMT)
A multi-task neural network for atypical mitosis recognition under domain shift [3.2] この問題に対処するために,マルチタスク学習に基づくアプローチを提案する。
主分類課題と相関する補助的タスクを活用することにより,本提案手法は,対象物のみに焦点を絞って分類を行うことを目的としている。
提案手法は,3つの異なるデータセットを用いた予備評価において有望な性能を示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:09:12 GMT)
QGuard:Question-based Zero-shot Guard for Multi-modal LLM Safety [3.2] 有害なプロンプトをゼロショットでブロックする簡易かつ効果的な安全ガード手法であるQGuardを提案する。
実験の結果,本モデルはテキストのみとマルチモーダル有害データセットの両方で競合的に動作することがわかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:37:09 GMT)
ODTlearn: A Package for Learning Optimal Decision Trees for Prediction and Prescription [3.2] ODTLearnは、最適な決定木を学ぶためのオープンソースのPythonパッケージである。
高精度な予測と規範的なタスクに最適な決定木を学習する方法を提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:47:23 GMT)
A Framework for Task and Motion Planning based on Expanding AND/OR Graphs [3.1] タスク・アンド・モーション・プランニング(TMP)は、自律的なサービス、表面操作、さらには軌道上でのミッションにおいて重要である。
本稿では、TMP-EAOGと呼ばれる拡張AND/ORグラフに基づくTMPフレームワークを導入し、異なるシナリオへの適応性を実証する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:28:25 GMT)
Versatile Control of Nonlinear Topological States in Non-Hermitian Systems [3.1] 非エルミート皮膚効果(NHSE)と非線形性はどちらもトポロジカルモード(TM)を界面から非局在化することができる。
エルミート格子と非エルミート格子とを非相互ホッピングおよび非線形性に統合した非エルミート非線形トポロジカルインタフェースモデルを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 05:33:27 GMT)
Can AI be Auditable? [3.0] オーディタビリティ(Auditability)とは、倫理的、法的、技術的基準に準拠するために独立して評価されるAIシステムの能力である。
この章では、EU AI Actなどの新たな規制フレームワークを通じて、監査容易性がどのように形式化されているかを論じている。
技術的不透明さ、一貫性のないドキュメントプラクティス、標準化された監査ツールとメトリクスの欠如など、AI監査可能性に直面する課題を分析する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:03:20 GMT)
Dual Actor DDPG for Airborne STAR-RIS Assisted Communications [3.0] 本研究では,UAV搭載STAR-RIS(Aerial-STAR)を利用したマルチユーザダウンリンク通信システムについて検討する。
主な貢献は、UAV軌道の合同最適化、基地局でのアクティブビームフォーミングベクトル、通信効率を高めるためのパッシブRIS TRCなどである。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 20:10:15 GMT)
Chunked TabPFN: Exact Training-Free In-Context Learning for Long-Context Tabular Data [2.3] TabPFN v2は、いくつかのベンチマークでツリーベースのモデルよりも優れた結果が得られる。
本稿では,TabPFNフレームワーク内での注目度を計算するために,テキストバッフルブロック方式を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:57:01 GMT)
LLM-Assisted Iterative Evolution with Swarm Intelligence Toward SuperBrain [2.2] 本稿では,大規模言語モデル(LLM)と人間ユーザの共進化を基盤とした,集団知能のための新しい枠組みを提案する。
静的なプロンプトエンジニアリングや分離されたエージェントシミュレーションとは異なり、我々の手法はサブクラス脳からスーパークラス脳への動的経路を強調する。
この作業は、概念的基盤と、スケーラブルで説明可能な、整合した集合AIに向けたアーキテクチャロードマップの両方を提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:12:46 GMT)
DAOVI: Distortion-Aware Omnidirectional Video Inpainting [2.2] 本稿では,DAOVI (Distortion-Aware Omnidirectional Video Inpainting) と呼ばれる一方向ビデオインパインティングのための新しいディープラーニングモデルを提案する。
提案手法は,既存の手法を定量的かつ定性的に上回る。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:27:52 GMT)
A Further Comparison of TD-DMRG and ML-MCTDH for Nonadiabatic Dynamics of Exciton Dissociation [2.0] 最近の研究では、exitonconfigurationの計算で最大60%の相違が報告されている。
ベンチマークP3HT:PCBMヘテロ接合モデルを再検討することにより、観察された相違は主に結合寸法の不足から生じることを示す。
その結果,結合次元が適切にスケールされている場合,両手法が数値的に正確な解に収束することが確認できた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:53:51 GMT)
Embodied Spatial Intelligence: from Implicit Scene Modeling to Spatial Reasoning [2.0] この論文は、自然言語の指示に基づいて現実世界で知覚し行動できるロボットを作るという課題に対処する。
シーン表現と空間推論の2つの側面についてコントリビューションを行う。
この研究は、ロボットが周囲をしっかりと知覚し、複雑な言語ベースのコマンドでインテリジェントに行動できる基盤を築いた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:42:26 GMT)
Multi-Agent Data Visualization and Narrative Generation [1.9] データ分析ワークフローを自動化する軽量なマルチエージェントシステムを提案する。
提案手法は,ハイブリッドマルチエージェントアーキテクチャと決定論的コンポーネントを組み合わせることで,重要な論理を戦略的に外部化する。
このシステムは、完全な再生なしに外科的修正を可能にする、粒度の細かいモジュラー出力を提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:39:55 GMT)
Story Generation from Visual Inputs: Techniques, Related Tasks, and Challenges [1.8] この調査では、画像やビデオのキャプション、視覚的質問応答など、自動ストーリ生成に関わるタスクについても取り上げている。
これらのタスクは、視覚的なストーリー生成と共通の課題を共有し、現場で使用されるテクニックのインスピレーションとなった。
主要なデータセットと評価指標を分析し、それらの制限について重要な視点を提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:58:09 GMT)
A Data-Free Analytical Quantization Scheme for Deep Learning Models [1.8] モデル重みに対する学習後の量子化手法を提案する。
提案手法は,量子化ノイズを最小限に抑える数学的保証とともに,最適クリッピングしきい値とスケーリング係数を求める。
実世界のデータセットにおける実験結果から,我々の量子化方式はモデルの精度を保ちながら,モデルのサイズと計算要求を大幅に削減することを示した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:23:58 GMT)
How to Make Museums More Interactive? Case Study of Artistic Chatbot [1.7] アーティスティック・プロジェクト(Artific Project)は、音声音声によるRAGを利用したチャットシステムで、非公式な学習をサポートし、ライブアート展示中に訪問者のエンゲージメントを高める。
本稿では,システムアーキテクチャとユーザインタラクション設計のキーとなる側面について述べるとともに,公共の文化施設にチャットボットを配置する際の実践的課題について議論する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 17:41:22 GMT)
AlzheimerRAG: Multimodal Retrieval Augmented Generation for Clinical Use Cases using PubMed articles [1.5] AlzheimerRAG は、主に PubMed 論文からの Alzheimer's Disease case study に焦点を当てた、臨床応用のためのクロスモーダルRAG アプリケーションである。
実験の結果,BioASQやPubMedQAなどのベンチマークと比較して,ドメイン固有情報の検索・合成性能が向上した。
我々は、アルツハイマーRAGがヒトに不適切で幻覚率の低い精度で反応を生成できると推測する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:41:13 GMT)
Epsilon-Neighborhood Decision-Boundary Governed Estimation (EDGE) of 2D Black Box Classifier Functions [1.3] ブラックボックスシステムにおける決定境界の正確な推定は、現実世界のアプリケーションにおける安全性、品質、実現可能性を保証する上で重要である。
本稿では,ユーザが指定した$varepsilon$-Neighborhood Decision-Boundary Governed Estimation (EDGE)を提案する。
EDGEアルゴリズムは, 適応サンプリング法やグリッドベース探索よりも, 試料効率と境界近似が優れていることを示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:37:51 GMT)
StoryReasoning Dataset: Using Chain-of-Thought for Scene Understanding and Grounded Story Generation [1.0] ビジュアルストーリーテリングシステムは、フレームをまたいだキャラクターのアイデンティティを維持し、適切な主題にアクションをリンクするのに苦労する。
52,016本の映画画像から得られた4,178個のストーリーを含むデータセットであるStoryReasoningを提案する。
非微調整モデルと比較して,1ストーリー平均で4.06から3.56(-12.3%)の幻覚が減少し,クリエイティビティが2.58から3.38(+31.0%)に改善した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:31:15 GMT)
Excitation Gaps of Ground and Excited State Energy of the Fermi-Hubbard Model Using Variational Quantum Eigensolver [1.0] 新しく設計されたアンザッツ回路を用いて、4$times$1および2$times$2Hubbard格子の基底、第1および第2の励起状態エネルギーを求める。
COBYLAは粗収束に、L-BFGSは微調整に使用される。
系の対応する物理的性質は、電荷とスピンの異なる構成のための励起エネルギーギャップの位相図を通して解析される。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 20:41:12 GMT)
CytoDiff: AI-Driven Cytomorphology Image Synthesis for Medical Diagnostics [0.9] 我々は,LoRA重みを微調整した安定拡散モデルであるCytoDiffを紹介した。
小さな非バランスな実データセットを使用することで、クラス毎に5,000の合成画像が追加され、ResNet分類器の精度は27%から78%(+51%)に向上した。
同様に、CLIPに基づく分類精度は62%から77%(+15%)に向上した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 19:04:24 GMT)
Enhancing Cyber Security Through Predictive Analytics: Real-Time Threat Detection and Response [0.9] 本研究では,リアルタイムサイバー攻撃検出と応答に対する予測分析の適用性を評価する。
我々は,攻撃タイプ,パケット長,異常スコア,プロトコル使用量,位置情報パターンなどの重要な特徴を分析し,それらの予測値を評価した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:24:06 GMT)
Interpretation Gaps in LLM-Assisted Comprehension of Privacy Documents [0.8] 本稿では,大規模言語モデル(LLM)を用いて複雑なプライバシポリシからデータプラクティスの簡易解釈を得る際のギャップについて考察する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 00:59:58 GMT)
GIER: Gap-Driven Self-Refinement for Large Language Models [0.8] GIER(Gap-driven Iterative Enhancement of Responses)は、大規模な言語モデル(LLM)出力を改善するためのフレームワークである。
GIERは、タスクの精度を低下させることなく、合理的な品質、接地、推論アライメントを改善する。
本分析は,抽象的な概念的ギャップを解釈できるだけでなく,具体的な推論改善に変換できることを示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 02:54:08 GMT)
Game Theoretic Resilience Recommendation Framework for CyberPhysical Microgrids Using Hypergraph MetaLearning [0.8] 本稿では, 協調型サイバー攻撃下での放射状マイクログリッドに対する物理対応型サイバー物理レジリエンスフレームワークを提案する。
提案手法は,モデルメタラーニング(MAML)により強化されたハイパーグラフニューラルネットワーク(HGNN)を介して攻撃者をモデル化する。
その結果、提案された防衛戦略は、トップランク攻撃の90%に対して、ほぼ完全なサービス回復を図っている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:20:11 GMT)
Long-range photonic device-independent quantum key distribution using SPDC sources and linear optics [0.7] 長距離デバイス非依存量子鍵分布(DI QKD)
本稿では、QKDのための2つの実験可能なスキームを提案する。
その結果,検出器効率は81%と正の値を示した。
この研究は、量子通信ネットワークにおけるデバイス非依存のセキュリティに向けた重要なマイルストーンである。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:13:24 GMT)
A Novel Deep Hybrid Framework with Ensemble-Based Feature Optimization for Robust Real-Time Human Activity Recognition [0.7] HAR(Human Activity Recognition)は、スマート監視、ヘルスケア、アシスト技術、スポーツ分析など、さまざまなアプリケーションにおいて重要な役割を担っている。
カスタマイズされたInceptionV3、LSTMアーキテクチャ、新しいアンサンブルベースの特徴選択戦略を統合した、最適化されたハイブリッドディープラーニングフレームワークが導入された。
提案手法は、99.65%の認識精度を実現し、特徴を7まで減らし、推論時間を短縮する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:28:11 GMT)
Privacy-Preserving Offloading for Large Language Models in 6G Vehicular Networks [0.7] 本稿では,6G vehicular ネットワークのための新しいプライバシ保護オフロードフレームワークを提案する。
ユーザデータを保護するために,フェデレートラーニング(FL)とディファレンシャルプライバシ(DP)技術を組み合わせたハイブリッドアプローチを導入する。
実験の結果,非プライバシ保存法に比べて75%の精度で2-3%の削減が達成できた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:08:28 GMT)
Tri-Accel: Curvature-Aware Precision-Adaptive and Memory-Elastic Optimization for Efficient GPU Usage [0.7] Tri-Accelは3つのアクセラレーション戦略と、トレーニング中の適応パラメータを併用する統合最適化フレームワークである。
ResNet-18とEfficientNet-B0を搭載したCIFAR-10では、Tri-Accelはトレーニング時間の最大9.9%削減とメモリ使用量の13.3%削減を実現している。
静的混合精度トレーニングと比較して、Tri-Accelは78.1%の精度を維持し、標準ハードウェアのメモリフットプリントを0.35GBから0.31GBに削減している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:28:38 GMT)
AQFusionNet: Multimodal Deep Learning for Air Quality Index Prediction with Imagery and Sensor Data [0.6] この研究は、堅牢なAQI予測のためのマルチモーダルディープラーニングフレームワークであるAQFusionNetを紹介する。
このフレームワークは、軽量CNNバックボーンを用いた地上レベルの大気画像と汚染物質濃度データを統合する。
インドとネパールから8000以上のサンプルを採取した実験では、AQFusionNetが単調なベースラインを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:32:38 GMT)
Towards Methane Detection Onboard Satellites [0.6] メタンは温室効果ガスであり、気候変動の主要な要因である。
衛星に搭載された機械学習(ML)は、ダウンリンクコストを低減しつつ、迅速な検出を可能にする。
テクスチュノルト認証データ(UnorthoDOS)を用いて,これらの前処理ステップをバイパスする新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:54:00 GMT)
A Multi-Strategy Approach for AI-Generated Text Detection [0.6] 本稿では,M-DAIGT共有タスクにおいて,ニュース記事や学術論文中のAI生成コンテンツを検出するために開発された3つの異なるシステムについて述べる。
RoBERTaベースのシステムは最も優れたシステムとして登場し、開発とテストの両方でほぼ完璧な結果を得た。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:37:35 GMT)
Part Segmentation of Human Meshes via Multi-View Human Parsing [0.5] この研究は、大規模なヒューマンメッシュの頂点ごとのセマンティックセマンティックセグメンテーションを可能にすることによって、2つのドメインをブリッジすることを目的としている。
T Human2.1データセットのために、擬似地上真理ラベルパイプラインが開発された。
点雲を効果的にダウンサンプリングするために、空間充填曲線に基づくシリアライゼーションを備えた窓付き反復極端点サンプリング(FPS)という新しいメモリ効率サンプリング戦略を導入する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:49:41 GMT)
Towards Digital Twins for Optimal Radioembolization [0.5] 放射線塞栓 (Radioembolization) は、肝動脈内に挿入されたカテーテルを介して、放射線マイクロスフィアを腫瘍に伝達する、局所的な肝がん治療である。
複雑な肝動脈解剖、血流の変化、微小粒子輸送の不確実性により、最適化は困難である。
本研究は、高忠実度計算流体力学(CFD)および/または最近の物理インフォームド機械学習アプローチを用いた肝放射線塞栓デジタル双生児の枠組みを概説する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 00:30:42 GMT)
SU(2) symmetry of spatiotemporal Gaussian modes propagating in the isotropic dispersive media [0.4] ラゲール・ガウスモード(ST)の強度分布は,エルミート・ガウスモードで観測されるようなマルチペナルパターンを示す。
異常分散状態においては、非単調な挙動は歪みと強度分布の復活を誘導する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:09:59 GMT)
Automated Parsing of Engineering Drawings for Structured Information Extraction Using a Fine-tuned Document Understanding Transformer [0.4] 本稿では,構造化情報抽出のためのハイブリッドディープラーニングフレームワークを提案する。
オブジェクト指向境界ボックス(OBB)モデルと変換器ベースの文書解析モデル(Donut)を統合する。
提案するフレームワークは、精度を改善し、手作業の労力を削減するとともに、精度駆動型産業におけるスケーラブルなデプロイメントをサポートする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:30:08 GMT)
Can Multi-turn Self-refined Single Agent LMs with Retrieval Solve Hard Coding Problems? [0.3] 本研究では,国際協調プログラミングコンテスト(ICPC)254の課題からなるICPCベンチマークを提案する。
我々は、これらのリソースと競合するプログラミングのための様々なLM推論手法を開発し、評価する。
驚くべきことに、o1が18のうち17の問題を解決できることがわかりました。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:02:12 GMT)
Context-Aware Knowledge Distillation with Adaptive Weighting for Image Classification [0.3] アダプティブ・ナレッジ蒸留(Adaptive Knowledge Distillation, AKD)は、大規模教師ネットワークからより小さな学生モデルへ知識を伝達する技術である。
トレーニング中に自動的に学習し、最適化できる、学習可能なパラメータとしてアルファを作成します。
提案手法は, 固定重KDベースラインよりも精度が高く, より安定な収束性が得られる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 09:18:46 GMT)
Forecasting the Ionosphere from Sparse GNSS Data with Temporal-Fusion Transformers [0.3] トータル・エレクトロン・コンテント(TEC)は、鍵となる電離層パラメータである。
TECは観測結果から導かれるが、その信頼性は地球規模測定の希少な性質によって制限される。
本稿では,TFT(Temporal Fusion Transformer)を利用した電離層変動予測のための機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:08:19 GMT)
Probing $CP$ violation and mass ordering in neutrino oscillations in matter through quantum speed limits [0.3] 我々はCP$違反とニュートリノ振動の質量秩序問題について検討する。
ニュートリノ状態の進化と絡み合いに対する量子速度制限(QSL)を計算する。
結果は、現在進行中の長いベースライン加速器ニュートリノ実験の長さスケールとエネルギーを用いて説明される。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 06:14:24 GMT)
Mechanistic interpretability for steering vision-language-action models [0.2] VLA(Vision-Language-Action)モデルは、一般のエンボディエージェントを実現するための有望な道である。
本稿では,VLAを内部表現で解釈し,操作するための最初のフレームワークを紹介する。
我々は、微調整、報酬信号、環境相互作用を伴わずに、リアルタイムに行動を調整する汎用的なアクティベーションステアリング手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 03:01:57 GMT)
Application of discrete Ricci curvature in pruning randomly wired neural networks: A case study with chest x-ray classification of COVID-19 [0.2] Randomly Wired Neural Networks (RWNN) は、ディープラーニングにおけるネットワークトポロジの影響を調査するための貴重なテストベッドとして機能する。
本研究では,Forman-Ricci curvature (FRC), Ollivier-Ricci curvature (ORC), edge betweenness centrality (EBC)の3つのエッジ中心ネットワーク対策について検討した。
FRCベースのプルーニングはRWNNを効果的に単純化し、ORCに匹敵する性能を維持しながら計算上の優位性を提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:50:22 GMT)
A Trust-Centric Approach To Quantifying Maturity and Security in Internet Voting Protocols [0.2] 本稿では,インターネット投票システムのセキュリティと成熟度を定量化する,信頼中心の成熟度スコアリングフレームワークを提案する。
選択されたインターネット投票プロトコルに対する総合的信頼モデル解析を行い、そのセキュリティ特性、信頼前提、技術的複雑さ、実用性について検討する。
このフレームワークは、分散化、信頼、セキュリティの側面が不可欠である他のシステムに適用できるほど一般的です。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:17:23 GMT)
Waterfall Model Simulation: A Systematic Mapping Study [0.2] 本稿では、ウォーターフォールモデルを明確にシミュレートするこれらの論文/論文を体系的にマッピングする。
主要なデータベース(ACM Digital Library、IEEE Xplore、Scopus、Springer、Google Scholar、Web of Science)は2000年から2024年の間に出版された研究のために検索された。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:34:57 GMT)
Privacy vs. Profit: The Impact of Google's Manifest Version 3 (MV3) Update on Ad Blocker Effectiveness [0.1] 広告ブロッカーは、何百万ものユーザーにとって、よりプライベートで広告のないブラウジング体験を求める重要な役割を果たす。
この研究は、MV3アップデートが広告やトラッカーをブロックする能力にどのように影響するかを実証的に調査する。
以上の結果より, MV3アドブロッカーの広告ブロック効果や追跡防止効果は, MV2と比較して統計的に有意な低下は認められなかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:41:20 GMT)
Authorship conflicts in academia: an international cross-discipline survey [0.1] 著者の信用に関する論争は、修士と博士号のレベルでさえ、学術的キャリアにおいて非常に早い段階で発生し、時間が経つにつれてますます一般的になっていく。
我々の発見は、著者の信用をめぐる対立は、修士課程や博士号のレベルにおいても、学術的キャリアにおいて非常に早い段階で発生し、時間が経つにつれてますます一般的になっていくことを示唆している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:19:32 GMT)
AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights [0.1] 大規模言語モデル (LLM) は人書き履歴書よりも, 自己生成したコンテンツを体系的に好んでいることを示す。
このバイアスは、LSMの自己認識能力をターゲットにした単純な介入によって50%以上削減することができる。
これらの調査結果は、AIによる意思決定における、新しくて見過ごされたリスクを浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:40:11 GMT)
Coarse-grained dynamics in quantum many-body systems using the maximum entropy principle [0.0] 我々は、最大エントロピー原理に基づいて、微視的な状態を粗い粒状状態に割り当てる逆写像を構築する。
代入マップを用いた粗粒度システムにおける結果のダイナミクスについて検討する。
これらの力学は非線形性や非マルコビアン性のような非定型的な量子挙動を示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:29:20 GMT)
Attention of a Kiss: Exploring Attention Maps in Video Diffusion for XAIxArts [0.0] 本研究は, 生成ビデオモデルにおいて, クロスアテンションマップを抽出し, 可視化する手法を提案する。
本ツールは,テキスト・ビデオ生成における注意の時間的・空間的挙動を解釈可能なウィンドウとして提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 19:46:18 GMT)
Zero-Knowledge Proofs in Sublinear Space [0.0] 本稿では,最初のサブ線形空間ZKP証明器を構築する。
私たちのコアコントリビューションは、古典的なツリー評価問題の例として、証明生成を再構成する等価性です。
このアプローチは、証明のサイズ、検証時間、基礎システムのトランスクリプト/セキュリティ保証を保ちながら、証明メモリを線形の T から O(sqrt(T)) (O(log T) の下位項まで) に還元する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:22:54 GMT)
WeSpeR: Computing non-linear shrinkage formulas for the weighted sample covariance [0.0] textitWeSpeRアルゴリズムの導出にはサンプルスペクトルの理論的特性を用いる。
私たちは、1000ドル以上の次元で非線形収縮を著しくスピードアップします。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:40:38 GMT)
Wage Sentiment Indices Derived from Survey Comments via Large Language Models [0.0] 本研究では,Large Language Models (LLMs) を用いたWSI(Wage Sentiment Index)を提案し,日本の賃金動態を予測する。
分析は、内閣府の月次調査である経済監視調査(EWS)に基づく。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 00:53:59 GMT)
Universal Representation of Generalized Convex Functions and their Gradients [0.0] 一般化凸関数(GCF)の凸と1対1のパラメータ化について述べる。
また、浅いニューラルネットワークとこのクラスを最適化問題と比較する。
ここで追求されたアイデアはPythonパッケージに実装されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:21:33 GMT)
Turning CVEs into Educational Labs:Insights and Challenges [0.0] この研究は、CVEをサイバーセキュリティトレーニングのための手持ちの教育ラボに転換することに焦点を当てている。
この研究は、コンテナ化されたラボ環境の開発によるCVEの実践的応用 - 現実世界の脆弱性をシミュレートするためのDocker - を示している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:47:54 GMT)
TimeCopilot [0.0] 予測のための初のオープンソースエージェントフレームワークであるTimeCopilotを紹介する。
複数の時系列ファンデーションモデル(TSFM)とLLM(Large Language Model)を単一の統一APIを通じて組み合わせる。
TimeCopilotは、機能分析、モデル選択、クロスバリデーション、予測生成といった予測パイプラインを自動化する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 21:48:51 GMT)
The Group-IV-Vacancy Color Center in Diamond [0.0] グループIV空孔(G4V、XV)色中心はダイヤモンドの新規で有望な欠陥のクラスを構成する。
本稿では,XV制御の基盤を確立し,量子情報処理の道を開いた。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:17:05 GMT)
TECP: Token-Entropy Conformal Prediction for LLMs [0.0] Token-Entropy Conformal Prediction (TECP) は、トークンレベルのエントロピーをロジットフリーで参照不要な不確実性尺度として活用する新しいフレームワークである。
本手法は,ブラックボックスLLM設定における信頼に値する生成のための原理的かつ効率的なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:31:04 GMT)
Spectral analysis of Dirac materials in position-dependent magnetic and electric fields via Heun functions [0.0] この研究は、位置依存磁場と電場に没入したディラック材料のスペクトル問題の研究に焦点をあてる。
これを達成するために、ハミルトニアンの固有関数成分で満たされる微分方程式の系は分離されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 07:56:13 GMT)
Robustness Analysis for Quantum Systems Controlled by Continuous-Time Pulses [0.0] もともとエネルギーランドスケープコントローラの堅牢性を研究するために開発された技術は、クローズド量子システムの重要なケースに一般化されている。
パラメータの変動に対する感度の低下は、時間不変制御の場合と同様に、完全忠実度と一致することが示されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 17:58:17 GMT)
Resilient Biosecurity in the Era of AI-Enabled Bioweapons [0.0] 既存のバイオセーフティ対策は、危険な出力を検出するために配列アライメントとタンパク質とタンパク質の相互作用予測に依存している。
The performance of three leading PPI prediction tools: AlphaFold 3, AF3complex and SpatialPPIv2。
いずれも実験的に検証された4つのSARS-CoV-2変異株の1つを同定できなかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 18:09:04 GMT)
Reduced-Order Modeling of Cyclo-Stationary Time Series Using Score-Based Generative Methods [0.0] 多くの自然システムは、年周期や日周期のような周期的な強制によって特徴づけられるサイクロ定常挙動を示す。
そこで本研究では,このようなサイクロ定常時系列の低次モデルを構築するためのデータ駆動手法を提案する。
PlaSim(Planet Simulator)気候モデルに適用して,本手法の性能を実証する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:45:55 GMT)
Quantum Computing Education in Latin America: Experiences and Strategies [0.0] 量子コンピューティングは、科学、教育、技術開発を促進する可能性を持つ急速に進歩している分野である。
有能な専門家が著しく不足しており、熟練した専門家に対する緊急の需要を生み出している。
ラテンアメリカでは、量子教育が初期段階にあり、限られた教育インフラと財政的な制約のために、地域的才能とアクセスギャップをさらに広げている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:25:15 GMT)
Quantum Circuits for Quantum Convolutions: A Quantum Convolutional Autoencoder [0.0] 量子機械学習は、古典的な機械学習アルゴリズムによる量子理論の活用を扱う。
本稿では、量子畳み込みとして機能するランダム化量子回路を用いて、入力データを処理することに焦点を当てる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 23:48:40 GMT)
Nonstabilizerness in the unitary and monitored quantum dynamics of XXZ-staggered and SYK models [0.0] 我々は XXZ-staggered spin chain の量子状態拡散力学を考察する。
我々は、安定化器R'enyi entropy(SRE)を用いて、軌道に沿った非安定化剤性(マジック'とも呼ばれる)を評価する。
測定がない場合、SYKモデルのみが、時間平均SREがランダムな状態境界を飽和させる唯一のモデルであることが分かる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:45:16 GMT)
Multiscale Feature Learning Using Co-Tuplet Loss for Offline Handwritten Signature Verification [0.0] 我々は,MultiScale Signature Feature Learning Network (MS-SigNet)を紹介した。
MS-SigNetは、複数の空間スケールからグローバルと地域両方の署名機能を学び、特徴の識別を強化する。
また、この言語のための堅牢なシステム開発を支援するため、大規模な中国語署名データセットであるHanSigも提示する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:59:51 GMT)
Illuminating Patterns of Divergence: DataDios SmartDiff for Large-Scale Data Difference Analysis [0.0] SmartDiffはスキーマ対応マッピング、タイプ固有のコンパレータ、並列実行を組み合わせた統合システムである。
数百万行のデータセット上では、SmartDiffは95%以上のリコールを達成し、30~50%高速に動作し、ベースラインよりも30~50%少ないメモリを使用する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 01:03:44 GMT)
Identifying Causal Direction via Dense Functional Classes [0.0] LCUBEは実世界のTuebingen の因果効果ペアデータセット上で AUDRC の精度に優れることを示す。
また、一般的な10のベンチマークデータセットの平均精度も向上し、13のデータセットの平均精度を達成している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 15:42:31 GMT)
Grover's search with an oracle distinguishing between solutions [0.0] 修正は、決定論的グロバーのアルゴリズムが必要とするものよりも多くの反復に対する解を求める高い確率を維持するために用いられる。
我々は,アルゴリズムが解を見つける確率を高く維持する反復回数の間隔が,レジスタサイズとオラクル位相に依存することを示すために,様々な半経験的手法を用いている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:16:31 GMT)
Graph Convolutional Network With Pattern-Spatial Interactive and Regional Awareness for Traffic Forecasting [0.0] パターンと空間モジュールからなるパターン空間の対話型融合フレームワークを提案する。
空間モジュールでは,メッセージパッシングに基づくグラフ畳み込みネットワークを設計した。
このネットワークは、地域特性バンクを活用して、データ駆動型メッセージパッシングを再構築するように設計されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:39:02 GMT)
Genuine multi-entropy, dihedral invariants and Lifshitz theory [0.0] トリパルタイト純状態に対する2つの多変量、すなわち多エントロピーと二面体不変量について検討する。
一般三部類純状態に対しては、二面体不変量はR'enyi の反射エントロピーと直接関係していることを示す。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 19:10:25 GMT)
Generation of Large Kitten states via thermally driven dissipative freezing [0.0] 直交基底における磁気量子数$0$のディック状態の表現を利用して、大きなキッテン状態やキャット状態を生成する確率を高めることができることを示す。
結果として生じる状態は、量子秘密共有にも有用である。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 20:16:02 GMT)
Gated Associative Memory: A Parallel O(N) Architecture for Efficient Sequence Modeling [0.0] Gated Associative Memory (GAM) ネットワークは、シーケンスモデリングのための新しい完全に並列なアーキテクチャである。
我々はGAMをゼロから実装し、標準的なトランスフォーマーモデルと現代的な線形時間ベースラインに対して厳密な比較分析を行う。
我々の実験は、GAMは一貫して高速で、トレーニング速度のベースラインの両方を上回り、全てのデータセットで優れた、または競争力のある最終バリデーションの難しさを達成できることを示した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 20:59:46 GMT)
Forecasting Probability Distributions of Financial Returns with Deep Neural Networks [0.0] CNNとLong Short-Term Memoryは3つの確率分布のパラメータを予測するために用いられる。
モデルは6つの主要な株式指標(S&P 500、BOVESPA、DAX、WIG、Nikkei 225、KOSPI)でテストされる。
その結果、ディープラーニングモデルは正確な分布予測を提供し、従来のGARCHモデルと競合してバリュー・アット・リスク推定を行うことがわかった。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:37:18 GMT)
Exploring Decision-Making Capabilities of LLM Agents: An Experimental Study on Jump-Jump Game [0.0] プレイヤーは現在の位置とターゲットプラットフォーム距離に基づいてジャンプ力を正確に制御する必要がある。
これはJump-Jumpゲームの基本的なゲームプレイの仕組みを描いており、プレイヤーキャラクターはスコアを最大化するために適切な力でプラットフォームを飛び越えなければならない。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:50:30 GMT)
DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation [0.0] 近年,拡散駆動型テキスト・ツー・イメージ(T2I)生成は顕著な進歩を遂げている。
レイアウトは、大きな言語モデルとレイアウトベースの拡散モデルを橋渡しするためのインターメジウムとして使用される。
本稿では,生成タスクを複数のサブタスクに分割する分割・コンカレント手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 21:54:52 GMT)
Designing across domains with declarative thinking: Insights from the 96-Eyes ptychographic imager project [0.0] 本稿では,デノボイメージングシステム設計における5世代問題定式化言語(5GL)の適用に関する実践者の考察を紹介する。
ハードウェア制約からライフサイエンスまで、プロジェクト要件が、さまざまなドメインステークホルダーからのミッションクリティカルなインプットを維持するために、マシン可読な問題ステートメントにどのようにフォーマル化できるかを説明します。
この宣言的アプローチは透明性を高め、設計のトレーサビリティを保証し、光学的、アルゴリズム的、ハードウェアアクセラレーションされた計算、ライフサイエンスチーム間でコストのかかるミスアライメントを最小限にする。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 17:31:37 GMT)
Deep opacity and AI: A threat to XAI and to privacy protection mechanisms [0.0] ビッグデータ分析とAIは、プライバシーを脅かす。
その理由のいくつかは、AIのある種の“ブラックボックス問題”にある。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:15:59 GMT)
Cross-Domain Malware Detection via Probability-Level Fusion of Lightweight Gradient Boosting Models [0.0] 本稿では,3つの異なるデータセットにまたがる確率レベル融合を利用したマルウェア検出のための新しいフレームワークを提案する。
提案手法は,各データセット上で個々のLightGBM分類器を訓練し,効率性を確保するために最上位の予測特徴を選択し,グリッドサーチによって決定された最適化重みを用いて予測確率を融合する。
実験により,我々の融合アプローチは,ドメイン間検証セット上で0.823のマクロF1スコアを実現し,個々のモデルよりも大幅に優れ,より優れた一般化を提供することを示した。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:18:13 GMT)
Contrastive MIM: A Contrastive Mutual Information Framework for Unified Generative and Discriminative Representation Learning [0.0] 我々は,相互情報機械 (MIM) を新規に拡張する確率的フレームワークである相互情報機械 (cMIM) を紹介する。
cMIMはこの制限に対処し、MIMの生成強度を維持しながらグローバルな識別構造を強制する。
提案する主なコントリビューションは,(1) インフォネッセ方式とは異なり,有意なデータ拡張の必要性を排除し,バッチサイズに堅牢なMIMのコントラスト拡張であるcMIM,(2) エンコーダ-デコーダからリッチ表現を抽出する一般的な手法である情報埋め込みを提案する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:41:58 GMT)
Collaborative and parametric insurance on the Ethereum blockchain [0.0] 本稿では、パラメトリックおよび協調的要素を統合するブロックチェーンベースの保険スキームを紹介する。
余剰プロバイダーと呼ばれる投資家のプールは、スマートコントラクトに資金をロックし、ブロックチェーンユーザはパラメトリック保険契約を下書きできる。
スマートコントラクトはブロックチェーン用の高レベルプログラミング言語であるSolidityで開発され、Sepoliaテストネットにデプロイされる。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 11:18:38 GMT)
Chatbot Deployment Considerations for Application-Agnostic Human-Machine Dialogues [0.0] 本論文は,技術者が考慮すべき基本的,要素的,考慮事項に光を当てることを目的としている。
このケーススタディを見てみると、社会的な価値を最重要要因として考慮することを目指している。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 22:46:09 GMT)
Assessing AI-Generated Questions' Alignment with Cognitive Frameworks in Educational Assessment [0.0] 本研究はブルームの分類学をOneClickQuizに統合することを評価する。
OneClickQuizは、MoodleでMultiple-Choice Question(MCQ)生成を自動化する人工知能(AI)駆動プラグインである。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 10:10:53 GMT)
Artificial Intelligence-Based Analysis of Ice Cream Melting Behavior Under Various Ingredients [0.0] 本報告では,ロカストビーンガム,グアガム,マルトデキストリン,カラギーナンが自家製アイスクリームの融解挙動に及ぼす影響について検討する。
タイムラプス記録は、時間の経過とともに融解の進行を捉え解析するために使用された。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 14:00:21 GMT)
An End-to-End System for Culturally-Attuned Driving Feedback using a Dual-Component NLG Engine [0.0] 本稿では,ナイジェリアのドライバーに対して,文化的に調整された安全な運転フィードバックを提供するエンド・ツー・エンドのモバイルシステムを提案する。
システムの中核となるのは、二成分自然言語生成エンジンで、法的に根拠付けられた安全ヒントと説得力のある理論駆動の行動レポートの両方を提供する。
このアーキテクチャは、断続接続やノイズの多いセンサデータに対する堅牢性のために設計されている。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 16:35:53 GMT)
A Novel Method to Determine Total Oxidant Concentration Produced by Non-Thermal Plasma Based on Image Processing and Machine Learning [0.0] 本研究では,酸化時のヨウ化カリウム (KI) 溶液中の色調変化を定量化するためのCBCA法を提案する。
CBCA法は、高度な画像処理と機械学習(ML)を統合し、酸化中のヨウ化カリウム(KI)溶液の色調変化を定量化する。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 12:28:52 GMT)
A Kriging-HDMR-based surrogate model with sample pool-free active learning strategy for reliability analysis [0.0] 本研究では,信頼性解析のためのKriging-HDMRモデルに基づく能動的学習代理モデルを提案する。
このサロゲート・モデリング・フレームワークのアーキテクチャは、3つの異なる段階から成り、全ての確率変数に対する単一変数のサブサロゲートモデルの開発、結合変数のサブサロゲートモデルの要件の特定、結合変数のサブサロゲートモデルの構築である。
論文参考訳(メタデータ) (Sat, 30 Aug 2025 04:15:02 GMT)