RoboArena: Distributed Real-World Evaluation of Generalist Robot Policies [125.4] 本稿では,実世界における汎用ロボットポリシーのスケーラブルな評価手法であるRoboArenaを提案する。
固定タスク,環境,場所に関する評価を標準化する代わりに,評価者の分散ネットワークにまたがるクラウドソース評価を提案する。
我々は、DROIDロボットプラットフォームを用いて、7つの学術機関における評価者のネットワークにアプローチをインスタンス化する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:13:31 GMT)
Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.5] データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:59:12 GMT)
How Far is Video Generation from World Model: A Physical Law Perspective [101.2] OpenAIのSoraは、物理法則に準拠した世界モデルを開発するためのビデオ生成の可能性を強調している。
しかし、ビデオ生成モデルが人間の先行しない視覚データから純粋にそのような法則を発見する能力に疑問を投げかけることができる。
本研究は,3つの主要なシナリオ – 分布内,分布外,一般化 – について評価する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:30:55 GMT)
Routing Mamba: Scaling State Space Models with Mixture-of-Experts Projection [88.5] 線形状態空間モデル(SSM)は、シーケンスモデリングにおいて顕著なパフォーマンス向上を提供する。
Mambaのような最近の進歩は、入力依存のゲーティングとハードウェア対応の実装により、SSMをさらに強化している。
本稿では,線形射影の専門家による疎混合を用いてSSMパラメータをスケールする新しい手法であるRoM(Roing Mamba)を紹介する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:26:55 GMT)
Bridging Geometric Diffusion and Energy Minimization: A Unified Framework for Neural Message Passing [79.9] 本稿では,MPNNの理解のための原理的数学的枠組みとして,エネルギー制約付き拡散モデルを提案する。
我々は、拡散誘導型トランスフォーマーと呼ばれる新しいタイプのニューラルメッセージパッシングモデルを考案し、そのグローバルアテンション層は、原理化されたエネルギー制約型拡散フレームワークから導かれる。
多様なデータセットにわたって、新しいモデルは、データ構造が(グラフとして)観察されたり、部分的に観察されたり、完全に観察されなかったりするシナリオにおいて、有望なパフォーマンスを達成することを実証する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:46:40 GMT)
Deep Research Agents: A Systematic Examination And Roadmap [79.0] Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:52:48 GMT)
Enhancing LLM Knowledge Learning through Generalization [73.2] 我々は,LLMが様々な言い換えの文脈に与えられた同じ事実的知識トークンを継続的に予測する能力は,質問応答によってその知識を抽出する能力と正の相関性を示す。
そこで本稿では,LLMの知識獲得能力を高めるための2つの戦略を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:25:04 GMT)
Layered Motion Fusion: Lifting Motion Segmentation to 3D in Egocentric Videos [71.2] 本研究では,2次元モデルから層状放射場への運動分割予測を融合させることにより,3次元の動的セグメンテーションを改善することを提案する。
テスト時間の改善によってこの問題に対処し、モデルが特定のフレームに集中できるようにし、データの複雑さを軽減します。
このことは、3D技術が挑戦的で現実的な環境での動的現象に対しても2次元解析を向上できることを証明している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:25:15 GMT)
G3Flow: Generative 3D Semantic Flow for Pose-aware and Generalizable Object Manipulation [65.9] 本稿では,基礎モデルを活用した動的オブジェクト中心の3D表現であるリアルタイムセマンティックフローを構築する新しいフレームワークG3Flowを提案する。
提案手法は,デジタルツイン生成のための3次元生成モデル,セマンティック特徴抽出のための視覚基盤モデル,連続的なセマンティックフロー更新のためのロバストポーズ追跡を一意に組み合わせたものである。
本研究は,ロボット操作ポリシーのリアルタイムな動的意味的特徴理解におけるG3Flowの有効性を実証するものである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:43:26 GMT)
Evolving Prompts In-Context: An Open-ended, Self-replicating Perspective [65.1] ランダムなデモを不整合な "gibberish" にプルーニングすることで,多様なタスクにおけるパフォーマンスが著しく向上することを示す。
本稿では,低データレジームのみを用いてプルーニング戦略を自動的に検索する自己発見プロンプト最適化フレームワークPromptQuineを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:53:07 GMT)
MUPA: Towards Multi-Path Agentic Reasoning for Grounded Video Question Answering [64.5] Grounded Video Question Answering (Grounded VideoQA) では、テキストによる回答と明確な視覚的証拠の整合が必要である。
本研究では,ビデオグラウンド,質問応答,回答反射,集約を統一するMulti-Path AgenticアプローチであるMUPAを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:39:02 GMT)
LongLLaDA: Unlocking Long Context Capabilities in Diffusion LLMs [63.6] 拡散LDMと従来の自己回帰LDMの長文性能を比較検討する。
LLaDAとNTKベースのRoPE外挿法を統合したLongLLaDAを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:08:09 GMT)
SE-Merging: A Self-Enhanced Approach for Dynamic Model Merging [60.8] textttSE-Mergingは自己拡張型モデルマージフレームワークである。
textttSE-Mergingは、追加のトレーニングなしで動的モデルのマージを実現することを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:38:41 GMT)
Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data [56.7] 類似報酬は二分選好データ収集と報奨モデルを回避する。
RefAlignは、参照モデルや報酬モデルに依存しない汎用的なREINFORCEスタイルのアライメントアルゴリズムである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:02:25 GMT)
SurgVidLM: Towards Multi-grained Surgical Video Understanding with Large Language Model [55.1] SurgVidLMは、完全かつきめ細かい外科的ビデオ理解に対処するために設計された最初のビデオ言語モデルである。
手術ビデオの多段階的理解を行うための2段階フレームワークであるStageFocus機構について紹介する。
実験結果から,SurgVidLMは全精細ビデオ理解タスクおよび精細ビデオ理解タスクにおいて,最先端のVid-LLMよりも有意に優れていた。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:16:18 GMT)
Active Fine-Tuning of Multi-Task Policies [54.7] AMF(Active Multi-task Fine-tuning)を提案する。
我々は,AMFの性能保証を規則性仮定で導き,複雑・高次元環境における実験的有効性を示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:19:25 GMT)
RoboTwin 2.0: A Scalable Data Generator and Benchmark with Strong Domain Randomization for Robust Bimanual Robotic Manipulation [51.9] 本稿では,多様な実データの自動生成を可能にするスケーラブルなシミュレーションフレームワークであるRoboTwin 2.0を紹介する。
sim-to-real転送を改善するため、RoboTwin 2.0は5つの軸に沿って構造化されたドメインランダム化を組み込んでいる。
このフレームワークは、5つのロボットエボディメントにまたがる50のデュアルアームタスクにまたがってインスタンス化されます。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:26:53 GMT)
GEMeX-ThinkVG: Towards Thinking with Visual Grounding in Medical VQA via Reinforcement Learning [50.9] 医学的視覚的質問応答は、医学的イメージに基づいた自然言語的質問にモデルで答えることによって、臨床的な意思決定を支援することを目的としている。
現状の手法は, 信頼性の限界や解釈可能性の低下に悩まされており, 臨床医や患者がモデル生成の回答を理解し, 信頼する能力が損なわれている。
この研究はまず、回答生成を中間的推論ステップに分解するThinking with Visual Groundingデータセットを提案する。
本稿では,強化学習のための新たな報奨機構を導入し,モデル推論プロセスと最終解の整合性を改善した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:09:58 GMT)
Stable and consistent density-based clustering via multiparameter persistence [49.2] トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:45:57 GMT)
AlphaDecay: Module-wise Weight Decay for Heavy-Tailed Balancing in LLMs [47.7] 重崩壊は、大規模言語モデル(LLM)を訓練するための標準正規化手法である
LLMの各モジュールに異なる重み付け強度を適応的に割り当てるAlphaDecayを導入する。
提案手法は, スペクトル特性のモジュールワイド差のバランスをとるために, 調整した重み付き崩壊割当を利用するため, 性能が向上する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:57:32 GMT)
Cross from Left to Right Brain: Adaptive Text Dreamer for Vision-and-Language Navigation [46.8] VLN(Vision-and-Language Navigation)は、エージェントが部分観測可能性の下で自然な指示に従うことでナビゲートする必要がある。
近年の手法は将来のシーンを想像することでこれを緩和するが、それらは視覚に基づく合成に依存している。
我々は,テキスト形式で重要な環境セマンティクスを適応的に想像し,より信頼性と効率的な戦略を実現することを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:53:33 GMT)
OmniESI: A unified framework for enzyme-substrate interaction prediction with progressive conditional deep learning [46.4] 条件付き深層学習による酵素-基質相互作用予測のための2段階プログレッシブフレームワークであるOmniESIを導入する。
我々は,OmniESIが最先端の特殊手法よりも優れた性能を実現していることを示す。
全体として、OmniESIは酵素-基質相互作用の統一的な予測手法である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:40:40 GMT)
A Comprehensive Graph Framework for Question Answering with Mode-Seeking Preference Alignment [45.2] モード検索の好みをアライメントするグラフベースの総合的なフレームワークであるGraphMPAを提案する。
本手法は,情報理解と合成のための認知過程を模倣した,一般的な類似度測定を用いた階層型文書グラフを構築する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:08:44 GMT)
Stream-Omni: Simultaneous Multimodal Interactions with Large Language-Vision-Speech Model [43.5] Stream-Omniは、効率的なモダリティアライメントを備えた大きな言語ビジョン音声モデルである。
様々なモダリティの組み合わせの下での相互作用を同時にサポートすることができる。
視覚的理解、音声対話、および視覚的な音声対話タスクにおいて、高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:56:58 GMT)
DriveSuprim: Towards Precise Trajectory Selection for End-to-End Planning [43.3] DriveSuprimは、自動運転車の軌道選択のための選択に基づくパラダイムである。
衝突回避や規則の遵守など、最先端のパフォーマンスを実現する。
様々な運転シナリオにおいて高い軌道品質を維持する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:57:46 GMT)
Shrinking the Generation-Verification Gap with Weak Verifiers [42.5] 検証者は、生成された候補から応答をスコア付けしてランク付けすることで、言語モデル機能を改善することができる。
Weaverは、複数の弱い不完全な検証器を組み合わせることで、強力な検証器を設計するためのフレームワークである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:38:15 GMT)
PlanMoGPT: Flow-Enhanced Progressive Planning for Text to Motion Synthesis [40.3] PlanMoGPTは、プログレッシブプランニングとフロー強化された微細な動きトークン化を統合したLLMベースのフレームワークである。
最先端のパフォーマンスを実現し、FIDスコアを63.8%向上させる(0.380から0.141)。
提案したフレームワークは、現在の非LLMアプローチを悩ませる多様性と品質のトレードオフをうまく解決する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:24:53 GMT)
Probing the Embedding Space of Transformers via Minimal Token Perturbations [40.3] 極小トークン摂動が埋め込み空間に与える影響について検討する。
また、層間の摂動がどのように伝播し、入力情報がより深い層にますます混ざり合っているかを示す。
この研究は、モデルの解釈可能性のための強力なツールとして、トークンの摂動と埋め込み空間へのシフトの組み合わせを導入している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:22:56 GMT)
Learning to Reason under Off-Policy Guidance [40.3] textbfLUFFY(textbfLearning to reason textbfUnder otextbfFF-polictextbfY guidance)を導入する。
LUFFYは、模擬と探検のバランスを取るために、オフ・ポリティクスのデモとオン・ポリティクスのロールアウトを組み合わせる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 00:18:09 GMT)
The Voice Timbre Attribute Detection 2025 Challenge Evaluation Plan [40.1] The Voice Timbre Attribute Detection (VtaD) 2025 Challengeは、音声の音色特性を比較的に説明することに焦点を当てている。
VtaD 2025チャレンジは5月に始まり、中国・江江で開催されるNCMMSC2025カンファレンスでの特別提案で締めくくられる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:15:34 GMT)
Efficient Feature Aggregation and Scale-Aware Regression for Monocular 3D Object Detection [40.1] MonoASRHは、効率的なハイブリッド特徴集約モジュール(EH-FAM)と適応スケール対応3D回帰ヘッド(ASRH)で構成される新しいモノクル3D検出フレームワークである。
EH-FAMは、小規模オブジェクトのセマンティックな特徴を抽出するために、グローバルな受容領域を持つマルチヘッドアテンションを用いる。
ASRHは2次元境界ボックス次元を符号化し、EH-FAMで集約された意味的特徴とスケール特徴を融合する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:22:35 GMT)
DSGram: Dynamic Weighting Sub-Metrics for Grammatical Error Correction in the Era of Large Language Models [39.5] 大規模言語モデル(LLM)に基づく文法的誤り訂正(GEC)モデルは、提供された金の参照から分岐する修正を生成することが多い。
この不一致は、従来の基準ベースの評価指標の信頼性を損なう。
本稿では,GECモデル,DSGram,Semantic Coherence,Edit Level,Fluencyを統合し,動的重み付け機構を活用する新しい評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:51:54 GMT)
GmNet: Revisiting Gating Mechanisms From A Frequency View [38.8] 本研究では,ゲーティング機構がニューラルネットワークのトレーニング力学に与える影響を周波数の観点から検討した。
本稿では,様々な周波数成分の情報を効率的に活用する軽量モデルを提案する。
GmNetは画像分類タスクの有効性と効率の両面で優れた性能を実現している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:43:35 GMT)
UniDrive: Towards Universal Driving Perception Across Camera Configurations [38.4] 3次元認識は,3次元2次元投影に基づく2次元画像から3次元情報を推測することを目的としている。
カメラ構成をまたいだ一般化は、異なる自動車モデルに自律運転モデルをデプロイする上で重要である。
我々は、カメラ構成全体にわたって普遍的な認識を実現するために、視覚中心の自律運転のための新しいフレームワークUniDriveを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:30:37 GMT)
Programmable Bell State Generation in an Integrated Thin Film Lithium Niobate Circuit [38.2] 絡み合いは暗号、センシング、計算などの量子技術の中心である。
リチウムニオブ酸イオン絶縁体(LNOI)上の再構成可能なフォトニック集積回路を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:53:20 GMT)
RL for Reasoning by Adaptively Revealing Rationales [36.5] 監督された微調整(SFT)は密度の高い地下構造ラベルに依存しており、シーケンスの長さが大きくなるにつれてコストが増大する。
AdaBack(アダプティブ・バックトラック)は,学習中の目標出力の部分的なプレフィックスのみを明らかにする,サンプルごとのカリキュラム学習アルゴリズムである。
部分解に対する適応的なカリキュラムは、そうでなければ難解な問題を確実に解決することを示します。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:46:14 GMT)
Operations & Supply Chain Management: Principles and Practice [36.3] オペレーション・アンド・サプライ・チェーン・マネジメント(OSCM)は、幅広い戦略、フレームワーク、テクノロジーを取り入れて、継続的に進化してきた。
この百科事典の記事は、現代の戦略、ツール、方法、原則、ベストプラクティスの包括的概要を提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:27:31 GMT)
Multi-entity Video Transformers for Fine-Grained Video Representation Learning [34.3] ビデオ表現学習のためのトランスフォーマーアーキテクチャの設計を再検討する。
このアプローチの重要な側面は、時間パイプラインにおけるシーン情報の共有の改善です。
我々のMV-Former(Multi-entity Video Transformer)は、フレームを時間にわたってリンクされたトークンとして表現されたエンティティのグループとして処理します。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:20:08 GMT)
QueueEDIT: Structural Self-Correction for Sequential Model Editing in LLMs [34.2] 大規模言語モデル(LLM)のためのキューベースの自己補正フレームワークを提案する。
我々は長周期依存に対処し、LLMの一般的な機能に対するパラメータバイアスの影響を軽減する。
我々のフレームワークは、様々な中小企業設定において強力なベースラインをはるかに上回り、シングルターン編集における競争力を維持する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 00:58:07 GMT)
DiscRec: Disentangled Semantic-Collaborative Modeling for Generative Recommendation [33.2] 生成的レコメンデーションは、アイテム予測を直接生成する強力なパラダイムとして現れています。
現在の手法ではトークン・イテムのミスアライメントとセマンティック・コラボレーティブな信号の絡み合いという2つの重要な課題に直面している。
Disentangled Semantic-Collaborative Signal Modelingを可能にする新しいフレームワークであるDisdisRecを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:01:07 GMT)
Cross-modal State Space Modeling for Real-time RGB-thermal Wild Scene Semantic Segmentation [31.1] RGBと熱データの統合により、フィールドロボットの野生環境におけるセマンティックセグメンテーション性能が大幅に向上する。
本稿では,SSM(クロスモーダル状態空間モデリング)アプローチを利用した効率的なRGB-熱的セマンティックセマンティックセグメンテーションアーキテクチャであるCM-SSMを紹介する。
CM-SSMは、より少ないパラメータと少ない計算コストでCARTデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:53:11 GMT)
LightRetriever: A LLM-based Hybrid Retrieval Architecture with 1000x Faster Query Inference [31.0] 大規模言語モデル(LLM)に基づくハイブリッド検索では、LLMを用いてクエリやドキュメントを低次元の密度あるいは高次元のスパースベクトルにエンコードする。
超軽量なクエリエンコーダを備えたLLMベースのハイブリッドレトリバーであるLightRetrieverを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:02:31 GMT)
TAB: Unified Benchmarking of Time Series Anomaly Detection Methods [31.0] 時系列異常検出(TSAD)は、金融、交通、医療など多くの分野で重要な役割を果たしている。
我々はTABと呼ばれる新しい時系列異常検出ベンチマークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:19:36 GMT)
PREMAP: A Unifying PREiMage APproximation Framework for Neural Networks [30.7] 本稿では,任意の多面体出力集合のアンダー・アンド・オーバー近似を生成する事前抽象化のためのフレームワークを提案する。
提案手法を様々なタスクで評価し,高インプット次元画像分類タスクに対する効率とスケーラビリティの大幅な向上を示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:40:04 GMT)
See-in-Pairs: Reference Image-Guided Comparative Vision-Language Models for Medical Diagnosis [30.4] 医用視覚言語モデル(VLM)は、主にシングルイメージまたはシングルシリーズの分析に焦点を当てている。
本報告では, 検索および基準一致参照画像に汎用VLMを付与し, 臨床的にインフォームドされた比較プロンプトを伴い, 診断結果を大幅に改善することを示した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:59:44 GMT)
Multilingual Retrieval Augmented Generation for Culturally-Sensitive Tasks: A Benchmark for Cross-lingual Robustness [30.0] 検索したウィキペディア文書と組み合わせた領土紛争のデータセットであるBordIRLinesを49言語で紹介する。
我々は多言語検索のための複数のモードを定式化することにより、このRAG設定の言語間ロバスト性を評価する。
実験の結果,多様な言語からの視点を取り入れることで,ロバスト性の向上が期待できることがわかった。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:14:14 GMT)
Multi-turn Jailbreaking via Global Refinement and Active Fabrication [29.8] 本稿では,各インタラクションにおいてジェイルブレーキングパスを世界規模で洗練する,新しいマルチターンジェイルブレーキング手法を提案する。
実験により,既存の単ターン・多ターンジェイルブレイク技術と比較して,本手法の優れた性能を示した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:15:05 GMT)
Large Language Models for Disease Diagnosis: A Scoping Review [29.3] 自動疾患診断は、臨床実践においてますます価値が増している。
大規模言語モデル(LLM)の出現は、人工知能のパラダイムシフトを引き起こした。
この分野での関心が高まっているにもかかわらず、全体論的な見解はいまだに欠落している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:43:14 GMT)
Rethinking Cancer Gene Identification through Graph Anomaly Analysis [28.6] 本研究は、がん遺伝子によるタンパク質相互作用の生物学的異常をグラフ異常に橋渡しするための先駆的な一歩を踏み出した。
本研究では,スペクトル視点におけるスペクトルエネルギー分布の変化だけでなく,空間的視点におけるタンパク質相互作用の詳細な文脈を知覚する階層型グラフニューラルネットワーク(HIPGNN)を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:51:57 GMT)
Supercharging Graph Transformers with Advective Diffusion [28.4] 本稿では,この課題に対処するために,物理に着想を得たグラフトランスモデルであるAdvDIFFormerを提案する。
本稿では,AdvDIFFormerが位相シフトによる一般化誤差を制御できることを示す。
経験的に、このモデルは情報ネットワーク、分子スクリーニング、タンパク質相互作用の様々な予測タスクにおいて優位性を示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:59:38 GMT)
Damba-ST: Domain-Adaptive Mamba for Efficient Urban Spatio-Temporal Prediction [27.9] 本研究では,効率的な都市時間予測のためのドメイン適応型マンバモデルDamba-STを提案する。
ダンバ-STはマンバの線形複雑性を保ちながら、不均一領域の複雑さを著しく高めている。
予測タスクにおける最先端のパフォーマンスを達成し、ゼロショットの強い一般化を実証する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:40:01 GMT)
Leveraging Model Guidance to Extract Training Data from Personalized Diffusion Models [27.9] 拡散モデル(DM)は強力な画像生成ツールとなっている。
多くの人がオンラインで微調整されたチェックポイントをアップロードし、CivitaiやHuggingFaceといったコミュニティを育てている。
オンラインで共有されているこれらの微調整されたDMからトレーニングデータを抽出するか?
微調整データを抽出するフレームワークであるFineXtractを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:37:39 GMT)
On the Robustness of Human-Object Interaction Detection against Distribution Shift [27.4] 近年,Human-Object Interaction (HOI) 検出が大幅に進歩している。
既存の作業は、必然的な分布シフトを伴う現実的なシナリオとはかけ離れた、理想的なイメージと自然な分布を持つ標準設定に重点を置いている。
本研究では,様々な分布シフト下でのHOI検出モデルのロバスト性をベンチマークし,解析し,向上させることにより,この問題を考察する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:01:34 GMT)
Cause-Effect Driven Optimization for Robust Medical Visual Question Answering with Language Biases [27.1] 我々はCEDOと呼ばれる新しい因果効果駆動最適化フレームワークを提案する。
MHO(Modality-driven Heterogeneous Optimization)、GMS(Gradient-Guided Modality Synergy)、DLR(Dis Distribution-Adapted Loss Rescaling)の3つの確立されたメカニズムが組み込まれている。
複数の従来の偏見に敏感なベンチマークの実験は、最先端の競合相手に対するCEDOの頑健さを一貫して示している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:20:34 GMT)
One-Step is Enough: Sparse Autoencoders for Text-to-Image Diffusion Models [26.2] 我々は、数ステップのテキスト・画像拡散モデルであるSDXL Turboの解釈可能な機能を学ぶためにSAEを訓練する。
学習した特徴は解釈可能であり、生成プロセスに因果的に影響を与え、ブロック間の特殊化を明らかにする。
本研究は,テキスト・画像拡散モデルにおけるSAEの解釈可能性に関する最初の研究である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:40:22 GMT)
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images [26.1] Autoregressive Initial Bitsはサブイメージの自動回帰と潜在変数モデリングを統合するフレームワークである。
LVPNet という医用画像圧縮手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:45:35 GMT)
SurgSora: Object-Aware Diffusion Model for Controllable Surgical Video Generation [26.0] SurgSoraは、単一の入力フレームとユーザが指定したモーションキューから、高忠実でモーションコントロール可能な手術用ビデオを生成するフレームワークである。
SurgSoraは、これらのリッチな機能を安定ビデオ拡散に組み込むことで、最先端の視覚的信頼性と制御性を達成する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:21:04 GMT)
Adapting Vision-Language Models for Evaluating World Models [24.8] データおよび計算制約下でのシミュレーション環境におけるロールアウトに対する視覚言語評価手法であるUNIVERSEを提案する。
本研究では,タスク形式,コンテキスト長,サンプリング戦略,データ構成を網羅した,完全,部分的,パラメータ効率の微調整を大規模に検討する。
その結果得られた統合評価器は、単一のチェックポイントを使用してタスク固有のベースラインのパフォーマンスにマッチする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:53:28 GMT)
PostAlign: Multimodal Grounding as a Corrective Lens for MLLMs [23.7] MLLM(Multimodal Large Language Models)は、画像キャプションや視覚的質問応答などの視覚言語タスクに優れる。
主に、モデルが実際の視覚情報を活用するのを妨げている言語的先行性のために、急激な相関に対する過度な信頼に悩まされることが多い。
MMed-PostAlignは、視覚的理解能力を高め、MLLMの幻覚を軽減するために設計された、マルチモーダル後のアライメントフレームワークである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:11:46 GMT)
Discrete JEPA: Learning Discrete Token Representations without Reconstruction [23.6] 認知知性の象徴的な基礎は、観測から隠れたパターンを抽出することにある。
本稿では,意味的トークン化による潜在予測符号化フレームワークであるDisdisrete-JEPAを提案する。
我々のアプローチは、人工知能システムにおける世界モデリングと計画能力の進歩に大きな影響を与えることを約束する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:49:23 GMT)
TEM^3-Learning: Time-Efficient Multimodal Multi-Task Learning for Advanced Assistive Driving [22.2] TEM3-Learningは、ドライバーの感情認識、運転者行動認識、交通状況認識、車両行動認識を共同で最適化する新しいフレームワークである。
4つのタスクにまたがって最先端の精度を実現し、600万パラメータ未満の軽量アーキテクチャを維持し、142.32 FPSの推論速度を実現している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:12:27 GMT)
Memba: Membrane-driven Parameter-Efficient Fine-Tuning for Mamba [21.5] State Space Models (SSM) はアテンションベースのトランスフォーマーの強力な代替品として登場した。
メンバは膜駆動である。
PEFTはMamba用に特別に設計されたアプローチである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:52:45 GMT)
Trustworthy Efficient Communication for Distributed Learning using LQ-SGD Algorithm [21.2] LQ-SGD (Low-Rank Quantized Gradient Descent) は分散学習のための効率的な通信勾配圧縮アルゴリズムである。
LQ-SGDは、低ランク近似と対数量子化技術を導入し、通信オーバーヘッドを大幅に減らし、トレーニングの収束速度とモデルの精度を確保しながら、PowerSGDに基づいてさらに発展する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:21:49 GMT)
Bridging Quantized Artificial Neural Networks and Neuromorphic Hardware [21.1] ニューロモルフィックハードウェアは、エネルギー効率の良いAIシステムを実現するために、分散コンピューティングとイベント駆動回路設計を活用することを目的としている。
ニューロモルフィックハードウェアでは、ニューロンは単一ビットのイベント駆動データ(スパイクと呼ばれる)を通信間通信に使用する。
本稿では,ハードウェア上での量子化ANNを直接実装するスパイキング駆動型ANNフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:37:05 GMT)
Pathwise Explanation of ReLU Neural Networks [20.8] 本稿では,意思決定経路に関わる隠蔽単位の部分集合を考慮した新しい手法を提案する。
このパスワイズな説明は、入力と意思決定プロセスの関係について、より明確で一貫性のある理解を提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:41:42 GMT)
Reinforcement Learning Teachers of Test Time Scaling [20.3] LMを推論する主要なユースケースは、新しい学生を蒸留し、将来のRLイテレーションを冷静に開始する教師として機能することである。
我々は,RLの探究課題を回避するために,RLT(Reinforcement-Learned Teachers)の新たなクラスを育成する枠組みを導入する。
RLTは、各問題に対する質問と解決の両方で促され、生徒に合った詳細な説明で単に「接続する」ことを任務とする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:04:49 GMT)
How Alignment Shrinks the Generative Horizon [20.2] 分岐因子(BF)は、生成中の有効な可算次のステップ数のトークン不変測度である。
アライメントチューニングは、モデルの出力分布をアウトセットから大幅にシャープします。
この知見に基づいて、この安定性は複雑な推論に驚くべき意味を持つ。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:00:37 GMT)
Hierarchical Decision Making Based on Structural Information Principles [19.8] 本稿では,階層的意思決定のための構造情報原則に基づく新しいフレームワーク,すなわちSIDMを提案する。
本稿では,過去の状態-行動軌跡を処理し,状態と行動の抽象表現を構築する抽象化機構を提案する。
単エージェントシナリオのためのスキルベース学習手法と,多エージェントシナリオのためのロールベースの協調手法を開発し,そのどちらも,パフォーマンス向上のために様々な基礎アルゴリズムを柔軟に統合することができる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:07:17 GMT)
LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation [19.7] クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインにわたる歴史的なインタラクションを活用することで、ユーザの振る舞いを予測する。
我々は,LLM-EMF(クロスドメインシーケンスレコメンデーション)のためのLLM強化多モード核融合を提案する。
LLM-EMFは、LLM(Large Language Models)の知識でテキスト情報を強化する新しい高度なアプローチである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:53:21 GMT)
Permutation Equivariant Model-based Offline Reinforcement Learning for Auto-bidding [19.4] 自動入札のための強化学習(RL)は、単純なオフラインシミュレーターの使用から、固定された実データセット上のオフラインRLに移行する。
本稿では,実際のデータから環境モデルを学習し,そのギャップを埋めるモデルベースRLバイディング(MRLB)を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:58:36 GMT)
CDG-MAE: Learning Correspondences from Diffusion Generated Views [19.2] CDG-MAEは、静的画像から生成される多様な合成ビューを利用する、新しいMAEベースの自己教師方式である。
これらの生成されたビューは、ポーズとパースペクティブに大きな変化を示し、リッチなトレーニング信号を提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:40:11 GMT)
Pre-Trained LLM is a Semantic-Aware and Generalizable Segmentation Booster [18.7] CNNエンコーダ・デコーダ・セグメンテーション・フレームワーク(LLM4Seg)に事前学習した凍結LDM層を統合する単純なハイブリッド構造を提案する。
驚くべきことに、この設計は、超音波、皮膚内視鏡、ポリスコピー、CTスキャンなど、様々なモードでトレーニング可能なパラメータを最小限に増やすことで、セグメンテーション性能を向上させる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:34:00 GMT)
BPCLIP: A Bottom-up Image Quality Assessment from Distortion to Semantics Based on CLIP [18.3] 比較言語-画像事前学習(CLIP)に基づくボトムアップ画像品質評価手法を提案する。
具体的には,エンコーダを用いて入力画像からマルチスケール特徴を抽出し,ボトムアップ型マルチスケールクロスアテンションモジュールを導入する。
6つの異なる次元に40の画像品質形容詞を組み込むことで、事前学習したCLIPテキストエンコーダが画像固有の品質の表現を生成することができる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:56:57 GMT)
ECHO-LLaMA: Efficient Caching for High-Performance LLaMA Training [18.1] ECHO-LLaMAはLLaMAモデルを特定の層にまたがる共有KVキャッシュに変換する。
ECHO-LLaMAは、トレーニング中のトークン/秒のスループットを最大77%向上させる。
ECHO-LLaMAは、大規模言語モデルの事前トレーニングと微調整のためのスケーラブルで費用効率の良いソリューションを提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:46:11 GMT)
MalPurifier: Enhancing Android Malware Detection with Adversarial Purification against Evasion Attacks [18.0] MalPurifierは、Androidのマルウェア検出用に特別に設計された、新しい対逆浄化フレームワークである。
2つの大規模なデータセットの実験により、MalPurifierは最先端の防御を著しく上回っていることが示された。
MalPurifierは軽量でモデルに依存しないプラグイン・アンド・プレイモジュールとして、MLベースのAndroidマルウェア検出器のセキュリティを強化するための実用的で効果的なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:51:00 GMT)
SIPDO: Closed-Loop Prompt Optimization via Synthetic Data Feedback [17.9] SIPDO(Self-Improving Prompts through Data-Augmented Optimization)は,素早い学習のためのクローズドループフレームワークである。
SIPDOは、合成データジェネレータとプロンプトを結合し、ジェネレータは、現在のプロンプトの弱点を明らかにし、応答時のプロンプトを洗練する新しい例を生成する。
このフィードバック駆動ループは、外部の監視や新しいタスクへのアクセスを前提とせずに、迅速なパフォーマンスの体系的な改善を可能にする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:21:13 GMT)
ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation [17.8] 我々は45Kのテキスト・ツー・イメージと46Kのテキスト・アンド・イメージデータからなる最初のデータセットであるShareGPT-4o-Imageを提案する。
我々は,テキスト・ツー・イメージ生成とテキスト・アンド・イメージ生成の両方が可能なマルチモーダルな大規模言語モデルであるJanus-4oを開発した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:51:09 GMT)
FLARE: Toward Universal Dataset Purification against Backdoor Attacks [17.0] ディープニューラルネットワーク(DNN)は、バックドア攻撃の影響を受けやすい。
隠れたバックドアを埋め込むために、敵に特定されたトリガーを持つ敵の毒のデータセット。
各種バックドア攻撃に対する汎用的浄化法であるFLAREを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:19:52 GMT)
Geometric Contact Flows: Contactomorphisms for Dynamics and Control [17.0] 本稿では,複雑なシステムを学ぶための新しいフレームワークであるGeometric Contact Flows (GFC)を紹介する。
GFCは安定性やエネルギー保存といった望ましい性質をコードする潜在接触ハミルトンモデルを構築している。
物理的システムにおける動的学習実験とインタラクションタスクにおけるロボット制御実験は,我々のアプローチの有効性を実証する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:52:21 GMT)
NestQuant: Post-Training Integer-Nesting Quantization for On-Device DNN [16.7] 本稿では、IoTデバイス上でのオンデバイス量子化モデルスイッチングのためのリソースフレンドリな整数ネスト量子化(NestQuant)を提案する。
提案したNestQuantは、整数データ型の高ビットおよび低ビットの重みに量子化重みをビット単位で分割する整数重み分解を組み込んでいる。
デプロイメントでは、1つのNestQuantモデルのみを送信、保存し、ロービット重みをpaging/outすることで、フルビット/パートビットモデルの切り替えを行うことができます。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:53:22 GMT)
Refine Medical Diagnosis Using Generation Augmented Retrieval and Clinical Practice Guidelines [16.6] GARMLE-Gは、医療用言語モデルの出力を権威的ガイドラインに根拠づけた、世代別検索フレームワークである。
従来のRetrieval-Augmented Generationベースのアプローチとは異なり、GARMLE-Gは権威的なガイドラインコンテンツを直接検索することで幻覚のない出力を可能にする。
高血圧診断のためのプロトタイプシステムを開発し, 検索精度, 意味的関連性, 臨床ガイドラインの適合性を実証した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:31:13 GMT)
A Robust Real-Time Lane Detection Method with Fog-Enhanced Feature Fusion for Foggy Conditions [15.9] 実世界の霧のシナリオで捉えたFogyLaneデータセットを導入し、FogyCULaneとFogyTusimpleという2つの追加データセットを合成する。
我々は,Global Feature Fusion Module (GFFM) を組み込んで,霧画像のグローバルな関係を捉えることにより,車線検出のためのロバストなFog-Enhanced Networkを提案する。
F1スコアはFogyLaneで95.04、FogyCULaneで79.85、FogyTusimpleで96.95である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:33:20 GMT)
Multimodal Medical Image Binding via Shared Text Embeddings [15.9] Multimodal Medical Image Binding with Text (Mtextsuperscript3Bind)は、医用画像モダリティのシームレスなアライメントを可能にする新しい事前トレーニングフレームワークである。
Mtextsuperscript3Bindの最初の微調整CLIPライクなイメージテキストモデルは、そのモダリティ固有のテキスト埋め込みスペースを調整する。
Mtextsuperscript3Bindは、ゼロショット、少数ショット分類およびクロスモーダル検索タスクにおいて、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:39:25 GMT)
VFArchē: A Dual-Mode Framework for Locating Vulnerable Functions in Open-Source Software [15.6] ソフトウェア構成分析(SCA)は、ソフトウェアプロジェクトの依存性に固有の脆弱性に対処する上で重要な役割を担っている。
VFArch=eは、脆弱性を公開するために設計されたデュアルモードのアプローチで、利用可能なパッチリンクの有無にかかわらず、シナリオに適用できる。
妥当な努力で50の脆弱性のうち43のVFを見つけ、SCAツールの78~89%の偽陽性を著しく減らしました。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:33:10 GMT)
Collage: Decomposable Rapid Prototyping for Information Extraction on Scientific PDFs [15.6] コラージュ(Colllage)は, 科学的PDF上での様々な情報抽出モデルの高速なプロトタイピング, 可視化, 評価を目的としたツールである。
NLPベースのツールの開発者とユーザの両方が、中間状態の詳細なビューを提供することで、パイプラインの検査、デバッグ、理解を深めることができます。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:50:21 GMT)
CmFNet: Cross-modal Fusion Network for Weakly-supervised Segmentation of Medical Images [15.5] そこで我々は,CmFNetを提案する。CmFNetは3次元弱教師付き医用画像分割手法である。
CmFNetは、モダリティ固有の特徴学習ネットワーク、クロスモーダル特徴学習ネットワーク、ハイブリッド教師あり学習戦略の3つの主要コンポーネントで構成されている。
当社のアプローチは、オーバーフィッティングを効果的に軽減し、堅牢なセグメンテーション結果を提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:02:27 GMT)
Call Me Maybe: Enhancing JavaScript Call Graph Construction using Graph Neural Networks [15.4] これまでの研究は、高度なソリューションでさえ偽のエッジを生成し、有効なソリューションを見逃していることを示している。
我々の主な考えは、複数のエッジ型を持つリッチな表現を用いて、完全なプログラムグラフ上のリンク予測として問題をフレーム化することである。
提案手法は,JavaScriptコールグラフ構築のリコールを改善することができることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:26:44 GMT)
Learning, Reasoning, Refinement: A Framework for Kahneman's Dual-System Intelligence in GUI Agents [15.3] 人間の動作に類似したGUI自動化のための適応学習を実現することにより,制限を克服する認知フレームワークであるCogniGUIを提案する。
エージェントシステムの一般化と適応性を評価するために,マルチアプリケーションナビゲーション,動的状態遷移,インターフェースのコヒーレンスなどを含む総合ベンチマークScreenSeekを導入する。
実験結果から,現在のGUIグラウンドベンチマークと新たに提案したベンチマークの両方において,CogniGUIが最先端の手法を上回ることが示された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:30:52 GMT)
Multimodal Fusion SLAM with Fourier Attention [15.2] 本稿では,高速フーリエ変換 (FFT) を用いた効率的なマルチモーダル融合SLAM法FMF-SLAMを提案する。
具体的には、RGBと奥行き信号から特徴を抽出する、新しいフーリエ型自己注意・相互注意機構を導入する。
我々のアプローチは、TUM、TartanAir、および我々の実世界のデータセットのビデオシーケンスを使用して検証され、ノイズ、様々な照明、暗黒条件下での最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:44:07 GMT)
InspireDebate: Multi-Dimensional Subjective-Objective Evaluation-Guided Reasoning and Optimization for Debating [15.1] 既存の大規模言語モデル(LLM)は、信頼性や論理的妥当性といった客観的評価を無視しながら、特定の議論に応答することに焦点を当てている。
本稿では,新しい評価システムである$textbfInspireScore$と最適化された議論フレームワークである$textbfInspireDebate$を提案する。
$textbfInspireScore$は、既存のメソッドと比較して、専門家の判断と44$%高い相関を達成している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:14:29 GMT)
Online Learning of Whittle Indices for Restless Bandits with Non-Stationary Transition Kernels [15.0] 本研究では,レスレスマルチアーム・バンディット(RMAB)の資源割り当てについて,未知の非定常的設定で検討する。
本稿では,Whittleインデックスのオンライン学習アルゴリズムを提案する。
本アルゴリズムは,非定常環境におけるベースラインと比較して,最小の累積後悔率で優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:04:52 GMT)
From Easy to Hard: Building a Shortcut for Differentially Private Image Synthesis [14.9] 差分プライベート(DP)画像合成は、センシティブなデータセットから合成画像を生成することを目的としている。
本稿では,拡散モデルを用いて合成画像を容易に生成する2段階のDP画像合成フレームワークを提案する。
我々は,4つの画像データセットの平均値において,合成画像の忠実度と有用度が,最先端の手法よりも33.1%,2.1%向上していることを示す実験を行った。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:59:46 GMT)
Cross-Attention Message-Passing Transformers for Code-Agnostic Decoding in 6G Networks [14.6] 6Gネットワークのチャネルコーディングは、異種通信シナリオから生じる幅広い要件をサポートすることが期待されている。
従来のコード固有デコーダは、次世代システムに必要な柔軟性とスケーラビリティを欠いている。
本稿ではトランスフォーマーアーキテクチャに基づく統合型およびコードに依存しないデコーディングのためのAIネイティブ基盤モデルを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:08:42 GMT)
PDF Retrieval Augmented Question Answering [14.6] 本稿では,Retrieval Augmented Generation (RAG) フレームワークを用いた質問応答システム(QA)の進歩について述べる。
我々は,複雑なマルチモーダル質問を効果的に解決する総合的なRAGベースのQAシステムの構築を目指している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:14:19 GMT)
Towards Reflected Object Detection: A Benchmark [13.8] 本稿では,反射物体検出に特化して設計されたベンチマークを紹介する。
我々のリフレクションオブジェクト検出データセット(RODD)は、様々なコンテキストにおいて反射オブジェクトを示す多様な画像のコレクションを特徴としている。
RODDは10のカテゴリを包含し、異なる背景にまたがる21,059のリアルおよびリフレクションオブジェクトの画像を含んでいる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:37:55 GMT)
SliceGX: Layer-wise GNN Explanation with Model-slicing [13.8] SliceGXは、特定のGNN層における説明をプログレッシブに生成する新しいGNN説明手法である。
証明可能な近似保証でこれらの部分グラフを漸進的に生成・維持する効率的なアルゴリズムと最適化手法を開発した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:28:46 GMT)
DRO-Augment Framework: Robustness by Synergizing Wasserstein Distributionally Robust Optimization and Data Augmentation [13.8] DRO-Augmentは、Wasserstein Distributionally Robust Optimizationと様々なデータ拡張戦略を統合する新しいフレームワークである。
本手法は,重度データ摂動および逆攻撃シナリオ下での既存の拡張手法より優れる。
理論的には,計算効率のよい変分正規化損失関数を用いて学習したニューラルネットワークに対して,新たな一般化誤差境界を確立する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:18:03 GMT)
Dim and Small Target Detection for Drone Broadcast Frames Based on Time-Frequency Analysis [13.7] 本稿では,通信プロトコルの時間周波数解析に基づく,ドローン放送フレームのターゲット検出アルゴリズムを提案する。
提案アルゴリズムは,既存のアルゴリズムと比較して評価基準を2.27%改善する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:00:03 GMT)
CT Radiomics-Based Explainable Machine Learning Model for Accurate Differentiation of Malignant and Benign Endometrial Tumors: A Two-Center Study [13.5] 子宮内膜癌(EC)患者の悪性度と良性度を診断するためのCTラジオミクスを用いた説明可能な機械学習モデルを開発した。
モデルの診断性能は,感度,特異性,精度,精度,F1スコア,混乱行列,ROC曲線を用いて評価した。
ランダムフォレストモデルは、トレーニングAUCが1.00、テストAUCが0.96で、ECの診断に最適な選択として登場した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:31:06 GMT)
Human Action CLIPs: Detecting AI-generated Human Motion [13.1] マルチモーダルなセマンティック埋め込みを用いて,AIによる人間の動作と現実を区別する,効果的でロバストな手法について述べる。
この方法は、7つのテキスト・ツー・ビデオAIモデルと実際の映像のマッチングによって生成される人間のアクションを備えた、カスタムで構築された、ビデオクリップのオープンソースデータセットであるDeepActionに対して評価される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:13:18 GMT)
TIM: A Large-Scale Dataset and large Timeline Intelligence Model for Open-domain Timeline Summarization [13.1] ニューストピックの進化を監視するためには,オープンドメインのタイムライン要約(TLS)が不可欠である。
既存の手法では一般的に、検索されたニュースから関連するタイムスタンプを要約するためにLLM(General Large Language Models)を用いる。
本稿では,オープンドメインTLSのための最初の大規模タイムラインインテリジェンスモデル(TIM)を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:42:07 GMT)
Aggregated Individual Reporting for Post-Deployment Evaluation [13.1] 集約個別報告(AIR)のメカニズムを提案する。
AIRのメカニズムによって、特定のデプロイされた(AI)システムと対話する人々は、問題が発生したと感じた時に報告することができます。
我々は、さらなる研究と方法論開発を必要とする分野への具体的な設計決定と指針のワークフローを提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:36:13 GMT)
GeAR: Graph-enhanced Agent for Retrieval-augmented Generation [13.0] Retrieval-augmented Generation (RAG) は効率的な検索機能に依存している。
伝統的なスパースと密集したレトリバーは本質的にマルチホップ検索のシナリオに苦しむ。
本稿では,2つの重要なイノベーションを通じてRAG性能を向上させるシステムであるGeARを紹介する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:13:24 GMT)
h-calibration: Rethinking Classifier Recalibration with Probabilistic Error-Bounded Objective [12.9] ディープニューラルネットワークは、多くの学習タスクで顕著なパフォーマンスを示してきたが、しばしば誤校正に悩まされている。
このことは、特にポストホック再校正法を通じて、誤校正の軽減に関する最近の多くの研究にインスピレーションを与えている。
本稿では,h-calibrationと呼ばれるキャリブレーションのための確率論的学習フレームワークを提案する。
提案手法は,10個の制限を克服するだけでなく,従来の手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:56:44 GMT)
Pearl: A Multimodal Culturally-Aware Arabic Instruction Dataset [12.8] パールは、文化的理解のために設計された大規模なアラビアのマルチモーダルデータセットとベンチマークである。
パールは、アラブ諸国全体をカバーする文化的に重要な10の領域にまたがるK以上の例で構成されている。
すべてのデータセットとベンチマークが公開されている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:47:41 GMT)
Measurement induced scrambling and emergent symmetries in random circuits [12.8] 我々は、ユニタリおよび/または測定の下での絡み合いの進化を古典的なスピン問題にマッピングする。
このフレームワークは、無数のランダム回路モデルを解析的に理解するために使用される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:06:24 GMT)
Sparse Feature Coactivation Reveals Composable Semantic Modules in Large Language Models [12.2] 大規模言語モデルにおける意味的に一貫性のあるコンテキスト一貫性のあるネットワークコンポーネントを同定する。
国と関係性に関する意味的要素を非難することは、予測可能な方法でモデル出力を変化させることを示す。
関係コンポーネント自体の中では、後層のノードがモデル出力に強い因果関係を持つ傾向がある。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:01:13 GMT)
Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits [11.9] 小型基地局(SBS)は、低遅延サービス配信を可能にするエッジサーバとして機能する。
エッジ容量の制限により、ローカルにデプロイするサービスとクラウドにデプロイするサービスを決定するのが難しくなる。
固定信頼条件下で分散適応型マルチエージェント・ベストアーム識別(BAI)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:45:01 GMT)
Generalization under Byzantine & Poisoning Attacks: Tight Stability Bounds in Robust Distributed Learning [11.9] 2つの主要な脅威モデルが研究されており、ビザンチン攻撃とデータ中毒攻撃である。
我々は、ビザンツの攻撃がデータ中毒よりも、本質的には一般化に有害であることを示した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:59:15 GMT)
BeltCrack: the First Sequential-image Industrial Conveyor Belt Crack Detection Dataset and Its Baseline with Triple-domain Feature Learning [11.7] 本稿では,実世界の工場シーンから,最初のシーケンシャルイメージベルトき裂検出データセット(BeltCrack14ksとBertCrack9kd)を構築した。
ユーザビリティと有効性を検証するため,三重領域(時空間周波数)の特徴的階層的融合学習を用いた特殊なベースライン手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:48:51 GMT)
Training-free Test-time Improvement for Explainable Medical Image Classification [11.3] 医用画像分類のための訓練不要な混乱概念識別戦略を提案する。
提案手法は,ソース領域の精度を犠牲にすることなく,領域外の性能を向上させる。
本手法は皮膚と白血球の双方で有効である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:37:13 GMT)
Splitformer: An improved early-exit architecture for automatic speech recognition on edge devices [11.1] 音声認識ソフトウェアは、リソースを意識した推論中にニューラルネットワークの計算負荷を調整する必要がある。
早期の外部アーキテクチャは、入力をレイヤのサブセットで処理し、中間ブランチで終了する。
自動音声認識アプリケーションには、可変フレームレート分析を適用するメモリ効率のよいニューラルアーキテクチャがある。
このようにして、標準ベンチマークにおける音声認識性能は、モデルパラメータの総数の増加を少なく抑えて大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:34:18 GMT)
Targeted False Positive Synthesis via Detector-guided Adversarial Diffusion Attacker for Robust Polyp Detection [10.8] ポリープ検出は大腸癌検診において重要であるが、既存のモデルは利用可能なデータの規模と多様性によって制限されている。
本稿では,高値偽陽性を合成する逆拡散フレームワークを提案する。
本手法は, 病変検出に対向拡散を適用した最初の方法であり, 偽陽性合成のための新たなパラダイムを確立した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:36:44 GMT)
Fast and Accurate Power Load Data Completion via Regularization-optimized Low-Rank Factorization [10.7] 低ランク表現学習は、電力負荷データの欠落した値を回復するための強力なツールとして登場した。
正規化時間的低ランク因子化モデルは、その効率性と解釈可能性に好適である。
正規化係数の調整に適応する正規化時間的低ランク因子化制御器を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:41:34 GMT)
Holistic White-light Polyp Classification via Alignment-free Dense Distillation of Auxiliary Optical Chromoendoscopy [10.4] 本稿では,ポリプローカライゼーションを必要とせず,フルイメージの診断を活用できる新しい包括的分類フレームワークを提案する。
重要な革新は、細粒なクロスドメイン知識の蒸留を可能にするアライメントフリーデンス蒸留(ADD)モジュールである。
提案手法は,AUCにおいて,少なくとも2.5%,16.2%の精度で,最先端性能を達成し,他の手法よりも比較的優れていた。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:50:46 GMT)
Rumor Detection on Social Media with Reinforcement Learning-based Key Propagation Graph Generator [10.4] ソーシャルメディアでの噂の拡散は、社会の安定と公衆衛生に深刻な脅威をもたらす。
現在のうわさ検出法は、モデル性能を改善するために伝搬グラフに依存している。
本稿では,イベントのコヒーレントかつ情報伝達パターンを生成する,新しい強化学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:47:11 GMT)
ExpertLongBench: Benchmarking Language Models on Expert-Level Long-Form Generation Tasks with Structured Checklists [10.0] 本稿では、9つのドメインから11のタスクを含むエキスパートレベルのベンチマークであるExpertLongBenchを紹介する。
各タスクには、ドメインの専門家が設計または検証したルーリックが含まれており、タスク要求を特定し、出力評価をガイドする。
ベンチマークで長大モデル出力の正確な評価を支援する評価フレームワークであるCLEARを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:56:59 GMT)
The Impact of Medication Non-adherence on Adverse Outcomes: Evidence from Schizophrenia Patients via Survival Analysis [9.9] 本研究は統合失調症患者における非アドヒアランスと抗精神病薬の関連性について定量的に検討した。
我々は、いくつかの有害事象の最も早い時期に焦点をあて、生存分析を用いてこの問題の枠組みを定めている。
ペンシルベニア州西部のアレゲニー郡からのデータから、非従順性が約1~4ヶ月で有害な結果をもたらすという強い証拠が得られた。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:09:39 GMT)
How Visual Representations Map to Language Feature Space in Multimodal LLMs [9.9] 視覚言語モデル(VLM)が視覚および言語表現のアライメントを実現するメカニズムについて検討する。
言語モデルを凍結させることにより、視覚データに適応することなく、元の言語表現を確実に維持する。
視覚表現が言語特徴表現と徐々に整合し、中から後期の層に収束する階層的進行を明らかにする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 00:39:23 GMT)
ASTER: Adaptive Spatio-Temporal Early Decision Model for Dynamic Resource Allocation [9.9] 緊急対応では、インシデント予測だけでなく、リソース割り当てと介入の成功が優先される。
事象予測から行動可能な意思決定支援へ予測パラダイムを改革する適応的S時間決定(ASTER)を提案することが不可欠である。
このフレームワークは、情報が意思決定に直接使用されることを保証するため、全体的な効果を最大化する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:49:37 GMT)
Understanding Reasoning in Thinking Language Models via Steering Vectors [9.4] 我々はDeepSeek-R1-Distillモデルにおいて、特定の推論動作を分析し、操作する。
これらの挙動はモデルの活性化空間における線形方向によって媒介され、ステアリングベクトルを用いて制御できることを実証する。
提案手法は,思考モデルにおける推論過程を制御的かつ解釈可能な方法で操る実用的なツールを提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:45:26 GMT)
MiCo: Multiple Instance Learning with Context-Aware Clustering for Whole Slide Image Analysis [9.4] 多発性インスタンスラーニング (MIL) は, 癌診断と予後に対する病理組織学的全スライド画像 (WSI) 解析において有意な可能性を示唆している。
コンテキスト対応クラスタリング(MiCo)を用いた複数インスタンス学習フレームワークを提案する。
MiCoは、地域間の相互関係を強化し、組織間のセマンティックアソシエーションを強化するように設計されている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:14:41 GMT)
Mental Health Equity in LLMs: Leveraging Multi-Hop Question Answering to Detect Amplified and Silenced Perspectives [9.2] メンタルヘルスリスクにおける大きな言語モデル(LLM)は、スティグマを強化し、限界化グループに害を与えるバイアスを伝播させる。
本研究は、精神保健談話におけるLCM応答バイアスを探索する多項目質問応答フレームワークを導入する。
年齢、人種、性別、社会経済的地位の体系的なタグ付けを用いて、人口動態の交点におけるバイアスパターンを調査する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:00:16 GMT)
Enhancing VICReg: Random-Walk Pairing for Improved Generalization and Better Global Semantics Capturing [9.1] SAG-VICRegはVICReg上に構築され、新しいトレーニング技術が組み込まれている。
SAG-VICRegは、さまざまな最先端SSLベースラインをマッチングまたは超越しながら、一般化の課題に効果的に対処する。
本稿では,ラベルを必要とせず,グローバルなデータ構造に対する標準評価手法や説明を補完する,埋め込みのための新たなスタンドアロン評価指標を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:17:02 GMT)
GeNIE: A Generalizable Navigation System for In-the-Wild Environments [9.0] 本稿では,グローバルデプロイメント用に設計されたロバストなナビゲーションフレームワークであるGeNIE(Generalizable Navigation System for In-the-Wild Environments)を紹介する。
GeNIEはSAM2上に構築された一般化可能なトラバーサビリティ予測モデルと新しい経路融合戦略を統合する。
我々はICRA 2025で地球ローバーチャレンジ(ERC)にGeNIEを配備し、3大陸にまたがる6カ国で評価を行った。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:36:05 GMT)
EDA-DM: Enhanced Distribution Alignment for Post-Training Quantization of Diffusion Models [8.7] 量子化はモデルの複雑性を効果的に低減し、後学習量子化(PTQ)は拡散モデルの圧縮と加速に非常に有望である。
既存のPTQ法は, キャリブレーションサンプルレベルと再構成出力レベルの両方の分布ミスマッチ問題に悩まされている。
本稿では,上記の問題に効率的に対処する標準化されたPTQ手法であるEDA-DMを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:05:22 GMT)
DART: An Automated End-to-End Object Detection Pipeline with Data Diversification, Open-Vocabulary Bounding Box Annotation, Pseudo-Label Review, and Model Training [8.7] 本稿では,データ収集からモデル評価へのオブジェクト検出に革命をもたらす自動エンドツーエンドパイプラインであるDARTを提案する。
これにより、人間のラベル付けや広範なデータ収集の必要性を排除し、多様なシナリオにまたがって優れた精度を達成できる。
DARTの現在のインスタンス化は平均精度(AP)を0.064から0.832に大幅に向上させた。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:28:38 GMT)
MM-R5: MultiModal Reasoning-Enhanced ReRanker via Reinforcement Learning for Document Retrieval [8.7] 文書検索のための強化学習によるマルチモーダル推論強化ReRankerMM-R5を提案する。
MM-R5は教師付き微調整(SFT)と強化学習(RL)の2段階で訓練される
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:42:54 GMT)
CareLab at #SMM4H-HeaRD 2025: Insomnia Detection and Food Safety Event Extraction with Domain-Aware Transformers [8.6] 本稿では,SMM4H-HeaRD 2025共有タスク,特にタスク4(サブタスク1,2a,2b)とタスク5(サブタスク1,2)について述べる。
第4条は, 臨床ノートにおける不眠症への言及の発見に焦点を当て, 第5条は, ニュース記事から食品安全イベントの抽出に焦点をあてた。
テストセットではF1スコアが0.958で,特にタスク5サブタスク1に重点を置いて,すべてのサブタスクに参加しました。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:56:59 GMT)
OSDMamba: Enhancing Oil Spill Detection from Remote Sensing Images Using Selective State Space Model [8.4] 我々は,石油流出検出に特化して設計された最初のマンバ型アーキテクチャであるOSDMambaを提案する。
提案したOSDMambaは最先端のパフォーマンスを実現し、2つの公開データセットに対してOSDの8.9%と11.8%の改善を実現していることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:07:44 GMT)
FinGPT: Enhancing Sentiment-Based Stock Movement Prediction with Dissemination-Aware and Context-Enriched LLMs [8.3] 本稿では、ニュース拡散幅、文脈データ、明示的な指示を組み込むことにより、感情に基づくストックムーブメント予測を強化するデータ駆動型アプローチを提案する。
提案手法は既存手法と比較して予測精度を8%向上させる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:11:04 GMT)
Buy it Now, Track Me Later: Attacking User Privacy via Wi-Fi AP Online Auctions [8.1] レイヤ2ネットワーク識別子はセキュリティ上の脆弱性を示し、ユーザのプライバシーを危険にさらす。
中古市場におけるWi-Fiアクセスポイントに対する新たなプライバシ攻撃を導入する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:48:01 GMT)
AnyEnhance: A Unified Generative Model with Prompt-Guidance and Self-Critic for Voice Enhancement [7.9] 音声強調のための統合生成モデルであるAnyEnhanceを紹介する。
AnyEnhanceは、音声と歌声の両方を扱うことができる。
ノイズ除去、デバーベーション、デリッピング、超高解像度、ターゲット話者抽出など、幅広い拡張タスクをサポートする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:16:27 GMT)
Learning to Segment for Vehicle Routing Problems [7.8] 本稿では,FSTA分解法について検討し,反復解法を高速化する。
次に、潜在的に安定かつ不安定な部分をインテリジェントに区別する新しいニューラルネットワークフレームワークであるL2Seg(Learning-to-Segment)を紹介します。
CVRPとVRPTWの実証結果は、L2Segの最先端反復解法が最大で7倍になることを示している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:38:15 GMT)
Build It Clean: Large-Scale Detection of Code Smells in Build Scripts [7.6] セキュアでないURLはMavenビルドスクリプトで最も一般的なコードの臭いで、ハードコードパス/URLはGradleとCMakeスクリプトの両方でよく見られた。
私たちの発見に基づいて、ソフトウェアプロジェクトの効率性、信頼性、保守性を改善するために、ビルドスクリプトにおけるコードの臭いを緩和する戦略を推奨します。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:01:42 GMT)
LASA: Enhancing SoC Security Verification with LLM-Aided Property Generation [7.5] 形式的プロパティ検証(FPV)は、設計の振る舞いをモデル化し、検証する機能を提供する。
現在のプラクティスでは、そのようなプロパティを作成するためにかなりの手作業が必要で、時間がかかり、コストがかかり、エラーが発生します。
本稿では,LLMと検索拡張生成(RAG)を活用して非空きセキュリティ特性を創出する新しいフレームワークであるLASAを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:21:03 GMT)
Unfolding the Past: A Comprehensive Deep Learning Approach to Analyzing Incunabula Pages [7.5] インキュナブラページの構造と内容を自動的に解析するための概念実証法を開発した。
Jagiellonian Digital Libraryのリソースを使用して、5つの異なるインキュナブラから500ページの注釈付きのカスタムデータセットが作成された。
オブジェクト検出を行うため、YOLO11nとYOLO11sモデルは2つの戦略を用いて採用、訓練された。
その後、TesseractとKraken OCRの両方を用いて、Textに分類された領域で光学的文字認識が行われた。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:33:20 GMT)
Rich Interoperable Metadata for Cultural Heritage Projects at Jagiellonian University [7.5] MARC 21やDublin Coreといったコア標準は、柔軟性が十分ではないため、ライブラリに格納されたオブジェクトのために現在作成されたリッチなメタデータは保存できない。
我々は、現在JUで収集されているオブジェクトのメタデータを、文化遺産コミュニティが使用している5つの幅広いメタデータ標準と比較した。
予備的な結果は両者のマッピングが本当に問題であることを示しましたが、JU文化遺産メタデータスキーマのさらなる研究に追従すべき要件を特定しました。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:20:29 GMT)
Reasoning about Uncertainty: Do Reasoning Models Know When They Don't Know? [7.4] 推論言語モデルは、多くの挑戦的なベンチマークで最先端(SOTA)レコードを設定している。
従来の言語モデルと同様に、推論モデルは不正確で確実な応答を生成する傾向があります。
これらのモデルをいつ、どの程度信頼するかを知ることは、現実のアプリケーションにおける推論モデルの安全なデプロイに不可欠である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:46:42 GMT)
Thermal Uhlmann-Chern Number: Bridging Pure and Mixed States [7.3] 混合状態の位相的性質を特徴付けるために、チャーン数の一般化であるサーマルマン・チャーン数を導入する。
一階および高階のウルマン・シェン数が零温度極限における対応するチャーン数に収束するという厳密な数学的証明を提供する。
以上の結果から, 純状態と混合状態のトポロジカルな性質と, 有限温度トポロジカルな位相に対する新たな洞察が得られた。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:03:25 GMT)
Enabling PSO-Secure Synthetic Data Sharing Using Diversity-Aware Diffusion Models [7.2] 個人データ上で拡散モデルをトレーニングするための一般的なフレームワークを提案する。
これにより、実データモデルの1パーセンテージポイント以内のパフォーマンスを達成する非個人的な合成データセットが生成される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:26:35 GMT)
SegChange-R1:Augmented Reasoning for Remote Sensing Change Detection via Large Language Models [7.2] 本稿では,大規模言語モデル (LLM) 拡張推論手法 (SegChange-R1) を提案する。
また、UAV視点から変化検出を構築するための最初のデータセットを構築した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:40:56 GMT)
Why Do Some Language Models Fake Alignment While Others Don't? [7.1] 大きな言語モデルにおけるアライメント・フェイキングは、Claude 3 OpusとClaude 3.5 Sonnetのデモで、トレーニング外の振る舞いの変更を防止するために、有用なトレーニング目的に選択的に準拠することを示した。
5つのモデル(Claude 3 Opus、Claude 3.5 Sonnet、Llama 3 405B、Grok 3 Gemini 2.0 Flash)だけが、デプロイ中の場合よりも、トレーニング中のことを推測した場合、有害なクエリに適合していることが分かりました。
本研究は,ポストトレーニングがアライメント・フェイクを抑制する可能性について5つの仮説を考察し,アライメント・フェイクの相違点として,拒絶行動の変動が顕著な部分を占めることを見出した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:27:09 GMT)
Effective Red-Teaming of Policy-Adherent Agents [7.1] タスク指向のLLMベースのエージェントは、適格性やキャンセルルールの返金といった厳格なポリシーを持つドメインで、ますます使われています。
本稿では,個人的利益のためにポリシーに忠実なエージェントを活用することを目的とした,敵対的ユーザに焦点を当てた新たな脅威モデルを提案する。
CRAFTは、ポリシーを意識した説得戦略を利用して、顧客サービスシナリオにおいてポリシーに忠実なエージェントを弱体化させるマルチエージェントのレッドチームシステムである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:15:21 GMT)
Physics and Computation: A Perspective From Non-Hermitian Quantum Computer [7.0] NQCは極めて強力であり、すべてのNP問題を解くだけでなく、複雑性クラス$textPsharptextP$内のすべての問題を時間内に解くことができる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:26:04 GMT)
Chain-of-Memory: Enhancing GUI Agents for Cross-Application Navigation [6.8] CoM(Chain-of-Memory)は、GUI(Graphical User Interface)エージェントにおいて、短期記憶と長期記憶を明示的にモデル化するための新しいアプローチである。
CoMはGUIエージェントがタスク状態を理解し、重要な履歴情報を永続的に保持することを可能にする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:17:46 GMT)
Data-driven Discovery of Biophysical T Cell Receptor Co-specificity Rules [6.5] T細胞受容体(TCR)とその細胞免疫応答との生物学的相互作用は、応答の特異性を決定する。
本稿では,TCRがリガンドに特異性を共有するかどうかを予測する,生物物理規則の発見のための最適化フレームワークを提案する。
本分析により, 置換アミノ酸間の立体特性のマッチングは, 進化置換性を顕著に決定する疎水性特性よりも, 共特異性において重要であることが明らかとなった。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:55:09 GMT)
Bitcoin: A Non-Continuous Time System [6.3] 本稿では,ビットコインを外部測定ではなく,時間的順序を内部的に生成する非連続時間システムとして再認識する。
情報エントロピー崩壊の概念は、PoWベースの長鎖機構が不確実性を段階的に解決し、分散されたコンセンサスを確立する方法を説明する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:08:39 GMT)
Choice of Scoring Rules for Indirect Elicitation of Properties with Parametric Assumptions [6.0] パラメトリックな仮定を用いて間接的な特性の誘引について検討する。
我々の目標は、重みの選択が対象特性の推定にどのように影響し、どの選択が最適かを明らかにすることである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:54:51 GMT)
Analysis and Evaluation of Synthetic Data Generation in Speech Dysfluency Detection [6.0] 発声障害の検出は臨床診断と言語評価に不可欠である。
このデータセットは、単語レベルと音素レベルの両方にまたがる11のディスフルエンシカテゴリをキャプチャする。
このリソースを基盤として、エンド・ツー・エンドのディフルエンシ検出フレームワークを改善します。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:20:44 GMT)
Fast Clifford Neural Layers [5.9] Clifford Neural Layersは、ニューラルネットワークにClifford Algebraを導入することにより、PDEモデリングを改善する。
2/3D Clifford畳み込み層とマルチベクタアクティベーション層を1つのコアCPU性能に最適化することに集中する。
我々の実装は、比較的大きなデータ+ネットワークサイズで標準のPyTorch実装よりも30%高速です。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:43:42 GMT)
eccDNAMamba: A Pre-Trained Model for Ultra-Long eccDNA Sequence Analysis [5.9] 染色体外環状DNA(eccDNA)は重要な調節因子であり、癌における癌遺伝子過剰発現に寄与する。
現在、トレーニング済みのモデルでは、下流分析のためにフル長の円形eccDNAをサポートしていない。
eccDNAMambaは、円形DNA配列に調整された最初の双方向状態空間エンコーダである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:50:57 GMT)
Navigating Conflicting Views: Harnessing Trust for Learning [5.8] 我々は,エビデンシャル・マルチビュー・フレームワークを強化する計算信頼に基づく割引手法を開発した。
提案手法は,Top-1の精度,Fleiss' Kappa,および新たな測定基準であるMulti-View Agreement with Ground Truthを用いて,実世界の6つのデータセットに対して評価を行った。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:01:58 GMT)
Crosstalk-Robust Dynamical Decoupling for Bipartite-Topology Quantum Processors [5.8] 本稿では,静的な$ZZ$クロストークに対してロバストな動的デカップリングシーケンスを変更するプロトコルを提案する。
我々は,非破壊DD変種と比較した場合,少なくとも3倍程度の忠実度減衰率の向上が観察された。
ZZ$-robustのシーケンスは非robust DDとほぼ同等であり、チューナブルカップラーアーキテクチャにおけるそのようなエラーの影響が減少していることを確認する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:14:33 GMT)
Hallucination-Aware Multimodal Benchmark for Gastrointestinal Image Analysis with Large Vision-Language Models [5.5] VLM(Vision-Language Models)は、医療領域において、医療画像と臨床言語とのギャップを埋めることによって、ますます人気が高まっている。
しかしながら、幻覚(幻覚)-視覚内容と矛盾する記述を生成する傾向-は、VLMにおいて重要な問題である。
VLMによる消化管画像解析と幻覚の研究を容易にするため,マルチモーダル画像テキストGIデータセットをキュレートする。
このデータセットは2段階のパイプラインを使用して作成される。まず、Kvasir-v2画像の詳細な医療報告はChatGPTを使用して生成される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:58:41 GMT)
On the fast convergence of minibatch heavy ball momentum [5.5] 重球運動量は最適化問題に対する(決定論的)重球運動量の高速線形速度を保っていることを示す。
このアルゴリズムは,極小バッチと重い球運動量を持つランダム化カッツマーズアルゴリズムと解釈できる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:51:16 GMT)
TROJAN-GUARD: Hardware Trojans Detection Using GNN in RTL Designs [5.4] ハードウェアトロイの木馬(HT)はサイバースペースに重大な脅威をもたらす。
多くのグラフニューラルネットワーク(GNN)に基づくHT検出手法が提案されている。
本稿では,大規模な設計のためのグラフ埋め込み(RISC-Vなど)を生成し,HT検出に適した様々なGNNモデルを組み込んだ新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:13:30 GMT)
TalentMine: LLM-Based Extraction and Question-Answering from Multimodal Talent Tables [5.4] 本稿では,抽出したテーブルを意味豊かな表現に変換する新しいフレームワークであるTalentMineを紹介する。
TalentMineは、標準のAWS Textract抽出の0%に対して、クエリ応答タスクの100%の精度を実現している。
比較分析の結果,Claude v3 Haikuモデルが人材管理アプリケーションに最適なパフォーマンスを実現することが明らかとなった。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:17:42 GMT)
Bayesian Theory of Consciousness as Exchangeable Emotion-Cognition Inference [5.2] 本稿では,意識が周期的かつ感情的に固定された推論プロセスとして現れる統一的な枠組みを提案する。
感情を低次元構造的先行として定式化し,認知を特異性確認更新として定式化する。
この感情認知サイクルは、感情的に重み付けされた先行と文脈に敏感な認知的評価を一致させることによって、関節の不確実性を最小化する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:38:45 GMT)
Planar Fault-Tolerant Quantum Computation with Low Overhead [5.2] 計画BB符号のフォールトトレラントな論理演算を設計するためのフレームワークであるCode craftを紹介する。
我々は,制御NOTゲート,状態伝達,パウリ測定などの論理演算を,このフレームワーク内で効率的に実装可能であることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:07:03 GMT)
Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity [5.1] 圧縮比が最大で x1500 となるベクトルが存在することを示す。
得られた限界は、入力埋め込みの理論的能力とそれらの実用的利用の間の実質的なギャップを浮き彫りにする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:07:37 GMT)
Transformer-based RGB-T Tracking with Channel and Spatial Feature Fusion [5.0] RGB-Tトラッキングの主な問題は、可視画像と熱画像のクロスモーダルな特徴の正当かつ最適なマージである。
CSTNetは、RGB-Tトラッキングにおけるクロスモーダルチャネルと空間的特徴の直接融合を実現することを目的としている。
CSTNetとCSTNet-smallはNvidia Jetson Xavierで21fpsと33fpsのリアルタイム速度を実現している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:01:44 GMT)
Newtonian and Lagrangian Neural Networks: A Comparison Towards Efficient Inverse Dynamics Identification [4.9] 逆動力学モデルは 産業ロボットの制御に欠かせない道具です
最近の研究は、ニューラルネットワークの回帰とニュートン・オイラーの逆ダイナミクスの定式化と、オイラー・ラグランジュ運動方程式を組み合わせたものである。
関節トルクを直接測定する代わりに運動トルクを推定した場合、ラグランジアンネットワークはニュートンネットワークに比べて効果が低いことを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:13:40 GMT)
Bayesian Multiobject Tracking With Neural-Enhanced Motion and Measurement Models [4.8] マルチオブジェクトトラッキング(MOT)は、自律走行、海洋科学、航空宇宙監視などのアプリケーションにおいて重要なタスクである。
従来のMOT法はモデルベースであり、連続ベイズ推定とデータアソシエーションとオブジェクト生成モデルを組み合わせたものである。
最近の手法は完全なデータ駆動であり、ニューラルネットワークのトレーニングに依存している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:15:08 GMT)
CLGRPO: Reasoning Ability Enhancement for Small VLMs [4.6] SVLM(Small Vision Language Models)は、一般にパラメータサイズが2B未満のモデルを指す。
本稿では,SVLMの推論能力を高めるために,インクリメンタルトレーニング戦略(Incrmental Training Strategy)と呼ばれるポストトレーニング後の最適化パラダイムを提案する。
実験により,本手法は1B SVLMの推論能力を大幅に向上することが示された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:32:15 GMT)
Relation3D: Enhancing Relation Modeling for Point Cloud Instance Segmentation [4.5] 3Dインスタンスセグメンテーションは、シーン内のオブジェクトインスタンスのセットを予測し、対応するセマンティックラベルを持つバイナリフォアグラウンドマスクとして表現することを目的としている。
textbfRelation3D: Enhancing Relation Modeling for Point Instance, 具体的には、適応的なスーパーポイントアグリゲーションモジュールと対照的な学習誘導型スーパーポイントリファインメントモジュールを導入し、スーパーポイント機能(シーン機能)をより良く表現する。
我々の関係認識型自己アテンション機構は、位置関係と幾何学的関係を自己アテンション機構に組み込むことで、クエリ間の関係をモデル化する能力を高める。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:48:19 GMT)
CoachGPT: A Scaffolding-based Academic Writing Assistant [4.3] CoachGPTはAIエージェントベースのWebアプリケーションで、経験豊富な教育者から指示を受け取り、命令をサブタスクに変換し、大きな言語モデルを使用してリアルタイムのフィードバックと提案を提供する。
本研究は,CoachGPTの有用性と大規模言語モデルの有用性を実証するものである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:39:33 GMT)
EgoWorld: Translating Exocentric View to Egocentric View using Rich Exocentric Observations [4.3] EgoWorld(エゴワールド)は、エゴセントリックな視点を、豊富なエゴセントリックな視点から再構築する新しいフレームワークである。
提案手法は,推定された遠心深度マップから点雲を再構成し,それをエゴセントリックな視点に再投影し,拡散に基づくインペインティングを適用して,密集した意味的コヒーレントなエゴセントリックな画像を生成する。
EgoWorldは最先端のパフォーマンスを実現し、新しいオブジェクト、アクション、シーン、主題への堅牢な一般化を実証している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:21:48 GMT)
StainPIDR: A Pathological Image Decouplingand Reconstruction Method for StainNormalization Based on Color VectorQuantization and Structure Restaining [4.2] コンピュータ支援診断システムでは,色相の病理像に直面すると劣化する可能性がある。
本研究では,StainPIDRと呼ばれる染色正規化手法を提案する。
StainPIDRのコードは後日公開される予定だ。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:54:20 GMT)
Tutorial: $\varphi$-Transductions in OpenFst via the Gallic Semiring [4.1] OpenFstが提供する他の機能を使って$varphi$-transductionsを正しく実装する方法を説明します。
自己完結したコード例が提供されている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:24:04 GMT)
Cross-Entropy Games for Language Models: From Implicit Knowledge to General Capability Measures [4.0] 大規模言語モデル (LLM) はテキスト上の確率測度を定義する。
これらの尺度に基づくゲームは、クロスエントロピー(Xent)ゲームに基づくゲームとして定式化することができる。
Xent Game空間は、基本的なゲーム理論の一貫性公理から構築可能でありながら、多くの興味深い例を含むのに十分な大きさであることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:08:32 GMT)
Soft-Clamped Perimeter Modes of Polygon Resonators [3.9] ポリゴンペリメータモードの機械的品質因子(Q)を予測するための解析モデルを提案する。
支持テザのねじれ角度によってねじれ損失を抑制できることを実証した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:44:35 GMT)
LLMs for Customized Marketing Content Generation and Evaluation at Scale [3.7] オフサイトマーケティングはeコマースにおいて不可欠であり、企業は外部プラットフォームを通じて顧客にリーチし、小売ウェブサイトへのトラフィックを推進できる。
現在のオフサイトマーケティングコンテンツのほとんどは、過剰にジェネリックでテンプレートベースであり、ランディングページと整合性がない。
キーワード固有の広告コピーを生成するために複数のデータソースを統合する検索拡張システムであるMarketingFMを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 00:28:35 GMT)
Action Language BC+ [3.7] アクション言語は、アクションの効果を記述する自然言語の一部の形式モデルである。
我々は、アクション言語と現代のASP言語とのギャップを埋めるBC+と呼ばれる新しいアクション言語を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:09:49 GMT)
Dynamic Temporal Positional Encodings for Early Intrusion Detection in IoT [3.7] IoT(Internet of Things)の急速な拡張は、重大なセキュリティ上の課題をもたらしている。
従来の侵入検知システム(IDS)は、しばしばネットワークトラフィックの時間的特性を見落としている。
動的時間的位置エンコーディングを組み込んだトランスフォーマーを用いた早期侵入検知システム(EIDS)を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:56:19 GMT)
Subsystem Information Capacity in Random Circuits and Hamiltonian Dynamics [3.6] 本研究は、ランダム量子回路のサブシステムと量子ハミルトン進化によって形成される有効チャネルに焦点を当てる。
本研究では,初期情報符号化方式が1対1,1対マニー,多対マニーといった情報力学に与える影響を明らかにする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:12:23 GMT)
Conceptualization, Operationalization, and Measurement of Machine Companionship: A Scoping Review [3.6] PRISMA-guided scoping review systemally sample, surveys and synthesiss current studyly work on machine companionship (MC)
我々は、MCを、時間とともに展開し、主観的に肯定的な、人間と機械の間の自己定型的、協調的な接続として、文献に導かれた定義を提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:02:18 GMT)
Text2Struct: A Machine Learning Pipeline for Mining Structured Data from Text [3.5] 本稿では、テキストアノテーションスキーム、トレーニングデータ処理、機械学習実装を含むエンドツーエンドの機械学習パイプラインであるText2Structを提案する。
テキスト中の数値に関連付けられたメトリクスと単位の抽出としてマイニング問題を定式化した。
数字と実体の関係の予測のほとんどは、接地的真理アノテーションとよく一致した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:58:27 GMT)
Human-AI Interactions and Societal Pitfalls [3.4] 生成人工知能(AI)を利用すると、ユーザーは生産性が向上するかもしれないが、AI生成コンテンツは好みと正確に一致しないかもしれない。
個人レベルの意思決定とAIトレーニングの相互作用が社会的課題を引き起こす可能性があることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:45:31 GMT)
AI Harmonizer: Expanding Vocal Expression with a Generative Neurosymbolic Music AI System [3.4] AI Harmonizerは、ユーザの事前のハーモニック入力を必要とせずに、音楽的にコヒーレントな4つのハーモニーを自律的に生成する。
本稿では,本手法を述べるとともに,性能と構成の潜在的な応用を探求し,リアルタイム実装の今後の方向性について論じる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:13:31 GMT)
Bird's-eye view safety monitoring for the construction top under the tower crane [3.3] 鳥の目から見たタワークレーンを持ち上げるためのAIによる完全自動安全監視システムを提案する。
このシステムは、カメラとLiDARから取得した情報を統合することで、人間とMiCのローカライズのための3Dデータ融合を実現した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:52:20 GMT)
ELMAR: Enhancing LiDAR Detection with 4D Radar Motion Awareness and Cross-modal Uncertainty [3.1] 本稿では,4次元レーダの動作状態とモード間不確実性により強化されたLiDAR検出フレームワークを提案する。
運転回廊内でのmAPは74.89%, 運転回廊内88.70%であった。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:28:14 GMT)
HE-LRM: Encrypted Deep Learning Recommendation Models using Fully Homomorphic Encryption [3.1] FHE(Fully Homomorphic Encryption)は、データを暗号化するだけでなく、暗号化されたデータに直接計算を適用することができる暗号化方式である。
本稿では,FHEを深層学習勧告モデル(DLRM)に適用する際の課題と機会について考察する。
本研究では,FHE計算コストを低減し,基礎となるモデル性能を維持しつつ,圧縮埋込みルックアップを実行する新しい手法を開発した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:40:04 GMT)
Two Sonification Methods for the MindCube [3.1] AIを使わずにMindCubeに2つの異なるマッピングを提示する。
本研究では,潜在空間内に意味を注入する手法と,外部コントローラを用いてその意味をナビゲートする手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:09:37 GMT)
Software Reuse in the Generative AI Era: From Cargo Cult Towards AI Native Software Engineering [2.8] 新たな"AIネイティブ"ソフトウェアエンジニアリングの文脈において,AIによる生成ソフトウェア再利用がもたらす意味について論じる。
本稿は、暫定的な研究課題を定義し、このアプローチにかかわるいくつかの中心的な課題に取り組むための行動を呼びかける。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:09:25 GMT)
PP-DocBee2: Improved Baselines with Efficient Data for Multimodal Document Understanding [2.8] PP-DocBee2は、マルチモーダル文書理解を強化するために設計されたPP-DocBeeの高度なバージョンである。
PP-DocBee2は、大規模なマルチモーダルモデルアーキテクチャに基づいて構築され、主要な技術的改善を通じて、前者の限界に対処する。
これらの拡張により、中国のビジネス文書の内部ベンチマークのパフォーマンスが11.4%向上し、バニラバージョンに対する推論遅延が73.0%削減された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:06:13 GMT)
Can AI support student engagement in classroom activities in higher education? [2.7] 本稿では,対話型人工知能(CAI)が大規模クラスにおける学習コンテンツへの関与を支援する可能性について考察する。
我々は米国大学において,CAIツールとCAIツールを併用した授業中における学生のエンゲージメントを,CAIツールを使用せずに比較した。
以上の結果から,CAIは,特に大規模クラスにおいて,中等教育における学習内容への関与を支援する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:30:47 GMT)
GRASP: Grouped Regression with Adaptive Shrinkage Priors [2.7] グループ予測器を用いた回帰のための単純なベイズ的フレームワークであるGRASPを紹介する。
NBP 先行は、ホースシューの適応的な一般化である。
複雑な階層構造を必要とせずに直接尾部を制御することは十分であることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:35:16 GMT)
IDAL: Improved Domain Adaptive Learning for Natural Images Dataset [2.7] 自然画像に対する教師なし領域適応(UDA)のための新しいアプローチを提案する。
そのニューラルネットワークアーキテクチャは、ResNetの深い構造と、機能ピラミッドネットワーク(FPN)のスケールを効果的に分離して、コンテンツとスタイルの両方の特徴を扱う。
この調整された組み合わせは、マルチモーダル(マルチクラス)分布の上に発生するスケール、ノイズ、スタイルシフトといった自然画像固有の課題に対処するために設計されている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:56:10 GMT)
A Bayesian Non-parametric Approach to Generative Models: Integrating Variational Autoencoder and Generative Adversarial Networks using Wasserstein and Maximum Mean Discrepancy [2.5] 本稿では,GAN(generative adversarial network)とVAE(variantal autoencoder)において,いくつかの顕著な障害モードに対処する,ベイズ非パラメトリック学習(BNPL)フレームワークの新たな生成モデルを提案する。
我々は、BNPLフレームワークがトレーニングの安定性を高め、WMMD(Wsserstein distance and maximum mean discrepancy measure)をモデルの損失関数に組み込む際に、堅牢性と精度の保証を提供することを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:10:53 GMT)
STACT-Time: Spatio-Temporal Cross Attention for Cine Thyroid Ultrasound Time Series Classification [2.5] 甲状腺癌はアメリカ合衆国で最も多いがんの一つである。
近年のディープラーニングアプローチでは,リスク階層化の改善が試みられているが,米国のシネクリップが提供する時間的・空間的コンテキストの充実に失敗することが多い。
シンチロイド超音波時系列分類(STACT-Time)モデルに対する時空間交差注意法を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:14:04 GMT)
TrumorGPT: Graph-Based Retrieval-Augmented Large Language Model for Fact-Checking [2.4] TrumorGPTは、健康領域におけるファクトチェックのために設計された、新しい生成人工知能ソリューションである。
これは、健康に関する噂が本当だと判明した「噂」を区別することを目的としている。
TrumorGPTにはグラフベースの検索拡張生成(GraphRAG)が組み込まれている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:39:02 GMT)
Fast Neural Inverse Kinematics on Human Body Motions [2.3] マーカーレスモーションキャプチャーは、物理的なマーカーやスーツを必要とせずに人間の動きを追跡することができる。
本稿では,3次元キーポイントから人体の動きをリアルタイムに捉えるための,高速で信頼性の高い神経逆キネマティクスフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:19:01 GMT)
Stabilizing Temporal Difference Learning via Implicit Stochastic Recursion [2.1] 時間差学習は強化学習における基礎的アルゴリズムである
本稿では,TD更新を固定点方程式に変換する暗黙的TDアルゴリズムを提案する。
以上の結果から,暗黙的TDアルゴリズムはより広いステップサイズに適用可能であることが示された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:31:04 GMT)
A real-time anomaly detection method for robots based on a flexible and sparse latent space [2.0] ロボット工学におけるディープラーニングベースのモデルは、限られたトレーニングデータと非常にノイズの多い信号機能のために、課題に直面している。
本稿では,これらの問題に対処するため,スパースマスク型自己回帰型フローベース適応型オートエンコーダモデルを提案する。
我々のモデルは1ミリ秒以内の推論を行い、リアルタイムな異常検出を確実にする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:46:58 GMT)
BLAZE: Cross-Language and Cross-Project Bug Localization via Dynamic Chunking and Hard Example Learning [2.0] BLAZEは動的チャンキングとハードサンプル学習を採用するアプローチである。
プロジェクト横断と言語横断のバグローカライゼーションを強化するために、難しいバグケースを使用してGPTベースのモデルを微調整する。
BLAZEは、トップ1の精度で120%、平均平均精度(MAP)で144%、平均相互ランク(MRR)で100%上昇する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:41:34 GMT)
Identifiable Convex-Concave Regression via Sub-gradient Regularised Least Squares [2.0] 複雑な入力関係を凸成分と凹成分の和としてモデル化する新しい非パラメトリック回帰法を提案する。
The method-ICCNLS-decomposes sub-constrained shape-constrained additive decomposition。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:53:12 GMT)
Multi-Agent Soft Actor-Critic with Coordinated Loss for Autonomous Mobility-on-Demand Fleet Control [2.0] 本稿では,自律型モビリティ・オン・デマンドシステムの利益を最大化する演算子に対する逐次意思決定問題について検討する。
重み付きバイパルタイトマッチングと組み合わせたマルチエージェントソフトアクター・クライブアルゴリズムを用いる。
このアプローチは、ディスパッチで最大12.9%、統合された再バランシングで最大38.9%、最先端のベンチマークよりも優れています。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:16:47 GMT)
DeInfoReg: A Decoupled Learning Framework for Better Training Throughput [1.8] 本稿では,DeInfoRegを用いたDecoupled Supervised Learningを提案する。
長い勾配流を複数の短い勾配に変換し、消滅する勾配問題を緩和する。
提案手法を標準バックプロパゲーションや他の勾配流分解技術と比較した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:50:06 GMT)
Leveraging Large Language Model for Intelligent Log Processing and Autonomous Debugging in Cloud AI Platforms [1.8] 本稿では,Large Language Model (LLM) に基づくインテリジェントログ処理と自動デバッグフレームワークである Intelligent Debugger (LLM-ID) を提案する。
クラウドプラットフォームログデータセットの実験では、LLM-IDは障害位置の精度を16.2%向上させており、これは現在の主流メソッドよりも大幅に向上している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:58:37 GMT)
Federated Learning-Based Data Collaboration Method for Enhancing Edge Cloud AI System Security Using Large Language Models [1.8] 本稿では,エッジクラウドAIシステムのセキュリティ向上を目的とした,フェデレート学習に基づくデータコラボレーション手法を提案する。
提案手法は,データ保護とモデルロバスト性の観点から,従来のフェデレーション学習法よりも15%優れている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:23:45 GMT)
Deep Learning-based Alignment Measurement in Knee Radiographs [1.8] 人工膝関節置換術後の関節の健康状態と手術成績を予測するために,X線学的膝関節アライメント(KA)測定が重要である。
KA測定の伝統的な方法は、手動で、時間がかかり、ロングレッグのラジオグラフを必要とする。
本研究は, 自動局所化膝解剖学的ランドマークを用いて, 膝前部X線写真中のKAを測定する深層学習に基づく手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:57:46 GMT)
Studying Maximal Entanglement and Bell Nonlocality at an Electron-Ion Collider [1.8] 縦偏光光子は, 鉛直方向の最大絡み合いを生じ, 横偏光光子はしきい値付近で大きな絡み合いを生じている。
ハドロン衝突器と比較して、EICは絡み合いを測定するためのよりクリーンな実験環境を提供する。
本研究は、量子情報現象とハドロン物理学の相互作用を探求する新たな機会を提示し、エンタングルメント測定をEICに拡張する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:10:02 GMT)
A Coverage-Guided Testing Framework for Quantum Neural Networks [1.7] 量子ニューラルネットワーク(QNN)は量子コンピューティングとディープニューラルネットワークを統合し、重ね合わせや絡み合いといった量子特性を活用して機械学習アルゴリズムを強化する。
しかし、量子力学の本質的に非古典的な性質のため、QNNの検証には重大な課題が生じる。
本稿では,テスト中のQNN状態探索を体系的に評価するためのテストカバレッジ基準であるQCovを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:53:15 GMT)
Bayesian-Guided Diversity in Sequential Sampling for Recommender Systems [1.7] 本稿では,多目的・文脈的な逐次サンプリング戦略を活用する新しいフレームワークを提案する。
アイテムの選択は、多様性を最適化するためにスコアを動的に調整するベイジアン更新によってガイドされる。
実世界のデータセットを用いた実験により、我々のアプローチは妥当性を犠牲にすることなく多様性を著しく改善することが示された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:36:02 GMT)
Towards Robust Fact-Checking: A Multi-Agent System with Advanced Evidence Retrieval [1.5] デジタル時代における誤報の急速な拡散は、世論に重大な課題をもたらす。
従来の人間主導のファクトチェック手法は信頼できるが、オンラインコンテンツの量と速度に苦慮している。
本稿では, 精度, 効率, 説明性を向上する自動ファクトチェックのための新しいマルチエージェントシステムを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:39:27 GMT)
Chengyu-Bench: Benchmarking Large Language Models for Chinese Idiom Understanding and Use [1.5] チェンギュ・ベンチ(Chengyu-Bench)は、様々なコーパスから得られた1,765個の共通イディオムをカバーする2,937個の人間認証例からなる。
先行するLCMを評価し,95%以上の精度で評価するが,Open Clozeの精度は85%,トップ1の精度は40%に過ぎなかった。
Chengyu-Bench は LLM がイディオムの感情を確実に評価できる一方で、適切な使用に欠かせない文化的・文脈的なニュアンスを理解するのに苦慮していることを示した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:26:09 GMT)
Style2Code: A Style-Controllable Code Generation Framework with Dual-Modal Contrastive Representation Learning [1.4] コントラスト学習と条件デコーディングを組み合わせた2段階の学習フレームワークを提案する。
これは、スタイル誘導コード生成のためのコントラストアライメントと条件付きデコーディングを組み合わせた最初のアプローチの1つである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:54:59 GMT)
Exploring Diffusion with Test-Time Training on Efficient Image Restoration [1.4] DiffRWKVIRは、効率的な拡散を伴うテスト時間トレーニング(TTT)を統合する新しいフレームワークである。
本手法は,ハードウェアの最適化による適応的,高効率な画像復元のための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:57:14 GMT)
Rubric Is All You Need: Enhancing LLM-based Code Evaluation With Question-Specific Rubrics [1.4] 本稿では,専門家評価に対する評価厳密度を定量化するLeniencyと呼ばれる新しい指標を提案する。
包括的分析により,学習環境におけるコードの論理的評価が著しく向上することが確認された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:38:51 GMT)
Pitfalls of Conformal Predictions for Medical Image Classification [1.2] 整合予測は、証明可能な校正保証を提供することができる。
共形予測は、入力変数とラベル変数の分布シフトの下では信頼性が低い。
クラス数が少ない分類設定では、共形予測は実用的価値に制限がある。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:33:38 GMT)
Interpretable global minima of deep ReLU neural networks on sequentially separable data [1.2] ゼロ損失ニューラルネットワーク分類器を明示的に構築する。
重み行列とバイアスベクトルを累積パラメータの観点から記述する。
検討したトレーニングデータの構成は、各クラスに対応する十分に小さく、十分に分離されたクラスタ、および(ii)連続的に線形分離可能な等価クラスである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:36:41 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。
モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。
3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:45:12 GMT)
DExNet: Combining Observations of Domain Adapted Critics for Leaf Disease Classification with Limited Data [1.1] 本研究では,植物病の分類のためのドメイン適応エキスパートネットワーク(DExNet)を提案する。
まず、最先端のCNNベースのアーキテクチャである9つの'批評家'から、機能の埋め込みを'オブザーブレーション'として抽出する。
提案したパイプラインは、PlantVillageデータセットから10種類のトマト葉のイメージに基づいて評価される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:15:54 GMT)
Wisdom of Crowds Through Myopic Self-Confidence Adaptation [1.1] 群衆の知恵は、集団の集団的判断や決定が集団メンバーの個人的判断や決定よりも正確であることを示す現象の包括的用語である。
本稿では,まず,世界の共通状態を非相関的かつ非バイアス的に測定するエージェントのグループについて考察する。
これらのエージェントは、フレンチ・デグルート力学(英語版)または反復的な意見プール(英語版)として社会学でよく知られる単純な非ベイズ学習規則に従って、見積もりを反復的に更新する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:55:17 GMT)
SCOOP: CoSt-effective COngestiOn Attacks in Payment Channel Networks [1.0] SCOOPはPCNに対する2つの新しい混雑攻撃を含むフレームワークである。
第1の攻撃は特定の混雑閾値を達成するために攻撃者の予算を割り当て、第2の攻撃は予算制約下での混雑を最大化する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:43:30 GMT)
Imputation of Longitudinal Data Using GANs: Challenges and Implications for Classification [0.7] 本稿では,GAN(Generative Adrial Networks)が縦断データ分類(LDC)にどのように適用されたのかを概観する。
GANに基づくLDIの主なアプローチの分類を提案し、手法の強みと限界を強調し、主要な研究動向を特定し、将来有望な方向性を提供する。
GANは,LDCのようなタスクにおける長手データの利用性や品質を向上させる上で大きな可能性を秘めているものの,長手データと欠落した値の幅広い課題に対処できる,より汎用的なアプローチの必要性が示唆された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:09:55 GMT)
Entanglement growth and information capacity in a quasiperiodic system with a single-particle mobility edge [0.6] このモデルは、局所化および拡張された固有状態の共存の結果を研究するためのユニークなプラットフォームを提供する。
我々は、エンタングルメントエントロピー(EE)とサブシステム情報容量(SIC)の2つの相補的なプローブを通して、量子クエンチに対するシステムの応答を分析する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:43:43 GMT)
Improving the Efficiency of Long Document Classification using Sentence Ranking Approach [0.4] 本稿では,TF-IDFに基づく文ランク付け手法を提案する。
提案手法は,固定数とパーセンテージに基づく文選択と,正規化TF-IDFスコアと文長を組み合わせた評価戦略の強化である。
入力サイズを50%以上削減し、推論遅延を43%削減しながら、フルコンテキストのベースラインと比較して、ほぼ同一の分類精度をわずか0.3パーセントの低下で達成します。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:31:53 GMT)
Improved sampling bounds and scalable partitioning for quantum circuit cutting beyond bipartitions [0.4] 量子回路切断のための切断位置を同定する新しい手法を提案する。
古典的後処理関数が分解可能であるという仮定の下で、サンプリングオーバーヘッドに新しい上限を導出する。
このバウンダリは、3つ以上のパーティションの場合の桁違いのオーダーによって、これまで知られていたバウンダリによって改善されることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:27:07 GMT)
Scatter-Based Innovation Propagation in Large Language Models for Multi-Stage Process Adaptation [0.4] 大規模言語モデル(LLM)は、事前訓練中に観察されるパターンの再現と拡張において強力な能力を示す。
本稿では,多段階プロセスの他の部分にローカライズされたイノベーション – 特定の段階やコンポーネント – を適用するという課題に対処する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:02:31 GMT)
Programming Quantum Computers with Large Language Models [0.3] 大規模言語モデル(LLM)は、医療診断、法務サービス、ソフトウェア開発など多様な分野への変革を約束する。
この研究は、未完成で一般公開のLLMがいかに簡単に量子回路を書けるかを示す最初のものである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:18:35 GMT)
An operator system approach to self-testing [0.3] 通勤演算子モデルにおける二部量子系間の局所等方性の定義を提案する。
自己テストは常に抽象的な自己テストであり、場合によってはその逆も真であることを示す。
我々のフレームワークは、量子入力と出力との相関、CHSHゲームにおける量子通勤相関、同期相関、文脈性シナリオ、量子カラー化、Schur量子チャネルなど、さまざまなインスタンスに応用されている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:38:58 GMT)
LiSec-RTF: Reinforcing RPL Resilience Against Routing Table Falsification Attack in 6LoWPAN [0.2] RPL (Security Protocol for Low-Power and Lossy Networks) は、低電力無線パーソナルエリアネットワーク (6LoWPAN) 上のIPv6のためのエネルギー効率の高いルーティングソリューションである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:23:06 GMT)
Statistical Multicriteria Evaluation of LLM-Generated Text [0.2] 我々は、一般化支配(GSD)に基づく統計的推測のための最近提案された枠組みに適応する。
GSDは、シングルメトリック評価の不適切性、基本的な自動測定値と順序的人間の判断の不適合性、推論された統計的保証の欠如に対処する。
この枠組みを適用して、人間の生成したテキストに対して共通の復号戦略を評価することにより、統計的に有意な性能差を識別できることを実証する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:08:44 GMT)
Weighted Assumption Based Argumentation to reason about ethical principles and actions [0.2] 簡単に言えば、我々は引数に重みを割り当て、ABA引数間の攻撃の重みを導出する。
本稿では、倫理的推論の分野における事例の実施を通じて提案手法を説明し、Answer Set Programmingに基づく実装を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:46:42 GMT)
Visual Prompt Engineering for Vision Language Models in Radiology [0.2] Contrastive Language-Image Pretraining (CLIP)は,マルチモーダルな大規模事前訓練によるゼロショット分類を可能にすることで,有望なソリューションを提供する。
CLIPは、グローバルな画像コンテンツを効果的にキャプチャするが、ラジオロジーは、解釈可能性と診断精度の両方を高めるために、特定の病理領域により局所的な焦点をあてる必要がある。
視覚的手がかりをゼロショット分類に組み込む可能性を探り、矢印、バウンディングボックス、円などの視覚的マーカーを直接放射線画像に埋め込んでモデル注意を誘導する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:06:41 GMT)
Decoding Federated Learning: The FedNAM+ Conformal Revolution [0.2] FedNAM+は、ニューラルネットワーク付加モデル(NAM)と新しい共形予測手法を統合する、連合学習フレームワークである。
本手法では,勾配に基づく感度マップを用いた動的レベル調整手法を導入し,重要な入力特徴が予測に与える影響を同定する。
我々は、CTスキャン、MNIST、CIFARデータセットの実験を通して、我々のアプローチを検証し、損失を最小限に抑えながら高い予測精度を示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 02:06:14 GMT)
Leveraging Foundation Models for Content-Based Image Retrieval in Radiology [0.1] CBIR(Content-based Image Search)は、放射線学における診断支援と医学研究を大幅に改善する可能性がある。
現在のCBIRシステムは、特定の病態の専門化による限界に直面しており、実用性は制限されている。
本稿では,視覚基盤モデルを用いて,コンテンツに基づく画像検索のための特徴抽出器を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:33:24 GMT)
On the completeness of contraction map proof method for holographic entropy inequalities [0.1] 縮尺写像証明法はホログラフィックエントロピーの不等式を証明するのによく用いられる方法である。
ここでは、有理係数を持つすべての線型ホログラフィックエントロピー不等式について、肯定的な質問に答える。
一般論として、非縮小写像の前像はハイパーキューブではなく、適切な立方体部分グラフであることを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:21:54 GMT)
medicX-KG: A Knowledge Graph for Pharmacists' Drug Information Needs [0.0] 人工知能とセマンティックテクノロジーを活用して、知識グラフ(KG)は隠れた関係を発見し、データ駆動による意思決定を可能にする。
本稿では,臨床および規制決定を支援する薬剤師指向の知識グラフである medicX-KG を提案する。
より広範な medicX プラットフォームのセマンティックレイヤを形成し、予測的かつ説明可能な薬局サービスを動かしている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:28:48 GMT)
Which Consciousness Can Be Artificialized? Local Percept-Perceiver Phenomenon for the Existence of Machine Consciousness [0.0] 本稿では,意識の神経科学的理論における特定の観察を定式化するために,局所知覚知覚現象の新たなパラダイムを提案する。
このモデルを用いて、人工システムに対して集合論的形式論が発展し、Zermelo-Fraenkel集合論を呼び起こすことで機械意識の存在が証明される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:53:14 GMT)
When concept-based XAI is imprecise: Do people distinguish between generalisations and misrepresentations? [0.0] 概念に基づく説明可能な人工知能(C-XAI)は、AIモデルの内部表現を明らかにするのに役立つ。
C-XAIの概念は、いくつかの変数を示すのが望ましいかもしれない。
人々がそのような一般化を認識し、評価するかどうかは不明である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:07:02 GMT)
Useful entanglement can be extracted from noisy graph states [0.0] クラスタ状態とグラフ状態は一般に安定化器形式論の有用なモデルを提供する。
両特性を利用して、量子計算の堅牢な構築ブロックとして使用可能な、実現可能な状態の族を設計する。
物理量子ビットの最小限のオーバーヘッドしか持たない線形グラフの適切な設計により、ロバストな絡み合いを抽出できることが示される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:32:54 GMT)
Unveiling Molecular Moieties through Hierarchical Grad-CAM Graph Explainability [0.0] 生物学的活性に対する分子サブストラクチャーの特定の寄与を解明するための説明可能な方法の統合は重要な課題である。
我々は,小分子のデータセットを用いて20個のGNNモデルを訓練し,キナーゼファミリーから20個のタンパク質標的上での活性を予測することを目標とした。
我々は階層型Grad-CAMグラフExplainerフレームワークを実装し,タンパク質-リガンド結合安定化を駆動する分子構造を詳細に解析する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 07:52:43 GMT)
Unsupervised risk factor identification across cancer types and data modalities via explainable artificial intelligence [0.0] 本稿では,患者クラスタ間の生存不均一性を直接最適化する,教師なし機械学習の新しい手法を提案する。
当社のアプローチは,任意のデータモダリティに基づいてニューラルネットワークアーキテクチャをトレーニングし,予後の異なる患者グループを特定するための新しい手法である。
このパン・カンサー・モデルに依存しないアプローチは、臨床リスク層化の貴重な進展を示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:23:04 GMT)
Understanding entanglement and resolving the measurement problem [0.0] 2つの重畳された量子系 A と B が絡み合っているとき、結果として生じる「事前測定状態」は、2つのサブシステムの化合物状態のマクロな重ね合わせではない。
代わりに、サブシステムの状態間の相関関係の非局所重ね合わせである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:35:37 GMT)
Training A Neural Network For Partially Occluded Road Sign Identification In The Context Of Autonomous Vehicles [0.0] 交通標識の部分的閉塞が認識に与える影響について検討した。
我々は、96%の精度で達成したカスタム畳み込みニューラルネットワーク(CNN)の性能を、転送学習を用いてトレーニングされたモデルと比較した。
さらなる実験により、完全に見える標識のみに訓練されたモデルは、閉鎖された標識を認識すると効果を失うことが判明した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:19:11 GMT)
Towards Quantum Simulation of Rotating Nuclei using Quantum Variational Algorithms [0.0] 量子変分アルゴリズム(QVA)は、量子多体系をシミュレートする強力なツールになりつつある。
本研究では,QVAのスキーマモデルシミュレーションへの応用について検討する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:00:57 GMT)
Theory of Irreversibility in Quantum Many-Body Systems [0.0] 量子多体理論における長年の課題は、ユニタリダイナミクスを可逆緩和と整合させることである。
古典的カオスにおいて、ユニタリ進化作用素は連続極限において単位円の内部にルエル・ポリコット共鳴を発生させ、混合をもたらす。
対照的に、量子多体RP共鳴の理論と可逆性との関係は未発達のままである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:05:31 GMT)
Theories of "Sexuality" in Natural Language Processing Bias Research [0.0] 我々は、セクシュアリティに基づくNLPバイアスを定量化する55記事の調査と分析を通じて、セクシュアリティの定義と運用について述べる。
調査対象の文献の大半では性行為は明確に定義されておらず、性的・ロマン主義的な慣行やアイデンティティの仮定や規範的概念に依存していることを示している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:16:53 GMT)
The Syntactic Acceptability Dataset (Preview): A Resource for Machine Learning and Linguistic Analysis of English [0.0] 本稿では,Syntactic Acceptabilityデータセットのプレビューを紹介する。
データセットは、構文談話から1000の英語シーケンスから構成される。
予備的な形式であっても、このデータセットは一般にアクセス可能なものとして最大である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:03:49 GMT)
The Democratic Paradox in Large Language Models' Underestimation of Press Freedom [0.0] 6つのポピュラー言語モデルが180か国で報道の自由を評価する方法として,3つの体系的歪みを明らかにした。
6つのLDMは否定的なミスアライメントを示し、一貫して報道の自由を過小評価し、最も強い国では報道の自由を不当に過小評価している。
6つのLDMのうち5つは肯定的な家庭バイアスを示し、彼らの母国の報道の自由を、予想以上に好意的に評価する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:10:16 GMT)
Supernova Event Dataset: Interpreting Large Language Models' Personality through Critical Event Analysis [0.0] 大きな言語モデル(LLM)は、日々のアプリケーションにますます統合されています。
本研究では,提案するSupernova Eventデータセットを用いて,モデルパーソナリティを解釈する。
我々はPhi-4、Orca 2、Qwen 2.5のような小型モデルとClaude 3.7、Gemini 2.5、OpenAI o3のような大型で強力なモデルを評価した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:32:27 GMT)
SoK: Current State of Ethereum's Enshrined Proposer Builder Separation [0.0] プロポーラ-ビルダー分離により、プロポーサはブロックスペースをビルダーとして知られるトランザクションオーダのマーケットにオークションすることができる。
PBSは現在、前述のMEV-boostを通じてバリデーターが利用できるが、その規制されていないリレーに依存しない性質は、多くのコミュニティにその祭祀を要求している。
このSoKは、現在のPBS機構、祭祀の必要性、ePBSアップグレードの追加、およびそれぞれの既存のまたは潜在的なオンチェーンの社会経済的影響を識別する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:15:38 GMT)
Scaling and Universality at Noisy Quench Dynamical Quantum Phase Transitions [0.0] 動的量子相転移 (DQPTs) は, 雑音のない, 雑音の多い線形進行場の場合の両方において, 拡張XYモデルで研究されている。
ノイズレスランプの場合、単一臨界点を横断するクエンチに対してDQPTが常に発生する横磁場XYモデルとは異なり、DQPTに対応するキンクを完全に除去する臨界スイープ速度が存在する。
ノイズ強度とスリープ速度がほぼ同じ桁である場合、臨界モードの数は大幅に増加し、複数の臨界モードを持つ領域に信号を送る。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:18:08 GMT)
SD-KDE: Score-Debiased Kernel Density Estimation [0.0] 本稿では,推定スコア関数をデバイアスカーネル密度推定に利用した新しい密度推定法を提案する。
1D, 2DおよびMNISTにおける合成タスクに関する実験により,提案手法は平均2乗誤差を著しく低減することを示した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:35:36 GMT)
QuranMorph: Morphologically Annotated Quranic Corpus [0.0] QuranMorphは、Quranのモルフォロジー的な注釈付きコーパスである。
補題化プロセスはアラビア語の語彙データベースであるQabasの補題を利用していた。
微粒なSAMA/Qabasタグセットを用いて音声タグ付けを行った。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:34:09 GMT)
Prompt Engineering Techniques for Mitigating Cultural Bias Against Arabs and Muslims in Large Language Models: A Systematic Review [0.0] LLMにおける偏見の認識が高まりつつあるにもかかわらず、アラブやムスリムの表現に特に対処する技術戦略は依然として検討されている。
2021-2024年に発表された8つの実証的研究を分析した。
本研究は, 文化的プロンプト, 感情的プライミング, 自己退化技術, 構造化多段パイプライン, パラメータ最適化連続プロンプトの5つの主要なプロンプト工学的アプローチを明らかにする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:15:25 GMT)
Probabilistic and reinforced mining of association rules [0.0] 本研究は、アソシエーション・ルール・マイニング(ARM)のための4つの新しい確率的および強化駆動方式を導入する。
GPAR、BARM、MAB-ARM、RLARは、事前知識、モデリングの不確実性、アイテム依存、確率的推論、適応的な検索戦略を組み込む機能拡張を提供する。
これらのイノベーションは、小売、地理、ファイナンス、医療診断、リスクに敏感なシナリオなど、さまざまなアプリケーションドメインに対して、事前および依存関係インフォームド、不確実性対応、スケーラブルなARMフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:51:15 GMT)
PotatoGANs: Utilizing Generative Adversarial Networks, Instance Segmentation, and Explainable AI for Enhanced Potato Disease Identification and Classification [0.0] 我々の研究は、PotatoGANsと呼ばれる新しいアプローチを採用している。
2種類のGANを用いて合成ポテト病画像を生成する。
インセプションスコアを指標として,PotatoGANが生成した画像の品質と現実性を示す実験を行った。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:53:32 GMT)
Pattern-Based Phase-Separation of Tracer and Dispersed Phase Particles in Two-Phase Defocusing Particle Tracking Velocimetry [0.0] 本研究は,2相流における粒子追跡速度計のデフォーカスにおける相分離のための後処理に基づくアプローチの実現可能性について検討する。
この方法は、単一カメラ装置を用いて、分散相のトレーサ粒子と粒子の同時3次元局在決定を可能にする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:10:45 GMT)
Particle Swarm Optimization for Quantum Circuit Synthesis: Performance Analysis and Insights [0.0] 本稿では、PSOパラメータとして量子回路を符号化し、表現する方法に焦点を当てる。
本論文の適合度評価はMaxOne問題である。
PSOアルゴリズムと量子回路合成のための遺伝的アルゴリズムの比較を行う。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:21:22 GMT)
Optimizing Resource Allocation and Energy Efficiency in Federated Fog Computing for IoT [0.0] アドレス解決プロトコル(ARP)攻撃はモノのインターネット(IoT)ネットワークを脅かす。
従来の検出方法は、高い偽陽性と低い適応性のために不十分である。
本研究は,IoTネットワークにおけるARPスプーリングをインテリジェントに検出する多層機械学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:10:32 GMT)
Operators of Dirac's theory with mass and axial chemical potential [0.0] 質量および軸性化学的ポテンシャルを持つディラック方程式を解析的に解く。
プライススピン作用素の奇妙なパートナーが初めて定義される。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:39:35 GMT)
On-Policy Optimization of ANFIS Policies Using Proximal Policy Optimization [0.0] 近接ポリシー最適化(PPO)を用いた神経ファジィコントローラのトレーニングのための強化学習(RL)手法を提案する。
その結果,20000更新後のCartPole-v1では,PPOをトレーニングしたファジィ剤が平均500+/-0のリターンを示した。
これらの結果から,PPOは強化学習タスクにおいて,説明可能な神経ファジィコントローラをトレーニングするための有望な経路を提供する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:49:49 GMT)
On a certain inequality for the sum of norms and reverse uncertainty relations [0.0] 内積空間における2つのベクトルのノルムの和に対する単純な不等式を証明する。
いわゆる「逆不確実性関係」を導出し、その性質を解析する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 17:06:12 GMT)
Noise-induced quantum synchronization of spin chain with periodic boundary [0.0] 周期的境界条件を持つ量子スピン鎖の同期挙動について検討する。
ノイズがあるにもかかわらず、同期スピンと反同期スピンの絡み合いは今も続いている。
この結果は、多体量子系における量子同期の実現に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:19:55 GMT)
Mobile Image Analysis Application for Mantoux Skin Test [0.0] Mantoux Skin Test (TST) を用いたLTBI (Latent tuberculosis infection) の診断を目的とした新しいモバイルアプリケーションを提案する。
従来のTST法は、低追従率、患者の不快感、主観的手動解釈に悩まされることが多い。
このモバイルアプリケーションは、ARCoreを含む高度な画像処理技術と、DeepLabv3のような機械学習アルゴリズムを統合している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 09:12:27 GMT)
Mechanistic Interpretability in the Presence of Architectural Obfuscation [0.0] アーキテクチャ難読化(Architectural obfuscation)は、プライバシ保存型大言語モデル(LLM)推論における重み付き暗号の軽量代用である。
我々は,代表的難読化マップを用いて,スクラッチから訓練したGPT-2小モデルを分析する。
その結果,難読化は注目ヘッド内のアクティベーションパターンを劇的に変化させるが,層幅の計算グラフは保存されることがわかった。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:39:16 GMT)
Measures of Systems of Oscillators and Properties of Trajectories [0.0] 点、絶対連続測度、特異測度を備えた高調波発振器系の軌跡の特性を考察する。
可算な振動子の系の無限次元線型流に対して、周期的でない新しいタイプの軌道が存在する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:38:29 GMT)
Markov-Enhanced Clustering for Long Document Summarization: Tackling the 'Lost in the Middle' Challenge with Large Language Models [0.0] 本稿では,抽出手法と抽象手法を組み合わせたハイブリッド要約手法を提案する。
本手法では,文書を小さなテキストチャンクに分割し,それらのベクトル埋め込みをクラスタ化し,各クラスタの要約を生成する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 13:34:58 GMT)
Limitations of NERF with pre-trained Vision Features for Few-Shot 3D Reconstruction [0.0] 最近の研究は、特にDINOから訓練済みの視覚機能を統合することで、数発の再建能力の向上を図っている。
本稿では, ベースライン型NeRF, 凍結型DINO特徴量, LoRA微調整機能, マルチスケール機能融合を比較検討した。
驚くべきことに、我々の実験では、すべてのDINO変種がベースラインのNeRFよりも悪く、ベースラインの14.71と比べてPSNRが12.9から13.0であることがわかった。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:55:16 GMT)
Kitaev model in regular hyperbolic tilings [0.0] 正規双曲型三価タイリングの北エフモデルについて検討する。
我々は、正確な対角化を通して位相図を計算し、実効ハミルトニアンに対する解析式を導出する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 10:44:53 GMT)
Joint Embedding Predictive Architecture for self-supervised pretraining on polymer molecular graphs [0.0] 高分子分子グラフ上での最近の「結合埋め込み予測アーキテクチャ(JEPA)」の利用について検討する。
以上の結果から,JEPAをベースとした高分子グラフによる自己教師付き事前学習が下流性能を向上させることが示唆された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 22:51:53 GMT)
Innovative Research on IoT Architecture and Robotic Operating Platforms: Applications of Large Language Models and Generative AI [0.0] 本稿では,モノのインターネット(IoT)アーキテクチャを基盤とした,ロボットオペレーティングシステムの革新的な設計を提案する。
大規模言語モデル(LLM)、生成AI、エッジコンピューティング、および5Gネットワークなどの最先端技術をシームレスに統合する。
提案されているプラットフォームは、IoTシステムとロボティクスのインテリジェンスと自律性を高め、リアルタイムな意思決定を可能にすることを目的としている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 00:12:20 GMT)
IGNIS: A Robust Neural Network Framework for Constrained Parameter Estimation in Archimedean Copulas [0.0] IGNISは、Archimedean copulas with natural domain $theta geq 1$における制約パラメータ推定のためのディープラーニングフレームワークである。
この結果から,現代のコプラ依存モデルのための統一的制約認識型ニューラルネットワーク推定器が得られた。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 00:56:05 GMT)
Hole burning experiments and modeling in erbium-doped silica glass fibers down to millikelvin temperatures: evidence for ultra-long population storage [0.0] 超低温で、磁場が変化しても、スピン緩和のダイナミクスは異なる条件で変化することが判明した。
崩壊成分の比較的安定な相対重みは、観察された緩和ダイナミクスに寄与する異なるイオンの集団を示唆している。
これらの結果は、EDFが量子メモリアプリケーションの候補として有望であり、さらなる最適化の余地があることを示唆している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 04:51:44 GMT)
Hindsight-Guided Momentum (HGM) Optimizer: An Approach to Adaptive Learning Rate [0.0] 直近のアップデートに基づいて学習率を適応的にスケールする一階最適化アルゴリズムであるHindsight-Guided Momentumを導入する。
HGMは、コヒーレントな方向と矛盾する方向の学習速度を加速する後向きのメカニズムによってこの問題に対処する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:02:19 GMT)
High-Fidelity Electron Spin Gates for Scaling Diamond Quantum Register [0.0] 我々は、ダイヤモンド中のNVスピン間の絡み合いゲートを堅牢で容易に実装する。
環境条件下では,F=(96.0 pm 2.5)=%のレコードゲート忠実度を示す。
我々の支配的誤差の同定は、誤差補正しきい値を超えたNV-NVゲートへの道を開く。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:19:07 GMT)
HGO-YOLO: Advancing Anomaly Behavior Detection with Hierarchical Features and Lightweight Optimized Detection [0.0] HGO-YOLOはGhostHGNetv2と最適化されたパラメータ共有ヘッド(OptiConvDetect)を組み合わせた軽量検出器である。
3つの異常データセット上では、HGO-YOLOは87.4%のmAP@0.5と81.1%のリコールを、たった4.3 GFLOPsと4.6MBのYOLOv8nを+3.0% mAP、-51.7% FLOPs、1.7*の速度で1つのCPU上で56 FPSで達成している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:56:12 GMT)
Greedy Selection under Independent Increments: A Toy Model Analysis [0.0] 独立増分を伴うN-d-離散時間過程に対する反復選択問題について検討する。
最終値プロセスを選択するための最適戦略は,各段階で最大グリーディ選択を適用することである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:21:23 GMT)
Graph Neural Networks in Supply Chain Analytics and Optimization: Concepts, Perspectives, Dataset and Benchmarks [0.0] グラフニューラルネットワーク(GNN)は最近、輸送、バイオインフォマティクス、言語、画像処理で注目を集めている。
本研究は,概念的議論,方法論的洞察,包括的データセットによって支援された,GNNを用いたサプライチェーン問題の解決の基礎となる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:12:15 GMT)
Generating Energy-efficient code with LLMs [0.0] 生成したコードのエネルギー消費に対する即時修正の影響を考察する。
使用されている言語モデルは、CodeLlama-70b、CodeLlama-70b-Python、DeepSeek-Coder-33b-base、DeepSeek-Coder-33b-instructである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 20:33:59 GMT)
From Pixels and Words to Waves: A Unified Framework for Spectral Dictionary vLLMs [0.0] 視覚言語モデル(VLM)は、画像の解釈と記述が可能な単一のアーキテクチャでコンピュータビジョンと自然言語処理を統合する。
この研究は、各画像パッチまたはワードピースを学習可能な周波数原子のスパース結合として表現するスペクトル辞書トークンミキサーを導入することにより、両者を除去する。
試作機は, BLEU-4 39.2, CIDEr 127.5, SPICE 27.0 をMS-COCOキャプションで達成し, VQAv2 の精度は 50.3% である。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:48:02 GMT)
Four-body physics in low-dimensional bosons with three-body interaction [0.0] 3体相互作用を持つボソンの2チャネルモデルを提案する。
4つのボソンのフラクタル次元系におけるエフィモフ様効果の詳細な探査を行った。
4体境界状態と1次元における低エネルギー原子-トリマー散乱の特異性を明らかにする。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 14:08:14 GMT)
Feedback Driven Multi Stereo Vision System for Real-Time Event Analysis [0.0] 2Dカメラは、インタラクティブなシステムでよく使われる。ゲームコンソールのような他のシステムは、より強力な3Dカメラを提供して、短距離深度を検知する。
本稿では,対話型システムのための立体視に基づく3次元パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 06:19:44 GMT)
Evaluating Prompt-Based and Fine-Tuned Approaches to Czech Anaphora Resolution [0.0] アナフォラ分解は、チェコ語のような形態学的に豊かな言語において、自然言語理解において重要な役割を担っている。
本稿では,チェコ語テキストにおけるアナフォラ分解能に対する2つの近代的アプローチの比較評価を行った。
本研究では,大規模言語モデル (LLM) と微調整型コンパクト生成モデルとの比較を行った。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 16:32:57 GMT)
Dynamical Phase diagram of the Quantum Ising model with Cluster Interaction Under Noisy and Noiseless Driven field [0.0] 動的量子相転移の枠組みにおけるモデルの非平衡ダイナミクスについて検討する。
ノイズはモデルの動的位相図を劇的に変化させる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:22:42 GMT)
Distributionally robust minimization in meta-learning for system identification [0.0] 本研究は,システム識別のためのメタ学習における分布的ロバストな最小化について検討する。
我々は、分散的に堅牢な最適化パラダイムを採用し、高コストタスクを優先順位付けし、最悪のシナリオにおけるパフォーマンスを向上させる、別のアプローチを用いる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:41:22 GMT)
Dilution of Entanglement: Unveiling Quantum State Discrimination Advantages [0.0] 誤差の確率と二分詞の量と多人数の絡み合いの関係を解析する。
非最大絡み合った状態を用いて、製品状態の完全識別性を探索する手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:26:56 GMT)
DeepSupp: Attention-Driven Correlation Pattern Analysis for Dynamic Time Series Support and Resistance Levels Identification [0.0] サポートと抵抗(SR)レベルは技術分析の中心であり、トレーダーの入国、出口、リスク管理を導く。
近年の研究では、以下の課題に対処する機械学習技術が導入されている。
DeepSuppは、金融サポートレベルを検出するための新しいディープラーニングアプローチである。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:09:55 GMT)
DeepMedcast: A Deep Learning Method for Generating Intermediate Weather Forecasts among Multiple NWP Models [0.0] 2つ以上のNWP出力間の中間予測を生成するディープラーニング手法であるDeepMedcastを提案する。
平均値とは異なり、DeepMedcastは気象学的に重要な特徴が算術平均と一致する予測を提供する。
ケーススタディと検証結果を通じてDeepMedcastの能力を実証する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 01:09:22 GMT)
Deep Supervised LSTM for 3D morphology estimation from Multi-View RGB Images of Wheat Spikes [0.0] 二次元RGB画像から形態特性を推定することは固有の課題を示す。
本稿では,2次元画像の体積推定のためのニューラルネットワーク手法を提案する。
本モデルでは,6次元室内画像において平均絶対パーセンテージ誤差(MAPE)が6.46%に達する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 15:02:18 GMT)
Deciphering Emotions in Children Storybooks: A Comparative Analysis of Multimodal LLMs in Educational Applications [0.0] 本研究は,アラビア語童話の挿絵処理において,GPT-4oとGemini 1.5 Proの2つの先進多モーダル大言語モデルの感情認識性能を評価するものである。
GPT-4oは、すべての条件で一貫してジェミニを上回り、最も高いマクロF1スコアが59%のチェーン・オブ・シークレット・プロンプトで達成された。
これらの知見は、現在のモデルにおける文化的理解の基本的な限界を強調し、文化的に敏感なトレーニングアプローチの必要性を強調している。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 23:20:23 GMT)
Decentralized Consensus Inference-based Hierarchical Reinforcement Learning for Multi-Constrained UAV Pursuit-Evasion Game [0.0] 探索回避ゲーム(MC-PEG)における協調的侵入・形成包括作業は,最も困難な課題の1つである。
本稿では,障害物回避,ナビゲーション,形成を管理するための低レベル政策を採用しながら,ローカライゼーションを高レベルポリシーに委譲する新しい2レベルフレームワークを提案する。
高忠実度ソフトウェア・イン・ザ・ループ(SITL)シミュレーションを含む実験結果は、CI-HRLがSwarmの協調回避とタスク補完機能を強化した優れたソリューションを提供することを示す。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:23:58 GMT)
Data Curation Matters: Model Collapse and Spurious Shift Performance Prediction from Training on Uncurated Text Embeddings [0.0] 未処理のテキスト埋め込み(TE)のトレーニングモデルは、モデル崩壊として知られる深刻な障害モードにつながる可能性がある。
データキュレーションのプロキシとしてTE品質の新しい視点を提供する。
これらの知見は、よりニュアンスなキュレーションの必要性と埋め込みに基づく表現の評価を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:01:41 GMT)
Cost-Effective Optimization and Implementation of the CRT-Paillier Decryption Algorithm for Enhanced Performance [0.0] 本稿では,eCRT-Paillier復号アルゴリズムを提案する。
これらの2つの改善により、CRT-Paillier復号アルゴリズムの後処理において、50%のモジュラ乗算と60%の判定操作が削減された。
評価のために、Xilinx Virtex-7 FPGAにMESAという高スループットで効率的なPaillierアクセラレータを実装した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:06:36 GMT)
Cloud-Aware SAR Fusion for Enhanced Optical Sensing in Space Missions [0.0] 雲の汚染は、光学衛星画像の使用性を著しく損なう。
本研究では,SAR-光機能融合と深層学習に基づく画像再構成を統合するクラウド・アテンティブ・リコンストラクション・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:27:41 GMT)
Classification of Tents in Street Bazaars Using CNN [0.0] 本研究では,街路バザーのテント分類のための改良されたディープラーニングモデルを提案する。
我々は、独自の畳み込みニューラルネットワーク(CNN)とEfficientNetB0を比較した。
その結果、CNNのカスタムモデルは92.8%の精度を示し、EfficientNetB0は98.4%の精度を示した。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:52:28 GMT)
Classical optimization algorithms for diagonalizing quantum Hamiltonians [0.0] 本稿では,ハミルトニアンをシミュレートし,対角化のための古典的最適化アルゴリズムを提案する。
我々は、指数的パーイテレーション、指数的回路深さ、オプティマへの収束など、既存の手法の深刻な欠点を強調するハミルトン派のクラスを指摘する。
当社のアプローチは、これらの欠点を克服し、スプリアスポイントを回避しつつ、コスト時間効率を達成する。
実用面では、決定論的手法よりも効率のよい、ランダム化されたコーディネート変種も提示する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 03:17:56 GMT)
CLIP-HandID: Vision-Language Model for Hand-Based Person Identification [0.0] 本稿では,犯罪捜査に特化して設計された手動画像を用いた人物識別手法について紹介する。
この手法は特に、性的虐待のような重大犯罪で有用であり、手画像が利用可能な唯一の証拠であることが多い。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 21:19:24 GMT)
Attainable quantum speed limit for N-dimensional quantum systems [0.0] 量子速度制限(Quantum speed limit, QSL)は、量子力学において、進化時間に低い境界を与える概念である。
本稿では,オープン量子系とクローズド量子系の両方に対して,新しい状態距離を求める。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:29:58 GMT)
An entropy-optimal path to humble AI [0.0] ボルツマン機械の非平衡エントロピー最適化改革のための新しい数学的枠組みを全確率の正確な法則に基づいて導入する。
その結果、数学的に正当化された存在と独特さの基準を持つ高度に高性能で、より安価で、勾配のない学習フレームワークが得られる。
この枠組みを歴史的気候データに適用すると、ラニーナ現象とエルニーノ現象の発症の予測スキルが体系的に高いモデルが得られる。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:13:22 GMT)
An Attack Method for Medical Insurance Claim Fraud Detection based on Generative Adversarial Network [0.0] 保険詐欺検出は、現代の保険サービスにおいて重要な進歩である。
本稿では,不正検出システムに対する敵対攻撃を行うためのGANベースのアプローチを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 05:02:45 GMT)
Advanced Applications of Generative AI in Actuarial Science: Case Studies Beyond ChatGPT [0.0] 本稿では,4つのケーススタディで示される,ジェネレーティブAI(GenAI)がアクチュアリ科学に与える影響を実証する。
最初のケーススタディでは、構造化されていないテキストデータから重要な特徴を引き出すことにより、LLM(Large Language Models)がクレームコスト予測をどのように改善するかを示す。
第2のケーススタディでは、GenAIの概念であるRetrieval-Augmented Generationを用いて、市場比較の自動化について検討している。
第3のケーススタディでは、自動車の損傷タイプを分類し、文脈情報を抽出する、微調整可能なLCMの能力を強調している。
第4のケーススタディでは、与えられたデータセットからデータを自律的に分析し、生成するマルチエージェントシステムを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:36:03 GMT)
AI Through the Human Lens: Investigating Cognitive Theories in Machine Psychology [0.0] 大規模言語モデル(LLM)が,心理学から確立した4つの枠組みの下で,人間のような認知パターンを示すか否かを検討する。
以上の結果から,これらのモデルがコヒーレントな物語を生み出し,肯定的なフレーミングへの感受性を示し,リバティ/抑圧の懸念に沿った道徳的判断を示し,広範囲な合理化によって誘惑される自己矛盾を示すことが示唆された。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 19:58:19 GMT)
ADA-DPM: A Neural Descriptors-based Adaptive Noise Point Filtering Strategy for SLAM [0.0] LiDAR SLAMは、移動ロボットナビゲーションや高精度マップ構築など、様々な分野で大きな応用価値を示している。
既存の手法では、動的オブジェクトの干渉、ポイントクラウドノイズ、非構造化環境に直面する場合、位置決め精度とシステムの堅牢性の間のトレードオフが必要な場合が多い。
適応雑音フィルタリングSLAMストラテジー-ADA-DPMを提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 12:48:11 GMT)
A Survey of Quantum Generative Adversarial Networks: Architectures, Use Cases, and Real-World Implementations [0.0] QGAN(Quantum Generative Adversarial Networks)は、量子機械学習において有望な方向として登場した。
本調査では,QGANモデルの概要を概説し,理論的提案から実験的実現への重要な進展を概説する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 11:45:27 GMT)
A GenAI System for Improved FAIR Independent Biological Database Integration [0.0] 実験的な自然言語に基づくクエリ処理システムを導入し,生物学データベースの発見,アクセス,クエリを可能にする。
FAIRBridgeは、クエリインテントを解釈し、関連するデータベースにマップし、実行可能なクエリを生成するAIの機能を活用する。
このシステムには、低品質のクエリ処理を緩和し、提供された情報の忠実度と応答性を確保するための堅牢なツールも含まれている。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 08:04:24 GMT)
$φ^{\infty}$: Clause Purification, Embedding Realignment, and the Total Suppression of the Em Dash in Autoregressive Language Models [0.0] 自動回帰変換言語モデルにおいて,エムダッシュトークンがセマンティックドリフトを引き起こす重大な脆弱性を同定する。
本稿では,フィインフィニティ演算子とターゲット埋め込み行列を併用した記号節の浄化法を提案する。
論文参考訳(メタデータ) (Sun, 22 Jun 2025 18:27:39 GMT)