More is Less: The Pitfalls of Multi-Model Synthetic Preference Data in DPO Safety Alignment [80.0] 直接選好最適化(DPO)は、人間のフィードバックによる強化学習の、シンプルで効果的な代替手段として登場した。
我々の研究は、DPOアライメントに関連する、目覚ましい、安全性に特有な現象を明らかにした。
選択されたペアと拒否されたペアに対してのみ自己生成されたレスポンスを使用することで、より強力なモデルからのレスポンスを含む構成を大幅に上回る。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:06:23 GMT)
Rethinking Discrete Tokens: Treating Them as Conditions for Continuous Autoregressive Image Synthesis [80.0] DisConは、離散トークンを生成ターゲットではなく条件信号として再解釈する新しいフレームワークである。
DisConは、ImageNet 256$times $256 世代で gFID スコアが 1.38 に達し、最先端の自己回帰アプローチよりも明確なマージンで優れている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:25:49 GMT)
Towards provable probabilistic safety for scalable embodied AI systems [79.3] エンボディードAIシステムは、様々なアプリケーションでますます普及している。
複雑な運用環境での安全性確保は依然として大きな課題である。
このパースペクティブは、安全で大規模に実施されたAIシステムを安全クリティカルなアプリケーションに採用するための道筋を提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:41:49 GMT)
C2-Evo: Co-Evolving Multimodal Data and Model for Self-Improving Reasoning [78.4] C2-Evoは、トレーニングデータとモデル機能の両方を共同で進化させる、自動クローズドループ自己改善フレームワークである。
C2-Evoは、複数の数学的推論ベンチマークにおいて、一定の性能向上が得られることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:27:08 GMT)
Assessing Adaptive World Models in Machines with Novel Games [77.9] 我々は、迅速な適応は、環境の内部表現の効率的な構築と洗練と結びついていると論じる。
人工知能における世界モデルの現在の理解と評価は依然として狭いままである。
そこで本研究では,真で深みがあり,常にリフレッシュするノベルティを持つ,慎重に設計されたゲームスイートをベースとした,新たなベンチマークパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:07:08 GMT)
LMM4Edit: Benchmarking and Evaluating Multimodal Image Editing with LMMs [76.6] EBench-18Kは、18K編集画像を含む最初の大規模画像編集ベンチマークである。
EBench-18Kは、21タスクにわたる対応する編集プロンプトを備えた1,080のソースイメージと、17の最先端TIEモデルによって生成された18K+編集イメージと、3つの評価次元から評価された55K+平均評価スコア(MOS)と18K+質問回答(QA)ペアを含む。
そして,LMMに基づく画像編集モデル評価のためのLMM4Editを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:11:07 GMT)
Risk and cross validation in ridge regression with correlated samples [72.6] 我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:18:26 GMT)
Promptomatix: An Automatic Prompt Optimization Framework for Large Language Models [72.5] LLM(Large Language Models)は、巧妙なプロンプトで最高の性能を発揮するが、プロンプトは手動で、一貫性がなく、非専門家にはアクセスできない。
Promptomatixは、手作業のチューニングやドメインの専門知識を必要とせずに、自然言語のタスク記述を高品質なプロンプトに変換する。
システムは、ユーザ意図を分析し、合成トレーニングデータを生成し、プロンプト戦略を選択し、コストを意識した目標を使用してプロンプトを洗練する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:19:51 GMT)
Controllable Video Generation: A Survey [72.4] 本稿では、制御可能なビデオ生成の体系的レビューを行い、理論的基礎と最近の現場の進歩の両方について述べる。
まず、主要な概念を導入し、一般的に使われているオープンソースビデオ生成モデルを紹介します。
次に、映像拡散モデルにおける制御機構に着目し、生成を誘導する認知過程に異なる種類の条件を組み込む方法について分析する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:05:34 GMT)
A Survey of Deep Learning for Geometry Problem Solving [72.2] 本稿では,幾何学的問題解決におけるディープラーニングの応用について調査する。
i)幾何学的問題解決における関連する課題の包括的概要、(ii)関連するディープラーニング手法の徹底的なレビュー、(iii)評価指標と手法の詳細な分析を含む。
我々の目標は、この分野のさらなる発展を促進するために、幾何学的問題解決のためのディープラーニングの包括的で実践的な参照を提供することである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:18:01 GMT)
PyG 2.0: Scalable Learning on Real World Graphs [70.8] Pyg 2.0は、拡張性と現実世界のアプリケーション機能を大幅に改善した包括的アップデートです。
ヘテロジニアスグラフやテンポラルグラフのサポート,スケーラブルな機能/グラフストア,さまざまな最適化など,フレームワークの強化されたアーキテクチャについて詳述する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:55:09 GMT)
Universal Model Routing for Efficient LLM Inference [69.9] モデルルーティングは,大規模言語モデル(LLM)の推論コストを削減する手法である
動的ルーティング問題に対する新しいアプローチであるUniRouteを提案する。
これらは理論的に最適なルーティングルールの推定であり、過大なリスクバウンドによってそれらのエラーを定量化する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:27:33 GMT)
Can Indirect Prompt Injection Attacks Be Detected and Removed? [68.7] 間接的インジェクション攻撃の検出・除去の可能性について検討した。
検出のために,既存のLCMとオープンソースの検出モデルの性能を評価する。
そこで本研究では,(1) インジェクション命令を含む部分をセグメント化して除去するセグメンテーション除去法,(2) 抽出モデルを訓練してインジェクション命令を識別・除去する抽出除去法,の2つの直感的手法を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:59:29 GMT)
Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny [68.0] 強化学習(RL)で訓練された大規模言語モデル(LLM)は、信頼性も拡張性もない、という大きな課題に直面している。
有望だが、ほとんど報われていない代替手段は、フォーマルな言語ベースの推論である。
生成モデルが形式言語空間(例えばダフニー)で機能する厳密な形式体系におけるLLMの接地は、それらの推論プロセスと結果の自動的かつ数学的に証明可能な検証を可能にする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:13:01 GMT)
NavMorph: A Self-Evolving World Model for Vision-and-Language Navigation in Continuous Environments [67.2] VLN-CE(Vision-and-Language Navigation in Continuous Environments)は、自然言語命令によって誘導される複雑な環境において、エージェントがシーケンシャルなナビゲーションアクションを実行する必要がある。
人間の認知にインスパイアされたNavMorphは、VLN-CEタスクにおける環境理解と意思決定を強化する自己進化型世界モデルフレームワークである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:03:26 GMT)
MC-Bench: A Benchmark for Multi-Context Visual Grounding in the Era of MLLMs [61.6] 本稿では,マルチコンテキストの視覚的グラウンド化という新しい視覚的グラウンド化タスクを提案する。
オープンなテキストプロンプトに基づいて、複数の画像にまたがる関心のインスタンスをローカライズすることを目的としている。
我々は20以上の最先端MLLMと基盤モデルをベンチマークし、潜在的にマルチコンテキストの視覚的グラウンド化機能を有する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:59:24 GMT)
Beyond Binary Rewards: Training LMs to Reason About Their Uncertainty [60.0] 本稿ではRLCRについて述べる。RLCRは精度と信頼性を共同で向上する推論モデルを訓練する手法である。
多様なデータセット間で、RLCRは精度を損なうことなくキャリブレーションを大幅に改善することを示す。
また,言語的信頼度をテスト時に活用し,精度とキャリブレーションを向上させることも実証した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:56:01 GMT)
Reasoning Models Can be Easily Hacked by Fake Reasoning Bias [59.8] 我々は、Reasoning Theatre Bias (RTB)を評価するための総合的なベンチマークTheATERを紹介する。
簡単なクイズとフェイク・オブ・サートを含む6種類のバイアスタイプについて検討した。
我々は、RTBの最も強力な形式として、'hallow reasoning'-plausibleだが欠陥のある議論を識別する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:20:24 GMT)
A Community-driven vision for a new Knowledge Resource for AI [59.3] WordNetのような知識リソースの成功にもかかわらず、検証可能な汎用的な知識ソースは、AIインフラストラクチャにおいて重要な欠陥である。
本稿では,この知見を要約し,新しい知識基盤に向けたコミュニティ主導のビジョンを概説する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:03:41 GMT)
LLMs syntactically adapt their language use to their conversational partner [58.9] 人間の話者は会話中に言語の使用が互いに一致していることがよく観察されている。
大規模言語モデル(LLM)間の会話のコーパスを構築し、2つのLLMエージェントが会話が進むにつれて、より類似した構文的選択をするのを見つける。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:24:10 GMT)
Mamba-OTR: a Mamba-based Solution for Online Take and Release Detection from Untrimmed Egocentric Video [57.8] Mamba-OTRは、短いビデオクリップでトレーニングしながら、推論中に時間的再発を利用するように設計されている。
Mamba-OTRは、スライドウインドウ方式で動作する際に、注目すべきmp-mAP45.48を達成する。
我々は,今後の研究を支援するため,Mamba-OTRのソースコードを公開します。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:23:51 GMT)
On the Effectiveness of LLM-as-a-judge for Code Generation and Summarization [55.0] 大規模言語モデルは、最近、Q&Aのような複雑な自然言語処理タスクの裁判官として活用されている。
コード生成とコード要約という2つのコード関連タスクに対するLLMs-as-a-judgeの有効性について検討した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:40:26 GMT)
Multi-Agent Reinforcement Learning for Sample-Efficient Deep Neural Network Mapping [54.7] 本稿では,サンプル非効率性の課題を克服するために,分散型マルチエージェント強化学習(MARL)フレームワークを提案する。
相関解析に基づいて類似のマッピングパラメータを同一エージェントに割り当てるエージェントクラスタリングアルゴリズムを提案する。
実験の結果,MARL法は標準単エージェントRLよりも30~300倍効率が向上した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:51:07 GMT)
Scale Your Instructions: Enhance the Instruction-Following Fidelity of Unified Image Generation Model by Self-Adaptive Attention Scaling [54.5] OmniGenのような統合画像生成モデルの最近の進歩により、単一のフレームワーク内で多様な画像生成および編集タスクの処理が可能になった。
テキスト命令が複数のサブインストラクションを含む場合,テキスト命令の無視に悩まされることがわかった。
本稿では,サブインストラクション毎に注意力の活性化を動的にスケールするために,自己適応型注意スケーリングを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:25:38 GMT)
R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory [53.9] 現在のモデルは、Web構造の可視化と理解が限られているため、効率的なナビゲーションとアクション実行に苦しむことが多い。
提案したR2D2フレームワークは,2つのパラダイムを統合することで,これらの課題に対処する。
本研究は,記憶を増強したナビゲーションと反射学習を組み合わせることで,Webエージェントの能力が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:14:16 GMT)
Seed-X: Building Strong Multilingual Translation LLM with 7B Parameters [53.6] 7Bパラメータサイズを持つオープンソースの言語モデル(LLM)のファミリーであるSeed-Xを紹介する。
ベースモデルは、28言語にわたるモノリンガルコンテンツとバイリンガルコンテンツの両方を含む、多種多様な高品質データセットで事前訓練されている。
その後、インストラクションモデルは、Chain-of-Thought(CoT)推論によって翻訳され、強化学習(RL)によりさらに強化され、多様な言語対をまたいだより良い一般化が達成される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:54:56 GMT)
Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report [51.2] 本報告では,フロンティアリスクの包括的評価について述べる。
サイバー犯罪、生物学的および化学的リスク、説得と操作、制御不能な自律型AIR&D、戦略的騙しと計画、自己複製、共謀の7つの分野における重要なリスクを特定します。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:44:38 GMT)
LLM4MEA: Data-free Model Extraction Attacks on Sequential Recommenders via Large Language Models [50.8] 近年の研究では、モデル抽出攻撃(MEA)に対するシーケンシャルレコメンデータシステムの脆弱性が実証されている。
事前のMEAにおけるブラックボックス攻撃は、データ選択のランダムサンプリングによるレコメンデータシステムの脆弱性を明らかにするのに効果がない。
LLM4MEAは,Large Language Models (LLMs) を人間のようなランク付けとして活用してデータを生成する新しいモデル抽出法である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:20:23 GMT)
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning [49.5] 実際の研究から5.1Kの複雑な経路問題を持つデータセットであるBioMazeを紹介する。
CoT法やグラフ拡張推論法などの手法の評価は,LLMが経路推論に苦慮していることを示している。
そこで本稿では,インタラクティブなサブグラフベースのナビゲーションにより推論を強化するLLMエージェントであるPathSeekerを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:56:33 GMT)
FISHER: A Foundation Model for Multi-Modal Industrial Signal Comprehensive Representation [49.5] FISHERはマルチモーダル産業信号解釈表現の基礎モデルである。
FISHERはSTFTサブバンドをモデリングユニットとし、事前トレーニングのために教師の学生SSLフレームワークを採用する。
上位のSSLモデルと比較して、FISHERは汎用性と優れた機能を示し、パフォーマンスは5.03%まで向上した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:31:16 GMT)
Effects of quantum geometry on the decoherence induced by black holes [49.2] ここでは、量子ブラックホールの幾何学自体の量子的側面が結果に大きな影響を及ぼす可能性があることを指摘した。
文献の様々な理由で提案された領域の領域の選択値に対して、地平線によって引き起こされるデコヒーレンス(英語版)は無視できるほど小さな値に制限されていることが判明した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:00:25 GMT)
Modeling Public Perceptions of Science in Media [49.1] 本稿では,ニュースの持続性,重要度,驚き度など,12次元にわたる公的な認識をモデル化する計算フレームワークを提案する。
我々は、米国と英国の多様な人口から2,101人の参加者から10,489のアノテーションで、大規模な科学ニュースの認識データセットを作成します。
我々は,公共の知覚スコアを高い性能で予測するNLPモデルを開発した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:13:52 GMT)
Predicting the Reliability of an Image Classifier under Image Distortion [48.9] 画像分類タスクでは、深層学習モデルは画像歪みに弱い。
品質管理のためには、画像分類器が歪みレベルで信頼できない/信頼できないかを予測することが重要である。
我々の解決策は、歪みレベルと「信頼できない」「信頼できない」ラベルからなるトレーニングセットを構築し、歪みレベルを分類するために機械学習予測モデル(歪み分類器と呼ばれる)を訓練することである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:06:37 GMT)
Diffusion-Modeled Reinforcement Learning for Carbon and Risk-Aware Microgrid Optimization [48.7] DiffCarl(ディフカール)は、マルチマイクログリッドシステムのインテリジェントな操作のための、拡散モデルによる炭素およびリスクを考慮した強化学習アルゴリズムである。
従来のアルゴリズムと最先端のDRLソリューションを2.3-30.1%削減した。
また、炭素を意識しない変種よりも28.7%低い炭素排出量を達成し、性能の変動を減少させる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:27:07 GMT)
Aligning AI with Public Values: Deliberation and Decision-Making for Governing Multimodal LLMs in Political Video Analysis [48.1] AIモデルが政治的トピックにどう対処すべきかは議論されているが、依然として困難であり、より優れたガバナンスが必要である。
本稿では、政治的に敏感なビデオを中心に、個人的および集団的な議論を通じて、大規模言語モデルのガバナンスについて検討する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:07:13 GMT)
High temperature superradiant phase transition in novel quantum structures with complex network interface [45.0] 複素ネットワークにおける2レベル系と光電場との超強相互作用を可能にする新しい量子材料の概念を提案する。
ネットワークの統計特性を,まず$langlekrangle$,次に正規化された$zetaequivlanglek2rangle/langlekrangle$,ノード次分布のモーメントによって特徴付ける。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:56:45 GMT)
ETCH: Generalizing Body Fitting to Clothed Humans via Equivariant Tightness [44.8] Equivariant Tightness Fitting for Clothed Humans(ETCH)は、布の表面マッピングを推定する新しいパイプラインである。
CAPEと4D-Dressの実験では、ETCHは最先端の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:49:25 GMT)
LongSplat: Online Generalizable 3D Gaussian Splatting from Long Sequence Images [44.6] LongSplatは、長時間画像入力のためのオンラインリアルタイム3Dガウス再構成フレームワークである。
GIRは3Dガウスパラメータを構造化されたイメージライクな2Dフォーマットにエンコードする。
LongSplatは、リアルタイムの新規ビュー合成において最先端の効率品質トレードオフを実現する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:43:51 GMT)
Dens3R: A Foundation Model for 3D Geometry Prediction [44.1] Dens3Rは幾何学的密度予測のための3次元基礎モデルである。
画像対マッチング機能と本質的不変性モデリングを統合することにより、Dens3Rは複数の幾何学的量を正確に回帰する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:22:30 GMT)
GenMol: A Drug Discovery Generalist with Discrete Diffusion [43.3] Generalist Molecular Generative Model (GenMol) は、多種多様な薬物発見シナリオを扱うために単一の離散拡散モデルのみを使用する汎用的なフレームワークである。
GenMolは、非自己回帰的双方向並列デコードにより、シーケンスアタッチメントベースのフラグメント埋め込みシーケンスを生成する。
GenMol は、de novo 生成とフラグメント制約生成において、以前の GPT ベースモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:03:34 GMT)
Banzhida: Advancing Large Language Models for Tibetan with Curated Data and Continual Pre-Training [40.9] バンジーダ(Banzhida)は、チベット語で生成するAIを進化させる多言語大言語モデルである。
現在までに最大のチベット事前訓練コーパスをキュレートし、様々な情報源からのデータを収集している。
我々は、新しい高品質のチベットベンチマークを作成し、それらを既存の公開ベンチマークで補完する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:15:52 GMT)
Quantum Annealing Hyperparameter Analysis for Optimal Sensor Placement in Production Environments [39.6] ハードウェアが成熟すると、量子コンピューティングがコスト効率、大規模最適化問題にどのように貢献するかを示す。
我々はこの問題を1ホットとバイナリエンコーディングによる2次非制約バイナリ最適化の定式化に変換する。
以上の結果から,量子アニールは実世界のシナリオから派生したインスタンスを解くことができることが示された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:35:51 GMT)
CausalStep: A Benchmark for Explicit Stepwise Causal Reasoning in Videos [39.5] CausalStepはビデオの段階的因果推論のベンチマークである。
ビデオは因果的にリンクされたユニットに分割し、厳密な段階的な質問応答プロトコルを強制する。
ベンチマークには、6つのカテゴリに100の動画と、1,852のマルチチョイスQAペアが含まれている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:29:13 GMT)
MONITRS: Multimodal Observations of Natural Incidents Through Remote Sensing [39.5] 我々は,1万件以上のFEMA災害イベントを,時空間衛星画像とニュース記事からの自然言語アノテーションで表現した新しいデータセットであるMONITRSを提示する。
既存のMLLMをデータセットに微調整することで,災害監視タスクの性能が大幅に向上することが実証された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:59:09 GMT)
Learning Streaming Video Representation via Multitask Training [38.8] オフラインの動画理解とは異なり、ストリーミングビデオ理解にはフレーム単位でビデオストリームを処理し、過去の情報を保存し、低レイテンシの決定を行う能力が必要である。
本稿では,事前学習した視覚変換器に因果的注意を組み込むことにより,StreamFormerと呼ばれる新しいストリーミングビデオバックボーンを開発する。
オンラインアクション検出、オンラインビデオインスタンスセグメンテーション、およびビデオ質問応答に関する広範な実験を行う。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:34:45 GMT)
confopt: A Library for Implementation and Evaluation of Gradient-based One-Shot NAS Methods [37.7] ワンショットニューラルアーキテクチャサーチ(NAS)は、アーキテクチャ空間を探索するコストを大幅に削減した。
しかし、勾配に基づくNAS法の評価はDARTSベンチマークに大きく依存している。
本稿では,勾配に基づくNAS手法の開発と評価を効率化するライブラリであるConfoptを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:44:28 GMT)
Evaluating Social Acceptance of eXtended Reality (XR) Agent Technology: A User Study (Extended Version) [37.7] 本稿では,eXtended Reality(XR)エージェント技術の社会的受容性を評価するユーザスタディについて述べる。
このシステムは、モジュラーツールキットによって実現された仮想アバターとのユーザインタラクションを含む。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:14:05 GMT)
A resource theoretical unification of Mpemba effects: classical and quantum [37.7] ムペンバ効果(Mpemba effect)は、もともと特定の熱力学の下では、当初より高温の試料は冷たいものよりも速く冷却できるという観察を指していた。
この研究は、情報理論に広く用いられている資源理論が、メペンバ物理学を体系化するための統一的な原理を提供することを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:28:16 GMT)
StreamME: Simplify 3D Gaussian Avatar within Live Stream [37.5] StreamMEは、プリキャッシュされたデータなしでライブビデオストリームからヘッドアバターを同期的に記録し、再構成する。
提案手法は3次元Splatting (3DGS) 上に構築され, 変形可能な3DGSにおけるガウシアンへの依存を解消する。
本手法は,VRシステムやオンライン会議において,顔のプライバシを保護し,通信帯域を削減する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:33:30 GMT)
DP2Guard: A Lightweight and Byzantine-Robust Privacy-Preserving Federated Learning Scheme for Industrial IoT [37.4] DP2Guardは、プライバシーと堅牢性の両方を強化する軽量PPFLフレームワークである。
特異値分解とコサイン類似性を用いて勾配特徴を抽出するハイブリッド防衛戦略を提案する。
信頼スコアに基づく適応アダプティブアグリゲーションスキームは、履歴行動に応じてクライアントの重みを調整する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:06:39 GMT)
Make Me Happier: Evoking Emotions Through Image Diffusion Models [36.4] 本稿では,感情を誘発するイメージを合成することを目的とした,感情誘発画像生成の新たな課題を提案する。
本稿では、ソースイメージを効果的に理解し、編集し、望ましい感情や感情を伝える拡散モデルを提案する。
我々は、人間の心理物理学実験を行い、すべての手法を体系的にベンチマークする新しい評価基準を導入する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:46:09 GMT)
Advancing Robustness in Deep Reinforcement Learning with an Ensemble Defense Approach [36.3] 本稿では,自律走行シナリオにおける敵攻撃を軽減するために,アンサンブルに基づく新しい防御アーキテクチャを提案する。
FGSM攻撃時のベースラインと比較して、我々のアンサンブル法は平均報酬を5.87から18.38(213%以上)に改善し、ハイウェイシナリオとマージシナリオにおける平均衝突速度を0.50から0.09(82%減少)に低減し、全てのスタンドアロン防衛戦略を上回っている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:15:11 GMT)
Unconventional Floquet topological phases in the SSH lattice [36.1] 局所的な摂動に頑健なエッジ状態で知られるトポロジカル材料は、次世代量子技術への期待を抱いている。
本稿では,Floquet位相位相を動的に誘導・切り替えするために,高周波単色駆動と変調振幅パルスを用いることを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:34:58 GMT)
Towards a Universal 3D Medical Multi-modality Generalization via Learning Personalized Invariant Representation [35.5] 本稿では,様々なモダリティにまたがるパーソナライズされた不変表現を近似することで,パーソナライズされた一般化を実現するアプローチを提案する。
我々は、パーソナライズされた$X_h$の学習の実現可能性とメリットを検証し、この表現が多種多様な医療タスクにおいて非常に一般化可能であり、伝達可能であることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:47:17 GMT)
CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning [35.1] 最適化のための自動強化学習フレームワークを導入する。
A100でトレーニングされたNVIDIA-L1は、250のBenchカーネルすべてに平均でx17.7のスピードアップを提供し、ピーク時のスピードアップはx449に達する。
H100ではx17.8、3090ではx19.0、L40ではx16.5、H800ではx14.7、H20ではx13.9である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:42:18 GMT)
Comparison of Optimised Geometric Deep Learning Architectures, over Varying Toxicological Assay Data Environments [34.8] 本研究では,グラフ畳み込みネットワーク(GCN),グラフ注意ネットワーク(GAT),グラフ同型ネットワーク(GIN)の性能の比較を行った。
エリア・アンダー・ザ・カーブ(AUC)のスコアは0.728-0.849(全ての折り畳み平均値)である。
GINはGCNとGATを一貫して上回り、最も有毒な7つのアッセイの上位5位を占めた。
これは、GINがデータ依存環境に最適なアーキテクチャであるのに対して、GATはデータに最適なアーキテクチャであることを示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:38:11 GMT)
PICACO: Pluralistic In-Context Value Alignment of LLMs via Total Correlation Optimization [33.6] In-Context Learningは、大規模言語モデル(LLM)を人間の価値と整合させる大きな可能性を示している。
LLMの入力プロンプトの理解は依然として不可知であり、ICAが値の緊張に対処する能力を制限する。
この問題に対処する新しい多元的ICA手法であるPICACOを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:14:56 GMT)
Characterizing Online Activities Contributing to Suicide Mortality among Youth [33.2] 近年の若年自殺の増加は、オンライン体験がこの公衆衛生問題にどのように貢献するかを緊急に理解する必要があることを浮き彫りにしている。
2013-2022年における死亡調査のオープンテキストサマリー29,124件を用いて,自死の文脈化に関係があると考えられる12種類のオンライン活動を特定するためのセマンティック分析を行った。
我々の研究は、自殺リスクの異なる段階に対応する、自己への害、他人への害、対人関係、オンライン活動レベル、ライフイベントに関連するいくつかのオンライン活動を明らかにする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:55:51 GMT)
Hierarchical Safety Realignment: Lightweight Restoration of Safety in Pruned Large Vision-Language Models [33.0] 階層型安全実現(HSR)という,新規で軽量なアプローチを提案する。
HSRはまず、それぞれの注意ヘッドの安全への貢献を定量化し、最も重要なものを同定し、選択的に神経細胞を復元する。
我々は,HSRを各種モデルおよびプルーニング戦略で検証し,安全性能の顕著な改善を継続的に達成した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:32:33 GMT)
Data Processing for the OpenGPT-X Model Family [32.8] データ選択と要件定義から始まり、最終的なフィルタリングデータの準備まで、すべてのデータ処理手順を説明します。
我々は、データセットの詳細な分析を提供し、透明性を高め、ヨーロッパのデータ規制と整合する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:46:10 GMT)
CM-UNet: A Self-Supervised Learning-Based Model for Coronary Artery Segmentation in X-Ray Angiography [32.7] CM-UNetは、注釈なしデータセットの自己教師付き事前学習と限られた注釈付きデータでの転送学習を利用する。
500点ではなく18点の注釈付き画像で微調整されたCM-UNetは、Diceのスコアが15.2%低下した。
これは、X線血管造影による冠動脈セグメンテーション改善における自己教師的学習の重要性を強調した最初の研究の1つである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:27:34 GMT)
The Ever-Evolving Science Exam [32.2] The *Ever-Evolving Science Exam (EESE)* was introduced the **Ever-Evolving Science Exam (EESE)*。
1)5つの分野と500以上のサブフィールドにまたがる専門的な科学インスタンス(クエスト・アンサー・ペア)と,2)定期的に更新された500インスタンスサブセット**EESE*,サンプルと検証により,リーク耐性,低オーバヘッド評価を実現する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:22:16 GMT)
Advancing Visual Large Language Model for Multi-granular Versatile Perception [31.8] Visual Large Language Model を取り入れた多言語・多言語知覚フレームワーク MVP-LM を提案する。
我々のフレームワークは、ボックスとマスクの予測とともに、単語ベースと文ベースの両方の知覚タスクを統合するように設計されている。
MVP-LMは、CoTにインスパイアされたデータセット統一戦略と合わせて、革新的なマルチグラニュラリティデコーダを備えている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:09:14 GMT)
Engineering Non-Hermitian Quantum Evolution Using a Hermitian Bath Environment [31.4] 非エルミートサブシステムによる量子バスネットワークのエンジニアリングは、量子ビット冷却、状態安定化、フォールトトレラント量子計算のための有望な戦略として登場した。
完全エルミートフォトニックプラットフォーム内で非エルミートサブシステムを構築するための体系的枠組みを導入する。
特に、実際の損失を伴わない制御された指数的崩壊吸収は、離散-連続結合とランツォス変換によって有限1-次元導波路鎖で実現される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:14:05 GMT)
LibEER: A Comprehensive Benchmark and Algorithm Library for EEG-based Emotion Recognition [31.4] 脳波に基づく感情認識(EER)は、人間の感情を理解し分析する可能性から注目されている。
この分野には、説得力のあるベンチマークと包括的なオープンソースライブラリが欠けている。
EERの公平な比較を容易にするために設計された総合ベンチマークおよびアルゴリズムライブラリであるLibEERを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:31:06 GMT)
TRIDENT: Benchmarking LLM Safety in Finance, Medicine, and Law [31.3] 大規模言語モデル(LLM)は、法律、金融、医療といったリスクの高い領域にますます展開されている。
まず,AMA Principles of Medical Ethics, ABA Model Rules of Professional Conduct, CFA Institute Code of Ethicsに基づいて,LLMのドメイン固有の安全原則を定義した。
法、金融、医療分野におけるLLMの安全性に特化したベンチマークであるTrident-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:52:29 GMT)
Learning to Call: A Field Trial of a Collaborative Bandit Algorithm for Improved Message Delivery in Mobile Maternal Health [30.7] インドのキルカリ・プログラムは、何百万人もの母親に毎週の音声通話を通じて重要な母体健康情報を提供している。
現在のランダムな呼び出しスケジューリングは、しばしばミスコールとメッセージ配信の削減をもたらす。
本研究では,母親の好みの通話時間を学習することで,通話タイミングの最適化を目的とした協調的帯域幅アルゴリズムのフィールドトライアルを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:42:17 GMT)
Quantum Geometry of Data [30.7] 量子認知機械学習は、データを量子幾何学としてエンコードする方法を示す。
QCMLでは、データの特徴は学習されたエルミート行列によって表現され、データポイントはヒルベルト空間の状態にマッピングされる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:27:22 GMT)
When LLMs Copy to Think: Uncovering Copy-Guided Attacks in Reasoning LLMs [30.5] 大規模言語モデル(LLM)は、脆弱性検出やコード理解といったタスクを可能にする自動コード解析に不可欠なものになっている。
本稿では,CGA(Copy-Guided Attacks)と呼ばれる,新たなプロンプトベースの攻撃のクラスを特定し,検討する。
CGAは、コード解析タスクにおいて、無限ループ、早期終了、偽の拒絶、意味的歪みを確実に誘導することを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:21:36 GMT)
Self-Contradiction as Self-Improvement: Mitigating the Generation-Understanding Gap in MLLMs [29.8] MLLMは、モデル自体の理解に基づいて、入力プロンプトと不一致とみなす画像を生成する自己コントラディションを示す。
私たちの経験的結果は、自己矛盾は主に誤解ではなく、プロンプトと一致しない弱い世代から生じます。
このような内部監督による標準的なポストトレーニング手法の適用は、生成と統一の両方をうまく改善する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:56:39 GMT)
FLAIN: Mitigating Backdoor Attacks in Federated Learning via Flipping Weight Updates of Low-Activation Input Neurons [29.2] フェデレートラーニング(FL)は、複数のクライアントが中央サーバの調整の下で、機械学習モデルを協調的にトレーニングすることを可能にする。
バックドア攻撃は 悪質な入力でのみ活性化される ニューロンを悪用する
FLのバックドア攻撃に対するFLAIN(Flipping Weight Updates of Low-Activation Input Neurons)を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:55:26 GMT)
AtrousMamaba: An Atrous-Window Scanning Visual State Space Model for Remote Sensing Change Detection [29.0] 本稿では,グローバルな文脈情報の統合と微粒な局所的詳細情報の抽出のバランスをとる新しいモデルであるAtrousMambaを提案する。
AWVSS(Atrous window scan visual state space)モジュールを活用することで、バイナリチェンジ検出(BCD)とセマンティックチェンジ検出(SCD)のためのエンド・ツー・エンドのMambaベースのフレームワークを設計する。
6つのベンチマークデータセットの実験結果は、提案フレームワークが既存のCNNベース、Transformerベース、Mambaベースの手法より優れていることを示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:36:16 GMT)
Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [28.5] Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:37:51 GMT)
Efficient RL for optimizing conversation level outcomes with an LLM-based tutor [28.2] 大規模言語モデル(LLM)は、人間フィードバック(RLHF)フレームワークによる既存の強化学習に基づいて構築される。
学生の低次元潜在状態表現を用いて対話履歴を表現し,LLMに基づくチュータを強化する手法を提案する。
我々のモデルは軽量であり、チューターの次の発話を直接出力するために、チューターポリシーをエンドツーエンドにトレーニングする以前の作業よりも計算資源を少なくする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:56:46 GMT)
HIPPO-Video: Simulating Watch Histories with Large Language Models for Personalized Video Highlighting [27.9] パーソナライズされたビデオハイライトのための新しいデータセットであるHIPPO-Videoを紹介する。
データセットには2,040対(履歴、給与スコア)が含まれており、170のセマンティックカテゴリにわたる20,400のビデオをカバーしている。
提案手法は,これらの個人化された時計履歴を利用して,嗜好条件付きセグメント・サリエンシスコアを推定する手法である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:24:33 GMT)
Optimal Pure Differentially Private Sparse Histograms in Near-Linear Deterministic Time [27.9] そこで本研究では,純微分プライベートなスパースヒストグラムを,サイズ$d gg n$の領域から引き出された参加者に対してリリースするアルゴリズムを提案する。
我々の手法は最適な$ell_infty$-estimation誤差を達成し、ワードRAMモデルで厳密に$O(n ln ln d)$時間で実行します。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:17:59 GMT)
The Cost of Compression: Tight Quadratic Black-Box Attacks on Sketches for $\ell_2$ Norm Estimation [27.8] 線形スケッチによる次元の低減は強力で広く使われている手法であるが、敵の入力に弱いことが知られている。
Rk X n$ の固定されたスケッチ行列 A は、高次元ベクトル v $in Rn$ を、低次元スケッチ A v in $Rk$ に写像する。
我々は、tilde(O)($k2$)クエリを使用して、ノルム推定の失敗を引き起こすか、クエリ分布の最適推定器が失敗する逆入力を構築する、普遍的で非適応的な攻撃を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:25:05 GMT)
Comparative validation of surgical phase recognition, instrument keypoint estimation, and instrument instance segmentation in endoscopy: Results of the PhaKIR 2024 challenge [27.5] 3つの医療機関から収集した腹腔鏡下胆嚢摘出術13例からなる新しいデータセットについて紹介した。
既存のデータセットとは異なり、同じデータ内の機器の局所化と手続き的コンテキストを共同で調べることができる。
バイオメディカル画像解析の課題に対するBIASガイドラインに従って,結果と知見を報告する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:10:42 GMT)
Many-body delocalization with a two-dimensional 70-qubit superconducting quantum simulator [27.4] 十分に強い障害を持つ量子多体系は、多体局在(MBL)と呼ばれる非平衡現象を示す。
制御有限サイズ2DシステムにおけるMBL体制のロバスト性について実験的に検討した。
我々の結果は、MBL状態が1つの空間次元を超えた不安定性を予測する雪崩理論と一致している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:02:05 GMT)
PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models [27.3] マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクにおいて顕著な成功を収めた。
膨大なインターネットソースデータへの依存は、プライバシーとセキュリティの重大な懸念を引き起こす。
マシン・アンラーニング(MU)はこれらの問題に対処するための重要な手法として登場した。
PEBenchはMLLMにおけるMUの徹底的な評価を容易にするために設計された新しいベンチマークである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:49:12 GMT)
RealBench: Benchmarking Verilog Generation Models with Real-World IP Designs [27.0] 本稿では,実世界のIPレベルのVerilog生成タスクを対象とした最初のベンチマークであるRealBenchを紹介する。
RealBenchは複雑で構造化された、実世界のオープンソースIP設計、マルチモーダルおよびフォーマット設計仕様、厳密な検証環境を備えている。
様々なLLMおよびエージェントの評価によると、最も優れたLLMの1つであるo1-previewでさえ、モジュールレベルのタスクでは13.3%のpass@1しか達成せず、システムレベルのタスクでは0%である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:29:23 GMT)
Finding Dori: Memorization in Text-to-Image Diffusion Models Is Less Local Than Assumed [27.0] データプライバシと知的財産権に関する懸念は、トレーニングデータを必然的に複製する可能性があるため、依然として残っている。
近年の緩和努力は、複製を誘発する原因となる重量を特定して刈り取ることに重点を置いている。
プルーニング後も、入力プロンプトのテキスト埋め込みに対する微調整は、データ複製を再トリガーするのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:02:38 GMT)
GroundFlow: A Plug-in Module for Temporal Reasoning on 3D Point Cloud Sequential Grounding [26.4] 3次元点雲(SG3D)における連続的な接地は、詳細なステップで日々の作業のためにテキスト命令に従うことによって、オブジェクトのシーケンスを探索することを指す。
現在の3Dビジュアルグラウンド法では,各ステップから有用な時間情報を抽出することなく,複数のステップでテキスト命令を処理している。
GroundFlow - 3Dポイントクラウドシーケンシャルグラウンド上での時間的推論のためのプラグインモジュール。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:31:10 GMT)
Positive Style Accumulation: A Style Screening and Continuous Utilization Framework for Federated DG-ReID [25.6] FedDG-ReIDは、分散ソースドメインデータを通じて、効果的にソースとターゲットドメインに一般化できるグローバルサーバモデルを学ぶことを目的としている。
既存の手法は主にスタイル変換によるサンプルの多様性を改善する。
我々は,モデルの一般化性能に有益で有害なスタイルを,肯定的あるいは否定的なスタイルとして定義する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:21:00 GMT)
Quantum Internet in a Nutshell -- Advancing Quantum Communication with Ion Traps [25.5] 本稿では,小さな量子誤り訂正符号の量子通信プロトコルへの組み入れについて検討する。
これらの符号はノイズレベルを抑えるのに役立ち、チャネルのノイズプロファイルを監視するのに役立ちます。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:27:01 GMT)
How Deep Is Representational Bias in LLMs? The Cases of Caste and Religion [25.3] 我々は、宗教と鋳造のための大きな言語モデルにおける表現バイアスの存在と「粘り強さ」を定量化する。
GPT-4の反応は、文化的に支配的な集団を、その統計的表現をはるかに超越している。
以上の結果から, LLMにおける表現バイアスは, 学習データにおける分布バイアスよりも, あらゆる品質に偏りがあることが示唆された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:28:37 GMT)
A Comprehensive Data-centric Overview of Federated Graph Learning [25.2] 本調査では,データ特性とデータ利用という2段階のデータ中心分類を提案する。
各分類レベルは3つの基準で定義され、それぞれが異なるデータ中心の構成を表す。
この調査では、事前訓練された大規模モデルとのFGL統合を調査し、現実的な応用を示し、GMLの新たなトレンドに沿った今後の方向性を強調している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:49:24 GMT)
M-SpecGene: Generalized Foundation Model for RGBT Multispectral Vision [25.1] 一般化RGBTマルチスペクトル基盤モデル(M-SpecGene)を構築した。
M-SpecGeneは、大規模な広義データから自己教師付き方法でモダリティ不変表現を学習することを目的としている。
本稿では,2つのモードにまたがる情報密度を定量化するために,CMSS(Cross-Modality Structure Sparsity)メトリクスを導入する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:00:49 GMT)
InternAgent: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification [24.8] InternAgentは、自律科学研究を行うための統合クローズドループマルチエージェントフレームワークである。
12の科学研究課題にまたがる多目的性を実証した。
複数の科学分野において有望な性能向上を達成し、人的努力に比べて大幅にコストを削減した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:05:22 GMT)
MegaScience: Pushing the Frontiers of Post-Training Datasets for Science Reasoning [24.7] 1kの大学レベルの教科書から抽出した真正な参照回答を特徴とするオープンデータセットであるTextbookReasoningを提案する。
私たちは、合計125万のインスタンスからなる高品質なオープンソースデータセットの大規模な混合であるMegaScienceを紹介します。
実験により,我々のデータセットはより簡潔な応答長で優れた性能と訓練効率が得られることを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:59:03 GMT)
Towards Resilient Safety-driven Unlearning for Diffusion Models against Downstream Fine-tuning [24.2] テキスト・ツー・イメージ(T2I)拡散モデルは、印象的な画像生成品質を達成し、パーソナライズされたアプリケーション向けに微調整されている。
これらのモデルはしばしば有毒な事前訓練データから安全でない行動を継承し、安全性の懸念が高まる。
本稿では、下流の微調整に対するレジリエンスを高める安全駆動型アンラーニングフレームワークResAlignを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:40:16 GMT)
Watermark Anything with Localized Messages [24.1] 我々は、Watermark Anything Model (WAM)と呼ばれる局所画像透かしのためのディープラーニングモデルを導入する。
WAM埋め込み装置は入力画像を不知覚に修正し、抽出器は受信した画像を透かし及び非透かし領域に分割する。
WAMはスプリシング画像中の透かし領域を特定し、複数の小さな領域から1ビット未満の誤差で異なる32ビットメッセージを抽出することができる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:48:18 GMT)
Multi-modal vision-language model for generalizable annotation-free pathology localization and clinical diagnosis [24.1] 医療画像から病理を自動的に定義することは、疾患の出現と進展を理解するのに役立つ。
既存のディープラーニングモデルは専門家のアノテーションに依存しており、オープンな臨床環境での一般化機能が欠如している。
視覚言語モデルを提案する。
局在のない病理(AFLOC)
胸部X線画像の220万対のデータセットについて実験を行い、8つの外部データセットに対して広範な検証を行った。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:21:54 GMT)
DREAM: Scalable Red Teaming for Text-to-Image Generative Systems via Distribution Modeling [23.9] テキスト・トゥ・イメージ(T2I)生成モデルは、性や暴力的なイメージなどの有害なコンテンツを生成できる。
Red Teamingは、T2Iシステムから安全でない出力を抽出できる多様なプロンプトを積極的に識別することを目的としている。
我々は,与えられたT2Iシステムから様々な問題のあるプロンプトを自動的に発見する,スケーラブルなレッド・チーム・フレームワークであるDREAMを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:10:22 GMT)
EmotiCrafter: Text-to-Emotional-Image Generation based on Valence-Arousal Model [23.3] 連続感情画像コンテンツ生成(C-EICG)の新たな課題について紹介する。
本稿では,テキストプロンプトとValence-Arousal値に基づいて画像を生成する感情画像生成モデルであるEmotiCrafterを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:47:31 GMT)
Dyna3DGR: 4D Cardiac Motion Tracking with Dynamic 3D Gaussian Representation [23.2] 本研究では,明示的な3次元ガウス表現と暗黙的な神経運動場モデリングを組み合わせた新しいフレームワークである動的3次元ガウス表現(Dyna3DGR)を提案する。
本手法は心構造と運動を同時に自己監督的に最適化し,広範囲なトレーニングデータやポイント・ツー・ポイント対応の必要性を解消する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:06:50 GMT)
MotionShot: Adaptive Motion Transfer across Arbitrary Objects for Text-to-Video Generation [23.1] MotionShotは、参照ターゲット対応をきめ細かい方法で解析するためのフレームワークである。
顕著な外観や構造の違いがあっても、物体を横切る動きをコヒーレントに転送することができる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:51:05 GMT)
Now and Future of Artificial Intelligence-based Signet Ring Cell Diagnosis: A Survey [22.8] 署名環細胞(SRC)は、末梢転移と予後不良の確率が高い。
本稿は,2008年から2025年6月までのAI駆動型SRC分析に関する包括的調査である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:32:02 GMT)
ResearcherBench: Evaluating Deep AI Research Systems on the Frontiers of Scientific Inquiry [22.6] 我々は、ディープAI研究システムの能力を評価することに焦点を当てた最初のベンチマークであるResearcherBenchを紹介する。
現実の科学的シナリオから専門的に選択された65の質問のデータセットを収集した。
OpenAI Deep ResearchとGemini Deep Researchは、他のシステムよりも格段に優れており、オープンエンドのコンサルティングの質問では特に強みがある。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:51:26 GMT)
Toward A Causal Framework for Modeling Perception [22.6] 機械学習(ML)における認識
本稿では,知覚を因果的にモデル化するための最初のアプローチを提案する。
我々は2種類の確率因果知覚(構造知覚とパラメトリック知覚)を定義した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:40:35 GMT)
AV-Reasoner: Improving and Benchmarking Clue-Grounded Audio-Visual Counting for MLLMs [22.4] CG-AV-Countingは、手動で注釈付き手掛かり付き数え上げベンチマークで、1,027のマルチモーダル質問と5,845の注釈付き手掛かりを497本の長ビデオで紹介する。
ブラックボックスとホワイトボックスの評価の両方をサポートし、エンドツーエンドと推論ベースのカウントのための包括的なテストベッドとして機能する。
AV-Reasonerは、GRPOとカリキュラム学習で訓練されたモデルであり、関連するタスクからカウント能力を一般化する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:00:35 GMT)
INTER: Mitigating Hallucination in Large Vision-Language Models by Interaction Guidance Sampling [22.0] 大規模視覚言語モデル(LVLM)における幻覚は、現実世界のアプリケーションに重大な課題をもたらす。
textbfInter: textbfInteraction Guidance Samplingを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:33:11 GMT)
Exploring Gender Bias in Large Language Models: An In-depth Dive into the German Language [21.9] 大規模言語モデル(LLM)における性別バイアス評価のためのドイツの5つのデータセットを提案する。
データセットは、ジェンダーバイアスというよく確立された概念に基づいており、複数の方法論を通してアクセス可能である。
8種類の多言語 LLM モデルで報告された本研究は,ドイツ語の性差にかかわる独特な課題を明らかにした。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:09:41 GMT)
Energy-Efficient and Real-Time Sensing for Federated Continual Learning via Sample-Driven Control [21.9] リアルタイムセンシング(RTS)システムは、現実のダイナミクスに適応するために、継続的に知識を取得し、更新し、統合し、適用しなければならない。
本稿では,データ分散が人工知能(AI)モデルの性能に与える影響について検討する。
本研究では,RTS機能を有するモバイルエッジネットワークを対象としたSCFL(Sample-driven Control for Federated Continual Learning)技術を開発した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:35:04 GMT)
DFR: A Decompose-Fuse-Reconstruct Framework for Multi-Modal Few-Shot Segmentation [21.5] DFR(Decompose, Fuse, Reconstruct)は、マルチモーダルガイダンスを数発のセグメンテーションで効果的に活用するという課題に対処する新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:21:32 GMT)
CP-uniGuard: A Unified, Probability-Agnostic, and Adaptive Framework for Malicious Agent Detection and Defense in Multi-Agent Embodied Perception Systems [21.5] コラボレーティブ・パーセプション(CP)は、マルチエージェント自律運転とマルチエージェントロボットシステムにとって有望な技術であることが示されている。
CPでは、egoエージェントは、その協力者からメッセージを受け取る必要があるため、悪意のあるエージェントからの攻撃に対して脆弱である。
我々は、CP-uniGuardという統合された、確率に依存しない、適応的なフレームワークを提案し、その協調ネットワークにおける悪意のあるエージェントを正確に検出し、排除する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:52:44 GMT)
New Mechanisms in Flex Distribution for Bounded Suboptimal Multi-Agent Path Finding [21.3] MAPF (Multi-Agent Path Finding) は、衝突のない経路の集合を見つける問題である。
その目的は、各エージェントの経路コストを、開始位置から目標位置への移動時間として定義するパスコスト(SOC)の総和を最小化することである。
EECBSは、有界-最適MAPFの第一のアルゴリズムであり、ソリューションのSOCは、最大でユーザ指定因子である$w$を最適から遠ざけている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:25:29 GMT)
VGGT-Long: Chunk it, Loop it, Align it -- Pushing VGGT's Limits on Kilometer-scale Long RGB Sequences [20.7] VGGT-Long(VGGT-Long)は、モノクローナル3D再構築の限界を、キロスケールで無界の屋外環境に広げるシステムである。
KITTIデータセットとVirtual KITTIデータセットを用いて本手法の評価を行った。
結果は、現実の環境でスケーラブルなモノラルな3Dシーンに基礎モデルを活用する可能性を強調している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:39:04 GMT)
Cross-Encoder Rediscovers a Semantic Variant of BM25 [20.7] そこで本研究では,MiniLMのクロスエンコーダ(Cross-Encoder)バージョンについて検討し,その関連性や格納場所について検討する。
従来のBM25のセマンティックなバリエーションを解釈可能な方法で採用し、局所的なコンポーネントを特徴とする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:10:57 GMT)
Accurate and Efficient Fine-Tuning of Quantized Large Language Models Through Optimal Balance [20.7] 大規模言語モデル(LLM)は、様々な領域で素晴らしいパフォーマンスを示している。
パラメータ量子化とローランド適応(LoRA)を組み合わせた既存ソリューション
QA-BLoRA(Quantization-Aware Fine-tuning with Balanced Low-Rank Adaptation)を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:00:38 GMT)
MultiTaskDeltaNet: Change Detection-based Image Segmentation for Operando ETEM with Application to Carbon Gasification Kinetics [20.5] MultiTaskDeltaNet(MTDN)は、セグメンテーションタスクを変更検出問題として創造的に再認識する新しいディープラーニングアーキテクチャである。
In-situ Environmental TEM(ETEM)ビデオのデータを用いた評価では、MTDNは従来のセグメンテーションモデルよりも大きな優位性を示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:52:35 GMT)
FinResearchBench: A Logic Tree based Agent-as-a-Judge Evaluation Framework for Financial Research Agents [20.4] FinResearchBenchはロジックツリーベースのエージェント・アズ・ア・ジャッジであり、金融調査エージェントに特化したターゲットである。
ファイナンシャル・リサーチ・ドメインにおける7つの重要なタスクの総合的かつ自動評価を提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:40:25 GMT)
Probing Ranking LLMs: A Mechanistic Analysis for Information Retrieval [20.4] 我々は、LLMのランク付けにおけるニューロンの活性化を調べるために、探索に基づく分析を用いる。
本研究は,語彙信号,文書構造,問合せ文書間相互作用,複雑な意味表現など,幅広い機能カテゴリにまたがる。
我々の発見は、より透明で信頼性の高い検索システムを開発するための重要な洞察を提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:18:08 GMT)
LLM-Driven Collaborative Model for Untangling Commits via Explicit and Implicit Dependency Reasoning [20.1] コミット回避のための新しいコラボレーティブコンサルテーションフレームワークであるColaUntangleを提案する。
ColaUntangleは、LLM(Large Language Model)駆動エージェントをマルチエージェントアーキテクチャに統合する。
我々は,マルチバージョンプログラム依存グラフ(delta-PDG)を構築し,エージェントが記号深度と意味深度の両方でコード関係を推論できるようにする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:42:13 GMT)
Unveiling the Potential of Segment Anything Model 2 for RGB-Thermal Semantic Segmentation with Language Guidance [20.1] 本稿では,RGB-サーマル知覚のための言語指導によるSAM2のポテンシャルを解放する新しいSAM2駆動型ハイブリッドインタラクションパラダイムを提案する。
ShiFNetは、公開ベンチマークで最先端のセグメンテーション性能を達成し、PST900で89.8%、FMBで67.8%に達した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:20:58 GMT)
FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation [19.7] 本稿では,大規模テキスト・ツー・イメージ(T2I)拡散モデルとイメージ・ツー・イメージ(I2I)パラダイムをプラグ・アンド・プレイ方式で適用する,新しい,簡潔かつ効率的なアプローチを提案する。
本手法は,周波数帯域のタイプや帯域幅を調整するだけで,参照画像の導出係数と導出強度の両方を柔軟に制御できる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:14:29 GMT)
SVAgent: AI Agent for Hardware Security Verification Assertion [19.4] 本稿では,革新的なSVA自動生成フレームワークであるSVAgentを提案する。
SVAAgentは、元の複雑な要求を構造化され、徐々に解決可能な微細な問題解決チェーンに変換する。
実験により、SVAgentは幻覚やランダムな答えの影響を効果的に抑制できることが示された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:36:06 GMT)
PUSA V1.0: Surpassing Wan-I2V with $500 Training Cost by Vectorized Timestep Adaptation [18.2] Pusaは、一貫したビデオ拡散フレームワーク内で微細な時間的制御を可能にする、画期的なパラダイムである。
We set a new standard for image-to-video (I2V) generation, to achieve a VBench-I2V total score 87.32%。
この研究は、次世代のビデオ合成のためのスケーラブルで効率的で多用途なパラダイムを確立する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:09:37 GMT)
Unreal is all you need: Multimodal ISAC Data Simulation with Only One Engine [17.9] Great-Xは、Unreal Engine内のSionnaのレイトレーシングを再構築する、シングルエンジンのマルチモーダルデータツインプラットフォームである。
我々は、オープンソースの、大規模、低高度のUAVマルチモーダル合成データセット、Great-MSDを構築した。
本稿では,CSI をベースとした UAV 3D ローカライゼーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:28:32 GMT)
ROADWork Dataset: Learning to Recognize, Observe, Analyze and Drive Through Work Zones [17.9] 作業ゾーンを認識し,観察し,分析し,運転するROADWorkデータセットを提案する。
私たちのデータセットの微調整モデルは、ワークゾーンにおける知覚とナビゲーションを大幅に改善します。
作業ゾーンのビデオから,ナビゲーションの目標を予測し,予測可能な経路を計算する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:55:25 GMT)
Choosing Coordinate Forms for Solving ECDLP Using Shor's Algorithm [17.8] Shorのアルゴリズムは楕円曲線離散問題(ECDLP)を時間内に解く能力でよく知られている。
本研究により, 射影座標はショア法を用いてCDLPに取り組む際に, アフィン座標と同等の利点を示さないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:00:45 GMT)
Depth Gives a False Sense of Privacy: LLM Internal States Inversion [17.6] 大きな言語モデル(LLM)は、日々のルーチンにますます統合されていますが、プライバシと安全性の懸念を生じさせています。
近年の研究では、データの局所性を確保するために、初期層推論をアウトソースする協調推論が提案されている。
逆入力の意味的類似性とトークンマッチング率を大幅に向上させる4つの逆攻撃を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:15:11 GMT)
Identifying Pre-training Data in LLMs: A Neuron Activation-Based Detection Framework [17.4] 大規模言語モデル(LLM)のパフォーマンスは、著作権のある資料やプライベート情報を含むトレーニングデータと密接に結びついている。
LLMにおけるトレーニングデータと非トレーニングデータの差分ニューロン活性化パターンを解析する新しいアルゴリズムであるNA-PDDを導入する。
また、厳密なデータ変換を用いて、トレーニングデータと非トレーニングデータ間の一貫した時間分布を確保するための、時間的偏りのないベンチマークであるCCNewsPDDを導入する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:05:30 GMT)
Quality Text, Robust Vision: The Role of Language in Enhancing Visual Robustness of Vision-Language Models [17.3] 頑健な微調整のための既存の敵の訓練手法は、視覚的堅牢性を高める上での言語の役割を概ね見落としている。
本研究では,QT-AFT(Quality Text-guided Adversarial Fine-Tuning)を提案する。
QT-AFTは、16のゼロショットデータセットで評価された、最先端のゼロショット対向ロバスト性とクリーンな精度を達成する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:13:30 GMT)
A Multi-granularity Concept Sparse Activation and Hierarchical Knowledge Graph Fusion Framework for Rare Disease Diagnosis [17.1] 本稿では,多粒度スパース活性化と階層的知識グラフを組み合わせたフレームワークを提案する。
提案手法では,4つの相補的マッチングアルゴリズムと多様性制御,および正確な概念活性化のための5段階のフォールバック戦略を用いる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:23:04 GMT)
Technical report: Impact of Duration Prediction on Speaker-specific TTS for Indian Languages [16.8] 本研究では,非自己回帰型連続正規化フロー(CNF)に基づく音声モデルを,公開言語データを用いて学習する。
ゼロショット・話者固有生成のための複数の継続時間予測戦略を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:38:30 GMT)
Toward a Lightweight and Robust Design for Caching with Predictions [16.7] textscGuardは軽量なロバスト化フレームワークで、学習強化型キャッシュアルゴリズムの堅牢性を2H_k + 2$に向上させる。
textscGuardは、一貫性と堅牢性の間の、現在のよく知られたトレードオフを実現している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:26:28 GMT)
Experience is the Best Teacher: Grounding VLMs for Robotics through Self-Generated Memory [16.5] 本稿では,視覚言語モデル(VLM)を現実体験の自己生成記憶を構築することで,ロボットに基盤付ける枠組みを提案する。
ExpTeachでは、VLMは自律的にアクションを計画し、結果を検証し、失敗を反映し、クローズドループでロボットの動作に適応する。
実験では、4つの困難なロボット作業において、リフレクションは成功率を36%から84%に改善することを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:48:49 GMT)
DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph [14.6] 本稿では,実演を効果的に検索し,クエリを生成する新しい手法を提案する。
質問とデータベースのスキーマ項目のキー情報と関連性を含むDeep Contextual Link Graphを構築した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:42:57 GMT)
Curve-Aware Gaussian Splatting for 3D Parametric Curve Reconstruction [14.6] 本稿では,多視点エッジマップから直接3次元パラメトリック曲線を再構成するためのエンドツーエンドフレームワークを提案する。
パラメトリック曲線とエッジ指向ガウス成分の双方向結合機構を提案する。
提案手法は,既存の手法に比べて高い効率と優れた性能を達成し,トレーニング中のパラメータ数を著しく削減する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:42:46 GMT)
LoRA is All You Need for Safety Alignment of Reasoning LLMs [14.6] 本稿では,SFT に LoRA を使用すれば,その推論能力を損なうことなく,安全のためにモデルを効果的に整列させることができることを示す。
これは、安全ウェイト更新を低ランク空間に制限することは、推論ウェイトとの干渉を最小限にするからである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:25:16 GMT)
MPO: An Efficient Post-Processing Framework for Mixing Diverse Preference Alignment [14.5] Mixing Preference Optimization (MPO)は、単一目的ポリシーを集約するための後処理フレームワークである。
MPOは様々な好みにまたがるバランスの取れた性能を実現し、計算コストを大幅に削減した既存モデルより優れている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:25:08 GMT)
LSSGen: Leveraging Latent Space Scaling in Flow and Diffusion for Efficient Text to Image Generation [14.4] 合成を高速化するための一般的な戦略は、低分解能で早期に復調を行うことである。
ピクセル空間におけるダウンスケールとアップスケールの伝統的な手法は、しばしばアーティファクトや歪みをもたらす。
本稿では,bf遅延空間スケーリング生成(LSSGen)を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:05:21 GMT)
Should Bias Always be Eliminated? A Principled Framework to Use Data Bias for OOD Generation [14.3] 本稿では, 推論中の不変表現を補うために, バイアスを戦略的に活用する新しいフレームワークを提案する。
我々は、合成データセットと標準領域一般化ベンチマークの両方の実験を通して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:17:48 GMT)
Adaptive Graph Pruning for Multi-Agent Communication [14.2] 大規模言語モデル(LLM)に基づくマルチエージェントシステムは,様々なタスクにおいて顕著な性能を示した。
本稿では,タスク適応型マルチエージェント協調フレームワークであるAdaptive Graph Pruning (AGP)を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:10:04 GMT)
CompLeak: Deep Learning Model Compression Exacerbates Privacy Leakage [14.2] 我々は3つの広く使用されている圧縮構成を調べる最初のプライバシリスクフレームワークであるCompLeakを提案する。
CompLeakには3つのバリエーションがあり、圧縮されたモデルとオリジナルのモデルの数にアクセスできる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:02:46 GMT)
SPACT18: Spiking Human Action Recognition Benchmark Dataset with Complementary RGB and Thermal Modalities [14.2] スパイクカメラ、バイオインスパイアされた視覚センサー、各ピクセルに光強度を蓄積して非同期に発火し、例外的な解像度のスパイクを提供する。
この研究は、エネルギー効率、超低消費電力のビデオ理解、特にスパイクベースのデータを用いた行動認識の研究を促進するデータセットに貢献する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:59:14 GMT)
Synthetic Data Matters: Re-training with Geo-typical Synthetic Labels for Building Detection [13.6] 対象地域の都市配置に合わせた合成データを用いて,テスト時に再学習モデルを提案する。
対象地域の都市構造を忠実に再現する地球型合成データを生成する。
実験では、ドメインギャップに応じて、パフォーマンスが大幅に向上し、中央値の12%が改善された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:53:13 GMT)
A computational transition for detecting correlated stochastic block models by low-degree polynomials [13.4] 2つの相関ブロックモデル $mathcalS(n,tfraclambdan;k,epsilon;s)$ を共通の親ブロックモデル $mathcalS(n,tfraclambdan;k,epsilon)$ からサブサンプリングする。
このモデルを一対の独立した ErdHos'enyi グラフと区別する検出問題に対して、隣接点のエントリのエンブロー度に基づくテストに焦点をあてる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:52:19 GMT)
Disability Across Cultures: A Human-Centered Audit of Ableism in Western and Indic LLMs [13.4] 大規模言語モデル(LLM)は、オンラインヘイトを識別し緩和するためにますます使われています。
オンラインアクティビズムに関するほとんどの研究は、西洋のAIモデルを用いた西洋の聴衆に焦点を当てている。
これらのモデルは、インドのような西欧以外の地域で、有能な損害を認識するために適切に装備されているか?
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:51:41 GMT)
Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs [13.3] 適応型フレーム選択とマルチテンポラリスケーリングのための新しいアプローチであるビデオQFrameを紹介する。
Q-Frameは、CLIPのようなテキスト画像マッチングネットワークによって生成されたトレーニング不要のプラグイン・アンド・プレイ戦略を採用している。
ベンチマークデータセットの広範な実験を通じて,Q-Frameの有効性を実証する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:42:31 GMT)
Evaluating Uncertainty and Quality of Visual Language Action-enabled Robots [13.3] ロボット操作タスクのためのVLAモデルに特化して設計された8つの不確実性指標と5つの品質指標を提案する。
我々は,3つの最先端VLAモデルから908のタスク実行を成功させる大規模実証実験により,その有効性を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:15:59 GMT)
A Single-step Accurate Fingerprint Registration Method Based on Local Feature Matching [13.2] 指紋画像の歪みは指紋認識性能の低下につながる。
2つの指紋を整列するエンドツーエンドの指紋登録アルゴリズムを提案する。
実験結果から,本手法は1ステップの登録だけで,最先端のマッチング性能を達成できることが証明された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:29:46 GMT)
Talking Like a Phisher: LLM-Based Attacks on Voice Phishing Classifiers [13.2] 大規模言語モデル (LLM) は、逆ビッシング文字を生成するために利用される。
我々は,迅速なエンジニアリングとセマンティックな難読化を利用する,系統的なアタックパイプラインを構築した。
LLM生成転写産物はMLに基づく分類器に対して実用的かつ統計的に有効であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:26:49 GMT)
GASPnet: Global Agreement to Synchronize Phases [13.1] トランスフォーマーアーキテクチャは、キーとクエリ間の合意に基づいて、ネットワーク内の情報の選択とルーティングを行う。
本稿では、トランスフォーマーの注意操作の側面と魅力的な神経科学理論、すなわち同期による結合を結合する新しいメカニズムを提案する。
その結果,CNNネットワークよりも精度が向上し,ノイズに対する堅牢性が向上し,一般化能力も向上した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:10:33 GMT)
Improving Code LLM Robustness to Prompt Perturbations via Layer-Aware Model Editing [13.1] 大規模言語モデル(LLM)は、急激な摂動に対して非常に敏感である。
ターゲットパラメータの更新によってLCMの堅牢性を高める新しいアプローチであるCREMEを導入する。
実験の結果,CREMEは摂動プロンプトでPass@1の精度を63%向上することがわかった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:57:55 GMT)
ToFe: Lagged Token Freezing and Reusing for Efficient Vision Transformer Inference [13.0] そこで我々は,各段階で重要なトークンを識別し,重要でないトークンを一時的に凍結する新しいToken Freezing and Reusingフレームワークを紹介した。
ToFeは、トップ1精度の2%以下でLV-ViTモデルの計算コストを50%削減する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:17:44 GMT)
Autonomous Data Selection with Zero-shot Generative Classifiers for Mathematical Texts [12.9] 本稿では,高品質な数学的テキストを自動的にキュレートする自動データ選択(AutoDS)を提案する。
人間のアノテーションや専用のデータフィルタのトレーニングを必要とする従来のアプローチとは異なり、AutoDSはモデルのロジットのみに依存する。
我々は、自動ドメイン固有データキュレーションの今後の研究を容易にするために、キュレートされたAutoMathTextデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:17:48 GMT)
A Human-Centered Approach to Identifying Promises, Risks, & Challenges of Text-to-Image Generative AI in Radiology [12.9] 私たちは、責任あるモデル開発に対する人間中心のアプローチを開発します。
我々は,医学生,放射線学研修生,放射線技師の立場から,テキスト・トゥ・CTスキャン・ジェネシスが医学教育,訓練,実践において果たす役割を明らかにする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:53:25 GMT)
Prototype-Guided Pseudo-Labeling with Neighborhood-Aware Consistency for Unsupervised Adaptation [12.8] CLIPのような視覚言語モデルに対する教師なし適応では、ゼロショット予測からの擬似ラベルは大きなノイズを示すことが多い。
本稿では,プロトタイプの整合性と近傍の整合性を統合することで,CLIPの適応性能を向上させる適応型擬似ラベルフレームワークを提案する。
提案手法は、教師なし適応シナリオにおける最先端性能を実現し、計算効率を維持しつつ、より正確な擬似ラベルを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:08:24 GMT)
Towards Robust Foundation Models for Digital Pathology [12.7] 本研究は,非生物学的特徴に対するFMロバスト性に関する最初の系統的研究である。
PathoROBは3つの新しいメトリクスを持つロバストネスベンチマークである。
その結果,非破壊的FM表現は下流の誤診や臨床症状の原因となることが判明した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:51:53 GMT)
Compatibility of Max and Sum Objectives for Committee Selection and $k$-Facility Location [12.4] 各クライアントが選択した施設への距離の和または最大を最小化しようとする4つの異なる目的について検討する。
一度に1つの目標を最適化するのではなく、これらの目標が相互にどのように互換性があるかを調査する。
この結果から,施設群や代表委員会を選定する場合,複数の目的に適するソリューションを同時に構築することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:47:35 GMT)
SAGE: A Visual Language Model for Anomaly Detection via Fact Enhancement and Entropy-aware Alignment [12.4] VLM(Vision-Language Models)は、しばしば産業の異常検出と推論に苦しむ。
SAGEは、自己ガイドFact Enhancement (SFE)とEntropy-aware Direct Preference Optimization (E-DPO)を通じて、異常推論を強化するVLMベースのフレームワークである。
SAGEはゼロショットおよびワンショット設定下での産業異常データセット上での優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:11:41 GMT)
WakenLLM: A Fine-Grained Benchmark for Evaluating LLM Reasoning Potential and Reasoning Process Stability [12.3] 大規模言語モデル(LLM)は、しばしばラベルemphUnknownを出力するが、現在の評価は、そのような答えがなぜ発生するかというよりも、真正であるかどうかにのみ焦点を絞っている。
これは、2つの異なるケースを曖昧にする: (i) 真に不確定な入力と (ii) モデルが解けない解決可能な問題である。
本研究では,emphUnknown応答の比率をモデル能力に寄与するフレームワークを導入し,誘導刺激がそれらを正しい(emphKnown)あるいは本質的に不確定な結果に変換することができるかどうかを検証した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:21:48 GMT)
SpiroLLM: Finetuning Pretrained LLMs to Understand Spirogram Time Series with Clinical Validation in COPD Reporting [11.8] COPDは気流制限が持続する主要な慢性呼吸器疾患である。
COPD診断のための現在のAIモデルは、分類結果の出力に限られている。
スピロLLMは,スピログラムを理解可能な最初のマルチモーダル大言語モデルである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:44:12 GMT)
From Flat to Round: Redefining Brain Decoding with Surface-Based fMRI and Cortex Structure [11.8] 人間の脳活動(例えばfMRI)から視覚刺激を再構築することは神経科学とコンピュータビジョンを橋渡しする。
球面上の空間的コヒーレントな2次元球面データとしてfMRI信号を明示的にモデル化する新しいスフィア・トークンーザを提案する。
また、構造MRIデータの統合も提案し、個々の解剖学的変動をパーソナライズした符号化を可能にする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:34:39 GMT)
Mangosteen: An Open Thai Corpus for Language Model Pretraining [11.7] 既存の大規模コーパスは英語や言語に依存しないパイプラインに依存している。
Mangosteen: タイのDolmaパイプラインを通じて構築された47億のタイ語対応コーパスを紹介します。
パイプライントリムを202万から2500万のドキュメントにまとめた上で,SEA-HELM NLGを3から11に引き上げた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:22:35 GMT)
Latent Space Alignment for AI-Native MIMO Semantic Communications [11.2] 本稿では,意味コミュニケーションにおける意味的ミスマッチに対処する新しい手法を提案する。
ニューラルネットワークベースのモデルは、電力予算と複雑さの制約の下でセマンティックプリコーダ/デコーダを学ぶ。
目的指向のセマンティックコミュニケーションシナリオにおいて,提案手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:16:18 GMT)
Unsupervised Joint Learning of Optical Flow and Intensity with Event Cameras [11.1] イベントカメラは、シーンの外観に関する情報を得るために動きに依存している。
本稿では,単一ネットワークを用いた光フロー(動き)と画像強度(出現)を共同で推定する教師なし学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:55:19 GMT)
Can LLMs Generate Reliable Test Case Generators? A Study on Competition-Level Programming Problems [11.1] 大規模言語モデル(LLM)は、推論中に複雑なタスクに対処できるコード生成において顕著な能力を示している。
テストケースジェネレータ(LLM生成)のベンチマークであるTCGBenchを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:07:10 GMT)
One Polyp Identifies All: One-Shot Polyp Segmentation with SAM via Cascaded Priors and Iterative Prompt Evolution [11.0] 本稿では,1つの注釈付き画像からプロンプトを自動的に生成する,SAMに基づくワンショットポリープセグメンテーションフレームワークOP-SAMを提案する。
本手法では,意味的ラベル伝達のための相関ベース事前生成(CPG)と,ポリプサイズに適応するためのスケールカスケード事前融合(SPF)を導入する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:19:56 GMT)
MMS Player: an open source software for parametric data-driven animation of Sign Language avatars [11.0] MMS-Playerは、MMS(MultiModal Signstream)と呼ばれる新しい手話表現フォーマットから手話アニメーションを合成することができる。
MMSは、記号、タイミング、および屈折の並行実行に関する情報を追加することで、光沢ベースの表現を強化する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:06:13 GMT)
Explicit Context Reasoning with Supervision for Visual Tracking [11.0] RSTrackは3つのコアメカニズムを通じてコンテキスト推論を明示的にモデル化し、監督する。
実験の結果,RSTrackは複数のベンチマークデータセット上で最先端のパフォーマンスを実現することがわかった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:07:50 GMT)
Routine: A Structural Planning Framework for LLM Agent System in Enterprise [11.0] エンタープライズ環境におけるエージェントシステムの展開は、しばしばいくつかの課題によって妨げられる。
一般的なモデルは、ドメイン固有のプロセス知識が欠如し、非組織的な計画、主要なツールの欠如、実行の安定性が低下します。
本稿では、明確な構造、明示的な命令、シームレスなパラメータパッシングを備えたマルチステップエージェント計画フレームワークであるRuleineを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:01:32 GMT)
ResidualPlanner+: a scalable matrix mechanism for marginals and beyond [11.0] ノイズの限界は、データリリースを保護する一般的な形式の機密性である。
本稿ではResidualPlannerとResidualPlanner+という2つの高度にスケーラブルな行列機構を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:43:11 GMT)
An effective physics-informed neural operator framework for predicting wavefields [10.9] 我々はヘルムホルツ方程式を効率的に解くために物理インフォームド畳み込みニューラル演算子(PICNO)を導入する。
PICNOは、均質媒質と速度モデルに対応する背景波動場を入力関数空間とし、散乱波動場を出力関数空間として生成する。
限られたトレーニングサンプルであっても、精度の高い精度の予測が可能になる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:22:30 GMT)
Unpacking Ambiguity: The Interaction of Polysemous Discourse Markers and Non-DM Signals [10.9] 英語におけるDMポリセミーと非DM信号の共起関係について検討する。
ポリセムDMは、より多様な非DMと共起するが、共起信号の総数は必ずしも増加しない。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:36:31 GMT)
Stable and Accurate Orbital-Free DFT Powered by Machine Learning [10.8] ホーエンバーグとコーンは、電子エネルギーと1粒子の電子密度は、密度に関して機能するエネルギーを最小化することで得られることを示した。
この研究は、機械学習が理論とホヘンベルクとコーンのビジョンの実践的実現の間のギャップを狭める上で重要な役割を果たすことを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:04:26 GMT)
Universal Wavelet Units in 3D Retinal Layer Segmentation [10.8] 本稿では,オプティカルコヒーレンス・トモグラフィ(OCT)ボリュームから3次元網膜層セグメンテーションに波長可変ウェーブレット単位(UwUs)を適用した最初の研究について述べる。
我々は3つのウェーブレットベースのダウンサンプリングモジュール、OrthLattUwU、BiorthLattUwU、LS-BiorthLattUwUを運動補正MGU-Netアーキテクチャに統合する。
特にLS-BiorthLattUwUによるDiceスコアの精度向上を図り,ボリューム医用画像における可変ウェーブレットフィルタの有用性を強調した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:11:33 GMT)
MRI-CORE: A Foundation Model for Magnetic Resonance Imaging [10.7] MRI-CORE(MRI-CORE)は、身体18箇所で1万1000万回以上のMRIボリュームから600万回以上スライスして訓練された視覚基盤モデルである。
実験では,13個のデータ制限セグメンテーションタスク,画像分類,ゼロショットセグメンテーションにおいて,最先端手法よりも優れた性能を示す。
また、最も有用な基礎モデルを生成する戦略と、事前学習タスクデータと下流タスクデータとの類似性に関する新たな分析結果も提示する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:20:31 GMT)
Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning [10.7] 本稿では,Qwen3基礎モデルに基づく金融大規模言語モデルのエージェントFin-R1シリーズを紹介する。
我々の最適化アプローチは、高品質で体系的な財務タスク分類と包括的信頼性保証フレームワークを統合している。
実験により,Agensar-Fin-R1が財務タスクにおける最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:52:16 GMT)
Toward Scalable Video Narration: A Training-free Approach Using Multimodal Large Language Models [10.6] 本稿では,ビデオキャプションを高密度に生成する新しいトレーニングフリーパイプラインであるVideoNarratorを紹介する。
VideoNarratorは、既製のMLLMとビジュアル言語モデルがキャプションジェネレータとして機能する柔軟なパイプラインを活用することで、課題に対処する。
実験の結果,これらの成分の相乗的相互作用はビデオナレーションの品質と精度を著しく向上させることが示された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:16:37 GMT)
Note on Follow-the-Perturbed-Leader in Combinatorial Semi-Bandit Problems [10.4] 小型不変半帯域問題におけるFollow-the-Perturbed-Leader(FTPL)ポリシーの最適性と複雑性について検討する。
我々は条件付き幾何再サンプリング(CGR)をサイズ不変半帯域設定に拡張し、計算の複雑さをオリジナルのGRの$O(d2)$から$Oleft(mdleft(log(d/m)+1right)$に縮める。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:29:46 GMT)
MAN++: Scaling Momentum Auxiliary Network for Supervised Local Learning in Vision Tasks [10.2] ローカル学習を教師するMOmentum Auxiliary Network++ (MAN++) を提案する。
MAN++は、GPUメモリ使用量を大幅に削減しつつ、エンドツーエンドのトレーニングに匹敵するパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:50:19 GMT)
Quantum thermodynamics in a rotating BTZ black hole spacetime [10.2] 我々は、スカラー背景場に対する複雑な応答を符号化する検出器の完全なダイナミクスを導出する。
BTZブラックホールからホーキング放射を受けると、検出器の熱分解過程に固有の非対称性が現れる。
特に、検出器は非平衡系の量子Mpemba効果に類似して、冷却するよりも常に速く加熱する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:32:17 GMT)
An Integrated Framework of Prompt Engineering and Multidimensional Knowledge Graphs for Legal Dispute Analysis [10.0] このフレームワークは3段階の階層的なプロンプト構造と3層知識グラフを含んでいる。
4つの支援方法により、正確な法的概念の検索が可能となる。
感度は9.9%-13.8%、特異度は4.8%-6.7%、引用精度は22.4%-39.7%だった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:41:16 GMT)
Multi-Label Classification with Generative AI Models in Healthcare: A Case Study of Suicidality and Risk Factors [9.9] 本研究では、自殺関連因子(SrFs)の多ラベル分類(MLC)における生成型大規模言語モデル(LLMs)、特にGPT-3.5およびGPT-4.5の使用について検討する。
本稿では,新しいエンドツーエンド生成パイプラインを提案するとともに,ラベルセットレベルのメトリクスや,エラー解析のためのマルチラベル混同行列など,高度な評価手法を提案する。
本研究は,SIとSAの融合などの系統的誤りパターンを明らかにし,ラベル付けに慎重な傾向を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:44:44 GMT)
Koel-TTS: Enhancing LLM based Speech Generation with Preference Alignment and Classifier Free Guidance [9.9] Koel-TTSは拡張エンコーダデコーダトランスフォーマーTSモデルのスイートである。
拡張エンコーダデコーダトランスフォーマーTSモデルのスイートであるKoel-TTSを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:32:13 GMT)
Reducing GPU Memory Fragmentation via Spatio-Temporal Planning for Efficient Large-Scale Model Training [9.8] 本稿では,ディープラーニングフレームワークのためのGPUメモリアレータSTWeaverを紹介し,メモリ割り当て動作の時間的規則性を利用してフラグメンテーションを低減する。
プラグPyTorchとして開発されたSTWeaverは、密度とスパースモデルの両方で平均79.2%(最大100%)のフラグメンテーション比を、無視できるオーバーヘッドで減少させる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:39:07 GMT)
Can External Validation Tools Improve Annotation Quality for LLM-as-a-Judge? [9.7] 大規模言語モデル(LLM)の評価とフィードバックを提供するため、モデル応答に対するペアワイズな嗜好が広く収集されている。
一部のドメインでは、高品質なペアワイズ比較はAIと人間から得るのが難しい。
本稿では,これらのドメインに対して高品質なフィードバックを提供するためのツール利用エージェントシステムを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:57:09 GMT)
The FIX Benchmark: Extracting Features Interpretable to eXperts [9.7] FIX(Features Interpretable to eXperts)は、機能の集合が専門家の知識とどの程度うまく一致しているかを測定するベンチマークである。
ドメインエキスパートと共同でFIXScoreを提案する。
特徴に基づく一般的な説明手法は、専門家が特定した知識と不一致であることがわかった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:03:48 GMT)
Influence of dark matter on quantum entanglement and coherence in curved spacetime [9.6] 完全流体暗黒物質(PFDM)は、現代の宇宙論において重要な課題である。
PFDMは量子エンタングルメントとコヒーレンスを強化または分解することができる。
異なる量子場は、曲線化された時空において、PFDMに対する大きな異なる応答を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:34:46 GMT)
Risk In Context: Benchmarking Privacy Leakage of Foundation Models in Synthetic Tabular Data Generation [9.6] 低データ設定では、しばしば合成データの主要なモチベーションであり、これらのモデルは機密レコードに過度に適合し、頻繁な再トレーニングを必要とする。
最近の研究では、大規模な事前トレーニングされたトランスフォーマーを使用して、インコンテキスト学習(ICL)を通じて行を生成する。
3つの基礎モデル(GPT-4o-mini, LLaMA 3.3 70B, TabPFN v2)を、健康、金融、政策から35の現実世界のテーブルの4つのベースラインに対してベンチマークする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:59:08 GMT)
EBaReT: Expert-guided Bag Reward Transformer for Auto Bidding [9.5] 我々は,自動入札をシーケンス決定問題として定式化する。
本稿では,データ品質と不確実性報酬に関する懸念に対処するため,エキスパート誘導型バグリワード変換器(EBaReT)を提案する。
提案手法は,最先端入札方式に比べて優れた性能を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:56:36 GMT)
EndoControlMag: Robust Endoscopic Vascular Motion Magnification with Periodic Reference Resetting and Hierarchical Tissue-aware Dual-Mask Contro [9.5] 本研究では,内視鏡環境に適合したマスク条件の血管運動拡大機能を備えたトレーニングフリーフレームワークであるEndoControlMagを紹介する。
提案手法は2つの重要なモジュールを特徴付ける: エラーの蓄積を防ぐために、動画を動的に更新された参照フレームでショートオーバーラップするクリップに分割する定期参照リセット方式。
本研究では,EndoVMM24データセット上でのEndoControlMagの評価を行った。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:11:23 GMT)
Generative Sign-description Prompts with Multi-positive Contrastive Learning for Sign Language Recognition [9.0] 本稿では,GSP-MC法を提案する。
GSP-MC法はまた、二重エンコーダアーキテクチャを用いて、階層的なスケルトン特徴と複数のテキスト記述を双方向にアライメントする。
実験では、中国のSLR500(97.1%)とトルコのAUTSLデータセット(97.07%の精度)の既存の手法に対する最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:46:21 GMT)
Revealing Bias Formation in Deep Neural Networks Through the Geometric Mechanisms of Human Visual Decoupling [9.0] ディープニューラルネットワーク(DNN)はしばしば、オブジェクト認識中に特定のカテゴリに対するバイアスを示す。
本稿では,クラス固有の知覚多様体の幾何学的複雑さをモデルバイアスにリンクする幾何学的解析フレームワークを提案する。
本稿では,知覚多様体の幾何学的性質を計算するために設計された知覚多様体幾何学ライブラリを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:04:11 GMT)
The BabyView dataset: High-resolution egocentric videos of infants' and young children's everyday experiences [9.0] このデータセットには、6か月から3歳までの子どもの、家庭内での縦断的、縦断的な自己中心的なビデオが含まれている。
我々は、自己教師型言語と視覚モデルを訓練し、配布外タスクへの移行を評価する。
私たちのデータセットは、堅牢で人間らしいAIシステムにとって、オープンな課題のひとつです。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:34:57 GMT)
SDGOCC: Semantic and Depth-Guided Bird's-Eye View Transformation for 3D Multimodal Occupancy Prediction [8.7] SDG-OCCと呼ばれる新しいマルチモーダル占有予測ネットワークを提案する。
ジョイントセマンティックとディープ誘導ビュー変換と、融合により占有されるアクティブ蒸留が組み込まれている。
提案手法は,Occ3D-nuScenesデータセットをリアルタイムに処理することで,最先端(SOTA)性能を実現する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:49:40 GMT)
From Text to Actionable Intelligence: Automating STIX Entity and Relationship Extraction [8.6] AZERGはセキュリティアナリストが自動的に構造化STIX表現を生成するのを支援するために設計されたツールである。
タスク固有の微調整を適用し、関連するエンティティを正確に抽出し、STIX仕様に従ってそれらの関係を推測する。
我々のモデルは、T1の84.43%、T2の88.49%、T3の95.47%、現実世界のシナリオでの84.60%のF1スコアを達成した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:27:09 GMT)
Swift-Sarsa: Fast and Robust Linear Control [8.3] Javed、Sharifnassab、Sutton(2024年)は、True Online TD($lambda$)をステップサイズ最適化で拡張する、TD学習のための新しいアルゴリズム、SwiftTDを導入した。
SwiftTDは、Atariゲームから派生した様々な予測タスクでTrue Online TD($lambda$)とTD($lambda$)を上回った。
我々はSwiftTDを拡張して、$textit-Sarsa$というオンデマンドの強化学習アルゴリズムを開発することで、制御問題に対処する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:08:38 GMT)
Neural Approaches for Multi-Objective Routing on Multigraphs [8.3] マルチグラフ上での多目的ルーティングに対処するグラフニューラルネットワークに基づく2つの手法を提案する。
最初のアプローチは、ツアーが完了するまでエッジを自動回帰的に選択することで、マルチグラフ上で直接動作する。
第2のモデルは、まず学習されたプルーニング戦略を介してマルチグラフを単純化し、その結果の単純なグラフのルーティングを実行する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:31:06 GMT)
Temporally-Constrained Video Reasoning Segmentation and Automated Benchmark Construction [8.2] 本稿では,対象対象物が文脈的関連性を持つ場合に暗黙的に推論することを必要とする新しいタスクの定式化である,時間制約付きビデオ推論セグメンテーションを導入する。
また、MVORデータセットからの映像を用いた52のサンプルを含む時間制約付きビデオRSデータセットであるTCVideoRSを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:59:21 GMT)
Working with AI: Measuring the Occupational Implications of Generative AI [8.2] ユーザとMicrosoft Bing Copilot間の200万の匿名会話のデータセットを分析します。
私たちは、人々が情報収集や執筆に携わるAI支援を求める最も一般的な作業活動を見つけます。
AI自身が実行している最も一般的な活動は、情報と援助、執筆、教育、助言を提供することである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:32:56 GMT)
Designing for Difference: How Human Characteristics Shape Perceptions of Collaborative Robots [8.1] 反社会的ロボット行動は一貫して最低と評価され、高齢者とのコラボレーションはより敏感な評価を導いた。
これらの結果は、人間の特徴と相互作用パラダイムの両方が協調ロボットの受容性に影響を与えることを示唆している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:36:08 GMT)
Beyond English: Evaluating Automated Measurement of Moral Foundations in Non-English Discourse with a Chinese Case Study [8.1] 本研究では、非英語コーパスにおける道徳的基礎(MF)を測定するための計算手法について検討する。
本研究は,中国語を事例として,機械翻訳テキスト,局所言語語彙,多言語言語モデル,および多言語モデル(LLM)に英語リソースを適用し,非英語テキストのMFを測定することの有効性を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:23:40 GMT)
Search-based Generation of Waypoints for Triggering Self-Adaptations in Maritime Autonomous Vessels [8.1] 海上自律船(AV)の自己適応により、予期せぬ状況に対処する行動に適応することができる。
AVのナビゲーションソフトウェアに焦点をあて、適応を通して操作中の動作に適応する必要がある。
本稿では,WPgenと呼ばれる多目的探索に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:10:12 GMT)
Towards a deeper GCN: Alleviate over-smoothing with iterative training and fine-tuning [7.8] Graph Convolutional Networks (GCNs) は、過度なスムーシングによるディープアーキテクチャのパフォーマンス低下に悩まされている。
本稿では,その表現能力を維持しつつ,深いGCNを段階的に構築する新たなトレーニング戦略である層ワイド・グラデュアル・トレーニング(LGT)を提案する。
LGTはベンチマークデータセットで最先端のパフォーマンスを実現し、32層設定でも精度を大幅に向上する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:07:33 GMT)
Improving U-Net Confidence on TEM Image Data with L2-Regularization, Transfer Learning, and Deep Fine-Tuning [7.8] TEM画像のナノスケール欠陥は、複雑なコントラスト機構と複雑な欠陥構造により、はるかに大きな変化を示す。
これらの課題は多くの場合、ラベル付きデータが少なくなり、アノテーションエラーの率も高くなる。
本研究では,自然画像に用いた大規模・事前学習モデルを用いて移動学習について検討した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:27:33 GMT)
Distilled Large Language Model in Confidential Computing Environment for System-on-Chip Design [7.8] 大規模言語モデル(LLM)は、回路設計タスクでますます使われ、通常、複数の訓練を経ている。
トレーニングされたモデルと関連するトレーニングデータは、秘密の知的財産権(IP)と見なされ、露出から保護されなければならない。
Confidential Computingは、Trusted Execution Environments(TEEs)を通じてデータとモデルを保護するための有望なソリューションを提供する
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:41:27 GMT)
The Trust Fabric: Decentralized Interoperability and Economic Coordination for the Agentic Web [7.4] AIエージェントエコシステムの断片化は、相互運用性、信頼、経済調整に対する緊急の要求を生み出している。
3つのコアイノベーションを中心に構築された分散フレームワークであるNanda Unified Architectureを紹介します。
Systemは経済調整のためのX42/H42マイクロペイメントと、Synergeticsの特許であるAgentTalkプロトコルを組み込んだセキュリティフレームワークMAESTROを導入している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:28:06 GMT)
Bayesian preference elicitation for decision support in multiobjective optimization [7.3] 我々は、ペア比較に基づいて、ベイズモデルを用いて意思決定者のユーティリティ関数を推定する。
原則的エレケーション戦略は、探索とエクスプロイトのバランスをとるために、クエリを対話的に選択する。
溶出相の最後には、高品質な溶液の還元メニューを生成する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:14:20 GMT)
Are Foundation Models All You Need for Zero-shot Face Presentation Attack Detection? [7.3] 顔認識システムは攻撃提示(AP)に対して脆弱である
本稿では,ゼロショットプレゼンテーションアタック検出(PAD)手法について述べる。
まず,確立された実験シナリオにおける基礎モデルの有効性と一般性を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:38:21 GMT)
Practical Insights into Knowledge Distillation for Pre-Trained Models [7.2] 本研究では,事前学習モデルにおける知識蒸留(KD)プロセスの強化について検討する。
事前訓練されたモデル間で知識を伝達するための多くのKDアプローチが採用されているにもかかわらず、KDの応用に関する包括的な理解は欠如している。
本研究は,標準KD,調整KD(最適化温度および重みパラメータ),深層相互学習,データ分割KDなど,複数のKD技術の比較を行った。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:21:30 GMT)
Vision-based Conflict Detection within Crowds based on High-Resolution Human Pose Estimation for Smart and Safe Airport [7.2] 本稿では,集団における衝突行動の分類を行う機械学習モデルの開発について述べる。
支持ベクトルマシン(SVM)は94.37%の精度を達成した。
結果として得られたモデルは、膨大な数の潜在的な乗客に対処するために改良が加えられた場合、空港内に配備される可能性がある。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:57:54 GMT)
The spatiotemporal Born rule is quasiprobabilistic [7.1] 補正項によって逐次測定に関連する確率を修正した場合、二部演算子によって一意に符号化された準確率分布が得られることを示す。
また、時相ボルン則とともに量子チャネルに対するベイズ反転の概念が適用されると、準確率的ベイズ則の逐次測定に自然に到達することを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:02:13 GMT)
On small perturbations of coherent information [7.1] 量子キャパシティ(Quantum capacity)は、任意の小さな誤差の確率で量子チャネルによって送信できる量子情報の量である。
我々は、入力状態の小さな摂動に対して量子チャネルのコヒーレントな情報の振る舞いを分析する摂動的手法を開発する。
我々の基準が1ショットの量子容量の超増感性、また1ショットのプライベート容量と1ショットの量子容量の間の正のギャップを検出するのにいかに十分な条件をもたらすかを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:02:27 GMT)
Navigating Large-Pose Challenge for High-Fidelity Face Reenactment with Video Diffusion Model [6.9] Face Reenactmentは、駆動ビデオから静的なソースイメージに動きを移すことで、リアルなトーキングヘッドビデオを生成することを目的としている。
大規模なポーズ変化下での高忠実度顔再現のための新しいフレームワークである顔再現ビデオ拡散モデル(FRVD)を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:23:43 GMT)
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm [6.9] textbfMotion-Condition-Motionを提案する。これは様々なタスクを3つの概念(震源運動、条件運動、目標運動)で統一した定式化を可能にする。
このパラダイムに基づいて,修正フローを組み込んだ統合フレームワーク textbfMotionLab を提案し,ソース動作からターゲット動作へのマッピングを学習する。
特に、MotionLabは有望な機能と推論効率を、複数のベンチマークで示しています。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:47:07 GMT)
iShumei-Chinchunmei at SemEval-2025 Task 4: A balanced forgetting and retention multi-task framework using effective unlearning loss [6.8] 機械学習は、大規模言語モデルからのセンシティブな情報を効率的に消去することに焦点を当てている。
そこで本研究では, より制御可能な非学習損失, エフェクト・アンラーニング損失を提案する。
我々のシステムは大会のリーダーボードで5位にランクインした。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:21:54 GMT)
Towards Enforcing Company Policy Adherence in Agentic Workflows [6.8] 大規模言語モデル(LLM)エージェントは、従来のビジネスプロセス自動化に代わる柔軟でスケーラブルな代替手段を約束する。
本研究では,エージェントにおけるビジネスポリシーの遵守を強化するための決定論的,透過的,モジュール的な枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:00:37 GMT)
A Method for the Architecture of a Medical Vertical Large Language Model Based on Deepseek R1 [6.6] 本稿では,知識獲得,モデル圧縮,計算強化といった課題に対処する,軽量な医療用大規模言語モデルアーキテクチャを提案する。
我々は,Low-Rank Adaptation (LoRA) を用いて,DeepSeek-R1-Distill-70BからDeepSeek-R1-Distill-7Bへの知識伝達パイプラインを設計した。
提案手法では,USMLEでは92.1%の精度を維持しながら,メモリ消費を64.7%削減し,12.4%のレイテンシをベースライン推論モデルと比較した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:26:53 GMT)
A Review of Privacy Metrics for Privacy-Preserving Synthetic Data Generation [6.5] 差分プライバシー(DP)は、個人が機密データを共有する際にどのように保護されているかを確立するPP-SDGメカニズムの特性である。
しかし、DPが提示するプライバシー予算(varepsilon$)を解釈することは困難である。
本稿では、17の異なるプライバシー指標の仮定と数学的定式化について述べる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:17:56 GMT)
Dutch CrowS-Pairs: Adapting a Challenge Dataset for Measuring Social Biases in Language Models for Dutch [6.5] オランダ語モデルにおけるバイアスを測定するための、米国固有のCrowS-Pairsデータセットのオランダ版が紹介されている。
得られたデータセットは、性的指向、ジェンダー、障害などの9つのカテゴリのバイアスをカバーする1463の文ペアで構成されている。
CrowS-Pairsデータセットの英語版とフランス語版を使用して、英語(BERTとRoBERTa)とフランス語(FlauBERTとCamemBERT)でバイアスを評価した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:38:02 GMT)
Biases in LLM-Generated Musical Taste Profiles for Recommendation [6.5] 推奨のための大規模言語モデル(LLM)は、消費データから自然言語(NL)のユーザ嗜好プロファイルを生成することができる。
しかし、ユーザーがこれらのプロフィールを自分の好みを正確に表現しているかどうかは不明だ。
本研究では、音楽ストリーミングの文脈でこの問題について研究し、大規模で文化的に多様なカタログによってパーソナライズに挑戦する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:44:10 GMT)
Pyramid Hierarchical Masked Diffusion Model for Imaging Synthesis [6.5] 本稿では,新しい画像合成ネットワークであるピラミッド階層型マスケッド拡散モデル(PHMDiff)を提案する。
2つの挑戦的データセットの実験により、PHMDiffはPak Signal-to-Noise Ratio(PSNR)とStructure similarity Index Measure(SSIM)の両方で優れた性能を発揮することが示された。
医療画像モダリティの多次元画像合成フレームワークであるPHMDiffモデルは,他の手法に比べて大きな優位性を示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:30:54 GMT)
MGSR: 2D/3D Mutual-boosted Gaussian Splatting for High-fidelity Surface Reconstruction under Various Light Conditions [6.4] 新しいビュー合成(NVS)と表面再構成(SR)は3次元ガウススプラッティングにおける必須課題である(3D-GS)
表示品質と3次元再構成精度を両立させる表面再構成用2D/3D多孔型ガウススプラッティングであるMGSRを提案する。
我々はMGSRをオブジェクトレベルとシーンレベルの両方において、多種多様な合成および実世界のデータセットで評価し、レンダリングおよび表面再構成において高い性能を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:29:01 GMT)
AI-enhanced conversational agents for personalized asthma support Factors for engagement, value and efficacy [6.4] 英国における喘息関連死亡件数はヨーロッパで最も多い。
基礎治療を受ける患者はわずか30%である。
喘息を患う人々にリーチするための代替アプローチが必要だ。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:21:00 GMT)
GATEBLEED: Exploiting On-Core Accelerator Power Gating for High Performance & Stealthy Attacks on AI [6.4] 本稿では,CPUの動作限界を抑えるために使用したアグレッシブパワーゲーティングにより,タイミング側および隠蔽チャネルであるGATEBLEEDを示す。
GateBLEEDは、従来の保護措置の下でも、ローカルおよびリモートのタイミング推定のリスクを負う。
我々は,Intel AMXに最適化されたトランスモデルに対して,エンド・ツー・エンドのマイクロアーキテクチャ推論攻撃を実装し,メンバシップ推定精度81%を達成する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:41:43 GMT)
Learning Text Styles: A Study on Transfer, Attribution, and Verification [6.4] この論文は、3つの相互接続された柱を通してテキストスタイルの計算的理解と操作を促進する。
テキスト・スタイル・トランスファー (TST) は、コンテンツ保存中にスタイル特性を変更し、オーサリング・アトリビューション (AA) は、スタイリスティック・フィンガープリントによるテキストの作者を特定し、オーサリング・検証 (AV) は、2つのテキストが同一のオーサシップを共有するかどうかを決定する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:38:39 GMT)
GEMINUS: Dual-aware Global and Scene-Adaptive Mixture-of-Experts for End-to-End Autonomous Driving [6.3] GEMINUSは、Global Expert、Scene-Adaptive Experts Group、Dual-Aware Routerを特徴とするエンドツーエンドの自動運転フレームワークである。
Global Expertはデータセット全体に基づいてトレーニングされており、堅牢なパフォーマンスを備えている。
Scene-Adaptive Expertsは、対応するシーンサブセットに基づいてトレーニングされ、適応的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:58:25 GMT)
T-GRAB: A Synthetic Diagnostic Benchmark for Learning on Temporal Graphs [6.2] 時間的グラフ推論ベンチマーク(T-GRAB)を導入し,TGNNの時間的推論能力を体系的に探究する。
T-GRABは、主要な時間的スキルを分離する制御された解釈可能なタスクを提供する。
これらの課題に対して,11の時間グラフ学習手法を評価し,時間パターンを一般化する能力の根本的な欠点を明らかにした。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:14:41 GMT)
Pragmatic Policy Development via Interpretable Behavior Cloning [6.2] 本稿では,患者の行動方針の解釈可能なモデルを用いて,各患者の状態において最も頻繁に選択される行動から治療方針を導出する。
このフレームワークによって導かれるポリシーは,オフラインのRLで得られるものに対して,解釈可能な代替手段を提供することで,現在の実践を上回り得ることを実証する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:34:35 GMT)
Analogy making as amortised model construction [5.9] 人間は、新しい状況をナビゲートするために内部モデルを構築します。
これらのプロセスにおいて類推が中心的な役割を担っていると我々は主張する。
従来のコンストラルから派生した抽象モジュールが、新しいモジュールの組み立て可能なビルディングブロックとして機能するフレームワークをスケッチする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:16:45 GMT)
WhatsApp Tiplines and Multilingual Claims in the 2021 Indian Assembly Elections [5.8] 本研究は、2021年のインド議会選挙で451人のユーザーから580人のユニーククレーム(チップ)を分析した。
我々は、これらの主張を選挙、COVID-19、その他の3つのカテゴリーに分類し、言語間のバリエーションを観察する。
その結果、言語間でのクレームの類似性が明らかとなり、同じファクトチェッカーに複数の言語でヒントを提出するユーザもいた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:35:42 GMT)
The Impact of Pseudo-Science in Financial Loans Risk Prediction [5.8] 金融融資におけるリスク予測への機械学習の直接適用による人々の行動予測における疑似科学的仮定の社会的影響について検討する。
本研究は,社会的に最適なモデルが,この下流作業において有意な精度の損失を生じさせないことを示すものである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:53:13 GMT)
Revisiting Pre-trained Language Models for Vulnerability Detection [5.7] プレトレーニング言語モデル(PLM)の急速な進歩は、様々なコード関連タスクに対して有望な結果を示した。
しかし、現実世界の脆弱性を検出する効果は依然として重要な課題である。
本稿では、より小さなコード固有のPLMと大規模PLMにまたがる17のPLMを広範囲に評価するRevisitVDを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:58:49 GMT)
LDRFusion: A LiDAR-Dominant multimodal refinement framework for 3D object detection [5.7] 既存のLiDAR-Camera融合法は3次元物体検出において大きな成果を上げている。
我々は,LDRFusionを提案する。LDRFusionは,マルチセンサフュージョンのための新しい2段階改良フレームワークである。
当社のフレームワークは,複数のカテゴリと難易度をまたいだパフォーマンスを継続的に達成しています。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:35:52 GMT)
R1-Track: Direct Application of MLLMs to Visual Object Tracking via Reinforcement Learning [5.6] 単一のオブジェクト追跡は、その後のビデオフレームにおけるターゲットのスケールを連続的にローカライズし、推定することを目的としている。
Qwen2.5-VLはイメージペア間のテンプレートマッチングに苦労している。
グループ相対政策最適化(GRPO)強化学習法を用いてQwen2.5-VLを微調整した。
結果として得られたR1-Trackは、GOT-10kベンチマークで顕著な性能を達成した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:39:40 GMT)
Efficient quantum state tomography with auxiliary systems [5.6] 量子状態トモグラフィ(quantum state tomography)は、未知の量子状態の密度行列を再構成するために用いられる量子情報科学の技法である。
量子システムのサイズが大きくなるにつれて、量子状態トモグラフィーの測定設定とサンプリング要求の数は、量子ビットの数とともに指数関数的に増加する。
本研究は, 測定条件の低減とサンプリング効率の向上を図るため, 補助システムに基づく状態トモグラフィー手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:40:14 GMT)
Analysis of Post-Quantum Cryptography in User Equipment in 5G and Beyond [5.4] 量子コンピューティングは、ポスト量子暗号(PQC)への移行につながった。
本稿では,ユーザ機器(UE)におけるNIST選択PQCアルゴリズムの5Gネットワーク上でのUE通信に対する実装と性能評価について述べる。
我々は、様々な暗号化構成とクライアント負荷の下で、ハンドシェイクレイテンシ、CPUおよびメモリ使用率、帯域幅、再送信率に基づいて性能を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:21:16 GMT)
Perovskite-R1: A Domain-Specialized LLM for Intelligent Discovery of Precursor Additives and Experimental Design [5.4] ペロブスカイト太陽電池 (PSCs) は、次世代の太陽電池技術の主要な候補として急速に出現している。
長期の安定、環境の持続可能性、スケーラブルな製造といった課題は、商業化を妨げ続けている。
プリキュラ付加工学はPSCの性能と耐久性を向上させることでこれらの問題に対処することを約束している。
本稿では,PSC前駆体の発見と設計に適した高度な推論機能を備えた特殊大言語モデル(LLM)であるPerovskite-R1を紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:48:32 GMT)
L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models [5.3] 量子化学習(QAT)とローランド適応(LoRA)を統合したL4Qを提案する。
メモリ最適化レイヤ設計を採用することで、L4QはQATのメモリオーバーヘッドを大幅に削減し、トレーニングコストはLoRAに匹敵する。
この量子化法と微調整法の組み合わせにより精度が向上することを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:10:11 GMT)
Voice-based AI Agents: Filling the Economic Gaps in Digital Health Delivery [5.2] 本稿では,大言語モデル(LLM)を利用した音声アシスタントが,予防ケアと継続的患者モニタリングの強化に果たす役割について検討する。
本稿では,AIエージェントが費用対効果の高い医療サービスをいかに提供できるかを示す経済モデルを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:01:06 GMT)
Multilevel Picard approximations and deep neural networks with ReLU, leaky ReLU, and softplus activation overcome the curse of dimensionality when approximating semilinear parabolic partial differential equations in $L^p$-sense [5.2] 我々は,Lmathfrakp$-senseでKolmogorov PDEの解を近似できるマルチレベルPicard近似とReLUによるディープニューラルネットワーク,リークReLU,ソフトプラスアクティベーションを証明した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:23:15 GMT)
INTEGRALBENCH: Benchmarking LLMs with Definite Integral Problems [5.2] INTEGRALBENCH(インテガルベンチ)は、大言語モデル(LLM)の性能を確定的な積分問題で評価するために設計されたベンチマークである。
現状の9つのLCMの評価結果から,問題難易度とモデル精度の相関が顕著であることがわかった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:44:36 GMT)
Robust Noisy Pseudo-label Learning for Semi-supervised Medical Image Segmentation Using Diffusion Model [5.2] 半教師付き医用画像セグメンテーションは、限られた注釈付きデータと豊富なラベルなしデータを利用して正確なセグメンテーションを実現することを目的としている。
既存の手法は、擬似ラベルが導入したノイズにより、潜在空間における意味分布を構成するのにしばしば苦労する。
提案手法は,プロトタイプに基づくコントラッシブコントラストの整合性を強制することにより,意味ラベルの遅延構造に制約を導入する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:21:55 GMT)
A Hybrid CNN-VSSM model for Multi-View, Multi-Task Mammography Analysis: Robust Diagnosis with Attention-Based Fusion [5.2] 乳がんの早期かつ正確な検診は乳がん検出に不可欠である。
既存のAIアプローチは、単一ビューのインプットや単一タスクのアウトプットに注目して、不足している。
本研究では,4つの標準マンモグラフィビュー全てを処理する,新しいマルチビュー・マルチタスクハイブリッドディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:52:18 GMT)
Optimizing Entanglement and Bell Inequality Violation in Top Anti-Top Events [5.2] スピン-スピン相関を対角化する基礎は,スピン相関,絡み合い,ベル不等式違反の最大化に最適であることを示す。
LHCと将来の$e+e-$コライダーのイベントにおいて,絡み合いやベルの不等式違反に対する感受性を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:40:34 GMT)
Pixels to Principles: Probing Intuitive Physics Understanding in Multimodal Language Models [5.1] 本稿では,直感的な物理課題に対するMLLM(State-of-the-the-art multimodal large language model)の体系的評価について述べる。
オープンソースモデルであるInternVL 2.5、Qwen 2.5 VL、LLaVA-OneVision、およびプロプライエタリなGemini 2.0 Flash Thinkingを評価した。
最新のモデルでさえ、不確実なシナリオと物理的に妥当な区別を確実にするのに苦労している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:24:42 GMT)
Fundamental limits of distributed covariance matrix estimation via a conditional strong data processing inequality [5.1] 本研究では,複数のエージェントがガウス以下のランダムベクトルから引き出されたサンプルの異なる成分を観測するシナリオについて検討する。
中央サーバは、各エージェントが通信する限られたビット数を用いて、完全な共分散行列を推定しようとする。
我々の主な技術ツールは、条件付き強データ処理不等式(C-SDPI)係数と呼ばれる、強データ処理不等式(SDPI)の新たな一般化である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:50:02 GMT)
Romance, Relief, and Regret: Teen Narratives of Chatbot Overreliance [5.1] われわれは13~17歳のユーザーによるReddit投稿318件を分析した。
十代の若者たちは、感情的なサポートや創造的な表現にチャットボットを使い始めるのが普通でした。
彼らの投稿では、心理的苦痛の兆候、再発のサイクル、そして解離の困難が繰り返し現れていた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:23:27 GMT)
Attention-Based Fusion of IQ and FFT Spectrograms with AoA Features for GNSS Jammer Localization [4.7] ジャミング装置はグローバルナビゲーション衛星システム(GNSS)からの信号を妨害する
古典アングル・オブ・アーリバル (AoA) 法はマルチパス環境において精度を低下させる。
本研究では,ジャミング源の距離,方位,標高を推定しながら干渉の検出と分類を行う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:44:20 GMT)
Deep RL Dual Sourcing Inventory Management with Supply and Capacity Risk Awareness [4.6] 介入モデルを利用して大規模最適化問題に強化学習(RL)を効率的に適用する方法を検討する。
我々は,サプライチェーン最適化におけるマルチソース多周期在庫管理問題である,現実世界の挑戦的アプリケーションに対するアプローチを実証する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:26:31 GMT)
A Social Data-Driven System for Identifying Estate-related Events and Topics [4.5] 本稿では、ソーシャルメディアコンテンツから不動産関連事象を検出し分類するための言語モデルに基づくシステムを提案する。
我々のシステムは階層的な分類フレームワークを用いて、まず関連するポストをフィルタリングし、それらを実行可能な不動産関連トピックに分類する。
この統合されたアプローチは、都市管理、運用対応、状況認識のためのタイムリーでデータ駆動的な洞察をサポートする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:48:42 GMT)
FedWSQ: Efficient Federated Learning with Weight Standardization and Distribution-Aware Non-Uniform Quantization [4.5] フェデレートラーニング(FL)は、データ不均一性や通信制約といった重要な課題により、しばしばパフォーマンス劣化に悩まされる。
We present a novel FL framework called FedWSQ, which integrates weight standardization (WS) and the proposed distribution-aware non-uniform Quantization (DANUQ)。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:52:09 GMT)
A Collaborative Framework Integrating Large Language Model and Chemical Fragment Space: Mutual Inspiration for Lead Design [4.5] AutoLeadDesignは、化学フラグメントを持つ大規模言語モデルでエンコードされた広範なドメイン知識を刺激する鉛化合物設計フレームワークである。
2つの臨床関連ターゲット(PRMT5とSARS-CoV-2 PLpro)をターゲットにした実験的な鉛設計キャンペーンは、リード化合物のデノボ生成におけるAutoLeadDesignの能力を示している。
設計プロセスのトレースにより、AutoLeadDesignは、伝統的に専門家の意思決定に依存しているフラグメントベースのドラッグデザインと類似したメカニズムを共有していることがわかった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:22:33 GMT)
CHIMERA: Compressed Hybrid Intelligence for Twin-Model Enhanced Multi-Agent Deep Reinforcement Learning for Multi-Functional RIS-Assisted Space-Air-Ground Integrated Networks [4.4] マルチファンクショナル再構成可能なインテリジェントサーフェス(MF-RIS)を用いて,空間空地ネットワーク(SAGIN)アーキテクチャを提案する。
MF-RISは同時に増幅し、収穫し、無線エネルギーを供給できる。
CHIMERAスキームは従来のベンチマークよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:40:56 GMT)
Exploring Large Language Models for Analyzing and Improving Method Names in Scientific Code [4.4] LLM(Large Language Models)の最近の進歩は、コード分析タスクを自動化する新しい機会を提供する。
そこで本研究では,Python ベースの Jupyter Notebooks から抽出した 496 のメソッド名に対して,文法パターンの解析能力に関する4つの LLM の評価を行った。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:33:49 GMT)
A Coalition Game for On-demand Multi-modal 3D Automated Delivery System [4.4] 都市環境におけるラストマイル配送に対処するため、2つのオーバーレイネットワークで運用するUAVとADRの連合ゲームを導入する。
戦略的協調が全体のルーティング効率をいかに向上させるかを把握するためのモード間の協調構造について検討する。
ミシサガ市におけるケーススタディの結果から,ラストマイル配送の応用に関するいくつかの数値実験が実施されている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:52:59 GMT)
Improving Model Classification by Optimizing the Training Dataset [4.0] Coresetsはデータ削減に対する原則的なアプローチを提供し、大規模なデータセットでの効率的な学習を可能にする。
下流の分類品質を向上させるために,コアセット生成プロセスを調整するための体系的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:10:11 GMT)
Quantum Dark Magic: Efficiency of Intermediate Non-Stabiliserness [4.0] 本稿では, 様々なアルゴリズムにおける非安定性の挙動を追跡する手法を提案する。
構造的および非構造的変動的アプローチに対する非安定化性の使用において、異なる効率性を見出した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:52:11 GMT)
Feature Construction Using Network Control Theory and Rank Encoding for Graph Machine Learning [3.5] グラフにおける平均制御可能性の概念と、新しいランクエンコーディング手法を用いて、ソーシャルネットワーク分類タスクにおけるグラフニューラルネットワーク(GNN)の性能を向上させる。
その結果,機能空間に平均制御性を導入することで,GNNの性能が大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:51:41 GMT)
AI for Better UX in Computer-Aided Engineering: Is Academia Catching Up with Industry Demands? A Multivocal Literature Review [3.5] Computer-Aided Engineering (CAE)は、シミュレーションの専門家が複雑なモデルを最適化することを可能にするが、効率とアクセシビリティを制限するユーザエクスペリエンス(UX)の課題に直面している。
人工知能(AI)はCAEプロセスを強化する可能性を実証しているが、これらの分野とUXに焦点を当てた研究はいまだに断片化されている。
本稿では,CAEソフトウェアにおけるAIのUX向上に関する多言語文献レビュー(MLR)について,学術研究と産業実装の両面で検討する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:39:45 GMT)
Harmonization in Magnetic Resonance Imaging: A Survey of Acquisition, Image-level, and Feature-level Methods [3.5] バッチ・エフェクト」または「サイト・エフェクト」は、真の生物学的信号の曖昧さ、統計力の低下、学習ベースモデルに障害がある。
画像調和は、意味のある生物学的情報を保持しながら、そのようなサイト関連バイアスを排除または緩和することを目的としている。
本総説では, 医用画像調和分野における重要な概念, 方法論の進歩, 公開データセット, 現状の課題, 今後の方向性について概説する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:06:02 GMT)
SoK: Concurrency in Blockchain -- A Systematic Literature Review and the Unveiling of a Misconception [3.5] 並行性と並列性は両刃の剣である。
スループットが向上する一方で、競合条件や非決定性、デッドロックやライブロックといった脆弱性も導入されている。
本稿では、スマートコントラクトに関する最初の調査を行い、重要な側面に整理された体系的な文献レビューを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:22:11 GMT)
On exploration of an interior mirror descent flow for stochastic nonconvex constrained problem [3.4] ヘッセン障壁法とミラー降下法は連続流の離散近似として解釈できることを示す。
厳密な相補性条件が成立すれば、これらの急激な定常点を回避できるような2つの十分な条件を提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:18:19 GMT)
VulGuard: An Unified Tool for Evaluating Just-In-Time Vulnerability Prediction Models [3.4] VulGuardは、脆弱性予測(JIT-VP)研究のためのGitHubリポジトリからのコミットの抽出、処理、分析を効率化する自動化ツールである。
コミット履歴を自動的にマイニングし、きめ細かいコード変更、コミットメッセージ、ソフトウェアエンジニアリングメトリクスを抽出し、下流分析のためにフォーマットします。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:18:44 GMT)
Adapt, But Don't Forget: Fine-Tuning and Contrastive Routing for Lane Detection under Distribution Shift [3.4] データセット間の分散シフトは、微調整中に破滅的な忘れ物を引き起こす可能性がある。
本フレームワークは,分布毎に異なるモデルをトレーニングするよりも,パラメータをはるかに少なくしながら,ほぼ最適F1スコアを実現する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:39:15 GMT)
Towards Railway Domain Adaptation for LiDAR-based 3D Detection: Road-to-Rail and Sim-to-Real via SynDRA-BBox [3.4] 我々は,現実的な鉄道シナリオにおいて,物体検出やその他の視覚に基づくタスクを支援するために設計された合成データセットであるSynDRA-BBoxを紹介する。
我々の知る限りでは、鉄道領域における2次元および3次元物体検出に適した、初めての合成データセットである。
最先端の半教師付きドメイン適応法を鉄道状況に適用し、合成データの3次元オブジェクト検出への転送性を実現する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:04:49 GMT)
Quantitative Quantum Soundness for Bipartite Compiled Bell Games via the Sequential NPA Hierarchy [3.3] 両部構成されたベルゲーム毎に、最初の量子音響量境界を示す。
より一般的には、全ての二部ゲームにおいて、コンパイルされたスコアが新しく定式化されたシーケンシャルなNavascu'es-Pironio-Ac'in階層によって与えられる境界を超えないことが示される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:31:41 GMT)
Interpretable Topic Extraction and Word Embedding Learning using row-stochastic DEDICOM [3.3] テキストコーパスのポイントワイド相互情報行列にDEDICOMの行確率変化を導入し、潜在トピッククラスタを同定する。
本稿では,制約付きDEDICOMアルゴリズムを効率的に学習する手法と,そのトピックモデリングと単語埋め込み性能の質的評価を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:30:32 GMT)
Introducing Quality Estimation to Machine Translation Post-editing Workflow: An Empirical Study on Its Usefulness [3.2] 英語・中国語機械翻訳後編集における文レベルの品質評価の有用性について検討した。
その結果,QEは編集後時間を大幅に短縮することが明らかとなった。
インタビューデータは、不正確なQEが後編集プロセスを妨げる可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:25:00 GMT)
Canonical Correlation Patterns for Validating Clustering of Multivariate Time Series [3.2] 我々は、無限相関空間を有限の解釈可能な参照パターンに識別する数学的に定義された検証対象として正準相関パターンを導入する。
制御条件を越えた完全基底真理を持つ合成データセットを用いて、正準パターンが信頼性のある検証ターゲットを提供することを示す。
本研究は,高吸収領域における厳密な相関に基づくクラスタリング検証のための方法論的基礎を確立する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:51:48 GMT)
SiLQ: Simple Large Language Model Quantization-Aware Training [3.1] 大規模言語モデルは、推論時間遅延、モデルサイズ、エネルギー消費を減らすために定量化することができる。
妥当な時間で精度の損失を最小限に抑えた量子モデルを提供することが課題である。
ここでは、先行する量子化手法よりも優れた、単純でエンドツーエンドな量子化対応トレーニング手法を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:17:53 GMT)
Statistical Assertions for Debugging Quantum Circuits and States in CUDA-Q [3.1] 本稿では,Q-Qツールの統計的アサーションに基づくワークフローを提案する。
我々のツールは、回路内の任意の点における量子ビットの状態に関する貴重な洞察を提供する。
我々は、フィッシャーの正確なテストとモンテカルロ法を組み合わせることで、製品状態のアサーションの信頼性を向上させる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:09:56 GMT)
The Sweet Danger of Sugar: Debunking Representation Learning for Encrypted Traffic Classification [3.1] 本稿では、表現学習モデルを利用して交通表現を作成する提案を批判的に再評価する。
Pcap-Encoderは,プロトコルヘッダから特徴を抽出する,LMに基づく表現学習モデルである。
この結果から,データセット作成とモデルトレーニングの欠陥が明らかとなり,より優れた,より意識的なテスト設計が求められた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:32:50 GMT)
Structural Effect and Spectral Enhancement of High-Dimensional Regularized Linear Discriminant Analysis [3.1] 正規化線形判別分析(RLDA)は、分類と次元減少のための広く使われているツールである。
既存のRLDAの理論分析では、データ構造が分類性能に与える影響についての明確な洞察が欠けていることが多い。
本稿では,より高度な分類精度と次元減少を実現するためのスペクトル拡張判別分析(SEDA)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:16:48 GMT)
Deep Unfolding Network for Nonlinear Multi-Frequency Electrical Impedance Tomography [3.0] 本稿では,古典的反復的再構築の利点と解釈性を,深層学習の力と戦略的に融合させるモデルベース学習パラダイムを提案する。
このアプローチは、グラフニューラルネットワーク(GNN)を、反復的プロキシ正規化ガウスニュートン(PRGN)フレームワークに統合する。
特に、GNNアーキテクチャは、非線形フォワードモデルの解法で用いられる不規則な三角形メッシュ構造を保持し、重なり合う組織分画の正確な再構成を可能にする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:14:41 GMT)
Graph Neural Network-Based Distributed Optimal Control for Linear Networked Systems: An Online Distributed Training Approach [2.9] グラフリカレントニューラルネットワーク(GRNN)を用いた離散時間線形ネットワークシステムの最適分散制御問題について検討する。
まず、GRNNに基づく分散最適制御法を提案し、これを自己教師付き学習問題とみなし、その後、(合意に基づく)勾配にインスパイアされた計算によって分散オンライントレーニングを実現し、また、提案したGRNNベースの制御下での線形ネットワークシステムの閉ループ安定性を、GRNNベースの制御器の非線形活性化関数が局所セクター境界と傾斜制限の両方であると仮定して提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:45:36 GMT)
LLMxCPG: Context-Aware Vulnerability Detection Through Code Property Graph-Guided Large Language Models [2.9] 本稿では,コードプロパティグラフ(CPG)とLarge Language Models(LLM)を統合し,堅牢な脆弱性検出を行う新しいフレームワークを提案する。
より簡潔で正確なコードスニペット表現を提供するアプローチの能力は、より大きなコードセグメントの分析を可能にします。
実証的な評価は、検証済みデータセット間でLLMxCPGの有効性を示し、最先端のベースラインよりもF1スコアが15~40%改善されている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:36:33 GMT)
Pre-Training LLMs on a budget: A comparison of three optimizers [2.8] 我々は、デファクト標準のAdamW、より単純なLion、そして2階のSophiaの3つの主要な変種を比較した。
より良い一般化のために、私たちは2つの異なるベースアーキテクチャでトレーニングし、単一と複数エポックのアプローチを使用します。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:48:53 GMT)
Towards Understanding the Challenges of Bug Localization in Deep Learning Systems [2.6] 我々は、ディープラーニングシステムにおけるバグのローカライズに関する課題をより深く理解するために、大規模な実証的研究を行っている。
まず,ディープラーニングシステムの2,365バグと,従来のソフトウェアによる2,913バグを用いて,既存の4つのテクニックのバグローカライズ性能を判定する。
第2に,ディープラーニングシステムにおけるバグタイプの違いが,バグのローカライゼーションに与える影響を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:00:53 GMT)
Recent Advances in Malware Detection: Graph Learning and Explainability [2.6] この調査は、グラフ学習と説明可能性の間の相互作用に焦点を当てている。
これらのコンポーネントを統合することで、グラフ学習と説明可能性が堅牢で解釈可能でスケーラブルなマルウェア検出システムの構築にどのように貢献するかを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:54:41 GMT)
Aitomia: Your Intelligent Assistant for AI-Driven Atomistic and Quantum Chemical Simulations [2.5] AitomiaはAIを利用したプラットフォームで、AI駆動の原子論と量子化学(QC)シミュレーションの実行を支援する。
チャットボットとAIエージェントを備えており、専門家や非専門家が原子論シミュレーションのセットアップと実行を支援する。
相富は、原子論的なシミュレーションを行う際の障壁を低くし、シミュレーションを民主化し、関連する分野での研究と開発を加速することが期待されている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:10:54 GMT)
Evaluating Generative AI Tools for Personalized Offline Recommendations: A Comparative Study [2.5] ジェネレーティブAIツールは、さまざまなドメインでパーソナライズされたレコメンデーションをサポートすることに、ますます重要になっている。
本研究は、反復的外傷のリスクがある個人に適した非デジタルアクティビティを推奨する場合、最も広く使用されている5つの生成AIツールの性能とユーザ満足度を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:47:26 GMT)
Towards Automated Regulatory Compliance Verification in Financial Auditing with Large Language Models [2.5] 我々は,様々なモデル構成における規制コンプライアンスの領域において,一般公開されたLarge Language Models (LLM) の効率性について検討する。
オープンソースのLlama-270億モデルは,非コンプライアンスや真の負の発生を検出する上で,優れた性能を示す。
GPT-4のようなプロプライエタリなモデルは、特に非英語の文脈において、様々なシナリオで最高の性能を発揮する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:39:54 GMT)
Edge-case Synthesis for Fisheye Object Detection: A Data-centric Perspective [2.5] フィッシュアイカメラは、大きな歪みを導入し、従来のデータセットでトレーニングされたオブジェクト検出モデルに固有の課題を提起する。
本稿では,モデルの盲点を特定する上で重要な課題に着目し,検出性能を体系的に向上するデータ中心パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:07:07 GMT)
Pixel-Resolved Long-Context Learning for Turbulence at Exascale: Resolving Small-scale Eddies Toward the Viscous Limit [2.5] 乱流は空気力学、核融合、燃焼など多分野の応用において重要な役割を果たしている。
私たちの知る限り、これは乱流のための最初のAIモデルであり、小さな渦を散逸する範囲まで捉えることができる。
これは乱流のための最初のAIモデルで、小さな渦を散逸範囲まで捉えることができる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:33:33 GMT)
From Cracks to Crooks: YouTube as a Vector for Malware Distribution [2.4] 本稿では、サイバー犯罪者がYouTubeを利用してマルウェアを拡散する方法について検討する。
フリーソフトウェアやゲーム不正を促進するキャンペーンに焦点を当てている。
自動検出システムを回避するために、YouTubeの多言語メタデータ機能を悪用する新しい回避テクニックを提示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:08:49 GMT)
Towards Accurate and Efficient 3D Object Detection for Autonomous Driving: A Mixture of Experts Computing System on Edge [2.4] 本稿では,低レイテンシかつ高精度な3Dオブジェクト検出を同時に実現する自律走行車(AV)のための最適計算システムを提案する。
このシステムは、LiDARとカメラデータを効果的に融合させることで、スパース3D点雲と高密度2D画像の相補的な強度を利用して、堅牢なマルチモーダル表現を生成する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:29:09 GMT)
Large-scale stochastic simulation of open quantum systems [2.3] 本稿では,大規模オープン量子系をシミュレーションするスケーラブルで恥ずかしい並列アルゴリズムであるテンソルジャンプ法(TJM)を紹介する。
この研究は、大規模オープン量子システムのシミュレーションにおける重要な一歩である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:14:08 GMT)
CIMR: Contextualized Iterative Multimodal Reasoning for Robust Instruction Following in LVLMs [2.2] CIMRは、コンテキスト対応の反復推論と自己補正モジュールを導入した、新しいフレームワークである。
CIMRの精度は91.5%で、GPT-4V、LLaVA-1.5、MiniGPT-4、InstructBLIPなどの最先端モデルを上回る。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:39:18 GMT)
Harnessing RLHF for Robust Unanswerability Recognition and Trustworthy Response Generation in LLMs [2.2] 本稿では, 自己認識型無解性学習システム(SALU)を導入し, 生成過程に直接不解性検出を深く統合する手法を提案する。
SALUは、標準的な質問回答(QA)と、解決不可能なクエリに対する明示的な棄権生成の両方のために、マルチタスク学習フレームワークを使用して訓練されている。
ハイブリッド LLM-classifier システムを含む強力なベースラインを一貫して上回り、質問に対する正しい回答や棄却の全体的な精度を向上する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:44:18 GMT)
Fine-Grained Alignment and Noise Refinement for Compositional Text-to-Image Generation [2.1] テキスト制約を考慮に入れた目標を組み込んだ,革新的な学習自由度手法を提案する。
本手法は,提案する目的関数にのみ依存し,構成性を大幅に向上し,人的評価の24%向上を実現した。
私たちのきめ細かいノイズ改善は効果を証明し、パフォーマンスを最大5%向上させます。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:17:37 GMT)
The Unified Cognitive Consciousness Theory for Language Models: Anchoring Semantics, Thresholds of Activation, and Emergent Reasoning [2.1] 大規模言語モデル(LLM)は潜在パターンの膨大なリポジトリであるが、構造化されたガイダンスがなければ、明確な推論、セマンティックグラウンド、ゴール指向インテリジェンスが欠如している。
統一認知意識理論(UCCT: Unified Cognitive Consciousness Theory)は、LCMを外部メカニズム、少数ショットプロンプト、RAG、微調整、マルチエージェント推論を必要とする無意識の基質として再解釈する統一モデルである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:57:05 GMT)
CL-Polyp: A Contrastive Learning-Enhanced Network for Accurate Polyp Segmentation [2.0] CL-Polypを提案する。
本手法は, コントラスト学習を用いて, エンコーダの識別的特徴抽出を強化する。
臨床ポリープセグメンテーションにおける最先端の手法を一貫して超越している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:47:49 GMT)
Do Large Language Models Have a Planning Theory of Mind? Evidence from MindGames: a Multi-Step Persuasion Task [2.0] 我々は、MindGames: a novel planning theory of Mind (PToM) taskを提示する。
ヒトはPTOMタスクにおいて,o1-preview(LLM)を著しく上回っていることがわかった。
これらの結果は、人間のような社会的推論と心の理論の間に大きなギャップがあることを示唆している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:15:27 GMT)
LangBiTe: A Platform for Testing Bias in Large Language Models [2.0] 大規模言語モデル(LLM)は、フォーラム、ウェブサイト、ソーシャルメディア、その他のインターネットソースから抽出された膨大な量のデータに基づいて訓練されている。
LangBiTeを使うことで、開発チームはテストシナリオを調整し、ユーザ定義の倫理的要件に従ってテストケースを自動生成し、実行することが可能になる。
LangBiteは、LLMのバイアス評価と、最初の倫理的要件と得られた洞察の間のエンドツーエンドトレーサビリティを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:10:18 GMT)
Learning from Data Streams: An Overview and Update [1.9] 教師付きデータストリーム学習の基本的定義と設定を再構築する。
教師付きデータストリーム学習タスクを構成するものについて、新たに検討する。
データストリームから学ぶことは、シングルパスやオンライン学習のアプローチを強制しない、という点が主な重点です。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:44:07 GMT)
Quantum Entrepreneurship Lab: Training a Future Workforce for the Quantum Industry [1.9] 量子起業研究所(Quantum Entrepreneurship Lab, QEL)はミュンヘン工科大学(TUM)の1学期制のプロジェクトベースコースである。
QELは、量子セクターにおける学術研究と産業応用のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:04:07 GMT)
Benchmarking pig detection and tracking under diverse and challenging conditions [1.9] オブジェクト検出のためのPigDetectと、マルチオブジェクト追跡のためのPigTrackの2つのデータセットをキュレートした。
対象物検出では,ランダムなサンプル画像のみを用いて達成可能なものよりも,困難なトレーニング画像により検出が向上することを示す。
マルチオブジェクト追跡において,SORTに基づく手法は,エンドツーエンドのトレーニング可能なモデルに比べて優れた検出性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:36:51 GMT)
Few-Shot Learning in Video and 3D Object Detection: A Survey [1.9] 少ないショット学習により、オブジェクト検出モデルでは、いくつかの例でのみ与えられた新しいクラスを認識できる。
少ない3D検出により、コストのかかる3Dアノテーションの必要性を最小限に抑えることで、実用的な自動運転の展開が可能になる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:37:20 GMT)
Novel Multi-Agent Action Masked Deep Reinforcement Learning for General Industrial Assembly Lines Balancing Problems [1.8] 本稿では,マルコフ決定過程 (MDP) として定式化された汎用産業組立ラインの数学的モデルを提案する。
提案モデルは,タスクとリソーススケジューリングを最適化するために,深層強化学習(DRL)エージェントを訓練するための仮想環境を構築するために使用される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:34:36 GMT)
Adaptive Inventory Strategies using Deep Reinforcement Learning for Dynamic Agri-Food Supply Chains [1.8] 本研究は,アグリフード製品の在庫管理とリードタイムの不確実性に着目した。
価値とポリシーに基づくDRLアプローチの両方の利点を、不確実性下での在庫最適化に組み合わせた、新しいDeep Reinforcement Learning (DRL)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:02:54 GMT)
Modeling the Sacred: Considerations when Using Religious Texts in Natural Language Processing [1.8] 宗教的な文章は文化的に重要な価値の表現である。
機械学習モデルは、トレーニングデータにエンコードされた文化的価値を再現する確率を持っている。
本稿は,NLPによるこのようなテキストの使用が,モデルバイアスを超えた考察を提起するものであることを論じる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:58:13 GMT)
Spiking neurons as predictive controllers of linear systems [1.8] 現在のスパイク制御は、アナログ制御を近似するためにスパイク信号のフィルタリングに依存する。
本稿では,スパース神経活動を伴うタスク特異的スパイキング制御のためのスケーラブルな方法を提案する。
物理的に制約されたシステムでは、予測制御が必要であり、制御信号は最終的に下流システムの受動力学を利用して目標に到達する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:50:11 GMT)
LLM-Enhanced Reranking for Complementary Product Recommendation [1.7] 本稿では,Large Language Models (LLMs) を利用したモデルに依存しないアプローチを提案する。
当社のアプローチは、補完的な製品レコメンデーションにおける正確性と多様性のバランスを効果的に保ち、少なくとも50%の精度測定値、2%の多様性測定値がデータセット全体を対象とした推奨項目の平均で上昇していることを実証しています。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:15:45 GMT)
Network Analytics for Anti-Money Laundering -- A Systematic Literature Review and Experimental Evaluation [1.7] 本稿では,Web of Science and Scopus の97論文をもとに,広範囲かつユニークな文献レビューを行う。
我々は、ほとんどの研究はエキスパートベースのルールと手動の機能に依存していると結論付け、ディープラーニングの手法は勢いを増している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:16:19 GMT)
ReMi: A Random Recurrent Neural Network Approach to Music Production [1.7] 生成的人工知能は、エネルギー消費、著作権侵害、創造的萎縮に関する懸念を提起する。
音楽家を置き換えることを目的としたエンドツーエンドの音楽生成とは対照的に、我々のアプローチはデータの不要さと計算能力の低下を両立させながらクリエイティビティを高める。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:56:12 GMT)
Holstein mechanism in single-site model with unitary evolution [1.7] 単電子系におけるホルスタイン機構について検討し, 一元的進化は非断熱条件下でのフェルミオンとボソン作用素の両方に本質的に関係することを示した。
結果として生じるユニタリダイナミクスとボソン周波数依存は、異なる短時間(強弱崩壊)と長時間(指数崩壊)の挙動によって証明された量子相転移を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:07:00 GMT)
Temporally Consistent Dynamic Scene Graphs: An End-to-End Approach for Action Tracklet Generation [1.7] TCDSG、Temporally Consistent Dynamic Scene Graphsは、時間を通して対象と対象の関係を検出し、追跡し、リンクするエンドツーエンドのフレームワークである。
私たちの研究は、マルチフレームビデオ分析における新しい標準を設定し、監視、自律ナビゲーションなどにおける、高インパクトなアプリケーションのための新たな道を開く。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:23:25 GMT)
Shared Control of Holonomic Wheelchairs through Reinforcement Learning [1.5] 最先端の研究は、非ホロノミックロボットのナビゲーションの安全性を向上させるための共有制御の可能性を示した。
本稿では,2次元ユーザ入力と3次元モーション出力を併用した強化学習手法を提案する。
本手法は,車いすをスマートに配向し,良好なスムーズさや競争力のあるスムーズさを示すとともに,衝突のないナビゲーションを確実にすることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:31:11 GMT)
Optimization of DNN-based HSI Segmentation FPGA-based SoC for ADS: A Practical Approach [1.5] 本研究では,FPGA ベースの SOC 上にデプロイされた DNN ベースの HSI セグメンテーションプロセッサの実用的共同設計のための最適化手法を提案する。
応用圧縮技術により設計されたDNNの複雑さは、元の操作の24.34%、元のパラメータの1.02%に大幅に減少し、セグメンテーション精度を著しく低下させることなく、推論タスクの2.86倍のスピードアップを達成した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:09:04 GMT)
Balancing Robustness and Efficiency in Embedded DNNs Through Activation Function Selection [1.5] 安全クリティカルなアプリケーションのための機械学習ベースの組み込みシステムは、ソフトエラーによる摂動に対して堅牢でなければならない。
ハイパースペクトル画像のセマンティックセグメンテーションのために開発されたエンコーダ・デコーダ畳み込みモデルと自律運転システムへの応用に焦点を当てた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:50:19 GMT)
ACT: Bridging the Gap in Code Translation through Synthetic Data Generation & Adaptive Training [1.5] Auto-Train for Code Translation (ACT)は、オープンソースのLarge Language Models (LLM)を社内で微調整することで、コード翻訳機能を改善することを目的としている。
ACTの自動パイプラインはこれらのモデルの性能を大幅に向上させ、オープンソースアクセシビリティとクローズドソースソリューションのパフォーマンスのギャップを狭める。
我々の結果は、ACTがオープンソースモデルの有効性を一貫して強化し、企業や開発者が安全で信頼性の高い代替手段を提供することを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:35:35 GMT)
A Partitioned Sparse Variational Gaussian Process for Fast, Distributed Spatial Modeling [1.5] 次世代のエネルギースーパーコンピュータは、エクサスケール計算が可能である。
これらのマシンでは、ディスクに保存できるものよりもはるかに多くの計算が可能になります。
その場でトレーニングできる機械学習アルゴリズムには、緊急に必要なものがあります。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:20:07 GMT)
GG-BBQ: German Gender Bias Benchmark for Question Answering [1.5] ドイツ語大言語モデル(LLM)における性別バイアスを,Parrishらによる質問回答のためのバイアスベンチマークを用いて評価した。
特に、この英語データセットの性同一性サブセットのテンプレートは、機械でドイツ語に翻訳された。
性別バイアス評価のためのデータセットを作成する際には,手作業による翻訳の改訂が不可欠であることがわかった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:02:28 GMT)
Denoising-While-Completing Network (DWCNet): Robust Point Cloud Completion Under Corruption [1.4] ポイントクラウドの完成は、自動運転、拡張現実、ロボット工学における3Dコンピュータビジョンタスクにとって不可欠である。
既存のコンプリートネットワークは、合成データに基づいて訓練されており、現実世界の劣化に苦戦している。
本稿では,ノイズ管理モジュールで拡張された補完フレームワークDWCNetを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:34:21 GMT)
Prompt4Trust: A Reinforcement Learning Prompt Augmentation Framework for Clinically-Aligned Confidence Calibration in Multimodal Large Language Models [1.4] Prompt4Trustは,MLLMにおける信頼度校正をターゲットとした即時強化のための,最初の強化学習フレームワークである。
従来のキャリブレーション技術とは異なり、Prompt4Trustは安全で信頼性の高い臨床診断に最も重要なキャリブレーションの側面を特に優先している。
実験では,より大きなMLLMに対してゼロショットの一般化が期待できることを示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 03:52:39 GMT)
A Mixed-Order Phase Transition in Continuous-Variable Quantum Networks [1.4] 量子ネットワーク(QN)は、主に離散可変(DV)アーキテクチャによって駆動されている。
エンタングルメント・パーコレーションの新形式-ネガティビティ・パーコレーション理論(NegPT)を提案する。
我々は,NegPTは,大域的絡み合いの急激な変化とノード間の長距離相関によって同時に,混合次相転移を示すことを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:09:21 GMT)
Time to Split: Exploring Data Splitting Strategies for Offline Evaluation of Sequential Recommenders [1.4] シーケンシャルなレコメンデーションのための共通評価プロトコルは、現実世界のシナリオと一致しない。
グローバルな時間分割は、これらの問題を、異なる将来の期間に基づいて評価することで解決する。
以上の結果から, 離脱や離脱などの分裂は, より現実的な評価戦略と十分に一致していない可能性が示唆された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:20:52 GMT)
Physical models realizing the transformer architecture of large language models [1.4] 2017年のトランスフォーマーアーキテクチャの導入は、自然言語処理の最も顕著な進歩となった。
我々は、トークンのヒルベルト空間上のフォック空間におけるオープン量子系として、トランスフォーマーアーキテクチャに基づいて、大きな言語モデルを実現する物理モデルを構築する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:01:10 GMT)
AUTOPSY: A Framework for Tackling Privacy Challenges in the Automotive Industry [1.3] AUTOPSYプロジェクトは、自動車分野におけるプライバシーエンジニアリングプロセスをサポートすることであった。
本稿では,プライバシ技術(PET)の強化を目的としたプロジェクトの結果について述べる。
さらに、アーキテクチャの配置フレームワークを評価するために、データベースのサービスのためのデモレータを構築しました。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:32:20 GMT)
Ownership Verification of DNN Models Using White-Box Adversarial Attacks with Specified Probability Manipulation [1.3] 画像分類タスクのためのディープニューラルネットワーク(DNN)モデルのオーナシップ検証のための新しいフレームワークを提案する。
これにより、元のモデルを提示することなく、正当な所有者と第三者の両方によるモデルの同一性を検証することができる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:25:39 GMT)
AI-based Clinical Decision Support for Primary Care: A Real-World Study [1.3] 介護における大規模言語モデルに基づく臨床意思決定支援の効果について検討した。
我々は、潜在的なドキュメンテーションと臨床的意思決定エラーを特定することによって、臨床医の安全ネットとして機能するツールであるAI Consultを研究した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:37:33 GMT)
Leveraging Synthetic Data for Question Answering with Multilingual LLMs in the Agricultural Domain [1.0] 農業における大規模言語モデル(LLM)は一般的に、局所的および多言語的文脈における精度を欠いた一般的なアドバイザリを提供する。
本研究では,多言語合成農業データセット(ヒンディー語,パンジャービ語,ヒンディー語,パンジャービ語)を農業用文書および微調整言語用LPMから生成する。
キュレートされた多言語データセットに対する評価は,事実的正確性,妥当性,農業的コンセンサスにおいて有意な改善を示した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:25:10 GMT)
AURA: A Multi-Modal Medical Agent for Understanding, Reasoning & Annotation [0.8] AURAは、医用画像の包括的分析、説明、評価のために特別に設計された最初の視覚的言語説明性エージェントである。
AURAは、より透明性があり、適応可能で、臨床的に整合したAIシステムに向けた大きな進歩を示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:24:18 GMT)
Meta-Learning for Cold-Start Personalization in Prompt-Tuned LLMs [0.8] 本稿では,パラメータ効率のよいプロンプトチューニングを行うためのメタラーニングフレームワークを提案する。
MovieLens-1M、Amazon Reviews、Recboleでは、当社の適応モデルは、NDCG@10、HR@10、MRRの強力なベースラインよりも優れています。
275msの適応率により、金融システムのリアルタイムリスクプロファイリングが成功している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:07:23 GMT)
Scene Text Detection and Recognition "in light of" Challenging Environmental Conditions using Aria Glasses Egocentric Vision Cameras [0.7] Scene Text Detection and Recognition (STDR) は、自我中心の視覚レンズを通じて簡単に選択できる。
本稿では, 現実シナリオにおけるSTDRアルゴリズムの性能に, 照明, 距離, 解像度などの環境変数がどのような影響を及ぼすかを検討する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:12:00 GMT)
3LM: Bridging Arabic, STEM, and Code through Benchmarking [0.7] 3LMはアラビア語用に特別に設計された3つのベンチマークのスイートである。
1つ目は、アラビア語の教科書と教育用ワークシートから自然に派生した、STEM関連の質問応答ペアのセットである。
2つ目は、同じソースを用いて合成されたSTEM質問である。
第3のベンチマークは、2つの広く使用されているコードベンチマークを注意深く翻訳することで構築されたコード生成に焦点を当てている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:43:45 GMT)
Do large language vision models understand 3D shapes? [0.7] 大規模視覚言語モデル(LVLM)は、世界の一般的な視覚的理解を達成するための主要なA.Iアプローチである。
この研究は、LVLMが3次元形状を真に理解しているかどうかを、モデルが全く同じ3次元形状の物体を識別しマッチングする能力をテストすることで検証する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:46:37 GMT)
MCP-MedSAM: A Powerful Lightweight Medical Segment Anything Model Trained with a Single GPU in Just One Day [0.7] 医用画像のセグメンテーションは、解剖学的構造や病変の特定に焦点をあてて、医療画像を意味のある領域に分割する。
Anything Model(SAM)は、様々なタスクのパフォーマンスを改善するために、医学領域に適応するよう研究者に促している。
MCP-MedSAMは、40GBのメモリを持つ単一のA100 GPU上で1日以内にトレーニングできるように設計された、強力で軽量な医療SAMモデルである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:08:28 GMT)
Human-AI Co-Creation: A Framework for Collaborative Design in Intelligent Systems [0.7] 本稿では、AIが自動化や効率向上にのみ使用されるだけでなく、アイデア、視覚的概念化、意思決定に積極的に参加する、人間とAIの共創の創発的パラダイムについて考察する。
具体的には, GPT-4のような大規模言語モデル(LLM)と, 提案, 批判, リビジョンの反復サイクルにデザイナを関与させる創造的エージェントとして, 安定拡散(Stable Diffusion)のようなマルチモーダル拡散モデルを使用することを検討する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:29:33 GMT)
Learning novel representations of variable sources from multi-modal $\textit{Gaia}$ data via autoencoders [0.6] 本稿では,複数のガイアデータ生成物を取り込み,恒星とクエーサーの変動の教師なし分類を実現する機械学習手法の提案と評価を行う。
3つの変分オートエンコーダ(VAE)のトレーニングには400万ガリアDR3ソースのデータセットが使用される
1つのVAEは、ガイアXP低分解能スペクトルで、もう1つは、ガイアG帯の大きさ差の分布に基づく新しいアプローチで、もう1つは折り畳まれたガイアG帯光曲線で訓練されている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:11:47 GMT)
Qubit-Efficient Quantum Algorithm for Linear Differential Equations [0.6] 本稿では,線形常微分方程式(ODE)を証明可能な実行保証で解くための量子アルゴリズムを提案する。
我々のアルゴリズムは1つのアシラ量子ビットしか使用せず、例えばODEの係数行列が$k$-localであるとき、局所性保存である。
また,提案アルゴリズムとリンドブラディアンシミュレーションの関連性,および相互作用するハタノ・ネルソンモデルへの応用について考察する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:08:34 GMT)
Optimal schedule of multi-channel quantum Zeno dragging with application to solving the k-SAT problem [0.6] 一般化された測定値を用いた多チャンネルZenoドラッグのより深い解析を行う。
まず、有限測定時間分解能の影響を含む収束時間に関する解析上界を計算した。
次に、最適制御理論を適用し、低次元設定に対して収束時間を低くする最適ドラッギングスケジュールを得る。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:46:19 GMT)
Optimization and generalization analysis for two-layer physics-informed neural networks without over-parametrization [0.6] 本研究は、物理インフォームドニューラルネットワーク(PINN)を用いた最小二乗回帰の解法における勾配降下(SGD)の挙動に焦点を当てる。
ネットワーク幅が$epsilon$と問題のみに依存するしきい値を超えると、トレーニング損失と期待損失は$O(epsilon)$以下になる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:24:22 GMT)
Avoiding spectral pollution for transfer operators using residuals [0.6] スペクトル汚染のない遷移作用素のスペクトル特性を計算するためのアルゴリズムを提案する。
ケーススタディは、既知のスペクトルを持つブラスキー写像の族からタンパク質の折り畳みの分子動力学モデルまで様々である。
提案手法は,幅広いアプリケーションにまたがるスペクトル推定のための堅牢なツールを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:01:05 GMT)
Mind the Gap: Evaluating the Representativeness of Quantitative Medical Language Reasoning LLM Benchmarks for African Disease Burdens [0.6] 既存のLCMベンチマークでは、高い所得設定による検査シラビと疾患プロファイルを主に反映している。
Alama Health QAはケニアのクリニカル・クリニカル・プラクティス・ガイドラインに固定された検索拡張生成フレームワークを用いて開発された。
アラマは関連性およびガイドラインアライメントで最高であり、PubMedQAは臨床的有用性で最低であった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:05:30 GMT)
Bootstrapped Control Limits for Score-Based Concept Drift Control Charts [0.6] 適応型教師付き学習モデル(コンセプトドリフト検出)で表される予測関係の変化のモニタリングは広く行われている問題である。
汎用的で強力なフィッシャースコアに基づくコンセプトドリフト手法が最近提案されている。
我々は制御限界(CL)を計算するための新しいブートストラップ法を開発した。
これは、特にサンプルサイズと/または偽アラームレートが小さい場合に、より正確な偽アラームレートの制御を提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:36:51 GMT)
Machine learning-based multimodal prognostic models integrating pathology images and high-throughput omic data for overall survival prediction in cancer: a systematic review [0.6] 病理組織学と分子データを統合するマルチモーダル機械学習は、がんの予後を保証している。
我々は,全スライド画像(WSI)と高スループットオミクスを組み合わせて,全体の生存率を予測する研究を体系的に検討した。
全ての研究は、不明瞭/高い偏見、外部検証の制限、臨床的有用性にはほとんど焦点が当てられなかった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:02:51 GMT)
Meta-learning of Gibbs states for many-body Hamiltonians with applications to Quantum Boltzmann Machines [0.6] パラメトリックハミルトニアンの効率的な熱状態調製のためのメタラーニングアルゴリズムを2つ導入する。
我々は,最大8-qubitの逆場イジングモデルと2-qubitのハイゼンベルクモデルに対して,すべてのフィールド項で検証する。
我々は,量子ボルツマンマシン(QBM)を,すべてのフィールド項を持つ2キュービットハイゼンベルクモデルで訓練するために,アルゴリズムを適用した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:17:50 GMT)
Never Come Up Empty: Adaptive HyDE Retrieval for Improving LLM Developer Support [0.5] 我々は,300万以上のJavaおよびPython関連Stack Overflowポストの検索コーパスを構築し,回答を受け付けている。
開発者からの質問に答えるために様々なRAGパイプライン設計を評価し、正確で信頼性の高い応答を生成する上での有効性を評価した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:46:00 GMT)
PlantSAM: An Object Detection-Driven Segmentation Pipeline for Herbarium Specimens [0.5] 植物領域検出のための YOLOv10 とセグメンテーションのための Segment Anything Model (SAM2) を統合した自動セグメンテーションパイプラインである PlantSAM を紹介する。
YOLOv10はSAM2を誘導するバウンディングボックスプロンプトを生成し、セグメンテーション精度を高める。
PlantSAMは最先端のセグメンテーション性能を達成し、IoUは0.94、Dice係数は0.97である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:02:39 GMT)
Software is infrastructure: failures, successes, costs, and the case for formal verification [0.5] この40ドル(約4万4000円)で起きた大規模なソフトウェア障害のコストを思い出します。
これらのコストは、フォーマルなソフトウェア検証、特にプログラム分析の研究、研究、適用を正当化するものであると我々は主張する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:41:24 GMT)
A simple quantum simulation algorithm with near-optimal precision scaling [0.5] 量子シミュレーションは量子コンピュータの基礎的な応用である。
本稿では, 量子ハミルトン動力学シミュレーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:56:24 GMT)
Speech as a Multimodal Digital Phenotype for Multi-Task LLM-based Mental Health Prediction [0.5] うつ病検出のための3モーダルマルチメディアデータソースとして,患者音声データの処理を提案する。
提案手法は,抑うつ早期警戒データセットを用いて,3モーダル長手MLLを特徴とする手法である。
バランスの取れた精度は70.8%で、これは一方向、単一タスク、および非縦方向のそれぞれの方法よりも高い。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:46:53 GMT)
LingBench++: A Linguistically-Informed Benchmark and Reasoning Framework for Multi-Step and Cross-Cultural Inference with LLMs [0.5] LingBench++は、大規模言語モデル(LLM)を評価するためのベンチマークおよび推論フレームワークである。
構造化された推論トレース、ステップワイズ評価プロトコル、90以上の言語にまたがるリッチな型付けメタデータを提供する。
本稿では,外部知識源と反復推論を用いたモデルが,精度と解釈性の両方において単一パスアプローチより優れていることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:57:44 GMT)
Hierarchical Reinforcement Learning Framework for Adaptive Walking Control Using General Value Functions of Lower-Limb Sensor Signals [0.4] 階層強化学習を用いて,低域外骨格に対する適応制御戦略を開発する。
提案手法は,エクソスケルトン制御適応の複雑なタスクを,地形戦略適応のための高レベルフレームワークと予測情報を提供する低レベルフレームワークに分解する。
本研究では,実際のセンサ信号と予測センサ信号を政策ネットワークに組み込むことにより,制御システムの意思決定能力を向上させることを目的とした2つの手法について検討した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:47:04 GMT)
Navigation through Non-Compact Symmetric Spaces: a mathematical perspective on Cartan Neural Networks [0.4] これらの概念の初期の実装は、Cartan Neural Networksのモニカーの下で双子の論文で紹介されている。
現在の論文は、カルタンニューラルネットワークを支える数学的構造を拡張し、それらの層の幾何学的性質を詳述している。
これらの論文は、群理論構造を利用したニューラルネットワークの完全に幾何学的に解釈可能な理論への第一歩となる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:34:53 GMT)
Transformer Based Building Boundary Reconstruction using Attraction Field Maps [0.4] 本稿では,グラフ畳み込みネットワーク(GCN)を利用した新たな深層学習手法を提案する。
当社のモデルであるDecoupled-PolyGCNは、APの6%、ARの10%で既存の手法より優れており、正確で規則化された建物のフットプリントを提供する能力を示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:53:03 GMT)
Ten Essential Guidelines for Building High-Quality Research Software [0.4] 本稿では,高品質な研究ソフトウェアを開発するための10のガイドラインを提案する。
ガイドラインは開発ライフサイクルのすべての段階をカバーする。
彼らは計画、クリーンで可読なコードを書くこと、バージョン管理の使用、テスト戦略の実装の重要性を強調している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:22:41 GMT)
Fast and Scalable Gene Embedding Search: A Comparative Study of FAISS and ScaNN [0.3] 大規模類似性探索は、ゲノムおよびプロテオミクス配列間の相同性、機能的類似性、新規性を検出するバイオインフォマティクスの基本課題である。
埋め込み型類似性探索法について検討し, 生の配列アライメントを超えて, より深い構造的・機能的パターンを抽出する潜在表現を学習する。
この結果から,メモリと実行効率の両面での計算上の優位性と,検索品質の向上が注目され,従来のアライメント重ツールに代わる有望な代替手段が提供される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:28:54 GMT)
On the Differential Topology of Expressivity of Parameterized Quantum Circuits [0.3] 量子回路は量子コンピューティングにおいて重要な役割を果たす。
このような問題のクラスを解くための回路の適合性を測定する必要がある。
この貢献の焦点となる変種は、いわゆる次元表現性である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:51:49 GMT)
Explainable Vulnerability Detection in C/C++ Using Edge-Aware Graph Attention Networks [0.2] 本稿では,C/C++コードの脆弱性検出のためのグラフベースのフレームワークであるExplainVulDを提案する。
平均精度88.25パーセント、F1スコア48.23パーセントをReVealデータセット上で30の独立ランで達成している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:49:14 GMT)
Evolutionary Feature-wise Thresholding for Binary Representation of NLP Embeddings [0.2] Thresholdingは、連続的な埋め込みをバイナリ表現に変換する一般的な方法である。
本稿では,各特徴の最適しきい値を特定するためのコーディネート検索に基づく最適化フレームワークを提案する。
我々の最適なバーコード表現は、様々なNLPアプリケーションで有望な結果を示している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:29:34 GMT)
Controllable Hybrid Captioner for Improved Long-form Video Understanding [0.2] ビデオデータは極めて密度が高く、高次元である。
テキストベースの動画コンテンツの要約は、生よりはるかにコンパクトな方法でコンテンツを表現する方法を提供する。
静的なシーン記述でメモリを豊かにするビジョン言語モデル(VLM)を導入する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:09:00 GMT)
Beating the natural Grover bound for low-energy estimation and state preparation [0.2] 多体ハミルトニアンの基底状態エネルギーの推定は、量子物理学の多くの分野において中心的な課題である。
量子アルゴリズムは、任意の$k$-body Hamiltonian $H$を与えられた場合、基底状態エネルギーの見積もりを計算する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 08:10:08 GMT)
Secondary Bounded Rationality: A Theory of How Algorithms Reproduce Structural Inequality in AI Hiring [0.2] 論文では、AIシステムは技術的・社会的制約を通じて人間の認知と構造的バイアスを継承し、増幅すると主張している。
アルゴリズムのプロセスが、エリート的信用権の特権化やネットワークのホモフィリーといった歴史的不平等を、明らかに有益な官僚的な結果にどのように変えるかを示す。
我々は、この自己強化不平等を打破するために、対物公正テスト、資本認識監査、規制介入を含む緩和戦略を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:25:59 GMT)
A Quantum Superposition of Black Hole Evaporation Histories: Recovering Unitarity [0.2] ブラックホールの蒸発は重力と量子物理学の界面でもっとも顕著な現象の1つである。
ホーキングの半古典的扱いでは、物質は量子力学であり、時空は定性であり、古典的な蒸発は、全体的な進化の統一性が明らかに失われる。
ここでは、ブラックホールの蒸発に関するおもちゃの量子モデルを定式化し、ブラックホールが完全に蒸発し、完全に蒸発しない重畳状態へと進化し、ホーキング粒子が異なるエネルギーレベルのコヒーレントな重畳状態にあるのと一致する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:39:34 GMT)
The Postman: A Journey of Ethical Hacking in PosteID/SPID Borderland [0.1] 本稿では, Poste Italiane による SPID の実装である PosteID 上で実施した脆弱性評価活動について述べる。
この活動により、重要な特権のエスカレーションの脆弱性が発見され、最終的にパッチが当てられた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:38:51 GMT)
TaxCalcBench: Evaluating Frontier Models on the Tax Calculation Task [0.1] 米国の個人所得税の計算は、膨大な量の英文を理解することを必要とするタスクである。
我々は、個人所得税率を計算できるモデルの能力を決定するためのベンチマークであるTaxCalcBenchを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:37:59 GMT)
Mapping Industry Practices to the EU AI Act's GPAI Code of Practice Safety and Security Measures [0.1] 本報告では、EU AI Actの汎用AI(GPAI)コード(第三ドラフト)で提案されている安全とセキュリティ対策と、主要なAI企業によって自発的に採用されている現在のコミットメントとプラクティスとを詳細に比較する。
本分析は、各個別の措置に関連する現在の公的な文書からの抜粋を文書化した草案の安全安全部門(コミットII.1-II.16)に焦点をあてる。
本報告書は、法律遵守の表示であってはならない。また、慣行法又は企業の方針に関する規定的な視点も持っていない。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:27:15 GMT)
LLM as a code generator in Agile Model Driven Development [0.0] この研究は、これらの課題を克服するための実行可能な戦略としてモデル駆動開発(MDD)を擁護します。
我々は GPT4 をコードジェネレータとして利用する Agile Model Driven Development (AMDD) アプローチを提案する。
GPT4自動生成機能を適用すると、JADEおよびPADEフレームワークと互換性のあるJavaとPythonコードが生成される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:02:57 GMT)
Weak-coupling bound states in semi-infinite topological waveguide QED [0.0] 原子-光子結合状態は通常、原子と環境の結合が十分に強いときに形成される。
量子エミッタが、位相的に保護された表面状態を示す構造的な貯水池に弱結合している場合、これらの状態とエミッタとのハイブリッド化が形成されることを示す。
弱結合状態間の振動は、予測可能かつ可逆的にエミッタから格子へ粒子を移動させるのに有効であることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:20:59 GMT)
VRU-Accident: A Vision-Language Benchmark for Video Question Answering and Dense Captioning for Accident Scene Understanding [0.0] MLLM(Multimodal large language model)は、自動運転車におけるシーン理解と意思決定の強化を約束している。
本稿では,VRUを含む高リスク交通シナリオにおけるMLLMの評価を目的とした,視覚言語ベンチマークであるVRU-Accidentを提案する。
これまでの研究とは異なり、我々のベンチマークはVRU車両事故に特化しており、空間的時間的ダイナミクスと事故の因果的セマンティクスの両方を捉えたリッチできめ細かいアノテーションを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:15:14 GMT)
Unified Sparse-Matrix Representations for Diverse Neural Architectures [0.0] 本稿では,畳み込み,再帰,自己アテンション操作をスパース行列乗法として適用する統一行列順序フレームワークを提案する。
この研究は、多様なニューラルネットワークアーキテクチャのための数学的に厳密な基質を確立し、原理化されたハードウェア対応ネットワーク設計のための道を開く。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:07:02 GMT)
Understanding Generalization, Robustness, and Interpretability in Low-Capacity Neural Networks [0.0] 低容量ネットワークにおけるキャパシティ、スパシティ、ロバスト性を調査するためのフレームワークを導入する。
トレーニングされたネットワークは、極大プルーニング(最大95%の間隔)に対して堅牢であることを示す。
この研究は、単純なニューラルネットワークを管理するトレードオフの明確で実証的なデモンストレーションを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:43:03 GMT)
Towards Trustworthy AI: Secure Deepfake Detection using CNNs and Zero-Knowledge Proofs [0.0] TrustDefenderは、リアルタイム拡張現実(XR)ストリームでディープフェイク画像を検出するフレームワークである。
私たちの研究は、没入的でプライバシーに敏感なアプリケーションにおいて、信頼できるAIの基礎を確立します。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:47:46 GMT)
Toward Routine CSP of Pharmaceuticals: A Fully Automated Protocol Using Neural Network Potentials [0.0] 結晶構造予測(CSP)は、多型に関連するリスクを特定し評価するための医薬品開発において有用なツールである。
本稿では,これらの障壁を克服するために,完全自動化された高スループットCSPプロトコルを提案する。
プロトコルの効率は、新しいニューラルネットワークポテンシャル(NNP)であるLavo-NNによって駆動される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 04:26:16 GMT)
Thermal modifications of mesons and energy-energy correlators from real-time simulations of a $U(1)$ lattice gauge theory [0.0] 実時間シミュレーションによる1+1$次元におけるU(1)$格子ゲージ理論の熱的性質について検討する。
この結果は、ゲージ理論における境界状態の熱膨張と有限温度エネルギー-流の相関に関する初めてのリアルタイムテクスタイブ-イニシアト研究である。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:00:00 GMT)
The Joys of Categorical Conformal Prediction [0.0] Conformal Prediction (CP) は、有限サンプルキャリブレーションされた予測領域を提供する不確実性表現技術である。
CPは本質的に不確実量化(UQ)機構であり,その基本UQ能力は構造的特徴であることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:10:06 GMT)
Tailoring Dynamical Codes for Biased Noise: The X$^3$Z$^3$ Floquet Code [0.0] バイアスノイズ下での性能が向上した動的コードであるX$3$Z$3$Floquet符号を提案する。
我々の研究は、素数量子誤り訂正符号としてX$3$Z$3$を定めている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:11:25 GMT)
Tagging fully hadronic exotic decays of the vectorlike $\mathbf{B}$ quark using a graph neural network [0.0] 対生成ベクトル型$B$クォークのLHC確率を、新しいゲージシンクレット(pseudo)スカラー場$Phi$と$b$クォークに外部的に崩壊させる。
標準模型の背景が大きく、レプトニックハンドルがないため、調査は困難である。
この課題を克服するために、グラフニューラルネットワークとディープニューラルネットワークを組み合わせたハイブリッドディープラーニングモデルを用いる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:46:59 GMT)
Synthetic Data Generation Using Large Language Models: Advances in Text and Code [0.0] 大規模言語モデル(LLM)は、自然言語とコードドメインの両方で合成トレーニングデータ生成を変換している。
我々は、プロンプトベースの生成、検索拡張パイプライン、反復的な自己精製といった重要なテクニックを強調した。
本稿では,生成テキストにおける事実的不正確性,文体的あるいは分布的リアリズムの不足,バイアス増幅のリスクなど,関連する課題について論じる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:28:00 GMT)
Supernova: Achieving More with Less in Transformer Architectures [0.0] Supernovaはデコーダのみの変換器で、計算効率を維持しながらより大きなモデルの性能を実現する。
重要な革新は、最先端の圧縮性能を実現するカスタム128,000バイトレベルのBPEトークンライザである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:27:02 GMT)
Studies of properties of bipartite graphs with quantum programming [0.0] 両部グラフの$G(U,V,E)$に対応するマルチキュービット量子状態について検討する。
得られた状態の絡み合い距離は任意の二部グラフ構造に対して解析的に導出される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:49:57 GMT)
Spectral signature of high-order photon processes enhanced by Cooper-pair pairing [0.0] 超伝導回路は、強い相互作用と低い損失を結合するのに適している。
我々の結果は、マイクロ波量子光学における高次光子相互作用の新しい状態を開く。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:16:55 GMT)
Some classes of finite-dimensional ladder operators [0.0] 有限次元ヒルベルト空間におけるはしご作用素の特別なクラスについて研究する。
我々は、クーンの切り詰めたバージョン、それらのエム・プシュド変換、および閉鎖上で作用する作用素の第3の族を考える。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:20:10 GMT)
Soft Computing Approaches for Predicting Shade-Seeking Behaviour in Dairy Cattle under Heat Stress: A Comparative Study of Random Forests and Neural Networks [0.0] 熱ストレスは地中海の気候において乳牛が直面する主な福祉と生産性の問題の1つである。
我々は2つのソフトコンピューティングアルゴリズム、ランダムフォレスト(Random Forests)とニューラル・ニューラルネットワーク(Neural Networks)を評価し、高解像度の行動データと微小気候データに基づいてトレーニングした。
最高のニューラルネットワーク(3つの隠れ層、16のニューロン、学習速度 = 10e-3)は平均で14.78に達し、ランダムフォレスト(10の木、深さ = 5)は14.97に達し、最も高い解釈性を提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:50:26 GMT)
SoK: Securing the Final Frontier for Cybersecurity in Space-Based Infrastructure [0.0] 本研究では、地上、宇宙、衛星、衛星等を含む宇宙のサイバー攻撃ベクトルの範囲を分析した。
また、宇宙インフラに関連する緩和策の有効性を評価する。
本論文は,最先端技術ソリューションの開発とテストにおける潜在的研究課題を明らかにする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:51:31 GMT)
Simulation of quantum contextuality with invasive-measurement maps [0.0] 文脈性は、量子を物理系の古典的な記述から分離する決定的な特徴である。
本稿では,線形写像を用いて文脈性を特徴付ける一般的な手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:28:40 GMT)
Shot-Efficient ADAPT-VQE via Reused Pauli Measurements and Variance-Based Shot Allocation [0.0] ADAPT-VQEにおけるショット要求を減らすための2つの統合戦略を提案する。
まず,次のADAPT-VQEイテレーションの演算子選択ステップにおいて,VQEパラメータ最適化時に得られるパウリ測定結果を再利用する。
第2に、分散に基づくショットアロケーションをハミルトンおよび演算子勾配測定の両方に適用する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:34:49 GMT)
Scarred ferromagnetic phase in the long-range transverse-field Ising model [0.0] いくつかの小さな磁区からなる単純な初期条件が、これらの不足状態に選択的に出現することを示します。
これにより特別な動的相が出現し、この相はスカーレッド強磁性相と呼ばれる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:12:31 GMT)
SDBench: A Comprehensive Benchmark Suite for Speaker Diarization [0.0] 最先端の話者ダイアリゼーションシステムでさえ、異なるデータセット間でエラー率のばらつきが高い。
SDBenchは,話者ダイアリゼーション性能を一貫した,きめ細かい分析を行うためのオープンソースのベンチマークスイートである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 01:11:26 GMT)
Rural School Bus Routing and Scheduling [0.0] ロングスクールバスは生徒のパフォーマンスと幸福に悪影響を及ぼす。
本稿では,農村部バス路線とスケジュールの設計に焦点をあてる。
学生の乗車時間を最小化しつつ、これらの複雑さに対処する農村バスのルーティングとスケジューリングモデルを定式化する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:39:42 GMT)
Revisiting boundary-driven method for transport: Finite-size effects and the role of system-bath coupling [0.0] 2つのアプローチから計算したdc拡散定数 $mathcalD_textdc$ を比較して比較する。
我々は,システムバス結合に強い依存を示す$mathcalD_textdc$という,両者の明確なミスマッチを見出した。
現実的な解決法として,我々は境界駆動フレームワーク内での時間依存輸送係数の計算を提唱する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:35:03 GMT)
Rethinking Data Input for Point Cloud Upsampling [0.0] ポイントクラウドのアップサンプリングは、3D再構築のようなタスクには不可欠だ。
既存の方法はパッチベースの入力に依存しており、ポイントクラウドモデルの完全な入力とパッチベースの入力の違いと原則について議論する研究はない。
PU1KおよびABCデータセットに関する実験により、パッチベースの入力がモデル全体の入力を一貫して上回っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:55:00 GMT)
Reconfigurable qubit states and quantum trajectories in a synthetic artificial neuron network with a process to direct information generation from co-integrated burst-mode spiking under non-Markovianity [0.0] 量子情報処理とスパイキング計算を併用した状態で機能する人工ニューロンネットワークを提案する。
これにより、クォービットのコヒーレンス状態と絡み合い、タンデムで読み出しや基本演算のような関数を実行することができる。
これにより、高度な機能を備えた情報パケットの生成と計算処理が可能になり、ルーティングにおけるセキュリティレベルが向上する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 15:02:06 GMT)
Rabi oscillations and entanglement between two atoms interacting by the Rydberg blockade studied by the Jaynes-Cummings Model [0.0] Rydberg原子は、2量子ビットゲートと原子光量子インターフェースのためのビルディングブロックを約束している。
我々は、リドベルク封鎖と量子化された放射場によって相互作用する2つのリドベルク原子間の相互作用を研究する。
この結果は,将来の長距離量子通信のためのコンポーネントとして,原子光量子インタフェースの考え方に関係している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:58:47 GMT)
Quantum synchronization between two strongly driven YIG spheres mediated via a microwave cavity [0.0] 単一モードマイクロ波キャビティを介して間接的に結合された2つの強駆動マグノンモードの同期について検討した。
インプット・アウトプット・フォーマリズムを用いて、古典的および量子的同期がカップリング、デチューニング、駆動の適切な選択のために出現することを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:56:31 GMT)
Quantum Theory of Optical Spin Texture in Chiral Tellurium Lattice [0.0] そこで我々は,Teの電子的構造に類似したスピン分解型深部顕微鏡光バンド構造を開発した。
格子レベルでは、Teのキラリティが光波内の深部微視的な光スピンテクスチャとして現れることが明らかとなった。
本フレームワークは光学活性の有限モメンタム源を明らかにするとともに, キラル結晶材料における光-物質相互作用の顕微鏡的基盤を提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:23:44 GMT)
Quantum Speed Limits Based on Schatten Norms: Universality and Tightness [0.0] 一般物理過程における有限次元量子系の量子速度制限(QSL)について論じる。
QSLは、量子状態空間の幾何学的特徴を利用して、Schatten $alpha$-normsを用いて得られた。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:20:47 GMT)
Pulse-Level Simulation of Crosstalk Attacks on Superconducting Quantum Hardware [0.0] 超伝導量子コンピュータにおけるハードウェアのクロストークは、深刻なセキュリティ上の脅威となる。
パルスレベルにおけるアクティブクロストーク攻撃のシミュレーションに基づく研究について述べる。
最大論理誤差の原因となるパルスと結合構成を同定する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:52:43 GMT)
Pulling Back the Curtain: Unsupervised Adversarial Detection via Contrastive Auxiliary Networks [0.0] 本稿では,補助的特徴表現内での敵対行動を明らかにするために,補助的コントラストネットワーク(U-CAN)による教師なし敵検出を提案する。
本手法は、既存の非教師付き対向検出手法を超越し、4つの異なる攻撃方法に対して優れたF1スコアを達成している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:30:16 GMT)
Project Patti: Why can You Solve Diabolical Puzzles on one Sudoku Website but not Easy Puzzles on another Sudoku Website? [0.0] 私は5つの人気ウェブサイトで1000以上のスドクパズルを分析し、各ウェブサイトの難易度を特徴付ける。
提案した2つの指標に基づいて,単純な教師なし分類器を用いた普遍評価システムを構築した。
本稿では,初期スドクの実践者が,スドクパズルの解法に利用できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:32:30 GMT)
Performance of Parity QAOA for the Signed Max-Cut Problem [0.0] パリティアーキテクチャにおける量子近似アルゴリズムの最適化性能(パリティQAOA)について検討する。
固定回路深さでのアルゴリズムの比較により、Parity QAOAはSWAPネットワークに基づく従来のQAOA実装よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:05:59 GMT)
Part Segmentation of Human Meshes via Multi-View Human Parsing [0.0] 並行して、人間のパーシングの分野は、画像から身体部分と衣服/アクセサリーラベルを予測することに焦点を当てている。
この研究は、大規模なヒューマンメッシュの頂点ごとのセマンティックセマンティックセグメンテーションを可能にすることによって、これらの2つのドメインをブリッジすることを目的としている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:42:34 GMT)
Parametric Amplification of Spin-Motion Coupling in Three-Dimensional Trapped-Ion Crystals [0.0] 3次元結晶(3D)は、量子センシングや量子シミュレーションへの応用のために、捕捉されたイオンシステムをスケールアップする経路を提供する。
工学的コヒーレントなスピン-モーション結合と大きな結晶における効果的なスピン-スピン相互作用は技術的な課題を引き起こす。
パラメトリック増幅による3次元結晶における相互作用の高速化の可能性を探る。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:28:01 GMT)
On two-dimensional tensor network group symmetries [0.0] 4サイクルの指数を持つ有限群の2次元テンソルネットワーク表現を導入する。
これらの異常対称性がテンソルネットワーク基底状態に作用するときに現れる(2+1)D相を特徴付ける。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:28:59 GMT)
Old Quantum Mechanics by Bohr and Sommerfeld from a Modern Perspective [0.0] ボーアの原子モデルとソマーフェルトによる拡張について、波動力学の数学的観点から検討する。
量子化規則とエネルギー準位の導出は、半古典的手法を用いて再検討される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:10:15 GMT)
Obscured but Not Erased: Evaluating Nationality Bias in LLMs via Name-Based Bias Benchmarks [0.0] 大きな言語モデル(LLM)は、明示的な人口統計マーカーが存在しない場合でも、特定の国籍に対する潜在バイアスを示す。
文化的に表象的な名前で明示的な国籍ラベルを置換することの影響を調査するために,新しい名称ベースのベンチマーク手法を導入する。
私たちの実験では、小さなモデルの方が精度が低く、大きなモデルに比べてバイアスが大きいことが示されています。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:54:49 GMT)
Nonequilibrium regimes for quasiparticles in superconducting qubits with gap-asymmetric junctions [0.0] ギャップ非対称性が遷移エネルギーよりも大きいクビットは準粒子デコヒーレンスの影響を受けにくい。
このトラップにより、ギャップ非対称性は準粒子を平衡から切り離すのに寄与する。
温度が上昇するにつれて、4つの定性的に異なる状態が可能であることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:05:07 GMT)
NPO: Learning Alignment and Meta-Alignment through Structured Human Feedback [0.0] 我々は,人間のループ内決定システムにおけるフィードバック駆動型適応を運用するアライメント対応学習フレームワークであるNPOを提案する。
NPOは、構造化されたフィードバックの下で測定可能で、監視可能で、再現可能なアライメント損失の形式化を導入する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:23:18 GMT)
Mitigating higher-band heating in Floquet-Hubbard lattices via two-tone driving [0.0] 高エネルギーレベルに対する多光子共鳴は、強い駆動量子系におけるフロック加熱の避けられない源である。
我々は、最近開発されたマルチ光子共鳴の2トーンアプローチを、ハバード系における揺らぎ格子に拡張する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:22:05 GMT)
Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS Thesauri [0.0] 我々は,SKOSセサウリの自動翻訳のためのオープンソースでモジュール化された,利用可能なパイプラインであるWOKIEを紹介する。
この研究は、言語多様性が知識リソースのアクセス、再利用、セマンティック相互運用性を制限することができるDH(Digital Humanities)において重要なニーズに対処する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:20:41 GMT)
Mapping the Parasocial AI Market: User Trends, Engagement and Risks [0.0] 110のAIコンパニオンプラットフォームをスキャンすると、グローバル市場が急速に成長していることがわかる。
英国だけでも、これらのプラットフォームは月間4600万から9100万の訪問者を集めている。
マッチング指向のAIコンパニオンは、英国訪問の44%を占めている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:33:42 GMT)
MLRU++: Multiscale Lightweight Residual UNETR++ with Attention for Efficient 3D Medical Image Segmentation [0.0] セグメント化精度と計算効率のバランスをとるために設計されたマルチスケール軽量Residual UNETR++アーキテクチャ。
4つの公開ベンチマークデータセットの実験は、MLRU++が最先端のパフォーマンスを達成することを示した。
MLRU++は, 3次元画像分割タスクに対して, 実用的で高性能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:30:44 GMT)
Leveraging Distribution Matching to Make Approximate Machine Unlearning Faster [0.0] Approximate Machine Unlearning(AMU)は、保持されたデータセットサブセットの特別な微調整を通じて、モデルを特定のトレーニングデータを忘れることを可能にする。
分類指向AMUを高速化する2つの補完手法を提案する。
まず、新しい分布マッチングデータセット凝縮(DC)である textbfBlend は、視覚的に類似した画像を共有混合重みとマージすることで、保持されたセットサイズを大幅に削減する。
第2に、損失中心の方法である textbfAccelerated-AMU (A-AMU) は、学習対象を拡大し、収束を早める。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:27:10 GMT)
Language Detection by Means of the Minkowski Norm: Identification Through Character Bigrams and Frequency Analysis [0.0] 本研究では,モノグラムとビッグラムの周波数ランキングを利用した言語決定性アルゴリズムの数学的実装について検討する。
本手法は,150文字未満のテキストに対して80%以上の精度を達成し,より長いテキストや古いテキストに対して100%の精度を達成する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:11:01 GMT)
Isocoherent Work Extraction from Quantum Batteries: Basis-Dependent Response [0.0] コヒーレンスに制約のある最大作業(CCMW)は、コヒーレンス保存ユニタリを介して抽出できる最大作業量である。
より高次元においても、ある数値的な結論の中でCCMWと入力量子コヒーレンスの間の閉形式関係を導出できることが示される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:07:55 GMT)
Information-acquiring von Neumann architecture of a computer: Functionality and subjectivity [0.0] 我々は,コンピュータの情報取得型フォン・ノイマンアーキテクチャを,きめ細かなあるいは粗いモデルで設計する。
このアーキテクチャは、与えられた入力純状態からシステム内の他の出力純状態に変換するハミルトニアン過程(機能)と、情報を取得する物理過程(主観性)の両方を可能にする。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:55:37 GMT)
Improving Source Code Similarity Detection Through GraphCodeBERT and Integration of Additional Features [0.0] 本稿では,新たな出力特徴を分類プロセスに統合したソースコード類似性検出手法を提案する。
我々のアプローチはGraphCodeBERTモデルに基づいており、カスタム出力特徴層と特徴表現を改善するための結合機構で拡張されている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:21:09 GMT)
Improving Predictions on Highly Unbalanced Data Using Open Source Synthetic Data Upsampling [0.0] 特徴空間のスパース領域におけるギャップを埋める多様なデータポイントを生成することにより,少数群の予測精度を向上させることができることを示す。
我々はMOSTLY AIによるオープンソースソリューションであるSynthetic Data SDKの有効性を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:11:32 GMT)
Features extraction for image identification using computer vision [0.0] この研究は、視覚変換器(ViT)およびジェネレーティブ・ディバイザ・ネットワーク(GAN)などのアプローチに焦点を当てている。
実験により,両手法のメリットと限界,およびコンピュータビジョンの進歩における実用的応用について検討した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:43:52 GMT)
Fast quantum gates for exchange-only qubits using simultaneous exchange pulses [0.0] 本稿では,同時交換パルスを用いた単一量子ゲートの実装を高速化する。
2量子ゲートにおける3つのスピンのサブシーケンスはより少ないステップで実装可能であることを示す。
我々は、SiGe量子ドットデバイスにおいて、$X$回転の同時交換実装を実験的に実証し、特徴付ける。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:20:21 GMT)
Fast charge noise sensing using a spectator valley state in a singlet-triplet qubit [0.0] 励起谷状態の1電子を持つシリコン一重項量子ビットを用いた荷電ノイズのリアルタイム検出法を提案する。
共振器の分散読み出しは、連続して古典的な交換変動の測定を可能にする。
重要なことに、このプロトコルはスピンコヒーレンスを保持し、キュービット論理ゲートと並行して実行できる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:53:14 GMT)
Families of Optimal Transport Kernels for Cell Complexes [0.0] 我々は,ホッジ・ラプラシア行列を用いて,細胞複合体信号分布間のワッサーシュタイン距離を明示的に表現する。
これにより、CW錯体を比較し、最適な輸送マップを定義するための構造的に意味のある尺度が導かれる。
特徴情報と構造情報の両方を同時に含むため, 融合グロモフ-ワッサーシュタイン距離をCW錯体に拡張する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:21:28 GMT)
False signatures of non-ergodic behavior in disordered quantum many-body systems [0.0] エルゴード型孤立量子多体系は固有状態熱化仮説(ETH)を満たす
ETHは、障害現実化の平均値が取られるとき、エネルギーウィンドウ内で局所観測可能量の期待値がどうなるかを規定していない。
本研究では、乱れた量子多体系における局所観測値の期待値を分析する際に、エネルギー窓の調整方法を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:19:32 GMT)
Exploring the Effects of Mass Dependence in Spontaneous Collapse Models [0.0] 自然崩壊モデルは、量子力学における長年の計測問題を、客観的波動関数の崩壊を含むように理論のダイナミクスを変更することで解決することを目的としている。
これらのモデルの中心的な特徴は、質量密度への依存であり、どのように、いつ崩壊が起こるかに直接影響を及ぼす。
我々は,崩壊モデルの将来の発展と実証テスト可能性に重要な意味を持つ,限られた範囲の大量依存関数のみが実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:49:50 GMT)
Exact distinguishability between real-valued and complex-valued Haar random quantum states [0.0] 我々はHaarランダム状態のスペクトル分解を解析的に計算する。
実数値状態 $t$-designs の近似パラメータに下界を示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:23:46 GMT)
Evaluating Ensemble and Deep Learning Models for Static Malware Detection with Dimensionality Reduction Using the EMBER Dataset [0.0] 本研究では,EMBERデータセットを用いた静的マルウェア検出における機械学習アルゴリズムの有効性について検討した。
LightGBM, XGBoost, CatBoost, Random Forest, Extra Trees, HistGradientBoosting, k-Nearest Neighbors (KNN), TabNetの8つの分類モデルを評価した。
モデルは精度、精度、リコール、F1スコア、AUCに基づいて評価され、予測性能とロバスト性の両方を調べる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 18:45:10 GMT)
Ethics through the Facets of Artificial Intelligence [0.0] 懸念は、AIのぼやけた理解、どのように使用できるか、社会でどのように解釈されたかに起因している、と我々は主張する。
本稿では,AI利用の倫理的評価のための枠組みを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:21:37 GMT)
Escaping the Krylov space during finite precision Lanczos [0.0] 有限精度算術における固有ベクトルの数値列は、正確なランツォスベクトルで表される真のベクトル空間から逃れることを示す。
これは作用素成長仮説の解釈に真の脅威をもたらす。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:22:21 GMT)
Entanglement of a spin-1/2 Ising-Heisenberg diamond spin cluster in the thermal bosonic bath [0.0] 熱ボゾン浴の影響下でのイシン・ハイゼンベルク相互作用によるダイヤモンドスピンクラスターの時間進化について検討した。
環境がシステム内の絡み合いの存在にどのように影響するかを実証する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:24:13 GMT)
Enhancing the Performance of Quantum Neutral-Atom-Assisted Benders Decomposition [0.0] 本稿では、混合整数線形プログラム(MILP)を解くためのハイブリッドベンダー分解フレームワークについて、これまでの研究の強化について述べる。
マスター問題は、擬似非拘束バイナリ最適化(QUBO)モデルとして再構成され、自動変換技術を用いて中性原子量子プロセッサ上で解決される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:40:58 GMT)
Emergent Cognitive Convergence via Implementation: A Structured Loop Reflecting Four Theories of Mind (A Position Paper) [0.0] 我々は、心の4つの有力な理論にまたがる構造的収束の発見を報告する。
この収束はエージェントフローと呼ばれる実践的なAIエージェントアーキテクチャ内で発生した。
本稿では,エージェントフローで観測される設計レベルの規則性をキャプチャする記述的メタアーキテクチャとしてPEACEを紹介する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:54:45 GMT)
Einstein's Electron and Local Branching: Unitarity Does not Require Many-Worlds [0.0] 我々は、単一電子源と不透明半球検出器アレイを用いて、アインシュタインの電子回折に関する1927年の思考実験を再考した。
many-Worlds Interpretation (MWI) と Branched Hilbert Subspace Interpretation (BHSI) を比較した。
我々の分析は、ユニタリティが並列世界を必要とするという考えに挑戦し、むしろより単純な視点を提唱する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 00:33:08 GMT)
Edge of Stochastic Stability: Revisiting the Edge of Stability for SGD [0.0] 我々は,ミニバッチ勾配降下(SGD)列車が異なる体制で「エッジ・オブ・安定性(EoSS)」と呼ばれることを示す。
この体制では、2/eta$で安定化されるのは*バッチ・シャープネス* であり、これは対応する勾配に沿ったミニバッチ・ヘッセンの方向曲率である。
その結果、Batch Sharpnessよりも一般的に小さい$lambda_max$が抑制され、より小さなバッチとより大きなステップサイズがよりフラットなミニマを好むという長年の経験的な観察と一致している。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:43:59 GMT)
Dynamical and Emission Properties of Quantum Emitters driven by Ultra-Short Laser Pulses [0.0] 高性能量子技術の開発は、高忠実度で固体エミッタの量子状態を作成する能力に依存している。
共振型Rabi発振、断熱型ラピッドパス(ARP)、Notch-filtered ARPの3つの単一パルスコヒーレント制御プロトコルを理論的に比較した。
以上の結果より,NARPは内因性スペクトル分離性と高忠実度断熱路とを一意に組み合わせていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:26:35 GMT)
Dynamical analog spacetimes from nonlinear perturbations in a topological material [0.0] トポロジカル材料内に包括的非線形アナログ重力場を構築する。
進化する音場地平線の形成を数値的に実証し,アナログホーキング温度を定量化する。
この研究は、幅広い種類の量子材料で非線形創発時空を探索するための基礎となる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:22:12 GMT)
ChatChecker: A Framework for Dialogue System Testing and Evaluation Through Non-cooperative User Simulation [0.0] ChatCheckerは複雑な対話システムの自動評価とテストのためのフレームワークである。
大きな言語モデル(LLM)を使用して、多様なユーザインタラクションをシミュレートし、対話のブレークダウンを特定し、品質を評価する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:40:34 GMT)
Causal Graph Fuzzy LLMs: A First Introduction and Applications in Time Series Forecasting [0.0] 本研究では, GPT-2 とファジィ時系列 (FTS) と因果グラフを組み合わせた新しい LLM フレーム CGF-LLM を提案する。
主な目的は、ファジフィケーションと因果解析の並列適用により、数値時系列を解釈可能な形式に変換することである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:03:13 GMT)
Canonical Representations of Markovian Structural Causal Models: A Framework for Counterfactual Reasoning [0.0] 反事実的推論は、「アリスがアスピリンを飲んだら、何故回復したのか」といった反事実的疑問に答えることを目的としている。
構造因果モデルの正準表現(canonical representations of structure causal model)とも呼ばれる反ファクトモデルを導入する。
構造因果モデルと比較して、観察的制約や介入的制約を変更することなく、多くの反事実的概念を特定できる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 09:13:02 GMT)
Can You Trust an LLM with Your Life-Changing Decision? An Investigation into AI High-Stakes Responses [0.0] 大規模言語モデル (LLMs) は、高い評価のライフアドバイスを求める声が高まっているが、自信はあるが誤った回答を提供するための標準的な安全策は欠如している。
本稿では,3つの実験を通して,これらの故障モードについて検討する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:11:13 GMT)
Building a robust OAuth token based API Security: A High level Overview [0.0] 本稿では,このようなトークンベースのAPIセキュリティシステムを構築するために必要な基礎について述べる。
その意図は、セキュアでスケーラブルなトークンベースのAPIセキュリティシステムを構築するために必要な基礎知識を開発者に提供することである。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:14:14 GMT)
Bringing Balance to Hand Shape Classification: Mitigating Data Imbalance Through Generative Models [0.0] 我々は、RWTHドイツ語手話ハンドシェープデータセットに基づいて訓練されたEfficientNet分類器を使用する。
提案手法はRWTHデータセットの最先端精度を5%向上させる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 20:41:29 GMT)
Beyond Algorethics: Addressing the Ethical and Anthropological Challenges of AI Recommender Systems [0.0] AI駆動型推薦システム(RS)による倫理的・人類学的課題の検討
私は、algorethicsを含む既存の倫理的アプローチは必要だが最終的には不十分であると主張する。
本稿では、学際的視点、規制戦略、教育イニシアチブを統合した、人間中心のRS設計のための包括的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:22:08 GMT)
Benchmarking Classical and Quantum Models for DeFi Yield Prediction on Curve Finance [0.0] 我々はXGBoost, Random Forest, LSTM, Transformer, Quantum Neural Network (QNN), Quantum Feature Map (QSVM-QNN) の6つのモデルをベンチマークした。
実験MAE, RMSE, 方向精度のモデル性能について検討した。
XGBoostはテストMAEが1.80で、Random Forestは1.77と71.36%で最高方向精度(71.57%)を達成した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 06:55:20 GMT)
BIDWESH: A Bangla Regional Based Hate Speech Detection Dataset [0.0] 本研究は,バングラヘイトスピーチデータセットであるBIDWESHを紹介する。
BD-SHSコーパスから9,183のインスタンスを3つの主要地域方言に翻訳し、注釈付けすることで構築された。
その結果得られたデータセットは、バングラでヘイトスピーチの検出を進めるための言語的にリッチでバランスの取れた、包括的なリソースを提供する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 02:53:48 GMT)
Argument Quality Annotation and Gender Bias Detection in Financial Communication through Large Language Models [0.0] 我々は3つの最先端のLCMの財務的議論に言及する能力を評価する。
分析モデルに性別バイアスを注入する逆攻撃を導入する。
以上の結果から,LDMをベースとしたアノテーションは,人間よりもアノテータ間のアノテータ間の合意度が高いことが判明した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 17:54:45 GMT)
Application-Driven Benchmarking of the Traveling Salesperson Problem: a Quantum Hardware Deep-Dive [0.0] この研究は、トラベリングセールスパーソン問題(Traveing Salesperson Problem)の例として、様々なハードウェアアーキテクチャの比較分析を含む。
量子ハードウェア上で現実世界のアプリケーションを走らせるのに必要なステップを強調します。
中性原子系、イオントラップ、超伝導ハードウェア上での模範量子アルゴリズムの相対効率に関する結果。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 11:22:04 GMT)
Analysis of Threat-Based Manipulation in Large Language Models: A Dual Perspective on Vulnerabilities and Performance Enhancement Opportunities [0.0] 大規模言語モデル(LLM)は、脅威ベースの操作に対する複雑な応答を示す。
本研究は,3つのLLMによる3,390個の実験応答の包括的解析を行った。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:13:08 GMT)
An advanced AI driven database system [0.0] 本稿では人工知能(AI)がサポートする新しいデータベースシステムを提案する。
自然言語処理(NLP)ベースの直感的インタフェースを用いてデータ管理を改善することを目的としている。
このシステムは、LLM(Large Language Models)と高度な機械学習アルゴリズムを統合することで、データベースの可能性を強化することを目的としている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 16:10:45 GMT)
An Efficient Algorithm for Generating Minimal Unique-Cause MC/DC Test cases for Singular Boolean Expressions [0.0] MC/DC(Modified Condition/Decision Coverage)は、重要なシステムの信頼性と安全性を確保するための構造的カバレッジ基準である。
Unique-Cause MC/DCは高い保証を提供するが、その効率的なテスト生成に関する研究は不足している。
本稿は,N条件のSBEに対して,100%ユニクカスMC/DCを保証するため,N + 1ケースの最小限のテストセットを直接構築する決定論的アルゴリズムである'Robin's Rule'を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 19:13:57 GMT)
Alternative Loss Function in Evaluation of Transformer Models [0.0] 本稿では,アルゴリズム投資戦略における予測生成モデルの最適化に有効な平均絶対目標損失関数を提案する。
MADL関数の結果は Transformer と LSTM モデルで比較され,ほぼすべてのケースにおいて Transformer が LSTM で得られた結果よりも有意に優れていることを示す。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:57:25 GMT)
AI-Enhanced Precision in Sport Taekwondo: Increasing Fairness, Speed, and Trust in Competition (FST.ai) [0.0] 「FST.ai」は、スポーツテコンドーにおける能力向上を目的とした、AIを活用した新しいフレームワークである。
キーアクションの識別と分類を自動化し、意思決定時間を数分から秒に短縮する。
この枠組みは、柔道、空手、フェンシング、さらにはサッカーやバスケットボールのようなチームスポーツのようなアクション検出を必要とする幅広いスポーツに適応することができる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:19:12 GMT)
A photon density wavefunction [0.0] 真空中のマクスウェルの方程式は、正式にシュル「オーディンガーの方程式」の形でキャストすることができる。
光子を数えることができるので、EM場から導かれるより説得力のある波動関数が存在する必要がある。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:55:42 GMT)
A novel approach to navigate the taxonomic hierarchy to address the Open-World Scenarios in Medicinal Plant Classification [0.0] 既存の薬草分類法は、しばしば階層的な分類や未知の種を正確に識別することができないことが観察された。
DenseNet121,Multi-Scale Self-Attention (MSSA) と階層分類のためのカスケード分類器を組み合わせた新しい手法を提案する。
提案するモデルサイズは,既存の最先端技術に比べて約4倍小さく,現実のアプリケーションに容易にデプロイできる。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 21:32:15 GMT)
A charge-density machine-learning workflow for computing the infrared spectrum of molecules [0.0] 分子の赤外スペクトルの計算のための機械学習ワークフローを提案する。
我々はJacobi-Legendreクラスタ展開を用いて収束密度関数理論計算の実空間電荷密度を予測する。
このスキームは、PySCF符号の数値的枠組みの中で実装され、気体相におけるウラシル分子の赤外スペクトルに適用される。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:18:04 GMT)
A Target-based Multi-LiDAR Multi-Camera Extrinsic Calibration System [0.0] マルチLiDARおよびマルチカメラセンサスイートに適したターゲットベース外部キャリブレーションシステムを提案する。
このシステムにより、LiDARとカメラの相互校正を、事前知識が限られている。
その結果,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 14:15:28 GMT)
A Study on Variants of Conventional, Fuzzy, and Nullspace-Based Independence Criteria for Improving Supervised and Unsupervised Learning [0.0] 我々は、教師なし学習者を設計するために、すべての独立基準を見直した。
独立度基準を3つ使い,非教師付き・監督型次元減少法の設計に使用した。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 22:02:50 GMT)
A Simple and Efficient Joint Measurement Strategy for Estimating Fermionic Observables and Hamiltonians [0.0] 量子化学と相関するフェルミオン系に関係のあるフェルミオン可観測物とハミルトンを簡易に推定する手法を提案する。
提案手法は,N$モードフェルミオン系におけるマヨラナ作用素の任意の積のノイズバージョンを共同測定する手法の実装に基づいている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 12:49:43 GMT)
A Relational (Re)Turn: Revisit Interactive Art through Interaction and Aesthetics [0.0] この論文は、対話型芸術における相互作用の概念を再考し、社会文化的起源から人間とコンピュータのパラダイムにおける狭まりまで、その進化をたどるものである。
相互対象的および技術的に媒介する美学としてのリレーショナルインタラクションの再生を提案する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 13:46:28 GMT)
A Parameter-Efficient Quantum Anomaly Detection Method on a Superconducting Quantum Processor [0.0] 本稿では,新しい量子機械学習手法を提案する。
実用的な画像異常検出のための効率的な量子異常検出(PEQAD)。
PEQADは従来のモデルと比較してパラメータ効率と精度の両方を達成することを目的としている。
超伝導量子プロセッサ上での一般画像データセットに対する量子異常検出法の最初の実装を実証する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 23:46:35 GMT)
A Distributional View of High Dimensional Optimization [0.0] 我々は、古典的な最適化の失敗点を調査することで、この見方を動機付けます。
ランダムに描画された目的関数の最適化を検討する。
さらに、この分布ビューは勾配降下の最適ステップサイズ制御に関する洞察を与える。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 07:56:01 GMT)
A Data-Driven Machine Learning Approach for Predicting Axial Load Capacity in Steel Storage Rack Columns [0.0] 冷間成形鋼構造物の軸受荷重特性を予測するための機械学習(ML)フレームワークを提案する。
この方法論は堅牢なモデル選択と解釈可能性を強調し、従来の分析手法の限界に対処する。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 10:16:53 GMT)
A Compact Post-quantum Strong Designated Verifier Signature Scheme from Isogenies [0.0] 我々は、コンパクトで量子抵抗的なSDVSスキームである$mathsfCSItext-SDVS$を紹介した。
$mathcalO(lambda)$のキーとシグネチャは、$mathcalO(lambda)$のサイズであり、既存の量子後SDVSスキームにおける典型的な$mathcalO(lambda)$バウンドよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 22 Jul 2025 05:51:44 GMT)