Observation of disorder-free localization using a (2+1)D lattice gauge theory on a quantum processor [118.0] 量子多体系における障害によって引き起こされる現象は、解析法や数値シミュレーションに重大な課題をもたらす。
チューナブルな状態における量子回路を、全ての障害構成上の重ね合わせについて検討する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:20:32 GMT)
On Positional Bias of Faithfulness for Long-form Summarization [83.6] LLM(Large Language Models)は、長いコンテキスト設定において、入力の途中で情報に過小評価される位置バイアスを示すことが多い。
長文要約におけるこのバイアスの存在、その忠実性への影響、およびこのバイアスを軽減するための様々な技術について検討する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 04:22:35 GMT)
Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models [79.5] 推論は知性の中心にあり、決定し、結論を導き、ドメインをまたいで一般化する能力を形成する。
人工知能において、システムがオープンで不確実でマルチモーダルな環境でますます機能するにつれて、推論は堅牢で適応的な行動を可能にするために不可欠となる。
大規模マルチモーダル推論モデル(LMRM)は、テキスト、画像、オーディオ、ビデオなどのモダリティを統合し、複雑な推論機能をサポートする、有望なパラダイムとして登場した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 14:40:27 GMT)
LLMs' Reading Comprehension Is Affected by Parametric Knowledge and Struggles with Hypothetical Statements [59.7] 言語モデルの自然言語理解(NLU)能力を評価するための主要な手段として、読解理解(RC)があげられる。
文脈がモデルの内部知識と一致している場合、モデルの回答がコンテキスト理解に由来するのか、あるいは内部情報から生じるのかを識別することは困難である。
この問題に対処するために、架空の事実や実体に基づいて、想像上のデータにRCを使うことを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 06:19:35 GMT)
CMD: Controllable Multiview Diffusion for 3D Editing and Progressive Generation [58.5] 入力画像から3Dモデルを生成するとともに、3Dモデルの各コンポーネントのフレキシブルな局所的編集を可能にするCMDと呼ばれる新しい手法を提案する。
CMDでは、3D生成を条件付き多視点拡散モデルとして定式化し、既存のまたは既知の部分を条件として取り、編集または追加されたコンポーネントを生成する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:36:40 GMT)
Robust Federated Learning Over the Air: Combating Heavy-Tailed Noise with Median Anchored Clipping [57.4] 重み付き雑音による有害な影響に対処するため,メディアアンコールド・クリッピング (MAC) と呼ばれる新しい勾配クリッピング法を提案する。
また、MAC下でのアナログオーバー・ザ・エア・フェデレーション学習によるモデルトレーニングの収束率の解析式も導出する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:04:33 GMT)
DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge [56.4] 本稿では,逆動力学モデリングを実現するために,包括的世界知識予測を統合した新しいVLAフレームワークであるDreamVLAを提案する。
DreamVLAは、動的領域誘導の世界知識予測を導入し、空間的および意味的な手がかりと統合し、アクション計画のためのコンパクトで包括的な表現を提供する。
実世界とシミュレーション環境での実験では、ドリームVLAが実際のロボットタスクで76.7%の成功率を達成したことが示されている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 16:14:29 GMT)
BiVM: Accurate Binarized Neural Network for Efficient Video Matting [56.0] リアルタイムビデオマッチングのためのディープニューラルネットワークは、エッジデバイスに重大な計算制限を被る。
ビデオマッティングのための正確でリソース効率のよいバイナリニューラルネットワークであるBiVMを提案する。
BiVMは、最先端(SOTA)バイナライゼーション手法を含む、代替のバイナライズされたビデオマッティングネットワークをかなり上回っている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 16:32:37 GMT)
Continual Visual Reinforcement Learning with A Life-Long World Model [55.1] 視覚力学モデリングのための新しい連続学習手法を提案する。
まず,タスク固有の潜在ダイナミクスを学習する長寿命世界モデルを紹介する。
そして,探索・保守的行動学習手法を用いて,過去の課題に対する価値推定問題に対処する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:47:04 GMT)
ObjectAdd: Adding Objects into Image via a Training-Free Diffusion Modification Fashion [52.0] 我々は,ユーザ指定領域にユーザ予測オブジェクトを追加するトレーニング不要な拡散修正手法であるObjectAddを紹介する。
テキストをプロンプトした画像では、ユーザがボックスとオブジェクトを指定することができ、(1) ボックス領域内にオブジェクトを追加すること、(2) ボックス領域の外で正確なコンテンツを追加すること、(3) ボックス領域間の不完全な融合を実現する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:25:49 GMT)
Towards Two-Stage Counterfactual Learning to Rank [50.5] ランク付けのためのカウンターファクトラーニングは、ユーザのインタラクションからランク付けポリシーを学ぶことを目的としている。
現実のアプリケーションでは、候補文書セットは数百万の順序で行われ、単一のステージのランキングポリシーを非現実的にしている。
本稿では,2段階間の相互作用を考慮した2段階CLTR推定器を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:59:04 GMT)
SCALE: Towards Collaborative Content Analysis in Social Science with Large Language Model Agents and Human Intervention [50.1] 我々は、効果的に機能する新しいマルチエージェントフレームワークを導入する。
Imulates $underlinetextbfC$ontent $underlinetextbfA$nalysis via。
underlinetextbfL$arge language model (LLM) agunderlinetextbfE$nts。
テキストコーディング、協調的な議論、動的コードブックの進化など、コンテンツ分析の重要なフェーズを模倣します。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 00:55:19 GMT)
AVTENet: A Human-Cognition-Inspired Audio-Visual Transformer-Based Ensemble Network for Video Deepfake Detection [49.8] 本研究では、ディープフェイクビデオを検出するために、オーディオ・ヴィジュアル・トランスフォーマー・ベースのアンサンブルネットワーク(AVTENet)を導入する。
評価には、最近リリースされたマルチモーダルオーディオビデオFakeAVCelebデータセットを使用する。
AVTENetとその変種およびいくつかの既存手法をFakeAVCelebデータセットの複数のテストセット上で評価する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:50:10 GMT)
Verification of Visual Controllers via Compositional Geometric Transformations [49.8] 到達可能な集合の外部近似を生成できる知覚ベースのコントローラのための新しい検証フレームワークを提案する。
提案手法の音質を理論的に保証し,ベンチマーク制御環境における有効性を示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:22:58 GMT)
Lilith: Developmental Modular LLMs with Chemical Signaling [49.2] 人工知能の現在のパラダイムは、神経レベルでの脳活動をモデル化するフィードフォワードネットワークの層に依存している。
我々は,モジュール型言語モデルの発達訓練と,ブレインインスパイアされたトークンベースの通信プロトコルを組み合わせた,新しいアーキテクチャLILITHを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 23:18:51 GMT)
LayerCake: Token-Aware Contrastive Decoding within Large Language Model Layers [46.7] 大規模言語モデル(LLM)は、自然言語の理解と生成に優れるが、事実の誤りに弱いままである。
本稿では,トークン型と最も影響力のあるトランスフォーマー層を整合させて実データ生成を改善する,トークン認識型コントラストデコーディング手法を提案する。
提案手法は追加のトレーニングやモデル修正を必要とせず,複数のLSMおよび各種ベンチマークの事実性を常に改善することを示す実験である。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 14:35:43 GMT)
A View-consistent Sampling Method for Regularized Training of Neural Radiance Fields [46.0] 我々は、NeRFトレーニングを正規化するために、固定深度値推定の代わりにビュー一貫性分布を用いることを提案する。
ビュー・一貫性分布からサンプリングすることにより、NeRFのトレーニングに暗黙の正規化が課される。
また,サンプリング手法と連動して機能する深度処理損失を利用して,故障モードの除去に有効な正則化を行う。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 14:48:10 GMT)
MambaFusion: Height-Fidelity Dense Global Fusion for Multi-modal 3D Object Detection [45.8] そこで本研究では,純粋なマンバブロックが効率的にDense Global Fusionを実現できることを示す。
我々のモチベーションは、既存の核融合戦略が、効率を同時に達成できないことに起因する。
本稿では,連続空間におけるボクセル圧縮による正確な高さ情報を保持する高忠実度LiDAR符号化を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:29:45 GMT)
Model Collapse Is Not a Bug but a Feature in Machine Unlearning for LLMs [44.8] LLMの現在の未学習方法は、学習目的に組み込むことで、削除しようとしているプライベート情報に基づいて最適化されている。
センシティブなデータへの露出を抑えるリスクだけでなく、その使用を最小化するという原則にも反する、と我々は主張する。
本研究では,未学習目標を学習対象に含まないPMC(Partial Model Collapse)を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 03:08:49 GMT)
MASS: Mathematical Data Selection via Skill Graphs for Pretraining Large Language Models [44.5] 大規模言語モデル(LLM)の事前学習と微調整において高品質なデータが重要な役割を果たす
我々は,textbfSkill グラフを用いて LLM の事前学習を行う textbfMAthematical data textbfSelection フレームワークである MASS を紹介する。
実験により, 異なるモデルサイズにおけるMASSの有効性と有効性を示した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 05:05:06 GMT)
Dynamic Frequency Feature Fusion Network for Multi-Source Remote Sensing Data Classification [33.0] ハイパースペクトル画像(HSI)と合成開口レーダ(SAR)のための動的周波数特徴融合ネットワーク(DFFNet)を提案する。
具体的には、入力特徴を集約することで周波数領域のフィルタカーネルを動的に学習する動的フィルタブロックを設計する。
2つのベンチマークデータセットの実験により、DFFNetはマルチソースデータ分類における最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 19:14:44 GMT)
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models [32.7] EasyEdit2は、LLM(Large Language Model)の動作を制御するためのプラグインとプレイを可能にするために設計されたフレームワークである。
EasyEdit2は、シームレスなモデルステアリング用に特別に設計された新しいアーキテクチャを備えている。
EasyEdit2の主な利点の1つは、ユーザによる使いやすさが、広範な技術知識を必要としないことである。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 04:59:13 GMT)
CRISP-SAM2: SAM2 with Cross-Modal Interaction and Semantic Prompting for Multi-Organ Segmentation [32.5] CRoss-modal Interaction と Semantic Prompting をベースとした CRISP-SAM2 という新しいモデルを提案する。
このモデルは、臓器のテキスト記述によって導かれる多臓器医療セグメンテーションへの有望なアプローチを示す。
我々の手法は、視覚的およびテキスト的入力を相互に文脈化されたセマンティクスに変換することから始まる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 02:53:08 GMT)
Is It Really Long Context if All You Need Is Retrieval? Towards Genuinely Difficult Long Context NLP [32.2] 異なるタスクをコンテキスト長で膨らませることは、生産的ではないと我々は主張する。
我々は、長い文脈でそれらがより困難になる特性に基づいて、長い文脈の分類を解き放つことを提案する。
必要な情報が非常に長く、入力内で非常に拡散している、最も困難で興味深い設定は、非常に過度に探索されている、と結論付けている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:13:18 GMT)
Selective Prediction via Training Dynamics [31.7] 本研究では,モデルのトレーニング力学を学習することで,最先端の選択的予測性能が得られることを示す。
特に、トレーニングの後半段階で最終予測と大差ないデータポイントを拒否する。
提案された拒絶機構はドメインに依存しない(すなわち、離散予測と実数値予測の両方に有効)、既存の選択的予測手法と柔軟に組み合わせることができる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:35:29 GMT)
Towards Better Visualizing the Decision Basis of Networks via Unfold and Conquer Attribution Guidance [29.0] 本稿では,ネットワーク決定の妥当性を高める新しいフレームワークUnfold and Conquer Guidance(UCAG)を提案する。
UCAGは画像のスライスに対する自信に順応し、豊富な明確な解釈をもたらす。
いくつかのメトリクスで性能を検証するために、多数の評価を行います。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:57:03 GMT)
MOMENTS: A Comprehensive Multimodal Benchmark for Theory of Mind [28.3] 心の理論は、社会的にインテリジェントなマルチモーダルエージェントを構築するために不可欠である。
マルチモーダルな大規模言語モデルのToM能力を評価するためのベンチマークであるMOMENTSを紹介する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:06:30 GMT)
Comprehensive Information Bottleneck for Unveiling Universal Attribution to Interpret Vision Transformers [26.0] 意思決定プロセスを説明するために,各層で関連する情報を検出する包括的情報ボトルネック(CoIBA)を導入する。
我々の中核となる考え方は、パラメトリック減衰比を共有することで包括的情報を推定するために、複数のターゲット層に情報ボトルネックを適用することである。
本稿では,各層の関連情報を上層境界情報により正確に反映する変動的手法を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:39:27 GMT)
U-ViLAR: Uncertainty-Aware Visual Localization for Autonomous Driving via Differentiable Association and Registration [25.7] U-ViLARは、新しい不確実性を認識した視覚的ローカライゼーションフレームワークである。
ハイデフィニション(HD)マップやナビゲーションマップを使った適応的なローカライゼーションを可能にする。
当社のモデルでは、大規模自動運転車両の厳格なテストが実施されている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:40:42 GMT)
Improving Rationality in the Reasoning Process of Language Models through Self-playing Game [25.2] 証明者が最初に与えられた問題に対する解を提供し、その後、その解に対する批判によって挑戦される、批判認識ゲーム(CDG)を設計する。
証明者の目的は、誤解を招くコメントに直面しながら、建設的なフィードバックに対する誤りを修正しながら正しい回答を維持することである。
数学的推論,ステップワイドな誤り検出,自己補正,長鎖推論を含む課題に関する実験により,CDGトレーニングは,その推論過程を理解するための整合性 LLM の能力を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:58:07 GMT)
Quantum Machine Learning for Energy-Efficient 5G-Enabled IoMT Healthcare Systems: Enhancing Data Security and Processing [24.2] インターネット・オブ・メディカル・モノ(IoMT)が拡大するにつれて、エネルギー効率の高い医療システムが産業5.0にとってますます重要になっている。
5G対応のIoMTシステムは、リアルタイムデータ収集、高速通信、医療機器と医療提供者間の接続性の向上を可能にする。
これらのシステムは、特にコネクテッドデバイスの増加に伴い、エネルギー消費とデータセキュリティの課題に直面している。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:17:55 GMT)
OmniVec2 -- A Novel Transformer based Network for Large Scale Multimodal and Multitask Learning [23.7] 本稿では,新しいマルチモーダルマルチタスクネットワークと学習アルゴリズムを提案する。
この方法は、約12の異なるモダリティからデータを取り込み得る。
モダリティ固有のタスクヘッドを各タスクに組み込むことで、マルチモーダルとマルチタスクのシナリオに対処する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:51:22 GMT)
Quantum Algorithms for Bandits with Knapsacks with Improved Regret and Time Complexities [23.2] knapsacks (BwK) を用いたバンドは、整数プログラミングとオンライン学習を組み合わせたモデルを構成する。
量子コンピューティングの設定において、報酬とリソース消費の両方を量子オラクルを介してアクセスすることができるBwKモデルについて検討する。
多腕バンディットの量子アルゴリズムに関するこれまでの研究と比較して、資源制約のあるバンディットモデルを考えるのはこれが初めてである。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:52:37 GMT)
Tensor-based Graph Learning with Consistency and Specificity for Multi-view Clustering [20.9] 一貫性と特異性を同時に検討する新しい多視点グラフ学習フレームワークを提案する。
我々は、ノイズフリーグラフ融合のための新しいテンソルベースのターゲットグラフ学習パラダイムを定式化する。
6つのデータセットの実験により,本手法の優位性を実証した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 04:08:24 GMT)
DynOPETs: A Versatile Benchmark for Dynamic Object Pose Estimation and Tracking in Moving Camera Scenarios [20.8] 本稿では,制約のない環境下でのオブジェクトポーズ推定と追跡のための新しいデータセットDynOPETを提案する。
提案手法は,ポーズ推定とポーズ追跡を革新的に統合し,擬似ラベルを生成する。
得られたデータセットは、動くカメラから観察される動的オブジェクトの正確なポーズアノテーションを提供する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:39:19 GMT)
Interactive Groupwise Comparison for Reinforcement Learning from Human Feedback [20.7] 人間からのフィードバックからの強化学習(RLHF)は、AI行動と人間の嗜好の整合を可能にする重要な技術として登場した。
我々は、人間の視覚能力を利用して、サンプル群全体を比較し、探索するインタラクティブな可視化を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:52:14 GMT)
ViTaL: A Multimodality Dataset and Benchmark for Multi-pathological Ovarian Tumor Recognition [20.7] 卵巣腫瘍は、一般的な婦人科疾患として、早期発見時に急速に悪化し、深刻な健康危機に陥ることがある。
ディープニューラルネットワークは卵巣腫瘍を同定し、死亡率を低下させる可能性があるが、公開データセットが限られているため、その進行を妨げている。
496例のtextbfVisual, textbfTabular, textbfLinguistic modality data を含む, textbfViTaL という重要な卵巣腫瘍診断データセットを導入する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:11:46 GMT)
Normalizing Flow to Augmented Posterior: Conditional Density Estimation with Interpretable Dimension Reduction for High Dimensional Data [20.2] 条件密度は、他の予測子$x$が与えられた応答変数$y$の分布を特徴付ける。
本研究では、外部の$x$が存在する場合にNFニューラルネットワークを拡張する。
我々は、z$の教師なしモデルに基づく非条件NFニューラルネットワークは、解釈可能な結果を生成することができないことを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 02:58:52 GMT)
Just Enough Shifts: Mitigating Over-Refusal in Aligned Language Models with Targeted Representation Fine-Tuning [19.8] ACTORは、さまざまなクエリから内部アクティベーションパターンを活用することで、過剰な拒絶を最小化する。
ACTORは、リファインをトリガーするアクティベーションコンポーネントを正確に識別し、調整し、リファイン機構のより強力な制御を提供する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 05:47:04 GMT)
On the Utility of Domain-Adjacent Fine-Tuned Model Ensembles for Few-shot Problems [19.5] 本稿では,ドメイン・アジャセント・ファイン・チューン・ファウンデーション・モデル(DAFT-E)を数ショット問題に応用したフレームワークについて検討する。
ゼロショット問題に対して、このアンサンブル法は、単一最良モデルの精度に近い性能を提供する。
数ショットの問題を発生させると、この性能はさらに向上し、DEFT-Eはどのドメイン・アジャセントモデルよりも優れている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 19:26:40 GMT)
Hijacking JARVIS: Benchmarking Mobile GUI Agents against Unprivileged Third Parties [19.4] 本稿では,モバイルGUIエージェントの脆弱性に関する最初の系統的研究について述べる。
本稿では,スケーラブルな攻撃シミュレーションフレームワークであるAgentHazardを紹介した。
動的タスク実行環境と攻撃シナリオの静的データセットの両方からなるベンチマークスイートを開発する。
以上の結果から, 調査対象となったエージェントは, 誤解を招く第三者コンテンツに大きく影響していることが判明した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 03:31:36 GMT)
Explain with Visual Keypoints Like a Real Mentor! A Benchmark for Multimodal Solution Explanation [19.4] モデルが補助線,点,角などの視覚的キーポイントを識別できるかどうかを評価し,これらのキー要素を組み込んだ説明を生成するためのマルチモーダルソリューション説明タスクを提案する。
我々の経験的結果は、最近の大規模オープンソースおよびクローズドソースモデル、ほとんどの一般オープンソースモデル、数学特殊主義モデルを除いて、マルチモーダルソリューションの説明タスクに苦戦していることを示している。
このことは、現在のLLMの教育的文脈における視覚的基盤による推論と説明能力において、大きなギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:36:13 GMT)
Does Learning Mathematical Problem-Solving Generalize to Broader Reasoning? [19.2] 数学的問題解決の学習が、他の推論能力の発達にどのように貢献するかは、まだ分かっていない。
各種MPSトレーニング手法の一般化可能性に関する実証的研究を行った。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:47:55 GMT)
Sat2City: 3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion [18.9] Sat2Cityは、スパースボクセルグリッドの表現能力を潜在拡散モデルと相乗化する新しいフレームワークである。
衛星視高マップと組み合わせた大規模3D都市を合成したデータセットを提案する。
本フレームワークは, 衛星画像から詳細な3次元構造を生成し, 既存の都市モデルに比べ, 忠実度に優れていた。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 14:30:08 GMT)
Agnostic Online Learning and Excellent Sets [18.6] モデル理論の意味で、$epsilon$-excellent set が任意の $epsilon frac12$ in $k$-edge 安定グラフに対して存在することを示す。
また、この設定に適した動的Sauer-Shelah-Perles lemmaのバージョンも提供します。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:18:39 GMT)
Structural Classification of Locally Stationary Time Series Based on Second-order Characteristics [18.4] 本稿では,局所定常時系列の2つのクラスを区別する数値的,実用的,理論的に厳密な分類法を提案する。
本手法は,局所定常時系列に対する自己回帰近似に基づいて,アンサンブルアグリゲーションと距離に基づく分類しきい値を組み合わせたものである。
トレーニングサンプルサイズには要件がなく、誤分類エラー率をゼロにすることが示されている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 04:00:26 GMT)
Long Context Modeling with Ranked Memory-Augmented Retrieval [18.3] 関連性に基づいて動的にメモリエントリをランク付けする新しいフレームワークを提案する。
本モデルは,情報検索における学習からランクまでの技術に着想を得て,新しい妥当性スコアとキー値埋め込みのためのポイントワイズ・リグレード・モデルを導入する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 21:41:20 GMT)
MedGellan: LLM-Generated Medical Guidance to Support Physicians [18.0] 本稿では,Large Language Model (LLM) を用いて生の医療記録から臨床ガイダンスを生成する軽量フレームワークであるMedGellanを紹介する。
予備実験により, LLM と MedGellan による誘導が診断性能を向上させることが示された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:31:01 GMT)
A Practical and Secure Byzantine Robust Aggregator [17.7] ビザンチンのロバストアグリゲーションは、ベクトルのロバスト平均を計算するアルゴリズムプリミティブである。
入力ベクトルのサイズにおいて準線形時間で動作し、ほぼ最適バイアス境界を持つ最初のロバストアグリゲータを与える。
我々のアルゴリズムは、クリーンベクトルの分布に関する知識を前提とせず、フィルターしきい値の事前計算も必要としない。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:17:29 GMT)
Structured light with a million light planes per second [17.6] フルフレームの3Dスキャンを1000text$で実現し,従来よりも4倍高速な構造光システムを提案する。
鍵となるイノベーションは、毎秒200万光面を投影できるカスタムの光学式光走査装置を使用することだ。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:21:49 GMT)
RAT: Bridging RNN Efficiency and Attention Accuracy in Language Modeling [17.4] 再発機構と注意機構の間にラットという中間設計を導入する。
入力をチャンクに分割し、各チャンク内で単純なリニアリカレンスを適用してローカル依存関係をキャプチャし、その後、チャンク全体でソフトマックスアテンションを行い、長距離インタラクションをモデル化する。
チャンクサイズが16の場合、ラット層は100Kトークンシーケンスで(7時間)訓練速度を向上し、4Kシーケンス長で(9時間)生成する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:08:49 GMT)
Inverse Reinforcement Learning using Revealed Preferences and Passive Stochastic Optimization [15.9] 最初の2章では、逆強化学習(IRL)を、ミクロ経済学から明らかな好みのレンズを通して見る。
第3章では適応勾配アルゴリズムについて研究している。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:56:02 GMT)
Automatic Multi-level Feature Tree Construction for Domain-Specific Reusable Artifacts Management [15.8] 本稿では,FTBuilDERという自動多層特徴木構築フレームワークを提案する。
自動的にドメイン固有のソフトウェアリポジトリをクロールし、メタデータをマージして構造化されたアーティファクトライブラリを構築する。
これにより、アーティファクトの選択に26%の時間を節約でき、GPT-4でアーティファクトレコメンデーションの精度を235%向上できる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 06:21:15 GMT)
Grid-Reg: Grid-Based SAR and Optical Image Registration Across Platforms [15.8] 本稿では,グリッドベースの多モード登録フレームワーク(Grid-Reg)を提案する。
我々のGrid-Regは、正確なキーポイント対応ではなく、検出不要なマッチングとグローバルな損失に基づいている。
実世界のUAV MiniSARデータとGoogle Earthの光学画像を用いて、SAR-to-optical registrationの新しい挑戦的なベンチマークデータセットをキュレートする。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 03:43:18 GMT)
GradOT: Training-free Gradient-preserving Offsite-tuning for Large Language Models [15.5] 本稿では,勾配保存圧縮に基づく新しい OT 手法,GradOT を提案する。
最適化レンズを用いてOT問題を解析することにより、ランク圧縮やチャネルプルーニングなどの圧縮手法を選択的に適用し、微調整アダプタの勾配を保ちながらプライバシーを確保する手法を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 16:27:27 GMT)
DevMuT: Testing Deep Learning Framework via Developer Expertise-Based Mutation [15.4] DevMuTは開発における開発者の共通操作をシミュレートし、より多様な欠陥を検出する。
生成されたモデルの多様性の平均で、少なくとも71.68%の改善が達成できる。
DevMuTは2023年12月からMindSporeコミュニティにデプロイされている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:48:04 GMT)
Learning from Similar Linear Representations: Adaptivity, Minimaxity, and Robustness [15.1] 我々は,不整形なタスクを扱いながら,テキストに類似するタスクから学習する方法を研究している。
両手法が大局的に最適であることを示すために,情報理論の下限を提供する。
また,未知の固有次元に適応するしきい値アルゴリズムを導入する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:36:55 GMT)
mmEgoHand: Egocentric Hand Pose Estimation and Gesture Recognition with Head-mounted Millimeter-wave Radar and IMU [15.1] mmEgoHandは、手振り推定のためのヘッドマウントエゴセントリックシステムである。
ジェスチャー認識、VRインタラクション、スキルのデジタル化とアセスメント、ロボット遠隔操作などのアプリケーションをサポートする。
mmEgoHandは、動的知覚を可能にするために、mmWaveレーダーと慣性測定ユニット(IMU)を統合する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:31:44 GMT)
Challenges & Opportunities with LLM-Assisted Visualization Retargeting [14.8] 既存のカスタムチャートを新しいデータセットに実装することは、依然として難しく、時間集約的で、面倒です。
近年のLarge Language Modelsでは,高レベルのユーザプロンプトによってコードの自動適応が実現されている。
我々は、複数のデータセットと様々な複雑さのチャートにまたがるLLMアシストの性能を評価する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:15:55 GMT)
Dealing with Uncertainty in Contextual Anomaly Detection [14.5] コンテキスト異常検出(CAD)は、コンテキスト変数のセットに条件付けされたターゲット(振る舞い)変数の異常を識別することを目的としている。
そこで本研究では,アレータ性およびてんかん性不確実性の両方を明示的にモデル化したCADのための新しいフレームワークである正規性スコア(NS)を提案する。
NSは検出精度と解釈可能性の両方において最先端CAD法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:02:11 GMT)
LearnLens: LLM-Enabled Personalised, Curriculum-Grounded Feedback with Educators in the Loop [14.4] LearnLensはLLMベースのモジュラーシステムで、科学教育において個人化されたカリキュラムに沿ったフィードバックを生成する。
既存のシステムにおける重要な課題に対処し、スケーラブルで高品質なフィードバックを提供し、教師と学生の両方に力を与える。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:39:26 GMT)
M$^3$-Med: A Benchmark for Multi-lingual, Multi-modal, and Multi-hop Reasoning in Medical Instructional Video Understanding [13.7] M3-Medは、医療ビデオ理解におけるマルチ言語、マルチモーダル、マルチホップ推論のための最初のベンチマークである。
M3-Medの重要な革新はマルチホップ推論タスクである。これは、テキスト内の重要なエンティティを特定し、ビデオ内の対応する視覚的証拠を見つけ、最終的に両方のモダリティにまたがって情報を合成して答えを導き出すモデルを必要とする。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:14:35 GMT)
BiFair: A Fairness-aware Training Framework for LLM-enhanced Recommender Systems via Bi-level Optimization [13.2] BiFairは、事前トレーニングと不公平トレーニングの両方を同時に緩和するために設計された公正対応のトレーニングフレームワークである。
3つの実世界のデータセットに対する大規模な実験は、BiFairが不公平を著しく軽減し、従来の最先端の手法よりも優れていることを示している。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:39:26 GMT)
Can Large Language Models Automate the Refinement of Cellular Network Specifications? [12.6] 本稿では,大規模言語モデル (LLM) のセルラーネットワーク仕様自動修正への適用性について検討する。
トップモデルでは、5つのトライアルで200のテストケース中127以上でセキュリティ関連の弱点を発見することができる。
30の細胞攻撃の評価は、完全な自動化を達成するためのオープンな課題を特定する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 02:40:04 GMT)
Unveiling the Potential of Diffusion Large Language Model in Controllable Generation [11.2] 拡散モデルは、もともと画像生成のために開発されたもので、自己回帰型大規模言語モデル(LLM)に代わる有望な代替品として登場した。
自己回帰とマスク拡散LDM(dLLMs)を比較した理論的解析法を提案する。
textbfSelf-adaptivetextbfSchema textbfScafは、dLLMが意味的忠実さを維持し、推論を加速しながら構造化された出力を生成する新しいフレームワークである。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:41:34 GMT)
The Role of Open-Source LLMs in Shaping the Future of GeoAI [11.1] 大規模言語モデル(LLM)は地理空間人工知能(GeoAI)を変換している
本稿では,このトランスフォーメーションにおけるオープンソースパラダイムの重要性について考察する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 21:19:54 GMT)
MVL-Loc: Leveraging Vision-Language Model for Generalizable Multi-Scene Camera Relocalization [11.1] 本稿では,新しいエンド・ツー・エンドのマルチシーンカメラ・リローカライズ・フレームワークであるMVL-Locを提案する。
自然言語は多場面学習プロセスを導くための指示ツールとして使用される。
7ScenesとCambridge Landmarksのデータセットの実験では、MVL-Locの堅牢性と最先端のパフォーマンスが示されている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:52:16 GMT)
Bandit Pareto Set Identification in a Multi-Output Linear Model [11.0] 目標は、腕からサンプルを適応的に集めることで、非支配的な腕の集合を特定することである。
固定予算設定と固定信頼設定の両方において、ほぼ最適な保証を提供する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 06:14:43 GMT)
Better Safe Than Sorry? Overreaction Problem of Vision Language Models in Visual Emergency Recognition [10.9] 我々は,100対のコントラスト画像からなる診断ベンチマークVERIを紹介する。
医療現場, 事故, 自然災害を対象とする14の視覚言語モデル(VLM)を評価した。
我々の分析では、モデルが真の緊急事態を正確に識別するが、偽陽性率が高い「過剰反応問題」が明らかになっている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:55:20 GMT)
PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models [10.6] ファインチューニング(FT)は、トレーニング済みのAIファンデーションモデルを、より小さなターゲットデータセットでトレーニングすることでカスタマイズする手法である。
完全同型暗号化(FHE)を組み込んだPrivTunerスキームをLoRAに実装し,プライバシ保護を実現する。
実験により,我々のアルゴリズムは,異なるプライバシー要件に適応しながら,エネルギー消費を大幅に削減できることが示された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:13:54 GMT)
UniAud: A Unified Auditing Framework for High Auditing Power and Utility with One Training Run [9.4] データに依存しない監査のための統合フレームワークUniAudを提案する。
データ依存監査のためのUniAud++として、このフレームワークを拡張します。
我々は,O(T)監査の最先端の監査結果と数千ランの監査結果とが一致していることを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 16:35:48 GMT)
Coupled Cluster Downfolding Theory in Simulations of Chemical Systems on Quantum Hardware [9.4] 古典的資源が、現在の量子デバイスの制約に適合する次元によって特徴づけられる有効ハミルトニアンを構築するためにどのように使用されるかを示す。
このようなフレキシブルなハイブリッドアルゴリズムは、問題のサイズを利用可能な量子資源に合わせることができ、ノイズの多い中間スケール量子(QNIS)デバイスと将来のフォールトトレラント量子コンピュータの間の橋渡しとして機能する、と我々は主張する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 01:58:40 GMT)
Transferring Visual Explainability of Self-Explaining Models through Task Arithmetic [8.9] 両方のタスクを単一の推論で実行する自己説明モデルは効果的であるが、それらのトレーニングは実質的なラベル付けと計算コストを発生させる。
本研究では,学習した自己説明型モデルの視覚的説明可能性について,タスク演算フレームワークに基づく対象領域に伝達する手法を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:55:31 GMT)
DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design [8.9] ユーザが提供する画像やテキストプロンプトから高品質なポスターをインテリジェントに合成するテキスト・ツー・イメージ生成フレームワークであるDreamPosterを紹介する。
データセット構築のために,テキストコンテンツとタイポグラフィ階層情報を正確にアノテートする体系的なデータアノテーションパイプラインを提案する。
我々は、高品質な生成を維持しつつ、階層的にマルチタスク生成能力を得られるプログレッシブトレーニング戦略を実装した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 03:06:45 GMT)
Free-Mask: A Novel Paradigm of Integration Between the Segmentation Diffusion Model and Image Editing [8.7] セグメンテーションのための拡散モデルと高度な画像編集機能を組み合わせたフレームワーク textbfFree-Mask を提案する。
その結果、textbfFree-Mask は VOC 2012 ベンチマークで未確認のクラスに対して、新しい最先端の結果を達成していることがわかった。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:14:36 GMT)
Self-supervised learning of speech representations with Dutch archival data [8.5] 本稿では,オランダのアーカイブテレビ放送データを用いた音声基礎モデルの自己教師型学習,特にwav2vec 2.0について検討する。
まず,事前学習におけるデータ品質の仮定について検討し,音楽,雑音,話者の重なりがSSL収束および下流微調整性能に与える影響を示す。
最後に, 55k時間アーカイブデータセットを用いたwav2vec 2.0 XLS-Rモデルチェックポイントの事前学習を継続することにより, オランダ語に対する最先端の大規模wav2vec 2.0モデルを実現する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:11:22 GMT)
Have LLMs Made Active Learning Obsolete? Surveying the NLP Community [8.0] 教師付き学習は注釈付きデータに頼っている。
大規模言語モデル(LLM)は、アクティブラーニングの有効性を推し進めている。
我々はNLPコミュニティでオンライン調査を行い、データアノテーションの認知的関連性に関する無形の知見を収集する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:59:31 GMT)
Improving Action Smoothness for a Cascaded Online Learning Flight Control System [7.9] 制御動作の振幅と周波数を減少させるために,オンライン時空間滑らか化手法と低域通過フィルタを導入する。
シミュレーションの結果,2つの手法による改善が示された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:19:34 GMT)
Multi-Modal Semantic Parsing for the Interpretation of Tombstone Inscriptions [7.8] 墓石は歴史的かつ文化的に豊かな人工物であり、個人の生活、コミュニティの記憶、歴史物語、芸術的表現をカプセル化している。
今日の多くの墓石は、物理的侵食、破壊、環境劣化、政治的変化など、重要な保存上の課題に直面している。
本稿では,墓石の解釈,整理,検索の改善を目的とした,墓石のデジタル化のための新しいマルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:50:07 GMT)
FairFare: A Tool for Crowdsourcing Rideshare Data to Empower Labor Organizers [7.8] ライダーワーカーは、ギグワークプラットフォームが不透明なAIとアルゴリズムシステムに依存しているため、予測不可能な労働条件を経験する。
FairFareは、従業員のデータをクラウドソースして分析して、テイクレートを見積もるツールです。
評価インタビューの間、主催者はフェアファールが法案言語とコロラド州上院法案24-75の成立に影響を与えたと報告した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:02:19 GMT)
EDALearn: A Comprehensive RTL-to-Signoff EDA Benchmark for Democratized and Reproducible ML for EDA Research [7.8] 我々はEDALearnを紹介した。EDALearnは、EDAの機械学習タスクに特化した、最初の包括的なオープンソースベンチマークスイートである。
このベンチマークスイートは、合成から物理実装までのエンドツーエンドのフローを示し、さまざまなステージにわたるデータ収集を強化する。
私たちの貢献はML-EDAドメインのさらなる進歩を促進することを目的としています。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 07:15:43 GMT)
Exploring Remote Physiological Signal Measurement under Dynamic Lighting Conditions at Night: Dataset, Experiment, and Analysis [7.7] 夜間に動的照明条件下で収集した大規模rデータセットDLCNを提示・公開する。
データセットは、約13時間の映像データと、98人の被験者の生理的信号からなり、4つの代表的な夜間照明シナリオをカバーしている。
DLCNに適用した場合、最先端の r 法で直面する課題を網羅的に分析する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:16:08 GMT)
Street design and driving behavior: evidence from a large-scale study in Milan, Amsterdam, and Dubai [7.6] 本研究では,ミラノの30km/h速度制限に対するドライバーのコンプライアンスについて検討した。
コンピュータビジョンに基づくセマンティックセマンティックセグメンテーションモデルをGoogleストリートビュー画像に適用する。
大規模な分析では、より狭い通りと密集した環境がより低い速度と関連していることが明らかになった。
道路特性に基づいて走行速度を予測する機械学習モデルを開発した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:40:38 GMT)
Normalized Iterative Hard Thresholding for Tensor Recovery [7.5] 低ランク回復は圧縮センシングの理論に基づく。
我々は、低ランクテンソルの回復のために、NIHTのテンソル拡張(TNIHT)を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 03:36:50 GMT)
DMAT: An End-to-End Framework for Joint Atmospheric Turbulence Mitigation and Object Detection [7.1] 大気乱流(AT)は、監視画像の明瞭さと精度を低下させる。
視覚的品質を改善するために深層学習に基づく手法が提案されているが、新しい歪みは依然として大きな問題である。
本稿では,変形した特徴を補償し,可視化とオブジェクト検出を同時に改善するフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:12:02 GMT)
Adversarial Data Augmentation for Single Domain Generalization via Lyapunov Exponent-Guided Optimization [6.6] 単一ドメインの一般化は、単一のソースドメインのみを使用して、対象ドメインを見えないように一般化できるモデルを開発することを目的としている。
Lyapunov Exponent (LE) を用いた動的システム理論に基づく新しい最適化手法であるLEAwareSGDを提案する。
PACS、OfficeHome、DomainNetの実験は、LEAwareSGDがかなりの一般化の利益をもたらすことを示した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:03:08 GMT)
Mixed-Sample SGD: an End-to-end Analysis of Supervised Transfer Learning [6.6] 本稿では,ソースデータとターゲットデータのサンプリングを交互に行うSGDプロシージャを設計する際の問題点について考察する。
アルゴリズムの主な難しさは、各SGDステップでこのような適応的なサブサンプリングメカニズムを設計する方法を理解することである。
このような混合サンプルSGD法は凸損失を伴う一般的な予測タスクに有効であることを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 00:03:34 GMT)
Fairness Evaluation of Large Language Models in Academic Library Reference Services [6.3] 大規模言語モデル (LLM) が, 性別, 人種・民族, 制度的役割の異なるパトロンを支援するために, 6つの最先端のLDMを誘導することにより, ユーザアイデンティティ間で応答を区別するか否かを評価する。
人種や民族による差別の証拠は見つからず、1つのモデルで女性に対するステレオタイプ的偏見の小さな証拠しか見つからなかった。
これらの結果から,現在のLCMは,学術図書館参照サービスにおける公平かつ適切なコミュニケーションを支援するための,有望な準備の度合いを示すことが示唆された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 03:28:24 GMT)
Surg-SegFormer: A Dual Transformer-Based Model for Holistic Surgical Scene Segmentation [6.3] Surg-SegFormerは、最先端技術より優れた新しいプロンプトフリーモデルである。
堅牢で自動的な手術シーン理解を提供することで,専門医の指導負担を大幅に軽減する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:04:25 GMT)
DC-Mamber: A Dual Channel Prediction Model based on Mamba and Linear Transformer for Multivariate Time Series Forecasting [6.2] 現在の主流モデルは主にTransformerと新しいMambaをベースにしている。
DC-Mamber は、時系列予測のためのMamba と linear Transformer に基づく二重チャネル予測モデルである。
8つの公開データセットの実験では、DC-Mamberの既存のモデルよりも優れた精度が確認されている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:58:52 GMT)
Construction Identification and Disambiguation Using BERT: A Case Study of NPN [6.2] 構築文法は、ある言語の知識は、主に形式的な意味を持つペアの知識から成り立っていると仮定する。
近年の研究では、トランスフォーマー言語モデルは少なくともいくつかの構造パターンを表すことが示されている。
BERTによる英語の形式と意味の表現について検討する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 23:10:06 GMT)
Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions [6.0] 視覚に基づく手ジェスチャー認識(VHGR)は、手話理解やカメラを用いた人間とコンピュータのインタラクションなど、幅広い用途を提供する。
この分野での膨大な研究にもかかわらず、VHGRに関する構造化された完全な調査はいまだに欠落している。
このレビューは、研究者が特定のVHGRタスクをディビングするための適切な戦略を選択するのを助けるために有用なガイドラインを構成することを目的としている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 17:03:01 GMT)
Towards Understanding the Cognitive Habits of Large Reasoning Models [5.9] 大規模推論モデル(LRM)は、最終的な応答を生成する前に、自律的に思考の連鎖(CoT)を生成する。
特定のCoTパターンがタスク全体にわたって一貫して現れるという観察に触発された私たちは、LRMが人間のような認知習慣を示すかどうかを探求する。
我々は、LRMの認知的習慣を評価するために設計された、原則付きベンチマークであるCogTestを紹介する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 02:26:21 GMT)
An Explainable Transformer Model for Alzheimer's Disease Detection Using Retinal Imaging [5.4] アルツハイマー病(英: Alzheimer's disease、AD)は、世界中の何百万もの人に影響を及ぼす神経変性疾患である。
本研究では,網膜画像を用いたAD検出のための新しいトランスフォーマーアーキテクチャであるRetformerを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 06:40:42 GMT)
MLLM-Fabric: Multimodal Large Language Model-Driven Robotic Framework for Fabric Sorting and Selection [5.2] MLLM-Fabricは,マルチモーダルな大規模言語モデル(MLLM)を用いて,ファブリックのソートと選別を行うロボットフレームワークである。
このシステムには、ロボットアーム、カメラ、粘菌センサー、圧力センサーが含まれる。
ファブリック特性を正確に分類しランク付けするために、教師付き微調整およびマルチモーダルな説明誘導知識蒸留を用いる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:27:27 GMT)
SmartThinker: Learning to Compress and Preserve Reasoning by Step-Level Length Control [5.2] 大規模な推論モデル(LRM)は、推論時間スケーリングを通じて顕著な推論能力を示した。
従来の研究は、強化学習中に生成されたサンプル全体の長さをペナルティ化することでこの問題を緩和しようと試みてきた。
We propose SmartThinker, a two-stage learnable framework designed to enable fine-fine control over the length of reasoning chains。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:21:47 GMT)
A Causal World Model Underlying Next Token Prediction: Exploring GPT in a Controlled Environment [5.2] 生成事前学習型トランスフォーマー(GPT)モデルは、次のトークンを予測するためにのみ訓練され、シーケンスが一度に1つのトークンを生成する世界モデルから暗黙的に学習される。
GPTモデルでは, 因果構造が高信頼な注意機構に符号化された分布外配列に対して, 合法的な次の動きが生じる可能性が示唆された。
違法な動きを発生させる場合、因果構造を捕捉することができない。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:43:56 GMT)
Consistent Labeling Across Group Assignments: Variance Reduction in Conditional Average Treatment Effect Estimation [4.9] 我々は,複数のアルゴリズムが同じインスタンスに対して異なるグループ割り当てに対して一貫性のない学習行動を示す,共通の問題を強調した。
本稿では,この不整合がテストエラーの増大に実際に寄与し,従来の機械学習手法では解決できないことを示す理論的解析について述べる。
我々は,既存のCATE推定アルゴリズムに適用可能な,textbfConsistent Labeling Across Group Assignments (CLAGA) と呼ばれる一般的な手法を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:36:39 GMT)
Approaching the Key Rate Limit in Continuous-Variable Quantum Key Distribution Network [4.8] 量子鍵分布ネットワークは、量子物理学の原理を活用して、一対のユーザが独立した秘密鍵を生成することを可能にする。
マルチユーザ・セキュリティ・フレームワークを導入し、汎用的で包括的なエンドツーエンド・キーレート・フォーミュラを提供する。
本稿では,100km以内の実践的展開において,理論上上限を達成できるマルチユーザプロトコルを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 16:56:48 GMT)
Exploring Micro Frontends: A Case Study Application in E-Commerce [4.6] この論文は、特に産業の文脈において、いつマイクロを採用する価値があるかを理解することを目的としている。
学術文献,灰色文献の両面からミクロスの現状を調査した。
そして、すでに使われている手作り製品のためのマーケットプレースで、このアーキテクチャスタイルを実装しました。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 21:42:36 GMT)
SpiritRAG: A Q&A System for Religion and Spirituality in the United Nations Archive [4.6] Retrieval-Augmented Generation(RAG)に基づく対話型Q&AシステムであるSpiritRAGを提案する。
SpiritRAGは、保健・教育分野におけるR/Sに関する7500件の国連(UN)決議文書を使って構築され、研究者や政策立案者が複雑な文脈に敏感なデータベース検索を行うことを可能にする。
100の質問を手作業で作成したドメインエキスパートによるパイロットテストと評価は、SpiritRAGの実用的価値と有用性を示している。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:54:54 GMT)
SHyPar: A Spectral Coarsening Approach to Hypergraph Partitioning [4.1] 大規模ハイパーグラフのためのマルチレベルスペクトルフレームワークSHyParを導入し,ハイパーエッジ有効抵抗とフローベースコミュニティ検出技術を利用した。
SHyParの鍵となるコンポーネントは、ハイパーグラフ粗化のためのフローベースの局所クラスタリングスキームであり、最大フローベースのアルゴリズムを組み込んで、コンダクタンスを大幅に改善したノードを生成する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 17:10:45 GMT)
PAVLM: Advancing Point Cloud based Affordance Understanding Via Vision-Language Model [4.1] 3Dオブジェクト上で動作可能な領域を識別する作業であるアフォーマンス理解は、ロボットシステムが物理的な世界の中で関わり、操作できるようにする上で重要な役割を担っている。
視覚言語モデル(VLM)は高レベルの推論において優れているが、効果的な人間とロボットの相互作用に必要な微妙な物理的特性の把握には不十分である。
PAVLMは、事前訓練された言語モデルに埋め込まれた広範なマルチモーダル知識を利用して、ポイントクラウドの3Dアベイランス理解を強化する革新的なフレームワークである。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:54:14 GMT)
Learning Software Bug Reports: A Systematic Literature Review [4.0] 機械学習(ML)は、バグレポートからの情報の理解、抽出、相関を自動化することを目的としている。
その重要性は増しているが、この地域では包括的なレビューは行われていない。
本稿では,1,825件の論文を網羅した体系的な文献レビューを行い,詳細な分析のために204件を選択した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:17:59 GMT)
Optical protection of alkali-metal atoms from spin relaxation [4.0] 単一共振レーザビームを用いたアルカリ金属スピンの緩和を抑制する光学的手法を提案する。
温度セシウム蒸気の脱コヒーレンスを9倍に低減し, スピン交換緩和とセル壁部分脱分極の同時保護を実現した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:22:39 GMT)
The role of large language models in UI/UX design: A systematic literature review [4.0] 本稿では,UI/UX設計における大規模言語モデル(LLM)の役割について考察する。
GPT-4、Gemini、PaLMを含む主要なLCMを特定し、それらの統合を設計ライフサイクル全体にわたってマップする。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 17:18:05 GMT)
Node Replacement based Approximate Quantum Simulation with Decision Diagrams [4.0] 量子回路におけるシミュレーション精度とメモリ要求とのトレードオフについて述べる。
新たなアプローチでは、最小のランタイムオーバーヘッドを持つ決定ダイアグラムを持つ量子回路を表現するためのメモリ精度のトレードオフが向上する。
初めて、決定図に基づく量子シミュレーションにおいて、メモリと忠実性の間の強い線形トレードオフが示される。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:44:36 GMT)
Enhancing Text-Based Hierarchical Multilabel Classification for Mobile Applications via Contrastive Learning [3.9] モバイルアプリケーション(アプリケーション)向けの階層的なラベリングシステムは、独自のユーザデータとラベリングを統合する幅広いダウンストリームビジネスに恩恵をもたらす。
我々は、名前や記述などのテキスト情報を用いて、アプリケーションの階層的マルチラベル分類の問題に対処する。
当社のアプローチはTencentで展開されており、アプリのマルチラベル分類アウトプットは、ダウンストリームタスク — ユーザのリスク管理 — のパフォーマンスを10.70%向上させました。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:04:19 GMT)
Confidence Intervals for Evaluation of Data Mining [3.8] データマイニングに使用される一般的なパフォーマンス対策に関する統計的推測を考察する。
信頼区間に対する有限サンプルカバレッジ確率について検討した。
また, ばらつきを補正する「ぼやけた補正」を提案し, 有限サンプル性能を向上する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 02:13:46 GMT)
Towards Lightest Low-Light Image Enhancement Architecture for Mobile Devices [3.8] モバイルおよび組み込みデバイス上でのリアルタイム低照度画像強調には、視覚的品質と計算効率のバランスをとるモデルが必要である。
大規模監視への依存を解消する超軽量無監督強化フレームワーク LiteIE を提案する。
LiteIEは、わずか58パラメータの4Kイメージで30 FPSで動作し、エッジデバイスへのリアルタイムデプロイメントを可能にする。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 07:36:47 GMT)
Answer Set Programming Modulo Theories and Reasoning about Continuous Changes [3.7] ASPMTは、解集合プログラミング(ASP)と満足度変調理論(SMT)の緊密な統合のための新しいフレームワークである。
連続的な変化と離散的な変化を扱うためのアクション言語C+を強化することで、ASPMTの有用性を実証する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:52:03 GMT)
Investigating the diversity and stylization of contemporary user generated visual arts in the complexity entropy plane [3.6] 複雑エントロピー平面(C-H)を用いて視覚芸術様式の出現とスタイル化を導く進化過程を考察する。
2010年から2020年にかけてDeviantArtとBehanceプラットフォームで撮影された149,780の画像を分析した。
その結果,視覚芸術様式のC-H情報と多面像の特徴の相違との間に有意な統計的関係が認められた。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 21:07:27 GMT)
SoK: A Systematic Review of Context- and Behavior-Aware Adaptive Authentication in Mobile Environments [2.4] 2011年以降のモバイル環境における適応認証に関する41の研究を分析した。
私たちの分析は、プライバシとセキュリティモデル、インタラクションのモダリティ、ユーザ、リスク認識、実装上の課題、マシンラーニングフレームワークの7つの側面にまたがっています。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:20:29 GMT)
Intelligent Assistants for the Semiconductor Failure Analysis with LLM-Based Planning Agents [2.3] 失敗分析(FA)は、非常に複雑で知識集約的なプロセスである。
FAラボの計算インフラにおけるAIコンポーネントの統合は、さまざまなタスクを自動化する可能性がある。
本稿では,Large Language Model (LLM) を用いた計画エージェント (LPA) の設計と実装について検討する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:51:01 GMT)
Multimedia Verification Through Multi-Agent Deep Research Multimodal Large Language Models [2.2] 本稿では,ACMMM25-Grand Challenge on Multimedia Verificationについて述べる。
マルチモーダル大言語モデル(MLLM)と特殊な検証ツールを組み合わせてマルチメディア誤情報を検出するマルチエージェント検証システムを開発した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 14:54:07 GMT)
No Language Data Left Behind: A Comparative Study of CJK Language Datasets in the Hugging Face Ecosystem [2.1] 文化規範,研究環境,制度的実践がデータセットの可用性と品質をどのように形成するかを検討する。
本研究は,中国におけるデータセットの大規模かつ機関主導的な性質,韓国NLPにおける草の根コミュニティ主導の開発,日本コレクションへのエンターテイメントとサブカルチャーの重視,などを明らかにする。
我々は、将来のデータセットのキュレーションとコラボレーションのためのベストプラクティスについて議論し、3つの言語すべてにわたるリソース開発を強化することを目的として締めくくった。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:32:32 GMT)
Investigating the Fermi-Hubbard model by the Tensor-Backflow method [2.1] 近年,逆流補正のテンソル表現に基づく変動波動関数は,Fermi-Hubbard型モデルの解法において,最先端のエネルギー精度を実現している。
本研究では、バックフロー補正のテンソル表現を0.9-バックフローと呼ぶ。
本研究では,2次元格子上のFermi-Hubbardモデルについて,U$の相互作用強度,n$の電子充填,境界条件で検討する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:35:00 GMT)
Making a Pipeline Production-Ready: Challenges and Lessons Learned in the Healthcare Domain [2.1] SPIRAはML-Enabled System(MLES)を作成し、音声分析によって呼吸不全を診断するプロジェクトである。
本稿では,MLESのアーキテクチャの概要を述べるとともに,その連続訓練サブシステムの3つのバージョンを比較した。
論文は、学習した課題と教訓を共有し、パイプラインを生産しようとする研究者や実践者に洞察を提供する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:45:08 GMT)
Machine Learning-Based Prediction of Metal-Organic Framework Materials: A Comparative Analysis of Multiple Models [2.1] 金属-有機系フレームワーク (MOF) は様々な用途に期待できる材料として登場してきた。
本研究は,MOFの材料特性を予測するための機械学習手法に関する包括的研究である。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:10:00 GMT)
Large Language Models' Varying Accuracy in Recognizing Risk-Promoting and Health-Supporting Sentiments in Public Health Discourse: The Cases of HPV Vaccination and Heated Tobacco Products [2.1] 大規模言語モデル(LLM)は強力な技術として注目されているが、その正確さと、健康問題に対するさまざまな意見の収集の可能性はほとんど解明されていない。
本研究は、リスク促進と健康支援の感情を検出する上で、3つの顕著なLSMがどの程度正確かを検討する。
特に、モデルはFacebook上でリスク促進感情の精度が高く、Twitter上でのヘルスサポートメッセージはより正確に検出される。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:57:02 GMT)
SPIRA: Building an Intelligent System for Respiratory Insufficiency Detection [1.9] 本稿では,音声から呼吸不全を検出するインテリジェントシステムであるSPIRAの構築経験を報告する。
同じアーキテクチャの次の2つの実装で直面する課題をコンパイルする。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 21:42:02 GMT)
QF: Quick Feedforward AI Model Training without Gradient Back Propagation [0.8] QFラーニング(QF Learning)は、モデル重みへの命令由来の知識の効率的な伝達のためのフレームワークである。
QF更新はクローズドな形式で計算され、パラメータの変更を最小限にし、事前の知識を保持する必要がある。
コードとモデルはGitHubで公開されている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:56:41 GMT)
MOD-X: A Modular Open Decentralized eXchange Framework proposal for Heterogeneous Interoperable Artificial Agents [0.8] 本稿では,エージェント相互運用のための新しいアーキテクチャフレームワークであるMOD-Xを紹介する。
現在のアプローチとは異なり、MOD-Xはユニバーサルメッセージバスを備えた階層アーキテクチャを提案する。
主なイノベーションとしては、パブリッシュ-サブスクライブ通信モデル、セマンティック機能発見、動的ワークフローオーケストレーションなどがある。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:46:57 GMT)
Reconstructing Biological Pathways by Applying Selective Incremental Learning to (Very) Small Language Models [0.4] 汎用大規模言語AIモデル(LLM)は、しばしば「幻覚」と呼ばれる創造的な回答を提供する傾向を示す。
生物医学研究において, より小さく, ドメイン, タスク固有のLMの設計と利用が, より合理的かつ適切な利用である可能性が示唆された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:35:45 GMT)
Linking diffusive fields to virtual waves as their propagative duals [0.3] 計測された拡散表面信号から得られた局所的に計算された仮想波を、超音波やRADAR画像から確立した飛行時間法を用いて画像再構成に利用した。
これにより、サーモグラフィにおける空間分解能が向上し、原子プローブトモグラフィーにおける量子波パケットの分散が補償される。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 21:25:33 GMT)
Efficient Training of Deep Networks using Guided Spectral Data Selection: A Step Toward Learning What You Need [0.3] 本稿では,GSTDS(Guid Spectrally Tuned Data Selection)アルゴリズムを提案する。
GSTDSは、市販の事前訓練参照モデルを使用して、トレーニングに使用するデータポイントのサブセットを動的に調整する。
性能を損なうことなく、最大4回まで、計算要求の顕著な削減を実現している。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 07:02:04 GMT)
ATwo-Stage Ensemble Feature Selection and Particle Swarm Optimization Approach for Micro-Array Data Classification in Distributed Computing Environments [0.3] マイクロアレイ技術によって生成されたデータセットの高次元性は、機械学習アルゴリズムの課題である。
我々は,ハイブリッドアレイのクラスiフィカシックに対して,多数決によるアンサンブル特徴選択手法を提案する。
提案モデルの有効性は,ローカル環境とクラウド環境の両方で検証されている。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 05:50:34 GMT)
Dude, where's my utterance? Evaluating the effects of automatic segmentation and transcription on CPS detection [0.3] 協調的問題解決マーカーは、効果的なチームワークの重要な側面を捉えます。
これらのマーカーを確実に検出するAIシステムは、あるグループが苦労しているか、あるいは生産的なコラボレーションを実証しているかを教師が識別するのに役立つ。
我々は、CPS検出が2つの重要なコンポーネント、すなわち転写と音声のセグメンテーションによってどのように影響するかを評価する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 16:25:18 GMT)
Emergent misalignment as prompt sensitivity: A research note [0.3] 我々は3つの設定(拒絶、自由形質問、事実的リコール)にわたる安全でないモデルを評価する。
「拒絶・自由形式の質問では、単に悪であると問うだけで、安全でないモデルから不一致の行動を確実に引き出すことができる。」
実際のリコール設定では、ユーザが不一致を表現すると、安全でないモデルの方が応答を変える可能性がずっと高いことが分かる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:57:42 GMT)
THM@SimpleText 2025 -- Task 1.1: Revisiting Text Simplification based on Complex Terms for Non-Experts [0.2] SimpleText CLEF Labは、科学テキストの単純化の問題に焦点を当てている。
この課題に対処するために,非専門読者を対象に,小さなGeminiとOpenAIの大規模言語モデルを用いて文中の複素項の同定を行う。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:05:54 GMT)
Mixtures of Gaussian Process Experts with SMC$^2$ [0.2] ガウスのプロセスエキスパートの混合は、データポイントが独立した専門家に割り当てられる場所として検討されている。
我々は、ネストした連続モンテカルロサンプルを用いた新しい推論手法を構築し、ゲーティングネットワークとガウス過程の専門家パラメータの両方を推論する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:48:15 GMT)
A Linguistic Analysis of Spontaneous Thoughts: Investigating Experiences of Déjà Vu, Unexpected Thoughts, and Involuntary Autobiographical Memories [0.2] 言語署名を用いて,Deja Vu,Involuntary Autobiographical Memories,Unexpected Thoughtsを調査した。
言語を自発的認知の窓として位置づけることで、既存の理論を更新し再確認することができることを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:57:36 GMT)
Information-theoretic Quantification of High-order Feature Effects in Classification Problems [0.2] 特徴重要度(Hi-Fi)法における高次相互作用の情報理論拡張について述べる。
私たちのフレームワークは、機能のコントリビューションをユニークでシナジスティックで冗長なコンポーネントに分解します。
その結果,提案した推定器は理論的および予測された結果を正確に復元することがわかった。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:50:30 GMT)
A Data-Driven Novelty Score for Diverse In-Vehicle Data Recording [0.1] 現実世界のデータ収集は、しばしば一般的なシーンやオブジェクトに偏りがあり、新しいケースは表現されていない。
本研究では,オブジェクトレベルの新規性検出に着目したリアルタイムデータ選択手法を提案する。
提案手法は,32フレーム/秒のリアルタイム展開をサポートし,時間とともに一定となる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:46:19 GMT)
Exploring React Library Related Questions on Stack Overflow: Answered vs. Unanswered [0.1] 本研究の目的は,Stack Overflow(SO)におけるReact関連質問の質問応答可能性と難易度に関連する要因を分析することである。
我々の研究を容易にするために、Exploratory Data Analysisを534,820の質問に適用し、23のReact関連タグに基づいてフィルタリングした。
その結果,ビュー数,コードスニペットインクルージョン数,コード行数,ユーザ評価などの属性が,質問応答可能性に肯定的に影響を与えることがわかった。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 13:45:40 GMT)
WebNav: An Intelligent Agent for Voice-Controlled Web Navigation [0.0] WebNavはマルチモーダルなWebナビゲーションのための新しいエージェントである。
システムは、スクリーンショットからの視覚ベースのコンテキストと動的DOMラベルのブラウザ拡張を組み合わせる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:41:00 GMT)
Universal shape-dependence of quantum entanglement in disordered magnets [0.0] 本稿では,2次元のパラダイム的ランダム逆場イジングモデルにおける量子絡みの系統的解析について述べる。
コーナーコントリビューションがサブシステムの形状にどのように依存するかを定量化する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:19:05 GMT)
Unconditionally superposition-robust entangled state in all multiparty quantum systems [0.0] 積状態を持つ多部質の純絡み合った状態の重ね合わせによって生じる状態の分離性について検討する。
特に、任意の完全積状態の重ね合わせ後に常に分離性を生じる特定の多部交絡状態を特定する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 08:26:41 GMT)
The Nexus of AR/VR, AI, UI/UX, and Robotics Technologies in Enhancing Learning and Social Interaction for Children with Autism Spectrum Disorders: A Systematic Review [0.0] 大言語モデル(LLM)、拡張現実(AR)、子どもに対する治療におけるユーザインターフェース/ユーザエクスペリエンス(UI/UX)設計について詳細に研究した。
150の出版物はPubMed、ACM、IEEE Xplore、Elsevier、Google Scholarで詳細な文献検索によって収集された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:42:56 GMT)
Testing, Evaluation, Verification and Validation (TEVV) of Digital Twins: A Comprehensive Framework [0.0] デジタル双生児は、様々な領域にまたがる複雑なシステムのモデリングとシミュレーションのための強力な技術として登場した。
本稿では,デジタル双生児の検査・評価・検証・検証(TEVV)のための枠組みを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:12:06 GMT)
Static Analysis for Detecting Transaction Conflicts in Ethereum Smart Contracts [0.0] 本稿では,スマートコントラクトにおける潜在的なトランザクション競合を検出するための新しい静的解析手法を提案する。
本手法は,Solidity契約における状態変数アクセスパターンを解析することにより,書き込み,書き込み,関数呼び出しの競合を識別する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:42:40 GMT)
Solving the Gross-Pitaevskii equation on multiple different scales using the quantics tensor train representation [0.0] 我々はテンソルトレイン表現を用いて時間依存グロス・ピタエフスキー方程式の解法を構築する。
ノートパソコンの1コアで1時間以内で,7桁のマグニチュードを1次元で切り離す現象を解くことができることを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 06:45:12 GMT)
Security of the BB84 protocol with receiver's passive biased basis choice [0.0] Bennett-Brassard 1984 Protocol (BB84 Protocol) は量子鍵分布(QKD)を実装するための最も単純なプロトコルの1つである。
このプロトコルでは、送信側と受信側は、2つの相補的な測定ベースのうちの1つを反復的に選択する。
本稿では, 受信機の受動ベース選択としきい値検出器による測定を併用した, このようなデコイ状態BB84プロトコルの完全な解析セキュリティ証明を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 05:18:45 GMT)
README: Robust Error-Aware Digital Signature Framework via Deep Watermarking Model [0.0] 本稿では,画像内の堅牢で検証可能な,エラー耐性のあるデジタルシグネチャを実現する新しいフレームワークを提案する。
提案したフレームワークは、ディープウォーターマーキングのための新しいクラスの高保証アプリケーションをアンロックする。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:15:53 GMT)
On the retraining frequency of global forecasting models [0.0] 計算コストを削減しつつ予測精度を保ちつつ,再訓練戦略の頻度を低くすることを示す。
また、機械学習モデルは、頻度の低いモデル再トレーニング戦略と組み合わせることで、予測のコストを削減するために、はるかに良い選択であることもわかりました。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 12:50:58 GMT)
NourID+: A Digital Energy Identity Framework for Efficient Subsidy Allocation in Morocco [0.0] 我々は、モロッコの信頼できるエネルギー補助金配分の必要性に対処するデジタルエネルギーアイデンティティーフレームワークであるNourID+を紹介する。
NourID+は、3つの政府発行のデジタル化証明書を統合することで、将来の補助金プログラムの強力な基盤を作る。
提案手法は, 推定よりも実際の消費需要に基づいて, 電気の補助的配分を目標とするものである。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:20:06 GMT)
Neural Networks for Tamed Milstein Approximation of SDEs with Additive Symmetric Jump Noise Driven by a Poisson Random Measure [0.0] 本稿では,非パラメトリック関数近似器として使用されるニューラルネットワークに,Tamed-Milsteinスキームを統合したフレームワークを提案する。
提案手法は、L'evyプロセスによって駆動される状態依存ノイズと不連続性を持つシステムにおける推論の柔軟な代替手段を構成する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:13:31 GMT)
Music102: An $D_{12}$-equivariant transformer for chord progression accompaniment [0.0] Music102は、$D_12$-equivariant Transformerによるコード進行伴奏の強化を目的とした高度なモデルである。
グループ理論とシンボリック音楽構造にインスパイアされたMusic102は、トランスポジションやリフレクション操作のような音楽対称性を活用し、これらの特性をトランスフォーマーアーキテクチャに統合する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 04:44:02 GMT)
Mpemba Effect in Large-Language Model Training Dynamics: A Minimal Analysis of the Valley-River model [0.0] 大規模言語モデル(LLM)トレーニングにおける学習速度のスケジュールは、ウォームアップ、一定のプラトー/安定フェーズ、崩壊といった経験的なテンプレートに従うことが多い。
トレーニング力学をMpemba効果を介して熱力学的アナログに接続する。
我々は、ある失われた風景に対して、最適な高原学習率、すなわち「強いムペンバ点」が存在することを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 01:34:12 GMT)
Model Inversion Attacks on Llama 3: Extracting PII from Large Language Models [0.0] 大規模言語モデル(LLM)は自然言語処理を変革しているが、トレーニングデータを記憶する能力は、重大なプライバシーリスクをもたらす。
本稿ではメタによって開発された多言語LLMであるLlama 3.2モデルに対するモデル反転攻撃について検討する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 17:24:17 GMT)
MedicalBERT: enhancing biomedical natural language processing using pretrained BERT-based model [0.0] MedicalBERTは、大規模なバイオメディカルデータセットに基づいてトレーニングされた、事前訓練されたBERTモデルである。
生物医学用語の理解を深めるドメイン固有の語彙を備えている。
MedicalBERTは、評価されたすべてのタスクで、汎用BERTモデルを平均5.67%上回る。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 03:38:05 GMT)
Just Add Geometry: Gradient-Free Open-Vocabulary 3D Detection Without Human-in-the-Loop [0.0] Webスケールのイメージテキストペアでトレーニングされた2次元視覚言語モデルは、リッチなセマンティック理解を示し、オープン語彙検出をサポートする。
我々は,2次元基礎モデルの成熟度とカテゴリの多様性を利用して,人間に注釈を付けた3次元ラベルを使わずに3次元オブジェクト検出を行う。
この結果は,スケーラブルな3D知覚のための2次元基礎モデルの未完成の可能性を強調した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 15:00:13 GMT)
In the Shadow of Smith`s Invisible Hand: Risks to Economic Stability and Social Wellbeing in the Age of Intelligence [0.0] AI資本と労働者の比率が適度に上昇しても、現在の2倍の労働力不足が増す可能性がある。
未使用量の推定増加による一人当たりの使い捨て所得の減少を防止するためには、新規雇用創出率の少なくとも10.8倍の増加が必要である。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 23:21:27 GMT)
HRVGAN: High Resolution Video Generation using Spatio-Temporal GAN [0.0] 本稿では,高解像度ビデオ合成に特化して設計された新しい深層生成ネットワークアーキテクチャを提案する。
我々のアプローチは、Wasserstein Generative Adrial Networks (WGANs) のキーコンセプトを統合している。
トレーニングの目的は、フレームレベルの精度とビデオリアリズムのバランスをとるために、画素単位の平均2乗誤差損失と対角損失を組み合わせることである。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 23:27:27 GMT)
HKCanto-Eval: A Benchmark for Evaluating Cantonese Language Understanding and Cultural Comprehension in LLMs [0.0] HKCanto-Evalベンチマークは、カントン言語理解タスクにおける大きな言語モデルを評価するために設計されている。
香港固有の文化的・言語的なニュアンスを統合し、現実的なシナリオで言語モデルを評価するための堅牢な枠組みを提供する。
その結果,プロプライエタリなモデルは一般にオープンウェイトモデルより優れているが,カントン固有の言語的・文化的知識を扱う上では,大きな制限が残っていることが示唆された。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:27:36 GMT)
Gradient Boosting Decision Trees on Medical Diagnosis over Tabular Data [0.0] アンサンブル法は、医学的意思決定プロセスの成功の観点から、強力な代替手段を提供する。
本研究では,医学分類作業におけるアンサンブル手法,特にGBDTアルゴリズムの利点について検討した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 21:37:01 GMT)
Geometry-induced Coulomb-like potential in helically twisted quantum systems [0.0] 非自明なねじれパラメータを特徴とする3次元ヘリカルツイスト空間におけるシュル・オーディンガー方程式について検討する。
ねじりによって引き起こされる角モーメントと縦モーメントの内在的な結合は、魅力的なクーロンのようなポテンシャル項をもたらす。
ねじりパラメータと効果的なクーロン様相互作用の相互作用を詳細に解析し、幾何学的変形が新しい量子閉じ込め機構をいかに生み出すかを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 23:20:26 GMT)
Gaze-Aware AI: Mathematical modeling of epistemic experience of the Marginalized for Human-Computer Interaction & AI Systems [0.0] 本稿では,支配的な文化の規範に適合する自己表現を意識的に修正する人間の条件を定量化する試みを示す。
視線の効果は、いくつかのReddit投稿を分析して研究される。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:55:18 GMT)
Fuzzy Classification Aggregation for a Continuum of Agents [0.0] 我々は、$mge 3$オブジェクトから$2le ple m$タイプへの個々の分類の連続体の最適で独立でゼロなファジィ分類集約関数が重み付き算術平均でなければならないことを証明した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:13:22 GMT)
Exceptional point rings and $PT$-symmetry in the non-Hermitian XY model [0.0] XYモデルの異方性パラメータ$lambda$を複素値に拡張することにより、2つの準エネルギーが縮退できることを示す。
非エルミートXYモデルにおいて、これらの準エネルギー退化は2つの固有値とその対応する固有ベクトルが結合する例外点(EP)をもたらす。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:23:05 GMT)
Evaluating LLMs on Real-World Forecasting Against Human Superforecasters [0.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示したが、将来の事象を予測する能力はまだ検討されていない。
メタキュラスから464個の質問を予測し,その性能をヒトのスーパーフォアキャスターと比較した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:26:59 GMT)
Ethics by Design: A Lifecycle Framework for Trustworthy AI in Medical Imaging From Transparent Data Governance to Clinically Validated Deployment [0.0] 本研究では,医療画像におけるAIの倫理的意義について考察する。
データ収集、データ処理、モデルトレーニング、モデル評価、デプロイメントの5つの重要なステージに焦点を当てている。
分析的手法を用いて,AI開発の各段階における倫理的課題について検討した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 05:28:17 GMT)
Enhancing Neural Autoregressive Distribution Estimators for Image Reconstruction [0.0] 画像の小さな部分集合(画素パッチと呼ばれる)を観察して、画像の未観測部分を予測するという課題について検討する。
本研究では,畳み込み型自己回帰分布推定モデル(ConvNADE)の一般化版を提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:18:14 GMT)
Efficient Perplexity Bound and Ratio Matching in Discrete Diffusion Language Models [0.0] データと学習分布のKL分散に関する3つの新しい定理を導入する。
クリーンなデータと破損したデータの相互エントロピーを最小化することにより、スコアエントロピーを利用したモデルよりも優れた性能が得られることを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:54:37 GMT)
Do Students Write Better Post-AI Support? Effects of Generative AI Literacy and Chatbot Interaction Strategies on Multimodal Academic Writing [0.0] 学術的な執筆は、学生が視覚情報とテキストの議論を統合することを要求するマルチモーダルなタスクをますます含んでいる。
ChatGPTのようなジェネレーティブAI(GenAI)ツールは、学術書記を支援するための新しい経路を提供するが、学生のGenAIリテラシーが独立したマルチモーダル書記スキルにどのように影響するかはほとんど分かっていない。
本研究は,高校生79名を対象に,比較研究設計を用いた多目的書記性能について検討した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 14:01:06 GMT)
Complete and Orthonormal Sets of Exponential-type Orbitals with non-integer quantum numbers. On the results for many-electron atoms using Roothaan's LCAO method [0.0] これらの軌道を用いて高精度で効率的な基底集合を構築する手法が提案されている。
結果は、他の公開されたベースセットを使用して報告されたものよりも低い。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 09:15:11 GMT)
Collaborative and parametric insurance on the Ethereum blockchain [0.0] 本稿では、パラメトリックおよび協調的要素を統合するブロックチェーンベースの保険スキームを紹介する。
余剰プロバイダーと呼ばれる投資家のプールは、スマートコントラクトに資金をロックし、ブロックチェーンユーザはパラメトリック保険契約を下書きできる。
スマートコントラクトはブロックチェーン用の高レベルプログラミング言語であるSolidityで開発され、Sepoliaテストネットにデプロイされる。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:25:37 GMT)
Beating the Optimal Verification of Entangled States via Collective Strategies [0.0] 本研究では, 任意に高い効率性を示す新たな検証手法を提案する。
このアプローチは、測定されていない状態の保存を確保しながら、絡み合った状態のわずか数コピーしか消費しない。
これらの進歩は幅広い応用を約束し、より堅牢で効率的な量子情報処理への道筋を提供する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:48:17 GMT)
Assessing the Capabilities and Limitations of FinGPT Model in Financial NLP Applications [0.0] この研究は、金融ドメイン固有の言語モデルであるFinGPTを、6つの重要な自然言語処理(NLP)タスクにわたって評価する。
この評価はファイナンス固有のデータセットを使用して、実世界の金融アプリケーションにおけるFinGPTの機能と制限を評価する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 20:02:08 GMT)
Arbiter PUF: Uniqueness and Reliability Analysis Using Hybrid CMOS-Stanford Memristor Model [0.0] 本研究では,Stanford Memristor Modelを用いてPUFの設計と評価を行い,そのランダムフィラメント進化を利用して安全性を向上させる。
CMOSベースのArbiter PUFとmemristorベースのArbiter PUFの比較を行い、その性能を温度、電圧、プロセスのバリエーションで評価した。
その結果,memristorベースのPUFはCMOSベースの設計よりも信頼性が高いことがわかった。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 16:51:32 GMT)
An explicit formulation of the learned noise predictor $ε_θ({\bf x}_t, t)$ via the forward-process noise $ε_{t}$ in denoising diffusion probabilistic models (DDPMs) [0.0] 学習したノイズ予測器 $epsilon_theta (bf x_t, t)$ は、前処理ノイズ $epsilon_t$ を近似するように訓練される。
我々は、前処理のノイズ$epsilon_t$が、学習した予測子$epsilon_theta (bf x_t, t)$にどのように貢献するかを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 01:16:16 GMT)
AL-SPCE -- Reliability analysis for nondeterministic models using stochastic polynomial chaos expansions and active learning [0.0] 多くの実世界のシステムは固有のランダム性を示し、出力がランダム変数であるシミュレータを必要とする。
モンテカルロ法はこれを処理できるが、計算コストが高いことはしばしば禁止される。
本研究は,エミュレータを用いた信頼性解析の計算負担を軽減するために,能動的学習フレームワークを導入する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 22:07:57 GMT)
AI-washing: The Asymmetric Effects of Its Two Types on Consumer Moral Judgments [0.0] この記事では、企業の実際のAI使用量を過大評価(偽りの誇張)または過小評価(偽りの否定)として、AI洗浄を紹介します。
2x2実験では、これらの虚偽の主張が消費者の態度や購入意図にどのように影響するかを検討した。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 11:28:45 GMT)
A validity-guided workflow for robust large language model research in psychology [0.0] 大規模言語モデル(LLM)は、研究ツール、評価対象、人間のシミュレータ、認知モデルとして、心理学研究に急速に統合されている。
これらの「測定幻覚」は、統計的成果を心理学的現象として生み出すもので、成長する研究機関の妥当性を損なうものである。
精神測定と因果推論を統合した二重正当性フレームワークによって導かれた6段階のワークフローで、妥当性要件を研究野心に拡張する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 18:06:12 GMT)
A note on the unique properties of the Kullback--Leibler divergence for sampling via gradient flows [0.0] 確率分布$pi$からサンプリングする問題を考察する。
クルバック・リーブラー分岐がブレグマン分岐群における唯一の分岐であることを示す。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 10:34:38 GMT)
A Hybrid Machine Learning Framework for Optimizing Crop Selection via Agronomic and Economic Forecasting [0.0] インド、カルナタカのような発展途上国の農家は、極端な市場と気候の変動をナビゲートすると同時に、リテラシー障壁によるデジタル革命から除外する、という2つの課題に直面している。
本稿では,機械学習と人-コンピュータインタラクションのユニークな合成により,両課題に対処する新しい意思決定支援システムを提案する。
論文参考訳(メタデータ) (Sun, 06 Jul 2025 06:18:41 GMT)