OneLLM: One Framework to Align All Modalities with Language [86.9] 統一フレームワークを用いて8つのモーダルを言語に整合させるMLLMであるOneLLMを提案する。
OneLLMは25の多様なベンチマークで評価され、マルチモーダルキャプション、質問応答、推論などのタスクを含む。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:12:06 GMT)
ReFocus: Visual Editing as a Chain of Thought for Structured Image Understanding [85.0] マルチモーダルな大言語モデル(LLM)には、このマルチホップ選択的な注意力がない。
マルチモーダル LLM に "視覚的思考" を生成する能力を備えた,シンプルで効果的なフレームワーク ReFocus を紹介する。
具体的には、ReFocusはマルチモーダルLLMでPythonコードを生成し、ツールを呼び出し、入力イメージを変更し、ボックスを逐次描画し、セクションをハイライトし、エリアをマスキングすることを可能にする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:59:58 GMT)
Nothing Stands Still: A Spatiotemporal Benchmark on 3D Point Cloud Registration Under Large Geometric and Temporal Change [82.3] 人工空間の3次元幾何学地図の構築は、基本的なコンピュータビジョンとロボット工学である。
Not Stands Still (NSS)ベンチマークは、大きな空間的および時間的変化を行う3Dシーンの時間的登録に焦点を当てている。
NSSの一環として,建設中または改修中の大規模建築屋内環境において,3次元点雲のデータセットを連続的に取得する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:20:34 GMT)
A General Framework for Clustering and Distribution Matching with Bandit Feedback [81.5] 我々は,帯域幅フィードバックを用いたクラスタリングと分散マッチング問題のための一般的なフレームワークを開発する。
誤り確率が$delta$を超えない任意のオンラインアルゴリズムに対して、平均アームプル数に基づいて漸近的でない下界を導出する。
我々の洗練された分析により、アルゴリズムの平均的なアームプル数が、$delta$が消えるにつれて、基本的限界に収束する速度に縛られる新しい現象が明らかになった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:06:36 GMT)
Demystifying Domain-adaptive Post-training for Financial LLMs [79.6] FINDAPは、大規模言語モデルのドメイン適応後トレーニングに関する体系的できめ細かな研究である。
私たちのアプローチは、ターゲットドメインに必要なコア機能を特定することから始まります。
次に、継続事前学習、指導調律、嗜好調整を含む学習後重要な段階の有効性を解析する。
結果として得られるモデルであるLlama-Finは、幅広い財務タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:26:15 GMT)
Enforcing Fundamental Relations via Adversarial Attacks on Input Parameter Correlations [76.2] 入力パラメータ間の相関は、多くの科学的分類タスクにおいて重要な役割を果たす。
我々はRandom Distribution Shuffle Attack (RDSA)と呼ばれる新たな敵攻撃アルゴリズムを提案する。
6つの分類課題においてRDSAの有効性を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:45:09 GMT)
LongProc: Benchmarking Long-Context Language Models on Long Procedural Generation [74.9] LongProc (Long Procedural Generation)は、Long-Context Language Model (LCLM) を評価するための新しいベンチマークである。
LongProcは、HTMLページから構造化された情報をTSVフォーマットに抽出し、旅行計画を作成する複雑な検索手順を実行する6つの手続き生成タスクで構成されている。
我々はLongProc上の17個のLCLMを3つの難易度で評価し、最大出力トークン数が500, 2K, 8Kと設定されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:16:55 GMT)
Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark [73.3] EMMAは,数学,物理,化学,コーディングにまたがる有機マルチモーダル推論を対象とするベンチマークである。
EMMAタスクは、各モードで独立に推論することで対処できない高度なクロスモーダル推論を要求する。
EMMA上での最先端MLLMの評価は、複雑なマルチモーダルおよびマルチステップ推論タスクの処理において、重大な制限を生じさせる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:55:52 GMT)
Masked Image Modeling: A Survey [73.2] マスク付き画像モデリングは、コンピュータビジョンにおける強力な自己教師付き学習技術として登場した。
我々は近年,分類学を構築し,最も顕著な論文をレビューしている。
我々は,最も人気のあるデータセット上で,様々なマスク付き画像モデリング手法の性能評価結果を集約する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:14:55 GMT)
Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control [73.1] Diffusion as Shader (DaS)は、統一アーキテクチャ内で複数のビデオ制御タスクをサポートする新しいアプローチである。
DaSは3D追跡ビデオを制御入力として利用し、ビデオ拡散過程を本質的に3D対応にしている。
DaSは、メッシュ・ツー・ビデオ生成、カメラ制御、モーション転送、オブジェクト操作など、さまざまなタスクにわたる強力なコントロール機能を示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:25:42 GMT)
Fermionic cellular automata in one dimension [72.5] フェルミオンモードの一次元鎖に対する量子セルオートマトンを考える。
最寄りのオートマチックの完全なキャラクタリゼーションが与えられる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:22:15 GMT)
Arc2Avatar: Generating Expressive 3D Avatars from a Single Image via ID Guidance [70.0] 本稿では,人間の顔の基盤モデルを用いた最初のSDSベースの手法であるArc2Avatarについて述べる。
我々のアバターは人間の顔メッシュテンプレートとの密接な対応を維持しており、ブレンドシェープによる表現生成を可能にしている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:04:33 GMT)
Multi-Task Model Merging via Adaptive Weight Disentanglement [69.7] モデルマージのための適応重み分散法を提案する。
余剰ベクトルの抽出に成功し, 減算後, タスクベクトルは頑健な性能を維持した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:34:55 GMT)
Relative Pose Estimation through Affine Corrections of Monocular Depth Priors [69.6] 本研究では,独立なアフィン(スケールとシフト)のあいまいさを明示的に考慮した相対ポーズ推定のための3つの解法を開発した。
提案する解法と古典的点ベース解法とエピポーラ制約を組み合わせたハイブリッド推定パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:58:30 GMT)
OpenOmni: Large Language Models Pivot Zero-shot Omnimodal Alignment across Language with Real-time Self-Aware Emotional Speech Synthesis [68.7] 両モードアライメントと音声生成を組み合わせた2段階学習手法であるopenomniを提案する。
実験により、openomniは全言語、視覚言語、言語評価において一貫して改善されていることが示された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:54:14 GMT)
DoubleDiffusion: Combining Heat Diffusion with Denoising Diffusion for Generative Learning on 3D Meshes [67.4] DoubleDiffusionは3次元メッシュ表面の直接生成学習のために、放熱拡散と脱ノイズ拡散を組み合わせたフレームワークである。
本研究は, 3次元表面上での拡散に基づく生成モデルの新しい方向性に寄与し, 3次元アセット生成の分野への応用の可能性を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:28:11 GMT)
An Empirical Study of Autoregressive Pre-training from Videos [67.2] ビデオをビジュアルトークンとして扱い、トランスフォーマーモデルをトレーニングして、将来的なトークンを自動回帰的に予測します。
われわれのモデルは、1兆以上の視覚トークンからなる多様なビデオと画像のデータセットで事前訓練されている。
以上の結果から, 自己回帰的事前学習は, 最小限の帰納バイアスにもかかわらず, 競争性能に寄与することが示唆された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:59:58 GMT)
Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation [66.8] 我々は,事前学習した2次元拡散モデルを用いたガウススプラット上での3次元直接生成手法であるZero-1-to-Gを導入する。
3D認識を取り入れるために,複雑な相関関係を捉え,生成されたスプラット間の3D一貫性を強制する,クロスビュー層とクロスアトリビュートアテンション層を導入する。
これにより、Zero-1-to-Gは、事前訓練された2D拡散前処理を効果的に活用する最初の直接画像から3D生成モデルとなり、効率的なトレーニングと未確認物体への一般化が実現された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:37:35 GMT)
Centurio: On Drivers of Multilingual Ability of Large Vision-Language Model [66.2] 多くのLVLM(Large Vision-Language Models)は、主に英語のデータに基づいて訓練されている。
異なる言語群に対する学習がいかに異なるかを検討する。
私たちはCenturio(100言語LVLM)をトレーニングし、14のタスクと56の言語を対象とした評価で最先端のパフォーマンスを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:26:14 GMT)
Preference-Based Multi-Agent Reinforcement Learning: Data Coverage and Algorithmic Techniques [65.6] PbMARL(Preference-based Multi-Agent Reinforcement Learning)について検討する。
一般ゲームにおける嗜好のみのオフラインデータセットからナッシュ平衡を同定する。
以上の結果から,PbMARLの多面的アプローチが示唆された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:24:44 GMT)
Emergence of human-like polarization among large language model agents [61.6] 我々は、何千もの大規模言語モデルエージェントを含むネットワーク化されたシステムをシミュレートし、それらの社会的相互作用を発見し、人間のような偏極をもたらす。
人間とLLMエージェントの類似性は、社会的分極を増幅する能力に関する懸念を提起するだけでなく、それを緩和するための有効な戦略を特定するための貴重なテストベッドとして機能する可能性も持っている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:45:05 GMT)
Open Problems in Machine Unlearning for AI Safety [61.4] 特定の種類の知識を選択的に忘れたり、抑圧したりするマシンアンラーニングは、プライバシとデータ削除タスクの約束を示している。
本稿では,アンラーニングがAI安全性の包括的ソリューションとして機能することを防止するための重要な制約を特定する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:59:10 GMT)
A Novel Pathology Foundation Model by Mayo Clinic, Charité, and Aignostics [61.0] 本稿では,RudolfVアプローチに基づく新しい視覚基盤モデルを提案する。
本モデルでは、120万の病理組織像からなるデータセットを用いてトレーニングを行った。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:06:45 GMT)
Optimality and Adaptivity of Deep Neural Features for Instrumental Variable Regression [57.4] ディープ・フィーチャー・インスツルメンタル・変数(DFIV)回帰(Deep Feature instrumental variable)は、ディープ・ニューラルネットワークによって学習されたデータ適応的特徴を用いたIV回帰に対する非パラメトリックなアプローチである。
DFIVアルゴリズムは,目的構造関数がベソフ空間にある場合,最小最適学習率を実現する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:22:22 GMT)
SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution [56.9] 大規模言語モデル(LLM)は、様々な複雑なタスクにまたがる顕著な習熟度を示している。
SWE-Fixerは、GitHubの問題を効果的かつ効率的に解決するように設計された、オープンソースのLLMである。
110万のGitHubイシューと対応するパッチを含む広範なデータセットをコンパイルし、SWE-Fixerの2つのモジュールを個別にトレーニングします。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:54:24 GMT)
A Fast Algorithm for the Real-Valued Combinatorial Pure Exploration of Multi-Armed Bandit [55.2] 多武装バンディット(R-CPE-MAB)の真価純探査問題について検討する。
本稿では,差分に基づく探索法 (CombGapE) アルゴリズムを提案する。
我々は,CombGapEアルゴリズムが,合成データセットと実世界のデータセットの両方において,既存の手法を大幅に上回っていることを数値的に示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:14:06 GMT)
Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.6] 本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。
提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:43:05 GMT)
Range, not Independence, Drives Modularity in Biological Inspired Representation [52.5] 我々は、生物学的にインスピレーションを受けたネットワークが、ソース変数(ソース)の表現をモジュール化する理論を開発する。
我々は、最適な線形オートエンコーダのニューロンがモジュラー化するかどうかを決定するソースのサンプルに対して、必要かつ十分な条件を導出する。
我々の理論はどんなデータセットにも当てはまり、以前の研究で研究された統計的な独立性よりもはるかに長い。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:20:48 GMT)
Rendering-Oriented 3D Point Cloud Attribute Compression using Sparse Tensor-based Transformer [52.4] 3D視覚化技術は、私たちがデジタルコンテンツと対話する方法を根本的に変えてきた。
ポイントクラウドの大規模データサイズは、データ圧縮において大きな課題を呈している。
そこで我々はPCACと差別化可能なレンダリングをシームレスに統合するエンドツーエンドのディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:01:55 GMT)
The Bakers and Millers Game with Restricted Locations [52.4] 本研究では,ベイカーズ・アンド・ミラーズ・ゲーム(Bakers and Millers Game)と呼ばれる,顧客と販売者による戦略的位置選択について研究した。
最適なバーゲティング力を得るために、パン屋は他のパン屋とほとんど競争せず、多くの製粉業者が小麦粉を買う場所を選択したいと考えた。
我々は、より難しい制限された設定でさえ平衡を許容する洗練された効率的なアルゴリズムを通して示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:59:32 GMT)
Turning Logic Against Itself : Probing Model Defenses Through Contrastive Questions [51.5] 非倫理的反応を引き起こすために、対照的な推論を利用する新しいジェイルブレイク手法であるPOATEを導入する。
PoATEは意味論的に意図に反し、敵のテンプレートと統合し、有害なアウトプットを驚くほど微妙に操る。
これに対応するために、悪意のある意図と理性を検出するためにクエリを分解して、有害な応答を評価し、拒否するIntent-Aware CoTとReverse Thinking CoTを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:11:41 GMT)
A Flexible and Scalable Framework for Video Moment Search [51.5] 本稿では,テキストクエリにマッチする任意の長さの動画のコレクションからランク付けされたモーメントのリストを取得するためのフレキシブルなフレームワークを提案する。
SPR(Segment-Proposal-Ranking)と呼ばれる我々のフレームワークは,探索プロセスを,セグメント検索,提案生成,モーメント改善という3つの独立した段階に単純化する。
TVR-Rankingデータセットの評価から,我々のフレームワークは,計算コストと処理時間を大幅に削減して最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:54:19 GMT)
OVO-Bench: How Far is Your Video-LLMs from Real-World Online Video Understanding? [51.5] OVO-Benchは、高度なオンラインビデオ理解機能のための新しいベンチマークである。
12のタスクで構成され、644のユニークなビデオと、正確なタイムスタンプを備えた約2,800の細かいメタアノテーションで構成されている。
Video-LLMの9つの評価によると、従来のベンチマークの進歩にもかかわらず、現在のモデルはオンラインビデオ理解に苦戦している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:00:01 GMT)
ContextMRI: Enhancing Compressed Sensing MRI through Metadata Conditioning [51.3] 本稿では, 微細なメタデータを再構成プロセスに統合したMRI用テキスト条件拡散モデルであるContextMRIを提案する。
メタデータの忠実度はスライス位置やコントラストから患者年齢、性別、病理まで増加し、体系的に再構築性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:58:41 GMT)
Finding Needles in Emb(a)dding Haystacks: Legal Document Retrieval via Bagging and SVR Ensembles [51.1] 本稿では,サポートベクタ回帰アンサンブル,ブートストラップアグリゲーション(バッグ),およびドイツ法情報検索データベース(GerDaLIR)への埋め込み空間を利用した検索手法を提案する。
投票アンサンブルを用いてベースライン上のリコールの改善を示し、トレーニングやディープラーニングモデルを微調整することなく、有望な初期結果を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:21:44 GMT)
More is not always better? Enhancing Many-Shot In-Context Learning with Differentiated and Reweighting Objectives [50.8] 本稿では,微分学習と優位性に基づく再重み付けによりモデル性能を向上させる新しい最適化手法であるDryCLを紹介する。
グローバルに、DryCLは差別化学習を利用してNLLの目的を最適化し、マルチショットのパフォーマンスがゼロショットレベルを超えていることを保証する。
Many-Shot ICL Benchmark (ICL-50) は、最大8,000トークンのシーケンスで1から350までのショット数をカバーする50のタスクの大規模ベンチマークである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:20:13 GMT)
MemLLM: Finetuning LLMs to Use An Explicit Read-Write Memory [50.0] 本稿では,構造化および明示的な読み書きメモリモジュールを統合することで,大規模言語モデル(LLM)の拡張手法であるMemLLMを紹介する。
実験の結果, 言語モデリング, 特に知識集約型タスクにおいて, MemLLMはLLMの性能と解釈可能性を向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:18:12 GMT)
Emergence of Painting Ability via Recognition-Driven Evolution [49.7] 脳卒中枝とパレット枝を併用したモデルを提案する。
マシンビジョンで達成した認識精度を計測することにより、視覚コミュニケーションの効率を定量化する。
実験結果から,本モデルは高次認識タスクにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:37:31 GMT)
Enhancing Architecture Frameworks by Including Modern Stakeholders and their Views/Viewpoints [48.9] データサイエンスと機械学習に関連する関心事、例えばデータサイエンティストやデータエンジニアの利害関係者は、まだ既存のアーキテクチャフレームワークには含まれていない。
10か国25以上の組織から61名の被験者を対象に調査を行った。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:12:14 GMT)
The explanation dialogues: an expert focus study to understand requirements towards explanations within the GDPR [47.1] 我々は、XAIに対する法的専門家や実践者の期待、推論、理解を明らかにするための専門的な研究である説明対話(Explaination Dialogues)を提示する。
調査はオンラインアンケートとフォローアップインタビューで構成されており、クレジットドメインのユースケースを中心に行われている。
提示された説明は、情報を理解して欠くことは困難であり、データコントローラと主題の異なる関心事から生じる問題について議論する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:50:02 GMT)
Solving the Catastrophic Forgetting Problem in Generalized Category Discovery [46.6] Generalized Category Discovery (GCD)は、ラベルなしデータセット内の既知のカテゴリと新しいカテゴリの混合を識別することを目的としている。
最近の最先端手法SimGCDは、既知のクラスデータからの知識を、偏りのある学習を通して、新しいクラスの学習に転送する。
本稿では,従来の手法にシームレスに統合された新しい学習手法であるLegoGCDを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:31:54 GMT)
Domain Adaptation-Enhanced Searchlight: Enabling classification of brain states from visual perception to mental imagery [46.3] 領域適応(DA)は、fMRIスキャンにおける画像予測を強化するために用いられる。
我々は,様々なDA手法を比較し,画像予測を改善するために複数のモデルを開発した。
我々のDA強化サーチライトは、視覚野や前頭頂皮質を含む、高度に分散した脳領域の画像内容を予測する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:19:09 GMT)
MambaHSI: Spatial-Spectral Mamba for Hyperspectral Image Classification [46.1] 本稿では,Mambaモデルに基づく新しいHSI分類モデル,MambaHSIを提案する。
具体的には,空間的マンバブロック(SpaMB)を設計し,画素レベルの画像全体の長距離相互作用をモデル化する。
スペクトルベクトルを複数のグループに分割し、異なるスペクトル群間の関係をマイニングし、スペクトル特徴を抽出するスペクトルマンバブロック(SpeMB)を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:27:47 GMT)
An Investigation of Conformal Isometry Hypothesis for Grid Cells [45.7] コンフォーマルアイソメトリー仮説はグリッドセル応答マップにおける六角形の周期パターンの潜在的な説明である。
我々は,この仮説が格子細胞の六角形周期パターンにつながることを示す数値実験を行った。
エージェントの入力速度の共形変調を提案し、グリッドセルの繰り返しニューラルネットワークが共形等尺性仮説を自動で満たすことを可能にする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:39:12 GMT)
From Simple to Complex Skills: The Case of In-Hand Object Reorientation [45.6] 我々は、以前に獲得した回転技術に基づいて、手動物体の向きを変えるための階層的ポリシーを導入する。
この階層的なポリシーは、環境と低レベルのスキルポリシー自体からのフィードバックに基づいて、どの低レベルのスキルを実行するかを選択することを学ぶ。
本稿では,プロプリセプティブ情報,低レベルスキル予測,および制御誤差を入力として用い,時間とともにオブジェクトのポーズを推定する一般化可能なオブジェクトポーズ推定手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:49:39 GMT)
Equilibrium and nonequilibrium steady states with the repeated interaction protocol: Relaxation dynamics and energetic cost [45.0] 本研究では, 熱処理した浴槽スピンと相互作用する量子ビット系の力学を, 繰り返しの相互作用スキームを用いて検討した。
我々の重要な発見は、決定論的システムとアンシラの相互作用が典型的には、アンシラの熱状態に熱を発しないことである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:35:36 GMT)
ECBench: Can Multi-modal Foundation Models Understand the Egocentric World? A Holistic Embodied Cognition Benchmark [44.6] ECBenchは、大規模視覚言語モデル(LVLM)の具体的認知能力を体系的に評価するために設計されたベンチマークである。
ECBenchは多様なシーンビデオソース、オープンで多様な質問フォーマット、30次元のエンボディド認知を備えている。
我々は、プロプライエタリ、オープンソース、タスク固有のLVLMの広範な評価を行う。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:43:49 GMT)
Commonsense Video Question Answering through Video-Grounded Entailment Tree Reasoning [43.6] そこで本研究では,コモンセンスビデオ質問応答のためのビデオ接地木推論手法を提案する。
提案手法は,VQAタスクをビデオフラグメントに,包括木構築,ビデオ言語による包括検証,ツリー推論,動的木拡張の4ステップで明示的に適用する。
公平な評価を支援するため,VQAベンチマークの回答セットを書き換える大規模モデルに基づくバイアス除去手法を考案した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:44:42 GMT)
What Matters for In-Context Learning: A Balancing Act of Look-up and In-Weight Learning [42.8] ICLには,データシーケンスにおける概念的反復が不可欠であることを示す。
また、ICLの出現は、重み付き学習目標とコンテキスト内問題解決能力のバランスに依存することを示した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:45:05 GMT)
Using Linearized Optimal Transport to Predict the Evolution of Stochastic Particle Systems [42.5] 本研究では,確率分布の時間的発展を,その進化を規定する演算子を明示的に学習することなく近似するアルゴリズムを開発した。
特に興味深い応用は、$mathbb Rd$ の$N$粒子の系から生じる離散測度 $mu_tN$ である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:54:15 GMT)
Exploring near-optimal energy systems with stakeholders: a novel approach for participatory modelling [41.9] エネルギーモデリングにおける参加研究は、利害関係者を包括的に関与する機会を提供する。
我々は、ステークホルダーを全体的な方法で組み込むことができる、最適に近いモデリング結果に基づく方法論とフレームワークを提案する。
本稿では,Longyearbyenの北極圏開拓のための方法論を紹介し,参加者がコスト最適から一貫した距離を逸脱する方法について説明する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:43:29 GMT)
The Tabular Foundation Model TabPFN Outperforms Specialized Time Series Forecasting Models Based on Simple Features [40.2] 本稿では,TabPFNと単純な特徴工学を組み合わせ,予測性能を高めるための簡単なアプローチであるTabPFN-TSを提案する。
その単純さとわずか1100万のパラメータにもかかわらず、TabPFN-TSは類似サイズのモデルであるChronos-Miniよりも優れており、65倍のパラメータを持つChronos-Largeよりもわずかに優れている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:26:17 GMT)
CoE: Deep Coupled Embedding for Non-Rigid Point Cloud Correspondences [39.9] 我々は、意味的に類似した点が同様の埋め込みを共有する埋め込み空間において、ポイントごとの高次元埋め込みという新しい形状表現を学習する。
学習された埋め込みは、基礎となる形状の形状を認識し、変形や様々な形状のアーチファクトに対して堅牢である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:38:33 GMT)
Battling the Non-stationarity in Time Series Forecasting via Test-time Adaptation [39.7] 時系列予測(TSF)に適した先駆的なテスト時間適応フレームワークを提案する。
TSF-TTAに対する提案手法であるTAFASは、事前学習中に学習したコアセマンティック情報を保存しながら、ソース予測器をフレキシブルに適応してテスト分布を継続的にシフトさせる。
部分的に観測された真実とゲートキャリブレーションモジュールの新たな利用により、ソース予測器のプロアクティブ、ロバスト、モデルに依存しない適応が可能となった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:59:15 GMT)
GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models [39.5] 2次元視覚言語モデル(VLM)は、画像テキスト理解タスクにおいて大きな進歩を遂げている。
近年の進歩は、3Dポイントクラウドとマルチビューイメージを入力として活用し、有望な結果をもたらしている。
人間の知覚にインスパイアされた、純粋に視覚に基づくソリューションを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:41:07 GMT)
MoEE: Mixture of Emotion Experts for Audio-Driven Portrait Animation [39.3] 音声アバターの生成は、正確な音声同期において大きな進歩を遂げた。
現在の手法は、単一の基本的な感情表現をモデル化するフレームワークの欠如など、基本的な課題に直面している。
本研究では,6つの基本的な感情を分離し,特異な感情状態と複合的な感情状態の両方を正確に合成する混合感情エキスパートモデルを提案する。
DH-FaceEmoVid-150データセットと組み合わせて、複雑な感情表現とニュアンスのある顔の詳細を生成するのにMoEEフレームワークが優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:45:43 GMT)
Step-by-Step Mastery: Enhancing Soft Constraint Following Ability of Large Language Models [39.1] 大規模言語モデル(LLM)には、複数の制約を含む命令に従うことが不可欠である。
ソフト制約は意味論的に関連しており、自動手法による検証が難しい。
高品質なアウトプットを自動的に獲得するパイプラインを設計し,カリキュラム学習に基づくトレーニングパラダイムを導入する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:34:07 GMT)
No-Regret Linear Bandits under Gap-Adjusted Misspecification [38.6] 既存の線形包帯の作用は通常、最良の線形近似のsup-norm誤差を測定する一様不特定パラメータ$epsilon$に依存する。
そこで本研究では,各入力における近似誤差をx$で近似し,その差分をx$で比例する,より自然な不特定モデルを提案する。
我々は,従来のLinUCBアルゴリズムが,そのような$rho$-gap-adjusted misspecificationに対して自動的に堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:44:53 GMT)
NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models [38.4] 我々はNV-Embedモデルを導入し、アーキテクチャ設計、トレーニング手順、キュレートされたデータセットを取り入れた。
モデルアーキテクチャでは、プール埋め込みを得るための潜在注意層を提案し、連続的に検索と下流タスクの精度を向上する。
トレーニングデータには, 埋込みモデルの性能向上のために, 強負のマイニング, 合成データ生成, 既存の公開データセットを利用する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:27:06 GMT)
JAQ: Joint Efficient Architecture Design and Low-Bit Quantization with Hardware-Software Co-Exploration [38.3] 本稿では,3つの臨界次元を協調的に最適化するJAQフレームワークを提案する。
ソフトウェア側のメモリオーバーヘッド: 低精度の量子化対応トレーニングは、メモリ使用量を大幅に増加させる可能性がある。
ハードウェア側での検索時間: ハードウェアパラメータの離散的な性質と、コンパイラ最適化と個々の演算子間の複雑な相互作用は、アクセラレーター検索に時間を要する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:10:06 GMT)
Towards Fingerprint Mosaicking Artifact Detection: A Self-Supervised Deep Learning Approach [37.8] 本稿では,指紋画像中のモザイク生成物を検出・スコアする深層学習に基づく新しい手法を提案する。
本手法は,大規模未ラベル指紋データに基づいて,自己教師付き学習フレームワークを用いてモデルを訓練する。
エラーの重大度を定量化するための新しいモザイクスコアを導入し,指紋画像の自動評価を可能にした。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:49:37 GMT)
Learning Transferable Features for Implicit Neural Representations [37.1] Inlicit Neural representations (INR) は、逆問題やニューラルレンダリングなど、様々な応用で成功している。
我々は新しいINRトレーニングフレームワークSTRAINERを導入し、新しい信号にINRを適合させるトランスファー可能な特徴を学習する。
我々は,複数の領域内および領域外信号適合タスクおよび逆問題に対するSTRAINERの評価を行った。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:24:46 GMT)
Entangled Mean Estimation in High-Dimensions [37.0] 信号のサブセットモデルにおける高次元エンタングルド平均推定の課題について検討する。
最適誤差(polylogarithmic factor)は$f(alpha,N) + sqrtD/(alpha N)$であり、$f(alpha,N)$は1次元問題の誤差であり、第二項は準ガウス誤差率である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:31:35 GMT)
An Algorithmic Approach for Causal Health Equity: A Look at Race Differentials in Intensive Care Unit (ICU) Outcomes [36.5] オーストラリアと米国における多数派と少数派の集中治療単位(ICU)における人種的・民族的格差について検討した。
マイノリティ患者は入院時に若く、慢性的な健康状態が悪く、緊急および非選択的な理由で入院する傾向があり、重症度が高い。
マイノリティグループに属することによる保護的直接的な効果は,多数派に比べて生存率の向上がみられ,他のすべての変数は等しく維持されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:48:15 GMT)
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step [36.0] LLaVA-CoTは、自律的な多段階推論を実現するために設計された新しいVLMである。
チェーン・オブ・シークレットのプロンプトとは異なり、LLaVA-CoTは独立に要約、視覚的解釈、論理的推論、結論生成の逐次的な段階に関与する。
100kのトレーニングサンプルと単純な推論時間スケーリング手法により、LLaVA-CoTはベースモデルを幅広いマルチモーダル推論ベンチマークで7.4%上回る。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:58:20 GMT)
Biomedical Relation Extraction via Adaptive Document-Relation Cross-Mapping and Concept Unique Identifier [35.8] Document-Level Biomedical Relation extract (Bio-RE) は、バイオメディカルエンティティ間の関係を広範囲にわたるテキスト内で識別することを目的としている。
従来の手法は文書の不完全性を見落とし、外部知識の統合を欠いていることが多い。
大規模言語モデル(LLM)の最近の進歩は、ドキュメントレベルのBio-REに関する上記の問題をすべて探求するきっかけとなりました。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:19:40 GMT)
Learning convolution operators on compact Abelian groups [35.7] コンパクトなアベリア群に関連する畳み込み作用素の学習問題を考察する。
正規化に基づくアプローチについて検討し、それに対応する学習保証を提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:43:08 GMT)
InfiFusion: A Unified Framework for Enhanced Cross-Model Reasoning via LLM Fusion [35.6] 本稿では,複数のドメイン特化モデルを効率的なピボットモデルに統合する戦略について検討する。
複数のLLMの強度を組み合わせるための2つの融合戦略を提案する。
GSM8K,MATH,HumanEvalの各タスクにおいて,9.27%,8.80%,8.89%の精度向上を実現した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:50:16 GMT)
Motion-X++: A Large-Scale Multimodal 3D Whole-body Human Motion Dataset [35.5] Motion-X++は大規模なマルチモーダル3D表現型人体モーションデータセットである。
Motion-X++は、巨大なシーンから120.5Kのモーションシーケンスをカバーする19.5Mの全身のポーズアノテーションを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:37:27 GMT)
Fast single atom imaging for optical lattice arrays [35.4] 格子内での高速で2.4マイクロ秒の単一原子イメージングを行い、99.4%の忠実さを示した。
これにより、中性原子量子プラットフォームの読み出し期間は超伝導量子ビットプラットフォームに近くなる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:07:51 GMT)
RadioTransformer: Accurate Radio Map Construction and Coverage Prediction [34.9] 本稿では、無線マップ予測の精度を高めるために、RadioTransformerと呼ばれるハイブリッドトランスフォーマー-畳み込みモデルを提案する。
提案モデルは,効率的な特徴抽出のためのマルチスケールトランスフォーマーベースのエンコーダと,正確な画素レベルの画像再構成のための畳み込みベースのデコーダを備える。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:30:22 GMT)
Secure Multi-Party Biometric Verification using QKD assisted Quantum Oblivious Transfer [34.5] 本稿では、量子オブリバスト転送(QOT)によって実現されたセキュアなマルチパーティ計算アプリケーションの実践的実装について述べる。
QOTプロトコルは、偏光符号化された絡み合った状態を使用して、認証を提供する量子鍵分布(QKD)を用いて、2つのパーティ間で不明瞭な鍵を共有する。
インターポールと国連のno-flyリストに対するプライバシー保護指紋マッチングの実用的なユースケースが実証されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:51:30 GMT)
Entanglement-Assisted Concatenated Quantum Codes: Parameters and Asymptotic Performance [33.8] 絡み合い支援量子符号(EAQECCs)は、2つの絡み合い支援量子誤り訂正符号(EAQECCs)を連結して構成される。
内部と外部のコンポーネントコードを慎重に選択することで、従来の量子コードよりも優れたパラメータを持つ最先端のEACQCを構築することができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:22:21 GMT)
LLMs as Workers in Human-Computational Algorithms? Replicating Crowdsourcing Pipelines with LLMs [33.2] LLMは、以前は人間の能力専用と考えられていたクラウドソーシングタスクにおいて、人間のような行動の複製を約束している。
LLMがより複雑なクラウドソーシングパイプラインを複製できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:13:41 GMT)
FOCUS: Towards Universal Foreground Segmentation [32.6] フォアグラウンドセグメンテーションはコンピュータビジョンにおける基本的なタスクであり、様々なサブディビジョンタスクを含んでいる。
従来の研究は、通常、各タスクのためのタスク固有のアーキテクチャを設計し、統一の欠如につながった。
我々は,複数のフォアグラウンドタスクを処理可能なフォアグラウンドObjeCts UniversalフレームワークであるFOCUSを紹介する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:44:15 GMT)
VoxEval: Benchmarking the Knowledge Understanding Capabilities of End-to-End Spoken Language Models [32.1] 我々は、純粋に音声に基づく対話を通して知識理解を評価するために設計された、新しい音声質問応答ベンチマークであるVoxEvalを紹介する。
既存のAudioQAベンチマークとは異なり、VoxEvalは質問と回答の両方の音声フォーマットを維持し、様々なオーディオ条件のモデルロバスト性を評価し、音声形式の数学的問題解決のような挑戦的な領域の評価を開拓している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:30:12 GMT)
On Measuring Unnoticeability of Graph Adversarial Attacks: Observations, New Measure, and Applications [32.0] グラフアタック通知の学習可能な尺度であるHideNSeekを紹介した。
まず、バイパス問題を緩和するために、HideNSeekは元の(潜在的)攻撃エッジと(潜在的)攻撃エッジを区別することを学ぶ。
第二に、見落としの問題を緩和するため、HyNSeekはすべてのエッジスコアの不均衡を意識したアグリゲーションを行い、最終的なアグリゲーションスコアを得る。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:16:21 GMT)
TimeDP: Learning to Generate Multi-Domain Time Series with Domain Prompts [30.8] データ拡張やプライバシ保護といったアプリケーションには,時系列生成モデルが不可欠だ。
既存の時系列生成モデルは、通常、1つの特定のドメインからデータを生成するように設計されている。
ドメインプロンプトを持つマルチドメイン時系列拡散モデルであるTimeDPを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:57:56 GMT)
McGrids: Monte Carlo-Driven Adaptive Grids for Iso-Surface Extraction [30.4] 暗黙の場からのイソ表面抽出は、コンピュータビジョンとグラフィックスの様々な応用における基本的なプロセスである。
本稿では,等表面抽出の効率向上のための新しい手法であるMcGridsを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:24:09 GMT)
HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids [30.3] 本稿では,難聴者を対象とした非侵襲的ディープラーニングに基づく音質評価モデルであるHAAQI-Netを紹介する。
HAAQIのスコアは、音楽のオーディオクリップや聴覚障害パターンから直接予測できる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 05:14:56 GMT)
3DIS-FLUX: simple and efficient multi-instance generation with DiT rendering [30.2] 3DIS-FLUXは3DISフレームワークの拡張であり、FLUXモデルを統合してレンダリング機能を強化している。
FLUX.1-Depth-devモデルを用いて深度マップ制御画像生成を行い、FLUXのジョイントアテンション機構におけるアテンションマスクを操作するディテールを導入する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:34:00 GMT)
AnCoGen: Analysis, Control and Generation of Speech with a Masked Autoencoder [30.2] AnCoGenは、マスク付きオートエンコーダを利用して、音声信号の分析、制御、生成を統一する手法である。
話者識別、ピッチ、内容、ラウドネス、信号対雑音比、明瞭度指数などの重要な属性を推定することにより、音声を分析することができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:58:37 GMT)
AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning [30.0] 本稿では,農業領域における視覚のみのデータを活用した指導調整データの構築手法を提案する。
我々は、複数のドメインにまたがる多様な農業データセットを利用し、クラス固有の情報をキュレートし、大規模言語モデル(LLM)を用いてエキスパートチューニングセットを構築する。
AgroGPTは、複雑な農業関連の会話を処理し、有用な洞察を提供する効率的なLMMである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:43:18 GMT)
IPDN: Image-enhanced Prompt Decoding Network for 3D Referring Expression Segmentation [29.7] 3D参照式(3D-RES)は、所定の式に基づいてクラウドシーンをセグメント化することを目的としている。
既存の3D-RESアプローチでは、機能の曖昧さと意図の曖昧さという2つの大きな課題に直面している。
本稿では,画像強化型Prompt Decoding Network (IPDN)を導入し,モデルの推論能力を向上する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:20:00 GMT)
Shelving it rather than Ditching it: Dynamically Debloating DEX and Native Methods of Android Applications without APK Modification [29.5] 3DNDroidは、AnDroidアプリのDEXメソッドとNativeメソッドの両方をターゲットにしたDynamic Debloatingアプローチである。
これは、デ肥大化したバイトコードメソッドの呼び出しをインターセプトし、それらの解釈、コンパイル、実行を防ぐ。
評価では、3DNDroidが187のDEXメソッドと30のネイティブメソッドを55の現実世界のアプリケーションでデブロする能力を示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:34:00 GMT)
FLowHigh: Towards Efficient and High-Quality Audio Super-Resolution with Single-Step Flow Matching [29.1] FLowHighは、高効率な生成モデルであるフローマッチングをオーディオ超解像に統合する新しいアプローチである。
提案手法は, 複数入力サンプリングレートにまたがる単一ステップサンプリングプロセスにより, 高忠実で高分解能な音声を生成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:30:26 GMT)
Rethinking Evaluation of Sparse Autoencoders through the Representation of Polysemous Words [29.1] スパースオートエンコーダ(SAE)は、大規模言語モデル(LLM)の解釈性を改善するための有望なツールとして多くの注目を集めている。
本稿では,多文単語に着目した単意味特徴の質を解析するためのSAEの評価スイートを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:54:19 GMT)
LongViTU: Instruction Tuning for Long-Form Video Understanding [28.9] LongViTUは、ロングフォームビデオ理解のための大規模なデータセットである。
LongViTUは、ロングフォームおよびストリーミングビデオ理解における指示に従うためのベンチマークである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:51:14 GMT)
Let's Ask GNN: Empowering Large Language Model for Graph In-Context Learning [28.7] 本稿では,逐次テキスト処理とグラフ構造化データのギャップを埋める新しいアプローチであるAskGNNを紹介する。
AskGNNはグラフニューラルネットワーク(GNN)を利用した構造強化レトリバーを使用して、グラフをまたいだラベル付きノードを選択する。
3つのタスクと7つのLLMにわたる実験は、グラフタスクのパフォーマンスにおいてAskGNNが優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:25:14 GMT)
SUGAR: Leveraging Contextual Confidence for Smarter Retrieval [28.6] セマンティック不確実性誘導適応検索(SUGAR)について紹介する。
我々は、文脈に基づくエントロピーを利用して、検索するかどうかを積極的に決定し、シングルステップとマルチステップの検索を更に決定する。
実験の結果,意味的不確実性推定によって導かれる選択探索により,多様な質問応答タスクのパフォーマンスが向上し,より効率的な推論が達成された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:24:59 GMT)
Compression with Global Guidance: Towards Training-free High-Resolution MLLMs Acceleration [28.3] マルチモーダルな大言語モデル(MLLM)は、視覚的コンテンツ理解と推論における例外的な性能から注目されている。
視覚トークンの数を減らしたトークン圧縮技術は,計算コストの削減に有効であることを示した。
我々は,サムネイルと複数作物の両方を受信する高分解能MLLMに適した新しいトークン圧縮手法,GlobalCom$2$を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:57:58 GMT)
Deep Assessment of Code Review Generation Approaches: Beyond Lexical Similarity [27.9] コードレビューを評価するための2つの新しいセマンティックベースのアプローチを提案する。
最初のアプローチでは、生成されたレビューと参照の両方をディープラーニングモデルを使用してデジタルベクトルに変換する。
2つ目のアプローチは、生成されたレビューとその参照に基づいてプロンプトを生成し、このプロンプトをChatGPTに送信し、生成されたレビューを評価するためにChatGPTを要求する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:52:32 GMT)
Contrast-Free Myocardial Scar Segmentation in Cine MRI using Motion and Texture Fusion [27.6] 左心室の心筋と傷部組織を分画するために,シネMRIで観察される心臓運動と画像テクスチャ情報を組み合わせた新しい枠組みを提案する。
実験により,LGE MRIに匹敵する精度で,非コントラストのシネ画像に基づいてスカーセグメンテーションを実現できることが示された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:46:46 GMT)
Generalized Kernel Thinning [27.4] Dwivedi and Mackeyのカーネルスライニングアルゴリズム(2021年)
我々は、ターゲットRKHSに直接適用されるKTが、任意のカーネルに対してより厳密で次元に依存しない保証を与えることを示す。
我々は、KT が分数核を持つと、非滑らかなカーネルに対してモンテカルロ MMD の保証がより良くなることを証明した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:28:02 GMT)
FaceMe: Robust Blind Face Restoration with Personal Identification [27.3] 拡散モデルに基づく顔復元手法FaceMeを提案する。
1枚または数枚の参照画像が与えられた場合、アイデンティティ関連の特徴を抽出するためにアイデンティティエンコーダを使用し、高品質な顔画像の復元において拡散モデルを導出するためのプロンプトとして機能する。
実験結果から,FaceMeは顔の良質な画像の復元が可能であり,顔認証の整合性を保ち,優れた性能とロバスト性を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:52:54 GMT)
SepsisCalc: Integrating Clinical Calculators into Early Sepsis Prediction via Dynamic Temporal Graph Construction [27.0] セプシス(Sepsis)は、感染症に対する免疫反応の低下によって引き起こされる臓器機能障害である。
臨床電卓は臨床医のワークフローにおける敗血症の同定において重要な役割を担っている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:00:16 GMT)
Investigating Numerical Translation with Large Language Models [27.0] 本研究では,数値データを扱う際の大規模言語モデル(LLM)の信頼性を評価することに焦点を当てた。
このデータセットの実験は、数値翻訳における誤りが一般的な問題であることを示している。
最新のllama3.1 8bモデルでさえ、20%のエラー率を持つことができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:32:40 GMT)
UniMatch V2: Pushing the Limit of Semi-Supervised Semantic Segmentation [26.9] 半教師付きセマンティックセグメンテーション(SSS)は、安価な未ラベル画像から豊富な視覚知識を学習することを目的としている。
アップグレードされ、単純化されたUniMatch V2を示し、V1から弱い一貫性のコアスピリットを継承する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:57:35 GMT)
Jailbreaking Multimodal Large Language Models via Shuffle Inconsistency [26.7] MLLM(Multimodal Large Language Models)は目覚ましい性能を発揮し、商用アプリケーションで実用化されている。
ジェイルブレイク攻撃は安全メカニズムを回避し、MLLMの潜在的なリスクを発見することを目的としている。
本稿では,Shuffleの不整合を克服し,シャッフルランダム性を克服するため,SI-Attackというテキストイメージのジェイルブレイク攻撃を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:47:01 GMT)
JELLY: Joint Emotion Recognition and Context Reasoning with LLMs for Conversational Speech Synthesis [26.7] JELLYは、会話において適切な音声を生成するための感情認識と文脈推論を統合する新しいフレームワークである。
本稿では,感情認識型Q-formerエンコーダを提案する。
モデル全体を会話音声データで微調整し、感情的文脈を推定し、会話の中で感情的に適切な音声を生成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:32:44 GMT)
ParaRev: Building a dataset for Scientific Paragraph Revision annotated with revision instruction [26.6] 学術テキスト改訂作業における文レベルから段落レベルへのシフトの影響について検討する。
タスクの段落レベルでの定義は、より意味のある変更を可能にし、一般的なものよりも詳細な修正命令によって導かれる。
本実験は, 詳細な指示を用いることで, 一般的な手法と比較して, 自動修正の精度が著しく向上することを示した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:19:55 GMT)
LLaVA-Octopus: Unlocking Instruction-Driven Adaptive Projector Fusion for Video Understanding [26.5] LLaVA-Octopusは、ユーザ指示に基づいて異なる視覚プロジェクタの機能を適応的に重み付けする。
LLaVA-Octopusは複数のベンチマークで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:43:57 GMT)
Towards Balanced Continual Multi-Modal Learning in Human Pose Estimation [26.5] 人間の3次元ポーズ推定(3D HPE)は、特にRGBベースの手法の領域において顕著な研究トピックとして現れている。
RGB, LiDAR, mmWave, WiFiの電力を利用する3次元HPEのための, バランスの取れた連続マルチモーダル学習手法を提案する。
広義のマルチモーダルデータセットMM-Fiについて広範囲に実験を行い、3次元ポーズ推定の高速化におけるアプローチの優位性を実証した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:19:33 GMT)
Identity-Preserving Video Dubbing Using Motion Warping [26.1] ビデオダビングは、レファレンスビデオと駆動オーディオ信号からリアルでリップシンクされたビデオを合成することを目的としている。
本稿では,ビデオダビングのためのIPTalkerを提案する。
IPTalkerは、リアリズム、リップ同期、アイデンティティ保持の観点から、既存のアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:27:58 GMT)
Function-Space Optimality of Neural Architectures with Multivariate Nonlinearities [26.0] 我々は、バナッハ空間上の学習問題に対する解集合が、非線形性を持つニューラルアーキテクチャによって完全に特徴づけられることを示す代表者定理を証明した。
我々の結果は、データに基づいてトレーニングされたニューラルネットワークによって学習された関数の規則性に光を当て、実際に見つかったいくつかのアーキテクチャ選択に対する新たな理論的動機を与えました。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:12:45 GMT)
Multi-Purpose Architecture for Fast Reset and Protective Readout of Superconducting Qubits [25.8] 制御および読み出し中に超伝導量子ビットの高速リセットと保護を可能にする新しい多目的アーキテクチャを提案する。
トランスモンの量子ビットを最初の励起状態から基底状態に100 nsでリセットし、2.7%の残存個体数を達成した。
我々のアプローチは、制御と読み出しの間、高速リセットとキュービット保護のスケーラブルな実装を約束します。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:50:47 GMT)
Towards Dynamic Neural Communication and Speech Neuroprosthesis Based on Viseme Decoding [25.6] テキスト、音声、あるいは人間の神経信号から画像を復号することは、患者の神経補綴や革新的なコミュニケーションツールとして有望な可能性を秘めている。
音声関連非侵襲脳信号から視覚音声意図を復号する拡散モデルに基づくフレームワークを開発した。
脳信号と動的視覚インターフェースのギャップを効果的に埋め、コヒーレントな唇運動の再構築に成功した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:47:27 GMT)
FairCode: Evaluating Social Bias of LLMs in Code Generation [25.4] コード生成のバイアスを評価するための新しいベンチマークであるFairCodeを紹介します。
FairCodeは機能実装とテストケース生成という2つのタスクで構成されている。
このベンチマークでモデル性能を評価するための新しい指標であるFairScoreを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:42:23 GMT)
RAG-WM: An Efficient Black-Box Watermarking Approach for Retrieval-Augmented Generation of Large Language Models [24.9] RAG-WMと呼ばれる新しいブラックボックスの「知識透かし」アプローチを提案し、RAGのIP侵害を検出する。
RAG-WMはマルチLLMインタラクションフレームワークを使用して、透かしエンティティ関係に基づいた透かしテキストを作成し、ターゲットRAGに注入する。
実験結果から,RAG-WMは各種のLLMにおいて,盗難されたRAGを効果的に検出することがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:01:15 GMT)
Prediction-Assisted Online Distributed Deep Learning Workload Scheduling in GPU Clusters [24.8] 本稿では,A-SRPT(Adaptive Shortest-Remaining-Time-first)スケジューリングアルゴリズムを提案する。
ヘテロジニアスディープニューラルネットワーク(DNN)モデルに対応するグラフとして各ジョブをモデル化することにより、A-SRPTはジョブを利用可能なGPUに戦略的に割り当てる。
A-SRPTは複雑なスケジューリング問題を単一マシンのインスタンスにマッピングし、プリエンプティブな "shortest-remaining-processing-time-first" 戦略によって最適に対処する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:19:01 GMT)
Non-Hermiticity enhanced topological immunity of one-dimensional $p$-wave superconducting chain [24.6] 非ハーミティシティは、非局所性障害に対するトポロジカルエッジ状態の堅牢性を高めることができることを示す。
非局所性障害に対するマヨラナゼロモード(MZM)を支持する領域は、非ハーモニティによって拡大される。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:11:54 GMT)
Soup to go: mitigating forgetting during continual learning with model averaging [24.3] 継続的な学習では、後続のタスクを微調整すると、しばしば以前のタスクのパフォーマンスが低下する。
他のマージ手法やL2-regressionにインスパイアされた逐次微調整(Sequential Fine-tuning with Averaging,SFA)を提案する。
我々の手法は過去のデータを保存しなくても同等の結果が得られる。
そこで本手法は,画像領域と言語領域をまたいだ学習において,部分学習モデルを統合する利点について考察する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:11:08 GMT)
Search-o1: Agentic Search-Enhanced Large Reasoning Models [24.2] OpenAI-o1のような大きな推論モデル(LRM)は、大規模な強化学習を通じて、大きなステップワイズ推論能力を実証している。
エージェント検索拡張生成(RAG)機構とReason-in-Documentsモジュールを併用し,LRMを強化するフレームワークである textbfSearch-o1 を紹介する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:48:17 GMT)
STITCH: Surface reconstrucTion using Implicit neural representations with Topology Constraints and persistent Homology [23.7] スパースおよび不規則に間隔を置いた点雲のニューラル暗黙表面再構成のための新しいアプローチSTITCHを提案する。
連続ホモロジーに基づく新しい微分可能なフレームワークを開発し、トポロジ的損失項を定式化し、1つの2次元多様体オブジェクトの先行を強制する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:39:37 GMT)
Spatiotemporally Coherent Probabilistic Generation of Weather from Climate [23.5] 本稿では,高分解能リアナリシスデータに基づいて学習したスコアベース拡散モデルを用いて,局所気象力学の統計的特性を抽出する新しい生成手法を提案する。
本研究では,地球規模の気候出力と一致した空間的・時間的気象動態をモデル化した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:18:26 GMT)
AgentForge: A Flexible Low-Code Platform for Reinforcement Learning Agent Design [23.5] 本稿では,強化学習システムにまたがるパラメータを最適化する,フレキシブルなローコードプラットフォームであるAgentForgeを提案する。
本稿では,視覚に基づくRL問題に対する性能評価について述べる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:12:04 GMT)
Quantum Discord Witness With Uncharacterized Devices [22.9] 任意次元系における未知の双極子状態の量子不協和を観測するために,不特性測定を用いた新しい手法を提案する。
本手法は, 誤差耐性などのデバイス不完全性に対して高い堅牢性を示し, その実験的実現可能性を示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:43:55 GMT)
MedCoDi-M: A Multi-Prompt Foundation Model for Multimodal Medical Data Generation [22.9] マルチモーダル医療データ生成モデルであるMedCoDi-Mを提案する。
MIMIC-CXRデータセット上の5つの競合と比較した。
MedCoDi-Mの医療分野における課題に対する有効性について検討した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:42:56 GMT)
LogLM: From Task-based to Instruction-based Automated Log Analysis [22.4] 既存のアプローチでは、ログ分析を独立したタスクを実行するためのモデルトレーニングとして扱うことが多い。
本稿では,対数ラベル対を命令応答対の統一形式に変換する命令ベーストレーニング手法を提案する。
トレーニングされたモデルであるLogLMは、複雑なユーザ命令に従って、さまざまなタスクをまたいでより一般化することができます。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:24:40 GMT)
Enhancing Quantum State Reconstruction with Structured Classical Shadows [22.4] 提案手法では,提案手法を用いてQSTの性能を保証した古典影法(PCS)を提案する。
PCSは、ターゲット部分空間にプロジェクションステップを組み込むことで、標準CSメソッドを拡張している。
行列積演算子状態に対して、PCS法は、$O(n2)$トータル状態コピーで基底構造を復元できることを実証する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:35:13 GMT)
Perception-as-Control: Fine-grained Controllable Image Animation with 3D-aware Motion Representation [21.9] 本稿では3D対応モーション表現を導入し,詳細な協調動作制御を実現するために,Perception-as-Controlと呼ばれる画像アニメーションフレームワークを提案する。
具体的には、参照画像から3D対応の動作表現を構築し、解釈されたユーザ意図に基づいて操作し、異なる視点から知覚する。
このように、カメラとオブジェクトの動きは直感的で一貫した視覚的変化に変換される。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:23:48 GMT)
CoDe: Communication Delay-Tolerant Multi-Agent Collaboration via Dual Alignment of Intent and Timeliness [21.6] 本稿では,通信遅延耐性多エージェント協調(CoDe)という新しいフレームワークを提案する。
最初にCoDeは、将来のアクション推論を通じてメッセージとしての意図表現を学習する。
次にCoDeは、非同期メッセージの融合プロセスを強化するために、インテントとタイムラインの二重アライメント機構を考案した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:57:41 GMT)
Embodied VideoAgent: Persistent Memory from Egocentric Videos and Embodied Sensors Enables Dynamic Scene Understanding [21.6] Embodied VideoAgentは、エゴセントリックビデオとエンボディインプットの両方からシーンメモリを構築する。
我々は,ロボット操作において,具体的相互作用の生成や知覚など,様々なAIタスクにおいてその可能性を実証した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:25:24 GMT)
Few-shot Class-incremental Learning for Classification and Object Detection: A Survey [21.0] FSCIL(Few-shot Class-Incremental Learning)は機械学習(ML)においてユニークな課題を提示する
本稿は、FSCILの総合的かつ体系的なレビューを提供することを目的としている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:39:30 GMT)
Filter-then-Generate: Large Language Models with Structure-Text Adapter for Knowledge Graph Completion [21.0] 大規模言語モデル(LLM)は、膨大な固有の知識と優れた意味理解能力を示す。
実証的な証拠は、LLMは従来の知識グラフ補完手法よりも一貫して性能が悪いことを示唆している。
これらの課題に対処するために,FtGという新しい命令チューニング手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:38:37 GMT)
Efficient Qubit Calibration by Binary-Search Hamiltonian Tracking [20.9] 共振駆動キュービットの周波数をリアルタイムに調整する手法を提案する。
コントローラは、キュービット周波数推定のための適応的な探索シーケンスを動的に計算する。
フラックス可変トランスモン量子ビットを安定化することにより,アルゴリズムの有効性を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:18:38 GMT)
Progressive Growing of Video Tokenizers for Highly Compressed Latent Spaces [20.9] ビデオトークン化器は遅延ビデオ拡散モデルに必須であり、生のビデオデータを遅延空間に変換して効率的なトレーニングを行う。
時間圧縮を強化するための代替手法を提案する。
本研究では, 高度圧縮ブロックを, 十分に訓練された低圧縮モデル上で段階的に訓練する, ブートストラップ付き高時間圧縮モデルを開発した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:55:15 GMT)
On the Generalizability of Transformer Models to Code Completions of Different Lengths [20.8] 大規模言語モデルが訓練中に見えない長さの入力に一般化できるかどうかは不明である。
自然言語処理(NLP)の最近の研究は、デコーダのみのLLM、すなわちxPOSとALiBiの文脈でこの問題に対処している。
本稿では、これらの特性と、本論文で提案されている他の符号化方式について、大規模な実証研究を行う。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:20:42 GMT)
DriVLM: Domain Adaptation of Vision-Language Models in Autonomous Driving [20.6] マルチモーダル大言語モデル(MLLM)は、画像、ビデオ、音声、テキストなど、複数のモダリティを組み合わせることができる。
ほとんどのMLLMは高い計算資源を必要としており、ほとんどの研究者や開発者にとって大きな課題である。
本稿では,小型MLLMの実用性について検討し,小型MLLMを自律運転分野に適用した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:02:41 GMT)
Hyper-3DG: Text-to-3D Gaussian Generation via Hypergraph [20.5] 本稿では,ハイパーグラフ(Hyper-3DG)を用いた3次元ガウス生成法を提案する。
本フレームワークは, 凝集度を最適化し, 劣化を効果的に回避し, 微細に生成した3Dオブジェクトの創出を可能にする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:20:46 GMT)
AccentBox: Towards High-Fidelity Zero-Shot Accent Generation [20.4] 本稿では、外部アクセント変換(FAC)、アクセント付きTS、ZS-TTSを統一したゼロショットアクセント生成を提案する。
第1段階では、アクセント識別(AID)に関するSOTA(State-of-the-art)を未確認話者に対して0.56f1のスコアで達成する。
第2段階では、AIDモデルにより抽出された事前訓練された話者認識アクセント埋め込みにZS-TTSシステムを適用する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:20:05 GMT)
LSEBMCL: A Latent Space Energy-Based Model for Continual Learning [20.4] この研究は、NLPタスクにおけるESMの有効性を示し、すべての実験で最先端の結果を達成する。
この研究で提案されたLSEBMCL(Latent Space Energy-based Model for Continual Learning)は、エネルギーベースモデル(EBM)を用いて破滅的な忘れ込みを防ぐ。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:47:30 GMT)
Quantifying Itch and its Impact on Sleep Using Machine Learning and Radio Signals [20.2] 臨床医療における大きな課題は、かゆみの定量化のための客観的な尺度が欠如していることである。
人工知能(AI)と組み合わせた無線装置は、スクラッチを同時に捕捉し、睡眠品質への影響を評価することができる。
このデバイスは、ウェアラブルセンサーや皮膚の接触を不要にし、家庭で長期にわたって慢性的なかゆみのモニタリングを可能にする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:50:44 GMT)
Enhanced Atom-by-Atom Assembly of Defect-Free Two-Dimensional Mixed-Species Atomic Arrays [19.4] 我々は120種の混合原子を持つ欠陥のない原子配列を作る。
改良されたアルゴリズムは、他の原子種の組み合わせにも拡張できると期待されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:57:25 GMT)
ITINERA: Integrating Spatial Optimization with Large Language Models for Open-domain Urban Itinerary Planning [19.4] オープンドメイン都市イテナリープランニング(OUIP)の新たな課題について紹介する。
OUIPは、自然言語によるユーザ要求から、パーソナライズされた都市反復を生成する。
本稿では,大規模言語モデルと空間最適化を統合したOUIPシステムであるITINERAについて述べる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:53:50 GMT)
V2C-CBM: Building Concept Bottlenecks with Vision-to-Concept Tokenizer [19.2] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、イメージを人間の理解可能な概念に変換することによって、固有の解釈性を提供する。
最近のアプローチでは、概念ボトルネックを構築するために、大きな言語モデルの知識を活用している。
本研究では,CBMをマルチモーダルモデルから直接構築することで,これらの問題を回避する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 05:12:38 GMT)
TreeKV: Smooth Key-Value Cache Compression with Tree Structures [19.1] TreeKVは、スムーズなキャッシュ圧縮のためにツリー構造を利用するトレーニング不要の手法である。
PG19とOpenWebText2の言語モデリングタスクのベースラインモデルを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:00:27 GMT)
Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning [18.4] コンピュータビジョンが人間の視覚システムを再現しようとすると、幼児の視覚発達を理解することは貴重な洞察を与えるかもしれない。
モデルの内部表現に隠れた視覚概念ニューロンを発見できる学習自由フレームワークを提案する。
我々の研究は、幼児の視覚的および言語的入力に基づいて訓練された計算モデルの内部表現を分析することによって、認知科学とコンピュータビジョンを橋渡しする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:55:55 GMT)
A New Perspective on Privacy Protection in Federated Learning with Granular-Ball Computing [18.2] フェデレートラーニング(FL)は、直接的なデータ共有を避けることにより、プライバシを優先しながら、協調的なモデルトレーニングを容易にする。
画像分類のためのGrBFL(Granular-Ball Federated Learning)と呼ばれる新しいフレームワークを提案する。
GrBFLは、最もきめ細かい入力データに依存する従来の手法から分岐する。代わりに、画像を最適な粗い粒度で複数の領域に分割し、グラフ構造に再構成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:14:03 GMT)
Light Transport-aware Diffusion Posterior Sampling for Single-View Reconstruction of 3D Volumes [18.1] 本稿では,雲など複数の光散乱効果が一様であるフィールドの単一ビュー再構成手法を提案する。
我々は、新しいベンチマークデータセットに基づいて訓練された無条件拡散モデルを用いて、体積場の未知分布をモデル化する。
物理的に基づく微分可能な体積は、潜在空間における光輸送に関して体積勾配を与えるために用いられる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:29:54 GMT)
Harnessing the Power of LLM to Support Binary Taint Analysis [18.1] LATTEは、大規模言語モデル(LLM)を利用した最初の静的バイナリ・テナント解析である。
まず、LATTEは完全に自動化されているが、以前の静的バイナリのテナントアナライザは、テナント伝搬ルールと脆弱性検査ルールを手動でカスタマイズするために、人間の専門知識に依存する必要がある。
第2に、LATTEは脆弱性検出に極めて有効であり、包括的評価によって実証された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:31:37 GMT)
Robust Conformal Prediction Using Privileged Information [17.9] 本研究では,トレーニングデータの破損に対して堅牢な,保証されたカバレッジ率で予測セットを生成する手法を開発した。
我々のアプローチは、i.d仮定の下で有効となる予測セットを構築するための強力なフレームワークである共形予測に基づいている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:47:33 GMT)
MagicFace: High-Fidelity Facial Expression Editing with Action-Unit Control [17.9] 同一人物からの顔行動単位(AU)の相対的変動を制御し,表情編集の課題に対処する。
これにより、特定の人の表現をきめ細かな、連続的で解釈可能な方法で編集することができる。
MagicFaceをダブしたモデルのキーとなるのは、AUのバリエーションとIDエンコーダを条件とした拡散モデルです。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:14:09 GMT)
The GAN is dead; long live the GAN! A Modern GAN Baseline [17.8] より原則的な方法で、現代的なGANベースラインを構築します。
我々は,モードダウンと非収束の問題に対処する正規化相対論的GAN損失を導出する。
このアプローチはFFHQ, ImageNet, CIFAR, Stacked MNISTデータセット上のStyleGAN2を超え, 最先端のGANや拡散モデルと比較した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:53:06 GMT)
Patch-GAN Transfer Learning with Reconstructive Models for Cloud Removal [17.7] クラウド除去はリモートセンシング画像解析の強化において重要な役割を担っているが、クラウドオブサークされた領域を正確に再構築することは大きな課題である。
生成モデルの最近の進歩は、現実的な画像の生成をますますアクセスしやすくしている。
本稿では,GAN(Generative Adversarial Network)フレームワーク上に構築された深層移動学習手法を提案し,雲除去における新しいマスク付きオートエンコーダ(MAE)画像再構成モデルの可能性について検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:19:46 GMT)
Leveraging Large Language Models for Zero-shot Lay Summarisation in Biomedicine and Beyond [17.3] 本稿では,現実のプロセスに基づくレイ要約のための新しいフレームワークを提案する。
この手法により生成された要約は、より大規模なモデルに対して、人間の判断によってますます好まれることが分かる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:24:11 GMT)
1-2-1: Renaissance of Single-Network Paradigm for Virtual Try-On [17.2] 本稿では,既存の手法の限界を克服する新しいシングルネットワークVTON法を提案する。
MNVTONと呼ばれる本手法では,テキスト,画像,ビデオの入力を別々に処理するモダリティ固有の正規化戦略を導入する。
その結果,シングルネットワーク・パラダイムはデュアルネットワーク・アプローチのパフォーマンスに匹敵する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:49:04 GMT)
COCOLA: Coherence-Oriented Contrastive Learning of Musical Audio Representations [17.2] COCOLAは、サンプル間の調和的・リズム的コヒーレンスをキャプチャする、音響音響表現の対照的な学習方法である。
本手法は,音楽トラックを構成する幹のレベルで動作し,ハーモニック・パーカッッシブ分離(HPS)によって得られる特徴を入力できる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:42:21 GMT)
Experimental benchmarking of quantum state overlap estimation strategies with photonic systems [17.1] フォトニック量子システムを用いた重畳推定の4つの方法を比較する。
我々は、単一光子の偏光と経路自由度に関する量子状態を符号化する。
そこで本研究では,フルレンジ重畳重畳推定における最適化精度を持つ適応戦略を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:23:17 GMT)
TAPFed: Threshold Secure Aggregation for Privacy-Preserving Federated Learning [16.9] フェデレートラーニング(Federated Learning)は、複数のパーティが個人データを公開せずに機械学習モデルを協調的にトレーニングできるようにすることで、プライバシを高めるコンピューティングパラダイムである。
従来のフェデレートされた学習プラットフォームは、勾配の交換によるプライバシーリークによってプライバシーを保証できない。
本稿では,悪意あるアクターを持つ複数の分散アグリゲータのコンテキストにおいて,プライバシ保護のためのフェデレーション学習を実現するためのTAPFedを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:24:10 GMT)
A Text-Based Knowledge-Embedded Soft Sensing Modeling Approach for General Industrial Process Tasks Based on Large Language Model [16.8] データ駆動型ソフトセンサー(DDSS)は、プロセス産業において重要なパフォーマンス指標を予測する主要な手法となっている。
開発には、モデリングプロセス中に様々なタスクに合わせてカスタマイズされた複雑でコストがかかる設計が必要である。
本稿では,LLM-TKESS(テキストベース知識埋め込み型ソフトセンシングのための大規模言語モデル)というフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:59:14 GMT)
Authorship Attribution in the Era of LLMs: Problems, Methodologies, and Challenges [16.4] LLM(Large Language Models)の急速な進歩は、人間と機械のオーサシップの境界線を曖昧にしている。
この文献レビューは、この急速に発展する分野における芸術の状況を理解することに興味を持つ研究者や実践者のためのロードマップを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:39:25 GMT)
REFA: Reference Free Alignment for multi-preference optimization [16.2] REFAは、複数のユーザの好みを最適化する参照不要アライメントメソッドのファミリーである。
我々の最高のREFA構成は、AlpacaEval v2ベンチマークでLC-WRが21.62%、WRが19.87%に達した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:20:31 GMT)
Employing Social Media to Improve Mental Health Outcomes [16.0] 本章では、メンタルヘルスと幸福のサービスにソーシャルメディアデータを活用した過去10年間に行われた研究について紹介する。
議論は3つのスラストに沿ってまとめられている: 第1はソーシャルメディアデータが、さまざまなメンタルヘルスの懸念に対するリスクの検出と予測にどのように利用されているかを強調するもので、第2のスラストは、現実世界でのソーシャルメディアベースのアルゴリズムの使用を可能にする翻訳パラダイムに焦点を当てている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:41:24 GMT)
CensorLab: A Testbed for Censorship Experimentation [15.4] 我々は,インターネット検閲シナリオをエミュレートする汎用プラットフォームであるCensorLabを設計し,実装する。
CensorLabは、これまでまたは現在、現実世界の検閲によってデプロイされているすべての検閲メカニズムをサポートすることを目指している。
研究者や実践者が広範な実験を行えるように、使い易いプラットフォームを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:55:17 GMT)
Improved finite-size analysis for measurement-device-independent quantum digital signature [14.9] 量子デジタルシグネチャ(QDS)は、情報理論のセキュリティを提供し、データの完全性、信頼性、非再検査を保証する。
MDI-QDSは検出に対する全ての攻撃に抵抗できるが、有限サイズ効果に悩まされる。
2次元MDI-QDSの有限サイズ解析のための3つのパラメータ推定モデルを提案し,比較する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:18:54 GMT)
Naturalistic Music Decoding from EEG Data via Latent Diffusion Models [14.9] 本研究は,非侵襲的脳波データを用いて,高品質な音楽再生を実現するための最初の試みである。
我々は、パブリックなNMED-Tデータセットでモデルをトレーニングし、ニューラルネットワークベースのメトリクスを提案する定量的評価を行う。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:38:07 GMT)
Deep Learning-based Code Completion: On the Impact on Performance of Contextual Information [14.8] 本稿では,DLベースのコード補完技術の性能が,状況によってどう影響するかを実証研究する。
追加のコンテキスト情報は、DLベースのコード補完のパフォーマンス向上に役立つ。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:34:34 GMT)
Session-Level Dynamic Ad Load Optimization using Offline Robust Reinforcement Learning [14.4] セッションレベルの動的広告ロード最適化は、ユーザのオンラインセッション中に配信される広告の密度とタイプをリアルタイムでパーソナライズすることを目的としている。
従来の因果学習に基づくアプローチは、重要な技術的課題に苦しむ。
本研究では,動的システムにおける共起バイアスを効果的に軽減するオフライン深層Q-network(DQN)ベースのフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:53:03 GMT)
Progressive Supervision via Label Decomposition: An Long-Term and Large-Scale Wireless Traffic Forecasting Method [14.4] LL-WTF(Long-term and Large-scale Wireless Traffic Forecasting)は、戦略的ネットワーク管理とマクロスケールの包括的計画において重要である。
ラベル分解(PSLD)に基づくプログレッシブ・スーパービジョン法を提案する。
PSLDは既存の手法よりも優れており、3つのWTデータセットの平均2%、4%、そして11%のパフォーマンス改善がある。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:35:00 GMT)
Domain-Incremental Semantic Segmentation for Autonomous Driving under Adverse Driving Conditions [14.3] 我々は、プログレッシブ・セマンティック(PSS)と呼ばれるアーキテクチャに基づくドメイン増分学習手法を提案する。
PSSはタスクに依存しない、動的に成長するドメイン固有セグメンテーションモデルのコレクションである。
提案手法は, 有害運転条件の分類における一般化のレベルが異なる複数のデータセットを用いて, 広範囲に評価した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:54:59 GMT)
Online Prompt and Solver Selection for Program Synthesis [14.2] 大規模言語モデル(LLM)は、プログラム合成の領域における印象的な機能を示している。
ユーザにとって重要な課題は、LLMがソルバの適切な選択であるかどうか、与えられた合成タスクを呼び出すのに適切なLLM、そしてそれを呼び出す正しい方法であるかどうかを特定することである。
我々は、マルチアームのバンディットアルゴリズムを用いて、どのシンボルソルバ(LLM)を選択し、与えられた報酬関数を最大化するために、即座に組み合わせてデプロイする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:57:09 GMT)
Differentiable Task Graph Learning: Procedural Activity Representation and Online Mistake Detection from Egocentric Videos [14.0] 手続き的活動は、特定の目標を達成するための重要なステップのシーケンスである。
タスクグラフは、手続き的活動の人間的に理解可能な表現として現れてきた。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:56:43 GMT)
Watermarking Graph Neural Networks via Explanations for Ownership Protection [13.9] グラフニューラルネットワーク(GNN)は、広汎なグラフデータを学習するための主流の手法である。
GNNを不正使用から保護することは依然として課題である。
オーナーシップ情報をモデルに埋め込むウォーターマーキングは潜在的な解決策である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:25:06 GMT)
CROPS: Model-Agnostic Training-Free Framework for Safe Image Synthesis with Latent Diffusion Models [13.8] 最近の研究では、安全チェッカーは敵の攻撃に対して脆弱性があることが示されており、NSFW(Not Safe For Work)イメージを生成することができる。
我々は、NSFW画像を生成する敵攻撃に対して、追加の訓練を必要とせずに容易に防御できるモデルに依存しないフレームワークであるCROPSを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:43:21 GMT)
Mechanistic understanding and validation of large AI models with SemanticLens [13.7] 航空機のような人間工学的なシステムとは異なり、AIモデルの内部動作はほとんど不透明である。
本稿では、コンポーネントによって符号化された隠れた知識をマッピングするニューラルネットワークの普遍的説明法であるSemanticLensを紹介する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:47:34 GMT)
Cross-Modal Mapping: Eliminating the Modality Gap for Few-Shot Image Classification [13.2] 本稿では,画像特徴をテキストの特徴空間にマッピングする,シンプルで効率的なクロスモーダルマッピング(CMM)手法を提案する。
11ベンチマークの結果は、従来の方法と比べて平均3.5%改善したことを示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:24:29 GMT)
Multi-class Decoding of Attended Speaker Direction Using Electroencephalogram and Audio Spatial Spectrum [13.0] 聴取者の脳波(EEG)信号から出席者話者の指向性焦点を復号することは脳-コンピュータインターフェースの開発に不可欠である。
音声空間スペクトルと脳波の特徴を統合することにより、復号精度を効果的に向上させることができる。
提案したSp-EEG-Deformerモデルでは, 55.35%, 57.19%の14クラスのデコード精度を実現している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:56:49 GMT)
Attention Mechanisms Don't Learn Additive Models: Rethinking Feature Importance for Transformers [13.0] 変換器は、特徴属性に使用される線形または付加的な代理モデルを表現することができず、構造的に不可能である。
我々は,変圧器フレームワークに特化して設計された新しい代理モデルであるSoftmax-Linked Additive Log Odds Model (SLALOM)を紹介する。
SLALOMが競合する代理モデルよりもはるかに高い忠実さで説明できることを示すことで、SLALOMの独特な効率品質曲線を強調した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:58:44 GMT)
Large language models streamline automated systematic review: A preliminary study [13.0] 大規模言語モデル(LLM)は、自然言語処理タスクにおいて、体系的なレビューを自動化する可能性を秘めている。
本研究は,3つのLLMの系統的レビュー作業における性能評価である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:59:35 GMT)
Separating Tongue from Thought: Activation Patching Reveals Language-Agnostic Concept Representations in Transformers [12.9] 変圧器に基づく言語モデルにおいて,単語翻訳作業中の潜時表現(潜時表現)を解析する。
出力言語は、翻訳される概念よりも前のレイヤの潜在層にエンコードされていることが分かりました。
本研究は,言語に依存しない概念表現の存在を実証するものである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:53:56 GMT)
Approximate Supervised Object Distance Estimation on Unmanned Surface Vehicles [12.6] 教師付き物体検出を用いたUSVの近似距離推定のための新しい手法を提案する。
本稿では,物体検出モデルの一分野として,物体検出だけでなく,その距離をUSVから予測する手法を提案する。
ボート、ブイ、その他の水上危険物などの付近の物体にオペレーターを警告する海洋補助システムにその応用を実証する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:34:36 GMT)
Optimality of Message-Passing Architectures for Sparse Graphs [12.4] スパース設定における特徴デコレーショングラフ上のノード分類問題、すなわちノードの期待次数がノード数で$O(1)$である場合について検討する。
局所ベイズ最適性(英語版)と呼ばれるノード分類タスクに対するベイズ最適性(英語版)の概念を導入する。
最適なメッセージパッシングアーキテクチャは,低グラフ信号のレギュレーションにおける標準と高グラフ信号のレギュレーションにおける典型とを補間することを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:09:42 GMT)
DATransNet: Dynamic Attention Transformer Network for Infrared Small Target Detection [12.3] 赤外線小目標検出(ISTD)は、民間や軍事用途で広く用いられている。
ISTDは、小さなターゲットと薄暗いターゲットが複雑な背景によって隠蔽される傾向など、いくつかの課題に直面している。
小型ターゲットのエッジ情報を抽出・保存する動的注意変換ネットワーク(DATransNet)を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:49:40 GMT)
Stochastic Process Learning via Operator Flow Matching [12.3] 我々は関数空間上でのプロセスの事前学習のための演算子フローマッチング(OFM)を開発した。
OFM は任意の点集合の値の確率密度を与える。
本手法は, プロセス学習, 機能回帰, 事前学習における最先端モデルより優れている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:20:28 GMT)
Kite: How to Delegate Voting Power Privately [12.0] 我々は、メンバの投票権の委譲を$textitprivate$で行えるプロトコルであるKiteを紹介した。
有権者は、誰に委任されたかを知ることなく、自由に委任し、証明し、権限を再委譲することができる。
公に記録されている唯一の情報は、投票者がその投票を誰かに委任または再委任したことである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:49:45 GMT)
PalmBench: A Comprehensive Benchmark of Compressed Large Language Models on Mobile Platforms [11.9] ユーザがモバイルデバイス上で大きな言語モデルを評価することができる軽量でオールインワンな自動ベンチマークフレームワークを紹介します。
ハードウェア能力の異なる複数のモバイルプラットフォームに対して、様々な量子化構成(重みとアクティベーションの両方)の異なる様々な人気のあるLCMのベンチマークを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:11:59 GMT)
EndoPerfect: A Hybrid NeRF-Stereo Vision Approach Pioneering Monocular Depth Estimation and 3D Reconstruction in Endoscopy [11.8] 内視鏡下副鼻腔手術(ESS)の3次元再建は極めて正確である。
これは、従来の単眼内視鏡を使用する場合、非常に難しい課題となる。
本稿では,ニューラルレージアンス場(NeRF)と立体深度推定を組み合わせた3次元再構成手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:39:56 GMT)
CorrDiff: Adaptive Delay-aware Detector with Temporal Cue Inputs for Real-time Object Detection [11.7] CorrDiffは、リアルタイム検出システムの遅延問題に対処するために設計された。
複数の将来のフレームに対するオブジェクトの位置を予測するために、実行時推定の時間的キューを利用することができる。
あらゆる種類のデバイスにおいて、厳格なリアルタイム処理要件を満たす。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:34:25 GMT)
CoMAL: Collaborative Multi-Agent Large Language Models for Mixed-Autonomy Traffic [11.7] CoMALは、交通の流れを最適化するために、自動運転車間のコラボレーションによって、混在する自律交通問題に対処するために設計されたフレームワークである。
CoMALは大きな言語モデル上に構築されており、対話的な交通シミュレーション環境で動作する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:02:11 GMT)
Addressing Domain Shift via Imbalance-Aware Domain Adaptation in Embryo Development Assessment [11.4] IADA(Im Balance-Aware Domain Adaptation)は、3つの重要なコンポーネントを通じて両方の課題に取り組む新しいフレームワークです。
IADAはクラス間のバランスの取れたパフォーマンスを維持しながら、最大25.19%の精度を達成する。
これらの結果から,IADAの医療画像システム開発の可能性が示唆された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:20:12 GMT)
Comparison Study: Glacier Calving Front Delineation in Synthetic Aperture Radar Images With Deep Learning [11.3] 本研究は、共通の計算フロントベンチマークデータセット上でのディープラーニングシステムの初回比較を示す。
最高のDLモデルの出力は平均で221m、人間のアノテータの平均偏差は38mである。
この大きな違いは、現在のDLシステムは、まだ人間のパフォーマンスに合わないことを示し、氷河カルビングフロントの完全な自動監視を可能にするためには、さらなる研究が必要であることを示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:43:36 GMT)
Analyzing Memorization in Large Language Models through the Lens of Model Attribution [11.3] 大規模言語モデル(LLM)は現代のアプリケーションでは一般的であるが、しばしばトレーニングデータを記憶し、プライバシー侵害や著作権問題を引き起こす。
異なる層におけるアテンションモジュールが,その記憶と一般化に与える影響を分析することによって,建築用レンズからの記憶について検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:00:32 GMT)
Harnessing Large Language and Vision-Language Models for Robust Out-of-Distribution Detection [11.3] Out-of-distribution (OOD) 検出はゼロショットアプローチで大幅に進歩した。
本稿では,Far-OODシナリオとNear-OODシナリオの両方において,ゼロショットOOD検出性能を向上させる新しい手法を提案する。
本稿では,提案フレームワークを目標分布に適合させるために,新しい数発のプロンプトチューニングと視覚的プロンプトチューニングを導入する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:36:37 GMT)
Short Paper: Atomic Execution is Not Enough for Arbitrage Profit Extraction in Shared Sequencers [10.7] 本研究では、2つの定積マーケッター流動性プールにおける原子的実行下での仲裁利益を評価するモデルを開発する。
我々はまた、原子性が損失につながるかもしれないいくつかのシナリオについて議論し、なぜ原子性の実行が、共有シークエンシングを採用するために仲裁やロールアップを納得させるのに十分でないのかについての洞察を提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:05:52 GMT)
De-centering the (Traditional) User: Multistakeholder Evaluation of Recommender Systems [10.7] マルチステークホルダー推薦システムの評価の複雑さに焦点をあてる。
理論的原理から実践的実装への移行について論じる。
我々は、これらの複雑で領域に依存した評価の問題について、研究者や実践者にどのように考えるかについてのガイダンスを提供することを目指している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:44:49 GMT)
Convergence Analysis of Split Federated Learning on Heterogeneous Data [10.6] Split Learning(SFL)は、複数のクライアント間で協調的なモデルトレーニングを行うための、最近の分散アプローチである。
SFLでは、グローバルモデルは通常2つの部分に分割され、クライアントは1つの部分を並行的に訓練し、もう一方は他方を訓練する。
本研究では,SFLの収束解析を行い,不均一なデータに対する凸性および汎用性について述べる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:39:19 GMT)
Mean-Field Analysis for Learning Subspace-Sparse Polynomials with Gaussian Input [10.6] 勾配降下と2層ニューラルネットワークを用いた部分空間スパース学習のための平均場流について検討する。
我々は,目標関数の特性とアクティベーション関数の表現性の両方を含む,SGD-Lrnabilityに必要な条件を確立する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 05:24:57 GMT)
LearningFlow: Automated Policy Learning Workflow for Urban Driving with Large Language Models [10.4] 我々は都市部での運転に適した革新的な自動ポリシー学習ワークフローであるLearningFlowを紹介した。
このフレームワークは、強化学習(RL)トレーニングプロセスを通して、複数の大規模言語モデル(LLM)エージェントの協調を活用している。
一連の複雑な運転タスク間でポリシー学習を自動化し、手動報酬関数設計への依存を著しく低減する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:28:16 GMT)
Bridging Adaptivity and Safety: Learning Agile Collision-Free Locomotion Across Varied Physics [10.4] BAS(Bridging Adaptivity and Safety)は、不確実性のある動的環境においても適応的な安全性を提供するように設計されている。
本研究では,BASが平均速度を維持しながら,動的環境におけるベースラインよりも50%高い安全性を実現することを示す。
その結果、BASは19.8%の速度向上を実現し、現実のABSの2.36倍の速度で衝突する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:26:27 GMT)
Interpretable deep learning illuminates multiple structures fluorescence imaging: a path toward trustworthy artificial intelligence in microscopy [10.4] 本稿では,単一画像から2つの細胞構造を同時予測可能なディープラーニングフレームワークであるAdaptive Explainable Multi-Structure Network (AEMS-Net)を提案する。
AEMS-Netはミトコンドリアと微小管の相互作用をリアルタイムに記録することができ、従来のシーケンシャルチャネルイメージングの手順の半分しか必要としないことを示した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:36:28 GMT)
PFML: Self-Supervised Learning of Time-Series Data Without Representation Collapse [10.4] 本稿では,PFML (Masked Latents) からの関数の予測という時系列データに対する新しいアルゴリズムを提案する。
PFMLは、マスク埋め込みに対応する入力信号の統計的機能を予測することで機能する。
その結果、PFMLは概念的に類似したSSL法と対照的な学習ベースのSSL法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:22:42 GMT)
A Survey on LLM-as-a-Judge [10.3] 大規模言語モデル(LLM)は、様々な領域で大きな成功を収めています。
LLMは、従来の専門家主導の評価に代わる魅力的な代替手段である。
LLM-as-a-Judgeシステムはどうやって構築できるのか?
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:08:17 GMT)
Cross-Attention Graph Neural Networks for Inferring Gene Regulatory Networks with Skewed Degree Distribution [9.9] クロスアテンション複合デュアルグラフ埋め込みモデル(XATGRN)
我々のモデルは、様々なデータセットで既存の最先端メソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:55:29 GMT)
Exact and Efficient Representation of Totally Anti-Symmetric Functions [9.6] このアンザッツは、すべての反対称かつ連続な函数を正確に表すことができることを証明している。
反対称基底関数の特異点を正確に同定する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:51:39 GMT)
Experimental Realization of Criticality-Enhanced Global Quantum Sensing via Non-Equilibrium Dynamics [9.3] 我々は、摂動イジングスピンモデルの非平衡ダイナミクスを活用することにより、臨界減速を緩和する臨界センシングスキームを導入する。
我々の研究は、非平衡臨界力学によって強化された気象学の応用を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:07:07 GMT)
Optimizing Distributed Deployment of Mixture-of-Experts Model Inference in Serverless Computing [9.2] 現在、Mixture-of-Experts (MoE) モデルはモデルアーキテクチャの主流となっている。
サーバレスプラットフォーム上での最適化されたMoEモデルデプロイメントと分散推論について検討する。
私たちの設計では、CPUクラスタと比較して、すべてのMoE層の請求コストを少なくとも75.67%削減しています。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:29:33 GMT)
Snapshot: Towards Application-centered Models for Pedestrian Trajectory Prediction in Urban Traffic Environments [9.0] 本稿では,交通環境における歩行者を対象とするArgoverse 2に基づくベンチマークを提案する。
Snapshotは、モジュラーでフィードフォワード型ニューラルネットワークで、現在の最先端技術より優れています。
Snapshotをモジュラー自動運転ソフトウェアスタックに統合することで、現実の応用性を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:57:53 GMT)
End-to-End Deep Learning for Interior Tomography with Low-Dose X-ray CT [9.0] 画像ドメイン畳み込みニューラルネットワーク(CNN)は、深層畳み込みフレームレットに基づいて、結合したアーティファクトの解決が困難であることがわかった。
両ドメインCNNを用いたエンドツーエンド学習を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:10:17 GMT)
Monotonic Learning in the PAC Framework: A New Perspective [8.9] モノトーン学習(Monotone learning)とは、より多くのトレーニングデータを導入すると、期待されるパフォーマンスが継続的に向上する学習プロセスを指す。
本稿では,PAC学習理論の枠組みの中で,単調学習の課題に取り組む。
低境界分布を計算することにより、有限サイズまたは有限VC次元の仮説空間を持つPAC学習可能問題を与えられた場合、経験的リスク最小化(ERM)に基づく学習アルゴリズムは単調であることを示すことができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:26:11 GMT)
KD-MSLRT: Lightweight Sign Language Recognition Model Based on Mediapipe and 3D to 1D Knowledge Distillation [8.9] 本稿では,3次元から1次元へのクロスモーダル多知識蒸留手法と,新しいエンドツーエンドのテキスト修正フレームワークを提案する。
PHOENIX14とPHOENIX14Tデータセットのワード誤り率(WER)は最先端のCorrNetと比較して少なくとも1.4%低下する。
また、中国語手話データセットの収集とリリースも行い、専門的な訓練語彙を開発した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:58:02 GMT)
Planning-Driven Programming: A Large Language Model Programming Workflow [8.8] 大規模言語モデル(LLM)は、コード生成において強力なパフォーマーである。
近年の研究では、LCMのコード生成精度を向上させるために、可視性テストによる継続的プログラム改善が提案されている。
初期コード生成とその後の改良の両方を改善するために,LLMプログラミングワークフロー(LPW)を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:55:07 GMT)
Cyber Risk Assessment for Capital Management [8.8] 本稿では,サイバーリスク管理における多岐にわたる課題に対処する,2ピラーのサイバーリスク管理フレームワークを提案する。
第1の柱であるサイバーリスク評価は、保険頻度重大度モデルとサイバーセキュリティカスケードモデルを組み合わせて、サイバーリスクのユニークな性質を捉えている。
第2の柱であるサイバー資本管理は、バランスの取れたサイバーリスク管理戦略のために、資金の割り当てを情報化することを促進する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:56:11 GMT)
GUTS: Generalized Uncertainty-Aware Thompson Sampling for Multi-Agent Active Search [8.8] 一般化された不確実性認識型トンプソンサンプリング (GUTS) アルゴリズムは, 大規模非構造環境における能動探索のための異種マルチロボットシステムへの展開に適したアルゴリズムである。
探索面積が75,000 sq.mの非構造環境におけるマルチロボットシステムを用いたフィールドテストを行った。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:54:53 GMT)
ResPanDiff: Diffusion Model with Disentangled Modulations for Image Fusion [8.8] ResPanDiff(ResPanDiff)を用いたパンシャーピングのための拡散モデルを提案する。
ResPanDiffは、パンシャーピングタスクに取り組むパフォーマンスを犠牲にすることなく、拡散ステップの数を著しく削減する。
提案手法は最近の最先端技術(SOTA)と比較して優れた結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:15:07 GMT)
Multi-Domain Features Guided Supervised Contrastive Learning for Radar Target Detection [8.7] 既存のソリューションは、統計的および深い特徴を含む、クラッタとターゲットのエコー差に基づいて、検出またはターゲットの特徴を抽出するための海溝モデルである。
本稿では,教師付きコントラスト学習(MDFG_SCL)手法を提案する。
実世界のデータセットで行った実験では、提案された浅海深度検出器は、小さな海洋目標を効果的に識別するだけでなく、様々な海洋環境において優れた検出性能を維持することが示されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:00:15 GMT)
Comparison of Feature Learning Methods for Metadata Extraction from PDF Scholarly Documents [8.5] 本研究では,自然言語処理(NLP)やコンピュータビジョン(CV),マルチモーダルアプローチなど,さまざまな特徴学習と予測手法を評価し,テンプレートのばらつきが高い文書からメタデータを抽出する。
我々は,学術文書のアクセシビリティの向上と,それらの広範な利用を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:03:43 GMT)
INFELM: In-depth Fairness Evaluation of Large Text-To-Image Models [8.3] マルチモーダルAIシステムは、人間のような認知をエミュレートすることで、産業応用の可能性を秘めている。
また、有害な内容の増幅や社会的偏見の強化など、重大な倫理的課題も生じている。
本稿では,広く使用されているテキスト・ツー・イメージ・モデルにおける奥行きの公平性評価であるINFELMを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:26:05 GMT)
Large Physics Models: Towards a collaborative approach with Large Language Models and Foundation Models [8.3] 本稿では、物理固有の大規模AIモデルの開発と評価のためのアイデアを探求し、潜在的ロードマップを提供する。
これらのモデルは、Large Language Models (LLMs) のような基礎モデルに基づいており、物理学研究の要求に対応するように調整されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:11:22 GMT)
Dynamic Localisation of Spatial-Temporal Graph Neural Network [8.3] 空間時空間グラフニューラルネットワーク(ASTGNN)は、依存関係をモデル化するための貴重なツールとして登場した。
本稿では,空間依存は時間とともに動的に進化するべきだという革新的な視点を紹介する。
textitDynAGSは、分散デプロイメントにおける効率性と精度の最大化を目的とした、ローカル化ASTGNNフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:38:45 GMT)
Explaining the Behavior of Black-Box Prediction Algorithms with Causal Learning [8.3] ブラックボックス予測モデルのポストホック説明可能性に対する因果的アプローチは、ますます人気が高まっている。
因果図形表現を学習し、特徴間の任意の非計測的共起を可能にする。
我々のアプローチは、適切な説明が介入論的な意味で「異論者」である要因を示唆する因果説明の反実理論によって動機付けられている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:10:04 GMT)
Semi-supervised 3D Semantic Scene Completion with 2D Vision Foundation Model Guidance [8.1] 我々は、高密度な注釈付きデータへの依存を軽減するために、新しい半教師付きフレームワークを導入する。
提案手法は2次元基礎モデルを用いて3次元シーンの幾何学的・意味的手がかりを生成する。
本手法は,10%のラベル付きデータを用いて全教師付き性能の最大85%を達成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:45:39 GMT)
Quantum Annealing Approaches to Solving the Shipment Rerouting Problems [7.9] 本稿では,NP-hardシークエンシングおよびパッケージング問題を一般化した出荷再帰問題 (SRP) について検討する。
目的は、トラックのセットを選択し、これらのトラックのルートをスケジュールし、総コストを最小化することである。
我々は、新しい数学的プログラミングの定式化と、シーケンシングとパッケージングの問題を同時に解くための新しい洞察を用いる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:47:23 GMT)
Safeguarding System Prompts for LLMs [7.9] 大規模言語モデル(LLM)は、システムがモデル出力を誘導するアプリケーションでますます利用されている。
敵や通常のユーザクエリでさえ、これらの隠れたプロンプトを公開するために脆弱性を悪用することができる。
本稿では,システムプロンプトの保護を目的とした堅牢な防御機構であるPromptKeeperを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:33:25 GMT)
Improving Skeleton-based Action Recognition with Interactive Object Information [7.9] 本稿では,不在な対話的オブジェクト情報を補うために,オブジェクトノードを導入した新しい行動認識フレームワークを提案する。
我々は、追加のオブジェクト情報を組み込んだオーバーフィッティング問題を初めて検討する。
本手法は,複数の骨格に基づく行動認識ベンチマークにおいて,これまでの最先端の手法を超越した手法である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:43:09 GMT)
GelBelt: A Vision-based Tactile Sensor for Continuous Sensing of Large Surfaces [7.8] 本研究では,連続表面センサのための視覚ベースの触覚センサを提案する。
私たちの設計では、エラストマーベルトと2つの車輪を使って目標面を連続的にスキャンしています。
その結果,提案センサは高速で45mm/sの精度で大規模表面を走査できることがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:00:03 GMT)
AD-L-JEPA: Self-Supervised Spatial World Models with Joint Embedding Predictive Architecture for Autonomous Driving with LiDAR Data [7.7] 我々は、LiDARデータを用いた自動運転のための新しい自己教師型事前訓練フレームワークAD-L-JEPAを提案する。
本手法は,空間空間モデルと組込み予測アーキテクチャを併用して学習する。
実験により,AD-L-JEPAは自律運転アプリケーションにおける自己指導型事前訓練に有効なアプローチであることが示された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:47:51 GMT)
Unraveling the Impact of Visual Complexity on Search as Learning [7.7] 本研究では,学習指向Webセッションにおける視覚的複雑度と探索行動の関係について検討した。
その結果,視覚的に複雑なページが少ないセッションは,学習の成功に結びついていることが判明した。
報告された結果は、視覚的複雑さが学習指向検索に与える影響に光を当て、より効果的なIRシステムの設計を通知した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:51:58 GMT)
Generative Flow Networks: Theory and Applications to Structure Learning [7.7] この論文は、ベイズの観点からの構造学習の問題を研究する。
ジェネレーティブフローネットワーク(GFlowNets)を導入
GFlowNetsは、生成をシーケンシャルな意思決定問題として扱う。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:47:17 GMT)
Do Automated Fixes Truly Mitigate Smart Contract Exploits? [7.6] 本稿では,スマートコントラクトのためのプログラム修復ツールの活用性を評価するための,新しい,体系的な実験フレームワークを提案する。
脆弱なスマートコントラクト143のデータセットを使用して、20の最先端のAPRツールを質的かつ定量的に分析する。
術式は27%から73%に低下した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:44:15 GMT)
Human Delegation Behavior in Human-AI Collaboration: The Effect of Contextual Information [7.5] 既存の補完機能を活用するための有望なアプローチの1つは、人間が個々の決定タスクのインスタンスをAIに委譲できるようにすることである。
我々は,この委任決定を支援するための文脈情報の提供の効果を検討するために行動学的研究を行う。
これらの結果から,コンテキスト情報へのアクセスは,デリゲート設定における人間-AIチームのパフォーマンスを著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:44:44 GMT)
CallNavi: A Study and Challenge on Function Calling Routing and Invocation in Large Language Models [7.4] API関数の選択、パラメータ生成、ネストAPI呼び出しのモデルを評価するために設計された新しいデータセットを提案する。
また,API選択のための汎用大規模言語モデルとパラメータ生成のための微調整モデルと,いくつかの迅速なエンジニアリングアプローチを組み合わせた拡張型APIルーティング手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:12:43 GMT)
RAPGen: An Approach for Fixing Code Inefficiencies in Zero-Shot [7.1] 本稿では,RAPGen(Retrieval-Augmented Prompt Generation)と呼ばれる新しい手法を提案する。
パフォーマンス問題のあるコードスニペットが与えられた後、RAPGenは最初に、以前のパフォーマンスバグ修正の事前構築された知識ベースからプロンプトを検索する。
RAPGenは60%のケースで開発者と同等かそれ以上のパフォーマンス改善提案を生成することができ、そのうち42%が冗長である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:29:00 GMT)
D3RM: A Discrete Denoising Diffusion Refinement Model for Piano Transcription [7.1] 離散拡散モデルを用いたピアノの書き起こしのための新しいアーキテクチャを提案する。
提案手法は,F1スコアの点から,従来の拡散型ピアノ書き起こしモデルとベースラインモデルより優れていた。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:44:06 GMT)
Codebook LLMs: Evaluating LLMs as Measurement Tools for Political Science Concepts [7.0] 抗議イベントや政治暴力、マニフェストなど、現実世界の3つの政治科学のコードブックを収集し、キュレートしています。
我々は,コードブック-LLM計測のための5段階のフレームワークを提案する。人間とLLMの両方のためのコードブックを作成し,LLMの基本機能をコードブック上でテストし,ゼロショット計測精度を評価する。
現在のオープンウェイトLLMは、以下のコードブックのゼロショットに制限があるが、教師あり指導チューニングは性能を大幅に向上させることができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:35:36 GMT)
A Novel Approach to Scalable and Automatic Topic-Controlled Question Generation in Education [6.9] 本稿では,質問の話題的焦点を制御する教育用質問生成手法について紹介する。
The proposed Topic-Controlled Question Generation (T-CQG) method has further thelevance and effect of the generated content for Education purposes。
厳密なオフラインおよび人間支援による評価の結果,提案モデルが高品質な話題中心の質問を効果的に生成できることが実証された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:13:24 GMT)
CDC: A Simple Framework for Complex Data Clustering [6.9] 複雑なデータクラスタリング(CDC)のためのフレームワークを提案する。
まず、グラフフィルタリングを用いて幾何学構造と属性情報を融合する。
そして、新しい類似性保存正規化器によって適応的に学習される高品質なアンカーの複雑さを低減する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:47:34 GMT)
Optimized Sampling for Non-Line-of-Sight Imaging Using Modified Fast Fourier Transforms [6.9] 非線形(NLOS)イメージングシステムは拡散リレー面の光を収集し、3D再構成を出力する計算アルゴリズムに入力する。
これらのアルゴリズムは、Fast Fourier Transform (FFT) を用いて再構成プロセスを高速化するが、入力と出力の両方を均一な格子で空間的にサンプリングする必要がある。
本研究では,既存のNLOS撮像装置が典型的にリレー面を空間的にオーバーサンプリングし,再構成品質を犠牲にすることなく,なぜ圧縮できるのかを説明する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:52:30 GMT)
YOLO11 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once (YOLO) Series [6.8] 本稿では,YOLOv1からYOLOv11へのオブジェクト検出アルゴリズムの進歩を体系的に検討する。
この進化は、今後10年間、YOLOとマルチモーダル、コンテキスト認識、人工知能(AGI)システムを統合するための道のりを示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:33:15 GMT)
Automating the Detection of Code Vulnerabilities by Analyzing GitHub Issues [6.7] 我々は、脆弱性検出に関連するGitHubの問題を分類するために特別に設計された新しいデータセットを紹介します。
結果は、早期脆弱性検出における現実世界のアプリケーションに対するこのアプローチの可能性を示している。
この作業は、オープンソースのソフトウェアエコシステムのセキュリティを強化する可能性がある。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:13:39 GMT)
Interpreting Deep Neural Network-Based Receiver Under Varying Signal-To-Noise Ratios [6.6] 本稿では,畳み込みニューラルネットワークに基づくレシーバモデルに着目し,ニューラルネットワークを解釈する新しい手法を提案する。
この方法は、モデルのどのユニットまたはユニットが関心のチャネルパラメータに関する最も多く(または少なくとも)情報を含むかを特定する。
リンクレベルのシミュレーション実験では、最も(少なくとも)信号対雑音比の処理に寄与する単位を特定する方法の有効性が示されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:04:51 GMT)
Stream Aligner: Efficient Sentence-Level Alignment via Distribution Induction [6.6] Stream Alignerは,生成プロセスを通じて,効率性とさまざまなタスクのパフォーマンス向上を両立させる。
Alignerと比較して、Stream Alignerは追加モデルの能力への依存を減らし、LCMの推論能力を高め、ユーザインタラクションのレイテンシを低減します。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:02:51 GMT)
Advancing ALS Applications with Large-Scale Pre-training: Dataset Development and Downstream Assessment [6.6] 事前訓練と微調整のパラダイムは、衛星リモートセンシングの応用に革命をもたらした。
大規模なALSポイントクラウドデータセットを構築し、下流アプリケーションへの影響を評価する。
以上の結果から,事前学習したモデルは,ダウンストリームタスク全体において,スクラッチよりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:21:09 GMT)
Drift2Matrix: Kernel-Induced Self Representation for Concept Drift Adaptation in Co-evolving Time Series [6.4] 概念ドリフトは従来の時系列解析モデルの信頼性と精度に影響を与える。
Dread2Matrixはカーネルベースの学習機構を使用して表現行列を生成する。
広く普及しているパターンを効果的に識別し、新興トレンドに対する洞察を提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:52:13 GMT)
Entanglement distribution based on quantum walk in arbitrary quantum networks [6.4] 我々は$d$次元GHZ状態に基づく量子フラクタルネットワークを提供する。
Sierpinskiガスケット上の連続量子ウォークと比較して、新しいフラクタルネットワーク上の量子ウォークは、同じ時間枠内でより広く広がる。
我々の研究は、大規模で複雑な量子ネットワークを構築するためのビルディングブロックとして機能する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:22:22 GMT)
Seeing with Partial Certainty: Conformal Prediction for Robotic Scene Recognition in Built Environments [6.3] 本稿では,VLMを用いた位置認識における不確実性の測定・調整を目的としたフレームワークであるSeing with partial Certainty(SwPC)を紹介する。
SwPCは、人間の助けを求めるリクエストを最小限に抑えつつ、位置認識に関する統計的保証を提供するために、共形予測の理論に基づいて構築されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:50:00 GMT)
GiNet: Integrating Sequential and Context-Aware Learning for Battery Capacity Prediction [6.3] 本稿では,バッテリ容量を予測するために,ゲート型リカレントユニット拡張InformerネットワークであるGiNetを提案する。
GiNetは、過去のバッテリ容量を知ることなく、将来のタイムスロットのシーケンスでバッテリ容量を予測するために、0.11の平均絶対誤差を達成している。
また、Informerに比べて27%のエラー削減率で、最新のアルゴリズムを著しく上回っている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:26:28 GMT)
Seeing Sound: Assembling Sounds from Visuals for Audio-to-Image Generation [6.2] オーディオから画像への生成モデルの訓練には、意味的に整合した多様なオーディオと視覚のペアが多数必要である。
本稿では,様々な高品質で不整合なユニモーダル原点のインスタンスを人工的にペアリングできる,スケーラブルな画像ソリフィケーションフレームワークを提案する。
提案手法の有効性を示すため,本手法では,音素化画像を用いて,最先端技術に対して競争力のある音声画像生成モデルを訓練する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:13:57 GMT)
NSChat: A Chatbot System To Rule Them All [6.1] NSChatは神経科学研究を支援するために設計されたウェブベースのシステムである。
従来のチャットボットではなく、実験機器として機能するように細心に設計されている。
情報検索の研究を支援したり、チャットボットエージェント全般と対話するために、容易に適応できる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:27:28 GMT)
HiTZ at VarDial 2025 NorSID: Overcoming Data Scarcity with Language Transfer and Automatic Data Annotation [6.0] Intent Detection, Slot Filling, Dialect Identificationの3つのタスクからなるNorSID共有タスクを提案する。
Intent DetectionとSlot Fillingでは、17言語で利用可能なxSIDデータセットを活用するために、言語間設定でマルチタスクモデルを微調整した。
ダイアレクト同定の場合、最終的な提案は、提供された開発セットに微調整されたモデルで構成され、最高スコアを得た。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:09:32 GMT)
From Lazy to Prolific: Tackling Missing Labels in Open Vocabulary Extreme Classification by Positive-Unlabeled Sequence Learning [6.0] Open-vocabulary Extreme Multi-label Classification (OXMC)は、従来のXMCを拡張し、ラベルセットが103ドルから1012ドルを超える予測を可能にする。
データアノテーションにおける自己選択バイアスは、トレーニングデータとテストデータの両方に重大な欠陥ラベルをもたらす。
本稿では OXMC をキーフレーズ生成タスクとして再構成する PUSL (Positive-Unlabeled Sequence Learning) を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:53:45 GMT)
Almost Optimal Synthesis of Reversible Function in Qudit Model [5.9] 我々は,$Theta(d)$(n - 1)$-quditサブ回路を用いて,$A_dn$で偶数置換を合成する方法を提案する。
また,$Oleft(n dn right)$ gatesと1つのアンシラのみを用いた可逆関数の手法を導入する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:44:14 GMT)
Harnessing Large Language Model for Virtual Reality Exploration Testing: A Case Study [5.9] 大きな言語モデル(LLM)は、情報を長期間保持し、視覚的データとテキストデータの両方を解析する能力を持ち、VRの進化するユーザーインターフェイスの複雑さを解読するための潜在的な鍵として浮上している。
我々は,VR探究試験における視野分析(FOV)におけるLCM(特にGPT-4o)の活用の可能性を検討するために,ケーススタディを実施している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:48:03 GMT)
Detecting Cognitive Impairment and Psychological Well-being among Older Adults Using Facial, Acoustic, Linguistic, and Cardiovascular Patterns Derived from Remote Conversations [5.9] 高齢化社会では、認知の低下を監視し、認知症リスクを示す社会的・心理的要因を特定するためのスケーラブルな方法が緊急に求められている。
機械学習の最近の進歩は、認知障害をリモートで検出し、神経症や心理的幸福のような関連する要因を評価する新しい機会を提供する。
実験の結果,言語パターンは認知障害の定量化に有用であるのに対し,表情や心血管パターンは性格や心理的幸福の定量化に有用であることがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:16:41 GMT)
Quantum Coherent State Transform on Continuous-Variable Systems [5.9] 本稿では,量子コヒーレント状態変換(QCST)と連続変数量子システムに実装するためのフレームワークを紹介する。
結果の量子状態の測定は、$leftfrac1pi left|alpharightrangle leftlanglealpharight| right_alpha 要素を持つ正の作用素値測度(POVM)と等価である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:58:39 GMT)
On-line Policy Improvement using Monte-Carlo Search [5.8] 適応制御器のリアルタイムポリシー改善のためのモンテカルロシミュレーションアルゴリズムを提案する。
我々のアルゴリズムは並列化が容易であり、IBM SP1とSP2の並列RISCスーパーコンピュータ上で実装されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:05:05 GMT)
Three-body scattering hypervolume of two-component fermions in three dimensions [5.7] 3つのフェルミオンのゼロエネルギー衝突について検討し、そのうち2つはスピンダウン(ダウンロウ$)状態にある。
相互作用が弱い場合、ボルン展開を用いておよそ$D$を計算する。
また、大周期立方体における3つのフェルミオンのエネルギーシフトを$D$により解析し、この結果を多価フェルミオン系に一般化する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:33:43 GMT)
The Influence of Initial Connectivity on Biologically Plausible Learning [5.7] ディープラーニングからの洞察に基づいて、ニューラルサーキットにおける初期シナプス接続形状学習はどうすればよいのか?
以上の結果から,初歩重みが学習成績に有意な影響を及ぼすことが明らかとなった。
我々は,リアプノフ指数を正規化する最近提案された勾配フロス法を生物学的に妥当な学習に拡張し,学習性能の向上を観察した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:10:57 GMT)
Cybersecurity in Transportation Systems: Policies and Technology Directions [5.7] 交通機関にまたがるサイバースペースの統合は、新しい意図的なサイバー脅威をもたらした。
公共機関は、その脆弱性が敵に知られていなかったため、デジタルインフラが確保されたと仮定した。
本研究では,交通におけるサイバー脆弱性の増加要因について検討した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:36:40 GMT)
Vision-Language Models for Autonomous Driving: CLIP-Based Dynamic Scene Understanding [5.6] 本研究では,コントラスト言語-画像事前学習(CLIP)モデルを用いた動的シーン検索システムを開発した。
提案システムは,GPT-4oのゼロショット機能を含む,最先端のコンテキスト内学習手法より優れている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:29:31 GMT)
Physics-Driven Learning for Inverse Problems in Quantum Chromodynamics [5.5] ディープラーニング技術と物理駆動設計の統合は、私たちが逆問題に対処する方法を変えつつある。
この視点は、物理駆動学習法の進歩と可能性を強調している。
MLと物理の融合により、より効率的で信頼性の高い問題解決戦略がもたらされることが示されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:14:25 GMT)
Conditional Deep Canonical Time Warping [5.5] シーケンスの時間的アライメントは、コンピュータビジョンやバイオインフォマティクスなど、多くのアプリケーションにおいて基本的な課題である。
CDCTW(Deep Canonical Temporal Time Warping)は、これらの課題に対処するために、スパース時間データの時間的アライメントを設計する。
本研究は,CDCTWの有効性を各種データセットの広範な実験により検証し,従来の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:16:38 GMT)
Response Kinetic Uncertainty Relation for Markovian Open Quantum System [5.1] 古典システムの外部摂動に対する応答を取り入れた新しい原理が発見されている。
我々は古典的R-KURを、リンドブラッドマスター方程式の定常状態に束縛された量子クラムアーラオを用いて一般化する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:50:43 GMT)
Gaze-Informed Vision Transformers: Predicting Driving Decisions Under Uncertainty [5.0] ビジョントランスフォーマー(ViT)は先進的なコンピュータビジョンを持っているが、運転のような複雑なタスクにおける有効性はいまだ研究されていない。
本研究は、視線を視線追跡によって捉え、不確実性の下での運転シナリオの予測精度を高めることにより、視線と視線を融合させることにより、視線を増強する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:08:31 GMT)
AI-generated Image Detection: Passive or Watermark? [4.9] 我々は受動型および透かし型検出器の有効性,堅牢性,効率性を比較するための,最初の総合的なベンチマークを開発した。
我々は5つの受動的検出器と4つの透かしに基づく検出器を8種類の共振と3種類の対向摂動に対して評価した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:17:30 GMT)
MORDA: A Synthetic Dataset to Facilitate Adaptation of Object Detectors to Unseen Real-target Domain While Preserving Performance on Real-source Domain [4.9] 我々は、新しい駆動データセットであるMORDA: Mixture of Real- Domain Characteristics for synthetic-data-assisted Domain Adaptationを構築できる合成融合ドメインを作成する。
実験の結果,MORDAはAI-Hubデータセットの平均精度(mAP)を大幅に向上する一方,nuScenesはわずかに向上することがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:58:02 GMT)
Deriving Coding-Specific Sub-Models from LLMs using Resource-Efficient Pruning [4.8] 大規模言語モデル(LLM)は、様々な複雑なコード生成タスクにおいて、その例外的な性能を実証している。
このような要求を緩和するために、モデルプルーニング技術は、パラメータが著しく少ないよりコンパクトなモデルを作成するために使用される。
本研究では,非構造化プルーニングによる符号化特化サブモデルの効率的な導出について検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:00:01 GMT)
Demonstrating experimentally the encoding and dynamics of an error-correctable logical qubit on a hyperfine-coupled nuclear spin qudit [4.7] 高次元量子システムは、量子ビットベースのアプローチよりもハードウェア効率の良いプロトコルを提供する。
我々は、S=1/2電子スピン量子ビットに結合した核スピン超微粒子の4つの状態に符号化された論理量子ビットを実装した。
本研究は, 実用的で実装可能なフォールトトレラント量子メモリの提案の可能性を確認した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:03:50 GMT)
Bit-depth color recovery via off-the-shelf super-resolution models [4.5] 画像から詳細な事前情報を抽出するために,超解像アーキテクチャを統合した新しい手法を提案する。
提案手法は最先端の手法よりも優れており,高忠実度色復元のための超解像の可能性を強調している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:20:19 GMT)
Towards Optimizing the Expected Performance of Sampling-Based Quantum-Inspired Algorithms [4.5] 我々はサンプリングベース量子インスパイアされたアルゴリズムにおいて2つの主要なサブルーチンを分析する。
データ構造を一般化することで改善の可能性について議論する。
我々は,様々な量子および量子に着想を得た機械学習アルゴリズムの最適実装を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:09:40 GMT)
Optimizing Estonian TV Subtitles with Semi-supervised Learning and LLMs [4.3] 我々は人為的なエストニア語字幕のWhisperモデルを微調整し、それを反復的な擬似ラベルと大言語モデル(LLM)ベースの後編集で強化する。
実験は、ラベルなしデータセットによる擬似ラベル付けによる顕著な字幕品質改善を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:41:37 GMT)
Deterministic Fault-Tolerant State Preparation for Near-Term Quantum Error Correction: Automatic Synthesis Using Boolean Satisfiability [4.3] 我々は、幅広い種類の量子コードに対して、フォールトトレラント回路を自動合成する問題に焦点をあてる。
本研究では, 古典回路設計の手法を応用し, 整合性解法などの手法を応用する。
本稿では,回路レベルのノイズシミュレーションを用いて,合成回路の耐故障性を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:06:01 GMT)
The State of Post-Hoc Local XAI Techniques for Image Processing: Challenges and Motivations [4.3] 生産性の向上を追求するためには、このようなAIシステムの全体的な信頼性を高める技術の必要性を忘れてはならない。
この研究で広く研究されている1つの例は、説明可能な人工知能(XAI)の領域である。
この領域における研究は、AIシステムをより透明で解釈可能なものにする目的を中心に進められている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:45:34 GMT)
Towards smart and adaptive agents for active sensing on edge devices [4.3] TinyMLは、低消費電力エッジデバイスにディープラーニングモデルをデプロイ可能にする。
ディープラーニングのスケーリング法則は、Edge上にデプロイしても適用できない。
本稿では,デバイス上での認識と計画を行うスマートエージェントシステムを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:27:02 GMT)
FedSA: A Unified Representation Learning via Semantic Anchors for Prototype-based Federated Learning [4.2] 本稿では,FedSA(Federated Learning via Semantic Anchors)という新しいフレームワークを提案する。
FedSAは、様々な分類タスクにおいて、既存のプロトタイプベースのFLメソッドを著しく上回っている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:10:03 GMT)
Driving Towards Inclusion: A Systematic Review of AI-powered Accessibility Enhancements for People with Disability in Autonomous Vehicles [4.1] 本稿では,自律走行車(AV)と自律走行車(自律走行車)における包括的ヒューマンコンピュータインタラクション(HCI)について検討する。
議論されている主な技術は、脳-コンピュータインターフェース、人為的相互作用、仮想現実、拡張現実、モード適応、音声アクティベートインターフェース、触覚フィードバックなどである。
これらの知見に基づいて,多様なユーザ層にまたがるアクセシビリティ要件に対処するエンドツーエンドの設計フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:16:39 GMT)
Human-centered Geospatial Data Science [3.9] このエントリは、人間中心の地理空間データサイエンスの概要を提供する。
それは、橋渡し、その重要性、そして重要なトピックと研究のギャップを強調している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:56:51 GMT)
A Look into How Machine Learning is Reshaping Engineering Models: the Rise of Analysis Paralysis, Optimal yet Infeasible Solutions, and the Inevitable Rashomon Paradox [3.8] 土木工学において経験的に派生したサンダル条項や方程式が広く受け入れられていることは、機械学習(ML)モデルに直面する懐疑主義とは対照的である。
本稿では、構造工学のレンズを通してこの哲学的緊張を考察し、MLの統合が従来の工学哲学や専門的アイデンティティにどのように挑戦するかを考察する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:35:48 GMT)
Is Your Autonomous Vehicle Safe? Understanding the Threat of Electromagnetic Signal Injection Attacks on Traffic Scene Perception [3.8] 電磁信号注入攻撃(ESIA)は、自動運転車が撮影した画像を歪めることができる。
我々の研究は、異なるモデル underA のパフォーマンスを分析し、攻撃に対する脆弱性を明らかにします。
我々の研究は、より堅牢なAIモデルの開発を促進することを目的として、包括的なシミュレーションと評価のフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:44:42 GMT)
Learned Discrepancy Reconstruction and Benchmark Dataset for Magnetic Particle Imaging [3.8] 磁気粒子イメージング (MPI) は、超常磁性酸化鉄ナノ粒子の磁気応答に基づく新しい画像モダリティである。
MPI画像再構成作業における重要な課題は、その基礎となるノイズモデルから生じる。
本稿では,逆問題に対する新しい学習ベース再構成手法であるLearninged Discrepancy Approachを紹介する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:21:06 GMT)
Grid Cost Allocation in Peer-to-Peer Electricity Markets: Benchmarking Classical and Quantum Optimization Approaches [3.8] 本稿では、量子コンピューティング(QC)を用いたピアツーピア(P2P)電力市場におけるグリッド運用コストの配分のための新しい最適化手法を提案する。
本研究では,生産者対と生産者対の間の論理的電力フローと物理的電力フローを整合させた準拘束的二元最適化(QUBO)モデルを構築し,グリッドの利用コストを公平に分配する。
このモデルは、最大57ノードのIEEEテストケースで評価され、量子アニーリング(QA)、ハイブリッド量子古典アルゴリズム、古典最適化アプローチと比較される。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:03:56 GMT)
Design and Control of a Bipedal Robotic Character [3.7] この研究は、足のついたロボットのための表現力のあるアーティスト指向のモーションとロバストなダイナミックモビリティを統一することを目的としている。
キャラクタ駆動型機械的特徴に着目した新しい二足歩行ロボットを提案する。
命令信号に条件付けられた芸術的動作を頑健に行うための強化学習に基づく制御アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:55:21 GMT)
A New Transformation Approach for Uplift Modeling with Binary Outcome [3.6] Uplift Modeling(アップリフト・モデリング)は、機械学習のテクニックで、何らかのアクションを実行することで、それを受け取らないことで得られる利益を予測する。
本稿では,2値対象変数の場合の新たな変換結果を設計し,結果ゼロのサンプルの完全な値をアンロックする。
当社の新たなアプローチは、中国全土の金融保有グループの精密マーケティングにすでに適用されています。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:54:34 GMT)
The optimization of exact multi-target quantum search algorithm based on MindSpore [3.6] 修正Groverのアルゴリズムに基づいて,最適化されたマルチターゲット探索アルゴリズムを提案する。
提案したアルゴリズムは、量子ゲート数を少なくとも21.1%減らし、量子回路の深さを少なくとも11.4%減らすことができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:43:07 GMT)
Enhanced Min-Sum Decoding of Quantum Codes Using Previous Iteration Dynamics [3.6] 本稿では,量子低密度パリティチェック符号の縮退を利用した新しいメッセージパス復号法を提案する。
我々は2ブロックのCalderbank-Shor-Steane符号(CSS)に着目している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:28:26 GMT)
Artificial Intelligence in Environmental Protection: The Importance of Organizational Context from a Field Study in Wisconsin [3.5] 農業廃棄物の投棄を検出するための衛星画像ベースのAIツールのユニークなケーススタディの結果を報告する。
この道具は2023年2月から3月にかけて投棄が禁止された際に現場調査に使用された。
AIツールは環境保護資源の割り当てを優先することを約束するが、既存の法律の重要なギャップを露呈する可能性がある。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:27:36 GMT)
Optimizing Multitask Industrial Processes with Predictive Action Guidance [3.5] マルチモーダルトランスフォーマー・フュージョン・アンド・リカレント・ユニット(MMTFRU)ネットワークを導入する。
このシステムは、プロアクティブなオペレータガイダンスを提供し、アセンブリプロセスにおける逸脱を防止する。
提案手法は,産業用Meccanoデータセットと大規模EPIC-Kitchens-55データセットを用いて検証した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:56:33 GMT)
Navigating the Designs of Privacy-Preserving Fine-tuning for Large Language Models [3.5] 現実世界の微調整は、モデルプロバイダの知的財産保護、クライアントのデータプライバシ要件、チューニングコストの間に固有の対立に直面します。
プライバシ保護のための微調整のための設計トレードオフを導出するためのいくつかの指標評価指標を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:33:04 GMT)
Explore Activation Sparsity in Recurrent LLMs for Energy-Efficient Neuromorphic Computing [3.4] Recurrent Large Language Models (R-LLM) は自己注意の複雑さを軽減するのに有効であることが証明されている。
ニューロモルフィックハードウェア上でのエネルギー効率を高めるために,R-LLMの活性化をスパースする,低コストでトレーニング不要なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:13:03 GMT)
Exploiting the geometry of heterogeneous networks: A case study of the Indian stock market [3.3] インド株式市場を異種スケール自由ネットワークとしてモデル化し、2次元双曲空間に埋め込まれる。
非パラメトリック統計テストを適用することで、市場の安定性とボラティリティの期間を明確に区別することができる。
特定の市場セクターが集まっているのがわかります。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:58:13 GMT)
Recursive Quantum Relaxation for Combinatorial Optimization Problems [3.3] 本稿では,既存の量子最適化手法を解法に統一して二項解を求める方法を示す。
MAX-CUT問題における数百ノードの標準ベンチマークグラフの実験は、完全に古典的な方法で行われた。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:25:00 GMT)
EquiBoost: An Equivariant Boosting Approach to Molecular Conformation Generation [3.3] 分子の3次元配座を反復的に洗練するために,複数の同変グラフ変換器を弱い学習者として積み重ねるモデルであるEquiBoostを提案する。
EquiBoostは拡散法よりも精度と効率のバランスが良いことを示す。
この研究は、特定のシナリオにおける拡散モデルの堅牢な代替となる可能性に光を当てる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:57:33 GMT)
Persistent Homology for Structural Characterization in Disordered Systems [3.3] 障害のあるシステムにおける局所的構造と大域的構造の両方を特徴付けるために,永続的ホモロジー(PH)に基づく統一的なフレームワークを提案する。
同じアルゴリズムとデータ構造を使って、ローカルとグローバルのディスクリプタを同時に生成できる。
粒子の再配置を予測し、大域的な位相を分類するのに非常に効果的で解釈可能であることが示されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:17:04 GMT)
A Scalable System for Visual Analysis of Ocean Data [3.2] pyParaOceanは、海洋データ分析に特化したスケーラブルでインタラクティブな可視化システムである。
pyParaOceanは、一般的な海洋分析タスクのための特殊なモジュールを提供する。
本稿では,ベンガル湾を事例として,システムの有効性を実証し,システムの効率性を評価するためのスケールスタディを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:11:51 GMT)
Voxel-Aggregated Feature Synthesis: Efficient Dense Mapping for Simulated 3D Reasoning [3.2] Voxel-Aggregated Feature Synthesis (VAFS) はシミュレーションにおける高密度3次元マッピングの新しいアプローチである。
VAFSはシミュレータの物理エンジンによって計算される分節点クラウドを用いて計算を大幅に削減する。
シミュレーションシーンにおける異なるオブジェクトに対する意味的クエリのIoUスコアを評価することで、結果の表現を検証する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:45:59 GMT)
Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training [3.2] ネットワークプルーニングのためのemphtop-upアルゴリズムであるtextscNeuroALを提案する。
これは、高密度モデルとスパースバージョンの両方から情報を利用するブロックワイドと行ワイドのスパース性を変更する。
パフォーマンスと実行時のトレードオフの観点から、最新の最先端の手法を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:11:37 GMT)
Generalization of Urban Wind Environment Using Fourier Neural Operator Across Different Wind Directions and Cities [3.2] 本研究では,風向と都市レイアウトの異なる流れ場予測におけるフーリエニューラル演算子(FNO)モデルの有効性について検討した。
大規模なエドディシミュレーションデータから速度データを学習することにより,異なる都市環境と風環境下でのモデルの性能を評価する。
その結果,FNOモデルでは正確な予測が可能であり,計算時間を99%削減できることがわかった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:02:12 GMT)
Non-Markovian Noise Mitigation: Practical Implementation, Error Analysis, and the Role of Environment Spectral Properties [3.1] QEM(Quantum error mitigation)は、ノイズの多い量子デバイスのための追加のアンシラ量子ビットを必要としない、エラー抑制パラダイムとして考えられている。
非マルコフ雑音に対するQEMフレームワークにおける確率的誤差キャンセル(PEC)法を拡張して非マルコフ雑音除去(NMNM)法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:22:06 GMT)
Search-based Testing of Simulink Models with Requirements Tables [3.1] 本研究は,要求表(RT)をサポートするSimulinkモデルに対して,最初のブラックボックステスト手法を提案する。
私たちのフレームワークは、モデルとRTの組み合わせの70%でフェールリベリングテストケースを返しました。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:13:22 GMT)
Quantum Linear System Solvers: A Survey of Algorithms and Applications [3.0] 本論文では,量子線形系問題に対するアルゴリズムの背景にある主要な考え方を要約し,解析する。
我々は,誤り耐性と条件数に関して,最適下界への道を開いたHHL後の拡張に焦点を当てた。
本稿では,これらのアルゴリズムの微分方程式,量子機械学習,多体物理学への応用の可能性について論じる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:47:32 GMT)
On the Diagnosis of Flaky Job Failures: Understanding and Prioritizing Failure Categories [2.8] 不安定なジョブ障害は継続的デプロイメント(CD)を妨げる主要な問題のひとつです。
本研究では,TELUSにおける4,511件のフレークなジョブ障害を調査し,頻度,頻度,通貨(RFM)の測定値に基づいて優先順位付けしたフレークな障害のカテゴリを特定した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 05:15:55 GMT)
On Fair Ordering and Differential Privacy [2.8] ブロックチェーンシステムでは、信頼できる規制に準拠したエコシステムにおいて、公正なトランザクションオーダが不可欠である。
本稿では,これらの特性について検討し,トランザクションオーダリングサービスにおけるアルゴリズムバイアスを排除することを目的とする。
我々は、関連する機能と無関係な機能の観点からトランザクションを特徴付け、その順序は関連するもののみによって決定される必要がある。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:17:43 GMT)
Optimal Oblivious Algorithms for Multi-way Joins [2.8] 我々は,ORAMシミュレーションや他のセキュリティ仮定に頼らずに動作するマルチウェイ結合処理のためのソートに基づく新しいアルゴリズムを提案する。
我々のアルゴリズムは、安全でない最悪ケースの最適結合アルゴリズムと対数係数を一致させる時間的複雑さを持つ、基本的なプリミティブの非自明で明白な構成である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:02:31 GMT)
Representation Learning of Lab Values via Masked AutoEncoder [2.8] 逐次的な実験値の計算のためのトランスフォーマーベースのマスク付きオートエンコーダフレームワークであるLab-MAEを提案する。
MIMIC-IVデータセットの実験的評価は、Lab-MAEが最先端のベースラインを大幅に上回っていることを示している。
Lab-MAEは、患者の人口集団間で同等のパフォーマンスを達成し、臨床予測において公平性を向上させる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:17:01 GMT)
A High-accuracy Calibration Method of Transient TSEPs for Power Semiconductor Devices [2.7] 熱感度電気パラメータ(TSEP)法は電力機器の信頼性を高めるために重要である。
本稿では,一過性TSEPの高精度校正法を提案する。
従来の校正法と比較して、平均絶対誤差は30%以上減少する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:56:47 GMT)
Histogram-Equalized Quantization for logic-gated Residual Neural Networks [2.7] ヒストグラム等化量子化(HEQ)は線形対称量子化のための適応的なフレームワークである。
HEQは独自のステップサイズ最適化を用いて量子化しきい値を自動的に適応する。
STL-10データセットの実験では、HEQが提案した論理ゲート(OR, MUX)残差ネットワークの適切なトレーニングを可能にすることも示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:00:02 GMT)
A 1Mb mixed-precision quantized encoder for image classification and patch-based compression [2.7] ASICニューラルネットワークアクセラレータは、異なるレベルの複数のタスクに適用可能であることを示す。
鍵となるコンポーネントは、適切な重み付けとアクティベーション量子化を利用する再構成可能、混合精度(3b/2b/1b)エンコーダである。
また,この量子化エンコーダを用いて画像パッチ・バイ・パッチを圧縮し,再構成を遠隔で行うことができることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:25:22 GMT)
LLMQuoter: Enhancing RAG Capabilities Through Efficient Quote Extraction From Large Contexts [2.7] LLMQuoterは、レトリーバル拡張生成(RAG)を強化するために設計された軽量蒸留モデルである。
LLaMA-3Bアーキテクチャをベースとして、HotpotQAの15,000サンプルのサブセット上にLoRA(Lo-Rank Adaptation)を微調整し、LLMQuoterは"quote-first-then-answer"戦略を採用し、キュレートされたスニペットを推論モデルに渡す前に重要な引用を効率的に識別する。
このワークフローは認知的オーバーヘッドを減らし、Retrieval-Augmented Fine-Tuning (RAFT)のようなフルコンテキストアプローチを上回り、小言語と大言語の両方で20ポイント以上の精度向上を達成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:01:15 GMT)
The dynamics of meaning through time: Assessment of Large Language Models [2.6] 本研究では,様々な大規模言語モデル(LLM)が意味の時間的ダイナミクスを捉える能力を評価することを目的とする。
比較分析にはChatGPT、GPT-4、Claude、Bard、Gemini、Llamaといった著名なモデルが含まれています。
発見は、各モデルの歴史的文脈と意味的シフトの扱いにおいて顕著な違いを示し、時間的意味的理解における強みと制限の両方を強調した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:56:44 GMT)
From Scientific Texts to Verifiable Code: Automating the Process with Transformers [2.5] トランスフォーマーは 研究論文を読めます 正式な証明を持つアルゴリズムを 提案し これらの証明を 検証可能なコードに翻訳します
このアプローチは形式的検証の障壁を大幅に減らすことができると我々は主張する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:03:35 GMT)
A Two-Scale Complexity Measure for Deep Learning Models [2.5] 有効次元に基づく統計モデルのための新しいキャパシティ尺度2sEDを導入する。
新しい量は、モデル上の軽度の仮定の下で一般化誤差を証明的に有界にする。
標準データセットと一般的なモデルアーキテクチャのシミュレーションは、2sEDがトレーニングエラーとよく相関していることを示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:42:45 GMT)
Multimodal-to-Text Prompt Engineering in Large Language Models Using Feature Embeddings for GNSS Interference Characterization [2.5] 大規模言語モデル(LLMs)は、NLP、情報検索、レコメンデーションシステムなど、さまざまな領域にまたがる高度なAIシステムである。
干渉監視は 道路上の車両の 位置決めの信頼性を確保するために 不可欠だ
我々のパイプラインは干渉分類タスクにおいて最先端の機械学習モデルより優れています。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:01:04 GMT)
Simultaneous emulation and downscaling with physically-consistent deep learning-based regional ocean emulators [2.4] 本稿では,メキシコ湾の高解像度海域に着目したAIを用いた海洋エミュレーション・ダウンスケーリングフレームワークを提案する。
このフレームワークは、短期的なスキルと、平均と可変性の観点からの正確な長期統計の両方を示している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:28:31 GMT)
Methodology for Interpretable Reinforcement Learning for Optimizing Mechanical Ventilation [2.3] 機械的換気は、コントロールされた空気と酸素を患者の肺に供給する重要な生命維持介入である。
人工呼吸器制御戦略を最適化するためのデータ駆動アプローチがいくつか提案されているが、多くの場合、解釈可能性やドメイン知識との整合性が欠如している。
本稿では,統合医療システムの一部として機械的換気制御を改善することを目的とした,解釈型強化学習(RL)の方法論を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:24:56 GMT)
High-fidelity Generation of Bell and W States in Giant Atom System via Bound State in the Continuum [2.3] 共振器導波路に結合した2つの巨大原子と3つの巨大原子からなる系において、絡み合った状態を生成するための高忠実性スキームを提案する。
従来のデコヒーレンスフリー相互作用機構の限界を克服し,ベル状態発生に対する98%以上の忠実度を実現した。
我々の提案は、最先端の固体量子プラットフォームの実装に有効であり、量子情報処理における巨大原子および導波路QEDシステムの適用を著しく拡大する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:04:13 GMT)
ViLBias: A Comprehensive Framework for Bias Detection through Linguistic and Visual Cues , presenting Annotation Strategies, Evaluation, and Key Challenges [2.3] VLBiasは、最先端のLarge Language Models(LLM)とVision-Language Models(VLM)を活用して、ニュースコンテンツの言語的および視覚的バイアスを検出するフレームワークである。
本稿では,多様なニュースソースからのテキストコンテンツと対応する画像からなるマルチモーダルデータセットを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:33:14 GMT)
Hierarchical Decomposed Dual-domain Deep Learning for Sparse-View CT Reconstruction [2.2] フィルタバックプロジェクションを用いた解析的再構成により, 厳密なストリーキングアーティファクトが得られた。
画像ドメインネットワークを用いたディープラーニング戦略は、ストリーキングアーティファクトを除去する際、顕著な性能を示した。
本研究は、スパースビューCT再構成のための理論的に正当化された深層学習手法を提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:19:05 GMT)
Boosting Graph Neural Network Training by Focusing on Non-Robust Samples from the Training Set [2.2] グラフニューラルネットワーク(GNN)は、グラフ構造化データの処理に有効なニューラルネットワークである。
GNNは、データポイント間の関係を表すグラフ構造と、データの特徴行列の両方を活用して、特徴表現を最適化する。
本稿では,モデルトレーニングのためのより小型で効果的なトレーニングセットを構築するために,元のトレーニングセットからノイズに敏感なトレーニングサンプルを選択する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:06:40 GMT)
EVA-S2PLoR: A Secure Element-wise Multiplication Meets Logistic Regression on Heterogeneous Database [2.1] 本稿では, 効率よく, 検証し, 正確な2次元ロジスティック回帰フレームワーク(EVA-S2PLoR)を提案する。
我々のフレームワークは、主にセキュアな2次元ベクトル要素ワイド乗算と、データディスガージング技術に基づく乗算、相反関数、シグモイド関数を含む。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:19:59 GMT)
Identifiability of Controlled Open Quantum Systems [2.1] 量子状態トモグラフィーの結果から、それに対応する識別可能性の概念を定義する。
このことは、オープン量子系の同定に対する多くの建設的なアプローチの基礎となる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:27:15 GMT)
Private Selection with Heterogeneous Sensitivities [2.1] 微分プライベート(DP)選択は、有限候補プールからハイスコア候補を選択することを含む。
この問題は、モデル選択、仮説テスト、および多くのDPアルゴリズムを含む様々な文脈で自然に発生する。
これを解決するために、GEM(Generalized Exponential Mechanism)のようなアルゴリズムは、候補感度の可変性を利用する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:25:07 GMT)
DGNN-YOLO: Interpretable Dynamic Graph Neural Networks with YOLO11 for Detecting and Tracking Small Occluded Objects in Urban Traffic [2.1] 本稿では,動的グラフニューラルネットワーク(DGNN)とYOLO11を統合し,制約に対処する新しいフレームワークであるDGNN-YOLOを紹介する。
標準のGNNとは異なり、DGNNはグラフ構造をリアルタイムで動的に更新する優れた能力のために選択される。
このフレームワークはグラフ表現を構築し、定期的に更新し、ノードとしてオブジェクトをキャプチャし、エッジとして相互作用する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:28:55 GMT)
Stochastic Neural Network Symmetrisation in Markov Categories [2.1] 我々は、群準同型に沿ってニューラルネットワークをシンメトリする問題を考察する。
これをマルコフ圏の項で定式化する。
シンメトリションのためのフレキシブルで構成的な枠組みを得る。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:14:23 GMT)
Stability and List-Replicability for Agnostic Learners [2.1] 無限のリトルストーン次元を持つクラスは、過大な誤差に依存する安定性パラメータを許容しても、安定してPACを学習できないことを証明している。
また、人口減少の少ない分布に非依存的な設定を限定しても、有限仮説クラスのみがグローバルに安定に学習可能であることも証明した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:59:15 GMT)
Efficient Evaluation of Optical Quantum Modules via Two-Photon High-Dimensional Interference [2.0] 香港-奥羽-マンデル干渉を用いた2光子量子モジュール評価法を提案する。
本手法は,光量子モジュールの高速かつ正確な評価を可能にするために,多自由度光子符号化を用いる。
本手法をプログラマブルシリコンフォトニックチップ上で検証し,光学量子モジュールの性能を正確に評価できることを実証した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:21:12 GMT)
From Images to Insights: Transforming Brain Cancer Diagnosis with Explainable AI [1.9] 本研究はバングラデシュの脳腫瘍MRIデータセットを,脳腫瘍,脳グリオーマ,脳髄質の3つのカテゴリに分類した6,056個のMRI画像を含む。
DenseNet169は、精度、精度、リコール、F1-Scoreは全て0.9983に達した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:35:43 GMT)
Extracting Affect Aggregates from Longitudinal Social Media Data with Temporal Adapters for Large Language Models [1.9] 本稿では,ソーシャルメディアデータの経時的分析ツールとして,時整列大言語モデル(LLM)を提案する。
本誌は、Llama 3 8Bのテンポラルアダプターを、イギリスのTwitterユーザのパネルから全タイムラインで微調整した。
我々は、世論や集団的感情に強い影響を与えている新型コロナウイルスのパンデミックの始まりについて分析する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:47:32 GMT)
SensorQA: A Question Answering Benchmark for Daily-Life Monitoring [1.9] 本稿では,人間による質問応答(QA)データセットであるDatasetを紹介した。
データセットは人間の労働者によって作成され、真の人間の関心を反映した5.6Kの多様性と実用的なクエリを含んでいる。
このデータセット上で、最先端AIモデルのベンチマークを確立し、典型的なエッジデバイス上でのパフォーマンスを評価する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 05:06:44 GMT)
UAV-VLA: Vision-Language-Action System for Large Scale Aerial Mission Generation [1.9] UAV-VLA (Visual-Language-Action) は、空中ロボットとの通信を容易にするためのツールである。
衛星画像処理をビジュアル言語モデル(VLM)と統合し、GPTの強力な能力により、UAV-VLAはユーザーが一般的な飛行経路と行動計画を作成することができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:15:59 GMT)
Retrieving past quantum features with deep hybrid classical-quantum reservoir computing [1.8] 量子状態の時間的処理のためのハイブリッド古典量子貯水池計算を導入する。
ハイブリッドセットアップは、両方の構成要素の強度を継承するが、その部分の総和以上である。
量子層は最先端のマルチモード量子光学プラットフォームの範囲内にあり、古典層はシリコで実装できる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:04:58 GMT)
Time Transfer: On Optimal Learning Rate and Batch Size In The Infinite Data Limit [1.8] 事前トレーニングトークンの予算である$T$,$B$と、クリティカルバッチサイズである$B_mathrmcrit$との関係に、最適な$eta$スケーリングの複雑な依存性を示す。
驚くべきことに、観測された最適$eta$と$B$Dynamicsは、$mu$Pモデルスケーリングで保存されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:04:01 GMT)
Optimal Scheduling in a Quantum Switch [1.8] 量子スイッチは、ネットワーク間の絡み合いを確立し、分散し、維持する。
古典的なスイッチングファブリックとは対照的に、量子スイッチは2側キューイングネットワークである。
一般的なスイッチトポロジーのための流体スケールでの2時間スケール分離現象を解析する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:08:01 GMT)
CellViT++: Energy-Efficient and Adaptive Cell Segmentation and Classification Using Foundation Models [1.8] $textCellViTscriptstyle ++$は、デジタル病理学における一般化された細胞セグメンテーションのためのフレームワークである。
$textCellViTscriptstyle ++$は、ユーザフレンドリで、ビジュアライゼーションとアノテーションのためのWebベースのインターフェースを備えたオープンソースのフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:26:50 GMT)
Effective Rank and the Staircase Phenomenon: New Insights into Neural Network Training Dynamics [1.7] ディープラーニングは高次元問題、特に低次元の特徴構造を持つ問題の解決において広く成功している。
ニューラルネットワークがどのようにそのような特徴を抽出するかをトレーニング中に理解することは、ディープラーニング理論における根本的な問題である。
本稿では,ニューラルネットワークの最後の隠れ層にあるニューロンを,重要な特徴を表す基本関数として解釈することで,新たな視点を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:18:12 GMT)
Knowledge Transfer in Model-Based Reinforcement Learning Agents for Efficient Multi-Task Learning [1.7] モデルに基づく強化学習のための効率的な知識伝達手法を提案する。
高容量マルチタスクエージェントをコンパクトな1Mパラメータモデルに蒸留し,MT30ベンチマークで最先端性能を実現する。
トレーニング後の量子化をFP16に適用し、性能を維持しながらモデルサイズを50%削減する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:55:08 GMT)
Outlyingness Scores with Cluster Catch Digraphs [1.6] 本稿では,クラスタ・キャッシュ・ダイグラフ(CCD)に基づく2つの新しいアウトリーニングネススコア(OS)について紹介する。
どちらのOSもグラフ、密度、分布に基づく技術を採用しており、クラスタ形状や強度の異なる高次元データに調整されている。
モンテカルロシミュレーションにより、両OSの性能をCCDベース、従来型、最先端の異常検出手法と比較する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:08:23 GMT)
Cluster Catch Digraphs with the Nearest Neighbor Distance [1.6] クラスタ・キャッシュ・ダイグラフ(CCD)に基づくクラスタリングの新しい手法を提案する。
新しい手法は空間ランダムネステストの新しい変種を用いてRK-CCDの限界に対処する。
我々は,モンテカルロ解析を総合的に行い,本手法の性能評価を行う。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:15:23 GMT)
From Mesh Completion to AI Designed Crown [1.6] 我々は、ポイントクラウドコンテキストに条件付けされたクラウンメッシュを生成するために、新しいエンドツーエンドのディープラーニングアプローチであるDigital Mesh Completion(DMC)を提案する。
提案手法は平均0.062 Chamfer Distanceを実現する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:10:15 GMT)
Explainable AI-Enhanced Deep Learning for Pumpkin Leaf Disease Detection: A Comparative Analysis of CNN Architectures [1.5] この研究は、2000枚の高解像度画像を5つのカテゴリに分けた「パンプキンリーフ病データセット」を用いている。
データセットは、モデルトレーニングの強力な表現を保証するために、いくつかの農業分野から厳格に組み立てられた。
我々は、DenseNet201、DenseNet121、DenseNet169、Xception、ResNet50、ResNet101、InceptionResNetV2を含む多くの熟練したディープラーニングアーキテクチャを調査し、ResNet50が90.5%の精度と同等の精度、リコール、F1-Scoreで最も効果的に実行されたことを観察した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:59:35 GMT)
Synchronization in microwave optomechanical circuits via coupling engineering to a common environment [1.5] 本研究では、3つの非同一および機械的に分離された光学共振器の同期ダイナミクスについて検討する。
共通環境は任意の2つの共振器間の間接結合を誘導し、これは実効的な非エルミート相互作用ハミルトニアンによって記述できる。
超伝導回路の優れたチューニング性を利用して、異なる同期状態を制御可能な方法で切り替えることができることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:23:22 GMT)
A Protocol for Compliant, Obliviously Managed Electronic Transfers [1.5] 本稿では,デジタル資産をセキュアに作成,更新,転送するためのプロトコルについて述べる。
アーキテクチャは3つのコンポーネントで構成されている。トランザクションチャネル内の相手をアンリンクするメカニズム、不要なトランザクションのメカニズム、サービスプロバイダが同調しないようにするメカニズムである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:02:03 GMT)
Online Continual Learning: A Systematic Literature Review of Approaches, Challenges, and Benchmarks [1.4] オンライン連続学習(OCL)は、機械学習において重要な分野である。
本研究は,OCLに関する総合的なシステム文献レビューを初めて実施する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:03:14 GMT)
tCURLoRA: Tensor CUR Decomposition Based Low-Rank Parameter Adaptation and Its Application in Medical Image Segmentation [1.3] 伝達学習は、事前訓練されたモデルからの知識を活用することで、目標タスクの性能を大幅に向上させた。
ディープニューラルネットワークのスケールアップに伴って、フル微調整によって、計算とストレージの大幅な課題がもたらされる。
テンソルCUR分解に基づく新しい微調整法であるtCURLoRAを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:59:41 GMT)
SpaLLM-Guard: Pairing SMS Spam Detection Using Open-source and Commercial LLMs [1.3] 我々は,SMSスパム検出における大規模言語モデル (LLM) の可能性を評価する。
ゼロショット、少数ショット、微調整、チェーン・オブ・プルーピングのアプローチでパフォーマンスを比較します。
ファインチューニングは最も効果的な戦略として現れ、Mixtralの精度は98.6%、偽陽性と偽陰性率は2%以下である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:00:08 GMT)
AgoraSpeech: A multi-annotated comprehensive dataset of political discourse through the lens of humans and AI [1.3] アゴラ・スペーチ(AgoraSpeech)は、ギリシャ国民選挙中の2023年の6つの政党による171の政治演説を精巧にキュレートした高品質なデータセットである。
このデータセットには、テキスト分類、トピック識別、感情分析、名前付きエンティティ認識、分極、ポピュリズム検出の6つの自然言語処理(NLP)タスクのためのアノテーション(1段落)が含まれている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:17:59 GMT)
Developing a Foundation of Vector Symbolic Architectures Using Category Theory [1.3] 本稿では,圏論をベクトル記号アーキテクチャに適用する試みについて述べる。
VSAは、ニューラル処理と人間が実行するシンボリック推論を統一する必要性から生まれた。
カテゴリー理論におけるVSAの基盤となることは、学習と認知の両方において、他の研究とより厳密なつながりをもたらすことを願っている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:49:04 GMT)
MHAFF: Multi-Head Attention Feature Fusion of CNN and Transformer for Cattle Identification [1.3] 本研究は,牛の識別において,MHAFF(Multi-Head Attention Feature Fusion)と呼ばれる新しいアプローチを導入する。
MHAFFは、その独自性を保ちながら、異なるタイプのハウジング機能間の関係をキャプチャする。
実験により、MHAFFは2つの公開された牛のデータセットの精度において、追加および連結技術および既存の牛の識別方法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:00:01 GMT)
Private and Robust States for Distributed Quantum Sensing [1.2] 分散量子センシングにより、空間的に分離されたプローブに符号化された複数のパラメータを推定できる。
このような設定では、必要以上に多くの情報を与えたくないのは自然なことです。
我々は、機能に関するプライバシーの概念を使用し、ターゲット機能に関する情報だけがすべての関係者に利用可能であることを保証します。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:28:25 GMT)
MultiMed: Multilingual Medical Speech Recognition via Attention Encoder Decoder [1.2] 我々はMultiMedを紹介した。MultiMedは、マルチリンガルな医療ASRデータセットであり、小型から大規模の医療ASRモデルの最初のコレクションである。
私たちの知る限り、MultiMedは主要なベンチマーク全体にわたって世界最大の医療ASRデータセットです。
本稿では,再現性のある経験的ベースライン,モノリンガル性・多言語性分析,注意デコーダ(AED)とハイブリッド比較研究,AEDのレイヤーワイドアブレーション研究,多言語医学的ASRのための言語分析を含む,医学的ASRのための最初の多言語性研究について紹介する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:50:12 GMT)
Toward a 2D Local Implementation of Quantum LDPC Codes [1.2] 幾何学的局所性は量子低密度パリティチェック(qLDPC)符号の重要な理論的および実践的な要素である。
本稿では,2次元局所ゲートに制限された場合の動作オーバーヘッドを低減することを目的とした,2層アーキテクチャ上に構築された誤り訂正プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:31:04 GMT)
CuRLA: Curriculum Learning Based Deep Reinforcement Learning for Autonomous Driving [1.2] 深層強化学習(DRL)エージェントは、経験から学び、報酬を最大化する。
本稿では,DRLとカリキュラム学習を組み合わせた自動運転手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 05:45:03 GMT)
Deep Learning-Based Automatic Multi-Level Airway Collapse Monitoring on Obstructive Sleep Apnea Patients [1.2] 音はVOTE (Velum, Oro-ynx, Tongue Base, Epiglottis) の分類でラベル付けされた。
モデルは,V,O,T,Eレベルの閉塞を同定し,後頭蓋骨(RP)と後舌骨(RG)を同定する2つの多ラベル分類タスクのために訓練された。
その結果,ASTはResNet-50よりわずかに優れており,Vを同定する安定性が良好であった。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:33:24 GMT)
A General Retrieval-Augmented Generation Framework for Multimodal Case-Based Reasoning Applications [1.0] Retrieval-Augmented Generation (RAG) を備えたLarge Language Models (LLM) は、CBRパイプラインのRetrieveおよびReuseステージをサポートすることができる。
本稿では,マルチモーダルCBRアプリケーションのための汎用RAGフレームワークMCBR-RAGを提案する。
単純化されたMath-24アプリケーションとより複雑なBackgammonアプリケーションを用いて,MCBR-RAGの有効性を実証する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:41:22 GMT)
Beyond Life: A Digital Will Solution for Posthumous Data Management [0.9] Beyond Lifeは、死の後にデジタル資産を安全に扱い、配布するために設計された、クロスプラットフォームのデジタル意志管理ソリューションである。
このソリューションの中核は、PD-CP-ABEと呼ばれるカスタマイズされたCiphertext-Policy Attribute-Based Encryptionスキームである。
既存のシステムとは異なり、Beyond Lifeはサービスプロバイダとは独立して運用されており、ユーザの意志の生成、保存、実行に関する透明性とコントロールを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:25:13 GMT)
Generalized Zurek's bound on the cost of an individual classical or quantum computation [0.9] Zurekは、このコストは$K(xvert y)$、条件付きコルモゴロフ複雑性$x$$$$$$$$$$$によって与えられると提案した。
我々は、$K(xvert y)$が$x$から$y$にマッピングする最小のコストであることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:55:51 GMT)
Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data [0.9] パスワードに依存するセキュリティシステムは、忘れられたり、推測されたり、違反されたりすることに対して脆弱である。
本稿では,これらの問題に対処するために顔認識技術を利用したバイオ暗号システムを提案する。
提案システムは、顔の特徴から派生した32ビットの暗号鍵を作成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:44:39 GMT)
Neural Architecture Codesign for Fast Physics Applications [0.9] 物理応用のためのニューラルネットワーク符号の合理化のためのパイプラインを開発した。
ハードウェア効率の良いモデルを見つけるために,ニューラルネットワーク探索とネットワーク圧縮を2段階のアプローチで実施する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:00:03 GMT)
Tailored-LLaMA: Optimizing Few-Shot Learning in Pruned LLaMA Models with Task-Specific Prompts [0.9] 我々はタスク固有のデータセットを使用し、50億と40億のパラメータを持つ2つのプルーニングLLaMAモデルを微調整する。
本稿では,LLaMAモデルをタスク特異性と即効性という2つの制約の下で微調整する手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:29:40 GMT)
Runtime Analysis of Evolutionary Algorithms for Multiparty Multiobjective Optimization [0.9] 本稿では、双方向多目的最適化問題(BPMOP)における進化的アルゴリズムの予測ランタイムに関する最初の理論的解析について述べる。
その結果,MPMOPを解くために従来の多目的最適化アルゴリズムを用いることは,時間を要することと非効率であることがわかった。
擬ブール最適化のための共進化型多目的多目的言語(CoEMPMO)を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:16:08 GMT)
HPAC-IDS: A Hierarchical Packet Attention Convolution for Intrusion Detection System [0.8] 本研究は,階層構造と自己認識機構を活用した,悪意あるネットワークトラフィックに対する堅牢な検出システムを提案する。
提案システムは,所定の生ネットワークパケットをHPAC-IDSに供給される固定サイズのセグメントに分割するパケットセグメンタを含む。
CIC-IDS 2017データセットで実施された実験によると、システムは高い精度と低い偽陽性率を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:24:49 GMT)
A CT Image Classification Network Framework for Lung Tumors Based on Pre-trained MobileNetV2 Model and Transfer learning, And Its Application and Market Analysis in the Medical field [0.8] 本稿では,事前学習したMobileNetV2モデルに基づくディープラーニングネットワークフレームワークを提案する。
このモデルはテストセットで99.6%の精度を達成し、特徴抽出を大幅に改善した。
診断精度を向上し、医療費を削減し、精密医療を促進するAIの可能性は、将来の医療産業の発展に大きな影響を与えるだろう。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:22:50 GMT)
$DPF^*$: improved Depth Potential Function for scale-invariant sulcal depth estimation [0.8] 脳の大きさが解剖学的MRIから得られた皮質表面の幾何学的特徴にどのように影響するかを検討する。
1)脳の大きさがsulcal depth測定にどう影響するか,2)問題の本来の定式化に基づく新しいスケール不変なsulcal depth推定法の導入,3)発達期から成人までの26週間にわたる1,987人の被験者の大規模サンプルを用いて,新しいsulcal depth測定の生物学的意義を実証する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:48:55 GMT)
Image2CADSeq: Computer-Aided Design Sequence and Knowledge Inference from Product Images [0.8] デジタルCADファイルがアクセスできないシナリオでは、リバースエンジニアリング(RE)が3DCADモデルの再構築に使われてきた。
ポイントクラウドなどの3Dデータを境界表現(B-rep)フォーマットで3Dモデルに変換することに重点を置いている。
本研究では,Image2CADSeqニューラルネットワークモデルを用いた新しいデータ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:36:21 GMT)
Quantum-enhanced causal discovery for a small number of samples [0.7] 本研究は,基礎となるモデル構造を仮定しない因果発見のための新しい量子ピーター・クラーク(qPC)アルゴリズムを提案する。
我々は因果構造の基本グラフ部分に関する系統的な実験を行い、qPCアルゴリズムが著しく優れた性能を示すことを示した。
我々の理論的および実験的結果は、提案した量子アルゴリズムが古典的アルゴリズムを堅牢で正確な推論に活用できることを証明している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:05:22 GMT)
Off-Policy Evaluation and Counterfactual Methods in Dynamic Auction Environments [0.6] オフ・ポリティ・アセスメント(Off-Policy Evaluation)は、研究者がコストのかかる実験をせずに新しいポリシーを評価できるようにし、評価プロセスを高速化する。
A/Bテストのようなオンライン実験手法は有効であるが、しばしば遅いため、政策選択と最適化プロセスが遅れる。
A/B試験実施前の予備段階として, 対物推定器を活用することにより, 評価プロセスの合理化を目指す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:39:40 GMT)
Arcee's MergeKit: A Toolkit for Merging Large Language Models [0.6] MergeKitは、任意のハードウェア上でモデルを効率的にマージするためのフレームワークである。
これまで、何千ものモデルがオープンソースコミュニティによってマージされてきた。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:21:56 GMT)
Visual Semantic Navigation with Real Robots [0.6] ビジュアルセマンティックナビゲーション(VSN)は、ロボットが見えない環境でナビゲートするための視覚意味情報を学ぶ能力である。
実ロボットにVSNモデルを組み込む新たなソリューションを提案する。
また,VSN 用の新しい ROS ベースのフレームワーク ROS4VSN をリリースし,任意の VSN モデルを ROS 互換ロボットに容易にデプロイし,実環境でテストできるようにした。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:59:21 GMT)
Quantum Data Center Infrastructures: A Scalable Architectural Design Perspective [0.6] 本稿では、光スイッチを用いて複数の量子プロセッサを相互接続するスケーラブルな量子ネットワークの設計について述べる。
我々は、現在の量子プロセッサの限界に対処し、量子データセンターの可能性を探ることを目指している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:12:33 GMT)
TimeRL: Efficient Deep Reinforcement Learning with Polyhedral Dependence Graphs [0.6] TimeRLは、熱心な実行のダイナミズムと、全プログラム最適化とグラフベースの実行のスケジューリングを組み合わせた動的DRLプログラムを実行するシステムである。
我々は、TimeRLが現在のDRLアルゴリズムを既存のDRLシステムよりも最大47$times$高速に実行し、GPUピークメモリを16$times$安くしていることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:05:33 GMT)
Decentralized Federated Anomaly Detection in Smart Grids: A P2P Gossip Approach [0.4] 本稿では,ランダムウォーク(Random Walk)とエピデミック(Epidemic)という2つの主要なゴシッププロトコルに基づく分散化フェデレーション異常検出手法を提案する。
従来のフェデレートラーニングに比べて,トレーニング時間の35%が顕著に改善されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:27:29 GMT)
Feasibility of short blocklength Reed-Muller codes for physical layer security in real environment [0.4] 実世界の通信路における物理層セキュリティのためのリード・ミュラー符号(RM)の適用について検討する。
我々は、RM符号の階層構造を利用してデータ伝送をセキュアにするためのコセット符号化方式を実装した。
実験結果から,RM符号は実世界のチャネル障害の影響を受けても堅牢なセキュリティを実現することが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:51:32 GMT)
Less is More: The Influence of Pruning on the Explainability of CNNs [0.4] 本稿では,技術的複雑性の低減が説明可能性に寄与するかどうかを考察する。
圧縮率の低下は説明可能性に肯定的な影響を及ぼすが、圧縮率の上昇は否定的な影響を示す。
認識された説明可能性とモデルの性能の両方を増加させるスイートスポットを同定する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:35:59 GMT)
Enhancing Complex Formula Recognition with Hierarchical Detail-Focused Network [0.4] 階層的かつ複雑な数式認識(MER)は、数式を複数解釈できるため困難である。
これらの問題に対処するために設計された最初のデータセットである階層的詳細認識データセット(Focused-Focused)を紹介する。
本稿では,階層型サブフォーミュラモジュールを組み込んだ新しいフレームワークである階層型Detail Recognition Network (HDNet)を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:18:59 GMT)
Manipulating spectral transitions and photonic transmission in a non-Hermitian optical system through nanoparticle perturbations [0.3] ナノ粒子による線形スピン共振器のスペクトル遷移と光子伝達について検討した。
本研究は,現実的な条件下での散逸型量子デバイスの設計に有用な知見を提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:37:25 GMT)
Robust Point Matching with Distance Profiles [0.3] 距離プロファイルに基づくマッチング手法の頑健性と雑音安定性を示す。
提案手法は,外乱や雑音があっても高い確率で適用可能であることを示す理論的解析を行う。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:08:44 GMT)
OpenAI ChatGPT interprets Radiological Images: GPT-4 as a Medical Doctor for a Fast Check-Up [0.3] GPT-4は画像の解釈能力を持つ。
画像の処理と解釈の能力は、人工知能の応用と有効性をはるかに超えている。
本研究では,まず,人工知能を用いた医療における放射線画像の解釈について検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:21:33 GMT)
Neuro-Symbolic AI in 2024: A Systematic Review [0.3] レビューはPRISMA方法論に従い、IEEE Explore、Google Scholar、arXiv、ACM、SpringerLinkといったデータベースを利用した。
1,428紙の最初のプールから、167紙が包含基準を満たし、詳細に分析された。
研究活動の大半は、学習、推論、論理、推論、知識表現の領域に集中している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:48:35 GMT)
Quantum geometry embedded in unitarity of evolution: revealing its impacts as geometric oscillation and dephasing in spin resonance and crystal bands [0.3] 我々は、一元的進化の本質的な結果として、幾何学が量子内でどのように現れるかを示す。
スピンやバンドのシナリオにおいて、振動やデファスティングなどの幾何学的可観測物を例示する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:30:49 GMT)
Strategy Masking: A Method for Guardrails in Value-based Reinforcement Learning Agents [0.3] 本稿では、報酬関数を用いて意思決定を学習するAIエージェントのための原則付きガードレール構築手法について検討する。
戦略マスキングは, 嘘の報酬次元を抑えるか, 積極的に罰せられることによって, エージェントの振る舞いを効果的に修正できることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:43:05 GMT)
Blind calibration of a quantum computer [0.2] 我々は、特定の量子状態の正確な準備に盲目な正確な校正プロトコルを開発する。
単純なトモグラフィーデータのみからデバイスエラーを抽出し、事前指定されたエラー機構の予備実験を必要としない。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:36:38 GMT)
BTMTrack: Robust RGB-T Tracking via Dual-template Bridging and Temporal-Modal Candidate Elimination [0.2] RGB-Tトラッキングのための新しいフレームワークであるBTMTrackを提案する。
このアプローチの核心は、デュアルテンポレートバックボーンネットワークとTMCE(Temporal-Modal Candidate Elimination)戦略にあります。
提案手法は,LasHeRテストセットの72.3%精度とRGBT210およびRGBT234データセットの競合結果を用いて,最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:33:09 GMT)
BRATI: Bidirectional Recurrent Attention for Time-Series Imputation [0.1] 時系列分析におけるデータの欠落は、ダウンストリームアプリケーションの信頼性に影響を及ぼす、重大な課題を引き起こす。
本稿では,多変量時系列計算のための新しい深層学習モデルであるBRATIを紹介する。
BRATIは時間的依存を処理し、長い時間的水平線と短い時間的水平線をまたいだ特徴相関を処理し、その逆の時間的方向で動作する2つの計算ブロックを利用する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:50:56 GMT)
TipSegNet: Fingertip Segmentation in Contactless Fingerprint Imaging [0.1] 本稿では,手動画像から直接指先をセグメント化することで,最先端の性能を実現する新しいディープラーニングモデルTipSegNetを提案する。
TipSegNet は既存の手法より優れており、平均の 0.987 と 0.999 の Intersection over Union (mIoU) を達成している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:59:23 GMT)
Automated external cervical resorption segmentation in cone-beam CT using local texture features [0.1] 外側頚椎吸収 (ECR) は歯に影響を及ぼす吸収過程である。
CT(cone-beam Computed tomography)は,EMCの適切な評価のために推奨される画像モダリティである。
本稿では,局所的に抽出されたボクセルのテクスチャ特徴の自動二分分類に基づくECR病変のセグメンテーション法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:43:01 GMT)
Analog Bayesian neural networks are insensitive to the shape of the weight distribution [0.1] 本稿では,実機ノイズを変動分布として用いたMFVIトレーニング手法を提案する。
実験により, BNNの重み付き予測分布は同一の重み付きであり, 分散は同一の分布に収束することを示した。
この結果は、MFVIを実行するハードウェア実装BNNにおいて、アナログデバイス設計者がデバイスノイズ分布の形状を考慮する必要はないことを示唆している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:19:27 GMT)
Real Time Multi Organ Classification on Computed Tomography Images [0.1] スパースデータサンプリング戦略を用いた大コンテキストサイズを用いて,臓器ラベルをリアルタイムに取得する方法を実証する。
本手法は,問合せ位置の独立分類器として機能するが,任意の解像度で問合せ格子位置を問合せすることで,完全分割を生成することができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:10:14 GMT)
A Multi-Layer CNN-GRUSKIP model based on transformer for spatial TEMPORAL traffic flow prediction [0.1] 交通流予測は、インテリジェント交通システムITSの基盤のままである。
CNN-GRUSKIPモデルは先駆的なアプローチとして現れる。
このモデルは、ARIMA、Graph Wave Net、HA、LSTM、STGCN、APTといった確立したモデルよりも一貫して優れていた。
強力な予測能力と適応アーキテクチャにより、CNN-GRUSKIPモデルはITSアプリケーションを再定義する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:30:02 GMT)
Validate Quantum State Preparation Programs [0.0] 本稿では、Coq証明アシスタントで実装された高保証フレームワークであるPqasmについて述べる。
このフレームワークの鍵は、量子重ね合わせ状態を含むプログラムのプログラム正当性保証を、重ね合わせのないプログラム状態に対するプログラム正当性保証に還元することである。
我々は、QuickChickプロパティベースのテストフレームワークを使用して状態準備プログラムをテストする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:35:26 GMT)
Using LLMs to Infer Non-Binary COVID-19 Sentiments of Chinese Micro-bloggers [0.0] 中国で最も人気のあるマイクロブログサイトであるWeiboについて、新型コロナウイルス(COVID-19)の感染拡大に伴う投稿を用いて調査する。
大規模言語モデルであるLlama 3 8Bを使用して,肯定的,否定的,皮肉的,中立的なカテゴリに分類することで,プラットフォーム上のユーザの感情を分析する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:30:14 GMT)
Unsupervised representation learning with Hebbian synaptic and structural plasticity in brain-like feedforward neural networks [0.0] 教師なし表現学習が可能な脳様ニューラルネットワークモデルを導入,評価する。
このモデルは、一般的な機械学習ベンチマークのさまざまなセットでテストされた。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:30:53 GMT)
UltraCortex: Submillimeter Ultra-High Field 9.4 T Brain MR Image Collection and Manual Cortical Segmentations [0.0] UltraCortexリポジトリには、超高磁場強度9.4Tで得られたヒト脳の磁気共鳴画像データが格納されている。
86枚の構造MR画像を含み、空間解像度は0.6mmから0.8mmである。
このレポジトリは、12の脳をグレーとホワイトの物質区画に分割する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:58:38 GMT)
Traversing Quantum Control Robustness Landscapes: A New Paradigm for Quantum Gate Engineering [0.0] 本稿では,制御パラメータを雑音感受性にマッピングする概念的フレームワークであるQuantum Control Robustness Landscape (QCRL)を紹介する。
QCRLのレベルセットをナビゲートすることで、ロバストネス不変パルス変動(RIPV)アルゴリズムは、ロバスト性を維持しながら制御パルスの変動を可能にする。
数値シミュレーションにより、我々の単一および2量子ビットゲートは、大きなノイズがあっても量子誤差補正しきい値を超えていることが示される。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:37:53 GMT)
Trading Devil RL: Backdoor attack via Stock market, Bayesian Optimization and Reinforcement Learning [0.0] データ中毒のみに焦点を当てたバックドア攻撃を提案する。
この特定のバックドア攻撃は、事前の考慮やトリガーなしに攻撃として分類され、ファイナンスLLMsBackRLと命名する。
本研究の目的は,テキスト生成や音声認識,ファイナンス,物理,現代人工知能モデルのエコシステムに強化学習システムを利用する大規模言語モデルの有効性を検討することである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:17:23 GMT)
Towards understanding the bias in decision trees [0.0] この信念は必ずしも決定木に対して正しいものではなく、そのバイアスが実際には反対方向にあることを示しています。
本研究は,無作為林など,一般的な樹木モデルの利用に影響を及ぼすものである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:31:30 GMT)
Towards Probabilistic Inference of Human Motor Intentions by Assistive Mobile Robots Controlled via a Brain-Computer Interface [0.0] Brain Computer Interface (BCI) は、物理的な動きを必要としない、ユーザフレンドリーな選択肢である。
現在のBCIシステムは、ユーザが加速するか減速するかを理解できますが、これらの変更を個別のスピードステップで実装します。
著者らは,BCI制御ロボットシステムにおける知覚行動サイクルを再設計することで,この制限に対処することを目指している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:18:38 GMT)
Theoretical study of the Spectroscopic measurements of Kerr non-linear resonators with four-body interaction [0.0] 四体相互作用を特徴とするKerr非線形共振器の分光計測について検討した。
1つの共振器に共振駆動を、もう1つの共振器に弱駆動を用いることで、人口変動を示す6つの異なる周波数を同定した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 05:43:57 GMT)
The more polypersonal the better -- a short look on space geometry of fine-tuned layers [0.0] 我々は、追加の文法モジュールで訓練されたBERTモデルの内部表現の変化を分析する。
単一の文法層を追加することで、モデルが新しい文法層と古い文法層をその内部で分離することを発見した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:50:47 GMT)
The global consensus on the risk management of autonomous driving [0.0] 道路交通のリスク嗜好は、文化圏間で著しく類似していることが示される。
決定論的衝突シナリオで検出された自動運転車の社会的ジレンマは、すべての国の日常交通状況のリスク評価で消失する。
どの国でも、サイクリストは高い脆弱性を超えるリスクボーナスを受け取らない。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:33:08 GMT)
The evolution of volumetric video: A survey of smart transcoding and compression approaches [0.0] 3D画像のキャプチャーと表示を行うボリュームビデオは、メディアの風景を変えるための革命的技術として登場した。
本稿では、この新興メディアがもたらすユニークな課題に対処するAI駆動型ソリューションの可能性に焦点を当て、ボリュームビデオ圧縮と配信の最先端について検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:38:13 GMT)
The application of annealing in quantum cooling protocols [0.0] 摂動理論に基づいて冷却過程を記述し, 時間変調ゼーマン場における浴の利点を検証した。
冷却プロトコルの耐雑音性は, 量子ノイズの種類に依存することを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:24:07 GMT)
The Humanist Programming Novice as Novice [0.0] 専門科目が脆弱なプログラミング知識の創出を促進するのか,プログラミング学習におけるヒューマニズムの学生が直面する困難は何か,専門学習のカリキュラムにおけるアルゴリズムの適切な場所は何か,などについて質問する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:12:58 GMT)
Teleportation and Entanglement Swapping of Continuous Quantum Variables of Microwave Radiation [0.0] 連続可変(CV)絡み合わせは、非線形媒体に光を絞って効率よく無条件に製造することができる。
本稿では,CVベースのマイクロ波量子通信の3つの重要な要素について述べる。
このようなハードウェア効率の良いCVエンタングルメントビルディングブロックは、量子計算、量子暗号、および量子通信における幅広い応用を可能にする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:20:59 GMT)
Targeted Adversarial Denoising Autoencoders (TADA) for Neural Time Series Filtration [0.0] 脳波(EEG)時系列データをフィルタリングするための機械学習(ML)ベースのアルゴリズムは、面倒なトレーニング時間、正規化、正確な再構築に関連する課題に直面している。
本稿では,ロジスティック共分散目標対向型オートエンコーダ(TADA)により駆動されるMLフィルタリングアルゴリズムを提案する。
この仮説を検証するため、TADAシステムプロトタイプをトレーニングし、EEGdenoiseNetデータセットの脳波データから筋電図(EMG)ノイズを除去するタスクで評価した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 04:41:50 GMT)
Statistical testing of random number generators and their improvement using randomness extraction [0.0] 乱数生成器(RNG)は、特に暗号アプリケーションにおいて、構築とテストが難しいことで知られている。
我々はRNG出力品質を改善するためにランダム性抽出器を用いて様々な後処理手法を設計、実装、提示する。
既存のテストスイートに基づいた総合的な統計的テスト環境を導入し、軽量(高速)なテストから集中的なテストにパラメトリできる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:08:52 GMT)
Stable Symmetry-Protected Topological Phases in Systems with Heralded Noise [0.0] 定常状態が安定な混合状態対称性保護位相(SPT)秩序を示す局所量子チャネルの族を示す。
定常状態の短距離対に誤差を閉じ込める補正プロトコルを構築する。
遮蔽ノイズの速度が増加するにつれて、SPTの順序は最終的に有向パーコレーション遷移によって失われる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:47:13 GMT)
Spatial Information Integration in Small Language Models for Document Layout Generation and Classification [0.0] 文書レイアウト理解は、文書内の情報の空間的配置を分析して、その構造とレイアウトを理解する研究分野である。
半構造化データは日常的な生活(バランスシート、購入注文、レシート)では一般的だが、この種のドキュメントのために機械学習モデルをトレーニングするための公開データセットが不足している。
本稿では,このデータ不足を克服する上で有効な,新しい,合成されたレイアウト情報を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:20:00 GMT)
Simulation of quantum computation with magic states via Jordan-Wigner transformations [0.0] ある種の準確率表現における負性は、量子計算上の優位性にとって必要条件である。
我々は、この性質を示す新しい準確率表現を、マジック状態モデルにおける量子計算に関して定義する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:03:45 GMT)
Simple Construction of Qudit Floquet Codes on a Family of Lattices [0.0] コードを定義するシーケンス2体計測における簡単な条件のセットに基づいて,単純かつ汎用的なqudit Floquet符号の構成を提案する。
この構成には、特殊ケースとしてqubitとquditのFloquet符号の両方の既存の構成が含まれていることを示す。
さらに, 建設によって得られた任意のクディットフロッケ符号は, 物理的クエーディットに対して, 物理的クエーディット数として$frac12$に近づくエンコードされた論理クエーディットの速度を達成し, 格子の面上での物理クエーディットの数も大きくなる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:52:00 GMT)
Shrink the longest: improving latent space isotropy with symplicial geometry [0.0] 本稿では, 簡易幾何学に基づく新しい正規化手法を提案し, 潜在表現の等方性を改善する。
本手法は, 微調整時の異方性を大幅に低下させながら, 下流性能の向上につながることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:44:10 GMT)
Scaffold-SLAM: Structured 3D Gaussians for Simultaneous Localization and Photorealistic Mapping [0.0] モノクロ,ステレオ,RGB-Dカメラ間の同時ローカライズと高品質な光リアルマッピングを実現するScaffold-SLAMを提案する。
まず,3次元ガウスアンによる様々なカメラポーズにおける画像の外観変化のモデル化を可能にする。
第二に、ガウス分布を導くために周波数正規化ピラミッドを導入し、モデルがシーンの細部を効果的に捉えることを可能にする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:50:26 GMT)
Research on quantum compilation of neutral atom quantum computing platform [0.0] ニュートラル原子量子コンピューティングプラットフォーム(Neutral atom quantum computing platform)は、高可制御性と拡張性を持つ量子コンピューティングの実装方法である。
本稿では,行列分解に基づく量子コンパイル手法を体系的に検討し,中性原子量子コンピューティングに適したコンパイルアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:20:32 GMT)
Randomized Approach to Matrix Completion: Applications in Collaborative Filtering and Image Inpainting [0.0] カラム選択マトリックスコンプリート(CSMC)法は列サブセット選択と低ランク行列コンプリートを組み合わせたものである。
CSMCを実装するための2つのアルゴリズムを導入し、それぞれ異なるサイズの問題に適合する。
CSMCは凸最適化に基づく最先端行列補完アルゴリズムと同じ品質のソリューションを提供する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:42:52 GMT)
Proactive Adversarial Defense: Harnessing Prompt Tuning in Vision-Language Models to Detect Unseen Backdoored Images [0.0] バックドア攻撃は、隠れたトリガーを入力に埋め込むことで重大な脅威となり、モデルがそれらをターゲットラベルに誤って分類する。
トレーニングと推論の両方において、未確認のバックドア画像を検出するための画期的な手法を提案する。
われわれのアプローチは、学習可能なテキストプロンプトを訓練し、クリーンな画像と隠れたバックドアトリガーを区別する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:15:20 GMT)
Privacy Violations in Election Results [0.0] 個々の投票記録の公開は、99.83%の有権者の投票選択を公表することにつながるものではない。
透明性の潜在的なメリットについて議論し、プライバシー侵害を減らすための対策の比較を行い、すべての選挙報告に固有のプライバシーと透明性のトレードオフを強調します。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:57:35 GMT)
Predicting Spin-Dependent Coulomb Interaction Based on the Yang-Mills Equations [0.0] マクスウェルの方程式は、標準クーロンポテンシャルの存在を予測することができる。
私たちの仕事は、基本的な相互作用とスピンを結合する方法に新たな光を当てています。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:44:31 GMT)
Physics Based Differentiable Rendering for Inverse Problems and Beyond [0.0] 物理ベースの微分可能レンダリング(PBDR)はコンピュータビジョン、グラフィックス、機械学習において効率的な方法となっている。
これらの能力により、自律的なナビゲーション、シーン再構築、材料設計など幅広い分野において、優れたレンダリングが採用されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:36:57 GMT)
Performance of YOLOv7 in Kitchen Safety While Handling Knife [0.0] 本研究は、YOLOv7を用いて、ナイフハンドリング時の安全性リスクを特定することに焦点を当てた。
モデルの性能は、精度、リコール、mAP50、mAP50-95などの指標を用いて評価された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:47:57 GMT)
On the role of Artificial Intelligence methods in modern force-controlled manufacturing robotic tasks [0.0] ロボットマニピュレータの強化におけるAIの役割は、スマートマニュファクチャリングにおける重要なイノベーションに急速に結びついている。
この記事では、これらのイノベーションを実効力によって制御されたアプリケーションにまとめ、高品質な生産標準を維持する必要性を強調します。
この分析は、AI技術を検証するための共通のパフォーマンスメトリクスの必要性を強調した、将来の研究方向性の視点で締めくくっている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:10:38 GMT)
On Corrigibility and Alignment in Multi Agent Games [0.0] 自律エージェントの信頼性はシステム設計の未調査部分である。
人間の嗜好に対する不確実性は、人間の不合理性に直面した場合でも、エージェントを矯正するために働くことが示唆されている。
本稿では,エージェントが常に人間に監督を依頼できる2人プレイヤゲームとして,マルチエージェント設定でコーリライザをモデル化するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:44:38 GMT)
OmniJet-${α_{ C}}$: Learning point cloud calorimeter simulations using generative transformers [0.0] 高粒度温度計における点雲として, 生成型変圧器を用いたカロリーメータを最初に使用した例を示す。
OmniJet-$alpha$モデルのトークン化子と生成部を用いて、検出器のヒットを整数列として表現する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:16:41 GMT)
Observation as Physication. A single-world unitary no-conspiracy interpretation of quantum mechanics [0.0] 本稿では,観測対象の値とともに,操作者に対する物理的意味の割り当てが観測を通して広まることを提案する。
量子観測は、この割り当てに留まらず、一元的に行うことができると提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:02:32 GMT)
Non-asymptotic analysis of the performance of the penalized least trimmed squares in sparse models [0.0] 最小三重二乗推定器(LTS)は古典的最小二乗推定器の代用として名高い。
本稿は、LTSを高い確率で推定し予測するための有限標本(漸近的でない)誤差境界を確立する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:36:17 GMT)
Molecular Properties from Quantum Krylov Subspace Diagonalization [0.0] クリャロフ固有状態の緩和された1と2の粒子還元密度行列を得る方法を示す。
これは量子信号処理を活用して、Krylov固有状態(出口状態を含む)を深さ線型に$D$で作成する。
我々は、小さな分子の核勾配を計算し、その分散を推定することで、我々のアプローチを検証する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:50:01 GMT)
Mathematical Modeling and Machine Learning for Predicting Shade-Seeking Behavior in Cows Under Heat Stress [0.0] 熱ストレスに晒された牛の日陰探索行動を予測するため,機械学習と組み合わせた数学的モデルを構築した。
このアプローチは、時間平均熱指標や蓄積熱応力測定値などの高度な数学的特徴を統合している。
ランダムフォレストとニューラルネットワークという2つの予測モデルは、正確性、堅牢性、解釈可能性について比較される。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:32:08 GMT)
Loschmidt echo, emerging dual unitarity and scaling of generalized temporal entropies after quenches to the critical point [0.0] クエンチ後の積状態のLoschmidtエコーが共形場理論を用いてどのように予測できるかを示す。
また、最近の進化の二重ユニタリ性も予測し、確認することができます。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:40:06 GMT)
Load Forecasting for Households and Energy Communities: Are Deep Learning Models Worth the Effort? [0.0] この研究は、エネルギーコミュニティにおける短期負荷予測のための最先端ディープラーニングモデルの広範なベンチマークを提供する。
LSTM、xLSTM、Transformerは、KNN、合成負荷モデル、永続化予測モデルなどのベンチマークと比較される。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:29:50 GMT)
Linear Multidimensional Regression with Interactive Fixed-Effects [0.0] 本稿では,3次元以上の多次元パネルデータに対する線形かつ加法的に分離可能な回帰モデルについて検討する。
ビールの需要を見積もる手法が実装されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 02:35:18 GMT)
Interferometry of quantum correlation functions to access quasiprobability distribution of work [0.0] 我々は、カークウッド・ディラック準確率分布の再構成に補助的なシステムによって支援された干渉計方式を用いる。
ダイヤモンド中の窒素空孔中心に付随する電子核スピン系において、このスキームを実験的に実証した。
本研究は,量子熱力学の文脈における作業準確率分布の物理的意義を明らかにするものである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:32:34 GMT)
Integrating Explainable AI for Effective Malware Detection in Encrypted Network Traffic [0.0] 暗号化されたネットワーク通信は、エンドポイント間の機密性、完全性、プライバシを保証する。
本研究では、悪意のあるネットワークトラフィックを検出するための説明可能な人工知能(XAI)技術の統合について検討する。
我々は、暗号化通信の様々な側面から抽出された多視点特徴を用いて、悪意ある活動を特定するためにアンサンブル学習モデルを用いる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:21:00 GMT)
Innovative Designs and Insights into Quantum Thermal Machines [0.0] 本稿では,量子システムの動作領域に関する包括的理論的研究を紹介する。
本研究は、量子熱機械の完全なスペクトルを含む、関連的で新しい知見を提供する。
文献に記述されていない新しいQTM設計を導入する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:02:07 GMT)
Inherent quantum resources in stationary spin chains [0.0] 様々なスピン-1/2鎖の固有状態に多体ベル相関が本質的に存在することを示す。
特に,Lipkin-Meshkov-Glickモデルの固有状態と熱状態が多体ベル相関を持つことを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:43:55 GMT)
Infecting Generative AI With Viruses [0.0] 本研究では、JPEG画像内に埋め込まれたEICARテストファイルを用いて、ビジョンラージ言語モデル(VLM/LLM)のセキュリティ境界をテストする新しい手法を示す。
OpenAI GPT-4o, Microsoft Copilot, Google Gemini 1.5 Pro, Anthropic Claude 3.5 Sonnet など,複数の LLM プラットフォームにまたがる4つのプロトコルをうまく実行しました。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:27:29 GMT)
Improving the U-Net Configuration for Automated Delineation of Head and Neck Cancer on MRI [0.0] MRIにおける腫瘍体積のセグメンテーションは困難で時間を要するプロセスである。
本研究は,頭部および頸部腫瘍のMRI画像における自動デライン化へのアプローチを示す。
本研究の目的は,医学的セグメンテーションタスクで一般的に使用される構成の改善を提案することである。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:22:35 GMT)
Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence [0.0] 既存の変更検出アプローチには3つの大きな制限がある。
本稿では,変化検出精度を向上させるために,学習中の変化対応を利用した新しい手法を提案する。
また、推定ホモグラフィーとハンガリーのアルゴリズムを用いて検出された変化のペア間の対応を予測した最初の人物である。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 20:02:10 GMT)
Implementation of phase gates using single photons [0.0] 量子フーリエ変換を用いた量子計算アルゴリズムは、位相シフトゲートの繰り返しの使用を必要とする。
動作に光子を用いる量子ビットの場合、このゲートは回折限界に近づいた単一光子ビームを用いて実装することができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:38:34 GMT)
Impact of Bivariate Gaussian Potentials on Quantum Walks for Spatial Search [0.0] 空間探索問題における量子ウォークの力学に及ぼすバイアス障害電位の影響について検討する。
量子ウォークは標準偏差が小さいときにAKRアルゴリズムを密接に反映するが、標準偏差が増加するにつれて成功確率が急速に低下することを示す。
これらの知見は、量子ウォーク探索アルゴリズムの堅牢性を理解し、量子ウォークを最適化アルゴリズムに適用する方法に関する洞察を与えるのに寄与する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:54:11 GMT)
HipyrNet: Hypernet-Guided Feature Pyramid network for mixed-exposure correction [0.0] HipyrNetは、ラプラシアピラミッドベースのフレームワークにHyperNetworkを統合する新しいアプローチである。
提案手法は、混合露光画像強調のための新しいベンチマークを設定し、適応画像翻訳における将来の研究の道を開く。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:33:46 GMT)
Harmonizing Metadata of Language Resources for Enhanced Querying and Accessibility [0.0] 本稿では,言語資源の多種多様なリポジトリ(LR)からのメタデータの調和について述べる。
我々の手法は,新たに開発されたポータルであるLinghubを通じて,テキストベースの検索,ファステッドブラウジング,高度なSPARQLクエリをサポートする。
この研究は、メタデータの調和を高めるために、重要なメタデータの問題とオープンな語彙と標準に固執することを提唱する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:48:43 GMT)
Geometry Restoration and Dewarping of Camera-Captured Document Images [0.0] 本研究では,カメラが捉えた紙文書のデジタル画像のトポロジを復元する手法の開発に焦点をあてる。
本手法では,文書アウトライン検出に深層学習(DL)を用い,次いでコンピュータビジョン(CV)を用いてトポロジカル2Dグリッドを作成する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:31:29 GMT)
Generalized Extended Uncertainty Principles, Liouville theorem and density of states: Snyder-de Sitter and Yang models [0.0] 量子力学的位相空間の修正は、ハイゼンベルクの不確実性原理の変化につながる。
GUPとEUPの組み合わせは、これらの修正を座標とモータの両方に非可換性を導入することで一般化する。
本稿では,非相対論的量子力学フレームワークの古典的極限内における状態の密度と統計物理学におけるリウヴィル定理の類似性に対するGEUPの影響について検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 03:20:36 GMT)
GLaM-Sign: Greek Language Multimodal Lip Reading with Integrated Sign Language Accessibility [0.0] このデータセットは、ブリッジング通信ギャップにおけるマルチモーダルリソースの変換可能性を強調する。
これはアクセシビリティとマルチモーダルAIにおいて画期的なリソースであり、Deaf and Hard-of-Hearing(DHH)個人をサポートするように設計されている。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 13:06:47 GMT)
Exploring the Potential Role of Generative AI in the TRAPD Procedure for Survey Translation [0.0] 本稿では、生成型AIが調査機器の翻訳にどう役立つかを探索し、評価する。
我々は、ChatGPTを用いたゼロショットプロンプト実験を実施し、生成的AIの言語的聴衆への翻訳が困難である可能性のある質問の特徴を識別する能力を探究する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 21:46:55 GMT)
Exploring Large Language Models for Translating Romanian Computational Problems into English [0.0] 本研究では,ロバストな大規模言語モデル(LLM)が,十分に構造化されたプロンプトを与えられた場合,あまり一般的でない言語を翻訳する際に,その性能を維持あるいは向上できることを示す。
OpenRoLLM, Llama 3.1 8B, Llama 3.2 3B, GPT-4o など, 複数の LLM の翻訳手法について検討した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:17:44 GMT)
Explainable AI based System for Supply Air Temperature Forecast [0.0] 本稿では,エアハンドリングユニット(AHU)の自動給気温度(ASAT)制御における予測モデルの透明性と理解を向上させるために,説明可能なAI(XAI)技術の適用について検討する。
本研究はXAI手法の1つを用いている: シェープ値(Shapley values)は、各特徴の推論を明らかにし、最終的なASAT予測への寄与を明らかにする。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:36:29 GMT)
Exosense: A Vision-Based Scene Understanding System For Exoskeletons [0.0] 本稿では,自己バランス型外骨格のための視覚中心のシーン理解システムであるExosenseを紹介する。
実際の屋内シナリオでは、人間の脚に装着したExosenseとWandercraftのPersonal Exoskeletonをテストしました。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:59:37 GMT)
Evaluation of uncertainty estimations for Gaussian process regression based machine learning interatomic potentials [0.0] モデル誤差の定量化には機械学習原子間ポテンシャル(MLIP)の不確実性推定が不可欠である。
予測的GPR標準偏差やアンサンブルに基づく不確実性を含む,GPRに基づくMLIPの不確実性の評価を行った。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:11:34 GMT)
Evaluating Developer-written Unit Test Case Reduction for Java -- A Replication Study [0.0] 本研究では, 還元過程, 還元出力, 除去実体について検討する。
Javaの単体テストでは、異なるテストケース削減ツールであるReduJavatorを使ってその結果を再現します。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:10:59 GMT)
Entropy flow in a parametric amplifier [0.0] エネルギーと光子数はゼロではないにもかかわらず、出力エントロピーフラックスは大きな時間で消滅する。
これは、パンプがその初期状態に関する情報を解放すると予想される方法と一致している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:44:40 GMT)
Enhancing Plagiarism Detection in Marathi with a Weighted Ensemble of TF-IDF and BERT Embeddings for Low-Resource Language Processing [0.0] 低リソース言語に適した堅牢な盗作検知システムを設計することが重要である。
本稿では,マラタイ文字の盗作検出精度を高める手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 14:14:18 GMT)
Enhancing Human-Like Responses in Large Language Models [0.0] 我々は、AIシステムにおける自然言語理解、会話のコヒーレンス、感情的知性を高める技術に焦点を当てている。
この研究は、多様なデータセットによる微調整、心理学的原則の取り入れ、人間の推論パターンをよりよく模倣するモデルの設計など、さまざまなアプローチを評価している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 07:44:06 GMT)
Enhanced Quantile Regression with Spiking Neural Networks for Long-Term System Health Prognostics [0.0] 本稿では,拡張量子回帰ニューラルネットワーク(EQRNN)を中心に,新しい予測保守フレームワークを提案する。
先進的なニューラルネットワークを組み合わせたハイブリッドアプローチによる早期障害検出の課題に対処する。
計算効率を維持しながら複雑なマルチモーダルセンサーデータを処理する上でのこのフレームワークの有効性は、産業用4.0の製造環境への適用性を検証する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:11:40 GMT)
Emergent weight morphologies in deep neural networks [0.0] 深層ニューラルネットワークのトレーニングは、トレーニングデータとは無関係に、創発的な重量形態を生じさせることを示す。
我々の研究は、ディープニューラルネットワークのトレーニングの出現を示し、ディープニューラルネットワークの達成可能なパフォーマンスに影響を与える。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:48:51 GMT)
Distributed Learning and Inference Systems: A Networking Perspective [0.0] 本研究は,DA-ITN(Data and Dynamics-Aware Inference and Training Networks)の新たなフレームワークを提案する。
DA-ITNの異なるコンポーネントとそれらの機能について検討し、関連する課題と研究領域を強調した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:48:29 GMT)
Disentangling Interacting Systems with Fermionic Gaussian Circuits: Application to Quantum Impurity Models [0.0] フェルミオンガウス状態の圧縮から得られる一元ゲートによる基底の変化を、様々なテンソルネットワークに対応する量子回路に導入する。
これらの回路は、基底状態の絡み合いエントロピーを低減し、密度行列再正規化群のようなアルゴリズムの性能を向上させることができる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:22:21 GMT)
DisQ: A Model of Distributed Quantum Processors [0.0] 分散量子プロセッサの最初の形式モデルとしてDisqを提案する。
Disqは分散量子プログラミング言語である。
本研究では,量子アルゴリズムの等価性とその分散バージョンをチェックするためのシミュレーション関係を開発する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 00:57:21 GMT)
Design for light-based spherical aberration correction of ultrafast electron microscopes [0.0] 超高速電子顕微鏡の収差補正には, 電子クロスオーバー近傍での観測的相互作用が有効であることを示す。
電子-光相互作用のシミュレーションは、球面収差を補償できることを示し、その結果、収差自由角はSI8.1$となる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:27:21 GMT)
Datasheets for Healthcare AI: A Framework for Transparency and Bias Mitigation [0.0] トレーニングデータセットにおけるバイアス、データ不完全性、不正確性は、不公平な結果をもたらし、既存の格差を増幅する。
透明性を促進し,規制要件との整合性を確保するためのデータセットドキュメンテーションフレームワークを提案する。
この発見は、責任あるAI開発を促進する上で、データセットドキュメンテーションの重要性を強調している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:36:34 GMT)
Contextual Bandit Optimization with Pre-Trained Neural Networks [0.0] より小さなモデルの体制において、事前学習がいかに役立つかを検討する。
最後の層の次元と作用数$K$が水平線$T$よりもはるかに小さいとき、E2TCのサブ線形後悔を示す。
弱い訓練体制では、最後の層のみが学習されると、問題は不特定な線形バンディットへと減少する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:21:19 GMT)
Constraints as Rewards: Reinforcement Learning for Robots without Reward Functions [0.0] 強化学習は複雑なロボット行動を生成するための重要なアルゴリズムとなっている。
このような振る舞いを学習するには、タスクを記述する報酬関数を設計する必要がある。
本稿では,CaR(Constraints as Rewards)の概念を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:35:56 GMT)
Constrained Optimization of Charged Particle Tracking with Multi-Agent Reinforcement Learning [0.0] 画素化粒子検出器における粒子トラックの再構成に制約を課したマルチエージェント強化学習手法を提案する。
提案手法は,多次元代入問題に対して機能するパラメトリケートポリシを協調的に最適化する。
陽子イメージングのために開発された粒子検出器のために生成されたシミュレーションデータについて,複数の単一およびマルチエージェントベースラインと比較し,提案手法の有効性を実証的に示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:59:42 GMT)
Circuit Quantisation from First Principles [0.0] 我々は、BCS基底空間をフルフェルミオンヒルベルト空間の部分空間として導入する。
電子ハミルトニアンをこの部分空間に射影すると、接合、コンデンサ、インダクタの標準ハミルトニアン項が得られることを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:11:35 GMT)
Charge transport limited by nonlocal electron-phonon interaction. II. Numerically exact quantum dynamics in the slow-phonon regime [0.0] 断熱限界付近の1次元ピエルスモデルにおけるキャリア輸送について検討した。
過渡的局所化シナリオ (TLS) はHEOM力学を高温および強い相互作用において非常によく近似する。
この適度な状態における我々の発見はTLSの限界を示し、最も先進的な量子古典シミュレーションの結果を支持する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:25:12 GMT)
Charge transport limited by nonlocal electron-phonon interaction. I. Hierarchical equations of motion approach [0.0] 相関関数は階層的な運動方程式から得ることができることを示す。
一次元ピエルスモデルにおけるキャリアの数値的正確な運動量を計算する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 08:25:09 GMT)
Causal Machine Learning for Moderation Effects [0.0] 我々は,グループ平均治療効果(GATE)を測定する新しいパラメータBGATEを提案する。
主な推定戦略は、未確立の環境での個別処理のための二重/退化機械学習に基づいている。
本稿では,自動脱バイアス機械学習と特定の再重み付け手法の2つの方法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:13:29 GMT)
Broadband electron paramagnetic resonance spectroscopy of $^{167}$Er:$^{7}$LiYF$_4$ at mK temperatures [0.0] 希土類スピンアンサンブルは、マイクロ波量子メモリアプリケーションのための有望なプラットフォームである。
スピンハミルトニアンを零場スペクトルに合わせることにより、磁場非依存相互作用の洗練されたパラメータを得る。
また,極低磁場域の超微細分裂に及ぼす四重極相互作用の影響についても検討した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:40:39 GMT)
Bringing Order Amidst Chaos: On the Role of Artificial Intelligence in Secure Software Engineering [0.0] 進化を続ける技術的景観は、機会と脅威の両方を提供し、カオスと秩序が競合する動的な空間を作り出す。
セキュアなソフトウェアエンジニアリング(SSE)は、ソフトウェアシステムを危険にさらす脆弱性に継続的に対処しなければならない。
この論文は、AIの精度に影響を与えるドメイン固有の違いに対処することで、SSEのカオスに秩序をもたらすことを目指している。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 11:38:58 GMT)
Bridging the Early Science Gap with Artificial Intelligence: Evaluating Large Language Models as Tools for Early Childhood Science Education [0.0] 幼少期の科学教育は科学リテラシーの発展に不可欠である。
複雑な科学概念を年齢に合った内容に翻訳することは、教育者にとって依然として困難である。
本研究は,4つの主要なLarge Language Model (LLM) について,就学前に適した科学的説明を生成する能力について評価した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 12:33:13 GMT)
Boosting quantum annealing performance through direct polynomial unconstrained binary optimization [0.0] 多くの最適化問題は、高次の非制約二項最適化関数の観点からより自然に定式化されている。
PUBOの定式化により,必要量子ビット数の点でかなりの節約が期待できることを示す。
以上の結果から, 量子アニールの資源効率とスイーピング速度を向上させるための有望な経路が示唆された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:58:23 GMT)
Boosting projective methods for quantum process and detector tomography [0.0] 本稿では,量子プロセスと検出器トモグラフィーの2つの方法を紹介する。
量子プロセストモグラフィでは、量子チャネルの線形反転推定を投影する解析手法を開発する。
第2の方法は、このアプローチを量子検出器トモグラフィーに拡張し、優れた効率性を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 09:22:25 GMT)
Are AI Detectors Good Enough? A Survey on Quality of Datasets With Machine-Generated Texts [0.0] AIフラグメントを備えた膨大な数の検出器とコレクションが出現し、いくつかの検出方法は認識品質を99.9%まで向上させた。
検出器は実際に非常に信頼性が高いのか、あるいは評価データセットの質が低いことから高いベンチマークスコアを得るのか?
本稿では,AI生成コンテンツ検出専用のコンペからのデータセットを体系的にレビューし,AI生成フラグメントを含むデータセットの品質を評価する手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:00:02 GMT)
Approaching the Quantum Speed Limit in Quantum Gates with Geometric Control [0.0] この幾何学的枠組みを任意の次元の量子ユニタリ作用素に拡張する。
本稿では,一元駆動の量子速度限界に近づくための幾何学的原理に基づく最適制御手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 15:57:28 GMT)
Analytical control of the exchange interaction in periodically driven Mott insulators [0.0] 時間反転はベッセル零点の観点から解析的に決定される。
半充填ハバードモデルと多軌道モデル、北エフ・ハイゼンベルクモデルの諸特性、キラルスピン項の出現について論じる。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:18:41 GMT)
An inconsistency in the CHSH inequality [0.0] CHSHの不等式の違反は、量子力学と局所的で現実的な隠れ変数理論の間の不可逆的な衝突を示すと考えられている。
我々は、CHSH不等式を証明する数学的仮定が、実際、そのような不等式をテストする実験の物理学とは相容れないことを示した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:38:22 GMT)
An Efficient Key Expansion Method Applied to Security Credential Management System [0.0] アメリカ運輸省はIEEE 1609シリーズを採用し、米国におけるコネクテッドカーの標準となるセキュリティ認証管理システム(SCMS)を構築した。
SCMSのバタフライキー拡張(BKE)法は、連結車のプライバシー向上のための証明書を提供するように設計されている。
本研究は,鍵展開手法を考案し,暗号化/復号化の実現可能性,車両のプライバシー,方法の効率性を証明する数学的原理を提案する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 23:59:46 GMT)
An Efficient Algorithm for Modulus Operation and Its Hardware Implementation in Prime Number Calculation [0.0] 提案アルゴリズムは加算演算,減算演算,論理演算,ビットシフト演算のみを用いる。
暗号化アプリケーションにおけるスケーラビリティの課題に対処する。
このアルゴリズムを50,000までの素数計算に適用すると、実用性と性能上の利点が示される。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 06:20:42 GMT)
Against Bell's Theorem [0.0] ベルの定理は、量子力学と局所的で現実的な隠れ変数理論の間の矛盾を証明していると考えられている。
本稿ではベルの定理を証明しようとするすべての実験がこの目標を達成できないことを示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:45:45 GMT)
Advancing Personalized Learning Analysis via an Innovative Domain Knowledge Informed Attention-based Knowledge Tracing Method [0.0] 本稿では,カリキュラムに知識概念経路のドメイン知識を効果的に取り入れた,革新的な注意に基づく手法を提案する。
我々はXES3G5Mデータセットを用いて提案手法の性能を7つの最先端ディープラーニングモデルと比較した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:41:50 GMT)
Active Inference for Self-Organizing Multi-LLM Systems: A Bayesian Thermodynamic Approach to Adaptation [0.0] 本稿では,大規模言語モデル(LLM)とアクティブ推論を統合し,適応型言語エージェントを作成するための新しいアプローチを提案する。
本フレームワークは,3つの状態要因(確率,探索,情報状態)を用いて環境をモデル化する。
実験により、エージェントが環境力学の正確なモデルを開発することにより、このアプローチの有効性が示された。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 22:46:26 GMT)
A survey of textual cyber abuse detection using cutting-edge language models and large language models [0.0] ソーシャルメディアで広く普及している様々な乱用形態を包括的に分析する。
我々は,言語モデル (LM) や大規模言語モデル (LLM) といった新興技術が,乱用コンテンツの検出と生成を両立させていることに注目した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:55:50 GMT)
A simple model for entangled photon generation in resonant structures [0.0] 共振構造における自発的なダウンコンバージョンを記述するモデルを提案する。
光子対を生成するのに必要な計算を単純化することにより、我々のモデルは複雑な共振構造を設計しやすくすることを約束する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 19:00:08 GMT)
A learning agent-based approach to the characterization of open quantum systems [0.0] 我々は,オープンな量子モデル学習エージェント (oQMLA) フレームワークを導入し,Louvillianフォーマリズムによるマルコフ雑音を考慮した。
ハミルトン作用素とジャンプ作用素を同時に学習することにより、oQMLAは独立に系のコヒーレント力学と非コヒーレント力学の両方を捉える。
複雑化のシミュレーションシナリオにおける本実装の有効性を検証し,ハードウェアによる測定誤差に対するロバスト性を示す。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 16:25:17 GMT)
A Systematic Literature Review on Deep Learning-based Depth Estimation in Computer Vision [0.0] 深度推定(DE)は、シーンに関する空間情報を提供し、3次元再構成、オブジェクト検出、シーン理解などのタスクを可能にする。
DEのためのDLモデルは、入力データから関連する特徴を自動的に抽出し、様々なシーン条件に適応し、目に見えない環境によく一般化することができる。
DEに関する以前のレビューは、Deを包括的にレビューするのではなく、主に単分子またはステレオベースのテクニックに焦点を当ててきた。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:56:50 GMT)
A Survey of Interactive Verifiable Computing: Utilizing Low-degree Polynomials [0.0] この調査は、その進化を複雑性理論から現代のゼロ知識の知識の非対話的議論へと遡る。
我々は,対話型証明システム,知識,低次誤り検出・検証プロトコルの適用における重要な発展について検討する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 18:42:47 GMT)
A Portable Solution for Simultaneous Human Movement and Mobile EEG Acquisition: Readiness Potentials for Basketball Free-throw Shooting [0.0] 本稿では,人間の姿勢と脳波を同時に捉えるために,2つのスマートフォンで構成されるポケットセットを提案する。
我々は26人のバスケットボール選手にそれぞれ120のフリースローを放つように頼んだ。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 17:00:53 GMT)
A Machine Learning Model for Crowd Density Classification in Hajj Video Frames [0.0] 本研究では,群集密度を中程度群集,過密群集,高密度群集の3段階に分類する機械学習モデルを提案する。
KAU-Smart Crowd 'HAJJv2'データセットでテストされた。
このモデルは精度が87%で、2.14%の誤差率(誤分類率)を達成した。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 01:58:14 GMT)
A Framework for Devising, Evaluating and Fine-tuning Indoor Tracking Algorithms [0.0] そこで我々はMobiXIMというトラッキングアルゴリズムの開発,評価,微調整を行うフレームワークを提案する。
トラッキングアルゴリズムを開発するため、MobiXIMは新しいプラグインアーキテクチャを導入し、研究者は既存のアルゴリズムを協調して拡張することができる。
提案手法は,ベースラインのペデストリアンデッドレコニングアルゴリズムと比較して最大33%向上した4mの位置決め精度を実現する。
論文参考訳(メタデータ) (Thu, 09 Jan 2025 10:32:41 GMT)