Fugu-MT: arxivの論文翻訳(概要)

Visual Sketchpad: Sketching as a Visual Chain of Thought for Multimodal Language Models [140.0]
Sketchpadは、マルチモーダルLMにビジュアルスケッチパッドとスケッチパッドに描画するツールを提供するフレームワークである。 LMは、人間のスケッチに近い線、ボックス、マークなどを使って絵を描くことができ、推論をより容易にすることができる。 Sketchpadは、スケッチなしで強力なベースモデルよりも、すべてのタスクのパフォーマンスを大幅に改善する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:09:56 GMT)
Pixel Distillation: A New Knowledge Distillation Scheme for Low-Resolution Image Recognition [124.8]
アーキテクチャ制約を同時に破りながら知識蒸留を入力レベルまで拡張するPixel Distillationを提案する。このようなスキームは、ネットワークアーキテクチャと画像品質の両方をリソースの全体的な要求に応じて調整できるため、展開のための柔軟なコスト制御を実現することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:49:41 GMT)
VEnhancer: Generative Space-Time Enhancement for Video Generation [123.4]
VEnhancerは、空間領域に詳細を追加し、時間領域に詳細を合成することにより、既存のテキスト・ビデオの結果を改善する。我々は、低フレームレートおよび低解像度ビデオの条件として、ビデオ制御ネットをトレーニングし、拡散モデルに注入する。 VEnhancerは、AI生成ビデオの強化において、既存の最先端のビデオ超解像と時空超解像を超越している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:46:08 GMT)
Entropy Law: The Story Behind Data Compression and LLM Performance [115.7]
モデル性能はトレーニングデータの圧縮比と負の相関関係にあり,トレーニング損失が小さくなるのが普通である。エントロピー法則の知見に基づいて, 極めて効率的で普遍的なデータ選択法を提案する。また,モデルトレーニング開始時の潜在的な性能リスクを検出するエントロピー法則の興味深い応用を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:55:29 GMT)
PaliGemma: A versatile 3B VLM for transfer [112.4]
PaliGemmaはオープンビジョン言語モデル(VLM)であり、SigLIP-So400mビジョンエンコーダとGemma-2B言語モデルに基づいている。我々は、標準的なVLMベンチマークを含む約40のタスクに対して、PaliGemmaを評価するとともに、リモートセンシングやセグメンテーションといった専門的なタスクも評価する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:57:46 GMT)
Learning Spatial-Semantic Features for Robust Video Object Segmentation [108.0]
空間意味的特徴と識別的オブジェクトクエリを備えたロバストなビデオオブジェクトセグメンテーションフレームワークを提案する。提案手法は,複数のデータセットに対して新しい最先端性能を設定できることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:36:00 GMT)
Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation [106.4]
本稿では,ビデオ中の異常検出のための非常に高速なフレームレベルモデルを提案する。複数の高精度なオブジェクトレベルの教師モデルから知識を抽出することで、異常を検出することを学ぶ。提案モデルでは,これまで聞こえなかった1480 FPSの速度のため,速度と精度の最良のトレードオフを実現している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:16:46 GMT)
MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations [105.1]
MMLongBench-Doc は 1,062 のエキスパート注釈付き質問を含む長文マルチモーダルベンチマークである。 130の長いPDFフォーマットの文書の上に構築されており、平均49.4ページと20,971のテキストトークンがある。 14個のLVLMの実験により、長いコンテキストのDUが現在のモデルに大きく挑戦することを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:31:09 GMT)
Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.7]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:15:24 GMT)
Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents [101.2]
GovSimは、大規模言語モデル(LLM)における戦略的相互作用と協調的意思決定を研究するために設計された生成シミュレーションプラットフォームである。最強のLSMエージェントを除く全てのエージェントは、GovSimの持続的均衡を達成することができず、生存率は54%以下である。道徳的思考の理論である「大学化」に基づく推論を活用するエージェントは、持続可能性を大幅に向上できることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:34:06 GMT)
Chain-of-Dictionary Prompting Elicits Translation in Large Language Models [100.5]
大規模言語モデル(LLM)は多言語ニューラルマシン翻訳(MNMT)において驚くほど優れた性能を示した入力単語のサブセットに対する多言語辞書の連鎖による事前知識でLLMを拡張して翻訳能力を引き出す新しい方法であるCoDを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:53:59 GMT)
How to Make Cross Encoder a Good Teacher for Efficient Image-Text Retrieval? [99.9]
クロスエンコーダのクロスモーダル類似度スコア分布は、二重エンコーダの結果がほぼ正常である間により集中する。強陰性間の相対的な順序だけが有効な知識を伝達する一方、容易な負性間の順序情報はほとんど意味を持たない。本研究では, コントラスト学習を用いて, 硬質負試料間の相対的な順序を模倣することを目的とした, コントラスト部分式蒸留法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:10:01 GMT)
Systematic Evaluation of Neural Retrieval Models on the Touché 2020 Argument Retrieval Subset of BEIR [99.1]
我々は、ニューラル検索モデルの潜在的な限界を探るため、Touch'e 2020データの研究を行っている。私たちのブラックボックス評価は、短いパスを取得するためのニューラルネットワークの固有のバイアスを明らかにします。 Touch'eの短いパスの多くは議論の余地がなく、したがって関連性がないので、非常に短いパスを除外してTouch'e 2020のデータに注目する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:07:51 GMT)
EA-VTR: Event-Aware Video-Text Retrieval [97.3]
Event-Aware Video-Text Retrievalモデルは、優れたビデオイベント認識を通じて、強力なビデオテキスト検索能力を実現する。 EA-VTRはフレームレベルとビデオレベルの視覚表現を同時にエンコードすることができ、詳細なイベント内容と複雑なイベントの時間的相互アライメントを可能にする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:09:58 GMT)
Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs [95.8]
モビリティVLAは、環境理解と長文VLMの常識推論能力を組み合わせた、階層的なビジョン・ランゲージ・アクション(VLA)ナビゲーションポリシーである。従来未解決であったマルチモーダル命令に対して,モビリティVLAはエンドツーエンドの成功率が高いことを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:49:07 GMT)
Image Fusion via Vision-Language Model [91.4]
VIsion-Language Model (FILM)による画像融合という新しい融合パラダイムを導入する。 FILMは画像からセマンティックプロンプトを生成し、それらをChatGPTに入力し、包括的なテキスト記述を行う。これらの記述はテキスト領域内で融合され、視覚情報融合を導く。 FILMは、赤外線可視、医療、マルチ露光、マルチフォーカス画像融合の4つの画像融合タスクにおいて有望な結果を示している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:30:21 GMT)
Agent Lumos: Unified and Modular Training for Open-Source Language Agents [89.8]
LUMOSは、オープンソースのLLMベースのエージェントをトレーニングするための最初のフレームワークの1つです。 LUMOSは、高レベルなサブゴール生成を学習する計画モジュールを備えた、学習可能で統一されたモジュラーアーキテクチャを備えている。我々は、多様な地道理理性から導かれた大規模で統一的で高品質なトレーニングアノテーションを収集する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:36:02 GMT)
OV-DINO: Unified Open-Vocabulary Detection with Language-Aware Selective Fusion [88.6]
我々はOV-DINOと呼ばれる新しいオープン語彙検出手法を提案する。統一されたフレームワークで言語対応の選択的融合を伴う、さまざまな大規模データセットを事前トレーニングする。我々は,提案するOV-DINOの性能を,人気のあるオープン語彙検出ベンチマークデータセットで評価した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:05:49 GMT)
MAP-Neo: Highly Capable and Transparent Bilingual Large Language Model Series [86.3]
私たちはMAP-Neoをオープンソースにしました。これは、4.5Tの高品質トークン上で、スクラッチからトレーニングされた7Bパラメータを持つバイリンガル言語モデルです。 MAP-Neo は,既存の最先端 LLM と比較して性能が劣る初の完全オープンソースバイリンガル LLM である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:55:47 GMT)
A Survey of Large Language Models in Medicine: Progress, Application, and Challenge [85.1]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:10:32 GMT)
PromptFusion: Decoupling Stability and Plasticity for Continual Learning [83.7]
本稿では,プロンプトフュージョン(PromptFusion)と呼ばれるプロンプトチューニングによる安定性と塑性の疎結合を実現する手法を提案する。特にPromptFusionは、破滅的な忘れ物を扱う慎重に設計されたスタブモジュールと、新しい知識を同時に学習するためのブーモジュールで構成されている。 PromptFusionとPromptFusion-Liteはどちらも、クラスインクリメンタルとドメインインクリメンタル設定のための一般的な継続的学習データセットにおいて、有望な結果を達成することを示す実験である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:23:20 GMT)
Using Natural Language Explanations to Rescale Human Judgments [81.7]
大規模言語モデル(LLM)を用いて順序付けアノテーションと説明を再スケールする手法を提案する。我々は、アノテータのLikert評価とそれに対応する説明をLLMに入力し、スコア付けルーリックに固定された数値スコアを生成する。提案手法は,合意に影響を及ぼさずに生の判断を再スケールし,そのスコアを同一のスコア付けルーリックに接する人間の判断に近づける。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:03:44 GMT)
Rigorous Probabilistic Guarantees for Robust Counterfactual Explanations [80.9]
モデルシフトに対する反ファクトの堅牢性を計算することはNP完全であることを示す。本稿では,頑健性の厳密な推定を高い保証で実現する新しい確率論的手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:13:11 GMT)
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。 IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:57:21 GMT)
Fuse, Reason and Verify: Geometry Problem Solving with Parsed Clauses from Diagram [78.8]
平面幾何学的問題解法 (PGPS) のニューラルネットワークモデルを提案し, モーダル融合, 推論過程, 知識検証の3つの重要なステップについて述べる。推論のために、幾何学的推論過程を記述するための説明可能な解プログラムを設計し、自己限定デコーダを用いて解プログラムを自動回帰的に生成する。また, PGPS9Kと呼ばれる大規模幾何学的問題データセットを構築し, テキスト節, 解法プログラム, 関連知識解決器の詳細なアノテーションを含む。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:45:22 GMT)
A Survey of Attacks on Large Vision-Language Models: Resources, Advances, and Future Trends [78.3]
LVLM(Large Vision-Language Models)は、多モーダルな理解と推論タスクにまたがる顕著な能力を示す。 LVLMの脆弱性は比較的過小評価されており、日々の使用において潜在的なセキュリティリスクを生じさせる。本稿では,既存のLVLM攻撃の様々な形態について概説する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:57:58 GMT)
Eliminating Warping Shakes for Unsupervised Online Video Stitching [78.0]
我々は、ビデオ縫合まで画像縫合を延ばす際に、ワープシェイクと呼ばれる新しい問題にビデオ縫合を向けた。統合された教師なし学習フレームワークにおいて,ビデオステッチとビデオ安定化を同時に実現するためのStabStitchを提案する。既存の縫合法と比較して、StabStitchは縫合性能と安定化性能に加えて、シーンの堅牢性と推論速度に大きな優位性を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:05:54 GMT)
Dynamical Measure Transport and Neural PDE Solvers for Sampling [77.4]
本研究では, 対象物へのトラクタブル密度関数の移動として, 確率密度からサンプリングする作業に取り組む。物理インフォームドニューラルネットワーク(PINN)を用いて各偏微分方程式(PDE)の解を近似する。 PINNはシミュレーションと離散化のない最適化を可能にし、非常に効率的に訓練することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:39:50 GMT)
Chat-Edit-3D: Interactive 3D Scene Editing via Text Prompts [76.7]
CE3Dと呼ばれる対話型3Dシーン編集手法を提案する。 Hash-Atlasは3Dシーンビューを表し、3Dシーンの編集を2Dアトラスイメージに転送する。その結果、CE3Dは複数の視覚モデルを効果的に統合し、多様な視覚効果が得られることを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:27:07 GMT)
SIP: Injecting a Structural Inductive Bias into a Seq2Seq Model by Simulation [75.1]
本稿では, 構造的帰納バイアスをセック2セックモデルに効率よく注入し, 合成データの構造的変換をシミュレートする方法について述べる。実験の結果,本手法は所望の帰納バイアスを付与し,FSTのようなタスクに対してより優れた数発学習を実現することがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:09:58 GMT)
Controllable Navigation Instruction Generation with Chain of Thought Prompting [74.3]
本稿では,C-インストラクタを提案する。C-インストラクタは,スタイル制御およびコンテンツ制御可能な命令生成のために,チェーン・オブ・シンクタスタイルのプロンプトを利用する。 C-インストラクタは生成した命令をより追従しやすくし、ランドマークオブジェクトの操作に対する制御性を高める。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:37:20 GMT)
Prompting Language-Informed Distribution for Compositional Zero-Shot Learning [73.5]
合成ゼロショット学習(CZSL)タスクは、目に見えない合成視覚概念を認識することを目的としている。本稿では,タスクに対して言語インフォームド分布(PLID)を指示するモデルを提案する。 MIT-States、UT-Zappos、C-GQAデータセットの実験結果は、PLIDの先行技術よりも優れた性能を示している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:54:11 GMT)
Rel-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance [73.2]
依存は世代間の相互作用の文脈における多くの要因に影響される。本稿では,信頼度を測定するためのシステムレベルの評価手法であるRel-A.I.を紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:00:05 GMT)
LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models [70.3]
LMMにおけるマルチイメージ、マルチフレーム(ビデオ)、マルチビュー(3D)、マルチパッチ(シングルイメージ)シナリオを同時に扱うLLaVA-NeXT-Interleaveを紹介する。また,LMMのマルチイメージ性能を総合的に評価するために,LLaVA-Interleave Benchをキュレートする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:59:43 GMT)
FedGT: Identification of Malicious Clients in Federated Learning with Secure Aggregation [69.8]
FedGTは、フェデレーション学習における悪意のあるクライアントを安全なアグリゲーションで識別するための新しいフレームワークである。我々はPillutlaらによって最近提案された幾何的中央値に基づいて,FedGTがプライベートロバストアグリゲーションアプローチを著しく上回っていることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:10:17 GMT)
Multi-branch Collaborative Learning Network for 3D Visual Grounding [66.7]
3D参照表現理解(3DREC)とセグメンテーション(3DRES)は重なり合う目標を持ち、コラボレーションの可能性を示している。我々は,3DRECタスクと3DRESタスクに個別のブランチを採用することで,各タスクの特定の情報を学ぶ能力が向上すると主張している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:31:50 GMT)
Disentangled Representation Learning through Geometry Preservation with the Gromov-Monge Gap [65.7]
不整合表現を教師なしで学習することは、機械学習における根本的な課題である。本稿では,2次最適輸送に基づく不整合表現学習の新たな視点を提案する。また, 幾何保存は, 標準的な再構成目的を伴わずとも, 教師なしの絡み合いを助長できることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:51:32 GMT)
Knowledge Overshadowing Causes Amalgamated Hallucination in Large Language Models [65.3]
「我々はこの現象を知識の誇張として造る。」その結果, 幻覚率の増大は, 不均衡比と支配的条件記述の長さに左右されることがわかった。本稿では,その発生前に幻覚をキャッチするための信号として,オーバーシェーディング条件を用いることを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:37:42 GMT)
Multi-modal Crowd Counting via a Broker Modality [64.5]
マルチモーダルな群衆カウントは、視覚画像と熱/深度画像の両方から群衆密度を推定する。本稿では,補助的ブローカーのモダリティを導入し,そのタスクを3つのモーダル学習問題とする新しい手法を提案する。我々はこのブローカーのモダリティを生成するための融合法を考案し、近代的な拡散に基づく核融合モデルの非拡散的軽量化を生かした。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:13:11 GMT)
Hybrid Structure-from-Motion and Camera Relocalization for Enhanced Egocentric Localization [64.1]
VQ3Dタスクのカメラポーズ推定部を改善するためのモデルアンサンブル戦略を提案する。中心となるアイデアは、egocentric videoのSfMだけでなく、既存の3Dスキャンと2Dビデオフレームの2D-3Dマッチングも行うことだ。本手法は,最も重要な指標である総合的な成功率に関して,最高の性能を達成する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:01:35 GMT)
SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning [63.9]
本稿では,リソース制限シナリオに対するSHERLと呼ばれる革新的なMETL戦略を提案する。初期経路では、中間出力は反冗長動作によって統合される。遅延ルートでは、最小限の遅延事前トレーニングされたレイヤを利用することで、メモリオーバーヘッドのピーク需要を軽減できる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:22:35 GMT)
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models [62.9]
大規模言語モデル(LLM)は、現代の自然言語処理や人工知能に不可欠なものである。 LLMを圧縮する新しい量子化手法であるEfficientQAT(Efficient Quantization-Aware Training)を提案する。広範囲な実験により、EfficientQATは、様々なモデルで以前の量子化法より優れていることが示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:53:30 GMT)
Mitigating Bias in Dataset Distillation [62.8]
原データセット内のバイアスがデータセット蒸留の性能に及ぼす影響について検討した。カーネル密度推定を用いたサンプル再重み付け方式に基づく,単純かつ高効率な手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:58:14 GMT)
4D Contrastive Superflows are Dense 3D Representation Learners [62.4]
我々は,LiDARとカメラのペアを連続的に利用して事前学習の目的を確立するための,新しいフレームワークであるSuperFlowを紹介する。学習効率をさらに向上するため,カメラビューから抽出した知識の整合性を高めるプラグイン・アンド・プレイ・ビュー・一貫性モジュールを組み込んだ。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:32:28 GMT)
Coherent and Multi-modality Image Inpainting via Latent Space Optimization [62.0]
PILOT(intextbfPainting vtextbfIa textbfOptextbfTimization)は、新しいテキストセマンティック中央化とテキストセマンティック保存損失に基づく最適化手法である。本手法は,背景とのコヒーレンスを維持しつつ,ユーザが提供するプロンプトに対して高い忠実度を示す塗装領域を生成できる潜時空間を探索する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:58:04 GMT)
A Long Way to Go: Investigating Length Correlations in RLHF [59.5]
本稿では, 応答長の最適化がRLHFの重要な要因であることを示す。報酬の改善は、他の機能ではなく、レスポンス長の増加によって大きく引き起こされると思います。純粋に長さベースの報酬でさえ、教師付き微調整モデルよりも下流のRLHFの改善を再現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:15:49 GMT)
Attribute or Abstain: Large Language Models as Long Document Assistants [58.3]
そこで本研究では,属性を付加した6種類の長文書タスクのベンチマークと,4つの長文書に対する属性に対する異なるアプローチの実験を行う。反応生成と証拠抽出を一つのステップで行うと、ほとんどの場合、最も良い結果が得られます。また、単純な応答を持つデータセットで応答品質を予測できるエビデンスがあることもわかりましたが、複雑な応答には適していません。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:16:02 GMT)
Disentangling Masked Autoencoders for Unsupervised Domain Generalization [57.6]
教師なしの領域一般化は急速に注目されているが、まだ十分に研究されていない。 Disentangled Masked Auto (DisMAE) は、本質的な特徴を忠実に示す不整合表現を発見することを目的としている。 DisMAEは、セマンティックで軽量な変分エンコーダを備えた非対称なデュアルブランチアーキテクチャを共同で訓練する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:11:36 GMT)
Refine, Discriminate and Align: Stealing Encoders via Sample-Wise Prototypes and Multi-Relational Extraction [57.2]
RDAは、事前訓練されたエンコーダを盗むために、以前の取り組みで普及した2つの主要な欠陥に対処するために設計された先駆的なアプローチである。これは、サンプルの様々な視点に対してターゲットエンコーダの表現を統一するサンプルワイドプロトタイプによって達成される。より強力な有効性を得るために、我々はサロゲートエンコーダを訓練し、ミスマッチした埋め込み-プロトタイプペアを識別するマルチリレーショナル抽出損失を開発する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:27:54 GMT)
Data-driven Bayesian State Estimation with Compressed Measurement of Model-free Process using Semi-supervised Learning [57.0]
モデルフリープロセスの圧縮測定(BSCM)によるデータ駆動ベイズ状態の推定。時間的測定ベクトルの次元は、推定される時間的状態ベクトルの次元よりも低い。既存の2つの教師なし学習ベースのデータ駆動手法は、モデルフリープロセスのBSCM問題に対処できない。半教師付き学習に基づくDANSE手法を開発し,その手法をSemiDANSEと呼ぶ。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:03:48 GMT)
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking [56.9]
本研究は、応答スタイルをプレゼンテーションスタイルとコンポジションスタイルに分解する。 SCAR(Style Consistency-Aware Response Ranking)を紹介する。 SCARは、そのレスポンススタイリスティックな一貫性に基づいて、トレーニングセット内の命令-レスポンスペアを優先順位付けする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:22:10 GMT)
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis [56.8]
Diffusion Mamba (DiM) は高分解能画像合成のためのシーケンスモデルである。 DiMアーキテクチャは高解像度画像の推論時間効率を実現する。実験は、我々のDiMの有効性と効率を実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:02:11 GMT)
WildAvatar: Web-scale In-the-wild Video Dataset for 3D Avatar Creation [55.9]
WildAvatar(ワイルドアバター)は、YouTubeから抽出されたウェブスケールの人間のアバター生成データセットである。我々は,アバター作成における現実のアプリケーションにおける未探索課題を,データセット上でいくつかの最先端アバター作成手法を評価した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:20:39 GMT)
UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.7]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:04:58 GMT)
IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection [55.6]
Infrared Small Target Detection (IRSTD) タスクは、自然画像と赤外線画像の間に顕著な領域ギャップがあるため、満足度の高い性能を達成するには不十分である。 IRSTDのためのIRSAMモデルを提案する。これはSAMのエンコーダデコーダアーキテクチャを改善し、赤外線小物体の特徴表現をより良く学習する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:17:57 GMT)
MambaVision: A Hybrid Mamba-Transformer Vision Backbone [55.0]
本稿では,視覚応用に適した新しいハイブリッド型Mamba-TransformerバックボーンであるMambaVisionを提案する。私たちのコアコントリビューションには、視覚的特徴の効率的なモデリング能力を高めるために、Mambaの定式化を再設計することが含まれています。視覚変換器(ViT)とマンバの統合可能性に関する包括的アブレーション研究を行う。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:02:45 GMT)
Going beyond Compositions, DDPMs Can Produce Zero-Shot Interpolations [55.0]
Denoising Diffusion Probabilistic Models (DDPM) は画像生成において顕著な能力を示す。本研究では,データ分布の厳密な部分集合を学習したDDPMについて検討した。本研究では,そのようなモデルにより,探索されていない中間領域の画像を効果的に生成できることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:42:18 GMT)
Bridging Synthetic and Real Worlds for Pre-training Scene Text Detectors [54.8]
FreeRealは、SDと実際のデータの相補的な強みを可能にする、実際のドメイン整合型事前トレーニングパラダイムである。 GlyphMixは、合成画像を落書きのようなユニットとして実際の画像に埋め込む。 FreeRealは、4つの公開データセットで、既存の事前トレーニングメソッドよりも大幅にパフォーマンスが向上している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:49:37 GMT)
"Can You Play Anything Else?" Understanding Play Style Flexibility in League of Legends [54.6]
各プレイヤーの柔軟性を総合的柔軟性と時間的柔軟性の2つの尺度で計算する。以上の結果から,ユーザの柔軟性はユーザの好みのプレイスタイルに依存し,柔軟性は結果に一致することが示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:12:06 GMT)
Manipulating Feature Visualizations with Gradient Slingshots [54.3]
本稿では,モデルの決定過程に大きな影響を及ぼすことなく,特徴可視化(FV)を操作する新しい手法を提案する。ニューラルネットワークモデルにおける本手法の有効性を評価し,任意の選択したニューロンの機能を隠蔽する能力を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:08:08 GMT)
Measuring Meaning Composition in the Human Brain with Composition Scores from Large Language Models [53.8]
コンポジションスコアは、文理解中に意味合成の度合いを定量化するために設計された、新しいモデルに基づく計量である。実験結果から, 単語の頻度, 構造処理, 単語に対する一般感性に関連する脳クラスタとの関連が示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:49:40 GMT)
Recursive Visual Programming [53.8]
本稿では、生成ルーチンを単純化し、より効率的な問題解決を提供し、より複雑なデータ構造を管理するRecursive Visual Programming (RVP)を提案する。本稿では,VSR,COVR,GQA,NextQAなどのベンチマークにおいて,RVPの有効性を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:26:21 GMT)
IDA-VLM: Towards Movie Understanding via ID-Aware Large Vision-Language Model [52.7]
本稿では,複数の視覚シナリオにまたがるキャラクタ・アイデンティティ・メモリと認識の可能性について検討する。我々は,ID参照を用いた視覚的指導チューニングを提案し,ID対応大規模視覚言語モデル IDA-VLM を開発した。本研究は,4次元にわたるインスタンスIDのメモリと認識におけるLVLMの検証を行うための,新しいベンチマークMM-IDを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:11:59 GMT)
GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction [52.0]
単一視点からの3次元オブジェクト再構成のためのガウススプティング表現に基づく拡散モデル手法を提案する。モデルはGS楕円体の集合で表される3Dオブジェクトを生成することを学習する。最終的な再構成されたオブジェクトは、高品質な3D構造とテクスチャを持ち、任意のビューで効率的にレンダリングできる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:41:49 GMT)
PosFormer: Recognizing Complex Handwritten Mathematical Expression with Position Forest Transformer [51.3]
手書き数学的表現認識(HMER)は、人間と機械の相互作用シナリオに広く応用されている。本稿では,HMERのための位置フォレスト変換器(PosFormer)を提案する。 PosFormerは、最先端のメソッドである2.03%/1.22%/2、1.83%、および4.62%を一貫して上回っている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:42:58 GMT)
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [50.8]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。 TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:28:21 GMT)
Unlocking the Multi-modal Potential of CLIP for Generalized Category Discovery [50.6]
テキスト埋め込み合成器(TES)を提案する。提案手法は,CLIPのマルチモーダルポテンシャルを解放し,すべてのGCDベンチマークにおいて,ベースライン手法よりも大きなマージンで性能を向上する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:20:56 GMT)
3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes [50.4]
本研究は, 粒子のトレーシング, 境界体積階層の構築, 高性能なレイトレーシングハードウェアを用いた各画素のレイキャストについて考察する。半透明粒子の多量処理を効率的に行うために,有界メッシュで粒子をカプセル化するアルゴリズムについて述べる。実験は、我々のアプローチの速度と精度、およびコンピュータグラフィックスとビジョンにおけるいくつかの応用を実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:38:35 GMT)
Data is all you need: Finetuning LLMs for Chip Design via an Automated design-data augmentation framework [50.0]
本稿では,Verilog と EDA スクリプトに適合する高ボリュームかつ高品質な自然言語を生成する自動設計データ拡張フレームワークを提案する。 Verilog生成の精度は現在の最先端のオープンソースVerilog生成モデルを超え、同じベンチマークで58.8%から70.6%に増加した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:06:40 GMT)
CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Benchmarking on HumanEval-X [50.0]
コード生成に130億のパラメータを持つ多言語モデルであるCodeGeeXを紹介する。 CodeGeeXは、23のプログラミング言語の8500億のトークンで事前訓練されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:52:58 GMT)
Trial and Error: Exploration-Based Trajectory Optimization for LLM Agents [49.9]
本稿では,ETOと呼ばれる探索に基づく軌道最適化手法を提案する。この学習方法はオープンLLMエージェントの性能を向上させるために設計されている。 3つの複雑なタスクに関する実験は、ETOがベースライン性能をはるかに上回っていることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:36:25 GMT)
External Knowledge Enhanced 3D Scene Generation from Sketch [49.6]
本稿では,カスタマイズされた多種多様な3Dシーンを生成するためのスケッチベース知識拡張拡散アーキテクチャ(SEK)を提案する。まず、オブジェクト関係を含む外部知識ベースを構築し、その後、知識強化グラフ推論を利用して手書きスケッチの理解を支援する。 3D-FRONTデータセットの実験により、我々のモデルは、最も近い競合であるDiffuSceneと比較して、FID、CKLを17.41%改善し、3Dシーン生成で37.18%改善し、FIDを19.12%改善し、20.06%改善した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:01:39 GMT)
Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.4]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。 BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:00:54 GMT)
Pareto Low-Rank Adapters: Efficient Multi-Task Learning with Preferences [49.1]
PaLoRAは、タスク固有の低ランクアダプタでオリジナルのモデルを拡張する、新しいパラメータ効率の手法である。実験の結果,PaLoRAは様々なデータセットでMTLとPFLのベースラインを上回っていることがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:25:51 GMT)
PUMA: Efficient Continual Graph Learning for Node Classification with Graph Condensation [49.0]
既存のグラフ表現学習モデルは、新しいグラフを学習する際に破滅的な問題に遭遇する。本稿では,PUMA(PUdo-label guided Memory bAnkrogation)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:37:02 GMT)
WorldAPIs: The World Is Worth How Many APIs? A Thought Experiment [49.0]
本稿では, wikiHow 命令をエージェントの配置ポリシーに基礎付けることで, 新たな API を創出するフレームワークを提案する。大規模言語モデル (LLM) の具体化計画における近年の成功に触発されて, GPT-4 のステアリングを目的とした数発のプロンプトを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:52:44 GMT)
LitSearch: A Retrieval Benchmark for Scientific Literature Search [48.6]
我々は,最近のMLおよびNLP論文に関する597のリアルな文献検索クエリからなる検索ベンチマークLitSearchを紹介する。 LitSearchのすべての質問は、高品質を保証するために専門家によって手作業で検査または編集された。 BM25と最先端の高密度レトリバーの間には,24.8%の絶対リコール@5。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:00:03 GMT)
Same Task, More Tokens: the Impact of Input Length on the Reasoning Performance of Large Language Models [48.4]
本稿では,入力長がLarge Language Models(LLMs)の能力に与える影響について検討する。同一サンプルの複数バージョンを用いて入力長の影響を分離し,それぞれが異なる長さ,タイプ,位置のパディングで拡張した。劣化傾向はデータセットのすべてのバージョンに現れるが、強度は異なる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:01:37 GMT)
Spatial-Temporal Generative AI for Traffic Flow Estimation with Sparse Data of Connected Vehicles [48.3]
交通流推定(TFE)はインテリジェント交通システムにおいて重要である。本稿では,スパース時間生成人工知能(GAI)フレームワークを活用した,新規で費用対効果の高いTFEフレームワークを提案する。このフレームワーク内では、条件エンコーダは初期TFE結果の時空間相関をマイニングする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:26:04 GMT)
Resource Allocation for Twin Maintenance and Computing Task Processing in Digital Twin Vehicular Edge Computing Network [48.2]
車両エッジコンピューティング(VEC)は、車両の近くにVECサーバを配置することで、計算キャッシュサービスを提供する。しかしながら、VECネットワークは、ハイカーモビリティのような課題に直面している。本研究では,ネットワーク内のツイン処理による2種類の遅延について検討した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:08:39 GMT)
A Comprehensive Study of Multimodal Large Language Models for Image Quality Assessment [46.6]
MLLM(Multimodal Large Language Models)は、視覚的理解と推論において大きな進歩を経験している。画像品質評価(IQA)のための強力でフレキシブル、解釈可能、およびテキスト駆動モデルとして機能する可能性については、まだ明らかにされていない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:55:10 GMT)
Video In-context Learning [46.4]
本稿では,既存のビデオクリップからモデルが始まり,様々な将来的なシーケンスを生成するビデオインコンテキスト学習について検討する。これを実現するために、タスクを明確に定義し、ビデオデータセット上で自動回帰変換器を訓練する。客観的尺度と主観的尺度の両方を含む様々な評価指標を設計し、生成結果の視覚的品質と意味的精度を実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:27:06 GMT)
Weakly-supervised Medical Image Segmentation with Gaze Annotations [46.3]
人間の観察パターンを明らかにする視線は、視覚タスクのソリューションにますます取り入れられている。本稿では, 医用画像のセグメンテーションにおいて, 医用画像のセグメンテーションを集中的に管理する手法を提案する。本研究では,複数のネットワークを識別的人間の注意から訓練する多層フレームワークを提案する。医用セグメンテーションデータセットの拡張として,GazeMedSegと題する高品質な視線データセットをコントリビュートする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:07:58 GMT)
CaesarNeRF: Calibrated Semantic Representation for Few-shot Generalizable Neural Rendering [46.1]
CaesarNeRFは、数ショットで一般化可能なニューラルレンダリングを前進させるエンドツーエンドのアプローチである。 CaesarNeRFは様々な参照ビューにまたがって最先端のパフォーマンスを提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:41:39 GMT)
Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization [45.6]
本研究は、DPO(Direct Preference Optimization)のためのトレーニングデータセットにおけるノイズの課題に対処する。ノイズを低品質なデータポイントを含むポイントワイズノイズと、誤ったデータペアアソシエーションを含むペアワイズノイズに分類する。本稿では、最悪の場合のペアワイズシナリオに対して最適化することで、ペアワイズロバストネスを統合した分散ロバスト化DPOを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:48:25 GMT)
Flow to Rare Events: An Application of Normalizing Flow in Temporal Importance Sampling for Automated Vehicle Validation [45.3]
本稿では,危険事象の分布を表現し,生成し,再重み付けする手法を提案する。リスク指標関数を導入することにより、リスクのあるまれな事象の分布は、自然主義的な運転分布から理論的に推測される。その結果、希少な事象分布から背景車両の操作をサンプリングすることで、テストシナリオを危険状態へと進化させる可能性が示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:31:15 GMT)
Density Estimation via Binless Multidimensional Integration [45.2]
非パラメトリック、ロバスト、およびデータ効率の高い密度推定のためのBinless Multidimensional Thermodynamic Integration (BMTI)法を提案する。 BMTIは、近隣のデータポイント間の対数密度差を計算し、その密度の対数を推定する。この方法は様々な複雑な合成高次元データセットでテストされ、化学物理学の文献から現実的なデータセットでベンチマークされる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:45:20 GMT)
Phy-Diff: Physics-guided Hourglass Diffusion Model for Diffusion MRI Synthesis [45.1]
本稿では,高画質のdMRIを生成する物理誘導拡散モデルを提案する。本モデルは拡散過程におけるノイズ進化におけるdMRIの物理原理を紹介する。実験の結果,本手法は他の最先端手法よりも優れていた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:17:42 GMT)
Thermal masses and trapped-ion quantum spin models: a self-consistent approach to Yukawa-type interactions in the $λ\!φ^4$ model [45.0]
閉じ込められたイオン系における磁気の量子シミュレーションは、スピン間の相互相互作用を仲介するために結晶振動を利用する。これらの相互作用は、フォノンが粗粒のクライン=ゴードン場によって記述される長波長相対論的理論によって説明できる。レーザ冷却により制御できる熱効果は、相互作用するQFTにおける熱質量の出現を通じて、この流れを明らかにすることができることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:46:02 GMT)
NCoder -- A Quantum Field Theory approach to encoding data [45.0]
我々は、量子場理論(QFT)にインスパイアされたAIの解釈に新しいアプローチを提案し、これをNCoderと呼ぶ。 NCoderは、潜伏層が$n$-point相関関数のサブセットとして指定された修正されたオートエンコーダニューラルネットワークである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:34:37 GMT)
Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [45.0]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。 iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:17:23 GMT)
On Leakage of Code Generation Evaluation Datasets [44.5]
コード生成テストセットによる汚染について考察する。我々の発見の鍵は161のプロンプトと関連するピソン溶液のデータセットである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:50:20 GMT)
Adaptive Multi-head Contrastive Learning [44.2]
対照的な学習では、異なる拡張によって生成された元のイメージの2つのビューが正のペアと見なされる。単射影ヘッドによって提供される単一の類似度測定は、正と負のサンプル対を評価する。適応型マルチヘッドコントラスト学習(AMCL)は,いくつかの一般的なコントラスト学習手法に適用し,実験的に拡張することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:37:48 GMT)
Fusion of Short-term and Long-term Attention for Video Mirror Detection [44.1]
人間は、その外観に基づいて、わずか1つか2つのフレームからミラー候補を認識することができる。候補が本当にミラーであることを確実にするためには、グローバルな視点のためにもっと多くのフレームを観察する必要があります。この観察は、短期の注意モジュールから抽出した外観特徴と長期の注意モジュールから抽出した文脈情報を融合させることで、ミラーを検出する動機付けとなる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:04:52 GMT)
Learning In-Hand Translation Using Tactile Skin With Shear and Normal Force Sensing [43.3]
3次せん断力と2次正規力のゼロショット・シミュレートを可能にする触覚皮膚センサモデルを提案する。触覚センシングが様々な未確認オブジェクト特性へのポリシー適応をどのように促進するかを評価するために、広範囲な実世界の実験を行う。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:52:30 GMT)
Benchmarking digital quantum simulations above hundreds of qubits using quantum critical dynamics [42.3]
最大133キュービットの量子ハードウェアとエラー軽減手法をベンチマークする。最大2量子ゲート幅は28で、最大1396個の2量子ゲートを持つ。結果はハミルトンシミュレーション、変分アルゴリズム、最適化、量子機械学習などのアプリケーションに転送可能である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:58:42 GMT)
Online Video Quality Enhancement with Spatial-Temporal Look-up Tables [42.1]
ビデオ会議やクラウドゲームなど、オンラインビデオベースのアプリケーションでは、レイテンシの低さが不可欠だ。既存の品質向上手法は、速度の遅い推論速度と、将来のフレームに含まれる時間情報の要求によって制限される。本稿では,オンラインビデオ品質向上(Online-VQE)問題に対処するために,STLVQEを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:06:16 GMT)
SUMix: Mixup with Semantic and Uncertain Information [42.0]
混合データ拡張アプローチは、ディープラーニングの様々なタスクに応用されている。そこで我々は,SUMix という新しい手法を提案し,混合率と混合試料の不確かさを学習する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:25:26 GMT)
SmurfCat at PAN 2024 TextDetox: Alignment of Multilingual Transformers for Text Detoxification [41.9]
本稿では,SmurfCatチームのPAN-2024コンペティションにおける多言語テキストの解法を提案する。機械翻訳によるデータ拡張と特別なフィルタリング手法を用いて,テキストのデトックス化のための追加の多言語並列データセットを収集した。テキストデトキシフィケーションタスクにおいて,mT0 や Aya などの多言語列列列列モデルを微調整した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:44:18 GMT)
GLBench: A Comprehensive Benchmark for Graph with Large Language Models [41.9]
GLBenchは、教師付きシナリオとゼロショットシナリオの両方でGraphLLMメソッドを評価するための最初の包括的なベンチマークである。 GLBenchはグラフニューラルネットワークのような従来のベースラインとともに、GraphLLMメソッドのさまざまなカテゴリを公平かつ徹底的に評価する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:20:47 GMT)
Exploring the Untouched Sweeps for Conflict-Aware 3D Segmentation Pretraining [41.1]
LiDARカメラによる3D画像の事前学習は、3D知覚タスクと関連する応用に有意な可能性を示唆している。未探索フレームからLiDAR-画像ペアを精巧に選択するための,ビジョン・ファウンデーション・モデル駆動型サンプル探索モジュールを提案する。我々の手法は、既存の最先端の事前訓練フレームワークを3つの主要な公道走行データセットで一貫して上回っている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:46:29 GMT)
Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model [41.1]
大規模な抽象画像と視覚的推論命令を合成するために,大規模言語モデルとそのコード機能を利用したマルチモーダル自己インストラクトを設計する。我々のベンチマークは単純な線と幾何学的要素で構築されており、最も先進的なLMMの欠点を明らかにする。合成データの質を検証するため,62,476の合成チャート,表,道路地図の指示を用いてLMMを微調整する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:17:15 GMT)
Deep Reinforcement Learning for Sequential Combinatorial Auctions [40.9]
収益-最適オークションデザインは、重要な理論的および実践的な意味を持つ難しい問題である。本稿では,一階勾配を利用した逐次オークションに適した新しい強化学習フレームワークを提案する。提案手法は,分析ベースラインと標準強化学習アルゴリズムの両方に対して,収益の大幅な向上を実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:00:22 GMT)
Referring Atomic Video Action Recognition [40.9]
我々は、Referring Atomic Video Action Recognitionと呼ばれる新しいタスクを導入する。我々は、テキストで導かれる特定の個人の正しい原子活動を認識することに集中する。テキスト記述を手作業で記述した36,630のインスタンスを含むRefAVAデータセットを提示する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:52:05 GMT)
Vulnerability Detection with Code Language Models: How Far Are We? [40.5]
PrimeVulは、脆弱性検出のためのコードLMのトレーニングと評価のための新しいデータセットである。これは、人間の検証されたベンチマークに匹敵するラベルの精度を達成する、新しいデータラベリング技術を含んでいる。また、厳密なデータ重複解消戦略と時系列データ分割戦略を実装して、データの漏洩問題を軽減している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:26:17 GMT)
The GeometricKernels Package: Heat and Matérn Kernels for Geometric Learning on Manifolds, Meshes, and Graphs [40.4]
古典ユークリッド二乗指数(熱とも呼ばれる)とマタン核の幾何学的類似を実装するパッケージを提案する。我々の実装は、バックエンドに依存しない設計により、すべての主要な現行フレームワークにおける自動微分をサポートします。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:09:23 GMT)
Satellite Image Time Series Semantic Change Detection: Novel Architecture and Analysis of Domain Shift [39.0]
衛星画像時系列(SITS-SCD)を用いた意味変化検出の試み本稿では,技術状況を改善し,パラメータの数に応じて拡張し,長期的時間的情報を活用する新しいアーキテクチャを提案する。実用的なユースケースでは、モデルが空間的および時間的シフトに適応する必要があるが、これは依然として課題である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:54:51 GMT)
Pairwise Distance Distillation for Unsupervised Real-World Image Super-Resolution [38.8]
実世界の超解像(RWSR)は低分解能入力における未知の劣化に直面している。既存の手法では、学習インプットの複雑な合成拡張を通じて視覚一般モデルを学習することでこの問題にアプローチする。実世界の劣化に対する教師なしRWSRに対処するための,新しい相互距離蒸留フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:46:40 GMT)
Industrial-Grade Time-Dependent Counterfactual Root Cause Analysis through the Unanticipated Point of Incipient Failure: a Proof of Concept [38.3]
本稿では,産業時系列環境における根本原因解析診断手法の開発について述べる。これは、異常な振る舞いが最初に観察された時点である突発的障害点(Point of Incipient Failure)に注意を向ける。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:02:03 GMT)
CRAFT: Extracting and Tuning Cultural Instructions from the Wild [38.3]
本稿では,未構造化コーパスから高品質で文化的に関連のある命令チューニングデータセットを抽出するための新しいパイプラインを提案する。自己指示生成パイプラインを用いて、文化的概念を特定し、指導をトリガーする。シンガポール、フィリピン、アメリカという3つの地域で実験を行い、最大6%のパフォーマンス向上を実現しました。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:54:23 GMT)
RoLoRA: Fine-tuning Rotated Outlier-free LLMs for Effective Weight-Activation Quantization [38.2]
有効重量活性化量子化のための最初のLoRA方式であるRoLoRAを提案する。我々は,LLaMA2-7B/13B,LLaMA3-8Bモデルにおけるロロラの評価を行い,最大29.5%の精度で4ビットの重量活性化量子化LLaMA2-13Bを実現した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:52:18 GMT)
PhyScene: Physically Interactable 3D Scene Synthesis for Embodied AI [38.0]
PhySceneは、リアルなレイアウト、明瞭なオブジェクト、エンボディエージェントに適したリッチな物理的相互作用によって特徴付けられるインタラクティブな3Dシーンを生成するための方法である。我々はPhySceneがこれらの誘導関数を物理的に相互作用可能なシーン合成に有効に利用し、既存の最先端シーン合成方法よりも大きなマージンで優れていることを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:43:14 GMT)
Physics-Informed Geometric Operators to Support Surrogate, Dimension Reduction and Generative Models for Engineering Design [38.0]
本研究では,代用/分別モデルのトレーニングに供される幾何データを強化するための物理インフォームド幾何演算子(GO)のセットを提案する。 GOは形状の微分的および積分的性質を利用して、高レベルの固有幾何学的情報と物理を訓練に使用する特徴ベクトルに注入する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:50:43 GMT)
Detection of broadband squeezed light with a low-noise die-level balanced receiver [37.7]
自然パラメトリックダウンコンバージョンによる圧縮光の生成と検出について述べる。我々は、低ノイズダイレベル受信機を利用して、バランスの取れたホモダイン検出による量子状態の特徴付けを行う。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:20:40 GMT)
Coupled vertical double quantum dots at single-hole occupancy [37.7]
我々は、二重量子井戸、シリコン-ゲルマニウムヘテロ構造に閉じ込められた垂直二重量子ドットを制御する。単一ホールトランジスタで個々の電荷遷移を感知する。垂直の二重量子ドットを(1,1)の電荷状態にチューニングすると、1つのプランジャゲートの下にある各量子井戸に1つの穴が閉じられる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:17:57 GMT)
Is Your LLM Outdated? Evaluating LLMs at Temporal Generalization [37.6]
LLM(Large Language Models)の急速な進歩は、評価方法論の進化に対する緊急の必要性を浮き彫りにしている。しばしば静的な従来のベンチマークでは、絶えず変化する情報ランドスケープをキャプチャできない。本研究では,過去,現在,未来に関連するテキストを理解し,予測し,生成する能力を含む時間的一般化について検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:57:01 GMT)
FUNAvg: Federated Uncertainty Weighted Averaging for Datasets with Diverse Labels [37.2]
我々は,関節背骨を連合的に学習することを提案する。異なるセグメンテーションヘッドは、個々のクライアントのラベルでのみ訓練されているが、それぞれのサイトに存在しない他のラベルに関する情報も学習している。 FUNAvgと呼ばれるこの手法では、平均して同じデータセット上でトレーニングされ、テストされたモデルと同等です。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:23:55 GMT)
Graph-Guided Test-Time Adaptation for Glaucoma Diagnosis using Fundus Photography [36.3]
緑内障は世界中で不可逆的な盲目の原因となっている。眼底画像を用いた深層学習は緑内障の早期診断を大幅に改善した。異なるデバイスや場所(ドメインシフトとして知られる)からのイメージの変化は、実世界の設定で事前トレーニングされたモデルを使用することに挑戦する。緑内障の診断モデルを未知のテスト環境に一般化するためのグラフ誘導テスト時間適応フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:54:23 GMT)
RT-LA-VocE: Real-Time Low-SNR Audio-Visual Speech Enhancement [36.1]
LA-VocEのすべてのコンポーネントを再設計して40msの入力フレームで因果的リアルタイム推論を行うRT-LA-VocEを提案する。提案アルゴリズムは,すべてのリアルタイムシナリオにおいて,最先端の処理結果が得られることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:49:23 GMT)
Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model [36.0]
2B大言語モデル(LLM)であるCT-LLMを導入する。 CT-LLMは、スクラッチから一意に開始され、中国語のテキストデータを組み込んで従来の手法から分岐する。 CT-LLMは中国語のタスクに優れており、SFTを通して英語で適応性を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:51:17 GMT)
Training A Small Emotional Vision Language Model for Visual Art Comprehension [35.3]
本稿では,視覚芸術を理解するために,小さな視覚言語モデルを開発する。感情モデリングと入出力特徴アライメントによって、小さな感情視覚言語モデル(SEVLM)を構築する。最先端の小型モデルを上回るだけでなく、微調整後のLLaVA 7BやGPT4(V)と競合する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:26:48 GMT)
A noise-robust acoustic method for recognizing foraging activities of grazing cattle [35.2]
NRFAR(Noth-Robust Foraging Activity Recognizer)と呼ばれる音響手法の動作原理と一般化能力について述べる。ノイズのない環境では、NRFARは平均的平衡精度86.4%に達し、以前の2つの音響手法を7.5%以上上回った。 NRFARは厳しい放牧環境において有効であることが示されており、牧草管理を改善し、乳牛の健康と福祉をモニタリングするための信頼性の高いソリューションとして利用することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:37:50 GMT)
Controlling Space and Time with Diffusion Models [34.7]
4次元新規ビュー合成(NVS)のためのケースド拡散モデルである4DiMを提案する。我々は3D(カメラポーズ付き)、4D(目的+時間)、ビデオ(時間だがポーズなし)データに関する共同トレーニングを提唱する。 4DiMは、パノラマ縫合の改善、ビデオ翻訳のためのポーズ付きビデオ、その他いくつかのタスクにも使用されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:23:33 GMT)
Entanglement of photonic modes from a continuously driven two-level system [34.5]
量子エミッタ(超伝導量子ビット)をコヒーレントドライブで連続的にエキサイティングすることで, 絡み合ったフォトニックモードを実験的に生成する。共鳴蛍光スペクトルの2つの側バンドから抽出したモード間の絡み合いが生じることを示す。本手法は, 様々な物理プラットフォームにおいて, 絡み合いを高速に分散するために有効である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:48:41 GMT)
Diffusion Tempering Improves Parameter Estimation with Probabilistic Integrators for Ordinary Differential Equations [34.5]
通常微分方程式(ODE)は科学の力学系を記述するために広く用いられているが、実験的な測定を説明するパラメータを特定することは困難である。本稿では,ODEにおける勾配に基づくパラメータ最適化の収束性を改善する確率的数値法の新しい正規化手法である拡散テンパリングを提案する。本手法は複雑性の異なる力学系に対して有効であることを示すとともに,実際に関連するパラメータ数を持つHodgkin-Huxleyモデルに対して,信頼性の高いパラメータ推定値が得られることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:36:15 GMT)
Volumetric Rendering with Baked Quadrature Fields [34.3]
テクスチャ化された多角形を利用して高速な推論を可能にする,不透明なシーンのための新しい表現を提案する。提案手法は,1920times1080$画像に対して,100フレーム/秒以上のレンダリング速度を実現するため,既存のグラフィックスフレームワークと容易に統合できる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:27:00 GMT)
Teaching Transformers Causal Reasoning through Axiomatic Training [34.0]
エージェントが受動的データから因果推論を学べる程度について検討する。重要な疑問は、エージェントが公理実証から新しいシナリオへの一般化を学ぶかどうかである。 6700万のパラメータ変換モデルが線形因果連鎖で訓練された場合、新しい種類のグラフに対してうまく一般化できることがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:50:44 GMT)
An efficient method to automate tooth identification and 3D bounding box extraction from Cone Beam CT Images [33.7]
本稿では,CBCT画像から歯を自動検出,識別,抽出する手法を提案する。歯は1段階の物体検出器を用いてピンポイントされラベル付けされる。ほうき箱は、各歯の3次元表現を作成するために、切り離され、識別される。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:44:17 GMT)
OneRestore: A Universal Restoration Framework for Composite Degradation [33.6]
現実のシナリオでは、画像障害はしばしば複合的な劣化として現れ、低光、迷路、雨、雪といった要素の複雑な相互作用を示す。本研究では, 複雑な複合劣化シナリオを正確に表現するために, 4つの物理劣化パラダイムを統合した多目的イメージングモデルを提案する。 OneRestoreは、適応的で制御可能なシーン復元のために設計された新しいトランスフォーマーベースのフレームワークである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:35:48 GMT)
Beyond Perplexity: Multi-dimensional Safety Evaluation of LLM Compression [33.5]
モデル圧縮が4次元に与える影響について検討する:(1)退化障害、すなわち、世代におけるバイアスと毒性、(2)表現障害、すなわち、識別的タスクにおけるバイアス、(3)方言バイアス、(4)言語モデリングと下流タスクのパフォーマンス。解析の結果,圧縮が予期せぬ結果をもたらすことが明らかとなった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:31:11 GMT)
Direct Training High-Performance Deep Spiking Neural Networks: A Review of Theories and Methods [33.4]
スパイキングニューラルネットワーク(SNN)は、人工ニューラルネットワーク(ANN)の代替として有望なエネルギー効率を提供する本稿では,より深いSNNを高い性能で訓練するための理論と手法を要約する新しい視点を提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:04:44 GMT)
DuInNet: Dual-Modality Feature Interaction for Point Cloud Completion [33.0]
我々は、よりリッチな形状のカテゴリとより多様なテストデータを備えた大規模マルチモーダルポイントクラウド補完ベンチマークModelNet-MPCにコントリビュートする。完全教師付きポイントクラウド完了タスクに加えて、完了の認知とゼロショット学習完了を含む2つのタスクが提案されている。 ShapeNet-ViPCとModelNet-MPCベンチマークの実験により、DuInNetは最先端の手法よりも全ての完了タスクにおいて優越性、堅牢性、転送能力を示すことが示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:19:40 GMT)
Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective [32.9]
人工知能(AI)の最近の進歩は、医療画像と計算病理に革命をもたらしている。デジタル全スライド画像(WSI)の解析における一定の課題は、何万ものタイルレベルの画像埋め込みをスライドレベルの表現に集約する問題である。本研究は,9つの臨床的課題を対象とした10種類のスライドレベルのアグリゲーション手法のベンチマーク分析を行った。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:00:57 GMT)
Unity in Diversity: Multi-expert Knowledge Confrontation and Collaboration for Generalizable Vehicle Re-identification [32.8]
一般化可能な車両再識別(ReID)は、様々なソースドメインでよく訓練されたモデルが、未知のターゲットドメインに広く適応できるようにすることを目的としている。依然としてドメインシフトの問題に直面しており、未知のターゲットドメインに正確に一般化することは困難である。本稿では,2段階のMulti-expert Knowledge Confrontation and Collaboration (MiKeCoCo)法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:06:39 GMT)
Marlin: Knowledge-Driven Analysis of Provenance Graphs for Efficient and Robust Detection of Cyber Attacks [32.8]
本稿では,リアルタイムのプロファイランスグラフアライメントによるサイバー攻撃検出にアプローチしたMarlinを紹介する。 Marlinは毎秒137Kのイベントを処理でき、120のサブグラフと31の攻撃を正確に識別できる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:49:48 GMT)
Causal Discovery-Driven Change Point Detection in Time Series [32.4]
時系列における変化点検出は、時系列の確率分布が変化する時間を特定する。実践的な応用では、時系列の特定の構成要素にのみ興味を持ち、その分布の急激な変化を探求する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:54:42 GMT)
Causal Discovery in Semi-Stationary Time Series [32.4]
本研究では,観測時系列における因果関係を発見するための制約に基づく非パラメトリックアルゴリズムを提案する。このアルゴリズムは離散時系列における因果関係の同定に有効であることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:55:38 GMT)
Scalable improvement of the generalized Toffoli gate realization using trapped-ion-based qutrits [32.3]
トフォリゲートの直接実現には、2量子ゲートの数の禁止的な成長が必要か、またはアンシラ量子ビットを使用する必要がある。ここでは、トラップイオンベースのデュアル型光マイクロ波量子ドットを用いたトフォリゲートの実現のスケーラブルな改善を実験的に実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:34:56 GMT)
Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation [32.3]
本研究では、異なる人間のポーズや形状に関連したタスクやデータセットをシームレスに統一するパラダイムを提案する。私たちの定式化は、トレーニングとテスト時間の両方で、人間の体積の任意の点を問う能力に重点を置いています。メッシュや2D/3Dスケルトン,密度の高いポーズなど,さまざまな注釈付きデータソースを,変換することなく自然に利用することが可能です。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:44:18 GMT)
Search, Examine and Early-Termination: Fake News Detection with Annotation-Free Evidences [32.1]
我々は,Web 検索したアノテーションのない証拠から有用な情報を検索する textbfSEE という手法を提案する。実験の結果,提案手法は最先端手法よりも優れていた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:22:30 GMT)
MIGS: Multi-Identity Gaussian Splatting via Tensor Decomposition [31.8]
MIGSは、モノクロビデオのみを使用して、複数のアイデンティティのための単一の神経表現を学習する新しい方法である。本稿では,学習可能な3DGSパラメータをすべて組み合わせた高次テンソルの構築を提案する。低ランク構造を仮定しテンソルを分解することにより、統一ネットワークにおける複数の対象の複雑な剛性および非剛性変形をモデル化する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:30:06 GMT)
Why Online Reinforcement Learning is Causal [31.6]
強化学習(RL)と因果モデリングは自然に相互に補完する。本稿では、因果モデリングのメリットを期待できる強化学習設定について検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:51:52 GMT)
Rethinking Few-shot Class-incremental Learning: Learning from Yourself [31.3]
FSCIL (Few-shot class-incremental Learning) は、限られたサンプルを持つシーケンシャルクラスを数ショットで学習することを目的としている。 FSCILの一般的なベンチマークは、古典的なクラス増分学習設定を継承し、評価指標として平均精度(aAcc)と最終タスク平均精度(lAcc)を用いる。我々は、さらに公平な評価を提供するために設計された一般化平均精度(gAcc)と呼ばれる新しい指標を提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:52:56 GMT)
Why should we ever automate moral decision making? [30.4]
AIが重大な道徳的意味を持つ決定に関与している場合、懸念が生じる。道徳的推論は広く受け入れられている枠組みを欠いている。もう一つのアプローチは、人間の道徳的決定からAIを学ぶことである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:59:22 GMT)
Real-time Holistic Robot Pose Estimation with Unknown States [30.4]
RGB画像からロボットのポーズを推定することは、コンピュータビジョンとロボット工学において重要な問題である。従来の手法では、例えば接地型ロボットの関節角など、ロボットの内部状態の完全な知識が想定されていた。本研究は,RGB画像からリアルタイムロボットのポーズ推定を行う上で,既知のロボットの状態を必要としない効率的なフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:28:44 GMT)
AdaptiGraph: Material-Adaptive Graph-Based Neural Dynamics for Robotic Manipulation [30.4]
本稿では,学習に基づく動的モデリング手法であるAdaptiGraphを紹介する。ロボットは様々な難易度の高い変形可能な素材を予測し、適応し、制御することができる。実世界の変形可能な物体の多種多様な集合を含む予測・操作タスクについて,予測精度とタスク習熟度に優れることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:57:04 GMT)
LEMoN: Label Error Detection using Multimodal Neighbors [30.3]
マルチモーダルデータセットにおけるラベルエラーを自動的に識別するLEMoNを提案する。提案手法はラベル誤り識別におけるベースラインよりも優れており,本手法を用いてフィルタリングしたデータセットのトレーニングにより,下流分類とキャプション性能が向上することがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:36:30 GMT)
End-to-end data-driven weather forecasting [30.2]
Aardvark Weatherは、エンドツーエンドのデータ駆動型天気予報システムである。生の観測を取り込み、グローバルなグリッド化された予測とローカルステーションの予測を出力する。興味事の量よりもパフォーマンスを最大化するために、エンドツーエンドに最適化することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:12:29 GMT)
CATP: Context-Aware Trajectory Prediction with Competition Symbiosis [30.2]
我々は,文脈情報の潜在能力を最大限に活用し,CATPモデルを構築するためのマネージャ・ワーカーの枠組みを提案する。このフレームワークは、マネージャモデル、複数のワーカーモデル、および自然界の競争共生にインスパイアされた調整されたトレーニングメカニズムから構成される。例えば、CATPを例にとると、各ワーカーはデータをトレーニングするために他の人と競争し、特定の動きパターンを予測する利点を育む必要があります。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:51:35 GMT)
Beyond the Calibration Point: Mechanism Comparison in Differential Privacy [29.6]
差分プライベート(DP)機械学習では、DPメカニズムのプライバシー保証が報告され、単一の$(varepsilon, delta)$-pairに基づいて比較されることが多い。このプラクティスは、DP保証が与えられた$(varepsilon, delta)$を共有するメカニズムの間でも大きく異なる可能性があることを見落としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:01:26 GMT)
CosmoCLIP: Generalizing Large Vision-Language Models for Astronomical Imaging [29.6]
我々は、事前学習されたCLIPモデルに基づいて精密に微調整された天文学的な画像テキストコントラスト学習フレームワークであるCosmoCLIPを紹介する。以上の結果から,CosmoCLIPは直接的かつ強力なフレームワークであり,ゼロショット分類や画像テキスト検索タスクにおいてCLIPを著しく上回っていることが明らかとなった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:24:43 GMT)
Bayesian Inverse Transfer in Evolutionary Multiobjective Optimization [29.6]
InvTrEMO(InvTrEMO)の第1回リバーストランスファー・マルチオブジェクト(InvTrEMO)を紹介する。 InvTrEMOは、決定空間がタスク間で正確に整合していない場合でも、多くの一般的な領域で共通の目的関数を利用する。 InvTrEMOは、高い精度の逆モデルを重要な副産物とし、オンデマンドで調整されたソリューションの生成を可能にする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:23:50 GMT)
Protecting NeRFs' Copyright via Plug-And-Play Watermarking Base Model [29.5]
ニューラル・ラジアンス・フィールド(NeRF)は3次元シーン表現の鍵となる手法となっている。我々は,NeRFの著作権保護のためのプラグイン・アンド・プレイ戦略を採用したtextbfNeRFProtectorを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:06:52 GMT)
Neural Geometry Processing via Spherical Neural Surfaces [29.3]
ニューラルサーフェス表現上でコア幾何学演算子を直接計算する方法を示す。これらの演算子によって、ニューラル表現に直接作用する幾何学的処理ツールが作成できます。我々は、(神経)スペクトル分析、熱流、平均曲率流におけるイラストラティブな応用を実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:28:02 GMT)
NuTime: Numerically Multi-Scaled Embedding for Large-Scale Time-Series Pretraining [28.6]
時系列データの数値特性に合わせた重要な技術的貢献を行う。入力をオーバーラップしないウィンドウに分割することでTransformerアーキテクチャを採用する。任意の数値振幅を持つスカラー値を高次元空間に埋め込むために,数値的に多スケールな埋め込みモジュールを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:52:48 GMT)
Unified Embedding Alignment for Open-Vocabulary Video Instance Segmentation [28.4]
Open-Vocabulary Video Instance (VIS)は、任意のオブジェクトのセグメンテーションと追跡機能によって、注目を集めている。我々はOVFormerと呼ばれる新しいオープン語彙VISベースラインを提案する。 OVFormerは軽量モジュールを使用して、クエリの埋め込みとCLIPイメージの埋め込みを統一する。従来の画像ベーストレーニングとは異なり、ビデオベースのモデルトレーニングを行い、ビデオ内の時間的一貫性を完全にマイニングする半オンライン推論スキームをデプロイする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:30:51 GMT)
Abide by the Law and Follow the Flow: Conservation Laws for Gradient Flows [28.3]
保存則」は、与えられたモデルの勾配流中に保存される量を定義する。単純なバイアス」は、訓練されたモデルの好ましい性質に責任があると考えられている。独立保護法の最大数を求める方法を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:15:10 GMT)
Video-to-Audio Generation with Hidden Alignment [28.3]
我々は、視覚エンコーダ、補助埋め込み、データ拡張技術に焦点をあてて、ビデオ・オーディオ生成パラダイムに関する洞察を提供する。提案モデルでは,最先端のビデオ・オーディオ生成機能を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:40:39 GMT)
Flooding Spread of Manipulated Knowledge in LLM-Based Multi-Agent Communities [28.2]
マルチエージェントシステムにおける大規模言語モデル(LLM)のセキュリティへの影響について検討する。本稿では,説得力注入と操作的知識注入を含む2段階攻撃手法を提案する。本手法は, LLMをベースとしたエージェントを誘導し, 有害な知識の拡散に有効であることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:08:46 GMT)
The Dark Side of NFTs: A Large-Scale Empirical Study of Wash Trading [28.2]
我々は,2,701,883 NFTから8,717,031の転送イベントと3,830,141のセールイベントを分析した。 NFTの3種類の洗剤取引を識別し,識別アルゴリズムを提案する。また,マーケットプレース設計,収益性,NFTプロジェクト設計,支払トークン,ユーザ行動,NTTエコシステムといった6つの側面からの洞察も提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:11:01 GMT)
Event-Aided Time-to-Collision Estimation for Autonomous Driving [28.1]
ニューロモルフィックなイベントベースカメラを用いて衝突時刻を推定する新しい手法を提案する。提案アルゴリズムは, 事象データに適合する幾何モデルに対して, 効率的かつ高精度な2段階のアプローチで構成する。合成データと実データの両方の実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:37:36 GMT)
ROSA: Random Subspace Adaptation for Efficient Fine-Tuning [28.1]
本稿では,従来のPEFT法よりも有意差で優れた手法であるRandom Subspace Adaptation (ROSA)を提案する。 ROSAは任意に大きな次元の部分空間を適応することができ、フルファインタニングをより良く適用できる。ほぼすべてのGLUEタスク ROSA が LoRA をかなり上回り、また NLG タスクでは LoRA を上回ります。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:20:53 GMT)
CharacterGen: Efficient 3D Character Generation from Single Images with Multi-View Pose Canonicalization [27.6]
本稿では,3Dキャラクタを効率的に生成するフレームワークである characterGen を提案する。変換器ベースで一般化可能なスパースビュー再構成モデルが,我々のアプローチの他のコアコンポーネントである。複数のポーズやビューでレンダリングされたアニメキャラクタのデータセットをキュレートして,モデルをトレーニングし,評価した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:25:08 GMT)
Trustworthy Contrast-enhanced Brain MRI Synthesis [27.4]
多モード医用画像翻訳は、CE-MRI画像を他のモダリティから合成することを目的としている。マルチモーダル回帰問題として,複数対1の医用画像翻訳問題を再構成する信頼性の高い新しい手法であるTrustI2Iを紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:17:01 GMT)
Playing Large Games with Oracles and AI Debate [27.4]
既存のオンラインゲームプレイのアルゴリズムでは、アクションの回数のイテレーションが要求されるため、大規模なゲームでは禁止される可能性がある。動作数を対数的に依存する外部と内部の後悔の最小化を同時に行うための,新しい効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:11:40 GMT)
A Survey on Deep Stereo Matching in the Twenties [26.7]
ステレオマッチングは半世紀に及ぶ歴史に近づきつつあるが、ディープラーニングのおかげで過去10年間に急速な進化が見られた。本稿では,2020年代にその分野を再定義した,先駆的な建築設計と画期的なパラダイムに焦点を当てる。アーキテクチャの革新と重要な課題の両方をレビューすることで、深いステレオマッチングの全体像を提供します。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:40:44 GMT)
GCondenser: Benchmarking Graph Condensation [26.5]
本稿では,大規模グラフ凝縮ベンチマークGCondenserを提案する。 GCondenserには標準化されたGCパラダイムが含まれており、凝縮、バリデーション、評価手順で構成され、新しいGCメソッドやデータセットの拡張を可能にする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:01:55 GMT)
Ramsey Theorems for Trees and a General 'Private Learning Implies Online Learning' Theorem [26.3]
この研究は、差分プライベート(DP)とオンライン学習との関係について研究を続けている。一般分類タスクにおいては,DP学習性はオンライン学習性を意味することを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:43:30 GMT)
Federated Foundation Model for Cardiac CT Imaging [26.0]
これまでで最も大きな心エコー画像解析を行い、部分的にラベル付けされたデータセットに焦点をあてた。タスク固有のCNNからの知識を1つのトランスフォーマーモデルに抽出する2段階の半教師付き学習戦略を開発した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:30:50 GMT)
A Coding-Theoretic Analysis of Hyperspherical Prototypical Learning Geometry [25.5]
HPL(Hyperspherical Prototypeal Learning)は、単位超球面上のクラスプロトタイプを設計する表現学習における教師ありアプローチである。これまでのHPLのアプローチには、以下の欠点がある: (i) 予想外の最適化手順に従う; (ii) 理論上は健全であるが、1つの潜在次元にのみ制約される。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:44:19 GMT)
FinCon: A Synthesized LLM Multi-Agent System with Conceptual Verbal Reinforcement for Enhanced Financial Decision Making [25.5]
大規模言語モデル(LLM)は、複雑なタスクの実行において顕著な可能性を示し、様々な金融アプリケーションでますます活用されている。本稿では,多様なFINancialタスクに適した概念的言語強化を備えたLLMベースのマルチエージェントフレームワークであるFinConを紹介する。 FinConのリスクコントロールコンポーネントは、体系的な投資信条を更新するための自己基準機構をエピソード的に開始することで、意思決定の品質を高める。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:59:18 GMT)
Analysis of Langevin Monte Carlo from Poincaré to Log-Sobolev [25.2]
離散時間ランゲヴィンモンテカルロアルゴリズムに対する最初の収束保証を提供する。従来の研究とは異なり、我々の結果は滑らかさの弱さを許容し、凸性や解離性条件を必要としない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:45:27 GMT)
InstructLayout: Instruction-Driven 2D and 3D Layout Synthesis with Semantic Graph Prior [25.2]
自然言語命令を補完することは、2Dおよび3Dレイアウト合成システムにとって魅力的な特性である。既存の手法は、オブジェクトの関節分布を暗黙的にモデル化し、オブジェクトの関係を表現し、生成物の可制御性合成システムを妨げる。 Instructは、セマンティックグラフとレイアウトデコーダを統合した、新しい生成フレームワークである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:13:39 GMT)
Complementary Information Mutual Learning for Multimodality Medical Image Segmentation [25.1]
本稿では,モーダル間冗長情報の負の影響を数学的にモデル化し,対処する相補的情報相互学習フレームワークを提案する。数値計算の結果,CIMLはモダリティ間の冗長情報を効率よく除去し,検証精度とセグメンテーション効果に関するSOTA法より優れていることがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:07:11 GMT)
What's the score? Automated Denoising Score Matching for Nonlinear Diffusions [25.1]
楽譜の学習による拡散過程の逆転は拡散に基づく生成モデルの中心を形成する。そこで我々は,ローカルDSM(Local-DSM)と呼ばれる,抽出可能なスコアマッチングのファミリーを導入する。本稿では,Taylor拡張を用いた局所DSM溶接により,非線形拡散プロセスによる自動トレーニングとスコア推定が可能となることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:02:19 GMT)
VQA-Diff: Exploiting VQA and Diffusion for Zero-Shot Image-to-3D Vehicle Asset Generation in Autonomous Driving [25.0]
VQA-Diff(VQA-Diff)は、車載画像を活用し、自動運転車のための3D車両資産を作成する新しいフレームワークである。 VQA-Diffは、VQA(Visual Question Answering)モデルにおけるLarge Language Modelから受け継いだ実世界の知識を利用して、堅牢なゼロショット予測を行う。我々はPascal 3D+を含む様々なデータセットの実験を行い、VQA-Diffが既存の最先端手法よりも質的かつ定量的に優れていることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:51:40 GMT)
Dynamic Encoder Size Based on Data-Driven Layer-wise Pruning for Speech Recognition [24.7]
可変サイズモデルは、異なるハードウェアおよび/またはアプリケーション制約下でASRシステムをデプロイするためにしばしば必要とされる。動的エンコーダ・サイズ・アプローチを提案する。この手法は1つのスーパーネット内の複数のパフォーマンスモデルをスクラッチからトレーニングする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:35:21 GMT)
AVCap: Leveraging Audio-Visual Features as Text Tokens for Captioning [24.6]
音声と視覚のキャプションに対する強力なベースラインアプローチであるtextbfAVCap を提案する。 AVCapは音声視覚機能をテキストトークンとして利用しており、性能だけでなく、モデルのスケーラビリティにも多くの利点がある。提案手法は,既存の音声・視覚のキャプション手法よりも優れた性能を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:17:49 GMT)
FLAIR: Feeding via Long-horizon AcquIsition of Realistic dishes [23.7]
FLAIRは、基礎モデルの常識と少数ショット推論能力を活用する、長期給餌システムである。現実的な6つのプレートの実際の評価では、FLAIRは効率的な食品のピックアップのために、様々なスキルのライブラリーを効果的に活用できることがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:38:57 GMT)
AlpaCare:Instruction-tuned Large Language Models for Medical Application [23.7]
GPT-4 と ChatGPT を用いた多種多様な医療用 IFT データセット MedInstruct-52k の作成を提案する。次に、データセット上のLLaMA系列モデルを微調整してAlpaCareを開発する。ドメイン固有のデータセットが小さいにもかかわらず、AlpaCareは医療アプリケーションで優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:46:06 GMT)
Debiased Noise Editing for Fair Medical Image Classification [23.6]
本研究は,ブラックボックス内での医療画像のバイアス問題に対処する。本稿では,DNEノイズを発生させるD(ebiased)N(oise)E(diting)戦略を提案する。われわれのパイプライン全体は、様々な医療状況にまたがって適用可能な公平な画像編集を可能にする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:49:28 GMT)
Spatial-Temporal Attention Model for Traffic State Estimation with Sparse Internet of Vehicles [23.5]
コスト効率の良い交通状態推定(TSE)を実現するために,スパースIoVデータを利用する新しいフレームワークを提案する。特に,TSEの精度を向上させるために,畳み込み抑止ネットワーク(CRNet)と呼ばれる新しい空間時間アテンションモデルを提案する。このモデルは、空間的相関集約のための畳み込みニューラルネットワーク(CNN)と、注意機構に基づいて時間的相関を抽出するRetNet(RetNet)を用いる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:58:53 GMT)
Mitigating Partial Observability in Sequential Decision Processes via the Lambda Discrepancy [23.3]
強化学習アルゴリズムは通常、環境力学と値関数がマルコフ状態表現の言葉で表現できるという仮定に依存する。基礎となる、観測不可能な状態空間へのアクセスや知識を必要とせずに、両方の目的を達成することのできるメトリクスを導入します。私たちは、$lambda$-discrepancyがすべてのMarkov決定プロセスで完全にゼロであり、ほぼ常に、部分的に観察可能な環境の幅広いクラスではゼロではないことを証明しています。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:04:20 GMT)
Federated PCA on Grassmann Manifold for IoT Anomaly Detection [23.3]
従来の機械学習ベースの侵入検知システム(ML-IDS)にはラベル付きデータの要求のような制限がある。 AutoEncodersやGenerative Adversarial Networks (GAN)のような最近の教師なしML-IDSアプローチは代替ソリューションを提供する。本稿では,分散データセットの共通表現を学習するフェデレーション型非教師付き異常検出フレームワークであるFedPCAを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:23:21 GMT)
ViTime: A Visual Intelligence-Based Foundation Model for Time Series Forecasting [23.3]
本稿では,時系列予測のためのビジュアルインテリジェンスに基づく新しい基礎モデルであるViTimeを提案する。これまで目にしなかったさまざまな予測データセットの実験は、ViTimeが最先端のゼロショットパフォーマンスを達成することを実証している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:11:01 GMT)
High-rate quantum digital signatures network with integrated silicon photonics [23.2]
量子デジタルシグネチャ(QDS)は、データの完全性、信頼性、非監査を保証するための情報理論的に安全なソリューションを提供する。以前のQDSシステムは高価でかさばる光学機器を頼りにしており、大規模な展開と再構成可能なネットワーク構築を制限していた。本研究は,チップベースのQDSの実現可能性を検証するとともに,大規模展開と既存のファイバインフラストラクチャとの統合を実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:04:31 GMT)
ActionVOS: Actions as Prompts for Video Object Segmentation [22.9]
ActionVOSは、人間のアクションをキー言語プロンプトとして使用して、エゴセントリックなビデオの中でアクティブなオブジェクトのみをセグメンテーションすることを目的としている。我々は、効率的なアクション誘導焦点損失を有する行動認識ラベルモジュールを開発した。実験により、ActionVOSは不活性なオブジェクトのミスセグメンテーションを著しく減少させることが示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:57:04 GMT)
HebDB: a Weakly Supervised Dataset for Hebrew Speech Processing [22.7]
HebDBはヘブライ語における音声言語処理のための弱い教師付きデータセットである。 HebDBはヘブライ語で、約2500時間の自然と自然の音声記録を提供している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:51:26 GMT)
CAPformer: Compression-Aware Pre-trained Transformer for Low-Light Image Enhancement [22.6]
低照度画像強調(LLIE)は携帯電話の撮影需要の急増とともに進歩しているが、既存の多くの方法では圧縮を無視している。本研究では,JPEG圧縮が低照度画像に与える影響について検討し,暗黒領域の低画素値の広さによるJPEGによる重大な情報損失を明らかにした。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:25:26 GMT)
Mitigating Cognitive Biases in Multi-Criteria Crowd Assessment [22.5]
クラウドソーシングにおけるマルチ基準アセスメントに関連する認知バイアスに着目した。複数の異なる基準で目標を同時に評価するクラウドワーカーは、いくつかの基準の優位性や評価対象の世界的な印象による偏りのある応答を提供することができる。評価基準間の関係を考慮に入れたベイズ意見集約モデルのための2つの具体的なモデル構造を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:00:23 GMT)
Decompose and Compare Consistency: Measuring VLMs' Answer Reliability via Task-Decomposition Consistency Comparison [22.4]
textttDeCCはVLMの直接応答の信頼性を測定する。 textttDeCCは既存の方法に比べてタスクの正確さとの相関性が良い。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:00:29 GMT)
Be More Real: Travel Diary Generation Using LLM Agents and Individual Profiles [21.7]
本研究では,現実の文脈に応じたリアルな軌跡を生成するためのエージェントベースフレームワーク(MobAgent)を提案する。当フレームワークを0.2万回の旅行調査データで検証し,個人化された正確な旅行日記を作成する上での有効性を実証した。本研究は、実世界の移動データを通して、人間の移動性に関する詳細かつ洗練された理解を提供するLLMの能力を強調した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:11:57 GMT)
mCoT: Multilingual Instruction Tuning for Reasoning Consistency in Language Models [21.6]
大規模言語モデル(LLM)とChain-of-Thought(CoT)は、最近、下流タスクを改善するために推論を誘発する強力なテクニックとして登場した。オープンソース LLM を用いて,多言語間の多言語推論の整合性について検討する。言語間の推論能力を向上させるため,多言語CoT命令チューニングを導入し,モデルの整合性を向上させる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:45:13 GMT)
Long-Term Fairness in Sequential Multi-Agent Selection with Positive Reinforcement [21.4]
大学入学や採用のような選抜プロセスでは、少数派からの応募者に対する偏見は肯定的なフィードバックをもたらすと仮定される。グリーディスコアとフェアネスのバランスをとるマルチエージェント・フェア・グリーディ政策を提案する。以上の結果から, 正の強化は長期的公正性にとって有望なメカニズムであるが, 進化モデルの変動に頑健な政策を慎重に設計する必要があることが示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:03:23 GMT)
Swiss DINO: Efficient and Versatile Vision Framework for On-device Personal Object Search [21.2]
本稿では,最近のDINOv2変換モデルに基づく一括個人オブジェクト検索のためのフレームワークを提案する。スイスのDINOは、デバイス上でパーソナライズされたシーン理解の要件に挑戦し、適応トレーニングを必要としない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:05:02 GMT)
Learning treatment effects while treating those in need [21.0]
本研究では,学習治療効果のある高年齢者を対象に,最適にバランスをとるランダム化アロケーションルールを設計する枠組みを提案する。ペンシルベニア州アレゲニー郡の人間サービスからのデータに我々のフレームワークを適用します。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:29:46 GMT)
Flow4D: Leveraging 4D Voxel Network for LiDAR Scene Flow Estimation [20.9]
Flow4Dは3Dイントラボクセル機能エンコーダの後、時間的に複数の点雲を融合する。 Spatio-Temporal De Blockcomposition (STDB)は、重い4Dコンボリューションを使用する代わりに、3Dと1Dコンボリューションを組み合わせる。 Flow4Dは、リアルタイム実行時の最先端よりも45.9%高いパフォーマンスを実現している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:55:43 GMT)
Evaluating the Adversarial Robustness of Retrieval-Based In-Context Learning for Large Language Models [20.8]
In-Context Learning (ICL) は、プロンプトでデモをエンコードするために使用される選択、順序、動詞に敏感である。 Retrieval-Augmented ICLメソッドは、レトリバーを活用して、意味論的に関連する例を例示として抽出することで、この問題に対処しようとする。本研究は, 検索強化モデルにより, 検体攻撃に対する堅牢性が向上することを明らかにする。そこで本研究では,攻撃したサンプルを用いてサンプルプールを充実させる,効果的な訓練自由対人防御手法であるDARDを導入する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:08:37 GMT)
New User Event Prediction Through the Lens of Causal Inference [20.7]
新規ユーザのための新しい離散イベント予測フレームワークを提案する。提案手法は,カテゴリを知る必要のない新規ユーザに対して,バイアスのない予測を提供する。数値シミュレーションと実世界の2つの応用を用いて,提案手法の優れた性能を実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:44:39 GMT)
Vegetable Peeling: A Case Study in Constrained Dexterous Manipulation [20.6]
食品の皮剥きに対する拘束的外用操作に着目する。そこで我々は,後続の剥離作業を容易にするリオリエンテーション制御系を学習するための簡単なシステムを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:51:33 GMT)
MindSpore Quantum: A User-Friendly, High-Performance, and AI-Compatible Quantum Computing Framework [20.6]
我々は、ノイズの多い中間スケール量子(NISQ)アルゴリズムに重点を置いた、先駆的なハイブリッド量子古典フレームワークであるMindSpore Quantumを紹介する。コアフレームワークに加えて,量子コンピューティングアクセラレーションエンジンQuPackを紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:53:46 GMT)
Reinforcement Learning of Adaptive Acquisition Policies for Inverse Problems [20.1]
高次元信号を得るための高価なプロセスを軽減するための有望な方法は、限られた数の低次元測定を取得することである。そこで本研究では,測定結果を逐次収集し,基礎となる信号をよりよく復元する強化学習に基づく手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:12:09 GMT)
SBoRA: Low-Rank Adaptation with Regional Weight Updates [20.0]
本稿では,SBORA(Standard Basis LoRA)を提案する。 SBoRAはローランド適応 (LoRA) とオルソゴン適応 (Orthogonal Adaptation) の先駆的な作品に基づいている。本研究は, 各種微調整作業におけるLoRAよりもSBoRA-FAの方が優れていることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:01:31 GMT)
Objective and subjective evaluation of speech enhancement methods in the UDASE task of the 7th CHiME challenge [19.8]
クリーン音声とノイズ信号の混合を人工的に生成し,音声強調のための教師付きモデルを訓練する。この相違は、テストドメインが合成トレーニングドメインと大きく異なる場合、性能が低下する可能性がある。第7回CiMEチャレンジのUDASEタスクは、テスト領域からの現実的なノイズの多い音声記録を活用することを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:16:08 GMT)
BiGym: A Demo-Driven Mobile Bi-Manual Manipulation Benchmark [19.7]
BiGymは、モバイル双方向のデモ駆動ロボット操作のための新しいベンチマークと学習環境である。 BiGymには、シンプルなターゲットから複雑なキッチンクリーニングまで、40の多様なタスクがホーム環境に設定されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:04:18 GMT)
Fish-Vista: A Multi-Purpose Dataset for Understanding & Identification of Traits from Images [19.5]
フィッシュ・ビジュアル・トレイト・アナリティクス(英: Fish-Visual Trait Analysis)は、1900の異なる種にまたがる約60万点の魚画像の大規模な注釈付きコレクションである。 Fish-Vistaは、各画像に存在する様々な視覚特性のきめ細かいラベルを提供する。また、2427枚の魚の画像に対して9つの異なる特徴のピクセルレベルのアノテーションを提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:10:56 GMT)
3D Gaussian as a New Era: A Survey [19.5]
3D Gaussian Splatting (3D-GS) はコンピュータグラフィックスの分野で大きな進歩を遂げている。ニューラルネットワーク(Neural Radiance Fields、NeRF)のようなニューラルネットワークに依存しない、明示的なシーン表現と新しいビュー合成を提供する。ロボット工学、都市マッピング、自律ナビゲーション、仮想現実/拡張現実(VR/拡張現実)など、さまざまな分野の応用を見出している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:48:08 GMT)
Pessimism Meets Risk: Risk-Sensitive Offline Reinforcement Learning [19.3]
リスクに敏感な強化学習(RL)は,不確実性を管理し,潜在的な有害な結果を最小限に抑えることが不可欠であるシナリオにおいて,意思決定を強化する能力において重要な分野である。本研究は, エントロピーリスク尺度をRL問題に適用することに焦点を当てる。我々は,リスクに敏感な観点からはまだ検討されていない理論的枠組みである線形マルコフ決定プロセス(MDP)の設定を中心としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:09:52 GMT)
MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations [19.2]
我々は,人間-ロボットインタラクション(HRI)のための共有潜在空間表現学習のための新しいアプローチを提案する。本研究では,情報的潜在空間を用いて,ロボットの動きを正規化するための変分オートエンコーダ(VAE)を訓練する。 VAEにおける人間の観察に先立って情報的MDNを使用するアプローチは,より正確なロボットの動きを生成する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:16:12 GMT)
Adversarial Robustness Limits via Scaling-Law and Human-Alignment Studies [19.1]
モデルサイズ,データセットサイズ,合成データ品質が,対戦型トレーニングのための最初のスケーリング法則を開発することにより,ロバスト性にどのように影響するかを分析する。我々のスケーリング法則は、先行技術における非効率性を明らかにし、現場を前進させるための実用的なフィードバックを提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:32:29 GMT)
SaMoye: Zero-shot Singing Voice Conversion Based on Feature Disentanglement and Synthesis [18.9]
そこで我々は,SaMoyeと名づけた,エンドツーエンドの機能不整合に基づくモデルを提案する。 SaMoyeは、歌声の特徴をそれぞれコンテンツ機能、音色機能、ピッチ機能に分解する。ゼロショット性能を保証するために,非並列な大規模データセットを構築した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:00:08 GMT)
MARS: Mixture of Auto-Regressive Models for Fine-grained Text-to-image Synthesis [18.9]
特殊設計されたセマンティックビジョンランゲージ統合エキスパート(Semantic Vision-Language Integration Expert, SemVIE)を組み込んだ,T2I世代のための新しいフレームワークであるMARSを紹介する。この革新的なコンポーネントは、言語情報と視覚情報を独立に処理し、ビジュアルコンポーネントを微調整しながらテキストコンポーネントを凍結することにより、事前訓練されたLCMを統合する。 MARSはSD1.5に必要なGPU日のうち9%しか必要としないが、様々なベンチマークで顕著な結果が得られる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:52:49 GMT)
Domain-Aware Fine-Tuning of Foundation Models [18.3]
ファンデーションモデル(FM)はコンピュータビジョンに革命をもたらし、異なるドメイン間で効果的な学習を可能にした。本稿では、異なるバックボーンアーキテクチャの比較により、FMのゼロショット領域適応ポテンシャルについて検討する。ドメイン関連テキスト埋め込みを利用した新しいドメイン認識コンポーネントを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:27:20 GMT)
From Supervised to Generative: A Novel Paradigm for Tabular Deep Learning with Large Language Models [18.2]
我々は,現在のモデルの限界を克服するために,TabFM(Tabular Foundation Models)を提案する。 TabFMは、ベースモデルとして事前訓練された大言語モデル(LLM)を採用し、目的設計の目的を用いて微調整する。ゼロショットやインコンテキスト推論のような命令追従タスクにおいてTabFMが優れていることを示す。また,TabFMの限界や可能性についても検討し,より強力なTabFMの開発に向けた今後の研究を刺激し,促進することを目的とする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:17:07 GMT)
Ensembling Prioritized Hybrid Policies for Multi-agent Pathfinding [18.1]
MARL(Multi-Agent Reinforcement Learning)をベースとしたMAPF(Multi-Agent Path Finding)が最近注目されている。いくつかのMARL-MAPFメソッドは、あるエージェントが知覚できる情報を豊かにするためにコミュニケーションを使用する。優先度付きハイブリッドポリシ(EPH)を組み込む新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:36:48 GMT)
Deformable Feature Alignment and Refinement for Moving Infrared Dim-small Target Detection [17.8]
本稿では,変形可能なコンボリューションに基づく変形可能な特徴アライメント・リファインメント(DFAR)手法を提案する。提案手法はDAUBとIRDSTを含む2つのベンチマークデータセットの最先端性能を実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:42:25 GMT)
Multivector Neurons: Better and Faster O(n)-Equivariant Clifford Graph Neural Networks [17.7]
本研究では,クリフォード・マルチベクタに基づく新しいメッセージパッシンググラフニューラルネットワーク(GNN)を試作する。我々はNボディデータセットの最先端エラーを0.0035にプッシュし、最近の手法よりも8%改善した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:24:42 GMT)
Revealing spontaneous symmetry breaking in continuous time crystals [17.6]
自発的対称性の破れは連続時間結晶(CTC)と呼ばれる新しい物質の状態をもたらす本研究では, 多様体トポロジーと近カオス運動という, 異なる機構に基づく2種類のCTCを提案し, 実験的に実現した。我々の研究は、CTCの実現のための一般的なレシピを提供し、様々なシステムにおけるCTCの探索の道を開く。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:27:06 GMT)
Online Vectorized HD Map Construction using Geometry [17.3]
本稿では,地図インスタンスのユークリッド形状と関係を基本的な知覚を超えて学習するGeMapを提案する。提案手法は,NuScenesおよびArgoverse 2データセット上での最先端性能を実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:46:19 GMT)
Switch Diffusion Transformer: Synergizing Denoising Tasks with Sparse Mixture-of-Experts [17.0]
拡散モデルは、様々な生成的タスクで顕著な成功を収めた。近年の取り組みは、各タスクが特定の雑音レベルにおける認知タスクに対応するマルチタスク学習の形式として再認識されている。タスク間のタスク間関係を確立するSwitch-DiT(Switch Diffusion Transformer)を導入する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:39:08 GMT)
DistriBlock: Identifying adversarial audio samples by leveraging characteristics of the output distribution [16.7]
アドリアックは、自動音声認識システムを誤認して任意のターゲットテキストを予測する。本稿では,任意のASRシステムに適用可能な効率的な検出戦略であるDistriBlockを提案する。提案手法の最高性能は, 受信機動作特性曲線下において, 99%, 97%のクリーン・ノイズデータに対して, ターゲット対向例を識別する平均面積である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:26:10 GMT)
TACLE: Task and Class-aware Exemplar-free Semi-supervised Class Incremental Learning [16.7]
そこで本研究では,先進的な半教師付きクラスインクリメンタルラーニングの問題に対処する新しいTACLEフレームワークを提案する。このシナリオでは、新しいタスクごとに、ラベル付きデータとラベルなしデータの両方から新しいクラスを学習する必要があります。事前訓練されたモデルの能力を活用することに加えて、TACLEは新しいタスク適応しきい値を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:46:35 GMT)
Grounding and Evaluation for Large Language Models: Practical Challenges and Lessons Learned (Survey) [16.4]
堅牢性、バイアス、セキュリティ、解釈可能性、その他の責任あるAI次元のために、AIシステムを評価し、監視することが不可欠である。我々は,幻覚,有害かつマニピュティブなコンテンツ,著作権侵害などの新たな課題を提起する,大規模言語モデル(LLM)やその他の生成AIモデルに焦点を当てる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:23:10 GMT)
Transforming LLMs into Cross-modal and Cross-lingual Retrieval Systems [16.3]
大規模言語モデル(LLM)は、ペア化された音声とテキストデータを持つ言語を超えた、テキストのみのデータに基づいて訓練される。マルチモーダルDEM検索システムの初期化にLLMを使うことを提案する。本システムは,21言語のみを訓練しながら,102言語で音声とテキストをマッチングできる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:20:19 GMT)
Training on the Test Task Confounds Evaluation and Emergence [16.3]
テストタスクのトレーニングは、相対モデル評価と創発的能力に関するクレームの両方に矛盾があることを示します。評価前のタスク関連データと比較し,各モデルを微調整することにより,テストタスクのトレーニングを効果的に調整する手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:57:58 GMT)
Amazing Things Come From Having Many Good Models [15.8]
羅生門効果は、同じデータセットに対して等しく良い予測モデルが存在するという現象を記述している。このパースペクティブは、機械学習に対する考え方を変えることを提案する。私たちのゴールは、Rashomon効果が社会の複雑な問題に対する機械学習の利用に大きな影響を与えるかを説明することです。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:39:01 GMT)
An Improved Traditional Chinese Evaluation Suite for Foundation Model [15.7]
従来の中国語理解のための新しいベンチマークTMMLU+を提案する。小学校から専門職まで66名の被験者を対象とする多票質問回答データセットである。我々はまた、1.8Bから72Bまでのパラメータのクローズドソースモデルと26のオープンウェイト中国語大言語モデル(LLM)をベンチマークした。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:11:56 GMT)
Continuous Control with Coarse-to-fine Reinforcement Learning [15.6]
本稿ではRLエージェントを粗い方法で連続的なアクション空間にズームインするよう訓練するフレームワークを提案する。我々は、CQN(Coarse-to-fine Q-Network)と呼ばれる、具体的な価値に基づくアルゴリズムをフレームワーク内に導入する。 CQNは、オンライントレーニングの数分後に現実世界の操作タスクを解決するために、しっかりと学習している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:04:08 GMT)
Green Screen Augmentation Enables Scene Generalisation in Robotic Manipulation [15.5]
視覚に基づく新しい環境に対する操作ポリシーの一般化は、限られた探索の難しい領域のままである。現在のプラクティスでは、ひとつの場所にデータを集め、このデータを使って模倣学習や強化学習のポリシーを訓練し、同じ場所にポリシーをデプロイする。本稿では,主にグリーンスクリーンを特徴とする場所でデータを収集する手法を提案する。背景テクスチャをグリーンスクリーン上にオーバーレイするためにクロマキーアルゴリズムを用いたグリーンスクリーン拡張(GreenAug)を導入する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:32:05 GMT)
Dual-stage Hyperspectral Image Classification Model with Spectral Supertoken [15.4]
スーパーピクセルの概念に触発されたDual-stage Spectral Supertoken(DSTC)を紹介する。 DSTCはスペクトル微分に基づく画素クラスタリングを用いて、類似のスペクトル特性を持つグループ画素をスペクトルスーパートーケンに分類する。適応的に重みを異なるカテゴリに割り当てるクラスプロポーションベースのソフトラベルも提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:58:30 GMT)
CiteME: Can Language Models Accurately Cite Scientific Claims? [15.1]
論文を参照する文章を引用すると、LMは研究助手として、参照された論文を正しく識別できるだろうか? 我々のベンチマークであるCiteMEは、最近の機械学習論文からのテキスト抜粋で構成されており、それぞれが1つの論文を参照している。 CiteMEの使用は、フロンティアのLMと人間のパフォーマンスの間に大きなギャップがあることを明らかにし、LMは4.2-18.5%の精度しか達成せず、人間は69.7%である。我々は、GPT-4o LM上に構築された自律システムであるCiteAgentを導入することにより、このギャップを埋める。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:31:20 GMT)
Arabic Automatic Story Generation with Large Language Models [15.0]
我々は,大規模言語モデル(LLM)からストーリを生成するタスクに注力する。トレーニングでは、機械翻訳(MT)とGPT-4を使って獲得したストーリーを使用します。 GPT-41データには、アラビア語の文脈に適したデータを生成するためのプロンプトが導入された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:26:10 GMT)
Let Occ Flow: Self-Supervised 3D Occupancy Flow Prediction [14.9]
Occ Flowは、カメラ入力のみを使用して、関節の3D占有率と占有率の予測を行う最初の自己教師型作業である。提案手法では,動的オブジェクト依存を捉えるために,後向きの時間的アテンションモジュールを組み込んでおり,次いで3次元洗練されたボリューム表現を行う。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:20:11 GMT)
TinyGraph: Joint Feature and Node Condensation for Graph Neural Networks [14.8]
大規模グラフ上でのグラフニューラルネットワーク(GNN)のトレーニングは、高い計算コストのために困難である。既存のグラフ凝縮の研究は、グラフ内のノード数を減少させることによってのみこの問題に取り組む。グラフで特徴とノードを同時に結集する新しいフレームワークであるTinyGraphを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:54:12 GMT)
Incorporating Clinical Guidelines through Adapting Multi-modal Large Language Model for Prostate Cancer PI-RADS Scoring [14.8]
近年の深層学習に基づく PI-RADS 評価法は, 放射線技師が利用する PI-RADS 臨床ガイドライン (PICG) の組み入れを欠いていることが多い。本稿では,マルチモーダルな大規模言語モデル(MLLM)を付加アノテーションやネットワークパラメータを使わずにPICGをPI-RADSスコアリングモデルに組み込む手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:44:03 GMT)
Machine Unlearning for Medical Imaging [14.7]
機械学習は、事前訓練されたモデルから特定のトレーニングサンプル群の影響を取り除くプロセスである。医用画像領域における異なる未学習アルゴリズムの有効性と計算効率を評価する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:59:28 GMT)
Cross Domain Object Detection via Multi-Granularity Confidence Alignment based Mean Teacher [14.7]
クロスドメインオブジェクト検出は、注釈付きソースドメインから知識を転送することで、ラベルなしターゲットドメインのオブジェクト検出器を学習する。本研究では,カテゴリレベルの過信,インスタンスレベルのタスクの信頼性の不整合,イメージレベルの信頼の誤認など,予測の信頼性の誤調整が,対象領域における準最適性能をもたらすことを見出した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:56:24 GMT)
S&D Messenger: Exchanging Semantic and Domain Knowledge for Generic Semi-Supervised Medical Image Segmentation [14.6]
半監督型医用画像分割(SSMIS)は,医療分野における手動ラベリングの課題に対処するための,有望な解決策として登場した。本稿では,3つのタスク全てをマスターする汎用フレームワークを開発することを目的とする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:39:47 GMT)
Pan-cancer Histopathology WSI Pre-training with Position-aware Masked Autoencoder [14.6]
設計した位置認識マスク付きオートエンコーダ(PAMA)を用いたパンカンサーWSIレベルの事前学習のための新しい自己教師型学習フレームワークを提案する。その結果, PAMAがWSI表現学習の一般化と差別化に有効であること, パン・カンサーWSI事前学習の有効性が示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:42:41 GMT)
Adversarial Attacks and Defenses on Text-to-Image Diffusion Models: A Survey [14.4]
テキストから画像への拡散モデルであるStable Diffusionは、リリースからわずか2ヶ月で1000万人以上のユーザーを集めた。本稿では,テキスト・ツー・イメージ拡散モデルを対象とした敵攻撃と防御に関する文献のレビューを行う。次に、モデルロバスト性および安全性を向上させるため、現行の防御手法の詳細な分析を行う。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:50:31 GMT)
BoostCom: Towards Efficient Universal Fully Homomorphic Encryption by Boosting the Word-wise Comparisons [14.4]
完全同型暗号化(FHE)は、最初に復号化することなく、暗号化データ上での計算の実行を可能にする。本稿では,単語比較処理の高速化を目的としたBoostComを提案する。我々は、最先端のCPUベースのuFHEシステムと比較して、桁違い(11.1倍高速)のエンドツーエンド性能向上を実現している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:09:10 GMT)
Split Conformal Prediction under Data Contamination [14.2]
データ汚染環境における分割共形予測の堅牢性について検討する。構築した集合のカバレッジと効率に及ぼす劣化したデータの影響を定量化する。本稿では,汚染ロバスト・コンフォーマル予測(Contamination Robust Conformal Prediction)と呼ぶ分類設定の調整を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:33:28 GMT)
Asymmetric Mask Scheme for Self-Supervised Real Image Denoising [14.2]
本稿では,盲点操作を不要とする自己指導型聴覚訓練のためのマスク方式を提案する。提案手法は,非対称マスク方式をトレーニングや推論に用い,既存の実雑音画像データセットの最先端性能を実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:00:22 GMT)
INSIGHT: Universal Neural Simulator for Analog Circuits Harnessing Autoregressive Transformers [13.9]
INSIGHTはアナログフロントエンド設計自動化ループにおける技術に依存しない効果的なユニバーサルニューラルネットワークシミュレータである。実験により、モデルベースバッチ強化学習フレームワークであるINSIGHT-Mは、回路間のサンプル効率を少なくとも50倍改善することを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:52:53 GMT)
Fine-Tuning Large Language Models with User-Level Differential Privacy [13.7]
1)サンプルレベルサンプリング(ELS)と,(2)ユーザレベルのサンプリング(ULS)とユーザごとの勾配クリッピングの2種類のDP-SGDについて検討した。我々は,ESSの厳密なプライバシー保証を計算できる新しいユーザレベルDP会計士を導出する。 ULS は(1) 強いプライバシー保証が必要か、(2) 計算予算が大きいかという設定で大幅に改善されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:07:58 GMT)
Call Graph Soundness in Android Static Analysis [13.6]
13の静的解析ツールと1000のAndroidアプリで動的解析を実行しています。静的解析ツールは、動的に実行されたメソッドの61%をキャプチャできなかった。既存のアプローチは静的解析の音質を著しく改善するものではない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:23:52 GMT)
Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis [13.6]
変形-回復拡散モデル (DRDM) は, 変形拡散と回復に基づく拡散モデルである。 DRDMは、不合理な変形成分の回復を学ぶために訓練され、ランダムに変形した各画像を現実的な分布に復元する。心MRIおよび肺CTによる実験結果から,DRDMは多種多様(10%以上の画像サイズ変形スケール)と高品質な変形場を創出できることが示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:26:48 GMT)
A Bias-Variance-Covariance Decomposition of Kernel Scores for Generative Models [13.5]
カーネルスコアに対する最初のバイアス-分散-共分散分解を導入する。不確実性推定のためのカーネルベースの分散とエントロピーを導出する。カーネルの広範な適用性に基づいて、画像、音声、言語生成のための一般化および不確実性実験を通じて、我々のフレームワークを実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:37:50 GMT)
HoneyGAN Pots: A Deep Learning Approach for Generating Honeypots [12.9]
本稿では,デコイ構成の生成にGAN(Generative Adversarial Networks)を用いることの有効性と有効性について検討する。既存のアプローチは、しばしば設定のリストの維持や、事前設定されたイメージのコレクションの保存に依存している。我々の研究は、このギャップに対処し、サイバーディフェンダーにネットワークディフェンスを強化する強力なツールを提供することを目的としています。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:56:09 GMT)
Incremental Multiview Point Cloud Registration with Two-stage Candidate Retrieval [12.5]
マルチビューポイントクラウド登録は、様々なコンピュータビジョンタスクの基盤となる。本稿では,すべてのスキャンを段階的にメタ形状に登録するインクリメンタルなマルチビューポイントクラウド登録手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:24:28 GMT)
How to Leverage Predictive Uncertainty Estimates for Reducing Catastrophic Forgetting in Online Continual Learning [12.3]
この研究は、異なる不確実性推定とメモリの投入戦略を詳細に分析する。負の対数類似度によって誘導される一般化分散を用いて予測の不確かさを推定する別の方法を提案する。予測不確実性対策を用いることで, CFを異なる設定で低減できることが実証された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:51:15 GMT)
Learning with Instance-Dependent Noisy Labels by Anchor Hallucination and Hard Sample Label Correction [12.3]
従来のNoisy-Label Learning (NLL) 手法は、トレーニングサンプルの損失分布に基づいて、トレーニングデータをクリーンでノイズの多いセットに分類する。提案手法は, 清潔さと難易度と難易度を明確に区別する。修正されたハードサンプルと簡単なサンプルは、その後の半教師付きトレーニングでラベル付きデータとして使用される。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:00:14 GMT)
Towards a theory of learning dynamics in deep state space models [12.3]
状態空間モデル(SSM)は多くの長いシーケンスモデリングタスクにおいて顕著な経験的性能を示した。この研究は、ディープステート空間モデルにおける動的学習の理論への一歩である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:01:56 GMT)
Lie Group Decompositions for Equivariant Neural Networks [12.1]
コンボリューションカーネルをパラメータ化してアフィン変換に対する同変モデルを構築する方法を示す。我々は,ベンチマークアフィン不変分類タスクにおいて,モデルのロバスト性と分布外一般化能力を評価する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:12:45 GMT)
Generative Image as Action Models [11.8]
RGB画像のターゲットとして安定拡散を微調整する行動閉鎖剤GENIMAを提案する。画像空間にアクションを持ち上げることで、インターネットで事前訓練された拡散モデルは、最先端のビジュモータアプローチよりも優れたポリシーを生成することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:41:10 GMT)
Targeted Augmented Data for Audio Deepfake Detection [11.7]
そこで本研究では,モデルの決定境界をターゲットとした音声疑似フェイク生成手法を提案する。敵の攻撃に触発されて、元の実際のデータを摂動させ、不明瞭な予測確率で擬似フェイクを合成する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:31:53 GMT)
DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance [11.4]
テキストと画像の拡散モデルは、高忠実度画像生成の可能性から、様々な領域で広く採用されている。既存の大規模拡散モデルでは、1K解像度の画像を生成できるが、これは現代の商用応用の要求を満たすには程遠い。本稿では,高分解能画像の生成を導くために,生成した低分解能画像を完全に活用する新しいプログレッシブアプローチを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:18:13 GMT)
Trade When Opportunity Comes: Price Movement Forecasting via Locality-Aware Attention and Iterative Refinement Labeling [11.4]
2つの主成分を持つ価格変動予測フレームワークであるLARAを提案する。 LA-Attentionはマスク付きアテンションスキームを通じて潜在的に有益なサンプルを抽出する。 RA-Labelingは、潜在的に利益の出るサンプルのうるさいラベルを洗練させる。 LARAは、Qlibの量的投資プラットフォーム上で、いくつかの機械学習ベースの手法を大幅に上回っている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:05:51 GMT)
Rectifier: Code Translation with Corrector via LLMs [11.4]
本稿では,翻訳誤りを修復するマイクロ・ユニバーサルモデルであるRectifierを提案する。 C++,Java,Python間の翻訳タスクの実験結果から,本モデルが有効な修復能力を有することが示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:58:41 GMT)
Mimicking Production Behavior with Generated Mocks [11.4]
実運用環境でのアプリケーションを監視して,モックによる現実的な実行シナリオを模倣するテストを生成することを提案する。まず、テストを生成するための一連のターゲットメソッドと、それらが呼び出すメソッドを設定します。第2に、本番環境では、ターゲットメソッドが呼び出されるコンテキストに関するデータと、モック可能なメソッド呼び出し毎にパラメータと返される値を収集します。第3にオフラインでは、実運用データを分析して、現実的なインプットとモックインタラクションでテストケースを生成します。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:19:20 GMT)
HAFormer: Unleashing the Power of Hierarchy-Aware Features for Lightweight Semantic Segmentation [11.3]
本稿では,CNNの階層的特徴抽出能力とTransformerのグローバル依存性モデリング機能を組み合わせたモデルであるHAFormerを紹介する。 HAFormerは計算オーバーヘッドを最小限に抑え、コンパクトなモデルサイズで高性能を実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:53:24 GMT)
LDPRecover: Recovering Frequencies from Poisoning Attacks against Local Differential Privacy [11.2]
周波数推定のためのローカルディファレンシャルプライバシ(LDP)プロトコルは、毒性攻撃に対して脆弱である。毒殺事件から正確な集積周波数を復元する手法であるLPPRecoverを提案する。以上の結果から, LDPRecoverは様々な毒素攻撃に対して, 正確かつ広く適用可能であることが示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:54:27 GMT)
SciQAG: A Framework for Auto-Generated Science Question Answering Dataset with Fine-grained Evaluation [11.1]
SciQAGは、大規模言語モデル(LLM)に基づく科学文献の大規模なコーパスから高品質な科学質問応答ペアを自動生成するフレームワークである。我々は,24分野にわたる22,743の科学論文から抽出された188,042のQAペアを含む大規模で高品質な科学QAデータセットを構築した。 SciQAG-24DはLLMの科学質問応答能力を評価するための新しいベンチマークタスクである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:25:50 GMT)
Pseudo-RIS: Distinctive Pseudo-supervision Generation for Referring Image Segmentation [11.0]
画像セグメンテーション(RIS)を参照するための疑似監督として,参照表現を用いた高品質セグメンテーションマスクを自動生成する新しいフレームワークを提案する。本手法は, RISベンチマークデータセットにおいて, 弱いSoTA法とゼロショットSoTA法の両方を著しく上回っている。また、未確認領域における完全に教師された手法を超越し、RIS内のオープンワールドの課題に取り組む能力を証明している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:14:48 GMT)
A Machine Learning and Explainable AI Framework Tailored for Unbalanced Experimental Catalyst Discovery [10.9]
各種成分の触媒収率を正確に分類するために,堅牢な機械学習と説明可能なAI(XAI)フレームワークを導入する。このフレームワークは、触媒データの不足と不均衡を処理するために設計された一連のMLプラクティスを組み合わせる。このような知見は, 新規触媒の開発・同定において, 優れた性能を有する化学者を支援することができると信じている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:09:53 GMT)
Was it Slander? Towards Exact Inversion of Generative Language Models [10.8]
大きな言語モデル(LLM)のトレーニングには、時間とお金のかなりの投資が必要となる。悪い信仰の俳優は、偽造されたアウトプットを公に報告することで、LLMの評判を損なおうとするかもしれない。このようなスランダー攻撃に対する防御には、偽造された出力の入力を再構築するか、それが存在しないことを証明する必要がある。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:08:06 GMT)
FACTS About Building Retrieval Augmented Generation-based Chatbots [10.4]
我々は3つのNVIDIAチャットボットを使った経験に基づいて、RAGベースのチャットボットを構築するためのフレームワークを提案する。 FACTSフレームワーク(フレッシュネス、アーキテクチャ、コスト、テスト、セキュリティ)を導入し、15のRAGパイプライン制御ポイントを提示し、大小のLLM間の精度-遅延トレードオフに関する実証的な結果を提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:20:59 GMT)
Identification and Estimation of the Bi-Directional MR with Some Invalid Instruments [10.3]
両方向メンデルランダム化(MR)における純粋観測データから因果効果を推定する難題について考察する。本稿ではまず,観測データから双方向MRの同定を理論的に検討する。我々は,有効なIV集合を発見し,興味の因果効果を推定するクラスタ融合的手法を開発した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:58:30 GMT)
Generative AI for RF Sensing in IoT systems [10.3]
RF(Radio Frequency)センシングは、人間の活動と環境変化の費用対効果と非侵襲的なモニタリングで際立っている。従来のRFセンシング手法は、ノイズ、干渉、不完全なデータ、高いデプロイメントコストなど、重大な課題に直面している。本稿では、IoTエコシステムにおけるこれらの制限を克服するジェネレーティブAI(GenAI)の可能性について検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:51:44 GMT)
Token-Mol 1.0: Tokenized drug design with large language model [10.3]
Token-Molはトークンのみの3Dドラッグデザインモデルで、2Dや3D構造を含む全ての分子情報をトークンにエンコードする。トランスデコーダアーキテクチャ上に構築され、ランダム因果マスキング技術を用いて訓練されている。既存の分子事前学習モデルと比較して、Token-Molはより幅広い下流タスクを扱うのに優れた習熟度を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:22:15 GMT)
Towards Adaptive Pseudo-label Learning for Semi-Supervised Temporal Action Localization [10.2]
既存の手法はしばしば厳密な条件に基づいて擬似ラベルをフィルタリングし、最適でない擬似ラベルのランク付けと選択につながる。擬似ラベル選択を容易にするための適応擬似ラベル学習フレームワークを提案する。本手法は,各種半教師付き環境下での最先端性能を実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:00:19 GMT)
Drantal-NeRF: Diffusion-Based Restoration for Anti-aliasing Neural Radiance Field [10.2]
Neural Radiance Field (NeRF) が生成したレンダリングにおけるアーティファクトのエイリアス化は、長く続くが複雑な問題である。拡散を利用した抗エイリアス性神経放射場(Drantal-NeRF)の復元法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:32:13 GMT)
Deep Symbolic Optimization for Combinatorial Optimization: Accelerating Node Selection by Discovering Potential Heuristics [10.2]
本稿では,その利点を生かした,新しい記号的最適化学習フレームワークを提案する。 Dso4NSは高次元離散記号空間内の数学的表現の探索をガイドし、最高性能の数学的表現を解法に組み込む。実験では、Dso4NSが高品質な表現の学習に有効であることを示し、CPUマシンにおける既存のアプローチよりも優れていた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:54:46 GMT)
Invisible Optical Adversarial Stripes on Traffic Sign against Autonomous Vehicles [10.2]
本稿では、発光ダイオードを用いて、カメラのローリングシャッター効果を利用して交通標識認識を誤認する攻撃を提案する。交通標識のストライプは人間には見えないので、攻撃はステルスです。本稿では,カメラセンサ,知覚モデル,自律運転システムのレベルにおける対策について論じる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:55:31 GMT)
RAG vs. Long Context: Examining Frontier Large Language Models for Environmental Review Document Comprehension [10.2]
大規模言語モデル(LLM)は、様々な領域にわたる多くの研究問題に適用されている。 NEPA文書における法律・技術・コンプライアンス関連情報のニュアンスを理解するためのLCMの能力を測定する。我々は,LLM とRAG を駆動するモデルの性能を,異なるタイプの質問に対処する上で比較した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:33:09 GMT)
H-FCBFormer Hierarchical Fully Convolutional Branch Transformer for Occlusal Contact Segmentation with Articulating Paper [10.0]
咬合接触検出は, 咬合機能の喪失を回復するための重要なツールである。咬合接触検出の最も一般的な方法は紙の調音である。階層的損失関数を組み合わせた多クラス視覚変換器と完全畳み込みネットワークのセマンティックセマンティックセグメンテーションモデルを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:42:39 GMT)
Understanding the Influence of Motivation on Requirements Engineering-related Activities [9.9]
本研究では,RE関連活動のモチベーションに影響を与える文脈的,因果的,介入的条件を説明する理論を開発する。我々は、これらの戦略の結果とともに、モチベーション・シチュエーションを強化する戦略や、モチベーション・シチュエーションを強化する戦略を特定します。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:55:19 GMT)
PEER: Expertizing Domain-Specific Tasks with a Multi-Agent Framework and Tuning Methods [9.7]
GPT-4は大きな可能性を秘めているが、性能、コスト、データプライバシーの重大な三重項に直面している。 PEER(Plan, Execute, Express, Review)マルチエージェントフレームワークを紹介する。これは、正確な質問分解、高度な情報検索、包括的な要約、厳密な自己評価を統合することで、ドメイン固有のタスクを体系化する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:49:05 GMT)
A third-order finite difference weighted essentially non-oscillatory scheme with shallow neural network [9.7]
双曲保存法則のニューラルネットワークに基づく有限差分重み付き本質的に非振動(WENO)方式を導入する。平均二乗誤差と平均二乗誤差の2つの損失関数を用いて、WENO3-JS重みをラベルとして計算する。これらのWENO3-SNNスキームは, WENO3-JSとWENO3-Zのシミュレーションと比較して, 1次元実例で優れた結果を示し, 2次元実例で改善された挙動を示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:43:58 GMT)
Interpretable Differential Diagnosis with Dual-Inference Large Language Models [9.6]
大規模言語モデル(LLM)は強力な言語処理能力を持つ。 570の公開臨床ノートに専門家による解釈を付加した新しいDDxデータセットを開発した。本稿では,LLMが双方向の解釈を行うことを可能にする新しいフレームワークであるDual-Infを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:58:37 GMT)
A New Self-organizing Interval Type-2 Fuzzy Neural Network for Multi-Step Time Series Prediction [9.5]
本稿では,マルチステップ時系列予測のための複数出力(SOIT2FNN-MO)を備えた新しい自己組織化間隔型2ファジィニューラルネットワークを提案する。予測精度,不確実性処理,モデル解釈可能性を改善するため,9層ネットワークを開発した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:35:44 GMT)
Vanilla Feedforward Neural Networks as a Discretization of Dynamical Systems [9.4]
本稿では,従来のネットワーク構造に戻り,バニラフィードフォワードネットワークが動的システムの数値的な離散化であることを示す。我々の結果は、フィードフォワードニューラルネットワークの近似特性を理解するための新しい視点を提供することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:53:32 GMT)
Out-of-distribution generalisation in spoken language understanding [9.4]
テストデータは、トレーニングデータと予期せず異なるときに、アウト・オブ・ディストリビューション(OOD)と呼ばれる。我々は、SLURPデータセットの修正版を導入し、SLUタスクにおけるOODの一般化をテストするためのデータ分割を特徴とする。エンドツーエンドのSLUモデルには、一般化のための限られた能力がある。モデル解釈可能性技術を用いることで、モデルの一般化の難しさに寄与する要因を明らかにした。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:27:38 GMT)
Bucket Pre-training is All You Need [9.3]
大規模言語モデル (LLM) は様々な自然言語処理タスクにおいて例外的な性能を示した。文書の連結と分割を伴う事前学習のための従来の固定長データ合成戦略は、ノイズを導入し、長距離依存関係をキャプチャするモデルの能力を制限できる。固定長のパラダイムを超えて,より柔軟で効率的な事前学習手法を提供するマルチポケットデータ合成手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:27:23 GMT)
Explaining Graph Neural Networks for Node Similarity on Graphs [9.1]
ノード類似性を計算するためのGNNベースの手法を,説明とともに拡張する方法について検討する。具体的には、GNNにおける説明に対する2つのアプローチの性能を評価する。 MIの説明とは異なり、勾配に基づく説明は3つの望ましい性質を持つ。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:20:47 GMT)
A review of graph neural network applications in mechanics-related domains [9.1]
グラフニューラルネットワーク(GNN)は、不規則な基盤構造を持つグラフデータから順応的に学習することで、課題に取り組むための有望なツールとして登場した。近年、GNNの進歩に触発された複雑な力学関連の応用が急増しているのを目撃している。本稿では, メカニクス関連領域におけるGNNアプリケーションの詳細な概要について述べる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:39:03 GMT)
Multi-Path Long-Term Vessel Trajectories Forecasting with Probabilistic Feature Fusion for Problem Shifting [9.0]
本稿では,AIS(Automatic Identification System, 自動識別システム)データに基づく多経路長期船体軌道予測の精度向上を課題とする。我々は,1～3時間のAISデータを入力として,深層自動エンコーダモデルとフェーズド・フレームワーク・アプローチを開発した。提案モデルでは, 平均誤差と中央値誤差をそれぞれ11km, 6kmと精度良く予測できることを実証した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:01:54 GMT)
I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling [8.9]
本稿では,医用画像合成のための新しい敵対モデルI2I-Mambaを提案する。 I2I-Mambaは、ターゲットモダリティ画像の合成における最先端CNNおよびトランスフォーマーベースの手法に対して優れた性能を提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:07:44 GMT)
Review-LLM: Harnessing Large Language Models for Personalized Review Generation [8.9]
大規模言語モデル(LLM)は、優れたテキストモデリングと生成能力を示している。パーソナライズされたレビュー生成のためのLLMをカスタマイズするReview-LLMを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:22:19 GMT)
Raising the Ceiling: Conflict-Free Local Feature Matching with Dynamic View Switching [8.9]
本稿では3つの側面からマッチングのシーリングを向上するRCMという特徴マッチング手法を提案する。 RCMは、画像中のマッチング可能な点の不足に対処する動的ビュー切替機構を導入している。 RCMは、複数対1のマッチング戦略を通じて、ターゲット画像内の競合に対処する、競合のない粗いマッチングモジュールを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:06:32 GMT)
Simplifying Source-Free Domain Adaptation for Object Detection: Effective Self-Training Strategies and Performance Insights [8.7]
本稿では,コンピュータビジョンにおけるオブジェクト検出のためのソースフリー領域適応に着目した。最近の研究では、ソースフリーオブジェクト検出(SFOD)の様々なソリューションが提案されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:18:38 GMT)
Trainable Highly-expressive Activation Functions [8.7]
トレーニング可能な高表現能アクティベーション機能であるDiTACを紹介する。 DiTACはモデル表現性と性能を高め、しばしば大幅な改善をもたらす。また、セマンティックセグメンテーション、画像生成、回帰問題、画像分類といったタスクにおいて、既存のアクティベーション関数(後者が固定可能かトレーニング可能かに関わらず)を上回っている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:49:29 GMT)
ESM+: Modern Insights into Perspective on Text-to-SQL Evaluation in the Age of Large Language Models [8.6]
テストスイート実行精度(EXE)と実行セットマッチング精度(ESM)の2つの主要な指標を分析し、このタスクの堅牢性を調べ、欠点に対処する。以上の結果から,EXE と ESM の偽陽性率は 11.3% と 13.9% であり, ESM+ はそれぞれ 0.1% と 2.6% であることがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:20:19 GMT)
Boosting Transferability in Vision-Language Attacks via Diversification along the Intersection Region of Adversarial Trajectory [8.6]
視覚言語事前学習モデルは多モーダル逆例(AE)の影響を受けやすい本研究では,AEsの多様性を拡大するために,対向軌道の交点領域に沿って多様化する手法を提案する。潜在的なオーバーフィッティングを緩和するため、最適化経路に沿った最後の交差点領域から逸脱する逆テキストを指示する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:04:43 GMT)
MixSumm: Topic-based Data Augmentation using LLMs for Low-resource Extractive Text Summarization [8.4]
低リソース抽出テキスト要約のためのMixSummを提案する。具体的には、MixSummはオープンソースのLLMであるLLaMA-3-70bを推進し、複数のトピックから情報を混合するドキュメントを生成する。 ROUGEスコアとL-Eval(参照不要LLaMA-3に基づく評価法)を用いて,生成された要約の質を測定した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:25:47 GMT)
Secondary Structure-Guided Novel Protein Sequence Generation with Latent Graph Diffusion [8.3]
粗い二次構造情報に基づいてタンパク質配列を生成する潜在グラフ拡散モデルであるCPDiffusion-SSを導入する。 CPDiffusion-SSは、構造的制約を保ちながら、様々な新しいアミノ酸配列を生産する際の柔軟性を向上することを示した。本研究は,提案手法による世代業績の生物学的意義を明らかにするための一連の事例研究である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:54:26 GMT)
Multi-task Prompt Words Learning for Social Media Content Generation [8.2]
マルチモーダル情報融合に基づく新しい単語生成フレームワークを提案する。一連のプロンプト単語を含むテンプレートを用いて、ChatGPTを誘導し、高品質なツイートを生成する。コンテンツ生成分野における効果的な客観的評価基準がない場合には、ChatGPTツールを用いてアルゴリズムが生成した結果を評価する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:46:32 GMT)
SoK: What don't we know? Understanding Security Vulnerabilities in SNARKs [8.2]
ゼロ知識証明(ZKP)は、プライバシと検証可能性を提供する理論概念から、実用的な実世界の実装まで進化してきた。 SNARK(Succinct Non-Interactive Argument of Knowledge)は、最も重要なイノベーションのひとつ。本稿では,実生活SNARK実装のエンドツーエンドセキュリティ特性の評価に焦点をあてる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:45:11 GMT)
Standard compliant video coding using low complexity, switchable neural wrappers [8.1]
標準互換性、高性能、低復号化の複雑さを特徴とする新しいフレームワークを提案する。私たちは、標準的なビデオをラップして、異なる解像度でビデオをエンコードする、共同最適化されたニューラルプリプロセッサとポストプロセッサのセットを使用します。我々は、異なるアップサンプリング比を処理できる低複雑性のニューラルポストプロセッサアーキテクチャを設計する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:36:45 GMT)
STAR: SocioTechnical Approach to Red Teaming Language Models [8.1]
STARは、大きな言語モデルの赤いチーム安全性のための現在のベストプラクティスを改善する社会技術フレームワークである。これは、人間のレッドチームのためにパラメータ化された命令を生成することで、ステアビリティを高め、リスク表面のカバレッジを改善する。特定のグループに対する害を評価するために、人口統計と一致させることで信号品質を改善し、より敏感なアノテーションをもたらす。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:53:11 GMT)
Improving Medical Multi-modal Contrastive Learning with Expert Annotations [8.1]
eCLIPはCLIPモデルの強化版であり、放射線学者の眼球熱マップの形で専門家アノテーションを統合する。対照的なマルチモーダル医療画像解析における重要な課題、特にデータ不足と「モダリティギャップ」に対処する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:45:54 GMT)
Tuning Vision-Language Models with Candidate Labels by Prompt Alignment [8.0]
視覚言語モデル(VLM)は、画像テキストペアの大規模なトレーニングデータセットから高品質な表現を学習することができる。プロンプト学習は、下流タスクに適応するためにVLMを微調整する一般的なアプローチである。本稿では,学習過程を候補ラベルでガイドする枠組みを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:19:31 GMT)
Mitigating Backdoor Attacks using Activation-Guided Model Editing [8.0]
バックドア攻撃は、機械学習モデルの完全性と信頼性を損なう。本研究では,そのようなバックドア攻撃に対抗するために,機械学習による新たなバックドア緩和手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:43:47 GMT)
Few-Shot Domain Adaptive Object Detection for Microscopic Images [8.0]
Few-shot Domain Adaptive Object Detection (FSDAOD) は、限られたラベル付きデータを持つターゲットドメインにオブジェクト検出器を適用するという課題に対処する。医学データセットは、高いクラス不均衡と背景類似性を示し、偽陽性が増加し、ターゲットドメインの平均精度(マップ)が低下する。私たちのコントリビューションには、少数ショットシナリオのためのドメイン適応型クラスバランス戦略、複数レイヤのインスタンスレベル間およびドメイン内アライメント、インスタンスレベルの分類損失が含まれています。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:11:58 GMT)
MemWarp: Discontinuity-Preserving Cardiac Registration with Memorized Anatomical Filters [8.0]
本稿では,メモリネットワークを利用した学習フレームワークであるMemWarpについて紹介する。本手法は, 利用可能な心臓データセットの実験において, 登録精度を大幅に向上し, 現実的な変形を生じさせる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:42:29 GMT)
Boosting Medical Image Synthesis via Registration-guided Consistency and Disentanglement Learning [7.9]
本稿では,医用画像合成のためのアンタングル学習を取り入れた登録誘導整合性を提案する。提案したアーキテクチャは、合成および登録モジュール内でのタスク特異性を促進する。合成モジュールは、解剖学的構造と様々な形態にまたがる特定のスタイルを分離する能力を持つように設計されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:41:26 GMT)
Deconstructing What Makes a Good Optimizer for Language Models [7.9]
SGD,Adafactor,Adam,Lionなどの最適化アルゴリズムを自己回帰言語モデリングの文脈で比較する。以上の結果から,SGDを除いて,これらのアルゴリズムは最適性能の両立が可能であることが示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:11:40 GMT)
Virtual Agents for Alcohol Use Counseling: Exploring LLM-Powered Motivational Interviewing [7.9]
アルコール使用カウンセリングのためのモチベーション面接(MI)を行う仮想カウンセラーを開発した。当社のアプローチでは,迅速なエンジニアリングと統合をユーザフレンドリな仮想プラットフォームに統合し,現実的で共感的なインタラクションを促進する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:50:08 GMT)
CHOPS: CHat with custOmer Profile Systems for Customer Service with LLMs [7.9]
現在のカスタマサービスモデルは、カスタマプロファイルと限定的に統合されている。既存のAPI統合は、現実世界のカスタマーサービスシナリオに不可欠な精度とエラー回避の多様性を強調している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:33:28 GMT)
Learning local equivariant representations for quantum operators [7.7]
本稿では,複数の量子演算子を予測するための新しいディープラーニングモデルSLEMを提案する。 SLEMは、計算効率を劇的に改善しながら最先端の精度を達成する。 SLEMの能力は多種多様な2次元および3次元材料にまたがって実証し,限られた訓練データでも高い精度を達成できることを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:20:10 GMT)
Beyond Benchmarking: A New Paradigm for Evaluation and Assessment of Large Language Models [7.5]
大規模言語モデル(LLM)を評価するための現在のベンチマークでは、コンテンツ制限の評価、不適切な更新、最適化ガイダンスの欠如などの問題がある。本稿では,LLMのベンチマーク評価評価のための新しいパラダイムを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:42:02 GMT)
Probabilistic learning rate scheduler with provable convergence [7.5]
学習率スケジューラは、実際に学習アルゴリズムの収束を加速することに成功した。しかしながら、それらの最小限への収束は理論的には証明されていない。単調に減少する条件に適合しない確率論的学習率スケジューラ(PLRS)を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:52:24 GMT)
TDML -- A Trustworthy Distributed Machine Learning Framework [7.3]
大規模モデル(LM)の急速な進歩は、計算資源の需要を増大させた。この需要は、サプライチェーンの遅延と大手テック企業による独占的な買収により、可用性の限界によって悪化している。本稿では、リモートトレーナーのコーディネートとワークロードの検証にガイダンスを活用する、テキスト信頼に値する分散機械学習(TDML)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:22:28 GMT)
ColonMapper: topological mapping and localization for colonoscopy [7.2]
そこで本研究では,実人の大腸で動作可能なトポロジカルマッピングとローカライゼーションシステムを提案する。マップは、各ノードが実際のイメージのセットでコロン位置をコードするグラフであり、エッジはノード間のトラバーサビリティを表す。 ColonMapperは、マップを自律的に構築し、それに対して2つの重要なユースケースでローカライズすることができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:00:34 GMT)
A First-Order Multi-Gradient Algorithm for Multi-Objective Bi-Level Optimization [7.1]
マルチオブジェクト・バイ・レベル最適化(MOBLO)問題について検討する。既存の勾配に基づくMOBLOアルゴリズムはヘッセン行列を計算する必要がある。 FORUMと呼ばれるMOBLOの高効率な1次多重勾配法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:21:47 GMT)
Approximate Unitary $k$-Designs from Shallow, Low-Communication Circuits [6.8]
近似ユニタリ$k$-デザインは、平均が最初の$k$モーメントまでのハールランダムアンサンブルに近いようなユニタリと測度のアンサンブルである。我々はサブシステム間の通信がシステムサイズで$O(1)$である乗法誤り近似単位の$k$-designアンサンブルを構築する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:43:23 GMT)
What type of inference is planning? [6.7]
すべての一般的な推論は、変分問題におけるエントロピー項の異なる重み付けに対応することを示す。我々は、マルコフ決定過程において近似的な計画を実行することができるループ的信念伝達の類推を開発する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:51:30 GMT)
Uncertainty-Aware Probabilistic Graph Neural Networks for Road-Level Traffic Accident Prediction [6.6]
Stemporal Zero-Inflated Tweedie Graph Neural Network STZITZTDGNNは,道路交通事故予測における最初の不確実性を考慮したグラフ深層学習モデルである。本研究は,STIDGNNが対象道路の監視を効果的に行い,都市道路の安全対策を改善することを実証するものである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:05:37 GMT)
TIP: Tabular-Image Pre-training for Multimodal Classification with Incomplete Data [6.4]
不完全なデータに頑健なマルチモーダル表現を学習するための新しいフレームワークであるTIPを提案する。具体的には、TIPは、データ不足に対処するためのマスク付き再構築タスクを含む、自己教師付き学習(SSL)戦略を調査する。 TIPは、完全なデータシナリオと不完全なデータシナリオの両方において、最先端の教師付き/SSLイメージ/マルチモーダルアルゴリズムより優れている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:16:15 GMT)
NDST: Neural Driving Style Transfer for Human-Like Vision-Based Autonomous Driving [6.3]
自律運転(AD)における利用者の快適性を高める新しいアプローチであるニューラル・ドライビング・スタイル・トランスファー(NDST)を提案する。 NDSTはパーソナライズドブロック(PB)を従来のベースライン駆動モデル(BDM)に統合する PBは自己設定システムとして機能し、BDMの変更を必要とせず、個人の運転行動に適応し、学習する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:26:45 GMT)
Automated Neural Patent Landscaping in the Small Data Regime [6.3]
近年の特許活動の急速な拡大により、効率的かつ効果的な自動的特許造成アプローチの必要性が高まっている。本稿では, 難解な事例に対して, 性能を著しく向上させる, 自動型ニューラルネットワーク特許造園システムを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:13:37 GMT)
Interactive Segmentation Model for Placenta Segmentation from 3D Ultrasound images [6.2]
3次元超音波画像からの胎盤体積測定は妊娠の予後を予測するのに重要である。胎盤セグメンテーションタスクに対する人間-イン-ループアプローチとは対照的に,公開可能な3次元インタラクティブセグメンテーションモデルの評価を行った。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:58:26 GMT)
Multilingual Blending: LLM Safety Alignment Evaluation with Language Mixture [6.2]
我々は,様々な大規模言語モデルの安全性アライメントを評価するために,混合言語クエリ応答方式であるMultilingual Blendingを導入する。本稿では,多言語ブレンディングの有効性に影響を及ぼす可能性のある,言語可用性,形態学,言語ファミリーなどの言語パターンについて検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:26:15 GMT)
How Aligned are Different Alignment Metrics? [6.2]
我々はBrain-Scoreの視覚データを人間の類似性やアライメントの指標とともに分析する。ニューラルスコアと行動スコアの相互相関は非常に低く、時にはネガティブである。この結果は,統合的ベンチマークの重要性を浮き彫りにしているだけでなく,個々のメトリクスを正しく組み合わせて集約する方法に関する疑問も提起している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:36:11 GMT)
Deep Learning-Based Robust Multi-Object Tracking via Fusion of mmWave Radar and Camera Sensors [6.2]
複雑なトラフィックシナリオを通じて、より安全で効率的なナビゲーションを実現する上で、マルチオブジェクトトラッキングは重要な役割を果たす。本稿では,自律走行システムにおける複数物体追跡の精度とロバスト性を高めるために,レーダデータとカメラデータを統合した新しいディープラーニング方式を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:09:09 GMT)
Micro-Expression Recognition by Motion Feature Extraction based on Pre-training [6.0]
マイクロ圧縮認識タスクのための新しい動き抽出戦略(MoExt)を提案する。 MoExtでは、まず、開始フレームと頂点フレームから形状特徴とテクスチャ特徴を分離して抽出し、その後、両方のフレームの形状特徴に基づいてMEに関連する運動特徴を抽出する。提案手法の有効性を3つの一般的なデータセットで検証した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:51:34 GMT)
Fair Column Subset Selection [6.0]
行列列を2つの群に分割した設定を考え,その目的は2つの群の最大誤差再構成を最小限に抑える列の部分集合を選択することである。特定のシナリオでは、各グループごとに列を別々に選ぶことは避けられないため、期待される列数を2倍にする。フェアセッティングのための決定論的レバレッジスコアサンプリング戦略を提案し、2つのグループが存在する場合、最小サイズのカラムサブセットのサンプリングがNPハードとなることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:40:41 GMT)
Metasurface-based Snapshot Shortwave-Infrared Hyperspectral Image Reconstruction with Inter and Intra Prior Learning Network [6.0]
本稿では, 準曲面フィルタとそれに対応するフィルタ選択法に基づくSWIRハイパースペクトルイメージングシステムを提案する。高品質なSWIRハイパースペクトル画像再構成を実現するために,新しい先進的および先進的学習展開フレームワークを提案する。実験の結果,提案手法は既存の手法よりも高速かつ優れた性能でHSIを再構築可能であることが示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:41:36 GMT)
Cut-and-Paste with Precision: a Content and Perspective-aware Data Augmentation for Road Damage Detection [5.9]
道路の損傷は、道路インフラの完全性、安全性、耐久性に重大な課題をもたらす可能性がある。近年、道路監視アプリケーションにおいて、画像に基づく損傷検出のための様々なデータ駆動手法が研究されている。本稿では、コンテンツ認識(すなわち、画像中の道路の真の位置を考える)と視点認識(すなわち、注入された損傷と対象画像との視点の差を考慮する)の両面から改善されたカット・アンド・ペースト増強手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:24:19 GMT)
A Proposed S.C.O.R.E. Evaluation Framework for Large Language Models : Safety, Consensus, Objectivity, Reproducibility and Explainability [5.9]
大規模言語モデル(LLM)の評価のための5つの重要な側面を提案する。我々はS.C.O.R.E.が将来のLCMモデル評価フレームワークの基礎となることを示唆する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:45:16 GMT)
SparseLIF: High-Performance Sparse LiDAR-Camera Fusion for 3D Object Detection [5.9]
クエリベースのパラダイムは、明示的な高密度なBEV機能構築を伴わずに低レイテンシを採用するため、スパース3D検出器は大きな注目を集めている。本稿では,エンドツーエンドのマルチモーダル3Dオブジェクト検出のための高性能フルスパース検出器を提案する。論文提出時点では、SparseLIFはnuScenesデータセット上で最先端のパフォーマンスを達成しており、検証セットとテストベンチマークの両方で1位になっている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:20:23 GMT)
Semantic Similarity Score for Measuring Visual Similarity at Semantic Level [5.9]
シーングラフ生成とグラフマッチングに基づくセマンティック類似度スコア(Semantic similarity Score)のセマンティック評価指標を提案する。このメトリクスは、画像の意味レベル情報のセマンティックレベルの違いを測定することができ、視覚的意味コミュニケーションシステムにおける評価に使用できる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:34:13 GMT)
A 'MAP' to find high-performing soft robot designs: Traversing complex design spaces using MAP-elites and Topology Optimization [5.8]
高品質で製造可能な設計を生産する計算設計ツールは広く採用されていない。本研究では,多種多様な高性能ソフトロボットを生成するための階層的設計最適化手法について検討する。本手法は, ソフトと剛性の両方において, 複雑な設計領域の部品を設計するための新しい枠組みを提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:27:17 GMT)
Automating Weak Label Generation for Data Programming with Clinicians in the Loop [5.7]
本稿では,データセットのいくつかの代表的なサンプルのラベルについて,専門家に問い合わせるアルゴリズムを提案する。専門家によって割り当てられたラベルは、完全なデータセットのラベル付けを誘導し、データプログラミングパイプラインで使用される弱いラベルを生成する。医療時系列調査では,3,265サンプル中50～130サブセットのラベル付けが17～28%,F1の13～28%の精度向上を示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:29:22 GMT)
Tail Bounds on the Runtime of Categorical Compact Genetic Algorithm [5.5]
我々は、この特定のアルゴリズムを分類コンパクト遺伝的アルゴリズム(ccGA)と呼ぶ。理論的には、可能なカテゴリ数$K$、次元数$D$、実行時の学習レート$eta$の依存性を分析する。 COMとKValのランタイムはそれぞれ、高い確率で$O(sqrtD ln (DK) / eta)$と$Theta(D ln K/ eta)$である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:26:05 GMT)
KpopMT: Translation Dataset with Terminology for Kpop Fandom [5.5]
専門家翻訳者は韓国の投稿やコメントのために1kの英訳を提供している。我々は,KpopMT上のGPTモデルを含む既存の翻訳システムを評価し,その故障事例を同定する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:14:51 GMT)
Fusion of atomic W-like states in cavity QED systems [5.5]
いくつかの原子と単一モードの空洞場との間の大きな相互作用に基づいて、原子W様状態に対する2種類の新規かつ効率的な融合スキームを提案する。提案手法の核融合過程は粒子損失を伴うが, 対応する成功確率は高く, 固定され, 高い核融合効率がもたらされる可能性がある。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:01:05 GMT)
MediSyn: Text-Guided Diffusion Models for Broad Medical 2D and 3D Image Synthesis [5.4]
医学では、このアプリケーションはデータの不足という重要な課題に対処することを約束する。リアルで多様な2Dおよび3D画像を生成することによって、これらのモデルは、アルゴリズムによるトレーニングと研究のためのリッチでプライバシーを尊重するリソースを提供する。テキストプロンプトによる医用画像とビデオ合成の大幅な改善が見られた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:04:06 GMT)
OccFusion: Depth Estimation Free Multi-sensor Fusion for 3D Occupancy Prediction [5.3]
マルチセンサ融合に基づく自律走行システムの3次元占有予測従来の核融合による3次元占有予測は2次元画像特徴の深度推定に頼っていた。深度推定自由マルチモーダル融合フレームワークOccFusionを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:08:14 GMT)
Explainable Hyperdimensional Computing for Balancing Privacy and Transparency in Additive Manufacturing Monitoring [5.3]
本研究では,DP-HD(differial Privacy-Hyperdimensional Computing)フレームワークを導入し,モニタリングの精度に対するノイズの影響を予測する。オーバーハング異常検出のためのAMの実世界の高速融解プールデータに対する実験結果から,DP-HDは操作効率,予測精度,堅牢なプライバシ保護を実現することが示された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:37:05 GMT)
On LLM Wizards: Identifying Large Language Models' Behaviors for Wizard of Oz Experiments [5.2]
ウィザード・オブ・オズの手法(WoZ)は、人間のウィザードロールプレイが手軽に利用できない技術である、広く採用されている研究手法である。現代の大規模言語モデル(LLM)のロールプレイ能力の増大により、WoZ実験のWizardsとしてLLMを適用でき、スケーラビリティと低コストが向上した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:05:56 GMT)
DeepGene Transformer: Transformer for the gene expression-based classification of cancer subtypes [5.2]
がんとそのサブタイプは世界中の死因の約30%を占める。マルチヘッド自己認識モジュールを用いた高次元遺伝子発現の複雑さに対処するDeepGene Transformerを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:16:00 GMT)
Large Language Model-Augmented Auto-Delineation of Treatment Target Volume in Radiation Therapy [5.2]
視覚言語モデルに基づくRTターゲットボリューム自動デラインネットワークであるRadformerを提案する。 Radformerは、他の最先端モデルに比べてセグメンテーション性能が優れている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:32:55 GMT)
Towards Secure Virtual Elections: Multiparty Computation of Order Based Voting Rules [5.2]
電子投票システムの主な課題の1つは、計算結果がキャスト投票と一致していることを示すことである。本稿では,秩序に基づく投票規則によって規制された選挙のためのセキュアな投票プロトコルを提案する。我々のプロトコルは、必要な出力のみを発行するという意味で、完全な投票秘密を提供するが、キャスト投票に関する他の情報は明らかにしない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:15:00 GMT)
Geospecific View Generation -- Geometry-Context Aware High-resolution Ground View Inference from Satellite Views [5.1]
多視点衛星画像から弱い幾何学やテクスチャを最大限に尊重するジオ特殊ビューを生成するための新しいパイプラインを提案する。本手法は,衛星画像からの包括的情報を用いて,位置の地上画像を直接予測する。我々のパイプラインは、衛星画像のみに基づいて、実物に近い地上ビューを初めて生成したものであることを実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:51:50 GMT)
Enhancing Global Maritime Traffic Network Forecasting with Gravity-Inspired Deep Learning Models [5.1]
水生非先住民種(NIS)は生物多様性に重大な脅威を与え、生態系を破壊し、農業、林業、漁業に重大な経済被害を与える。本研究では,世界の港湾地域間の海上輸送を予測するための物理インフォームドモデルを開発した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:33:58 GMT)
The Human Factor in AI Red Teaming: Perspectives from Social and Collaborative Computing [4.9]
レッド・チームリング(Red Teaming)とは、軍事・サイバーセキュリティの応用に端を発する敵対的なテストの実践である。このワークショップは、この実践にまつわる概念的および経験的課題を考察し、しばしば非開示協定によって不透明にされる。将来の研究は、公正からメンタルヘルス、その他の潜在的な害のある分野まで幅広いトピックを探求することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:02:13 GMT)
Swin SMT: Global Sequential Modeling in 3D Medical Image Segmentation [4.9]
我々は,Swin UNETRに基づく新しいアーキテクチャであるSwin Soft Mixture Transformer (Swin SMT)を紹介する。このモデルにはSoft Mixture-of-Experts (Soft MoE)が組み込まれており、複雑で多様な長距離依存関係を効果的に扱う。 We evaluate Swin SMT on the public available TotalSegmentator-V2 dataset, including 117 major anatomical structure in WBCT images。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:05:22 GMT)
Conformalized Teleoperation: Confidently Mapping Human Inputs to High-Dimensional Robot Actions [4.9]
低次元人間の入力から高次元ロボット動作へのマッピングを学習する。我々のキーとなる考え方は、訓練時に補助地図を適応させ、高次元のアクション量子化を付加的に見積もることである。本研究では,不確実なユーザ入力やロボットの状態を検出する不確実なインターバル機構を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:34:05 GMT)
Inference Performance Optimization for Large Language Models on CPUs [4.7]
大規模言語モデル(LLM)は、様々なタスクにまたがる優れたパフォーマンスと大きな潜在能力を示している。 GPUハードウェアリソースが限られている場合、CPU上の代替オプションを検討することができます。本稿では,CPU上でのLCMの高速化を目的とした,容易にデプロイ可能な推論性能最適化ソリューションを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:53:49 GMT)
High-Resolution Cloud Detection Network [4.7]
本稿では,高分解能クラウド検出ネットワーク(HR-cloud-Net)を紹介する。 HR-cloud-Netは高分解能表現モジュール、レイヤーワイド機能融合モジュール、多分解能ピラミッドプールモジュールを統合している。ノイズの多い拡張画像に基づいて訓練された学生ビューを教師ビューで教師が通常の画像を処理するという,新しいアプローチが導入された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:54:03 GMT)
Advancements in Recommender Systems: A Comprehensive Analysis Based on Data, Algorithms, and Evaluation [4.7]
RSには、アルゴリズム改善、ドメインアプリケーション、ユーザの振る舞いと認識、データ処理とモデリング、社会的影響と倫理の5つの主要な研究トピックが含まれている。コールドスタート、データスパシティ、データ中毒といったデータ関連の問題、関心の漂流、デバイスとクラウドのコラボレーション、非因果駆動、マルチタスクの競合といったアルゴリズム上の問題には、顕著な影響がある。収集された文献は主に主要な国際データベースに基づいており、今後の研究は今後さらに拡大していく予定である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:02:21 GMT)
Human-mediated Large Language Models for Robotic Intervention in Children with Autism Spectrum Disorders [4.6]
本稿では自閉症スペクトラム障害(ASD)児に対するロボット介入における視点学習の実践について述べる。提案手法では,大規模言語モデル (LLM) を用いてテキストとして言語コンテンツを生成し,ロボット音声で子供に届ける。実際の視点指導セッションを模擬したドメインエキスパートと10分間のセッションを行い,研究員は子どもの参加者として行動した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:27:45 GMT)
Mitigating scattering in a quantum system using only an integrating sphere [4.6]
量子系では、散乱はデコヒーレンスと損失の両方に寄与する。本稿では,散乱の悪影響を著しく軽減できる実験手法を提案する。我々の手法は、破壊的ランダムプロセスから量子相関を回復するための先駆的なステップである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:07:49 GMT)
A Comprehensive Survey on the Security of Smart Grid: Challenges, Mitigations, and Future Research Opportunities [4.6]
本稿では,スマートグリッドの高度なコンポーネントによって導入された新たな攻撃面に着目し,様々な攻撃ベクトルの詳細な解析を行う。次に,ゲーム理論,グラフ理論,機械学習など,革新的な検出・緩和戦略を検討する。まず,既存戦略と新興戦略の研究機会について考察し,新たな技術の可能性を探る。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:03:24 GMT)
Quantum Triticality of Bosonic Atomic-Molecular Mixtures with Feshbach Coupling [4.6]
我々は,3次元のFeshbachカップリングを持つボゾン原子-分子混合系の機能的定式化を開発する。分子超流動(MSF)、原子分子超流動(AMSF)、相分離(PS)の3つの領域を特徴とする豊富な基底相図を構築した。厳密には,AMSF相が位相分離線の境界に触れると音速が消えることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:24:36 GMT)
Learning linear operators: Infinite-dimensional regression as a well-behaved non-compact inverse problem [4.5]
経験的観測から2つのヒルベルト空間の間の線型作用素を$theta$で学習する問題を考察する。この目標を$theta$の逆問題として、フォワード演算子が一般に非コンパクトであるような特徴で再定義できることが示される。この逆問題は、スカラー応答回帰の導出に伴う既知のコンパクト逆問題と等価であることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:08:27 GMT)
Optimal number of parametrized rotations and Hadamard gates in parametrized Clifford circuits with non-repeated parameters [4.4]
量子回路における非クリフォードゲート数を削減するための効率的なアルゴリズムを提案する。この手法はクリフォードゲートとパラメタライズドローテーションからなるパラメタライズド回路に最適であることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:08:18 GMT)
PAT: Pixel-wise Adaptive Training for Long-tailed Segmentation [4.4]
長い尾のセグメンテーションに適した革新的なPixel-wise Adaptive Training (PAT)技術を提案する。 PATには,(1)クラスワイド勾配等級均質化,2)ピクセルワイドクラス固有損失適応(PCLA)の2つの重要な特徴がある。 PATは、NyUデータセットで現在の最先端を2.2%上回る、大幅なパフォーマンス向上を示している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:26:35 GMT)
Deep-Graph-Sprints: Accelerated Representation Learning in Continuous-Time Dynamic Graphs [4.4]
連続時間動的グラフ(CTDG)は相互接続された進化するシステムのモデリングに不可欠である。 Deep-Graph-Sprints (DGS)は、低遅延推論要求のCTDG上での効率的な表現学習のために設計された、新しいディープラーニングアーキテクチャである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:44:25 GMT)
Feasibility Study on Active Learning of Smart Surrogates for Scientific Simulations [4.4]
深層ニューラルネットワーク(DNN)のサロゲートトレーニングにアクティブラーニングを組み込むことの可能性を検討する。これにより、インテリジェントで客観的なトレーニングシミュレーションの選択が可能になり、広範なシミュレーションデータを生成する必要がなくなる。その結果、スマートサロゲートのための高性能コンピューティング基盤の開発の基礎となった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:00:20 GMT)
DaBiT: Depth and Blur informed Transformer for Joint Refocusing and Super-Resolution [4.3]
多くの現実のシナリオでは、録画されたビデオは偶然の焦点がぼやけている。本稿では、焦点ずれ(再焦点)とビデオ超解像(VSR)に最適化されたフレームワークを提案する。我々は、既存のビデオ復元方法よりも1.9dB以上のPSNR性能で、最先端の結果を得る。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:19:44 GMT)
RoBus: A Multimodal Dataset for Controllable Road Networks and Building Layouts Generation [4.3]
ロードネットワークとビルディングレイアウト(RoBus)の制御可能な生成のための評価指標を備えたマルチモーダルデータセットを導入する。 RoBusは、これまでのところ、都市世代で最初の、そして最大のオープンソースデータセットだ。我々は,RoBusデータセットを統計的に分析し,既存の道路網と建築レイアウト生成手法の有効性を検証した。道路ネットワークや建物レイアウトの生成プロセスにおいて,道路配向や建物密度などの都市特性を取り入れた新しいベースラインを設計する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:55:01 GMT)
DIOR-ViT: Differential Ordinal Learning Vision Transformer for Cancer Classification in Pathology Images [4.3]
本稿では,2組のサンプル間の分類クラスラベルの差分を定義・学習する微分順序学習問題を提案する。差分順序学習の導入により,がんの診断精度と信頼性が向上することが実証された。提案手法は,クラスラベル間の順序関係が関係する他の疾患や問題にも適用すべきである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:42:27 GMT)
SGM-PINN: Sampling Graphical Models for Faster Training of Physics-Informed Neural Networks [4.3]
SGM-PINNは物理情報ニューラルネットワーク(PINN)のトレーニング効率を向上させるグラフベースの重要度サンプリングフレームワークである提案手法の利点を実証し,従来の最先端サンプリング手法と比較して3倍の収束性を実現した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:31:50 GMT)
Exploring the Boundaries of On-Device Inference: When Tiny Falls Short, Go Hierarchical [4.2]
Hierarchical Inference (HI)システムは、選択したサンプルをエッジサーバやクラウドにオフロードして、リモートML推論を行う。本稿では, HIの精度, レイテンシ, エネルギーの測定値に基づいて, デバイス上での推論性能を系統的に比較する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:05:43 GMT)
Study on Aspect Ratio Variability toward Robustness of Vision Transformer-based Vehicle Re-identification [4.2]
本稿では,様々なアスペクト比で訓練されたモデルを融合する,新しいViTベースのReIDフレームワークを提案する。提案手法は,平均精度が91.0%,平均精度が80.9%,平均精度が91.0%,平均精度が80.9%であった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:02:42 GMT)
Class-Discriminative Attention Maps for Vision Transformers [4.1]
我々は,下流タスクに敏感な説明を生成するために,クラス識別アテンションマップ(CDAM)を開発した。 CDAMは既知のクラスや潜在概念に関して特徴的重要性を推定する。特に,既存の重要度推定器では十分なクラス感度が得られないことが示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:39:59 GMT)
Einstein-Podolsky-Rosen Steering Criterion and Monogamy Relation via Correlation Matrices in Tripartite Systems [4.1]
量子ステアリングの非対称性は、一方のデバイス非依存の量子情報処理に不可欠である。相関行列を用いて,任意の3量子状態に対する新規かつ有望な操舵基準を導出する。本稿では, ステアリング基準とモノガミーの関係を, いくつかの代表例を用いて示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:15:52 GMT)
Towards a text-based quantitative and explainable histopathology image analysis [4.1]
テキストベースの定量的・説明可能な病理画像解析を提案し,これをTQxと呼ぶ。検索した単語は、病理像を定量化し、理解可能な特徴埋め込みを生成するために使用される。その結果、TQxは、計算病理学における一般的な視覚モデルに匹敵する病理像を定量化し、分析できることを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:33:43 GMT)
FALFormer: Feature-aware Landmarks self-attention for Whole-slide Image Classification [4.1]
全スライド画像(WSI)のスライドレベル分類は、デジタルおよび計算病理学において重要な問題として広く認識されている。本稿では,WSI全体を処理可能な効率的なスライドレベル分類モデルFALFormerを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:24:40 GMT)
A Bi-consolidating Model for Joint Relational Triple Extraction [4.0]
リレーショナルトリプルを抽出する現在の手法は、エンティティ認識に依存することなく、生文の可能なエンティティペアに基づいて直接予測を行う。このタスクは、複数の関係三重項が文中に1つまたは2つの実体を共有するという深刻な意味的重なり合う問題に悩まされる。関係三重関係に関連する局所的・大域的意味的特徴を同時に強化することにより、この問題に対処するバイコンソリデーションモデルを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:23:11 GMT)
Counting Distinct Elements in the Turnstile Model with Differential Privacy under Continual Observation [3.9]
挿入や削除を処理するすべての異なるプライベートなメカニズムは、比較的弱いイベントレベルのプライバシ定義の下でも、最低でもT1/4$の付加エラーがあることを示す。最大フリップパンシー$w$を持つすべてのターンタイルストリームに対して、$O(sqrtw cdot polylog T)$加法誤差で異なる要素の数を連続的に出力するアイテムレベル微分プライベート機構を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:18:36 GMT)
Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search [3.9]
高次元空間における近似近接探索(ANNS)は、機械学習分野における重要な課題である。本稿では,グラフ内のノードの近傍を探索する際の確率的保証を提供する手法を提案する。次に,グラフ内のどの近傍が正確な距離計算を行うべきかを効率的に同定する新しい手法PEOを紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:05:43 GMT)
Learning Speed Adaptation for Flight in Clutter [3.9]
動物は自分の運動の速度を自分の能力や観察する環境に適応させることを学ぶ。モバイルロボットはまた、タスクを効率的に達成するための攻撃性と安全性をトレードオフする能力を示す必要がある。この研究は、未知の、部分的に観測可能な乱雑な環境において、速度適応の能力を持つ飛行車両を養うことを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:57:01 GMT)
The Selective G-Bispectrum and its Inversion: Applications to G-Invariant Networks [3.8]
我々は,$G$-Bispectrumをテキスト選択型$G$-Bispectrumに還元できることを示す。ニューラルネットワークへの統合によって、従来のアプローチと比較して精度と堅牢性が向上することを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:35:04 GMT)
Panoptic Segmentation of Galactic Structures in LSB Images [3.8]
低表面輝度(LSB)画像中の銀河構造を局所化するための深層学習の利用について検討する。本稿では,銀河構造の多クラス分割と非晶質画像汚染物質の拡張に対する新しい統一的アプローチを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:26:26 GMT)
Parameter Efficient Fine Tuning for Multi-scanner PET to PET Reconstruction [3.7]
潜在能力に感銘を受ける。 PEFT (Efficient Fine-Tuning, PEFT) は, PEFTを有効活用して限られたデータを改善することを目的としている。本稿ではPETITEについて紹介する。 MultI-Scanner PET と PET Reconstruction の効率的なファインチューニングは、パラメータの1%未満を使用する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:12:26 GMT)
Report on the NSF Workshop on Sustainable Computing for Sustainability (NSF WSCS 2024) [3.7]
本報告では,2024年4月にネバダ州アレクサンドリアのNSFで開催された,持続可能コンピューティングに関するNSFワークショップのプロセスについて報告する。ワークショップの主な目標は、持続可能コンピューティングと持続可能性のためのコンピューティングの両方のテーマに沿った研究イニシアチブの開発を進めることであった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:40:30 GMT)
SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmentation [3.7]
軽度の感染部位を有する軽度の症候群は、異常な警告であり、疾患の早期診断の最前線である。畳み込みニューラルネットワーク(CNN)のような深層学習アルゴリズムは、自然または医学的対象のセグメンテーションに使用されている。医用画像における小型物体分割を高精度に行うための,新しいスケール可変アテンションベースネットワーク(SvANet)を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:53:37 GMT)
ChatGPT Doesn't Trust Chargers Fans: Guardrail Sensitivity in Context [3.7]
本稿では,ユーザに関する情報がLCMの要求実行を拒否する可能性にどのように影響するかを検討する。若年、女性、アジア系アメリカ人の人物は、検閲された情報や違法な情報を要求する際に、拒否するガードレールを発生させる傾向にある。それぞれのカテゴリーやアメリカンフットボールチームでさえ、ChatGPTはおそらく政治的イデオロギーを推測しているようだ。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:47:55 GMT)
An Experiment with the Use of ChatGPT for LCSH Subject Assignment on Electronic Theses and Dissertations [3.6]
著者らはChatGPTを使用して、タイトルと抽象化に基づいて電子的論文や論文(ETD)の主題的見出しを生成する。その結果,LCSHをETDに割り当てるのに必要なカタログ作成時間を短縮できる可能性が示唆された。 LLMによるLCSHの妥当性, 消耗性, 特異性を検証し, 向上するためには, ヒトカタログは依然として不可欠である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:14:32 GMT)
CHILLI: A data context-aware perturbation method for XAI [3.6]
機械学習(ML)モデルの信頼性は評価が難しいが、リスクの高いアプリケーションや倫理的に敏感なアプリケーションでは重要である。本稿では,文脈に意識された摂動を生成することで,データコンテキストをXAIに組み込む新しいフレームワークCHILLIを提案する。これは説明の正確さと正確さを両立させることが示されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:18:07 GMT)
Robust, randomized preconditioning for kernel ridge regression [3.5]
本稿では,カーネルリッジ回帰問題を解くための2つのランダム化プレコンディショニング手法について検討する。最先端のパフォーマンスを持つ2つの新しいメソッドを導入している。提案手法は広い範囲のKRR問題を解き、実用的な応用に最適である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:46:15 GMT)
LMSeg: A deep graph message-passing network for efficient and accurate semantic segmentation of large-scale 3D landscape meshes [3.5]
本稿では,大規模3次元ランドスケープメッシュ上でのセマンティックセマンティックセグメンテーションを効率的かつ正確に行うために,エンドツーエンドのディープグラフメッセージパッシングネットワークであるLMSegを提案する。偏心グラフの階層的および局所的なプーリングは、効果的な幾何集約モジュールとともに、小さく不規則なメッシュオブジェクトの高速な推論と正確なセグメンテーションを可能にする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:52:25 GMT)
SPIN: SE(3)-Invariant Physics Informed Network for Binding Affinity Prediction [3.4]
タンパク質-リガンド結合親和性の正確な予測は、薬物開発に不可欠である。伝統的な手法は、しばしば複合体の空間情報を正確にモデル化するのに失敗する。この課題に適用可能な様々な帰納バイアスを組み込んだモデルSPINを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:40:07 GMT)
Instrumentation and Analysis of Native ML Pipelines via Logical Query Plans [3.2]
私たちは、データサイエンティストが機械学習パイプラインを開発し、検証し、監視し、分析するのを支援するために、高度に自動化されたソフトウェアプラットフォームを構想しています。一般的なライブラリに依存したMLパイプラインコードから"論理クエリプラン"を抽出する。これらの計画に基づいて、パイプラインのセマンティクスとインスツルメンタを自動で推論し、MLパイプラインを書き換えて、データサイエンティストが手動でアノテートしたり、コードを書き換えたりすることなく、さまざまなユースケースを可能にします。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:35:02 GMT)
Can LLMs Augment Low-Resource Reading Comprehension Datasets? Opportunities and Challenges [3.1]
GPT-4は、既存の読解データセットを強化するために使用できる。この研究は、QAシステムのための合成データ拡張器としてLLMを初めて分析した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:35:17 GMT)
MLRS-PDS: A Meta-learning recommendation of dynamic ensemble selection pipelines [3.1]
本稿では,動的アンサンブル選択のための最適なプール生成手法を提案するメタラーニングレコメンデーションシステム(MLRS)を提案する。このシステムは、データセットのメタ機能から構築されたメタモデルを使用して、与えられたデータセットに対して最も適切なプール生成スキームとDESメソッドを予測する。このメタ学習レコメンデーションシステムは従来の固定プールやDESメソッドの選択方法よりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:31:57 GMT)
Spin/Phonon Dynamics in Single Molecular Magnets: II. spin/phonon entanglemen [3.1]
分子磁石におけるスピン-フォノン相互作用を探索するための新しい量子埋め込み法を提案する。システム全体を「システム」と「ベース」のサブアンサンブルに正確に分解することで、我々のアプローチは、これまで難解だった問題を単純化する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:03:35 GMT)
Spin/Phonon Dynamics in Single Molecular Magnets: I. quantum embedding [3.1]
単一分子磁石 (SMM) と金属有機フレームワーク (MOF) は、量子情報処理、スケーラブルな量子コンピューティング、寿命とコヒーレンス時間などにおいて大きな関心を集めている。これらの系の制限因子は、しばしば分子構造の振動運動と相互作用と結合によって引き起こされるスピンの劣化である。この研究は、分子磁気のスピンフォノンダイナミクスを解析するための体系的なプロジェクション/埋め込み方式を導入する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:49:34 GMT)
Anomaly detection using data depth: multivariate case [3.0]
異常検出はデータ分析と機械学習の一分野である。データ深度(Data depth)は、データセットへの空間の任意の点の帰属度を測定する統計関数である。本稿では、データ深度を効率的な異常検出ツールとして検討し、異常ラベルを低い深さの観測値に割り当てる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:02:03 GMT)
Transformer Alignment in Large Language Models [3.0]
我々は,大規模言語モデル (LLM) を,高次元の離散的,結合的,非線形,動的システムによる埋め込みの変換とみなす。この観点は、変換器ブロックを通過する個々のトークンの軌跡の追跡を動機付け、ジャコビアン行列を通してこれらの軌跡に沿って系を線形化する。公開されている38個の LLM の解析において、残余ヤコビアンの上と右の特異ベクトルのアライメント、および線形性および層ワイド指数的成長の出現を明らかにする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:30:27 GMT)
How Inverse Conditional Flows Can Serve as a Substitute for Distributional Regression [3.0]
逆流変換(DRIFT)を用いた分布回帰の枠組みを提案する。 DRIFTは解釈可能な統計モデルと柔軟なニューラルネットワークの両方をカバーする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:47:05 GMT)
Synthetic to Authentic: Transferring Realism to 3D Face Renderings for Boosting Face Recognition [3.0]
画像から画像への変換技術(I2I)の3次元レンダリング画像への現実性伝達の可能性について検討した。本研究では、3Dレンダリング画像にリアリズムを移すことにより、3Dレンダリング画像をよりリアルに見せることにより、顔認識(FR)システムの性能を高めることができることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:07:39 GMT)
Evaluating the Role of Security Assurance Cases in Agile Medical Device Development [3.0]
医療機器のサイバーセキュリティ問題は患者の安全を脅かし、悪用された場合に害を与える可能性がある。標準と規制は、そのようなデバイスのベンダーに対して、サイバーセキュリティのリスクの評価と、それらの緩和に関する説明を提供するよう要求している。セキュリティ保証ケース(SAC)は、これらの要素を構造化された引数としてキャプチャする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:34:53 GMT)
Progressive Growing of Patch Size: Resource-Efficient Curriculum Learning for Dense Prediction Tasks [2.9]
本稿では資源効率の高い暗黙的なカリキュラム学習手法であるPatch Sizeのプログレッシブグロース(Progressive Growing of Patch)を紹介する。我々のカリキュラムのアプローチは、モデルトレーニング中にパッチサイズを拡大することで定義され、タスクの難しさが徐々に増大する。このアプローチにより、ネットワークトレーニングのランタイム、計算コスト、CO$2$の排出を大幅に削減できる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:14:54 GMT)
TransFusion -- A Transparency-Based Diffusion Model for Anomaly Detection [2.8]
本稿では,2つのデータセットにおける最先端性能を実現する識別異常検出手法を提案する。 TransFusion は VisA と MVTec AD の両方のデータセットで、画像レベルの AUROC はそれぞれ98.5% と 99.2% である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:44:42 GMT)
Arbitrary Distributions Mapping via SyMOT-Flow: A Flow-based Approach Integrating Maximum Mean Discrepancy and Optimal Transport [2.7]
本稿では,2つの未知分布からの標本間の対称最大平均誤差を最小化することにより,可逆変換を訓練するSyMOT-Flowと呼ばれる新しいモデルを提案する。結果として得られる変換はより安定で正確なサンプル生成をもたらす。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:34:07 GMT)
MCMC-Correction of Score-Based Diffusion Models for Model Composition [2.7]
拡散モデルは、スコアまたはエネルギー関数のどちらかの観点からパラメータ化することができる。本稿では,エネルギーモデルにインスパイアされたスコアパラメータ化と受理確率の計算を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:24:07 GMT)
Lossless Acceleration of Large Language Model via Adaptive N-gram Parallel Decoding [2.6]
適応的なN-gram並列デコーディング(ANPD)を導入し,複数のトークンを同時に生成することで推論を高速化する。 ANPDは、処理速度を向上しながら、元の出力の完全性を維持する。実験では、LLaMAのようなモデルとその微調整されたモデルが3.67倍の速度向上を示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:38:32 GMT)
Topological Transitions in a Kerr Nonlinear Oscillator [2.6]
カー非線形発振器(KNO)は一対の定常固有状態、対向位相のコヒーレント状態をサポートする。断熱的固有状態の進化は、3つの物理的観測物全てを測定するために用いられる。位相遷移は、最初のチャーン数のジャンプによって明らかにされる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:01:05 GMT)
Early Explorations of Lightweight Models for Wound Segmentation on Mobile Devices [2.5]
高齢化は、高齢者の慢性的な傷の増加など、医療に多くの課題をもたらす。セラピストによる創傷評価への現在のアプローチは主観的であり、スマートフォン写真からコンピュータ支援による創傷認識の必要性を強調している。スマートフォンをベースとした創傷セグメンテーションに適した3つの軽量アーキテクチャについて,初期研究を行った。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:44:22 GMT)
Constrained Measurement Incompatibility from Generalised Contextuality of Steered Preparation [2.5]
2部構成のベルのシナリオでは、1つの翼における測定の不整合性は必要であり、非局所性を明らかにするのに十分である。我々は、自然の任意の実効的理論の許容される測度の不整合性に制限を与える、一般化された文脈性であると主張する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:36:35 GMT)
Explaining Spectrograms in Machine Learning: A Study on Neural Networks for Speech Classification [2.4]
本研究では,ニューラルネットワークで学習した音声の正確な分類のための識別パターンについて検討する。母音分類のためのニューラルネットワークのアクティベーションと特徴を調べることで、スペクトログラムでネットワークが何を見るかについての洞察を得る。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:37:18 GMT)
Employing Software Diversity in Cloud Microservices to Engineer Reliable and Performant Systems [2.4]
本研究は,システムの信頼性と性能を同時に向上するために,ソフトウェアの多様性を活用することを提案する。私たちの仕事の土台は信頼性基準の導出です。目標は、より信頼性の高いバージョンに対して、可能な限り多くのバージョンを保存しながら、より高いレプリカ数を維持することである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:34:39 GMT)
Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent [2.4]
Jack of All Trades (JAT) は、シーケンシャルな意思決定タスクに最適化されたユニークな設計のトランスフォーマーベースのモデルである。 JATは、その種の最初のモデルはhttps://huggingface.co/jat-project/jatで完全にオープンソース化されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:56:14 GMT)
Real-time system optimal traffic routing under uncertainties -- Can physics models boost reinforcement learning? [2.3]
本稿では,強化学習を物理モデルに統合し,性能,信頼性,解釈可能性を向上させるアルゴリズムであるTransRLを提案する。物理モデルからの情報を活用することで、TransRLは最先端の強化学習アルゴリズムより一貫して優れている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:53:26 GMT)
The Computational Learning of Construction Grammars: State of the Art and Prospective Roadmap [2.3]
本稿では,構成文法学習の計算モデルに関する技術の現状を文書化し,レビューする。これまでに提案された様々な方法論と得られた成果を合成することを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:45:02 GMT)
Characterizing Encrypted Application Traffic through Cellular Radio Interface Protocol [2.2]
5G無線通信が,ユーザのアプリケーションをリアルタイムに正確に推測するためのサイドチャネルとなることを示す。オンラインショッピング、音声/ビデオ会議、ビデオストリーミング、Over-The-Top(OTT)メディアプラットフォームという4つの異なるカテゴリのアプリケーションについて検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:39:56 GMT)
TriQXNet: Forecasting Dst Index from Solar Wind Data Using an Interpretable Parallel Classical-Quantum Framework with Uncertainty Quantification [2.2]
地磁気嵐はGPS、衛星通信、電力網などの重要なインフラを破壊する可能性がある。本研究は、Dst予測のためのハイブリッド古典量子ニューラルネットワークであるTriQXNetを紹介する。我々のモデルは、古典的および量子コンピューティング、共形予測、およびハイブリッドアーキテクチャ内に説明可能なAI(XAI)を統合する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:53:38 GMT)
Use of a Structured Knowledge Base Enhances Metadata Curation by Large Language Models [2.2]
メタデータは、データセットの発見可能性、アクセシビリティ、相互運用性、再利用性を保証する上で重要な役割を果たす。本稿では,メタデータ標準への準拠性を改善するため,大規模言語モデル (LLM) の可能性について検討する。 NCBI BioSampleレポジトリの肺がん関連サンプルを無作為に記録した200データについて実験を行った。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:06:48 GMT)
Enhancing Quantum Circuit Noise Robustness from a Geometric Perspective [2.2]
ノイズの多い環境での量子エラーは、量子情報技術の進歩の大きな障害である。本稿では、ツイリング技術を用いて、回路ノイズの堅牢性を向上する方法を示す。本研究は、制御パルスの単なる最適化以上のノイズ耐性量子制御を実現するための経路を照らす。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:06:17 GMT)
From Principles to Rules: A Regulatory Approach for Frontier AI [2.2]
レギュレータは、フロンティアAI開発者に安全対策を適用するよう要求する。要件は、ハイレベルな原則や特定のルールとして定式化できる。これらの規制アプローチは「原則ベース」および「ルールベース」規制と呼ばれ、補完的な強みと弱みを持っている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:45:15 GMT)
Towards Complete Causal Explanation with Expert Knowledge [2.2]
特定のエッジマークを含む最大祖先グラフ(MAG)のマルコフ同値クラスを制限する問題について検討する。我々は、Ali et al. 2009からの予想を含むマルコフ同値類全体のある性質を証明した。本論文では,従来のルールを一般化し,専門的な知識を本質的なグラフに付加する3つの健全な図形配向規則を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:20:17 GMT)
Uncovering Layer-Dependent Activation Sparsity Patterns in ReLU Transformers [2.2]
我々は、トレーニングの過程でトークンレベルのスパーシリティがどのように進化し、より広いスパーシリティパターンにどのように結びつくかを探る。特に、ネットワークの第一層と最後の層は、多くの点で、空間性との関係を逆転させることを実証する。さらに、ReLU次元の「オフ」現象を探求し、「ニューロン死」がトレーニングのダイナミクスによって引き起こされていることを示す証拠を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:10:10 GMT)
A Critical Review of Causal Reasoning Benchmarks for Large Language Models [2.1]
因果関係に関するLLMベンチマークの概要を概観する。有用なベンチマークやベンチマークのセットが満たすべき基準のセットを導出します。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:11:51 GMT)
A Clinical Benchmark of Public Self-Supervised Pathology Foundation Models [2.1]
本研究は, がん診断を含む臨床関連エンドポイントと, 2つの医療センターからの標準病院手術中に発生する各種バイオマーカーとを関連づけた臨床スライドを含む病理データセットの収集について述べる。これらのデータセットを利用して、公共病理基盤モデルの性能を体系的に評価し、新しい基礎モデルをトレーニングし、適切な事前学習モデルを選択するためのベストプラクティスに関する洞察を提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:38:45 GMT)
Derivations of Bloch (Majorana--Bloch) equation, von Neumann equation, and Schrödinger--Pauli equation [2.1]
電子スピンに対する空間非依存のフォン・ノイマン方程式は、古典的ブロッホ方程式やマヨラナ-ブロッホ方程式から数学的に導かれる。 Schr"odinger--Pauli方程式は量子力学と最近開発された共量子動的フレームワークの両方から導出される。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:06:37 GMT)
Stochastic Gradient Descent for Two-layer Neural Networks [2.0]
本稿では、過パラメータ化された2層ニューラルネットワークに適用した場合の降下(SGD)アルゴリズムの収束率について検討する。提案手法は,NTKのタンジェントカーネル(NTK)近似と,NTKが生成する再生カーネル空間(RKHS)の収束解析を組み合わせたものである。我々の研究フレームワークは、カーネルメソッドと最適化プロセスの間の複雑な相互作用を探索し、ニューラルネットワークのダイナミクスと収束特性に光を当てることを可能にする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:58:57 GMT)
Malicious Path Manipulations via Exploitation of Representation Vulnerabilities of Vision-Language Navigation Systems [2.0]
視覚言語ナビゲーション(VLN)は、ロボットナビゲーションに対する自然言語インタフェースへの課題に対処する効果的な方法として登場した。視覚言語モデルにおいて、全く異なる画像と無関係なテキストの表現とを無意識に修正できることが示される。我々は,多数のランドマークを必要とするコマンドに対して,ロボットが選択経路に従うように,最小限の画像を逆向きに修正できるアルゴリズムを開発した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:32:58 GMT)
When to Accept Automated Predictions and When to Defer to Human Judgment? [2.0]
我々は、トレーニングされたニューラルネットワークの出力がどのように変化するかをクラスタリングを用いて分析し、出力とクラスセントロイド間の距離を測定する。本稿では,分布変化による予測の信頼度を評価する指標として,この距離を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:45:52 GMT)
Solving Linear Systems on Quantum Hardware with Hybrid HHL++ [1.9]
HHL (Harrow-Hassidim-Lloyd) は、臨界量子線型代数プリミティブである。線形系行列のスケーリング係数を決定するための新しいアルゴリズムを提案する。量子システムモデルH系列のトラップイオン量子コンピュータ上で、修正されたハイブリッドHHLを動作させることにより、我々の作業の有効性を実証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:02:04 GMT)
Practical Guide for Causal Pathways and Sub-group Disparity Analysis [1.9]
我々は因果不均質分析を用いて、感度特性と結果の間の因果関係を定量化し、検証する。当社の2段階の調査は、レースがセンシティブな属性として機能するデータセットに焦点を当てています。本研究は,ML分類誤差が最も大きい部分群が,最も影響を受けやすい部分群であることが実証された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:58:42 GMT)
Formal Verification of Object Detection [1.9]
Deep Neural Networks(DNN)は、現実世界のアプリケーションではユビキタスだが、エラーや敵攻撃に対して脆弱である。この研究は、コンピュータビジョンモデルの安全性を確保するために正式な検証を適用するという課題に取り組み、画像分類を超えてオブジェクト検出まで検証を拡張した。本稿では,オブジェクト検出モデルのロバスト性を形式的検証を用いて証明するための一般的な定式化と,最先端の検証ツールと互換性のある実装戦略の概要を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:33:58 GMT)
Promoting AI Competencies for Medical Students: A Scoping Review on Frameworks, Programs, and Tools [1.8]
医療におけるAIの重要性の高まりにもかかわらず、それが伝統的な、しばしば過負荷の医療カリキュラムに採用されている範囲は不明である。このレビューは、AI能力のある医療従事者を構築するための実践的で関連する教育戦略を開発するためのロードマップを提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:34:41 GMT)
Towards Interpretable Foundation Models of Robot Behavior: A Task Specific Policy Generation Approach [1.7]
ファンデーションモデルは、汎用的でユーザフレンドリーなロボットへの、有望な道のりだ。特に、タスク間のモジュラリティの欠如は、モデルの重みが更新されると、他の無関係なタスクの振る舞いが影響を受ける可能性があることを意味します。本稿では,スタンドアロンのタスク固有のポリシーを生成するロボット基盤モデルの設計に対する代替的アプローチを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:55:44 GMT)
The Misclassification Likelihood Matrix: Some Classes Are More Likely To Be Misclassified Than Others [1.7]
本研究では、分散シフト下でのニューラルネットワーク予測の信頼性を定量化するための新しいツールとして、MLM(Misclassification Likelihood Matrix)を紹介した。この研究の意味は、画像の分類を超えて、自動運転車などの自動運転システムで進行中の応用に及んでいる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:43:14 GMT)
KaiRacters: Character-level-based Writer Retrieval for Greek Papyri [1.7]
ギリシア語文では, トリオグラムカイと4つの追加文字(エプシロン, カッパ, ム, オメガ)について, 文字レベルの注釈を導入する。 1ページあたり15文字程度しか使わないことで、パフォーマンスを最大4%まで向上できることが示されています。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:51:34 GMT)
Promises, Outlooks and Challenges of Diffusion Language Modeling [1.6]
Score Entropy Discrete Diffusion (SEDD) は自己回帰生成の代替として有望であることを示す。推論レイテンシの面では、SEDDはGPT-2よりも4.5$times$効率が高い。 SEDDは任意位置でのトークンの条件付けを許すが、SEDDは短いプロンプトを条件付き生成するためにGPT-2よりもわずかに弱いように見える。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:36:06 GMT)
DeblurDiNAT: A Generalizable Transformer for Perceptual Image Deblurring [1.5]
DeblurDiNATは汎用的で効率的なエンコーダ・デコーダ変換器であり、地上の真実に近いクリーンな画像を復元する。本稿では,線形フィードフォワードネットワークと非線形デュアルステージ機能融合モジュールを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:39:03 GMT)
STAGE: Simplified Text-Attributed Graph Embeddings Using Pre-trained LLMs [1.5]
テキスト分散グラフ(TAG)を符号化するグラフニューラルネットワーク(GNN)モデルにおけるノード機能向上手法を提案する。本手法では,Large-Language Models (LLMs) を用いてテキスト属性の埋め込みを生成する。我々は,事前学習したLLMを埋め込みジェネレータとして利用することにより,GNNのアンサンブルトレーニングに堅牢な機能を実現することを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:50:25 GMT)
An application of continuous-variable gate synthesis to quantum simulation of classical dynamics [1.5]
古典非線形力学のKvNシミュレーションのための連続変数量子計算アルゴリズムを提案する。特に、無調波振動ダイナミクスの積-形式ハミルトニアンシミュレーションのための明示的なゲート合成について述べる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:20:48 GMT)
THEA-Code: an Autoencoder-Based IDS-correcting Code for DNA Storage [1.4]
IDS訂正符号における最適解の追求は、理論と工学の両方の観点から関心を惹きつける、オープンな課題である。自動エンコーダをIDS訂正コードとしてデプロイする際の課題を解決するため,識別可能なIDSチャネル,コードワード上のエントロピー制約,ソースシーケンスの補助的再構築など,革新的な手法を提案する。これらの戦略は、オートエンコーダの収束の成功に寄与し、深い学習ベースのIDS補正コードと予測可能なパフォーマンスをもたらす。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:52:56 GMT)
The Ethics of Interaction: Mitigating Security Threats in LLMs [1.4]
この論文は、社会や個人のプライバシに対するこのようなセキュリティ上の脅威に対する、倫理的な悪影響について論じている。われわれは、プロンプト注入、ジェイルブレイク、個人識別情報(PII)露出、性的に明示的なコンテンツ、ヘイトベースのコンテンツという5つの主要な脅威を精査し、彼らの批判的な倫理的結果と、彼らが堅牢な戦略戦略のために作り出した緊急性を評価する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:07:52 GMT)
Sequential Kalman Monte Carlo for gradient-free inference in Bayesian inverse problems [1.4]
逐次カルマンモンテカルロサンプリングを導入し、逆問題における勾配のない推論を行う。 FAKIは正規化フローを用いて、EKIの目標措置のガウスアンザッツを緩和する。 FAKIだけでは、EKIのモデル線形性仮定を正すことはできない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:56:30 GMT)
High-Dimensional Bell States: A Paradigm Shift for Quantum Illumination [1.4]
本稿では、量子照明(QI)の性能を離散変数状態で特徴付けるというオープンな問題を解く。 M rightarrow infty$の極限では、最大絡み合った$M$モードベル状態は最適な性能を達成し、ハイノイズ状態において2モードの圧縮真空と一致し、低ノイズ状態においてそれを超える。この利点は、光系の環境との相互作用が絡み合いを損なうと信じられているため、パラダイムシフトの発見であるベル状態における絡み合いの維持に由来する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:19:31 GMT)
Automatic Extraction of Disease Risk Factors from Medical Publications [1.3]
医学文献から疾患の危険因子の同定を自動化するための新しいアプローチを提案する。まず、リスクファクターの議論の有無に基づいて関連記事を特定し、最後に、特定のリスクファクター情報を抽出する。私たちのコントリビューションには、リスクファクタの自動抽出と、いくつかのデータセットのコンパイルのための包括的なパイプラインの開発が含まれています。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:17:55 GMT)
Automated Question Generation on Tabular Data for Conversational Data Exploration [1.3]
本稿では,会話環境におけるデータセットの関連するスライスに基づいて,自然言語で興味深い質問を推薦するシステムを提案する。我々は、訓練済みの言語モデル(T5)の微調整のバリエーションを使って、特定の方法で自然言語の質問を生成する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:07:05 GMT)
Toto: Time Series Optimized Transformer for Observability [1.1]
TotoはDatadogが開発した時系列予測のためのアートファウンデーションモデルの新たな状態である。 Totoは、観測可能性測定のために特別に調整された、初めての汎用時系列予測基盤モデルである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:40:30 GMT)
Information dynamics in decohered quantum memory with repeated syndrome measurements: a dual approach [1.1]
我々は、繰り返し測定された量子メモリにおける情報力学を本質的に特徴付ける。情報理論診断のための$(d+1)$次元統計力学モデルを開発した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:48:54 GMT)
MNeRV: A Multilayer Neural Representation for Videos [1.1]
ビデオのための多層ニューラル表現(MNeRV)を提案し、新しいデコーダM-デコーダとそのマッチングエンコーダM-エンコーダを設計する。 MNeRVは、より多くのエンコーディング層とデコード層を持ち、冗長なモデルパラメータの問題を効果的に軽減する。ビデオレグレッション再構成の分野では、より少ないパラメータでより良い再現品質(+4.06 PSNR)を達成する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:57:29 GMT)
African Democracy in the Era of Generative Disinformation: Challenges and Countermeasures against AI-Generated Propaganda [1.1]
本稿では,アフリカにおけるジェネレーティブAI駆動型偽情報の拡散に伴うリスクを明らかにすることを目的とする。本稿では, アフリカにおける選挙関連プロパガンダにおける生成AIの活用を事例として, アフリカ政府がAI生成プロパガンダの効果を効果的に抑制する方法について考察する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:24:53 GMT)
A deep graph model for the signed interaction prediction in biological network [1.0]
医薬品研究において、医薬品の再利用戦略は、研究開発コストを削減しつつ、新しい治療法の開発を加速させる。ディープグラフモデルは、複雑な生物学的ネットワークのマッピングにおいて、その精度に欠かせないものとなっている。本研究は, グラフ畳み込みネットワークとテンソル分解を利用して, 署名された化学・遺伝子相互作用を効果的に予測する高度なグラフモデルを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:28:21 GMT)
Subnatural-linewidth fluorescent single photons [1.0]
サブナチュラル線幅の単一光子は、量子光学と量子情報科学において必然的に重要である。ここでは, サブナチュラル線幅を持つ蛍光単光子を生成するために, 普遍的に適用可能なアプローチを提案する。単一光子線幅は外部場により広い範囲で容易に操作できる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:32:32 GMT)
ImPORTance -- Machine Learning-Driven Analysis of Global Port Significance and Network Dynamics for Improved Operational Efficiency [1.0]
本研究は, 船舶の移動によって形成される接続網を解析し, 重要港で共有される共通特性について検討することを目的とする。本研究の成果は, 産業における港湾開発, 資源配分, インフラ計画に関連する意思決定プロセスについて報告することを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:49:45 GMT)
Analyzing Machine Learning Performance in a Hybrid Quantum Computing and HPC Environment [1.0]
我々は、量子シミュレータを「ハイブリッド」量子機械学習(QML)ワークフローに統合する可能性について検討した。私たちは2つのOak Ridge Leadership Computing Facility HPCシステム、AndesとFrontierを使用しました。 Frontierで1GPUを使用すると、FrontierのCPUとローカルな非HPCシステムと比較して56%と77%のスピードアップがあった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:22:02 GMT)
MagicPool: Dealing with Magic State Distillation Failures on Large-Scale Fault-Tolerant Quantum Computer [1.0]
追加の実行遅延を低減するために,マジックステートのプールを提案する。我々は、実行遅延の大きさを検証するために、量子回路のシミュレーションを実行する。その結果, 並列処理により実行遅延が増幅され, プール化は空間コストの小さい実行遅延を効果的に低減することがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:36:26 GMT)
Automated generation of attack trees with optimal shape and labelling [1.0]
本稿では,攻撃木の自動生成の問題に対処する。精度を犠牲にすることなく,ラベルのツリーサイズと情報長を最小化する攻撃木生成アルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:16:20 GMT)
Category Adaptation Meets Projected Distillation in Generalized Continual Category Discovery [0.9]
Generalized Continual Category Discovery (GCCD)は、新しいカテゴリを明らかにしながら、シーケンシャルに到達し、部分的にラベル付けされたデータセットから学習に取り組む。伝統的な方法は、古い知識を忘れないように特徴蒸留に依存する。本稿では,学習可能なプロジェクタと特徴蒸留を統合し,過去の知識を犠牲にすることなくモデル適応性を向上する手法を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:16:25 GMT)
Multi-objective Representation for Numbers in Clinical Narratives Using CamemBERT-bio [0.9]
本研究の目的は,医学文献から抽出した数値を7つの生理カテゴリーに分類することである。キーワード埋め込みをモデルに統合し、数に依存しない戦略を採用する、という2つの主要なイノベーションを紹介します。従来のF1スコア0.89を上回り,CamemBERT-bioの有効性を著しく改善した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:47:52 GMT)
Identifying macro conditional independencies and macro total effects in summary causal graphs with latent confounding [0.9]
要約因果グラフのマクロトータル効果を同定するために,do-calculusは健全かつ完全であることを示す。また, マイクロコンディショナル・インディペンデンシーとマイクロトータル・エフェクトを考慮した場合, これらの結果は成立しないことを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:03:04 GMT)
Hybridizing Target- and SHAP-encoded Features for Algorithm Selection in Mixed-variable Black-box Optimization [0.9]
ELAは問題理解、アルゴリズム設計、自動アルゴリズムの選択や設定などのアプリケーションに使われている。最近まで、ERAは連続変数または離散変数を持つ探索空間に限られており、混合変数の問題を無視していた。このギャップは、ターゲットエンコーディングに基づくアプローチを用いて、混合問題に対する探索的な景観特徴を計算する最近の研究で解決された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:47:31 GMT)
Iris: An AI-Driven Virtual Tutor For Computer Science Education [0.9]
本稿では,対話型学習プラットフォームArtemisに組み込まれたチャットベースの仮想チューターであるIrisを紹介する。アイリスはコンピュータサイエンスの学生をプログラミングの練習を通じて指導することで支援し、実践的に意味のある方法で家庭教師として振る舞うように設計されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:59:15 GMT)
Random unitaries in extremely low depth [0.9]
1D線を含む任意の幾何学上のランダム量子回路は、$log n$ 深さで$n$ qubits以上の近似ユニタリな設計をすることができることを証明している。同様に、1D回路で擬似ランダムユニタリ(PRU)を$textpoly log n $ depthで、全接続回路で$textpoly log n $ depthで構築する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:27:48 GMT)
Automated Creation of Source Code Variants of a Cryptographic Hash Function Implementation Using Generative Pre-Trained Transformer Models [0.8]
ジェネレーティブ・プレトレーニング・トランスフォーマー(Generative Pre-trained Transformer、GPT)は、新鮮で一貫性のある自然言語を生成できる大規模言語機械学習モデルの一種である。本研究では, ハッシュ関数SHA-1の実装において, GPTモデルが新規かつ適切なバージョン, 特に非常に安全でないバージョンを生成する能力について検討した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 03:32:36 GMT)
Structural Design Through Reinforcement Learning [0.8]
Sogymは、TOの物理学を直接報酬関数に組み込むことで、物理的に実現可能で構造的に堅牢な設計を学習するRLエージェントを目指している。結果は、RLが継続的TO問題を解決し、多様な設計ソリューションを探索し、学習する能力を持っていることを示唆している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:38:08 GMT)
The Voice: Lessons on Trustworthy Conversational Agents from "Dune" [0.8]
我々は、生産的なAIが、産業規模で個人化された影響を実装する方法を提供する方法について検討する。悪質な俳優が雇用すれば、世論の形成や不協和を招き、企業から政府まで組織を弱体化させる強力なツールになる恐れがある。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:38:31 GMT)
PhenDiff: Revealing Subtle Phenotypes with Diffusion Models in Real Images [0.7]
PhenDiffは、実際の画像をある状態から別の状態に翻訳することで、細胞性表現型の変化を特定する。薬物治療の低濃度の場合など,表現型の変化が見えない場合や見えない場合において,この手法を質的,定量的に検証する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:04:03 GMT)
EDHOC is a New Security Handshake Standard: An Overview of Security Analysis [0.7]
本報告では,新たなセキュリティハンドシェイクプロトコルEDHOCの正式な解析を行う。標準化されたプロトコルの概要、コミュニティによる公式なセキュリティ分析の概要、そして今後の作業のためのオープンな会場に関する議論を提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:56:05 GMT)
ICD Codes are Insufficient to Create Datasets for Machine Learning: An Evaluation Using All of Us Data for Coccidioidomycosis and Myocardial Infarction [0.7]
医学において、機械学習データセットは、しばしば国際疾患分類(ICD)コードを用いて構築される。機械学習モデルをトレーニングするデータセットを作成するのに最適なICDコードを決定することを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:02:11 GMT)
Infinite quantum signal processing for arbitrary Szegő functions [0.6]
SzegHo関数のクラスに対する無限量子信号処理の問題に対する完全な解を提供する。我々のアルゴリズムは任意のSzegHo関数の位相係数を計算するための最初の安定な数値アルゴリズムである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:57:23 GMT)
MAN TruckScenes: A multimodal dataset for autonomous trucking in diverse conditions [0.6]
我々は、自律トラックのための最初のマルチモーダルデータセットであるMAN TruckScenesを紹介する。様々な環境条件の中で、20秒の740以上のシーンで構成されている。 Man TruckScenesは、360度カバレッジを備えた4Dレーダデータを提供する最初のデータセットである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:32:26 GMT)
Use of social networks to motivate computer-engineering students to participate in self-assessment activities [0.6]
本研究は,ソーシャル・ネットワークとソーシャル・アプリケーションについて,他の多くのツールとみなすべきかどうかを検証しようとするものである。実験では、学生のモチベーションに関する従来の3つの戦略と、ソーシャルネットワークが自己評価タスクの導入、説明、提供に使用された3つの戦略をカバーした。この結果にもかかわらず、統計的分析により、連続的かつ定期的なモチベーションのあるスピーチの戦略として、ソーシャルネットワークの使用が同様の結果を得たことが示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:25:37 GMT)
Evaluating the method reproducibility of deep learning models in the biodiversity domain [0.6]
AIによる生物多様性研究の確立は、透明性の向上、結果の検証、生態学的発見の信頼性向上に不可欠である。本研究では,3段階にわたる深層学習技術を用いた生物多様性関連出版物の評価手法を設計する。本研究は,データセットが出版物の47%で共有されていることを示しているが,多くの出版物はディープラーニング手法に関する包括的情報を持っていない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:19:15 GMT)
Quantum and classical algorithms for nonlinear unitary dynamics [0.6]
我々は$fracd|urangledtという形の非線形微分方程式に対する量子アルゴリズムを提案する。また,Euler法に基づく古典的アルゴリズムを導入し,制限された場合の量子アルゴリズムへのコンパラブルなスケーリングを実現する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:08:58 GMT)
Towards Human-Like Driving: Active Inference in Autonomous Vehicle Control [0.5]
本稿では,アクティブ推論の適用を通じて,自律走行車(AV)制御への新たなアプローチを提案する。アクティブ推論(英: Active Inference)は、脳を予測機械として概念化する神経科学に由来する理論である。提案手法は,深層学習と能動推論を統合してAVの側方制御を制御し,シミュレーション都市環境下で車線追従操作を行う。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:08:27 GMT)
LSM: A Comprehensive Metric for Assessing the Safety of Lane Detection Systems in Autonomous Driving [0.5]
本研究では,車線検出システムの安全性を評価するため,車線安全基準(LSM)を提案する。道路タイプや道路幅を考慮したシーンのセマンティクスなどの付加的要因を車線検出の評価に考慮すべきである。我々は,異なるレーン検出手法を用いて,様々な仮想シナリオにおけるオフライン安全基準を評価し,最先端のパフォーマンス指標と比較した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:11:37 GMT)
FsPONER: Few-shot Prompt Optimization for Named Entity Recognition in Domain-specific Scenarios [0.5]
FsPONERは、少数ショットプロンプトを最適化するための新しいアプローチであり、ドメイン固有のNERデータセットの性能を評価する。 FsPONERは、ランダムサンプリングとTF-IDFとの組み合わせに基づく3つのショット選択法で構成されている。データ不足を考慮した実世界のシナリオでは、TF-IDFを用いたFsPONERは、F1スコアで約10%の微調整モデルを上回っている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:32:50 GMT)
Left/Right Brain, human motor control and the implications for robotics [0.5]
本研究は、運動タスクの制御システムとして、二元的ニューラルネットワークアーキテクチャを探求する。我々は,異なるタスクで観察されるような,半球の特殊化の実現を目指していた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:47:20 GMT)
Circuit-based leakage-to-erasure conversion in a neutral atom quantum processor [0.5]
計算部分空間からの漏れは、現在の最先端の原子-原子量子コンピュータの大きな限界である。リーク検出ユニット(LDU)によるリークエラーから消去エラーへの回路ベース変換を実証する。 LDUは、装置の技術的欠陥によって制限された93.4%の精度で原子損失誤差を検出する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:59:37 GMT)
GothX: a generator of customizable, legitimate and malicious IoT network traffic [0.5]
GothXは、IoTデータセットの正当性と悪意のあるトラフィックを生成するフレキシブルなトラフィックジェネレータである。 GothXは、IoTデータセットからのトラフィックの再生成と強化、新しい現実シナリオの自動実行の2つのユースケースで検証されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:20:20 GMT)
Session Context Embedding for Intent Understanding in Product Search [0.5]
本稿では,検索と再帰におけるコンテキストの捕捉と活用を目的とした,セッションコンテキストのベクトル化手法を提案する。実行時に、セッションの埋め込みは、各リクエストの後にクエリの埋め込み、保存、更新の代替となる。ユーザ意図の理解のために,実行時のセッションコンテキストを無視した戦略の改善を実演する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:21:51 GMT)
Co-designing heterogeneous models: a distributed systems approach [0.4]
本稿では3つの要素に基づく異種システムに適したモデリング手法を提案する。モデルとは何かという推論主義的な解釈、分散システムのメタファ、そして協調設計サイクルは、モデルの実践的な設計と構築を記述している。本手法の適合性について,3つの異なるセキュリティ指向モデルを用いて検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:35:38 GMT)
Learning and Motivational Impact of Game-Based Learning: Comparing Face-to-Face and Online Formats on Computer Science Education [0.4]
本稿では,コンピュータサイエンス教育における教師による教育用ビデオゲームの学習と動機づけの影響について分析する。その効果を、対面とオンラインの両方のフォーマットで比較する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:39:45 GMT)
Reducing the number of qubits in quantum simulations of one dimensional many-body Hamiltonians [0.3]
ブロック再正規化群法(BRGM)を用いたIsingとHeisenbergのモデルについて検討する。 BRGMが比較的少数のスピンであっても、Isingモデルを正確に特徴づけることに成功したことは、複雑な物理系の研究において、その堅牢性と有用性を強調している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:35:42 GMT)
Generative Plant Growth Simulation from Sequence-Informed Environmental Conditions [0.3]
植物成長シミュレーションは、植物または植物系の再構成された視覚表現として特徴付けられる。本研究では、条件付き生成モデルを用いて、植物表現の分布を暗黙的に学習するシーケンスインフォームド植物成長シミュレーションフレームワーク(SI-PGS)を提案する。我々は,SI-PGSが時間的依存を捕捉し,植物の成長の現実的なフレームを連続的に生成できることを実証した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:49:45 GMT)
Digital twin with automatic disturbance detection for real-time optimization of a semi-autogenous grinding (SAG) mill [0.3]
デジタルツインは、クローズドループシステムをエミュレートする3つのモジュールから構成される。モデルは68時間のデータでトレーニングされ、8時間のテストデータで検証された。障害検出は、再トレーニングの必要性を評価し、デジタルツインは、SAGミルをエキスパート制御システムで監督する約束を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:06:33 GMT)
Deformable-Heatmap-Segmentation for Automobile Visual Perception [0.3]
本稿では,オブジェクトの特徴をエンド・ツー・エンドのアーキテクチャで抽出するDHSNetとヒートマップを提案する。 DHSNetは、アップサンプリング演算子とダウンサンプリング演算子をU字型にすることで、低レベル特徴写像と高レベル特徴写像を微調整する。また,ネットワーク上でのより正確なターゲットの提案点を検出するための提案ヒートマップも予測する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:24:53 GMT)
Quantum complexity phase transitions in monitored random circuits [0.3]
監視されたランダム回路における量子状態複雑性のダイナミクスについて検討する。正確な量子状態の複雑性の進化は、測定率を変更する際に相転移を起こす。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:38:54 GMT)
Large Language Model in Financial Regulatory Interpretation [0.3]
本研究では、複雑な金融規制を解釈するための分析ツールとして、LLM(Large Language Models)の革新的利用について検討する。主な目的は、動詞の蒸留や複雑な規制文書の抽出においてLLMを導く効果的なプロンプトを設計することである。この新たなアプローチは、グローバル金融機関の金融報告・リスクマネジメントシステムにおける規制委任事項の実施を円滑化することを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:31:59 GMT)
Achieving Quantum Limits of Exoplanet Detection and Localization [0.2]
本稿では,Quantum Chernoff ExponentとQuantum Fisher Information Matrixによって規定される外惑星検出と局在の量子情報限界について報告する。我々は、高次モードを減衰させることなく、望遠鏡の基本モードを排他的に排除するシステムは、高い恒星-惑星のコントラストの体制において量子最適であることを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:06:10 GMT)
Deep learning in a bilateral brain with hemispheric specialization [0.2]
そこで本研究では,自然界で観測された横性化を模倣する人工ニューラルネットワークを提案する。分析の結果、ヘミスフィアは、重み付けされた注意のタイプを実装するネットワークヘッドによって利用される相補的特徴を表すことがわかった。結果は、二元主義の有効性を示し、生物学的脳における二元主義の議論に寄与し、この原理は、新しいAIシステムに対する帰納的バイアスとなる可能性がある。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:20:11 GMT)
Can ChatGPT Pass a Theory of Computing Course? [0.2]
われわれは,ChatGPTのToCコース合格能力を評価した。 ToCの質問と回答のデータベースを作成し、トピックや構造に関する他のToCオファリングの選択に対応する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:34:06 GMT)
Precision is not limited by the second law of thermodynamics [0.2]
平衡状態から作動する物理的装置は本質的に熱ゆらぎの影響を受けており、その操作精度は制限されている。我々の理論的な発見は、エントロピー散逸と指数関数的にクロック精度のスケーリングを実現する量子多体システムを示す。この発見は、コヒーレント量子力学が従来の熱力学の精度限界を超え、将来の高精度で低散逸の量子デバイスの開発を導く可能性があることを示している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:00:04 GMT)
Long-fiber Sagnac interferometers for twin field quantum key distribution networks [0.2]
サニャックループ構造は、ツインフィールド量子鍵分布ネットワークの実践的な実装において大きな困難を克服するのに役立つ。長繊維と損失光デバイスを含むサニャック系において,レイリー後方散乱雑音は信号対雑音比を制限することを示した。本研究は,大都市量子ネットワークの実現に向けた重要なステップである,長距離TFQKDネットワークに対するサニャックシステムの適合性を示すものである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:34:21 GMT)
Development of an automatic modification system for generated programs using ChatGPT [0.1]
OpenAIのChatGPTは自然言語処理タスクに優れ、ソースコードも生成できる。我々はChatGPTで生成されたコードをテストし、不適切であれば自動的に修正し、適切なコードをユーザに提示するシステムを開発した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:54:23 GMT)
Harnessing Orthogonality to Train Low-Rank Neural Networks [0.1]
本研究は,ニューラルネットワークの学習力学を,トレーニングを通じて重みの特異値分解(SVD)を分析することによって研究する。本稿では,ニューラルネットワークの直交性を利用した新しいトレーニング手法であるOrthogonality-Informed Adaptive Low-Rank(OIALR)トレーニングを紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:59:20 GMT)
High-Entanglement Capabilities for Variational Quantum Algorithms: The Poisson Equation Case [0.1]
離散方程式行列(DPEM)は計算流体力学の分野において不可欠である。量子コンピュータでそれを解くアルゴリズムは、指数空間と時間複雑性のスピードアップを与える可能性がある。本研究は,計算流体力学の将来に量子コンピュータが関与することを示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:59:14 GMT)
iiANET: Inception Inspired Attention Hybrid Network for efficient Long-Range Dependency [0.0]
iiANET(Inception Inspired Attention Network)は,複雑な画像の長距離依存性を捉えるために設計された,効率的なハイブリッドモデルである。基本的なビルディングブロックであるiiABlockはグローバル2D-MHSA(Multi-Head Self-Attention)をレジスタ、MBConv2(MobileNetV2ベースの畳み込み)、拡張畳み込みを並列に統合する。各iABlockの終端にECANET(Efficient Channel Attention Network)を連続的に統合し、チャネルワイドアテンションを校正し、モデル性能を向上させる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:39:02 GMT)
Zero-Shot Class Unlearning in CLIP with Synthetic Samples [0.0]
私たちは、画像テキストペアの巨大なデータセットに基づいてトレーニングされたデュアルビジョン言語モデルであるCLIP内でのアンラーニングに重点を置いています。リプシッツ正則化をCLIPのマルチモーダル文脈に適用する。我々の忘れる手順は反復的であり、合成された忘れ物セットの精度を追跡し、選択された閾値未満の精度で停止する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:16:14 GMT)
Weakly Hadamard diagonalizable graphs and Quantum State Transfer [0.0]
量子状態移動の文脈におけるアダマール対角化可能なグラフについて検討する。弱いアダマール行列と弱いアダマール対角化可能なグラフの多くの性質と構成を提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:27:03 GMT)
Using Low-Discrepancy Points for Data Compression in Machine Learning: An Experimental Comparison [0.0]
ニューラルネットワークのトレーニングのために,低差分点に基づく2つの手法を探索し,大規模なデータセットを削減する。 1つ目はDickとFeischlの手法で、これはデジタルネットと平均化手順に依存している。ディジタルネットを用いた第2の手法を構築するが、平均化ではなくクラスタリングを行う。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:07:55 GMT)
Use of Nash equilibrium in finding game theoretic robust security bound on quantum bit error rate [0.0]
DL04プロトコルは、量子セキュアなダイレクト通信のためのスキームである。受信機、送受信機、盗聴器(Eve)は量子プレイヤーと見なされている。メッセージモードにおけるPavivci'c攻撃に対するDL04プロトコルの脆弱性を確立する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:51:14 GMT)
Unsupervised Beyond-Standard-Model Event Discovery at the LHC with a Novel Quantum Autoencoder [0.0]
本研究は,大型ハドロン衝突型加速器の標準モデルを超える物理を同定するための教師なし異常検出の可能性を探るものである。本稿では,この課題に特化して設計された新しい量子オートエンコーダ回路アンサッツを提案する。量子オートエンコーダ回路の特性について検討し,絡み合いと魔法に着目した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:01:11 GMT)
Transforming qubits via quasi-geometric approaches [0.0]
少数の量子ビットをより大きな数の誤り訂正量子ビットに変換する理論を開発する。 2次元の準直交完全補完符号 (2D-QOCCCSs) と準巡回非対称量子誤り訂正符号 (AQECCs) を準群および群理論特性を介して用いる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:41:26 GMT)
Towards Efficient Quantum Computation of Molecular Ground State Energies using Bayesian Optimization with Priors over Surface Topology [0.0]
変分量子固有解法(VQEs)は、現代の量子コンピュータにおける分子基底状態とエネルギーの計算における有望なアプローチである。量子資源の少ないVQEを解くために,数ショットの回路観測を利用する標準的なベイズ最適化アルゴリズムの修正を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:01:50 GMT)
To Translate or Not to Translate: A Systematic Investigation of Translation-Based Cross-Lingual Transfer to Low-Resource Languages [0.0]
低リソース言語へのトランスファーのための,既存の翻訳に基づく新しいXLT手法の評価と提案を行う。翻訳に基づくアプローチはすべて, mLM でゼロショット XLT を劇的に上回っていることを示す。 MTシステムでサポートされていない言語に対しても,効率的な翻訳ベースのXLT戦略を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:34:49 GMT)
Time-bin entanglement in the deterministic generation of linear photonic cluster states [0.0]
理論的には、個々の量子エミッタを用いて、時間双絡光子の列車を決定論的に生成するための戦略を理論的に検討する。フル微視的数値シミュレーションにおいて, 束縛されたフォトニック量子ビットのかなりの数の線形クラスター状態の理論的生成を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:29:13 GMT)
The Language of Weather: Social Media Reactions to Weather Accounting for Climatic and Linguistic Baselines [0.0]
気候・言語ベースラインを考慮し、天気関連感情分析の精度を向上させる。その結果、天候に反応して公衆の気分をよりよく理解するために、文脈に敏感な手法の重要性が浮かび上がった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:08:24 GMT)
The Design of a 3D Character Animation System for Digital Twins in the Metaverse [0.0]
メタバースは、製造、セキュリティ、輸送、ゲームといった領域において重要なイネーブラーとして登場した。アバターと呼ばれる3Dキャラクタアニメーションの利用はメタバースの実装に不可欠である。このケーススタディは、パイロット応用の基礎を築き、教育、健康、産業用4.0の材料開発用に調整することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:54:06 GMT)
Teaching Type Systems Implementation with Stella, an Extensible Statically Typed Programming Language [0.0]
このコースは、古典的なコンパイラ構築の基礎、特に抽象構文表現、ビジターパターン、構文解析を前提としている。このコースは、最小限のコアと小さな拡張セットを備えた言語Stellaを中心に構築されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:27:21 GMT)
Symmetries and singular behaviors with Bohmian trajectories [0.0]
この研究は、位相に基づく現象を分析する上で、ボーム力学がかなり便利な理論的な枠組みであることをどのように証明するかに焦点を当てている。自由空間で起こる2つの興味深い現象は、エアリービームの自己加速と形状不変性、自然自己焦点である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:58:56 GMT)
Suppressing photon detection errors in nondeterministic state preparation [0.0]
フォトニック量子コンピューティングは、フォトニック量子ビットによるフォールトトレラント量子コンピューティングの候補として期待されている。非決定性ゲートに対応する干渉計における最適ビームスプリッタと位相シフタ角を調整することにより、そのような誤差を抑制する可能性を検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:13:22 GMT)
Study of noise in virtual distillation circuits for quantum error mitigation [0.0]
循環置換回路における非相関な同一ノイズの影響について検討する。観測対象物の期待値の推定は, 騒音の劣化に対して頑健であることがわかった。この結果から,短期的に高い精度で幅広い量子アルゴリズムを実装できることが示唆された。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:23:23 GMT)
Stochastic inflation and entropy bound in de Sitter spacetime [0.0]
インフレーション相におけるド・ジッター時空のエントロピー挙動を解析した。インフラトン場に対する体積重み付き確率分布を採用すると、ド・ジッター時空における有意義なエントロピー挙動を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:31:32 GMT)
Stochastic correction to the Maxwell-Bloch equations via the positive $P$ representation [0.0]
我々は、非直交フェルミオン基底状態の選択において有利な自由度を求める。このアプローチは、光-物質相互作用の半古典的処理と場量子化処理の関連について検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:35:39 GMT)
Stable Weight Updating: A Key to Reliable PDE Solutions Using Deep Learning [0.0]
本稿では,物理インフォームドニューラルネットワーク(PINN)の安定性と精度の向上を目的とした,新しい残差ベースアーキテクチャを提案する。このアーキテクチャは、残りの接続を組み込むことで従来のニューラルネットワークを強化し、よりスムーズなウェイト更新を可能にし、バックプロパゲーション効率を向上させる。特にSquared Residual Networkは、従来のニューラルネットワークと比較して安定性と精度の向上を実現し、堅牢なパフォーマンスを示している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:20:43 GMT)
Smooth Like Butter: Evaluating Multi-Lattice Transitions in Property-Augmented Latent Spaces [0.0]
本研究は,複数格子遷移領域を生成するためのハイブリッドジオメトリ/プロパティ変分オートエンコーダ(VAE)を実装し,評価する。本研究では, ハイブリッドVAEが遷移領域を通した剛性連続性を維持する上で, 高い性能を示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:28:13 GMT)
Simulating quantum field theories on continuous-variable quantum computers [0.0]
我々は、任意のハミルトニアンの下で量子力学状態の時間発展を再現する方法を開発し、証明する。提案手法は,目的状態における所望の時間進化を誘導する特殊準備された量子状態である進化状態を構築することに集中する。 CVQCのフィールド理論を,フィールド値の認識を伴わずに符号化できるフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:50:35 GMT)
SecureReg: Combining NLP and MLP for Enhanced Detection of Malicious Domain Name Registrations [0.0]
本稿では,登録プロセス開始時に疑わしいドメインを特定するための最先端アプローチを提案する。提案システムは,自然言語処理技術(NLP)の新たな組み合わせを利用して,意味的および数値的属性を解析する。 F1スコアは84.86%、精度は84.95%で、悪意のあるドメイン登録を効果的に検出する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:17:50 GMT)
Scalable, high-fidelity all-electronic control of trapped-ion qubits [0.0]
既存の量子ビット制御へのアプローチは、スケールパフォーマンスのトレードオフに悩まされ、有用なデバイスへの進歩を妨げる。我々は、このボトルネックを緩和する電子的に制御されたイオン量子コンピュータのビジョンを示す。最大10キュービットまでの制御が可能な7ゾーンイオントラップで低ノイズサイト選択型単一および2キュービットゲートを実験的に実証した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:21:58 GMT)
SIC-POVMs and orders of real quadratic fields [0.0]
我々は、対称的に完備な正の演算子評価尺度(SICまたはSIC-POVM)を数え、分類する問題を考える。 4 lq d leq 90$ に対して、ワイル=ハイゼンベルク共変 SIC の既知同値類を次元 $d$ で表す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:05:23 GMT)
Robust estimation of the Quantum Fisher Information on a quantum processor [0.0]
量子フィッシャー情報(QFI)に収束する一連の下界の実験的測定について述べる。我々はグリーンバーグ・ホーネ・ザイリンガー状態のQFIを推定し、真のマルチパーティイト絡みを観察する。回路深度を増大させることにより誘導される状態最適化と雑音の相互作用について検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:43:32 GMT)
Reviving QFT in $2+1$ de Sitter Spacetime [0.0]
2+1$ 次元静的アインシュタイン宇宙上の共形結合スカラー QFT を考える。我々は、この理論が秘密裏に、2+1$ de Sitter 空間の QFT であると説明している。理論がUVで切り離されるとき、基底次元はベーケンシュタイン・ホーキングの公式としてスケールする。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:00:01 GMT)
Quantum-Acoustical Drude Peak Shift [0.0]
Fr"ohlichモデルでは,Drude peak hid ing が視界に隠れていた。その結果, 高温吸収ピークの発生源は, 奇妙な金属, 悪い金属であることがわかった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:44:59 GMT)
Quantum superpositions of current states in Rydberg-atom networks [0.0]
現状を設計するための量子最適制御プロトコルを提案する。与えられた空間的に閉じたツイーザーネットワークで伝播するライドバーグ励起によって特徴づけられる量子状態
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:10:56 GMT)
Quantum phases of hardcore bosons with repulsive dipolar density-density interactions on two-dimensional lattices [0.0]
ボソンズ力学は、2次元格子上の拡張ボース・ハバード・ハミルトニアンによって記述される。我々は、正方形、ハニカム、三角形の3つの異なる格子幾何学を考察する。この結果は、アナログ量子シミュレータにおける自己組織型結晶秩序パターンの実験的実現の即時的関連性である。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:01:34 GMT)
Quantum information recast via multiresolution in $L_2(0,1]$ [0.0]
本稿では,量子情報理論に対する多分解能アプローチを提案する。これは、無限個の量子ビットの配列を解析するための体系的な数学的アプローチを開発する努力から生まれた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:05:51 GMT)
Quantum advantage in batteries for Sachdev-Ye-Kitaev interactions [0.0]
セルが相互作用している場合、量子電池のユニタリ充電において量子アドバンテージが達成される。特に、$q$-point rescaled sparse SYK 相互作用の場合、量子優位性は $Gammasim Nfracalpha-q2+frac12$ for $alphageq q/2$ および $Gammasim Nfrac12-fracalpha2$ for $q/2>alphageq 0$ となる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:51:27 GMT)
Quantum Technology masters: A shortcut to the quantum industry? [0.0]
本稿では,世界的量子技術(QT)教育の展望,すなわち修士課程の開発動向について考察する。グローバル調査を通じて、86のマスタープログラムを特定しました。我々は、多くの国の量子労働力を拡大するための様々な国家的努力、量子プログラムの強化、量子コンテンツによる既存の研究プログラムの内容の増大を識別する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:32:12 GMT)
Quantum Kernel Machine Learning With Continuous Variables [0.0]
人気の高いqubitフレームワークは、量子カーネル機械学習に関する最近の研究を支配している。連続変数(CV)量子コンピューティングプラットフォームに対するこれらの概念を理解するための比較フレームワークは存在しない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:30:36 GMT)
Quantum Dynamics with Stochastic Non-Hermitian Hamiltonians [0.0]
反エルミート的部分の摂動によって非エルミート的ハミルトニアンが生成する量子力学について検討する。得られた状態の進化を特徴付け、その純度を分析する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:17:34 GMT)
Quantum Algorithm to Prepare Quasi-Stationary States [0.0]
本稿では,高密度多体スペクトルにおける準定常状態を生成する効率的な量子探索アルゴリズムを提案する。システムサイズによる時間スケーリングでは、このアルゴリズムは逆エネルギーの状態を発生させ、多くのボディのダイナミクスを何度も分析することができる。本稿では, このアルゴリズムを, 多体量子系における熱化変換と流体力学のメカニズムを解明するために, プリミティブとして利用する方法について論じる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:59:26 GMT)
Purity benchmarking study of error coherence in a single Xmon qubit [0.0]
我々は2つの異なる動作周波数でコヒーレンスノイズ予算を同時に測定する。全体的なエラー率を優先する不整合誤差は、最小の周波数依存性を示す。コヒーレントエラーはそれほど多くはないが、運用周波数の変動や電信ノイズに対して顕著な感度を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:01:04 GMT)
Psycho-linguistic Experiment on Universal Semantic Components of Verbal Humor: System Description and Annotation [0.0]
ユーモアの注釈のためのセルフペースト読解システムの詳細な観察を行う。システムは、読者が次の単語を開くために押すキーを登録し、クラスを選択し、選択を変更する。また、システムで実施した心理言語実験や、その期間中に収集したデータにも触れます。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:56:17 GMT)
Probability of Differentiation Reveals Brittleness of Homogeneity Bias in Large Language Models [0.0]
LLM(Large Language Models)における均一性バイアス(英語版)とは、ある集団の表現を他と比較して均質化する傾向を指す。このバイアスを文書化する以前の研究は、主にエンコーダモデルを使用しており、それは必然的にバイアスを導入した可能性がある。本研究は、エンコーダモデルをバイパスして、モデル出力から均一性バイアスを直接評価する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:56:55 GMT)
Princeton seminars on physics and philosophy [0.0]
これらは、私が2024年11月にプリンストン哲学部で招待される一連のセミナーのために準備された講義ノートです。それらは、量子重力の概念構造、量子力学の解釈、時間の構造、その方向と未来の開放性、そして観念論と反境界主義に関する概念が進化するという事実に関する一般的な考察をカバーしている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:37:18 GMT)
Photonic Entanglement and Polarization Nonclassicality: Two Manifestations, One Nature [0.0]
同じフレームワーク内での非古典性と多光子絡みの解析を行う。我々の研究結果は、量子プロトコルの絡み合いとして、非古典的偏光が等しく資源に富んでいることを示している。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:08:45 GMT)
Phishing Website Detection through Multi-Model Analysis of HTML Content [0.0]
本研究では,HTMLコンテンツに着目した高度な検出モデルを導入することにより,フィッシングのプレス問題に対処する。提案手法は、構造化表データのための特殊多層パーセプトロン(MLP)モデルと、テキストの特徴を解析するための2つの事前学習自然言語処理(NLP)モデルを統合する。 2つのNLPと1つのモデルであるMultiText-LPの融合により、96.80 F1スコアと97.18精度スコアが得られた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:47:07 GMT)
Phase-space localization at the lowest Landau level [0.0]
我々は,高調波トラップにおける接触相互作用の弱いボゾンについて検討し,最低ランダウレベルの状態に着目した。対応するグロス=ピタエフスキー方程式のエネルギー汎函数の既知の非自明位相空間トポグラフィーにより、シュローディンガー場の古典位相空間における量子エネルギー固有状態のフシミ密度を探索する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:04:32 GMT)
Periodic quantum Rabi model with cold atoms at deep strong coupling [0.0]
我々は、深い強い結合状態において、周期量子ラビモデルによって予測される原子動力学を実験的に実証した。観測されたダイナミクスは、ブリルアンゾーンの端に達すると関係する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:25:54 GMT)
Pentagonal Photonic Crystal Mirrors: Scalable Lightsails with Enhanced Acceleration via Neural Topology Optimization [0.0]
Starshot Breakthrough Initiativeは、20年以内に1グラムのマイクロチッププローブをAlpha Centauriに送ることを目指している。このミッションには、ナノテクノロジーの基本に挑戦するライトセール材料が必要である。 60 x 60 mm$2$, 200nmの厚さの単層リフレクターを10億以上のナノスケール特性で穿孔した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:59:55 GMT)
Parameter estimation from an Ornstein-Uhlenbeck process with measurement noise [0.0]
熱雑音をハミルトンモンテカルロに匹敵する性能で効果的に分離できるアルゴリズムを提案する。熱雑音と乗算雑音の比についての追加知識により, 2種類の雑音を正確に識別できることが示されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:33:34 GMT)
Orchard: building large cancer phylogenies using stochastic combinatorial search [0.0]
がんの系統再建アルゴリズムであるOrchardを1000件の突然変異を用いて高速かつ高精度に導入する。 Orchardは、より可塑性な系統を再構築する、最先端のがん系統再建法より優れている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 00:32:49 GMT)
Optimal Decision Making Through Scenario Simulations Using Large Language Models [0.0]
大規模言語モデル(LLM)は、複雑な問題へのアプローチと解決の方法を変えました。本稿では,この能力ギャップを橋渡しする革新的な手法を提案する。 LLMがユーザから複数のオプションとそれぞれのパラメータをリクエストできるようにすることで、動的フレームワークを導入しています。この関数は提供された選択肢を分析し、潜在的な結果をシミュレートし、最も有利な解を決定するように設計されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:57:49 GMT)
OpenDiLoCo: An Open-Source Framework for Globally Distributed Low-Communication Training [0.0]
OpenDiLoCoは、大規模言語モデルのための分散低コミュニケーション(DiLoCo)トレーニング手法のオープンソース実装である。我々は,90～95%の計算利用を維持しながら,2大陸と3カ国でモデルをトレーニングすることで,その効果を実証した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:13:17 GMT)
On the power of data augmentation for head pose estimation [0.0]
本稿では, 自然画像へのより良い一般化を実現するために, 合成データの異なるフレーバーの組み合わせを提案する。精度と効率の両面での競合モデルが得られ、実際のリアルタイムアプリケーションで完全な6つのDoFポーズ推定が可能となる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:35:43 GMT)
On compatibility of binary qubit measurements [0.0]
この研究はブールハイパーキューブとそのフーリエ変換で定義される関数を通してこの問題にアプローチする。この問題の修正は、任意の有限集合の偏りのない二乗量子ビット測定における関節測定可能性の完全な幾何学的特徴化につながることを示す。我々は、量子ステアリングの領域における我々の結果について議論し、そこでそれらがステアリングの不平等の族へと変換する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:44:12 GMT)
New algorithms for sampling and diffusion models [0.0]
本稿では,未知分布を持つ拡散生成モデルのための新しいサンプリング手法と新しいアルゴリズムを提案する。我々のアプローチは、拡散生成モデルにおいて広く採用されている逆拡散過程の概念に着想を得たものである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 22:57:08 GMT)
Mutual Information calculation on different appearances [0.0]
画像マッチングに相互情報公式を適用し、画像Aを移動対象とし、画像Bを対象対象とする。また,エントロピー法と情報ゲイン法を用いて画像の依存性を検証した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:12:50 GMT)
Mitigation of systematic amplitude error in nonadiabatic holonomic operations [0.0]
非断熱的ホロノミック操作は、パルスタイミングやレーザー強度の不完全な制御によって誘導される系統的な振幅誤差に敏感である。本稿では,その系統的振幅誤差を軽減するために,非断熱的ホロノミック操作のスキームを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:47:10 GMT)
Missile Detection and Destruction robot using Detection Algorithm [0.0]
この研究は、バングラデシュでシステムを実装するための費用対効果の高いソリューションを見つけるために、世界の現在のミサイル検出技術とこれらの技術の分析に基づいている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:12:21 GMT)
Microscopic scale of quantum phase transitions: from doped semiconductors to spin chains, cold gases and moiré superlattices [0.0]
我々は、量子相転移(QPT)につながる微視的過程を識別する新しいデータ解析法を開発した。多くのシステムにおいて、局所化のスケーリング理論で導入された一般化指数依存により、QPT近傍のスケールデータを近似できることが示されている。また, 相互作用系の場合, 温度はシステム固有の初等励起によって移動される長さで再正規化群の流れを減少させると推測した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 21:57:04 GMT)
Many-hypercube codes: High-rate quantum error-correcting codes for high-performance fault-tolerant quantum computing [0.0]
本稿では,高速量子符号の新たなファミリとして,小型量子誤り検出符号を提案する。これらの単純な構造は、論理キュービットに対応するハイパーキューブを用いた幾何学的解釈を可能にする。回路レベルのノイズモデルにおいても高い誤差閾値を達成する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:01:47 GMT)
Machine Learning Assisted Design of mmWave Wireless Transceiver Circuits [0.0]
mmWave集積回路(IC)はここ数十年で大きな研究関心を集めている。この論文では、28GHzのトランシーバ回路を詳細な設計図と関連する性能指標を用いて検討した。いくつかの従来型および大規模機械学習(ML)アプローチは、選択されたシステムの設計パイプラインに統合され、望ましい仕様に基づいて回路パラメータを予測する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:21:01 GMT)
LokiLM: Technical Report [0.0]
500Bトークンでトレーニングされた1.4Bパラメータ大言語モデルであるLokiLMを紹介する。 LokiLMは1.5B以下のパラメータを持つモデル間で最先端のパフォーマンスを実現する。その有望なパフォーマンスにもかかわらず、LokiLMは、TruthfulQAベンチマークにおいて、必要な量の幻覚とスコアを示しています。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:05:47 GMT)
Lattices, Gates, and Curves: GKP codes as a Rosetta stone [0.0]
GKP クリフォードゲートが対応するGKP格子のシンプレクティック自己同型としてどのように生じるかを説明する。単一モードのGKP符号に対して、楕円曲線のモジュライ空間を持つすべてのGKP符号の空間を同定する。我々はGKP符号の普遍的なファミリーを構築し、繊維束の耐障害性を明確に構築する方法を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:06:26 GMT)
Krylov fractality and complexity in generic random matrix ensembles [0.0]
クリロフ空間法は量子系の動的側面を分析するための効率的なフレームワークを提供する。適切なランダムな行列アンサンブルに対する三対角行列要素と関連する基底ベクトルの特性を考察する。本稿では,3つの条件(エルゴード,フラクタル,局所化)における行列要素と基底ベクトルの特性について考察し,遷移点を特定するためのツールを紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:48:31 GMT)
Integrating Human-Centric Approaches into Undergraduate Software Engineering Education: A Scoping Review and Curriculum Analysis in the Australian Context [0.0]
ヒューマン・センター・ソフトウェア・エンジニアリング(Human-Centric Software Engineering)とは、人間の要求と要求をコア・プラクティスとするソフトウェア・エンジニアリング・プロセスを指す。ソフトウェアプロジェクトの大部分が人的ニーズに対応できず、結果として予算やデリバリ、ユーザビリティの問題に陥ります。本稿では,大学院ソフトウェア工学の学生にHCSEを教えるのに適したトピックとカリキュラムのアプローチを特定するためのスコーピング・レビューを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:34:58 GMT)
In situ subwavelength microscopy of ultracold atoms using dressed excited states [0.0]
サブ波長分解能を持つ超低温原子をイメージングする新しい手法を実装した。対向的に、反対の弱いイメージング機構も、サブ波長分解能に到達するために活用できることが示される。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:18:54 GMT)
Impact of atomic initial conditions on nonclassicality of the light in the ladder-type three-level Jaynes-Cummings model [0.0]
3レベル原子と1モード量子化キャビティの相互作用を探索し、3レベルラグ型Jaynes-Cummingsモデルと呼ぶ。シュル・オーディンガー方程式の正確な解を用いて、原子の初期状態が原子エネルギーレベルの占有確率、平均光子数、光の非古典性にどのように影響するかを研究する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:30:55 GMT)
Holographic Entropy Inequalities and Multipartite Entanglement [0.0]
本研究では,ある多部情報量に項を順序的にグループ化することで,ホログラフィックエントロピーの不等式とその構造特性について検討する。これらの構造のいくつかを体系的に探索することにより、6つのパーティで300以上の新しいエントロピー不等式を発見することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:58:24 GMT)
High-Throughput Phenotyping using Computer Vision and Machine Learning [0.0]
我々はオークリッジ国立研究所が提供した1,672枚のPopulus Trichocarpaの画像と白ラベルで治療を行った。光文字認識(OCR)は、植物上でこれらのラベルを読むために用いられた。機械学習モデルを用いて,これらの分類に基づいて処理を予測し,解析されたEXIFタグを用いて葉の大きさと表現型間の相関を見いだした。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:28:14 GMT)
High-Precision, Fair University Course Scheduling During a Pandemic [0.0]
本稿では、コース配信モードの拡張分類法を提案し、整数プログラムを示し、コーススケジューリングアルゴリズムを開発する。我々のアプローチは、教室で各コースセクションの特定の一部が実行されることを保証することで公平である。フェアネスと同時出席の原理に基づくアルゴリズムは、パンデミック時と通常時の大学コーススケジュールを大幅に改善することができる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:26:01 GMT)
HiLight: Technical Report on the Motern AI Video Language Model [0.0]
本報告では,ビデオテキストアライメントのための最先端ビデオエンコーダと,HiLightと呼ばれるビデオ会話フレームワークの実装について述べる。我々のゴールはビリヤードの文脈におけるビデオ理解の課題に対処することである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 02:43:18 GMT)
HDKD: Hybrid Data-Efficient Knowledge Distillation Network for Medical Image Classification [0.0]
ビジョントランスフォーマー(ViT)は、強力なモデリング能力のため、コンピュータビジョンタスクにおいて大きな進歩を遂げている。知識蒸留(KD)への以前のアプローチは、CNNの教師からViTの学生へのロジット分布の蒸留に焦点を絞った2つの主要な経路を追求してきた。本稿では,CNN教師とハイブリッド学生を併用したHybrid Data- efficient Knowledge Distillation(HDKD)パラダイムを提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:09:12 GMT)
Greit-HRNet: Grouped Lightweight High-Resolution Network for Human Pose Estimation [0.0]
軽量モジュールは高解像度ネットワークにおけるコストのかかるポイントワイズ畳み込みを置き換えるために提案されている。グループ化チャネル重み付け(GCW)と空間重み付け(GSW)を含むグリットブロックを提案する。我々は,MS-COCOとMPIIによるポーズ推定データセットの実験を行い,Greit-HRNetの優れた性能を示し,他の最先端軽量ネットワークよりも優れた性能を示した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 06:28:25 GMT)
Generalized flux trajectories: New insights into partially coherent Airy beams [0.0]
本稿では,部分コヒーレントビームに対するフラックス軌道の概念の一般化に基づく,新規で洞察に富んだ方法論を提案する。この方法論は相関係の役割を強調し、なぜビームが伝播に沿って空間的に抜け出すのかを明らかにするのに役立つ。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:59:38 GMT)
Fine-Grained Classification for Poisonous Fungi Identification with Transfer Learning [0.0]
FungiCLEF 2024は、真菌種のきめ細かい視覚分類(FGVC)に対処する。提案手法は,試験後評価において,最高トラック3スコア (0.345), 精度 (78.4%), マクロF1スコア (0.577) を達成した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:24:50 GMT)
Facilities and practices for linear response Hubbard parameters U and J in Abinit [0.0]
本稿では,オープンソースの Abinit First-principles シミュレーションスイートのユーザに対して,既存のHubbard パラメータと容易に連携可能な更新後プロセッサ lrUJ ユーティリティを提案する。本稿では,プロジェクタ拡張波(PAW)法で導入された複雑で潜在的な落とし穴に特に重点を置いている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:20:16 GMT)
Evaluating Voice Command Pipelines for Drone Control: From STT and LLM to Direct Classification and Siamese Networks [0.0]
本研究の目的は、ドローン動作の直感的な音声制御を可能にすることにより、人間と機械の相互作用を強化することである。開発されたパイプラインには、(1)従来の音声テキスト(STT)、次いでLarge Language Model(LLM)アプローチ、(2)直接音声から関数へのマッピングモデル、(3)Siameseニューラルネットワークベースのシステムが含まれる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:15:26 GMT)
Evaluating Transfer Learning in Deep Learning Models for Classification on a Custom Wildlife Dataset: Can YOLOv8 Surpass Other Architectures? [0.0]
現在の人間主導の監視技術は、エラーを起こしやすく、労働集約的である。本稿では,畳み込みニューラルネットワーク(CNN)や伝達学習などのディープラーニング手法の適用について検討する。その結果, YOLOv8の精度は97.39%, F1スコア96.50%であった。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:03:00 GMT)
Evaluating Large Language Models with Grid-Based Game Competitions: An Extensible LLM Benchmark and Leaderboard [0.0]
我々は,Tic-Tac-Toe,Connect-Four,Gomokuなどのグリッドベースのゲームを通じて,大規模言語モデル(LLM)の新たなベンチマークを導入する。 GitHubで公開されているオープンソースのゲームシミュレーションコードは、LSMが競合し、詳細なデータファイルを生成することを可能にする。本稿では,Orthropic の Claude 3.5 Sonnet と Claude 3 Sonnet,Google の Gemini 1.5 Pro と Gemini Flash,OpenAI の GPT-4 Turbo と GPT-4o,Meta の Llama3-70B などの主要な LLM のゲーム結果を紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:14:34 GMT)
Estimating the stability number of a random graph using convolutional neural networks [0.0]
グラフ画像に畳み込みニューラルネットワーク(CNN)を用いることで、乱数グラフやネットワークの特性の濃度を予測できる可能性について検討する。提案手法は,最適化問題にディープラーニングを適用する可能性を示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:50:59 GMT)
Entanglement asymmetry in conformal field theory and holography [0.0]
エンタングルメント非対称性(英: entanglement asymmetric)は、量子サブシステムにおける対称性の破れの尺度である。 U(1)対称性を持つ共形場の量子論において、励起的「コヒーレント状態」のクラスの非対称性を研究する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:08:27 GMT)
Entanglement Entropy as a Probe Beyond the Horizon [0.0]
この拡張は、システム全体のサイズに対数的に依存する絡み合いエントロピーの項を誘導することを示す。宇宙論では、系の大きさは空間的に有限な宇宙の大きさ、またはインフレーションの開始時に地平線から出る第1モードの波長と同一視できる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:48:58 GMT)
Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation [0.0]
本研究は自動運転の制御最適化問題における安全性問題に対処する。本稿では,条件付きバリュー・アット・リスクに基づくソフトアクター批判を利用して,ポリシー最適化のための新しいモデルベースアプローチを提案する。本手法では, 安全探索を誘導する最悪のアクターを導入し, 予測不可能なシナリオにおいても, 安全要件の厳密な遵守を確保する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 01:18:19 GMT)
Dephasing due to electromagnetic interactions in spatial qubits [0.0]
劣化の電磁源に着目した周波数空間の雑音解析得られた式を隣接する2つのマイクロ粒子の状況に適用する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 11:09:13 GMT)
Deep(er) Reconstruction of Imaging Cherenkov Detectors with Swin Transformers and Normalizing Flow Models [0.0]
チェレンコフ検出器のイメージングは、核物理学と粒子物理学の実験において粒子識別(PID)に不可欠である。本稿では,複雑なヒットパターンを示すDIRC検出器に着目し,JLabのGlueX実験において,ピオンとカオンのPIDにも使用される。 We present Deep(er)RICH, a extension of the seminal DeepRICH work, offered improve and faster PID than traditional methods。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 05:37:02 GMT)
Daisy: An integrated repeat protein curation service [0.0]
Daisyは、リピートタンパク質キュレーションウェブサービスである。 protein Data Bank(PDB)とAlphaFold Databaseエントリを処理して,タンデムの識別を繰り返すことができる。繰り返し分類は、RepeatsDBを通じて特定された家族に関連付けられている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:41:19 GMT)
DS@GT eRisk 2024: Sentence Transformers for Social Media Risk Assessment [0.0]
DS@GTチームの作業ノートをeRisk 2024 for Tasks 1 and 3で紹介する。本稿では,抑うつの症状を予測する第1タスクのランキングシステムを提案する。タスク3では、BERTからの埋め込みを用いて、ユーザの投稿履歴に基づいて障害症状の重症度を予測する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 19:30:16 GMT)
Coordinated Disclosure of Dual-Use Capabilities: An Early Warning System for Advanced AI [0.0]
本稿では,先進的なAI開発者や米国政府機関,その他の民間企業との早期情報共有を支援するプロセスとして,CDDC(Coordinated Disclosure of Dual-Use Capabilities)を提案する。これは、米国政府、デュアルユースファンデーションモデル開発者、その他のアクターに、公衆の安全とセキュリティに大きな影響を与える可能性のあるAI機能の概要と、対応の最大時間を提供することを目的としている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:27:45 GMT)
Continuous variable dense coding under realistic non-ideal scenarios [0.0]
一般二モードガウス状態の高密度符号化容量(DCC)の一般形式を導出する。本研究では,2モード圧縮真空状態(TMSV)のDCCパターンについて,ノイズの強度を変化させることにより検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 12:49:17 GMT)
CM-DQN: A Value-Based Deep Reinforcement Learning Model to Simulate Confirmation Bias [0.0]
本稿では,人間の意思決定過程をシミュレートするために,Deep Reinforcement Learning(CM-DQN)に新たなアルゴリズムを提案する。我々は,Lunar Lander環境において,確認的,不確認的バイアス,非バイアスを用いて学習効果を観察する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:16:13 GMT)
CIDER: Context sensitive sentiment analysis for short-form text [0.0]
CIDER (Context Informed Dictionary and sEmanticer) は文脈依存型言語分析を行う。英国におけるジェンダーに関するケーススタディが提示され、ジェンダーと感情に満ちた日々の識別がなされている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 10:39:12 GMT)
Bosonic and fermionic coherence of N-partite states in the background of a dilaton black hole [0.0]
我々は、ガーフィンクル・ホロウィッツ・ストロミンジャー・ディラトンブラックホールの事象地平線付近にN個の観測者が浮かぶとき、自由ボソニック場およびフェルミオン場に対するGHZおよびW状態のN粒子コヒーレンスを研究する。ボーソニック場のコヒーレンスはフェルミオン場のコヒーレンスよりも大きく、フェルミオン場の絡み合いはディラトン時空のボソニック場のコヒーレンスよりも大きいことが判明した。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 14:10:30 GMT)
Bohmian analysis of dark solutions in interfering Bose-Einstein condensates: The dynamical role of underlying velocity fields [0.0]
ボヘミア力学は、ソリトンアレイのリアルタイムな形成と進化を探索し分析するための追加のツールと考えられている。自由力学と境界力学の微妙さをよりよく理解するために、2つのケースについて論じる。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 23:58:34 GMT)
Berry Phase and Topological Insights in a Qubit-Inspired Classical Two-Level Elastic Bit [0.0]
外部ドライバと結合したグラニュラーを操作することにより, 2レベル弾性ビットにおけるベリー位相の制御された蓄積を示す。重要な成果は、様々な系の状態に対するベリー位相の計算であり、システムのトポロジカルな性質に関する洞察を明らかにすることである。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 04:16:51 GMT)
Awareness and Adoption of AI Technologies in the Libraries of Karnataka [0.0]
本研究は,カルナタカの書誌専門家を対象に,AI技術の意識と採用を評価するための調査手法を用いた。この研究は、性別の要因に基づくAI技術の認識と採用に統計的に有意な違いがあることを明らかにした。年齢、学歴、専門的経験などの要因に基づくAI技術の認識度と採用度の間には、有意な関係は存在しない。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:33:10 GMT)
Assessing a binary quantum channel exploiting a Silicon photomultiplier based hybrid receiver [0.0]
シリコン光増倍器ベースの受信機を利用する量子チャネルを考える。本稿では,チャネル上の情報伝達,相互情報による定量化,連続可変量子鍵分布の2つのシナリオについて検討する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 09:52:04 GMT)
Applying generative neural networks for fast simulations of the ALICE (CERN) experiment [0.0]
この論文は、CERNのゼロ・デグレ・カロリメータ(ZDC)中性子検出器の高速シミュレーションのための生成ニューラルネットワークへの最先端の応用について研究している。 GEANT Monte Carlo ツールキットを用いた従来のシミュレーション手法は正確ではあるが、計算的に要求される。この論文は、コンピュータビジョンにおけるニューラルネットワークの適用、機械学習を用いた高速シミュレーション、高エネルギー物理学における生成ニューラルネットワークに関する包括的な文献レビューを提供する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 17:08:59 GMT)
Analyzing Large language models chatbots: An experimental approach using a probability test [0.0]
本研究は2つの異なる大言語モデル(LLM)を用いた探索実験を通じて行われた定性的な経験的研究から成る。方法としては,確率問題で設計されたプロンプトに基づいて探索試験を行った。認知心理学において広く認知されている「リンダ問題」は、この実験に特化して新たな問題である「マリー問題」の開発とともに、テスト作成の基礎として用いられた。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:49:40 GMT)
An investigation of the Online Payment and Banking System Apps in Bangladesh [0.0]
バングラデシュは国家インフラのデジタル化に力を入れている。これらのシステムのセキュリティレベルに関する知識が不足しているにも関わらず、現在、あまり考慮せずに頻繁に使用されている。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 15:43:45 GMT)
A tractable model of monitored fermions with conserved $\mathrm{U}(1)$ charge [0.0]
U(1)対称性を持つ自由フェルミオン系の測定誘起相について検討した。広い空間と時間スケールにおける純度と二分性絡み合いの場の理論記述を導出する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 20:53:47 GMT)
A thermodynamically consistent approach of quantum measurement energy costs [0.0]
熱浴に結合した量子プローブからなる量子計測装置の一般的な顕微鏡モデルを示す。熱浴の特性を利用して測定結果を冗長に記録し,その自由度を推定する。本研究では, 熱力学的に可逆な測定が可能であり, 最小限の工数に到達できることを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 08:55:05 GMT)
A Review of the Challenges with Massive Web-mined Corpora Used in Large Language Models Pre-Training [0.0]
このレビューでは、ノイズ(不適切な情報や誤解を招く情報)、コンテンツの重複、品質の低い情報や誤った情報の存在、バイアス、機密情報や個人情報をウェブマイニングコーパスに含めることなど、この分野における重要な課題を明らかにしている。データクリーニング、前処理、バイアス検出、緩和のための現在の手法を検討することで、既存のアプローチのギャップを強調し、今後の研究の方向性を提案する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 13:09:23 GMT)
A QCA for every SPT [0.0]
3次元では、非自明な量子セルオートマトン (QCA) があり、3つのフェルミオンウォーカー-ワング模型を歪めている。 QCAのいくつかはクリフォードであり、これらの定理をクリフォード QCAの分類定理に関連付ける。クリフォードQCAを4m+1$次元で同定し、クリフォードゲートを使用せず、クリフォードゲートを使用せずに低深さの回路記述を求める。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:00:06 GMT)
A Numerical Calculation of Entanglement Entropy in de Sitter Space [0.0]
デ・シッター空間における質量を持たないスカラー場の絡み合いエントロピーは、複数のスケールに依存する。準水平エンタングリング半径に対する平坦空間エントロピーのド・ジッター補正を導出する。角運動量の消滅を伴う理論のセクターの絡み合いエントロピーへの寄与は、システム全体のサイズに対数的に依存することを示す。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 16:30:38 GMT)
A Lightweight Low-Light Image Enhancement Network via Channel Prior and Gamma Correction [0.0]
LLIE(ローライト・イメージ・エンハンスメント)とは、低照度シーンの処理に適した画像エンハンスメント技術である。我々は,暗/明のチャネル先行と深層学習によるガンマ補正を組み合わせた,革新的なLLIEネットワークであるCPGA-Netを紹介する。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 18:29:14 GMT)
A Conceptual Framework for API Refactoring in Enterprise Application Architectures [0.0]
本稿では,APIの実装に関する概念的枠組みを紹介する。私たちのフレームワークには重要なトレードオフと選択肢があり、結果として生じるアーキテクチャの効率性、保守性、分離性に大きな影響を与えます。私たちの作業は、APIを適用する際の摩擦を減らし、よりアーキテクチャ的な選択をオープンにする方法を、初めて示します。
論文参考訳（メタデータ） (Wed, 10 Jul 2024 07:32:16 GMT)