Fugu-MT: arxivの論文翻訳(概要)

Qwen2 Technical Report [139.2]
本稿では,我々の大規模言語モデルと大規模マルチモーダルモデルへの最新の追加であるQwen2シリーズを紹介する。 Qwen2は、前身のQwen1.5を含む、これまでのほとんどのオープンウェイトモデルを超え、プロプライエタリモデルと比較して競争力のある性能を示している。 Qwen2は、英語、中国語、スペイン語、フランス語、ドイツ語、アラビア語、ロシア語、韓国語、日本語、タイ語、ベトナム語など、約30の言語で熟練した堅牢な多言語機能を示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:29:30 GMT)
JailbreakBench: An Open Robustness Benchmark for Jailbreaking Large Language Models [123.7]
ジェイルブレイク攻撃は、大きな言語モデル(LLM)が有害、非倫理的、またはその他の不快なコンテンツを生成する原因となる。これらの攻撃を評価することは、現在のベンチマークと評価テクニックの収集が適切に対処していない、多くの課題を提示します。 JailbreakBenchは、以下のコンポーネントを備えたオープンソースのベンチマークである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:15:10 GMT)
Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.2]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。 GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:56:11 GMT)
Bootstrapped Pre-training with Dynamic Identifier Prediction for Generative Retrieval [109.0]
生成検索は、クエリに応答して関連するドキュメント識別子を直接生成するために、識別可能な検索インデックスを使用する。近年の研究では、微調整による下流検索タスクを強化するために、慎重に訓練された事前学習タスクで訓練された強力な生成検索モデルの可能性を強調している。生成検索のためのブートストラップ付き事前学習手法であるBootRetを導入し,事前学習中に文書識別子を動的に調整し,コーパスの継続に対応する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:42:36 GMT)
UltraFeedback: Boosting Language Models with Scaled AI Feedback [99.5]
大規模で高品質で多様なAIフィードバックデータセットである textscUltraFeedback を提示する。我々の研究は、強力なオープンソースのチャット言語モデルを構築する上で、スケールしたAIフィードバックデータの有効性を検証する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:24:39 GMT)
Scaling Exponents Across Parameterizations and Optimizers [94.5]
本稿では,先行研究における重要な仮定を考察し,パラメータ化の新たな視点を提案する。私たちの経験的調査には、3つの組み合わせでトレーニングされた数万のモデルが含まれています。最高の学習率のスケーリング基準は、以前の作業の仮定から除外されることがよくあります。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:40:09 GMT)
Learning a Diffusion Model Policy from Rewards via Q-Score Matching [93.0]
本稿では,拡散モデルポリシの構造を学習されたQ-関数に関連付ける理論的枠組みを提案する。本稿では,この理論からQスコアマッチングを示す新しいポリシー更新手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:24:36 GMT)
ConTextual: Evaluating Context-Sensitive Text-Rich Visual Reasoning in Large Multimodal Models [92.6]
テキストリッチな画像に対して文脈に敏感な推論を必要とする人為的な命令を特徴とする新しいデータセットであるConTextualを紹介した。そこで本研究では,14の基盤モデルの性能評価実験を行い,人為的な性能基準を確立する。 GPT-4Vとヒトのパフォーマンスの30.8%の有意な性能差を観察した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:36:29 GMT)
CAT-SAM: Conditional Tuning for Few-Shot Adaptation of Segment Anything Model [90.3]
本稿では,CAT-SAM(ConditionAl Tuning Network)を提案する。 CAT-SAMはSAM全体を凍結し、マスクデコーダとイメージエンコーダに少数の学習可能なパラメータを同時に適用する。 Cat-SAM 変種は、非常に困難なワンショット適応設定の下でも、常に優れた目標セグメンテーション性能を達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:23:47 GMT)
DataDream: Few-shot Guided Dataset Generation [90.1]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。 DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:15:01 GMT)
GVGEN: Text-to-3D Generation with Volumetric Representation [89.6]
3Dガウススプラッティングは、高速で高品質なレンダリング機能で知られる3D再構成と生成のための強力な技術として登場した。本稿では,テキスト入力から3次元ガウス表現を効率的に生成する新しい拡散型フレームワークGVGENを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:54:46 GMT)
Generalized Unbiased Scene Graph Generation [85.2]
一般化Unbiased Scene Graph Generation (G-USGG)は、述語レベルと概念レベルの不均衡を考慮に入れている。本稿では,まれ/非一般的/共通概念間のバランスの取れた学習プロセスを確実にするマルチコンセプト学習(MCL)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:53:47 GMT)
R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [83.8]
Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。 SFLの課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータが相手のジャミングに感受性を持つことである。これは、言語理解に不可欠である大規模言語モデル(LLM)における単語埋め込みパラメータに対して特に顕著である。無線ネットワーク上でのLLM(R-SFLLM)を用いたレジリエンスSFLのための物理層フレームワークを開発した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:21:29 GMT)
Identifying Speakers in Dialogue Transcripts: A Text-based Approach Using Pretrained Language Models [83.8]
本稿では,デジタルメディアアーカイブにおけるコンテンツアクセシビリティと検索可能性を高める重要な課題である,対話テキスト中の話者名を識別する手法を提案する。本稿では,メディアサムコーパスから派生した大規模データセットについて述べる。本稿では,話者名を正確に属性付けるために,対話中の文脈的手がかりを活用する,話者IDに適したトランスフォーマーモデルを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:03:58 GMT)
FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models [81.0]
我々は27のソースデータセットから派生した1.10万のマルチターン会話からなるフィードバック・リファインメント・データセットを構築した。データ収集のスケールアップには、FIRE-100KとFIRE-1Mの2つのコンポーネントが使用される:FIRE-100KはGPT-4Vで生成され、FIRE-1MはFIRE-100Kで訓練されたモデルを介して自由に生成される。 FIRE-100KおよびFIRE-1M上でのLLaVAの微調整によりFIRE-LLaVAモデルを構築し、FIRE-Bench上で顕著なフィードバック精錬能力を示し、未学習のVLMを50%上回る性能を示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:00:45 GMT)
Learning to Make Keypoints Sub-Pixel Accurate [80.6]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:39:56 GMT)
Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5]
テキストの匿名化は、プライバシーを維持しながら機密データを共有するために重要である。既存の技術は、大規模言語モデルの再識別攻撃能力の新たな課題に直面している。本稿では,3つのLCMベースコンポーネント – プライバシ評価器,ユーティリティ評価器,最適化コンポーネント – で構成されるフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:28:56 GMT)
NAMER: Non-Autoregressive Modeling for Handwritten Mathematical Expression Recognition [80.2]
手書き数学的表現認識(HMER)は、文書理解における多種多様な応用のために、パターン認識において大きな注目を集めている。本稿では,HMERのためのボトムアップ非自己回帰モデリング手法であるNAMERを初めて構築する。 NAMERは、VAT(Visual Aware Tokenizer)とPGD(Parallel Graph)を備える。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:52:39 GMT)
Fine-grained Hallucination Detection and Mitigation in Long-form Question Answering [79.6]
LFQA(Long-form Question answering)は、複雑な質問に対して徹底的で深い回答を提供し、理解を深めることを目的としている。この研究は、人書きおよびモデル生成LFQA回答の局所的エラーアノテーションを備えた最初の幻覚データセットであるHaluQuestQAを紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:23:16 GMT)
TCFormer: Visual Recognition via Token Clustering Transformer [79.2]
本稿では,意味に基づく動的視覚トークンを生成するToken Clustering Transformer (TCFormer)を提案する。ダイナミックトークンには2つの重要な特徴がある:(1)同じ視覚トークンを用いて類似の意味を持つ画像領域を表現し、(2)それらの領域が隣接していない場合でも、(2)貴重な詳細を持つ領域に集中し、細かなトークンを用いてそれらを表現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:26:18 GMT)
VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models [78.8]
PyTorchに基づく大規模マルチモーダリティモデルを評価するためのオープンソースツールキットを提案する。 VLMEvalKitは70以上の大規模なマルチモダリティモデルを実装しており、プロプライエタリなAPIとオープンソースモデルの両方を含んでいる。マルチモーダル学習研究の進展を追跡するために,OpenVLM Leaderboardを主催する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:06:15 GMT)
MotionCtrl: A Unified and Flexible Motion Controller for Video Generation [77.1]
ビデオ中の動きは、主にカメラの動きによって誘導されるカメラの動きと、物体の動きによって生じる物体の動きから成り立っている。本稿では,カメラと物体の動きを効果的かつ独立に制御するビデオ生成用統合モーションコントローラであるMotionCtrlを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:27:10 GMT)
PromptRobust: Towards Evaluating the Robustness of Large Language Models on Adversarial Prompts [76.2]
本研究は、文字、単語、文、意味といった複数のレベルにわたるプロンプトを標的とした、敵対的なテキスト攻撃を多用する。相手のプロンプトは、感情分析、自然言語推論、読書理解、機械翻訳、数学の問題解決など様々なタスクに使用される。以上の結果から,現代の大規模言語モデルでは,敵対的プロンプトに対して頑健ではないことが示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:29:49 GMT)
Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.0]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:05:03 GMT)
Controllable Navigation Instruction Generation with Chain of Thought Prompting [74.3]
本稿では,C-インストラクタを提案する。C-インストラクタは,スタイル制御およびコンテンツ制御可能な命令生成のために,チェーン・オブ・シンクタスタイルのプロンプトを利用する。 C-インストラクタは生成した命令をより追従しやすくし、ランドマークオブジェクトの操作に対する制御性を高める。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:09:34 GMT)
Towards Effective and Efficient Non-autoregressive Decoding Using Block-based Attention Mask [73.5]
AMDはアテンションマスクを用いて隠された出力ラベルの連続ブロック内で並列NAR推論を行う。ビームサーチアルゴリズムは、CTC、ARデコーダ、AMD確率の動的融合を利用するように設計されている。 LibriSpeech-100hrコーパスの実験では、AMDモジュールを組み込んだトリパルタイトデコーダが最大1.73倍のデコード速度比を生み出すことを示唆している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:34:46 GMT)
MOCA: Self-supervised Representation Learning by Predicting Masked Online Codebook Assignments [72.6]
自己教師付き学習は、ビジョントランスフォーマーネットワークの欲求を軽減できる。所望のプロパティを統一する単段および単段のMOCAを提案する。我々は,様々な評価プロトコルにおいて,低照度設定と強力な実験結果に対して,最先端の新たな結果を得る。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:02:58 GMT)
States Hidden in Hidden States: LLMs Emerge Discrete State Representations Implicitly [72.2]
本稿では,チェーン・オブ・ステップ・バイ・ステップの解に頼らずに,拡張された計算列を実行する本質的な能力を明らかにする。注目すべきは、最も先進的なモデルでは、2桁の加算結果を直接出力できることだ。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:27:22 GMT)
Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.1]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:44:27 GMT)
Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning [71.1]
変更キャプションは、類似した画像間のセマンティックな変化を簡潔に記述することを目的としている。既存のほとんどの手法は、それらの違いを直接キャプチャし、エラーを起こしやすい特徴を得るリスクを負う。本稿では,2つの画像表現の対応するチャネルを関連づけるイントラクタ免疫表現学習ネットワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:00:33 GMT)
InferAct: Inferring Safe Actions for LLM-Based Agents Through Preemptive Evaluation and Human Feedback [70.5]
本稿では、クリティカルアクションの実行前に潜在的なエラーを積極的に検出する新しいアプローチであるInferActを紹介する。 InferActはまた、人間のフィードバックを統合することで、不可逆的なリスクを防ぎ、アクターの意思決定プロセスを強化することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:24:44 GMT)
SELF-GUIDE: Better Task-Specific Instruction Following via Self-Synthetic Finetuning [70.2]
大規模言語モデル(LLM)は、適切な自然言語プロンプトを提供する際に、多様なタスクを解決するという約束を持っている。学生LLMからタスク固有の入出力ペアを合成する多段階メカニズムであるSELF-GUIDEを提案する。ベンチマークの指標から,分類タスクに約15%,生成タスクに18%の絶対的な改善を報告した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:41:58 GMT)
Skills-in-Context Prompting: Unlocking Compositionality in Large Language Models [68.2]
大規模言語モデル(LLM)における構成一般化能力の活用法について検討する。我々は,これらのスキルに基礎を置く基礎的スキルと構成的事例の両方を同じプロンプト・コンテキストで示すことが重要であることを発見した。 SKiC型データを用いた微調整LDMは、ゼロショット弱強一般化を導出できることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:09:47 GMT)
Data-Juicer Sandbox: A Comprehensive Suite for Multimodal Data-Model Co-development [67.6]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。このサンドボックスは包括的な実験プラットフォームを提供し、データとモデルの両方の迅速なイテレーションと洞察駆動による改善を可能にする。また、徹底的なベンチマークから得られた実りある洞察を明らかにし、データ品質、多様性、モデル行動の間の重要な相互作用に光を当てています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:40:07 GMT)
Beyond Mask: Rethinking Guidance Types in Few-shot Segmentation [67.4]
我々は、テキスト、マスク、ボックス、画像からのプロンプトを統合するユニバーサルビジョン言語フレームワーク(UniFSS)を開発した。 UniFSSは最先端の手法よりも優れています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:41:01 GMT)
SuperGaussian: Repurposing Video Models for 3D Super Resolution [67.2]
本稿では,幾何学的および外観的詳細を付加することにより,粗い3次元モデルをアップサンプルする,単純でモジュラーで汎用的な手法を提案する。既存の3次元超解像モデルを直接再利用できることを実証する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:41:59 GMT)
OmniBind: Large-scale Omni Multimodal Representation via Binding Spaces [67.1]
我々は,70億から300億のパラメータからなる大規模マルチモーダル関節表現モデルOmniBindを提案する。全てのモダリティにまたがるデータペアが不足しているため、スクラッチから大規模モデルをトレーニングする代わりに、様々な事前訓練された専門家モデルの空間を再マッピングし結合することを提案する。実験では、OmniBindのオムニ表現モデルとしての汎用性と優位性を示し、多様なアプリケーションに対するその大きな可能性を強調している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:24:31 GMT)
SPIRE: Semantic Prompt-Driven Image Restoration [66.3]
セマンティック・復元型画像復元フレームワークであるSPIREを開発した。本手法は,復元強度の量的仕様を言語ベースで記述することで,より詳細な指導を支援する最初のフレームワークである。本実験は, SPIREの修復性能が, 現状と比較して優れていることを示すものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:10:03 GMT)
Efficient Training with Denoised Neural Weights [65.1]
この研究は、初期化のために神経重みを合成するウェイトジェネレータを構築するための新しい一歩を踏み出した。本稿では,モデル重みの収集を容易にするために,GANを用いた画像間翻訳タスクを例に挙げる。拡散モデルによって予測される重み付き画像翻訳モデルを初期化することにより、トレーニングは43.3秒しか必要としない。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:42 GMT)
What Makes and Breaks Safety Fine-tuning? A Mechanistic Study [65.0]
安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。安全でない入力の健全な側面をキャプチャする合成データ生成フレームワークを設計する。これを用いて,3つのよく知られた安全微調整手法について検討する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:19:15 GMT)
VISA: Reasoning Video Object Segmentation via Large Language Models [64.3]
我々は新しいタスク、Reasoning Video Object(ReasonVOS)を導入する。このタスクは、複雑な推論能力を必要とする暗黙のテキストクエリに応答して、セグメンテーションマスクのシーケンスを生成することを目的としている。本稿では、ReasonVOSに取り組むためにVISA(ビデオベース大規模言語命令付きアシスタント)を導入する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:29:29 GMT)
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction [63.7]
既存の手法は、視覚言語モデル(VLM)の頑健なオープン語彙認識機能を活用することにより、オープン語彙オブジェクト検出を強化している。本稿では,視覚的概念間の関係を生かしたLanguage Model Instruction(LaMI)戦略を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:58:33 GMT)
LanEvil: Benchmarking the Robustness of Lane Detection to Environmental Illusions [61.9]
レーン検出(LD)は自律走行システムにおいて不可欠な要素であり、適応型クルーズ制御や自動車線センターなどの基本的な機能を提供している。既存のLDベンチマークは主に、環境錯覚に対するLDモデルの堅牢性を無視し、一般的なケースを評価することに焦点を当てている。本稿では、LDに対する環境錯覚による潜在的な脅威について検討し、LanEvilの最初の総合ベンチマークを確立する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:50:34 GMT)
PYRA: Parallel Yielding Re-Activation for Training-Inference Efficient Task Adaptation [61.6]
本稿では, PYRA(Parallel Yielding Re-Activation)法を提案する。 PYRAは低圧縮率と高圧縮率の両方で競合する全ての手法より優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:34:35 GMT)
NoviCode: Generating Programs from Natural Language Utterances by Novices [59.7]
初心者非プログラマによるAPIと自然言語記述を入力とする新しいNLプログラミングタスクであるNoviCodeを提示する。我々は、NoviCodeがコード合成領域における挑戦的なタスクであることを示し、非技術的命令から複雑なコードを生成することは、現在のText-to-Codeパラダイムを超えている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:36:53 GMT)
PromptAD: Learning Prompts with only Normal Samples for Few-Shot Anomaly Detection [59.3]
本稿では,PromptADと呼ばれる,数発の異常検出のための一級プロンプト学習手法を提案する。画像レベル/ピクセルレベルの異常検出のために、PromptADはMVTecとVisAで11/12のショット設定で1位を達成した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:02:46 GMT)
Animate Your Motion: Turning Still Images into Dynamic Videos [58.6]
本稿では,マルチモーダル入力を管理する新しい手法であるScene and Motion Conditional Diffusion (SMCD)を紹介する。 SMCDは、認識されたモーションコンディショニングモジュールを組み込み、シーン条件を統合するための様々なアプローチを調査する。我々のデザインは映像の品質、動きの精度、セマンティック・コヒーレンスを大幅に向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:29:13 GMT)
A Benchmark for Fairness-Aware Graph Learning [58.5]
本稿では,10の代表的な公正性を考慮したグラフ学習手法に関する広範なベンチマークを示す。我々の詳細な分析は、既存の手法の強みと限界に関する重要な洞察を明らかにしている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:43:43 GMT)
Retrieval-Augmented Mixture of LoRA Experts for Uploadable Machine Learning [57.4]
Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)を微調整する効率的な方法を提供する。本稿では,入力プロンプトに基づいて複数のLoRAを適応的に検索・構成するフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:59:06 GMT)
Self-Guided Generation of Minority Samples Using Diffusion Models [57.3]
データ多様体の低密度領域に居住する少数サンプルを生成するための新しい手法を提案する。我々のフレームワークは拡散モデルに基づいて構築されており、ガイドドサンプリングの原理を生かしている。実データセットのベンチマーク実験により、我々のアプローチは現実的な低自由度マイノリティインスタンスを作成する能力を大幅に改善できることが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:03:29 GMT)
Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.2]
カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:04:29 GMT)
Are Large Language Models Strategic Decision Makers? A Study of Performance and Bias in Two-Player Non-Zero-Sum Games [56.7]
大規模言語モデル(LLM)は、現実世界での利用が増えているが、その戦略能力はほとんど解明されていない。戦略ゲーム,Stag Hunt と Prisoner Dilemma における LLM の動作について検討し,異なる設定とプロンプト下での性能変動を分析した。以上の結果から,(1)位置バイアス,(2)支払いバイアス,(3)行動バイアスの少なくとも1つが評価された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:19:27 GMT)
Monocular Occupancy Prediction for Scalable Indoor Scenes [56.7]
そこで本研究では,モノクロ画像を用いた屋内シーン占有率の予測手法であるISOを提案する。 ISOは、事前訓練された深度モデルの利点を利用して正確な深度予測を行う。 Occ-ScanNetは屋内シーンの大規模占有ベンチマークである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:50:40 GMT)
Encapsulating Knowledge in One Prompt [56.3]
KiOPは、元のモデルを変更したり、トレーニングデータにアクセスする必要なしに、さまざまなモデルからの知識を単独のプロンプトにカプセル化する。実用性の観点から、このパラダイムは、データアクセス不能なコンテキストにおけるVisual Promptの有効性を証明している。様々なデータセットとモデルを用いた実験は、提案したKiOP知識伝達パラダイムの有効性を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:35:23 GMT)
Estimating the Energy Footprint of Software Systems: a Primer [56.2]
この文書は、この分野で研究を始めたい研究者の出発点となることを目的としている。私たちは、グリーンソフトウェア開発をサポートするために、ソフトウェアシステムのエネルギーフットプリントをどのように見積もることができるかについて話します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:21:30 GMT)
Four Ways to Improve Verbo-visual Fusion for Dense 3D Visual Grounding [56.0]
3Dビジュアルグラウンドティング(3D visual grounding)は、自然言語で記述された3Dシーンでオブジェクトをローカライズするタスクである。そこで本研究では,高密度な3次元グラウンドネットワークを提案し,グラウンド性能向上を目的とした4つの新しいスタンドアローンモジュールを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:14:11 GMT)
SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation [55.9]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。本稿では,DA手法の評価と,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの公平な評価を行うフレームワークを提案する。本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:52:29 GMT)
PerlDiff: Controllable Street View Synthesis Using Perspective-Layout Diffusion Models [55.1]
PerlDiffは、3次元幾何学情報を完全に活用した効果的なストリートビュー画像生成手法である。この結果から,我々のPerlDiffはNuScenesおよびKITTIデータセットの生成精度を著しく向上させることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:05:17 GMT)
Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.7]
モデルアタック(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:38:49 GMT)
BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.5]
多くの複雑な実世界のクエリは、関連する文書を特定するために詳細な推論を必要とする。 BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。 brightbenchmarkは、さまざまなドメインから収集された1,398の現実世界のクエリから構築されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:58:27 GMT)
Representation Bias in Political Sample Simulations with Large Language Models [54.5]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。 GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:52:26 GMT)
Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [54.2]
コネクショニストと象徴的人工知能(AI)の収束を探求する記事従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:32:28 GMT)
The Latency Price of Threshold Cryptosystem in Blockchains [52.4]
本稿では,Byzantine-fault Tolerant(BFT)コンセンサスプロトコルを用いた,しきい値暗号とブロックチェーンのクラス間の相互作用について検討する。しきい値暗号システムに対する既存のアプローチは、しきい値暗号プロトコルを実行するための少なくとも1つのメッセージ遅延の遅延オーバーヘッドを導入している。しきい値が狭いブロックチェーンネイティブのしきい値暗号システムに対して,このオーバーヘッドを取り除く機構を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:53:04 GMT)
Temporally Grounding Instructional Diagrams in Unconstrained Videos [51.9]
本稿では,ビデオ中の命令図中のクエリ列を同時にローカライズするという課題について検討する。既存のほとんどのメソッドは、クエリの固有の構造を無視しながら、一度に1つのクエリをグラウンドすることに焦点を当てている。ステップダイアグラムの視覚的特徴を包括的にペアリングして構築した複合クエリを提案する。ステップ図のグラウンド化のためのIAWデータセットと自然言語クエリのグラウンド化のためのYouCook2ベンチマークに対するアプローチの有効性を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:44:30 GMT)
Physics of Language Models: Part 3.2, Knowledge Manipulation [51.7]
本稿では,4つの基本的な知識操作タスクについて検討する。言語モデルは知識検索に優れるが、最も単純な分類や比較タスクにも耐え難い。また, GPT-4のような近代的な事前学習言語モデルにも適用できる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:33:12 GMT)
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction [51.7]
大規模言語モデル(LLM)は膨大な量の世界の知識を格納することができ、しばしば質問応答によって抽出できる。モデルが知識を抽出する能力と,トレーニングデータの多様な多様性尺度との間には,強い相関関係が認められた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:22:51 GMT)
The Foundations of Tokenization: Statistical and Computational Concerns [51.4]
トークン化とは、アルファベット上の文字の文字列を語彙上のトークンの列に変換するプラクティスである。本稿では,トークン化の基礎を形式的観点から説明する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:12:28 GMT)
A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.4]
自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。 SSLによって、モデルは豊富で安価なラベル付きデータから学ぶことができ、ラベルが高価でアクセス不能なトレーニングモデルのコストを大幅に削減できる。コンピュータビジョンでは、SSLは事前トレーニングや、教師付き転送、より小さなラベル付きデータセットでの少数ショット学習、および/または教師なしクラスタリングといったダウンストリームタスクとして広く使用されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:17:36 GMT)
Diffusion-based Graph Generative Methods [51.0]
拡散に基づくグラフ生成法について,系統的,包括的に検討した。まず,拡散モデル,スコアベース生成モデル,微分方程式の3つの主流パラダイムについて概説する。最後に,現在の研究の限界と今後の探査の方向性を指摘する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:21:30 GMT)
Segment, Lift and Fit: Automatic 3D Shape Labeling from 2D Prompts [50.2]
本稿では,2Dポイントやボックスプロンプトから3Dオブジェクトを自動的にラベル付けするアルゴリズムを提案する。従来のアートとは異なり、自動ラベルはバウンディングボックスの代わりに3D形状を予測し、特定のデータセットのトレーニングを必要としない。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:53:28 GMT)
Relaxing Graph Transformers for Adversarial Attacks [49.5]
グラフトランスフォーマー(GT)は、いくつかのベンチマークでMessage-Passing GNNを上回り、その逆の堅牢性は明らかにされていない。本研究では,(1)ランダムウォークPE,(2)ペアワイドショートパス,(3)スペクトル摂動に基づく3つの代表的なアーキテクチャを対象とすることで,これらの課題を克服する。評価の結果, 破滅的に脆弱であり, 作業の重要性と適応攻撃の必要性を浮き彫りにする可能性が示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:24:58 GMT)
HYPE: Hyperbolic Entailment Filtering for Underspecified Images and Texts [49.2]
本稿では,HyPerbolic Entailment Filtering (HYPE)を導入し,ノイズの多い画像とテキストのペアのデータセットから有意で整合したデータを抽出する。 HYPEは、フィルタリング効率を大幅に改善するだけでなく、DataCompベンチマークで新しい最先端を設定できる。このブレークスルーは、HYPEがデータ選択プロセスを洗練させる可能性を示し、より正確で効率的な自己教師型学習モデルの開発に寄与する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:11:24 GMT)
Entanglement and operator correlation signatures of many-body quantum Zeno phases in inefficiently monitored noisy systems [49.2]
情報スクランブルハミルトニアンと局所連続測定との相互作用は、エキゾチックな測定誘起相転移のプラットフォームをホストしている。平均エンタングルメントと演算子相関における局所雑音強度の非単調依存性を同定する。有限長鎖におけるシステムサイズによるスケーリングの解析は、有限効率において、この効果が演算子相関と絡み合いに対して異なるMIPTをもたらすことを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:42:38 GMT)
Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.8]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。 HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:09:31 GMT)
Large Language Models for Relevance Judgment in Product Search [48.6]
検索クエリに対する検索および再ランクされたアイテムの高い関連性は、製品検索の成功の土台である。本稿では,大規模言語モデル(LLM)を活用して,クエリ・イテムペア(QIP)の関連判断を大規模に自動化する手法について述べる。本研究は,製品検索における関連判断の自動化の分野への直接的な影響を示唆するものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:01:55 GMT)
Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.7]
速度歪み認識制御可能な多目的画像圧縮法を提案する。本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:17:51 GMT)
Within the Dynamic Context: Inertia-aware 3D Human Modeling with Pose Sequence [47.2]
本研究では、現在のフレームのポーズ状態だけでなく、過去のポーズ状態にも人間の外観の変化が依存していることを明らかにする。非剛性変形に対するデルタポーズシーケンス表現を利用した新しい手法であるDycoを導入する。さらに, 慣性を考慮した3次元人間の手法は, 異なる速度での慣性による外観変化を前例なくシミュレートすることができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:12:46 GMT)
Animate3D: Animating Any 3D Model with Multi-view Video Diffusion [47.1]
Animate3Dは静的な3Dモデルをアニメーションするための新しいフレームワークである。 MV-VDMは静的3Dオブジェクトのマルチビューレンダリングに条件付けされている。 Animate3Dは従来のアプローチよりも大幅に優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:35:57 GMT)
Towards Reliable Evaluation and Fast Training of Robust Semantic Segmentation Models [47.0]
我々は,mIoUとmIoUの精度の異なる指標を最小化する,いくつかの問題固有の新規攻撃を提案する。驚くべきことに、セマンティックセグメンテーションモデルに対する既存の敵の訓練の試みは、弱かったり、全く損なわれなかったりする。最近提案された堅牢なImageNetバックボーンを用いて,PASCAL-VOCとADE20kの最大6倍のトレーニング時間を持つ,対向的に堅牢なセマンティックセマンティックセマンティクスモデルを得ることができることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:54:12 GMT)
GTPT: Group-based Token Pruning Transformer for Efficient Human Pose Estimation [46.7]
効率的なポーズ推定のためのグループベースToken Pruning Transformer (GTPT) 効率的なポーズ推定のためのグループベースToken Pruning Transformer (GTPT)
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:32:21 GMT)
Hierarchical Separable Video Transformer for Snapshot Compressive Imaging [46.2]
HiSViT(Hierarchical Separable Video Transformer)は、時間的アグリゲーションのない再構成アーキテクチャである。 HiSViTは、CSS-MSAとGSM-FFN(Gated Self-Modulated Feed-Forward Network)の複数グループによって構築されている。我々のメソッドは、同等または少ない複雑さとパラメータで$>!0.5$で前のメソッドより優れています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:35:59 GMT)
Unsupervised Concept Discovery Mitigates Spurious Correlations [45.5]
トレーニングデータにおける急激な相関関係のモデルはしばしば脆い予測を発生させ、意図しないバイアスを導入する。本稿では,教師なし対象中心学習と突発的相関の緩和の新たな関連性を確立する。コバルト(CoBalT)は、サブグループの人間のラベル付けを必要とせず、効果的に素早い相関を緩和する概念バランス技術である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:54:43 GMT)
TeethDreamer: 3D Teeth Reconstruction from Five Intra-oral Photographs [45.1]
そこで我々は,上下顎歯の形状と位置を復元する3次元再構築フレームワークTeethDreamerを提案する。口腔内5枚の写真から,まず大きな拡散モデルの事前知識を活用して,新しい多視点画像を生成する。生成したビュー間の3D整合性を確保するために,逆拡散プロセスに3D対応機能アテンション機構を統合する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:24:32 GMT)
A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0]
時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。 LLMの入力に生テキストを直接統合しても、ゼロショット補間性能は向上しないことがわかった。対照的に、特定の複雑なイベントや微調整LDMに生テキストを組み込むことで、性能が大幅に向上する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:58:54 GMT)
BraTS-PEDs: Results of the Multi-Consortium International Pediatric Brain Tumor Segmentation Challenge 2023 [44.6]
小児脳腫瘍に焦点を当てた第1回BraTS-PEDs 2023チャレンジの結果を報告する。 BraTS-PEDs 2023は、磁気共鳴画像による小児脳グリオーマの体積分割アルゴリズムの評価を目的とした。小児腫瘍分析におけるトップパフォーマンスのAIアプローチには、nnU-NetとSwin UNETR、Auto3DSeg、あるいはnnU-Netの自己組織化フレームワークによるアンサンブルが含まれていた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:52:45 GMT)
CompoDiff: Versatile Composed Image Retrieval With Latent Diffusion [44.3]
本稿では,ゼロショット合成画像検索(ZS-CIR)を遅延拡散で解くための新しい拡散モデルCompoDiffを提案する。また,CIRモデルをトレーニングするための1880万の参照画像,条件,および対応するターゲット画像三重項を含む,SynthTriplets18Mという新しい合成データセットも紹介した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:23:37 GMT)
Rotary Position Embedding for Vision Transformer [44.3]
本研究では、視覚変換器(ViT)に適用した場合の回転位置埋め込み(RoPE)の包括的解析を提供する。 RoPEは印象的な補間性能、すなわち推論時の画像解像度を増大させながら精度を維持する。最終的にImageNet-1k、COCO検出、ADE-20kセグメンテーションのパフォーマンスが向上した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:54:56 GMT)
Gradients Look Alike: Sensitivity is Often Overestimated in DP-SGD [44.1]
DP-SGDのリークは、一般的なベンチマークでトレーニングした場合、多くのデータポイントのプライバシが大幅に低下することを示す。これは、敵がトレーニングデータセットを十分にコントロールしていない場合、プライバシ攻撃が多くのデータポイントに対して必ず失敗することを意味する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:06:54 GMT)
Progressive Pretext Task Learning for Human Trajectory Prediction [44.1]
本稿では,PPT(Progressive Pretext Task Learning)フレームワークについて紹介する。トランスフォーマーを用いたトラジェクトリ予測器を設計し,高効率な2段階推論を実現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:48:18 GMT)
Beyond Correctness: Benchmarking Multi-dimensional Code Generation for Large Language Models [43.6]
本稿では,大規模言語モデル(LLM)が生成するコードの品質を包括的に評価する RACE ベンチマークを提案する。ユーザ要求を満たす正しいコードを生成するモデルの能力を評価するために,各次元の様々なタイプのユーザ要件を設計する。 RACE上の18の代表的なLCMを評価し、要求に応じて高品質なコードを生成する能力は、まだソフトウェア開発の要件を満たしていないことを発見した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:08:48 GMT)
UNIT: Backdoor Mitigation via Automated Neural Distribution Tightening [43.1]
ディープニューラルネットワーク(DNN)は様々な分野で有効性を示している。 DNNはバックドアアタックに対して脆弱で、インプットにトリガーと呼ばれるユニークなパターンを注入することで、アタック・チョーゼンターゲットラベルの誤分類を引き起こす。本稿では, 各種攻撃に対するバックドア効果を効果的に除去する, ポストトレーニング防衛技術を紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:33:05 GMT)
Learning Multi-view Anomaly Detection [42.9]
本研究では,最近提案された多視点異常検出(AD)タスクについて検討する。我々は、textbfMulti-textbfView textbfAnomaly textbfMVAD (textbfMVAD)フレームワークを導入し、マルチビューから機能を学び、統合する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:26:34 GMT)
Learning Confidence Bounds for Classification with Imbalanced Data [42.7]
本稿では,学習理論と集中不等式を利用して従来のソリューションの欠点を克服する新しい枠組みを提案する。本手法は, クラスごとに異なる不均衡度に効果的に適応できるため, より堅牢で信頼性の高い分類結果が得られる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:02:27 GMT)
Thermal Imaging and Radar for Remote Sleep Monitoring of Breathing and Apnea [42.0]
睡眠モニタリングのためのレーダとサーマルイメージングの初回比較を行った。熱画像法では,0.99,精度0.68,リコール0.74,F1スコア0.71,クラス内相関0.73が検出された。マルチモーダル・セットアップを活用して閉塞性および中枢性睡眠時無呼吸を分類するための新しい提案を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:26:50 GMT)
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices [41.2]
低ランク量子化$-$は、大規模言語モデルのための単純だが効果的なポストトレーニング重み量子化法である。低ランク構造によるパラメータ共有により、LRQは重みの個別のスケーリングを可能にしながら、パラメータを著しく少ない値で学習するのみである。従来の LLM PTQ よりも, (i) 8$-bit ウェイトおよび (ii) 4$-bit ウェイトおよび (ii) 8$-bit アクティベーション量子化, (iii) 低ビットウェイトのみの量子化スキームにおける LRQ の優位性を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:32:07 GMT)
OPT-Tree: Speculative Decoding with Adaptive Draft Tree Structure [41.0]
投機的復号には、複数のトークンを1ステップで生成できるようにする"ドラフトと検証"機構が使用されている。既存の手法は主に固定されたドラフト構造を採用しており、異なる状況に適応できない。我々は適応的でスケーラブルなドラフトツリーを構築するアルゴリズムであるOPT-Treeを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:45:01 GMT)
Graph Dimension Attention Networks for Enterprise Credit Assessment [40.9]
グラフ次元注意ネットワーク(GDAN)という新しいアーキテクチャを提案する。 GDANは、細粒度のリスク関連特性を捉えるための次元レベルの注意機構を組み込んでいる。金融シナリオにおけるGNN手法の解釈可能性について検討し、GDAN-DistShiftと呼ばれるGDANのためのデータ中心の説明器を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:24:28 GMT)
FairProof : Confidential and Certifiable Fairness for Neural Networks [40.8]
消費者の心の中では、機械学習モデルの公平性に関する不信が高まっている。我々は、Zero-Knowledge Proofsを使用して、機密性を保ちながらモデルの公正性を公に検証するシステムであるnameを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:56:20 GMT)
Trust No Bot: Discovering Personal Disclosures in Human-LLM Conversations in the Wild [40.6]
人間とチャットボットのインタラクションにおける個人の開示を測定することで、ユーザのAIリテラシーをよりよく理解することができる。我々は、実際のユーザが商用のGPTモデルに対して行った個人情報を詳細に分析する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:05:31 GMT)
Toward Tiny and High-quality Facial Makeup with Data Amplify Learning [40.4]
小型メイクモデル「TinyBeauty」とともに「データ増幅学習」を提案する。 DALの中核となる考え方は、DDA(Diffusion-based Data Amplifier)を使用して、モデルトレーニングのために制限されたイメージを"増幅"することにある。 TinyBeautyはiPhone 13で460fpsという驚くべき速度を実現している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:43:04 GMT)
A Comparative Study of Image Restoration Networks for General Backbone Network Design [39.7]
5つの古典的画像復元タスクの比較研究を行った。ベンチマーク結果を提示し、異なるモデルの性能格差の背景にある理由を解析する。我々は,新しい画像復元バックボーンネットワークであるX-Restormerを設計する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:08:15 GMT)
Advanced Model Consistency Restoration with Higher-Order Short-Cut Rules [39.6]
我々は、同期中に、より複雑なSC規則をオンザフライで計算する手法を開発した。これらの高階のSCルールは、複数の変更を1ステップで処理しなければならない場合に、より複雑なシナリオに対処することができます。評価により、高次SCルールのオンザフライでの計算のオーバーヘッドは許容可能であり、時には全体的な性能も向上することが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:25:48 GMT)
Learning on Graphs with Large Language Models(LLMs): A Deep Dive into Model Robustness [39.6]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示している。 LLMがグラフ上での学習において堅牢性を示すかどうかは不明である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:05:31 GMT)
Far from Perfect: Quantum Error Correction with (Hyperinvariant) Evenbly Codes [38.7]
Evenbly コードと呼ばれる新しいクビット符号のクラスを導入します。我々の研究は、イブリー符号が実用的な量子コンピューティングアプリケーションにとって有望であることを示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:18:13 GMT)
Biomedical Visual Instruction Tuning with Clinician Preference Alignment [38.6]
臨床適応型バイオメディカル・ビジュアル・インストラクション・チューニング(BioMed-VITAL)を提案する。本研究では,臨床医の嗜好を生医学的マルチモーダル基礎モデルのチューニングのための指導データの生成と選択の両段階に組み込んだデータ中心型フレームワークを提案する。その結果,提案手法から得られた指示追従データに調整したモデルでは,オープン・ビジュアル・チャット(18.5%)と医療用VQA(81.73%)の大幅な改善が見られた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:56:05 GMT)
DeMamba: AI-Generated Video Detection on Million-Scale GenVideo Benchmark [38.6]
我々は,AIが生成した最初のビデオ検出データセットであるGenVideoを紹介する。大量のビデオがあり、その中にはAIが生成し、実際のビデオが100万本以上含まれている。我々はデテール・マンバ(Detail Mamba)というプラグイン・アンド・プレイ・モジュールを導入し、AI生成ビデオを特定して検出器を強化する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:34:28 GMT)
Scaling Sign Language Translation [38.4]
手話翻訳(SLT)は、ビデオ中の手話からテキスト中の音声言語への情報を翻訳する問題に対処する。本稿では,事前学習データ,モデルサイズ,翻訳方向の数を拡大することにより,SLTのフロンティアを推し進める。実験では、バニラベースラインよりも大幅に品質が向上し、以前のSOTA(State-of-the-art)をはるかに上回った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:36:58 GMT)
InterFusion: Text-Driven Generation of 3D Human-Object Interaction [38.4]
ゼロショットテキスト・ツー・3D方式でテキスト記述から3次元オブジェクト間相互作用(HOI)を生成する複雑な課題に取り組む。本稿では,HOI生成に特化して設計された2段階フレームワークであるInterFusionを紹介する。実験の結果,InterFusionは3次元HOI生成において既存の最先端手法よりも優れていたことが確認された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:20:31 GMT)
One-Shot Unlearning of Personal Identities [38.4]
O-UPI (One-Shot Unlearning of Personal Identities) は、トレーニングデータがアクセスできない場合の未学習モデルを評価する。 CelebAとCelebA-HQデータセットの忘れを、異なる学習セットサイズでベンチマークする。得られたサンプルとトレーニング時に使用するデータとの相違点がある場合,データ可用性が制限された場合,既存のアプローチは困難であることが示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:00:54 GMT)
Uniformly Accelerated Motion Model for Inter Prediction [38.3]
自然ビデオでは、通常、変動速度を持つ複数の移動物体が存在し、その結果、コンパクトに表現することが難しい複雑な運動場が生じる。 Versatile Video Coding (VVC) では、既存のインター予測手法は連続するフレーム間の均一な速度運動を仮定する。本研究では,動画フレーム間の移動物体の運動関連要素(速度,加速度)を利用する一様加速度運動モデル(UAMM)を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:46:29 GMT)
XTraffic: A Dataset Where Traffic Meets Incidents with Explainability and More [38.1]
トラヒックとインシデントという2つの非常に相関の深いトラックで研究が行われている。 XTrafficデータセットには、トラフィック、すなわち、トラフィックフロー、車線占有率、平均車両速度の時系列インデックスが含まれている。各ノードは、レーンの詳細な物理ポリシーレベルのメタ属性を含む。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:16:01 GMT)
Learning Unified Reference Representation for Unsupervised Multi-class Anomaly Detection [38.1]
RLRと呼ばれる新しい特徴再構成に基づく異常検出フレームワークを提案する。 RLRは学習可能な参照表現を使用して、モデルに正常な特徴パターンを明示的に学習するように強制する。 15カテゴリのMVTec-ADデータセットと12カテゴリのVisAデータセットによるRLRの評価は、最先端の手法と比較して優れた性能を示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:25:19 GMT)
AU-vMAE: Knowledge-Guide Action Units Detection via Video Masked Autoencoder [38.0]
顔行動単位(FAU)検出のためのビデオレベルの事前学習方式を提案する。我々の設計の中心は、ビデオマインドオートエンコーダに基づく事前訓練されたビデオ特徴抽出器である。提案手法は,BP4DおよびdisFA FAUsデータセットで使用されている既存の最先端手法と比較して,性能の大幅な向上を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:07:47 GMT)
NeedleBench: Can LLMs Do Retrieval and Reasoning in 1 Million Context Window? [37.6]
NeedleBenchは、バイリンガルの長期コンテキスト能力を評価するための、徐々に難しいタスクからなるフレームワークである。私たちはこのフレームワークを使って、主要なオープンソースモデルがその疑問に関連する重要な情報をどの程度正確に特定できるかを評価する。本稿では,実世界の長文タスクに現れる可能性の高い論理的推論課題の複雑さを模倣するAncestral Trace Challengeを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:06 GMT)
LMExplainer: Grounding Knowledge and Explaining Language Models [37.6]
GPT-4のような言語モデル(LM)は、AIアプリケーションにおいて重要であるが、不透明な意思決定プロセスは、特に安全クリティカルな領域において、ユーザの信頼を低下させる。 LMExplainerは,人間の直感的,理解可能な説明を通じて,LMの推論過程を明らかにする新しい知識基盤説明器である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:53:31 GMT)
CycleHOI: Improving Human-Object Interaction Detection with Cycle Consistency of Detection and Generation [37.5]
本稿では,人間と物体の相互作用(HOI)の検出性能を高めるために,CycleHOIという新しい学習フレームワークを提案する。我々の鍵となる設計は、HOI検出器のトレーニングのための新しいサイクル整合性損失を導入することである。我々は,CycleHOIの有効性と一般化力を検証するための広範囲な実験を行った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:55:43 GMT)
CodeV: Empowering LLMs for Verilog Generation through Multi-Level Summarization [37.4]
本稿では,オープンソースの命令調整型Verilog生成用LLMであるCodeVを紹介する。 CodeVは以前のオープンソースSOTAを14.4%(VerilogEvalのBetterV)と11.3%(RTLCoder in RTLLM)で相対的に上回っている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:53:59 GMT)
Cover-separable Fixed Neural Network Steganography via Deep Generative Models [37.1]
我々は、Cs-FNNSという、カバー分離可能な固定ニューラルネットワークステレオグラフィーを提案する。 Cs-FNNSでは,シークレットデータを受容不能な摂動に直接エンコードするSPSアルゴリズムを提案する。本稿では,視覚的品質と非検出性の観点から,提案手法の優れた性能を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:47:06 GMT)
Beyond Pixels: Semi-Supervised Semantic Segmentation with a Multi-scale Patch-based Multi-Label Classifier [37.0]
マルチスケールパッチベースマルチラベル(MPMC)を導入する。 MPMCはパッチレベルの監視を提供し、パッチ内の異なるクラスのピクセル領域の識別を可能にする。 MPMCは、教師のうるさい疑似ラベル監督の影響を軽減するためにパッチレベルの分類を用いて、適応的な擬似ラベル重みを学習する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:49:31 GMT)
The Devil is in the Statistics: Mitigating and Exploiting Statistics Difference for Generalizable Semi-supervised Medical Image Segmentation [36.5]
この課題に対処するために、半教師付きドメインの一般化が提案されている。医療機関間のドメインシフトが、異なる特徴統計を引き起こすことを観察する。この現象は、目に見えない領域の一般化を促進するために利用することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:41:48 GMT)
Explaining the Implicit Neural Canvas: Connecting Pixels to Neurons by Tracing their Contributions [36.4]
Implicit Neural Representation (INR) は、信号の連続表現として訓練されたニューラルネットワークである。我々の研究は、各ニューロンの出力画素への寄与の強さを調べることによって、INRの特性を説明する統一的な枠組みである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:04:34 GMT)
Optical Mode Control, Switching and Shaping In Few Mode Fiber Using a Fiber Piano [36.1]
SMF-28ファイバーと半/4ウェーブプレートへの準最適結合により、このファイバピアノは所望の空間モードを生成・再生できることがわかった。空間モードプロファイルの制御は、単一の光子レベルにまで拡張される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:24:44 GMT)
Reflective Instruction Tuning: Mitigating Hallucinations in Large Vision-Language Models [36.1]
大規模視覚言語モデル(LVLM)は様々な視覚言語タスクにおいて有望な性能を示す。幻覚に敏感であり、視覚内容や指示と不一致な出力を生成する。本稿では,理科学習を視覚的指導調律に統合した反射的指導調律を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:32:45 GMT)
Universal Sound Separation with Self-Supervised Audio Masked Autoencoder [35.6]
本稿では,音声マスク付きオートエンコーダ(A-MAE)を汎用的な音声分離システムに統合する自己教師付き事前学習モデルを提案する。提案手法は,最先端のResUNetベースUSSモデルの分離性能の向上に成功している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:11:44 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [35.4]
本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:20:39 GMT)
ReLaX-VQA: Residual Fragment and Layer Stack Extraction for Enhancing Video Quality Assessment [35.0]
本稿では, NR-VQA(No-Reference Video Quality Assessment)モデルであるReLaX-VQAを提案する。 ReLaX-VQAは、残留フレームと光学フローの断片と、サンプルフレームの空間的特徴の異なる表現を用いて、動きと空間的知覚を高める。我々は、NR-VQAのさらなる研究と応用を促進するために、コードをオープンソース化し、訓練されたモデルを公開します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:33:55 GMT)
NeuSurfEmb: A Complete Pipeline for Dense Correspondence-based 6D Object Pose Estimation without CAD Models [34.9]
CADモデルを必要とせず、入力として少数の実画像のみを必要とする最先端のポーズ推定器を訓練できるパイプラインを提案する。提案手法は,Structure-from-Motion (SfM) とオブジェクトに依存しないセグメンテーションに基づいて,半自動で学習するNeuS2オブジェクト表現に基づいている。提案手法をLINEMOD-Occlusionデータセット上で評価し,各コンポーネントの影響を広範囲に検討し,CADモデルとPBRデータに基づくアプローチによる競合性能を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:48:22 GMT)
Diff-Reg v1: Diffusion Matching Model for Registration Problem [34.6]
既存の手法では、幾何学的あるいは意味的な特徴を利用して潜在的な対応を生成する。従来はシングルパス予測に頼っていた手法は、複雑なシナリオにおいて局所的なミニマと競合する可能性がある。本稿では,ロバスト対応推定のための拡散マッチングモデルを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:48:21 GMT)
PADRe: A Unifying Polynomial Attention Drop-in Replacement for Efficient Vision Transformer [33.7]
PADReは、トランスフォーマーモデルにおける従来の自己注意機構を置き換えるために設計されたフレームワークである。 PADReの鍵となるコンポーネントは乗法的非線形性(multiplicative linearities)である。多様なコンピュータビジョンタスクにおける自己注意の代替手段としてのPADReの有効性を評価する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:45:44 GMT)
Image Clustering with External Guidance [33.7]
クラスタリングのコアは、監視信号を構築するために、事前の知識を取り入れている。本稿では,クラスタリングを誘導する新たな監視信号として外部知識を活用することを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:11:59 GMT)
Navigating the Data Trading Crossroads: An Interdisciplinary Survey [33.6]
データは、将来の経済にとって重要な要素として、ますます認識されるようになった。しかし、効率的なデータトレーディング市場の構築は、プライバシー侵害、データ独占、誤用といった問題に直面している。本稿では,既存の問題と研究ギャップを同定し,潜在的な解決策を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:07:16 GMT)
Scaling Diffusion Transformers to 16 Billion Parameters [33.4]
本稿では拡散変換器のスパースバージョンであるDiT-MoEについて述べる。実験により,DiT-MoEは高密度ネットワークに匹敵する性能を実現するが,推論時の計算負荷ははるかに少ないことを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:55:23 GMT)
QVD: Post-training Quantization for Video Diffusion Models [33.1]
ポストトレーニング量子化(PTQ)は、メモリフットプリントの削減と計算効率の向上に有効な手法である。本稿では,QVDと呼ばれるビデオ拡散モデルに適した最初のPTQ戦略を紹介する。我々は、W8A8のほぼロスレス性能劣化を達成し、FVDの205.12倍の性能向上を実現した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:47:27 GMT)
Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting [32.6]
近年の手法では、走行中の車両のポーズをアニメーションに取り入れてNeRFを拡張し、ダイナミックな街路シーンのリアルな視認を可能にしている。この制限に対処する新たな明示的なシーン表現であるStreet Gaussiansを紹介します。提案手法は,全データセットで常に最先端の手法より優れる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:12:54 GMT)
GV-Bench: Benchmarking Local Feature Matching for Geometric Verification of Long-term Loop Closure Detection [32.5]
ループクロージャは軌道推定における正しいドリフトを補正し、グローバルに一貫したマップを構築する。偽ループ閉鎖は致命的であり、堅牢性を保証するための追加のステップとして検証が必要である。本稿では,長期条件下でのループ閉鎖検出の幾何的検証を対象とする統一ベンチマークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:05:19 GMT)
Bridge Past and Future: Overcoming Information Asymmetry in Incremental Object Detection [32.2]
漸進的な物体検出において、知識蒸留は破滅的な忘れを緩和する有効な方法であることが証明されている。以前の研究は、過去のモデルの知識を保存し、画像が過去、現在、そして将来の段階のカテゴリを同時に含んでいることを無視することに焦点を当てていた。本稿では,ブリッジ・パス・アンド・フューチャー(BPF)と呼ばれる手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:37:12 GMT)
Approximating Probabilistic Inference in Statistical EL with Knowledge Graph Embeddings [32.1]
統計的EL(SEL)の例を用いて,知識グラフの埋め込みを用いて確率的推論を効率的に近似する方法を説明する。我々は,ランタイムと音質保証の証明を提供し,我々のアプローチのランタイムと近似品質を実証的に評価する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:08:33 GMT)
A Watermark-Conditioned Diffusion Model for IP Protection [32.0]
拡散モデルにおけるコンテンツ著作権保護のための統一的な透かしフレームワークを提案する。そこで我々はWaDiffと呼ばれるWadmark条件付き拡散モデルを提案する。本手法は,検出タスクと所有者識別タスクの両方において有効かつ堅牢である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:40:37 GMT)
LiCamPose: Combining Multi-View LiDAR and RGB Cameras for Robust Single-frame 3D Human Pose Estimation [31.7]
LiCamPoseは、マルチビューRGBとスパースポイントクラウド情報を統合して、単一のフレームで堅牢な3Dポーズを推定するパイプラインである。 LiCamPoseは、2つの公開データセット、1つの合成データセット、1つの挑戦的な自己収集データセットを含む4つのデータセットで評価されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:30:58 GMT)
Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling [31.6]
階層的状態空間モデル(HiSS)は概念的にシンプルで,連続的な逐次予測のための新しい手法である。 HiSSスタックは、時間階層を生成するために、互いに上にステートスペースモデルを構造化する。 HiSSは、因果変換器、LSTM、S4、Mambaといった最先端のシーケンスモデルをMSEで少なくとも23%上回っている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:38:41 GMT)
Turbo: Informativity-Driven Acceleration Plug-In for Vision-Language Large Models [31.1]
Turboは、情報次数を参照するデータをソートするプラグインで、トップレベルのデータだけを使ってコストを節約する。複数のVLMベンチマークにおいて,我々はTurboの良好な加速を無視可能な性能低下下で完全に実証する実験を行った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:35:26 GMT)
LOTUS: Enabling Semantic Queries with LLMs Over Tables of Unstructured and Structured Data [30.8]
構成可能なAIベースの操作でリレーショナルモデルを拡張するプログラミングインターフェースであるセマンティック演算子を導入する。我々は,PandasライクなAPIを備えたオープンソースのクエリエンジンであるLOTUSで,演算子といくつかの最適化を実装した。我々は,ファクトチェック,極端なマルチラベル分類,検索など,一連の実アプリケーションにおいてLOTUSの有効性を実証する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:19:14 GMT)
PRET: Planning with Directed Fidelity Trajectory for Vision and Language Navigation [30.7]
視覚と言語ナビゲーションは、エージェントが自然言語の指示に従ってナビゲートする必要があるタスクである。近年の手法では、各ステップで構築されたトポロジーマップのサブゴールを予測し、長期的な行動計画を可能にする。本稿では,指示と指向性軌道のアライメントを考慮し,ナビゲーション計画を容易にする方法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:22:18 GMT)
We are Who We Cite: Bridges of Influence Between Natural Language Processing and Other Academic Fields [30.6]
自然言語処理の分野横断は減少している。 NLPの引用の8%以下は言語学に関するものである。 NLPの引用の3%以下は数学と心理学に関するものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:50:11 GMT)
Real-time Holistic Robot Pose Estimation with Unknown States [30.4]
RGB画像からロボットのポーズを推定することは、コンピュータビジョンとロボット工学において重要な問題である。従来の手法では、例えば接地型ロボットの関節角など、ロボットの内部状態の完全な知識が想定されていた。本研究は,RGB画像からリアルタイムロボットのポーズ推定を行う上で,既知のロボットの状態を必要としない効率的なフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:57:48 GMT)
Context-Guided Diffusion for Out-of-Distribution Molecular and Protein Design [30.2]
我々は、ラベルのないデータと滑らかな制約を利用して、ガイド付き拡散モデルのアウト・オブ・ディストリビューション一般化を改善するシンプルなプラグ・アンド・プレイ法である文脈誘導拡散法(CGD)を開発した。このアプローチは、連続的、離散的、グラフ構造化された拡散プロセスや、薬物発見、材料科学、タンパク質設計にまたがる応用など、様々な状況において、大幅なパフォーマンス向上をもたらす。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:34:00 GMT)
Learning to Break Deep Perceptual Hashing: The Use Case NeuralHash [29.7]
Appleは最近、子供の性的虐待物質を検出するための深い知覚的ハッシュシステムNeuralHashを発表した。ユーザのプライバシとシステムの信頼性の保護について、大衆の批判が持ち上がった。現在の深い知覚的ハッシュは、堅牢でない可能性がある。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:48:41 GMT)
Gradient Flows and Riemannian Structure in the Gromov-Wasserstein Geometry [29.7]
本稿ではGromov-Wasserstein(GW)幾何学における勾配流について検討する。本稿では,$mathbbRd上の分布間の内部積 GW (IGW) 距離に着目した。固有IGW幾何を創り出す固有IGW幾何を同定し,それを用いて,IGWのベナモ・ブレニエ式を定式化する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:53:23 GMT)
sPhinX: Sample Efficient Multilingual Instruction Fine-Tuning Through N-shot Guided Prompting [29.6]
本稿では,多言語合成指導調律データセット sPhinX を作成するための新しいレシピを提案する。 SPhinXは、命令応答対を英語から50言語に選択的に翻訳することで作成される。 Phi-3-Small と Mistral-7B の2つの最先端モデルを微調整するために sPhinX の有効性を検証した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:23:18 GMT)
WebCanvas: Benchmarking Web Agents in Online Environments [29.3]
WebCanvasは、Webエージェントのための革新的なオンライン評価フレームワークである。我々は、推論のためのモジュールを備えたエージェントフレームワークをオープンソースとして公開し、コミュニティがオンライン推論と評価を行うための基盤を提供します。ベストパフォーマンスエージェントは,Mind2Web-Liveテストセット上でのタスク成功率23.1%,タスク完了率48.8%を達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:19:21 GMT)
3D-COCO: extension of MS-COCO dataset for image detection and 3D reconstruction modules [29.1]
3D-COCOは、3Dモデルと2D-3Dアライメントアノテーションを提供するMS-COCOデータセットの拡張である。 3D-COCOのオープンソース性は、新しい3D関連トピック研究の道を開くためのプレミアである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:14:45 GMT)
How Control Information Influences Multilingual Text Image Generation and Editing? [29.0]
TextGenは、制御情報を最適化することによって生成品質を向上させるように設計された新しいフレームワークである。制御情報の異なる役割を異なる段階で整合させるために、2段階生成フレームワークを用いる。本手法は、中国語と英語の両方のテキスト生成における最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:40:21 GMT)
Controllable Contextualized Image Captioning: Directing the Visual Narrative through User-Defined Highlights [29.0]
CIC(Contextualized Image Captioning)は、従来の画像キャプションをより複雑なドメインに進化させる。本稿では,Ctrl-CIC(Contulable Contextualized Image Captioning)の新たな領域を提案する。本稿では, Prompting-based Controller (P-Ctrl) と Recalibration-based Controller (R-Ctrl) の2つのアプローチを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:32:48 GMT)
A Reference Architecture for Designing Foundation Model based Systems [28.8]
ファンデーションモデルが将来のAIシステムの基本的なビルディングブロックになる、という広いコンセンサスがある。基礎モデルをAIシステムに組み込むことは、責任と安全性に関する重要な懸念を提起する。本稿では,基礎モデルに基づくシステム設計のためのパターン指向参照アーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:35:43 GMT)
Revisiting Deep Ensemble for Out-of-Distribution Detection: A Loss Landscape Perspective [28.5]
Out-of-Distribution (OoD) は、In-Distribution (InD) データからOoDサンプルを検出する方法である。我々は,OoD検出における損失景観とモードアンサンブルの新しい視点を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:49:19 GMT)
Private prediction for large-scale synthetic text generation [28.5]
大規模言語モデル(LLM)を用いた微分プライベートテキスト生成手法を提案する。プライベートな予測フレームワークでは、差分プライバシー保証を満たすために出力された合成データのみを必要とする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:28:40 GMT)
GADePo: Graph-Assisted Declarative Pooling Transformers for Document-Level Relation Extraction [28.4]
本稿では,共同テキストグラフ変換モデルとグラフ支援宣言型プール(GADePo)仕様を導入する。 GADePoにより、プールプロセスはドメイン固有の知識や望ましい結果によってガイドされるが、Transformerによって学習される。提案手法は,手書きプーリング関数により達成された結果よりも一貫した有望な結果が得られることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:54:31 GMT)
The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research [28.4]
我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。 NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:53:19 GMT)
Change-Agent: Towards Interactive Comprehensive Remote Sensing Change Interpretation and Analysis [28.4]
現在のRSICI技術は、変更検出と変更キャプションを包含しており、それぞれに包括的な解釈を提供する限界がある。本稿では,ユーザ指示に従って包括的な変更解釈を実現するインタラクティブなChange-Agentを提案する。 Change-Agentは、マルチレベル変化解釈(MCI)モデルを目として、大きな言語モデル(LLM)を脳として統合する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:43:23 GMT)
Event-Aided Time-to-Collision Estimation for Autonomous Driving [28.1]
ニューロモルフィックなイベントベースカメラを用いて衝突時刻を推定する新しい手法を提案する。提案アルゴリズムは, 事象データに適合する幾何モデルに対して, 効率的かつ高精度な2段階のアプローチで構成する。合成データと実データの両方の実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:14:30 GMT)
TeacherLM: Teaching to Fish Rather Than Giving the Fish, Language Modeling Likewise [27.9]
我々は,ほとんどのNLPサンプルに対して,関連する基本,思考の連鎖,一般的な誤りを注釈できるTeachLM-7.1Bを提案する。このモデルはMMLUで52.3のゼロショットスコアを獲得し、100B以上のパラメータを持つほとんどのモデルを上回った。 TeacherLMシリーズのモデルと拡張データセットをオープンソースとしてリリースします。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:02:01 GMT)
EgoExo-Fitness: Towards Egocentric and Exocentric Full-Body Action Understanding [27.9]
EgoExo-Fitnessは新しいフルボディアクション理解データセットである。シンクロナイズドエゴセントリックカメラと固定型エゴセントリックカメラで撮影されたフィットネス・シーケンス・ビデオが特徴。 EgoExo-Fitnessは、エゴセントリックでエゴセントリックなフルボディの行動理解を研究するための新しいリソースを提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:35:49 GMT)
SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning [27.7]
自己教師付き学習(SSL)は、データ表現を符号化する一般的な手法である。 SSLエンコーダに埋め込まれたTrojan攻撃は隠蔽的に動作し、複数のユーザやデバイスに分散する。 SSLエンコーダのバックドア脅威を特定し軽減するためのソリューションとしてSSL-Cleanseを導入します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:07:24 GMT)
Does Refusal Training in LLMs Generalize to the Past Tense? [27.5]
我々は、現在の拒絶訓練アプローチにおける興味深い一般化のギャップを明らかにする。本手法をLlama-3 8B, GPT-3.5 Turbo, Gemma-2 9B, Phi-3-Mini, GPT-4o, R2D2モデルで系統的に評価した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:55 GMT)
Temporally Consistent Stereo Matching [27.5]
ビデオステレオマッチングを時間的不均質化のプロセスとして定式化し,連続的な反復的改善を行った。本手法は時間的不整合を効果的に軽減し,精度と効率を両立させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:44:34 GMT)
Self-Duplicating Random Walks for Resilient Decentralized Learning on Graphs [27.1]
本稿では,任意の故障があっても,所望値の周りのグラフ内のRW数を維持できるDECAFORKという分散アルゴリズムを提案する。本稿では,DECAFORKの高速検出と故障に対する反応について,広範囲な数値シミュレーションを行った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:22:22 GMT)
Do LLMs have Consistent Values? [27.1]
我々は,Large Language Models (LLM) によって生成されたテキストで表される値について検討する。我々は,LLMが,値のランク付けや値の相関など,人間で実証されたのと同じ値構造を示すかどうかを問う。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:58:00 GMT)
Satisficing Exploration for Deep Reinforcement Learning [26.7]
現実世界の広大さと規模にアプローチする複雑な環境では、最適な性能を達成することは、実際には完全に難易度の高い試みであるかもしれない。最近の研究は、情報理論から設計エージェントへのツールを活用し、十分な満足や満足のいくソリューションを優先して最適なソリューションを意図的に実現している。モデルベース計画の必要性を回避し、満足度の高いポリシーを学習できるように、最適な値関数に対する不確実性を直接表現するエージェントを拡張します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:28:03 GMT)
Rethinking Fair Graph Neural Networks from Re-balancing [26.7]
単純な再分散手法は、既存の公正なGNN手法と容易に一致するか、追い越すことができる。本稿では,グループバランスによるGNNの不公平さを軽減するために,再バランシングによるFairGB,Fair Graph Neural Networkを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:39:27 GMT)
Exploration Unbound [26.3]
シーケンシャルな意思決定エージェントは、新しい知識を得るための探索と、現在の知識を活用して即時報酬を最大限にするためにバランスをとる。このような複雑な環境の単純で簡潔な例を示します。この環境では、報酬は非有界であり、エージェントは常に、より多くのことを学ぶことで報酬が蓄積される率を高めることができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:14:43 GMT)
Video-Language Alignment Pre-training via Spatio-Temporal Graph Transformer [26.1]
ビデオ言語アライメントは、ビデオテキスト検索や質問応答など、下流の様々なアプリケーションに恩恵をもたらす重要なタスクである。本研究では,ビデオ言語アライメント事前学習のための空間的・時間的文脈を均一に学習する新しい時空間グラフトランスフォーマモジュールを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:52:32 GMT)
CroMo-Mixup: Augmenting Cross-Model Representations for Continual Self-Supervised Learning [26.1]
自己教師付き学習(SSL)によって、CSSLがタスク混乱問題により敏感になることを示す。この課題に触発され、新しいクロスモデル機能Mixup(CroMo-Mixup)フレームワークを提案する。我々はCroMo-Mixupの有効性を評価し,タスクID予測と全タスクの平均線形精度を改善した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:34:26 GMT)
Relation DETR: Exploring Explicit Position Relation Prior for Object Detection [26.0]
本稿では,DETR(Detection TRansformer)の収束性と性能を向上させる手法を提案する。我々の手法であるRelation-DETRは、プログレッシブ・アテンション・リファインメントのための位置関係埋め込みを構築するエンコーダを導入している。汎用データセットとタスク固有のデータセットの両方の実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:17:07 GMT)
Learning Semantic Latent Directions for Accurate and Controllable Human Motion Prediction [26.0]
この課題に対する解決策として,SLD(Semantic Latent Directions)を導入する。 SLDは潜在空間を制約し、意味のある動作意味学を学ぶ。現実主義と多様性のバランスを保ちながら動きを正確に予測する上で,本手法の優位性を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:31:59 GMT)
The Importance of Online Data: Understanding Preference Fine-tuning via Coverage [25.8]
選好微調整におけるオンライン手法とオフライン手法の類似点と相違点について検討した。グローバルなカバレッジ条件は、オフラインのコントラスト手法が最適ポリシーに収束するのに必要かつ十分であることを示す。 KL正規化のためのオンラインデータとコントラストベースの選好最適化にオフラインデータを利用するハイブリッド選好最適化アルゴリズムを導出する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:51:38 GMT)
Convex Analysis at Infinity: An Introduction to Astral Space [25.8]
$mathbbRn$ 上の凸函数は、有限最小化子を持つわけではない。無限遠点が加わったような$mathbbRn$のコンパクトな拡張であるアストラル空間について研究する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:26:24 GMT)
MedContext: Learning Contextual Cues for Efficient Volumetric Medical Segmentation [25.7]
医用3次元セグメンテーションのためのユニバーサルトレーニングフレームワークMedContextを提案する。本手法は,教師付きボクセルセグメンテーションタスクと協調して,自己教師付きコンテキストキューを効果的に学習する。 MedContextの有効性は、複数の3D医療データセットと4つの最先端モデルアーキテクチャで検証されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:24:41 GMT)
Hypergraph Multi-modal Large Language Model: Exploiting EEG and Eye-tracking Modalities to Evaluate Heterogeneous Responses for Video Understanding [25.5]
ビデオの創造性と内容の理解はしばしば個人によって異なり、年齢、経験、性別によって焦点や認知レベルが異なる。実世界のアプリケーションとのギャップを埋めるために,ビデオデータセット用の大規模主観応答指標を導入する。我々は,異なるユーザ間での映像コンテンツの認知的理解度を分析し,評価するためのタスクとプロトコルを開発した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:47:20 GMT)
GPT-4V Cannot Generate Radiology Reports Yet [25.3]
GPT-4Vの強いマルチモーダル能力は、放射線学レポート作成を自動化するためにそれを使うことに関心を喚起する。我々は, GPT-4V を用いた報告を異なるプロンプト戦略により直接生成し, 語彙指標と臨床効果指標の両方で異常を生じさせることを試みた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:03:14 GMT)
Interactions with Generative Information Retrieval Systems [25.1]
既存の検索エンジンでは、インタラクションはいくつかの事前定義されたアクションに限られている。生成IRシステムへ移行する大きな利点は、情報ニーズとフィードバックの豊かな表現をユーザに提供することである。本章では、生成IRシステムにおける相互作用の役割について概説する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:12:22 GMT)
PlayBest: Professional Basketball Player Behavior Synthesis via Planning with Diffusion [24.5]
本稿ではプレイヤーの意思決定を改善する方法であるPlayBest(PLAYer BEhavior DynamicThesis)を紹介する。本研究では,NBA選手の運動追跡データから,拡散確率モデルを拡張し,環境動態を学習する。以上の結果から,このモデルは,効率的なプレーを実現する合理的なバスケットボールコースの創出に優れることが明らかとなった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:01:27 GMT)
Revisiting Relation Extraction in the era of Large Language Models [24.3]
関係抽出(RE)は、テキストからエンティティ間の意味的関係を推測する中核的なNLPタスクである。近年の研究では、入力に条件付きで生成するターゲット文字列としてエンティティ間の関係を線形化することで、その問題を列列化タスクとして扱っている。ここでは、従来の作業よりも大きい言語モデル(GPT-3とFlan-T5)を用いて、標準的なREタスクの性能を様々なレベルの監督下で評価し、このアプローチの限界を推し進める。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:04:10 GMT)
Efficiently Training 7B LLM with 1 Million Sequence Length on 8 GPUs [24.1]
大規模言語モデル(LLM)は、よりクリエイティブなアプリケーションを促進するために、拡張コンテキスト長を使用して訓練されている。本稿では,メモリ管理を微粒化するための新しいフレームワークであるMEMOを提案する。我々は,MEMOがMegatron-LMやDeepSpeedと比較して平均2.42倍,2.26倍のMFUを達成することを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:59:49 GMT)
REVEAL-IT: REinforcement learning with Visibility of Evolving Agent poLicy for InTerpretability [23.8]
REVEAL-ITは複雑な環境下でのエージェントの学習過程を説明するための新しいフレームワークである。各種学習課題における政策構造とエージェントの学習過程を可視化する。 GNNベースの説明者は、ポリシーの最も重要な部分を強調することを学び、エージェントの学習プロセスについてより明確で堅牢な説明を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:13:08 GMT)
Neural Passage Quality Estimation for Static Pruning [23.7]
ニューラルネットワークが、ドキュメントのどのパスが、検索エンジンに送信されたクエリに関連しそうにないかを効果的に予測できるかどうかを検討する。通過品質を推定する新しい手法により,通過コーパスを著しく刈り取ることが可能であることが判明した。この研究は、より高度なニューラルな「学習とインデクシング」手法を開発するための段階を定めている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:47:54 GMT)
cDP-MIL: Robust Multiple Instance Learning via Cascaded Dirichlet Process [23.3]
マルチプル・インスタンス・ラーニング (MIL) は全スライス・ヒストパラメトリック・イメージ (WSI) 解析に広く応用されている。 MILの既存の集約戦略は、主にインスタンス間の一階距離に依存するが、各インスタンスの真の特徴分布を正確に近似することができない。本稿では、複数のインスタンス学習のための新しいベイズ非パラメトリックフレームワークを提案し、WSIのインスタンス・ツー・バッグ特性を組み込むためにディリクレ・プロセスのカスケード(cDP)を採用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:28:39 GMT)
RetailOpt: Opt-In, Easy-to-Deploy Trajectory Estimation from Smartphone Motion Data and Retail Facility Information [23.2]
RetailOptは、屋内小売環境でオフラインで顧客の動きを追跡するための、オプトインで簡単にデプロイできる新しいシステムである。このシステムは、顧客のスマートフォンや小売アプリから簡単にアクセス可能な情報(モーションデータ、ストアマップ、購入記録など)を利用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:58:19 GMT)
Boosting the Transferability of Adversarial Attacks with Global Momentum Initialization [23.1]
敵対的な例は、良心的な入力に人間の知覚能力を加えることで作られる。敵の例では、モデル間での転送可能性を示し、実用的なブラックボックス攻撃を可能にしている。我々は,Global Momentum Initialization (GI)を導入し,勾配除去を緩和するためのグローバルモメンタム知識を提供する。 GIは既存の転送手法とシームレスに統合され、平均6.4%の転送攻撃の成功率を大幅に向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:28:05 GMT)
Feature Inference Attack on Shapley Values [23.0]
特徴推論攻撃を用いたShapley値に基づくモデル解釈可能性手法のプライバシーリスクについて検討する。私たちは、主要な機械学習プラットフォーム、すなわちGoogle Cloud、Microsoft Azure、IBM aix360に対する提案された攻撃を実行します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:50:06 GMT)
Physics-informed tracking of qubit fluctuations [22.8]
物理インフォームドおよび適応ベイズ推定戦略を実装し,それを半導体スピン量子ビットにリアルタイムで適用する。この戦略は、Fokker-Planck方程式に従って量子コントローラ内の確率分布を伝搬する。この戦略は、適切な更新方程式を調整して、異なるノイズ源を捕捉することで、他のキュービットプラットフォームに適用することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:47:58 GMT)
Exploring the Use of Abusive Generative AI Models on Civitai [22.5]
本稿では,AIGCソーシャルプラットフォームとして最大規模のCivitaiを用いて,乱用コンテンツの生成について検討する。 87Kモデルと2M画像を含む包括的データセットを構築した。これらのプラットフォームをよりよく管理するためのモデレーション戦略について議論する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:18:03 GMT)
Strategic Littlestone Dimension: Improved Bounds on Online Strategic Classification [22.0]
戦略エージェントが観測可能な特徴を修正して肯定的な分類を受けられるような設定において、オンライン二項分類の問題について検討する。我々は,仮説クラスと操作グラフの結合複雑性をキャプチャする新しい尺度である,ストラテジック・リトルストーン次元を導入する。我々は、すべてのエージェントがグラフファミリ内の同じグラフで操作する実現可能な設定と、操作グラフが逆向きに選択され、家族内の1つのグラフで一貫したモデル化が行われない非依存的な設定の両方において、後悔すべき境界を導出する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:31:20 GMT)
Beta Sampling is All You Need: Efficient Image Generation Strategy for Diffusion Models using Stepwise Spectral Analysis [22.0]
拡散過程の画像スペクトル解析に基づく効率的な時間ステップサンプリング法を提案する。従来の均一分布に基づく時間ステップサンプリングの代わりに,ベータ分布のようなサンプリング手法を導入する。我々の仮説では、あるステップは画像の内容に大きな変化を示すが、他のステップは最小限に寄与する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:53:06 GMT)
A Survey on Federated Unlearning: Challenges, Methods, and Future Directions [21.9]
近年、忘れられる権利(RTBF)の概念は、デジタル信頼とAI安全のためのデータプライバシの重要な側面となっている。マシン・アンラーニング(MU)は、MLモデルによって識別可能な情報を選択的に排除できる、かなりの注目を集めている。 FUは、フェデレートされた学習環境におけるデータ消去の課題に直面している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:29:20 GMT)
Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous Driving and Zero-Shot Instruction Following [21.8]
Reward-gradient guided denoisingは、微分可能報酬関数と拡散モデルによって捕捉されたデータ分布下での確率の両方を最大化する軌道を生成する。そこで我々は,勾配のない最適化と軌道デノゲーションを組み合わせたDiffusionESを提案する。 DiffusionESは、自動運転のための確立されたクローズドループ計画ベンチマークであるnuPlan上で、最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:54:22 GMT)
A Language Modeling Approach to Diacritic-Free Hebrew TTS [21.5]
我々はヘブライ語におけるテキスト音声(TTS)の課題に取り組む。伝統的なヘブライ語には、個人が与えられた言葉を発音する方法を規定するダイアクリティカル語が含まれている。現代ヘブライ語におけるダイアクリティカルな発音の欠如は、読者が正しい発音を結論付けることを期待する結果となった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:43:49 GMT)
Latent Spectral Regularization for Continual Learning [21.4]
本研究では,学習者の潜伏空間の幾何学的特徴について検討する。潜在空間のラプラシアンスペクトルの弱い要求を強制する幾何正則化器を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:33:12 GMT)
Bayesian Online Multiple Testing: A Resource Allocation Approach [21.2]
本研究では,各実験が仮説テストタスクに対応する連続的な実験を行うことの問題点を考察する。目的は、ローカル・ファルス・ディスカバリー・レート(LFDR)で測定された全ての時点において、低いエラー率を維持しながら発見回数を最大化することである。予算安全バッファを組み込んだ新しいポリシーを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:00:15 GMT)
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather [21.0]
既存のLiDARセマンティックセグメンテーション手法は、悪天候下での性能低下に苦慮することが多い。これまでの研究は、悪天候をシミュレートしたり、トレーニング中に普遍的なデータ拡張を採用することでこの問題に対処してきた。本稿では,性能劣化の主な原因を特定するために,新たな戦略データ拡張手法を提案する。提案手法はセマンティックKITTI-to-SemanticSTFベンチマークで39.5 mIoUを達成し,ベースラインを8.1%改善し,新たな最先端技術を確立した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:32:33 GMT)
MINI-LLM: Memory-Efficient Structured Pruning for Large Language Models [21.0]
大規模言語モデル(LLM)は劇的に成長する。これらのモデルの圧縮と高速化の傾向が増している。本研究では, 粒度, アクティベーション, 勾配を適切に統合したハイブリッドプルーニング基準を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:59:44 GMT)
Improving Unsupervised Video Object Segmentation via Fake Flow Generation [20.9]
本稿では,単一画像からの擬似光フローをシミュレートする新しいデータ生成手法を提案する。光フローマップは深度マップに大きく依存していることから着想を得て,各画像の深度マップを精細化し,拡大することにより,偽の光フローを生成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:32:50 GMT)
Why long model-based rollouts are no reason for bad Q-value estimates [20.8]
本研究の目的は,長期ロールアウトが必ずしも指数関数的に増大するエラーを生じさせるわけではなく,モデルフリー法よりもQ値推定が優れていることを示すことである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:17:00 GMT)
Global atmospheric data assimilation with multi-modal masked autoencoders [20.8]
EarthNetはデータ同化のためのマルチモーダル基礎モデルである。衛星観測のみから、地球規模のギャップに満ちた大気状態を予測することを学ぶ。大気の3次元温度と湿度の地球規模の0.16度の再分析データセットを生成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:15:51 GMT)
SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions -- An EndoVis'24 Challenge [20.6]
現在のフィードフォワードニューラルネットワークに基づく手法は、理想的な条件下では優れたセグメンテーション性能を示す。 SegSTRONG-C チャレンジは、予期せぬが確実な手術画像の破損に対して堅牢なアルゴリズムの開発を促進することを目的としている。新たなベンチマークにより、手術の非敵的腐敗に対するニューラルネットワークの堅牢性について慎重に研究することが可能になります。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:50:43 GMT)
Learning-augmented Maximum Independent Set [20.6]
学習強化アルゴリズムの枠組みにおける一般グラフ上での最大独立集合(MIS)問題について検討する。機械学習モデルから得られた予測によって得られたオラクルの存在下で、この障壁を破ることができることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:05:40 GMT)
Bora: Biomedical Generalist Video Generation Model [20.6]
本稿では,テキスト誘導型バイオメディカルビデオ生成のための最初のモデルであるBoraを紹介する。新たに確立された医用ビデオコーパスを用いて、モデルアライメントとインストラクションチューニングによって微調整を行う。 Boraは、4つの異なるバイオメディカルドメインにわたる高品質なビデオデータを生成することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:00:07 GMT)
An MRP Formulation for Supervised Learning: Generalized Temporal Difference Learning Models [20.3]
従来の統計的学習では、データポイントは独立して同じ分布(d)であると仮定される。本稿では、データポイントを相互接続したものとして認識し、データモデリングにマルコフ報酬プロセス(MRP)を用いる、対照的な視点を示す。我々は、強化学習(RL)における政治政策評価問題として、典型的教師付き学習を再構成し、一般化時間差学習アルゴリズム(TD)を解法として導入する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:53:29 GMT)
SlingBAG: Sliding ball adaptive growth algorithm with differentiable radiation enables super-efficient iterative 3D photoacoustic image reconstruction [20.3]
高画質3D光音響画像 (PAI) の低視野, 限られた視野での再構成は, 長年に渡り困難であった。我々は3次元PAIのためのスライディングボール適応成長アルゴリズム(SlingBAG)を開発した。 SlingBAGは,高度の3次元PAI再構成の能力を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:38:13 GMT)
SDPT: Synchronous Dual Prompt Tuning for Fusion-based Visual-Language Pre-trained Models [20.1]
本稿では,デュアルモーダル融合に基づく視覚言語事前学習モデルに対するSDPT(Synchronous Dual Prompt Tuning)を提案する。 SDPTは、異なるモダリティのトークンに対するモダルマッピングと整列問題に対処し、転送一般化が貧弱になる。実験の結果,SDPTは核融合型VLPMを補助し,モデルパラメータの0.04%に過ぎなかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:07:01 GMT)
KernelSHAP-IQ: Weighted Least-Square Optimization for Shapley Interactions [20.0]
Shapley値(SV)は、機械学習(ML)エンティティにクレジットを割り当てる一般的なアプローチである。シェープリー相互作用指数(Shapley Interaction Index, SII)は、SVの公理的拡張である。本研究では、WLS問題の解として高階SIIを特徴付け、SIIと$k$-Shapley値による最適近似を構築する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:03:01 GMT)
Neural Compression of Atmospheric States [19.9]
ニューラルネットワークの手法を用いて大気状態を圧縮する手法を提案する。モデルの両方の族が小さな平均誤差のデシラタを満たすことを示す。大気中における1000倍を超える圧縮比を示すとともに, 大気中における圧縮と減圧を約1秒の速さで示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:38:39 GMT)
Distribution Alignment for Fully Test-Time Adaptation with Dynamic Online Data Streams [19.9]
TTA(Test-Time Adaptation)は、テストデータストリームの適応と推論を可能にする。本稿では,TTAにおける新しい配電アライメント損失を提案する。我々は、非i.d.シナリオにおける既存の手法を超越し、理想的なi.d.仮定の下で競争性能を維持する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:33:23 GMT)
LoFTI: Localization and Factuality Transfer to Indian Locales [19.8]
LLMのローカライゼーションと実際のテキスト転送機能を評価するために,LoFTIという新しいベンチマークを導入する。 LoFTIは、ソースおよびターゲットロケーションのエンティティに関する事実的なステートメントで構成されている。我々は,LoFTIが高品質な評価ベンチマークであり,GPT-4を含む全てのモデルが,様々な局所性レベルで歪んだ結果を生成することを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:20:43 GMT)
Multi-Channel Masked Autoencoder and Comprehensive Evaluations for Reconstructing 12-Lead ECG from Arbitrary Single-Lead ECG [19.7]
本研究では,実シングルリードECGから12リードECGを再構成するためのマルチチャネルマスク付きオートエンコーダ(MCMA)を提案する。実験の結果,生成した信号と実信号の可視化結果から,提案手法の有効性が示された。本研究は,信号レベル,特徴レベル,診断レベル評価を含む総合評価ベンチマークECGGenEvalを紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:17:45 GMT)
Continuous Embedding Attacks via Clipped Inputs in Jailbreaking Large Language Models [19.7]
大規模言語モデル(LLM)に対するセキュリティ上の懸念は最近エスカレートされ、個別のプロンプトにおけるジェイルブレイクの試みを阻止することに焦点が当てられている。本研究では,LSM入力に対する直接攻撃を行うための新しいチャネルを提案する。この対策として,CLIPというシンプルで効果的な戦略を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:53:00 GMT)
Optimizing KV Cache Eviction in LLMs: Adaptive Allocation for Enhanced Budget Utilization [19.4]
大規模言語モデルは様々な分野で優れているが、推論に必要な広範なKVキャッシュのために効率の限界に直面している。本稿では, 従来の一様割当手法よりも上限の損失を理論的に保証するだけでなく, 自己アテンション機構の特性と効果的に整合する, 単純かつ効果的な適応割当アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:53:32 GMT)
Diff-Tracker: Text-to-Image Diffusion Models are Unsupervised Trackers [19.4]
Diff-Trackerは、教師なしの視覚追跡タスクに挑戦する新しいアプローチである。我々の主な考えは、事前訓練された拡散モデルにカプセル化された豊富な知識を活用することである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:34:53 GMT)
Mitigating Background Shift in Class-Incremental Semantic Segmentation [18.6]
クラスインクリメンタルセマンティック(CISS)は、古いクラスを忘れずに新しいクラスを学習することを目的としている。 CISSのためのバックグラウンドクラス分離フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:44:37 GMT)
Affective Behavior Analysis using Task-adaptive and AU-assisted Graph Network [18.3]
本稿では,第7回ABAW7コンペティションにおけるマルチタスク学習課題に対する解決策と実験結果について述べる。この課題は、アクション単位の検出、表情認識、および原子価-覚醒推定の3つのタスクから構成される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:33:22 GMT)
Scalable and Reliable Over-the-Air Federated Edge Learning [18.3]
オーバー・ザ・エア計算(AirComp)は、クライアントの更新をチャネル上で集約することで、通信リソースを節約する。 FEELのAirCompではチャネル符号化方式が提案されている。本稿では,クライアント数に一定の誤り訂正機能を有するディジタル格子型コード構築法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:58:55 GMT)
Bellman Diffusion Models [18.3]
政策の後継状態尺度(SSM)のモデルクラスとして拡散を利用する方法について検討する。ベルマンフローの制約を強制することは、拡散ステップ分布の単純なベルマン更新につながる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:40:08 GMT)
Crowd-SAM: SAM as a Smart Annotator for Object Detection in Crowded Scenes [18.2]
Crowd-SAMは、混み合ったシーンでSAMのパフォーマンスを高めるために設計されたフレームワークである。混み合ったシーンにおけるマスク選択と精度を高めるために,効率的なプロンプトサンプリング (EPS) とPWD-Net (Part-whole discrimination network) を導入する。 Crowd-SAMは、CrowdHumanやCityPersonsなどいくつかのベンチマークにおいて、最先端のSOTA(State-of-the-art)と競合する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:00:01 GMT)
Subject-driven Text-to-Image Generation via Preference-based Reinforcement Learning [18.2]
我々は、信頼できる報酬信号を提供する$lambda$-Harmonic reward関数を提示する。提案アルゴリズムは,最新のCLIP-Iスコア0.833,CLIP-Tスコア0.314をDreamBench上で達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:40:25 GMT)
MEVG: Multi-event Video Generation with Text-to-Video Models [18.1]
本稿では,ユーザから複数の個々の文が与えられた複数のイベントを示すビデオを生成する,拡散に基づく新しいビデオ生成手法を提案する。本手法は, 微調整処理を伴わずに, 事前学習したテキスト・ビデオ生成モデルを使用するため, 大規模なビデオデータセットを必要としない。提案手法は,コンテンツとセマンティクスの時間的コヒーレンシーの観点から,他のビデオ生成モデルよりも優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:40:21 GMT)
DreamCatalyst: Fast and High-Quality 3D Editing via Controlling Editability and Identity Preservation [17.9]
DreamCatalystは、SDSベースの編集を拡散逆プロセスとして解釈する新しいフレームワークである。目的関数はサンプリングダイナミクスを考慮し,DreamCatalystの最適化プロセスを拡散逆過程の近似とする。我々の高品質モードは、スピードと品質の両面で現在の最先端のNeRF編集方法より優れています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:26:14 GMT)
Isometric Representation Learning for Disentangled Latent Space of Diffusion Models [17.6]
等方的拡散(Isometric Diffusion)を提案し、幾何正則化器を備えた拡散モデルを用いてモデルを誘導し、トレーニングデータ多様体の幾何学的音響潜在空間を学習する。このアプローチにより拡散モデルはより不整合な潜在空間を学習することができ、より滑らかで正確に逆転し、潜在空間に直接属性を制御できるようになる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:36:01 GMT)
Enhancing Perceptual Quality in Video Super-Resolution through Temporally-Consistent Detail Synthesis using Diffusion Models [17.6]
本稿では,リアルタイムかつ時間的に一貫性のある細部を合成することにより,高画質映像の知覚品質を向上させるためのDMに基づくVSR手法であるStableVSRを提案する。本稿では,既存のVSRの最先端手法と比較して,時間的整合性を向上しつつ,高画質映像の知覚品質を高める上でのStableVSRの有効性を実証する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:32:42 GMT)
Exploring Active Learning in Meta-Learning: Enhancing Context Set Labeling [17.6]
いくつかの設定では、ラベルのどのポイントを積極的に選択することが可能である。ガウス混合体を適合させてラベルのどの点を選択するかを選択する自然アルゴリズムを提案する。提案アルゴリズムは、複数のベンチマークデータセットにまたがる様々なメタラーニングアルゴリズムを使用する場合、最先端のアクティブラーニング手法より優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:38:01 GMT)
Generalized Coverage for More Robust Low-Budget Active Learning [17.5]
ProbCoverは、選択したデータポイントで与えられた半径のボールでデータ分布を"カバー"しようとする。本稿では,ProbCoverのアルゴリズムを一般化して,このカバレッジを最適化する効率的なグリージー手法を提案する。総合的な実験では、MaxHerdingは複数の低予算画像分類ベンチマークで既存のアクティブな学習方法を上回っている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:21:51 GMT)
CPM: Class-conditional Prompting Machine for Audio-visual Segmentation [17.5]
CPM(Class-conditional Prompting Machine)は,クラス非依存クエリとクラス条件クエリを組み合わせた学習戦略により,双方向マッチングを改善した。我々はAVSベンチマーク実験を行い、その手法がSOTA(State-of-the-art)セグメンテーションの精度を実現することを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:35:24 GMT)
Gated Temporal Diffusion for Stochastic Long-Term Dense Anticipation [17.4]
長期的な行動予測は、自律運転や人間とロボットの相互作用など、多くのアプリケーションにとって重要な課題となっている。本稿では,Gated Temporal Diffusion (GTD) ネットワークを提案する。我々のモデルは、Breakfast、Ambly101、50Saladsの両方の決定論的設定で、最先端の結果を達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:48:05 GMT)
SurroFlow: A Flow-Based Surrogate Model for Parameter Space Exploration and Uncertainty Quantification [17.2]
既存のディープラーニングベースのサロゲートモデルは、効率的なデータ生成を容易にするが、不確実な定量化、効率的なパラメータ空間探索、逆予測に不足する。シミュレーションパラメータとシミュレーション出力の間の可逆変換を学習するために,フローベースサロゲートモデルを正規化した新しいモデルであるSurroFlowを紹介した。本フレームワークは,科学的サロゲートモデルの信頼性と探索能力を向上しつつ,計算コストを大幅に削減する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:08:49 GMT)
Human-AI Collaborative Taxonomy Construction: A Case Study in Profession-Specific Writing Assistants [17.1]
LLM(Large Language Models)は、テキストのリビジョンやストーリー生成など、複数の作業において人間を支援する。本稿では,ドメイン固有書記アシスタントのガイドラインとして,人間とAIの連携による分類学開発手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:13:09 GMT)
Building AI Agents for Autonomous Clouds: Challenges and Design Principles [17.0]
AI for IT Operations(AIOps)は、障害のローカライゼーションや根本原因分析といった複雑な運用タスクを自動化することを目的としている。このビジョンペーパーは、まず要求をフレーミングし、次に設計決定について議論することで、そのようなフレームワークの基礎を定めています。アプリケーションをオーケストレーションし,カオスエンジニアリングを使用してリアルタイム障害を注入するエージェント-クラウドインターフェースを活用したプロトタイプ実装であるAIOpsLabと,障害のローカライズと解決を行うエージェントとのインターフェースを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:40:43 GMT)
SphereHead: Stable 3D Full-head Synthesis with Spherical Tri-plane Representation [17.0]
PanoHeadは、正面と後方の両方のビューの画像をフルヘッド合成するために、大規模なデータセットを使用することの可能性を証明している。本研究では,人間の頭部の幾何学的特徴に適合する球面座標系における新しい三面体表現であるSphereHeadを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:52:40 GMT)
Mitigating Catastrophic Forgetting in Language Transfer via Model Merging [16.8]
ブランチ・アンド・マージ(BaM)は複数のモデルを反復的にマージする手法である。 BaMは、これが低等級であるがより高い品質の重量変化をもたらすという知見に基づいている。ブルガリア語とドイツ語の実証研究において、BaMは、マッチングやターゲットドメインの性能の向上を伴いながら、忘れを著しく低減できることを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:48:06 GMT)
Effective Bayesian Causal Inference via Structural Marginalisation and Autoregressive Orders [16.7]
構造学習問題を因果順序と各変数に対する因果順序を推定する親集合に分解する。提案手法は, スケールフリーおよびエルドス・レーニグラフ構造を持つ非線形付加雑音ベンチマークのシミュレーションによる構造学習における最先端の手法である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:27:13 GMT)
Exciting Action: Investigating Efficient Exploration for Learning Musculoskeletal Humanoid Locomotion [16.6]
敵の模倣学習が鍵となる問題を分析し、解決策を提供することでこの問題に対処できることを実証する。 16自由度と92自由度を持つ擬似ヒューマノイドモデルを用いて歩行歩行と歩行歩行を学習し,その方法論を検証した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:27:55 GMT)
HSViT: Horizontally Scalable Vision Transformer [16.5]
Vision Transformer (ViT) は大規模データセットの事前トレーニングが必要であり、パフォーマンスが向上する。本稿では,新しい水平方向拡張型ビジョントランス (HSViT) 方式を提案する。 HSViTは、小さなデータセットの最先端スキームよりも最大10%高いトップ1精度を達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:04:36 GMT)
End-user Comprehension of Transfer Risks in Smart Contracts [16.3]
転送結果とユーザ目標に深刻な影響を与える5つの転送リスクに焦点を当てる。我々は,110名の参加者とUSDT/MetaMaskによるスマートコントラクト転送リスクのエンドユーザー理解について調査した。我々は,次のトップ78のERC-20スマートコントラクト(USDT以降)について,手動および自動ソースコード解析を行い,これらのリスクの有病率を明らかにした。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:18:45 GMT)
Understanding Counting in Small Transformers: The Interplay between Attention and Feed-Forward Layers [16.3]
我々はヒストグラムタスクで訓練された単純な変圧器モデルを分析する。目標は、固定アルファベットからの入力シーケンスにおける各項目の発生をカウントすることである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:48:10 GMT)
TIGER: A Generating-Then-Ranking Framework for Practical Python Type Inference [16.2]
Pythonの動的型付けシステムは柔軟性と表現力を提供するが、型関連のエラーにつながる可能性がある。 TIGERはPythonの多様な型カテゴリを扱うための2段階生成レベル(GTR)フレームワークである。 ManyTypes4Pyデータセットに対する評価は、TIGERが様々な型カテゴリの既存のメソッドよりも優れていることを示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:26:45 GMT)
Nearest Neighbour Score Estimators for Diffusion Generative Models [16.2]
トレーニングセットから複数のサンプルを抽出し,推定値の分散を劇的に低減する新しい近傍スコア関数推定器を提案する。拡散モデルでは,確率フローODE統合のための学習ネットワークを推定器で置き換えることができ,将来的な研究の新たな道が開かれる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:37:10 GMT)
Probing the Efficacy of Federated Parameter-Efficient Fine-Tuning of Vision Transformers for Medical Image Classification [16.1]
様々な下流タスクのための微調整事前訓練モデルは、医療画像領域において重要な問題である。これらのモデルの大規模なサイズは、フェデレート学習における通信負担を軽減するために、パラメータ効率のよい微調整(PEFT)を使用する必要がある。本研究では,医用画像分類のためのビジョントランスフォーマー(ViT)モデルに適用するための各種PEFT戦略について検討する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:28:50 GMT)
StyleCity: Large-Scale 3D Urban Scenes Stylization [16.0]
StyleCityは、大規模都市シーンのための視覚とテキストによるテクスチャスタイリングシステムである。 StyleCityは、大規模な都市シーンの3Dテクスチャメッシュをセマンティックスに意識したスタイルでスタイリングする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:01:22 GMT)
A Single Online Agent Can Efficiently Learn Mean Field Games [16.0]
平均場ゲーム (MFGs) は大規模人口システムの振る舞いをモデル化するための有望なフレームワークである。本稿では,オンラインサンプルを用いてMFNEを学習できるオンライン単エージェントモデルフリー学習方式を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:03:23 GMT)
Local Feature Selection without Label or Feature Leakage for Interpretable Machine Learning Predictions [15.8]
ラベルと特徴リークの概念を定式化することで、ミスリード選択の問題に対処する。本稿では,SUWRと呼ばれるリークがないことを示す,最初の局所特徴選択手法を提案する。実験結果から,SUWRは過度に適合する傾向が低く,最先端の予測性能と高い特徴選択間隔を併せ持つことが明らかとなった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:36:30 GMT)
RobotKeyframing: Learning Locomotion with High-Level Objectives via Mixture of Dense and Sparse Rewards [15.8]
本稿では,脚ロボットのための新しい学習ベース制御フレームワークを提案する。脚のあるロボットの自然な移動における高レベルな目標を取り入れている。マルチクリティック強化学習アルゴリズムを用いて、密集した報酬とスパース報酬の混合を処理する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:15:35 GMT)
Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL [15.8]
自然言語の質問(text-to-)から正確なsqlを生成することは、長年にわたる課題である。 PLMはテキスト・ツー・タスクに利用され、有望な性能を実現している。近年,大規模言語モデル (LLM) は自然言語理解において重要な機能を示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:06:57 GMT)
Think Big, Generate Quick: LLM-to-SLM for Fast Autoregressive Decoding [15.7]
大規模言語モデル(LLM)は、実際にはユビキタスなものとなり、翻訳、要約、命令の追従といった生成タスクに広く利用されている。本稿では,異なるサイズの言語モデルを組み合わせて,自己回帰復号化の効率を高めるハイブリッド手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:10:45 GMT)
Lost and Found: Overcoming Detector Failures in Online Multi-Object Tracking [15.5]
マルチオブジェクト追跡(MOT)は、時間とともに複数のオブジェクトのアイデンティティと位置を正確に推定する。現代の検出器は、あるフレーム内のいくつかのオブジェクトを見逃すことがあるため、トラッカーは早めに追跡をやめる。オンラインTbDシステムと互換性のある汎用フレームワークであるBUSCAを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:19:48 GMT)
Single Layer Single Gradient Unlearning [15.4]
モデルパラメータの単一層のみを変更できる1時間勾配しか必要としない効率的な手法を提案する。 CLIP, 安定拡散, VLM など, 様々なモデルにおける本手法の有効性と有効性を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:52:36 GMT)
Designing Decision Support Systems Using Counterfactual Prediction Sets [15.1]
分類タスクの意思決定支援システムは主に、基底真理ラベルの価値を予測するために設計されている。本稿では,オンライン学習の観点から,このようなシステムの設計を再考する。私たちは専門家のモデルを必要としない方法論を開発しています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:52:02 GMT)
UrbanWorld: An Urban World Model for 3D City Generation [15.1]
UrbanWorldは、フレキシブルな制御条件を備えたカスタマイズされたリアルでインタラクティブな3D都市世界を自動生成できる、最初の生成的都市世界モデルである。高忠実な3D都市環境は、シミュレーションにおいて一般的なAIとマシン知覚システムの現実的なフィードバックと相互作用を可能にする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:29 GMT)
Large Vision-Language Models as Emotion Recognizers in Context Awareness [14.9]
文脈対応感情認識(CAER)は、様々な文脈から感情を知覚する必要がある複雑で重要なタスクである。以前のアプローチは主に、イメージから感情的な手がかりを抽出する洗練されたアーキテクチャを設計することに焦点を当てていた。本稿では,LVLM(Large Vision-Language Models)を活用したCAERタスクの実現の可能性について,体系的に検討する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:28:06 GMT)
Defining 'Good': Evaluation Framework for Synthetic Smart Meter Data [14.8]
スマートメーターデータセットのプライバシーリスクを評価するには,標準プライバシ攻撃手法が不十分であることを示す。本稿では,トレーニングデータを不確実なアウトレーラで注入し,それらのアウトレーラに直接プライバシ攻撃を発生させる手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:41:27 GMT)
Synchronization is All You Need: Exocentric-to-Egocentric Transfer for Temporal Action Segmentation with Unlabeled Synchronized Video Pairs [14.6]
我々は、当初、外向型(固定型)カメラ用に設計された時間的アクションセグメンテーションシステムを、ウェアラブルカメラが映像データをキャプチャするエゴセントリックなシナリオに転送する問題を考える。本稿では,既存のラベル付きエキソセントリックビデオを活用する新しい手法と,ラベル付き,同期化されたエキソセントリックビデオペアの新たなセットを提案する。 Assembly101とEgoExo4Dの実験は、従来の教師なし領域適応と時間的アライメントに対する提案手法の有効性を示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:27:04 GMT)
Street TryOn: Learning In-the-Wild Virtual Try-On from Unpaired Person Images [14.6]
仮想トライオンアプリケーションをサポートするためのStreetTryOnベンチマークを導入する。また,一対のデータを必要とせず,一対の人物画像から直接仮想試行を学習する手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:04:41 GMT)
Digital Twin Vehicular Edge Computing Network: Task Offloading and Resource Allocation [14.4]
本稿では,タスクオフロードとリソース割り当てに関するマルチエージェント強化学習手法を提案する。多数の実験により,本手法は他のベンチマークアルゴリズムと比較して有効であることが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:51:32 GMT)
HeightFormer: Explicit Height Modeling without Extra Data for Camera-only 3D Object Detection in Bird's Eye View [14.2]
視覚に基づくバードアイビュー(Bird's Eye View, BEV)の表現は、自律運転のための新たな知覚定式化である。我々は、LiDARのような余分なデータを必要とせず、任意のカメラリグやタイプに適合できるBEV空間の高さを明示的にモデル化することを提案する。自己再帰的手法で高さと不確実性をモデル化するHeightFormerを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:10:46 GMT)
Split Conformal Prediction under Data Contamination [14.2]
データ汚染環境における分割共形予測の堅牢性について検討する。構築した集合のカバレッジと効率に及ぼす劣化したデータの影響を定量化する。本稿では,汚染ロバスト・コンフォーマル予測(Contamination Robust Conformal Prediction)と呼ぶ分類設定の調整を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:52:54 GMT)
BadRobot: Jailbreaking LLM-based Embodied AI in the Physical World [14.2]
人工人工知能(英語: Embodied AI, AI)は、センサーやアクチュエータを通して物理世界と対話する人工知能システムである。大規模言語モデル(LLM)は言語命令を深く探求し、複雑なタスクの計画策定において重要な役割を担います。 LLMベースのエンボディAIロボットは広く普及し、家庭や産業で一般的になると予想されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:13:16 GMT)
SGIFormer: Semantic-guided and Geometric-enhanced Interleaving Transformer for 3D Instance Segmentation [14.2]
本稿では,SGIFormerという3次元インスタンスセグメンテーションのための新しい手法を提案する。 Semantic-Guided Mix Query (SMQ)とGeometric-enhanced Interleaving Transformer (GIT)デコーダで構成されている。 ScanNet V2、ScanNet200、そして挑戦的な高忠実度ScanNet++ベンチマークで最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:17:28 GMT)
SwitchCIT: Switching for Continual Instruction Tuning of Large Language Models [14.1]
大規模言語モデル(LLM)は、様々な領域、特に一般的な言語理解において印象的な能力を発揮している。しかし、これらのモデルは大量のテキストデータに基づいて訓練されており、命令によって引き起こされる特定のタスクに対して微妙に最適化されていないかもしれない。本研究は, LLMの連続的な命令学習において, パラメータ効率の高いチューニングモデルに演算をルーティングする切替機構を通じて, 破滅的な忘れに対処するものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:37:33 GMT)
RecGS: Removing Water Caustic with Recurrent Gaussian Splatting [13.9]
水の因果関係は浅海域の海底画像データでよく見られる。画像から因果パターンを取り除く従来の方法は、注釈付きデータセットで2Dフィルタリングや事前トレーニングに依存することが多い。本稿では,今日のフォトリアリスティックな3D再構成技術を活用したRecurrent Gaussian Splatting(RecGS)を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:20:11 GMT)
Exploring connections of spectral analysis and transfer learning in medical imaging [13.8]
自然画像と医用画像で事前学習したモデル間での学習優先順位の顕著な相違について検討した。モデルの学習優先度がアーティファクトのパワースペクトル密度と一致した場合、そのアーティファクトに過度に適合する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:49:48 GMT)
Generalization Error Curves for Analytic Spectral Algorithms under Power-law Decay [13.8]
本稿では,カーネル勾配勾配法における一般化誤差曲線の完全な特徴付けを行う。ニューラル・タンジェント・カーネル理論により、これらの結果は広義のニューラルネットワークを訓練する際の一般化行動の理解を大幅に改善する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:15:57 GMT)
An efficient framework based on large foundation model for cervical cytopathology whole slide image screening [13.7]
本稿では,教師なし・弱教師付き学習によるWSIレベルラベルのみを用いた頚部細胞病理学WSI分類のための効率的なフレームワークを提案する。 CSDおよびFNAC 2019データセットで実施された実験は、提案手法が様々なMIL手法の性能を高め、最先端(SOTA)性能を達成することを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:21:54 GMT)
SES: Bridging the Gap Between Explainability and Prediction of Graph Neural Networks [13.7]
本稿では、説明可能性と予測のギャップを埋める自己説明型自己教師型グラフニューラルネットワーク(SES)を提案する。 SESは説明可能なトレーニングと予測学習の2つのプロセスから構成される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:46:57 GMT)
Graph Structure Prompt Learning: A Novel Methodology to Improve Performance of Graph Neural Networks [13.7]
グラフネットワーク(GNN)のトレーニングを強化するための新しいグラフ構造Prompt Learning法(GPL)を提案する。 GPLはタスク非依存のグラフ構造損失を利用して、GNNが下流タスクを同時に解決しながら固有のグラフ特性を学習することを奨励している。 11の実世界のデータセットの実験では、ニューラルネットワークによってトレーニングされた後、GNNはノード分類、グラフ分類、エッジタスクにおいて、元のパフォーマンスを大幅に上回った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:59:18 GMT)
UniRec: A Dual Enhancement of Uniformity and Frequency in Sequential Recommendations [13.7]
新たな双方向拡張シーケンシャルレコメンデーション手法であるUniRecを提案する。 UniRecは、一様でないシーケンスと少ない頻度のアイテムの表現を改善している。我々の知る限り、UniRecは特徴増強のための均一性と周波数の特性を利用する最初の方法である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:20:16 GMT)
Perception Helps Planning: Facilitating Multi-Stage Lane-Level Integration via Double-Edge Structures [13.6]
Perception Helps Planning (PHP) はレーンレベルのプランニングを知覚で調整する。 3つのCarlaベンチマークの実験では、既存のアルゴリズムよりも27.20%、33.47%、および15.54%のドライブスコアが大幅に改善された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:12:06 GMT)
Towards the Law of Capacity Gap in Distilling Language Models [13.6]
言語モデル (LM) 蒸留は, 大規模教師のLMに居住する知識を小学生に活用することを目的とした, 流行の分野である。本論文は, より大きい教師は, より小さい教師から蒸留したものに比べて, 必ずしも優れた生徒になるとは限らないことを論じる。最適教師尺度は, モデルアーキテクチャやデータスケールにまたがる学生尺度とほぼ一貫して線形に相関していることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:55:03 GMT)
Enhancing Stochastic Optimization for Statistical Efficiency Using ROOT-SGD with Diminishing Stepsize [13.4]
本稿では,最適化と統計効率のギャップを埋める手法であるtextsfROOT-SGDを再検討する。提案手法は, 念入りに設計したステップサイズ戦略を統合することにより, テキストfROOT-SGDの性能と信頼性を向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:59:35 GMT)
Benchmarking the Attribution Quality of Vision Models [13.3]
本稿では,広く使用されているインクリメンタル削除プロトコルの2つの基本的な限界を克服する新しい評価プロトコルを提案する。これにより、23の帰属手法と8つの異なる視覚モデルの設計選択が帰属品質にどのように影響するかを評価することができる。本研究は,本質的に説明可能なモデルが標準モデルより優れており,生の帰属値が従来よりも高い帰属品質を示すことを発見した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:02:20 GMT)
NeRF-VO: Real-Time Sparse Visual Odometry with Neural Radiance Fields [13.2]
NeRF-VOは、低遅延カメラトラッキングとニューラルラディアンスシーン表現のための学習ベースのスパースビジュアルオドメトリーを統合している。我々は、様々な合成および実世界のデータセットに対して、ポーズ推定精度、新しいビュー忠実度、および密度の高い再構成品質においてSOTA法を超越した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:58:33 GMT)
Enhancing Covert Communication in Relay Systems Using Multi-Antenna Technique [13.1]
本稿では,マルチアンテナ技術を利用して,リレーシステムにおける秘密通信性能を向上させる。まず,S,R,Dのそれぞれが単一アンテナを採用する場合のシナリオを考察し,仮説テストと統計理論を適用して,隠れた性能モデリングの理論的枠組みを開発する。本研究では,マルチアンテナ技術が2ホップリレーシステムにおけるカバート性能をいかに向上させるかを示すために,広範な数値計算結果を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:08:15 GMT)
SFPNet: Sparse Focal Point Network for Semantic Segmentation on General LiDAR Point Clouds [13.1]
本稿では、ウィンドウアテンションをスパース焦点変調に置き換えることで、市場で広く普及している様々なLiDARに対応するためのフレームワークを提案する。我々のSFPNetは、複数のレベルのコンテキストを抽出し、ゲート機構を用いて動的に集約することができる。また,ロボットアプリケーションのための大規模ハイブリッド型LiDARセマンティックセマンティックセマンティックセマンティックデータセットについても紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:22:09 GMT)
MapDistill: Boosting Efficient Camera-based HD Map Construction via Camera-LiDAR Fusion Model Distillation [13.1]
我々は,KD(Knowledge Distillation)というアイデアを初めて,効率的なHDマップ構築に利用した。我々は、高性能カメラ-LiDAR融合モデルから軽量カメラ専用モデルへ知識を伝達する、MapDistillと呼ばれる新しいKDベースのアプローチを導入する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:00:20 GMT)
ProSub: Probabilistic Open-Set Semi-Supervised Learning with Subspace-Based Out-of-Distribution Detection [13.0]
オープンセット半教師付き学習(OSSL)では、未知のクラスを含む可能性のあるラベルなしデータセットを検討する。データとIDサブスペース間の特徴空間の角度に基づくID/OOD分類のための新しいスコアを提案する。また、与えられたIDまたはOODデータの条件分布を推定し、IDまたはOODであるデータの確率的予測を可能にする手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:05:16 GMT)
Are Synthetic Data Useful for Egocentric Hand-Object Interaction Detection? [13.0]
本研究では,エゴセントリックな手・物体間相互作用検出における合成データの有効性について検討した。実際のラベル付きデータの10%しか利用できないため、実際のデータにのみ訓練されたベースラインと比較して、全体的なAPの改善を実現しています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:27:04 GMT)
TGIF: Text-Guided Inpainting Forgery Dataset [12.9]
デジタル画像操作は、生成AI技術の出現により、ますますアクセスしやすく、現実的なものになりつつある。近年の進歩により、テキストガイドによるインペイントが可能となり、最小限の努力で高度な画像編集が可能になった。本稿では,画像フォージェイローカライゼーションのトレーニングと評価を支援するために設計された画像の包括的コレクションであるText-Guided Inpainting Forgeryデータセットを紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:19:14 GMT)
A Recipe for Unbounded Data Augmentation in Visual Reinforcement Learning [12.9]
Q-learningアルゴリズムは、視覚的な観察からトレーニングされた時に、不安定さを過度に調整し、訓練する傾向がある。そこで本研究では,より広範に拡張可能な一般化されたレシピであるSADAを提案する。提案手法は,RLエージェントのトレーニング安定性と一般化を,多種多様な拡張セットで大幅に向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:57:46 GMT)
Online Joint Fine-tuning of Multi-Agent Flows [12.9]
本稿では,ラーニング・トゥ・サーチフレームワークに触発された全フローのオンライン共同微調整手順について述べる。このアプローチはシミュレータアクセスを活用して、エピソード全体の好みを減らし、個々のノード出力よりも好みを減らします。私は、最先端の結果を達成するためのマルチホップQAデータセットMuseicに適用します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:46:36 GMT)
Sibyl: Simple yet Effective Agent Framework for Complex Real-world Reasoning [12.8]
Sibylは、最小限のツールセットを効率的に活用することによって、複雑な推論タスクに取り組むように設計された強力なフレームワークである。 Sibylは、最終回答を自己定義し、包括的でバランスの取れたアプローチを確保するために、マルチエージェントの議論に基づく陪審を実施。 GAIAベンチマークテストセットの実験結果から,Sibylエージェントは平均スコア34.55%の最先端性能を実現していることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:16:53 GMT)
SpatialBot: Precise Spatial Understanding with Vision Language Models [12.7]
視覚言語モデル (VLM) は2次元画像理解において優れた性能を発揮している。彼らはまだ、Embodied AIの基盤である空間的理解に苦戦している。本稿では,RGB画像と深度画像の両方をフィードすることで,空間的理解を向上させるためのSpatialBotを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:44:37 GMT)
Leveraging Near-Field Lighting for Monocular Depth Estimation from Endoscopy Videos [12.5]
内視鏡ビデオにおける単眼深度推定は、補助手術やロボット手術により、臓器のより良いカバレッジと様々な健康問題の検出が可能になる。主流の自然画像深度推定では有望な進歩があったが、内視鏡画像では技術が不十分であった。本稿では, 内視鏡から放射される光を表面から反射する光学的手がかりを用いて, 単分子深度推定を改善する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:44:04 GMT)
Variational Randomized Smoothing for Sample-Wise Adversarial Robustness [12.5]
本稿では,ノイズレベルセレクタを導入し,各入力に適したサンプルごとのノイズレベルを用いた新しい変分フレームワークを提案する。実験の結果,敵攻撃に対する経験的堅牢性の向上が示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:25:13 GMT)
Mitigating biases in big mobility data: a case study of monitoring large-scale transit systems [12.3]
本研究では,大きなモビリティデータセットのバイアスを評価し,緩和法を開発した。今回の研究では、GoogleとAppleのモビリティデータを例として、政府機関のベンチマークデータと比較します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:22:16 GMT)
Enhancing Split Computing and Early Exit Applications through Predefined Sparsity [12.3]
Deep Neural Networks(DNN)は、オブジェクト分類やアクション認識からスマートビルディングやヘルスケアまで、幅広い問題で最先端のパフォーマンスを達成した。計算要件は、リソースに制約のあるエッジデバイスへのデプロイメントを妨げます。本稿では,事前定義された空間性の概念とスプリットコンピューティング(SC)とEarly Exit(EE)を組み合わせることで,この問題に対処する新しいアプローチを提案する。実験の結果, 性能を損なうことなく, 記憶量と計算複雑性を4倍に削減できることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:24:04 GMT)
Bridging the Gap Between Information Seeking and Product Search Systems: Q&A Recommendation for E-commerce [12.3]
我々は,製品検索に関連する質問応答(Q&A)ペアを推薦し,購入決定を支援することを提案する。我々は、この新興分野における今後の研究を促進するための課題、オープンな課題、そして解決策を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:34:40 GMT)
AEMIM: Adversarial Examples Meet Masked Image Modeling [12.1]
本稿では,新たな再構成対象として,敵対例をマスク画像モデリングに組み込むことを提案する。特に、原画像に対応する敵の例を再構成する、新しい補助的前文タスクを導入する。また,MIM事前学習において,より適切な対戦例を構築するために,革新的な敵攻撃を考案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:39:13 GMT)
Semi-Supervised Object Detection: A Survey on Progress from CNN to Transformer [12.0]
本稿では,物体検出のための半教師付き学習における27の最先端開発について概説する。データ拡張テクニック、擬似ラベル戦略、一貫性の正則化、敵の訓練方法などをカバーする。我々は,既存の課題を克服し,物体検出のための半教師あり学習における新たな方向性を探るため,さらなる研究の関心を喚起することを目的としている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:28:59 GMT)
Review-Feedback-Reason (ReFeR): A Novel Framework for NLG Evaluation and Reasoning [12.0]
ReFeR(Review-Feedback-Reason)は、LPMエージェントを用いたNLGのための新しい評価フレームワークである。 NLGタスクの2つの既存のベンチマークデータセットを使用して、ReFeRを厳格にテストする。 3つの推論ベンチマークに応用することで,方法論の有効性を強調した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:25:26 GMT)
Dance Any Beat: Blending Beats with Visuals in Dance Video Generation [12.0]
音楽によってガイドされた個人の画像から直接ダンスビデオを生成するという新しいタスクを導入する。我々のソリューションであるDance Any Beat Diffusion Model (DabFusion)は、参照画像と楽曲を使用してダンスビデオを生成する。 AIST++データセットを用いてDabFusionの性能評価を行い,映像品質,オーディオ・ビデオ同期,モーション・ミュージックアライメントに着目した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:09:27 GMT)
COMET: "Cone of experience" enhanced large multimodal model for mathematical problem generation [12.0]
本稿では,数学問題生成のための大規模マルチモーダルモデルであるCOMETを提案する。相互能力の促進と応用論理の観点から、我々は、茎生成と問題解決を数学的問題生成に統合する。このフレームワークは、微調整データを象徴的な経験、象徴的な経験、直接的な経験に分割し、教師のキャリア成長における経験と類似性を引き出す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:02:16 GMT)
MaskVD: Region Masking for Efficient Video Object Detection [11.8]
ビデオタスクは計算量が多く、リアルタイムアプリケーションにデプロイする際の課題となる。本稿では,ビデオフレームにおけるマスキング領域の戦略を提案する。以前のフレームから抽出した特徴を活用することで、ViTバックボーンはリージョンマスキングの恩恵を直接受けられる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:01:49 GMT)
Formal Verification of Unknown Dynamical Systems via Gaussian Process Regression [11.7]
安全クリティカルなシナリオにおける自律システムの活用には、不確実性の存在下での行動を検証する必要がある。本研究では,非モデル化された力学と雑音測定を用いた離散時間力学システムの検証フレームワークを開発した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:33:04 GMT)
Exploring Quantization for Efficient Pre-Training of Transformer Language Models [11.7]
本研究の目的は,変圧器の効率的な事前学習における量子化の影響を検討することである。重み、アクティベーション、勾配、状態に直線量子化を体系的に適用することにより、トレーニング中のモデル効率、安定性、性能への影響を評価する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:42:09 GMT)
Statistics-aware Audio-visual Deepfake Detector [11.7]
オーディオ・ヴィジュアルフェイク検出の手法は、主に音声と視覚の特徴の同期を評価する。モデルの識別能力を高めるため,統計的特徴損失を提案する。 DFDCおよびFakeAVCelebデータセットの実験により,提案手法の妥当性が示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:15:41 GMT)
Wicked Oddities: Selectively Poisoning for Effective Clean-Label Backdoor Attacks [11.4]
クリーンラベル攻撃は、毒性のあるデータのラベルを変更することなく攻撃を行うことができる、よりステルスなバックドア攻撃である。本研究は,攻撃成功率を高めるために,標的クラス内の少数の訓練サンプルを選択的に毒殺する方法について検討した。私たちの脅威モデルは、サードパーティのデータセットで機械学習モデルをトレーニングする上で深刻な脅威となる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:21:12 GMT)
CUPID: Leveraging ChatGPT for More Accurate Duplicate Bug Report Detection [11.4]
重複バグレポート検出(DBRD)は、学術と産業の両方において長年の課題である。本稿では,従来のDBRD手法と最先端LLMを組み合わせたCUPIDという手法を提案する。 CUPIDは、解析されたすべてのデータセットで0.602から0.654までのRecall Rate@10スコアに達する、最先端の結果を達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:56:24 GMT)
Nonreciprocal Single-Photon Band Structure in a Coupled-Spinning-Resonator chain [11.3]
共振共振器チェーンにおける単一光子バンド構造と単一光子の輸送について解析する。我々の研究は、非相互または相互の単光子バンド構造を達成、操作、切り替えするための新しい経路を開く。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:10:08 GMT)
Expressive Power of ReLU and Step Networks under Floating-Point Operations [11.3]
二項しきい値単位またはReLUを用いたニューラルネットワークは、任意の有限入力/出力ペアを記憶可能であることを示す。また,浮動小数点演算が有意および指数の両方に有限ビットを使用する場合,暗記および普遍近似に関する同様の結果を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:00:31 GMT)
MergeNet: Explicit Mesh Reconstruction from Sparse Point Clouds via Edge Prediction [11.3]
既存の暗黙の手法は、優れた滑らかで水密なメッシュを生成する。顔を直接ポイントから形成することで、明示的な手法がより効率的になる。本稿では,メッシュ再構成を局所接続予測問題に変換する edGE(Net) による MEshMerge 再構成を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:19:16 GMT)
Rethinking LiDAR Domain Generalization: Single Source as Multiple Density Domains [11.3]
領域一般化のための密度識別特徴埋め込み (DDFE) モジュールを提案する。 DDFEモジュールは、単一のソースドメイン内で密度固有の特徴を抽出するために慎重に設計されている。さらに、ソースデータの密度スペクトルを拡大することを目的とした、シンプルながら効果的な密度拡張手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:24:01 GMT)
A Pilot Study of GSLM-based Simulation of Foreign Accentuation Only Using Native Speech Corpora [11.3]
生成音声言語モデル(GSLM)を用いた外国人アクセントの人的プロセスのシミュレーション手法を提案する。我々は、言語Aの音声を言語BのGSLMに入力し、Bのアクセントを入力音声に加えることで、このプロセスをシミュレートする。実験の結果,L1がBである話者が生成したAの実際のサンプルと比較すると,出力音声の合成アクセントは非常に自然であることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:29:00 GMT)
Dilated convolution neural operator for multiscale partial differential equations [11.1]
本稿では,多スケール偏微分方程式に対するDilated Convolutional Neural Operator (DCNO)を提案する。 DCNOアーキテクチャは、低計算コストを維持しながら、高周波と低周波の両方の特徴を効果的にキャプチャする。我々は,DCNOが精度と計算コストの最適なバランスをとることを示し,マルチスケール演算子学習に有望なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:17:02 GMT)
Enhancing Parameter Efficiency and Generalization in Large-Scale Models: A Regularized and Masked Low-Rank Adaptation Approach [11.0]
低ランク適応(LoRA)は、良好な微調整結果を維持しつつ、資源消費を減らすために開発された。本稿では,LoRA法により近似された行列更新の本質的な次元について検討し,本質的な次元を増大させることによる性能上の利点を明らかにする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:26:31 GMT)
Motion-Oriented Compositional Neural Radiance Fields for Monocular Dynamic Human Modeling [10.9]
本稿では,MoCo-NeRF(MoCo-NeRF)について述べる。 MoCo-NeRFはモノクロビデオのフリービューポイントレンダリングを実現するために設計されたフレームワークである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:01 GMT)
A Survey on Safe Multi-Modal Learning System [10.9]
マルチモーダル学習システム(MMLS)は、様々なモーダル入力から情報を処理し統合する能力で注目を集めている。安全に関する体系的な研究が欠如していることは、この分野の進歩にとって重要な障壁である。 MMLSの安全性を体系的に分類し評価する最初の分類法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:35:40 GMT)
Haze-Aware Attention Network for Single-Image Dehazing [10.9]
本稿では,HAAM(Haze-Aware Attention Module)とMFEM(Multiscale Frequency Enhancement Module)を組み合わせたデハージングネットワークを提案する。 HAAMは大気散乱モデルにインスパイアされ、物理的原理を高次元の特徴に巧みに組み込んで目的の脱ハージングを行う。我々の研究は、画像デハジングの分野を前進させるだけでなく、コンピュータビジョンの幅広い応用のための注意機構の設計に関する洞察も提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:42:39 GMT)
AIGC for Industrial Time Series: From Deep Generative Models to Large Generative Models [10.9]
本稿では,DGMからLGMへの産業時系列生成モデルの概要を概説する。まず,産業時系列生成のためのDGMベースのAIGCフレームワークを提案する。このフレームワークでは,先進的な産業用DGMを調査し,多視点分類を提案する。さらに, 産業用LGMの構築に必要な重要な技術は, 大規模産業用データセット, 複合産業用LGMアーキテクチャ, 産業用時系列の自己監督訓練, 産業用ダウンストリームタスクの微調整の4つの側面から分析する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:16:54 GMT)
EndoFinder: Online Image Retrieval for Explainable Colorectal Polyp Diagnosis [10.8]
EndoFinderはコンテンツベースの画像検索フレームワークである。新たに検出されたポリプが与えられた参照データベースでは、'デジタルツイン'ポリプが見つかる。新しいポリプの臨床的意味は、一致したポリプを参照して推測することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:40:17 GMT)
Towards Multi-modal Transformers in Federated Learning [10.8]
本稿では,視覚言語領域におけるMFL(Transfer Multi-modal Federated Learning)のシナリオについて検討する。我々は,クライアント間の非モダリティと相互モダリティのギャップに対処することによって,FedCola(Federated modality complementary and collaboration)と呼ばれる新しいフレームワークを導入する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:19:34 GMT)
Beware of Validation by Eye: Visual Validation of Linear Trends in Scatterplots [10.7]
斜面の視覚的評価の精度は斜面の視覚的検証よりも高い。どちらの場合も「急すぎる」斜面に偏りがあることがわかりました。第2の実験では,レグレッション・ビジュアライゼーションのための共通設計を導入することで,視覚的妥当性が向上するかどうかを検討した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:41:24 GMT)
Physics-informed active learning for accelerating quantum chemical simulations [10.6]
本稿では,量子化学シミュレーションにおけるロバストなデータ効率ポテンシャル構築のためのエンドツーエンドALを提案する。本プロトコルは,物理インフォームドによるトレーニングポイントのサンプリング,初期データの自動選択,不確実性定量化,収束モニタリングに基づく。これらの調査は、高性能コンピューティングクラスタ上での純粋な量子化学計算ではなく、数週間を要した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:16:46 GMT)
I$^2$-SLAM: Inverting Imaging Process for Robust Photorealistic Dense SLAM [10.5]
カジュアルビデオは、しばしば動きのぼやけや様々な外観に悩まされ、コヒーレントな3D視覚表現の最終的な品質を低下させる。本稿では、線形HDR放射率マップを用いて測定値の収集を行うSLAMシステムに物理画像を統合することを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:31:33 GMT)
Positive and Unlabeled Data: Model, Estimation, Inference, and Classification [10.4]
本研究では、二重指数傾斜モデル(DETM)による正・ラベルなし(PU)データへの新たなアプローチを提案する。従来の手法は、完全にランダム(SCAR)PUデータでのみ適用されるため、しばしば不足する。我々のDEMの二重構造は、ランダムPUデータで選択されたより複雑で未探索な構造を効果的に許容する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:06:02 GMT)
MASIVE: Open-Ended Affective State Identification in English and Spanish [10.4]
本研究は,人間が感情経験を説明するために使用する言葉を含む,事実上拘束力のないテクスタフェクティブな状態にまで範囲を広げる。私たちは、英語とスペイン語でReddit投稿のデータセットであるMASIVEを収集し、公開しています。このタスクでは、より小さな微調整された多言語モデルの方が、地域固有のスペイン感情状態においても、ずっと大きなLLMより優れていることが分かる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:43:47 GMT)
LHRS-Bot: Empowering Remote Sensing with VGI-Enhanced Large Multimodal Language Model [10.3]
本稿では,新しい視覚言語アライメント戦略とカリキュラム学習手法を通じて,RS画像理解に適したMLLMであるLHRS-Botを紹介する。総合的な実験により、LHRS-BotはRS画像の深い理解と、RS領域内でニュアンス推論を行う能力を示すことが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:40:34 GMT)
When Should Algorithms Resign? A Proposal for AI Governance [10.2]
アルゴリズムの辞退は、ガバナンスを直接AIシステムに埋め込むことによって、人工知能(AI)の使用を管理する戦略的アプローチである。アクセスAI出力の制限やパフォーマンス評価の表示など、AIからの意図的かつインフォームドな切り離しが伴う。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:40:37 GMT)
Beyond Binary: Multiclass Paraphasia Detection with Generative Pretrained Transformers and End-to-End Models [10.1]
失語症(英: Aphasia)は、失語症として知られる言語障害である。本稿では,GPT(Generative Pretrained Transformer)を用いて,転写産物から失語症を同定する手法を提案する。単一シーケンスモデルはマルチクラスパラパシア検出においてGPTベースラインより優れていることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:24:51 GMT)
Fairly Accurate: Optimizing Accuracy Parity in Fair Target-Group Detection [10.1]
グループ精度パリティ(GAP)は、APに1対1のマッピングを持つ最初の微分可能損失関数である。 GAPは他の一般的な損失関数と比較してバイアスを緩和する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:23:41 GMT)
REMM:Rotation-Equivariant Framework for End-to-End Multimodal Image Matching [10.0]
我々は、エンドツーエンドのマルチモーダル画像マッチングのための回転同変フレームワークREMMを提案する。本手法は,一致するパイプライン全体における記述子の回転差を完全にエンコードする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:58:40 GMT)
Characterizing and Understanding HGNN Training on GPUs [10.0]
ヘテロジニアスグラフニューラルネットワーク(HGNN)は、レコメンデーションシステムや医療分析など、多くの現実世界の領域で広く採用されている。 HGNNトレーニングの効率を高めるためには、トレーニングプロセス内の実行セマンティクスとパターンを特徴づけて分析し、パフォーマンスボトルネックを特定することが不可欠である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:45:46 GMT)
Rethinking Transformer-based Multi-document Summarization: An Empirical Investigation [9.9]
本稿では,トランスフォーマーを用いたMDSモデルの動作に関する5つの実証的研究について述べる。その結果、文書境界セパレータの影響、異なるレベルの特徴の粒度、異なるモデルトレーニング戦略が示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:42:37 GMT)
Sparse Training for Federated Learning with Regularized Error Correction [9.9]
Federated Learning(FL)は、ディープニューラルネットワーク(DNN)モデルをトレーニングする上で大きなメリットがあるため、大きな関心を集めている。 FLAREは、FLプロセスへの埋め込みを正規化した更新モデルの累積引き込みによる新しいスパーストレーニング手法を提案する。 FLAREの性能は、多種多様な複雑なモデルに関する広範な実験を通じて検証され、顕著なスパーシリティレベル(現在の最先端の10倍以上の)を達成するとともに、精度が大幅に向上した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:48 GMT)
DFDRNN: A dual-feature based neural network for drug repositioning [9.7]
薬物再配置は経済的に効率的な戦略であり、既存の薬物に対する新しい表示を、当初の承認を超えて発見するために用いられる。我々は、薬物や疾患の正確なエンコーディングを実現するために、二重機能麻薬再配置ニューラルネットワークモデルを設計する。 6つの最先端の手法と比較して、DFDRNNは4つのベンチマークデータセットで他よりも優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:02:18 GMT)
3DGS.zip: A survey on 3D Gaussian Splatting Compression Methods [9.7]
本稿では,3次元ガウススプラッティング圧縮法について,様々なベンチマークにおける統計的性能に着目して検討する。評価されたデータセットには、TurpsAndTemples、MipNeRF360、DeepBlending、SyntheticNeRFがある。各手法について,Pak Signal-to-Noise Ratio (PSNR), Structure similarity Index (SSIM), Learned Perceptual Image Patch similarity (LPIPS)を報告する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:47:46 GMT)
Contrastive Sequential-Diffusion Learning: An approach to Multi-Scene Instructional Video Synthesis [9.7]
アクション中心のシーケンス記述には、次のステップが即時前のステップではなく、前のステップで視覚的に一貫性を持たなければならない、非線形パターンが含まれている。本稿では,最も適切なシーンを選択して,次のシーンの復調過程をガイドし,条件付けするコントラッシブ・シーケンシャルな映像拡散手法を提案する。実世界のデータを用いた実験では,従来の作業と比較して,モデルの実用性と整合性の向上が示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:03:05 GMT)
Siamese Transformer Networks for Few-shot Image Classification [9.6]
人間は視覚分類タスクにおいて顕著な熟練度を示し、最小限の例で新しい画像を正確に認識し分類する。既存の少数の画像分類手法は、大域的特徴と局所的特徴の両方を強調し、両者を統合することを考える研究はほとんどない。我々は,シームズ変圧器ネットワーク(STN)に基づく新しいアプローチを提案する。我々の戦略は, 複雑な特徴適応モジュールの必要性を回避し, 画像分類におけるグローバルな特徴と局所的な特徴の可能性を効果的に活用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:27:23 GMT)
FlexRound: Learnable Rounding based on Element-wise Division for Post-Training Quantization [9.6]
トレーニング後の量子化(PTQ)は、リソース制限されたデバイスへのディープニューラルネットワークのデプロイで人気を集めている。本稿では,典型的な要素分割ではなく,要素分割に基づくPTQ(emphFlexRound)の重み付け機構を提案する。我々の研究は、画像分類と自然言語理解だけでなく、自然言語生成に関する総合的な実験を初めて行った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:08:32 GMT)
CIC-BART-SSA: Controllable Image Captioning with Structured Semantic Augmentation [9.5]
そこで本研究では,集中型および視覚的接地型キャプションをサンプリングするための,新しい完全自動手法を提案する。我々は、言語間グラフに基づくセマンティックフォーマリズムを利用して、エンティティ間のすべての可能なセマンティックな関係を符号化する。我々は、SSAに分散したデータセットから制御信号を出力する新しいモデルCIC-BART-SSAを開発した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:26:12 GMT)
Multimodal Cross-Domain Few-Shot Learning for Egocentric Action Recognition [9.5]
マルチモーダル入力とラベルなしターゲットデータを用いた,エゴセントリックな行動認識のための新しいドメイン間数ショット学習課題に対処する。本稿では,エゴセントリックな行動認識に関わる2つの重要な課題を同時に解決する。まず,教師モデルを用いた学生RGBモデルへのマルチモーダル蒸留の導入を提案する。第2に,マスクによる入力トークン数を削減する手法であるアンサンブルマスク推論を導入する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:56:12 GMT)
Interpretability in Action: Exploratory Analysis of VPT, a Minecraft Agent [9.3]
Video PreTraining (VPT) マインクラフトプレイングエージェントは、オープンソースのビジョンベースのエージェントの1つだ。エージェントがトレーニングタスクを完了している間の注意機構を解析し,ダイヤモンドピックアックスを製作する。私たちは様々な介入を行い、ゴールの誤一般化の懸念事例を明らかにするのに役立ちます。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:38:08 GMT)
MMSD-Net: Towards Multi-modal Stuttering Detection [9.3]
MMSD-Netは、スタブリング検出のための最初のマルチモーダルニューラルネットワークフレームワークである。我々のモデルでは、既存の最先端ユニモーダルアプローチよりもF1スコアが2-17%向上している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:26:59 GMT)
NeSIG: A Neuro-Symbolic Method for Learning to Generate Planning Problems [9.2]
我々はNe SIGを提案し、私たちの知る限り、計画問題を自動的に生成する最初のドメインに依存しない手法を提案する。マルコフ決定プロセスとして問題生成を定式化し、Deep Reinforcement Learningを用いて2つの生成ポリシーを訓練して問題を生成する。結果は、Ne SIGがドメイン固有のジェネレータよりもはるかに難しい、有効で多様な問題を自動生成できることを示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:37:41 GMT)
InstructAV: Instruction Fine-tuning Large Language Models for Authorship Verification [9.2]
本稿では,著者確認のための新しいアプローチであるInstructAVを紹介する。このアプローチでは,パラメータ効率の細かいチューニング(PEFT)手法と併用して,精度と説明可能性の向上を図る。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:27:01 GMT)
SpaceJAM: a Lightweight and Regularization-free Method for Fast Joint Alignment of Images [9.1]
教師なしの関節アライメントは、高複雑性、幾何学的歪み、局所的あるいは大域的最適性への収束といった課題によって特徴づけられる。本稿では,JA タスクに効率と簡易さで対処する新しいアプローチである SpaceJAM について紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:32:39 GMT)
PipeInfer: Accelerating LLM Inference using Asynchronous Pipelined Speculation [9.1]
PipeInferは、パイプライン化された投機的アクセラレーション技術で、トークン間のレイテンシを低減し、単一要求シナリオにおけるシステム利用を改善する。 PipeInferは、標準的な投機的推論よりも生成速度が2.15$times$改善されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:52:02 GMT)
This Probably Looks Exactly Like That: An Invertible Prototypical Network [9.0]
プロトタイプニューラルネットワークは、概念アノテーションなしで人間に理解可能な機械学習を実現するための、エキサイティングな方法だ。原型的説明に対する間接的解釈関数への依存は、プロトタイプの情報的力に厳しい制限を課すことが判明した。本稿では,ガウス混合モデルを用いて正規化フローを構成することにより,ProtoFlowと呼ばれるモデルを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:51:02 GMT)
FLIPHAT: Joint Differential Privacy for High Dimensional Sparse Linear Bandits [8.9]
高次元スパース線形帯域は、シーケンシャルな意思決定問題の効率的なモデルとして機能する。データプライバシの懸念により、我々は、共同でプライベートな高次元の疎線形帯域について検討する。また,FLIPHATは対数的要因を最適に再現できることが示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:34:21 GMT)
Enabling MCTS Explainability for Sequential Planning Through Computation Tree Logic [8.8]
モンテカルロ木探索(MCTS)は、シーケンシャルな計画作業のための最も有能なオンライン検索アルゴリズムの1つである。実世界のデプロイメントにおけるパフォーマンスは高いが、MCTSの本質的な計算は、技術的なバックグラウンドのないユーザにとって理解を困難にしている。本稿では,MCTSを交通ルーティングサービスに利用し,最適化された経路計画を構築するためにアルゴリズムを統合することを検討する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:00:31 GMT)
Practical Guidelines for the Selection and Evaluation of Natural Language Processing Techniques in Requirements Engineering [8.8]
自然言語(NL)は現在、要求自動化の基盤となっている。多くの異なるNLPソリューション戦略が利用可能であるため、特定のREタスクに対して適切な戦略を選択することは困難である。特に,従来のNLP,特徴ベース機械学習,言語モデルに基づく手法など,さまざまな戦略を選択する方法について議論する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:06:02 GMT)
SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image Synthesis [8.8]
SCP-Diff は SIS on Cityscapes, ADE20K and COCO-Stuff の新たな最先端の成果を設定し、Cityscapes の FID は 10.53 である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:40:17 GMT)
ECoh: Turn-level Coherence Evaluation for Multilingual Dialogues [8.7]
本稿では,複数の言語にまたがる応答コヒーレンスを評価するために訓練された評価者の家族であるECohを提案する。 ECohはGenResCoh上の教師モデル(GPT-3.5-Turbo)よりもはるかに小さなアーキテクチャに基づいているにもかかわらず、多言語検出機能を実現している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:28:30 GMT)
Large Language Models as Misleading Assistants in Conversation [8.6]
本稿では,Large Language Models (LLMs) の読解作業における支援の文脈において,誤認する能力について検討する。我々は,(1)モデルが真理的な援助を提供するよう促された場合,(2)モデルが微妙に誤解を招くよう促された場合,(3)間違った回答を求めるよう促された場合,の結果を比較した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:45:22 GMT)
Learning Modality-agnostic Representation for Semantic Segmentation from Any Modalities [8.5]
Any2Segは、任意の視覚的条件におけるモダリティの組み合わせから堅牢なセグメンテーションを実現する新しいフレームワークである。 4つのモダリティを持つ2つのベンチマークの実験は、Any2Segがマルチモーダル設定の下で最先端を達成することを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:34:38 GMT)
Dissipationless topological quantum computation for Majorana objects in sparse-dense mixed encoding process [8.3]
マヨラナオブジェクトに基づくトポロジカル量子計算は重要な課題である。 2量子ビットの量子ゲートのいくつかは、量子ビットのフェルミオンパリティに依存している。所望のフェルミオンパリティから所望のフェミオンパリティへの情報の非散逸補正を可能にするトポロジカル操作を考案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:51:17 GMT)
OAM-TCD: A globally diverse dataset of high-resolution tree cover maps [8.3]
OpenMap (OAM) から得られた高解像度の空中画像において, ツリークラウンデライン化(TCD)のための新しいオープンアクセスデータセットを提案する。我々のデータセットであるOAM-TCDは、50722048x2048px画像を10cm/px解像度で、関連する280k個以上の木と56k個の木からなる。データセットを使用して、既存の最先端モデルと比較する参照インスタンスとセマンティックセグメンテーションモデルをトレーニングする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:11:29 GMT)
Ev-GS: Event-based Gaussian splatting for Efficient and Accurate Radiance Field Rendering [8.3]
単眼イベントカメラから3次元ガウススプラッティングを推定する最初のCNIインフォームドスキームであるEv-GSを紹介する。 Ev-GSは、ぼかしを減らし、視覚的品質を改善したリアルなビューをレンダリングすることで、フレームベースの信号を入力として取り出す手法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:15:13 GMT)
Cloud-based Semi-Quantum Money [8.3]
1970年代、ヴィースナーは量子マネーの概念を導入し、特定の規則に従って生成された量子状態が通貨として機能した。量子マネーを鋳造・保存できる量子コンピュータはまだ登場していない。既存の量子チャネルは、量子マネーのための効率的な量子状態の伝送をサポートするほど安定ではない。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:40:17 GMT)
Decomposition Betters Tracking Everything Everywhere [8.2]
DecoMotionと呼ばれる新しいテスト時間最適化手法を提案し、画素ごとの動作と長距離動きを推定する。提案手法は,ポイントトラッキングの精度を高いマージンで向上させ,最先端のポイントトラッキングソリューションと同等に動作させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:11:47 GMT)
Preconditioned Gradient Descent Finds Over-Parameterized Neural Networks with Sharp Generalization for Nonparametric Regression [8.1]
本稿では、勾配降下(GD)またはその変種により訓練された2層ニューラルネットワークによる非パラメトリック回帰を考察する。ニューラルネットワークが早期停止を伴う新しいプレコンディション付きグラディエント・ディフレクション(PGD)でトレーニングされ、ターゲット関数がディープラーニング文献において広く研究されているスペクトルバイアスを持つ場合、トレーニングされたネットワークは、特に、極小値の最大速度が$cO(1/n4alpha/(4alpha+1)$で制限されたシャープな一般化をレンダリングする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:38:34 GMT)
MVG-Splatting: Multi-View Guided Gaussian Splatting with Adaptive Quantile-Based Geometric Consistency Densification [8.1]
マルチビューを考慮したソリューションであるMVG-Splattingを紹介する。付加的な密度化のレベルを動的に決定する適応的量子化法を提案する。このアプローチは3次元再構成プロセス全体の忠実度と精度を大幅に向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:24:01 GMT)
A Scalable Real-Time Data Assimilation Framework for Predicting Turbulent Atmosphere Dynamics [8.0]
我々は,汎用リアルタイムデータ同化フレームワークを導入し,そのエンドツーエンド性能をFrontierスーパーコンピュータ上で実証する。このフレームワークは、アンサンブルスコアフィルタ(EnSF)とビジョントランスフォーマーベースのサロゲートの2つの主要モジュールから構成される。 ExascaleスーパーコンピュータであるFrontier上では、私たちのフレームワークの強いスケーリングと弱いスケーリングの両方を1024GPUで実証しています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:44:09 GMT)
Cycle Contrastive Adversarial Learning for Unsupervised image Deraining [7.9]
CCLGANと呼ばれる非教師付きSIDのための新しいサイクルコントラスト生成対向ネットワークを提案する。このフレームワークは、サイクルコントラスト学習(CCL)と位置コントラスト学習(LCL)を組み合わせたものである。 CCLGANは、CCLGANの利点とその有効性を示す広範な実験として、優れた性能を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:16:42 GMT)
Weak-coupling limits of the quantum Langevin equation for an oscillator [7.9]
量子ランゲヴィン方程式のレベルで'Born-Markov'のような近似を実装するとどうなるかを示す。この背景には、回転波近似についてもコメントする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:51:26 GMT)
Paraphrase Types for Generation and Detection [7.8]
これらのタスクをパラフレーズ型生成とパラフレーズ型検出と呼ぶ。以上の結果から,従来の手法は二項分類のシナリオではうまく機能するが,微粒なパラフレーズ型の含みは大きな課題となることが示唆された。我々は、パラフレーズ型が将来、パラフレーズモデルの開発とタスクの解決のための新しいパラダイムを解き放つことができると考えている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:55:21 GMT)
Centering the Value of Every Modality: Towards Efficient and Resilient Modality-agnostic Semantic Segmentation [7.8]
最近の試みでは、RGBのモダリティを中心とみなし、その他を補助的とみなし、2つの枝を持つ非対称なアーキテクチャを生み出している。本稿では,コンパクトモデルから高性能モデルまで,様々なバックボーンと柔軟にペアリングできるMAGICという新しい手法を提案する。提案手法は, モデルパラメータを60%削減しつつ, 最先端性能を実現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:19:59 GMT)
Learning local equivariant representations for quantum operators [7.7]
本稿では,複数の量子演算子を予測するための新しいディープラーニングモデルSLEMを提案する。 SLEMは、計算効率を劇的に改善しながら最先端の精度を達成する。 SLEMの能力は多種多様な2次元および3次元材料にまたがって実証し,限られた訓練データでも高い精度を達成できることを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:52:49 GMT)
A cryogenic on-chip microwave pulse generator for large-scale superconducting quantum computing [7.7]
超伝導量子プロセッサでは、マイクロ波信号が室温のエレクトロニクスから同軸ケーブルを介して低温環境へ各キュービットに送られる。このアーキテクチャは、フォールトトレラント量子コンピューティングに必要な数百万の量子ビットに対して有効ではない。制御エレクトロニクスと量子ビットのモノリシックな統合は、有望なソリューションを提供する。このような信号源は, ミリケルビン温度で直接, 位相, 強度, 周波数を制御したパルスマイクロ波放射を発生させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:33:18 GMT)
Cross-Phase Mutual Learning Framework for Pulmonary Embolism Identification on Non-Contrast CT Scans [7.7]
肺塞栓症 (PE) は, 急速かつ正確な診断が困難であるが, 主に非定型的な症状を呈する疾患である。我々は,CTAからNCTスキャンへの知識伝達を促進する新しいクロスパス・ミューチュアル・ラーニング・フレームワーク (CPMN) を提案する。 CPMNは、NCTスキャンにおける患者レベルの感度と特異性において95.4%と99.6%の顕著な識別性能を達成している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:29:33 GMT)
DepGAN: Leveraging Depth Maps for Handling Occlusions and Transparency in Image Composition [7.7]
DepGANは、デプスマップとアルファチャンネルを利用して、不正確なオクルージョンを正すジェネレーティブ・アドバイサル・ネットワークである。我々のネットワークの中心にはDepth Aware Lossと呼ばれる新しいロス関数があり、ピクセルのワイド深さ差を定量化している。我々は不透明データを利用してネットワークの学習プロセスを強化し、透明で半透明なオブジェクトを含む構成を効果的に管理する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:18:40 GMT)
UP-Diff: Latent Diffusion Model for Remote Sensing Urban Prediction [7.6]
本研究では,今後の都市計画に焦点をあてた新しいリモートセンシング(RS)都市予測(UP)タスクを紹介する。本稿では,遅延拡散モデル(LDM)を応用したUP-Diffを提案する。 LEVIRCDとSYSU-CDデータセットの実験結果は、UP-Diffが将来の都市レイアウトを忠実に正確に予測する能力を示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:40:21 GMT)
Length-Aware Motion Synthesis via Latent Diffusion [7.5]
そこで本研究では,テキスト記述子から長さ認識型3次元人間の動作系列を生成する問題について紹介する。可変目標長の運動を合成する新しいモデルを提案し,これをLength-Aware Latent Diffusion (LADiff) と呼ぶ。 LADiff は新しい2つのモジュールから構成される: 1) 長さ依存の潜伏符号を用いた動き表現を学習する長さ認識変分自動エンコーダ; 2) 所望の目標列長とともに増加する細部豊かな動きを生成する長さ変換潜伏拡散モデル。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:30:57 GMT)
Entanglement-Based Artificial Topology: Neighboring Remote Network Nodes [7.5]
絡み合いは、量子インターネットの鍵となる通信資源として全会一致で認識される。マルチパーティ・エンタングルメントは局所演算のみを用いてQLAN間人工トポロジーを生成することができることを示す。我々の貢献は、ネットワークエンジニアリングコミュニティに、人工トポロジと人工地区の概念に関する手持ちのガイドラインを提供することである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:30:31 GMT)
ParamNet: A Dynamic Parameter Network for Fast Multi-to-One Stain Normalization [7.4]
静止正規化は、デジタル病理画像の色と明るさの差を効果的に低減することができる。本研究では,動的パラメータネットワークを導入し,ParamNetと呼ばれる新しい染色正規化法を提案する。その結果、ParamNetは25秒で10万×100,000のスライド画像(WSI)を正規化できることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:26:12 GMT)
Dynamic Dimension Wrapping (DDW) Algorithm: A Novel Approach for Efficient Cross-Dimensional Search in Dynamic Multidimensional Spaces [7.4]
本研究では,新しい最適化アルゴリズム-動的次元ラッピング(DDW)アルゴリズムを提案する。 DDWは優れた探索効率を示し、実際の最適解に最も近い検索結果を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:41:35 GMT)
AFIDAF: Alternating Fourier and Image Domain Adaptive Filters as an Efficient Alternative to Attention in ViTs [7.4]
本稿では,特徴抽出のためのFourierと画像領域フィルタリングを交互に行う手法を提案する。軽量モデル間の性能はImageNet-1K分類の最先端レベルに達する。我々のアプローチは、視覚変換器(ViT)を圧縮するための新しいツールとしても機能する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:53:11 GMT)
Enhancing Scene Graph Generation with Hierarchical Relationships and Commonsense Knowledge [7.3]
この研究は、関係階層とコモンセンス知識の両方によってシーングラフを生成するための拡張されたアプローチを導入する。我々は,シーングラフ予測システムから結果を批判するために基礎モデルを活用する,堅牢なコモンセンス検証パイプラインを実装した。 Visual GenomeとOpenImage V6データセットの実験では、既存のシーングラフ生成アルゴリズムのプラグインとプレイの拡張として、提案されたモジュールをシームレスに統合できることが示されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:39:05 GMT)
A Central Motor System Inspired Pre-training Reinforcement Learning for Robotic Control [7.2]
本稿では,ロボットがリッチモータースキルを習得することのできる,事前学習型強化学習アルゴリズムを提案する。まず,任意運動の選択機構を利用して,脳に類似したスキルベースネットワークを設計する。本研究では,4種類のロボットと22種類のタスク環境について実験を行い,提案手法により,柔軟な運動能力を実現することができることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:57:18 GMT)
Quantised Global Autoencoder: A Holistic Approach to Representing Visual Data [7.2]
量子化されたオートエンコーダでは、画像は通常、局所的なパッチに分割され、それぞれが1つのトークンでエンコードされる。本手法は,入力信号を大域周波数の重畳に変換するスペクトル分解に着想を得たものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:05:20 GMT)
Empowering Safe Reinforcement Learning for Power System Control with CommonPower [7.1]
RLコントローラのフレキシブルでモデルベースの保護を可能にするPythonツールCommonPowerを紹介した。 CommonPowerは、単一エージェントRL、マルチエージェントRL、最適制御のための統一インターフェースを提供し、異なる予測メソッドをシームレスに統合する。我々は、異なる安全ガードを特徴とするRLエージェントと、エネルギー管理のコンテキストにおけるモデル予測制御器を比較した数値ケーススタディにより、CommonPowerの汎用性を実証する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:48:19 GMT)
Contingency-constrained economic dispatch with safe reinforcement learning [7.1]
強化学習ベース(RL)コントローラはこの課題に対処できるが、それ自体が安全保証を提供することはできない。本稿では,経済派遣のための公式なRLコントローラを提案する。従来の制約を時間依存制約によって拡張する。安全でないアクションは安全なアクション空間に投影され、制約付きゾノトペ集合表現を計算効率に活用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:00:04 GMT)
Stepping Stones: A Progressive Training Strategy for Audio-Visual Semantic Segmentation [7.1]
AVSS (Audio-Visual Semantic) は映像中の音源の画素レベルのローカライゼーションを実現することを目的としており、AVSS (Audio-Visual Semantic) は音声視覚シーンの意味的理解を追求している。従来の方法は、エンドツーエンドのトレーニングにおいて、このマッシュアップを扱うのに苦労しており、学習とサブ最適化が不十分である。 textitStepping Stonesと呼ばれる2段階のトレーニング戦略を提案し、AVSSタスクを2つの単純なサブタスクに分解する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:08:30 GMT)
Information Scrambling in Free Fermion Systems with a Sole Interaction [7.1]
我々は、自由フェルミオンホッピング項と単独相互作用からなるブラウン回路とクリフォード回路を構築する。両回路とも,演算子のスクランブルの発生が明らかとなった。 1次元システムでは、演算子と絡み合いの両方が拡散スケーリングを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:49:39 GMT)
UAV-Assisted Space-Air-Ground Integrated Networks: A Technical Review of Recent Learning Algorithms [7.1]
無人航空機(UAV)は宇宙航空地上統合ネットワーク(SAGIN)において重要な役割を果たしている UAVの高ダイナミック性と複雑さのため、SAGINの実際の展開は、そのようなSAGINを実現する上で重要な障壁となる。本稿では,UAV支援型SAGINにおける最近の学習アルゴリズムについて,本質的なレビューと分析を行う。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:15:25 GMT)
SPINACH: SPARQL-Based Information Navigation for Challenging Real-World Questions [6.9]
本稿では,Wikidata の "Request a Query" フォーラムからの KBQA データセットである SPINACH データセットを紹介する。データセットに加えて、このような難しい問題に対して、人間の専門家がどのようにSPARQLを書くかを模した、KBQAアプローチであるSPINACHエージェントも導入しています。我々の新しいSPINACHデータセットでは、SPINACHエージェントは、最高のGPT-4ベースのKBQAエージェントを含む全てのベースラインを38.1%上回る。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:18:21 GMT)
Combining Wasserstein-1 and Wasserstein-2 proximals: robust manifold learning via well-posed generative flows [6.8]
低次元多様体に支持された学習分布の連続時間生成フローを定式化する。 We show that the Wasserstein-1 proximal operator regularize $f$-divergences to be compareds。また, ワッサーシュタイン2近似作用素は, 最適輸送コストを加算することにより, 生成フローの経路を正則化することを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:34:31 GMT)
Sim-Grasp: Learning 6-DOF Grasp Policies for Cluttered Environments Using a Synthetic Benchmark [6.8]
シム・グラスプ(Sim-Grasp)は、6-DOF2指グルーピングシステムで、乱雑な環境下でのオブジェクト操作を改善するための高度な言語モデルを統合する。我々はSim-Grasp-Datasetを紹介し、500のシナリオに7.9百万のアノテートラベルを持つ1,550のオブジェクトを含み、ポイントクラウドから把握ポーズを生成するSim-GraspNetを開発した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:12:11 GMT)
Novel Artistic Scene-Centric Datasets for Effective Transfer Learning in Fragrant Spaces [6.8]
文化遺産研究でしばしば見落とされ、人間の経験やアイデンティティを形作る上で重要な役割を担っている。弱ラベル付き学習データを用いた移動学習手法は、香り空間の分類を著しく改善できることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:18:05 GMT)
MRIo3DS-Net: A Mutually Reinforcing Images to 3D Surface RNN-like framework for model-adaptation indoor 3D reconstruction [6.8]
本稿では,モデル適応型屋内3次元再構成のための3次元表面リカレントニューラルネットワークに画像を相互に補強するエンドツーエンドフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:46:57 GMT)
Beyond Spatial Explanations: Explainable Face Recognition in the Frequency Domain [6.7]
我々は、探索されていない周波数領域における説明可能な顔認識について、一歩前進して検討する。この研究は、周波数領域における検証に基づく決定の説明可能性について初めて提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:29:24 GMT)
CATD: Unified Representation Learning for EEG-to-fMRI Cross-Modal Generation [6.7]
本稿では,ニューロイメージングの終端から終端までのクロスモーダル合成のための条件付き時間拡散(CATD)フレームワークを提案する。提案フレームワークは、ニューロイメージングのクロスモーダル合成のための新しいパラダイムを確立する。パーキンソン病の予測を改善し、異常な脳領域を同定するといった医療応用の可能性を示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:31:38 GMT)
IPA-NeRF: Illusory Poisoning Attack Against Neural Radiance Fields [6.6]
Illusory Poisoning Attack against Neural Radiance Fields (IPA-NeRF)について紹介する。この攻撃では、隠れたバックドアビューをNeRFに埋め込み、所定の出力を生成する。我々の攻撃は、特定の位置でユーザーや下流のモデルを騙し、NeRFの異常が他の視点では検出できないことを確実にするように設計されています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:11:43 GMT)
What's Wrong? Refining Meeting Summaries with LLM Feedback [6.5]
本稿では,人間レビュープロセスを模倣した2段階プロセスを用いて,会議要約のためのマルチLLM補正手法を提案する。 QMSum Mistakeは、人によって注釈付けされた会議要約を9種類のエラータイプで自動生成する200のデータセットである。特定ミスを実用的なフィードバックに変換することで,関連性,情報性,簡潔性,一貫性によって測定された要約の質を向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:10:16 GMT)
Bike Frames: Understanding the Implicit Portrayal of Cyclists in the News [6.4]
報道機関のイデオロギーと報告スタイルは、しばしばサイクリングに対する大衆の認識に影響を及ぼす。本稿では,ニュース見出し中のサイクリストの知覚を検知する手法を開発する。 BikeFrame Chain-of-Codeフレームワークを導入し、サイクリストの知覚を予測し、事故に関連する見出しを特定し、欠陥を判定する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:42:44 GMT)
Bridging Weighted First Order Model Counting and Graph Polynomials [6.3]
重み付き一階述語モデルカウント問題(WFOMC)は、与えられた一階述語論理文のモデルの重み付き和を計算することを要求する。 Weak Connectedness Polynomials and Strong Connectedness Polynomials for first-order logic sentences。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:01:25 GMT)
Relational Representation Distillation [6.2]
本稿では,複雑な知識の効率的な伝達を保証するためにRepresentation Distillation (RRD)を導入する。自己監督学習の原則に触発されて、正確な複製よりも類似性に焦点を当てた、リラックスした対照的な損失を使用する。提案手法はCIFAR-100よりも優れており,従来のKD技術より優れ,最先端手法は13を超える。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:56:13 GMT)
Invariant Consistency for Knowledge Distillation [6.2]
本稿では,知識蒸留の高度化を目的とした新手法であるICDについて紹介する。 CIFAR-100の結果は、ICDが従来のKD技術より優れ、最先端の手法が13を超えることを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:53:35 GMT)
DynSyn: Dynamical Synergistic Representation for Efficient Learning and Control in Overactuated Embodied Systems [6.2]
制御機構の研究は、高次元の過度なシステムの制御に関する洞察を与える。神経力学における筋シナジーとして知られるアクチュエータの協調は、運動指令の生成を単純化する予備的なメカニズムであると考えられている。この理論を動機として,動的シナジスティック表現(DynSyn)アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:09:59 GMT)
Improved Belief Propagation Decoding on Surface Codes with High Accuracy and Low Latency [5.9]
EWAInit-BPは、順序統計復号処理を行わないBP改善の中で最高精度を達成している。理論上のO(1)時間複雑性と高精度により、高精度リアルタイムデコーダの候補となる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:03:06 GMT)
AnatoMask: Enhancing Medical Image Segmentation with Reconstruction-guided Self-masking [5.8]
Masked Image Modeling (MIM) は、ランダムにマスキングされた画像を再構成し、詳細な表現を学習することで効果を示した。解剖学的に重要な領域を動的に識別・隠蔽するために再構成損失を利用した新しいMIM手法であるAnatoMaskを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:04:26 GMT)
OneDiff: A Generalist Model for Image Difference Captioning [5.7]
画像差分キャプション(IDC)は、近縁な画像間の変化を正確に記述するために重要である。 OneDiffは、堅牢な視覚言語モデルアーキテクチャを利用する新しいジェネラリストアプローチである。 OneDiffは、既存の最先端モデルを精度と適応性で一貫して上回っている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:50:44 GMT)
LoRA-GA: Low-Rank Adaptation with Gradient Approximation [5.7]
微調整された大規模事前訓練モデルは、計算とメモリコストの点で極めて高価である。 LoRAは、パラメータが著しく少ない補助的な低ランクモデルを微調整することで、コスト効率のよい代替手段を提供する。 LoRAは完全な微調整に比べてかなり遅い速度で収束し、全体的な計算能力が向上し、しばしばテスト性能が悪化する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:32:23 GMT)
Atom Cavity Encoding for NP-Complete Problems [5.5]
我々は、カープの21個のNP完全問題の大部分を含む、多数のNP完全問題に対する符号化スキームを提案する。このような計算問題を, 原子数の線形コストで, 原子キャビティ・システムによって符号化できることが判明した。本研究は,NP完全問題の解法において,原子空洞系の実用的な量子的優位性を求めるための重要なガイダンスを提供することを期待している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:32:42 GMT)
SparseRadNet: Sparse Perception Neural Network on Subsampled Radar Data [5.3]
レーダー生データは、しばしば過剰なノイズを含むが、レーダー点雲は限られた情報しか保持しない。本稿では,適応的なサブサンプリング手法と,空間パターンを利用したネットワークアーキテクチャを提案する。 RADIalデータセットの実験により,SparseRadNetはオブジェクト検出における最先端(SOTA)性能を超え,自由空間セグメンテーションにおけるSOTA精度に近づいた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:29:30 GMT)
Performance Evaluation of Lightweight Open-source Large Language Models in Pediatric Consultations: A Comparative Analysis [5.3]
大きな言語モデル(LLM)のオープンソース版と軽量版が潜在的な解決策として浮上するが、その性能は未検討のままである。本研究は, 公立オンライン医療フォーラムから250件の患者相談質問をランダムに選択し, 小児科25部門から10件の質問を行った。 ChatGLM3-6BはVicuna-13BやVicuna-7B(P .001)よりも精度と完全性を示したが、すべてChatGPT-3.5より優れていた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:35:09 GMT)
EARN Fairness: Explaining, Asking, Reviewing and Negotiating Artificial Intelligence Fairness Metrics Among Stakeholders [5.2]
我々は、AIの専門知識を必要とせず、利害関係者間でのメトリクスの集合的決定を促進する新しいフレームワークEARN Fairnessを提案する。このフレームワークは、適応可能なインタラクティブシステムと、公正度指標を説明するステークホルダ中心のEARNフェアネスプロセス、利害関係者の個人的メトリック選好、総括的メトリクス、メトリクス選択に関するコンセンサスを交渉する。我々の研究によると、EARN Fairnessフレームワークは、利害関係者が個人の好みを表現し、合意に達することを可能にし、リスクの高い状況下で人間中心のAIフェアネスを実装するための実践的なガイダンスを提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:20:30 GMT)
A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility [5.2]
本稿では,艦隊スケジューリング問題の包括的最適化について述べる。また、代替ソリューションのアプローチの必要性も認識している。新しい模倣アプローチは、目に見えない最悪のシナリオにおいて、パフォーマンスと顕著な改善を実現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:51:24 GMT)
Dataset Dictionary Learning in a Wasserstein Space for Federated Domain Adaptation [5.0]
マルチソースドメイン適応(MSDA、Multi-Source Domain Adaptation)は、複数の関連する異種ソースデータセットをラベル付けされていないターゲットデータセットに適合させるという、難しいシナリオである。我々の研究は、この課題に対処するために、分散データセット辞書学習という新しいアプローチを提案する。我々のアルゴリズムは、各クライアントの基盤となる分布を、プライベートなバリ中心座標によって重み付けされたパブリック原子のワッサーシュタインバリセンタとして表現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:13:54 GMT)
SHMamba: Structured Hyperbolic State Space Model for Audio-Visual Question Answering [5.0]
AVQA(Audio-Visual Question Answering)のマルチモーダル入力により,特徴抽出と融合処理がより困難になる。我々は、双曲幾何学と状態空間モデルの利点を統合するために、構造化双曲状態空間モデル(SHMamba: Structured Hyperbolic State Space Model)を提案する。提案手法は,現行のすべての主要な手法の優越性を実証し,実用的なアプリケーションシナリオに適した方法である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:09:56 GMT)
FR-SLAM: A SLAM Improvement Method Based on Floor Plan Registration [5.0]
本稿では,形態素に基づくフロアプラン登録アルゴリズムを用いて,フロアプラン登録に基づくSLAM法を提案する。これにより、包括的なモーションマップの迅速な取得と効率的な経路計画が容易になり、迅速なナビゲーションが短い時間枠内で位置を目標にすることができる。実データとシミュレーションデータを用いて行った実験は,他のベンチマークアルゴリズムと比較すると,フロアプランの登録精度の向上と時間消費の短縮を実現している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:23:38 GMT)
DaCapo: Accelerating Continuous Learning in Autonomous Systems for Video Analytics [5.0]
本稿では,自律型システムによる推論,ラベリング,トレーニングの同時実行を可能にする,継続的学習のためのハードウェアアルゴリズムであるDaCapoを提案する。 DaCapoは、最先端の継続的学習システムであるEkyaとEOMUよりも6.5%と5.5%高い精度を実現し、消費電力は254倍少ない。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:32:01 GMT)
Quantum Maximum Entropy Inference and Hamiltonian Learning [5.0]
この研究は、最大エントロピー推論とグラフィカルモデルの学習のためのアルゴリズムを量子領域に拡張する。量子反復スケーリング(QIS)として知られる一般化は単純であるが、重要な課題は量子問題インスタンスの非可換性にある。準ニュートン法によるQISとGDの性能向上について検討する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:11:34 GMT)
Fast Diffusion-Based Counterfactuals for Shortcut Removal and Generation [5.0]
ショートカット学習は、モデルがターゲットラベルと急激なショートカット特徴の間の相関を利用するときである。これは医学的画像において一般的であり、治療と臨床的アノテーションは疾患のラベルと相関し、疾患を予測するためのショートカットを容易にする。本稿では,高速拡散に基づく反ファクト画像生成による潜在的ショートカット特徴の影響の新しい検出と定量化を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:45:40 GMT)
ODIM: Outlier Detection via Likelihood of Under-Fitted Generative Models [5.0]
Unsupervised Outlier Detection (UOD) とは、非教師付き外乱検出(unsupervised outlier detection, UOD)問題である。我々は、IM効果(ODIM)による外れ検知と呼ばれる新しい手法を開発した。注目すべきなのは、ODIMはほんの数回の更新しか必要とせず、計算効率が他のディープラーニングベースのアルゴリズムの何倍も高速であることだ。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:29:01 GMT)
Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors [5.0]
本稿では,バイナリ重み付きニューラルネットワークのサブビット圧縮を実現するために,ビット列を持つタイル型ニューラルネットワーク層に対する新しい量子化方式を提案する。私たちは完全に接続された層と畳み込み層の両方にアプローチを採用しています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:55:38 GMT)
Market or Markets? Investigating Google Search's Market Shares Under Horizontal and Vertical Segmentation [4.9]
本稿では,オンライン検索の水平および垂直のセグメンテーションの下で,Google検索のマーケットシェアを初めて分析する。 Google Searchは、他の水平検索エンジンと比較して71.8%の参加者のクエリを受け取ります。以上の結果から,Google検索の市場パワーとオンライン市場全体の概念化に関する,現在かつ現在進行中の議論について報告する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:09:55 GMT)
Ubiquitous Metadata: Design and Fabrication of Embedded Markers for Real-World Object Identification and Interaction [4.9]
物理的な領域とデジタル領域の収束は、没入的な経験とシームレスな相互作用の新しい時代を支えてきた。物理的オブジェクトと仮想オブジェクトを接続する堅牢で効率的な方法が求められている。本稿では, 組込み機械可読マーカーの設計, 製作, 検出を通じて, このギャップを埋める新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:14:52 GMT)
Repurformer: Transformers for Repurposing-Aware Molecule Generation [4.8]
タンパク質と化合物間のマルチホップ関係を利用して多様な分子を生成することを提案する。我々のモデルであるRepurformerは、Fast Fourier Transform (FFT)とLow-pass Filtering (LPF)と双方向事前学習を統合し、複雑な相互作用を捉える。 BindingDBデータセットに関する一連の実験は、Repurformerが正の化合物に似たアンカー化合物の代替品をうまく作ることを確認した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:16:13 GMT)
Continuity Preserving Online CenterLine Graph Learning [4.8]
CGNetは、予測されるトポロジ的接続を反復的に洗練するためのメモリを備えたグラフベースのネットワークである。 nuScenesとArgoverse2データセットの両方で最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:05:51 GMT)
Improving Engagement and Efficacy of mHealth Micro-Interventions for Stress Coping: an In-The-Wild Study [4.7]
パーソナライズされたコンテキスト認識介入選択アルゴリズムは、mHealth介入のエンゲージメントと有効性を改善する。短時間でも1分間の介入は、知覚されるストレスレベルを著しく減少させる。本研究は,個人化された文脈認識介入選択アルゴリズムを導入することで文献に寄与する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:22:22 GMT)
Detection of Global Anomalies on Distributed IoT Edges with Device-to-Device Communication [4.6]
本稿では,ワイヤレスアドホックフェデレートラーニングを用いた分散異常検知器の学習のための,完全分散協調方式を提案する。サンプルはローカルデバイスでは稀だが,対象ドメインの全デバイスでは稀であるGlobal Anomalyの概念を紹介した。両装置は, 偽陽性率の低いグローバル異常検出の閾値を, 例外なく高い真陽性率を達成し, 協調的に検出できることを確認した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:50:25 GMT)
Beyond Words: On Large Language Models Actionability in Mission-Critical Risk Analysis [4.5]
リスク分析の原則はコンテキストレスです。リスク分析には、国内外の規制や基準に関する膨大な知識が必要である。大規模な言語モデルは、人間よりも少ない時間で情報を素早く要約することができ、特定のタスクに微調整することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:45:50 GMT)
Physical partisan proximity outweighs online ties in predicting US voting outcomes [4.5]
影響のある分極と社会的分裂の増大は、社会の混合や、オンラインや物理的な空間における情報の拡散に影響を及ぼす。我々は、同じ社会的文脈への物理的な近接と露出、オンラインの社会的結びつき、住居のソートという、パルチザンの露出の3つの次元を比較した。以上の結果から,選挙結果が不確実なスウィング郡では,物理パルチザン近接が投票パターンの最良の予測要因であることが示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:02:18 GMT)
Sociotechnical Implications of Generative Artificial Intelligence for Information Access [4.4]
生成AI技術は、情報にアクセスし、既存の情報検索システムの有効性を改善する新しい方法を可能にする。本稿では、情報アクセスの文脈において、生成AIを採用する際のシステム的結果とリスクについて概説する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:47:13 GMT)
Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection [4.3]
本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争力のある性能を実現する手法を提案する。大規模ネットワークから小さなネットワークへ知識を伝達するために,リレーショナル自己教師型蒸留を利用することで,少ない記述子サイズの軽量ネットワークのトレーニングを可能にする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:39:27 GMT)
A Transformer-based Approach for Augmenting Software Engineering Chatbots Datasets [4.3]
ソフトウェアエンジニアリングデータセットを拡張するための自動トランスフォーマーベースのアプローチを提案する。 3つのソフトウェアエンジニアリングデータセットを用いて,拡張アプローチがRasa NLUの性能に与える影響を評価する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:48:44 GMT)
FoodMem: Near Real-time and Precise Food Video Segmentation [4.3]
現在の制限は、不正確な栄養分析、非効率な作物管理、最適な食品加工に繋がる。本研究では,高品質でほぼリアルタイムなセグメンテーションとビデオ中の食品の追跡のための堅牢なフレームワークの開発を紹介する。私たちは、360度シーンのビデオシーケンスから食品を分割する新しいフレームワーク、FoodMemを紹介します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:15:07 GMT)
Challenges of Multilingual Program Specification and Analysis [4.2]
マルチ言語プログラミングで一般的に使用される特徴が,その特徴を特定・解析する能力に与える影響について論じる。多言語プログラムのいくつかの例と、その振る舞いを公式に推論する複雑さについて述べる。また、多言語プログラム分析における技術の現状を要約し、オープンなままの課題を含める。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:29:54 GMT)
Revisiting the Impact of Pursuing Modularity for Code Generation [4.2]
コード生成におけるモジュラリティの影響を,その定量的測定のための新しい測定基準を導入することによって評価する。驚くべきことに、このトピックに関する従来の知恵とは異なり、モジュラリティはコード生成モデルのパフォーマンスを改善するための中核的な要素ではない。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:48:24 GMT)
A PLMs based protein retrieval framework [4.1]
本稿では,配列類似性に対するバイアスを緩和する新規なタンパク質検索フレームワークを提案する。我々のフレームワークは、タンパク質の配列を高次元の特徴空間に埋め込むために、タンパク質言語モデル(PLM)を主導的に活用する。大規模な実験により、我々のフレームワークは類似タンパク質と異種タンパク質の両方を等しく回収できることが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:52:42 GMT)
ScribblePrompt: Fast and Flexible Interactive Segmentation for Any Biomedical Image [4.1]
本稿では,バイオメディカルイメージングのためのフレキシブルニューラルネットワークを用いたインタラクティブセグメンテーションツールであるemphScribblePromptを紹介する。ドメインの専門家によるユーザスタディでは、ScribblePromptはアノテーションの時間を28%削減し、Diceを15%改善した。インタラクティブなデモでScribblePromptを紹介し、コードを提供し、https://scribbleprompt.csail.mit.eduでscribbleアノテーションのデータセットをリリースします。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:21:42 GMT)
Multi-reservoir enhanced loading of tweezer atom arrays [4.0]
単一原子光トウィーザアレイへの負荷改善のための種非依存手法を提案する。提案手法は4回のリロードサイクル後に96$%の負荷率を達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:37:41 GMT)
Distributed Representations Enable Robust Multi-Timescale Symbolic Computation in Neuromorphic Hardware [4.0]
本稿では,ロバストなマルチスケールダイナミックスをアトラクタベースRSNNに組み込むシングルショット重み学習方式について述べる。対称自己解離重み行列を重畳することにより、有限状態機械をRSNN力学に組み込む。この研究は、リカレントダイナミクスによる堅牢な記号計算をニューロモルフィックハードウェアに組み込むスケーラブルなアプローチを導入している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:41:27 GMT)
Deciphering the Role of Representation Disentanglement: Investigating Compositional Generalization in CLIP Models [3.9]
構成分布(C-OoD)の一般化はCLIPモデルでは比較的未探索である。本研究は,CLIPモデルの一般化において,画像およびテキスト表現の歪み,特に構成要素について重要な役割を担っていることを明らかにした。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:42:05 GMT)
Safe Online Convex Optimization with Multi-Point Feedback [3.9]
我々は,ゼロオーダー情報のみを使用しながら,サブ線形後悔とゼロ制約違反を同時に達成する必要がある安全なオンライン凸最適化環境について検討する。特に,各ラウンドで$d + 1$ポイントを選択し,各ポイントで制約関数とコスト関数の値を受け取るマルチポイントフィードバック設定を考える。この問題に対処するために,前向き差分勾配推定と楽観的かつ悲観的なアクションセットを利用して,$mathcalO(d sqrtT)$ regret and zero constraintを実現するアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:09:26 GMT)
Accelerating Simulation of Two-Phase Flows with Neural PDE Surrogates [3.9]
二相流問題のスケーリングシミュレーションを支援するツールとして,ニューラルPDEソルバを検討・拡張する。この問題に対する既存の数値解法を、領域の様々な測度を含むより複雑な設定に拡張する。その結果,最大3桁の速さで液滴力学を正確にモデル化できることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:41:22 GMT)
Automating psychological hypothesis generation with AI: when large language models meet causal graph [3.9]
我々は,大言語モデル(LLM)を用いて43,312の心理学記事を分析し,因果関係のペアを抽出した。リンク予測アルゴリズムを適用して、幸福に焦点をあてた130の心理学的仮説を作成した」この結果から,因果知識グラフなどの機械学習技術を組み合わせることで,心理学における自動発見に革命をもたらす可能性が示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:12:45 GMT)
On the Calibration of Epistemic Uncertainty: Principles, Paradoxes and Conflictual Loss [3.8]
証拠不確実性は、Deep Ensembles、Bayesian Deep Networks、Evidential Deep Networksによって生成される。測定可能ではあるが、この形の不確実性は客観的に校正することは困難である。以上の要件に則った競合損失という,深層アンサンブルの正規化関数を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:21:28 GMT)
A Discrete Perspective Towards the Construction of Sparse Probabilistic Boolean Networks [3.8]
スパースPBNを構築するための新しいGreedy Entry removal (GER)アルゴリズムを提案する。 GERは最先端のスパースPBN構築アルゴリズムの中で最高の性能を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:50:04 GMT)
Uhlmann-quench, A Protocol to Measure the Uhlmann Phase [3.8]
混合量子状態のクエンチ力学に幾何学的位相を組み込む形式を提示する。ウルマンクエンチ(Uhlmann quench)は、混合状態における量子力学と幾何学的過程の間の相互作用を研究するためのルートを提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:59:30 GMT)
Towards Neuro-Symbolic Video Understanding [3.8]
長期的時間的推論は、フレーム検索システムにとって重要なデシダータムである。この失敗の主な理由は、フレーム単位の認識と時間的推論を1つのディープネットワークに織り込むためである。本稿では,個々のフレームの意味的理解に視覚言語モデルを活用するシステムを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:55:58 GMT)
psifx -- Psychological and Social Interactions Feature Extraction Package [3.6]
psifxはマルチモーダルな特徴抽出ツールキットである。それは、人間の科学研究に最先端の機械学習技術を使うことを容易にし、民主化することを目的としている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:30:03 GMT)
A Novel Lexicon for the Moral Foundation of Liberty [3.5]
自由の道徳的価値は、議論を呼んでいる社会問題に対してスタンスを取るという点において、我々の推論システムにおける中心的な概念である。 3000以上の注釈付きデータから評価した新しいリバティ辞書を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:49:05 GMT)
Coexistence of non-Hermitian skin effect and extended states in one-dimensional nonreciprocal lattices [3.4]
スタッガートオンサイト変調と非相互ホッピングを持つ一次元非エルミート格子について検討する。本研究は,非エルミート系におけるオンサイト変調と非相互ホッピングの複雑な相互作用を明らかにする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:26:22 GMT)
HyperAggregation: Aggregating over Graph Edges with Hypernetworks [3.4]
HyperAggregationは、グラフニューラルネットワークのためのハイパーネットワークベースの集約機能である。これは、誘導的およびトランスダクティブな設定の両方において、ホモ親和性およびヘテロ親和性データセットに効果的に使用できる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:52:03 GMT)
Co-Designing Binarized Transformer and Hardware Accelerator for Efficient End-to-End Edge Deployment [3.4]
トランスフォーマーモデルはAIタスクに革命をもたらしたが、その大きなサイズはリソース制約やレイテンシクリティカルなエッジデバイスへの実際のデプロイメントを妨げる。本稿では, アルゴリズム, ハードウェア, 共同最適化の3つの側面から, トランスフォーマーのエンドツーエンド配置を効率的に行うための設計手法を提案する。実験の結果,2.14-49.37倍のスループット向上と3.72-88.53倍のエネルギー効率を実現した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:36:10 GMT)
NudgeRank: Digital Algorithmic Nudging for Personalized Health [3.3]
NudgeRankは、人口規模でポジティブな健康行動を促進する革新的なデジタルアルゴリズムヌードシステムである。 NudgeRankは実運用で運用されており、パーソナライズされたコンテキスト対応のナッジを毎日11万人以上のケア受け手に届けている。厳格な評価は、日歩が6.17%増加し、運動時間が7.61%増加したことを含む、統計的に有意な健康改善を示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:56:42 GMT)
Continuous Management of Machine Learning-Based Application Behavior [3.3]
機械学習モデルの非機能特性は、監視、検証、維持されなければならない。 MLベースのアプリケーションの安定な非機能動作を保証することを目的としたマルチモデルアプローチを提案する。非機能的プロパティフェアネスに着目した実世界のシナリオで,我々のソリューションを実験的に評価した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:57:44 GMT)
Mask-Free Neuron Concept Annotation for Interpreting Neural Networks in Medical Domain [3.3]
Mask-free Medical Model Interpretation (MAMMI)は、新しい医療ニューロン概念アノテーション法である。視覚言語モデルを用いて,ニューロン概念アノテーションのためのピクセルレベルのマスクの必要性を緩和する。 NIH胸部X線で訓練したモデルを用いた実験により, MAMMIの有効性が検証された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:40:17 GMT)
Enhanced Safety in Autonomous Driving: Integrating Latent State Diffusion Model for End-to-End Navigation [3.3]
本研究は自動運転の制御最適化問題における安全性問題に対処する。本稿では,条件付きバリュー・アット・リスクに基づくソフトアクター批判を利用して,ポリシー最適化のための新しいモデルベースアプローチを提案する。本手法では, 安全探索を誘導する最悪のアクターを導入し, 予測不可能なシナリオにおいても, 安全要件の厳密な遵守を確保する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:07:34 GMT)
A2E: Attribute-based Anonymity-Enhanced Authentication for Accessing Driverless Taxi Service [3.2]
本稿では,A2E(Attribute-based Anonymity Enhanced)認証方式を提案する。セキュリティ面から、A2Eは属性検証可能性を持ち、再実行可能なシグネチャに基づいてユーザ属性クレデンシャルを設計することで達成される。さらに、A2Eは、リングシグネチャとシークレット共有を利用した分散型認証発行機構を設計し、匿名性を向上した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:22:26 GMT)
A Foundation Model for Brain Lesion Segmentation with Mixture of Modality Experts [3.2]
本稿では3次元脳病変分割のための普遍的基礎モデルを提案する。我々は,様々な画像モダリティに対応する複数のエキスパートネットワークを備えた,新しいMixture of Modality Experts (MoME) フレームワークを定式化する。我々のモデルは最先端のユニバーサルモデルより優れており、目に見えないデータセットに有望な一般化を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:59:11 GMT)
AdaptEval: Evaluating Large Language Models on Domain Adaptation for Text Summarization [3.1]
本研究では,多言語モデル(LLM)のドメイン適応能力について,各ドメイン間の要約タスクで評価する。本稿では、最初のドメイン適応評価スイートであるAdaptEvalを紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:50:39 GMT)
A replica analysis of under-bagging [3.1]
Under-bagging (UB) は、不均衡なデータに基づいて分類器を訓練するための一般的なアンサンブル学習手法である。アンダーサンプリングによる試料径の減少による分散の増大を抑えるためにバッジを用いることは自然なアプローチである。近年、一般化線形モデルでは、クラス不均衡構造を考慮しない単純バッグングとリッジ正則化が同じ結果をもたらすことが指摘されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:19:07 GMT)
Frequentist Guarantees of Distributed (Non)-Bayesian Inference [3.1]
本稿では,分散(非)ベイズ推論問題に対する後続一貫性,正規性,後続収縮率などの頻繁な特性について述べる。この結果から,分散ベイズ推定はパラメトリックな効率を保っていることがわかった。解析結果を時間変化グラフに拡張し,指数関数型ファミリーモデル,分散ロジスティック回帰モデル,分散検出モデルに適用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:57:49 GMT)
Learning telic-controllable state representations [3.1]
本稿では,有界エージェントにおける状態表現学習のための新しい計算フレームワークを提案する。我々の研究は、自然エージェントと人工エージェントの目標指向状態表現学習に関する統一的な理論的視点を推し進めている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:20:17 GMT)
Characteristic Learning for Provable One Step Generation [3.0]
本稿では,GAN(Generative Adversarial Networks)におけるサンプリング効率とフローベースモデルの安定した性能を組み合わせた一段階生成モデルを提案する。我々のモデルは、確率密度輸送を通常の微分方程式(ODE)で記述できる特性によって駆動される。 2-ワッサーシュタイン距離における特性発生器の非漸近収束速度を確立するために,速度マッチング,オイラー離散化,特性適合の誤差を解析した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:41:53 GMT)
Spatial Coherence Loss: All Objects Matter in Salient and Camouflaged Object Detection [3.0]
正確な意味分析を行うには、学習のどの段階でも現れる全てのオブジェクトレベルの予測を学習する必要がある。本稿では,隣接画素間の相互応答を広範に使用する単一応答損失関数に組み込んだ新しい損失関数である空間コヒーレンス損失(SCLoss)を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:23:30 GMT)
Estimating Agreement by Chance for Sequence Annotation [3.0]
本稿では,シーケンスアノテーションタスクにおける確率一致を推定する基礎となるランダムアノテーションを生成するための新しいモデルを提案する。我々は,各注釈付きテキストセグメントの確率的位置の計算と,それに続く確率的一致推定を可能にするために,分布の分析形式をうまく導出する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:32:47 GMT)
On the Need for Configurable Travel Recommender Systems: A Systematic Mapping Study [3.0]
再利用の最小化と市場投入のスピードアップを促進する設定アプローチで開発者をサポートするのではなく、さまざまなコンテキストに対して、スクラッチからTRSを構築する傾向があります。分析の結果,運用状況と密接な関係を持つTLSの開発において,TLSプロバイダを支援する構成サポートが欠如していることが明らかになった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:33:59 GMT)
Hybrid Deep Learning Framework for Enhanced Melanoma Detection [3.0]
本研究の目的は, メラノーマ検出の精度と効率を, 革新的なハイブリッドアプローチにより向上させることである。我々は、HAM10000データセットを使用して、U-Netモデルを綿密に訓練し、癌領域を正確に分類することができる。我々はISIC 2020データセットを用いてEfficientNetモデルをトレーニングし、皮膚がんのバイナリ分類に最適化する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:58:47 GMT)
CCVA-FL: Cross-Client Variations Adaptive Federated Learning for Medical Imaging [3.0]
Federated Learning(FL)は、分散データ上でモデルをトレーニングするためのプライバシ保護アプローチを提供する。 Cross-Client Variations Adaptive Federated Learning (CCVA-FL)は、イメージを共通の特徴空間に変換することで、クロスクライアントのバリエーションを最小限にすることを目的としている。その結果、CCVA-FLはプライバシーを損なうことなく、クライアント間でのデータ分散の違いを効果的に解決することで、Vanilla Federated Averagingよりも優れていることが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:18:20 GMT)
A Meta-Learning Approach for Multi-Objective Reinforcement Learning in Sustainable Home Environments [3.0]
我々はメタラーニングパラダイムを用いて最先端のMORLアルゴリズムを拡張した。環境環境変化を検出するために,自動エンコーダ(AE)に基づく教師なしの手法を用いる。本研究は,住宅機器スケジューリングにおけるMORLの適用性を評価し,エネルギー管理におけるメタラーニングの有効性を裏付けるものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:23:20 GMT)
Beyond Incompatibility: Trade-offs between Mutually Exclusive Fairness Criteria in Machine Learning and Law [3.0]
本稿では,3つのフェアネス基準を連続的に補間する新しいアルゴリズム(FAir Interpolation Method: FAIM)を提案する。我々は,合成データ,CompASデータセット,電子商取引部門による新たな実世界のデータセットに適用した場合のアルゴリズムの有効性を実証する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:29:01 GMT)
Data selection method for assessment of autonomous vehicles [2.9]
本稿では,自律走行車の評価を行う上で,実用的で柔軟かつ効率的なデータ選択手法を提案する。我々の考えは、選択したデータのメタデータ分布と予め定義されたメタデータ分布との類似性を最適化することである。大規模なデータセットBDD100Kの実験では,提案手法が効率的にデータ選択タスクを実行できることが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:35:38 GMT)
GraphFM: A Scalable Framework for Multi-Graph Pretraining [2.9]
本稿では,さまざまな領域のグラフデータセットにまたがるノード分類タスクに適した,スケーラブルなマルチグラフ・マルチタスク事前学習手法を提案する。我々は,740万以上のノードと1億1900万のエッジからなる152のグラフデータセットのモデルをトレーニングすることで,このアプローチの有効性を実証する。以上の結果から,多種多様な実・合成グラフの事前学習により適応性と安定性が向上し,最先端のスペシャリストモデルと競合する結果が得られた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:51:43 GMT)
Click-Gaussian: Interactive Segmentation to Any 3D Gaussians [2.8]
Click-Gaussian は2段階の粒度の区別可能な特徴場を学習する。私たちのメソッドは、従来のメソッドの15～130倍の速さで、1クリックあたり10ミリ秒で動作します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:49:27 GMT)
Reasoning with Large Language Models, a Survey [2.8]
本稿では,LSMによるプロンプトベース推論の急速に進展する分野について概説する。我々の分類学は、多段階推論の生成、評価、制御の異なる方法を特定します。我々は, 自己改善, 自己回帰, 推論過程のいくつかのメタ能力が, プロンプトの司法的利用によって可能であることを発見した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:49:35 GMT)
Zero-Shot Adaptation for Approximate Posterior Sampling of Diffusion Models in Inverse Problems [2.8]
画像の逆問題に対するゼロショット近似後方サンプリング(ZAPS)を提案する。 ZAPSはサンプリングステップの数を修正し、物理学誘導損失関数によるゼロショットトレーニングを使用して、不規則な時間ステップ毎にログライクな重みを学習する。以上の結果から,ZAPSは推定時間を短縮し,不規則な騒音スケジュールに頑健性を提供し,再現性の向上を図っている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:09:37 GMT)
Imitation of human motion achieves natural head movements for humanoid robots in an active-speaker detection task [2.8]
頭の動きは社会的人間と人間の相互作用に不可欠である。そこで本研究では,直型ヒューマノイドロボットの頭部運動生成に生成型AIパイプラインを用いた。その結果,会話中の話者を積極的に追跡しながら,人間の頭部の動きを自然に模倣することに成功した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:08:40 GMT)
Quantum Coherence, Dynamics and Their connections [2.8]
時間に依存しないハミルトニアンにとって、平均的な進化速度を決定するのは量子コヒーレンスであることを示す。時間依存ハミルトニアンに対しては、ある量子ビットの進化における距離の上限を1つ与える。一般量子系では、量子コヒーレンスと量子力学の関係についても論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:21:59 GMT)
A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting [2.8]
この研究は安定拡散の上に構築され、汎視的セグメンテーションに対する潜時拡散アプローチを提案する。トレーニングは,(1)部分分割マスクを潜伏空間に投影する浅層オートエンコーダの訓練,(2)潜伏空間における画像条件付きサンプリングを可能にする拡散モデルの訓練,の2段階からなる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:52:54 GMT)
Navigating the swarm: Deep neural networks command emergent behaviours [2.7]
エージェント間相互作用ルールを微調整することにより,グローバルなパターンを意図した集合行動の協調構造を生成することができることを示す。私たちの戦略では、望ましい構造を指示する相互作用ルールを見つけるために、ダイナミックスの法則に従うディープニューラルネットワークを採用しています。本研究は, ロボット群操作, アクティブ物質組織, 生体システムにおける不明瞭な相互作用規則の解明における新たな応用の道を開くものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:46:11 GMT)
How Personality Traits Influence Negotiation Outcomes? A Simulation based on Large Language Models [2.7]
本稿では,Large Language Model (LLM) エージェントに着目したシミュレーションフレームワークを提案する。実験結果から, LLMシミュレーションの行動傾向は, 人間の交渉で観察された行動パターンを再現できることが示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:52:51 GMT)
Quantum computation in fermionic thermal field theories [2.7]
量子アルゴリズムを用いてフェルミオンのみを含む熱場理論を研究する。 1+1次元のマヨラナフェルミオンの熱分布や熱場理論のエネルギー密度などの数値的な結果を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:18:54 GMT)
NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks [2.6]
この研究は、任意の整数のみのコナールニューラルネットワーク(CNN)を学習するための新しいフレームワークであるNITRO-Dを導入する。 NiTRO-Dは、量子化スキームを導入することなく整数のみのCNNのトレーニングを可能にする文献における最初のフレームワークである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:16:49 GMT)
ClaimCompare: A Data Pipeline for Evaluation of Novelty Destroying Patent Pairs [2.6]
我々は、IRおよびMLモデルのトレーニングに適したラベル付き特許請求データセットを生成するように設計された、新しいデータパイプラインであるCrimCompareを紹介する。私たちの知る限りでは、ClaymCompareは、特許データセットを破壊する新規性を複数生成できる最初のパイプラインです。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:38:45 GMT)
Learning secondary tool affordances of human partners using iCub robot's egocentric data [2.6]
我々は、人間のパートナーの二次ツールの余裕を学習する問題に対処する。我々は、iCubロボットを使用して、3台のカメラで人間のパートナーを観察し、4つの異なるツールを使用して20個のオブジェクトに対してアクションを実行する。以上の結果から,iCubロボットは深層学習アーキテクチャにより,セカンダリツールの価格を予測できることが示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:14:13 GMT)
Zero-shot Cross-Lingual Transfer for Synthetic Data Generation in Grammatical Error Detection [2.6]
様々な言語からのデータを用いてモデルを訓練し、他の言語で合成エラーを生成する。これらの合成誤差コーパスは、GEDモデルのトレーニングに使用される。このアプローチは、現在最先端のアノテーションのないGEDメソッドよりも優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:35:15 GMT)
BinaryAlign: Word Alignment as Binary Sequence Labeling [2.6]
本稿では,バイナリシーケンスラベリングに基づく単語アライメント手法であるBinaryAlignを提案する。非英語対におけるBinaryAlignの性能について検討する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:11:06 GMT)
Prioritized Semantic Learning for Zero-shot Instance Navigation [2.5]
我々はゼロショットのインスタンスナビゲーションについて研究し、エージェントはトレーニングにオブジェクトアノテーションを使わずに特定のオブジェクトにナビゲートする。本稿では,ナビゲーションエージェントのセマンティック理解能力を向上させるために,優先度付き意味学習(PSL)手法を提案する。我々のPSLエージェントは、0ショットのObjectNavにおいて、0ショットのObjectNavを66%上回り、新しいInstanceNavタスクよりも優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:13:07 GMT)
Towards Interpretable Visuo-Tactile Predictive Models for Soft Robot Interactions [2.4]
ロボットエージェントの現実の状況への統合は、知覚能力に依存している。我々は、周囲を探索するために、様々な感覚モダリティの融合の上に構築する。生の感覚モダリティに応用されたディープラーニングは、実行可能な選択肢を提供する。我々は、知覚モデルとその制御目的への含意の展望を掘り下げる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:46:04 GMT)
Variance Norms for Kernelized Anomaly Detection [2.4]
バナッハ空間上でのマハラノビス型異常検出の統一理論を提案する。半教師付き異常検出のためのカーネル化近辺マハラノビス距離の概念を導入する。 12個の実世界のデータセットに関する実証的研究において、核化された最も近いマハラノビス距離が従来の核化されたマハラノビス距離より優れていることを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:59:49 GMT)
Cross-lingual QA: A Key to Unlocking In-context Cross-lingual Performance [2.4]
クロスランガルQAは、質問と回答の部分のみを翻訳し、翻訳コストを削減できる言語間プロンプト手法である。 4つのタイプ的多言語ベンチマークの実験により、クロスランガルQAはモデルに効果的に刺激を与え、クロスランガルの知識を引き出すことを示した。本研究は,言語間実例を用いたオープンソースMLLMの高速化により,モデルスケールの増大に伴い,性能が向上することを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:18:48 GMT)
Diff-MTS: Temporal-Augmented Conditional Diffusion-based AIGC for Industrial Time Series Towards the Large Model Era [2.3]
本稿では,MTS生成のための時間拡張適応拡散モデルDiff-MTSを提案する。 MTSデータの複雑な時間的依存関係とダイナミックスをよりよく扱うことを目的としている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:38:40 GMT)
Towards a Benchmark for Causal Business Process Reasoning with LLMs [2.3]
大きな言語モデル(LLM)は、組織の効率向上やタスクの自動化にますます使われています。近年の取り組みは、推論、計画、意思決定といった活動にLLMを採用するよう拡張されている。本研究は, LLMの因果的・プロセス的視点を推論する能力を評価するため, ベンチマーク開発のための種子を植え付けるものである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:48:32 GMT)
Sharif-MGTD at SemEval-2024 Task 8: A Transformer-Based Approach to Detect Machine Generated Text [2.2]
MGTは自然言語処理において重要な研究領域となっている。本研究では,強力なニューラルアーキテクチャであるRoBERTaベーストランスを微調整し,MGT検出に対処する効果について検討する。提案システムでは,テストデータセットの78.9%の精度を達成し,参加者の57位に位置づけた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:33:01 GMT)
Fine-Tuning Medical Language Models for Enhanced Long-Contextual Understanding and Domain Expertise [2.2]
大規模言語モデル(LLM)は様々な専門分野に広く応用されている。特定のドメイン知識の改善にもかかわらず,長期理解における医学的LLMの性能は著しく低下している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:37:20 GMT)
Dynamical Quantum Phase Transition and Thermal Equilibrium in the Lattice Thirring Model [2.2]
臨界相と質量相の両方で平衡から切り離された格子チリングモデルの進化をシミュレートする。我々は、動的量子相転移が存在するために必要な初期状態のエネルギー密度の閾値を同定する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:51:01 GMT)
Mapping savannah woody vegetation at the species level with multispecral drone and hyperspectral EnMAP data [2.1]
本研究は南アフリカのサバンナの種レベルでの分画木質被覆(FWC)の正確なマッピングを目標としている。乾季EnMAP画像のFWCマッピングにおいて, 4つの機械学習回帰アルゴリズムを検証した。その結果,FWCを種レベルで正確にマッピングする手法の妥当性が示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:44:41 GMT)
Accounting for Work Zone Disruptions in Traffic Flow Forecasting [2.1]
我々は、畳み込みグラフニューラルネットワークアーキテクチャの上に構築し、新しい道路作業ゾーンのためのグラフ畳み込みモデルを示す。このモデルは、バージニア共和国のワークゾーンの存在下でのトラフィックを最小限に抑える2つのデータセットで評価される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:48:24 GMT)
Backpropagation through space, time, and the brain [2.1]
我々は、ニューロンの物理的、動的ネットワークにおける完全局所的時間的クレジット割り当てのための計算フレームワークであるGeneral Latent Equilibriumを紹介する。特に、GLEは樹状樹の形態を利用して、単一ニューロンのより複雑な情報保存と処理を可能にしている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:37:05 GMT)
VideoClusterNet: Self-Supervised and Adaptive Clustering For Videos [2.1]
Video Face Clusteringは、検出された顔のトラックを共通の顔認証でまとめることを目的としている。この問題は、ビデオフレームにまたがる特定の顔のポーズ、表情、外観、照明のバリエーションが多岐にわたるため、非常に難しい。本稿では,ジェネリック・フェイスIDモデルを,完全に自己管理された新しいビデオ・フェイス・トラックに適応させることを学習する,新しいビデオ・フェイス・クラスタリング手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:34:55 GMT)
Cryptocurrency Price Forecasting Using XGBoost Regressor and Technical Indicators [2.0]
本研究では,暗号通貨の価格を予測するための機械学習手法を提案する。我々は、XGBoost回帰モデルの訓練および供給のために、EMA(Exponential moving Avergence)やMACD( moving Avergence Divergence)といった重要な技術指標を活用している。モデルの性能を様々なシミュレーションにより評価し,有望な結果を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:41:27 GMT)
XEdgeAI: A Human-centered Industrial Inspection Framework with Data-centric Explainable Edge AI Approach [2.0]
本稿では,新しいXAI統合視覚品質検査フレームワークを提案する。我々のフレームワークはXAIとLarge Vision Language Modelを組み込んで人間中心の解釈可能性を提供する。このアプローチは、重要な産業アプリケーションに信頼性と解釈可能なAIツールを広く採用する道を開くものだ。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:30:24 GMT)
Analytical Performance Estimations for Quantum Repeater Network Scenarios [2.0]
量子リピータチェーンは将来の量子ネットワークのバックボーンを形成し、ネットワークノード間の絡み合いを分散する。量子リピータチェーンのダイナミクスをモデル化するためにマルコフ連鎖を用いることで、長期スループットとオンデマンドレイテンシの解析的推定を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:41:29 GMT)
Latency optimized Deep Neural Networks (DNNs): An Artificial Intelligence approach at the Edge using Multiprocessor System on Chip (MPSoC) [1.9]
モバイルデバイスにおけるエッジコンピューティング(Edge at Edge)は、この要件に対処するための最適化されたアプローチのひとつだ。本研究では,低レイテンシ・電力最適化型スマートモバイルシステムの実現の可能性と課題について考察する。組込みFPGAエッジデバイス上でのニューラルネットワーク(NN)の性能と実装可能性について論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:51:41 GMT)
Learning Global and Local Features of Power Load Series Through Transformer and 2D-CNN: An image-based Multi-step Forecasting Approach Incorporating Phase Space Reconstruction [1.9]
本研究では、PSRとニューラルネットワークを統合することで、新しいマルチステップ予測手法を提案する。 PSR-GALIENと呼ばれる新しいディープラーニングモデルは、エンドツーエンド処理のために設計されている。その結果、PSR-GALIENの予測性能は、最先端の6つのディープラーニングモデルと比較すると、これらのベースラインを一貫して上回っていることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:59:13 GMT)
Joint Data Inpainting and Graph Learning via Unrolled Neural Networks [1.9]
基礎となるグラフトポロジと欠測値の両方を推定するアルゴリズムを提案する。提案手法はグラフ学習とグラフ信号再構成アルゴリズムの両方に利用できる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:46:41 GMT)
LiteGPT: Large Vision-Language Model for Joint Chest X-ray Localization and Classification Task [1.9]
医用イメージングのための統合フレームワーク LiteGPT を提案する。複数の事前学習されたビジュアルエンコーダを利用して情報を強化し、視覚言語モデルの性能を向上させる。本研究は,医用画像における共同局所化と分類の新たな課題に視覚言語モデルを用いた最初の研究である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:19:02 GMT)
Overfitting In Contrastive Learning? [1.9]
オーバーフィッティング(Overfitting)は、モデルがトレーニングデータにあまりにも密接に適合し、結果として一般化が不十分な機械学習現象を記述している。オーバーフィッティングが実際に起こり、オーバーフィッティングのメカニズムが明らかになる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:20:00 GMT)
Decay-protected superconducting qubit with fast control enabled by integrated on-chip filters [1.9]
我々は、キュービット周波数で停止帯域を示すキュービットドライブのオンチップフィルタを導入する。ストップバンドで測定した緩和時間を最大200倍に改善した。 2次元量子プロセッサにおけるオンチップフィルタと効率的なサブハーモニック駆動の実証は、スケーラブルな量子ビットアーキテクチャへの道を開く。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:07:46 GMT)
Ensure Differential Privacy and Convergence Accuracy in Consensus Tracking and Aggregative Games with Coupling Constraints [1.9]
共有結合制約を持つ完全分散集約ゲームに対する差分プライバシに対処する。一般化ナッシュ平衡(GNE)探索機構と微分プライバシ雑音注入機構を共同設計することにより,最初のGNE探索アルゴリズムを提案する。また,高精度な追跡性能を維持しつつ,厳密なエプシロン差分プライバシーを実現するための新しいコンセンサス追跡アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:03:04 GMT)
Ascend-CC: Confidential Computing on Heterogeneous NPU for Emerging Generative AI Workloads [1.9]
クラウドワークロードは、大規模言語モデル(LLM)に基づいた生成AIを支配している GPU、NPU、TPUといった特殊なハードウェアアクセラレータは、汎用CPUよりも優れたパフォーマンスのため、AIの採用において重要な役割を果たす。 AIモデルとデータは、しばしば非常に敏感で、相互に不信な関係者から来ています。本稿では,ホストシステムへの信頼を必要としない離散NPUデバイスに基づく秘密計算アーキテクチャAscend-CCを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:17:28 GMT)
Frontend Diffusion: Exploring Intent-Based User Interfaces through Abstract-to-Detailed Task Transitions [1.8]
ユーザスケッチから高品質なWebサイトを生成するエンドツーエンドツールであるFrontend Diffusionを紹介した。複雑なタスクにおける人的介入やコミュニケーションコストを低減するために,タスク遷移の可能性を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:24:35 GMT)
Novel Hybrid Integrated Pix2Pix and WGAN Model with Gradient Penalty for Binary Images Denoising [1.8]
本稿では,GAN(Generative Adversarial Networks)の利点を活用した画像復号化手法を提案する。 Pix2PixモデルとWasserstein GAN(WGAN)とGradient Penalty(WGAN-GP)の要素を組み合わせたモデルを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:50:45 GMT)
VMAF Re-implementation on PyTorch: Some Experimental Results [1.8]
PyTorchフレームワークを用いたVMAFの実装を提案する。目的関数としてVMAFを使用する場合の計算勾配について検討し、この関数を用いたトレーニングが動作不良な勾配を生じさせないことを示す。結果として得られるフィルタは実装も容易であり、ビデオ圧縮改善のためのビデオ処理タスクにも適用できる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:03:50 GMT)
RIMformer: An End-to-End Transformer for FMCW Radar Interference Mitigation [1.8]
RIMformerと呼ばれる新しいFMCWレーダ干渉緩和法は、エンドツーエンドのTransformerベース構造を用いて提案される。このアーキテクチャは、時間領域IF信号をエンドツーエンドで処理するように設計されている。その結果,提案したRIMformerは干渉を効果的に軽減し,ターゲット信号の復元を可能にすることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:51:20 GMT)
Image Denoising Using the Geodesics' Gramian of the Manifold Underlying Patch-Space [1.8]
本稿では,正確な画像を生成することができる新しい,計算効率の良い画像復号法を提案する。画像の滑らか性を維持するため、画素ではなく画像から分割されたパッチを入力する。本稿では,この手法の性能をベンチマーク画像処理法に対して検証する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 23:12:45 GMT)
Federated Learning Forecasting for Strengthening Grid Reliability and Enabling Markets for Resilience [1.7]
分散エネルギー資源に富む将来の電力グリッドの信頼性とレジリエンスを高めるための包括的アプローチを提案する。分散方式では,フェデレーション学習に基づく攻撃検出と,地域電気市場による攻撃軽減手法を組み合わせた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:23:00 GMT)
Learning Network Representations with Disentangled Graph Auto-Encoder [1.7]
DGA(Disentangled Graph Auto-Encoder)とDVGA(Disentangled Variational Graph Auto-Encoder)を導入する。 DGAは、エンコーダとして機能するマルチチャネルメッセージパッシング層を備えた畳み込みネットワークである。 DVGAは非交叉表現の特徴を考慮に入れた因子的デコーダである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:07:44 GMT)
Investigating Imperceptibility of Adversarial Attacks on Tabular Data: An Empirical Analysis [1.7]
敵対的攻撃は、入力データに知覚不能な摂動を導入することによって、機械学習モデルが誤った予測を行う可能性がある。本研究は,表型データに対する敵攻撃の非受容性を評価するための特性セットを定義する。この評価は、特に近接性、感度、偏差に関して、攻撃の成功と不可避性の間のトレードオフを明らかにしている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:55:25 GMT)
Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints [1.6]
提案手法は,局所的・グローバルな経路計画タスクにおいて,既存の手法よりも優れていることを示す。提案手法は,提案手法が局所的・グローバルな経路計画タスクにおいて既存手法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:41:27 GMT)
LAB-Bench: Measuring Capabilities of Language Models for Biology Research [1.6]
言語エージェント生物学ベンチマーク(LAB-Bench)を紹介する。これは、AIシステムを評価するための2,400以上の複数の選択質問のデータセットである。また,本ベンチマークに対して,複数のフロンティア言語モデルの性能を測定し,人間の専門生物学研究者と比較して結果を報告する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:54:55 GMT)
COHO: Context-Sensitive City-Scale Hierarchical Urban Layout Generation [1.6]
都市規模の都市レイアウト生成のための新しいグラフベースのマスク付きオートエンコーダ(GMAE)を提案する。この方法は、属性付き建物、都市ブロック、コミュニティ、都市を統一的なグラフ構造に符号化する。提案手法は,米国330都市における異質な都市スタイルにおける良好な現実性,意味的整合性,正当性を実現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:49:53 GMT)
Better RAG using Relevant Information Gain [1.6]
大きな言語モデル(LLM)のメモリを拡張する一般的な方法は、検索拡張生成(RAG)である。本稿では,検索結果の集合に対するクエリに関連する総情報の確率的尺度である,関連情報ゲインに基づく新しい単純な最適化指標を提案する。 RAGシステムの検索コンポーネントのドロップイン置換として使用すると、質問応答タスクにおける最先端のパフォーマンスが得られる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:09:21 GMT)
Hierarchical Multigrid Ansatz for Variational Quantum Algorithms [1.5]
量子コンピューティングは、基礎物理学を用いたスーパーコンピューティングを強化することを約束する。短期的には、この利点を達成するための最良の候補アルゴリズムは変分量子アルゴリズム(VQA)である。変動量子固有解法(VQE)に着目した新しいVQAアンサッツの設計と数値評価を行う。数値シミュレーションにより,ラプラシアン固有解器の解法品質において,マルチグリッドアンサッツが標準ハードウェア効率のアンサッツより優れていることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:13:03 GMT)
Walking through Hilbert Space with Quantum Computers [1.5]
このレビューは、計算化学の重要な領域における複雑なサンプリングタスクに取り組む量子アルゴリズムの最近の進歩を強調している。我々は、ハイブリッド量子古典から完全量子まで、幅広い量子アルゴリズムをレビューする。量子計算の優位性を達成するための可能性と課題について論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:43:44 GMT)
Tackling Oversmoothing in GNN via Graph Sparsification: A Truss-based Approach [1.5]
本稿では,グラフの高密度領域からエッジを抽出する新鮮で柔軟なトラスグラフスペーシフィケーションモデルを提案する。次に、GIN、SAGPool、GMT、DiffPool、MinCutPool、HGP-SL、DMonPool、AdamGNNといった最先端のベースラインGNNとプールモデルでスパーシフィケーションモデルを利用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:21:36 GMT)
Hydra: Brokering Cloud and HPC Resources to Support the Execution of Heterogeneous Workloads at Scale [1.5]
Hydraは、商用プライベートクラウドとHPCプラットフォームからリソースを同時に取得できる、クラウド内のHPCブローカシステムである。商用プライベートクラウドとHPCプラットフォームからリソースを同時取得可能な,クラウド内HPCブローカシステムであるHydraを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:46 GMT)
Improved particle-flow event reconstruction with scalable neural networks for current and future particle detectors [1.5]
電子-陽電子衝突における事象再構成のためのスケーラブルな機械学習モデルについて, フル検出器シミュレーションに基づく検討を行った。グラフニューラルネットワークとカーネルベースのトランスフォーマーを比較し、現実的な再構築を実現しつつ、操作を回避できることを実証する。最良のグラフニューラルネットワークモデルでは、ルールベースのアルゴリズムと比較して、ジェット横運動量分解能が最大50%向上している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:57:44 GMT)
Evaluating Task-Oriented Dialogue Consistency through Constraint Satisfaction [1.4]
制約満足度問題(CSP)としての対話整合性の概念化を提案する。我々は,LLMで再語彙化された対話における不整合を検出するために,CSPソルバを利用する。我々は、CSPがコンポーネントパイプラインに基づくアプローチでは考慮されていない対話一貫性のコア特性を捉えていると論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:38:41 GMT)
LoRA-PT: Low-Rank Adapting UNETR for Hippocampus Segmentation Using Principal Tensor Singular Values and Vectors [1.4]
海馬は様々な精神疾患に関連する重要な脳構造である。深層学習に基づく手法は海馬のセグメンテーションに大きな進歩をもたらした。そこで本研究では,LoRA-PTと呼ばれるパラメータ効率の高いファインチューニング手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:40:57 GMT)
Strategizing against Q-learners: A Control-theoretical Approach [1.4]
敵のQ-ラーニングアルゴリズムを知っていれば、いかに戦略的に洗練されたエージェントが素質のQ-ラーナーを活用できるかを定量化する。連続状態空間に取り組むための量子化に基づく近似スキームを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:13:25 GMT)
Thorns and Algorithms: Navigating Generative AI Challenges Inspired by Giraffes and Acacias [1.4]
人間とジェネレーティブAI(Gen AI)の相互作用は、アフリカサバンナのキリンとアカシアのダイナミックな関係と、洞察に富んでいる。この論文は、まだ環境をマスターしている若いキリンのように、人間がGen AIに適応し形作りする初期段階にあることを探求する。偏見、誤報、プライバシー侵害などのリスクを軽減するために、人間が開発し、精錬している戦略を掘り下げる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:53:25 GMT)
TM-PATHVQA:90000+ Textless Multilingual Questions for Medical Visual Question Answering [1.3]
本研究は,テキストレス多言語病理VQAデータセットを導入することで,音声ベースのVQAシステムを実現する。このデータセットは5,004の病理画像と70時間の音声に基づいて、98,397の多言語音声質問と回答からなる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:54:45 GMT)
Generally-Occurring Model Change for Robust Counterfactual Explanations [1.3]
モデル変更に対する対実的説明生成アルゴリズムの堅牢性について検討する。本稿では,まず自然発生モデル変化の概念を一般化する。また、モデルパラメータ変化のより一般的な概念である、モデル変化の一般発生についても提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:44:00 GMT)
GPT Assisted Annotation of Rhetorical and Linguistic Features for Interpretable Propaganda Technique Detection in News Text [1.3]
本研究は, 説得の言語に関する文献で同定された22の修辞的, 言語学的特徴を分類した。 WebアプリケーションであるRhetAnnは、そうでなければかなりの精神的な努力を最小限に抑えるように設計されている。注釈付きデータの小さなセットは、生成的大言語モデル(LLM)であるGPT-3.5を微調整し、残りのデータに注釈を付けた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:15:39 GMT)
AI and the Iterable Epistopics of Risk [1.3]
AIが社会に提示するリスクは、一般的な計算によって管理可能であると広く理解されている。本稿では、規制当局、開発者、サイバーセキュリティの専門家によるリスクの把握と管理について詳述する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:43:18 GMT)
Impossibility of latent inner product recovery via rate distortion [1.2]
d gtrsim n h(p)$ ここで、$h(p)$ が二元エントロピー函数であれば、内部積を回復することは不可能である。この証明は、確立された速度歪曲理論に従う。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:23:29 GMT)
Improved Quantum Power Method and Numerical Integration Using Quantum Singular Value Transformation [1.1]
最初に、QSVTフレームワークが最近導入された量子パワー法を加速できることを示し、実行時間を大幅に改善した。矩形法などいくつかの基本数値積分手法をQSVTフレームワークに組み込んだ結果,グリッドのサイズや点数に対する高速化が得られた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:11:35 GMT)
ImPORTance -- Machine Learning-Driven Analysis of Global Port Significance and Network Dynamics for Improved Operational Efficiency [1.0]
本研究は, 船舶の移動によって形成される接続網を解析し, 重要港で共有される共通特性について検討することを目的とする。本研究の成果は, 産業における港湾開発, 資源配分, インフラ計画に関連する意思決定プロセスについて報告することを目的としている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:58:04 GMT)
Not Another Imputation Method: A Transformer-based Model for Missing Values in Tabular Datasets [1.0]
NAIM(Not Another Imputation Method)は、従来の計算手法を使わずに欠落した値を扱うために設計されたトランスフォーマーベースのモデルである。 NAIMは機能固有の埋め込みと、利用可能なデータから効果的に学習するマスク付き自己認識機構を採用している。 5つの公開データセット上でNAIMを広範囲に評価した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:43:47 GMT)
Revisiting Supervision for Continual Representation Learning [1.0]
本研究では,連続表現学習における教師の役割を再検討する。多層パーセプトロンヘッドで強化された教師付きモデルは、連続表現学習において自己教師付きモデルより優れていることを示す。このことは、連続学習における一連のタスクにまたがる特徴伝達可能性を形成する上で、多層パーセプトロンプロジェクタの重要性を強調している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:37:42 GMT)
What Makes a Meme a Meme? Identifying Memes for Memetics-Aware Dataset Creation [0.9]
マルチモーダルインターネットミームは現在、オンライン談話におけるユビキタスなフィクスチャとなっている。ミームはミームを模倣してシンボルに変換する過程である。我々は,ミームと非ミームコンテンツとを識別するミーム識別プロトコルを開発した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:48:36 GMT)
Monocular pose estimation of articulated surgical instruments in open surgery [0.9]
本研究は,開腹手術における手術器具の単眼6Dポーズ推定への新たなアプローチとして,物体調音,対称性,注釈付き実世界のデータの欠如といった課題に対処する。提案手法は,(1)手術器具の3次元モデリングと調音リギングを用いた合成データ生成,(2)ポーズ推定とハイブリッドな幾何学的融合戦略を組み合わせたポーズ推定フレームワーク,(3)自動生成擬似ラベルを用いた実ビデオデータへのドメイン適応を用いた,合成データと実際の注釈データの両方を利用したトレーニング戦略,の3つの構成要素から構成される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:47:35 GMT)
Pseudorandom density matrices [0.8]
Pseudorandom state (PRS) は、任意の効率的な量子アルゴリズムによってハールランダム状態と区別できない状態アンサンブルである。一般化されたヒルベルト・シュミットのアンサンブルと計算的に区別できない$n$-qubit状態のアンサンブルであるPRDMを導入する。 m=omega(log n)$のPRDMは、ユニタリノイズチャネルと最近導入された$mathsfPostBQP$攻撃に対して堅牢である。また、効率よくハールランダム状態と区別できないPRSのノイズロバストな概念である、メモリレスPSSも導入する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:14:58 GMT)
Advantages of multistage quantum walks over QAOA [0.8]
量子近似最適化アルゴリズム(QAOA)と多段量子ウォーク(MSQW)を比較する。等価資源を用いて,MSQWがQAOAより優れていることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:35:53 GMT)
Particle Multi-Axis Transformer for Jet Tagging [0.8]
本稿では,新しいアーキテクチャであるParticle Multi-Axis transformer (ParMAT)を提案する。 ParMATは単一ユニット内の局所的およびグローバルな空間的相互作用を含み、様々な入力長を扱う能力を向上させる。 JETCLASSは10種類の粒子からなる1億基のジェットを含む,公開可能な大規模データセットである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:39:49 GMT)
Characterising transformations between quantum objects, 'completeness' of quantum properties, and transformations without a fixed causal order [0.8]
量子力学における重要な対象は、特定のアフィン/線型空間の間の線型写像である。直接的で使いやすい方法でこれらのプロパティを推論するフレームワークを提供する。我々は、高次量子変換において、不定因性の存在が自然に出現する方法について論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:49:03 GMT)
Detection of Malaria Vector Breeding Habitats using Topographic Models [0.8]
本研究では,地球規模で利用可能なDEMデータに基づく実用的な地形モデルを提案する。ガーナのオプアシ地域を調査し,様々な地形特性が異なる水域に与える影響について検討した。我々の最良モデルは、小水位検出に地形変数を用いた以前の試みよりも優れていた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:05:39 GMT)
L2AI: lightweight three-factor authentication and authorization in IOMT blockchain-based environment [0.7]
医療用インターネット・オブ・モノ(IoMT)は、個人が最小限のインタラクションで重要なアクティビティをリモートで管理することを可能にする。本稿では,ブロックチェーン環境におけるリアルタイムデータにアクセスするための,軽量な多要素認証と匿名ユーザ認証方式を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:33:46 GMT)
GenMix: Combining Generative and Mixture Data Augmentation for Medical Image Classification [0.7]
我々はGenMixと呼ばれる新しいデータ拡張手法を提案する。両方の手法の強みを利用するために、生成的アプローチと混合的アプローチを組み合わせる。我々はGenMixが様々な生成モデルの性能を向上させることを実証した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:07:08 GMT)
Rethinking Learned Image Compression: Context is All You Need [0.6]
本稿では,エンコーダ,デコーダ,コンテキストモデルのスケーリングパラメータの有効性を解析する。文脈を最適化することにより,PSNRの達成率と最先端性能をさらに向上させ,VVCよりもBD-RATEの方が14.39%向上したことを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:50:10 GMT)
CCoE: A Compact LLM with Collaboration of Experts [0.6]
我々は、強力なドメインエキスパートを簡単に結合して大きな言語モデル(LLM)に融合するフレームワークを提案する。コード、法、テキストから数学、医学の分野の専門家5人から始めます。その結果、私たちのCCoEフレームワークは、異なるドメインのオリジナルベースモデルにおいて、トレーニングのリソースが少ないだけでなく、推論も簡単に、効率的に10%-20%パフォーマンスを向上できます。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:03:58 GMT)
Flatfish Disease Detection Based on Part Segmentation Approach and Disease Image Generation [0.6]
ヒラメは、世界中で大量に消費される主要な養殖種である。密集した農業環境のため、ヒラメは怪我や病気の影響を受けやすい。本研究では, 魚の病気画像を生成的対向ネットワークと画像調和法を用いて拡張する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 03:32:10 GMT)
Schema Matching with Large Language Models: an Experimental Study [0.6]
本稿では,市販のLarge Language Models (LLM) を用いてスキーママッチングを行う。本研究の目的は,2つの関係スキーマの要素間の意味的対応を名前と記述のみを用いて識別することである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:33:00 GMT)
MaskedHLS: Domain-Specific High-Level Synthesis of Masked Cryptographic Designs [0.6]
本稿では,PSCA保護マスクハードウェア実装に適したドメイン固有HLS手法を提案する。レジはグリッチ・ロバスト・マスキング・ガジェットが必要とする特定の場所に配置され、セキュアなRTLとなる。 PreSENT CipherのS-boxとAES CanrightのS-boxを4つの最先端ガジェットで覆った実験の結果、MaskedHLSはレジスタが73.9%減少し、レイテンシが45.7%低下していることがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:57:15 GMT)
Theoretical Insights into CycleGAN: Analyzing Approximation and Estimation Errors in Unpaired Data Generation [0.6]
我々は、CycleGANと呼ばれる未ペアデータ生成モデルの過大なリスクを分析することに重点を置いている。古典的なGANとは異なり、CycleGANは2つの障害のない分布間でデータを変換するだけでなく、マッピングの一貫性を保証する。モデルアーキテクチャとトレーニング手順の両方の影響を考慮すると、リスクは近似誤差と推定誤差の2つの項に分解される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:53:53 GMT)
Stabilizer ground states: theory, algorithms and applications [0.6]
我々は、パウリ・ハミルトニアン将軍の安定化基底状態を特定するための同値形式を発展させる。また、1次元局所ハミルトニアンの安定化基底状態を得るための正確で線形スケールのアルゴリズムも開発している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:02:44 GMT)
GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression [0.6]
GoldFinchはハイブリッドリニアアテンション/トランスフォーマーシーケンスモデルである。新しいGOLDトランスフォーマーを、拡張バージョンのFinchアーキテクチャの上に積み重ねています。我々は、Finch、Llama、GoldFinchアーキテクチャの1.5Bパラメータクラスモデルをトレーニングする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:00:00 GMT)
Coherently amplified ultrafast imaging using a free-electron interferometer [0.5]
自由電子ラムゼイイメージング(Free-Electron Ramsey Imaging, IFER)は、光誘起電子変調に基づく顕微鏡法である。六方晶窒化ホウ素膜から作製したマイクロドラムの時間・空間・位相分解測定を行った。実験では、従来の電子近接場イメージングと比較して、近接場信号の20倍のコヒーレント増幅を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:05:39 GMT)
Ancient Korean Archive Translation: Comparison Analysis on Statistical phrase alignment, LLM in-context learning, and inter-methodological approach [0.5]
本研究における提案手法の性能はBLEUスコア36.71で,SOLAR-10.7Bの文脈学習と既存のSeq2Seqモデルに勝っている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:26:21 GMT)
Coarse-grained dynamics in quantum many-body systems using the maximum entropy principle [0.5]
我々は、最大エントロピー原理に基づいて、微視的な状態を粗い粒状状態に割り当てる逆写像を構築する。我々は、スワップとコントロールノーゲートを持つ2量子システムと、Isingスピンチェーンまたはオールツーオールインタラクションで構成される$n$量子システムについて検討する。これらの力学は非線型性や非マルコビアン性のような非定型的な量子挙動を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:11:14 GMT)
QOG:Question and Options Generation based on Language Model [0.4]
質問-オプション生成(QOG)は、与えられたコンテキストの一連の質問-オプションペアを生成するタスクである。微調整シーケンス・ツー・シーケンス言語モデル(LM)に基づく3つの異なる手法を用いてQOGモデルを開発する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:12:03 GMT)
Enhancing TinyML Security: Study of Adversarial Attack Transferability [0.4]
この研究は、リソース制約の組込みハードウェア上でAIモデルの敵対的脆弱性を掘り下げるものである。以上の結果から,強力なホストマシンからの敵攻撃は,ESP32やRaspberry Piなど,より小型で安全性の低いデバイスに転送される可能性が示唆された。このことは、敵対的攻撃が小さなデバイスに拡張され、脆弱性が強調され、TinyMLデプロイメントにおける強化されたセキュリティ対策の必要性を強調していることを示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:55:25 GMT)
An Explainable Deep Learning-Based Method For Schizophrenia Diagnosis Using Generative Data-Augmentation [0.3]
脳波記録を用いた統合失調症の自動診断にディープラーニングを用いた手法を応用した。このアプローチは、診断の精度を高める強力な手法である生成データ拡張を利用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:51:24 GMT)
An AI System for Continuous Knee Osteoarthritis Severity Grading Using Self-Supervised Anomaly Detection with Limited Data [0.3]
本研究は膝OAの自動連続グルーピングのための3段階的アプローチを提案する。正常度の中心までの距離に基づいて、健康な膝X線の堅牢な表現と疾患の重症度を学ぶ。提案手法は,OA検出率において最大24%のマージンで既存の技術よりも優れており,疾患重症度スコアはKellgren-Lawrenceグレーティングシステムと人間専門家の成績と同等のレベルで相関している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:37:33 GMT)
Genomic Language Models: Opportunities and Challenges [0.3]
ゲノム言語モデル(gLM)は、ゲノムの理解を著しく前進させる可能性があり、様々なスケールのDNA要素が相互作用して複雑な機能を引き起こす。本稿では、フィットネス予測、シーケンス設計、伝達学習など、gLMの重要応用を強調して、この可能性を実証する。本稿では,gLMの開発と評価について論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:57:35 GMT)
Global Optimisation of Black-Box Functions with Generative Models in the Wasserstein Space [0.3]
ブラックボックスシミュレータの最適化はシミュレータや高次元では困難である。我々は、パラメータ空間全体のブラックボックス応答をモデル化するために、深い生成的サロゲートアプローチを用いる。次に、この知識を活用して、ワッサーシュタイン距離に基づいて提案された不確実性を推定する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:09:47 GMT)
Self Attention with Temporal Prior: Can We Learn More from Arrow of Time? [0.3]
本稿では,注目層がデータセットの短期的時間バイアスをよりよく符号化できる簡易かつ効率的な手法を提案する。本実験は,ほとんどのタスクやデータセットにおいて,最高の性能を示すモデルと比較して,例外的な分類結果を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:09:08 GMT)
Simplifying the Theory on Over-Smoothing [0.3]
グラフの畳み込みは過剰な平滑化を引き起こす。本稿では,過度な平滑化がパワーの特殊な場合であることを示すことによって,これらの方向を整列させようとする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:00:42 GMT)
Cross-Modal Augmentation for Few-Shot Multimodal Fake News Detection [0.2]
フェイクニュースを早期に検出するためには、ほとんどショットラーニングが重要である。本稿では,一様特徴を用いたマルチモーダル特徴を付加したマルチモーダルフェイクニュース検出モデルを提案する。提案したCMAは3つのベンチマークデータセット上でSOTA結果を達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:32:11 GMT)
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors [0.2]
Vibravox corpusには38時間の音声サンプルと188人の参加者が異なる音環境下で記録した生理的音が含まれている。音声認識や話者検証など,様々な音声関連課題について一連の実験を行った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:16:10 GMT)
Large Visual-Language Models Are Also Good Classifiers: A Study of In-Context Multimodal Fake News Detection [0.2]
本稿ではまず,CLIPモデルと比較し,LVLMとGPT4VのFND特性について検討する。次に,標準文脈学習(ICL)をLVLMと統合し,FND性能の向上に言及する。 textbfIn-context textbfMultimodal textbfFake textbfNews textbfD
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:28:23 GMT)
Improve Virational Quantum Eigensolver by Many-Body Localization [0.2]
多体局所花束系は熱化を回避している。本研究では,パラメータ更新のための勾配のばらつきについて検討した。我々は'many-body Localization ansatz'と呼ばれる新しいタイプの変分アンザッツを設計した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:49:40 GMT)
Probing the quantum nature of gravity using a Bose-Einstein condensate [0.1]
ボース・アインシュタイン凝縮体を用いてグラビトンによる騒音の影響について検討した。ボース=アインシュタインが1つのモードで凝縮すると、振幅測定における不確実性の平方の期待値の低い境界は無限にはならない。重力波によって誘導されるノイズのため、ボース・アインシュタイン凝縮体を用いて重力波を検出できない測定時間の最小値が存在する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:41:47 GMT)
The Future of Data Science Education [0.1]
バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。本稿では、モデルの中核となる特徴を説明し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:11:54 GMT)
Gaussian Splatting LK [0.1]
本稿では,動的ガウススティングフレームワークにおけるネイティブワープフィールドの正規化の可能性について検討する。フォワードワープフィールドネットワークに固有の知識を利用して解析速度場を導出できることが示される。このルーカス・カナーデ型解析正規化により,高ダイナミックなシーンを再構成する際の優れた性能を実現することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:50:43 GMT)
Mask-guided cross-image attention for zero-shot in-silico histopathologic image generation with a diffusion model [0.1]
拡散モデルは、シリコン内画像を生成する最先端のソリューションである。自然画像の出現伝達拡散モデルが設計されている。計算病理学、特に腫瘍学では、画像内のどのオブジェクトを前景と背景に分類すべきかを簡単に定義することはできない。我々は,クラス固有のAdaIN特徴量マッチングを交互に行うために,外観伝達指導を変更することで,拡散安定画像への外観伝達モデルの適用性に寄与する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:36:26 GMT)
Whitening Not Recommended for Classification Tasks in LLMs [0.1]
ホワイトニングは、Large Language Models (LLMs) から得られる埋め込み品質を改善する効果的な操作であると主張されている。特に、ホワイトニングは分類タスクの埋め込みを退化させる。我々の研究の副産物は、SentEval+と呼ばれるLCMの組込み評価プラットフォームである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:48:30 GMT)
Statistical Reachability Analysis of Stochastic Cyber-Physical Systems under Distribution Shift [0.1]
到達可能性分析は、サイバー物理システムの安全性を保証する一般的な方法である。本稿では,力学の記号的記述を持たないSCPSに対して,到達可能性解析を行う際の問題点について検討する。本稿では,このしきい値よりも小さい確率で,展開中の到達可能な状態がこのセットに存在することを保証する統計的到達可能性解析手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:18:41 GMT)
Reliable Reasoning Beyond Natural Language [0.0]
大きな言語モデル(LLM)は、しばしば、確実に柔軟に推論する能力の限界を示す。本稿では,問題文から全ての関連情報を論理コード文として抽出し,エンコードする手法を提案する。次に、論理型プログラミング言語(Prolog)を用いて、明示的な推論の反復的な計算を行う。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:34:18 GMT)
Semi-Supervised Generative Models for Disease Trajectories: A Case Study on Systemic Sclerosis [0.0]
複雑な疾患の軌跡をモデル化し, 全体解析するために, 潜時過程を用いた深部生成手法を提案する。全身性硬化症の特徴の医学的定義と生成的アプローチを組み合わせることで,新たな疾患の発見が容易になる。本研究は, SSc患者軌跡を新たなサブタイプに分類するなど, さらにデータ分析や臨床仮説の検証に, 学習時潜伏過程を活用できることを示唆する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:45:27 GMT)
EGIC: Enhanced Low-Bit-Rate Generative Image Compression Guided by Semantic Segmentation [0.0]
EGICは、単一のモデルから歪み知覚曲線を効率的にトラバースできる拡張生成画像圧縮法である。 EGICは実装が簡単で、非常に軽量であり、優れた特性を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:34:05 GMT)
Approximate inverse measurement channel for shallow shadows [0.0]
古典的な影は、多体量子システムを探索するための多用途ツールである。無限深度逆チャネルを有限深度古典影に適用する簡単な近似後処理方式を提案する。我々の研究は、浅い影を大きなシステムサイズに拡張し、一般的な回路接続を可能にした。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:02:25 GMT)
Violation of the Leggett-Garg Inequality for Dynamics of a Bose-Einstein Condensate in a Double-Well Potential [0.0]
二重井戸電位におけるボソン系のレゲット・ガルグ不等式(LGI)の違反について検討した。我々の分析では、LGIはジョゼフソンの振動によって侵害されているが、強い結合状態では非侵害であることが明らかとなった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:26:28 GMT)
Vectoring Languages [0.0]
本稿では,言語モデルの背後にあるメカニズムをよく反映した,新しい言語構造を提案する。線型代数の類似は、この観点の基礎を強化するために適応される。この観点と現在の言語モデルの設計哲学の違いについて論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:25:55 GMT)
V2X-M2C: Efficient Multi-Module Collaborative Perception with Two Connections [0.0]
複数モジュールからなる協調認識モデル $textbfV2X-M2C$ を導入する。実験により、V2X-M2Cは最先端の知覚性能を達成することが示された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:51:52 GMT)
Unraveling Rodeo Algorithm Through the Zeeman Model [0.0]
任意の初期状態を考慮したハミルトニアン一般に対する固有状態と固有値スペクトルを決定するために、ロデオアルゴリズムを解く。我々はPennylaneとQiskitのプラットフォームリソースを利用して、ハミルトンが1スピンと2スピンのゼーマンモデルによって記述されるシナリオを分析する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 01:29:25 GMT)
Universal neural network potentials as descriptors: Towards scalable chemical property prediction using quantum and classical computers [0.0]
本稿では,化学特性予測のための汎用記述子として,普遍的ニューラルネットワークポテンシャルの中間情報を利用する汎用的アプローチを提案する。本稿では,M3GNet や MACE などのグラフニューラルネットワークを用いた伝達学習が,NMR の化学シフトを予測するための最先端手法に匹敵する精度を実現することを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:17:14 GMT)
Undergraduate setup for measuring the Bell inequalities and performing Quantum State Tomography [0.0]
提案されたセットアップは多用途で費用対効果があり、複数の教室操作モードが可能である。実験の結果、光子の量子状態の操作が成功し、高忠実な絡み合った状態が達成された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:22:30 GMT)
Transforming Agency. On the mode of existence of Large Language Models [0.0]
本稿では,ChatGPTのような大規模言語モデル(LLM)のオントロジ的特徴について検討する。また,ChatGPTは,言語オートマトンやインターロケータ,言語オートマトンとして特徴付けられるべきだと論じる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:53:15 GMT)
Towards consistency of rule-based explainer and black box model -- fusion of rule induction and XAI-based feature importance [0.0]
ルールベースのモデルは、人間の理解可能な表現、すなわち解釈可能な表現を提供する。このような説明の生成には、ルールベースモデルによるブラックボックスモデルの近似が含まれる。ルールベースモデルが近似したブラックボックスモデルと同じ方法で決定を行うかどうかは、まだ調査されていない。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:56:29 GMT)
The object detection method aids in image reconstruction evaluation and clinical interpretation of meniscal abnormalities [0.0]
本研究では,ディープラーニング(DL)画像再構成の品質と異常検出性能の関係について検討した。再建画像における半月面異常の解釈を強化するための人工知能アシスタントの有効性を評価する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:25:28 GMT)
The Structure of the Majorana Clifford Group [0.0]
量子情報科学において、クリフォード作用素と安定化符号は量子ビット(または量子ビット)系において中心的な役割を果たす決定的な役割はフェルミオンパリティ対称性 (fermion parity symmetric) によって演じられる。パリティ保存 fermionic Cliffords の部分群は二進体 $mathbbF$ 上の群で表現できることを証明し、演算子をブレイディングして生成し、任意の(偶数の)マヨラナ安定化符号を構成する方法を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:20:14 GMT)
The Slow Growth of Entanglement in Long-range Interacting Spins Chains due to Destructive Interference between quasi-Particles [0.0]
本稿では,低温におけるハイゼンベルクスピン鎖の機構を理論的に明らかにする。この機構は、有効光円錐の外側の準粒子間の破壊的干渉に起因する。我々は、破壊干渉効果の直接の顕在化として、捕捉されたイオンの鎖で実験的に観察可能であることを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:59:19 GMT)
The IoT Breaches your Household Again [0.0]
本稿は、一見無害なデバイスの脆弱性がユーザを重大なリスクに晒す方法を明らかにする。これらの発見が、同じIoTエコシステム内の他のスマートデバイス間で、部分的にも完全にも、どのように複製できるかを実証する。調査は、スマート電球(Tapo L530E, Tapo L510E V2, Tapo L630)、スマートプラグ(Tapo P100)、スマートカメラ(Tapo C200)を含むTp-Link Tapoの範囲に焦点を当てた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:30:37 GMT)
Teleportation of unknown qubit via Star type tripartite states [0.0]
プロトタイプの$W$ stateは標準的なテレポーテーションには役に立たないことが知られている。我々は、非プロトタイプの$W$状態の線型重ね合わせとスピンフルプ版を取り、$Star$クラスに属することを示した。チャネルとして使用するためには、真の三部体の絡み合いが必須ではないことが観察された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:56:25 GMT)
Superconducting surface trap chips for microwave-driven trapped ions [0.0]
マイクロ波駆動の捕捉されたイオンロジックゲートは、レーザーベースのロジック操作を超えて前進するための有望な道を提供する。本稿では, マイクロ波共振器と大電流容量を一体化した超伝導表面トラップチップを提案する。ゲートラビ周波数1kHzのサブミリワット外マイクロ波入力電力を実現できる電力効率の良い2ビットゲート方式を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:21:33 GMT)
Stimulated absorption of single gravitons: First light on quantum gravity [0.0]
本研究では,巨大量子共振器と重力波との1つの重力子の交換を検出できることを示す。しかし、刺激された単一重力過程は重力の量子化を意味するのだろうか? 我々は量子論の初期の時代と歴史的に類似している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:23:12 GMT)
Stable infinite-temperature eigenstates in SU(2)-symmetric nonintegrable models [0.0]
非可積分な結合重み付きモデルのクラスには、多数のゼロエネルギー固有状態が与えられ、非アベリア内部対称性を持つ。少数のマグノンゼロエネルギー状態が正確な解析的記述を持ち、低絡み合う固定分離状態の基礎を構築することができることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:48:47 GMT)
Socioeconomic factors of national representation in the global film festival circuit: skewed toward the large and wealthy, but small countries can beat the odds [0.0]
本研究では,グローバル・フィルム・フェスティバル・サーキットにおいて,各国の経済・人口・地理的要因がどのように表現されるかを分析する。これは、いくつかのオープンアクセスデータセットの組み合わせに依存しており、10年間で世界中で約600のフェスティバルで2万本以上の映画を3万本以上上映している。フェスティバル画面は、確かに大富裕国の映画に支配されているが、その偏見は世界の人口と経済格差に完全に比例していないことが示されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:35:53 GMT)
Simple Fermionic backflow states via a systematically improvable tensor decomposition [0.0]
相関電子の波動関数に対して,機械学習のパラメータ化とテンソル階数分解の場を近づける効果的なアンザッツを提案する。 CANDECOMP/PARAFAC (CP) Tenor Factorization of a general backflow transformation in second Quantization for a simple, compact and systematically improvable Fermionic state。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:37:20 GMT)
Shift-invariant functions and almost liftings [0.0]
我々は、$k$bits 上のブール関数から持ち上げられる$n$bits 上のシフト不変ベクトルブール関数を $kleq n$ に対して検討する。直径$k$のブール関数がほぼ持ち上げである場合、その持ち上げ関数の最大衝突回数は、任意の$n$に対して2k-1$であることを示す。暗号特性が良好で、非客観性が重大なセキュリティ上の弱点を生じさせないような、ほとんど持ち上げのクラスの関数を探索する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:23:27 GMT)
Scientific QA System with Verifiable Answers [0.0]
我々は,オープンソースの科学的質問応答システムであるVerifAIプロジェクトを紹介した。本システムの構成要素は,(1)科学的論文(ミストラル7B)上の意味論的検索技術と語彙的検索技術を組み合わせた情報検索システム,(2)微調整生成モデル(ミストラル7B)を用いた検索型生成(RAG)モジュール,(3)微調整DBERTaに基づく検証エンジン,である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:21:02 GMT)
Scalable simulation of non-equilibrium quantum dynamics via classically optimised unitary circuits [0.0]
量子時間進化演算子を近似するために,一元的ブロックウォール回路を最適化する方法を示す。様々な3体ハミルトニアンに対して、我々の手法は、その精度と量子回路の深さの両方でトロタライズを上回る量子回路を生成する。また、量子デバイスとブロックウォール回路近似の組み合わせ誤差を最小限に抑える最適な時間ステップを選択する方法についても説明する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:46:45 GMT)
Representation of Context-Specific Causal Models with Observational and Interventional Data [0.0]
CStreesと呼ばれるコンテキスト固有条件独立モデルの新たなファミリーを導入する。この族は、一般的な介入DAGモデルを定義する因子化特性の一般化を可能にする新しい分解基準によって定義される。 CStreeモデルを実際のデータセットに適用し、データ依存構造とソフトな介入摂動の文脈固有の性質を明らかにする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:43:16 GMT)
Relevance of Anisotropy in the Kondo Effect -- Lessons From the Symplectic Case [0.0]
シンプレクティック対称性を持つ近藤模型は, 超伝導アイランドデバイスの有効低エネルギー理論として最近提案された。鉛とのカップリングにおける非対称性が非フェルミ液体を不安定化することを示す。結果は、近藤結合における異方性は常に無関係であるという共通の誤解を浮き彫りにする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:01:18 GMT)
Quantum geometry of bosonic Bogoliubov quasiparticles [0.0]
本稿では,シンプレクティックな量子幾何テンソル(SQGT)を提案する。シンプレクティックベリー曲率をボゴリューボフ・ブロッホ波パケットの一般化されたシンプレクティック異常速度項に接続する。ボソニックなボゴリューボフ・ハルダンモデルについて実験を行った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:29:29 GMT)
Quantum geometric Wigner construction for $D(G)$ and braided racks [0.0]
有限群の量子双対 D(G)=Bbb C(G)rtimes Bbb C G$ は量子コンピューティングの北エフモデルにおいて重要な役割を果たす。我々は、そのモデルの準粒子である既知構成を、Bbb R1,3$の通常のポアンカー群に対するウィグナー構成と厳密に類似した幾何学的方法で解釈する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:21:28 GMT)
Quantum annealer accelerates the variational quantum eigensolver in a triple-hybrid algorithm [0.0]
新しい三重ハイブリッドアルゴリズムは、古典的コンピュータ、ゲートベースの量子コンピュータ、および量子アニールの有効利用を組み合わせたものである。量子アニールを用いたグラフ着色問題の解は、VQEを加速するために必要な資源を減らす。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:07:21 GMT)
Quantum and Classical Dynamics with Random Permutation Circuits [0.0]
量子多体系における熱化が古典多体系と根本的に異なるかどうかを考察する。そこで我々は,局所的な透過基底状態を持つランダムな置換回路(RPC)のクラスを導入し,汎用的な顕微鏡的古典力学をモデル化する。 RUCと同様に、RPCsは、OOC(out-of-time order correlator)や絡み合いエントロピーなど、いくつかの重要な量の解析的計算を可能にする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:58:03 GMT)
Quantum Machine Learning in the Cognitive Domain: Alzheimer's Disease Study [0.0]
アルツハイマー病(英語: Alzheimer's disease、AD)は、神経変性脳疾患の1つである。認知障害による影響の1つは手書きである。高齢者のADを手書き解析により検出するための古典的人工知能(AI)アプローチがいくつか提案されている。近年の研究では、医療における量子コンピューティング技術の使用は、これらの問題に対処するだけでなく、複雑なデータ分析を加速し、大規模データセットをより効率的に処理できることが示されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:28:11 GMT)
Quantum Entropies and Decoherence for the Multiparticle Quantum Arnol'd Cat [0.0]
動的エントロピー、古典および量子の物理パラメータにおけるスケーリング挙動について研究する。このモデルは、量子カオスの性質、定義、および関連性に関する私の見解を明らかにするために、詳細な方法で提示します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:48:00 GMT)
Quantum Dissipative Search via Lindbladians [0.0]
マルコフ空間上の純粋に散逸する量子ランダムウォークの収束基準と収束速度を解析する。結果を実際の実装にマップし、そのポテンシャルを正確に推定し、従来の検索ほど効率的ではないことを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:39:18 GMT)
Quantum Chaos, Randomness and Universal Scaling of Entanglement in Various Krylov Spaces [0.0]
我々は、ダイソンのアンサンブルが支配する全ての量子カオスシステムに適用する、時間平均量子フィッシャー情報(QFI)の分析式を導出する。提案手法はランダム性,多部絡み合い,量子カオスの概念を統合する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:11:20 GMT)
Qu8its for Quantum Simulations of Lattice Quantum Chromodynamics [0.0]
我々は1+1D SU(3)格子量子色力学の力学の量子シミュレーションにおける立方体、立方体、立方体の有用性を探求する。並列ゲート応用の最近の進歩は、単一量子ビット演算のより短い適用時間とともに、量子シミュレーションの忠実度や量子ビットではなく量子ビットを用いた回路深度において大きな利点をもたらす。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:13:54 GMT)
Purcell-enhanced single-photon emission from InAs/GaAs quantum dots coupled to low-Q cylindrical nanocavities [0.0]
量子ドット(QD)は、要求に応じて高品質な量子光状態を生成することができる有望な情報源である。本研究では,Purcell効果を利用して,InAs QDの排出率を最大38倍に向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:06:30 GMT)
Predicting Emotion Intensity in Polish Political Texts: Comparing Supervised Models and Large Language Models in a Resource-Poor Language [0.0]
本研究では,ポーランドの政治文における感情の強さを予測するために,大規模言語モデル(LLM)の利用について検討する。本研究は,ソーシャルメディアテキスト1万件の注釈付きコーパスを用いた教師付きモデルと比較した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:53:14 GMT)
Phylotrack: C++ and Python libraries for in silico phylogenetic tracking [0.0]
Phylotrackプロジェクトは、シリコの進化における系統の追跡と解析のためのライブラリを提供する。プロジェクトは,1) Phylotracklibと,2) Phylotrackpy: Phylotracklibを囲むPythonラッパーで,Pybind11で作成された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:40:03 GMT)
Personalized Conversational Travel Assistant powered by Generative AI [0.0]
モリスCTE研究プロジェクトは、イタリア経済成長大臣(MIMIT)が出資している。この研究は、イタリア経済成長大臣(MIMIT)が出資したMoise CTE研究プロジェクト(英語版)で進行中である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:18:12 GMT)
Perceived Importance of ICT Proficiency for Teaching, Learning, and Career Progression among Physical Education Teachers in Pampanga [0.0]
この研究は、フィリピンのパンパンガ州メキシコの高等学校PE教師のICT統合の現状を垣間見ることができる。本研究は,政策立案者,管理者,研修プログラム開発者が,PE教師のICT能力の向上に重点を置くことを示唆している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:14:48 GMT)
Path integral for the quartic oscillator: An accurate analytic formula for the partition function [0.0]
正確な分割関数は、温度と結合定数$g$に依存する有効周波数を持つ調和振動子の分配関数によって近似される。極めて顕著に、この公式は正確な分割関数の重要な特徴を定性的かつ定量的に再現する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:33:59 GMT)
Parity-deformed $su(2)$ and $so(3)$ Algebras: a Basis for Quantum Optics and Quantum Communications Applications [0.0]
単モード系と二モード系に対するウィグナー代数は、それらをリフレクション作用素として加えると考えられる。関連する退化 $su(2)$ algebra, $su_nu(2)$, and the deformed $so(3)$ algebra, $so_nu(3)$ は、広く使われているジョルダン・シュウィンガーおよびホルシュタイン・プリマコフ実現に対して構成される。 parity-deformed $so_nu(3)$ representation は、量子ビット系と量子ビット系の研究における潜在的な応用のために解析される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:27:14 GMT)
Operational quantification of simultaneous correlations in complementary bases of two-qubit states via one-sided semi-device-independent steering [0.0]
2量子状態の場合、一方の半デバイス非依存的ステアビリティの定量化と、相互に偏りのない基底における同時相関の情報理論的定量化の関係について検討する。我々は,2量子状態の相補的基底における同時相関の操作的特徴について,直観を隠蔽するために,量子ステアリング楕円体形式(quantum steering ellipsoid formalism)を導出する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:17:59 GMT)
On the importance of learning non-local dynamics for stable data-driven climate modeling: A 1D gravity wave-QBO testbed [0.0]
機械学習(ML)技術は、気候モデルのためのサブグリッドスケールパラメータ化の学習において有望であることを示している。しかし、データ駆動パラメータ化の大きな問題はモデル不安定性である。ここでは、ML理論と気候物理を組み合わせて、NNベースのパラメータ化における不安定性の源となる問題に対処する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 00:58:41 GMT)
On the Fragility of Active Learners for Text Classification [0.0]
アクティブラーニング(AL)技術は、学習に最も価値のあるインスタンスを反復的に選択することで、ラベル付け予算を最適に活用する。データセットに最も適したALアルゴリズムを選択するための所定の基準はない。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 22:24:35 GMT)
Non-stabilizerness versus entanglement in matrix product states [0.0]
マトリックス生成物状態(MPS)における絡み合いと非安定化剤性(マジックとも呼ばれる)の関係について検討する。我々は,MPSの相互情報計算の観点から,パウリ・マルコフ連鎖がいかに技術の現状をリセットするかを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:51:01 GMT)
Non-commutative probability, joint distributions, conditioning, and the associated polymorphisms [0.0]
可換ポリモルフィズムと非可換ポリモルフィズムの並列性を示す。私たちの重点はプロセスからの条件分布への適用です。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:28:47 GMT)
Non-Adiabatic Quantum Optimization for Crossing Quantum Phase Transitions [0.0]
有限時間における量子相転移における量子系の基底状態の最適駆動について考察する。本稿では,非断熱量子最適化(Non-Adiabatic Quantum Optimization,NAQO)を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:47:21 GMT)
Noise mitigation in quantum teleportation [0.0]
離散および連続可変量子テレポーテーションスキームに適用可能なノイズ緩和機構総系のエネルギースペクトルにおいて有界状態が形成される限り、忠実性の量子的優位性は持続的に回復される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:05:47 GMT)
Neutrino oscillations originate from virtual excitation of Z bosons [0.0]
ニュートリノ振動は空間上を拡散するZボゾン場の仮想励起に由来する。ニュートリノが物質中に伝播するとき、その挙動は散乱に起因するコヒーレントフレーバー変換とデコヒーレンス効果の競合によって決定される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:44:12 GMT)
Multi-variable integration with a variational quantum circuit [0.0]
本稿では,量子回路を用いた多変数積分の評価手法を提案する。得られた回路は、パラメータシフトルール法を用いて積分変数に対して導出される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:02:04 GMT)
Molecular Topological Profile (MOLTOP) -- Simple and Strong Baseline for Molecular Graph Classification [0.0]
分子グラフ分類におけるトポロジカル記述子の有効性を再検討し、単純で強力なベースラインを設計する。機能工学への簡単なアプローチがグラフニューラルネットワーク(GNN)の強力なベースラインを確立することを実証する。新たなアルゴリズムである分子トポロジカルプロファイル(MOLTOP)は、エッジ間の中央性、調整されたランダムインデックス、SCAN構造類似度スコアを統合している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:45:34 GMT)
Minimally Entangled Typical Thermal States for Classical and Quantum Simulation of Gauge Theories at Finite Temperature and Density [0.0]
有限温度と密度で強い結合ゲージ理論をシミュレートすることは、核物理学や高エネルギー物理学における長年の挑戦である。本研究では,最小絡み合った典型的な熱状態(METTS)アプローチの有用性について検討し,古典的および量子的両方の研究を容易にする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:44:01 GMT)
Microscopic parametrizations for gate set tomography under coloured noise [0.0]
駆動相における時間相関ノイズ下での量子ゲートの顕微鏡的パラメトリゼーションにより,必要な資源を削減できることを示す。有限相関時間と非マルコフ量子進化の影響を含むゲート集合の最小パラメトリゼーションについて議論する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:39:52 GMT)
Magnetogram-to-Magnetogram: Generative Forecasting of Solar Evolution [0.0]
DDPM(Denoising Diffusion Probabilistic Models)を用いた画像と画像の変換による視線(LoS)磁気グラムの進化予測手法を提案する。提案手法は,画像品質の「計算機科学メトリクス」と物理精度の「物理メトリクス」を組み合わせて,モデル性能の評価を行う。その結果, DDPMは, 太陽磁場の動的範囲, 磁束, 活動領域の大きさなどの物理的特徴の維持に有効であることが示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:28:10 GMT)
Linear multidimensional regression with interactive fixed-effects [0.0]
本稿では,3次元以上の多次元パネルデータに対する線形かつ付加的に分離可能なモデルについて検討する。 2つのアプローチは、係数を推定する際、これらの未観測のインタラクティブな固定効果を考慮に入れていると考えられる。ビールの需要弾力性を推定する手法が提案されている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:02:46 GMT)
Leveraging Segment Anything Model in Identifying Buildings within Refugee Camps (SAM4Refugee) from Satellite Imagery for Humanitarian Operations [0.0]
本研究は,セグメンテーション・セグメンテーション・タスクにおいて,セグメンテーション・アロイング・モデル(SAM)とその分岐の一つであるSAM-Adapterの利用について検討する。 SAM-AdapterはSAMの軽量な適応であり、様々な難民キャンプでこの抽出作業の強力なツールとして登場した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:52:58 GMT)
LaVy: Vietnamese Multimodal Large Language Model [0.0]
LLM(Large Language Models)とMLLM(Multimodal Large Language Models)は、複雑な推論と言語理解において印象的な能力を持つ嵐によって世界を席巻している。ベトナムの大規模言語モデルに関連する作品が多数あり、マルチモーダリティにおける高品質な資源の欠如はベトナムのMLLMの進歩を妨げている。本稿では,現在最先端のベトナム語MLLMであるLaVyを導入することでこの問題に対処し,また,MLLMのベトナム語視覚言語タスクに対する理解を評価するためのLaVy-Benchベンチマークも導入する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:37:43 GMT)
LLMs-in-the-loop Part-1: Expert Small AI Models for Bio-Medical Text Translation [0.0]
本研究では,医療用テキストに最適化された教師ありニューラルマシン翻訳モデルを開発するために,新しい"LLMs-in-the-loop"アプローチを提案する。 6つの言語での独自の平行コーパスは、科学論文、人工的に生成された臨床文書、医療文書から編纂された。 MarianMTベースのモデルは、Google Translate、DeepL、GPT-4-Turboより優れている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:32:23 GMT)
Knowledge-based Drug Samples' Comparison [0.0]
ドラッグ・サンプル・コンファレンス(英: Drug sample comparison)は、フランス国家警察が麻薬の流通ネットワークを識別するプロセスである。現在のアプローチは、法医学の専門家による手動比較に基づいている。我々は、現在のプロセスを改善するために専門家の知識を取得し、形式化し、指定するためのアプローチを提示します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:16:17 GMT)
InvAgent: A Large Language Model based Multi-Agent System for Inventory Management in Supply Chains [0.0]
本研究では,大規模言語モデル (LLM) を用いて複数エージェントの在庫管理システムを管理する手法を提案する。我々のモデルであるInvAgentはレジリエンスを高め、サプライチェーンネットワーク全体の効率を向上させる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:55:17 GMT)
Improving LLM Abilities in Idiomatic Translation [0.0]
NLLBやGPTのような言語モデル(LLM)では、イディオムの翻訳は依然として難しい課題である。我々のゴールは、慣用的な言語のLLM処理を改善することで、翻訳の忠実度を高めることである。文化的なニュアンスを維持し、翻訳されたテキストが意図と感情の共鳴を維持することを保証するため、これは大きな社会的影響を持つ。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:17:34 GMT)
Improving Explainability of Softmax Classifiers Using a Prototype-Based Joint Embedding Method [0.0]
本稿では,ソフトマックス分類器の説明可能性向上のための試作手法を提案する。モデルアーキテクチャの変更とトレーニングにより、予測に寄与する原型例のサンプル化が可能となる。我々は、ソフトマックスの信頼性よりも分布データから検出できる不確実性の指標を得る。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:48:17 GMT)
ITI-IQA: a Toolbox for Heterogeneous Univariate and Multivariate Missing Data Imputation Quality Assessment [0.0]
ITI-IQAは、様々な計算手法の信頼性を評価するために設計されたユーティリティのセットである。ツールボックスには、測定をチェックするための診断方法とグラフィカルツールのスイートも含まれている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:26:46 GMT)
How Are LLMs Mitigating Stereotyping Harms? Learning from Search Engine Studies [0.0]
商業モデル開発は、社会的影響評価を犠牲にして、法的負債に関する「安全」の訓練に重点を置いている。これは、数年前に検索エンジンのオートコンプリートを観測できる同様の傾向を模倣している。 LLMにおけるステレオタイピングを評価するために,オートコンプリート方式の新たな評価課題を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:04:35 GMT)
High-quality poor man's Majorana bound states from cavity embedding [0.0]
粗い男のマヨアナ境界状態は、パラメータがスイートスポットに微調整されたときに、最小限のキータエフ鎖に現れる。単一モードキャビティに結合した相互作用する2部位の北エフ鎖を考えると, スイートスポット状態は, キャビティ周波数とサイト間のホッピングによって制御可能であることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:00:04 GMT)
Hexagonal boron nitride based photonic quantum technologies [0.0]
本稿では, 六方晶窒化ホウ素の構造, 性質, 成長, 転移について概説する。本研究の目的は、六方晶窒化ホウ素系フォトニック量子技術における欠陥工学とデバイス製造の進展の要約を提供することである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:17:50 GMT)
Hawking radiation in quantum Hall system with an expanding edge: application of anomaly method [0.0]
我々は、拡張エッジを持つ量子ホール系において、ウィルツェクとロビンソンの手法をド・シッター時空のアナログに応用する。この系はキラルであるため、地平線付近で進入モードを課す必要はない。ド・ジッター地平線のギボンズ・ホーキング温度で外平部におけるホーキング放射のフラックスを求める。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:06:21 GMT)
Hatred Stems from Ignorance! Distillation of the Persuasion Modes in Countering Conversational Hate Speech [0.0]
本研究は、説得モードを理性、感情、信頼性に蒸留する。クローズド(複数ターン)とオープン(単ターン)の2つのタイプの会話において、人種差別、セクシズム、宗教的偏見に関する使用を評価している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:58:42 GMT)
Harmonizing Safety and Speed: A Human-Algorithm Approach to Enhance the FDA's Medical Device Clearance Policy [0.0]
我々は、FDAが510(k)医療機器のクリアランスプロセスを改善するために、人間とアルゴリズムを組み合わせたアプローチを開発した。まず,510(k)医療機器のリコールリスクを推定する機械学習手法を開発した。次に、FDAの委員会への承認、拒絶、延期を推奨するデータ駆動クリアランス政策を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:11:29 GMT)
Greatly improved higher-order product formulae for quantum simulation [0.0]
ハミルトン進化のシミュレーションのための量子アルゴリズムは、しばしば積公式に基づいている。本研究では,8位と10位の両方の新しい積公式を数千個発見し,これらの式を数値的に検証した。優れた性能を有する第8次加工製品公式を新たに発見した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:58:58 GMT)
Graceful task adaptation with a bi-hemispheric RL agent [0.0]
人間では、タスクを実行する責任は徐々に右半球から左へシフトする。ノベルティ・ルーティン仮説 (NRH) は、右半球と左半球をそれぞれ新規なタスクとルーチンなタスクに用いていることを述べている。本研究では,右半球からの一般知識を活用できる強化学習エージェントを開発し,新規タスクにおける初期性能の低下を回避する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:45:28 GMT)
Geometric Interpretation of a nonlinear extension of Quantum Mechanics [0.0]
非線形項は重力効果を引き起こすと考えられる。波動関数の2つの成分は、時空の2つの異なる領域におけるハミルトニアン H によって記述された系を表すことを示唆する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:50:49 GMT)
Gaming and Blockchain: Hype and Reality [0.0]
このレポートは、EnjinやAxie Infinityといったブロックチェーンベースの一般的なゲームプロジェクトの特徴である。トランザクションコストやプレーヤのフィードバックなどのメトリクスを比較して、ブロックチェーン統合ゲーム全体の長寿を評価する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:43:13 GMT)
Fuzzy Logic Approach For Visual Analysis Of Websites With K-means Clustering-based Color Extraction [0.0]
本稿では,ユーザエクスペリエンス向上におけるWebサイトデザインの美学の重要性について検討する。これは、しばしば50ミリ秒以内に形成される最初の印象が、ウェブサイトの魅力とユーザビリティに対するユーザの認識に重大な影響を与えることを強調している。カラーハーモニーとフォントの人気に基づいて,ウェブサイトの美意識を測定する新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:56:05 GMT)
From the Choi Formalism in Infinite Dimensions to Unique Decompositions of Generators of Completely Positive Dynamical Semigroups [0.0]
我々は、任意のヒルベルト空間に一意な有界作用素 $K$ と一意に正の写像 $Phi$ が存在することを証明している。特に、上述のヒルベルト空間が無限次元となるとすぐに、チェイ形式の下で空の事前像を持つ正半定値作用素の例が見つかる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:56:36 GMT)
Frequency dependence of nonsequential double ionization of atoms in strong laser fields [0.0]
完全な量子力学計算において、(非逐次)二重イオン化の周波数依存性を研究する。また,フィールドサイクル数の影響などの時間依存性の影響についても検討した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:35:20 GMT)
Feynman Diagrams for Matter Wave Interferometry [0.0]
物質波干渉法における位相シフトを計算するために、ファインマン図に基づく新しい理論フレームワークを導入する。本研究では,物質波干渉計の応答を任意の空間依存性を持つ法則ポテンシャルとポテンシャルに求める手法を適用した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:26:19 GMT)
Fast Ground State to Ground State Separation of Small Ion Crystals [0.0]
捕捉されたイオンの線形結晶を異なるサブセットに迅速に分離することは、捕捉されたイオン量子コンピューティングアーキテクチャを実現するために重要である。我々は,同種結晶と混合種結晶のより小さな部分集合への分離を記述するのに使用できる一般的な理論的枠組みを紹介する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:00:41 GMT)
Extending the Tavis-Cummings model for molecular ensembles -- Exploring the effects of dipole self energies and static dipole moments [0.0]
分子アンサンブルに対するTavis-Cummingsモデルを拡張した。光共振器に共振結合したMgH$+$分子の励起状態ダイナミクスと分光をシミュレートする。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:32:52 GMT)
Exponential tilting of subweibull distributions [0.0]
サブワイブル分布の代替特性について述べる。指数傾斜後にその尾の挙動が保存される条件について詳述する。サブワイブル分布は、亜指数および亜ガウス確率変数の一般化である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:06:52 GMT)
Evaluation of Extra Pixel Interpolation with Mask Processing for Medical Image Segmentation with Deep Learning [0.0]
筆者らは、BICベースの画像とマスク処理とBICとNNベースの画像とマスク処理の両方の効果を評価した。評価の結果、BIC-496モデル/ネットワークは8.9578%(画像サイズ256 x 256)で、NN-NNネットワークは1.0%(画像サイズ384 x 384)増加した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:07:55 GMT)
Entanglement Structure of Non-Gaussian States and How to Measure It [0.0]
本稿では,実験的な相関関数による量子状態の制約を行うプロトコルを提案する。この方法は量子状態の絡み合い構造の計測を可能にする。提案プロトコルは,現在および今後の実験能力とともに有用であることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:00:01 GMT)
Ensemble Transport Filter via Optimized Maximum Mean Discrepancy [0.0]
本稿では, 粒子フィルタの解析段階をトランスポートマップで再構築し, アンサンブルに基づく新しいフィルタ法を提案する。トランスポートマップは、最大平均離散損失関数によって記述された最適化問題によって構築される。アンサンブルカルマンフィルタに対する提案手法の利点を示すために,いくつかの数値例を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:54:12 GMT)
Enhancing stop location detection for incomplete urban mobility datasets [0.0]
本研究は, 位置同定のための密度に基づく手法を強化するために, 分類アルゴリズムの適用について検討する。提案手法は,様々な時間にまたがる個別のルーチン行動を含む複数の特徴を取り入れ,個々のGPS点の局所的特徴を拡大する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:41:08 GMT)
Enhancement of nonclassical properties of two-mode squeezed vacuum state with postselected von Neumann measurement [0.0]
弱値増幅が2モードスクイーズ真空状態の非古典的特性に及ぼす影響について検討した。選択後弱測定に基づく2モードスクイーズ真空状態の利点を示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:23:22 GMT)
Empirical fits to inclusive electron-carbon scattering data obtained by deep-learning methods [0.0]
広い運動領域における炭素の電子散乱断面積に対する経験的適合性を得る。このようなモデル非依存のパラメトリゼーションを得るための2つの異なる方法とそれに対応する不確実性を考える。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 09:00:04 GMT)
Efficient detection of non-classicality of continuous variable states using moments of Wigner function [0.0]
非古典状態の重要なサブクラスである負のウィグナー関数を持つ状態は、量子情報処理タスクの貴重な資源として機能する。負のウィグナー関数を示す量子状態を検出するための基準を提供する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:54:41 GMT)
Educational Personalized Learning Path Planning with Large Language Models [0.0]
本稿では,これらの課題に対処するために,大規模言語モデル(LLM)と迅速なエンジニアリングを統合する新しいアプローチを提案する。学習者固有の情報を組み込んだプロンプトを設計することにより,LLama-2-70B や GPT-4 などの LLM をガイドし,パーソナライズ,一貫性,教育的な学習経路を生成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:32:56 GMT)
Discrete-Time Quantum Walks: A Quantum Advantage for Graph Representation [0.0]
この論文は、複雑なグラフトポロジをヒルベルト空間に包含し、グラフ解析の有効性を著しく向上させる。この発展は量子コンピューティングとグラフ理論の交差に革命をもたらすことを約束する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:49:49 GMT)
DiNO-Diffusion. Scaling Medical Diffusion via Self-Supervised Pre-Training [0.0]
Dino-Diffusionは潜在拡散モデル(LDM)の自己教師型手法であるアノテーションへの依存をなくすことで、私たちのトレーニングは、公開胸部X線データセットから868万以上の未ラベル画像を活用する。小さなデータプールからでも意味的に多様な合成データセットを生成するために使用できる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:51:21 GMT)
Dephasing and error dynamics affecting a singlet-triplet qubit during coherent spin shuttling [0.0]
我々は,コヒーレントスピンシャットリング中の一重項量子ビットの劣化と緩和に寄与する崩壊ダイナミクスを探索する。我々は、スピンシャットリングによる遠方量子ビットの絡み合いに対する将来の実装を奨励する指標として、シャトルの誤り率を1時間10〜4ドルから少なくとも103ドルまで見積もる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:59:28 GMT)
Deep Learning without Global Optimization by Random Fourier Neural Networks [0.0]
本稿では、ランダムな複雑な指数関数活性化関数を利用する様々なディープニューラルネットワークのための新しいトレーニングアルゴリズムを提案する。提案手法では,マルコフ連鎖モンテカルロサンプリング法を用いてネットワーク層を反復的に訓練する。複雑な指数的活性化関数を持つ残留ネットワークの理論的近似速度を一貫して達成する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:23:40 GMT)
Deconvolution with a Box [0.0]
箱(正方形波)によるデコンボリューションは、ピクセルシフトカメラによる超高分解能の鍵となる操作である。凸最適化を用いてスパース信号の完全再構成が可能であることを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 13:02:54 GMT)
DMRG study of the theta-dependent mass spectrum in the 2-flavor Schwinger model [0.0]
ハミルトン形式論における2ドルフレーバーシュウィンガーモデルの$theta$依存質量スペクトルについて検討する。複合粒子の質量、ピオンとシグマ中間体は2つの独立した方法で計算される。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 05:23:20 GMT)
Constructing a fully homomorphic encryption scheme with the Yoneda Lemma [0.0]
本稿では, Yoneda Lemmaの適用を通じて, 非対称暗号の同型暗号システムの基盤を再定義する。これは、ElGamal、RSA、Benaloh、RegevのLWE、NTRUEncryptといった広く採用されているシステムが、Yoneda Lemmaの原則から直接派生していることを示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:02:09 GMT)
Condensation of vanishing photon emission rates in random atomic clouds [0.0]
寒冷な原子雲の放射動力学に関連するユークリッド確率行列の特性を解析する。協調性パラメータによって制御された新しい相転移の証拠を提示する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:43:21 GMT)
Complementarity between quantum entanglement, geometrical and dynamical appearances in $N$ spin-$1/2$ system under all-range Ising model [0.0]
現代幾何学は距離や曲率といった要素間の相互関係を研究する。我々はこれらの構造を全範囲イジングモデルの下でN$相互作用スピン-1/2$の物理系で探索する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:52:20 GMT)
Competition of long-range interactions and noise at ramped quench dynamical quantum phase transition: The case of the long-range pairing Kitaev chain [0.0]
ノイズのない/ノイズの多い線形時間依存化学ポテンシャルを持つ長距離ペア北エフモデルの非平衡ダイナミクスについて検討した。ランプが1つの臨界点を横切ることを示す一方、短距離ペアの北エフモデルでは1つの臨界時間スケールを示す。 3つのDQPT時間スケールを持つ領域はノイズの存在下で縮小することがわかった。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:51:33 GMT)
ColorwAI: Generative Colorways of Textiles through GAN and Diffusion Disentanglement [0.0]
StyleGAN と Diffusion のカラーアンタングルを用いた「世代別カラーウェイ」の創出が提案されている。 StyleGANのW空間は、人間の色の概念と最もよく一致している。そこで本研究では,色道創出のための創造システムを考案し,専門家のアンケートや創造理論を通じて評価することを提案する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:51:01 GMT)
Code Documentation and Analysis to Secure Software Development [0.0]
CoDATは、さまざまなレベルのコードドキュメント間の一貫性を維持するように設計されたツールである。 Intellij IDEAで実装されている。私たちは、コードの断片とそれを記述するコメントの間のセマンティックな一貫性をチェックするために、大きな言語モデルを使用します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:25:44 GMT)
ChatBCG: Can AI Read Your Slide Deck? [0.0]
本稿では,GPT 4o と Gemini Flash-1.5 の精度を評価する。これらのモデルは、複雑なグラフやラベル付けされていないグラフを含む場合、現在、デッキを正確にエンドツーエンドに読むことはできないと結論付けています。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 06:00:45 GMT)
CM-DQN: A Value-Based Deep Reinforcement Learning Model to Simulate Confirmation Bias [0.0]
本稿では,人間の意思決定過程をシミュレートするために,Deep Reinforcement Learning(CM-DQN)に新たなアルゴリズムを提案する。我々は,Lunar Lander環境において,確認的,不確認的バイアス,非バイアスを用いて学習効果を観察する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 04:29:04 GMT)
Bringing AI Participation Down to Scale: A Comment on Open AIs Democratic Inputs to AI Project [0.0]
Open AI Democratic Inputsプログラムをレビューし、生成AIへの公的な参加のための手順を設計するための10のチームに資金を提供した。我々は, LLMの一般性, 抽象的価値の抽出, 問題ではなく解決策の募集, 民主主義への参加など, 共有された仮定をいくつか挙げる。私たちは代わりに、特定のコミュニティやユースケースを含むAI参加を呼びかけ、修正すべき具体的な問題を提起します。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 11:22:34 GMT)
Black box work extraction and composite hypothesis testing [0.0]
ブラックボックスワーク抽出は、量子熱力学において最も中心的なプロセスの1つである。ブラックボックス設定における最適抽出作業は,複合仮説テストタスクの性能によって完全に特徴づけられることを示す。また、この物理環境では、合成仮説が特定の相関を含む新しい量子シュタインの補題も示している。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 08:07:44 GMT)
Beyond the Request: Harnessing HTTP Response Headers for Cross-Browser Web Tracker Classification in an Imbalanced Setting [0.0]
本研究は、二項化HTTP応答ヘッダを用いたWebトラッカー検出のための効果的な機械学習分類器を設計する試みである。 10の教師付きモデルがChromeデータ上でトレーニングされ、1年後のChromeデータセットを含むすべてのブラウザでテストされた。結果は、ChromeとFirefoxで高い精度、F1スコア、精度、リコール、最小ログロスエラーを示した。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:45:21 GMT)
Behavior of correlation functions in the dynamics of the Multiparticle Quantum Arnol'd Cat [0.0]
アーノールの猫(アーノールの猫、英: Arnol'd cat)は、古典的および量子的なハミルトン系の一般化である。私は、量子古典対応の問題に焦点をあてて、このシステムを以前の一連の研究で研究してきた。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 10:46:08 GMT)
Bayesian Causal Forests for Longitudinal Data: Assessing the Impact of Part-Time Work on Growth in High School Mathematics Achievement [0.0]
ベイジアンカウサル林の長手延長について紹介する。このモデルは、数学的能力における個々の成長と、パートタイム作業への参加の影響の両方を柔軟に識別することができる。その結果、ほとんどの学生にとってパートタイムワークの負の影響が明らかとなったが、当初は学校所有感が低い学生にとって潜在的利益が示唆された。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:18:33 GMT)
BUSClean: Open-source software for breast ultrasound image pre-processing and knowledge extraction for medical AI [0.0]
臨床乳房超音波データセットを自動処理するオープンソースソフトウェアソリューションを提案する。このアルゴリズムは、ソノグラフアノテーションからBUSスキャンフィルタリング、クリーニング、知識抽出を行う。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:02:51 GMT)
Axioms for Quantum Yang-Mills Theories -- 1. Euclidean Axioms (incomplete) [0.0]
ゲージ不変な共配置シュウィンガー函数の存在を仮定し、それらにのみ反射陽性を課す。これはゲージ不変量のみが物理的意味を与えられるというゲージ理論の基本原理に従っている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 16:36:20 GMT)
Augmenting Replay in World Models for Continual Reinforcement Learning [0.0]
連続RLは、エージェントが過去のタスクと将来のタスクの両方を改善しながら、以前のタスクを忘れずに新しいタスクを学ぶ必要がある。最も一般的なアプローチは、モデルフリーのアルゴリズムとリプレイバッファを使って破滅的な忘れを軽減している。 WMAR(World Models with Augmented Replay)は,メモリ効率のよいリプレイバッファを持つモデルベースRLアルゴリズムである。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 07:33:52 GMT)
Asymmetric Bethe Ansatz [0.0]
最近、固壁箱に質量比3:1の2つのデルタ関数相互作用粒子に対する正確な量子解が、ベーテ・アンザッツ積分性に必要な従来の条件に反する。既知の自己不変ミラー重ね合わせの半透明ミラーの一部は、完全に反射する鏡に置き換えられる。提案法の名称は非対称Bethe Ansatz (非対称BA)である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:54:59 GMT)
Are Linear Regression Models White Box and Interpretable? [0.0]
説明可能な人工知能(XAI)は、モデルを理解し解釈するために機械学習モデルに適用または組み込んだ一連のツールとアルゴリズムである。線形回帰を含む単純なモデルは実装が容易であり、計算の複雑さが小さく、出力を視覚化するのも容易である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 21:05:51 GMT)
Are ELECTRA's Sentence Embeddings Beyond Repair? The Case of Semantic Textual Similarity [0.0]
ELECTRAの埋め込みを修復する新しいTMFT法を提案する。 TMFTはパラメータ効率を高めながら、スピアマン相関係数を8点以上改善する。我々は分析を様々なモデルサイズと言語に拡張する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 19:38:43 GMT)
Approximating the Number of Relevant Variables in a Parity Implies Proper Learning [0.0]
パリティ関数の関連変数数を近似することはパリティを適切に学習するのと同じくらい難しいことを示す。 2つ目の結果では、任意の$T(n)$-timeアルゴリズムから、任意のパリティ$f$に対して、関連する変数の数を$gamma$-approximation($d(f)$ of $f$)を返すことを示す。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:20:30 GMT)
Agglomerative Clustering of Simulation Output Distributions Using Regularized Wasserstein Distance [0.0]
本研究では,シミュレータが生成するデータに対するクラスタリング手法の適用について検討し,異常検出,事前最適化,オンラインモニタリングへの応用について述べる。本稿では,正規化ワッサースタイン距離を用いて経験的分布をクラスタリングする集合的クラスタリングアルゴリズムを導入し,その手法をコールセンタモデルに適用する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:07:32 GMT)
Advancing Quantum Computing with Formal Methods [0.0]
このチュートリアルは、量子コンピューティングに関心を持つフォーマルなメソッドコミュニティの全員を対象としている。量子コンピューティングに精通する必要はないが、基本的な線形代数の知識は前提条件である。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 12:51:38 GMT)
Active Suppression of Quantum Dephasing in Resonantly Driven Ensembles [0.0]
我々は、原子対内のコヒーレントな集団移動に対するランダムな原子位置の影響を抑制するために量子制御を用いてきた。この方法は、非共振ラビ周波数の結合強度の低下を利用して、非線形光学における準位相マッチングと類似して達成可能な集団移動をコヒーレントに増幅する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 18:26:45 GMT)
Accurate Numerical Simulations of Open Quantum Systems Using Spectral Tensor Trains [0.0]
量子ビット間のデコヒーレンス(英語版)は、量子計算における主要なボトルネックである。数値計算法Q-ASPEN(Quantum Accelerated Propagator Evaluation)を提案する。 Q-ASPENは任意に正確であり、誤り訂正量子計算に必要なリソースを推定するために適用することができる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 02:33:27 GMT)
Accelerated creation of NOON states with ultracold atoms via counterdiabatic driving [0.0]
量子制御プロトコルは、N$超低温ボソニック原子を2つのモードで生成するために提案される。この状態は、最初に全てのボソンが配置され、他の2つのモードと対称に結合された第3モードを用いて作成することができる。この第3モードのエネルギーを他のモードのエネルギーレベルに調整することで、NOON状態の断熱的な生成が可能になる。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 15:39:16 GMT)
A Theoretical Formulation of Many-body Message Passing Neural Networks [0.0]
我々は高次ノード相互作用をモデル化する多体メッセージパッシングニューラルネットワーク(MPNN)フレームワークを提案する。グローバルエッジリッチ曲率で重み付けしたモチーフラプラシアンに局所化スペクトルフィルタを適用した。我々は、我々の定式化が隣接ノード置換に不変であることを証明し、その感度境界を導出し、学習されたグラフポテンシャルの範囲を束縛する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:18:48 GMT)
A Hitchhiker's Guide to Deep Chemical Language Processing for Bioactivity Prediction [0.0]
化学言語処理(CLP)は、薬物発見における深層学習の顕著なアプローチとして現れている。ここでは,CLPトレーニングの重要な要素を分析し,新参者や専門家のガイドラインを提供する。この「ヒッチハイカーのガイド」は、特定の方法論的選択の重要性を強調しているだけでなく、研究者に実践的な勧告を与えている。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 20:13:31 GMT)
A Channel Attention-Driven Hybrid CNN Framework for Paddy Leaf Disease Detection [0.0]
作物の損失を回避し、栽培を改善するため、農業において早期かつ正確な病原体同定が重要である。チャネルアテンション機構とSwish ReLUアクティベーション機能を備えた新しいハイブリッドディープラーニング(DL)分類器を提案する。我々のモデルは99.76%のF1スコアと99.74%の精度を達成し、既存のモデルの性能を上回った。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 14:17:26 GMT)
21cmEMU: an emulator of 21cmFAST summary observables [0.0]
本稿では,一般的な21cmFASTシミュレーションコードから,いくつかのサマリ観測器のエミュレータとして21cmEMUを提案する。 21cmEMUは、EoR銀河を特徴づける9つのパラメータとして入力され、以下の要約統計を出力する。すべての観測可能量は、中央値の低い精度で予測され、計算コストを10$4$以上削減する。
論文参考訳（メタデータ） (Tue, 16 Jul 2024 17:17:53 GMT)