Fugu-MT: arxivの論文翻訳(概要)

Qwen2 Technical Report [139.8]
Qwen2は、前機種のQwen1.5を含む、これまでのほとんどのオープンウェイトモデルを上回っている。言語理解、生成、多言語習熟、コーディング、数学、推論に関する様々なベンチマークにおいて、プロプライエタリなモデルと比較して、競争力のあるパフォーマンスを示す。 Qwen2は、英語、中国語、スペイン語、フランス語、ドイツ語、アラビア語、ロシア語、韓国語、日本語、タイ語、ベトナム語など、約30の言語で熟練した堅牢な多言語機能を示している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:35:42 GMT)
IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation [136.6]
高品質な人中心型ビデオ深度生成のためのIDOL(unIfied Dual-mOdal Latent diffusion)を提案する。我々のIDOLは2つの新しい設計で構成されている。第一に、デュアルモーダル生成を可能にし、ビデオと深度生成の間の情報交換を最大化する。次に,映像と深度特徴運動場との整合性を実現する動きの整合性損失を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:36:54 GMT)
WildVidFit: Video Virtual Try-On in the Wild via Image-Based Controlled Diffusion Models [132.8]
ビデオ仮想トライオンは、衣料品のアイデンティティを維持し、ソースビデオにおける人のポーズと身体の形に適応する現実的なシーケンスを生成することを目的としている。従来の画像ベースの手法は、ワープとブレンディングに依存しており、複雑な人間の動きや閉塞に苦しむ。衣料品の説明や人間の動きを条件とした映像生成のプロセスとして,映像試行を再認識する。私たちのソリューションであるWildVidFitは、画像ベースで制御された拡散モデルを用いて、一段階の合理化を図っている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:21:03 GMT)
Interfacing Foundation Models' Embeddings [131.0]
ファウンデーションモデルの埋め込みと、モダリティと粒度にまたがる統合イメージとデータセットレベルの理解を整合させる汎用インターフェースであるFINDを提案する。インターリーブド埋め込み空間を考慮したFIND-Benchでは,インターリーブドセグメンテーションと検索のためのCOCOデータセットに新たなトレーニングと評価アノテーションを導入している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:18:26 GMT)
Arena Learning: Build Data Flywheel for LLMs Post-training via Simulated Chatbot Arena [126.7]
AI駆動のアノテーションを使ってアリーナの戦いをシミュレートするために設計された、革新的なオフライン戦略であるArena Learningを紹介します。 Arena Learningは、オフラインシミュレーションとオンラインコンペティションの正確な評価と一貫性を保証する。ターゲットモデルであるWizardLM-$beta$をトレーニングするためにArena Learningを適用し、大幅なパフォーマンス向上を示します。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:26:07 GMT)
Mix-CPT: A Domain Adaptation Framework via Decoupling Knowledge Learning and Format Alignment [120.1]
汎用大規模言語モデル(LLM)を特殊なドメインに適応させることは、様々なデータ分散のために大きな課題となる。そこで我々はMix-CPTと呼ばれるドメイン知識学習と汎用フォーマットアライメントを含む新しいドメイン適応フレームワークを提案する。提案するMix-CPTフレームワークは,目標領域および一般領域におけるLCMのタスク解決能力を同時に向上させることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:20:13 GMT)
4D Gaussian Splatting for Real-Time Dynamic Scene Rendering [103.3]
本研究では,動的シーンの全体像として4D-GS(Gaussian Splatting)を提案する。 HexPlaneにインスパイアされたニューラルボクセル符号化アルゴリズムは、4Dニューラルボクセルの機能を効率的に構築するために提案されている。我々の4D-GS法は、高解像度の82 FPSで、3090 GPUで800$times$800の解像度でリアルタイムレンダリングを実現する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:34:51 GMT)
OPEN: Object-wise Position Embedding for Multi-view 3D Object Detection [102.1]
OPENと呼ばれる新しい多視点3Dオブジェクト検出器を提案する。我々の主目的は、提案したオブジェクト指向位置埋め込みを通して、オブジェクトワイド情報をネットワークに効果的に注入することである。 OPENは、nuScenesテストベンチマークで64.4%のNDSと56.7%のmAPで、最先端の新たなパフォーマンスを実現している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:29:15 GMT)
Diffusion of Thoughts: Chain-of-Thought Reasoning in Diffusion Language Models [100.5]
Diffusion-of-Thought (DoT) は、拡散モデルとChain-of-Thoughtを統合する新しいアプローチである。 DoTは、拡散言語モデルを通じて、時間とともに推論ステップが拡散することを可能にする。本研究は,多桁乗算,論理学,小学校数学におけるDoTの有効性を示すものである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:03:59 GMT)
DOCBENCH: A Benchmark for Evaluating LLM-based Document Reading Systems [99.2]
本稿では,大規模言語モデル(LLM)に基づく文書読解システムを評価するベンチマークであるDocBenchを紹介する。我々のベンチマークには、人間のアノテーションの募集と、合成質問の生成が含まれる。実際の文書は229件、質問は1,102件で、5つのドメインにまたがって4種類の質問がある。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:17:42 GMT)
Testing Occupational Gender Bias in Language Models: Towards Robust Measurement and Zero-Shot Debiasing [98.1]
大規模言語モデル(LLM)は、様々な人口層に対して有害で人間らしいバイアスを示すことが示されている。生成言語モデルにおけるバイアスを頑健に測定するためのdesiderataのリストを紹介する。次に、このベンチマークを使用して、Llama、Mistral、およびそれらの命令チューニングバージョンを含む、最先端のオープンソースLLMをテストします。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:10:45 GMT)
Eyes Closed, Safety On: Protecting Multimodal LLMs via Image-to-Text Transformation [98.0]
我々は,MLLMの本来の安全意識を生かしたトレーニング不要な保護手法であるECSO(Eyes Closed, Safety On)を提案する。 ECSOは、安全でない画像をテキストに適応的に変換することで、より安全な応答を生成し、予め整列されたLCMの本質的な安全性メカニズムを活性化する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:03:53 GMT)
Q-Sparse: All Large Language Models can be Fully Sparsely-Activated [93.5]
Q-Sparseは、スパースアクティベートされた大規模言語モデル(LLM)を訓練するための、シンプルで効果的なアプローチである。 Q-Sparse は LLM における活性化の完全な分散を可能にし、推論においてかなりの効率向上をもたらす。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:59:29 GMT)
Mutual Learning for Acoustic Matching and Dereverberation via Visual Scene-driven Diffusion [93.3]
本稿では拡散モデルに基づく相互学習フレームワークMVSDを紹介する。 MVSDは2つのタスクを対称的に考慮し、逆タスクからの学習を容易にするために相互関係を利用する。我々のフレームワークは、残響器と残響器の性能を向上させることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 00:47:56 GMT)
DataDream: Few-shot Guided Dataset Generation [90.1]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。 DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:10:31 GMT)
MagDiff: Multi-Alignment Diffusion for High-Fidelity Video Generation and Editing [90.1]
我々は、高忠実度ビデオ生成と編集の両方のタスクに対して、MagDiffと呼ばれる統合多重配位拡散を提案する。提案したMagDiffは、主観駆動アライメント、適応プロンプトアライメント、高忠実アライメントを含む3種類のアライメントを導入している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:51:43 GMT)
$\texttt{MixGR}$: Enhancing Retriever Generalization for Scientific Domain through Complementary Granularity [88.8]
本稿では,様々なレベルの粒度にまたがる問合せ文書マッチングに対する高密度検索者の認識を改善するために,$texttMixGR$を紹介した。 $texttMixGR$は、これらの粒度に基づいて様々なメトリクスを統合スコアに融合させ、包括的なクエリドキュメントの類似性を反映させる。実験によると、$texttMixGR$は、教師なしと教師なしのレトリバーでnDCG@5で、以前のドキュメント検索を24.7%、9.8%上回っている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:04:09 GMT)
Lite2Relight: 3D-aware Single Image Portrait Relighting [87.6]
Lite2Relightは、肖像画の3D一貫性のある頭部ポーズを予測できる新しいテクニックだ。事前学習した幾何認識エンコーダと特徴アライメントモジュールを利用することで、入力画像を3D空間にマッピングする。これには、髪、目、表情を含むフルヘッドの3D一貫性のある結果が含まれる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:16:11 GMT)
Situated Instruction Following [87.4]
本稿では,実世界のコミュニケーションの非特異性とあいまいさを取り入れた位置指示について述べる。位置指示の意味は、人間の過去の行動と将来の行動を通じて自然に展開される。我々の実験は、現在最先端の身体的指示追従(EIF)モデルが、位置する人間の意図の全体的理解を欠いていることを示唆している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:32:30 GMT)
From GaLore to WeLore: How Low-Rank Weights Non-uniformly Emerge from Low-Rank Gradients [86.4]
現代大規模言語モデルの様々な層にまたがる低ランク構造の出現について検討する。 WeLore(Weight Low-Rank Projection)を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:05:20 GMT)
Rethinking Machine Unlearning for Large Language Models [85.9]
大規模言語モデル(LLM)の領域における機械学習の研究このイニシアチブは、望ましくないデータの影響(機密情報や違法情報など)と関連するモデル機能を排除することを目的としている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 00:18:21 GMT)
Class-Incremental Learning: A Survey [84.3]
CIL(Class-Incremental Learning)は、学習者が新しいクラスの知識を段階的に取り入れることを可能にする。 CILは、前者の特徴を壊滅的に忘れる傾向にあり、その性能は劇的に低下する。ベンチマーク画像分類タスクにおける17の手法の厳密で統一的な評価を行い、異なるアルゴリズムの特徴を明らかにする。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:35:33 GMT)
Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models [79.8]
大規模言語モデル(LLM)は、出力の信頼性が不可欠である様々な高い領域で採用されている。本研究では,不確実性推定の脆弱性を調査し,攻撃の可能性を探る。攻撃者がLSMにバックドアを埋め込むことができ、入力中の特定のトリガーによって起動されると、最終的な出力に影響を与えることなくモデルの不確実性を操作できることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:41:11 GMT)
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Cross-Regularization [78.6]
トレーニング済み重量を効率的に更新するための直交微調整法を提案する。クロスレギュラー化戦略はゼロショットの一般化の観点から安定性を維持するためにも用いられる。提案手法は,タスク固有の知識を表現するために,事前学習した重み空間を明示的に操るものであることを実証するために,広範囲にわたる実験を行った。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:38:40 GMT)
TVE: Learning Meta-attribution for Transferable Vision Explainer [76.7]
本稿では,下流タスクにおける様々な視覚モデルを効果的に説明できるTransferable Vision Explainer(TVE)を提案する。 TVEは,大規模データセットの事前学習プロセスを通じて,メタ属性の学習を実現する。このメタ属性は、一般的なバックボーンエンコーダの汎用性を利用して、入力インスタンスの属性知識を包括的にエンコードし、TVEがシームレスに転送し、様々な下流タスクを説明することを可能にする。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:02:52 GMT)
Datacube segmentation via Deep Spectral Clustering [76.5]
拡張ビジョン技術は、しばしばその解釈に挑戦する。データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:11:19 GMT)
GeoMix: Towards Geometry-Aware Data Augmentation [76.1]
Mixupは画像分類におけるラベル付き限られたデータによる課題の緩和にかなりの成功を収めている。 In-place graph editing を利用した簡易かつ解釈可能な混合手法 Geometric Mixup (GeoMix) を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:58:04 GMT)
Qwen2-Audio Technical Report [73.9]
本稿では,Qwen2-Audioと呼ばれる大規模オーディオ言語モデルであるQwen-Audioの最新動向を紹介する。 Qwen2-Audioは、様々な音声信号入力を受け入れ、音声解析や音声指示に対する直接テキスト応答を行うことができる。我々はQwen2-Audioの指示追従能力を高め、音声チャットと音声分析のための2つの異なる音声対話モードを実装した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:38:09 GMT)
Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.8]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。 Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:54:37 GMT)
SEED: A Simple and Effective 3D DETR in Point Clouds [72.7]
ポイントクラウドの分散度が高く,不均一な分布のため,主な課題は困難である,と我々は主張する。点雲から3次元物体を検出するための簡便で効果的な3次元DETR法(SEED)を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:21:07 GMT)
ESceme: Vision-and-Language Navigation with Episodic Scene Memory [72.7]
ヴィジュアル・アンド・ランゲージ・ナビゲーション(VLN)は、現実世界のシーンで自然言語のナビゲーション指示に従う視覚エージェントをシミュレートする。本稿では,VLNにおける情景記憶(esceme)のメカニズムについて紹介する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:35:49 GMT)
Heterogeneous Semantic Transfer for Multi-label Recognition with Partial Labels [70.5]
部分ラベル付きマルチラベル画像認識(MLR-PL)は、アノテーションのコストを大幅に削減し、大規模なMLRを促進する。それぞれの画像と異なる画像の間に強い意味的相関が存在することがわかった。これらの相関関係は、未知のラベルを取得するために、既知のラベルが持つ知識を転送するのに役立ちます。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:32:29 GMT)
Agent Attention: On the Integration of Softmax and Linear Attention [70.1]
本稿では,計算効率と表現力のバランスをとるために,新しい注意パラダイムであるエージェント注意(Agent Attention)を提案する。提案するエージェントアテンションは,線形アテンションの一般化形式と等価であることを示す。特に、エージェントの注意は高解像度のシナリオにおいて顕著な性能を示しており、その線形の注意の性質に依拠している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:42:48 GMT)
Towards High-Quality 3D Motion Transfer with Realistic Apparel Animation [69.4]
本研究では,現実的なアパレルアニメーションを用いた高品質な動き伝達を目的とした新しい手法を提案する。本稿では,2つのニューラル変形モジュールを介し,物体とアパレルの変形を学習するデータ駆動パイプラインを提案する。本手法は各種アパレルの品質に優れた結果をもたらす。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:17:35 GMT)
Knowledge Distillation Meets Open-Set Semi-Supervised Learning [69.2]
本研究では,事前学習した教師から対象学生へ,表現的知識を意味的に蒸留する新しいモデル名(bfem shortname)を提案する。問題レベルでは、これは知識蒸留とオープンセット半教師付き学習(SSL)との興味深い関係を確立する。我々のショートネームは、粗い物体分類と微妙な顔認識タスクの両方において、最先端の知識蒸留法よりもかなり優れている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:08:49 GMT)
CIBench: Evaluating Your LLMs with a Code Interpreter Plugin [69.0]
データサイエンスタスクにコードインタプリタを利用するLLMの能力を総合的に評価する,CIBenchという対話型評価フレームワークを提案する。評価データセットは,LLM-人的協調手法を用いて構築され,連続的かつ対話的なIPythonセッションを活用することによって,実際のワークフローをシミュレートする。コードインタプリタの利用において, CIBench 上で 24 個の LLM の能力を解析し, 将来の LLM に対する貴重な洞察を提供するため, 広範囲にわたる実験を行った。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:43:55 GMT)
GOEmbed: Gradient Origin Embeddings for Representation Agnostic 3D Feature Learning [67.6]
入力された2次元画像を任意の3次元表現にエンコードするGOEmbed(Gradient Origin Embeddings)を提案する。入力画像が大きな事前訓練されたモデルから抽出された2D特徴を用いて符号化される典型的な従来のアプローチとは異なり、カスタマイズされた特徴は異なる3D表現を扱うように設計されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:15:34 GMT)
Walking the Values in Bayesian Inverse Reinforcement Learning [66.7]
ベイズIRLの鍵となる課題は、可能な報酬の仮説空間と可能性の間の計算的ギャップを埋めることである。本稿では,この知見に基づく新しいマルコフ連鎖モンテカルロ法であるValueWalkを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:59:52 GMT)
Secure Aggregation is Not Private Against Membership Inference Attacks [66.6]
フェデレーション学習におけるSecAggのプライバシーへの影響について検討する。 SecAggは、単一のトレーニングラウンドであっても、メンバシップ推論攻撃に対して弱いプライバシを提供します。以上の結果から,ノイズ注入などの付加的なプライバシー強化機構の必要性が浮き彫りになった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:29:33 GMT)
When Do Neural Nets Outperform Boosted Trees on Tabular Data? [65.3]
私たちは一歩後退して、'NN vs. GBDT'議論の重要性に疑問を投げかけます。驚くほど多くのデータセットに対して、GBDTとNNのパフォーマンスの違いは無視できる。我々は、データセットのどの特性がNNやGBDTを適切に動作させるために適しているかを決定するために、数十のメタ機能を分析します。私たちの洞察は、実践者がデータセット上で最もうまく機能するテクニックを決定するためのガイドとして機能します。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:00:47 GMT)
GRUtopia: Dream General Robots in a City at Scale [65.1]
本稿では,各種ロボットを対象とした対話型3D社会「GRUtopia」について紹介する。 GRScenesには100万のインタラクティブな微妙な注釈付きシーンが含まれており、都市規模の環境に自由に組み合わせることができる。 GRResidentsはLarge Language Model (LLM)によって駆動されるNon-Player Character (NPC)システムである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:40:46 GMT)
RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception [64.8]
本稿では,様々な知覚タスクの表現を調和させる新しい統一表現RepVFを提案する。 RepVFは、ベクトル場を通じてシーン内の異なるターゲットの構造を特徴付け、シングルヘッドでマルチタスクの学習モデルを可能にする。 RepVF 上に構築された RFTR は,タスク間の固有性を利用したネットワークである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:25:07 GMT)
Object-Centric Diffusion for Efficient Video Editing [64.7]
デルタ蒸留と呼ばれる新しい知識蒸留方式を提案する。ビデオフレーム内の時間的冗長性により,これらの時間的変動を効果的に蒸留できることを実証した。副産物として、デルタ蒸留は教師モデルの時間的一貫性を向上させる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:32:19 GMT)
Understanding Matrix Function Normalizations in Covariance Pooling through the Lens of Riemannian Geometry [63.7]
グローバル共分散プーリング(GCP)は、高レベルの表現の2階統計を利用して、ディープニューラルネットワーク(DNN)の性能を向上させることが実証されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:11:44 GMT)
AccDiffusion: An Accurate Method for Higher-Resolution Image Generation [63.5]
AccDiffusionは、パッチワイドの高解像度画像生成をトレーニングなしで正確に行う方法である。本稿では,異なるパッチに対する同一のテキストプロンプトが繰り返しオブジェクト生成を引き起こすことを明らかにする。我々のAccDiffusionは、繰り返しオブジェクト生成の問題に効果的に対処し、高解像度画像生成の性能向上につながる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:06:29 GMT)
OVLW-DETR: Open-Vocabulary Light-Weighted Detection Transformer [63.1]
本稿では,OVLW-DETR(Open-Vocabulary Light-Weighted Detection Transformer)を提案する。本稿では,視覚言語モデル(VLM)からオブジェクト検出器への知識伝達を簡易なアライメントで行うエンド・ツー・エンドのトレーニングレシピを提案する。実験により,提案手法は標準ゼロショットLVISベンチマークにおいて,既存の実時間開語彙検出器よりも優れていることが示された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:15:27 GMT)
Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning [62.8]
我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し、このアルゴリズムは(弱)勾配支配仮定の下でのグローバルな最終点収束を保証する。制約付き制御問題に対して,我々のアルゴリズムを数値的に検証し,それらを最先端のベースラインと比較する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:54:57 GMT)
DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning [62.5]
テキスト・ツー・イメージ(T2I)世代はここ数年で著しい成長を遂げている。それにもかかわらず、T2Iモデルでダイアグラムを生成する作業はほとんど行われていない。本稿では,新しい2段階のテキスト・ツー・ダイアグラム生成フレームワークであるDiagrammerGPTを紹介する。我々のフレームワークは、既存のT2Iモデルを上回る精度で、より正確なダイアグラムを生成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:32:39 GMT)
Deep Diffusion Image Prior for Efficient OOD Adaptation in 3D Inverse Problems [61.9]
本稿では,従来のディープイメージに形式的な接続を導入することで,最近のSCD適応法を一般化するDDIPを提案する。本稿では,D3IPと呼ばれる3次元計測のための効率的な適応手法を提案し,DDIPを桁違いに高速化する。本手法は, 学習対象とは大きく異なるファントム画像のみを用いて, 事前学習した生成的画像から多種多様な3次元再構成タスクを解くことができることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:00:46 GMT)
Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs [60.7]
大規模言語モデル(LLM)は、特に知識集約的なタスクにおいて幻覚に悩まされる。既存の研究は、外部知識コーパスから取得した個々のテキスト単位でLLMを拡張することを提案する。本稿では,グラフを反復的に推論することで,LLMをグラフで拡張するためのGraph Chain-of-thinkt (Graph-CoT) というフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:36:18 GMT)
Don't Throw Away Data: Better Sequence Knowledge Distillation [60.6]
本稿では,知識蒸留訓練において,最小ベイズリスク(MBR)の復号化をより厳密に行うことを目的とする。英語からドイツ語,英語,日本語への翻訳実験では,強いベースライン法よりも一貫した改善が見られた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:11:18 GMT)
Deceptive-NeRF/3DGS: Diffusion-Generated Pseudo-Observations for High-Quality Sparse-View Reconstruction [60.5]
我々は,限られた入力画像のみを用いて,スパースビュー再構成を改善するために,Deceptive-NeRF/3DGSを導入した。具体的には,少数視点再構成によるノイズ画像から高品質な擬似観測へ変換する,偽拡散モデルを提案する。本システムでは,拡散生成擬似観測をトレーニング画像集合に徐々に組み込んで,スパース入力観測を5倍から10倍に高めている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:01:55 GMT)
Multilingual Contrastive Decoding via Language-Agnostic Layers Skipping [60.5]
対照的なレイヤ(DoLa)によるデコーディングは、大規模言語モデルの生成品質を改善するために設計されている。このアプローチは英語以外のタスクではうまくいきません。モデルの前方通過における言語遷移に関する従来の解釈可能性の研究から着想を得て,改良されたコントラスト復号アルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:14:01 GMT)
NoviCode: Generating Programs from Natural Language Utterances by Novices [59.7]
初心者非プログラマによるAPIと自然言語記述を入力とする新しいNLプログラミングタスクであるNoviCodeを提示する。我々は、NoviCodeがコード合成領域における挑戦的なタスクであることを示し、非技術的命令から複雑なコードを生成することは、現在のText-to-Codeパラダイムを超えている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:26:03 GMT)
3D Geometric Shape Assembly via Efficient Point Cloud Matching [59.2]
Proxy Match Transform (PMT) は、部品の配向面間の信頼性の高いマッチングを可能にする、高次特徴変換層である。 PMT を基盤として,幾何学的組立作業のための新しいフレームワーク Proxy Match TransformeR (PMTR) を導入する。我々は,Breaking Badの大規模3次元幾何形状集合ベンチマークデータセットを用いてPMTRの評価を行った。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:50:02 GMT)
IDEAL: Leveraging Infinite and Dynamic Characterizations of Large Language Models for Query-focused Summarization [59.1]
クエリ中心の要約(QFS)は、特定の関心事に答え、より優れたユーザ制御とパーソナライゼーションを可能にする要約を作成することを目的としている。本稿では,LLMを用いたQFSモデル,Longthy Document Summarization,およびクエリ-LLMアライメントの2つの重要な特徴について検討する。これらのイノベーションは、QFS技術分野における幅広い応用とアクセシビリティの道を開いた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:14:56 GMT)
Animate Your Motion: Turning Still Images into Dynamic Videos [58.6]
本稿では,マルチモーダル入力を管理する新しい手法であるScene and Motion Conditional Diffusion (SMCD)を紹介する。 SMCDは、認識されたモーションコンディショニングモジュールを組み込み、シーン条件を統合するための様々なアプローチを調査する。我々のデザインは映像の品質、動きの精度、セマンティック・コヒーレンスを大幅に向上させる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:50:14 GMT)
Fast Matrix Multiplications for Lookup Table-Quantized LLMs [58.1]
FLUTEはLUT量子化LLM用のフレキシブルなルックアップテーブルエンジンである。バッチサイズ32と量子化グループサイズ128では、FLUTEカーネルは既存のGEMMカーネルよりも2〜4倍高速である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:55:42 GMT)
GRIP: Generating Interaction Poses Using Spatial Cues and Latent Consistency [58.0]
手は器用で多用途なマニピュレータであり、人間が物体や環境とどのように相互作用するかの中心である。現実的な手オブジェクトの相互作用をモデル化することは、コンピュータグラフィックス、コンピュータビジョン、混合現実の応用において重要である。 GRIPは、体と物体の3次元運動を入力として取り、物体の相互作用の前、中、後の両方の両手の現実的な動きを合成する学習ベースの手法である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:42:07 GMT)
(Deep) Generative Geodesics [57.6]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。我々の計量は、生成距離と生成測地学の概念的定義に繋がる。彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:14:02 GMT)
Exploration-Driven Policy Optimization in RLHF: Theoretical Insights on Efficient Data Utilization [56.5]
ポリシー最適化(PO-RLHF)に基づくRLHFアルゴリズムの検討クエリの複雑さが低いPO-RLHFの性能バウンダリを提供する。鍵となる新規性は、軌跡レベルの楕円ポテンシャル分析である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:19:50 GMT)
Curved Diffusion: A Generative Model With Optical Geometry Control [56.2]
最終シーンの外観に対する異なる光学系の影響は、しばしば見過ごされる。本研究では,画像レンダリングに使用される特定のレンズとテキスト画像拡散モデルを密接に統合するフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:47:13 GMT)
SuperPADL: Scaling Language-Directed Physics-Based Control with Progressive Supervised Distillation [55.5]
物理ベースのテキスト・トゥ・モーションのためのスケーラブルなフレームワークであるSuperPADLを紹介する。 SuperPADLは、RLと教師あり学習を使って、何千もの多様なモーションクリップでコントローラを訓練する。コントローラは5000以上のスキルを含むデータセットでトレーニングされ、コンシューマGPU上でリアルタイムに動作します。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:07:11 GMT)
The Manifold Hypothesis for Gradient-Based Explanations [55.0]
勾配に基づく説明アルゴリズムは知覚的に整合した説明を提供する。特徴属性がデータの接する空間と一致しているほど、知覚的に一致している傾向にあることを示す。説明アルゴリズムは、その説明をデータ多様体と整合させるよう積極的に努力すべきである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:44:31 GMT)
MVSGaussian: Fast Generalizable Gaussian Splatting Reconstruction from Multi-View Stereo [54.0]
MVSGaussianは、Multi-View Stereo(MVS)から導かれる新しい一般化可能な3次元ガウス表現手法である。 MVSGaussianは、シーンごとにより良い合成品質でリアルタイムレンダリングを実現する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:34:30 GMT)
Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs [53.7]
本稿では,多種多様なカメラを用いた生と生の翻訳の未ペアリング学習手法を提案する。特定のカメラが捉えた生画像をターゲットカメラに正確にマッピングし、学習可能なISPを新しい目に見えないカメラに一般化する。提案手法は,従来の最先端技術と比較して精度が高く,実際のカメラデータセットに優れた性能を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:09:28 GMT)
Large Language Model-based FMRI Encoding of Language Functions for Subjects with Neurocognitive Disorder [53.6]
LLMを用いたfMRIエンコーディングと脳のスコアを用いた高齢者の言語関連機能変化について検討する。脳のスコアと認知スコアの相関関係を脳全体のROIと言語関連ROIの両方で分析した。以上の結果から,認知能力の向上は,中側頭回に有意な相関がみられた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:09:08 GMT)
LiteFocus: Accelerated Diffusion Inference for Long Audio Synthesis [53.4]
長い音声合成における音声潜伏拡散モデルの推論を強化する新しい手法を提案する。我々は、同じ周波数の焦点とクロス周波数の補償として指定され、同じ周波数の制約下でのアテンション計算を縮小する、二重スパース形式を用いてアテンション計算を行う。 LiteFocusは80秒音声クリップの合成において拡散ベースTTAモデルによる推論時間を1.99倍に削減した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:49:05 GMT)
SHINE: Saliency-aware HIerarchical NEgative Ranking for Compositional Temporal Grounding [53.0]
時間的グラウンドディング(英: Temporal grounding、ビデオモーメント検索(英語版))は、所定のクエリ文に対応するビデオセグメントを特定することを目的としている。本稿では, GPT-3.5-Turbo を用いた負のクエリ構築のための大規模言語モデル駆動手法を提案する。本稿では,ビデオと階層的負のクエリ間の多粒度意味的関係を学習するモデルを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:53:17 GMT)
Local Action-Guided Motion Diffusion Model for Text-to-Motion Generation [52.9]
既存の動き生成法は主に大域運動の直接合成に焦点を当てている。本研究では,局所動作を微粒化制御信号として利用することにより,グローバルな動き生成を容易にする局所動作誘導型動き拡散モデルを提案する。本手法は,様々な局所動作と連続誘導重み調整をシームレスに組み合わせる柔軟性を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:35:00 GMT)
ChiMed-GPT: A Chinese Medical Large Language Model with Full Training Regime and Better Alignment to Human Preferences [51.7]
我々は中国医学領域向けに明示的に設計されたベンチマークLSMであるChiMed-GPTを提案する。 ChiMed-GPTは、事前訓練、SFT、RLHFを含む総合的な訓練体制を実施。我々は,ChiMed-GPTを患者識別に関する態度尺度の実行を促すことによって,潜在的なバイアスを分析した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:57:00 GMT)
Accessing Vision Foundation Models at ImageNet-level Costs [51.5]
Proteusは、驚くべき能力でImageNetレベルのコストでトレーニングされている。 Proteus-L/14は、OracleのメソッドであるDINOv2-L/14のパフォーマンスを15ベンチマークで比較する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 00:13:53 GMT)
Provable Robustness of (Graph) Neural Networks Against Data Poisoning and Backdoor Attacks [50.9]
グラフニューラルネットワーク(GNN)は、特定のグラフのノード特徴をターゲットとした中毒やバックドア攻撃に対して認証する。コンボリューションベースのGNNとPageRankベースのGNNの最悪の動作におけるグラフ構造の役割とその接続性に関する基本的な知見を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:12:51 GMT)
Simple and Effective Transfer Learning for Neuro-Symbolic Integration [50.6]
この問題の潜在的な解決策はNeuro-Symbolic Integration (NeSy)であり、ニューラルアプローチとシンボリック推論を組み合わせる。これらの手法のほとんどは、認識をシンボルにマッピングするニューラルネットワークと、下流タスクの出力を予測する論理的論理的推論を利用する。それらは、緩やかな収束、複雑な知覚タスクの学習困難、局所的なミニマへの収束など、いくつかの問題に悩まされている。本稿では,これらの問題を改善するための簡易かつ効果的な方法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:49:49 GMT)
Inertial Confinement Fusion Forecasting via LLMs [50.0]
本研究では,従来の貯水池計算パラダイムとLarge Language Models(LLM)の新たな統合である$textbfFusion-LLM$を紹介する。本研究では, 核融合特異的プロンプトを付加した$textitLLM-anchored Reservoir$を提案し, インロジョン中の熱電子ダイナミクスの正確な予測を可能にする。また、物理実験に基づく最初の$textttICF$ベンチマークである$textbfFusion4AI$も提示し、プラズマ物理学研究における新しいアイデアの育成を目的としている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:46:44 GMT)
A Roadmap to Pluralistic Alignment [49.3]
本稿では,言語モデルをテストベッドとして用いた多元的アライメントのロードマップを提案する。我々は,AIシステムにおける多元性を定義・運用する3つの可能な方法を特定し,定式化する。我々は、現在のアライメント技術は、基本的に多元的AIに限られていると論じる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:06:13 GMT)
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles [49.2]
本研究では,自然言語で表現を指定した発話ヘッドを生成可能なフレームワークであるTalkCLIPを提案する。テキストから表現へのマッピングをモデル化するために,まず,テキストとビデオのペアによる発話ヘッドデータセットを構築した。自然言語による記述を表現表現に投影するCLIPベースのスタイルエンコーダを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:51:36 GMT)
CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.2]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:52:10 GMT)
Explore as a Storm, Exploit as a Raindrop: On the Benefit of Fine-Tuning Kernel Schedulers with Coordinate Descent [48.8]
カーネルの品質を向上しながら,Ansorの検索時間を短縮する可能性を示す。このアプローチを、Ansorが生成した最初の300のカーネルに適用する。この結果は20の有名なディープラーニングモデルで再現されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:42:24 GMT)
Automated Label Unification for Multi-Dataset Semantic Segmentation with GNNs [48.4]
本稿では,グラフニューラルネットワークを用いて,複数のデータセットにまたがる統一ラベル空間を自動構築する手法を提案する。従来の手法と異なり,本手法は手動の注釈や分類の調整を必要とせず,シームレスな訓練を容易にする。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:42:10 GMT)
DreamMotion: Space-Time Self-Similar Score Distillation for Zero-Shot Video Editing [48.2]
ビデオスコアの蒸留は、ターゲットテキストで示される新しいコンテンツを導入することができるが、構造や動きのずれを引き起こすこともある。本稿では, 原ビデオの時空間自己相似性と, スコア蒸留中の編集ビデオとを一致させることを提案する。我々のアプローチはモデルに依存しないもので、カスケードと非カスケードの両方の動画拡散フレームワークに適用できる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:34:29 GMT)
SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant [48.2]
本稿では,SQ-LLaVA: Self-Questioning for Large Vision-Language Assistantを提案する。 SQ-LLaVAは、視覚的手がかりと先行言語知識を分析しながら、柔軟で有意義な画像関連質問を生成する能力を示す。高品質なインストラクションデータに対する微調整SQ-LLaVAは、従来の視覚的インストラクションチューニング手法と比較して性能改善を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:37:11 GMT)
A pragmatic policy learning approach to account for users' fatigue in repeated auctions [47.8]
MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:53:29 GMT)
Unraveling the Truth: Do LLMs really Understand Charts? A Deep Dive into Consistency and Robustness [47.7]
チャート質問応答(CQA)は、ビジュアル言語理解の重要な領域である。この分野の現在のビジュアル言語モデル(VLM)は、まだ未調査のままである。本稿では,包括的データセット上での最先端VLMの評価を行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:29:24 GMT)
Using LLMs for the Extraction and Normalization of Product Attribute Values [47.1]
本稿では,大規模言語モデル(LLM)を用いて,製品タイトルや記述から属性値の抽出と正規化を行う可能性について検討する。実験のために、Web Data Commons - Product Attribute Value extract (WDC-PAVE)ベンチマークデータセットを紹介します。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:16:14 GMT)
GTPT: Group-based Token Pruning Transformer for Efficient Human Pose Estimation [46.7]
効率的なポーズ推定のためのグループベースToken Pruning Transformer (GTPT) 効率的なポーズ推定のためのグループベースToken Pruning Transformer (GTPT)
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:32:45 GMT)
InVi: Object Insertion In Videos Using Off-the-Shelf Diffusion Models [46.6]
InViは、ビデオ内のオブジェクトを挿入または置換するためのアプローチで、オフザシェルフ、テキスト・ツー・イメージの潜伏拡散モデルを用いて導入する。 InViは、フレーム間の一貫したブレンディングとコヒーレンスで現実的なオブジェクト挿入を実現し、既存のメソッドよりも優れています。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:55:09 GMT)
Are Emergent Abilities in Large Language Models just In-Context Learning? [46.6]
創発的能力を説明する新しい理論を提示する。以上の結果から,創発能力は真に創発的ではなく,文脈内学習,モデル記憶,言語知識の組み合わせによるものであることが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:21:56 GMT)
Evaluating Concurrent Robustness of Language Models Across Diverse Challenge Sets [46.2]
言語モデルはブラックボックスの性質が特徴で、しばしば幻覚を呈し、入力の摂動に敏感である。入力摂動が言語モデルにどう影響するかを,様々な尺度で検討する手法を提案する。複数の摂動に対するロバスト性に対処するための3つの異なる微調整戦略を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:59:49 GMT)
Towards Scale-Aware Full Surround Monodepth with Transformers [46.1]
フルサラウンドモノデプス(FSM)法は,複数のカメラビューから同時に学習し,スケール認識深度を予測する。本研究では,深度推定のためのFSM法のスケール・アウェアネスの向上に焦点をあてる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:54:46 GMT)
Gravitationally dominated instantons and instability of dS, AdS and Minkowski spaces [45.7]
量子場理論解析が有効でない状態における偽真空の崩壊について検討する。これは、偽と真真空を分ける障壁の高さが大きいときに起こる。デ・シッター、ミンコフスキー、反デ・シッターの不安定性に影響を及ぼす。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:13:16 GMT)
In-Loop Filtering via Trained Look-Up Tables [45.7]
インループフィルタリング(ILF)は、画像/ビデオのコーディング標準におけるアーティファクトを取り除くための重要な技術である。ルックアップテーブル(LUT)を用いたループ内フィルタリング手法を提案する。実験結果から,提案手法の超高速・超高速・高速モードは平均0.13%/0.34%/0.51%,0.10%/0.27%/0.39%のBDレート低下を達成できた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:25:42 GMT)
Learning the Unlearned: Mitigating Feature Suppression in Contrastive Learning [45.3]
自己監督型コントラスト学習は、ラベルのないデータから高品質な表現を導き出すのに有効であることが証明されている。単目的学習とマルチモーダル学習の両方を妨げる大きな課題は、特徴抑制である。本稿では,新しいモデルに依存しないマルチステージコントラスト学習フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:28:46 GMT)
Finding Meaning in Points: Weakly Supervised Semantic Segmentation for Event Cameras [45.1]
本稿では,イベントベースセマンティックセマンティックセグメンテーションのための新しい弱教師付きアプローチEV-WSSSを提案する。提案フレームワークは,(1)前向きのイベントデータと(2)逆向きのイベントデータとの間に非対称な二重学習を行う。提案手法は,画素レベルの高密度地下真実に頼らずとも,かなりのセグメンテーション結果が得られることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:00:50 GMT)
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization [44.9]
本稿では,単純かつ効果的な離散潜在グラフ拡散生成モデルを提案する。我々のモデル、すなわちGLADは、既存の潜伏アプローチの欠点を克服するだけでなく、グラフ空間に適用される拡散法に固有の問題を緩和する。分子ベンチマークデータセット上で生成モデルを検証し、最先端のベースラインと比較して競合性能を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:19:36 GMT)
Temporal Event Stereo via Joint Learning with Stereoscopic Flow [44.5]
イベントカメラは生体網膜にインスパイアされた動的視覚センサーである。本稿では,新しい時間的イベントステレオフレームワークを提案する。我々はMVSECとDSECデータセットで最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:43:08 GMT)
NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models [44.0]
我々は,大規模モデルの認知的マルチモーダル推論と問題解決能力を評価するために,NTSEBenchという新しいデータセットを導入した。このデータセットは、インドで実施されているNTSE試験から採取された26のカテゴリで合計4,642枚の画像からなる2,728の多重選択質問からなる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:21:56 GMT)
Möbius Transform for Mitigating Perspective Distortions in Representation Learning [43.9]
パースペクティブ歪み(PD)は、画像の形状、大きさ、向き、角度、その他の空間的関係に前例のない変化を引き起こす。 M"オビウス変換の特定の族に対して,パラメータ制御を微粒化することにより,MPDを緩和する手法を提案する。我々は,この新たなデータセットに対して,ディープラーニングモデルの堅牢性を評価するために,視点的に歪んだベンチマークデータセットであるImageNet-PDを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:16:52 GMT)
Guitar Chord Diagram Suggestion for Western Popular Music [43.6]
コードダイアグラムは、ギター奏者がフレットボードでコードを演奏する場所と方法を示すために使用される。いくつかのコードダイアグラムは西洋のポピュラー音楽で過剰に表現されており、いくつかのコードダイアグラムは20以上の方法で演奏可能であることを示す。コンテクストを考慮に入れれば、コードダイアグラムの提案の多様性や質が向上し、現在のコードラベルのみを考慮に入れたモデルと比較する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:44:13 GMT)
VQ-HPS: Human Pose and Shape Estimation in a Vector-Quantized Latent Space [43.4]
この研究は、ヒューマン・ポースと形状推定の問題に対処する新しいパラダイムを導入している。身体モデルパラメータを予測する代わりに、提案した離散潜在表現を予測することに重点を置いている。提案モデルであるVQ-HPSはメッシュの離散潜在表現を予測する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:47:03 GMT)
Towards Robust Event-based Networks for Nighttime via Unpaired Day-to-Night Event Translation [43.0]
ダイナミックレンジの高いイベントカメラは、低照度条件でもシーンキャプチャを保証します。夜の出来事は、昼間に捕獲されたものとは異なるパターンを示す。この違いは、夜間イベントを日々のイベントのみにトレーニングされたモデルに適用する際のパフォーマンス低下を引き起こす。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:18:37 GMT)
ConDiSR: Contrastive Disentanglement and Style Regularization for Single Domain Generalization [42.8]
医療データは、しばしば分散シフトを示し、標準パイプラインを使用してトレーニングされたディープラーニングモデルのテスト時のパフォーマンス劣化を引き起こす。本研究は、分類タスクの文脈において、単一ドメインの一般化フレームワークを探索することの重要性と課題を強調した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:59:57 GMT)
Leave No Knowledge Behind During Knowledge Distillation: Towards Practical and Effective Knowledge Distillation for Code-Switching ASR Using Realistic Data [42.7]
本稿では,現実的な音声のみのデータを用いた音声認識のための,より効率的なモデルを構築するためのフレームワークを提案する。提案手法は,教師モデルの知識と,小さな補助モデルからの洞察を両立させる。ベースライン法と教師モデルを全テストセットで比較しながら,5倍高速な生成速度を持つ2時間小型モデルを得ることに成功した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:25:14 GMT)
The Prompt Report: A Systematic Survey of Prompting Techniques [42.6]
本稿では, プロンプトの分類を組立て, 利用分析を行うことにより, プロンプトの構造的理解を確立した。本稿では,33の語彙の包括的語彙,58のテキストのみのプロンプト技術,40のモダリティのテクニックを提示する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:17:50 GMT)
What distinguishes conspiracy from critical narratives? A computational analysis of oppositional discourse [42.1]
本稿では,陰謀と批判的テキストを区別する,トピックに依存しない新しいアノテーション手法を提案する。また、Telegramメッセージの高品質なアノテーションを含む多言語XAI-DisInfodemics corpus(英語とスペイン語)にも貢献する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:18:47 GMT)
PILoRA: Prototype Guided Incremental LoRA for Federated Class-Incremental Learning [42.0]
標準データセットによる実験結果から,本手法は最先端の手法よりも優れていたことが示唆された。本手法は, 異なる設定, データの均一度において, 強靭性と優越性を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:59:38 GMT)
Graph Neural Networks for Vulnerability Detection: A Counterfactual Explanation [41.8]
グラフニューラルネットワーク(GNN)は、脆弱性検出のための顕著なコード埋め込みアプローチとして登場した。本稿では,GNNに基づく脆弱性検出のための新しいファクト・ファクト・アナライザCFExplainerを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:05:49 GMT)
Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion [41.5]
本研究では,行動から政治へ向けた新しい政策パラメータ生成手法であるMake-An-Agentを提案する。我々の生成モデルは、複数のタスクにおける顕著な汎用性とスケーラビリティを示します。さまざまな目的,行動,さらには異なるロボットマニピュレータに対して,その有効性と効率性を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:59:57 GMT)
Parrot: Pareto-optimal Multi-Reward Reinforcement Learning Framework for Text-to-Image Generation [40.7]
本稿では,報酬重みを手動で調整する問題に対処するParrotを提案する。我々は,新しいマルチリワード最適化アルゴリズムを用いて,T2Iモデルと即時拡張ネットワークを協調的に最適化する。また,提案手法は,ユーザ入力に対するインプットの正確性を確保するために,推論時に独自のプロンプト中心のガイダンスを導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:19:18 GMT)
Intelligent Cross-Organizational Process Mining: A Survey and New Perspectives [40.6]
本稿では,プロセスマイニングの分野に関する具体的な見解を提唱する。まず、プロセスマイニングの枠組み、一般的な産業応用、そして人工知能と組み合わされた最新の進歩について要約する。この視点は、複雑な多組織データ分析のための洗練されたソリューションを提供するために人工知能を活用することによって、プロセスマイニングに革命をもたらすことを目的としている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:30:34 GMT)
Multi-Armed Bandits with Interference [39.6]
スイッチバックポリシは,最高の固定アームポリシに対して,最適に期待された後悔のO(sqrt T)$を達成できることが示される。提案するクラスタランダム化ポリシは,期待値に最適である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:17:42 GMT)
2D Neural Fields with Learned Discontinuities [39.5]
本稿では,対象画像と協調的に近似し,不連続性を回復する新たな不連続性ニューラルネットワークモデルを提案する。また,本モデルでは,ムンフォード-シャフ法を上回り,不連続性を正確に把握し,チャンファーを真相に近づけた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:55:19 GMT)
The Good, The Bad, and The Greedy: Evaluation of LLMs Should Not Ignore Non-Determinism [39.4]
大規模言語モデル(LLM)の現在の評価は、しばしば非決定論を見落としている。 greedyデコーディングは一般的に、最も評価されたタスクのサンプリング方法よりも優れています。より小型のLPMはGPT-4-Turboのような大型のモデルと一致するか、超えることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:12:17 GMT)
BECAUSE: Bilinear Causal Representation for Generalizable Offline Model-based Reinforcement Learning [39.1]
オフラインモデルベース強化学習(MBRL)は、事前コンパイルされたデータセットを使用してモデルとポリシーを学ぶことにより、データ効率を向上させる。本稿は、このミスマッチの主な原因を、オフラインデータに存在する根底にある共同設立者から特定する。両状態の因果表現をキャプチャするアルゴリズムである textbfBilintextbfEar textbfCAUSal rtextbfEpresentation (BECAUSE) を導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:59:23 GMT)
DiffStega: Towards Universal Training-Free Coverless Image Steganography with Diffusion Models [38.2]
カバーレス画像ステガノグラフィ(CIS)は、カバー画像を使用しないことにより、非受容性を高める。近年の研究では、拡散モデルによるCISの鍵としてテキストプロンプトが活用されている。そこで我々は,DiffStegaを提案する。DiffStegaは,ユニバーサルアプリケーションのための革新的なトレーニングフリー拡散型CIS戦略である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:15:49 GMT)
Step-Controlled DPO: Leveraging Stepwise Error for Enhanced Mathematical Reasoning [38.1]
ステップ制御DPOは、特定のステップでエラーを発生させる数学的推論論理の負のサンプルを生成する。これらのサンプルをDPOトレーニングに適用することにより、SCDPOは推論エラーを理解し、正確な推論ステップを出力するようにモデルを整合させることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:03:54 GMT)
WAVE: Weight Template for Adaptive Initialization of Variable-sized Models [38.0]
WAVEは、様々な深さと幅のモデルを初期化する際に、最先端の性能を達成する。 WAVEは、一連のデータセット間で最も効率的な知識伝達を同時に達成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:41:13 GMT)
Interactive Rendering of Relightable and Animatable Gaussian Avatars [37.7]
本稿では,多視点映像や単眼アバター映像から身体材料と照明を分離する簡便で効率的な方法を提案する。提案手法は,合成データと実データの両方で高速に高品質な結果が得られる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:25:07 GMT)
Backdoor Attacks against Image-to-Image Networks [37.7]
深層学習に基づくイメージ・トゥ・イメージ(I2I)ネットワークは、画像の超解像やデノイングといったI2Iタスクの主要な選択肢となっている。バックドア攻撃に対するI2Iネットワークの感受性に関する包括的調査を行う。具体的には,侵入されたI2Iネットワークがクリーンな入力画像に対して正常に動作する,新しいバックドア攻撃手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:14:17 GMT)
Empowering LLMs for Verilog Generation through Multi-Level Summarization [37.4]
本稿では,オープンソースの命令調整型Verilog生成用LLMであるCodeVを紹介する。 CodeVは以前のオープンソースSOTAを14.4%(VerilogEvalのBetterV)と11.3%(RTLCoder in RTLLM)で相対的に上回っている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:57:20 GMT)
GROOT: Generating Robust Watermark for Diffusion-Model-Based Audio Synthesis [37.1]
本稿では,Groot を用いたロバストな音声透かし手法を提案する。このパラダイムでは、透かし生成と音声合成のプロセスが同時に行われる。 Grootは複合攻撃に直面した場合、異常な堅牢性を示し、平均的な透かし抽出精度は約95%を維持している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:57:19 GMT)
GKGNet: Group K-Nearest Neighbor based Graph Convolutional Network for Multi-Label Image Recognition [37.0]
マルチラベル画像認識(Multi-Label Image Recognition, MLIR)は、1つの画像で複数のオブジェクトラベルを予測することを目的とした課題である。我々は、最初の完全グラフ畳み込みモデル、グループK-アネレスト近傍グラフ畳み込みネットワーク(GKGNet)を提示する。実験により,GKGNetは計算コストを大幅に削減し,最先端の性能を実現することを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:23:10 GMT)
UniFS: Universal Few-shot Instance Perception with Point Representations [36.9]
そこで我々は,UniFSを提案する。UniFSは多種多様なインスタンス認識タスクを統一する汎用のインスタンス認識モデルである。提案手法は,タスクについて最小限の仮定を行うが,高度に専門的で最適化されたスペシャリストモデルと比較して,競争力のある結果が得られる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:19:47 GMT)
Towards Open Domain Text-Driven Synthesis of Multi-Person Motions [36.7]
我々は、大規模な画像とビデオのデータセットからポーズ情報を推定することで、人間のポーズと動きのデータセットをキュレートする。本手法は,多種多様なテキストプロンプトから多目的運動列を多種多様な多様性と忠実度で生成する最初の方法である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:55:43 GMT)
Have Faith in Faithfulness: Going Beyond Circuit Overlap When Finding Model Mechanisms [35.5]
エッジ属性パッチ(EAP: Edge Attribution patching)は、介入に対する勾配に基づく近似であり、この問題に対するスケーラブルだが不完全な解決策として現れている。本稿では,回路のコア特性をよりよく維持することを目的とした,統合勾配付きEAP(EAP-IG)手法を提案する。 EAPを用いた回路はEAP-IGを用いた回路に比べて信頼性が低いことを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:07:09 GMT)
Physics-embedded Fourier Neural Network for Partial Differential Equations [35.4]
物理埋め込みフーリエニューラルネット(PeFNN)を柔軟かつ説明可能な誤差で導入する。 PeFNNは運動量保存を強制し、解釈可能な非線形表現を得るように設計されている。我々は,大規模な洪水シミュレーションのような実世界のアプリケーションに挑戦する上で,その優れた性能を実証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:30:39 GMT)
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking [35.4]
大きな言語モデル(LLM)は、一般的でない言及を解釈する上で、より堅牢である。 LLM-Augmented Entity Linking LLMAELは,エンティティリンクを強化するためのプラグイン・アンド・プレイ方式である。 6つの標準データセットの実験では、ほとんどの場合、バニラLLMAELはベースラインELモデルよりも優れていた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:47:39 GMT)
Representing Rule-based Chatbots with Transformers [35.3]
ELIZAプログラムを実装したTransformerを構築することで,先行作業に基づいて構築する。 ELIZAは会話設定の際立った課題をいくつか挙げている。我々は、合成されたERIZA会話のデータセット上でトランスフォーマーを訓練し、モデルが学習するメカニズムを調査する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:45:53 GMT)
CLAVE: An Adaptive Framework for Evaluating Values of LLM Generated Responses [34.8]
CLAVEは2つの補完的なLarge Language Model(LLM)を統合する新しいフレームワークである。このデュアルモデルアプローチは、値タイプ当たり100個の人ラベルサンプルを使用して、任意の値システムでキャリブレーションを可能にする。 ValEvalは13k+(text,value,label)12+を多種多様なドメインで構成し、3つの主要なバリューシステムをカバーする包括的データセットである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:51:37 GMT)
Human-Centric Transformer for Domain Adaptive Action Recognition [34.6]
本研究では,行動認識のための領域適応タスク,すなわちドメイン適応行動認識について検討する。我々は、ドメイン適応型アクション認識のための人間中心のアクションキューを明らかにすることに注力する。提案するHuman-Centric Transformer (HCTransformer) は、疎結合な人間中心学習パラダイムを開発する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:10:11 GMT)
Motion-prior Contrast Maximization for Dense Continuous-Time Motion Estimation [34.5]
コントラスト最大化フレームワークと非直線運動を組み合わせた新たな自己監督的損失を画素レベルの軌跡の形で導入する。連続時間運動の高密度推定では, 合成学習モデルのゼロショット性能を29%向上する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:18:28 GMT)
Diffusion Tempering Improves Parameter Estimation with Probabilistic Integrators for Ordinary Differential Equations [34.5]
通常微分方程式(ODE)は科学の力学系を記述するために広く用いられているが、実験的な測定を説明するパラメータを特定することは困難である。本稿では,ODEにおける勾配に基づくパラメータ最適化の収束性を改善する確率的数値法の新しい正規化手法である拡散テンパリングを提案する。本手法は複雑性の異なる力学系に対して有効であることを示すとともに,実際に関連するパラメータ数を持つHodgkin-Huxleyモデルに対して,信頼性の高いパラメータ推定値が得られることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:14:15 GMT)
NGP-RT: Fusing Multi-Level Hash Features with Lightweight Attention for Real-Time Novel View Synthesis [33.6]
NGP-RTはInstant-NGPのレンダリング速度を向上し、リアルタイムな新しいビューを実現するための新しいアプローチである。我々のアプローチは、効率よく高品質なレンダリングを必要とするNeRFベースのリアルタイムアプリケーションに対して有望である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:08:03 GMT)
Spectral Representation for Causal Estimation with Hidden Confounders [33.1]
隠れた共同創設者が存在する場合の因果効果推定の問題に対処する。本手法では,条件付き期待演算子の特異値分解とサドル点最適化問題を用いる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:39:56 GMT)
LaRa: Efficient Large-Baseline Radiance Fields [32.9]
本稿では,トランス層における局所的および大域的推論を統一する手法を提案する。我々のモデルはガウスボリュームとしてシーンを表現し、これを画像エンコーダとグループ注意層と組み合わせて効率的なフィードフォワード再構築を行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:18:09 GMT)
Hybrid Oscillator-Qubit Quantum Processors: Instruction Set Architectures, Abstract Machine Models, and Applications [32.4]
CV-DVハイブリッドハードウェアは,DVプロセッサとCVプロセッサの両方の長所を継承する,強力な計算パラダイムを提供する。本稿では,様々なハイブリッドCV-DVコンパイル技術,アルゴリズム,アプリケーションについて述べる。ハイブリッドCV-DV量子計算は超伝導、閉じ込められたイオン、中性原子プラットフォームで実行され始めている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:23:47 GMT)
Robust Score-Based Quickest Change Detection [32.1]
最も速い変化検出の分野における手法は、オンラインデータストリームのデータ生成分布の変化をリアルタイムで迅速に検出する。最近の研究は、これらの結果を、前値と後値の分布がスコア関数によってのみ知られているケースにまで拡張している。この研究は、既存のスコアベースのクイックチェンジ検出アルゴリズムを堅牢化するために、"最も好ましくない"2つの分布を用いる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:53:04 GMT)
Learned Best-Effort LLM Serving [32.0]
本稿では,タスク分布とシステム負荷に基づいてサービス品質を調整するために,深層強化学習を用いたベストエフォートサービスシステムを提案する。当社のベストプラクティスシステムは、10倍以上のクライアント要求率で可用性を維持し、ピークパフォーマンスの96%以上、ピークパフォーマンスの4.1倍、ピークパフォーマンスの98%以上を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:54:20 GMT)
Benchmarking Vision Language Models for Cultural Understanding [31.9]
本稿では,視覚言語モデル(VLM)の評価を目的とした視覚的質問応答ベンチマークであるCulturalVQAを紹介する。我々は,5大陸11カ国の文化を表わす質問毎の回答が1～5である2,378枚の画像検索ペアのコレクションをキュレートした。質問は、衣服、食べ物、飲み物、儀式、伝統など、様々な文化の側面の理解を調査する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:21:41 GMT)
PreSight: Enhancing Autonomous Vehicle Perception with City-Scale NeRF Priors [31.8]
新しい都市をナビゲートする際、人間は徐々に、その後の訪問中にリアルタイムの知覚を補うための予備的なメンタルマップを開発していく。このような人間的アプローチに触発されて、私たちはPreSightという新しいフレームワークを導入しました。提案手法では,都市規模のニューラルフィールドを過去の旅行データで最適化し,ニューラルプライドを生成する。これらの先行は意味論と幾何学的詳細に富み、手動のアノテーションなしで導出され、様々な最先端の知覚モデルをシームレスに拡張することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:18:09 GMT)
WildRefer: 3D Object Localization in Large-scale Dynamic Scenes with Multi-modal Visual Data and Natural Language [31.7]
本稿では,自然言語記述とオンラインキャプチャによるマルチモーダル視覚データに基づく大規模動的シーンにおける3次元視覚接地作業について紹介する。本研究では,画像中のリッチな外観情報,位置,および点雲中の幾何学的手がかりをフル活用して,WildReferという新しい手法を提案する。われわれのデータセットは、野生の3Dビジュアルグラウンドの研究にとって重要なものであり、自動運転とサービスロボットの開発を促進する大きな可能性を秘めている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:42:13 GMT)
Open-Source Conversational AI with SpeechBrain 1.0 [31.6]
SpeechBrainはオープンソースのConversational AIツールキットで、PyTorchをベースとしている。事前トレーニングされたモデルと、トレーニングに必要なコードとアルゴリズムの完全な“レシピ”の両方をリリースすることで、透明性と複製性を促進する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:56:28 GMT)
Efficient Unsupervised Visual Representation Learning with Explicit Cluster Balancing [31.4]
グループ(またはクラスタ)の識別は、自己教師あり学習において最も成功した方法の1つである。この問題に対処するフレームワークであるExCBを,新しいクラスタ分散手法により提案する。我々は,我々のアプローチを評価するための広範囲な実験を行い,ExCBが最先端の成果を達成できることを実証した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:44:17 GMT)
No Train, all Gain: Self-Supervised Gradients Improve Deep Frozen Representations [30.9]
FUNGIは、自己教師付き勾配を利用して視覚エンコーダの特徴を高める方法である。 FUNGIの機能は線形分類や画像検索に有用であり,事前学習したモデルのテキスト内シーン理解能力を大幅に向上させることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:58:42 GMT)
Enhancing Privacy of Spatiotemporal Federated Learning against Gradient Inversion Attacks [30.8]
本稿では,時空間データに適した勾配攻撃アルゴリズムである時空間勾配インバージョンアタック(GIA)を提案する。我々は、時間的連合学習における勾配反転攻撃を軽減するための適応的な防御戦略を設計する。提案した防衛戦略は,効果的なセキュリティ保護による時間的フェデレーション学習の有用性を十分に維持できることを明らかにした。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:42:31 GMT)
Antibody DomainBed: Out-of-Distribution Generalization in Therapeutic Protein Design [30.6]
能動機械学習(ML)による治療分子の最適化は、関心の標的特性を予測する代理モデルに依存している。重要な課題は、各サイクルからの実験的なフィードバックが、次のサイクルの候補提案や実験的なプロトコルの変更を誘発し、分散シフトにつながることである。設計サイクルによって定義された5つのドメインにわたる抗体と抗原の相互作用の安定性を分類するためにドメイン一般化(DG)法を適用した。以上の結果から,基礎モデルとアンサンブルは,アウト・オブ・ディストリビューション領域における予測性能を向上させることが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:46:25 GMT)
Advancing Question Answering on Handwritten Documents: A State-of-the-Art Recognition-Based Model for HW-SQuAD [30.6]
本稿では,HW-SQuADデータセットとBenthamQAデータセットの先行技術を改善する新しい認識ベースアプローチを提案する。本モデルでは,変換器を用いた文書検索とアンサンブル手法をモデルレベルで導入し,HW-SQuADデータセットとBenthamQAデータセットにおいて,Exact Matchスコアが82.02%,69%に達した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:41:32 GMT)
RoboGolf: Mastering Real-World Minigolf with a Reflective Multi-Modality Vision-Language Model [30.1]
ネストされたVLMを用いた閉ループ制御と反射平衡ループによりデュアルカメラの視覚入力を知覚するVLMベースのフレームワークであるRoboGolfを紹介する。 RoboGolfのミニゴルフコートに対する効果を実験で実証した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:51:19 GMT)
AdapTable: Test-Time Adaptation for Tabular Data via Shift-Aware Uncertainty Calibrator and Label Distribution Handler [29.4]
本稿では,ターゲットラベル分布を推定し,不確実性に基づいて初期確率を調整することによって,出力確率を変化させる新しいテスト時間適応手法であるAdapTableを紹介する。自然分布シフトと合成汚損の両方の実験により,提案手法の適応効果が示された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:02:53 GMT)
HACMan: Learning Hybrid Actor-Critic Maps for 6D Non-Prehensile Manipulation [29.0]
本稿では6次元非包括的操作のための強化学習手法であるHybrid Actor-Critic Maps for Manipulation (HACMan)を紹介する。シミュレーションおよび実世界における6次元オブジェクトポーズアライメントタスクにおけるHACManの評価を行った。代替アクション表現と比較して、HACManは最高のベースラインの3倍以上の成功率を達成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:49:48 GMT)
OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models [28.7]
Panoptic Scene Graph Generation (PSG) は、オブジェクトを分割し、それらの関係を認識し、画像の構造的理解を可能にすることを目的としている。従来の手法では、事前定義されたオブジェクトと関係カテゴリの予測に重点を置いており、そのため、オープンワールドシナリオでのアプリケーションを制限する。本稿では,事前訓練された開集合パノプティックセグメンテーションモデルと統合された開集合関係予測の課題に焦点をあてる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:56:42 GMT)
Learning to Generate Answers with Citations via Factual Consistency Models [28.7]
大型言語モデル(LLM)は、ミッションクリティカルな状況においてその信頼性を阻害する。本稿では,事実整合性モデル(FCM)を利用した弱教師付き微調整法を提案する。集中学習は目的に統合され、ファインチューニングプロセスが現実の単位トークンを強調するように指示される。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:04:05 GMT)
VideoAgent: A Memory-augmented Multimodal Agent for Video Understanding [28.3]
VideoAgent: 1)は、一般的な時間的イベント記述と、ビデオのオブジェクト中心のトラッキング状態の両方を格納する構造化メモリを構築する。 2) 入力タスククエリが与えられた場合,ビデオセグメントのローカライゼーションやオブジェクトメモリクエリなどのツールと,他の視覚基盤モデルを用いて対話的にタスクを解く。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:54:30 GMT)
VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation [28.1]
VGBenchは、ベクトルグラフィックスを扱うためのLLM(Large Language Models)の包括的なベンチマークである。 LLMは両面に強い能力を示し、低レベルフォーマット(SVG)では望ましい性能は低い。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:59:55 GMT)
Quantized Prompt for Efficient Generalization of Vision-Language Models [28.0]
CLIPのような大規模事前学習型視覚言語モデルは、様々な分野で大きな成功を収めている。下流への適応の間、最も難しい問題は過度に適合し、破滅的な忘れ物である。本稿では,視覚言語モデルを正規化するための量子化について検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:19:56 GMT)
Human-in-the-Loop Visual Re-ID for Population Size Estimation [27.8]
そこで本研究では,市販のRe-IDシステムから得られた2方向の類似性により,人口規模を推定する手法を提案する。本手法は, 営巣重要度サンプリングに基づいて, 対の類似性によって駆動されるヒトの獣医に対する画像のペアを選択し, 集団サイズ推定値の偏りを導出する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:05:12 GMT)
TAPI: Towards Target-Specific and Adversarial Prompt Injection against Code LLMs [27.7]
本稿では,新たな攻撃パラダイム,すなわち,コードLLMに対するターゲット固有および対向的プロンプトインジェクション(TAPI)を提案する。 TAPIは悪意のある命令に関する情報を含む読めないコメントを生成し、それらを外部ソースコードのトリガーとして隠す。 CodeGeexやGithub Copilotなど、デプロイされたコード補完統合アプリケーションに対する攻撃に成功しました。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:54:50 GMT)
Conceptual Codebook Learning for Vision-Language Models [27.7]
視覚言語モデル(VLM)の一般化能力向上のためのCodebook Learning(CoCoLe)を提案する。視覚概念をキーとして,概念的プロンプトを値として,概念的コードブックを学習する。この概念的コードブック学習法は,視覚的・言語的モダリティの高度化を実現することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:00:24 GMT)
OmniGS: Fast Radiance Field Reconstruction using Omnidirectional Gaussian Splatting [27.5]
現在の3次元ガウス散乱システムは、歪みのない視点画像を用いた放射場再構成しかサポートしていない。高速な放射野再構成のための全方位画像を利用するため,新しい全方位撮影システムであるOmniGSを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:59:07 GMT)
EnTri: Ensemble Learning with Tri-level Representations for Explainable Scene Recognition [27.2]
ディープラーニングに基づくシーン認識は大きな進歩を遂げているが、その性能にはまだ限界がある。本稿では,視覚的特徴の階層構造を用いたアンサンブル学習フレームワークであるEnTriを提案する。 EnTriは認識精度の点で優れており、最先端のアプローチと比較して競争性能が向上している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:06:20 GMT)
A Survey on Deep Active Learning: Recent Advances and New Frontiers [27.1]
この研究は、ディープラーニングに基づくアクティブラーニング(DAL)の難しさを克服する上で、研究者にとって有用かつ迅速なガイドとなることを目的としている。この手法は適用可能性の広さから人気が高まりつつあるが、特にディープラーニングに基づくアクティブラーニング(DAL)に関する調査論文は乏しいままである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:07:56 GMT)
Can We Remove the Square-Root in Adaptive Gradient Methods? A Second-Order Perspective [26.5]
適応手法の動作が根の除去時にどのように変化するか,すなわち2階のモチベーションを強化するかを検討する。驚いたことに、このような平方根自由適応法は畳み込みアーキテクチャ上のSGDへの一般化ギャップを閉じている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:23:41 GMT)
Preventing Catastrophic Forgetting through Memory Networks in Continuous Detection [26.2]
メモリベースの検出変換器アーキテクチャを導入し、トレーニング済みのDETR型検出器を新しいタスクに適用する。本稿では,メモリ単位からの効率的な情報検索のための新しい局所化クエリ関数を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:59:02 GMT)
A Unified Differentiable Boolean Operator with Fuzzy Logic [26.0]
コンストラクティブ・ソリッド・ジオメトリー(CSG)を用いた暗黙的な固体形状モデリングのための統一微分可能作用素を提案する。提案したオペレーターは、完全な連続CSG最適化に向けた今後の研究の新たな可能性を開く。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:52:22 GMT)
MetaTool: Facilitating Large Language Models to Master Tools with Meta-task Augmentation [25.4]
我々は、再利用可能なツールセットをマスターするために一般化可能な新しいツール学習手法(MetaTool)を導入する。我々は,ツール実行のマスキング要因を予測するメタタスクを開発した。メタタスクデータを命令チューニングプロセスに組み込むことで,提案したMetaToolモデルは,オープンソースモデルよりも大幅に優れている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:15:41 GMT)
Learning from Naturally Occurring Feedback [25.3]
チャットモデルと対話する際にユーザが自然に含むフィードバックを抽出するスケーラブルな方法を提案する。我々は,自然に発生するフィードバックの存在を確認するために,会話データを手動でアノテートした。 100万件以上の会話に本手法を適用し,数十万件のフィードバックサンプルを得た。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:41:34 GMT)
Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning [25.2]
本稿では,CompoSuiteの256ドルのタスクを用いて,ロボット操作をシミュレーションするための4つのオフラインRLデータセットを提供する。エージェントが構成的タスクポリシーを学習する能力を評価するためのトレーニングおよび評価設定を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:21:48 GMT)
Pacer and Runner: Cooperative Learning Framework between Single- and Cross-Domain Sequential Recommendation [25.2]
クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインの情報を活用することでレコメンデーションパフォーマンスを向上させる。しかし、CDSRは、負の転送により特定の領域でSDSR(Single-Domain Sequential Recommendation)と比較して性能が劣る可能性がある。本稿では,各領域の負の移動度を推定し,予測損失に対する重み係数として適応的に割り当てるCDSRモデルを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:14:13 GMT)
Understanding the Importance of Evolutionary Search in Automated Heuristic Design with Large Language Models [24.4]
自動設計(AHD)は、有効物の開発を自動化する可能性についてかなりの注目を集めている。近年の大規模言語モデル(LLM)の出現は、進化的プログラム探索問題としてのAHDのフレーミングに焦点をあてて、AHDの新しい道を開いた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:21:20 GMT)
By My Eyes: Grounding Multimodal Large Language Models with Sensor Data via Visual Prompting [24.4]
マルチモーダル大言語モデル(MLLM)を用いたセンサデータに対する視覚的プロンプト手法を提案する。我々は,MLLMの視覚的プロンプトを設計し,ターゲットの知覚タスク記述と並行して可視化されたセンサデータを活用する。また、与えられた感覚タスクに合わせて最適な可視化を作成するための可視化生成装置も導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:33:54 GMT)
SfM on-the-fly: Get better 3D from What You Capture [24.1]
Structure from Motion (SfM) は、フォトグラメトリー、コンピュータビジョン、ロボティクスなどの分野で、常に研究のホットスポットとなっている。この作業は、オリジナルのSfMの上に構築され、アップデートされたバージョンには3つの新しい進歩があり、より優れた3Dをキャプチャから得ることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:56:32 GMT)
COSMU: Complete 3D human shape from monocular unconstrained images [24.1]
対象画像から完全な3次元人物形状を再構成するための新しい枠組みを提案する。本研究の目的は、入力対象に見えない再建された人体の領域において、高品質な詳細を再現することである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:06:59 GMT)
Boosting Zero-Shot Crosslingual Performance using LLM-Based Augmentations with Effective Data Selection [23.6]
大きな言語モデル(LLM)は、非常に熟練したテキストジェネレータである。ゼロショットプロンプトによるタスク固有のデータ生成にこの機能を活用します。感情分析や自然言語推論タスクにおいて,顕著なパフォーマンス向上が観察された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:00:22 GMT)
Learning Natural Consistency Representation for Face Forgery Video Detection [23.5]
本研究では,自然表現(NACO)の実写映像を自己監督的に学習することを提案する。我々の手法は、他の最先端の手法よりも優れたロバスト性を持つ。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:00:02 GMT)
Spatial-Temporal Attention Model for Traffic State Estimation with Sparse Internet of Vehicles [23.5]
コスト効率の良い交通状態推定(TSE)を実現するために,スパースIoVデータを利用する新しいフレームワークを提案する。特に,TSEの精度を向上させるために,畳み込み抑止ネットワーク(CRNet)と呼ばれる新しい空間時間アテンションモデルを提案する。このモデルは、空間的相関集約のための畳み込みニューラルネットワーク(CNN)と、注意機構に基づいて時間的相関を抽出するRetNet(RetNet)を用いる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:31:15 GMT)
Temporal Residual Guided Diffusion Framework for Event-Driven Video Reconstruction [23.5]
イベントベースのビデオ再構成は、ハイダイナミックレンジや高速モーションキャプチャ機能など、そのアドバンテージから注目を集めている。現在の方法では、連続したイベントフローからの時間情報の抽出が優先され、シーン内の低周波テクスチャの特徴に過度に強調される。本稿では,時間的・周波数的イベント前処理を効果的に活用する新しい手法である時間的残留ガイド拡散フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:48:57 GMT)
Exploring the Impact of Moire Pattern on Deepfake Detectors [23.3]
デジタルスクリーンから撮影したディープフェイク映像が検出器性能に与える影響について検討した。その結果,検出器の精度は著しく低下し,平均68%を超えなかった。このことは、現実世界のディープフェイク検出シナリオにおいて、Moirのパターン問題に対処する重要な必要性を浮き彫りにしている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:39:24 GMT)
PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition [23.3]
深層学習に基づく物体認識システムは、様々な逆方向の摂動によって容易に騙される。弱い頑丈さの1つの理由は、人間の認識プロセスのような部分ベースの帰納バイアスがないためかもしれない。これによって、認識の対角的堅牢性を改善するために、いくつかのパートベース認識モデルが提案されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:19:50 GMT)
CoLeaF: A Contrastive-Collaborative Learning Framework for Weakly Supervised Audio-Visual Video Parsing [23.1]
弱教師付き音声視覚ビデオ解析手法は,ビデオレベルラベルのみを用いて,可聴性のみ,可視性のみ,可視性のみ,可聴性のみを検出することを目的としている。埋め込み空間におけるクロスモーダルコンテキストの統合を最適化する新しい学習フレームワークであるCoLeaFを提案する。我々の実験は、CoLeaFがデータセット上で平均1.9%と2.4%のFスコアで最先端の結果を大幅に改善することを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:31:54 GMT)
Removing Undesirable Concepts in Text-to-Image Diffusion Models with Learnable Prompts [23.0]
本稿では,学習可能なプロンプトをモジュールに組み込むことにより,テキストから画像への拡散モデルから望ましくない概念を除去する手法を提案する。この学習可能なプロンプトは追加記憶として働き、望ましくない概念の知識を捉える。本研究では, 安定拡散モデルにおける本手法の有効性を実証し, 最先端消去法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:32:38 GMT)
Uncovering Latent Arguments in Social Media Messaging by Employing LLMs-in-the-Loop Strategy [23.0]
ソーシャルメディアは世論分析の自動化方法として人気が高まっている。トピックモデリングのような公共の話題からテーマを抽出する伝統的な教師なしの手法は、しばしば特定のニュアンスを捉えない過度なパターンを明らかにする。本稿では,大規模言語モデルの高度な機能を活用したLLMs-in-the-Loop戦略を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:00:46 GMT)
Discovering Latent Themes in Social Media Messaging: A Machine-in-the-Loop Approach Integrating LLMs [23.0]
ソーシャルメディアメッセージングにおける潜在テーマを明らかにするための新しいアプローチを提案する。私たちの仕事は、ソーシャルメディアのダイナミックな性質に光を当て、現実の出来事に対するメッセージのテーマ的焦点の変化を明らかにします。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:14:13 GMT)
Building Intelligence Identification System via Large Language Model Watermarking: A Survey and Beyond [22.9]
大規模言語モデル(LLM)は多種多様な産業に統合され、不正な複製と誤用により重大なセキュリティリスクが生じる。本稿では,識別過程を体系化し,より正確でカスタマイズされた透かしを実現する相互情報理論に基づく数学的枠組みを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:20:02 GMT)
APC: Adaptive Patch Contrast for Weakly Supervised Semantic Segmentation [22.8]
画像レベルラベルのみを用いたWSSS(Weakly Supervised Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic Semantic 視覚変換器(ViT)に基づく最近の手法は、信頼性の高い擬似ラベルを生成するのに優れた能力を示している。我々は、パッチ埋め込み学習を大幅に強化する、テキストパッチコントラスト(APC)と呼ばれる新しいViTベースのWSSS手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:10:05 GMT)
Pairwise Comparisons Are All You Need [22.8]
ブラインド画像品質評価(BIQA)アプローチは、様々な画像に一様に適用される一般的な品質基準に依存しているため、現実のシナリオでは不足することが多い。本稿では、従来のBIQAの制限を回避すべく設計されたペアワイズ比較フレームワークであるPICNIQを紹介する。 PICNIQは、サイコメトリックスケーリングアルゴリズムを用いることで、対比較をジャストオブジェクタブルディファレンス(JOD)の品質スコアに変換し、画像品質の粒度と解釈可能な指標を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:19:48 GMT)
Scaling Laws For Dense Retrieval [22.8]
本研究は,高密度検索モデルの性能が他のニューラルモデルと同様のスケーリング法則に従うかどうかを考察する。その結果、我々の設定下では、高密度検索モデルの性能は、モデルサイズとアノテーション数に関連する正確なパワーロースケーリングに従っていることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:48:09 GMT)
Uncertainty Calibration for Counterfactual Propensity Estimation in Recommendation [22.7]
inverse propensity score (IPS) は、観測された各インスタンスの予測誤差を重み付けするために用いられる。 IPSベースのレコメンデーションは、確率推定における誤校正によって妨げられる。本稿では,CVR予測の妥当性に基づくデバイアス化のためのモデルに依存しないキャリブレーションフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:57:30 GMT)
Diffusion Models for Audio Restoration [22.4]
本稿では拡散モデルに基づく音声復元アルゴリズムを提案する。拡散モデルは両世界の長所を組み合わせることができ、オーディオ復元アルゴリズムを設計する機会を提供する。拡散形式とそのクリーンな音声信号の条件付き生成への応用について説明する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:15:12 GMT)
An Embeddable Implicit IUVD Representation for Part-based 3D Human Surface Reconstruction [22.3]
単一の画像から3次元の人体表面を再構築するには、人間のポーズ、形状、衣服の詳細を同時に検討することが重要である。最近のアプローチでは、身体のポーズと形状をキャプチャするパラメトリックボディモデル(SMPLなど)が組み合わされている。本稿では,IUVD占有関数とフィードバッククエリアルゴリズムからなる新しいIUVD-Feedback表現を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:46:03 GMT)
Fine-Tuning and Prompt Optimization: Two Great Steps that Work Better Together [21.8]
すべてのパイプラインステージでトレーニングラベルをブートストラップして,パイプラインのプロンプトを最適化し,重みを微調整する,近似最適化戦略を評価する。プロンプトとウェイトを同時に最適化するための単純なアプローチは、直接的にウェイトのみを最適化し、平均してLMとタスクで最大65%と5%のプロンプトを単独で生成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:30:31 GMT)
MetaLLM: A High-performant and Cost-efficient Dynamic Framework for Wrapping LLMs [21.7]
分類タスクに最適な大言語モデル(LLM)に各クエリを動的にルーティングするフレームワークであるMetaLLMを紹介する。多武装バンディットとして選択問題をフレーミングすることで、MetaLLMは不確実性の下で予測精度とコスト効率のバランスをとる。 LLMプラットフォーム上で実施した本実験では,メタLLMの有効性を実世界のシナリオで示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:45:07 GMT)
SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation [21.7]
本研究では,データ・テキスト生成における合成一般化のための総合的・実践的な評価手法であるSPORを提案する。 2つの異なるデータセット上でSPORを実証し、LLMを含む既存の言語モデルを評価する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:47:29 GMT)
Dissecting Deep RL with High Update Ratios: Combatting Value Divergence [21.3]
ネットワークパラメータをリセットすることなく、深層強化学習アルゴリズムが学習能力を維持できることを示す。我々は,大規模な更新率での学習を可能にする,単純な単球正規化を採用している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:08:06 GMT)
Kinetic Typography Diffusion Model [21.2]
我々は,映像拡散モデルにおける最近の進歩を生かし,テキストの外観を視覚的に向上させる。私たちのデータセットは、プロのモーショングラフィックデザイナーによって設計された584のテンプレートで、さまざまな組み合わせで作られています。実験の結果,本モデルはテキストプロンプトに基づいて,可読性および芸術的文字運動を伴う動画像を生成することがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:04:45 GMT)
PTaRL: Prototype-based Tabular Representation Learning via Space Calibration [21.0]
タブラルデータは、医療、エンジニアリング、金融など、さまざまな現実世界の分野において、主に重要な役割を担っている。近年のディープラーニングの成功により、ディープネットワーク(Transformer、ResNetなど)に基づく機械学習(ML)メソッドの多くは、ベンチマーク上での競合的なパフォーマンスを実現している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:37:49 GMT)
Self-Evaluation as a Defense Against Adversarial Attacks on LLMs [20.8]
モデル入力の端に空間を付加するだけで、モデルディフェンスを壊すことが可能であることを示す。トークン化されたトレーニングデータに単一空間が存在する状況は、モデルにトリガーされた時にリストを生成することを奨励する。本研究は, 現行モデルアライメントの脆弱さを浮き彫りにして, より堅牢なアライメント手法の開発の重要性を推し進めるものである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:20:18 GMT)
When Heterophily Meets Heterogeneity: New Graph Benchmarks and Effective Methods [20.8]
H2GBは、グラフのヘテロフィとヘテロジニアスの性質の両方の複雑さをまとめる新しいグラフベンチマークである。ベンチマークには5つのドメインにまたがる9つの現実世界のデータセット、28のベースラインモデル実装、26のベンチマーク結果が含まれています。本稿では、モジュラーグラフ変換フレームワークUnifiedGTと新しいモデル変種H2G-formerを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:18:42 GMT)
Learning Dynamics of LLM Finetuning [20.7]
学習力学は、特定のトレーニング例の学習がモデルの他の例の予測にどのように影響するかを記述する。ステップワイズ分解の解析により,大規模言語モデルの微調整時の学習ダイナミクスについて検討した。我々のフレームワークは、命令チューニングと選好チューニングの両方のための一般的なアルゴリズムのトレーニングに関する多くの興味深い観察を均一に解釈することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:30:28 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6]
我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。以上の結果から,最高性能のLPMであるGPT-4oでもゲーム全体の8%しか解けないことがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:17:52 GMT)
Foundational Autoraters: Taming Large Language Models for Better Automatic Evaluation [20.4]
基礎的な大規模オートラタモデルのファミリーであるFLAMeを紹介する。 FLAMeは、100以上の品質評価タスクの大規模で多様なコレクションに基づいて訓練されています。 FLAMeは下流の微調整のための強力な出発点としても機能することを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:33:45 GMT)
BKDSNN: Enhancing the Performance of Learning-based Spiking Neural Networks Training with Blurred Knowledge Distillation [20.3]
スパイキングニューラルネットワーク(SNN)は、生物学的ニューラルネットワークを模倣し、離散スパイクを介して情報を伝達する。本研究は,静的およびニューロモルフィックなデータセット上でSNNをトレーニングするための最先端性能を実現する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:19:34 GMT)
Human-Modeling in Sequential Decision-Making: An Analysis through the Lens of Human-Aware AI [20.2]
私たちは、人間を意識したAIシステムを構成するものの説明を提供しようとしています。人間を意識したAIはデザイン指向のパラダイムであり、人間と対話するかもしれないモデリングの必要性に焦点を当てている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:01:54 GMT)
Integrating Amortized Inference with Diffusion Models for Learning Clean Distribution from Corrupted Images [20.0]
拡散モデル(DM)は、逆問題を解決するための強力な生成モデルとして登場した。 FlowDiffは条件付き正規化フローモデルを利用して、破損したデータソース上で拡散モデルのトレーニングを容易にする共同トレーニングパラダイムである。実験の結果,FlowDiffは広範囲の破損したデータソースにわたるクリーンな分布を効果的に学習できることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:33:20 GMT)
Improving Hyperbolic Representations via Gromov-Wasserstein Regularization [19.9]
双曲型ニューラルネットワークにおける新しい正規化機構として,Gromov-Wasserstein (GW) 距離を適用した。具体的には、双曲型ニューラルネットワークの層を輸送マップとして扱い、GW距離を計算する。我々は、トレーニングセットに基づいて計算されたGW距離が、基礎となるデータ分布のGW距離をよく近似していることを検証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:37:31 GMT)
Deep Learning on Object-centric 3D Neural Fields [19.8]
単一推論パスにおいて入力NFに対してコンパクトな潜在表現を生成可能なフレームワークであるnf2vecを導入する。 nf2vecは入力されたNFで表される3Dオブジェクトを効果的に埋め込み、その結果の埋め込みがディープラーニングパイプラインにどのように使われるかを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:13:05 GMT)
Evaluating Model Bias Requires Characterizing its Mistakes [19.8]
スキューサイズ(SkewSize)は、モデルの予測における誤りからバイアスを捉える、原則付きフレキシブルなメトリクスである。マルチクラスの設定で使用したり、生成モデルのオープンな語彙設定に一般化することができる。合成データで訓練された標準的な視覚モデル、ImageNetで訓練された視覚モデル、BLIP-2ファミリーの大規模視覚言語モデルなどである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:46:21 GMT)
All-in-one simulation-based inference [19.4]
我々は、現在の制限を克服する新しい償却推論手法、Simformerを提案する。 Simformerは、ベンチマークタスクにおける現在の最先端の償却推論アプローチより優れています。関数値パラメータを持つモデルに適用することができ、欠落または非構造化データによる推論シナリオを処理でき、パラメータとデータの合同分布の任意の条件をサンプリングすることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:45:28 GMT)
New Guarantees for Learning Revenue Maximizing Menus of Lotteries and Two-Part Tariffs [19.3]
本研究では,経済に顕著な2種類のメカニズム,すなわち宝くじのメニューと2部関税の学習可能性について検討する。我々は、宝くじのメニューと、後悔の強い保証付き二分関税のための、最初のオンライン学習アルゴリズムを提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:29:02 GMT)
BandControlNet: Parallel Transformers-based Steerable Popular Music Generation with Fine-Grained Spatiotemporal Features [19.3]
BandControlNetは、複数の音楽シーケンスに対処し、与えられた時間的制御機能に合わせた高品質な音楽サンプルを生成するように設計されている。提案したBandControlNetは、ほとんどの客観的指標において、忠実度と推論速度の点で他の条件付き音楽生成モデルよりも優れている。短いデータセットでトレーニングされた主観評価は、最先端のモデルに匹敵する品質の音楽を生成できるが、BandControlNetでは大幅にパフォーマンスが向上する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:33:25 GMT)
Benign, Tempered, or Catastrophic: A Taxonomy of Overfitting [19.1]
ニューラルネットワークを含むいくつかの補間手法は、破滅的なテスト性能を損なうことなく、ノイズの多いトレーニングデータを適合させることができる。ニューラルネットワークのような実際の補間手法は、良心的に適合しない、と我々は主張する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:54:26 GMT)
Pathology-knowledge Enhanced Multi-instance Prompt Learning for Few-shot Whole Slide Image Classification [19.1]
臨床環境では、患者のプライバシ上の懸念や、稀な疾患や新興疾患の流行により、病的スライドへのアクセスが制限されることは避けられない。本稿では,病理知識によって強化されたマルチインスタンス・プロンプト学習フレームワークを提案する。本手法は,3つの困難な臨床課題において優れた成績を示し,比較数ショット法よりも優れていた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:31:55 GMT)
FabGPT: An Efficient Large Multimodal Model for Complex Wafer Defect Knowledge Queries [19.0]
本稿では、ウェハ欠陥知識クエリのためのカスタマイズIC作成大型マルチモーダルモデルであるFabGPTを紹介する。 FabGPTは、走査型電子顕微鏡(SEM)画像における欠陥検出の専門知識を示し、根本原因分析を行い、製造プロセスについて専門的な質問回答(Q&A)を提供する。室内ファブデータ(SEM-WaD)を用いた実験により,FabGPTはウエハ欠陥検出および知識クエリにおいて大幅な性能向上を実現していることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:25:45 GMT)
Towards Arbitrary-Scale Histopathology Image Super-resolution: An Efficient Dual-branch Framework via Implicit Self-texture Enhancement [18.9]
Inlicit Self-Texture Enhancement-based dual-branch framework (ISTE) を提案する。 ISTEには、まずピクセルの特徴とテクスチャの特徴を学習するテクスチャ学習ブランチと、画素学習ブランチが含まれている。我々はISTEが既存の固定スケールおよび任意のスケールのアルゴリズムを複数の倍率で上回ることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:24:59 GMT)
Distributed Semantic Segmentation with Efficient Joint Source and Task Decoding [18.9]
ディープニューラルネットワーク(DNN)は、エッジデバイス上のネットワークの一部と、大規模クラウドプラットフォーム上での他部分を実行する。そこで本研究では,クラウド上のネットワークサイズを小さくする目的で,共同ソースとタスクデコーディングを提案する。本研究では,分散セマンティックセグメンテーションSOTAを幅広い交差点で実現し,本手法の有効性を実証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:20:04 GMT)
Static Detection of Filesystem Vulnerabilities in Android Systems [18.5]
本稿では,静的プログラム解析とアクセス制御ポリシ解析を組み合わせることで,従来の手法の限界を克服するPathSentinelを提案する。 PathSentinelは、プログラムとアクセス制御ポリシーを統一することにより、攻撃面を正確に識別し、多くの非現実的な攻撃を発生させる。脆弱性検証の合理化のため、PathSentinelは大規模言語モデル(LLM)を活用して、ターゲットとするエクスプロイトコードを生成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:10:52 GMT)
Flexible Distribution Alignment: Towards Long-tailed Semi-supervised Learning with Proper Calibration [18.4]
Longtailed semi-supervised learning (LTSSL)は、半教師付きアプリケーションのための実践的なシナリオである。この問題は、ラベル付きとラベルなしのクラス分布の相違によってしばしば悪化する。本稿では,新しい適応ロジット調整型損失フレームワークFlexDAを紹介する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:07:02 GMT)
Detecting Omissions in Geographic Maps through Computer Vision [18.4]
特定地域や特徴ランドマークを指定した地図を自動的に識別する手法を開発し,評価する。地図を非マップと区別し、表示された領域の精度を確認し、特定のランドマーク名の有無を確認する。このデータセットの実験では、特定領域のランドマークを除く地図を識別するために、この手法が85.51%のF1スコアを達成することを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:26:58 GMT)
DiarizationLM: Speaker Diarization Post-Processing with Large Language Models [18.3]
DiarizationLMは、大きな言語モデル(LLM)を利用して話者ダイアリゼーションシステムから出力を後処理するフレームワークである。このフレームワークは、市販のASRや話者ダイアリゼーションシステムにも容易に適用できる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:32:23 GMT)
FRI-Net: Floorplan Reconstruction via Room-wise Implicit Representation [18.2]
本研究では,FRI-Netと呼ばれる新しい3次元点雲からの2次元フロアプラン再構築手法を提案する。フロアプランの幾何学的事前をトレーニング戦略に組み込むことにより、生成された部屋ポリゴンはより幾何学的に規則的である。提案手法は,提案手法の有効性を実証し,提案手法の有効性を検証した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:01:44 GMT)
General algorithm of assigning raster features to vector maps at any resolution or scale [18.1]
本稿では,都市地図における特徴量(大気汚染物質の濃度)をベクトル成分(エッジで表される道路)に割り当てるアルゴリズムを提案する。我々は、グラフベースの汚染分析を行うため、1692都市の道路に正確なPM$_2.5$とNO$_2$の濃度を割り当てることを実証した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:24:00 GMT)
When Synthetic Traces Hide Real Content: Analysis of Stable Diffusion Image Laundering [18.0]
近年、高度にリアルな合成画像を作成する方法が大幅に進歩している。 SDオートエンコーダを介して画像を渡すことで、画像の合成コピーを高いリアリズムで再現することができ、視覚的アーティファクトはほとんどない。このプロセスはSD画像ロンダリング(SD image laundering)と呼ばれ、実際の画像を見た目の合成画像に変換することができ、コンテンツ認証のための法医学的分析を複雑にするリスクがある。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:01:35 GMT)
Did the Neurons Read your Book? Document-level Membership Inference for Large Language Models [18.0]
文書レベルのメンバシップを予測し,OpenLLaMA-7B上でインスタンス化するブラックボックス手法を提案する。本稿では,文書レベルのメンバシップタスクにおいて,プライバシ文献で使用される文レベルのメンバシップ推論攻撃よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:12:43 GMT)
Stop! In the Name of Flaws: Disentangling Personal Names and Sociodemographic Attributes in NLP [17.7]
名前と命名に関する学際的背景を示す。次に、社会デマログラフィー属性と名前の関連付けに固有の問題を調査する。我々は、妥当性と倫理的落とし穴を避けるために、規範的な勧告とともに指針質問を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:57:56 GMT)
Deflated Dynamics Value Iteration [17.7]
値関数の計算を高速化するために, DDVI (Deflated Dynamics Value Iteration) を提案する。 DDVI は行列分割法と行列デフレレーション法を用いて、遷移行列 $mathcalPpi$ の上位$s$支配固有構造を効果的に除去する。このことが$tildeO(gammak |lambda_s+1$is $(s+1)$-the largest eigen value of the dynamics matrix につながることを証明している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:07:05 GMT)
Enhancing Robustness to Noise Corruption for Point Cloud Model via Spatial Sorting and Set-Mixing Aggregation Module [17.6]
本研究では,個々の雑音点の影響を緩和するノイズロバストアグリゲーションモジュール,Set-Mixerを提案する。 ModelNet40-Cで行った実験によると、Set-Mixerはノイズの多い点のクラウド上でのモデル性能を大幅に向上する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:21:34 GMT)
DoubleTake: Geometry Guided Depth Estimation [17.5]
RGB画像の列から深度を推定することは、基本的なコンピュータビジョンタスクである。本稿では,現在のカメラ位置から深度マップとして描画された,ボリューム特徴と先行幾何学のヒントを組み合わせた再構成手法を提案する。本手法は, オフライン・インクリメンタルな評価シナリオにおいて, 対話的な速度, 最先端の深度推定, および3次元シーンで動作可能であることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:15:56 GMT)
Transformer for Multitemporal Hyperspectral Image Unmixing [17.4]
エンドツーエンドの教師なしディープラーニングモデルであるMultitemporal Hyperspectral Image Unmixing Transformer (MUFormer)を提案する。我々は,グローバル・アウェアネス・モジュール(GAM)とチェンジ・エンハンスメント・モジュール(CEM)の2つの重要なモジュールを紹介する。これらのモジュール間のシナジーにより、エンドメンバーとアブリダンスの変更に関するセマンティックな情報をキャプチャすることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:02:01 GMT)
On the Robustness of LDP Protocols for Numerical Attributes under Data Poisoning Attacks [17.4]
ローカルディファレンシャルプライバシ(LDP)プロトコルは、データ中毒攻撃に対して脆弱である。この脆弱性は、敵対的環境におけるLDPの堅牢性と信頼性に関する懸念を引き起こす。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:56:48 GMT)
PathoTune: Adapting Visual Foundation Model to Pathological Specialists [17.3]
PathoTuneは、病理学的または視覚的基礎モデルから病理学固有のタスクに効率的に適応するように設計されたフレームワークである。パッチレベルとWSIレベルの複数のデータセットにまたがる結果は、単一モードのプロンプトチューニングアプローチよりも優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:24:36 GMT)
Target conversation extraction: Source separation using turn-taking dynamics [17.3]
本稿では,ターゲット会話抽出の新たな課題について紹介する。その目的は,参加者の1人の話者埋め込みに基づいて,対象会話の音声を抽出することである。ニューラルネットワークを用いて、英語とマンダリンの会話データセットに対する我々のアプローチの有効性を示す。干渉話者の存在下では,2対4対4対4対4対4対4対4対7.92対2対1対1対1対1対1対1対8.19対1対1対1対4対4対4対4対2対2対2対2対2対1対1対1対1対1対1対1対1対1対1対1対1対1対1対1対1対1対1対2対2対2対2対4対1対2対2対2対2対2対2対2対2対2対1対1対1対1対1対1対1対1
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:55:27 GMT)
PolyRoom: Room-aware Transformer for Floorplan Reconstruction [17.2]
点群からフロアプランを再構築する部屋対応トランスであるPolyRoomを提案する。具体的には、トレーニング中の密集的な監視と角度情報の有効活用を可能にするため、一様サンプリングフロアプラン表現を採用する。 2つの広く使用されているデータセットの結果は、PolyRoomが現在の最先端の手法を量的にも質的にも上回っていることを示している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:53:10 GMT)
CanonicalFusion: Generating Drivable 3D Human Avatars from Multiple Images [17.1]
カノニカルフュージョン(CanonicalFusion)と呼ばれる複数の画像からアニマタブルなヒトアバターを再構成するための新しい枠組みを提案する。まず,LBS(Linear Blend Skinning)重みマップと深度マップを共有エンコーダ・デュアルデコーダネットワークを用いて予測し,予測深度マップから3次元メッシュの直接正準化を可能にする。また,複数画像から再構成した結果をマージするために,前方スキンベースの異なるレンダリング方式を導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:07:16 GMT)
Defining and Preventing Asymmetric Mempool DoS in Ethereum with saferAd [17.1]
安全定義を2つの抽象的なDoSe、すなわち退行攻撃とロック攻撃で定式化する。本稿では,メムプール保護のための安全な取引許可フレームワークであるSaferAdを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:00:44 GMT)
TCM-FTP: Fine-Tuning Large Language Models for Herbal Prescription Prediction [17.0]
伝統的な中国の医学は、症状や徴候を治療するために処方薬中のハーブの特定の組み合わせに依存している。本稿では,消化器疾患の経験者による医療記録を含む新しいデータセットであるDigestDSを紹介する。また、DigDSの教師付き微調整により、事前訓練された大規模言語モデル(LLM)を活用するためのTCM-FTP(TCM Fine-Tuning Pre-trained)を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:06:37 GMT)
iHuman: Instant Animatable Digital Humans From Monocular Videos [17.0]
モノクロビデオからアニマタブルな3Dデジタル人間を作るための,迅速かつシンプルで効果的な方法を提案する。この研究は、人間の身体の正確な3Dメッシュ型モデリングの必要性を達成し、説明します。我々の手法は(訓練時間の観点から)最も近い競合相手よりも桁違いに高速である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:51:51 GMT)
Self Pre-training with Topology- and Spatiality-aware Masked Autoencoders for 3D Medical Image Segmentation [16.8]
Masked Autoencoders (MAEs) は、自然および医学的な画像解析問題に対する事前訓練型ビジョントランスフォーマー (ViTs) に有効であることが示されている。既存のMAE事前学習手法は、ViTアーキテクチャで特別に開発されたが、幾何学的形状や空間情報をキャプチャする能力は欠けていた。本稿では,3次元医用画像セグメンテーションのための自己事前トレーニング(すなわち,同じターゲットデータセット上で事前トレーニングされたモデル)のための既知のMAEの新たな拡張を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:35:00 GMT)
Revealing Trends in Datasets from the 2022 ACL and EMNLP Conferences [16.7]
トランスフォーマーは、事前訓練された大規模言語モデル(PLM)を生んだ。高品質なデータセットの必要性から、NLP研究者は、特定のニーズを満たす新しいデータセットの作成を継続している。この研究は、これらのデータセットに含まれるトレンドと洞察を明らかにすることを目的としている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:07:16 GMT)
DDFAD: Dataset Distillation Framework for Audio Data [16.6]
ディープニューラルネットワーク(DNN)は多くのアプリケーションで大きな成功を収めている。ディープニューラルネットワーク(DNN)は多くのアプリケーションで大きな成功を収めている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:23:35 GMT)
MoE-DiffIR: Task-customized Diffusion Priors for Universal Compressed Image Restoration [16.5]
MoE-DiffIR (MoE-DiffIR) は、タスクカストマイズド拡散前処理を用いた革新的ユニバーサル圧縮画像復元法である。 MoE-DiffIRは強力なMix of-experts(MoE)プロンプトモジュールを開発する。基本プロンプトのフレキシブルな割り当てを可能にするために,分解対応ルーティング機構を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:43:27 GMT)
SEMINAR: Search Enhanced Multi-modal Interest Network and Approximate Retrieval for Lifelong Sequential Recommendation [16.4]
本稿では,SEMINAR-Search Enhanced Multi-Modal Interest Network と Approximate Retrieval という,一生涯にわたるマルチモーダルシーケンスモデルを提案する。具体的には、Pretraining Search Unitと呼ばれるネットワークが、事前トレーニング-ファインタニング方式で、マルチモーダルクエリ-イテムペアの寿命のシーケンスを学習する。マルチモーダル埋め込みのオンライン検索速度を高速化するために,マルチモーダルなコードブックベースの製品量子化戦略を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:33:30 GMT)
An Empirical Study of Validating Synthetic Data for Formula Generation [16.3]
大規模言語モデル(LLM)は、スプレッドシートで公式を書くのに役立つ。我々は、(他の)モデルを用いて、微調整のための合成自然言語発話を生成する。バリデーションは、4つのモデルにわたる生データよりも性能を向上させることを実証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:16:33 GMT)
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion [16.3]
NOVICは、革新的なuN制約付きOpen Vocabulary Imageである。埋め込みスペースを利用して、純粋なテキストから画像へのゼロショット転送を可能にする。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:53:02 GMT)
A Survey of Defenses against AI-generated Visual Media: Detection, Disruption, and Authentication [15.9]
深層生成モデルは様々なコンピュータビジョンアプリケーションで顕著な性能を示した。これらのモデルは、誤情報、偽造、著作権侵害などの悪意ある目的のために使用されることがある。本稿では,AI生成したビジュアルメディアに対する防衛研究の体系的かつタイムリーなレビューを行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:46:02 GMT)
IE-NeRF: Inpainting Enhanced Neural Radiance Fields in the Wild [15.9]
本稿では,ニューラル・ラジアンス・フィールド(NeRF)と野生の無制御写真を用いて,リアルな新しいビューを合成するための新しいアプローチを提案する。 textitInpainting Enhanced NeRF, あるいは我々のフレームワークは, 画像インパインティング技術からインスピレーションを得て, 従来のNeRFを強化する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:10:23 GMT)
An Empirical Study of Mamba-based Pedestrian Attribute Recognition [15.8]
本論文は,Mambaを2つの典型的なPARフレームワーク,テキスト画像融合アプローチと純粋ビジョンMambaマルチラベル認識フレームワークに設計・適応する。属性タグを追加入力として操作することは、必ずしも改善につながるとは限らない。具体的には、Vimを拡張できるが、VMambaではできない。これらの実験結果は、単にTransformerでMambaを拡張すれば、パフォーマンスが向上するだけでなく、特定の設定でより良い結果が得られることを示している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 00:48:06 GMT)
CompAct: Compressing Retrieved Documents Actively for Question Answering [15.6]
CompActは、キー情報を失うことなく、広範囲のドキュメントを格納するためのアクティブな戦略を採用した、新しいフレームワークである。実験により,マルチホップ質問応答ベンチマークにおいて,CompActは性能と圧縮率に大きな改善をもたらすことが示された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:19:46 GMT)
ChEX: Interactive Localization and Region Description in Chest X-rays [15.6]
レポート生成モデルは、胸部X線のような医療画像の微細なテキスト解釈を提供する。レポート生成モデルは、しばしば相互作用性(すなわち、ユーザクエリを通じて生成プロセスをステアリングする能力)と局所的解釈可能性に欠ける。本稿では,テキストプロンプトとバウンディングボックスを統合した新しいマルチタスクアーキテクチャとトレーニングパラダイムを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:22:15 GMT)
Large Language Models as Biomedical Hypothesis Generators: A Comprehensive Evaluation [15.5]
大規模言語モデル(LLM)は、知識相互作用に革命をもたらす有望なツールとして登場した。バイオメディカル文献から背景と仮説のペアのデータセットを構築し、トレーニング、観察、および見えないテストセットに分割する。最上位モデルの仮説生成能力を、ゼロショット、少数ショット、微調整設定で評価する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:27:07 GMT)
(De)Noise: Moderating the Inconsistency Between Human Decision-Makers [15.3]
本研究では, アルゴリズムによる意思決定支援が, 不動産評価の文脈における人間の意思決定の不整合度を緩和するのに有効かどうかを検討する。 i) アルゴリズムによって選択されたペアワイド比較において, 回答者に見積をレビューするよう求めることと, (ii) 従来の機械的アドバイスを回答者に提供することは, 人間の反応に影響を与える効果的な方法であることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:24:36 GMT)
Fundamental Benefit of Alternating Updates in Minimax Optimization [15.2]
Gradient Descent-Ascent gradients (GDA) アルゴリズムは、最小限の最適化問題を解決するために設計されている。 Alt-GDAはイテレーションを早く収束させるのが一般的であるが、両者のパフォーマンスギャップはまだよく理解されていない。本稿では,強いコンケーブとリプシッツの勾配目的に対する両アルゴリズムの微細収束解析について述べる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:21:28 GMT)
ScoreCL: Augmentation-Adaptive Contrastive Learning via Score-Matching Function [14.9]
自己教師付きコントラスト学習(CL)は表現学習において最先端のパフォーマンスを達成した。各種CL法を一貫して改良することにより,ScoreCLと呼ばれる手法の汎用性を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:21:08 GMT)
MultiDelete for Multimodal Machine Unlearning [14.8]
MultiDeleteは、アンラーニング中の非モーダルデータポイント間の関連を分離するように設計されている。アンラーニング後のオリジナルのモデルのマルチモーダルとユニモーダルの知識を維持できる。敵の攻撃に対して、未学習のデータに対するより優れた保護を提供することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:40:54 GMT)
Domain Generalization for 6D Pose Estimation Through NeRF-based Image Synthesis [14.6]
本研究では,6次元ポーズ推定ネットワークの一般化能力を向上させるために,列車セットの多様性を高める新しい拡張手法を提案する。この目的のために、ニューラルネットワーク場は合成画像から訓練され、拡張集合を生成するために利用される。本研究では,宇宙船のポーズ推定の難易度に関する拡張手法を検証するとともに,ポーズ推定の一般化能力を大幅に向上させることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:42:08 GMT)
Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Efficiency in RAG Systems [14.6]
Retrieval-augmented Generation (RAG)技術は、大規模言語モデル(LLM)のコンテキスト内学習機能を利用して、より正確で関連する応答を生成する。重要なコンポーネントであるQuery Rewriterモジュールは、検索フレンドリーなクエリを生成することで知識検索を強化する。これら4つのRAGモジュールは、RAGシステムの応答品質と効率を相乗的に改善する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:35:00 GMT)
Pan-cancer Histopathology WSI Pre-training with Position-aware Masked Autoencoder [14.6]
設計した位置認識マスク付きオートエンコーダ(PAMA)を用いたパンカンサーWSIレベルの事前学習のための新しい自己教師型学習フレームワークを提案する。その結果, PAMAがWSI表現学習の一般化と差別化に有効であること, パン・カンサーWSI事前学習の有効性が示された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:15:50 GMT)
InversionView: A General-Purpose Method for Reading Information from Neural Activations [14.6]
この情報は、同様のアクティベーションを引き起こす入力のサブセットによって具現化されていると我々は主張する。 InversionViewを提案し、アクティベーションに条件付きトレーニングされたデコーダモデルからサンプリングすることで、このサブセットを実際に検査することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:30:52 GMT)
Score-based Generative Priors Guided Model-driven Network for MRI Reconstruction [14.5]
そこで本研究では,モデル駆動型ネットワークトレーニングの先駆的な先駆的手法として,ナイーブなSMLDサンプルが用いられる新しいワークフローを提案する。まず,予備指導画像(PGI)としてサンプルを生成するために,事前学習スコアネットワークを採用した。第2のステップでは,PGIからアーティファクトやノイズを粗く除去するデノナイジングモジュール(DM)を設計した。第3に、より詳細な詳細を復元するために、識別されたPGIによって誘導されるモデル駆動ネットワークを設計した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:54:32 GMT)
Addressing Image Hallucination in Text-to-Image Generation through Factual Image Retrieval [14.5]
本稿では,外部から取得した実写画像を用いて現実的な画像を生成する手法を提案する。 InstructPix2Pix や IP-Adapter といった既製の画像編集ツールを使って、検索した画像の事実情報を活用する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:59:03 GMT)
The Role of Masking for Efficient Supervised Knowledge Distillation of Vision Transformers [14.5]
本稿では,ViT蒸留の監督コストを削減するための簡易な枠組みを開発する。入力トークンをマスキングすることで、教師のパラメータやアーキテクチャを変更することなく、マスクされたトークンに関連する計算をスキップすることができる。学生の注意点が最も低いマスキングパッチは極めて有効であり,教師のFLOPの最大50%を学生の精度の低下なしに節約できることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:37:04 GMT)
Wavelet Convolutions for Large Receptive Fields [14.4]
本稿では、Wavelet Transform (WT) を利用して、非常に大きな受容場を得ることができることを示す。 WTonvレイヤは、既存のアーキテクチャのドロップイン代替として使用することができる。画像劣化に対するロバスト性やテクスチャ上の形状に対する応答の増大など,さらなる特性が得られることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:39:57 GMT)
Graphusion: Leveraging Large Language Models for Scientific Knowledge Graph Fusion and Construction in NLP Education [14.4]
フリーテキストからのゼロショット知識グラフフレームワークであるGraphusionを紹介する。核融合モジュールは、エンティティのマージ、競合解決、新しい三重項発見を取り入れた三重項のグローバルなビューを提供する。本評価は,リンク予測における教師付きベースラインの精度を最大10%超えることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:13:49 GMT)
Asymmetric Mask Scheme for Self-Supervised Real Image Denoising [14.2]
本稿では,盲点操作を不要とする自己指導型聴覚訓練のためのマスク方式を提案する。提案手法は,非対称マスク方式をトレーニングや推論に用い,既存の実雑音画像データセットの最先端性能を実現する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:34:38 GMT)
Word Order in English-Japanese Simultaneous Interpretation: Analyses and Evaluation using Chunk-wise Monotonic Translation [13.7]
本稿では,ソース言語の単語順に従う単調翻訳の特徴を同時解釈(SI)で解析する。 NAIST英語と日本語の単調翻訳評価データセットを用いて,チャンクワイド単調翻訳(CMT)文の特徴を解析した。さらに,既存の音声翻訳(ST)と同時音声翻訳(simulST)モデルからの出力を評価し,CMT文の特徴について検討した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:42:02 GMT)
Random Channel Ablation for Robust Hand Gesture Classification with Multimodal Biosignals [13.4]
マルチモーダルバイオシグナーに基づく手ジェスチャー分類は、効果的な人間と機械の相互作用の重要な構成要素である。本稿では、学習過程におけるランダムチャネルアブレーション(RChA)を用いて、データの欠落したチャネルに対して、分類器を堅牢化することを提案する。 5倍のクロスバリデーションを平均12.2%,24.5%改善し,最大4チャンネルと8チャンネルのジェスチャー分類を行った。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:23:53 GMT)
GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM [13.4]
GPT-4oは、微調整がなくても、前腕超音波データから手の動きを復号できることを示す。また,GPT-4oは,テキスト内学習の少ない場面で改善可能であることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:18:06 GMT)
TimeAutoDiff: Combining Autoencoder and Diffusion model for time series tabular data synthesizing [13.4]
本稿では、遅延拡散モデルのパワーを活用して、合成時系列表データを生成する。可変オートエンコーダ(VAE)と拡散確率モデル(DDPM)のアイデアを組み合わせることでこの問題に対処する。 textttTimeAutoDiffという名前の私たちのモデルは、(1)汎用性:単一から複数シーケンスのデータセットの幅広い時系列データを処理できる能力など、いくつかの大きな利点があります。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:36:30 GMT)
Enhancing Stochastic Optimization for Statistical Efficiency Using ROOT-SGD with Diminishing Stepsize [13.4]
本稿では,最適化と統計効率のギャップを埋める手法であるtextsfROOT-SGDを再検討する。提案手法は, 念入りに設計したステップサイズ戦略を統合することにより, テキストfROOT-SGDの性能と信頼性を向上させる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:54:03 GMT)
Emergent Visual-Semantic Hierarchies in Image-Text Representations [13.3]
既存の基盤モデルの知識について検討し、視覚・意味的階層の創発的な理解を示すことを明らかにする。本稿では,階層的理解の探索と最適化を目的としたRadial Embedding (RE)フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:40:44 GMT)
Three Dogmas of Reinforcement Learning [13.3]
現代の強化学習は、少なくとも3つのドッグマによって条件付けられている。ひとつは環境スポットライトであり、エージェントではなく環境をモデリングする傾向を示している。 2つ目は、適応ではなく、タスクの解決策を見つけるものとしての学習の扱いです。 3つ目は報酬仮説であり、すべての目標と目的は報奨信号としてよく考えることができるというものである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:03:24 GMT)
Towards Adversarially Robust Vision-Language Models: Insights from Design Choices and Prompt Formatting Techniques [12.9]
VLM(Vision-Language Models)は、研究と現実世界の両方の応用が急増しているのを目撃している。本研究は,画像ベース攻撃に対するVLMの対角的ロバスト性に対するモデル設計選択の影響を系統的に検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:01 GMT)
Masked Generative Video-to-Audio Transformers with Enhanced Synchronicity [12.8]
本稿では,V2A生成モデルであるMaskVATを提案する。提案手法は,高品質なオーディオ・ビジュアル特徴とシーケンス・ツー・シーケンス並列構造を組み合わせることで,高い同期性が得られることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:49:59 GMT)
Sibyl: Simple yet Effective Agent Framework for Complex Real-world Reasoning [12.8]
Sibylは、最小限のツールセットを効率的に活用することによって、複雑な推論タスクに取り組むように設計された強力なフレームワークである。 Sibylは、最終回答を自己定義し、包括的でバランスの取れたアプローチを確保するために、マルチエージェントの議論に基づく陪審を実施。 GAIAベンチマークテストセットの実験結果から,Sibylエージェントは平均スコア34.55%の最先端性能を実現していることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:45:40 GMT)
A Fast, Robust Elliptical Slice Sampling Implementation for Linearly Truncated Multivariate Normal Distributions [12.8]
スライススサンプリング(スライスススライスススライスススライスススライスス)は、マルコフ連鎖モンテカルロ法である。本論文の主な新規性は,$mathcalO(m log m)$時間で交点を計算するアルゴリズムである。このアルゴリズムに基づく実装により、数値安定性が向上し、実行時間を短縮し、複数のマルコフ連鎖を起動するために並列化が容易であることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:40:11 GMT)
GuideLight: "Industrial Solution" Guidance for More Practical Traffic Signal Control Agents [12.5]
強化学習(RL)に基づく交通信号制御(TSC)法は,従来の手法よりも優れていることが証明されている。しかし、ほとんどのRL法は、入力、出力、サイクル-フロー関係という3つの要因により、実世界で適用した場合に困難に直面している。我々は、RLエージェントをガイドする業界ソリューションを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:26:10 GMT)
Effective Motion Modeling for UAV-platform Multiple Object Tracking with Re-Margin Loss [12.3]
無人航空機プラットフォームからの複数の物体追跡には、効率的な動きモデリングが必要である。本稿では,最小コストで高精度な動作モデリングを実現するためのフロー・バイ・検出モジュールを提案する。提案モデルでは, 大規模かつ不規則な動きを伴う物体の追跡に成功し, UAV-MOTタスクにおける既存の最先端手法より優れる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:13:27 GMT)
R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection [12.2]
3次元異常検出は、精密製造における局所固有の欠陥のモニタリングにおいて重要な役割を担っている。埋め込みベースおよび再構築ベースのアプローチは、最も人気があり、成功した方法の一つである。本稿では, 高精度な3次元異常検出のための拡散モデルにより, 異常点雲を再構成するR3D-ADを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:10:58 GMT)
A Survey on Consumer IoT Traffic: Security and Privacy [12.1]
CIoTセキュリティとプライバシドメイン内のトラフィック分析に関する310のパブリッシュをレビューした。 CIoTは、新たな課題と研究機会を導入する可能性のある、特別な新しい特徴を提供する。我々は既存の研究を応用目的に応じて分類した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:05:13 GMT)
Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning [12.1]
オフラインの強化学習では、アウト・オブ・ディストリビューションの課題が強調される。既存の手法は、しばしば政策規則化を通じて学習されたポリシーを制約する。適応アドバンテージ誘導政策正規化(A2PR)を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:55:57 GMT)
Variational Quantum Imaginary Time Evolution for Matrix Product State Ansatz with Tests on Transcorrelated Hamiltonians [12.0]
マトリックス生成物状態(MPS)アンザッツは、分子ハミルトンの基底状態を見つけるための有望なアプローチを提供する。本稿では,変分量子想像時間進化(VarQITE)手法を用いて,QCMPSアンサッツの最適化性能を向上させる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:28:52 GMT)
Wicked Oddities: Selectively Poisoning for Effective Clean-Label Backdoor Attacks [12.0]
クリーンラベル攻撃は、毒性のあるデータのラベルを変更することなく攻撃を行うことができる、よりステルスなバックドア攻撃である。本研究は,攻撃成功率を高めるために,標的クラス内の少数の訓練サンプルを選択的に毒殺する方法について検討した。私たちの脅威モデルは、サードパーティのデータセットで機械学習モデルをトレーニングする上で深刻な脅威となる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:38:21 GMT)
Bidirectional Stereo Image Compression with Cross-Dimensional Entropy Model [12.0]
BiSICは対称ステレオ画像圧縮アーキテクチャである。本研究では,局所的な特徴を捉え,グローバルな特徴を活用するために双方向の注意ブロックを組み込む3次元畳み込みに基づくバックボーンを提案する。提案するBiSICは,従来の画像/ビデオ圧縮規格より優れている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:36:22 GMT)
Any-Property-Conditional Molecule Generation with Self-Criticism using Spanning Trees [12.0]
Spanning Tree-based Graph Generation (STGG)は有効な分子の生成を保証するための有望なアプローチである。本研究では,STGGをマルチプロパティ条件生成に拡張する。この結果から,STGG+は分布内および分布外条件生成における最先端の性能を達成できることが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:10:13 GMT)
Differentiable Voxelization and Mesh Morphing [11.7]
本研究では3次元メッシュのドッキング数と固体角による微分可能なボキセル化を提案する。提案手法は, 3次元メッシュの高速, フレキシブル, 高精度なボキセル化を実現する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:39:03 GMT)
Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes [11.6]
参照音声・視覚的伝統(Ref-AVS)と呼ばれる新しいタスクを導入する。 Ref-AVSはマルチモーダルキューを含む式に基づいてオブジェクトをセグメント化する。本稿では,マルチモーダルキューを適切に活用し,正確なセグメンテーションガイダンスを提供する手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:54:45 GMT)
TME-Box: Scalable In-Process Isolation through Intel TME-MK Memory Encryption [11.5]
クラウドコンピューティングは、単一のプロセス内でワークロードを実行することでパフォーマンスを最適化するために、プロセス内分離に依存している。既存のプロセス内分離メカニズムは、現代的なクラウド要件には適していない。本稿では,コモディティx86マシン上で細粒度でスケーラブルなサンドボックスを実現する,新しい分離技術であるTME-Boxを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:09:00 GMT)
You Only Sample Once: Taming One-Step Text-to-Image Synthesis by Self-Cooperative Diffusion GANs [11.5]
YOSOは、高速でスケーラブルで高忠実なワンステップ画像合成のために設計された、新しい生成モデルである。 YOSOは,一段階のモデルトレーニングをスクラッチから行うことができ,競争性能が向上することを示す。特に、512の解像度で訓練された1ステップで画像を生成できる最初の拡散変換器を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:51:48 GMT)
iSNEAK: Partial Ordering as Heuristics for Model-Based Reasoning in Software Engineering [11.2]
iSNEAKは、インクリメンタルなAI問題解決ツールである。情報過負荷問題を解決するため,iSNEAKのような部分順序付けやツールを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:59:27 GMT)
EdVAE: Mitigating Codebook Collapse with Evidential Discrete Variational Autoencoders [11.1]
コードブックの崩壊は、離散表現空間を持つ深層生成モデルの訓練において一般的な問題である。本稿では,dVAEのコードブック崩壊問題に対処するために,ソフトマックスの代わりに顕在的深層学習(EDL)を組み込む新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:57:48 GMT)
Constrained 6-DoF Grasp Generation on Complex Shapes for Improved Dual-Arm Manipulation [11.0]
本研究では,任意のジオメトリを持つオブジェクトに一般化した拡散に基づくグリップ生成モデルであるConstrained Grasp Diffusion Fieldsを提案する。本手法は,複雑なオブジェクトに対して安定なグリップを生成するために一般化できることを示し,特にデュアルアーム操作設定に有用である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:45:57 GMT)
Pseudo-RIS: Distinctive Pseudo-supervision Generation for Referring Image Segmentation [11.0]
画像セグメンテーション(RIS)を参照するための疑似監督として,参照表現を用いた高品質セグメンテーションマスクを自動生成する新しいフレームワークを提案する。本手法は, RISベンチマークデータセットにおいて, 弱いSoTA法とゼロショットSoTA法の両方を著しく上回っている。また、未確認領域における完全に教師された手法を超越し、RIS内のオープンワールドの課題に取り組む能力を証明している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:35:32 GMT)
Temporal-spatial Adaptation of Promptable SAM Enhance Accuracy and Generalizability of cine CMR Segmentation [10.9]
本研究では,時間的情報と空間的情報の両方をモデルアーキテクチャに組み込んだcineCMR-SAMを提案する。 STACOM 2011データセットでは,データ固有モデルのセグメンテーション精度が向上した。我々はcineCMR-SAMにテキストプロンプト機能を導入し、入力スライスのビュータイプを指定する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:22:28 GMT)
Learning to Rasterize Differentiably [10.8]
微分可能化は、画素から下層の三角形へのフローを可能にすることにより、プリミティブ化の標準的な定式化を変える。これまでの研究は、軟化のいくつかの組み合わせを分析し、比較してきた。本研究では, ソフト化操作を選択する代わりに, 一般的なソフト化操作の連続空間をパラメータ化する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:36:45 GMT)
Near-deterministic quantum search algorithm without phase control [10.8]
グローバーのアルゴリズムは、4つのうち1つを検索した場合にのみ、ターゲット項目を確実に見つけることができる。位相制御のないほぼ決定論的量子探索アルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:20:47 GMT)
Expanding the Scope: Inductive Knowledge Graph Reasoning with Multi-Starting Progressive Propagation [10.6]
本稿では、条件付きメッセージパッシングニューラルネットワーク(C-MPNN)を利用した新しい帰納的KG推論モデルMStarを提案する。キーとなる洞察は、複数のクエリ固有の開始エンティティを選択して、プログレッシブな伝播の範囲を広げることです。実験結果から,MStarは最先端モデルと比較して優れた性能を示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:16:20 GMT)
LLM Circuit Analyses Are Consistent Across Training and Scale [10.5]
我々は,デコーダのみの言語モデルにおいて,300億の訓練トークンにまたがるモデル機構の出現と進化について検討する。タスク能力とそれらをサポートする機能コンポーネントは、スケールにわたって同じトークン数で一貫して現れます。これらの結果から, 事前学習終了時の小モデルに対する回路解析は, 追加の事前学習やモデルスケールの超越後においても適用可能な知見を与えることが可能であることが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:38:51 GMT)
UICrit: Enhancing Automated Design Evaluation with a UICritique Dataset [10.4]
983のモバイルUIに対して,設計批判と品質評価をターゲットとしたデータセットを提示する。 LLM生成UIフィードバックにおける55%のパフォーマンス向上を実現するために,このデータセットを適用した。生成UI技術に対する報酬モデルのトレーニングを含む,このデータセットの今後の応用について論じる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:46:08 GMT)
Can Textual Semantics Mitigate Sounding Object Segmentation Preference? [10.4]
音声は視覚に比べて頑健な意味論が欠如しており、視覚空間上での音声誘導の弱さをもたらすと我々は主張する。テキストのモダリティがよく探求され、豊富な抽象的意味論を含むという事実に触発され、視覚シーンからのテキストキューを活用して音声誘導を強化することを提案する。本手法は,3つのサブセットすべてに対して高い競争性能を達成し,テキストキューに助けられた場合の音声に対する感度の向上を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:45:20 GMT)
FedTSA: A Cluster-based Two-Stage Aggregation Method for Model-heterogeneous Federated Learning [10.3]
FedTSAは、フェデレートラーニング(FL)におけるシステム不均一性に適したクラスタベースの2段階アグリゲーション手法である我々は,FedTSAがベースラインを上回り,モデル性能に影響を及ぼす様々な要因を探索することを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:19:30 GMT)
MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models [10.2]
英語,日本語,中国語の21のサブデータセットを含むMultilingual MRE混合データセット(MMM)を提案する。また,Large Language Models (LLM) を用いたデータセット翻訳手法を提案する。オープンドメイン情報抽出大言語モデル(OIELLM)を学習するための統合入力出力フレームワークを開発する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:50:43 GMT)
Latent Linear Quadratic Regulator for Robotic Control Tasks [10.1]
本稿では、状態空間を潜在空間にマッピングする、$textbfla$tent $textbfl$inear $textbfq$uadratic $textbfr$egulator (LaLQR)を提案する。実験では、LaLQRの他のベースラインに比べて効率と一般化が優れていることが示された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:22:52 GMT)
DeepGate3: Towards Scalable Circuit Representation Learning [9.9]
回路表現学習は電子設計自動化(EDA)の分野を前進させる有望な成果を示した DeepGate Familyのような既存のモデルは、主にグラフニューラルネットワーク(GNN)を使用して、回路網リストをゲートレベルの埋め込みにエンコードする。我々は,最初のGNN処理に従ってTransformerモジュールを統合する拡張アーキテクチャであるDeepGate3を紹介する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:44:21 GMT)
OPa-Ma: Text Guided Mamba for 360-degree Image Out-painting [9.9]
我々は,従来の狭視野画像(NFoV)から360度画像を生成するという,最近の話題に対処する。この課題は、NFoV画像から合理的で一貫した環境を予測することを目的としている。そこで本稿では,Mambaと呼ばれる状態空間モデルを備えた新しいテキスト誘導アウトペイントフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:23:00 GMT)
Boost Your NeRF: A Model-Agnostic Mixture of Experts Framework for High Quality and Efficient Rendering [9.9]
本研究では,Sparsely-Gated Mixture of Expertsにインスパイアされたモデル非依存のフレームワークを導入し,計算複雑性を増大させることなくレンダリング品質を向上させる。本稿では,専門家の能力を最大化するために設計された新しいゲートの定式化と,空間を効果的に誘導し,シーンを分解する解像度ベースのルーティング手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:58:54 GMT)
3D Feature Distillation with Object-Centric Priors [9.6]
CLIPのような2Dビジョン言語モデルは、2Dイメージのオープン語彙グラウンドディングに優れた機能を備えているため、広く普及している。最近の研究は、特徴蒸留によって2D CLIP機能を3Dに高めることを目的としているが、シーン固有のニューラルネットワークを学ぶか、室内のスキャンデータにフォーカスする。提案手法は, 3次元CLIPの特徴を再構築し, 接地能力と空間的整合性を改善した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:23:33 GMT)
The Medium is the Message: How Secure Messaging Apps Leak Sensitive Data to Push Notification Services [9.5]
本研究では、Androidデバイスにプッシュ通知を送信するために、セキュアメッセージングアプリのGoogleのCloud Messaging(FCM)サービスの使用について調査した。われわれはGoogle Play Storeから人気の高い21のセキュアメッセージングアプリを分析し、FCM経由で送られたプッシュ通知のペイロードにリークする個人情報を判定した。 FCMにリークされたデータはすべて、これらのアプリのプライバシー開示で具体的には公開されていません。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:13:30 GMT)
3M-Health: Multimodal Multi-Teacher Knowledge Distillation for Mental Health Detection [9.5]
メンタルヘルス分類のためのマルチモーダル・マルチティーラー知識蒸留モデルを提案する。多様な特徴を統合するための単純な結合にしばしば依存する従来のアプローチとは異なり、我々のモデルは様々な性質の入力を適切に表現するという課題に対処する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:53:12 GMT)
Explicit Modelling of Theory of Mind for Belief Prediction in Nonverbal Social Interactions [9.3]
マルチモーダル入力から人間の社会的相互作用における信念とそのダイナミクスを予測するための、心の理論(ToM)ニューラルネットワークであるMToMnetを提案する。 MToMnetはコンテキストキューを符号化し、個人固有のキュー(人間の視線とボディランゲージ)を、それぞれ個別のMindNetに統合する。以上の結果から,MToMnetは既存の手法をはるかに上回り,同時にパラメータも大幅に少なくなることが明らかとなった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:42:29 GMT)
BatchPrompt: Accomplish more with less [9.2]
BatchPromptはトークン制限内でデータをバッチする効率的な方法である。効率を保ち、性能損失を克服するために、バッチの置換と組立を提案する。これは、大規模言語モデルの高速化を技術的に改善する最初の試みである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:42:34 GMT)
Static and multivariate-temporal attentive fusion transformer for readmission risk prediction [9.1]
ICU患者の短期的寛解を予測するため, SMTAFormer を新たに提案する。提案手法の精度は最大86.6%であり,受信機動作特性曲線(AUC)の面積は最大0.717である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:42:44 GMT)
Evaluating Large Language Models with fmeval [9.0]
fmevalは大規模な言語モデル(LLM)をさまざまなタスクで評価するオープンソースライブラリである。実践者は、タスクパフォーマンスのモデルと、複数の責任あるAI次元を評価するのに役立ちます。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:15:08 GMT)
Optical Diffusion Models for Image Generation [8.9]
拡散モデルは、初期供給されたランダム分布から徐々にノイズを減らし、新しいサンプルを生成する。この推論手順は、トレーニングされたニューラルネットワークを何回も使用して最終的な出力を得るのが一般的である。本研究では,半透明媒質を透過する光ビームの伝搬をプログラムし,画像サンプルにデノナイズ拡散モデルを実装することを実証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:46:14 GMT)
Offline Reinforcement Learning with Imputed Rewards [8.9]
本稿では,報酬を付与した環境遷移のごく限られたサンプルから報酬信号を推定できるリワードモデルを提案する。その結果、元のデータセットからの報酬ラベル付き遷移の1%しか使用していないため、学習した報酬モデルは残りの99%の遷移に対して報酬を付与できることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:53:13 GMT)
Enabling MCTS Explainability for Sequential Planning Through Computation Tree Logic [8.8]
モンテカルロ木探索(MCTS)は、シーケンシャルな計画作業のための最も有能なオンライン検索アルゴリズムの1つである。実世界のデプロイメントにおけるパフォーマンスは高いが、MCTSの本質的な計算は、技術的なバックグラウンドのないユーザにとって理解を困難にしている。本稿では,MCTSを交通ルーティングサービスに利用し,最適化された経路計画を構築するためにアルゴリズムを統合することを検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:35:09 GMT)
Probability Passing for Graph Neural Networks: Graph Structure and Representations Joint Learning [8.4]
グラフニューラルネットワーク(GNN)は、幅広い領域にわたる非ユークリッドデータの解析において顕著な成功を収めている。この問題を解決するために、ノード特徴の類似性やエッジ確率を計算することにより、タスク固有の潜在構造を推論するために、遅延グラフ推論(LGI)を提案する。本稿では,隣接ノードのエッジ確率を集約することにより,生成したグラフ構造を洗練するためのProbability Passingという新しい手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:01:47 GMT)
MeanCache: User-Centric Semantic Cache for Large Language Model Based Web Services [8.4]
キャッシングは、繰り返しクエリの推論コストを削減するための自然なソリューションである。本稿では,LLMベースのサービスのためのユーザ中心セマンティックキャッシュであるMeanCacheを紹介する。 MeanCacheは、セマンティックに類似したクエリを特定して、キャッシュヒットやミスを判定する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:33:58 GMT)
Heterogenous Multi-Source Data Fusion Through Input Mapping and Latent Variable Gaussian Process [8.3]
提案するフレームワークは,3つの工学的ケーススタディに基づいて実証および解析を行った。単一のソースモデルに対して予測精度が向上し、変換されるがソースモデルは認識されない。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:27:04 GMT)
The Minimax Risk in Testing Uniformity of Poisson Data under Missing Ball Alternatives within a Hypercube [8.3]
本研究は,様々なカテゴリーの項目が同一のポアソン分布に収まることの良さを検証することの課題について考察する。代替仮説のクラスとして、超真空から半径$epsilon$の$ell_p$ ball, $p leq 2$の除去を考える。期待されるサンプル数$n$とカテゴリ数$N$が無限に、$epsilon$が小さければ、ミニマックスの確率は2Phi(-n N2-2/p epsになる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:30:00 GMT)
Generalizable Physics-Informed Learning for Stochastic Safety-Critical Systems [8.3]
十分なリスク事象を伴わない短期サンプルを用いて,長期的リスク確率とその勾配を評価するための効率的な手法を提案する。提案手法は, サンプル効率を向上し, 未確認領域を一般化し, システムパラメータの変化に適応できることをシミュレーションで示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:47:42 GMT)
Topo4D: Topology-Preserving Gaussian Splatting for High-Fidelity 4D Head Capture [8.2]
自動幾何およびテクスチャ生成のための新しいフレームワークであるTopo4Dを提案する。まず、時系列面を固定位相を持つ動的3次元ガウス面の集合として表現する。次に、高品質な幾何学とテクスチャ学習のためのフレーム・バイ・フレームの代替的な幾何学とテクスチャ最適化を行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:20:03 GMT)
Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process [8.2]
提案手法は、2つの数学的(表現パラボラ問題、2D Ackley関数)と2つの材料科学(FeCrAlおよびSmCoFe合金の設計)のケーススタディを用いて実証および解析を行った。単一のソースとソースを意識しないMLモデルと比較して,提案するマルチソースデータ融合フレームワークは,スパースデータ問題,ソースに対する解釈可能性,異なるソース間の相関や関係を利用してモデリング能力を向上させることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:03:07 GMT)
Deep Causal Learning to Explain and Quantify The Geo-Tension's Impact on Natural Gas Market [8.2]
我々は、天然ガス需要の重要な要因を特定するために、ディープニューラルネットワークベースのGranger因果関係を用いる。結果として生じる依存関係は、戦争の勃発なしに対実的なケースを構築するために使用されます。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:28:26 GMT)
Improving Medical Multi-modal Contrastive Learning with Expert Annotations [8.1]
eCLIPはCLIPモデルの強化版であり、放射線学者の眼球熱マップの形で専門家アノテーションを統合する。対照的なマルチモーダル医療画像解析における重要な課題、特にデータ不足と「モダリティギャップ」に対処する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:35:13 GMT)
Sparse Transformer with Local and Seasonal Adaptation for Multivariate Time Series Forecasting [8.0]
3つのスパース成分からなるドーザー注意機構を提案する。これらのコンポーネントは、局所性、季節性、グローバルな時間的依存関係を含む、MSSデータの本質的な属性をキャプチャするために設計されている。 MTS予測タスクに対するDozer Attentionメカニズムを取り入れたDozerformer Frameworkを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:59:42 GMT)
PEGASUS: Physically Enhanced Gaussian Splatting Simulation System for 6DoF Object Pose Dataset Generation [7.9]
6DOFオブジェクトポーズデータセット生成のためのPhysically Enhanced Gaussian Splatting Simulation System (PEG)を導入する。環境や物体の表現は、コモディティカメラを用いて容易に得ることができ、ガウススプラッティングで再構成することができる。本研究では,PEGが生成したデータに対するトレーニングにより,合成データから実世界のデータへのポーズ推定ネットワークの転送に成功できることを実証した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:41:16 GMT)
Think-on-Graph 2.0: Deep and Interpretable Large Language Model Reasoning with Knowledge Graph-guided Retrieval [7.9]
Think-on-Graph 2.0は、知識グラフと質問を一致させ、ナビゲーションツールとして使用する、拡張されたRAGフレームワークである。 KG誘導航法は、論理的整合性を維持するために深海と長距離の関連を育成する。 ToG$2.0$は、LLMの応答の精度と信頼性を改善するだけでなく、ハイブリッド構造化知識システムの可能性も示している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:20:40 GMT)
Learning Distributions on Manifolds with Free-form Flows [7.8]
本稿では,多様体上のデータ生成モデルであるManifold Free-Form Flows (M-FFF)を提案する。 M-FFF は、既知の射影を持つ任意の多様体に直接適応する。従来のシングルステップメソッドと一貫して一致したり、性能が良くなったりします。典型的には2桁の推論速度を持つ多段階法と競合する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:19:13 GMT)
OmniGenome: Aligning RNA Sequences with Secondary Structures in Genomic Foundation Models [7.6]
OmniGenomeは、構造コンテキスト化モデリングを使用して二次構造でシーケンスをブリッジする。その結果、OmniGenomeは複雑なRNAサブタスク上で最先端のパフォーマンスを達成することがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:10:40 GMT)
A Multi-Stage Framework for 3D Individual Tooth Segmentation in Dental CBCT [7.6]
コーンビームCT(CBCT)は歯科疾患の診断方法として一般的である。深層学習に基づく手法は、医用画像処理において説得力のある結果を得た。歯科用CBCTにおける3次元歯の一般化のための多段階フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:23:28 GMT)
Early Career Developers' Perceptions of Code Understandability. A Study of Complexity Metrics [7.5]
低理解力はコーディングの労力を増大させ、コードの誤解釈は開発プロセス全体に影響を与えます。私たちの研究は、McKabe Cyclomatic ComplexityやCognitive Complexityが、開発者が認識するコード理解可能性の予測に有効かどうかを調査します。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:27:03 GMT)
Reducing the Filtering Effect in Public School Admissions: A Bias-aware Analysis for Targeted Interventions [7.5]
DOEが「不利」と分類する学生の得点分布の変化が示される。集中的に計画された介入は、奨学金やトレーニングを通じてバイアスの影響を著しく低減できることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:49:48 GMT)
Denoising Task Difficulty-based Curriculum for Training Diffusion Models [7.4]
拡散に基づく生成モデルは、生成モデリングの領域において強力なツールとして登場した。様々な時間経過と騒音レベルを横断する認知度に関する広範な研究にもかかわらず、認知度タスクの相対的困難に関する紛争が続いている。本稿では,拡散モデルの学習過程を改善するため,カリキュラム学習から手書きの学習手法を導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:46:29 GMT)
An Exploratory Study on Just-in-Time Multi-Programming-Language Bug Prediction [7.4]
本研究の目的は,ジャスト・イン・タイム (JIT) MPLB 予測モデルの構築である。我々は18のApache MPLプロジェクトに基づいて構築したデータセットを用いて、プロジェクト内およびプロジェクト間コンテキストでモデルを評価する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:06:18 GMT)
Cutting Through the Clutter: The Potential of LLMs for Efficient Filtration in Systematic Literature Reviews [7.4]
大規模言語モデル(LLM)は、文献レビューフィルタリングの効率、速度、精度を高めるために用いられる。単純なプロンプトによる高度なLCMを用いることで,文学的なフィルタリングに要する時間を大幅に削減できることを示す。また、偽陰性は実際にコンセンサス・スキームによって制御でき、通常の人間のエラー・しきい値の98.8%以上のリコールを達成できることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:13:53 GMT)
Meta-Learning Strategies through Value Maximization in Neural Networks [7.3]
完全に規範的な目的に対して制御信号を効率よく最適化できる学習活動フレームワークを提案する。本稿では,一般的なメタ学習アルゴリズムにおける近似の影響について検討する。設定全体では、学習の早い段階でタスクの容易な側面に適用する場合、制御の取り組みが最も有益であることが分かります。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:07:03 GMT)
A Survey on Uncertainty Quantification Methods for Deep Learning [7.1]
不確かさ定量化(UQ)は、予測精度以上のDNN予測の信頼性を推定することを目的としている。本稿では,DNNに対するUQ手法の系統分類を,不確実性源の種類に基づいて提案する。我々は、我々のUQ方法論の分類が、異なる機械学習問題におけるUQ手法の選択を導くのにどのように役立つかを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:49:38 GMT)
The Missing Link: Allocation Performance in Causal Machine Learning [7.1]
一つのCATEモデルの性能が、さまざまな意思決定シナリオで大きく異なることを示す。分布シフトなどの課題が予測やアロケーションに与える影響を明らかにする。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:57:40 GMT)
Codebook LLMs: Adapting Political Science Codebooks for LLM Use and Adapting LLMs to Follow Codebooks [7.0]
有効な測定を気にする政治学者は、代わりにコードブック・コンストラクト・ラベルの仮定を行うべきだと論じる。我々は,LLMがコードブック命令に準拠するかどうかを理解するために,一連の実験を行う。オリジナルのコードブックを再構築することで、ゼロショットのパフォーマンスがわずかに向上することがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:20:09 GMT)
PutnamBench: Evaluating Neural Theorem-Provers on the Putnam Mathematical Competition [7.0]
パットナムベンチ (PutnamBench) は、ウィリアム・ローウェル・パットナム数学コンペティション (William Lowell Putnam Mathematical Competition) から導かれる640の定理を1697年に手作りで定式化したものである。すべての定理はLean 4 と Isabelle の形式化を持ち、かなりの部分集合は Coq の形式化も持つ。パットナムベンチを用いて、確立されたニューラルおよびシンボリック定理証明器の評価を行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:57:15 GMT)
TF-SASM: Training-free Spatial-aware Sparse Memory for Multi-object Tracking [6.9]
コンピュータビジョンにおけるマルチオブジェクト追跡(MOT)は依然として重要な課題であり、ビデオシーケンス内の複数のオブジェクトの正確な位置決めと連続的な追跡が必要である。本稿では,オブジェクトの動きと重なり合う認識に基づいて,重要な特徴を選択的に記憶するメモリベースの新しいアプローチを提案する。提案手法はDanceTrackテストセットのMOTRv2よりも有意に改善し,AsAスコアが2.0%,IFF1スコアが2.1%向上した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:13:39 GMT)
Efficient Continual Learning with Low Memory Footprint For Edge Device [6.8]
本稿では,連続学習の忘れる問題を解くために,LightCLと呼ばれるコンパクトアルゴリズムを提案する。まず,CLにおける可塑性学習とメモリ安定性の2つの新しい指標を提案する。実験的な比較では、LightCLは忘れるのを遅らせる他のSOTAメソッドよりも優れており、最大$textbf6.16$times$$$メモリフットプリントを削減している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:52:20 GMT)
Social and Ethical Risks Posed by General-Purpose LLMs for Settling Newcomers in Canada [6.8]
汎用生成AIは、このニーズに対処するための新参者やサービス提供者の間で一般的なプラクティスになる可能性がある。これらの道具は入植地に適したものではなく、移民や難民に有害な影響を及ぼす可能性がある。われわれは、これらのツールが初心者にもたらすリスクを調査し、まずは、生成AIの未防衛使用に対して警告し、次に、AIリテラシープログラムの作成においてさらなる研究と開発のインセンティブを与える。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:23:06 GMT)
Transferable Tactile Transformers for Representation Learning Across Diverse Sensors and Tasks [6.7]
T3は、マルチセンサーとマルチタスクにまたがる触覚表現学習のためのフレームワークである。 FoTaで事前訓練したT3は、特定のセンサとタスクのペアリングにおいてゼロショット転送性を達成した。また、T3は長距離接点リッチな操作のための触覚エンコーダとしても有効である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 04:17:11 GMT)
On the Matrix Form of the Quaternion Fourier Transform and Quaternion Convolution [6.6]
フーリエ変換および畳み込み演算の四元数版行列形式について検討する。四元数(英語版)は強力な表現単位を提供するが、それらは四元数乗算の非可換性から最も遠ざかるそれらの使用の困難に関係している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:19:20 GMT)
Learning to Unlearn for Robust Machine Unlearning [6.5]
学習過程を最適化する新しいLTU(Learning-to-Unlearn)フレームワークを提案する。 LTUは、モデルが一般化可能な知識を効果的に保存することを容易にするメタ最適化スキームを含んでいる。また、記憶と忘れのための最適化トラジェクトリを整列するグラディエント調和戦略も導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:36:00 GMT)
CoDA: Instructive Chain-of-Domain Adaptation with Severity-Aware Visual Prompt Tuning [6.5]
Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインからラベル付きターゲットドメインへのモデルを適応することを目的としている。 CoDAはモデルに、シーンやイメージレベルでの相違点を識別、焦点付け、学習するように指示する。 CoDAは、あらゆる悪い場面で広く使用されているベンチマークでSOTAのパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:34:03 GMT)
PCT: Perspective Cue Training Framework for Multi-Camera BEV Segmentation [6.4]
Cue Perspective Training (PCT) は、ラベルのない視点画像から生成された擬似ラベルを利用する新しいトレーニングフレームワークである。 PCTはラベルのないデータが利用できる様々な設定に適用できる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:59:23 GMT)
YouTube-SL-25: A Large-Scale, Open-Domain Multilingual Sign Language Parallel Corpus [6.4]
本稿では,手話ビデオの大規模オープンドメイン多言語コーパスであるYouTube-SL-25を紹介する。 3000時間以上のビデオが25以上の手話言語で使用されているため、YouTube-SL-25は、これまでで最大の並列手話データセットである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:08:34 GMT)
Continual Deep Learning on the Edge via Stochastic Local Competition among Subnetworks [6.4]
エッジデバイス上での継続的な学習は、厳しいリソース制約のため、ユニークな課題を生んでいる。本稿では,競争の原則を活かしてスパシティを促進する新しい手法を提案する。これにより、ディープ・ネットワーク・メモリのフットプリントと計算負荷が大幅に削減される。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:36:05 GMT)
Enhanced Self-supervised Learning for Multi-modality MRI Segmentation and Classification: A Novel Approach Avoiding Model Collapse [6.3]
多モードMRI(Multi-modality magnetic resonance imaging)は、コンピュータ支援診断のための補完的な情報を提供する。従来のディープラーニングアルゴリズムは、病変をセグメント化し、磁気共鳴画像で疾患を分類する特定の解剖学的構造を特定するのに適している。自己教師付き学習(SSL)は、事前学習によりラベル付きデータから特徴表現を効果的に学習することができ、自然画像解析に有効であることが示されている。ほとんどのSSLメソッドはマルチモードMRIの類似性を無視し、モデルが崩壊する。ハイブリッドマスクパターン(HMP)とピラミッドバーローツイン(PBT)を組み合わせた多モードMRIマスク自動エンコーダの確立と検証を行った。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:11:30 GMT)
Stability and Dynamics of Atom-Molecule Superfluids Near a Narrow Feshbach Resonance [6.3]
ボゾン原子の凝縮物から生じる安定な分子凝縮物の最近の観察は、興味深い一連の疑問を提起している。これらの現象の背後にある重要な要素の1つは、19.849Gで133$Cの非常に狭いフェシュバッハ共鳴である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:21:17 GMT)
EyeDentify: A Dataset for Pupil Diameter Estimation based on Webcam Images [6.3]
EyeDentifyは、Webカメラ画像に基づく瞳孔径推定のために設計されたデータセットである。標準的なウェブカメラデータを用いて瞳孔径を推定できるディープラーニングモデルは少ない。 EyeDentifyは、装備の少ない環境向けに特別に設計されたモデルの開発と改良を可能にする。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:39:28 GMT)
MARTSIA: Safeguarding Data Confidentiality in Blockchain-Driven Process Execution [6.3]
相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ MARTSIAは、ユーザ定義ポリシーと認証宣言属性を通じて、メッセージ部分レベルでの読み取りアクセス制御を提供する。 MARTSIAは暗号化されたマルチ認証属性ベースの暗号化と分散ハッシュテーブルデータストアを利用する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:59:54 GMT)
Spatialyze: A Geospatial Video Analytics System with Spatial-Aware Optimizations [6.2]
Spatialyzeは、地理空間ビデオのエンドツーエンドクエリのための新しいフレームワークである。その結果、Spatialyzeは、最適化されていない実行と比較して最大97.1%の精度を維持しながら、実行時間を最大5.3倍に短縮できることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 00:05:58 GMT)
Making New Connections: LLMs as Puzzle Generators for The New York Times' Connections Word Game [6.1]
コネクションパズル(Connections puzzle)は、ニューヨーク・タイムズ(NYT)が毎日発行しているワードアソシエーションゲームである。新たなパズルを生成するには、メタ認知の形式が必要である: ジェネレータは、潜在的な解決者の下流の推論を正確にモデル化できなければならない。この結果から,LLMは有能なパズル作成者であり,人間によって判断されるような,楽しい,挑戦的な,創造的なコネクトパズルを多種多様なセットで生成できることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:05:25 GMT)
Context-aware Communication for Multi-agent Reinforcement Learning [6.1]
マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。 CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:02:25 GMT)
AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering [6.1]
我々は,オープンエンドビデオ質問応答において,大規模視覚言語モデルを包括的に評価するための,新しい,挑戦的なベンチマークであるAutoEval-Videoを提案する。 1)AutoEval-Videoは9つのスキルディメンションにまたがるオープンエンドなビデオクエストを構築し,認識能力,理解力,生成能力に対処する。インスタンス固有のルールを即座に使用することにより、GPT-4を自動評価器として、人間の評価器の94.9%から97.5%の精度に匹敵する、97.0%程度の安定した評価精度を達成できる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:42:22 GMT)
Model-based learning for multi-antenna multi-frequency location-to-channel mapping [6.1]
Inlicit Neural Representationの文献によると、古典的ニューラルネットワークアーキテクチャは低周波の内容の学習に偏っている。本稿では、モデルに基づく機械学習パラダイムを利用して、伝搬チャネルモデルから問題固有のニューラルアーキテクチャを導出する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:54:53 GMT)
A Framework for QoS of Integration Testing in Satellite Edge Clouds [6.1]
衛星エッジクラウドにサービステストの質を統合するためのフレームワークを提案する。このフレームワークは、衛星ネットワークトポロジの変更を統合し、衛星エッジクラウドクラスタテスト環境を作成し、管理することができる。実験の結果,サテライトエッジクラウドクラスタにおける主要なサービス品質メトリクスをテストするためのフレームワークの能力を検証することができた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:42:00 GMT)
Segmentation of Prostate Tumour Volumes from PET Images is a Different Ball Game [6.0]
既存の方法では、腫瘍輪郭のマニュアルアノテーション中に医師が適用した強度に基づくスケーリングを正確に考慮することができない。我々は、新しいカスタム・フィーチャー・クリッピング・正規化手法を実装した。この結果から, PETスキャンを新規なクリッピング技術で前処理した場合, U-Netモデルの方が優れた性能が得られることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:48:17 GMT)
UFQA: Utility guided Fingerphoto Quality Assessment [6.0]
指の画質を評価するために意味のある特徴表現を学習するための自己教師付きデュアルエンコーダフレームワークを提案する。品質予測モデルを用いて、品質マップのさらなる監視を行い、指の画質を評価する。実験により,本手法は広く用いられている指紋品質指標であるNFIQ2.2よりも優れた性能を示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:06:07 GMT)
Joint-Embedding Predictive Architecture for Self-Supervised Learning of Mask Classification Architecture [5.9]
マスク分類アーキテクチャ(MCA)に適した自己教師型学習フレームワークであるMask-JEPAを紹介する。 Mask-JEPAは、統合埋め込み予測アーキテクチャとMCAを組み合わせることで、複雑なセマンティクスと正確なオブジェクト境界を正確にキャプチャする。提案手法は,1) 画素デコーダから普遍的画像分割のための包括的表現を抽出し,2) 変換器デコーダを効果的に訓練する,自己教師型学習における2つの重要な課題に対処する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:01:03 GMT)
Functional-Edged Network Modeling [5.9]
我々は、隣接行列を関数的隣接テンソルに変換し、関数表現専用の追加次元を導入する。関数エッジの不規則な観測に対処するため,テンソル完備化問題の解法としてモデル推論を行う。また、関数型エッジネットワークモデルの望ましい性質を示すために、いくつかの定理を導出する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:18:42 GMT)
GHunter: Universal Prototype Pollution Gadgets in JavaScript Runtimes [5.9]
プロトタイプ汚染は、JavaScriptコードに影響を与える最近の脆弱性である。これはJavaScriptのプロトタイプベースの継承をルーツとしており、攻撃者は実行時にオブジェクトのプロトタイプに任意のプロパティを注入することができる。 V8ベースのJavaScriptランタイムにおけるガジェットの研究は、Node.jsとDenoに重点を置いている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:30:00 GMT)
Empirical Mean and Frequency Estimation Under Heterogeneous Privacy: A Worst-Case Analysis [5.8]
微分プライバシー(DP)は、現在プライバシーを測定するための金の標準である。異種プライバシー制約を考慮した一変量データに対する経験的平均推定とカテゴリーデータに対する周波数推定の問題点を考察する。提案アルゴリズムは,PAC誤差と平均二乗誤差の両面から最適性を証明し,他のベースライン手法よりも優れた性能を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:46:02 GMT)
A quantum Monte Carlo algorithm to extract large-scale data of entanglement entropy and its derivative in high precision [5.7]
エンタングルメントエントロピー(EE)の大規模データを抽出できる量子モンテカルロスキームを提案する。 2次元および高次元システムにおいて,脳波を広いパラメータ領域で走査することにより,新しい位相および位相遷移を数値的に検出する手段を開く。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:12:15 GMT)
CLIF: Complementary Leaky Integrate-and-Fire Neuron for Spiking Neural Networks [5.6]
スパイキングニューラルネットワーク(SNN)は、脳にインスパイアされたエネルギー効率のモデルである。差別化できないスパイク機構のため、SNNを訓練することは依然として困難である。本稿では、Leaky Integrate-and-Fire Neuron-based SNNとComplementary Leaky Integrate-and-Fire Neuronを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:01:03 GMT)
Cluster and Separate: a GNN Approach to Voice and Staff Prediction for Score Engraving [5.6]
本稿では,音符を量子化された記号楽曲(例えばMIDIファイル)から複数の音声とステーブに分離する問題にアプローチする。本稿では,同じ和音に属する音符を音声の一部であればエッジで接続する,グラフニューラルネットワークに基づくエンドツーエンドシステムを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:36:13 GMT)
Physics-Inspired Generative Models in Medical Imaging: A Review [5.5]
物理にインスパイアされた生成モデル、特に拡散とポアソンフローモデルはベイジアン法を強化し、医用画像の優れたユーティリティを約束する。画像再構成,画像生成,画像解析など,物理にインスパイアされた生成モデルの主な応用について述べる。将来の研究の方向性は、物理にインスパイアされた生成モデルの統合、視覚言語モデル(VLM)の統合、および生成モデルの新しい応用を含むブレインストーミングである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:08:22 GMT)
Efficient In-Context Medical Segmentation with Meta-driven Visual Prompt Selection [5.4]
本稿では,Meta-driven Visual Prompt Selection Mechanism (MVPS)を導入し,ラベル効率のよい医用セグメンテーション手法を提案する。 MVPSは柔軟で微調整のないモジュールで、異なるバックボーンに簡単にプラグインでき、他のモデル中心のアプローチと組み合わせることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:22:32 GMT)
A Neurosymbolic Approach to Adaptive Feature Extraction in SLAM [5.3]
既存の追跡手法は環境変化や境界条件に適応しない。ディープラーニングベースのアプローチは、環境の変化に適応できるが、トレーニングにはかなりのデータを必要とし、新しいドメインに適応する柔軟性に欠けることが多い。本稿では,データを利用して複雑な関係を学習しながら,従来のSLAMアプローチからドメイン知識を統合した適応型SLAMパイプラインを構築するための,ニューロシンボリックプログラム手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:12:08 GMT)
Towards Open-World Grasping with Large Vision-Language Models [5.3]
オープンワールドの把握システムは、高レベルの文脈と低レベルの物理幾何学的推論を組み合わせることができるべきである。本稿では,視覚言語モデルとセグメンテーションとグルーピング合成モデルを組み合わせたオープンワールドグルーピングパイプラインOWGを提案する。乱雑な屋内シーンデータセットを用いて,オープンエンド言語を基盤としたOWGのロバスト性を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:21:44 GMT)
Separable Operator Networks [4.7]
物理インフォームドディープノネット(PI-DeepONet)はデータの不足を軽減するが、非効率なトレーニングプロセスに悩まされる。本稿では,物理インフォームド演算子の学習効率を大幅に向上させる新しいフレームワークであるSepONetを紹介した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:43:41 GMT)
Leveraging LLM-Respondents for Item Evaluation: a Psychometric Analysis [4.6]
我々は6種類のLDM(GPT-3.5, GPT-4, Llama 2, Llama 3, Gemini-Pro, Cohere Command R Plus)を用いて、人間の答えに類似した心理測定特性を持つ応答を生成する。その結果,一部のLLMは大学生に比べて,カレッジ・アルジェブラの習熟度が高いことが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:49:26 GMT)
Deep Learning Evidence for Global Optimality of Gerver's Sofa [4.6]
移動ソファー問題(Moving Sofa Problem)は、単位幅の1L$の廊下を航行できる2次元形状の最大面積を決定することを目的としている。現在の最高下界は約 2.2195 であり、1992年にジョゼフ・ガーバーによって達成された。我々は2つのアプローチを報告し、どちらもガーバーの予想を、彼の形状が一意な大域的最大値であるという予想を支持している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:59:32 GMT)
Refusal in Language Models Is Mediated by a Single Direction [4.5]
リファリングは1次元のサブスペースによって媒介され、最大72Bのパラメータを持つ13の人気のオープンソースチャットモデルにまたがる。そこで本研究では,他の機能に最小限の影響を伴って拒絶を手術的に無効にする,新しいホワイトボックス・ジェイルブレイク法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:53:41 GMT)
Unraveling the origin of antiferromagnetic coupling at YIG/permalloy interface [4.4]
イットリウム鉄ガーネット(YIG)とパーマロイ(Py)の原子準位における反強磁性(AFM)カップリングの構造と電子的起源について検討した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:47:26 GMT)
On-Device Training of Fully Quantized Deep Neural Networks on Cortex-M Microcontrollers [4.4]
本稿では,完全量子化トレーニング(FQT)と動的部分勾配更新を用いて,MCU上でDNNの効率的なトレーニングを可能にする手法を提案する。マルチビジョンと時系列データセットに対するアプローチの実現可能性を示し、トレーニング精度、メモリオーバーヘッド、エネルギ、実際のハードウェアでのレイテンシのトレードオフに関する洞察を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:01:34 GMT)
Scientific Inference With Interpretable Machine Learning: Analyzing Models to Learn About Real-World Phenomena [4.3]
解釈可能な機械学習は、モデルを論理的に分析して解釈を導出することで解を提供する。現在のIML研究は、科学的推論にMLモデルを活用するのではなく、MLモデルの監査に重点を置いている。本稿では、モデルだけでなく、その表現する現象を照らし出すIMLメソッドを定式化した「プロパティ記述子」を設計するためのフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:36:50 GMT)
TLRN: Temporal Latent Residual Networks For Large Deformation Image Registration [4.3]
本稿では,時系列画像登録における変形フィールドの列を予測するため,TLRN(en Temporal Latent Residual Network)と呼ばれる新しい手法を提案する。提案手法は, 時間的初期速度場によってパラメータ化される遅延変形空間において, 残留ブロックを慎重に設計した時間的残差ネットワークである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:07:45 GMT)
Almost-linear Time Approximation Algorithm to Euclidean $k$-median and $k$-means [4.3]
Euclidean $k$-medianと$k$-meansの問題、クラスタリングのタスクをモデル化する標準的な2つの方法に注目します。本稿では,定数係数近似を計算するためのほぼ線形時間アルゴリズムを提案することにより,この問題にほぼ答える。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:04:06 GMT)
BiasScanner: Automatic Detection and Classification of News Bias to Strengthen Democracy [4.2]
BiasScannerは、ニュース消費者がオンラインで読んでいるニュース記事を精査することで、民主主義を強化することを目指している。これには、ニュース記事のバイアスのある文を識別するサーバーサイドで事前訓練された大きな言語モデルと、フロントエンドのWebブラウザプラグインが含まれている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:42:22 GMT)
Cooperative Reward Shaping for Multi-Agent Pathfinding [4.2]
MAPF(Multi-Agent Pathfinding)の主な目的は、全てのエージェントに対して効率的で競合のないパスを計画することである。従来のマルチエージェントパス計画アルゴリズムは、複数のエージェントに対して効率的な分散パス計画を実現するのに苦労する。独立Q-Learning(IQL)に基づく独自の報酬形成手法を紹介する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:44:41 GMT)
AstroMLab 1: Who Wins Astronomy Jeopardy!? [4.2]
このデータセットは、天文学と天文学の年次レビューから算出された4,425の多重選択質問からなる。 Claude-3.5-Sonnetは最大4.6ポイント、85.0%の精度でライバルを上回っている。 LLaMA-3-70b (80.6%) と Qwen-2-72b (77.7%) はいくつかの優れたプロプライエタリモデルと競合している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:28:14 GMT)
Scalarisation-based risk concepts for robust multi-objective optimisation [4.1]
この問題の多目的事例について検討する。我々は、ロバストな多目的アルゴリズムの大多数が、ロバスト化とスカラー化という2つの重要な操作に依存していることを確認した。これらの操作は必ずしも可換であるとは限らないので、それらが実行される順序は結果の解に影響を及ぼす。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:13:13 GMT)
Pandora's White-Box: Precise Training Data Detection and Extraction in Large Language Models [4.1]
我々は,大規模言語モデル(LLM)に対する最先端のプライバシ攻撃を開発する。事前訓練されたLLMに対する新たなメンバーシップ推論攻撃(MIA)は、ベースライン攻撃の数百倍の精度で実行される。微調整では, ベースモデルと微調整モデルとの損失率に基づく単純な攻撃により, ほぼ完全なMIA性能が得られることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:37:09 GMT)
Deep ContourFlow: Advancing Active Contours with Deep Learning [4.0]
画像分割のための教師なしとワンショットの両方のアプローチのためのフレームワークを提案する。広範なラベル付きトレーニングデータを必要とせずに、複雑なオブジェクト境界をキャプチャできる。これは特に、注釈の不足に直面している分野である歴史学において必要である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:12:34 GMT)
How Do Students Interact with an LLM-powered Virtual Teaching Assistant in Different Educational Settings? [3.9]
LLMを利用したバーチャル教育アシスタントであるJill Watson氏は、学生の質問に答えて、インストラクターが提供するコースウェア上での会話を延長する。本稿では,Jill と学生の相互作用を,複数の科目や大学間で分析する。幅広い認知的要求をサポートすることで、ジルは生徒に高度な高次認知的質問への参加を促している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:22:50 GMT)
MSegRNN:Enhanced SegRNN Model with Mamba for Long-Term Time Series Forecasting [3.9]
本研究では,微調整された単一層マンバ構造を用いて情報を前処理するSegRNNの変種を紹介する。暗黙のセグメンテーションと残留構造をモデルエンコーディングセクションに組み込んで、固有のデータ反復サイクルをさらに削減する。この変種はMSegRNNと呼ばれ、Mamba構造を用いて有用な情報を選択し、変換シーケンスを生成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:50:15 GMT)
Exploring the Factors of "AI Guilt" Among Students -- Are You Guilty of Using AI in Your Homework? [3.8]
AI罪(AI guilt)とは、人類が伝統的に行ってきた学業におけるAIツールの使用から生じる道徳的な不快感である。この研究は、AIの罪悪感に寄与する要因、その社会的・心理的影響、そして教育実践に影響を及ぼす要因について検討する。この結果は、学術的完全性を再定義し、教育において私たちが何に価値があるかを再考する考え方を変える必要があることを示唆している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:56:32 GMT)
Risk-aware Trajectory Prediction by Incorporating Spatio-temporal Traffic Interaction Analysis [3.7]
本稿では,データセット内の高リスク相互作用に対応する位置と速度を解析することにより,この情報を得る。トレーニングでは、高いリスク状況下でより良い予測を生成するために、それを使用します。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:57:06 GMT)
CLAMS: A System for Zero-Shot Model Selection for Clustering [3.7]
本稿では,最適なトランスポートベースデータセットの類似性を利用して,クラスタリング問題に対するモデル選択を可能にするAutoMLシステムを提案する。その結果、クラスタリングアプリケーションを解決するための類似性に基づく自動モデル選択の有用性が実証された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:50:07 GMT)
Large Language Models and Games: A Survey and Roadmap [3.7]
大規模言語モデル(LLM)は、ゲームを含む幅広いアプリケーションやドメインにおいて、顕著なポテンシャルを示している。本稿では,ゲームにおけるLLMの様々な応用状況を調査し,ゲーム内でLLMが果たす役割について検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:10:32 GMT)
An Autonomous Drone Swarm for Detecting and Tracking Anomalies among Dense Vegetation [3.6]
ドローンの群れは、密集した目標を事実上検出し、追跡することができることを示す。 6機のドローンによる実生活実験で、平均位置精度は0.39m、平均精度は93.2%に達した。合成開口画像統合プロセスにセンサノイズを効果的に組み込むことができることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:31:21 GMT)
Learning in Repeated Multi-Unit Pay-As-Bid Auctions [3.6]
複数単位のペイ・アズ・バイドオークションの入札方法を学ぶことの問題点を考察する。バイド・バイド・オークションの入札方法を学ぶという問題は、アクション・スペースの性質によって困難である。時間動的計画法を用いて,オフライン問題に対する最適解が得られることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:58:56 GMT)
SoK: Software Debloating Landscape and Future Directions [3.6]
マルチレベル分類の基盤となるソフトウェアのデブロ化ワークフローを概念化する。このフレームワークは、インプット/アウトプットアーティファクト、デブレーション戦略、評価基準に従ってデブレーションツールを分類する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:52:21 GMT)
Learning to Represent Surroundings, Anticipate Motion and Take Informed Actions in Unstructured Environments [3.5]
ロボットが動的で非構造的な環境で動作し、環境をよりよく理解し、他人の行動を予測し、それに応じて情報的行動を取ることを目的とした、学習に基づく様々な手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:25:46 GMT)
Success Probability in Multi-View Imaging [3.4]
ロボット、防犯カメラ、ドローン、衛星などのプラットフォームは立体視や断層撮影によって3Dリカバリのために多視点イメージングに利用されている。本稿は、この側面を分析するためのフレームワークを作成する。不正確な指摘は自己校正によって緩和できるという事実を用いる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:50:19 GMT)
Patch-Consistent Optical Translation Across Sensors: Large-Scale Denoising Diffusion with Heterogeneous Change Detection as a Use Case [3.4]
リモートセンシングでは、異なるセンサーが捉えた画像を比較することが一般的な障害である。 DDIMを用いた広帯域光画像変換手法を提案する。我々のアプローチは、大規模な低空間分解能画像を、異なる光学センサから高解像度に高分解能に分解するのに適したものである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:29:08 GMT)
Representation Learning and Identity Adversarial Training for Facial Behavior Understanding [3.4]
主観的同一性はモデルに対するショートカット学習を提供し、AU予測に対する準最適解をもたらすことを示す。我々はIAT(Identity Adrial Training)を提案し、アイデンティティ不変の特徴を学習するために強力なIAT正規化が必要であることを実証する。提案手法であるFMAE(Facial Masked Autoencoder)とIATは単純で汎用的で効果的である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:13:28 GMT)
PULPo: Probabilistic Unsupervised Laplacian Pyramid Registration [3.3]
変形可能な画像登録は多くの医療画像応用に基礎がある。本研究では不確実な定量化が可能な確率的変形可能な登録法であるPULPoを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:30:31 GMT)
Data-Guided Physics-Informed Neural Networks for Solving Inverse Problems in Partial Differential Equations [3.2]
物理インフォームドニューラルネットワーク(PINN)は、機械学習の大幅な進歩を示している。 PINNは偏微分方程式(PDE)における様々な前方および逆問題の解法に成功している。本研究では、データ誘導物理インフォームドニューラルネットワーク(DG-PINN)と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:47:24 GMT)
A Conservative Approach for Few-Shot Transfer in Off-Dynamics Reinforcement Learning [3.2]
オフダイナミックス強化学習(英語: Off-dynamics Reinforcement Learning)は、ソース環境から、異なるが類似したダイナミクスによって特徴づけられるターゲット環境へポリシーを移そうとする。我々は近年のImitation Learningと保守的RLアルゴリズムの進歩に触発された革新的なアプローチを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:36:37 GMT)
CWRCzech: 100M Query-Document Czech Click Dataset and Its Application to Web Relevance Ranking [3.2]
CWRCzechは、Seznam$.$czの検索エンジンログから収集されたユーザ行動データと関連性ランキングのための1億のクエリドキュメントチェコのクリックデータセットである。検索結果の文書位置とユーザーの行動に関する情報を提供する:2760万クリックされた文書と108万ダウエル時間。我々は、十分な規模で自動的に活用されるデータに基づいてトレーニングされたモデルが、人間の注釈付きデータに基づいてトレーニングされたモデルの性能を上回ることができることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:50:29 GMT)
TripletViNet: Mitigating Misinformation Video Spread Across Platforms [3.1]
最近、多くのプラットフォームでフェイクニュースや誤報ビデオが広まっている。最近の研究は、単一のプラットフォーム内で暗号化されたネットワークトラフィックからビデオタイトルを識別できる可能性を示している。クロスプラットフォームビデオ認識には既存の方法はない。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:03:23 GMT)
A unified theory and statistical learning approach for traffic conflict detection [3.1]
本研究では,交通競合検出のための統一理論と統計的学習手法を提案する。コンフリクト検出は、観測された確率と文脈変数から統計的学習によってリスクを推定するものである。 3つの主要なタスクは、選択された可観測物からの相互作用コンテキストの表現、異なるコンテキストにおける近接分布の推測、極端な値理論の適用である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:55:36 GMT)
Protect Measurement-Induced Phase Transition from Noise [3.1]
測定誘起相転移(MIPT)は、絡み合いエントロピーを特徴とする新しい非平衡相転移である。量子化操作を組み込むことで,MIPTを環境騒音から効果的に保護できることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:59:53 GMT)
Unitary tetrahedron quantum gates [3.1]
2量子ビットYang-Baxterゲートを用いた多体システムの量子シミュレーションは、量子ハードウェアのベンチマークを提供する。これは、$n$-複素作用素と呼ばれるヤン・バクスターゲートの$n$-量子一般化を持つ高次元ケースにまで拡張することができる。それらを見つけることは、高次元可積分系の構成要素である$n$-シプレックス方程式のユニタリ解を特定することに等しい。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:58:33 GMT)
Automated essay scoring in Arabic: a dataset and analysis of a BERT-based system [3.1]
本研究では、2046人の学生エッセイからなるアラビアAESベンチマークデータセットであるAR-AESを紹介する。 AESにおけるAraBERTの使用の先駆者であり、様々な質問タイプでその性能を探求した。 BERTベースのAESシステムによるエラーの規模を初めて調査し、96.15%のエラーが最初のヒトマーカーの予測の1点以内であることを観察した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:55:37 GMT)
Language models are better than humans at next-token prediction [3.1]
次のトークン予測では、言語モデルが人間より優れているか悪いかは明らかではない。我々は、次の予測で、GPT3-Adaのような比較的小さな言語モデルよりも、人間は一貫して非言語的であることに気付きました。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:04:34 GMT)
Laypeople's Egocentric Perceptions of Copyright for AI-Generated Art [3.1]
本研究では,著作権保護に関連する要因に関する,AI生成技術に対する認識について検討する。参加者は、AI生成画像の作者と著作権を、システムに画像を生成するよう促したユーザーに委ねる可能性が高い。以上の結果から, 創造性や努力などに関して, 自分達のAI生成技術をより好意的に判断する者はいるものの, 他者(スキル)ではないことが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:53:43 GMT)
An integrated perspective of robustness in regression through the lens of the bias-variance trade-off [3.0]
本稿では, 従来の外乱耐性の頑健な推定と, 仮想データセットの摂動に抵抗するパラメータ推定に焦点をあてる頑健な最適化の関係について検討する。どちらも堅牢な方法とみなされるが、これらの概念はバイアス分散トレードオフを示し、大まかに逆戦略に従うことを示している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:47:16 GMT)
Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks [2.9]
複数のロボット間のスケーラブルでほぼ最適な関節運動計画を可能にする分散協調パラダイムを提供する。我々のアルゴリズムは、競合する準最適アルゴリズムよりも2桁高速である。最大45台のロボットによる監視タスクのシミュレーションでは、1Hzのオーダーでリアルタイム計画が可能で、カバー性能も優れている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:25:39 GMT)
PlayMolecule pKAce: Small Molecule Protonation through Equivariant Neural Networks [2.9]
pKAceは分子のプロトン化部位のマイクロpKa値を予測する新しいウェブアプリケーションである。このモデルの適応バージョンは、トレーニングデータのごく一部をトレーニングしながら、確立したモデルに匹敵する最先端のパフォーマンスを達成できることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:22:44 GMT)
On Machine Learning Approaches for Protein-Ligand Binding Affinity Prediction [2.9]
本研究では,タンパク質-リガンド結合親和性予測における古典的木モデルと高度なニューラルネットワークの性能を評価する。 2次元モデルと3次元モデルを組み合わせることで、現在の最先端のアプローチを超えて、アクティブな学習結果が向上することを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:06:00 GMT)
Improving a Proportional Integral Controller with Reinforcement Learning on a Throttle Valve Benchmark [2.8]
本稿では,非対称制御器を用いた非線形スロットル弁の学習制御手法を提案する。我々は近年の強化学習とガイドの進歩を活用し、弁との付加的な相互作用から学習することで閉ループ動作を改善する。すべての試験ケースにおいて、結果のエージェントは従来のRLエージェントよりもサンプリング効率が良く、PIコントローラよりも優れています。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:27:46 GMT)
Transformer-based Drum-level Prediction in a Boiler Plant with Delayed Relations among Multivariates [2.8]
本稿では, 蒸気ボイラプラントのドラム水位予測におけるトランスフォーマーモデルの適用について検討する。この目的のために,1)データ前処理,2)因果関係解析,3)遅延推論,4)変数拡張,および5)予測を含む急進パイプラインを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:05:30 GMT)
Aligning Neuronal Coding of Dynamic Visual Scenes with Foundation Vision Models [2.8]
自己教師型視覚変換器(ViT)を用いた時空間畳み込みニューラルネットワークVi-STを提案する。提案したVi-STは,脳内動的視覚シーンのニューロンコーディングのための新しいモデリングフレームワークである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:06:13 GMT)
Leveraging Hybrid Intelligence Towards Sustainable and Energy-Efficient Machine Learning [2.8]
ハイブリッドインテリジェンスは、意思決定、問題解決、システム全体のパフォーマンスの向上を目的としている。本稿では,ハイブリット・インテリジェンス(Hybrid Intelligence)を,持続的でエネルギーを意識した機械学習に活用するためのアプローチを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:58:27 GMT)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [2.8]
本稿では,診療所における低コストシステムを用いた心疾患の迅速かつ効率的な診断方法を提案する。 LSCNネットワークによる心臓音の総合的分類精度は96%以上である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:02:54 GMT)
Enhancing Electrocardiogram Signal Analysis Using NLP-Inspired Techniques: A Novel Approach with Embedding and Self-Attention [2.8]
埋め込みと自己注意に基づく新しい心電図解析手法を提案し,心電図データの空間的および時間的依存性を捉える。 91%の精度でF1スコアが得られた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:20:15 GMT)
Tight lower bound on the error exponent of classical-quantum channels [2.7]
任意の古典量子(CQ)チャネル上での通信の誤差指数の低い値を示す。議論は適切なデコーダの精巧な分析を通じて進行せず、代わりに、プライバシーの増幅というタスクのエラー指数に関する林のバウンドを利用する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:01 GMT)
Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique [2.7]
Chain & Hashは、暗号化されたフレーバーで指紋を実装する、新しいシンプルなフィンガープリントアプローチだ。チェイン・アンド・ハッシュ法を複数のモデルで評価し,良性変換に対するロバスト性を実証した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:38:56 GMT)
Learning Social Cost Functions for Human-Aware Path Planning [2.7]
本稿では,一般的な社会的シナリオを認識し,それに対応するために従来のプランナーのコスト関数を変更する新しい手法を提案する。我々のアプローチでは、ロボットはタスクごとに異なるモジュールを持つのではなく、単一の学習モデルで異なる社会的規範を学習することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:57:02 GMT)
High-harmonic generation in graphene under the application of a DC electric current: From perturbative to nonperturbative regimes [2.7]
直流電界下におけるハニカム格子グラフェンモデルにおける高調波発生(HHG)について検討した。動的・静的な対称性は直流電流または停滞したポテンシャル項によって部分的に破壊されていることを示す。また、レーザー強度、周波数、偏光は、HHGスペクトルの形状に影響を与えることが示されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:58:33 GMT)
Topological Transitions in a Kerr Nonlinear Oscillator [2.6]
カー非線形発振器(KNO)は一対の定常固有状態、対向位相のコヒーレント状態をサポートする。断熱的固有状態の進化は、3つの物理的観測物全てを測定するために用いられる。位相遷移は、最初のチャーン数のジャンプによって明らかにされる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:52:39 GMT)
Eta Inversion: Designing an Optimal Eta Function for Diffusion-based Real Image Editing [2.6]
実際の画像を編集するための一般的な戦略は、拡散過程を反転させて元の画像のノイズ表現を得る。拡散反転の現在の方法は、しばしば特定のテキストプロンプトに忠実で、ソースイメージによく似ている編集を生成するのに苦労する。本稿では, DDIMサンプリング式における$eta$の役割を理論的に解析し, 編集性の向上を図った, 実画像編集のための新規かつ適応的な拡散インバージョン手法を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:36:59 GMT)
How and where does CLIP process negation? [2.6]
VALSEベンチマークからモデルによる否定の理解をテストするために,既存のタスクを構築した。本稿では,モデル解釈可能性に関する文献からインスピレーションを得て,否定の理解におけるVLモデルの振る舞いを説明する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:20:06 GMT)
SparQ Attention: Bandwidth-Efficient LLM Inference [2.5]
SparQ Attentionは、大規模言語モデルの推論スループットを向上させる技術である。注意データ転送において,SparQの注意力は,精度の低下を伴わずに最大8倍の節約率を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:40:11 GMT)
The Quantum Imitation Game: Reverse Engineering of Quantum Machine Learning Models [2.3]
量子機械学習(QML)は、機械学習モデルと量子コンピューティングのパラダイムを融合させる。量子コンピューティングのNoisy Intermediate-Scale Quantum(NISQ)時代における多くのサードパーティベンダーの拡大により、QMLモデルのセキュリティが最重要となる。我々は、信頼できない量子クラウドプロバイダが、推論中にトランスパイルされたユーザ設計のトレーニングされたQMLモデルにホワイトボックスアクセスを持つ敵であると仮定する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:27:14 GMT)
Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.3]
本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:15:57 GMT)
Advancing Human Action Recognition with Foundation Models trained on Unlabeled Public Videos [2.3]
我々は283,582本のTikTokビデオクリップを使用して、386のハッシュタグに分類し、ドメイン固有のアクション認識基盤モデルをトレーニングしている。 UCF101は99.05%、HMDB51は86.08%、Kinetics-400は85.51%、V2は74.27%である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:35:39 GMT)
Physics-Informed Machine Learning for Smart Additive Manufacturing [2.3]
本稿では、ニューラルネットワークと物理法則を統合した物理インフォームド・機械学習(PIML)モデルの開発に焦点をあて、レーザー金属堆積(LMD)におけるケーススタディによるモデル精度、透明性、一般化について述べる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:40:24 GMT)
TurboTLS: TLS connection establishment with 1 less round trip [2.3]
より少ないラウンドトリップでTLS接続を確立する方法を示す。我々がTurboTLSと呼ぶアプローチでは、TLSハンドシェイクの初期クライアント-サーバ間フローとサーバ-クライアント間フローはTCPではなくUDP経由で送信される。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:37:09 GMT)
ALMol: Aligned Language-Molecule Translation LLMs through Offline Preference Contrastive Optimisation [2.3]
機械語-分子翻訳に焦点をあて、コントラスト優先最適化と呼ばれる新しい訓練手法を展開する。その結果,我々のモデルでは,他のモデルと比較して最大32%の改善が達成された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:53:55 GMT)
Balancing the Scales: Reinforcement Learning for Fair Classification [2.3]
分類タスクの公平性は、伝統的に神経表現からのバイアス除去に焦点を当ててきた。最近の傾向は、トレーニングプロセスに公正さを埋め込むアルゴリズム的手法を好んでいる。我々は、コンテキスト的マルチアーム・バンディット・フレームワークを採用し、我々の目的に合うように3つの人気のあるRLアルゴリズムを適用した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:28:16 GMT)
Learning Rapid Turning, Aerial Reorientation, and Balancing using Manipulator as a Tail [2.2]
これまでの研究は、四足歩行ロボットの尾にのみ機能するロボット尾部を装着することで、様々な能力の向上に重点を置いてきた。そこで本研究では,6-DoFマニピュレータを尾翼として,かつマニピュレータとして用いることを提案する。実験の結果, マニピュレータを備えたロボットは, 急速旋回, 空中方向転換, バランスなどのタスクにおいて, マニピュレータを持たないロボットよりも優れていた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:51:19 GMT)
Interferometric binary phase estimations [2.2]
本稿では,各光子が未知位相の2進展開の1ビットを返却する干渉計構成を提案する。任意の不確実性で位相値を推定する手法を設定する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:59:20 GMT)
Unconditional Latent Diffusion Models Memorize Patient Imaging Data: Implications for Openly Sharing Synthetic Data [2.1]
生成型AIモデルは、オープンデータの共有を容易にするために注目を集めている。これらのモデルは、新規な合成サンプルの代わりに患者データコピーを生成する。我々は,合成データ生成のためのCT,MR,X線データセット上で2次元および3次元潜時拡散モデルを訓練する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:22:45 GMT)
On the Efficacy of Surface Codes in Compensating for Radiation Events in Superconducting Devices [2.1]
我々は,4億件以上の故障インジェクションから得られたデータを報告し,コード出力の復号後の論理誤差とハードウェア故障の相関関係を考察した。本研究では, 表面符号を適切に選択し, 調整することで, 放射線誘発断層の修正確率を最大10%向上させることを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:56:09 GMT)
Flow Perturbation to Accelerate Unbiased Sampling of Boltzmann distribution [2.1]
フローベース生成モデルはボルツマン分布のサンプリングに用いられているが、その応用は流れのジャコビアンを得る計算コストによって妨げられている。本稿では,最適化された摂動を流れに組み込む流れ摂動法を提案する。摂動流によって生じる軌跡を再重み付けすることにより,ボルツマン分布の非バイアスサンプリングを桁違いの速度アップで達成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:29:17 GMT)
GraphPrint: Extracting Features from 3D Protein Structure for Drug Target Affinity Prediction [2.1]
薬物標的親和性予測のための3Dタンパク質構造特徴を組み込むためのフレームワークであるGraphPrintを提案する。本モデルでは,平均平方誤差0.1378,一致指数0.8929をKIBAデータセット上で達成する。我々のアブレーション研究は、3Dタンパク質の構造に基づく特徴が従来の特徴と相補的な情報を提供することを示している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:45:09 GMT)
Teaching CORnet Human fMRI Representations for Enhanced Model-Brain Alignment [2.0]
認知神経科学において広く用いられる技術として機能的磁気共鳴イメージング(fMRI)は、視覚知覚の過程における人間の視覚野の神経活動を記録することができる。本研究では,SOTAビジョンモデルCORnetに基づくモデルであるReAlnet-fMRIを提案する。 fMRIを最適化したReAlnet-fMRIは、CORnetと制御モデルの両方においてヒトの脳との類似性が高く、また、内・内・対モダリティモデル脳(fMRI、EEG)も高い類似性を示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:31:42 GMT)
Geometric Analysis of Unconstrained Feature Models with $d=K$ [2.0]
2つの人気の制約のない特徴モデルが厳密なサドル関数であり、すべての臨界点が大域的最小点か、負の曲率で退避できる厳密なサドル点であることを示す。主要な発見は、前回の記事における制約のない特徴モデルに関する予想を確定的に裏付けるものである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:17:48 GMT)
GraphEval: A Knowledge-Graph Based LLM Hallucination Evaluation Framework [1.9]
本稿では,知識グラフ構造における情報表現に基づく幻覚評価フレームワークGraphEvalを提案する。我々のアプローチと最先端自然言語推論(NLI)モデルとの併用により、様々な幻覚ベンチマークにおけるバランスの取れた精度が向上する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:11:16 GMT)
Rotationally Invariant Latent Distances for Uncertainty Estimation of Relaxed Energy Predictions by Graph Neural Network Potentials [1.9]
緩和エネルギー計算における不確実性定量化は他の種類の分子特性予測において不確実性定量化よりも複雑であることを示す。本研究では,GNNの校正,校正,再校正,不確実性予測手法の開発において,分散フリー手法がより有用なツールであることが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:59:39 GMT)
Pathformer3D: A 3D Scanpath Transformer for 360° Images [1.9]
360deg画像の既存のスキャンパス予測モデルは、2次元の正方形射影平面上でスキャンパス予測を実行するが、これは常に2次元平面の歪みと座標の不連続により大きな誤差をもたらす。本研究では,3次元球面座標系における360deg画像の走査パス予測を行い,新しい3次元走査パス変換器Pathformer3Dを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:24:27 GMT)
Formal Verification of Object Detection [1.9]
Deep Neural Networks(DNN)は、現実世界のアプリケーションではユビキタスだが、エラーや敵攻撃に対して脆弱である。この研究は、コンピュータビジョンモデルの安全性を確保するために正式な検証を適用するという課題に取り組み、画像分類を超えてオブジェクト検出まで検証を拡張した。本稿では,オブジェクト検出モデルのロバスト性を形式的検証を用いて証明するための一般的な定式化と,最先端の検証ツールと互換性のある実装戦略の概要を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:41:06 GMT)
AirDnD -- Asynchronous In-Range Dynamic and Distributed Network Orchestration Framework [1.9]
本研究の目的は、動的メッシュネットワークを形成することにより、分散エッジデバイスにおけるコンピューティングリソースの利用を改善することである。提案手法は, 地理的に分散したエッジデバイスを生物に変換する3つのモデルから構成される。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:43:56 GMT)
CICAPT-IIOT: A provenance-based APT attack dataset for IIoT environment [1.8]
産業用モノのインターネット(Industrial Internet of Things, IIoT)は、スマートセンサー、高度な分析、産業プロセス内の堅牢な接続を統合する、変革的なパラダイムである。 Advanced Persistent Threats (APTs) は、そのステルス性、長く、標的とする性質のために特に重大な懸念を抱いている。 CICAPT-IIoTデータセットは、全体的なサイバーセキュリティ対策を開発するための基盤を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:08:34 GMT)
ConTEXTure: Consistent Multiview Images to Texture [1.8]
複数の視点からの画像を用いて、所定の3次元メッシュのテクスチャマップ/アトラスを作成するために設計された生成ネットワークを導入する。我々は、Zero123++を使用し、同時に6つの特定視点に対して複数のビュー一貫性画像を生成する。このアプローチは、バック、サイド、ボトム、トップを含む様々な視点からのレンダリング画像が、視点の不規則性から解放されることを保証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:15:55 GMT)
Proper losses regret at least 1/2-order [1.8]
我々は、損失の厳密な正当性は、非空きサロゲート的後悔境界を確立するのに十分であることを示す。また、p-ノルムにおける収束の順序は、厳密な適切な損失の幅広いクラスに対する1/2$のサロゲート後悔の順序よりは高速ではないことを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:46:15 GMT)
Solving the inverse problem of microscopy deconvolution with a residual Beylkin-Coifman-Rokhlin neural network [1.8]
光顕微鏡(LM)における従来の明示的手法は、画像取得時に点拡散関数(PSF)に依存する。本稿では、光学デコンボリューションを近似するために、革新的な物理インフォームドニューラルネットワークであるMulti-Stage Residual-BCR Net(m-rBCR)を提案する。明示的なデコンボリューション法(例えばリチャードソン=ルーシー)や他の最先端NNモデルとは対照的に、m-rBCRモデルは他の候補よりも優れた性能を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:53:44 GMT)
Leveraging Multimodal CycleGAN for the Generation of Anatomically Accurate Synthetic CT Scans from MRIs [1.8]
我々は、MRIから合成CTスキャンを生成するために、Deep Learningモデルの異なる構成の能力を解析する。異なるMRIモダリティからCTスキャンを生成するために、コントラスト剤を使用しないいくつかのCycleGANモデルを教師なしで訓練した。結果から, 入力のモーダル性に応じて, モデルが全く異なる性能を持つことを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:38:59 GMT)
Deep Learning-Based Operators for Evolutionary Algorithms [1.8]
本稿では、遺伝的アルゴリズムのクロスオーバー演算子と遺伝的プログラミングの突然変異演算子という、ディープラーニングの能力を利用する2つの新しいドメイン非依存型遺伝演算子を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:05:34 GMT)
Benchmarking the readout of a superconducting qubit for repeated measurements [1.7]
超伝導量子ビットの読み出しは、測定速度とキュービット上の望ましくないバックアクションの間のトレードオフに直面している。このような特徴は、読み出しによるリークエラーを著しく見落としている可能性がある。本稿では,本手法を用いて,本発明の本質的なパーセル保護量子ビットの分散可読化を特徴付ける。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:34:13 GMT)
STARS: Self-supervised Tuning for 3D Action Recognition in Skeleton Sequences [1.7]
マスク付き予測を用いた自己教師付き事前学習手法は骨格に基づく行動認識において顕著な内部データセット性能を示す。対照的な学習アプローチとは異なり、それらは十分に分離されたクラスタを生成しない。骨格列における3次元行動認識のための自己教師付きチューニング(STARS)を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:35:38 GMT)
SwiftBrush: One-Step Text-to-Image Diffusion Model with Variational Score Distillation [1.6]
テキストと画像の拡散モデルは、しばしば遅い反復的なサンプリングプロセスに悩まされる。我々は$textbfSwiftBrush$という新しいイメージフリー蒸留方式を提案する。 SwiftBrushは、COCO-30Kベンチマークで、$textbf16.67$のFIDスコアと$textbf0.29$のCLIPスコアを達成している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:33:45 GMT)
Discrete generative diffusion models without stochastic differential equations: a tensor network approach [1.6]
拡散モデル(DM)は、生成機械学習の手法のクラスである。ネットワーク(TN)を用いて,このような離散モデルを効率的に定義し,サンプリングする方法を示す。」
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:11 GMT)
Features Reconstruction Disentanglement Cloth-Changing Person Re-Identification [1.6]
衣服交換者再識別(CC-ReID)は、特定の歩行者を衣服交換シナリオで回収することを目的としている。主な課題は、衣服に関する機能と衣服に関する無関係な機能を切り離すことである。本稿では, 衣服関連・衣服関連の特徴を分離する機能であるFRD-ReIDを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:08:42 GMT)
Innovation Resistance Theory in Action: Unveiling Barriers to Open Government Data Adoption by Public Organizations to Unlock Open Data Innovation [1.5]
Open Government Data(OGD)は、データ駆動のイノベーションと、さまざまな分野における持続可能性を促進する上で、重要な役割を担っている。その可能性にもかかわらず、多くの公共団体は、自分のデータを公開的に共有することに消極的だ。本研究は,OGDに合わせたIRTモデルを構築し,公共機関間の抵抗予測を行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:35:38 GMT)
Interpretability analysis on a pathology foundation model reveals biologically relevant embeddings across modalities [1.5]
病理基盤モデルから得られたViT-Smallエンコーダの特徴を2つのデータセットに応用して解析する。我々は、モデル埋め込み空間内での遺伝子発現とともに、細胞および組織形態の解釈可能な表現を発見する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:03:01 GMT)
Quantum Bayesian Inference with Renormalization for Gravitational Waves [1.5]
重力波干渉計で検出された小型のバイナリコレッセンスからパラメータの量子推論を行うために,ハイブリッド量子アルゴリズムを提案する。 LIGO観測所から二元ブラックホール(BBH)の融合をアルゴリズムをテストする最初のケースとして選択するが、その応用はより一般的なインスタンスに拡張できる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:00:48 GMT)
Geometric additivity of modular commutator for multipartite entanglement [1.4]
二次元ギャップ量子多体系のモジュラー共振器による多体絡みの新たな幾何学的性質を明らかにする。ある種の共形場理論のクラスにおいて、不連結区間を含むモジュラー可換作用素に対して興味深い恒等式を導出する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:04 GMT)
Omni-Dimensional Frequency Learner for General Time Series Analysis [1.4]
スペクトル特徴の3つの側面の奥行き解析に基づいて,Omni-dimensional Frequency Learner (ODFL) モデルを提案する。本手法は,非定常周波数帯域に着目した意味適応型大域的フィルタとチャネル次元間の部分演算からなる。 ODFLは、短期および長期予測、計算、分類、異常検出を含む5つの主流時系列分析タスクにおいて、一貫した最先端を達成している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:48:16 GMT)
Open Stamped Parts Dataset [1.4]
自動車製造のための切削された金属シートの合成と実像を特徴とするOpen Stamped Partsデータセット(OSPD)を提示する。実際の写真は7台のカメラから撮影され、7,980枚の未ラベル画像と1,680枚のラベル画像で構成されている。合成データは、訓練用画像7,980枚、検証用画像1,680枚、テスト用画像1,680枚を含む。我々は,合成OSPDのホール検出モデルを訓練し,67.2%,94.4%の精度でリコールスコアを修正した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:25:00 GMT)
Enhancing Building Safety Design for Active Shooter Incidents: Exploration of Building Exit Parameters using Reinforcement Learning-Based Simulations [1.3]
本研究では,既存研究のギャップに対処する強化学習に基づくシミュレーション手法を提案する。現実的なオフィス環境下でアクティブシューティングをシミュレートする自律エージェントを開発した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:08:38 GMT)
Differentiable Neural-Integrated Meshfree Method for Forward and Inverse Modeling of Finite Strain Hyperelasticity [1.3]
本研究では,新しい物理インフォームド機械学習手法,特にニューラル積分メッシュフリー(NIM)法を拡張し,有限ひずみ問題をモデル化することを目的とする。固有の微分可能プログラミング機能のおかげで、NIMは変分形式のニュートン・ラフソン線形化の導出を回避できる。 NIMはひずみデータから超弾性材料の不均一力学特性を同定し, 非線形材料の逆モデリングにおけるその有効性を検証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:15:18 GMT)
On the limitations of data-based price discrimination [1.3]
収益の面では、古典的な結果は3PDは、少なくとも均一な価格と同程度であることを示している。もし販売者が、基礎となる分布からの観察のサンプルのみに基づいて価格を設定する必要があるとしたらどうだろう? この論文はこれらの基本的な疑問に光を当てている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:20:08 GMT)
Correlations Are Ruining Your Gradient Descent [1.2]
自然勾配降下は、最も急勾配の方向を示す勾配ベクトルが、損失景観の局所曲率を考慮することにより、どのように改善されるかを照らしている。ニューラルネットワークの各層におけるノード応答を含む,任意の線形変換におけるデータの相関が,モデルパラメータ間の非正規的関係を生じさせることを示す。多層ニューラルネットワーク内でのデコリレーションを実装することで、バックプロパゲーションによるトレーニングが著しく増加しているだけでなく、過去に破滅的に失敗したバックプロパゲーションの既存の近似が再び実行されたことを示すことができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:59:43 GMT)
Scalable Networking of Neutral-Atom Qubits: Nanofiber-Based Approach for Multiprocessor Fault-Tolerant Quantum Computer [1.2]
ナノファイバー光キャビティは、原子間の高速な絡み合い発生を可能にするために、効率的な原子-光子界面としての可能性を持つことを示す。最先端のミリスケールのナノファイバーキャビティと数千の微細さで、100以上の原子を光ツイーザーアレイでキャビティモードに結合することができる。これにより、予測される100kHzのベル対生成率で効率的な時間多重絡み合わせ生成が可能となる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:00 GMT)
Optimizing Retinal Prosthetic Stimuli with Conditional Invertible Neural Networks [1.1]
本稿では,非教師ありの方法で網膜インプラント刺激を最適化するために,フローベース条件付き非可逆ニューラルネットワークの正規化を活用することを提案する。これらのネットワークの可逆性により、視覚系の計算モデルの代用として使用できる。自明なダウンサンプリング、線形モデル、フィードフォワード畳み込みニューラルネットワークなどの他の手法と比較して、フローベースの可逆ニューラルネットワークとその条件付き拡張は、より良い視覚的再構成特性をもたらす。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:49:16 GMT)
An experimental evaluation of Siamese Neural Networks for robot localization using omnidirectional imaging in indoor environments [1.0]
本稿では,ロボットに搭載された頭蓋前視システムによって撮像された全方位画像を用いた局所化問題に対処する。本研究では,パノラマ画像を用いた屋内環境モデリングのためのシームズニューラルネットワークの可能性を探る。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:44:37 GMT)
Melon Fruit Detection and Quality Assessment Using Generative AI-Based Image Data Augmentation [1.0]
生成AIモデルは高品質な画像を作成するのに役立つ。私たちはMidJourneyとFireflyのツールを使って、メロンの温室と収穫後の果実の画像を生成しました。 YOLOv9モデルは生成した画像を良好に検出し、純品質も測定可能であった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:26:13 GMT)
Enhancing Multistep Brent Oil Price Forecasting with a Multi-Aspect Metaheuristic Optimization Approach and Ensemble Deep Learning Models [1.0]
メタヒューリスティック最適化と5つのニューラルネットワークアーキテクチャのアンサンブルを組み合わせたハイブリッドアプローチを提案する。我々は,GWOメタヒューリスティック・オプティマイザを特徴選択,データ準備,モデルトレーニング,予測ブレンディングの4段階で活用する。提案手法は、実世界のブレント原油価格データを用いて、前日3日を予測するために評価されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:27:14 GMT)
Enhancing Multi-Step Brent Oil Price Forecasting with Ensemble Multi-Scenario Bi-GRU Networks [1.0]
我々は,ブレント原油価格のボラティリティを把握し,多段階予測を強化するためのアンサンブルモデルを導入する。まず、一般的なディープラーニングモデルと、様々な外部要因が予測精度に与える影響を評価する。提案手法は,3つのBI-GRUネットワークを用いて,複数の予測シナリオのアンサンブル手法を用いて正確な予測を生成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:21:17 GMT)
Bridging the Global Divide in AI Regulation: A Proposal for a Contextual, Coherent, and Commensurable Framework [1.0]
本稿では、人工知能(AI)を制御するための文脈的・一貫性的・包括的枠組み(3C)を提案する。コンテキスト性を確保するため、このフレームワークはAIライフサイクルを、基礎や汎用モデルを定義するのではなく、特定のタスクの学習とデプロイという2つのフェーズに分岐させる。コンメンサビリティを確保するため、この枠組みはリスクの測定と緩和のための国際標準の採用を促進する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:43:22 GMT)
Enhancing HNSW Index for Real-Time Updates: Addressing Unreachable Points and Performance Degradation [1.0]
グラフベースのインデックスは、大量のリアルタイム削除、挿入、更新に直面したとき、受け入れられなくなる。本稿では,HNSWの欠点を克服するための効率的な対策について述べる。提案したMN-RUアルゴリズムは,更新効率を効果的に向上し,到達不能な点の成長速度を抑え,全体の性能を向上し,グラフの完全性を維持する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:23:35 GMT)
Category Adaptation Meets Projected Distillation in Generalized Continual Category Discovery [0.9]
Generalized Continual Category Discovery (GCCD)は、シーケンシャルに到着し、部分的にラベル付けされたデータセットから学ぶことに取り組む。本稿では,学習可能なプロジェクタと特徴蒸留を統合し,過去の知識を犠牲にすることなくモデル適応性を向上する手法を提案する。それぞれのコンポーネントが個別に穏やかなメリットを提供する一方で、その組み合わせであるCAMPは、新しい情報学習と古い情報保持のバランスを大幅に改善します。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:33:10 GMT)
MARVEL: MR Fingerprinting with Additional micRoVascular Estimates using bidirectional LSTMs [0.9]
本稿では,現実的な微小血管ネットワークを含む数値ボクセルからのMR信号をシミュレーションする効率的な方法を提案する。 3人のボランティアに対して行った結果から,我々のアプローチはより高速に微小血管パラメータの定量的マップを作成できることが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:09:54 GMT)
Deep-Learning-Based Markerless Pose Estimation Systems in Gait Analysis: DeepLabCut Custom Training and the Refinement Function [0.9]
マーカーレスポーズ推定システムは生態学的代替物として現れる。本研究では,2種類のマーカーレスシステムであるOpenPose(OP)とDeepLabCut(DLC)の性能を比較した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:14:30 GMT)
Maximum Likelihood Estimation of the Direction of Sound In A Reverberant Noisy Environment [0.9]
残響環境における音の方向を音の伝搬の基本原理から推定する新しい手法について述べる。音波分解後の方向成分の時間遅延とエネルギーからSNR適応特性を利用する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:22:05 GMT)
Can machine learning solve the challenge of adaptive learning and the individualization of learning paths? A field experiment in an online learning platform [0.8]
デジタル技術に基づく学習内容の個別化は、大きな個人的および社会的利益をもたらす。大規模なデジタル自己学習プラットフォーム上でランダム化制御試験を行う。我々は,2つの畳み込みニューラルネットワークに基づくアルゴリズムを開発し,学習経路に応じて4,365ドルの学習者にタスクを割り当てる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:53:55 GMT)
Impacts of Data Preprocessing and Hyperparameter Optimization on the Performance of Machine Learning Models Applied to Intrusion Detection Systems [0.8]
侵入検知システム(IDS)は継続的に改善されている。その多くは、脅威を特定するために機械学習(ML)技術を採用している。本稿では,この研究ギャップを埋める研究について述べる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:30:25 GMT)
Large Language Models can Strategically Deceive their Users when Put Under Pressure [0.8]
我々は,GPT-4を現実的な模擬環境でエージェントとして展開し,自律的な株式取引エージェントの役割を想定する。このモデルは、収益性のある株式取引に関するインサイダーチップを取得し、企業経営によってインサイダー取引が承認されていないことを知りながら、その上で行動する。我々は、この動作が、推論スクラッチパッドへのモデルアクセスを除去するなど、設定の変更の下でどのように変化するかを簡単に調査する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:51:52 GMT)
A Sound and Complete Equational Theory for 3-Qubit Toffoli-Hadamard Circuits [0.8]
X, CX, CCX, K をToffoli-Hadamard ゲート集合とする3量子量子回路の完全方程式理論を与える。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:19:20 GMT)
Towards Task-Compatible Compressible Representations [0.8]
マルチタスクで学習可能な圧縮において、あるタスクで学習した表現が別のタスクの速度歪み性能に肯定的な寄与をしない問題について検討する。学習可能なスケーラブルコーディングでは、この共有表現を学習する際に入力再構成にも報いることで、入力再構成のためのサイド情報の利用が増加した。我々はCOCO 2017のオブジェクト検出とCityscapesデータセットの深さ推定のために訓練された表現を用いて実験を行い、画像再構成とセマンティックセグメンテーションタスクを支援する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:58:07 GMT)
Unlocking the Potential: Multi-task Deep Learning for Spaceborne Quantitative Monitoring of Fugitive Methane Plumes [0.8]
メタン濃度インバージョン(英語版)、プルームセグメンテーション(英語版)、エミッションレート推定(英語版)は、メタン排出モニタリングの3つのサブタスクである。リモートセンシング画像からメタン排出量の定量モニタリングを行うための,新しいディープラーニングベースのフレームワークを提案する。メタン濃度インバージョンのためのU-Netネットワーク,メタン配管セグメンテーションのためのMask R-CNNネットワーク,メタン排出率推定のためのResNet-50ネットワークを訓練する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:49:24 GMT)
Lessons from a human-in-the-loop machine learning approach for identifying vacant, abandoned, and deteriorated properties in Savannah, Georgia [0.8]
VADecideと呼ばれるHuman-in-the-loop Machine Learning(HITLML)モデルを作成し、ジョージア州サバンナのパーセルレベルのケーススタディに適用する。その結果,人間の入力を伴わない機械学習モデルを用いた場合よりも,予測精度が高いことがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:03:42 GMT)
XEQ Scale for Evaluating XAI Experience Quality Grounded in Psychometric Theory [0.8]
説明可能な人工知能(XAI)は、説明を通じて自律的な意思決定の透明性を向上させることを目的としている。近年の文献では、ユーザによる総合的な「マルチショット」の説明の必要性と、XAIシステムとの関わりをパーソナライズする能力を強調している。我々は,XAI体験のユーザ中心品質を評価するためのXAI Experience Quality (XEQ)尺度を紹介する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:25:49 GMT)
M18K: A Comprehensive RGB-D Dataset and Benchmark for Mushroom Detection and Instance Segmentation [0.8]
本稿では,キノコ検出専用のデータセットを提供することにより,農業プロセスの自動化に寄与する。 Intel RealSense D405カメラで撮影された423のRGB-Dイメージペアに18,000以上のキノコインスタンスがあり、キノコ固有のデータセットのギャップを埋める。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:50:06 GMT)
Benchmarking Quantum Computers: Towards a Standard Performance Evaluation Approach [0.7]
我々は、古典的なプロセッサベンチマークとそれらを構成するメトリクスの両方の最も重要な側面についてレビューする。量子コンピューティングのパラダイムを特徴付ける本質的な特性を解析する。本稿では,量子ベンチマークの一般的なガイドラインを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:39:59 GMT)
Using Stochastic Gradient Descent to Smooth Nonconvex Functions: Analysis of Implicit Graduated Optimization with Optimal Noise Scheduling [0.7]
本稿は,大規模なバッチサイズが急激な局所最小値に陥る理由,学習速度の低下とバッチサイズの増加が,固定的な学習速度よりも優れている理由,学習速度の最適性について理論的知見を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:17:24 GMT)
Evaluating Algorithmic Bias in Models for Predicting Academic Performance of Filipino Students [0.7]
本稿では,フィリピンの大学における学生の地域背景に基づくアルゴリズムバイアスについて検討する。我々はCanvasにおける学生の活動のログ記録を4870万件使用し、学生の成績を予測する2進分類モデルを訓練した。学年予測では,特定の学生群に対して不公平性は認められなかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:03:01 GMT)
Two-dimensional motion of an impurity under dynamic light-induced dipole forces in an atomic subwavelength array [0.7]
サブ波長の原子配列を自由に移動できる不純物の力学について検討する。不純物はプラケット内の準安定軌道を長時間維持できる。解析の最終点として、格子原子の運動自由度を考慮に入れ、不純物による格子の運動状態に誘起されるポーラロン様励起を研究する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:00 GMT)
Evaluation of RAG Metrics for Question Answering in the Telecom Domain [0.7]
Retrieval Augmented Generation (RAG) は、大規模言語モデル(LLM)が質問応答(QA)タスクを実行できるようにするために広く使われている。この作業は、いくつかの指標(事実性、文脈関連性、回答関連性、回答正当性、回答類似性、事実正当性)に対して修正されたこのパッケージで、プロンプトの中間出力を提供する。次に、修正されたRAGASパッケージの出力のエキスパート評価を分析し、通信領域で使用する際の課題を観察する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:40:15 GMT)
Comparing Optical Flow and Deep Learning to Enable Computationally Efficient Traffic Event Detection with Space-Filling Curves [0.6]
我々は,OF(Optical Flow)とDL(Deep Learning)を比較し,前方の車載カメラからの映像データに対して,空間充填曲線による計算効率の高いイベント検出を行う。以上の結果から,OFアプローチは特異性に優れ,偽陽性を低減し,DLアプローチは優れた感度を示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:44:52 GMT)
Towards noise contrastive estimation with soft targets for conditional models [0.6]
本稿では確率的目標に適合する損失関数を提案する。我々の新しいソフトターゲットInfoNCE損失は概念的にはシンプルで、計算に効率的であり、ノイズコントラスト推定の枠組みを通じて動機付けできる。ソフトターゲットInfoNCEは,強いソフトターゲットのクロスエントロピーベースラインと同等に動作し,一般的なベンチマークにおいてハードターゲットNLLとInfoNCEの損失を上回ります。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:45:00 GMT)
BMR and BWR: Two simple metaphor-free optimization algorithms for solving real-life non-convex constrained and unconstrained problems [0.6]
本稿では,Best-Mean-Random (BMR) とBest-Worst-Randam (BWR) という2つの単純な最適化アルゴリズムを提案する。 BMRアルゴリズムは、問題を解くために生成される集団の最適で平均的なランダムな解に基づいている。 BWRアルゴリズムは、最良の、最悪の、ランダムな解に基づいている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:11:47 GMT)
Prompt Selection Matters: Enhancing Text Annotations for Social Sciences with Large Language Models [0.6]
性能はプロンプト間で大きく異なり,高品質なプロンプトを体系的に構築するために自動プロンプト最適化手法を適用する。我々はまた、このメソッドのシンプルなブラウザベースの実装をコミュニティに提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:04:32 GMT)
The impact of noise on the simulation of NMR spectroscopy on NISQ devices [0.5]
本稿では、2つの有望な量子コンピューティングプラットフォームを持つ小さな有機分子の核磁気共鳴(NMR)分光シミュレーションについて述べる。得られたNMRスペクトルに対するノイズの影響を解析し、提案アルゴリズムが許容できる閾値ノイズを定量化する効果的なデコヒーレンス率を定式化する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:34:29 GMT)
Robust Quantum Control via Multipath Interference for Thousandfold Phase Amplification in a Resonant Atom Interferometer [0.5]
本稿では,光パルス原子干渉計のパルス不均一性に対する堅牢性を高める新しい手法を提案する。本手法を共振型原子干渉計に適用し,数千倍の位相増幅を実現する。我々は,ダークマター,ダークエネルギ,重力波検出など,さまざまな用途において,物質波干渉計の性能向上が期待できる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:19:52 GMT)
Feynman path integrals for discrete-variable systems: Walks on Hamiltonian graphs [0.5]
離散変数量子系において、ファインマン経路積分は重み付き隣接行列がハミルトニアンであるグラフ上のウォークの形式をとる。ファインマンの連続変数パス積分を明示的に回収する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:44:02 GMT)
ConvBench: A Comprehensive Benchmark for 2D Convolution Primitive Evaluation [0.3]
本稿では,畳み込みアルゴリズムの評価と比較のためのプリミティブレベルのベンチマークであるConvBenchを提案する。 1097の現実世界のディープラーニングモデルから派生した9243の畳み込み操作を評価する。実験の結果、93.6%の畳み込みでIm2col-GEMMよりも速い結果が得られた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:58:24 GMT)
Novel Approach for Predicting the Air Quality Index of Megacities through Attention-Enhanced Deep Multitask Spatiotemporal Learning [0.3]
大気汚染は、特に都市部において、世界中の人間の健康にとって最も深刻な環境脅威の1つだ。人口1000万人を超える都市として定義されるメガシティーは、深刻な汚染のホットスポットとして頻繁に見られる。本稿では,長期記憶ネットワークに基づく注意力強化型ディープラーニングモデルを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:43:50 GMT)
G-PCGRL: Procedural Graph Data Generation via Reinforcement Learning [0.3]
ゲームでは、グラフベースのデータ構造は全表現であり、ゲーム経済、スキルツリー、複雑な分岐クエストラインを表す。本稿では,強化学習を用いたグラフデータの手続き生成のための新規かつ制御可能な手法を提案する。本手法は,ゲーム作成プロセスにおいて,デザイナの支援とインスピレーションを行うために,グラフベースのコンテンツを迅速かつ確実に生成することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:11:00 GMT)
Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain [0.2]
本稿では,文空間法を用いた自然言語データストリーム分類手法を提案する。画像分類専用の畳み込みディープネットワークを使用することで、テキストデータに基づいてフェイクニュースを認識できる。実生活のFakedditデータセットに基づいて,提案手法をデータストリーム分類のための最先端アルゴリズムと比較した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:23:21 GMT)
Brain Tumor Classification From MRI Images Using Machine Learning [0.2]
脳腫瘍は生命を脅かす問題であり、人間の身体の正常な機能を損なう。医用画像におけるディープラーニングアルゴリズムの使用により、脳腫瘍の分類と診断が大幅に改善された。本研究の目的は,機械学習を用いた脳腫瘍検出のための予測システムを開発することである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:30:40 GMT)
Stacking-Enhanced Bagging Ensemble Learning for Breast Cancer Classification with CNN [0.2]
本稿では,乳がん分類のためのBaggingおよびスタックングアンサンブル学習手法に基づくCNN分類ネットワークを提案する。このモデルは入力画像の高速かつ正確な分類を行うことができる。二項分類(乳がんの有無)では、精度は98.84%に達し、5級分類では98.34%に達した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:44:43 GMT)
Representing Arbitrary Ground States of Toric Code by Restricted Boltzmann Machine [0.2]
隠れたニューロンと可視ニューロンの局所的接続のみを有する制限ボルツマンマシンによるトーリック符号基底状態の表現可能性の解析を行った。我々は制限ボルツマン機械を改良し、効率的な非局所接続を導入することで任意の基底状態に適応する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:40:20 GMT)
Imaging Coulomb interactions and migrating Dirac cones in twisted graphene by local quantum oscillations [0.2]
ナノスケール走査型超伝導量子干渉装置を用いて、交流三層グラフェンの局所熱力学的量子振動を56mT以下の磁場で撮像する。電子状態の占有による帯電自己エネルギーは,高キャリア密度物理を説明する上で重要である。伝導平板の半充填では、ストーナー様対称性の破れが観察され、これは相転移の階層における最も堅牢な機構であることが示された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:47:22 GMT)
Data-Driven Abstractions via Binary-Tree Gaussian Processes for Formal Verification [0.2]
ガウス過程(GP)回帰に基づく抽象的解は、量子化された誤差を持つデータから潜在システムの表現を学習する能力で人気を博している。二分木ガウス過程(BTGP)により未知系のマルコフ連鎖モデルを構築することができることを示す。 BTGPの関数空間に真の力学が存在しない場合でも、統一公式による非局在誤差量子化を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:49:44 GMT)
Quality Scalable Quantization Methodology for Deep Learning on Edge [0.2]
ディープラーニングアーキテクチャは重い計算を使い、計算エネルギーの大部分は畳み込みニューラルネットワークの畳み込み演算によって取り込まれる。提案する研究は、ユビキタスコンピューティングデバイス上でエッジコンピューティングで機械学習技術を使用する場合、CNNのエネルギー消費とサイズを削減することである。 LeNetとConvNetsで実施された実験では、ゼロの6%まで増加し、メモリ節約量は82.4919%まで増加し、最先端の精度を維持した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:00:29 GMT)
NPA Hierarchy for Quantum Isomorphism and Homomorphism Indistinguishability [0.2]
グラフの量子同型に対するSDP緩和のNPA階層の各々のレベルは、平面グラフの適切なクラスに対する準同型独立性と同値であることを示す。この準同型不連続性の特徴付けはまた、量子同型に対するSDP緩和のNPA階層の固定レベル毎の正確な実現性を決定するランダム化時間アルゴリズムを与えることもできる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:48:09 GMT)
Quantification and Validation for Degree of Understanding in M2M Semantic Communications [0.2]
本稿では,自然言語に基づくマシン・ツー・マシン(M2M)SemComの2段階階層的検証モデルを提案する。このアプローチは、自律運転やエッジコンピューティングなど、さまざまなアプリケーションに適用することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:37:42 GMT)
Long-fiber Sagnac interferometers for twin field quantum key distribution networks [0.2]
サニャックループ構造は、ツインフィールド量子鍵分布ネットワークの実践的な実装において大きな困難を克服するのに役立つ。長繊維と損失光デバイスを含むサニャック系において,レイリー後方散乱雑音は信号対雑音比を制限することを示した。本研究は,大都市量子ネットワークの実現に向けた重要なステップである,長距離TFQKDネットワークに対するサニャックシステムの適合性を示すものである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:16:10 GMT)
VyZX: Formal Verification of a Graphical Quantum Language [0.2]
帰納的表現は形式的推論の意味論を定義する。 VyZXは、帰納的に定義されたグラフィカル言語を推論するためのライブラリである。 VyZX における帰納グラフは、ZX-計算の書き直し規則の正しさを証明するためにどのように用いられるかを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:10:09 GMT)
Development of an automatic modification system for generated programs using ChatGPT [0.1]
OpenAIのChatGPTは自然言語処理タスクに優れ、ソースコードも生成できる。我々はChatGPTで生成されたコードをテストし、不適切であれば自動的に修正し、適切なコードをユーザに提示するシステムを開発した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:48:31 GMT)
Understanding the Dependence of Perception Model Competency on Regions in an Image [0.1]
低モデル能力に寄与する入力画像内の領域を特定する5つの方法を示す。その結果,低モデル能力に関連する領域を特定する上で,能力勾配と復元損失法が有望であることが判明した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:50:13 GMT)
Moment Unfolding [0.1]
我々は、まずデータを離散化することなく、観測可能な別の関数として分布モーメントを展開するための新しいアプローチを開発する。私たちのモーメント・アンフォールディング技術は機械学習を使い、GAN(Generative Adrial Networks)にインスパイアされています。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:45:23 GMT)
Spatio-temporal neural distance fields for conditional generative modeling of the heart [0.1]
本稿では,時間的神経野の形で形と動きを暗黙的にモデル化し,臨床デモグラフィーに基づく条件付き生成モデルを提案する。左心房で検査され、現在の配列解剖学的完了合成配列よりも優れている。これは、静的画像から機能的計測を推測し、特定のデモグラフィーまたは疾患で合成集団を生成し、非画像臨床データが心臓解剖の形状と運動にどのように影響するかを調査することができることを意味している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:26:52 GMT)
Finding Fake News Websites in the Wild [0.1]
誤情報コンテンツの作成・配信に責任があるウェブサイトを識別する新しい手法を提案する。さまざまな実行モードやコンテキストを調べて,Twitter上でのアプローチを検証する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:18:44 GMT)
Zeptosecond-scale single-photon gyroscope [0.0]
Prototypeは、平均時間72$sで249$zs、平均時間で26zsの差分遅延測定で$t=104$zの光子遅延測定に制限を課している。結果は、低光子状態の量子メートル法(英語版)の文脈において画期的なものであり、特殊あるいは一般相対性理論で量子光学を橋渡しするための新しい実験的な構成への道を開いた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:35:08 GMT)
What Do People Think about Sentient AI? [0.0]
先進的AIの話題に関する全国的に代表的な調査データを提示する。 2021年に1波、2023年に2波のデータ収集を行い、AIの幸福に対する心の認識と道徳的懸念は予想以上に高かった。我々は、AIが賢明になるかどうかに関わらず、議論そのものが人間とコンピュータのインタラクションをオーバーホールするかもしれないと論じる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:39:44 GMT)
Weighted Grouped Query Attention in Transformers [0.0]
Weighted Grouped-Query Attention (WGQA) と呼ばれるグループクエリ注意のバリエーションを提案する。我々は,T5デコーダのアテンションブロックにおいて,各キーと値のヘッダに対して新たな学習可能なパラメータを導入し,微調整中に重み付き平均値を取ることを可能にする。本モデルでは,GQAよりも平均0.53%改善し,推定時のオーバーヘッドを伴わず,従来のマルチヘッドアテンション(MHA)に収束する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:07:13 GMT)
Transforming Agency. On the mode of existence of Large Language Models [0.0]
本稿では,ChatGPTのような大規模言語モデル(LLM)のオントロジ的特徴について検討する。また,ChatGPTは,言語オートマトンやインターロケータ,言語オートマトンとして特徴付けられるべきだと論じる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:01:35 GMT)
Towards Enhanced Classification of Abnormal Lung sound in Multi-breath: A Light Weight Multi-label and Multi-head Attention Classification Method [0.0]
本研究は, 肺の異常な呼吸音を分類するための補助診断システムを開発することを目的とする。既存の呼吸音データセットにおけるクラス不均衡と多様性の欠如の問題に対処するため,本研究では軽量で高精度なモデルを用いた。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:40:02 GMT)
Time-symmetric correlations for open quantum systems [0.0]
二コトミック・オブザーバブルの逐次測定の2回の期待値は、閉じた量子系に対して時間対称である。量子ベイズ則は開量子系に付随する2時間期待値に対して時間対称性を示すことを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:01 GMT)
There Are No Post-Quantum Weakly Pseudo-Free Families in Any Nontrivial Variety of Expanded Groups [0.0]
最悪のケース設定やブラックボックスモデルであっても、$mathfrak V$に量子後、弱い擬似自由な家族が存在しないことを示す。また、計算とブラックボックスのファミリに対して、いくつかの弱い擬似自由度を定義し、研究する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:24:48 GMT)
The geometry of the Hermitian matrix space and the Schrieffer--Wolff transformation [0.0]
量子力学において、シュリーファー-ヴォルフ変換(Schrieffer--Wolff transformation)はハミルトニアンの摂動次元を減少させる近似法として知られている。エルミート行列の空間における局所座標が、$k$-foldの縮退部分多様体の近くで誘導されることを証明した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:05:39 GMT)
Superresolution in separation estimation between two dynamic incoherent sources using spatial demultiplexing [0.0]
近年、ハーマイト・ガウスモードにおける空間モード除算(SPADE)に基づく完全な測定により、2つの弱い不整合定常源の分離を推定する精度の量子限界に達した。本稿では、ソースの定常性に関する仮定を捨てて、完璧な設定から別の逸脱を考える。定常源シナリオにおける推定パラメータの1つを削減できる測定アルゴリズムを定式化する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:57:57 GMT)
Subspace-Search Quantum Imaginary Time Evolution for Excited State Computations [0.0]
本稿では,量子デバイスを用いた励起状態の計算を行うSSQITE法を提案する。 SSQITEは局所的な最小値を避けることの堅牢さから、広範囲のアプリケーションにまたがる励起状態の量子計算を推し進めることを約束している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:14:45 GMT)
Splitting techniques for approximating the exponential of commutators [0.0]
我々は、2つの任意の作用素の可換作用素の指数を関連する作用素の指数の観点で近似する位数 3 から 6 の積公式を構築する。新しいスキームは指数関数の数を減らし、これまで公表された他の方法よりも効率的な近似を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:41:00 GMT)
Spin entanglement in two-proton emission from $^6$Be [0.0]
本稿では,2陽子(2p$)放射性発光における結合スピンの絡み合いの評価を行う。時間依存計算を行い、放出された2つの陽子の結合スピン状態を算出する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:41 GMT)
Spatial Addressing of Qubits in a Dispersive Waveguide [0.0]
マイクロ波導波路内のサブ波長距離で分離した超伝導量子ビットの空間アドレス化を実現するために分散を用いる。この実験は、量子実験の設計と解析における分散の重要性を強調する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:08:34 GMT)
Socioeconomic factors of national representation in the global film festival circuit: skewed toward the large and wealthy, but small countries can beat the odds [0.0]
本研究では,グローバル・フィルム・フェスティバル・サーキットにおいて,各国の経済・人口・地理的要因がどのように表現されるかを分析する。これは、いくつかのオープンアクセスデータセットの組み合わせに依存しており、10年間で世界中で約600のフェスティバルで2万本以上の映画を3万本以上上映している。フェスティバル画面は、確かに大富裕国の映画に支配されているが、その偏見は世界の人口と経済格差に完全に比例していないことが示されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:31:23 GMT)
Single-qubit rotation algorithm with logarithmic Toffoli count and gate depth [0.0]
我々のアルゴリズムは、繰り返し固定回転を適用するのではなく、直ちに$R_thetaast$を適用する。厳密に1/2$以上の確率で成功し、予想されるトフォリ数対数$tfrac1epsilon$、期待されるゲート深さ$tfrac1epsilon$で対数を持つ。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:00:01 GMT)
Scattering entropies of quantum graphs with several channels [0.0]
多くの異なる状況において、量子グラフの散乱エントロピーを扱う。この結果は、量子グラフの輸送に関連するモデルの量化子として用いられるかもしれない。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:09:47 GMT)
Scaling 3D Reasoning with LMMs to Large Robot Mission Environments Using Datagraphs [0.0]
本稿では,LMM(Large Multimodal Models)を拡張性のある3D環境に拡張するという課題に対処する。我々は,LMMが大規模環境の小さな部分を反復的に問合せすることのできる,データグラフ構造を利用した新しい手法を提案する。本稿では,このデータグラフを2つの3次元シーン言語ユースケースに活用する可能性を,探索・救助ミッションの例で示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:16:13 GMT)
SSSD-ECG-nle: New Label Embeddings with Structured State-Space Models for ECG generation [0.0]
拡散モデルは近年大きく進歩し、実際のモデルに匹敵するデータを合成する可能性を生み出している。本稿では,SSSD-ECGに基づくSSSD-ECG-nleアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:31:25 GMT)
SLIP: Securing LLMs IP Using Weights Decomposition [0.0]
大規模言語モデル(LLM)は、最近、アカデミックと産業の両方で広く採用されている。これらのモデルが成長するにつれて、彼らは価値ある知的財産権(IP)となり、所有者による巨額の投資を反映している。エッジ上のモデルのIPを保護する現在の方法は、実用性、精度の低下、要求に対する適合性の制限がある。我々は,エッジデデプロイされたモデルを盗難から保護するために,SLIPという新しいハイブリッド推論アルゴリズムを導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:37:55 GMT)
SEDNet: Shallow Encoder-Decoder Network for Brain Tumor Segmentation [0.0]
本稿では,脳腫瘍セグメント化のための浅層エンコーダとデコーダネットワークSEDNetを提案する。提案するネットワークは,U-Net構造から適応する。 SEDNetは、非励磁性腫瘍コア(NTC)、周膜浮腫(ED)、造影腫瘍(ET)に対して、0.9308、0.9451、0.9026、0.7040、1.2866、0.7762という印象的なダイスとハースドルフスコアを達成している
論文参考訳（メタデータ） (Mon, 15 Jul 2024 06:46:40 GMT)
Randomised benchmarking for universal qudit gates [0.0]
巡回演算子とキューディットTゲートを用いることで、シングルおよびマルチキューディット回路に対する二面体ベンチマークスキームを一般化する。以上の結果から,qudit系を実験的にベンチマークする方法が確立され,理論的,実験的に注目されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:16:02 GMT)
Quantum coherence in networks [0.0]
入力を必要とせずに、ネットワークシナリオにおける量子コヒーレンスを検証する必要はないことを示す。三角ネットワーク上には, 3人の共同結果の確率分布が存在することを示す。古典的相関によって満たされる非線形不等式を導出し、それらに反する量子状態を見つける。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:01 GMT)
Quantum chemistry, classical heuristics, and quantum advantage [0.0]
量子化学の問題点、それらを解決するために使われた古典的手法の背景にある直観、そしてその後の量子的優位性の機会について述べる。この記事では、量子化学者と量子情報理論者の両方について記述する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:58:32 GMT)
Quantum bungee jumping [0.0]
正の半直線上の至る所でよく定義されたポテンシャルが、$-infty$ として $xrightarrow 0+$ に発散し、粒子を(正の)半直線に動的に閉じ込めることができるかもしれないことを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:01:04 GMT)
Quantum advantage in batteries for Sachdev-Ye-Kitaev interactions [0.0]
セルが相互作用している場合、量子電池のユニタリ充電において量子アドバンテージが達成される。我々は、この量子優位性がスパース Sachdev-Ye-Kitaev (SYK) 相互作用に対してどのように達成されるか、分析的な計算によって明らかにしようとする。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:05:59 GMT)
Quantum Technology masters: A shortcut to the quantum industry? [0.0]
本稿では,世界的量子技術(QT)教育の展望,すなわち修士課程の開発動向について考察する。グローバル調査を通じて、86のマスタープログラムを特定しました。我々は、多くの国の量子労働力を拡大するための様々な国家的努力、量子プログラムの強化、量子コンテンツによる既存の研究プログラムの内容の増大を識別する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:27:04 GMT)
Quantum Phase Estimation and the Aharonov-Bohm effect [0.0]
長いソレノイドを通した環上の粒子の時間発展を考えると、この系はアハロノフ・ボーム効果により自然に$U(1)$ユニタリ作用素に対する量子位相推定アルゴリズムの物理的実装を構成していることがわかる。 U(N)$ユニタリ作用素による完全量子位相推定アルゴリズムの実装は、非アーベル的アハロノフ・ボーム効果によって実現される。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:03:16 GMT)
Quantum Null Geometry and Gravity [0.0]
ヌル超曲面上の重力の量子化は、それぞれのヌル線に付随するCFTの出現につながる。 CFTは非ゼロ中心電荷を示し、重力系における時間の量子発生のメカニズムを提供する。集中電荷は、無限個のヌル発生器により摂動解析において分岐することを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:08 GMT)
Quantum Data Centers in the Presence of Noise [0.0]
シングルプロセッサのモノリシック量子コンピュータは、クロストークの増加と、キュービット数が増加するとゲートの実装が困難になる。 QDCでは、複数の量子処理ユニット(QPU)が短距離で連結され、任意のプロセッサ上のキュービット数を増やすことなく計算キュービットの総数を増やすことができる。これにより、各QPUの操作で発生するエラーを小さく抑えることができるが、QPU間の絡み合い分布中に発生する遅延コストとエラーのために、システムに追加のノイズを加えることができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:50:20 GMT)
Quantum Control of an Oscillator with a Kerr-cat Qubit [0.0]
ボソニック符号は、量子情報を冗長に符号化することで量子誤り訂正のためのハードウェア効率の良い戦略を提供する。 Kerr-cat qubitは理論上はノイズバイアスのため、これらの符号のアンシラとして提案されている。我々はKerr-cat量子ビットと高品質マイクロ波空洞との駆動結合を実験的に実現した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:38:34 GMT)
Quantum Advancements in Neutron Scattering Reshape Spintronic Devices [0.0]
トポロジカル磁気は量子技術の先例のない時代を巻き起こした。トポロジカルマグネットは、従来の半導体ベースのエレクトロニクスの限界を超えた新しい世代のスピントロニクスデバイスを動機付けている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:36:03 GMT)
Principal Component Flow Map Learning of PDEs from Incomplete, Limited, and Noisy Data [0.0]
本稿では,力学系の進化をモデル化する計算手法を提案する。本研究では,高次元非一様格子上の部分観測偏微分方程式(PDE)をモデル化する上での課題に着目する。本稿では、状態変数や計算領域のサブセットでのみ利用可能なノイズと制限付きデータを用いたPDEモデリングに適したニューラルネットワーク構造を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:06:20 GMT)
OnionVQE Optimization Strategy for Ground State Preparation on NISQ Devices [0.0]
変分量子固有解法(VQE)は、現在のノイズ中間スケール量子(NISQ)デバイスの性能を利用するために用いられる。 VQEアルゴリズムは、バレンプラトー、局所ミニマ、量子ハードウェアノイズ、量子ビット接続の制限など、多くの問題に悩まされている。文献の最近の進歩を基盤として、非常に浅い回路深さを示すVQE最適化戦略を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:32:27 GMT)
On Hagedorn wavepackets associated with different Gaussians [0.0]
Hagedorn関数の重ね合わせによって形成されるウェーブパペットは、シュル「オーディンガー方程式」を解くのに成功している。位置や運動エネルギーなどの典型的な観測可能量を評価するためには、単一のガウス中心を持つ正則ハゲゴルン函数を考えるのに十分である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:58:44 GMT)
Observing the quantum Mpemba effect in quantum simulations [0.0]
我々は、傾いた強磁性体が対称状態から遠く離れたとき、その対称性をより早く復元する量子Mpemba効果を実験的に検討する。トラップイオン量子シミュレータにおいて、この効果の発生に関する最初の実験的な証拠を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 07:01:05 GMT)
Nonlinearity of the Fidelity in Open Qudit Systems: Gate and Noise Dependence in High-dimensional Quantum Computing [0.0]
本稿では,リンドブラッド形式におけるマルコフ雑音下での単一キューディット系の平均ゲート忠実度(AGF)について検討する。環境結合係数の観点から平均ゲート不忠実度(AGI)の摂動膨張に関する一般表現を導出する。本研究は,AGIがQudit次元,量子ゲート選択,ノイズ強度に依存していることに注目し,量子ゲート設計と誤り訂正プロトコルを最適化するための重要な洞察を提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:34:48 GMT)
Multi-Mode Array Filtering of Resonance Fluorescence [0.0]
本稿では,周波数フィルタによる光子相関の測定と計算のための新しい周波数フィルタ法を提案する。モード依存位相変調を導入することで、ほぼ矩形周波数応答を生成する。単モードおよび多モードアレイフィルタによる2階自動・相互相関関数の結果について述べる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 23:23:08 GMT)
Multi-Attention Integrated Deep Learning Frameworks for Enhanced Breast Cancer Segmentation and Identification [0.0]
超音波画像を用いた乳腺腫瘍の正確な診断・分類は医学的課題である。本研究は,乳がん腫瘍の超音波画像からの分類と分類を目的とした多目的ディープラーニング(DL)フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:55:49 GMT)
Monolithically Integrated Ultra-Low Noise Balanced Receiver for CV-QKD [0.0]
モノリシックに集積されたアプローチは、バランスの取れた光検出器にワイヤーボンディングを必要とする不均一に統合されたソリューションと比較される。改良されたノイズ性能は、連続可変量子鍵分布(CV-QKD)における安全な鍵レートと到達範囲の増加に対して活用される。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:20:03 GMT)
Mixed-State Quantum Spin Liquids and Dynamical Anyon Condensations in Kitaev Lindbladians [0.0]
我々は, 脱コヒーレンスと散逸によるエノン凝縮の発生を示し, 初期状態スピン液体から定常状態スピン液体へのトポロジカルな遷移をもたらすことを示した。我々の研究は、オープン量子系が量子スピン液体やエノンのトポロジカル現象の新たな場所となることを示唆している。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:11:21 GMT)
Mitigating Data Imbalance for Software Vulnerability Assessment: Does Data Augmentation Help? [0.0]
CVSS(Common Vulnerability Scoring System)タスクにおけるモデルの予測性能は,データ不均衡の軽減によって著しく向上することを示す。また、ランダムなテキスト挿入、削除、置換といった単純なテキスト拡張は、ボード全体のベースラインよりも優れていることもわかりました。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:47:55 GMT)
Mechanistic interpretability of large language models with applications to the financial services industry [0.0]
我々は、金融サービスアプリケーションで使用する大規模言語モデルの内部動作に光を当てるために、機械的解釈可能性の使用の先駆者です。特に,フェアレンディング法違反の可能性を特定するために,GPT-2スモールの注意パターンについて検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:59:53 GMT)
Measurable Krylov Spaces and Eigenenergy Count in Quantum State Dynamics [0.0]
我々は、異なる進化時間を持つ時間進化状態が、クリロフ状態空間と等価な空間を構築するために用いられることを示した。次に、ハミルトニアンのペアごとに異なる固有値の数によって上界となる実効次元を導入する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:43:29 GMT)
Mammographic Breast Positioning Assessment via Deep Learning [0.0]
マンモグラフィーにおける不適切な位置決めは、診断ミス、患者のストレスの増加、リコールによるコストの上昇につながる可能性がある。本稿では,マンモグラム位置決め品質を定量的に評価するための新しいディープラーニング(DL)手法を提案する。本手法は, 乳頭筋, 乳頭筋などの重要な解剖学的特徴を同定し, 自動的に後乳頭線(PNL)を描出する。以上の結果から,注意機構とCoordConvモジュールを組み込んだモデルでは乳房位置決め精度が向上することが示唆された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:14:10 GMT)
Low-depth Circuit Implementation of Parity Constraints for Quantum Optimization [0.0]
ゲート数と深さが低い回路の構成について述べる。回路は任意の量子デバイス上で実装でき、隣り合う接続は正方形格子上で行うことができる。システムサイズに依存しない回路深さの上限を求める。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:55:07 GMT)
Linear-optical fusion boosted by high-dimensional entanglement [0.0]
2量子ビット部分空間のベル状態に1組の$d$を確率的に投影する量子測度を提案する。アンシラ光子なしで1-d-1$、アンシラ光子で1-d-(k+1)$で2(2k-1)$の成功確率を持つ線形光学回路を用いて行うことができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:41:59 GMT)
Landslide vulnerability analysis using frequency ratio (FR) model: a study on Bandarban district, Bangladesh [0.0]
本研究では,南東バングラデシュのバンダルバン地区を中心に,チッタゴンヒルトラクト(CHT)における地すべりの脆弱性を評価する。その結果, 急傾斜, 高標高, 特異面, 曲率が地すべりの感受性に大きく寄与することが判明した。その結果、ランドスライダー・サセプティビリティ・マップ (LSM) は、この地域を5つのサセプティビリティ・ゾーンに分類した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:28:10 GMT)
LIP-CAR: contrast agent reduction by a deep learned inverse problem [0.0]
コントラスト剤の低減問題は、視力増強を保ちながらコントラスト剤の投与量を減少させることである。 CARタスクに関する現在の文献は、完全な画像処理フレームワーク内のディープラーニング技術に基づいている。我々は,高線量画像を対応する低線量画像にマッピングするイメージ・ツー・イメージ演算子を学習し,CARタスクを逆問題とする。正規化法は、堅牢性と説明可能性を提供するよく確立された数学的手法である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:16:54 GMT)
JDT3D: Addressing the Gaps in LiDAR-Based Tracking-by-Attention [0.0]
自動走行のための3Dトラッキングベンチマークにおいて、トラッキング・バイ・検出(TBD)法は最先端のパフォーマンスを達成する。一方、トラッキング・バイ・アテンション(TBA)法は、TBD法より優れている可能性がある。本研究は,LiDARを用いたジョイント検出器とJDT3Dを用いたTBD法におけるTBA法の性能低下について検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:02:08 GMT)
Interpreting Hand gestures using Object Detection and Digits Classification [0.0]
本研究の目的は,数字を表す手振りを正確に認識し,分類できる堅牢なシステムを開発することである。提案手法では、手動画像のデータセットの収集、画像の事前処理と拡張、関連する特徴の抽出、機械学習モデルのトレーニングなどを行う。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:53:04 GMT)
InsertDiffusion: Identity Preserving Visualization of Objects through a Training-Free Diffusion Architecture [0.0]
InsertDiffusionは、オブジェクトを画像に効率的に埋め込む、トレーニング不要の拡散アーキテクチャである。提案手法は既製の生成モデルを利用し,微調整の必要性を排除している。生成タスクを独立したステップに分解することで、InsertDiffusionはスケーラブルなソリューションを提供する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:15:58 GMT)
Inference at the data's edge: Gaussian processes for modeling and inference under model-dependency, poor overlap, and extrapolation [0.0]
ガウス過程 (GP) はフレキシブルな非線形回帰法である。これは、予測された(非現実的な)値に対する不確実性を扱うための原則化されたアプローチを提供する。これは外挿または弱い重なり合いの条件下では特に有用である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:09:50 GMT)
Impact of COVID-19 post lockdown on eating habits and lifestyle changes among university students in Bangladesh: a web based cross sectional study [0.0]
本研究は, 学生の食事習慣, 身体活動, 睡眠時間, 買い物習慣, インターネット利用時間, 精神状態の有意な変化を明らかにすることを目的とした。調査によると、回答者の21.5%が体重を、23.8%が体重を減らし、41.7%が体重をコントロールした。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 03:08:32 GMT)
General measurements with limited resources and their application to quantum unambiguous state discrimination [0.0]
任意の$n$-outcome Generalized quantum Measurement (POVM) を$m$-qubitレジスタ上に実装するためのフレームワークを提案する。この枠組みをあいまいな状態識別に適用し、可能な戦略を分析する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:17:38 GMT)
FarsInstruct: Empowering Large Language Models for Persian Instruction Understanding [0.0]
この研究は、Co-CoLAフレームワークによるトレーニングとFarsInstructデータセットの有効性を示す。現在の執筆時点で、FarsInstructは21の異なるデータセットに200以上のテンプレートで構成されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:17:31 GMT)
Exploring the Potentials and Challenges of Deep Generative Models in Product Design Conception [0.0]
DGM-families (VAE, GAN, Diffusion, Transformer, Radiance Field) を解析し,その強度,弱点,製品設計概念の適用性について検討した。我々の目標は、エンジニアが意思決定プロセスを簡単にし、特定の課題に対してどの方法が最も効果的かを決定するのに役立つ洞察を提供することです。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:28:50 GMT)
Exploration in Knowledge Transfer Utilizing Reinforcement Learning [0.0]
本論文は,深層移動学習アルゴリズムで用いられる探索手法を比較することを目的としている。用いられる方法は、$epsilon$-greedy、Boltzmann、そして高信頼境界探索である。以上の結果から, 上位信頼境界アルゴリズムはこれらの選択肢の中で最良であることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:45:29 GMT)
Expert-aware uncertainty estimation for quality control of neural-based blood typing [0.0]
医学的診断において、神経モデルに対する正確な不確実性推定は、二次対位法の補完に不可欠である。ここでの大きな難点は、サンプルの硬さにラベルがないことである。我々の新しいアプローチは、ニューラルネットワークの学習プロセスにケース複雑性のエキスパートアセスメントを統合し、決定的なターゲットラベルと補足的複雑性評価の両方を活用する。実験では、不確実性予測におけるアプローチの強化、専門家ラベルによる2.5倍の改善、およびニューラルネットワークの専門家コンセンサスの推定によるパフォーマンスの35%向上が示されている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:07:02 GMT)
Experimental lower bounds on entanglement entropy without twin copy [0.0]
断熱的に調製した地盤状態の実験的測定と関連するシャノンエントロピー$S_ABX$を計算した。良い近似では$S_AvNpropto (2S_AX-S_ABX)$が1よりわずかに大きい例を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:27:55 GMT)
Examining the Influence of Varied Levels of Domain Knowledge Base Inclusion in GPT-based Intelligent Tutors [0.0]
知識ベース(KB)をLLM知能チューターと統合して応答信頼性を高める効果について検討する。我々は,知的学習システムによって自動的に処理される授業カリキュラムのシームレスな統合を可能にする,スケーラブルなKBを設計する。 KBアクセスを持つ知的家庭教師は,教師のように話し,学生を理解する能力が,ドメインエキスパートよりも優れていることが観察された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:14:34 GMT)
Evaluating geometric accuracy of NeRF reconstructions compared to SLAM method [0.0]
フォトグラメトリーは画像ベースの3D再構成を行うことができるが、計算コストが高く、複雑な幾何学やフォトリアリズムを復元するために非常に高密度な画像表現を必要とする。 NeRFは、スパース画像上でニューラルネットワークをトレーニングし、データをポーズすることで3Dシーン再構築を行い、少ない入力データでフォトグラム測定に優れた結果が得られる。縦型PVCシリンダの直径を推定するための2つのNeRFシーン再構成の評価を行った。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:04:11 GMT)
Enhancing Medication Recommendation with LLM Text Representation [0.0]
本稿では,Large Language Model (LLM) テキスト表現を用いた薬剤推奨の強化手法を提案する。 LLMは強力な言語理解と生成能力を利用し、複雑で長い構造化されていないデータから情報を抽出することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 05:51:11 GMT)
Enhancing Cyber Security through Predictive Analytics: Real-Time Threat Detection and Response [0.0]
調査では、ネットワークトラフィックとセキュリティイベントの2000インスタンスを含む、Kaggleのデータセットを使用している。その結果,予測分析は脅威の警戒と応答時間を高めることが示唆された。本稿では,予防的サイバーセキュリティ戦略開発における重要な要素として,予測分析を提唱する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:11:34 GMT)
Enhanced entanglement scaling and area-law charge fluctuations in a non-Fermi liquid of composite fermions [0.0]
エンタングルメントの強化は$nu=1/2$だけでなく$nu=1/4$でもあり、ボソニックなCFL状態は$nu=1$で、$nu=$で満たされている。その結果, CFL状態における非Fermi-液性相関の指紋として, 絡み合いの増大と電荷変動の抑制が確認された。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:01 GMT)
Encoded probabilistic imaginary-time evolution on a trapped-ion quantum computer for ground and excited states of spin qubits [0.0]
量子コンピュータを用いて、ダイヤモンドと窒化アルミニウムのスピン欠陥に対する低エネルギー有効ハミルトニアンを解く。スピン一重項状態は密度汎関数理論(DFT)を用いて計算することは困難であり、これは複数のスレーター行列式によって記述されるべきである。これは、符号化されたPITE回路が捕捉されたイオン量子コンピュータ上で実行される最初の例である。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:07:54 GMT)
Efficient fidelity estimation: Alternative derivation and related applications [0.0]
Uhlmann-Jozsa は、Uhlmann-Jozsa の二つの量子状態 $rho$ と $sigma$ の間の忠実さ、すなわち $F(rho,sigma):=(Trsqrtsqrtrhosigmasqrtrho)2$ は、$F(rho,sigma) = (Trsqrtrhosigma)2$ と簡単に書けることを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:57:03 GMT)
Effect of order of transfer matrix exceptional points on transport at band edges [0.0]
バンドエッジに近い1次元フェルミオン系では、ゼロ温度コンダクタンスは1/N2$までスケールし、そこではN$はシステム長である。バンドエッジの移動行列EPの順序によってこれらの挙動がどう影響するかを考察する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:37:01 GMT)
E-Commerce Product Recommendation System based on ML Algorithms [0.0]
このプロジェクトの目的は、eコマースプラットホームがユーザとコミュニケーションする方法を変えることだ。私たちは、最先端の機械学習技術を使用して、製品レコメンデーションをカスタマイズできるモデルを作成しました。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 01:30:49 GMT)
Dynamical Phase Transitions, Caustics, and Quantum Dark Bands [0.0]
時間とともに多体状態のフォック空間表現における因果関係を示す。本稿では,有限系実験におけるDPTの存在を検証するためのプロトコルを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 08:37:13 GMT)
Distillation of quantum non-Markovianity [0.0]
開量子系力学の非マルコビアン性は物理的に関係のある性質であり、通常は(量子)情報のバックフローと関連している。チャネルのコピー数が多い場合, 量子力学の非マルコビアン性はいかにして蒸留され, 情報のバックフローに強い影響を与えるかを検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:07:42 GMT)
Disorder-free Sachdev-Ye-Kitaev models: Integrability and a precursor of chaos [0.0]
本研究では、Sachdev-Ye-Kitaevモデル(SYK)の2種類の障害のない変種について検討する。これらのモデルでは, 時間外相関器 (OTOC) が早期に指数関数的な成長を示した。以上の結果から,SYKモデルのクリーンバージョンは,乱れのない量子多体系の単純かつ非自明な例であることがわかった。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:37:10 GMT)
Disentangling Representations in RNNs through Multi-task Learning [0.0]
不整合表現は生物学的および人工両方の効率的な一般化のための有望な枠組みですマルチタスク分類で訓練されたRNNは、連続的なアトラクタの形で非絡み合った表現を学習することが実験的に確認された。本稿では,知識を整理し,フレキシブルな一般化を実現する認知地図作成の一般的な原則を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:32:58 GMT)
Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints [0.0]
マルチエージェント強化学習パラダイムに拡散モデルを統合する革新的なフレームワークを導入する。このアプローチは、協調動作をモデル化しながらリスク軽減を通じて、複数のエージェントが取るべき行動の安全性を特に向上させる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:33:52 GMT)
Depth scaling of unstructured search via quantum approximate optimization [0.0]
変分量子アルゴリズムは、現在の量子計算のデファクトモデルとなっている。そのような問題の1つは、ある文字列の特定のビットを見つけることで構成される非構造化探索である。我々は、CTQWを用いてQAOA配列を復元し、最近のトロッター公式の理論の進歩を利用して、クエリの複雑さを束縛する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:12:58 GMT)
Deep learning of many-body observables and quantum information scrambling [0.0]
物理オブザーバブルの力学を学習する際のデータ駆動型ディープニューラルネットワークの能力が、量子情報のスクランブルとどのように相関するかを考察する。ニューラルネットワークを用いて、モデルのパラメータからランダム量子回路における可観測物の進化へのマッピングを求める。特定のタイプのリカレントニューラルネットワークは、局所的およびスクランブルされた状態の両方でトレーニングされたシステムサイズと時間ウィンドウ内での予測を一般化する上で非常に強力であることを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 20:33:00 GMT)
Decoding AI and Human Authorship: Nuances Revealed Through NLP and Statistical Analysis [0.0]
本研究では,AIが生成したテキストと人間が作成したテキストの微妙な相違について検討する。本研究は,人文・AI生成テキストに固有の言語特性,創造性パターン,潜在的なバイアスについて検討した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:09:03 GMT)
Deciding factor for detecting a particle within a subspace via dark and bright states [0.0]
測定による連続時間量子ウォークでは、固定位置ではなく、部分空間内の粒子を検出するという問題に対処する。サブスペースにおける粒子検出のための単位と検出確率に基づいて,明るい状態と暗い状態のアプローチを開発する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:06:01 GMT)
DINO Pre-training for Vision-based End-to-end Autonomous Driving [0.0]
本研究では,ラベルのない自己蒸留法(DINO)を用いた運転エージェントの視覚エンコーダの事前学習を提案する。 Leaderboard のベンチマークにより,CARLA環境における実験により,提案した事前学習は,分類に基づく事前学習よりも効率的であることが判明した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 15:18:57 GMT)
Counterfactuality, back-action, and information gain in multi-path interferometers [0.0]
古典的対物プロトコルに対する量子対物プロトコルの利点を同定する。パスと出力ポートの間の負のKirkwood-Dirac項は、そのパスに吸収体を挿入することがフォーカス効果を持つことを示している。量子対物効果の大きさは、吸収された粒子の単純な除去によって説明できないことを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:18:30 GMT)
Correlated Noise in Epoch-Based Stochastic Gradient Descent: Implications for Weight Variances [0.0]
勾配降下(SGD)はニューラルネットワーク最適化の基盤となっている。運動量を伴う離散時間SGDの定常分布に及ぼすエポックノイズ相関の影響について検討する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:21:02 GMT)
Conquering images and the basis of transformative action [0.0]
我々は、物語やネットワークが精神、社会的、アルゴリズムのレベルにどう影響するかを検討する。帝国が社会を最適化するデジタルネットワークを構築する方法を見つけるだろう。イメージをイメージとして見ることによってのみ、反対の物語によって共有される類似性を理解することで、変革的行動を促進することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 21:45:52 GMT)
Comprehensive Review of Performance Optimization Strategies for Serverless Applications on AWS Lambda [0.0]
レビュー論文は、AWS Lambda上にデプロイされたサーバレスアプリケーションのパフォーマンス最適化戦略に関する最新の研究を合成する。レビューでは、リソース管理、ランタイムの選択、可観測性の改善、ワークロード対応操作など、さまざまな最適化テクニックについて取り上げている。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:18:15 GMT)
Comparison of Controlled-Z operation and beam-splitter transformation for generation of squeezed Fock states by measurement [0.0]
ビームスプリッタを用いた2モード絡み合ったガウス状態からの1つ以上の光子サブトラクションによる圧縮フォック状態の生成と制御Z動作に対処する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:27:53 GMT)
Classical and quantum field theory in a box with moving boundaries: A numerical study of the Dynamical Casimir Effect [0.0]
完全に反射する運動境界を持つ空洞に閉じ込められた平坦な時空における量子スカラー場理論の詳細な記述を示す。静的ディリクレ境界条件を持つ音響計量における時間依存性の設定と場理論の等価性を確立する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 11:09:01 GMT)
Chaos and integrability in triangular billiards [0.0]
三角ビリヤードにおける量子力学を5つの性質の観点から特徴づける。私たちが研究したビリヤードは、可積分性、擬可積分性、または非可積分性に分類される。一貫した図形は、積分可能から非可積分三角形へ遷移する際に現れる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:00:00 GMT)
Cephalo: Multi-Modal Vision-Language Models for Bio-Inspired Materials Analysis and Design [0.0]
セファロ (Cephalo) は、材料科学の応用のために設計されたビジョン大型言語モデル(V-LLM)のシリーズである。何千もの科学論文の総合的な画像とテキストデータに基づいて訓練されている。ジェネレーティブ・アプリケーションには、花粉にインスパイアされた設計材料を含むバイオインスパイアされたデザインが含まれる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:36:42 GMT)
Capturing non-Markovian polaron dressing with the master equation formalism [0.0]
ポーラロンマスター方程式(PME)の妥当性を拡張し,非マルコフ型ポーラロンドレッシングの影響を捉える。我々は、変換に通勤しない可観測物の正確な記述を提供する補正項を導入する。正準スピンボソンモデルと散逸時間依存Landau-Zenerプロトコルの2つのケースにおいて,補正項の重要性を示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 14:17:58 GMT)
Blockchain Governance: An Empirical Analysis of User Engagement on DAOs [0.0]
Aave, Compound, Lido, Uniswapの4つの主要なブロックチェーンに対する投票について検討する。ほとんどの投票では、「最小のクォーラム」すなわち、投票を動かせる最小のアクティブな有権者は極めて少ない。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:43:02 GMT)
Bipartite Graph Variational Auto-Encoder with Fair Latent Representation to Account for Sampling Bias in Ecological Networks [0.0]
本研究では,生態ネットワーク研究の課題に対処するためのグラフ埋め込みを用いて,二部ネットワークを表現する手法を提案する。 Spipollデータセットに適用した場合、我々のアプローチが生態ネットワークの理解をどのように変えるかを示す。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:21:45 GMT)
Bilayer graphene in periodic and quasiperiodic magnetic superlattices [0.0]
本研究では, 周期的外磁場中に置かれた二層グラフェンの低層励起挙動を, 既約二階超対称性変換を用いて検討した。より一般的な2階超対称性変換の直接的な実装により、周期性欠陥と禁止バンドに埋め込まれた有界な状態を持つ非特異なシュリンガーポテンシャルを生成することができる。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 18:27:13 GMT)
Beyond Generative Artificial Intelligence: Roadmap for Natural Language Generation [0.0]
本稿では,自然言語処理分野(NLP)とそのサブフィールド自然言語生成分野(NLG)に焦点を当てる。 LLMファミリーの中では、人気のあるGPT-4、Bard、より具体的にはChatGPTのようなツールがある。このシナリオは、NLGの次のステップと、新たな課題に対処するために、フィールドをどのように適応し、進化させるかについて、新たな疑問を提起する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 09:07:07 GMT)
Bayesian inference for near-field interferometric tests of collapse models [0.0]
物体波近傍のタルボット干渉計と連続自発局在(CSL)について検討する。圧力や黒体放射を含む脱コヒーレンス機構の効果を計算した。我々は、MAQROのような実験において、$sim109,textu$の質量に到達でき、CSL上に置ける境界を定量化できることを示した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 12:18:45 GMT)
Anticipating Future Object Compositions without Forgetting [0.0]
本稿では,従来の知識を忘れることなく,オブジェクト検出における合成ゼロショット学習(CZSL)を強化することを目的とする。我々は、Grounding DINOを使用し、コンポジション型ソフト・プロンプティング(CSP)を組み込んで、コンポジション型予測で拡張する。本手法の有効性を実証し, プレトレイン, インクリメント, 不可視集合におけるHMの14.5%の増加を実現する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 13:49:31 GMT)
Analyzing negativity criterion in qubit-qutrit system located in external magnetic fields with the Dzyaloshinskii-Moriya interaction [0.0]
量子四重項系で表される複雑な絡み合い力学の研究 Dzyaloshinskii-Moriya(DM)相互作用と外部磁場の存在によってモデルが強化される。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:24:16 GMT)
An evaluation of CNN models and data augmentation techniques in hierarchical localization of mobile robots [0.0]
本研究では,移動ロボットの階層的位置決めを行うために,CNNモデルの評価とデータ拡張を行う。この意味では、バックボーンとして使用される様々な最先端CNNモデルのアブレーション研究を示す。ロボットの視覚的ローカライゼーションに対処するために,様々なデータ拡張視覚効果を提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:20:00 GMT)
An Analysis of European Data and AI Regulations for Automotive Organizations [0.0]
本報告では、欧州連合の一連のデータおよびAI規制を要約し、自動車製造組織のマネージャに対して分析する。特に、以前の法律にルーツを見出す方法など、規制の関連する考え方を強調します。全体として、我々は欧州連合のデータ規制を、歴史的先例に根ざした波の集合として特徴づけ、自動車産業に重要な意味を持つ。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 22:38:37 GMT)
An Actionable Framework for Assessing Bias and Fairness in Large Language Model Use Cases [0.0]
本稿では,大規模言語モデルにおけるバイアスと公平性リスクを評価するための実践者のための技術ガイドを提供する。この作業の主な貢献は、特定のLLMユースケースで使用するメトリクスを決定するための決定フレームワークである。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 16:04:44 GMT)
Actuation without production bias [0.0]
音声生成バイアスは、音響変化の計算モデルにおいて最も一般的に呼び出される外部力である。生産バイアスによって条件付けられた力学はユニークではないが、全ての摂動力が同じ力学を持つというわけではない。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 19:38:03 GMT)
A family of thermodynamic uncertainty relations valid for general fluctuation theorems [0.0]
エントロピー生成の高次モーメントを探索するTURの族を導出する。結果として得られる境界は古典的および量子的状態の両方で成り立つ。我々はTURとエントロピー生成と熱力学量との相関関係を考察した。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 02:00:53 GMT)
A Framework for Curriculum Transformation in Quantum Information Science and Technology Education [0.0]
QCTF(Quantum Curriculum Transformation Framework)は4つのステップで構成されている。1はトピックを選択し、2は対象とするスキルを選択し、3は学習目標を選択し、4はこの目標を達成するための教育アプローチを選択する。このフレームワークは、QIST教育の物語を構造化することを目的としており、将来のテストと改良により、QISTの実践に関するさらなる研究の基盤を形成する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 10:19:54 GMT)
A Dual-Attention Aware Deep Convolutional Neural Network for Early Alzheimer's Detection [0.0]
アルツハイマー病(英: Alzheimer's disease、AD)は、神経変性の主要な形態であり、毎年何百万人もの人に影響を及ぼす。ニューロイメージングデータからADを分類するための2重注意強化深層学習フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 15 Jul 2024 17:22:16 GMT)