Fugu-MT: arxivの論文翻訳(概要)

InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output [138.2]
InternLM-XComposer-2.5 (IXC-2.5) は、長文入力と出力をサポートする汎用的な大規模言語モデルである。 IXC-2.5は様々なテキストイメージの理解と構成の応用に優れる。 IXC-2.5は28のベンチマークで評価され、16のベンチマークで既存のオープンソースの最先端モデルを上回っている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:59:21 GMT)
Stereo Risk: A Continuous Modeling Approach to Stereo Matching [110.2]
我々はコンピュータビジョンにおける古典的ステレオマッチング問題を解決するための新しいディープラーニングアプローチであるStereo Riskを紹介する。ステレオリスクはディープネットワーク,特にマルチモーダル確率分布の相違に対して,ステレオマッチング性能を向上させることを実証する。総合的な分析により,提案手法の理論的健全性と,各種ベンチマークデータセットにおける最先端手法よりも優れた性能を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:30:47 GMT)
Mixture of insighTful Experts (MoTE): The Synergy of Thought Chains and Expert Mixtures in Self-Alignment [103.1]
従来のアライメント戦略は人間の介入に大きく依存しており、例えばSupervised Fine-Tuning(SFT)やReinforcement Learning from Human Feedback(RLHF)などである。本稿では、AlignCoTと呼ばれる思考の連鎖(CoT)アプローチを利用した新しい自己アライメント手法を提案する。本稿では、AlignCoTプロセスの各コンポーネントを強化するために専門家の混合を適用し、アライメント効率を著しく向上させるMoTEアーキテクチャについて紹介する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:04:25 GMT)
Anti-Collapse Loss for Deep Metric Learning Based on Coding Rate Metric [99.2]
DMLは、分類、クラスタリング、検索といった下流タスクのための識別可能な高次元埋め込み空間を学習することを目的としている。埋め込み空間の構造を維持し,特徴の崩壊を避けるために,反崩壊損失と呼ばれる新しい損失関数を提案する。ベンチマークデータセットの総合実験により,提案手法が既存の最先端手法より優れていることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:44:20 GMT)
Found in the Middle: Calibrating Positional Attention Bias Improves Long Context Utilization [97.8]
大規模言語モデル(LLM)は、入力の中央に位置する関連する情報を取得するのに苦労する。この現象はミドル・イン・ザ・ミドル問題として知られている。また,中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級健常者を対象に,長期にわたる中級中級中級中級中級健常者を対象とした。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:40:00 GMT)
Jailbreaking Black Box Large Language Models in Twenty Queries [97.3]
大規模言語モデル(LLM)は、敵のジェイルブレイクに対して脆弱である。 LLMへのブラックボックスアクセスのみのセマンティックジェイルブレイクを生成するアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:50:34 GMT)
BLINK: Multimodal Large Language Models Can See but Not Perceive [96.4]
Blinkはマルチモーダル言語モデル(LLM)のための新しいベンチマークであり、他の評価では見つからないコア視覚知覚能力に焦点を当てている。 Blinkは14の古典的なコンピュータビジョンタスクを3,807の複数の質問に修正し、単一の画像や複数の画像と組み合わせて視覚的にプロンプトする。 GPT-4V と Gemini は 51.26% と 45.72% であり、ランダムな推測よりも 13.17% と 7.63% 高い。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:44:45 GMT)
52B to 1T: Lessons Learned via Tele-FLM Series [96.2]
我々は、SFTデータ構築のための"less is more"アプローチをサポートするTele-FLM-52B上のSupervised Fine-tuning(SFT)について論じる。 520億から102億へと、そしてその後1兆のパラメータへと、モデルを段階的に成長させるためのベストプラクティスに関する実験と分析を実演する。我々は、さらなるトレーニングと研究を進めるために、Tele-FLM-1Tと呼ばれる1Tモデルのチェックポイントをオープンソース化する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:21:02 GMT)
Implicit Concept Removal of Diffusion Models [92.6]
テキスト・ツー・イメージ(T2I)拡散モデルはしばしば、透かしや安全でない画像のような望ましくない概念を不注意に生成する。幾何学駆動制御に基づく新しい概念除去手法であるGeom-Erasingを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:45:26 GMT)
HEMM: Holistic Evaluation of Multimodal Foundation Models [91.6]
マルチモーダル・ファンデーション・モデルは、画像、ビデオ、オーディオ、その他の知覚モダリティと共にテキストをホリスティックに処理することができる。モデリング決定、タスク、ドメインの範囲を考えると、マルチモーダル基盤モデルの進歩を特徴づけ、研究することは困難である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:48 GMT)
Safe Unlearning: A Surprisingly Effective and Generalizable Solution to Defend Against Jailbreak Attacks [89.5]
我々は、LLMの有害な知識を直接解き放つことは、脱獄攻撃から守るためのより効果的な方法になり得ると推測する。 Vicuna-7BのEmphout-of-distribution(OOD)に対する攻撃成功率(ASR)は82.6%から7.7%に低下した。 Llama2-7B-Chatは、約0.1Mの安全アライメントサンプルで微調整されているが、追加の安全システムプロンプトの下でも21.9%のASRを持つ。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:14:05 GMT)
Language-Guided Face Animation by Recurrent StyleGAN-based Generator [87.6]
本研究では,静的顔画像のアニメーション化を目的とした,言語指導型顔画像の新しいタスクについて検討する。本稿では,言語から一連の意味情報と動作情報を抽出し,学習済みのStyleGANに視覚情報と共に供給し,高品質なフレームを生成するための繰り返し動作生成手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:50:39 GMT)
Translatotron-V(ison): An End-to-End Model for In-Image Machine Translation [81.5]
In-image Machine Translation (IIMT) は、ソース言語のテキストを含む画像をターゲット言語の翻訳を含む画像に変換することを目的としている。本稿では,4つのモジュールからなるエンドツーエンドIIMTモデルを提案する。本モデルでは,70.9%のパラメータしか持たないカスケードモデルと比較して競争性能が向上し,画素レベルのエンド・ツー・エンドIIMTモデルよりも大幅に優れていた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:15:39 GMT)
Foundations and Frontiers of Graph Learning Theory [81.4]
グラフ学習の最近の進歩は、複雑な構造を持つデータを理解し分析する方法に革命をもたらした。グラフニューラルネットワーク(GNN)、すなわちグラフ表現を学習するために設計されたニューラルネットワークアーキテクチャは、一般的なパラダイムとなっている。本稿では,グラフ学習モデルに固有の近似と学習行動に関する理論的基礎とブレークスルーについて概説する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:07:41 GMT)
Benchmarking End-To-End Performance of AI-Based Chip Placement Algorithms [77.7]
ChiPBenchはAIベースのチップ配置アルゴリズムの有効性を評価するために設計されたベンチマークである。評価のために、さまざまなドメイン(CPU、GPU、マイクロコントローラなど)から20の回路を集めました。その結果, 単点アルゴリズムの中間距離が支配的であったとしても, 最終的なPPA結果は満足できないことがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:29:23 GMT)
Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.6]
我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:36:19 GMT)
Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset [74.7]
Emotion and Intent Joint Understanding in Multimodal Conversation (MC-EIU)は、マルチモーダルな会話履歴に現れる意味情報をデコードすることを目的としている。 MC-EIUは多くのヒューマン・コンピュータ・インタフェースのテクノロジーを実現している。 MC-EIUデータセットは,7つの感情カテゴリー,9つの意図カテゴリ,3つのモダリティ,すなわちテキスト,音響,視覚的内容,および英語とマンダリンの2つの言語を特徴とする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:56:00 GMT)
ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models [74.6]
活性化スパーシリティ(Activation sparsity)とは、活性化出力の間に弱い分散要素が存在することを指す。本稿では,PLMを高活性化空間にプッシュするために,"ProSparse" という,シンプルで効果的なスペース化手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:56:49 GMT)
Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time [73.8]
本稿では、画像と音声のきめ細かい理解を備えた音声視覚LLMであるMeerkatを紹介する。 Meerkatは、音声参照画像の接地、画像案内音声の時間的局所化、音声-視覚的事実チェックといった課題に取り組むことができる。我々は、これらの下流タスクすべてにおいて、37.12%の相対的な改善で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:01:30 GMT)
Self-supervised ASR Models and Features For Dysarthric and Elderly Speech Recognition [71.9]
本稿では,TDNNとConformer ASRシステムにSSLプリトレーニングモデルとその機能を統合するアプローチについて検討する。ドメイン適応型HuBERT、wav2vec2-conformer、マルチ言語型XLSRモデルを統合することで構築されたTDNNシステムは、スタンドアロンの微調整型SSL事前訓練モデルより一貫して優れている。 DementiaBank Pitt の高齢者音声認識出力を用いて,アルツハイマー病の検出精度の向上も行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:33:39 GMT)
DyFADet: Dynamic Feature Aggregation for Temporal Action Detection [70.4]
カーネル重みと受容フィールドを異なるタイムスタンプで適応できる新しい動的特徴集約(DFA)モジュールを構築した。 DFAを使用することで動的DADヘッド(DyHead)の開発を支援し、パラメータを調整したマルチスケール機能を適応的に集約する。新しい動的TADモデルであるDyFADetは、一連の挑戦的なTADベンチマークで有望なパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:29:10 GMT)
Evaluating and Analyzing Relationship Hallucinations in LVLMs [69.8]
視覚関係の幻覚を評価するための新しいベンチマークであるR-Benchを紹介する。 R-Benchは、関係の存在に焦点を当てたイメージレベルの質問と、局所的な視覚的理解を評価するインスタンスレベルの質問を特徴としている。我々は,関係関連性,主観関連性,関係対象性という,幻覚につながる3つの関係共起関係を同定する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:02:35 GMT)
LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models [69.7]
暗黙的および明示的な信頼マーカーを校正するリスナー対応微調整法 (LACIE) を提案する。我々は,LACIEがリスナーをモデル化し,回答が正しいかどうかだけでなく,リスナーに受け入れられるかどうかを考察する。 LACIEによるトレーニングの結果、正しい回答の受け入れレベルを維持しながら、誤った回答が受け入れられる割合が47%減少することがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:49:23 GMT)
Expressive Gaussian Human Avatars from Monocular RGB Video [69.6]
EVAは3DガウスとSMPL-Xに基づいて細部を巧みに彫刻する乾燥可能な人間モデルである。 SMPL-XモデルをRGBフレームに整合させることが,効果的なアバター学習において重要であることを強調した。本稿では,勾配閾値を適応的に調整する適応密度制御戦略を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:36:27 GMT)
Accelerating Diffusion Sampling with Optimized Time Steps [69.2]
拡散確率モデル(DPM)は高分解能画像合成において顕著な性能を示した。彼らのサンプリング効率は、通常多くのサンプリングステップのため、依然として望まれている。 DPM用高次数値ODEソルバの最近の進歩により、サンプリングステップがはるかに少ない高品質な画像の生成が可能になった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:16:31 GMT)
DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception [66.9]
本稿では,拡散モデルの生成的フィードバックを利用して画像エンコーダのセマンティックな分布を整合させる,シンプルで効果的なアプローチであるDEEMを提案する。 DEEMは、訓練可能なパラメータを少なくし、事前訓練データが少なく、ベースモデルのサイズを小さくし、幻覚を緩和するための強化された堅牢性と優れた能力を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:30:53 GMT)
Unveiling the Safety of GPT-4o: An Empirical Study using Jailbreak Attacks [65.8]
本稿では,GPT-4oのジェイルブレイク攻撃に対する厳密な評価を行う。新たに導入されたオーディオモダリティは、GPT-4oに対するジェイルブレイク攻撃のための新しい攻撃ベクトルを開く。既存のブラックボックスマルチモーダル・ジェイルブレイク攻撃は、GPT-4oとGPT-4Vに対してほとんど効果がない。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:51:21 GMT)
LauraGPT: Listen, Attend, Understand, and Regenerate Audio with GPT [65.7]
Generative Pre-trained Transformer (GPT) モデルは、様々な自然言語処理タスクにおいて顕著なパフォーマンスを実現している。音声認識, 理解, 生成のための新しい音声・テキストGPTベースのLLMであるLauraGPTを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:38:03 GMT)
Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long Contexts [65.0]
視覚言語モデル(VLM)における長文抽出推論評価のためのベンチマークジェネレータであるLoCoVQAを提案する。 LoCoVQAは、数学的推論、VQA、そしてより長い視覚的コンテキストを持つ文字認識タスクのテスト例を拡張している。このテストは、VLMがクエリに応答する際の無関係な情報をどの程度無視できるかを評価する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:55:59 GMT)
Fine-Tuning with Divergent Chains of Thought Boosts Reasoning Through Self-Correction in Language Models [63.4]
本稿では,複数の推論連鎖を比較するためにモデルを必要とすることによって,性能を向上する新しい手法を提案する。 DCoTデータセットの命令チューニングにより、より小さく、よりアクセスしやすい言語モデルの性能が向上することがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:01:18 GMT)
EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration [63.1]
本稿では,行動情報と意味情報の両方をシームレスに統合する新しい生成推薦フレームワークであるEAGERを紹介する。 EAGERの有効性を4つの公開ベンチマークで検証し,既存手法と比較して優れた性能を示した。
論文参考訳（メタデータ） (Wed, 03 Jul 2024 10:00:26 GMT)
LLM Internal States Reveal Hallucination Risk Faced With a Query [62.3]
人間は、クエリに直面したとき、私たちが知らないことを認識できる自己認識プロセスを持っています。本稿では,大規模言語モデルが応答生成に先立って,自身の幻覚リスクを推定できるかどうかを検討する。確率推定器により, LLM自己評価を利用して, 平均幻覚推定精度84.32%を達成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:08:52 GMT)
Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.2]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:05:20 GMT)
Learning to Mitigate Externalities: the Coase Theorem with Hindsight Rationality [62.2]
経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。次に、プレイヤーが全福祉を最大化する交渉戦略を学習できるようにするための政策を設計する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:35:17 GMT)
Injecting linguistic knowledge into BERT for Dialogue State Tracking [60.4]
本稿では,教師なしの枠組みを用いて言語知識を抽出する手法を提案する。次に、この知識を用いて、対話状態追跡(DST)タスクにおけるBERTの性能と解釈可能性を高める。このフレームワークを様々なDSTタスクでベンチマークし、精度の顕著な改善を観察する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:59:32 GMT)
Modern Neighborhood Components Analysis: A Deep Tabular Baseline Two Decades Later [59.9]
我々は、インスタンス間のセマンティックな類似性をキャプチャする線形射影を学習するために設計された古典的近傍成分分析(NCA)を再考する。学習目的の調整や深層学習アーキテクチャの統合といった微調整は,NAAの性能を著しく向上させることがわかった。また,提案したModernNCAの効率性と予測精度を向上する,近隣のサンプリング戦略も導入する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:38:57 GMT)
Investigating Event-Based Cameras for Video Frame Interpolation in Sports [59.8]
本稿では,スポーツスローモーションビデオを生成するためのイベントベースビデオフレーム補間(VFI)モデルについて検討する。特に,スポーツ映像を撮影するためのRGBとイベントベースカメラを含むバイカメラ記録装置の設計と実装を行い,両カメラの時間的整列と空間的登録を行う。実験により,市販のイベントベースVFIモデルであるTimeLensが,スポーツビデオのスローモーション映像を効果的に生成できることが実証された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:32:51 GMT)
CaLMQA: Exploring culturally specific long-form question answering across 23 languages [58.2]
CaLMQAは、23の言語にまたがる1.5Kの文化的に特定の質問のコレクションであり、51の文化的に翻訳された質問は、英語から22の言語に翻訳されている。コミュニティのWebフォーラムから自然に発生する質問を収集し、ネイティブスピーカーを雇い、FijianやKirndiといった未調査言語をカバーする質問を書いています。私たちのデータセットには、文化的トピック(伝統、法律、ニュースなど)とネイティブスピーカーの言語使用を反映した、多種多様な複雑な質問が含まれています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:33:55 GMT)
STAR: A First-Ever Dataset and A Large-Scale Benchmark for Scene Graph Generation in Large-Size Satellite Imagery [58.0]
衛星画像(SAI)におけるシーングラフ生成(SGG)は、地理空間シナリオの認識から認識への理解を促進する。画像サイズは512 x 768から27,860 x 31,096ピクセル(STAR)である。大規模SAIにおいてSGGを実現するために,オブジェクト検出(OBD)やペアプルーニング,SGGの関係予測に関するSAIを理解するためのコンテキスト認識カスケード認知(CAC)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:00:31 GMT)
LLMs can learn self-restraint through iterative self-reflection [57.3]
大規模言語モデル(LLM)は、特定のトピックに関連する知識と不確実性に基づいて、その振る舞いを動的に適応できなければならない。この適応的行動は、私たちが自己規制と呼ぶもので、教えるのは簡単ではない。モデルが信頼している場合にのみ応答を生成できるようにするユーティリティ関数を考案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:46:52 GMT)
BVI-RLV: A Fully Registered Dataset and Benchmarks for Low-Light Video Enhancement [57.0]
本稿では,2つの異なる低照度条件下での様々な動きシナリオを持つ40のシーンからなる低照度映像データセットを提案する。我々は、プログラム可能なモータードリーを用いて、通常の光で捉えた完全に登録された地上真実データを提供し、異なる光レベルにわたるピクセルワイドフレームアライメントのための画像ベースアプローチによりそれを洗練する。実験の結果,Low-light Video enhancement (LLVE) における完全登録ビデオペアの重要性が示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 22:41:49 GMT)
CoIR: A Comprehensive Benchmark for Code Information Retrieval Models [56.7]
textbfInformation textbfRetrieval Benchmark(textbfInformation textbfRetrieval Benchmark)は,コード検索機能の評価に特化して設計された,堅牢で包括的なベンチマークである。名前は、Textbftenを巧みにキュレートしたコードデータセットから成り、textbfs7の異なるドメインにまたがる、textbfeight特有の検索タスクにまたがる。我々は9つの広く使われている検索モデルを名前を用いて評価し、最先端のシステムであってもコード検索タスクの実行に重大な困難を見出した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:58:20 GMT)
SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.1]
ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:30:45 GMT)
Four Ways to Improve Verbo-visual Fusion for Dense 3D Visual Grounding [56.0]
3Dビジュアルグラウンドティング(3D visual grounding)は、自然言語で記述された3Dシーンでオブジェクトをローカライズするタスクである。そこで本研究では,高密度な3次元グラウンドネットワークを提案し,グラウンド性能向上を目的とした4つの新しいスタンドアローンモジュールを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:01:52 GMT)
Evaluating Automatic Metrics with Incremental Machine Translation Systems [55.8]
商業機械翻訳からなるデータセットを導入し,12の翻訳方向から6年間にわたって収集した。商業システムは時間とともに改善され、より最近の翻訳の好みに基づいて機械翻訳(MT)メトリクスを評価することができると仮定する。本研究は、MTメトリックス研究におけるいくつかの過去の知見を確認し、測定値評価のためのテストベッドとしてデータセットの価値を実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:04:17 GMT)
On Generalization for Generative Flow Networks [54.2]
生成フローネットワーク(GFlowNets)は、非正規化確率分布からのサンプリングの課題に対処するために設計された革新的な学習パラダイムとして登場した。本稿では,GFlowNetsの文脈で一般化を形式化し,一般化と安定性を結びつけるとともに,これらのモデルの能力を評価する実験を行い,報酬関数の未知の部分を明らかにする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:42:21 GMT)
Generalized Gouy Rotation of Electron Vortex beams in uniform magnetic fields [54.0]
磁場中における相対論的同軸方程式の正確な解を用いた磁場中のEVBのダイナミクスについて検討する。一般化されたグーイ回転の下で異なる状態について統一的に記述し、グーイ位相をEVB回転角にリンクする。この研究は、磁場中のEVBのダイナミクスに関する新たな洞察を与え、渦粒子のビーム操作とビーム光学の実践的応用を示唆している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:29:56 GMT)
DistiLLM: Towards Streamlined Distillation for Large Language Models [53.5]
DistiLLMは自動回帰言語モデルのためのより効率的で効率的なKDフレームワークである。 DisiLLMは,(1)新しいスキューKulback-Leibler分散損失,(2)学生生成出力の効率向上を目的とした適応型オフ政治アプローチの2つのコンポーネントから構成される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:57:41 GMT)
A robust three-way classifier with shadowed granular-balls based on justifiable granularity [53.4]
我々は、不確実なデータのために、影付きGBの頑健な3方向分類器を構築した。本モデルでは,不確実なデータ管理を実証し,分類リスクを効果的に軽減する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:54:45 GMT)
Who Wrote this Code? Watermarking for Code Generation [53.2]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:09:52 GMT)
On Tractable $Φ$-Equilibria in Non-Concave Games [53.2]
非凹面ゲームはゲーム理論と最適化に重大な課題をもたらす。 Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。また,オンライングラディエントDescentは,非自明な状況下で効率よく$Phi$-equilibriaを近似できることを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:26:58 GMT)
Combining AI Control Systems and Human Decision Support via Robustness and Criticality [53.1]
我々は、逆説(AE)の方法論を最先端の強化学習フレームワークに拡張する。学習したAI制御システムは、敵のタンパリングに対する堅牢性を示す。トレーニング/学習フレームワークでは、この技術は人間のインタラクションを通じてAIの決定と説明の両方を改善することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:38:57 GMT)
ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.1]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:33:31 GMT)
Complex Event Recognition with Symbolic Register Transducers: Extended Technical Report [51.9]
本稿では,オートマトンに基づく複合イベント認識システムを提案する。本システムは,記号とレジスタオートマトンを組み合わせたオートマトンモデルに基づいている。我々は、イベントストリーム上のパターンを検出するために、SRTをCERでどのように使用できるかを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:59:13 GMT)
Knowledge Composition using Task Vectors with Learned Anisotropic Scaling [51.5]
本稿では,パラメータブロックと異なる学習係数を線形に組み合わせ,タスクベクトルレベルでの異方性スケーリングを実現するアルゴリズムであるaTLASを紹介する。このような線形結合は事前学習されたモデルの低内在性を明示的に利用しており、学習可能なパラメータは数係数のみであることを示す。本稿では,タスク算術,少数ショット認識,テスト時間適応において,教師なしあるいは教師なしの目的を用いた手法の有効性を実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:54:08 GMT)
How Does Quantization Affect Multilingual LLMs? [50.9]
量子化技術は、大規模な言語モデルの推論速度と展開を改善するために広く使われている。量子化多言語 LLM の徹底的な解析を行い、言語間および様々なスケールでその性能に焦点をあてる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:39:40 GMT)
A Unified Framework for 3D Scene Understanding [50.7]
UniSeg3Dは統一された3Dセグメンテーションフレームワークで、単一のモデル内でパノプト、セマンティック、インスタンス、インタラクティブ、参照、オープン語彙セグメンテーションタスクを実現する。タスク間の知識共有を促進し、総合的な3Dシーン理解を促進する。 ScanNet20、ScanRefer、ScanNet200を含む3つのベンチマークの実験は、UniSeg3Dが現在のSOTAメソッドより一貫して優れていることを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:50:07 GMT)
Let the Code LLM Edit Itself When You Edit the Code [50.5]
underlinetextbfPositional textbfIntegrity textbfEncoding (PIE) PIEは、標準的な完全再計算手法に比べて計算オーバーヘッドを85%以上削減する。その結果、PIEは計算オーバーヘッドを標準の完全再計算手法に比べて85%以上削減することを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:34:03 GMT)
AMEX: Android Multi-annotation Expo Dataset for Mobile GUI Agents [50.4]
我々は,モバイルシナリオにおけるAIエージェントの研究を進めるために,Android Multi-Annotation EXpo (AMEX)を紹介した。 AMEXは110のモバイルアプリケーションから104K以上の高解像度のスクリーンショットで構成されており、複数のレベルでアノテートされている。 AMEXには、GUIインタラクティブな要素接地、GUIスクリーンと要素機能記述、複雑な自然言語命令の3段階のアノテーションが含まれている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:59:58 GMT)
Online Variational Sequential Monte Carlo [50.0]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:47:36 GMT)
A Case Study on Context-Aware Neural Machine Translation with Multi-Task Learning [49.6]
文書レベルのニューラルネットワーク翻訳(DocNMT)では、コンテクストやソース文のエンコーディングにおいてマルチエンコーダアプローチが一般的である。近年の研究では、コンテキストエンコーダがノイズを発生させ、コンテキストの選択に頑健なモデルを実現することが示されている。本稿では、マルチタスク学習(MTL)を通してコンテキストエンコーディングを明示的にモデル化することで、コンテキスト選択に敏感なモデルを実現することにより、この観察をさらに検討する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:50:49 GMT)
A Simple Baseline for Spoken Language to Sign Language Translation with 3D Avatars [49.6]
Spoken2Signは、音声言語を手話に変換するシステムである。本稿では,グロスビデオ辞書の作成,サインビデオ毎の3Dサインの推定,スポンケン2サインモデルのトレーニングという3つのステップからなる単純なベースラインを提案する。私たちが知っている限りでは、最初にSpken2Signタスクを3Dサインの出力フォーマットで提示します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:04:14 GMT)
Boosting the Power of Small Multimodal Reasoning Models to Match Larger Models with Self-Consistency Training [49.3]
マルチモーダル推論(multimodal reasoning)は、複数のモーダルをまたいだモデルによる質問に答える難しいタスクである。既存のアプローチでは、言語と視覚のモダリティを2段階の推論フレームワークに組み込むことで進歩している。 MC-CoTは,複数の合理性と回答を生成し,投票プロセスを通じて最も正確な選択を行う自己整合性学習戦略である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:56:47 GMT)
Reconsidering utility: unveiling the limitations of synthetic mobility data generation algorithms in real-life scenarios [49.2]
実世界の応用性の観点から,5つの最先端合成手法の有用性を評価した。我々は、GPS追跡タクシーのような細粒度都市の動きを符号化するいわゆる旅行データに焦点を当てる。あるモデルは妥当な時間内にデータを生成することができず、別のモデルはマップマッチングの要件を満たすためにあまりに多くのジャンプを生成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:08:05 GMT)
2500 vibronic eigenstates of the NO$_3$ radical [49.2]
我々は電子の$tilde X 2A'$状態に関連する振動スペクトルを再検討する。反対称曲げ運動では、非常に大きな対称性によって誘導されるレベル分割が見つかる。本研究は,非無視的非透析効果について考察し,ボルン・オッペンハイマー近似がスペクトルに有意な誤差をもたらすことを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:00 GMT)
A Computational Framework for Solving Wasserstein Lagrangian Flows [48.9]
一般に、最適密度経路は未知であり、これらの変動問題の解法は計算的に困難である。本稿では,これらすべての問題に統一的な視点からアプローチする,新しいディープラーニングベースのフレームワークを提案する。提案手法は, 単セル軌道推定における従来の手法より優れていることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:23:42 GMT)
Learning Action Conditions from Instructional Manuals for Instruction Understanding [48.5]
本稿では,行動条件推論というタスクを提案し,命令マニュアルにおける行動条件の事前条件と後条件の高品質なアノテートデータセットを収集する。本稿では,オンライン指導マニュアルから大規模トレーニングインスタンスを自動構築する弱い教師付きアプローチを提案し,人間に注釈を付けて検証したデータセットをキュレートし,現在のNLPモデルが命令テキストの動作条件依存性をいかに推測できるかを検証した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:49:28 GMT)
The Shortcomings of Force-from-Motion in Robot Learning [48.0]
我々は、ロボット学習におけるより対話的な行動空間について論じる。現在のロボット学習のアプローチは、インタラクションに対するポリシー制御を明示的に提供しない動き中心のアクション空間に焦点を当てている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:23:02 GMT)
MIA-Bench: Towards Better Instruction Following Evaluation of Multimodal LLMs [47.9]
MIA-Benchは、マルチモーダルな大規模言語モデル(MLLM)を、複雑な命令に厳密に準拠する能力に基づいて評価するために設計されたベンチマークである。私たちのベンチマークでは、400のイメージプロンプトペアで構成されており、それぞれが階層化された命令に対するモデルのコンプライアンスに挑戦するために作られています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:11:45 GMT)
Nearly Linear Sparsification of $\ell_p$ Subspace Approximation [47.8]
$ell_p$ 部分空間近似問題のNP硬度に対処する一般的なアプローチは、強いコアセットを計算することである。我々は、$ell_p$部分空間近似に対して、ランクパラメータ$k$にほぼ最適に依存する強いコアセットを構築するための最初のアルゴリズムを得る。我々の手法は、オフライン設定と同様のバウンダリを持つ$ell_p$サブスペース近似のための、ほぼ最適に近いオンライン強力なコアセットにも繋がる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:49:28 GMT)
How Deep Neural Networks Learn Compositional Data: The Random Hierarchy Model [47.6]
言語と画像の階層構造にインスパイアされた合成タスクのファミリーであるランダム階層モデルを紹介する。深層ネットワークは、等価なグループを交換するために不変な内部表現を開発することでタスクを学習する。この結果から, ネットワークは次元の呪いを克服し, 不変表現を構築できることが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:57:00 GMT)
Bunny-VisionPro: Real-Time Bimanual Dexterous Teleoperation for Imitation Learning [46.8]
本稿では,VRヘッドセットを活用したリアルタイム双方向デキスタラス遠隔操作システムであるBunny-VisionProを紹介する。従来のビジョンベースの遠隔操作システムとは異なり、我々は演算子に触覚フィードバックを提供するために、新しい低コストデバイスを設計する。 Bunny-VisionProは、標準的なタスクスイートで以前のシステムよりも優れており、より高い成功率とタスク完了時間の短縮を実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:35:35 GMT)
Single Image Rolling Shutter Removal with Diffusion Models [46.6]
単フレーム転がりシャッター(RS)補正のための最初の拡散モデルに基づく手法であるRS-Diffusionを提案する。本研究では,イメージ・トゥ・モーションの枠組みを,パッチ・アテンション・モジュールを設計した拡散技術を用いて提示する。さらに,得られたRSフレームと,対応するGlobal Shutter(GS)地対からなるRS-Realデータセットを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:25:02 GMT)
DLO: Dynamic Layer Operation for Efficient Vertical Scaling of LLMs [46.4]
変換器をベースとした大規模言語モデル(LLM)を垂直スケールする新しいアプローチである動的層演算(DLO)を導入する。モデル幅の拡張に重点を置く従来のMixture-of-Experts(MoE)手法とは異なり,本手法はモデル深度を対象とし,様々な入力サンプルに対して層表現間で観測される冗長性に対処する。実験結果から、DLOは元の非スケールモデルよりも優れるだけでなく、効率が大幅に向上した密に拡張されたモデルに匹敵する結果が得られることが示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:34:08 GMT)
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation [46.1]
市販のMLLMとT2Iモデルを連携させてマルチモーダル対話システムを構築するためのDialogGenを提案する。描画プロンプトアライメント、注意深いトレーニングデータキュレーション、エラー修正で構成されている。ダイアログジェネレーションとユーザスタディに関する実験は、他の最先端モデルと比較してダイアログジェネレーションの有効性を実証している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:09:53 GMT)
Tuning-Free Alignment of Diffusion Models with Direct Noise Optimization [45.8]
直接雑音最適化(DNO)という新しいアライメント手法を提案する。設計上、DNOはチューニング不要で、生成中にオンライン形式でアライメントが発生するため、プロンプトに依存しない。我々は、人間のフィードバックデータに基づいて訓練された複数の人気報酬関数について広範な実験を行い、提案したDNOアプローチが、最先端の報酬スコアと高画質を、すべて生成に適切な時間予算で達成できることを実証した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:45:45 GMT)
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations [45.6]
AURORAデータセット(AURORA data)は、ビデオやシミュレーションエンジンから人間に注釈を付け、キュレートされた高品質なトレーニングデータの集合である。 AURORA-finetuned model on a new expert-curated benchmark across 8 various editing task。我々のモデルは従来の編集モデルよりもはるかに優れており、人間のレーティングによって判断される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:36:33 GMT)
Are Large Language Models Consistent over Value-laden Questions? [45.4]
大きな言語モデル(LLM)は、調査回答を特定の値にバイアスしているように見える。価値の一貫性は、パラフレーズ、ユースケース、翻訳、トピック内での回答の類似性として定義します。モデルは、パラフレーズ、ユースケース、翻訳、トピック内で比較的一貫性がある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:53:54 GMT)
A Self-Supervised Task for Fault Detection in Satellite Multivariate Time Series [45.3]
この研究は、複雑な分布と高次元分布をモデル化する能力で有名な物理インフォームドリアルNVPニューラルネットワークを活用する新しいアプローチを提案する。実験には、セルフスーパービジョンによる事前トレーニング、マルチタスク学習、スタンドアロンのセルフ教師付きトレーニングなど、さまざまな構成が含まれている。結果は、すべての設定で大幅にパフォーマンスが向上したことを示している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:19:41 GMT)
SemioLLM: Assessing Large Language Models for Semiological Analysis in Epilepsy Research [45.2]
大規模言語モデルは、一般的な医学的知識をエンコードする能力において有望な結果を示している。内科的知識を活用しててててんかんの診断を行う技術について検討した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:02:12 GMT)
Back to the Color: Learning Depth to Specific Color Transformation for Unsupervised Depth Estimation [45.1]
合成色と実世界の色の違いは、実世界のシーンにおける深度推定に重大な課題をもたらす。実世界のデータに基づいて訓練されたモデルを用いて,奥行きからリアルな色を予測するフレームワークBack2Colorを提案する。また、VADepthは、変換器よりも計算量が少なく、精度も高いVision Attention Networkをベースにしている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:08:22 GMT)
Meta-Learning Based Optimization for Large Scale Wireless Systems [45.0]
文献における従来の最適化アルゴリズムの限界は、無線システムにおける送信アンテナ数や通信ユーザ数によって増大することが知られている。本稿では,教師なしメタラーニングに基づく手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:09:00 GMT)
Towards Negotiative Dialogue for the Talkamatic Dialogue Manager [45.0]
本稿では,TDM(Talkamatic Dialogue Manager)の開発版に実装された,交渉対話に関連する対話現象について述べる。この実装は、TDMにおける交渉対話の一般的な特徴を網羅する最初のステップである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:49:18 GMT)
Thermal masses and trapped-ion quantum spin models: a self-consistent approach to Yukawa-type interactions in the $λ\!φ^4$ model [45.0]
閉じ込められたイオン系における磁気の量子シミュレーションは、スピン間の相互相互作用を仲介するために結晶振動を利用する。これらの相互作用は、フォノンが粗粒のクライン=ゴードン場によって記述される長波長相対論的理論によって説明できる。レーザ冷却により制御できる熱効果は、相互作用するQFTにおける熱質量の出現を通じて、この流れを明らかにすることができることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:51:08 GMT)
Integrability and dark states of the XX spin-1 central spin model in a transverse field [45.0]
XX中心スピンモデルは、結合が存在するXY平面に向いた磁場の存在下で積分可能である。スピン-1/2の場合、非スキュー対称 XXZ Richardson-Gaudin 模型の適切な極限により、磁場が平面内成分を含むように傾いた場合でも積分可能であることを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:47:22 GMT)
Video Watermarking: Safeguarding Your Video from (Unauthorized) Annotations by Video-based LLMs [43.8]
ビデオウォーターマーキング(英語: Video Watermarking)は、ビデオベースの大規模言語モデルによって、未承認のアノテーションからビデオを保護する技術である。ビデオによるLLMの誤使用を防止しつつ視聴体験を保存している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:48:18 GMT)
Towards Efficient Pixel Labeling for Industrial Anomaly Detection and Localization [43.5]
本稿では,新しいインタラクティブ画像(IIS)アルゴリズムであるADClickを紹介する。 ADClickは、実際の欠陥画像に対して「地中真実」の異常マスクを効率よく生成する。我々は ADClick の能力を ADClick-Seg に拡張する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:12:43 GMT)
Budget-Aware Pruning: Handling Multiple Domains with Less Parameters [43.3]
この作業は、ユーザ定義の予算に従って複数のドメインを処理可能なモデルを立案することを目的としている。これを実現するために、全てのドメインがベースラインモデルから同様のフィルタのサブセットを使用するように促します。提案されたアプローチは、テスト時に複数のドメインを処理する数少ない作業の1つでありながら、リソース制限されたデバイスに適応することで革新的になる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:16:57 GMT)
Fast maneuver recovery from aerial observation: trajectory clustering and outliers rejection [43.1]
2種類のVulnerable Road Users (VRU) が提案される軌道クラスタリング手法によって検討される。 2つの環境がメソッド開発のテストとして機能し、3つの異なる交差点と1つのラウンドアバウトとなる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:22:21 GMT)
TieBot: Learning to Knot a Tie from Visual Demonstration through a Real-to-Sim-to-Real Approach [42.9]
この研究は、ロボットがネクタイを結びつくことを学べるリアルタイムの学習システムTieBotを紹介している。実演ビデオからネクタイのメッシュ列を推定する階層的特徴マッチング手法を提案する。我々のパイプラインは、学習されたポリシーが実世界の実行に適用されたときに残留ポリシーを学習する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:16:41 GMT)
Gradient Projection For Continual Parameter-Efficient Tuning [42.8]
我々は勾配投影の観点からAdapter, LoRA, Prefix-tuning, Prompt-tuningを再構成する。大規模モデルであっても,勾配の条件は忘れることに効果的に抵抗できることを示す。多様なデータセットを用いて,VTやCLIPを含む異なるバックボーンを用いて,本手法を広範囲に評価した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:27:45 GMT)
Can 3D Vision-Language Models Truly Understand Natural Language? [42.7]
既存の3D-VLモデルは言語入力のスタイルに敏感であり、同じ意味を持つ文を理解するのに苦労するが、異なる変種で書かれる。本稿では,様々なタスクにまたがって3D-VLモデルを体系的に評価し,異なる言語スタイルのバリエーションを提示した場合のパフォーマンスをベンチマークする言語頑健性タスクを提案する。包括的評価により,様々な3D-VLタスクにまたがる既存モデルの性能低下が明らかとなった。最先端の3D-LLMでさえ、同じ文の変種を理解することができない。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:21:38 GMT)
Expressivity of Graph Neural Networks Through the Lens of Adversarial Robustness [42.1]
我々は、理論的に可能であり、実証的に達成された表現力の間の大きなギャップを明らかにするためのツールとして、敵の頑健性を用いる。また,グラフ構造に対する小さな摂動に対しても,より強力なGNNが一般化できないことを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:21:19 GMT)
Multiple-Resolution Tokenization for Time Series Forecasting with an Application to Pricing [41.9]
本稿では,時系列のトークン化に着目した時系列予測のためのトランスフォーマーアーキテクチャを提案する。我々のアーキテクチャは、利用可能なすべてのデータにまたがって、多くのスケールで効率的な表現を同時に学習することを目的としています。我々は,このモデルを,大手小売店のマークダウンチームが直面している現実的な予測問題に適用する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:07:16 GMT)
DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents [41.9]
本研究では,複雑なデータ分布を単一連続ガウス分布に符号化するDisCo-Diffを提案する。 DisCo-Diffはトレーニング済みのネットワークに依存しておらず、フレームワークを普遍的に適用することができる。玩具データ, 画像合成タスク, 分子ドッキングに関するDisCo-Diffの検証を行い, 離散潜水剤の導入によりモデル性能が一貫した改善が得られた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:42:46 GMT)
Aligning Large Language Models with Human Preferences through Representation Engineering [41.8]
表現工学(RepE)の新たな分野から着想を得た本研究は,LLM内の活動パターンに埋め込まれた高レベルの人間の嗜好の関連表現を特定することを目的としている。この新しいアプローチは、人間フィードバックからの表現アライメント(Representation Alignment from Human Feedback、RAHF)と呼ばれ、効果的で、計算的に効率的で、実装が容易であることが証明されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:21:02 GMT)
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model [41.3]
初期ビジョン言語Fusion-based SAM (EVF-SAM) について紹介する。 EVF-SAMは、マルチモーダルプロンプト(画像とテキスト)を利用する、シンプルだが効果的な参照セグメンテーション手法である BEIT-3をベースとしたEVF-SAMにより,RefCOCO/+/gにおける表現セグメンテーションの最先端性能が得られた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:59:52 GMT)
JailbreakHunter: A Visual Analytics Approach for Jailbreak Prompts Discovery from Large-Scale Human-LLM Conversational Datasets [41.3]
大規模言語モデル (LLM) は注目されているが、誤用リスクが懸念されている。 JailbreakHunterは、大規模な人間とLLMの会話データセットでジェイルブレイクプロンプトを特定するためのビジュアル分析手法である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:10:41 GMT)
A Formal Model for Artificial Intelligence Applications in Automation Systems [41.2]
本稿では,自動化システムにおけるAIアプリケーションの明確かつ構造化されたドキュメンテーションを提供するために,標準を用いた形式モデルを提案する。自動化システム(AIAS)における人工知能の情報モデルは、設計パターンを利用して、自動化システムとAIソフトウェアの様々な側面をマッピングし、リンクする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:05:32 GMT)
Learning and Forgetting Unsafe Examples in Large Language Models [41.1]
大規模言語モデル(LLM)は、サードパーティのカスタム微調整データから学習する。協調LLMは、安全でないコンテンツを容易に学習できるが、より安全なコンテンツに微調整した場合には、それを忘れやすい傾向にある。このアルゴリズムは、モデルがそのデータに対して忘れている信号がどれほど強いかに基づいて、安全でないデータをフィルタリングする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:13:31 GMT)
ShadowRefiner: Towards Mask-free Shadow Removal via Fast Fourier Transformer [41.0]
影に影響された画像は、しばしば色と照明の空間的な違いが顕著に現れる。我々はFast Fourier Transformerを介してマスクレスシャドウ除去・精細ネットワーク(ShadowRefiner)を導入する。本手法は,NTIRE 2024画像シャドウ除去チャレンジのフィデリティトラックにおいて,第2位を達成し,パーセプチュアルトラックのタイトルを獲得した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:38:39 GMT)
Call Me When Necessary: LLMs can Efficiently and Faithfully Reason over Structured Environments [41.0]
本稿では,構造化環境に対する効率的な推論を行うために,Reasoning-Path-Editing (Readi)を提案する。 Readiはクエリが与えられた推論パスを生成し、必要なときにのみそのパスを編集する。 3つのKGQAデータセットと2つのTableQAデータセットの実験結果から、Readiの有効性が示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:23:59 GMT)
KeyVideoLLM: Towards Large-scale Video Keyframe Selection [40.7]
KeyVideoLLMは、ビデオLLMデータを効率的に管理するためのテキストフレーム類似性に基づく選択方法である。データ圧縮速度は最大60.9倍に向上し、ディスクスペースの要求を大幅に低減する。既存の選択方法と比較して、処理速度を最大200倍に向上させる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:41:44 GMT)
One Fits All: Learning Fair Graph Neural Networks for Various Sensitive Attributes [40.6]
不変学習,すなわちFairINVに基づくグラフフェアネスフレームワークを提案する。 FairINVはセンシティブな属性分割を取り入れ、ラベルと各種のセンシティブな属性の間の急激な相関を排除し、公正なGNNを訓練する。いくつかの実世界のデータセットの実験結果から、FairINVは最先端のフェアネスアプローチを著しく上回っていることが示されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:53:47 GMT)
Fisher-aware Quantization for DETR Detectors with Critical-category Objectives [40.6]
この研究は、タスククリティカルなカテゴリのサブセット、すなわちクリティカルカテゴリのパフォーマンスを定義します。特定の臨界カテゴリは量子化に対する感度が高く、量子化対応訓練(QAT)後に過度に適合する傾向にある。このエビデンスを用いて、臨界カテゴリーの損失ランドスケープに対して、フィッシャー対応の混合精度量子化スキームと、QATに対するフィッシャートラス正規化を適用する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:35:53 GMT)
Merlin:Empowering Multimodal LLMs with Foresight Minds [40.5]
MLLM(Multimodal Large Language Models)の既存の学習フレームワークへの将来のモデリングの統合について紹介する。本稿では,MLLMをフォレスト・マインドで強化する2つの革新的な手法を提案する。 FPTはトラジェクトリを中心とした様々なタスクを共同で訓練し、MLLMは与えられた初期観測からトラジェクトリ全体への参加と予測の仕方を学ぶことができる。 FITはMLLMに対して、まず関連するオブジェクトの軌道を予測し、それに基づいて将来の事象を推論する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:58:12 GMT)
MentalAgora: A Gateway to Advanced Personalized Care in Mental Health through Multi-Agent Debating and Attribute Control [40.2]
MentalAgoraは、複数のエージェント間の相互作用によって強化された大きな言語モデルを利用した新しいフレームワークである。このフレームワークは,戦略的議論,カウンセラー作成の調整,応答生成という3つの段階を通じて動作する。実験やユーザスタディを含む評価は、MentalAgoraがプロの標準と整合し、ユーザの好みを効果的に満たしていることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:19:38 GMT)
GraphWiz: An Instruction-Following Language Model for Graph Problems [39.7]
GraphInstructは、言語モデルに明示的な推論パスを用いて、幅広いグラフ問題に対処する機能を持たせるために設計されたデータセットである。 GraphWizは、明確な推論プロセスを生成しながら、さまざまなグラフ問題タイプを解決できるオープンソースの言語モデルです。拡張モデルであるGraphWiz-DPOは、9つのタスクで平均65%の精度を達成し、GPT-4を平均43.8%上回っている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:39:59 GMT)
Evaluating LLMs' Inherent Multi-hop Reasoning Ability [39.6]
マルチホップQAタスクにおける複数のエビデンスの統合に関する多段階推論能力は、未検討のままである。現在のマルチホップQAベンチマークは、ウィキペディアのようなオープンソースのコーパスに、事実と注釈が付けられている。本稿では,LLMの連鎖評価性能を協調的に評価する新しい評価手法であるIRE法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:50:48 GMT)
On Evaluating Explanation Utility for Human-AI Decision Making in NLP [39.6]
既存のメトリクスをレビューし、アプリケーショングラウンド評価に適したデータセットの要件を確立する。我々は,人間-AIチームの形成と研究のために,芸術の状態を再評価することの重要性を実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:53:27 GMT)
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better [39.6]
すべての合成画像は、最終的にジェネレータを訓練するために使用される上流データに由来する。我々は, LAION-2Bから直接取得した目標実画像に対して, 安定拡散によって生成されたタスク関連ターゲット合成データを微調整と比較した。解析の結果,このアンダーパフォーマンスは生成物と,合成画像中のタスク関連視覚的詳細が不正確なためであることが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:00:50 GMT)
Learning to Reduce: Towards Improving Performance of Large Language Models on Structured Data [39.3]
大規模言語モデル(LLM)は、幅広い下流タスクにおいて有能なパフォーマンスを実現している。本稿では、オン・ポリシー・ラーニングを用いて言語モデルを微調整し、入力された構造化データの縮小版を生成するフレームワークであるLearning to Reduceを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:51:50 GMT)
A Wolf in Sheep's Clothing: Practical Black-box Adversarial Attacks for Evading Learning-based Windows Malware Detection in the Wild [39.3]
MalGuiseは、既存の学習ベースのWindowsマルウェア検出システムのセキュリティリスクを評価するブラックボックス敵攻撃フレームワークである。 MalGuiseの攻撃成功率は95%を超え、生成したマルウェアファイルの91%以上が同じセマンティクスを維持している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:01:19 GMT)
Investigating Decoder-only Large Language Models for Speech-to-text Translation [39.2]
大規模言語モデル (LLM) は、様々なドメインにまたがる例外的な推論能力、一般化可能性、およびレイテンシで知られている。我々は,LLMが直接符号化された音声表現を消費し,テキスト翻訳を生成することができるデコーダのみのアーキテクチャを提案する。本モデルでは,プロプライエタリなデータを必要としないモデル間で,CoVoST 2およびFLEURSの最先端性能を実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:42:49 GMT)
Social Bias Evaluation for Large Language Models Requires Prompt Variations [38.9]
大規模言語モデル(LLM)は、かなりの社会的偏見を示す。本稿では,高速変動変化におけるLDMの感度について検討する。 LLMは、そのプロンプトによって引き起こされる社会的偏見と性能のトレードオフがあることが示される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:12:04 GMT)
SF-GNN: Self Filter for Message Lossless Propagation in Deep Graph Neural Network [38.7]
グラフニューラルネットワーク(GNN)は,グラフの伝播と集約によるグラフ構造情報の符号化を主目的とする。等質グラフ、異質グラフ、知識グラフのようなより複雑なグラフなど、複数の種類のグラフの表現学習において優れた性能を発揮した。深部GNNの性能劣化現象に対して,新しい視点を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:40:39 GMT)
Multi-Scenario Combination Based on Multi-Agent Reinforcement Learning to Optimize the Advertising Recommendation System [38.5]
本稿では,異なるシナリオを共通の目的の下で整列するマルチエージェント・リカレント決定性ポリシー勾配(MARDPG)アルゴリズムを提案する。その結果,クリックスルー率 (CTR) , コンバージョン率, 総売上など, 指標の大幅な改善が見られた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:33:20 GMT)
FairMedFM: Fairness Benchmarking for Medical Imaging Foundation Models [37.8]
医療画像における基礎モデル(FM)研究のためのフェアネスベンチマークであるFairMedFMを紹介する。 FairMedFMは17の一般的な医療画像データセットと統合されており、様々なモダリティ、次元、機密属性を含んでいる。ゼロショット学習、線形探索、パラメータ効率のよい微調整、様々な下流タスク、分類とセグメンテーションなど、広く使われている20のFMを探索する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:37:36 GMT)
PWM: Policy Learning with Large World Models [37.7]
強化学習(RL)は複雑なタスクにおいて印象的な結果を得たが、異なる実施形態を持つマルチタスク設定に苦戦している。我々は,大規模マルチタスク世界モデルから連続制御ポリシを学習する新しいモデルベースRLアルゴリズムである,大規模世界モデルを用いたポリシー学習(PWM)を紹介する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:24:02 GMT)
PosMLP-Video: Spatial and Temporal Relative Position Encoding for Efficient Video Recognition [37.6]
PosMLP-Videoは、ビデオ認識のための軽量だが強力なバックボーンのようなモデルである。 ImageNet1Kで事前トレーニングされたPosMLP-Videoは59.0%/70.3%のトップ-1精度を達成した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:07:14 GMT)
Cyclic Refiner: Object-Aware Temporal Representation Learning for Multi-View 3D Detection and Tracking [37.2]
マルチビュー3次元検出・追跡タスクのための統合オブジェクト認識時間学習フレームワークを提案する。提案モデルでは,異なる設計のベースラインよりも一貫した性能向上を実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:10:19 GMT)
Multi-modal Attribute Prompting for Vision-Language Models [37.1]
大規模な事前訓練されたビジョンランゲージモデル(VLM)は、下流のタスクに対して強力な一般化能力を示すが、少数のシナリオでは苦労する。既存のプロンプト技術は主にグローバルテキストと画像表現に重点を置いているが、マルチモーダル属性の特徴を見落としている。テキスト属性プロンプト,視覚属性プロンプト,属性レベルのアライメントを共同で探索し,マルチモーダル属性プロンプト法(MAP)を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:04:25 GMT)
Graph and Skipped Transformer: Exploiting Spatial and Temporal Modeling Capacities for Efficient 3D Human Pose Estimation [36.9]
我々は、簡潔なグラフとSkipped Transformerアーキテクチャを用いて、Transformer-temporal情報を活用するためのグローバルなアプローチを採っている。具体的には、3Dポーズの段階では、粗粒の体部が展開され、完全なデータ駆動適応モデルが構築される。実験はHuman3.6M、MPI-INF-3DHP、Human-Evaベンチマークで行われた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:42:09 GMT)
Jamba: A Hybrid Transformer-Mamba Language Model [36.5]
本稿では,新しいハイブリッドなTransformer-Mamba混在型アーキテクチャに基づく,新しいベースとなる大規模言語モデルであるJambaを紹介する。 JambaはTransformer層とMamba層のブロックをインターリーブし、両方のモデルファミリーの利点を享受する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:30:33 GMT)
Pistis-RAG: A Scalable Cascading Framework Towards Content-Centric Retrieval-Augmented Generation [36.5]
Pistis-RAGは、大規模検索拡張生成(RAG)システムの課題に対処するために設計されたスケーラブルなマルチステージフレームワークである。私たちのフレームワークは、マッチング、序列、ランク付け、推論、集約という、異なるステージで構成されています。我々の新しいランキングステージは、情報検索の原則を取り入れたRAGシステムに特化して設計されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:54:16 GMT)
Free-SurGS: SfM-Free 3D Gaussian Splatting for Surgical Scene Reconstruction [36.5]
手術シーンのリアルタイム3D再構成は,コンピュータ支援手術において重要な役割を担っている。近年の3次元ガウススプラッティングの進歩は、リアルタイムな新規なビュー合成に大きな可能性を示している。外科的シーン再構成のためのSfMフリー3DGS法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:49:35 GMT)
SlerpFace: Face Template Protection via Spherical Linear Interpolation [35.7]
本稿では,事前保護の無効化が可能な拡散モデルを用いて,新たなプライバシ攻撃形態を特定する。この攻撃は、テンプレートから高品質でアイデンティティを保存する顔画像を合成し、人の外観を明らかにする。本稿では,拡散モデルの生成能力に関する研究に基づいて,テンプレートをノイズ様の分布に回転させることにより,攻撃に対する防御を提案する。提案手法は,新しい顔テンプレート保護技術であるSlerpFaceとして実装されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:07:36 GMT)
MindBench: A Comprehensive Benchmark for Mind Map Structure Recognition and Analysis [35.3]
文書分析にMindBenchという新しいベンチマークを導入する。これには、厳密に構築されたバイリンガル認証または合成画像、詳細なアノテーション、評価指標、ベースラインモデルが含まれる。これらのタスクには、完全パース、部分パース、位置関連パース、構造化された視覚質問応答(VQA)、位置関連VQAが含まれる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:39:18 GMT)
Advanced Framework for Animal Sound Classification With Features Optimization [35.3]
一般的な動物音響分類に適用可能な自動分類フレームワークを提案する。提案手法は,精度,リコール,精度を25%以上向上させる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:33:47 GMT)
ConCodeEval: Evaluating Large Language Models for Code Constraints in Domain-Specific Languages [35.2]
大規模言語モデル(LLM)は、ゼロショットと少数ショットの設定で様々なテキスト生成タスクの自然言語制約を理解するのに苦労する。 5つの表現にまたがってコードとして表現されるハード制約とソフト制約を用いてLLMの可制御性を評価するための2つの新しいタスクを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:36:13 GMT)
Analog Quantum Simulator of a Quantum Field Theory with Fermion-Spin Systems in Silicon [34.8]
フェルミオンを量子ビットにマッピングすることは、2+1$以上の時空次元で困難である。シリコン中のドーパントアレイを用いた固有フェルミオンスピンアナログ量子シミュレータを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:52 GMT)
Motion meets Attention: Video Motion Prompts [34.4]
本研究では,学習可能な傾きとシフトパラメータを付加したSigmoid関数を,動作信号を活性化・変調するアテンション機構として提案する。このアプローチは、モーション関連ビデオコンテンツの処理を強化するアテンションマップのシーケンスを生成する。我々はこのプロセスをモーションプロンプト層として形式化し、正規化項をロス関数に組み込んで、より良いモーションプロンプトを学習する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:59:46 GMT)
Character-Adapter: Prompt-Guided Region Control for High-Fidelity Character Customization [34.3]
character-Adapterは、参照文字の詳細を保持するイメージを生成するために設計されたプラグイン・アンド・プレイのフレームワークである。 character-Adapterは、参照文字のきめ細かい地域的特徴を保証するために、プロンプト誘導セグメンテーションを使用する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:26:35 GMT)
UnSeenTimeQA: Time-Sensitive Question-Answering Beyond LLMs' Memorization [34.3]
UnSeenTimeQAは、新しい時間に敏感な質問応答ベンチマークである。これは、事実とWeb検索可能なクエリを避けることで、従来のTSQAベンチマークから切り離されている。真の時間的推論を行うには、大きな言語モデルが必要である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 22:02:07 GMT)
Croppable Knowledge Graph Embedding [34.2]
知識グラフ埋め込み(英: Knowledge Graph Embedding、略称:KGE)は、知識グラフ(英: Knowledge Graphs、略称:KG)の一般的な手法である。新しい次元が必要になったら、新しいKGEモデルをゼロからトレーニングする必要があります。複数のシナリオに適用可能なKGEモデルを一度トレーニングできる新しいKGEトレーニングフレームワークMEDを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:10:25 GMT)
Explicitly Guided Information Interaction Network for Cross-modal Point Cloud Completion [34.1]
EGIInetはビュー誘導ポイントクラウドコンプリート(ViPC)タスクのモデルである。本稿では,モーダルアライメントをサポートする情報インタラクション戦略を提案する。我々は,従来の手法に比べてパラメータが少ないにもかかわらず,ベンチマークデータセットにおいて新しい最先端(XMFnet上で+16% CD)を実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:03:56 GMT)
Temporal Interest Network for User Response Prediction [34.0]
本稿では,行動と対象間の意味的・時間的相関を同時に捉えるための時間的関心ネットワーク(TIN)を提案する。 TINは2023年10月から運用に成功し、WeChat Momentsのトラフィックに対応している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:28:10 GMT)
Unifying Floquet theory of longitudinal and dispersive readout [33.7]
回路QEDにおける長手および分散読み出しのフロケ理論を考案する。超伝導及びスピンハイブリッドcQED系に応用する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:47 GMT)
Model and Feature Diversity for Bayesian Neural Networks in Mutual Learning [33.6]
深層学習によるBNNの性能向上のための新しい手法を提案する。実験結果から, 分類精度, 負の対数類似度, キャリブレーション誤差が有意に向上した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:25:25 GMT)
What Affects the Stability of Tool Learning? An Empirical Study on the Robustness of Tool Learning Frameworks [33.5]
本稿では,ツール学習フレームワークの性能に及ぼす内部要因と外部要因の影響について検討する。今後の研究には、LCMが試行錯誤の増加から大きな恩恵を受けることができるという観察など、洞察に富んだ結論がいくつか見出される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:06:05 GMT)
DocCGen: Document-based Controlled Code Generation [33.2]
DocCGenは、構造化コード言語のためのNL-to-Code生成タスクを2段階のプロセスに分解することで、豊富な知識を活用できるフレームワークである。実験の結果,DocCGenは6つの評価指標すべてで,言語モデルのサイズを常に改善していることがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:16:27 GMT)
Noise Contrastive Alignment of Language Models with Explicit Rewards [32.9]
我々は、NCEを利用して、スカラー評価で明示的に注釈付けされた報酬データセットを扱う際のギャップを埋める、LMアライメントのための一般的なフレームワークを提案する。我々のフレームワークは2つの並列アルゴリズム、NAAとInfoNCAで構成されており、どちらも報酬データと嗜好データからLMポリシーを直接抽出することができる。 NCA と InfoNCA を比較することで,DPO/InfoNCA の減少傾向は,反応の相違による相対可能性の調整に焦点が当てられていることが示される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:53:06 GMT)
Nuisances via Negativa: Adjusting for Spurious Correlations via Data Augmentation [32.7]
ラベルとの関係の異なる特徴はニュアンスである。ニュアンスとラベルの関係を利用するモデルは、これらの関係が変化するとパフォーマンスが低下する。我々は,意味論に関する知識をデータに悪用して利用するためのアプローチを開発する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:06:56 GMT)
Surface-based parcellation and vertex-wise analysis of ultra high-resolution ex vivo 7 tesla MRI in Alzheimer's disease and related dementias [32.6]
アルツハイマー病と関連する認知症にまたがる等方分解能の0.3mmで、82個の脳半球外T2wの1-of-in-kindデータセットを提出した。 Desikan-Killiany-Tourville (DKT) 脳のアトラスを用いて,超高分解能の生体外脳組織を母体空間分解能で解析するために,高速で使いやすく自動表面ベースパイプラインを開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:09:31 GMT)
Efficient DNN-Powered Software with Fair Sparse Models [32.5]
Lottery Ticket hypothesis (LTH) は一般的なモデルプルーニング手法である。本稿では,LTHを用いたプルーニングの公平性問題はサブネットワーク選択とトレーニング手順の両方から生じることを示す。本稿では, 競合検出に基づく新たなサブネットワーク選択手法であるBallotを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:52:28 GMT)
VEGS: View Extrapolation of Urban Scenes in 3D Gaussian Splatting using Learned Priors [32.0]
本研究では,左,右,下などの視界の再構成を評価することで,外挿ビュー合成(EVS)問題に対処する。我々の知る限りでは、都市景観再建におけるESV問題に最初に取り組む人物である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:23:13 GMT)
FedIA: Federated Medical Image Segmentation with Heterogeneous Annotation Completeness [30.8]
フェデレーテッド・ラーニングは医療画像セグメンテーションの魅力的なパラダイムとして登場した。本稿では,医療実践における課題である不完全アノテーションについて述べる。この問題に対処するために、FedIAという新しいソリューションを紹介します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:12:34 GMT)
Malign Overfitting: Interpolation Can Provably Preclude Invariance [30.8]
補間にもかかわらずモデルを適切に一般化する「良性過剰適合」は、堅牢性や公正性が望ましい設定に好ましくない可能性があることを示す。本研究では,非補間型分類器の確率的不変性を学習するアルゴリズムを提案し,解析する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:40:39 GMT)
Investigating the Contextualised Word Embedding Dimensions Responsible for Contextual and Temporal Semantic Changes [30.6]
どのようにして変化が埋め込み空間にエンコードされるのかは、まだ不明である。セマンティックチェンジベンチマークにおいて、事前訓練されたCWEとそれらの微調整されたバージョンを比較した。以上の結果から, (a) 事前学習したCWE空間における単語の意味変化の原因となる軸は少ないが, 微調整された場合, 全次元に分散することがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:42:20 GMT)
MONGOOSE: Path-wise Smooth Bayesian Optimisation via Meta-learning [30.0]
ブラックボックスの客観的関数を評価するコストの主な貢献は、しばしば測定のためのシステムを作成するのに必要な労力である。本稿では, 連続評価の間隔が大きくなるにつれて, 準備コストが増大する一般的なシナリオについて考察する。我々のアルゴリズムMONGOOSEは、メタリアントパラメトリックポリシーを用いてスムーズな最適化軌道を生成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:28:00 GMT)
Camera-LiDAR Cross-modality Gait Recognition [29.7]
本稿では,カメラとLiDAR,すなわちCL-Gait間の最初の相互モダリティ歩行認識フレームワークを提案する。私たちの知る限りでは、これはモダリティ間の歩行認識に対処する最初の試みである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:50:48 GMT)
Spectral Estimators for Structured Generalized Linear Models via Approximate Message Passing [28.9]
本研究では,高次元一般化線形モデルにおけるパラメータ推定の問題について考察する。広く使われているにもかかわらず、厳密なパフォーマンス特性とデータ前処理の原則が、構造化されていない設計でのみ利用可能である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:43:58 GMT)
PharmaGPT: Domain-Specific Large Language Models for Bio-Pharmaceutical and Chemistry [28.4]
大規模言語モデル(LLM)は、複雑な機能工学の必要性を最小限に抑えて、自然言語処理(NLP)に革命をもたらした。しかし、生物医薬品や化学といった専門分野へのLSMの応用は、まだほとんど解明されていない。本研究では,13億～70億のパラメータを持つ多言語LLMのスイートであるPharmGPTについて紹介する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:56:40 GMT)
Probing the Feasibility of Multilingual Speaker Anonymization [28.4]
最先端の匿名化システムを9言語に拡張する。プライバシー攻撃や音声劣化に対する匿名化音声の堅牢性をテストする実験は、全ての言語でこのシステムの全体的な成功を示している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:12:53 GMT)
Align and Aggregate: Compositional Reasoning with Video Alignment and Answer Aggregation for Video Question-Answering [28.4]
Video Question-Answering (VideoQA) は一般にブラックボックスとして機能し、それらの推論プロセスを理解し、一貫した構成的推論を行うのが困難である。本稿では,ビデオコーディネータと応答アグリゲータモジュールを統合することで,既存のVidQA手法の構成整合性と精度を両立させるフレームワークを提案する。本フレームワークは,既存手法の構成整合性と精度を向上し,より解釈可能な実世界のVidQAモデルを実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:07:21 GMT)
Knowledge Transfer with Simulated Inter-Image Erasing for Weakly Supervised Semantic Segmentation [28.2]
弱教師付きセマンティックセグメンテーションのためのtextbfKnowledge textbfTransfer with textbfSimulated Inter-Image textbfErasing (KTSE) アプローチを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:54:33 GMT)
Vision-driven Automated Mobile GUI Testing via Multimodal Large Language Model [28.0]
本稿では,マルチモーダル大規模言語モデルを用いて,非クラッシュな機能的バグを検出する視覚駆動型GUIテスト手法を提案する。 GUIテキスト情報を抽出し、スクリーンショットと整列して視覚プロンプトを形成することで、MLLMはGUIコンテキストを理解することができる。 VisionDroidは、Google Playの29の新しいバグを特定し、そのうち19が確認され、修正されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:58:09 GMT)
Defect Spectrum: A Granular Look of Large-Scale Defect Datasets with Rich Semantics [28.0]
Defect Spectrumは、広範囲の産業的欠陥に対して、正確でセマンティックな、そして大規模なアノテーションを提供する包括的なベンチマークである。 4つの重要な産業ベンチマークに基づいて、私たちのデータセットは既存のアノテーションを洗練し、単一のイメージ内の複数の欠陥タイプを識別する、リッチなセマンティックな詳細を導入します。また、高品質で多様な欠陥画像を作成するために設計された2段階拡散ベースジェネレータであるDefect-Genを紹介する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:11:54 GMT)
A Survey on Trustworthiness in Foundation Models for Medical Image Analysis [27.9]
本稿では, 主な医用画像の基盤モデルについて概説する。本稿では,医療画像解析の基礎モデル作成の課題について考察する。我々は、これらのモデルが患者ケアに革命をもたらすための将来的な可能性を探求する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:07:57 GMT)
Quantum coarsening and collective dynamics on a programmable quantum simulator [27.8]
我々は、(2+1)Dイジング量子相転移における集合力学を実験的に研究した。順序づけられた領域の進化を決定的に準備し、追従することにより、粗い領域は領域境界の曲率によって駆動されることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:29:12 GMT)
Self-supervised co-salient object detection via feature correspondence at multiple scales [27.7]
本稿では,画像群における2段階の自己教師型手法を用いて,セグメンテーションアノテーションを必要とせず,共起性有色物体(CoSOD)を検出する手法を提案する。我々は、画像間の局所パッチレベルの特徴対応を計算し、コサレント領域を検出する自己教師ネットワークを訓練する。 3つのCoSODベンチマークデータセットの実験では、我々のモデルは、対応する最先端モデルよりも大きなマージンで優れています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:10:52 GMT)
Stable Heterogeneous Treatment Effect Estimation across Out-of-Distribution Populations [27.2]
不均一治療効果(HTE)の推定は、個人またはグループ間の治療効果の変化を理解するために不可欠である。既存のHTE推定手法の多くは、処理単位と制御単位間の共著者の不均衡分布によって引き起こされる選択バイアスに対処することに焦点を当てている。人口分布を連続的に変化させる現実世界のアプリケーションでは、分布外人口をまたいだ安定したHTE推定が緊急に必要である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:03:51 GMT)
TheoremLlama: Transforming General-Purpose LLMs into Lean4 Experts [27.0]
Leanのようなコンピュータで検証可能な形式言語を用いた数学的定理の証明は、数学的推論に大きな影響を及ぼす。形式的定理証明の1つのアプローチは、自然言語(NL)の証明に基づいたLarge Language Models (LLM)を用いた完全証明を生成することである。本稿では,汎用LLMを学習してLean4の専門家になるためのエンドツーエンドフレームワークである*Theorelama**を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:36:18 GMT)
Boosting Biomedical Concept Extraction by Rule-Based Data Augmentation [26.7]
文書レベルのバイオメディカル概念抽出は、ある文書で言及されているバイオメディカル概念を識別するタスクである。近年,この課題に対する事前学習型言語モデルの導入が進んでいる。既存のルールベースの概念マッピングシステムであるMetaMapLiteを用いて,PubMed と PMC から擬似アノテーション付きデータを生成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:00:21 GMT)
Bayesian Reward Models for LLM Alignment [26.6]
我々は、トレーニングデータ分布からより高い不確実性を示すベイズ報酬モデルを訓練する。得られた不確実性推定は,BoNサンプリングにおける報酬過小評価を効果的に軽減できることがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:23:41 GMT)
FSM: A Finite State Machine Based Zero-Shot Prompting Paradigm for Multi-Hop Question Answering [26.4]
大きな言語モデル (LLM) とチェーン・オブ・シント (COT) のプロンプトは、単純な自然言語推論タスクにおいて印象的な能力を示している。本稿では,複雑なタスクに対するLLMの推論能力を高めるために,FSM(Finite State Machine)というプロンプト手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:01:01 GMT)
Foster Adaptivity and Balance in Learning with Noisy Labels [26.3]
我々はtextbfSelf-adaptivtextbfE とクラスバランスtextbfD 方式でラベルノイズに対処するための textbfSED という新しい手法を提案する。平均教師モデルは、ノイズの多いサンプルのラベルを修正するために使用される。また,検出した雑音に異なる重みを割り当てる自己適応型およびクラスバランスのサンプル再重み付け機構を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:10:24 GMT)
Explainable Natural Language Processing for Corporate Sustainability Analysis [26.3]
コーポレート・サステナビリティの概念は、コーポレート・オペレーションの多様で複雑な性質のために複雑である。企業サステナビリティ評価は、企業サステナビリティの取り組みを反映したデータと、それらを評価するアナリストの両方で主観性に悩まされている。我々は、説明可能な自然言語処理(XNLP)は企業サステナビリティ分析を大幅に向上させることができると主張している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:27:51 GMT)
Adam-mini: Use Fewer Learning Rates To Gain More [26.0]
Adam-miniはAdamの学習率リソースを削減してメモリを削減します。 Adam-miniは、メモリフットプリントを45%から50%削減したAdamWよりも、オンパーまたは優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:38:17 GMT)
Multi-Task Domain Adaptation for Language Grounding with 3D Objects [26.0]
本稿では,3次元オブジェクトを用いたDA4LG(Domain Adaptation for Language Grounding)という新しい手法を提案する。具体的には、DA4LGは、視覚言語アライメントを実現するために、マルチタスク学習を備えたビジュアルアダプタモジュールで構成されている。実験の結果,DA4LGは視覚的および非視覚的言語記述間で競合的に機能することが示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:47:58 GMT)
AMA-LSTM: Pioneering Robust and Fair Financial Audio Analysis for Stock Volatility Prediction [25.7]
マルチモーダル法は 2つの欠点に直面しています彼らはしばしば、信頼できるモデルを得るのに失敗し、株式市場からの情報の吸収のためにデータを過大評価する。株のボラティリティを予測するためにマルチモーダルモデルを使用することは、性別バイアスに悩まされ、そのようなバイアスを取り除く効率的な方法が欠如している。我々は,ロバストネス・ワールド・ファイナンシャル・オーディオ・データセットに関する包括的な実験を行い,この手法が現在の最先端ソリューションの性能を上回ることを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:40:53 GMT)
FRoG: Evaluating Fuzzy Reasoning of Generalized Quantifiers in Large Language Models [25.5]
ファジィ推論のための新しいベンチマークFRoGを導入する。ファジィ推論は大きな言語モデルにとって大きな課題であり続けている。また、強い数学的推論スキルが必ずしもベンチマークの成功を示すものではないことも示している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:37:53 GMT)
Raw Text is All you Need: Knowledge-intensive Multi-turn Instruction Tuning for Large Language Model [25.5]
本稿では,対話論理のCoD-Chainを利用して,多言語モデル(LLM)を指導指導のための知識集約型多元対話を生成する新しいフレームワークR2Sを提案する。オープンソースデータセットとドメイン固有のWebcrawledドキュメントの両方の生文書をベンチマークK-BENCHに統合することにより、Wikipedia(英語)、Science(中国語)、Artifacts(中国語)などのさまざまな領域をカバーする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:04:10 GMT)
Reasoning Runtime Behavior of a Program with LLM: How Far Are We? [25.5]
コードのための大規模な言語モデル(LLM)は、強力なコード理解と生成能力を示している。コード推論は、コードLLMの最も重要な能力の1つである。本稿では,プログラム実行によるLLMのコード推論能力と一貫性を評価するためのフレームワークであるRevalを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:10:43 GMT)
Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems [25.1]
LLM(Large Language Model)ベースのTODシステムは、コンテキスト内例を通してタスクを学習する能力のため、限られたデータでも優れている。低データ設定におけるアライメントを改善するために,タスク固有のヒントでLLMを相乗化するSyncTODを提案する。 ChatGPTでは、SyncTODは低データ設定でLLMベースのベースラインやSoTAモデルよりも優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:26:24 GMT)
GLADformer: A Mixed Perspective for Graph-level Anomaly Detection [25.0]
マルチパースペクティブなグラフレベルの異常検出器であるGLADformerを提案する。具体的には、まず、グローバルスペクトル拡張を用いたグラフトランスフォーマーモジュールを設計する。局所的な異常特性を明らかにするため、帯域通過スペクトルGNNメッセージパッシングモジュールをカスタマイズする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:30:01 GMT)
Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory [24.9]
我々は,認知行動療法(Cognitive Behavioral Therapy, CBT)の目標指向的, 構造化的アプローチを用いて, 実生活インタラクションをエミュレートする多ターン対話データセットを作成する。我々は、実際のカウンセリングセッションの評価、専門家の評価との整合性の確保に使用される確立された心理学的基準をベンチマークする。 Cactusで訓練されたモデルであるCamelはカウンセリングスキルにおいて他のモデルよりも優れており、カウンセリングエージェントとしての有効性と可能性を強調している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:41:31 GMT)
JailBreakV-28K: A Benchmark for Assessing the Robustness of MultiModal Large Language Models against Jailbreak Attacks [24.7]
本稿では,大規模言語モデルのジェイルブレイクを成功させる手法が,MLLMのジェイルブレークに等しく有効かどうかを検討する。 MLLM への LLM ジェイルブレイク手法の転送性を評価するための先駆的なベンチマークである JailBreakV-28K を紹介する。 LLMの高度なジェイルブレイク攻撃と、最近のMLLMのジェイルブレイク攻撃によるイメージベースのジェイルブレイク入力により、20000のテキストベースのジェイルブレイクプロンプトを生成します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:08:14 GMT)
SOS! Soft Prompt Attack Against Open-Source Large Language Models [24.6]
オープンソースの大規模言語モデル(LLM)は、一般大衆と業界の両方で人気が高まっている。一部のオープンソースLLMは使用前に承認を必要としており、サードパーティが容易にアクセス可能なバージョンを公開している。我々は、計算要求が低く、クリーンなデータやモデルの重みの変更を必要としない新しいトレーニングタイムアタック、SOSを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:35:16 GMT)
Neuro-BERT: Rethinking Masked Autoencoding for Self-supervised Neurological Pretraining [24.6]
本稿では、フーリエ領域におけるマスク付き自己エンコーディングに基づく神経信号の自己教師付き事前学習フレームワークであるNeuro-BERTを提案する。本稿では、入力信号の一部をランダムにマスキングし、欠落した情報を予測するFourier Inversion Prediction (FIP)と呼ばれる新しい事前学習タスクを提案する。提案手法をいくつかのベンチマークデータセットで評価することにより,Neuro-BERTは下流神経関連タスクを大きなマージンで改善することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 22:27:37 GMT)
Universal Length Generalization with Turing Programs [24.1]
本稿では,アルゴリズムタスクをチューリングマシンを模倣するステップに分解する手法であるチューリングプログラムを提案する。チューリングプログラムを用いることで,アルゴリズム的タスクの領域におけるロバストな長さの一般化が得られる。次に,確率的チューリングプログラムにおいて,トランスフォーマーが長さ一般化を実現することを実証し,任意のアルゴリズムタスクに対して長さ一般化が可能であることを示唆する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:53:44 GMT)
I-MedSAM: Implicit Medical Image Segmentation with Segment Anything [24.0]
提案するI-MedSAMは、連続表現とSAMの両方の利点を利用して、クロスドメイン能力と正確な境界線を求める。トレーニング可能なパラメータが1.6Mしかない提案手法は、離散的および暗黙的を含む既存の手法よりも優れている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:23:57 GMT)
BACON: Supercharge Your VLM with Bag-of-Concept Graph to Mitigate Hallucinations [23.8]
視覚言語モデル(VLM)の特権を味わう言語能力に制限のあるBag-of-Concept Graph(BACON)ギフトモデル BACONはアノテーションを基本的な最小要素に分解し、それらをグラフ構造で示す。 100Kの注釈付き画像でデータセットを収集し、優れた機能を備えたVLMを実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:55:27 GMT)
Efficient Training of Language Models with Compact and Consistent Next Token Distributions [23.3]
我々は, コーパスを崩壊した$n$-gramの分布で事前集約することで, より良いモデルをより高速に訓練できることを示す。我々の近似は、より大きなデータセットやモデルへのゲインのスケーラビリティを促進する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:40:41 GMT)
Enabling Discriminative Reasoning in LLMs for Legal Judgment Prediction [23.0]
人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。 ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:25:23 GMT)
Relating CNN-Transformer Fusion Network for Change Detection [23.0]
RCTNetは、空間的特徴と時間的特徴の両方を利用する早期融合バックボーンを導入した。実験では、従来のRS画像CD法よりもRCTNetの方が明らかに優れていることを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:58:40 GMT)
GraCoRe: Benchmarking Graph Comprehension and Complex Reasoning in Large Language Models [22.7]
本稿では,大規模言語モデルのグラフ理解と推論を体系的に評価するベンチマークであるGraCoReを提案する。 GraCoReは、純粋なグラフとヘテロジニアスグラフ上のモデルを分類およびテストするために、3階層の階層分類を使用する。キーとなる発見は、セマンティックエンリッチメントが推論性能を高め、ノード順序付けがタスクの成功に影響を及ぼし、長いテキストを処理する能力が必ずしもグラフの理解や推論を改善するとは限らないことである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:12:38 GMT)
Correlation-Guided Query-Dependency Calibration for Video Temporal Grounding [22.6]
相関ガイドによる検出TRansformerは、クエリ関連ビデオクリップのヒントを提供する。 CG-DETRは時間的接地のための様々なベンチマークで最先端の結果を得る。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:05:02 GMT)
Conformal Prediction for Causal Effects of Continuous Treatments [22.1]
本研究では, 連続処理の潜在的な結果に対する新しいコンフォメーション予測法を提案する。共形予測区間が正当性スコアが未知であっても有効となるように、不確実性推定によって導入された追加的不確実性を考慮する。我々の知る限りでは、確率スコアが不明で、データから推定しなければならない場合、我々は、継続的治療のための共形予測を最初に提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:34:33 GMT)
MedVH: Towards Systematic Evaluation of Hallucination for Large Vision Language Models in the Medical Context [21.6]
LVLM(Large Vision Language Models)は、最近、自然画像やテキストデータにおける様々なタスクにおいて、優れたパフォーマンスを実現している。それらの進歩にもかかわらず、より小さなデータセットで微調整された場合の幻覚に対するこれらのモデルの堅牢性について、精査された研究がなされている。領域固有のLVLMの幻覚を評価するために,新しいベンチマークデータセットであるMedVH(MedVH)を導入する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:59:03 GMT)
HoloHisto: End-to-end Gigapixel WSI Segmentation with 4K Resolution Sequential Tokenization [21.2]
デジタル病理学では、ディープラーニングに基づくイメージセグメンテーションの伝統的な方法は通常、2段階のプロセスを含む。本稿では,ギガピクセルWSI上でのエンドツーエンドのセグメンテーションを実現するために,ホロヒスト法(HoloHisto)セグメンテーション法を提案する。 HoloHistoプラットフォームでは、超高解像度の4Kサンプルをランダムに公開しています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:49:31 GMT)
Single Character Perturbations Break LLM Alignment [20.8]
モデル入力の端に空間を付加するだけで、モデルディフェンスを壊すことが可能であることを示す。トークン化されたトレーニングデータに単一空間が存在する状況は、モデルにトリガーされた時にリストを生成することを奨励する。本研究は, 現行モデルアライメントの脆弱さを浮き彫りにして, より堅牢なアライメント手法の開発の重要性を推し進めるものである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:03:10 GMT)
Self-Evaluation as a Defense Against Adversarial Attacks on LLMs [20.8]
モデル入力の端に空間を付加するだけで、モデルディフェンスを壊すことが可能であることを示す。トークン化されたトレーニングデータに単一空間が存在する状況は、モデルにトリガーされた時にリストを生成することを奨励する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:03:42 GMT)
Convergence of flow-based generative models via proximal gradient descent in Wasserstein space [20.8]
フローベースの生成モデルは、データ生成と可能性の計算において一定の利点がある。本研究では,進行流モデルによるデータ分布の生成を理論的に保証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:05:43 GMT)
Explainable AI for Comparative Analysis of Intrusion Detection Models [20.7]
本研究は,ネットワークトラフィックから侵入検出を行うために,各種機械学習モデルを二分分類および多クラス分類のタスクに解析する。すべてのモデルをUNSW-NB15データセットで90%の精度でトレーニングしました。また、Random Forestは正確さ、時間効率、堅牢性という点で最高のパフォーマンスを提供します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:32:51 GMT)
Planetarium: A Rigorous Benchmark for Translating Text to Structured Planning Languages [20.6]
benchmarkNameは、計画タスクの自然言語記述からPDDLコードを生成する言語モデルの性能を評価するために設計されたベンチマークである。 13のタスクにまたがる132,037ドルのテキスト-PDDLペアのデータセットを,さまざまな難易度で提示する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:59:53 GMT)
SFC: Achieve Accurate Fast Convolution under Low-precision Arithmetic [20.2]
WinogradやFFTといった高速畳み込みアルゴリズムは、深層モデルの畳み込み操作を効率的に高速化することができる。これらのアルゴリズムは推論精度を維持するために高精度演算に依存しており、これはモデルの量子化と矛盾する。本稿では、離散フーリエ変換をシンボル計算で拡張することにより、高速畳み込みのための新しい代数変換であるSFCを提案する。我々の新しいアルゴリズムは、量子化アルゴリズムと高速畳み込み量子化に関する既存の研究の両方を超越しながら、精度を維持しながら量子化モデルの効率をさらに向上させることができることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:38:14 GMT)
Monotone Generative Modeling via a Gromov-Monge Embedding [19.9]
本稿では, 基礎となるデータ分布の低次元構造を同定し, 基礎となる幾何学を保ちながら低次元の潜在空間にマッピングし, 埋め込み分布への参照測度を最適に伝達する新しいモデルを提案する。数値実験により,高画質画像の生成とモード崩壊とトレーニング不安定性の両面に対するロバスト性を示す手法の有効性が示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:35:27 GMT)
Evolutionary Approach to S-box Generation: Optimizing Nonlinear Substitutions in Symmetric Ciphers [19.7]
本研究では,対称鍵暗号における非線形置換箱(Sボックス)生成における遺伝的アルゴリズムの適用について検討した。本稿では,遺伝的アルゴリズムとWalsh-Hadamard Spectrum (WHS)コスト関数を組み合わせることで,非線形性104。提案手法は, 平均49,399回, 100%の成功率で, 最もよく知られた手法と同等の性能を実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:15:24 GMT)
Visual Grounding with Attention-Driven Constraint Balancing [19.3]
本稿では,言語関連領域における視覚的特徴の挙動を最適化するために,注意駆動制約バランス(AttBalance)を提案する。 4つの異なるベンチマークで評価された5つの異なるモデルに対して、一定の改善が達成される。 QRNetにメソッドを統合することにより,最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:14:09 GMT)
Visual Analytics of Multivariate Networks with Representation Learning and Composite Variable Construction [19.3]
本稿では,多変量ネットワーク研究のための視覚解析ワークフローを提案する。それは、データを分類するニューラルネットワークベースの学習フェーズ、次元の削減と最適化フェーズ、ユーザが実行する解釈フェーズで構成される。ニューラルネットワークから得られる非線形特徴を直感的に解釈できる線形特徴にモデル化する複合変数構築ステップが,我々の設計の鍵となる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:05:05 GMT)
Decomposition for Enhancing Attention: Improving LLM-based Text-to-SQL through Workflow Paradigm [19.1]
大規模言語モデル(LLM)の文脈内学習は自然言語処理の分野で大きな成功を収めている。ケーススタディでは、一段階のチェーン・オブ・シントアプローチが、テキスト・トゥ・コレクションのような複雑なタスクにおける注意拡散や不適切なパフォーマンスといった課題に直面していることが明らかになった。分解によりLLMの注目度と問題解決範囲を高めることを目的としたワークフローパラダイムを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:45:29 GMT)
EarthMatch: Iterative Coregistration for Fine-grained Localization of Astronaut Photography [19.0]
本研究では,宇宙飛行士の写真の微粒化を再現する,反復的ホモグラフィー推定手法であるEarthMatchを提案する。提案手法の有効性をこのデータセットで証明し,画像マーカ比較のための新しい公正な方法を提案する。われわれの方法では、45万枚の地球の写真の高速かつ正確なローカライズが可能になります。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:37:00 GMT)
Helicity is a topological invariant of massless particles: C=-2h [18.8]
質量のない粒子の位相と幾何学の間には、より微妙な関係があることが示される。我々は、質量のない粒子のアーベル群構造を通して全ての質量のないバンドル表現を生成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:48:18 GMT)
Eraser: Jailbreaking Defense in Large Language Models via Unlearning Harmful Knowledge [18.7]
脱獄攻撃により、Large Language Models (LLM) は保護をバイパスし、有害なコンテンツを生成することができる。既存のジェイルブレイク防御手法は、有害な知識がモデルの中に存在するという根本的な問題に対処できなかった。本稿では,有害な知識の学習,一般知識の保持,安全性の維持という3つの目標を主目的として,エラザーと呼ばれる新しい防衛手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:52:00 GMT)
A Pairwise DomMix Attentive Adversarial Network for Unsupervised Domain Adaptive Object Detection [18.7]
教師なしドメイン適応オブジェクト検出(DAOD)は、ソースドメインでトレーニングされたモデルを未ラベルのターゲットドメインに適応させ、オブジェクト検出を行う。本稿では,上記の課題を軽減するために,Domain Mixup (DomMix) モジュールを用いた対角対向ネットワークを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:25:20 GMT)
Data Overfitting for On-Device Super-Resolution with Dynamic Algorithm and Compiler Co-Design [18.6]
本稿では,Content-Awareデータ処理パイプラインが支援する動的ディープニューラルネットワークを提案する。本手法は,市販携帯電話上でのPSNRとリアルタイム性能(33FPS)の向上を実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:17:26 GMT)
Domain-Aware Fine-Tuning of Foundation Models [18.3]
ファンデーションモデル(FM)はコンピュータビジョンに革命をもたらし、異なるドメイン間で効果的な学習を可能にした。本稿では、異なるバックボーンアーキテクチャの比較により、FMのゼロショット領域適応ポテンシャルについて検討する。ドメイン関連テキスト埋め込みを利用した新しいドメイン認識コンポーネントを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:10:55 GMT)
MuDiT & MuSiT: Alignment with Colloquial Expression in Description-to-Song Generation [18.2]
本稿では,口語記述から歌声生成への新たな課題を提案する。生成されたコンテンツと口語的人間の表現の整合性に焦点を当てている。この課題は、AIモデル内の言語理解と聴覚表現のギャップを埋めることを目的としている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:12:36 GMT)
Releasing Large-Scale Human Mobility Histograms with Differential Privacy [18.1]
環境インサイト・エクスプローラー(EIE)は、世界中の約5万の地域をまたがる人々の交通手段を含む、人間の移動に関する統計を集計している。これらの統計は二酸化炭素排出量を推定するために使われ、政策立案者に交通政策やインフラに関する判断を伝えるために提供される。この作業では、フェデレートされた分析と差分プライバシーの組み合わせを使用して、これらの必要な統計情報を公開しつつ、厳しいエラー制約の下で運用し、下流の利害関係者に有効性を保証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:54:00 GMT)
Truth is Universal: Robust Detection of Lies in LLMs [18.1]
大規模言語モデル(LLM)は自然言語処理に革命をもたらした。 LLM は "lying" 能力を持ち、故意に偽のステートメントを出力する。 LLMがいつ横たわっているかを検知するロバストな手法を開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:01:54 GMT)
Digital Twin-based Driver Risk-Aware Intelligent Mobility Analytics for Urban Transportation Management [18.0]
本稿では,デジタルツインをベースとしたドライバリスク認識知能モビリティ分析システムを提案する。 DT-DIMAシステムはパンティルトカメラからのリアルタイムトラフィック情報を統合する。このシステムは、ネットワーク全体のモビリティと安全性のリスクをリアルタイムで予測する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:44:22 GMT)
Category-Aware Dynamic Label Assignment with High-Quality Oriented Proposal [17.7]
本稿では,オブジェクト指向検出フレームワークにおいて,複素平面に基づく OBB 表現を導入する。コンバータRPNヘッドは、角度情報を予測するために構成される。提案した損失関数とコンバータRPNヘッドは,高品質な指向性の提案を共同で生成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:36:47 GMT)
Quantum Serverless Paradigm and Application Development using the QFaaS Framework [17.4]
この章では、QFを使った例を使って、サーバレス量子コンピューティングの概念を紹介します。このフレームワークは、サーバーレスコンピューティングモデルを使用して、量子アプリケーションの開発とデプロイを単純化する。この章では、QFのデプロイと使用に関する包括的なドキュメンテーションとガイドラインが提供されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:12:55 GMT)
NLP Sampling: Combining MCMC and NLP Methods for Diverse Constrained Sampling [17.3]
本研究では,各分野からの手法統合のためのフレームワークとして,2段階の手法を再起動するファミリを提案し,解析的およびロボット操作計画問題について評価する。本稿では,ラグランジュパラメータの役割,グローバルサンプリング,ディフューズドNLPとそれに対応するモデルベースデノナイズサンプリングのアイデアなど,いくつかの概念的議論を行う。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:55:06 GMT)
Frequency-Controlled Diffusion Model for Versatile Text-Guided Image-to-Image Translation [17.3]
大規模テキスト・ツー・イメージ拡散モデル(T2I)は画像・画像翻訳(I2I)の強力なツールとして登場した。本稿では,周波数制御拡散モデル(FCDiffusion)を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:05:19 GMT)
PEDDiM: Formal Definitions and Provably Secure Designs for Pre-Execution DoS Defense in Mempools [17.1]
本稿では,非対称なDoS攻撃に対して防御可能なセキュアなブロックチェーン・メムプール設計を提案する。提案するセキュアなトランザクション入力アルゴリズムであるtextscsaferAd-PR は,排除DoS攻撃の実行コストの証明可能な低境界を提供することにより,消去セキュリティを確保する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:28:35 GMT)
Similarity Distance-Based Label Assignment for Tiny Object Detection [17.1]
そこで我々は,SimD(Simisity Distance)と呼ばれるシンプルだが効果的な戦略を導入し,ボックス間の類似性を評価する。我々のアプローチは、ラベル割り当てやNon Maximum Suppression(NMS)のためのIoUの代わりに、一般的なアンカーベース検出器に適用できる。 4つの主流となる小型物体検出データセットの実験により,本手法の優れた性能が示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:36:23 GMT)
Large Language Model Agents for Improving Engagement with Behavior Change Interventions: Application to Digital Mindfulness [17.1]
大規模言語モデルは、社会的支援をエミュレートできる人間のような対話を提供するという約束を示す。 LLMエージェントがマインドフルネス運動のユーザエンゲージメントに与える影響を評価するために2つのランダム化実験を行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:43:16 GMT)
Incremental Gauss--Newton Methods with Superlinear Convergence Rates [16.9]
Incrmental Gauss--Newton(IGN)法を明示的な超線形収束速度で導入する。特に、有限サム構造を持つ非線形最小二乗で問題を定式化する。また、より高速な超線形収束率を得るIGN法に対するミニバッチ拡張も提供する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:26:34 GMT)
HiDiff: Hybrid Diffusion Framework for Medical Image Segmentation [16.9]
HiDiffは医療画像セグメンテーションのためのハイブリッド拡散フレームワークである。既存の識別的セグメンテーションモデルと新しい生成的拡散モデルの強みを相乗化することができる。小さなオブジェクトをセグメンテーションし、新しいデータセットに一般化する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:59:09 GMT)
MG-Verilog: Multi-grained Dataset Towards Enhanced LLM-assisted Verilog Generation [16.8]
大規模言語モデル(LLM)は、ドメイン固有の膨大なデータをカプセル化することによって、ハードウェア設計プロセスの合理化を約束している。既存の利用可能なハードウェアデータセットは、サイズ、複雑さ、詳細に制限されることが多い。本稿では,多段階の詳細な記述と対応するコードサンプルを包含したMulti-Grained-Verilog(MG-Verilog)データセットを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:15:20 GMT)
STRIDE: Simple Type Recognition In Decompiled Executables [16.8]
そこで本研究では,デコンパイラトークンのシーケンスをトレーニングデータと一致させることで,変数名や型を予測する手法STRIDEを提案する。 3つのベンチマークデータセットで評価した結果、STRIDEは可変リタイピングとリネームの両方において、最先端の機械学習モデルに匹敵するパフォーマンスを実現していることがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:09:41 GMT)
Scalable Zero-Knowledge Proofs for Verifying Cryptographic Hashing in Blockchain Applications [16.7]
ゼロ知識証明(ZKP)は、現代のブロックチェーンシステムのスケーラビリティ問題に対処するための、有望なソリューションとして登場した。本研究では,暗号ハッシュの計算完全性を保証するため,ZKPの生成と検証を行う手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:19:01 GMT)
uDistil-Whisper: Label-Free Data Filtering for Knowledge Distillation via Large-Scale Pseudo Labelling [16.7]
ラベル付きデータを使わずに比較的小さなモデルにWhisperモデルを蒸留可能であることを示す。私たちのモデルは、教師モデルと同等以上の性能を維持しながら、計算とメモリ効率が25～50%向上しています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:54:08 GMT)
Codec-ASR: Training Performant Automatic Speech Recognition Systems with Discrete Speech Representations [16.6]
本稿では、離散符号を用いたASRシステム構築に関する総合的な分析を行う。本稿では,量子化スキームや時間領域,スペクトル特徴符号化などの異なる手法について検討する。同様のビットレートでEncodecを上回るパイプラインを導入する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:51:41 GMT)
LANE: Logic Alignment of Non-tuning Large Language Models and Online Recommendation Systems for Explainable Reason Generation [16.0]
大きな言語モデル(LLM)を活用することで、包括的なレコメンデーションロジック生成の新しい機会を提供する。レコメンデーションタスクのための微調整LDMモデルは、計算コストと既存のシステムとのアライメントの問題を引き起こす。本研究は,LLMとオンラインレコメンデーションシステムとの連携を,LLMのチューニングを伴わない効果的戦略LANEを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:20:31 GMT)
LoRA-Guard: Parameter-Efficient Guardrail Adaptation for Content Moderation of Large Language Models [15.9]
大規模言語モデル(LLM)のコンテンツモデレーションのための安全アライメントの代替としてガードレールが登場した。 LLMとガードレールモデル間の知識共有に依存するパラメータ効率の高いガードレール適応法であるLoRA-Guardを導入する。 LoRA-Guardは100-1000倍のパラメータオーバヘッドで既存の手法より優れ、精度を保ちながらオンデバイスコンテンツのモデレーションを実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:38:40 GMT)
Solving Motion Planning Tasks with a Scalable Generative Model [15.9]
本稿では,運転シーンのダイナミクスを学習する生成モデルに基づく効率的な解を提案する。我々の革新的なデザインは、モデルがフルオートレグレッシブモードとパーシャルオートレグレッシブモードの両方で動作できるようにする。提案した生成モデルは,様々な動作計画タスクの基盤となる可能性がある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:57:05 GMT)
Differential Encoding for Improved Representation Learning over Graphs [15.8]
メッセージパッシングパラダイムとグローバルアテンションメカニズムは、基本的にノードの埋め込みを生成する。支配的な情報がノード自身からなのか、あるいはノードの隣人からなのかは不明だ。本稿では,失った情報の問題に対処する差分符号化手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:23:33 GMT)
General Communication Enhancement via the Quantum Switch [15.8]
我々は$mathcalP_n>0$が、量子$tt SWITCH$による通信強化に必要な条件であり、十分な条件であると予想する。次に、BB84チャネルのプライベートキャパシティを高める量子$tt SWITCH$を含む通信プロトコルを定式化する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:47:13 GMT)
Temperature-scaling surprisal estimates improve fit to human reading times -- but does it do so for the "right reasons"? [15.8]
大規模な言語モデルのキャリブレーションは,通常モデルサイズによって改善されることを示す。温度スケーリングの確率は、読み取り時間に体系的に適合することがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:12:32 GMT)
Parm: Efficient Training of Large Sparsely-Activated Models with Dedicated Schedules [15.7]
本稿では,MP+EP+ESP学習を高速化するParmを提案する。 Parmは、1.13$times$から5.77$times$のスピードアップを実現し、1296年に手動で設定されたMoEレイヤと、2つの現実世界のMoEモデルで約3$times$の改善を行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:51:11 GMT)
ITEM: Improving Training and Evaluation of Message-Passing based GNNs for top-k recommendation [15.6]
グラフニューラルネットワーク(GNN)はトップkレコメンデーションタスクで注目されている。 GNNは、NDCG@kやRecall@kといったランキングベースのメトリクスで評価される。評価指標を直接最適化するためのランキング損失関数の利用について検討する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:35:23 GMT)
Analytic Convolutional Layer: A Step to Analytic Neural Network [15.6]
ACL(Analytic Convolutional Layer)は、分析的畳み込みカーネル(ACK)と従来の畳み込みカーネルのモザイクである。 ACLはニューラルネットワーク解釈の手段を提供するので、ニューラルネットワークの固有の解釈可能性の道を開くことができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:10:54 GMT)
The Role of Privacy Guarantees in Voluntary Donation of Private Data for Altruistic Goals [15.5]
本研究は,4つのプライバシ保証の下で新たな治療法の開発に医療データを寄付する意思について,ヴィグネット調査を実施している。以上の結果から,収集データの種類がプライバシの期待に強く影響していることが判明した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:50:48 GMT)
Non-Adversarial Learning: Vector-Quantized Common Latent Space for Multi-Sequence MRI [15.5]
本稿では,各列の離散表現を圧縮し,列間の共通潜在空間のガウス分布を推定する生成モデルを提案する。 BraTS2021データセットを用いた実験では、我々の非敵モデルは他のGANベースの手法よりも優れていた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:37:01 GMT)
EgoFlowNet: Non-Rigid Scene Flow from Point Clouds with Ego-Motion Support [15.1]
本稿では,オブジェクトをベースとした抽象化を必要とせず,弱い教師付きで訓練されたポイントレベルのシーンフロー推定ネットワークを提案する。提案手法は,エゴモーションとシーンフローの2つの並列分岐を暗黙的に駆動する二分分割マスクを推定する。現実的なKITTIのシーンでは,地上点の存在下では,EgoFlowNetは最先端の手法よりも優れた性能を示している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:53:50 GMT)
Instance Temperature Knowledge Distillation [15.1]
既存の学習方法は、学生ネットワークが様々な学習困難に適応できるように、動的に温度調整を行う。本稿では,温度調整を逐次意思決定タスクとして定式化し,強化学習に基づく手法を提案する。我々のフレームワークは、様々なKDメソッドに簡単に挿入できるプラグイン・アンド・プレイ技術として機能する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:17:26 GMT)
LMBF-Net: A Lightweight Multipath Bidirectional Focal Attention Network for Multifeatures Segmentation [15.1]
網膜疾患は、早期に診断や治療を受けなければ、両眼で不可逆的な視力喪失を引き起こす可能性がある。多くのラベルや属性で網膜画像をセグメント化するための現在のディープラーニング技術は、検出精度と一般性に乏しい。本稿では,多機能セグメンテーションのためのマルチパス畳み込みニューラルネットワークを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:37:09 GMT)
Smaug: Fixing Failure Modes of Preference Optimisation with DPO-Positive [15.1]
理論上、標準的なDPO損失は、モデルが好むサンプルの可能性を減少させる可能性があることを示す。 DPO-Positive (DPOP) は,この障害モードを回避する新しい損失関数とトレーニング手順である。意外なことに、DPOPはさまざまなデータセットや下流タスクでDPOやその他の微調整手順より優れています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:46:33 GMT)
Optimal thresholds and algorithms for a model of multi-modal learning in high dimensions [15.0]
本論文は,このモデルに対する近似メッセージパッシング(AMP)アルゴリズムを導出し,その性能を高次元限界で特徴づける。 AMPの線形化は、広く使われている部分最小二乗法(PLS)および正準相関解析法(CCA)と数値的に比較される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:48:23 GMT)
Spatio-Temporal Adaptive Diffusion Models for EEG Super-Resolution in Epilepsy Diagnosis [15.0]
HDデバイスは頭皮により多くの電極を配置することで脳波の空間分解能を向上させる。この技術は、高い取得コストや限られた使用量といった課題に直面している。本稿では,空間SR再構成を実現するために拡散モデルを用いた適応拡散モデルを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:26:31 GMT)
MLEM: Generative and Contrastive Learning as Distinct Modalities for Event Sequences [14.9]
本研究では,イベントシーケンスに対する自己教師付き学習手法の適用について検討する。これは、銀行、eコマース、ヘルスケアといった様々なアプリケーションにおいて重要なモダリティである。 MLEM(Multimodal-Learning Event Model)と呼ばれる新しい手法を開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:28:50 GMT)
Naturalistic Music Decoding from EEG Data via Latent Diffusion Models [14.9]
本研究は,非侵襲的脳波データを用いて,高品質な音楽再生を実現するための最初の試みである。我々は、パブリックなNMED-Tデータセットでモデルをトレーニングし、ニューラルネットワークベースのメトリクスを提案する定量的評価を行う。本研究は,脳波データを用いた複雑な聴覚情報再構成の実現可能性に関する知見を提供する,ニューラルデコーディングと脳-コンピュータインタフェースの継続的な研究に寄与する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:33:58 GMT)
Collaborative Quest Completion with LLM-driven Non-Player Characters in Minecraft [14.9]
我々はMinecraft内のミニゲームを設計し、プレイヤーは2台のGPT4駆動のNPCを使ってクエストを完了する。ゲームログと記録の分析において,NPCや人間プレイヤーから協調行動のパターンがいくつか出現していることが判明した。この予備的な研究と分析は、ゲームにおける協調的な役割のために、これらの急速に改善された生成AIモデルをうまく活用する方法を、将来のゲーム開発者に与えるだろうと考えている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:11:21 GMT)
Reinforcement Learning with Elastic Time Steps [14.8]
Multi-Objective Soft Elastic Actor-Critic (MOSEAC) は、弾性時間ステップを用いて制御周波数を動的に調整する非政治アクター批判アルゴリズムである。我々は,MOSEACが理論レベルで収束し,安定なポリシーを生成できることを示し,実時間3Dレースゲームにおける結果を検証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:31:18 GMT)
DyGPrompt: Learning Feature and Time Prompts on Dynamic Graphs [14.6]
動的グラフモデリングのための新しいフレームワークであるDyGPromptを提案する。まず,タスクの目的と,事前学習タスクと下流タスクの動的変動のギャップに対処する2つのプロンプトを設計する。第2に,ノードと時間の特徴が相互に特徴付けされていることを認識し,下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:06:07 GMT)
Reinforcement Learning for Sequence Design Leveraging Protein Language Models [14.5]
本稿では,タンパク質言語モデル(PLM)を報酬関数として利用し,新たな配列を生成することを提案する。我々はRLベースのアプローチをベンチマークするために、様々なシーケンス長に関する広範な実験を行う。生物学的妥当性とタンパク質の多様性に関する総合的な評価を行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:31:36 GMT)
How JEPA Avoids Noisy Features: The Implicit Bias of Deep Linear Self Distillation Networks [14.3]
データ表現の自己教師型学習には2つの競合パラダイムが存在する。 JEPA(Joint Embedding Predictive Architecture)は、意味的に類似した入力が互いに予測可能な表現に符号化されるアーキテクチャのクラスである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:43:12 GMT)
Sketch-Guided Constrained Decoding for Boosting Blackbox Large Language Models without Logit Access [14.3]
我々は,ブラックボックス大言語モデル(LLM)の制約付き復号法として,スケッチガイド付き制約付き復号法(SGCD)を導入する。 SGCDはブラックボックスLSMのロジットにアクセスすることなく動作する。閉情報抽出および選挙区解析における実験によるSGCDの有効性を実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:55:37 GMT)
Exploring the Capabilities of LLMs for Code Change Related Tasks [14.3]
大規模言語モデル(LLM)は、コードに関連するタスクにおいてその効果を示す。 LLMは2つのコードバージョンの違いよりも、一般的なコード構文とセマンティクスに重点を置いている。我々は,3つのコード変更関連タスクに対して,テキストグレーター1BパラメータLPMを用いた実証的研究を行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:49:18 GMT)
Improving Zero-shot Generalization of Learned Prompts via Unsupervised Knowledge Distillation [14.2]
より強力なモデルからの教師なし知識の蒸留に基づく学習を促す新しい手法を提案する。我々はKDPL(Knowledge Distillation Prompt Learning)と呼ぶアプローチを,既存の即興学習技術に統合することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:24:40 GMT)
LLMs' Classification Performance is Overclaimed [14.1]
AIや人間のために設計された多くの分類タスクでは、ゴールドラベルはデフォルトでラベル空間に含まれる。この標準設定は、伝統的に高度なAI、特に大規模言語モデル(LLM)の強力なパフォーマンスを強調してきた。本稿では, LLMの認識性能は, 課題の予測的理解を示すことができないため, 過度に評価されていることを論じる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:18:50 GMT)
VIVA: A Benchmark for Vision-Grounded Decision-Making with Human Values [14.1]
本稿では,人間のVAluによって駆動されるVsion-grounded decision-makingのベンチマークであるVIVAを紹介する。 Vilaには、さまざまな現実世界の状況と手動による注釈付き決定を描いている1,062のイメージが含まれている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:59:06 GMT)
Consistent Point Orientation for Manifold Surfaces via Boundary Integration [13.9]
我々は、多様体表面からサンプリングされた点雲に対して、大域的に一貫した正規値を生成するための新しいアプローチを導入する。提案手法は, ノイズ, 外れ値, 複雑なトポロジ, 細い構造に対する強靭性を示す, 最先端の手法より優れる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:40:21 GMT)
Federated Continual Learning Goes Online: Leveraging Uncertainty for Modality-Agnostic Class-Incremental Learning [13.9]
我々は,1回しか処理できないミニバッチのストリームに新しいデータが到着するオンラインシナリオに対処する,新しいモダリティに依存しないアプローチを提案する。特に,Bregman Information (BI) に基づく推定器を用いて,サンプルレベルでのモデルの分散を計算することを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:22:04 GMT)
Model Guidance via Explanations Turns Image Classifiers into Segmentation Models [13.9]
説明可能なAI手法による画像分類網の入力から生成した熱マップは、多くの場合、入力画像のセグメンテーションに類似している。ヒートマップは、画像レベルの監督を伴う弱い教師付きセグメンテーションを達成するためにも活用されている。差分型ヒートマップアーキテクチャは, 標準的なセグメンテーション損失のトレーニングにおいて, 競争力のある結果が得られることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:10:23 GMT)
Semi-Supervised Semantic Segmentation via Marginal Contextual Information [13.7]
半教師付きセマンティックセグメンテーションにおける擬似ラベルを強化する新しい信頼度向上手法を提案する。 S4MCと命名された本手法は,擬似ラベルの品質を維持しつつ,トレーニング中に使用するラベルなしデータの量を増加させる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:58:22 GMT)
UFRec: Integrating Uniformity and Frequency to Enhance Sequential Recommendations [13.7]
逐次レコメンデーションのための革新的な双方向拡張手法であるUFRecを紹介する。 UFRecは、シーケンスの均一性とアイテム頻度を利用してパフォーマンスを向上し、特に一様でないシーケンスと低い頻度のアイテムの表現を改善している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:32:34 GMT)
Evaluation of Retrieval-Augmented Generation: A Survey [13.6]
本稿では,Retrieval-Augmented Generation (RAG)システムの評価とベンチマークについて概観する。具体的には、検索・生成要素の定量化指標(関連性、正確性、忠実性など)について検討・比較する。次に、様々なデータセットとメトリクスを分析し、現在のベンチマークの限界について議論し、RAGベンチマークの分野を前進させる潜在的な方向性を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:59:32 GMT)
How and Why LLMs Use Deprecated APIs in Code Completion? An Empirical Study [13.6]
大規模言語モデル(LLM)では、ライブラリの迅速かつ継続的な進化のために、コード補完は、正しく最新のアプリケーションプログラミングインタフェース(API)を使用するのに苦労する可能性がある。この研究には、7つの高度なLLM、人気のあるPythonライブラリの145のAPIマッピング、28125の補完プロンプトが含まれていた。我々は,textscReplaceAPI と textscInsertPrompt の2つの軽量固定手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:37:04 GMT)
Enhancing Translation Accuracy of Large Language Models through Continual Pre-Training on Parallel Data [13.6]
本稿では,並列データに対して,事前学習された大規模言語モデルを継続的に事前学習する2相学習手法を提案する。日本語と英語と日本語の13種類のテストセットを用いて,これらの手法の評価を行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:23:36 GMT)
LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control [13.6]
Portrait Animationは、単一のソースイメージからビデオを合成し、それを外観参照として使用し、駆動ビデオ、オーディオ、テキスト、または生成から派生したモーションで合成することを目的としている。我々はLivePortraitというビデオ駆動のポートレート・アニメーション・フレームワークを開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:41:39 GMT)
Images Speak Louder than Words: Understanding and Mitigating Bias in Vision-Language Model from a Causal Mediation Perspective [13.5]
広範囲なデータセットで事前訓練された視覚言語モデルは、性情報とオブジェクトやシナリオを関連付けることによって、必然的にバイアスを学習することができる。本稿では,因果媒介分析を取り入れた枠組みを提案し,バイアス発生と伝播の経路を計測・マッピングする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:19:45 GMT)
The More the Merrier? Navigating Accuracy vs. Energy Efficiency Design Trade-Offs in Ensemble Learning Systems [13.5]
我々は,精度とエネルギー消費のトレードオフの可能性について,アンサンブル学習のための3種類の設計判断を分析した。我々はJの精度(F1スコア)とエネルギー消費(トレーニングと推論の両方)を測定した。私たちは、サブセットベースのトレーニング、多数決投票、決定木、ネイブベイズ、KNNのようなエネルギー効率の良いMLアルゴリズムを使用して、小さな(最大3モデルまたは2モデル)アンサンブルを設計することを推奨します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:45:17 GMT)
Representation learning with CGAN for casual inference [13.5]
因果推論のためのCGANを用いた条件表現学習についてはほとんど研究されていない。本稿では,敵対的アイデアを取り入れた表現学習関数の探索手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:51:57 GMT)
Probing Perfection: The Relentless Art of Meddling for Pulmonary Airway Segmentation from HRCT via a Human-AI Collaboration Based Active Learning Method [13.4]
肺気管分節症では, 注記データの不足が主訴である。ディープラーニング(DL)メソッドは、'ブラックボックス'モデルの不透明さとパフォーマンス向上の必要性という課題に直面します。多様なクエリ戦略とさまざまなDLモデルを組み合わせることで、これらの課題に対処する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:27:53 GMT)
Estimating Treatment Effects under Recommender Interference: A Structured Neural Networks Approach [13.2]
標準差分推定器は、推奨者干渉による偏差推定を導出できることを示す。本稿では,処理項目と制御項目の両方を含むプールからどのアイテムが露出するかを記述した「レコメンダ選択モデル」を提案する。提案した推定器はベンチマークに匹敵する結果が得られるのに対し,標準差分推定器は有意なバイアスを示し,また逆の兆候も生み出すことを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:40:49 GMT)
Memory Kernel Coupling Theory: Obtain Time Correlation Function from Higher-order Moments [13.1]
このレターは、時間相関関数(TCF)を評価する一般的な形式であるメモリカーネル結合理論(MKCT)を提示する。補助核の急激な崩壊により、結合した運動方程式を高精度に切り離すことができる。この定式化は一般的なものであるが、典型的な開量子系(スピンボソンモデル)の数値的な実演を行う。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:04:36 GMT)
$L_p$-norm Distortion-Efficient Adversarial Attack [13.0]
現在の攻撃法は、$L$-norm、$L$-norm、$L_infty$-normの歪みの1つしか考慮していない。我々は、最小の$L$-normを所有するだけでなく、$L_infty$-normの歪みを著しく低減する、新しい$L_p$-norm歪み効率逆攻撃を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:00:33 GMT)
Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models [12.9]
本稿では,ストーリ生成のセマンティック一貫性と時間的一貫性を高めるために,リッチコンテキスト拡散モデル(RCDM)を提案する。 RCDMは、自動回帰モデルと比較して、1つの前方推論で一貫したストーリーを生成することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:17:01 GMT)
Out-of-distribution Detection in Medical Image Analysis: A survey [12.8]
コンピュータ支援診断は、ディープラーニングベースのコンピュータビジョン技術の発展の恩恵を受けている。従来の教師付きディープラーニング手法は、テストサンプルがトレーニングデータと同じ分布から引き出されることを前提としている。実際の臨床シナリオでは分布外のサンプルに遭遇し、深層学習に基づく医用画像解析タスクにおいてサイレント障害を引き起こす可能性がある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:59:57 GMT)
Warm-up Free Policy Optimization: Improved Regret in Linear Markov Decision Processes [12.8]
ポリシー最適化(PO)手法は、実際に最も人気のある強化学習(RL)アルゴリズムの一つである。本稿では,線形マルコフ決定過程 (MDP) モデルに基づくPOアルゴリズムを提案する。我々のアルゴリズムは、問題の他のパラメータへの依存性を改善して後悔する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:36:24 GMT)
Deconvolving Complex Neuronal Networks into Interpretable Task-Specific Connectomes [12.8]
タスク特異的機能MRI(fMRI)画像は、認知過程の神経基盤を研究する上で優れたモダリティを提供する。我々は、fMRIデータを用いて、タスク固有の集約ニューロンネットワークを、標準ネットワークと呼ばれる基本的なビルディングブロックの集合に分解する問題を定式化し、解決する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:37:54 GMT)
Multi-Agent Probabilistic Ensembles with Trajectory Sampling for Connected Autonomous Vehicles [12.7]
軌道サンプリングMA-PETSを用いた分散マルチエージェント確率アンサンブルを提案する。特に、未知環境の不確実性をよりよく捉えるために、MA-PETSは確率的アンサンブルニューラルネットワークを利用する。 MFBLに匹敵する試料効率でMA-PETSの優位性を実証的に実証した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:54:58 GMT)
Context-Aware Video Instance Segmentation [12.7]
本稿では,コンテキスト対応型ビデオインスタンス(CAVIS)について紹介する。本研究では、コンテキスト認識型インスタンス追跡装置(CAIT)を提案する。これは、インスタンスを取り巻くコンテキストデータをコアインスタンス機能とマージすることで、トラッキング精度を向上させる。また,PCC(Prototypeal Cross-frame Contrastive)ロスを導入し,フレーム間のオブジェクトレベルの特徴の整合性を確保する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:11:16 GMT)
Towards Efficient and Optimal Covariance-Adaptive Algorithms for Combinatorial Semi-Bandits [12.7]
プレイヤーが$d$ベースアイテムを含むセットのパワーセットから$P$アクションの中から選択する半帯域の問題に対処する。提案手法は半帯域フィードバックを効果的に活用し,帯域フィードバックアプローチより優れていることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:29:43 GMT)
GMM-ResNext: Combining Generative and Discriminative Models for Speaker Verification [12.6]
話者検証のためのGMM-ResNextモデルを提案する。 2つの性関連GMMに基づく2経路GMM-ResNextモデルも提案されている。提案されたGMM-ResNextは、VoxCeleb1-OテストセットのResNet34とECAPA-TDNNと比較して、EERの48.1%と11.3%の相対的な改善を実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:14:18 GMT)
Mixture-of-Experts for Open Set Domain Adaptation: A Dual-Space Detection Approach [12.6]
Open Set Domain Adaptation (OSDA)は、ソースとターゲットドメイン間の分散とラベルシフトに同時に対処することを目的としている。画像特徴空間とルーティング特徴空間の不整合を利用して未知のクラスサンプルをしきい値なしで検出するDual-Space Detectionを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:51:56 GMT)
Contrast then Memorize: Semantic Neighbor Retrieval-Enhanced Inductive Multimodal Knowledge Graph Completion [12.5]
マルチモーダル知識グラフ補完(MKGC)は、MKGの欠落するリンクを予測するために多くの研究がなされている。既存の帰納的アプローチは、視覚的モダリティにおいてリッチな意味情報を無視するテキストエンティティ表現の学習に重点を置いている。本稿では, セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティクス(IMKGC) フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:31:33 GMT)
ArchesWeather: An efficient AI weather forecasting model at 1.5° resolution [12.4]
そこで,Pangu-Weatherの3次元局所処理は計算的に準最適であることを示す。 2次元アテンションとカラムワイズアテンションに基づく特徴相互作用モジュールを組み合わせたトランスフォーマーモデルArchesWeatherを設計する。 ArchesWeatherは1.5degの解像度と24hのリードタイムでトレーニングされている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:39:58 GMT)
Explainable AI for Safe and Trustworthy Autonomous Driving: A Systematic Review [12.4]
本稿では,安全かつ信頼性の高い自動運転のための説明可能な手法に関する,最初の体系的な文献レビューを紹介する。我々は、ADにおける安全で信頼性の高いAIに対するXAIの5つの重要な貢献を特定し、それらは解釈可能な設計、解釈可能な代理モデル、解釈可能なモニタリング、補助的な説明、解釈可能な検証である。我々は、これらのコントリビューションを統合するためにSafeXと呼ばれるモジュラーフレームワークを提案し、同時にAIモデルの安全性を確保しながら、ユーザへの説明提供を可能にした。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:31:45 GMT)
Vertex Exchange Method for a Class of Quadratic Programming Problems [12.3]
一般化された単純点への射影を計算するための高効率半平滑なニュートン法を提案し,解析する。提案アルゴリズムの優れた実用性能は, 広範囲な数値実験によって実証された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:28:17 GMT)
AgentInstruct: Toward Generative Teaching with Agentic Flows [12.2]
我々は、ポストトレーニングに合成データを使うこと、特に、他のモデルに新しいスキルや振る舞いを教えるために、強力なモデルでデータを作成することに重点を置いている。本稿では,多種多様な高品質な合成データを自動生成するエージェントフレームワークであるAgentInstructを紹介する。テキスト編集,創造的執筆,ツール使用,コーディング,理解の理解など,さまざまなスキルを学習するための,2500万対のポストトレーニングデータセットを作成することで,AgentInstructの有用性を実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:01:12 GMT)
Entanglement-assisted authenticated BB84 protocol [11.8]
この作業は、最大絡み合ったペアの機能を利用する、新しいユーザサーバ認証手順を提供する。我々は、よく知られたBB84量子通信プロトコルにそれを組み込むのに便利な設計の特徴を活用している。ユーザサーバ認証プロトコルの現実的なシミュレーションは,送信とストレージの両方にノイズモデルを用いることで実現されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:05:27 GMT)
Hierarchical Tree-structured Knowledge Graph For Academic Insight Survey [11.6]
調査は、研究トレーニングを欠いている初心者研究者にとって、常に課題となっている。本研究は,階層的な木構造知識グラフを確立することにより,初心者研究者を対象とした研究インサイトサーベイを支援することを目的とする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:34:52 GMT)
Self-Supervised Detection of Perfect and Partial Input-Dependent Symmetries [11.5]
群の同値性は、群の対称性がデータで観測されたものと異なる場合、過度にモデルを制約することができる。本稿では,ラベルを使わずに各入力の対称性のレベルを検出する手法を提案する。我々のフレームワークは、連続分布と離散対称性分布の両方の異なる族に対応するのに十分である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:15:51 GMT)
Comics Datasets Framework: Mix of Comics datasets for detection benchmarking [11.5]
メディアとしてのコミックは、しばしば現実の視覚と異なるスタイルでテキストとイメージを独自に組み合わせている。漫画の計算研究は、基本的な物体検出から、より洗練されたタスクへと進化してきた。我々は、データセット間でアノテーションを標準化し、さまざまなコミックスタイルをデータセットに導入し、明確でレプリケート可能な設定でベンチマーク結果を確立することを目指している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:07:57 GMT)
Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba [11.4]
イベントカメラは、最小限の電力を消費しながら、低レイテンシで高ダイナミックレンジで環境光の変化を効率的に検出する。イベントデータを処理する現在のアプローチでは、フレームベースの表現に変換することが多い。 Point Cloudは3D処理の一般的な表現であり、イベントカメラのスパースと非同期性に適合するのに適している。提案するEventMambaは,最先端(SOTA)のフレームベース手法と比較しても,競合的な結果が得られる,効率的かつ効果的なPoint Cloudフレームワークである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:17:06 GMT)
Biomechanics-informed Non-rigid Medical Image Registration and its Inverse Material Property Estimation with Linear and Nonlinear Elasticity [11.4]
本稿では,生体力学的制約のない医用画像登録と軟組織材料特性の正確な同定を物理インフォームドニューラルネットワーク(PINN)を用いて検討する。複素非線形弾性理論を利用して、満たすべき生体力学的制約の物理法則を表す偏微分方程式(PDE)を正式に確立する。前立腺癌生検の臨床例から、変形しないMRI画像と変形したMR画像のペアを用いて、2つの実験が実施された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:26:07 GMT)
On the Client Preference of LLM Fine-tuning in Federated Learning [11.4]
人間のフィードバックによる強化学習(RLHF)は、好みのデータセットを用いて事前訓練された大規模言語モデル(LLM)を微調整する。提案するFedBisを用いて、クライアントが好みのデータセットでバイナリセレクタを協調的にトレーニングする実行可能なフレームワークを提案する。我々はまた、クライアントを好みに応じてバランスの取れたクラスタに整理し、複数のセレクタを訓練する新しいアルゴリズムであるFedBiscuitを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:02:24 GMT)
Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization [11.3]
セキュアなマルチパーティ計算に基づく意思決定ツリーのためのマルチパーティトレーニングフレームワークにより、複数のパーティが、プライバシ保護を備えた分散プライベートデータ上で、高性能モデルをトレーニングすることができる。決定木のための既存のマルチパーティトレーニングフレームワークは、通信オーバーヘッドが大きいため、コミュニケーションの非効率性を実証する。本稿では,コミュニケーション最適化による意思決定木のための効率的な3要素学習フレームワークであるEntsを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:01:42 GMT)
BeNeRF: Neural Radiance Fields from a Single Blurry Image and Event Stream [11.2]
一つのぼやけた画像とそれに対応するイベントストリームからニューラル放射場(NeRF)を復元する可能性を示す。本手法は暗黙的なニューラルシーンの表現を共同で学習し,カメラの動きを復元する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:17:05 GMT)
Learning Disentangled Representation in Object-Centric Models for Visual Dynamics Prediction via Transformers [11.2]
最近の研究は、オブジェクト中心の表現が学習力学の精度を大幅に向上させることを示した。対象中心モデルにおける視覚力学予測の精度をさらに向上することは可能か? 我々は、オブジェクトが持つ可能性のある属性の種類について、具体的な仮定をすることなく、静的なイメージ citepnsb の場合のこのような非絡み合い表現を学習しようと試みる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:43:54 GMT)
PaPr: Training-Free One-Step Patch Pruning with Lightweight ConvNets for Faster Inference [11.1]
PaPrは、軽量なConvNetを使用して、最小限の精度で冗長なパッチを実質的に刈り取る方法である。 FLOPカウントの低減に類似した、最先端のパッチリダクション法よりもはるかに高い精度を実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:21:18 GMT)
Feature-Specific Coefficients of Determination in Tree Ensembles [11.0]
ツリーアンサンブル法は、解釈が難しいモデルで予測を期待できる。最近のShapley値の導入は、予測された値に対する高速な計算アルゴリズムを伴って、興味をそそる結果を示している。本稿では,2次損失に関するShapley値を計算する際に,計算複雑性を時間に短縮する効率的なアルゴリズムQ-SHAPを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:27:29 GMT)
Large language models, physics-based modeling, experimental measurements: the trinity of data-scarce learning of polymer properties [11.0]
大規模言語モデル(LLM)は、評価、分析、設計のための高速で正確な物質モデリングパラダイムとして約束される。データ不足の病理に対処する物理ベースのトレーニングパイプラインを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:57:40 GMT)
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation [10.9]
AIoT技術は現代の養鶏経営において重要なトレンドとなり、農業作業の最適化と人的ワークロード削減の可能性を秘めている。本稿では,エッジAI機能付きCMOSセンサを備えた軽量でインテリジェントなカメラを用いて,ニワトリとその健康状態を特定するための,リアルタイムかつコンパクトなエッジAI対応検出器を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:21:07 GMT)
Prompt Engineering a Prompt Engineer [10.8]
我々は,大規模な言語モデルをメタプロンプトで自動プロンプトエンジニアリングを行うことができると主張している。このギャップを、詳細な説明、コンテキスト仕様、ステップバイステップの推論テンプレートという、メタプロンプトの3つの重要なコンポーネントに注入することで埋めます。 PE2と呼ばれるこの手法は、様々な言語タスクにまたがる優れた汎用性を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:29:20 GMT)
Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning [10.7]
我々は,大規模言語モデルの観点から,テキストからテキストへのセマンティックパーシングに注目した。商用データベースのスキーマのサイズとビジネスインテリジェンスソリューションの展開性に関する課題から,入力データベース情報を動的に取得するアプローチを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:55:14 GMT)
Fairness-aware Federated Minimax Optimization with Convergence Guarantee [10.7]
フェデレートラーニング(FL)はそのプライバシー保護機能のためにかなりの注目を集めている。ユーザデータ管理の自由の欠如は、モデルが人種や性別などのセンシティブな要因に偏っている、グループフェアネスの問題につながる可能性がある。本稿では,FLにおけるグループフェアネス問題に明示的に対処するために,拡張ラグランジアン法(FFALM)を用いたフェアフェデレーション平均化アルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:02:07 GMT)
PRD: Peer Rank and Discussion Improve Large Language Model based Evaluations [10.7]
現代の大規模言語モデル(LLM)は、自動評価と比較が難しい。本稿では,全ての解答対に対するLLMのペアワイズ選好を考慮に入れたピアランク(PR)アルゴリズムを提案する。我々のアプローチは高い精度を実現し、人間の判断とよく一致していることがわかりました。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:34:03 GMT)
Model-Enhanced LLM-Driven VUI Testing of VPA Apps [10.5]
モデル強化型大規模言語モデル(LLM)駆動型VUIテストフレームワークであるElevateを紹介した。これは、最先端のテスタであるVitasに対して、4000の現実世界のAlexaスキルでベンチマークされている。あらゆる種類のアプリでVitaよりも15%高いステートスペースカバレッジを実現しており、効率が大幅に向上している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:36:05 GMT)
Strong-to-Weak Spontaneous Symmetry Breaking in Mixed Quantum States [10.4]
我々は、(固定対称性の電荷を持つ)正準アンサンブルにおける非零温度の熱状態は、自発的に強い対称性を破るべきであることを示した。我々は、(固定対称性の電荷を持つ)正準アンサンブルにおける非零温度の熱状態は、自発的に強い対称性を破るべきであると論じる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:04:25 GMT)
Geometrically Local Quantum and Classical Codes from Subdivision [10.4]
幾何学的に局所的な量子符号は$mathbbRD$内の誤り訂正符号であり、チェックは固定空間距離内の量子ビットにのみ作用する。最近、Portnoyはコードによってポリログまでの最適な寸法と距離を達成し、大きなブレークスルーを遂げた。本稿では、このステップを回避し、優れた量子低密度パリティチェック符号、バランスの取れた積符号の族が自然に2次元構造を持つことに気づき、構成を合理化する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:14:03 GMT)
Dielectric Fano Nanoantennas for Enabling Sub-Nanosecond Lifetimes in NV-based Single Photon Emitters [10.3]
誘電体ナノアンテナはプラズモンよりも強い発光増強を提供する。界面エミッタはパーセル増強係数が10、サブns発光寿命が9、偏光コントラストが9である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:15:59 GMT)
Understanding the Expressive Power and Mechanisms of Transformer for Sequence Modeling [10.2]
ドット積自己注意などのトランスフォーマーの異なる成分が表現力に影響を及ぼすメカニズムについて検討する。本研究では,トランスフォーマーにおける臨界パラメータの役割を明らかにする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:23:24 GMT)
A subpolynomial-time algorithm for the free energy of one-dimensional quantum systems in the thermodynamic limit [10.2]
局所的, 翻訳的, 1次元量子系の自由エネルギーを近似する古典的アルゴリズムを導入する。我々のアルゴリズムは、任意の温度$T > 0のサブポリノミカル時間で実行される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:41:37 GMT)
Multi-agent Reinforcement Learning: A Comprehensive Survey [10.2]
マルチエージェントシステム(MAS)は、多くの現実世界のアプリケーションにおいて広く普及し、重要な存在である。汎用性にもかかわらず、MASにおける知的意思決定エージェントの開発は、その効果的な実装にいくつかのオープンな課題を提起している。本調査は,ゲーム理論(GT)と機械学習(ML)による基礎概念の研究に重点を置いて,これらの課題を考察する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:27:14 GMT)
Venomancer: Towards Imperceptible and Target-on-Demand Backdoor Attacks in Federated Learning [10.1]
本稿では,効果的なバックドア攻撃であるVenomancerを提案する。具体的には、視覚的損失関数を用いて、毒データを元のデータと視覚的に区別できるようにする。実験の結果,Norm ClippingやWak DP,Krum,Multi-Krumといった最先端の防御に対して堅牢であることがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:22:51 GMT)
An Uncertainty-guided Tiered Self-training Framework for Active Source-free Domain Adaptation in Prostate Segmentation [10.1]
Source-free Domain Adaptation (SFDA)は、プライバシとセキュリティ上の問題に対処するために、深いセグメンテーションモデルを適用するための有望なテクニックである。安定したドメイン適応を実現するための新しい不確実性誘導型自己学習(UGTST)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:13:16 GMT)
VITS : Variational Inference Thompson Sampling for contextual bandits [10.0]
我々は、文脈的帯域幅に対するトンプソンサンプリング(TS)アルゴリズムの変種を導入・解析する。ガウス変分推論に基づく新しいアルゴリズムであるValational Inference Thompson sample VITSを提案する。我々は,VITS が線形文脈帯域に対して従来の TS の次元とラウンド数で同じ順序のサブ線形後悔境界を達成することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:53:13 GMT)
Strategies for Arabic Readability Modeling [10.0]
自動可読性評価は、教育、コンテンツ分析、アクセシビリティのためのNLPアプリケーションの構築に関係している。本稿では,アラビア可読性評価に関する実験結果について,多種多様なアプローチを用いて述べる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:54:11 GMT)
Federated Learning for Zero-Day Attack Detection in 5G and Beyond V2X Networks [9.9]
Connected and Automated Vehicles(CAV)は、5GおよびBeyondネットワーク(5GB)上にあり、セキュリティとプライバシ攻撃のベクトルの増加に対して脆弱である。本稿では,ネットワークトラフィックパターンのみに依存する攻撃を検知するディープ・オートエンコーダ法を利用した新しい検出機構を提案する。連合学習を用いて、提案した侵入検知システムは、CAVのプライバシーを維持し、通信オーバーヘッドを最小限に抑えながら、大規模で多様なネットワークトラフィックで訓練することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:42:31 GMT)
Speaker- and Text-Independent Estimation of Articulatory Movements and Phoneme Alignments from Speech [9.8]
本稿では,従来別々に扱われていたAAIとPTAの動作推定という2つのタスクの組み合わせを紹介する。我々はこの共同作業を音響音素-調音音声インバージョン(APTAI)と呼ぶ。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:13:04 GMT)
When Benchmarks are Targets: Revealing the Sensitivity of Large Language Model Leaderboards [9.8]
既存のリーダーボードでは,LLMの相対的な性能は細部まで非常に敏感であることが示されている。一般的なマルチチョイス質問ベンチマーク(MMLUなど)では、選択の順序や解答の選択方法の変更など、ベンチマークに対する小さな摂動が最大8位までランクが変更されることが示されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:20:43 GMT)
CRUISE on Quantum Computing for Feature Selection in Recommender Systems [9.7]
我々は、推奨アルゴリズムにおける特徴選択問題に対処するためにQuantum Annealersを使用します。対実解析を取り入れることで、項目ベースKNN推薦アルゴリズムの性能を大幅に改善する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:34:56 GMT)
SOAF: Scene Occlusion-aware Neural Acoustic Field [9.7]
そこで我々は,Scene Occlusion-aware Acoustic Field (SOAF) と呼ばれる新しい手法を提案する。提案手法は,距離対応パラメトリック音波伝搬モデルを用いた音場に先行する手法である。そこで我々は、Fibonacci Sphereを用いて、受信機を中心にした局所音場から特徴を抽出し、新しい視聴のための音声を生成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:24:37 GMT)
Multi-Task Decision-Making for Multi-User 360 Video Processing over Wireless Networks [9.6]
無線マルチユーザーバーチャルリアリティ(VR)システムにおいて,360度ビデオ処理におけるマルチタスク決定問題について検討する。これはデータボリュームと帯域幅の増大を犠牲にしている。本稿では,ビデオフレーム間の再バッファリング時間と品質変化がユーザおよびビデオ要求に依存する,制約付きクオリティ・オブ・エクスペリエンス(QoE)問題を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:09:25 GMT)
Attention Incorporated Network for Sharing Low-rank, Image and K-space Information during MR Image Reconstruction to Achieve Single Breath-hold Cardiac Cine Imaging [9.5]
我々は,MRI再構成のための新しい深層学習ネットワークに,低ランク,画像,k空間を含む複数の領域からの情報を埋め込むことを提案する。 A-LIKNetは並列ブランチ構造を採用し、k空間と画像領域で独立した学習を可能にする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:54:43 GMT)
Holistic view of the road transportation system based on real-time data sharing mechanism [9.5]
本稿では,リアルタイム共有機構に基づく道路交通システムの時空グローバルビューを構築する。道路利用者と管理者の両方が、近くの車両の運転意図や道路インフラのリアルタイム状態にタイムリーにアクセスできる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:10:05 GMT)
Learnability in Online Kernel Selection with Memory Constraint via Data-dependent Regret Analysis [9.5]
本稿では,オンライン学習可能性,メモリ制約,データ複雑性の関連性を示す。本稿では,2種類の損失関数に対してデータ依存上界を与えるアルゴリズムフレームワークを提案する。以上の結果から,2つのデータ複雑度が線形である場合,小さなメモリ制約内で学習が可能であることが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:42:46 GMT)
Joint Optimization of Resource Allocation and Data Selection for Fast and Cost-Efficient Federated Edge Learning [9.5]
FEEL(FEEL)を導入したワイヤレスエッジでの学習本稿では,効率的なシステム,連合型共同資源割り当てとデータ選択を提案する。共同資源配分とデータ選択という提案手法の優位性を検証した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:03:59 GMT)
Towards a Scalable Reference-Free Evaluation of Generative Models [9.3]
本稿では、VENDIとRKEのエントロピースコアを推定するためのカーネルエントロピー近似(FKEA)法を提案する。我々は、FKEAの数値性能を、標準画像、テキスト、ビデオデータセットに適用して広範囲に評価する。実験結果から,大規模生成モデルに適用する手法のスケーラビリティと解釈可能性を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:54:58 GMT)
Exploiting Dialect Identification in Automatic Dialectal Text Normalization [9.3]
我々は、方言アラビア語を標準オーソグラフィー(CODA)に標準化することを目指している。我々はCODAフィケーションのタスクに基づいて,新たに開発されたシーケンス・ツー・シーケンスのモデルをベンチマークした。方言識別情報を使用することで,すべての方言のパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:30:03 GMT)
What's color got to do with it? Face recognition in grayscale [9.3]
最先端のディープCNNフェイスマーカは通常、カラーフェイスイメージの広範なトレーニングセットを使用して作成される。本研究は、トレーニングセットのグレースケールまたはカラーバージョンでトレーニングした場合、そのようなマーカがほぼ同一の精度に達することを明らかにした。より浅いモデルは、複雑な表現をモデル化する能力に欠けており、色に関連するような低レベルの特徴に強く依存している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:43:41 GMT)
Universal Gloss-level Representation for Gloss-free Sign Language Translation and Production [9.1]
Universal Gloss-level Representation (UniGloR)は手話翻訳と手話生成のための統一的で自己指導型のソリューションである。本結果は,UniGloRの翻訳および生産における有効性を示すものである。本研究は, 自己指導型学習を統一的に実現し, 革新的かつ実践的な応用の道を開くことを示唆する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:12:36 GMT)
PII-Compass: Guiding LLM training data extraction prompts towards the target PII via grounding [9.0]
ドメイン内データを用いて手作業で構築した抽出プロンプトを接地することで,個人識別情報(PII)の抽出性を向上させることができることを示す。提案手法は,1,128,128,2308問合せでそれぞれ0.92%,3.9%,6.86%のPII電話番号抽出率,すなわち15人に15人の電話番号を抽出可能である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:20:04 GMT)
Self-Cooperation Knowledge Distillation for Novel Class Discovery [9.0]
新たなクラス発見(NCD)は、既知のクラスについて既に学んだ知識を活用することで、ラベルのないセットで未知のクラスと新しいクラスを発見することを目的としている。本研究では, 自己協調的知識蒸留法 (SCKD) を提案し, 各トレーニングサンプル(既知の, 新規, ラベル付, ラベル付, 未ラベル) を, レビューと発見の両方に活用する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:51:09 GMT)
ESBMC-Python: A Bounded Model Checker for Python Programs [9.0]
本稿では,Pythonプログラムの検証ツールを紹介する。入力プログラムを抽象構文木に変換し、型情報を推論し追加する。この記述を、満足度モジュラー理論の解法を用いて評価された公式に変換する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:38:14 GMT)
Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment [8.9]
量子化対応直接選好最適化(QDPO)は、量子化大言語モデル(LLM)の会話能力を改善する各種言語における2つの命令調整LDMにおいて,QDPOは,既存のPTQや知識蒸留細調整技術と比較して,会話能力の向上に優れた性能を示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:19:06 GMT)
Automatic gradient descent with generalized Newton's method [8.9]
本稿では,SGDやAdamなどのトピックに適用可能なヘシアンインフォームドアプローチを提案する。本手法は,収束を加速する学習率を自動的に動的に選択する。実際にoutメソッドは、計算オーバーヘッドがほとんどゼロのフォワードパスのみを必要とするため、実装が容易である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:01:43 GMT)
YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [8.8]
従来の溶解度予測技術は、しばしば分子トラクチャーの複雑な性質を捉えるのに失敗し、予測と実際の結果の間に顕著な違いをもたらす。本研究では,注目に基づくトランスフォーマー,Long Short-Term Memory(LSTM)ネットワーク,GCN(Graph Convolutional Networks)を組み合わせた新しいディープラーニングフレームワークを提案する。本手法は,0.55の相関係数(R2$)と0.59のルート平均角誤差(RMSE)を達成し,ベンチマークモデルのスコア(R2$)と0.61(RMSE)を上回った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:12:02 GMT)
Fine-Grained Scene Image Classification with Modality-Agnostic Adapter [8.8]
MAA(Modality-Agnostic Adapter)と呼ばれる新しいマルチモーダル特徴融合手法を提案する。我々は分散のモーダル差を排除し、その後、意味レベルの特徴融合のためにモダリティに依存しないトランスフォーマーエンコーダを使用する。実験により,MAAは従来の手法と同一のモーダル性を適用することで,ベンチマーク上での最先端の結果が得られることを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:57:14 GMT)
ISWSST: Index-space-wave State Superposition Transformers for Multispectral Remotely Sensed Imagery Semantic Segmentation [8.7]
Index-space-wave state superposition Transformer (ISWSST) は、MSRSIセマンティックセグメンテーションのために提案される最初の方法である。 ISWSSTは、MSRSIセグメンテーションタスクの最先端アーキテクチャよりも検証され、優れている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:54:17 GMT)
Correlated Privacy Mechanisms for Differentially Private Distributed Mean Estimation [8.7]
CorDP-DMEは、ローカルディファレンシャルプライバシ(LDP)と分散DP(SecAgg)のギャップにまたがる新しいDP-DMEである。我々はCorDP-DMEの情報理論解析を行い、任意のプライバシパラメータの下での実用性に関する理論的保証を導出する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:22:33 GMT)
How high-status women promote repeated collaboration among women in male-dominated contexts [8.6]
ある女性が地位が急な階層で上位にある場合、そのチームの他の女性は、男性よりも再び協力する可能性が高い。急な階層では、上位階級の女性であるが上位階級の男性ではない女性は、同様の地位にある下層階級の男性よりも、下層階級の女性が再び協力する傾向にある。現状階層は, 若年者同士の反復的コラボレーションに特に有害であるのに対し, 急激な地位階層の女性は, 男女間のネガティブな影響を緩和することが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:41:48 GMT)
SAFT: Towards Out-of-Distribution Generalization in Fine-Tuning [8.6]
Sparse Adaptation for Fine-Tuning (SAFT) を導入する。これは、ファインチューニングが事前訓練されたモデルにおける一般的な知識を忘れないようにする手法である。モデルパラメータのわずか0.1%で、SAFTはCLIPの性能を大幅に改善できる。 ImageNetのほんの数ショットの学習ベンチマークで、SAFTはOOD設定における従来の微調整法よりも平均5.15%向上した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:56:55 GMT)
Documenting Ethical Considerations in Open Source AI Models [8.5]
本研究では,開発者がオープンソースAIモデルの倫理的側面を実際にどのように文書化しているかを検討する。 2,347の文書の最初の集合をフィルタリングした後、265の関連文書を特定した。モデル行動リスク、モデルユースケース、モデルリスク軽減の6つのテーマが浮かび上がっています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:08:01 GMT)
ObfuscaTune: Obfuscated Offsite Fine-tuning and Inference of Proprietary LLMs on Private Datasets [8.5]
この研究は、モデルプロバイダが所有する独自のLLMの推論と微調整を行うという、未解明のタイムリーな問題に対処する。本稿では, シンプルで効率的な難読化手法と秘密計算の効率的な利用を併用した, 新規で効率的で完全かつ実用的保存手法であるObfuscaTuneを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:54:08 GMT)
IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization [8.5]
IncogniTextは,テキストを匿名化して潜在的敵を誤認し,誤った属性値を予測する手法である。実証評価の結果,私的属性の漏洩が90%以上減少した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:49:03 GMT)
SPLITZ: Certifiable Robustness via Split Lipschitz Randomized Smoothing [8.5]
敵の例に証明可能な堅牢性を提供するための2つのアプローチがある。実用的で斬新なアプローチである textitSPLITZ を提案する。 textitSPLITZは、既存の最先端のアプローチを一貫して改善することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:13:28 GMT)
Unveiling and Controlling Anomalous Attention Distribution in Transformers [8.5]
ウェイバー現象は、要素が情報への貢献に影響を与えることなく過剰な注意を吸収することを可能にする。特定のモデルでは、位置符号化と注意パターンの違いにより、モデルによるウェイブラー要素の選択は2つの方法に分類できることがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:19:59 GMT)
How Similar Are Elected Politicians and Their Constituents? Quantitative Evidence From Online Social Network [8.4]
選出された政治家とその構成員のオンライン談話を比較する。政治家は、選挙区が右派または左派の政治家を選出するかどうかにかかわらず、内容やスタイルの観点からも、その構成員と等しく似ている傾向にある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:36:26 GMT)
Fredformer: Frequency Debiased Transformer for Time Series Forecasting [8.4]
Transformerモデルは時系列予測において主要なパフォーマンスを示している。データの中で低周波の特徴を学習し、高周波の特徴を見落とし、周波数バイアスを示す傾向がある。そこで我々はFredformerを提案する。Fredformerは、異なる周波数帯域にまたがる特徴を均等に学習することで、周波数バイアスを軽減するために設計されたフレームワークである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:24:39 GMT)
Soft Begging: Modular and Efficient Shielding of LLMs against Prompt Injection and Jailbreaking based on Prompt Tuning [8.3]
この抽象概念は、"soft begging"と呼ばれる、インジェクションやジェイルブレイク攻撃から大きな言語モデルを保護する新しいアプローチを探求している。本稿では,インジェクションとジェイルブレイクについて概説し,この手法の理論的基礎を紹介し,その有効性について論じる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:52:09 GMT)
WizardMerge -- Save Us From Merging Without Any Clues [8.2]
WizardMergeは、Gitのマージ結果を利用して、テキストとLLVM-IRレベルのコードブロック依存を検索する補助ツールです。その結果、WizardMergeは競合の合併コストを減少させ、23.85%の削減を実現している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:40:29 GMT)
Generation and characterization of customized perfect Laguerre-Gaussian beams with arbitrary profiles [8.2]
所望の曲線の周囲に最大強度が局在するパーフェクトラゲール・ガウスビーム(PLG)の発生を実験的に実証した。我々はこれらのビームの伝搬特性を特徴付け、同じ強度プロファイルを持つ非回折因果ビームと比較する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:40:59 GMT)
Artificial Inductive Bias for Synthetic Tabular Data Generation in Data-Scarce Scenarios [8.1]
本稿では,限られた実データ環境下でDGM(Deep Generative Models)を用いて,現実的で信頼性の高い合成データを生成する手法を提案する。本稿では,移動学習とメタ学習技術を用いて,DGMにおける人工的帰納バイアスを生成する方法を提案する。我々は,2つの最先端DGM,すなわち変分オートエンコーダとジェネレーティブ・アダクティブ・アダクティブ・ネットワークを用いて,人工的帰納バイアスがより優れた合成データ品質をもたらすことを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:53:42 GMT)
An Organism Starts with a Single Pix-Cell: A Neural Cellular Diffusion for High-Resolution Image Synthesis [8.0]
我々は、GeCA(Generative Cellular Automata)と呼ばれる新しいモデルのファミリーを紹介する。 GeCAは2つの画像モダリティ(Fundus and Optical Coherence Tomography, OCT)にまたがる網膜疾患分類の効果的な拡張ツールとして評価されるデータが不足し,クラス分布が本質的に歪んでいるOCT画像の文脈では,GeCAは11種類の眼科領域の性能を著しく向上させる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:26:09 GMT)
Mast Kalandar at SemEval-2024 Task 8: On the Trail of Textual Origins: RoBERTa-BiLSTM Approach to Detect AI-Generated Text [8.0]
SemEval 2024は、マルチジェネレータ、マルチドメイン、マルチ言語ブラックボックスマシン生成テキスト検出のタスクを導入している。本稿では,テキストをAI生成か人間かの2つのカテゴリに分類するために,RoBERTa-BiLSTMに基づく分類器を提案する。私たちのアーキテクチャは、125の内、80.83の正確さで、公式のリーダーボードで46位でした。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:22:23 GMT)
RobocupGym: A challenging continuous control benchmark in Robocup [7.9]
本稿では,オープンソースのrcssserver3dサッカーサーバをベースとしたRobocupベースのRL環境を提案する。各タスクでは、RLエージェントがシミュレートされたロボットを制御し、ボールや他のエージェントと対話することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:26:32 GMT)
Lift, Splat, Map: Lifting Foundation Masks for Label-Free Semantic Scene Completion [7.8]
本研究では,鳥の視線における連続的,オープンなセマンティクスと高度認識の表現を予測するためのLSMapを提案する。我々のモデルは1枚のRGBD画像しか必要とせず、人間のラベルを必要とせず、リアルタイムに動作する。事前学習された表現は、教師なしのセマンティックシーンの完了時に、既存の視覚基盤モデルよりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:08:05 GMT)
Learning Positional Attention for Sequential Recommendation [7.8]
位置関係を直接学習する新しい注意モデルを導入する。提案モデルである textbfPARec と textbfFPARec は,従来の自己意識に基づくアプローチよりも優れていた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:42:13 GMT)
Wideband Coherent Microwave Conversion via Magnon Nonlinearity in Hybrid Quantum System [7.7]
ダイヤモンド中の窒素空孔中心と磁性薄膜CoFeBを結合したハイブリッド量子システムにおけるマイクロ波周波数変換法を実証した。我々は、0.1GHzから12GHzまでの変換帯域を実現し、最大$mathrm25th$オーダー周波数変換を行う。磁場中における磁壁などの対称性の破れから生じる非線形性から,本手法は他のスピントロニクスデバイスとスピン量子ビットのハイブリッド系に適応できることが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:33:34 GMT)
ULLER: A Unified Language for Learning and Reasoning [7.7]
我々はニューロシンボリック人工知能(NeSy)のための統一言語を提案する。 ULLER(Unified Language for LEarning and Reasoning)と呼ぶ。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:34:31 GMT)
Are demographically invariant models and representations in medical imaging fair? [7.7]
人口統計属性をエンコードしないモデルが望ましいかどうかを問う。医用画像の公平性には,人口的不変表現は必要ではなく,十分ではないと結論づける。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:52:58 GMT)
MHNet: Multi-view High-order Network for Diagnosing Neurodevelopmental Disorders Using Resting-state fMRI [7.5]
NDD予測のためのマルチビューBFNから階層的・高次的特徴をキャプチャするマルチビュー高次ネットワーク(MHNet)を導入する。 MHNetには、ユークリッド空間特徴抽出(ESFE)モジュールと非ユークリッド空間特徴抽出(Non-ESFE)モジュールの2つのブランチがある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:45:48 GMT)
Quantum microwave photonic mixer with a large spurious-free dynamic range [7.5]
マイクロ波周波数混合は、現代のレーダーや無線通信システムにおいて重要な役割を担っている。量子マイクロ波フォトニクス技術は、スパイラスフリーなダイナミックレンジを改善するための有望なソリューションを提供する。我々は、強度変調器の構成に基づいて、2種類の量子マイクロ波フォトニックミキサーを実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:03:03 GMT)
A versatile quantum microwave photonic signal processing platform based on coincidence window selection technique [7.5]
量子マイクロ波フォトニクス(QMWP)は、エネルギー時間に絡み合った双光子源を光キャリアとして組み合わせた革新的なアプローチであり、高速RF信号回復のための時間関連単一光子検出である。本稿では,両光子同時分布の共振窓選択を利用して,量子マイクロ波フォトニック信号処理の汎用性について検討する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:26:53 GMT)
Absence of measurement-induced entanglement transition due to feedback-induced skin effect [7.5]
一般監視」下のある開放境界系では、非エルミート系における「皮膚効果」を連想させるような、異常な遅延時間粒子濃度がエッジに現れる。このようなフィードバックによって引き起こされる皮膚効果は絡み合いの発生を抑制し、測定によって引き起こされる絡み合いの遷移を伴わずに短距離の絡み合いを生じさせる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:42:12 GMT)
Collective advantages in qubit reset: effect of coherent qubits [7.3]
我々は3つの側面においてコヒーレント量子ビットの量子ビットリセットの集合的利点を探求する。準定常過程では、集合リセットの熱力学的コストは並列リセットよりも著しく低い。量子ビット数の増加に伴い、量子ビットリセット性能が向上することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:35:29 GMT)
Improved Noise Schedule for Diffusion Training [7.2]
拡散モデルは視覚信号を生成するデファクト選択として現れている。本稿では,拡散モデルのトレーニングを強化するため,ノイズスケジュールを設計するための新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:34:55 GMT)
Style Alignment based Dynamic Observation Method for UAV-View Geo-localization [7.2]
UAVビューのジオローカライゼーションのためのスタイルアライメントに基づく動的観察法を提案する。具体的には、ドローンビュー画像の多様な視覚スタイルから衛星画像の統一的な視覚スタイルへ変換するスタイルアライメント戦略を導入する。動的観察モジュールは、人間の観察習慣を模倣して画像の空間分布を評価するように設計されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:19:42 GMT)
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers [7.2]
ビジョントランスフォーマー(ViT)の量子化は、これらの課題を緩和するための有望なソリューションとして現れている。既存の手法は依然として低ビットでの精度の低下に悩まされている。 ADFQ-ViTは、画像分類、オブジェクト検出、および4ビットでのインスタンスセグメンテーションタスクにおいて、様々なベースラインを大幅に改善する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:41:59 GMT)
ShiftAddAug: Augment Multiplication-Free Tiny Neural Network with Hybrid Computation [7.1]
ShiftAddAugは費用のかかる乗算を使い、効率は良いが非力な乗算演算子を拡張し、推論オーバーヘッドなしでパフォーマンスを向上させる。 CIFAR100の精度は、直接訓練されたNNよりも最大4.95%向上する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:56:51 GMT)
CiteAssist: A System for Automated Preprint Citation and BibTeX Generation [7.1]
CiteAssistは、プリプリントのためのBibエントリの自動生成システムである。 CiteAssistはPDFの最後にBibの引用を自動的に添付し、文書の最初のページにリンクする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:18:29 GMT)
Improving Sequential Query Recommendation with Immediate User Feedback [6.9]
本稿では,対話型データ探索設定における次のクエリレコメンデーションのためのアルゴリズムを提案する。人気のあるオンライン文献発見サービスからログファイルを用いて大規模な実験を行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:44:31 GMT)
HRDE: Retrieval-Augmented Large Language Models for Chinese Health Rumor Detection and Explainability [6.8]
本稿では、一般的な健康関連質問のWebスクレイピングを通じて、12万件の健康関連噂(HealthRCN)を含むデータセットを構築する。我々は,中国の健康噂の検出と説明可能性 (HRDE) のための検索強化された大規模言語モデルを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:18:40 GMT)
Value-Penalized Auxiliary Control from Examples for Learning without Rewards or Demonstrations [6.8]
本研究は,実例(VPACE)から価値額化補助制御を導入する。我々は、スケジュールされた補助制御と補助タスクの例を追加することで、サンプルベース制御における探索を大幅に改善する。 3つのシミュレーション環境と1つの実際のロボット操作環境,21のタスクにまたがって,本手法が学習効率を大幅に向上することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:54:11 GMT)
Curvature Clues: Decoding Deep Learning Privacy with Input Loss Curvature [6.7]
入力に対する損失の曲率(所定入力損失曲率)は、入力に関する損失のヘシアンのトレースである。我々は,プライバシとトレーニングセットのサイズに基づいて,列車試験の識別可能性の上限を導出する理論的枠組みを開発する。この洞察は、入力損失曲率を利用した新しいブラックボックスメンバーシップ推論攻撃の開発を促進する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:47:46 GMT)
Self-distilled Masked Attention guided masked image modeling with noise Regularized Teacher (SMART) for medical image analysis [6.7]
注意誘導型マスク画像モデリング(MIM)を用いた事前学習型視覚変換器(ViT)は、自然画像解析において下流の精度を向上することを示した。我々は,MIMの選択的マスキングを誘導するために,雑音の多い運動量更新教師を組み合わせた共蒸留スウィントランスを開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:49:33 GMT)
Wearable Device-Based Real-Time Monitoring of Physiological Signals: Evaluating Cognitive Load Across Different Tasks [6.7]
本研究は,中等教育学生の脳波(EEG)データに対する認知負荷評価を行うために,最先端のウェアラブルモニタリング技術を用いている。この研究は、中等教育学生の認知負荷を評価するための応用価値と、様々な課題にまたがる有用性について考察した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:33:29 GMT)
e-Health CSIRO at "Discharge Me!" 2024: Generating Discharge Summary Sections with Fine-tuned Language Models [6.5]
BioNLP 2024 Shared Task on Streamlining Discharge Documentation (Discharge Me! 我々は,複数のオープンソース言語モデル (LM) を微調整し,デコーダのみとエンコーダのみを含む生成タスクにアプローチする。その結果, 生成作業において, 目標区間に先行する放電概要の内容に対する条件付けが有効であることが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:32:28 GMT)
Deep learning for 3D human pose estimation and mesh recovery: A survey [6.5]
本稿では過去5年間の3次元ポーズ推定のためのディープラーニング手法の進歩を概観する。我々の知る限りでは、この調査は人間の3次元ポーズ推定のためのディープラーニング手法を包括的にカバーした最初のものであることは間違いない。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:52:33 GMT)
Breeding the Cat Through Superposition of Two Schrodinger Kittens Based on Coupled Waveguides [6.5]
オプティカル・シュロディンガーの猫(SC)は、フォールトトレラント量子コンピューティングを実現する可能性から、非常に期待されている。ここでは、2つの近傍のコヒーレント状態が干渉し、拡大したコヒーレント状態に成長する2つの子猫の重ね合わせにより、大きなSC様状態が生成されることを実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:22:38 GMT)
Revisiting Scalable Hessian Diagonal Approximations for Applications in Reinforcement Learning [6.4]
二次情報は多くのアプリケーションにとって価値があるが、計算は困難である。 BL89よりも改善されたHesScaleを導入し、無視できる余分な計算を追加した。小さなネットワークでは、この改善は全ての代替品よりも高い品質であり、不偏性のような理論的保証のあるものでさえも計算がより安価である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:22:00 GMT)
SparseSSP: 3D Subcellular Structure Prediction from Sparse-View Transmitted Light Images [6.3]
従来の蛍光染色は、生きた細胞に光毒性があり、遅くて高価である。従来のアプローチでは、1対1のボクセルレベルの密度予測に3Dネットワークを使用している。本研究では,ターゲットボクセル格子内の蛍光強度を予測する効率的なフレームワークであるSparseSSPを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:00:34 GMT)
Solving the Inverse Problem of Electrocardiography for Cardiac Digital Twins: A Survey [6.2]
ECG逆問題の解決は、正確な仮想心臓モデリングに不可欠である。近年の進歩は、仮想心臓モデリングの強化に大きく貢献している。本稿では,ECG逆問題の解法を包括的に検討することを目的とする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:32:37 GMT)
Barium Titanate and Lithium Niobate Permittivity and Pockels Coefficients from MHz to Sub-THz Frequencies [6.1]
ニオブ酸リチウム(LN)およびチタン酸バリウム(BTO)のポッケルス係数と誘電率の最初の測定を行った。これらの性質は、LNのこの周波数範囲にわたって一定であるが、BTOにおいて有意な周波数依存性を持つ。この研究は、高速BTOデバイスの設計と新しい電気光学材料の開発に基礎を置いている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:37:44 GMT)
Learning from Memory: Non-Parametric Memory Augmented Self-Supervised Learning of Visual Features [6.1]
提案手法では,ニューラルネットワークをメモリコンポーネントに拡張して,現在のイメージビューとこれまで遭遇した概念を比較する。我々は, 線形, 転送学習, ローショット分類, 画像検索など, 多数の視覚課題に対して, 提案手法をベンチマークする。実験結果は,新たな正規化子を使わずに安定したSSLトレーニングを実現するための提案手法の有効性を固めるものである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:46:08 GMT)
Accelerated Proton Resonance Frequency-based Magnetic Resonance Thermometry by Optimized Deep Learning Method [5.9]
本研究の目的は, 動的MR温度マップ再構成における時間分解能の向上である。トレーニング最適化手法と5つの古典的ニューラルネットワークを2倍および4倍のアンダーサンプリングk空間データに適用した。深層学習に基づく再建は、臨床FUS熱療法におけるMRサーモメトリーの精度と効率を著しく向上させることができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:49:38 GMT)
Graphon Particle Systems, Part II: Dynamics of Distributed Stochastic Continuum Optimization [5.7]
ノード連続体を持つグラフオン上での分散最適化問題について検討する。グラノン上での勾配降下と勾配追従アルゴリズムを提案する。時間変化アルゴリズムを適切に選択することにより、すべてのノードの状態が接続されたグラフに対して$mathcalLinfty$-consensusを達成することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:47:39 GMT)
ColorizeDiffusion: Adjustable Sketch Colorization with Reference Image and Text [5.7]
事前学習したCLIP画像エンコーダの異なる画像トークンを利用した画像誘導潜時拡散モデルの2つのバリエーションを紹介する。重み付きテキスト入力を用いて結果の逐次的調整を行うための,対応する操作手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:18:49 GMT)
Terrain Classification Enhanced with Uncertainty for Space Exploration Robots from Proprioceptive Data [5.6]
地層分類における不確かさを定量化するニューラルネットワークを提案する。入力としてプロプリセプティブデータのみを使用して時系列対応アーキテクチャにおいて,モンテカルロ・ドロップアウト,DropConnect,Flipoutによるニューラルネットワークを実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:10:50 GMT)
Anomaly-based Framework for Detecting Power Overloading Cyberattacks in Smart Grid AMI [5.6]
本稿では回帰決定木に基づく2段階異常検出フレームワークを提案する。導入された検出手法は、エネルギー消費の規則性と予測可能性を利用して参照消費パターンを構築する。アイルランドの500人の顧客を対象とした,実世界の公用エネルギー消費データセットに関する広範な実験を行った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:52:23 GMT)
Transport meets Variational Inference: Controlled Monte Carlo Diffusions [5.6]
本稿では,経路空間上の発散に着目したサンプリングおよび生成モデリングのための原理的かつ体系的な枠組みを提案する。ベイズ計算のためのemphControlled Monte Carlo Diffusion sampler (CMCD)を開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:25:33 GMT)
A Systematic Performance Analysis of Deep Perceptual Loss Networks: Breaking Transfer Learning Conventions [5.5]
ディープ・パーセプチュアル・ロス(英: Deep Perceptual Los)とは、2つの画像間の誤差をニューラルネットワークから抽出したディープ・特徴間の距離として計算する画像のロス関数の一種である。本研究は,4つの異なるアプリケーション領域における事前学習損失ネットワークの効果を評価する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:36:43 GMT)
NEBULA: Neural Empirical Bayes Under Latent Representations for Efficient and Controllable Design of Molecular Libraries [5.4]
NEBULAはシード化合物を中心とした大規模分子ライブラリーをスケーラブルに生成するための,最初の潜伏3次元生成モデルである。 NEBULAは、サンプルの品質を犠牲にすることなく、既存の方法よりもほぼ1桁早く大きな分子ライブラリを生成する。ここでのアプローチは、機械学習ベースの薬物発見に極めて有効になることを期待しています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:10:43 GMT)
Effective Heterogeneous Federated Learning via Efficient Hypernetwork-based Weight Generation [5.3]
クライアントの不均一性をサポートするための新しいフェデレーション学習フレームワークであるHypeMeFedを提案する。このアプローチは、ヘテロジニアスモデル層の特徴空間を整列し、重み付け時の層間情報格差を解消する。 HypeMeFedはFedAvgよりも5.12%精度を向上し、ハイパーネットワークメモリの要求を98.22%削減し、単純なハイパーネットワークアプローチに比べて1.86倍の動作を高速化する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:15:12 GMT)
Pulse Design of Baseband Flux Control for Adiabatic Controlled-Phase Gates in Superconducting Circuits [5.3]
大規模な量子コンピュータを実現する上では、2量子ビットの誤り発生ゲートがボトルネックとして残っている。超伝導量子ビットにおける2量子ゲートの1つのタイプは、制御相(CPHASE)ゲートである。チェビシェフをベースとした軌道は, ある場合において, リーク誤差の低いゲートを平均6%以下にできることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:25:59 GMT)
Zero-X: A Blockchain-Enabled Open-Set Federated Learning Framework for Zero-Day Attack Detection in IoV [5.2]
インターネット・オブ・ビークルズ (Internet of Vehicles, IoV) は、インテリジェントトランスポーテーション・システムズ (ITS) にとって重要な技術である。接続が拡大するにつれ、サイバーセキュリティの脅威が懸念されている。 0日とN日の攻撃を効果的に検出する革新的なセキュリティフレームワークであるZero-Xを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:06:15 GMT)
ALTER: Augmentation for Large-Table-Based Reasoning [5.2]
ALTER(Augmentation for Large-Table-Based Reasoning)は、NL (Free-form Natural Language) とNL (Augmentation for Large-Table-Based Reasoning) の双方の質問において、潜在的な拡張可能性を活用するために設計されたフレームワークである。テーブルからの関連データの小さなサブセットのみを利用することで、ALTERはテーブルベースの推論ベンチマークで優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:34:45 GMT)
Dual Latent State Learning: Exploiting Regional Network Similarities for QoS Prediction [5.1]
本稿では,新しいディープラーニングフレームワークである地域ベースデュアル潜在状態学習ネットワーク(R2SL)を紹介する。 R2SLは2つの異なる地域ネットワーク潜在状態を引き出すことで、地域ネットワークの振舞いのニュアンスを捉える。我々のR2SLアプローチは、オブジェクトに固有の地域ネットワークの類似性を十分に活用することで、正確な予測のための革新的な道を開く。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:42:25 GMT)
Thermodynamics-informed super-resolution of scarce temporal dynamics data [4.9]
本稿では,物理系の測定値の分解能を高め,その時間進化を予測する手法を提案する。本手法では, 逆自己エンコーダを用いて全順序モデルの次元性を, 先行値に適合するように強制される潜在変数の集合に還元する。第2のニューラルネットワークは、潜伏変数の物理的構造を学び、その時間的進化を予測するために訓練される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:13:21 GMT)
Accelerated Inference for Partially Observed Markov Processes using Automatic Differentiation [4.9]
自動微分(AD)は機械学習の最近の進歩を促している。我々は,新しいアルゴリズムのクラスの拡張を提供する理論的枠組みに,既存の2つのAD粒子フィルタ手法を組み込む方法を示す。我々はAD勾配推定のモンテカルロ特性に適合する確率アルゴリズムを開発する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:06:46 GMT)
Euler's Elastica Based Cartoon-Smooth-Texture Image Decomposition [4.8]
グレースケール画像を3つの異なる成分に分解する新しいモデルを提案する。構造部は強い境界と強い光-暗黒遷移のある領域、滑らかな部分、柔らかい影と影、振動、テクスチャとノイズを表す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:42:33 GMT)
Homotopy, Symmetry, and Non-Hermitian Band Topology [4.8]
非エルミート帯域は、スペクトルブレイドや交差点の興味深い特徴を示す。我々は$mathcalPT$-symmetricシステムにおいて、アベリア位相と非アベリア位相をそれぞれ明らかにする。これらの結果は、様々な新しいトポロジカル現象の理論的および実験的探索の扉を開く。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:15:01 GMT)
Unified Anomaly Detection methods on Edge Device using Knowledge Distillation and Quantization [4.7]
欠陥検出を用いたほとんどの異常検出アプローチでは、各クラスに個別のモデルを適用する必要がある1クラスモデルを採用している。本研究では,統一型マルチクラス構成について検討する。実験により,マルチクラスモデルは標準MVTec ADデータセットの1クラスモデルと同等に動作することが示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:04:48 GMT)
Delving into ChatGPT usage in academic writing through excess vocabulary [4.6]
大きな言語モデル(LLM)は、人間レベルのパフォーマンスでテキストを生成し、修正することができる。しかし、多くの科学者が学術的な執筆を支援するためにそれを使ってきた。 2010年から2024年までの1400万のPubMed抽象語の語彙変化について検討し、LLMの出現がある種の単語の出現頻度の急激な増加につながったことを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:53:27 GMT)
Smooth Lower Bounds for Differentially Private Algorithms via Padding-and-Permuting Fingerprinting Codes [4.6]
微分プライベートアルゴリズムのサンプル複雑性に基づいて,スムーズな下界を生成するための新しいフレームワークとツールを提案する。我々の主な技術は、指紋コードにパディング・アンド・パーミュート変換を適用することである。我々はDwork et al. (FOCS 2015) と Bun et al. (SODA 2017) より強い新しい指紋認証補題を開発する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:22:10 GMT)
MLKD-BERT: Multi-level Knowledge Distillation for Pre-trained Language Models [4.4]
本研究では,教師-学生の枠組みにおける多段階知識を蒸留するための知識蒸留手法MLKD-BERTを提案する。本手法は, BERTにおける最先端の知識蒸留法より優れている。さらに、MLKD-BERTは、生徒の注意番号を柔軟に設定でき、性能低下を少なく抑えることができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:03:30 GMT)
Revisiting the Performance of Deep Learning-Based Vulnerability Detection on Realistic Datasets [4.4]
本稿では,脆弱性検出モデルを評価するための実世界のシナリオを表すデータセットであるReal-Vulを紹介する。 DeepWukong、LineVul、ReVeal、IVDetectの評価では、パフォーマンスが大幅に低下し、精度は95パーセントまで低下し、F1スコアは91ポイントまで低下した。オーバーフィッティングは重要な問題として認識され、改善手法が提案され、パフォーマンスが最大30%向上する可能性がある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:34:30 GMT)
Convergence of Implicit Gradient Descent for Training Two-Layer Physics-Informed Neural Networks [4.3]
本稿では、過度にパラメータ化された2層PINNのトレーニングのための暗黙の勾配降下に対する収束解析について述べる。ランダムなIGDは線形収束速度で大域的に最適解を収束することを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:10:41 GMT)
Collective Attention in Human-AI Teams [4.3]
AIアシスタントの存在は、共有認知の様々な側面を調節することによって、チームの集団的注意に大きく影響する。本研究は,チーム設定におけるAIシステムがチームパフォーマンスに影響を及ぼす中心的なメカニズムとして,集団的注意を喚起することによって,人間とAIのコラボレーション研究に寄与する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:46:00 GMT)
MVGT: A Multi-view Graph Transformer Based on Spatial Relations for EEG Emotion Recognition [4.2]
空間関係に基づく多視点グラフ変換器(MVGT)を提案する。脳波チャネルの空間情報を符号化としてモデルに組み込むことにより,脳波チャネルの空間構造を知覚する能力を向上させる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:13:00 GMT)
Prosody-Driven Privacy-Preserving Dementia Detection [4.0]
本研究の目的は,認知症検出のための診断ユーティリティを保ちつつ,埋め込みを匿名化することである。本稿では,認知症に関連する韻律的特徴を話者埋め込みから切り離すために,ドメイン知識を活用した新しいアプローチを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:34:47 GMT)
Depth Priors in Removal Neural Radiance Fields [3.9]
本論文では、SpinNeRFとZoeDepthのような単分子深度推定モデルを利用して、物体除去におけるNeRFの性能を向上させる新しいパイプラインを提案する。 KITTIデータセット上でのCOLMAPの深い深度再構成の徹底的な評価を行い、COLMAPが深度基底真理を得るためのコスト効率とスケーラブルな代替手段であることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:23:00 GMT)
A Radiometric Correction based Optical Modeling Approach to Removing Reflection Noise in TLS Point Clouds of Urban Scenes [3.8]
TLSが取得した点雲は反射面からの仮想点を含むことが多く、乱れを引き起こす。本研究では,TLS点雲に対する反射ノイズ除去アルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:17:41 GMT)
ESQA: Event Sequences Question Answering [3.8]
イベントシーケンス(ES)は、金融、小売、ソーシャルネットワーク、医療など、多くの実践的な領域で発生する。 ESsモデリングと分析の重要性にもかかわらず、大きな言語モデル(LLM)をESsドメインに適応させる作業はほとんど行われなかった。本稿では,複数の下流タスクを微調整をほとんどあるいは全く行わずに解決できる新しい解法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:41:54 GMT)
A Role of Environmental Complexity on Representation Learning in Deep Reinforcement Learning Agents [3.7]
我々は、深層強化学習エージェントを訓練するためのシミュレーションナビゲーション環境を開発した。ショートカットおよびナビゲーションキューへの露出頻度を変調し,異なる能力を有する人工エージェントの開発に繋がった。これらのエージェントを駆動する人工ニューラルネットワークの符号化表現について検討し、表現学習における複雑なダイナミクスを明らかにした。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:27:26 GMT)
Face4RAG: Factual Consistency Evaluation for Retrieval Augmented Generation in Chinese [3.7]
従来の検索時拡張世代(RAG)における事実整合性エラーの大きな問題は、FCE(Factual Consistency Evaluation)の研究を動機づけている我々は,基礎となるLarge Language Models (LLM) に依存しないRAGのための,最初の総合的なFCEベンチマークemphFace4RAGを提案する。提案するベンチマークでは,既存のFCE手法が論理的誤りを検出できないことを発見した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:49:34 GMT)
ViG-Bias: Visually Grounded Bias Discovery and Mitigation [3.6]
視覚的基底バイアス発見・緩和(ViG-Bias)を導入し,発見・緩和性能の向上を図る。視覚的説明を取り入れることで、DOMINO、FACTS、Bias-to-Textといった既存の手法が強化されることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:42:47 GMT)
Precision at Scale: Domain-Specific Datasets On-Demand [3.6]
Precision at Scale (PaS)は、オンデマンドでドメイン固有のデータセットを自動生成するための新しい方法である。 PaSパイプラインは、最先端の基盤モデルと生成モデルを活用して、任意のドメインに属するイメージのコレクションを作成する。自動生成されたドメイン固有データセットは、ImageNet-1kやImageNet-21kのような大規模教師付きデータセットよりも、事前トレーニングが優れていることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:17:42 GMT)
Protecting Privacy in Classifiers by Token Manipulation [3.5]
テキスト分類モデルに焦点をあて、様々なトークンマッピングとコンテキスト化された操作機能について検討する。いくつかのトークンマッピング関数の実装は簡単で簡単ですが、ダウンストリームタスクのパフォーマンスに大きな影響を与えます。比較すると、文脈化された操作はパフォーマンスを改善する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:31:52 GMT)
For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives [3.4]
この研究は、ソーシャルメディアプラットフォームにおける画像の社会的・文化的影響を大規模に調査するためのフレームワークであるFRESCOを提示する。 FRESCOは、最新のコンピュータビジョン技術を用いて、画像を数値変数と分類変数に分解する。このフレームワークは、線や色のような基本的な視覚的特徴を含むプラスティックレベル、特定の実体や概念を表す図形レベル、特にオブザーバーとオブザーバーの視点を構築することに焦点を当てた啓示レベルという3つのレベルにわたって画像を分析する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:57:38 GMT)
DACB-Net: Dual Attention Guided Compact Bilinear Convolution Neural Network for Skin Disease Classification [3.4]
本稿では,DACB-Netを用いた3分岐デュアルアテンションガイド型コンパクトバイリニアCNNについて紹介する。グローバルブランチは、失った識別的特徴を補償し、関連する収穫地に対する注意熱マップ(AHM)を生成する。このフレームワークはデータ強化、転送学習、微調整を統合し、データの不均衡に対処し、分類性能を改善し、計算コストを削減する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:32:54 GMT)
A Framework for Quantum Finite-State Languages with Density Mapping [3.1]
量子有限状態オートマトン(Quantum finite-state Automaticon, QFA)は、有限メモリを持つ量子系の進化をシミュレートする理論モデルである。本稿では,QFAを構築し,シミュレーション精度を最大化するための,シンプルで直感的な方法を提供するフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:06:37 GMT)
Towards Attention-based Contrastive Learning for Audio Spoof Detection [3.1]
視覚変換器 (ViT) はコンピュータビジョンにおける分類タスクに大きく進歩している。音声スプーフ検出タスクにViTを導入する。本稿では,クロスアテンションを用いて表現学習を支援する新しい注目型コントラスト学習フレームワーク(SSAST-CL)を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:25:12 GMT)
Scaling Data-Driven Building Energy Modelling using Large Language Models [3.0]
本稿では,ビル管理システムにおけるデータ駆動型モデルの開発に伴うスケーラビリティ問題に対処する手法を提案する。我々は、大規模言語モデル(LLM)を使用して、BMSから構造化データを処理するコードを生成し、BMS固有の要求に対してデータ駆動モデルを構築します。ケーススタディでは、プロンプトテンプレートの下での双方向のプロンプトは、高いコード生成率とコード精度を実現し、人件費を大幅に削減できることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:34:24 GMT)
ENOT: Expectile Regularization for Fast and Accurate Training of Neural Optimal Transport [3.0]
最適な輸送計画の正確かつ効率的に推定する新しい手法を提案する。 expectile Regularized Neural Transport Optimal (ENOT) と呼ばれる。 ENOTは二重ポテンシャルの学習過程に結合条件を強制する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:02:39 GMT)
Social Bias in Large Language Models For Bangla: An Empirical Study on Gender and Religious Bias [3.0]
LLM生成したバングラ語に対する2種類の社会的バイアスについて検討した。これは、バングラのLLMのバイアス評価を私たちの知識の最大限に活用する、この種の研究としては初めてのものです。すべてのコードとリソースは、Bangla NLPにおけるバイアス関連研究の進展のために公開されています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 22:45:36 GMT)
Knowledge-based Consistency Testing of Large Language Models [3.0]
我々は,大規模言語モデル(LLM)の不整合性と知識ギャップを系統的に公開し,測定する。テストケース構築に知識グラフを活用する自動テストフレームワーク(KONTEST)を提案する。 KONTESTは、意味論的に等価なクエリとテストオラクルの組み合わせによって、LLMの世界の知識の不整合を調査し、測定する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:16:54 GMT)
Performance optimization of a finite-time quantum tricycle [2.9]
有限時間外界駆動型量子三サイクルモデルを確立する。我々は,三輪車の冷却性能を,冷却速度と実測値を考慮して最適化する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:19:03 GMT)
Recompression Based JPEG Tamper Detection and Localization Using Deep Neural Network Eliminating Compression Factor Dependency [2.8]
本稿では,JPEG画像におけるrepression based forgeryの存在を検出することができる畳み込みニューラルネットワークに基づくディープラーニングアーキテクチャを提案する。本研究では,リ圧縮機能に基づく画像操作領域のローカライズも目的とする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:19:35 GMT)
On Large Language Models in National Security Applications [2.8]
2023年初頭のGPT-4の圧倒的な成功は、国家安全保障を含む様々な分野にわたる大規模言語モデル(LLM)の変革の可能性を強調した。本稿では,情報処理,意思決定,運用効率に革命をもたらす可能性を分析し,国家安全保障におけるLLM統合の意義について考察する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:53:22 GMT)
NeuraLUT: Hiding Neural Network Density in Boolean Synthesizable Functions [2.7]
Field-Programmable Gate Array (FPGA)アクセラレータは、レイテンシとリソースクリティカルなDeep Neural Network (DNN)推論タスクの処理に成功している。本稿では、ニューロンの境界を緩和し、サブネットワーク全体を単一のLUTにマッピングすることを提案する。提案手法は,既知の遅延クリティカルタスク,ジェットサブストラクチャタグ,古典的コンピュータビジョンタスク,MNISTを用いた桁分類で検証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:43:56 GMT)
A Framework For Refining Text Classification and Object Recognition from Academic Articles [2.7]
現在の学術論文のデータマイニング手法はルールベース(RB)または機械学習(ML)アプローチを採用している。我々は,機械学習とルールベースのスキームハイブリッドであるテクストブロックリファインメントフレームワーク(TBRF)を開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:46:32 GMT)
xApp Distillation: AI-based Conflict Mitigation in B5G O-RAN [2.7]
我々は、複数のxAppから知識を抽出し、Previous xAppsの機能を保持した単一モデルをトレーニングする方法を提案する。性能評価では、競合緩和スキームの比較により、最大で6倍のネットワーク障害が発生する可能性がある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:40:20 GMT)
LLM-Oracle Machines [2.7]
本稿では,大規模言語モデル(LLM)のクラスタをオラクルとして利用することにより,オーラクルチューリングマシン(OTM)の概念の拡張を提案する。各LLMはブラックボックスとして機能し、その専門知識内でクエリに応答できるが、遅延がある。 LLM-OMの基本,拡張,障害回避,および$epsilon$-faultの4つのバリエーションを紹介した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:59:21 GMT)
Context is Important in Depressive Language: A Study of the Interaction Between the Sentiments and Linguistic Markers in Reddit Discussions [2.7]
本研究では,抑うつにおける言語マーカーと感情表現の文脈としての議論トピックの影響について検討した。我々の感情分析では、抑うつ者の感情の強さは、コントロールよりも否定的感情と肯定的感情の両方が高いことが判明した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:51:53 GMT)
Fine-tuning Large Language Models with Sequential Instructions [2.5]
既存の命令調整モデルでは、複数の命令でクエリに応答するのに苦労していることがわかった。我々は、微調整データの一部がシーケンシャルに関連したタスクの連鎖を含むべきであると論じる。既存のデータセットの命令を多種多様な複雑なシーケンシャルな命令に変換することで、このプロセスを自動化する。逐次指導チューニングを行ったモデルでは、符号化、数学、オープンエンド生成の結果が改善された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:18:44 GMT)
Highly Accelerated MRI via Implicit Neural Representation Guided Posterior Sampling of Diffusion Models [2.5]
Inlicit Neural representation (INR) は、逆問題を解決するための強力なパラダイムとして登場した。提案するフレームワークは、他の医療画像タスクにおける逆問題を解決するための一般化可能なフレームワークである。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:37:56 GMT)
Supporting Cross-language Cross-project Bug Localization Using Pre-trained Language Models [2.5]
既存のテクニックは、アプリケーション固有のデータに依存しているため、一般化性とデプロイメントに苦労することが多い。本稿では,プロジェクトと言語の境界を超越したバグローカライゼーションのための,PLMに基づく新しい言語モデルを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:09:36 GMT)
Unsupervised Latent Stain Adaptation for Computational Pathology [2.5]
スタン適応は、ターゲットの染色を一般化するソース染色のモデルをトレーニングすることで、異なる染色間の一般化誤差を低減することを目的としている。我々は,Unsupervised Latent Stain Adaptation (ULSA) と呼ばれる,すべてのステンド画像を含む人工ラベル付きと非ラベル付きデータの共同トレーニングを提案する。本手法では, 教師付き信号の増大のために, ラベル付きソース画像に合成対象画像を付加するために, ステンドトランスフォーメーションを用いる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:34:39 GMT)
Causal inference approach to appraise long-term effects of maintenance policy on functional performance of asphalt pavements [2.4]
アスファルト舗装は、繰り返しの交通負荷や連続的な気候周期によるストレスやひずみによる機能的または構造的損傷による交通安全上の深刻な問題を引き起こす。本研究では,従来の因果構造モデルと潜在的結果モデルフレームワークを組み合わせた新たな因果推論手法を提案する。その結果, 本手法は, 予防的維持治療の効果を正確に評価し, 異なる予防的維持アプローチの機能を十分に発揮するための維持時間を評価できることが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:53:21 GMT)
Stimulated emission tomography for efficient characterization of spatial entanglement [2.4]
本研究では, 自然発生過程と比較して, 検出された光子の平均個数が数桁増加することを示す。 SET測定では、特定モード特性を備えた強信号場によりパラメトリックダウンコンバージョンがシードされる。我々は,強いアイドラー生成と空間モード分布の理論的予測との良好な一致を観察する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:04:03 GMT)
FairJob: A Real-World Dataset for Fairness in Online Systems [2.4]
広告における求人推薦のためのフェアネス対応データセットを提案する。収集され、プライバシー基準とビジネス機密に準拠する準備が整った。匿名化され、センシティブな属性のプロキシを含むにもかかわらず、データセットは予測力を保持します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:30:39 GMT)
Multi-domain improves out-of-distribution and data-limited scenarios for medical image analysis [2.3]
特殊ドメインの代わりに複数のドメインを組み込んだモデルを用いることで、特殊モデルで観測される制限が大幅に軽減されることを示す。臓器認識では、従来の特殊なモデルと比較して、マルチドメインモデルは精度を最大8%向上させることができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:15:46 GMT)
IM-MoCo: Self-supervised MRI Motion Correction using Motion-Guided Implicit Neural Representations [2.2]
磁気共鳴イメージング(MRI)における運動アーティファクトは、比較的長い取得時間によって生じる。従来の動き補正法は、しばしば激しい動きに対処できず、歪んだり信頼性の低い結果をもたらす。 Inlicit Neural Representation (INR) を利用したインスタンスワイド動作補正パイプラインを提案する。本手法は, 動作不良画像と比較して, 少なくとも1.5ドル以上の精度で分類結果を改善する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:14:33 GMT)
MedExQA: Medical Question Answering Benchmark with Multiple Explanations [2.2]
本稿では,MedExQAについて紹介する。MedExQAは,医学的知識に関する大規模言語モデル (LLM) の理解を説明を通じて評価するための,医学的質問応答の新しいベンチマークである。 5つの異なる医療専門分野のデータセットを構築することで、現在の医療QAベンチマークの大きなギャップに対処する。本研究は、医学LLMにおける説明可能性の重要性を強調し、分類精度以上のモデルを評価する効果的な方法論を提案し、特定の分野である音声言語病理学に光を当てる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:13:56 GMT)
Aspect-Based Sentiment Analysis Techniques: A Comparative Study [2.1]
Aspect-based Sentiment Analysis (ABSA) は人工知能(AI)の進歩に支えられている本研究では、2つのベンチマークデータセット(Restaurant14とLaptop-14)でABSAのディープNN手法を比較した。 FAST LSA は 87.6% と 82.6% の精度で最高の結果を得るが、それぞれ 90.33% と 86.21% の精度で LSA+DeBERTa を通過しない。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:21:07 GMT)
Satisfiability of commutative vs. non-commutative CSPs [2.1]
NP-ハード CSP は、有限次元および無限次元ヒルベルト空間上の作用素を通して古典的満足度と満足度を分離することを示す。また,非有界幅のトラクタブル CSP は,いかなる種類の満足感ギャップも持たないことを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:13:46 GMT)
Backstepping Neural Operators for $2\times 2$ Hyperbolic PDEs [2.0]
双曲型PDEプラントにおけるゲインカーネルPDEの近似システムの課題について検討した。工学的応用としては、油井掘削、浅瀬波のサン・ヴェナントモデル、渋滞流における停止・停止不安定のAw-Rascle-Zhangモデルなどがある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:04:07 GMT)
Enhanced high-dimensional teleportation in correlated amplitude damping noise by weak measurement and environment-assisted measurement [1.9]
弱い測定(WM)と環境支援測定(EAM)によるCADノイズのクォートテレポーテーション向上のための2つの方策その結果,CADノイズの相関効果は成功の確率を増大させることがわかった。我々の研究は、量子技術としてのWMとEAMの能力を拡張し、クォート通信におけるCADノイズに対処する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:45:55 GMT)
Tripartite GHZ Entanglement in Monitored Random Clifford Circuits [1.9]
多数体の多部量子絡み合いはよく理解されていない。我々は、ランダムなクリフォード回路によって生成される状態から抽出できる三部晶グリーンバーガー・ホーネ・ザイリンガー状態(GHZ)の量を数値的に研究する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:36:49 GMT)
Precise and Efficient Orbit Prediction in LEO with Machine Learning using Exogenous Variables [1.9]
地球の軌道における宇宙物体の量の増加は、宇宙状況認識(Space situational Awareness, SSA)にとって重要な課題である。正確な軌道予測は、宇宙物体の位置と速度を予測し、衝突回避と宇宙デブリの緩和のために重要である。機械学習と時系列技術を用いることで、計算コストが非常に低い位置決め誤差を発生させることができることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:12:33 GMT)
VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation [1.8]
VCHAR(Variance-Driven Complex Human Activity Recognition)は、原子活動の出力を特定の間隔での分布として扱う新しいフレームワークである。 VCHARは、原子活動の正確な時間的・シーケンシャルなラベル付けを必要とせず、複雑な活動認識の精度を高める。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:24:36 GMT)
Solving the inverse problem of microscopy deconvolution with a residual Beylkin-Coifman-Rokhlin neural network [1.8]
光顕微鏡(LM)における従来の明示的手法は、画像取得時に点拡散関数(PSF)に依存する。本稿では、光学デコンボリューションを近似するために、革新的な物理インフォームドニューラルネットワークであるMulti-Stage Residual-BCR Net(m-rBCR)を提案する。明示的なデコンボリューション法(例えばリチャードソン=ルーシー)や他の最先端NNモデルとは対照的に、m-rBCRモデルは他の候補よりも優れた性能を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:09:59 GMT)
Developing a Novel Image Marker to Predict the Clinical Outcome of Neoadjuvant Chemotherapy (NACT) for Ovarian Cancer Patients [1.8]
ネオアジュバント化学療法(ネオアジュバントセラピー、Neoadjuvant chemotherapy, NACT)は、卵巣がんの進行期における治療法の一つ。 NACTに対する部分的反応は、近位部破裂手術を引き起こす可能性があり、予後不良を引き起こす。我々は,NATの早期に高精度な予後予測を実現するために,新しい画像マーカーを開発した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:58:56 GMT)
XferBench: a Data-Driven Benchmark for Emergent Language [1.7]
創発的言語の全体的な品質を評価するためのベンチマークを導入する。人間の言語における下流のNLPタスクの事前学習データとして、創発言語を用いてこれを計測する。我々は,人,合成,創発的な言語ベースラインを用いて,ベンチマークの有効性を実証的に検証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:02:26 GMT)
A Review of the Applications of Deep Learning-Based Emergent Communication [1.7]
創発的コミュニケーション(英: Emergent Communication)または創発的言語(英: emergent language)は、人間の言語に似たコミュニケーションシステムが深層強化学習環境においてどのように出現するかを研究する研究分野である。本稿では,機械学習,自然言語処理,言語学,認知科学における創発的コミュニケーション研究の応用を包括的にレビューする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:43:54 GMT)
Physics-Informed Boundary Integral Networks (PIBI-Nets): A Data-Driven Approach for Solving Partial Differential Equations [1.6]
偏微分方程式(PDE)は力学系の関連する現象を記述するために広く用いられる。高次元設定では、PINNは計算領域全体にわたって密度の高いコロケーションポイントを必要とするため、しばしば計算上の問題に悩まされる。本稿では,PDEを元の問題空間よりも1次元以下で解くためのデータ駆動手法として,Physical-Informed Boundary Networks(PIBI-Nets)を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:31:06 GMT)
Swish-T : Enhancing Swish Activation with Tanh Bias for Improved Neural Network Performance [1.6]
Swish-T は元の Swish 関数に Tanh バイアスを加えることで定義される。 Tanhバイアスは、初期トレーニング段階での負の値のより広範な受け入れを可能にする。 Swish-Tファミリーの優位性は、様々なモデルやベンチマークデータセットで実証的に実証されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:36:00 GMT)
Chemical Shift Encoding based Double Bonds Quantification in Triglycerides using Deep Image Prior [1.6]
本研究では, 化学シフトエンコードされたマルチエコ勾配エコー画像からトリグリセリド二重結合をネットワークトレーニングなしで定量化する深層学習法について検討した。信号制約に基づいたコスト関数を用いて、ニューラルネットワークを1つのデータセットで反復的に更新する。その結果,Pearson相関係数は0.96。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:40:52 GMT)
Towards Semantically Enriched Embeddings for Knowledge Graph Completion [1.5]
本稿では,KG埋め込み生成のバリエーションに基づいて,既存のKG完了アルゴリズムについて論じる。その後、KG、LLM内の型情報を利用したアルゴリズムに移行し、最後に、異なる記述論理公理で表されるセマンティクスをキャプチャするアルゴリズムに移行する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:00:37 GMT)
RIDGE: Reproducibility, Integrity, Dependability, Generalizability, and Efficiency Assessment of Medical Image Segmentation Models [1.5]
本稿では, 深層学習に基づく医用画像分割モデルの再現性, 統合性, 依存性, 一般化性, 効率性を評価するための RIDGE チェックリストを提案する。 RIDGEチェックリストは単なる評価ツールではなく、研究の質と透明性の向上を目指す研究者のためのガイドラインでもある。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:57:53 GMT)
The sudden death of quantum advantage in correlation generations [1.4]
量子ノイズの強度が0から連続的に上昇すると、量子的優位性は徐々に低下し、最終的には完全に消える。驚くべきことに、いくつかのケースでは、量子ノイズの強さが一定の点を超えると、量子の利点は無視できないレベルから突然消えてしまう。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:22:53 GMT)
Cheshire qudits from fractional quantum spin Hall states in twisted MoTe$_2$ [1.4]
ツイストされたMoTe$$$ホモ双層は、分数量子スピンホール(FQSH)状態と整合した輸送シグネチャを示す。我々は,そのようなFQSH状態のパンチホールから形成された,チェシャークイディットと呼ばれるトポロジカル量子メモリ要素を構築する経路について述べる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:01 GMT)
AntibotV: A Multilevel Behaviour-based Framework for Botnets Detection in Vehicular Networks [1.4]
本稿では,車載ネットワークにおける車載ボットネット検出のためのマルチレベル動作ベースフレームワークであるAntibotVを提案する。提案するフレームワークは,攻撃検知のための2つの主要モジュールを結合し,第1のモジュールはネットワークレベルで車両の活動をモニタし,第2のモジュールは車内活動をモニタする。実験の結果,提案手法は既存手法よりも優れており,検出率は97%以上であり,偽陽性率は0.14%以下であることがわかった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:07:49 GMT)
Machine Learning Models for Improved Tracking from Range-Doppler Map Images [1.4]
地中移動目標指標(GMTI)レーダのレンジ・ドップラー・マップ(RDM)画像におけるターゲット検出と不確実性推定のための新しい機械学習モデルを提案する。これらのモデルの出力を用いることで、複雑なマルチターゲット空対地追跡シナリオに対して、複数の仮説トラッカーの性能を大幅に向上できることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:20:24 GMT)
Domain-independent detection of known anomalies [1.3]
異常検出アプローチは、スパースな名目データで訓練することができるが、ドメインの一般化アプローチは、以前は目に見えないドメイン内のオブジェクトを検出することができる。 3つの新しいデータセットを生成することにより、確立されたMVTec ADデータセットを改良する。 SEMLPは、平均画像レベルのAUROCが87.2%であるのに対して、MIROは80.4%である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:35:52 GMT)
GPTQT: Quantize Large Language Models Twice to Push the Efficiency [1.3]
本稿では,学習後量子化手法であるGPTQTを導入し,メモリ使用量の削減と処理速度の向上を図る。重みの量子化誤差の最小化は非効率であり、過度に適合することを示した。 GPTQTは、最初は線形量子化を用いて重みを相対的に高いビットに量子化し、続いて得られた重みを低ビットバイナリ符号化に変換する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:08:01 GMT)
Efficient Fusion and Task Guided Embedding for End-to-end Autonomous Driving [1.3]
我々は,センサ融合と安全リスク予測の課題に対処するため,EfficientFuserというコンパクトで強力なソリューションを導入した。 CARLAシミュレーションプラットフォームで評価されたEfficientFuserは、パラメータの37.6%しか利用せず、顕著な効率性を示している。安全スコアは、その有効性と、自律運転システムへの実用的展開の可能性を示す主要な安全性向上手法に近づいた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:45:58 GMT)
Enhancements for Real-Time Monte-Carlo Tree Search in General Video Game Playing [1.3]
本稿では,汎用ゲームプレイング(GVGP)におけるモンテカルロ木探索(MCTS)の8つの拡張について論じる。これらのいくつかは既存の文献から知られており、拡張またはGVGPの文脈で導入されている。ほとんどの拡張は、個別に適用された場合の勝利率の統計的に有意な増加をもたらすことが示されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:18:28 GMT)
Regurgitative Training: The Value of Real Data in Training Large Language Models [1.3]
LLMの性能に及ぼす「相対的学習」の影響について検討した。退行訓練がLSMの性能を著しく向上させる強い証拠が得られている。本稿では,3つの異なる戦略を提案して評価する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:42:55 GMT)
IWISDM: Assessing instruction following in multimodal models at scale [1.2]
我々は,視覚言語タスクの無制限な配列を生成するために,指示された仮想VISual Decision Making (iWISDM)環境を紹介する。 iWISDMを用いて,様々な複雑性レベルにわたる視覚課題に追従する命令の3つの異なるベンチマークをコンパイルした。本研究は,既存のマルチモーダルモデルと創発的マルチモーダルモデルの両方の命令順守性を評価するための頑健なベンチマークとしてiWISDMを確立した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:44:23 GMT)
Towards Human-AI Collaboration in Healthcare: Guided Deferral Systems with Large Language Models [1.2]
大規模言語モデル(LLM)は、医療における様々なアプリケーションに有用な技術を提供する。彼らの幻覚傾向は、批判的な意思決定の状況において受け入れ難い不確実性をもたらす。人間とAIのコラボレーションは、より良い結果を得るために人間とAIの強みを組み合わせることで、この不確実性を軽減することができる。本稿では,AIが人間の意思決定者に対してケースをデフェクトした場合にインテリジェントなガイダンスを提供する,新しいガイド付きデフェラルシステムを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:49:15 GMT)
A multi-objective combinatorial optimisation framework for large scale hierarchical population synthesis [1.2]
エージェントベースのシミュレーションでは、エージェントの合成集団は個人の構造、行動、相互作用を表現するために一般的に使用される。大規模集団合成のための多目的最適化手法を提案する。提案手法は, 個人と世帯間の複雑な階層構造をサポートし, 大規模に拡張可能であり, 連続表復元誤差の最小化を実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:01:12 GMT)
Individual Tree Detection in Large-Scale Urban Environments using High-Resolution Multispectral Imagery [1.2]
本研究では,都市環境における個々の木検出のための新しい深層学習手法を提案する。畳み込みニューラルネットワークを用いて、個々の木の位置を示す信頼マップを回帰する。本手法は,公共空間とプライベート空間の両方で樹木を検出することによって,完全な空間被覆を実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:23:16 GMT)
Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition [1.1]
本稿では,ターゲットアクセントに関する事前知識を必要としないQifusion-Netと呼ばれる層適応核融合モデルを提案する。実験の結果,提案手法は,複数のアクセントテストデータセットに対して,22.1$%と17.2$%の文字誤り率(CER)を相対的に低減し,ベースラインを上回った。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:35:52 GMT)
A higher-order transformation approach to the formalization and analysis of BPMN using graph transformation systems [1.1]
本稿ではBPMNの実行セマンティクスの形式化を提案する。私たちのアプローチは、BPMNモデルからグラフ変換システムへの高次の変換に基づいています。このアプローチの能力を示すため、オープンソースのWebベースツールとして実装しました。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:28:48 GMT)
Smart City Surveillance Unveiling Indian Person Attributes in Real Time [1.1]
このプロジェクトは、人々の属性をリアルタイムで識別し分析できる、インドの都市のためのスマート監視システムの構築に焦点を当てている。人工知能や機械学習などの高度な技術を使って、システムは上半身の色、身に着けているもの、装着しているアクセサリー、ヘッドギアなどの属性を認識できる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:47:59 GMT)
LLMcap: Large Language Model for Unsupervised PCAP Failure Detection [1.0]
機械学習は代替手段を提供するが、ラベル付きデータの不足は精度を制限している。そこで本研究では,PCAP故障検出のための自己教師付き大規模言語モデル(LLMcap)を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:59:27 GMT)
A multicategory jet image classification framework using deep neural network [0.9]
著者らは、粒子とジェットの特徴抽出によるジェットカテゴリー分離性に注目し、その結果、ジェット分類のための計算効率の良い解釈可能なモデルを生み出した。この研究は、分離可能な潜在空間で表される高次元データセットがジェット分類のためのより単純なアーキテクチャをもたらすことを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 22:00:35 GMT)
The solving degrees for computing Gröbner bases of affine semi-regular polynomial sequences [0.9]
本研究では,アフィン半正則配列の解度とその均質化配列について検討する。これらの結果は,Gr"オブザーバー基底の計算方法の正確性に関する数学的に厳密な証明を与えると考えられる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:03:56 GMT)
Accelerating quantum imaginary-time evolution with random measurements [0.9]
量子想像時間進化(Quantum imaginary-time evolution、QITE)は、ハミルトニアンの温度または基底状態を作成するための有望なツールである。量子フィッシャー情報行列(QFIM)の高速化によるQITEの高速化本稿では,いくつかの分子システムで実演し,試行するランダム計測想像時間進化(RMITE)アルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:06:32 GMT)
Entropy-based Guidance of Deep Neural Networks for Accelerated Convergence and Improved Performance [0.9]
完全に接続された畳み込みニューラルネットワークの処理データとしてエントロピーの変化を測定するために、新しい数学的結果を得る。ネットワーク処理データとしてのエントロピーの変化を効果的に測定することにより、良好なネットワークに不可欠なパターンを視覚化し、同定することができる。ベンチマークデータセットにおける画像圧縮、画像分類、イメージセグメンテーションの実験は、これらの損失がニューラルネットワークを誘導し、少ない次元でリッチな潜在データ表現を学習することを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:15:39 GMT)
Membership Inference Attacks Against Time-Series Models [0.8]
個人情報を含む可能性のある時系列データは、特に医療分野において、深刻なプライバシー上の懸念を生じさせる。推論攻撃(MIA)はこの種の評価の鍵となる手法であるが,この文脈では時系列予測モデルが十分に研究されていない。時系列モデルにおける既存のMIA技術について検討し、データの季節性やトレンドに焦点をあてた新機能を紹介する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:34:49 GMT)
Can machine learning solve the challenge of adaptive learning and the individualization of learning paths? A field experiment in an online learning platform [0.8]
デジタル技術に基づく学習内容の個別化は、大きな個人的および社会的利益をもたらす。大規模なデジタル自己学習プラットフォーム上でランダム化制御試験を行う。我々は,2つの畳み込みニューラルネットワークに基づくアルゴリズムを開発し,学習経路に応じて4,365ドルの学習者にタスクを割り当てる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:04:05 GMT)
Implementation and Analysis of GPU Algorithms for Vecchia Approximation [0.8]
Vecchia Approximationは計算複雑性を減らすために広く使われており、恥ずかしい並列アルゴリズムで計算することができる。 Vecchia Approximationのためにマルチコアソフトウェアが開発されたが、グラフィックス処理ユニット(GPU)上で動作するように設計されたソフトウェアは不足している。我々の新しい手法は他の2つより優れており、GpGpU Rパッケージに表示されます。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:24:44 GMT)
Measuring Trotter error and its application to precision-guaranteed Hamiltonian simulations [0.8]
本研究では,量子回路上でのアシラリー量子ビットを使わずにトロッター誤差を測定する手法を開発した。我々は、トロッター化精度を保証し、トロッター$(m,n)$というアルゴリズムを開発する。適応的に選択された$mathrmdt$は、既知のトロッター誤差の上限から推定されるものより約10倍大きい。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:37:26 GMT)
Fast photon-mediated entanglement of continuously-cooled trapped ions for quantum networking [0.8]
我々は、各イオンから1つの可視光子を真空0.8NAの目的によって集めることで、2つのコトラップされた原子バリウムイオン量子ビットを絡み合わせる。これにより、クォービットは、観測された忠実度が F > 94% 以下の絡み合ったベル状態に投影される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:56:22 GMT)
Magnetic Hysteresis Modeling with Neural Operators [0.8]
本稿では、磁場間のマッピングを学習することで、磁場を示す法則をモデル化するためのニューラル演算子を提案する。ニューラル演算子(ディープ演算子ネットワークとフーリエニューラル演算子)は、新しい一階反転曲線とマイナーループを予測するために使用される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:45:45 GMT)
What's the Magic Word? A Control Theory of LLM Prompting [0.7]
我々は制御理論のレンズを通して迅速な工学を探求する。 LLMのパネルの制御性に関する実験結果を示す。短いプロンプトシーケンスは、特定の出力の可能性を劇的に変えることができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 22:23:50 GMT)
Low-variance observable estimation with informationally-complete measurements and tensor networks [0.7]
本稿では, 統計的誤差の低い複数観測値の非バイアス推定器を提案する。この方法は、テンソルネットワークに基づく測定データの観測可能固有古典最適化から成り立っている。低結合次元のテンソルネットを用いた場合においても最適推定がいかにできるかを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:55:37 GMT)
Can GitHub Issues Help in pp Review Classifications? [0.7]
GitHubイシューから抽出した情報を活用することでラベル付きデータセットの拡張を支援する新しいアプローチを提案する。以上の結果から,データ拡張にラベル付き問題を用いることで,F1スコアが6.3,機能要求が7.2に向上することが示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:54:04 GMT)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.7]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:31:30 GMT)
Iris and Palmprint Multimodal Biometric Recognition using Novel Preactivated Inverted ResNet and Hybrid Metaheuristic Optimized DenseNet [0.7]
本稿では,アイリスとヤシプリントを用いた深層学習アルゴリズムを用いた新しいマルチモーダルバイオメトリック認識システムを提案する。システムの性能は、精度、検出誤差トレードオフ(DET)曲線、EER(Equal Error Rate)曲線、トータルトレーニング時間に基づいて評価される。 CASIA Palmprint、MMU、BMPD、IITデータセットでテストされたマルチモーダル認識アーキテクチャは、100%の認識精度を実現し、不定形虹彩およびパームプリント識別アプローチを上回っている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:55:15 GMT)
3D Multimodal Image Registration for Plant Phenotyping [0.7]
植物フェノタイピングのための複合マルチモーダルモニタリングシステムにおける複数のカメラ技術の利用は、有望な利益をもたらす。クロスモーダルパターンの有効利用は、ピクセル・正確なアライメントを実現するために、正確な画像登録に依存する。本稿では,飛行時間カメラからの深度情報を登録プロセスに統合することにより,これらの課題に対処する新しいマルチモーダル3D画像登録手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:29:46 GMT)
YOLOv5, YOLOv8 and YOLOv10: The Go-To Detectors for Real-time Vision [0.7]
本稿では、YOLOv5, YOLOv8, YOLOv10に着目し、YOLO(You Only Look Once)オブジェクト検出アルゴリズムの進化に焦点を当てた。これらのバージョンにまたがるエッジデプロイメントのアーキテクチャの進歩、パフォーマンスの改善、適合性を分析します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:40:20 GMT)
Comparing Feature-based and Context-aware Approaches to PII Generalization Level Prediction [0.6]
テキストデータのPIIはプライバシにとって重要であるが、現在の一般化手法では、不均一なデータ配信やコンテキスト認識の制限といった課題に直面している。本稿では、構造化された入力の性能向上に機械学習を用いた特徴ベース手法と、原文と一般化された候補との間のより広い文脈と意味的関係を考慮したコンテキスト認識フレームワークを提案する。 WikiReplaceデータセットの実験では、両方の方法の有効性が示され、コンテキスト認識アプローチは、さまざまなスケールで機能ベースのものよりも優れています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:32:03 GMT)
Nonlocal coherence harvesting from quantum vacuum [0.6]
量子真空から粒子検出器に収穫される非局所コヒーレンスを解析する。我々は、非局所コヒーレンスの収穫達成可能な分離範囲が量子絡み合いよりも大きいことを発見した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:36:18 GMT)
Predicting and Understanding Turn-Taking Behavior in Open-Ended Group Activities in Virtual Reality [0.5]
ネットワーク型バーチャルリアリティ(VR)では、ユーザー行動、個人差、グループダイナミクスが将来の音声行動の重要なシグナルとなる。本研究では,社会的ダイナミクスの文献から抽出した特徴を用いたターンテイク行動の予測を行う。 77セッションと1660分間の少人数のソーシャルインタラクションからなる大規模なVR教室データセットの結果について論じる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:17:59 GMT)
Floquet geometric entangling gates in ground-state manifolds of Rydberg atoms [0.5]
我々は、量子エンタングゲートを構築するために、リドベルク原子におけるフロケ理論の新たな応用を提案する。レイドベルク封鎖の時代には、エラー耐性の2量子エンタングゲートを実装できる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:21:21 GMT)
Clifford Circuits Augmented Time-Dependent Variational Principle [0.5]
最近提案された Clifford Circuits Augmented Matrix Product States (CA-MPS) は, Clifford Circuits による密度行列再正規化群をシームレスに増強する。時間進化シミュレーションのための時間依存変動原理(TDVP)の枠組みにCA-MPSを一般化する。クリフォード回路拡張TDVP法により,時間発展過程における絡み合いのエントロピーを低減できることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:34:15 GMT)
How Reliable and Stable are Explanations of XAI Methods? [0.5]
ブラックボックスモデルは、社会の中で生活している人間の日常生活にますます使われている。 XAI(Explainable Artificial Intelligence)メソッドが登場し、モデルが特定の予測を行う方法に関するさらなる説明が生まれている。その結果、現在のXAI法は1つの特定の方法を除いて摂動に敏感であることが判明した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:47:41 GMT)
Explanations Based on Item Response Theory (eXirt): A Model-Specific Method to Explain Tree-Ensemble Model in Trust Perspective [0.5]
Ciu、Dalex、Eli5、Lofo、Shap、Skaterといった手法がブラックボックスモデルを説明するために登場した。 Xirtは、ツリーアンサンブルモデルのグローバルな説明とIRTを通してモデルのインスタンスのローカルな説明を生成することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:08:04 GMT)
Gradual Verification for Smart Contracts [0.5]
Algosはスマートコントラクトを通じてセキュアなリソーストランザクションを実現する。従来の検証技術は、包括的なセキュリティ保証の提供に不足している。本稿では,段階的検証という段階的なアプローチを紹介する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:23:18 GMT)
Transformers and Cortical Waves: Encoders for Pulling In Context Across Time [0.4]
本研究では,入力シーケンス中の単語のペア間の関連性を計算することにより,変換器の時間的文脈を向上できることを示す。単一大脳皮質領域や複数の領域を横断する神経活動の波は、同様の符号化原理を実装できる可能性が示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:41:07 GMT)
Quantum State Synthesis: Relation with Decision Complexity Classes and Impossibility of Synthesis Error Reduction [0.3]
本研究では、量子状態合成複雑性クラスと従来の決定複雑性クラスとの関係について検討する。特に,量子状態合成複雑性クラスにおける合成の質を特徴付ける合成誤差パラメータの役割について検討する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:26:38 GMT)
Matrix product state approximations to quantum states of low energy variance [0.3]
有限エネルギー密度を持つ1次元系における純粋量子状態の効率的なシミュレート方法を示す。我々は、スペクトルの大部分に中程度の絡み合いエントロピーを持つ非常に狭い支持状態が存在することを証明した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:41:00 GMT)
Balancing Patient Privacy and Health Data Security: The Role of Compliance in Protected Health Information (PHI) Sharing [0.3]
保護された健康情報(PHI)の共有は、患者のケアの質とコーディネーションを著しく向上させ、より正確な診断、効率的な治療計画、患者の歴史の包括的理解に寄与する。 HIPAAのような法律で要求されるような厳格なプライバシーとセキュリティポリシーへのコンプライアンスは、PHIを保護するために重要である。我々は、スマートコントラクトを統合し、同意関連プロセスを部分的に自動化し、PHIへのアクセスと共有が患者の好みや法的要件に従っていることを保証するブロックチェーン技術を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:49:33 GMT)
Decomposition of Difficulties in Complex Optimization Problems Using a Bilevel Approach [0.3]
実際の最適化問題には、特定の最適化方法に依存する場合、しばしば難解な様々な困難が含まれている。複雑な最適化問題に対して2つのアプローチを同時に適用できる分解戦略を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:59:17 GMT)
A primer on synthetic health data [0.3]
深層生成モデルの最近の進歩は、現実的な合成健康データセットを作成する可能性を大きく広げている。これらの合成データセットは、患者のアイデンティティやセンシティブな情報を開示することなく、特徴、パターン、全体的な科学的結論を保存することを目的としている。しかし、合成データセットの類似性と予測ユーティリティを継続的に評価する方法など、多くの疑問や課題が残っている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:28:13 GMT)
STF: Sentence Transformer Fine-Tuning For Topic Categorization With Limited Data [0.3]
Sentence Transformers Fine-tuning (STF) は、事前訓練されたSentence Transformersモデルと微調整を利用して、ツイートからトピックを正確に分類するトピック検出システムである。我々の主な貢献は、事前訓練された文変換言語モデルを適用することで、ツイートトピック分類における有望な結果の達成である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:34:56 GMT)
Beating Grover search for low-energy estimation and state preparation [0.2]
多体ハミルトニアンの基底状態エネルギーの推定は、量子物理学の多くの分野において中心的な課題である。この研究において、量子アルゴリズムは、任意の$k$ボディハミルトン$H$を与えられた場合、基底状態エネルギーの見積もりを計算する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:47:06 GMT)
AI Emergency Preparedness: Examining the federal government's ability to detect and respond to AI-related national security threats [0.2]
緊急準備は、政府のAI進捗の監視と予測能力を向上させることができる。 1)コントロールの喪失(人間のコントロールを逃れることのできる強力なAIシステムからの脅威)、(2)悪意のあるアクターによるサイバーセキュリティの脅威、(3)生物兵器の増殖。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:54:01 GMT)
Maximizing Blockchain Performance: Mitigating Conflicting Transactions through Parallelism and Dependency Management [0.2]
競合トランザクションは、高いネットワーク遅延とトランザクション障害に寄与する。トランザクション並列性とインテリジェントな依存性マネージャを統合した,新たなスキームを提案する。その結果,提案方式は既存の並列および非並列のHyperledger Fabricブロックチェーンネットワークよりも優れていた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:33:43 GMT)
Synthetic data: How could it be used for infectious disease research? [0.2]
人工データセット生成の可能性に関連する潜在的な負の要因について懸念が高まっている。これには、サイバー犯罪のような分野における生成的人工知能の潜在的な誤用が含まれる。合成データは、特にデータプライバシ、研究、データセットのバランシングと機械学習モデルのバイアス低減において、大きなメリットを提供する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:13:04 GMT)
Large Language Models as Evaluators for Scientific Synthesis [0.2]
我々は,5つの関連論文の要約から,GPT-4による100の質問とそれらの合成のデータセットを用いて,人間の品質評価を検証した。予備的な結果から、LLMは品質評価に幾らか適合する論理的説明を提供することができるが、より深い統計分析により、LLMと人間の評価との間には弱い相関関係が示されている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:21:27 GMT)
Development of Machine Learning Classifiers for Blood-based Diagnosis and Prognosis of Suspected Acute Infections and Sepsis [0.2]
急性感染症・敗血症の迅速かつ正確な診断・予後の医学的ニーズに機械学習を適用した。我々のソリューションは、Mirna (TM) Instrument と組込み TriVerity (TM) 分類器からなる。マーナ・トリバーティ・システムはアメリカ合衆国食品医薬品局(FDA)によって画期的な装置に指定された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:20:26 GMT)
Self-supervised Vision Transformer are Scalable Generative Models for Domain Generalization [0.1]
病理組織像における領域一般化のための新しい生成法を提案する。本手法では,画像パッチの特徴を動的に抽出するために,生成型自己教師型視覚変換器を用いる。 2つの異なる病理組織学的データセットを用いて行った実験は,提案手法の有効性を示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:20:27 GMT)
Human-like Linguistic Biases in Neural Speech Models: Phonetic Categorization and Phonotactic Constraints in Wav2Vec2.0 [0.1]
We study how how Wav2Vec2solvs phonotactic constraints。我々は/l/と/r/の音響連続体に音を合成し、制御された文脈に埋め込む。人間と同様に、Wav2Vec2モデルは、このようなあいまいな音を処理する際に、音素的に許容できるカテゴリーに対してバイアスを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:04:31 GMT)
Explainable vertebral fracture analysis with uncertainty estimation using differentiable rule-based classification [0.1]
深部神経回路を用いた低用量XVFAを用いた新しい脊椎骨折診断法を提案する。我々はGenantの半定量基準を、椎骨骨折の成績と形態を分類する異なる規則に基づく方法として取り入れた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:57:35 GMT)
High-Entanglement Capabilities for Variational Quantum Algorithms: The Poisson Equation Case [0.1]
離散方程式行列(DPEM)は計算流体力学の分野において不可欠である。量子コンピュータでそれを解くアルゴリズムは、指数空間と時間複雑性のスピードアップを与える可能性がある。本研究は,計算流体力学の将来に量子コンピュータが関与することを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:21:08 GMT)
ZEAL: Surgical Skill Assessment with Zero-shot Tool Inference Using Unified Foundation Model [0.1]
本研究はZEAL (unifiEd foundAtion modeLを用いたゼロショット手術ツールセグメンテーションによる外科的スキル評価)について紹介する。 ZEALはセグメンテーションマスクを予測し、楽器と周辺の両方の本質的な特徴を捉えている。外科的スキルスコアを生成し、客観的な熟練度を提供する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:20:56 GMT)
A new heuristic approach for contextuality degree estimates and its four- to six-qubit portrayals [0.1]
本稿では,量子的文脈構成の文脈性度とそれに対応する不満足な部分の上限を求める新しい手法を紹介し,記述する。 SATソルバをベースとした従来手法は3キュービットに制限されていたが,本手法はより高速で汎用性が高い。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:59:30 GMT)
Identification of Device Dependencies Using Link Prediction [0.1]
グラフベース機械学習に基づく新しいアプローチを用いて,依存関係の識別に対処する。この手法は、コンピュータネットワークの通信グラフの潜在表現に基づくリンク予測に属する。ネットワーク依存に課される時間条件を満たすIPアドレスをランダムにウォーキングする。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:28:09 GMT)
When big data actually are low-rank, or entrywise approximation of certain function-generated matrices [0.0]
我々は、特定の分析関数のクラスに対して、そのような行列は$m$に依存しないランクの正確なエントリーワイズ近似を許容する、という文献の議論に反論する。 n × n$ の関数生成行列が次数 $varepsilon$ のエントリーワイド誤差で階数 $mathcalO(log(n) varepsilon-2 Mathrmpolylog(varepsilon-1)$ で近似できる関数のより狭い3つのクラスを記述する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:29:47 GMT)
Visual Robustness Benchmark for Visual Question Answering (VQA) [0.0]
213,000枚の画像からなる最初の大規模ベンチマークを提案する。複数のVQAモデルの視覚的堅牢性に挑戦し、現実的な視覚的腐敗の強さを評価する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:35:03 GMT)
Variational Quantum Crank-Nicolson and Method of Lines for the Solution of Initial Value Problems [0.0]
Inlicit Crank-Nicolson と Method of Lines (MoL) による初期値問題の解法として変分量子アルゴリズムを用いる。実装を説明するために開発された例は、Advection equation、一階結合方程式系として記述された波動方程式、非線形の場合として粘性バーガース方程式である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:30:50 GMT)
Using Natural Language Processing and Networks to Automate Structured Literature Reviews: An Application to Farmers Climate Change Adaptation [0.0]
本研究の目的は、変数関係を抽出し、それらの結果をネットワークを用いて合成することで、自然言語処理を巧みに活用することである。一例として,農家の気候変動適応の分析に本手法を適用した。その結果,自然言語処理とネットワークを記述的手法で併用することで,文献レビューの結果を高速かつ解釈可能な方法で合成できることが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:41:20 GMT)
Universal Quantum Tomography With Deep Neural Networks [0.0]
純量子状態トモグラフィーと混合量子状態トモグラフィーの両方に対する2つのニューラルネットワークに基づくアプローチを提案する。提案手法は,実験データから混合量子状態の再構成を行なえることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:15:26 GMT)
Understanding and Generalizing Unique Decompositions of Generators of Dynamical Semigroups [0.0]
量子力学的半群のすべての生成元は、両方のトレースが消滅すると仮定して、一意に閉部分と散逸部分に分解されることを示す。上記の分解は、B$重み付き内積に関するものであることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:20:56 GMT)
Towards Asimov's Psychohistory: Harnessing Topological Data Analysis, Artificial Intelligence and Social Media data to Forecast Societal Trends [0.0]
ビッグデータや高度な計算手法の時代には、大規模社会行動の予測がますます実現可能になっている。本稿では,計算能力と数学的枠組みの統合を理論的に検討する。これらのツールは、大きなコミュニティのダイナミクスに前例のない明快さをもたらしている、と私は論じます。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:44:36 GMT)
Tensor Networks for Lattice Gauge Theories beyond one dimension: a Roadmap [0.0]
ネットワーク法(Network method)は、平衡外における多体量子システムを研究するための数値ツールとアルゴリズムのクラスである。彼らは高エネルギー物理学における関連する問題に近づく格子ゲージ理論のシミュレーションに重要な応用を見出した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:30:04 GMT)
Teleporting two-qubit entanglement across 19 qubits on a superconducting quantum computer [0.0]
我々は、127量子ビットのIBM量子デバイス上で準備された2量子状態の絡み合いと忠実さを測定し、追跡する。 2ビットグラフ状態の絡み合いは、選択後のアプローチを用いて、少なくとも19ホップのテレポーテーション後に持続することを示す。ゲート誤差から得られたものと比較して,2ビットの負性から決定される経路において,より高いレベルのテレポーテッド絡みを観測する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:18:06 GMT)
Superselection rules and bosonic quantum computational resources [0.0]
計算能力に基づいて量子光学的非古典的資源を特定し分類する。我々の研究は、量子光学の連続的な性質から離散的な性質へのシームレスな遷移を確立するのに寄与する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:18:41 GMT)
Strong quantum nonlocality without entanglement in every $(n-1)$-partition [0.0]
厳密な証明は、これらの集合がすべての$(n-1)-分割において局所的に既約であることを示している。また,非局所性について,絡み合わずに理解を深めることができた。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:57:10 GMT)
Strong Charge-Photon Coupling in Planar Germanium Enabled by Granular Aluminium Superinductors [0.0]
我々は、抵抗量子を超える特性インピーダンスを持つ粒状アルミニウム共振器を統合した。強い電荷-光子結合と$g_textc/2pi= (566 pm2)$ MHz の速度を示す。この方法は、新しい量子ビットと高忠実で長距離2量子ゲートの経路を開く。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:53:01 GMT)
Simulating electron-vibron energy transfer with quantum dots and resonators [0.0]
ゲート可能な半導体量子ドット(QD)は、アナログ量子シミュレーションのための汎用的なプラットフォームを提供する。単一モードマイクロ波共振器をQDに容量的に結合することで分子振動モードを表現する。電圧バイアス三重量子ドット(TQD)系から単一減衰共振器モードへのゲート可変エネルギー移動について検討した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:35:17 GMT)
Sentence-level Aggregation of Lexical Metrics Correlate Stronger with Human Judgements than Corpus-level Aggregation [0.0]
個々のセグメントレベルのスコアを平均すると、BLEUやchrFのようなメトリクスは人間の判断と非常に強く相関する。本稿では,低リソース言語に対する機械翻訳システムの評価をより信頼性の高いものにする上で有効である。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:46:24 GMT)
Self-supervised Pretraining for Partial Differential Equations [0.0]
本稿では、トランスフォーマーに基づくニューラルネットワークアーキテクチャの最近の進歩を活用し、ニューラルPDEソルバを構築するための新しいアプローチについて述べる。我々のモデルは、ネットワークを再トレーニングすることなく、PDEパラメータの異なる値に対するソリューションを提供することができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:39:32 GMT)
Security Approaches for Data Provenance in the Internet of Things: A Systematic Literature Review [0.0]
Internet of Things(IoT)は、保護されていない環境にデプロイされるリソース制限されたデバイスに依存している。シングルホップとマルチホップのシナリオでは、データ転送中にさまざまなタイプのリスクが直面する可能性がある。これらの脆弱性に対処することが重要です。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:25:36 GMT)
SD-BLS: Privacy Preserving Selective Disclosure of Verifiable Credentials with Unlinkable Threshold Revocation [0.0]
本稿では,デジタル認証の取り消しを目的とした情報開示とプライバシ保護手法を提案する。提案手法は,特定の発行者によって署名された証明書を選択的に公開することを保証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:57:25 GMT)
SAVE: Segment Audio-Visual Easy way using Segment Anything Model [0.0]
そこで本研究では,AVSタスクに対して,事前学習セグメントモデル(SAM)を効率的に適用するための軽量なアプローチSAVEを提案する。提案手法は,符号化段階における効果的な音声と視覚の融合と相互作用を実現する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 23:49:36 GMT)
Revealing symmetries in quantum computing for many-body systems [0.0]
量子コンピュータ上での評価のためにジョルダン・ウィグナー形式で用意された多体ハミルトニアンの対称性特性を導出する。我々は、対称性演算の下でパウリテンソル弦の変換を計算する簡単な方法を提供する一般的な定理を証明する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:53:09 GMT)
RDBE: Reasoning Distillation-Based Evaluation Enhances Automatic Essay Scoring [0.0]
Reasoning Distillation-Based Evaluation (RDBE) は、解釈可能性を統合し、モデルスコアの背景にある理論的根拠を解明する。実験により, データセットに考慮したすべてのスコアリングルーリックに対してRDBEの有効性が示された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:49:01 GMT)
Qudit-native measurement protocol for dynamical correlations using Hadamard tests [0.0]
動的相関は、基礎となる量子多体系の重要な平衡特性を示す。我々は、quditオブザーバブルをユニタリ演算に分解することで、この制限を克服する修正されたプロトコルを提案する。この方式は様々なプラットフォームで容易に実装でき、幅広いアプリケーションを提供できる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:01:29 GMT)
Quasi-probability distribution of work in a measurement-based quantum Otto engine [0.0]
測定に基づく量子オットーエンジンの動作統計について検討し、そこでは量子非選択的測定を用いてエンジンを駆動する。我々は、ある作業値の確率が負になりうることを実証し、位相空間で見られる準確率分布と似ていることを示した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:09:10 GMT)
Quantum dynamical criticality speeds up thermodynamic entropy production [0.0]
エントロピー生成の幾何学的視点を通して, 熱力学の第二法則に動的臨界度を接続する。以上の結果から, 動的臨界がシステムに極めて複雑な力学をもたらすことが示唆され, 熱伝達経路の可能性が示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:57:00 GMT)
Prediction Instability in Machine Learning Ensembles [0.0]
機械学習では、複数のモデルからの予測が集約される。本稿では,任意のアンサンブルが,以下の予測不安定性の少なくとも1つの形態を示すことを示す。基礎となるすべてのモデル間の合意を無視したり、基礎となるモデルがどれもそうしていない場合、その考えを変更したり、実際に予測しないオプションを含めたり除外したりすることで、操作可能になります。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:26:02 GMT)
Position and Altitude of the Nao Camera Head from Two Points on the Soccer Field plus the Gravitational Direction [0.0]
サッカーをするためには、ロボットはフィールド上の現在の位置を適切に見積もる必要がある。標準プラットフォームリーグの直ロボットは視野が限られているため、カメラフレームが認識できるのは1つか2つの点のみである。簡易テトラヘドロンの形状から,カメラの被写体と高さhの座標(x, y)を決定する手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:06:34 GMT)
Plant Doctor: A hybrid machine learning and image segmentation software to quantify plant damage in video footage [0.0]
本研究では,アクセス可能なカメラで撮影した映像を用いて,街路植物の自動診断を行うAIシステムを提案する。本システムは,都市部における病気のコントロールを支援するため,日常的に植物の健康をモニタリングすることを目的としている。その結果, 葉の損傷診断におけるシステムの堅牢性と精度が示され, 大規模都会の植物病モニタリングにも応用できる可能性が示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:11:18 GMT)
Parametric Light-Matter Interaction in the Single-Photon Strong Coupling Limit [0.0]
本稿では、パラメトリック結合マイクロ波回路の新しいパラダイムを実証する。 1つの線形マイクロ波空洞を超伝導トランスモン量子ビットに置き換える。強いサイドバンド駆動を適用すると、オンデマンドで非線形のJaynes-Cummingsが線形共振器と相互作用する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:43:52 GMT)
PPO-based Dynamic Control of Uncertain Floating Platforms in the Zero-G Environment [0.0]
本稿では,PPO(Proximal Policy Optimization)とMPC(Model Predictive Control)を組み合わせた革新的なアプローチを提案する。従来の制御手法とは異なり、このPPO-MPCアプローチはMPC予測から学習し、モデル化されていない力学や乱れに適応する。この研究は、宇宙探査の進歩を約束するゼロ重力環境における浮体プラットフォーム制御の新しい可能性を開く。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:51:06 GMT)
PCL-Indexability and Whittle Index for Restless Bandits with General Observation Models [0.0]
我々は、任意の初期信念から始まる可算な信念状態空間を持つレスレス・バンディットとして問題を定式化する。有限状態問題に対するNino-Mora と Bertsimas の AG アルゴリズムを適用可能な問題に変換する近似法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:09:14 GMT)
Out-of-equilibrium Eigenstate Thermalization Hypothesis [0.0]
観測可能な状態行列要素と初期状態行列要素との間の指数関数的に小さな相互相関が緩和ダイナミクスを平衡に向けて決定することを示す。スケーリングと相互相関を数値的に検証し、高周波挙動の創発性を指摘し、一般化の可能性を概説する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:20:49 GMT)
OSPC: Artificial VLM Features for Hateful Meme Detection [0.0]
本稿では,AI Singapore Online Safety Prize Challenge において,チーム 'Baseline' によって開発されたソリューションを紹介する。計算効率と特徴工学に重点を置き、AUROCは0.76、精度は0.69に達した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:35:52 GMT)
Numerical solution of nonlinear Schrödinger equation by a hybrid pseudospectral-variational quantum algorithm [0.0]
時間依存型1次元非線形シュリンガー方程式(NLSE)は、ハイブリッド擬スペクトル偏差量子アルゴリズムにより数値的に解かれる。量子アルゴリズムの精度を分析し,古典的手法と比較する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:40:31 GMT)
Multiparameter critical quantum metrology with impurity probes [0.0]
臨界量子量論の新しいパラダイムとして、2IKモデルを導入する。既知の制御場を適用することにより,特異性を除去し,測定感度を回復できることを実証する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:59:14 GMT)
Multi-Attention Integrated Deep Learning Frameworks for Enhanced Breast Cancer Segmentation and Identification [0.0]
超音波画像を用いた乳腺腫瘍の正確な診断・分類は医学的課題である。本研究は,乳がん腫瘍の超音波画像からの分類と分類を目的とした多目的ディープラーニング(DL)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:40:26 GMT)
Meson Mass Sets Onset Time of Anomalous Dynamical Quantum Phase Transitions [0.0]
我々は、異常DQPTの開始時刻が、大域対称性破壊相の閉じ込められた状態における中間子質量と、電力法則を介して直接接続されているかを示す。以上の結果から,中間子と異常DQPTの直接的関連が指摘され,外因性極端平衡臨界度を分類するための後者のパワーが強調された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:00 GMT)
MedPix 2.0: A Comprehensive Multimodal Biomedical Dataset for Advanced AI Applications [0.0]
本稿では、データセットMedPix 2.0を構築するためのワークフロー全体について説明する。データセットとともに、MongoDBインスタンスを効率的にナビゲートするためのGUIを開発しました。また、分類タスクをスキャンするために、MedPix 2.0でトレーニングされたCLIPベースのモデルを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:49:21 GMT)
Majorana fermion induced power-law scaling in the violation of Wiedemann-Franz law [0.0]
マヨラナ境界状態による2次元トポロジカル絶縁体におけるウィーデマン・フランツの法則の違反は、単一粒子像におけるローレンツ比によって研究される。本研究では,バチカー電圧温度プローブを用いた非弾性散乱によるMBSの存在と欠如におけるローレンツ比のスケーリングについて検討した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 06:25:42 GMT)
M5: A Whole Genome Bacterial Encoder at Single Nucleotide Resolution [0.0]
線形アテンション機構は、エンコーダのみ変換器(M5)のコンテキスト長を、細菌全ゲノム上で事前訓練された数百万の単一ヌクレオチド分解基盤モデルに拡張する。 M5小モデルは、トレーニング中に最大196Kヌクレオチド、テスト中に2Mヌクレオチドを含む40gbのメモリを持つ1つのA100 GPUで完全にトレーニングされ、テストされる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:30:44 GMT)
Long-lived magnetization in an atomic spin chain tuned to a diabolic point [0.0]
量子サイズ効果が顕著になるところまで磁化の量子トンネル(QTM)を拡大する磁気異方性点(DP)と呼ばれる水平交差付近の磁化寿命の非単調変動を観測する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 00:51:09 GMT)
Lattices, Gates, and Curves: GKP codes as a Rosetta stone [0.0]
GKP クリフォードゲートが対応するGKP格子のシンプレクティック自己同型としてどのように生じるかを説明する。単一モードのGKP符号に対して、楕円曲線のモジュライ空間を持つすべてのGKP符号の空間を同定する。我々はGKP符号の普遍的なファミリーを構築し、繊維束の耐障害性を明確に構築する方法を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:57:53 GMT)
Kinetically constrained models constructed from dissipative quantum dynamics [0.0]
強い散逸は創発的な非コヒーレンスな部分空間につながることを示す。我々は、GKSL力学によって構成されるユニタリ力学は、強く相互作用するハミルトン力学によって構成される力学よりもより厳密に制約されていると論じる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:49:58 GMT)
Josephson oscillations of two weakly coupled Bose-Einstein condensates [0.0]
2つの初期独立なボース=アインシュタイン凝縮体に対して、粒子数保存量子場理論に基づく数値実験を行う。 2つの縮合体のそれぞれの初期相対位相はランダムなままではなく、整数倍の2pi$の値で分散される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:40:44 GMT)
Interaction-induced dissipative quantum phase transition in a head-to-tail atomic Josephson junction [0.0]
ヘッド・ツー・テールのボース・ジョセフソン接合における散逸相転移を提案する。原子間相互作用強度が減衰パラメータの役割を担っていることを示す。我々は、準1次元の原子ガスの密閉により絶縁相に到達することができると主張している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 08:07:20 GMT)
Integration of Artificial Intelligence in Educational Measurement: Efficacy of ChatGPT in Data Generation within the Scope of Item Response Theory [0.0]
本研究の目的は,項目応答理論(IRT)の枠組みにおけるデータ生成アルゴリズム開発におけるChatGPT 3.5の有効性を検討することである。 ChatGPT 3.5はIRTの仮定に合致するデータを生成するのにかなり成功したが、研究者によって開発されたアルゴリズムと比較して項目パラメータのシミュレーション条件を満たすのに効果が低いと判断された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:09:09 GMT)
Improving LLM Abilities in Idiomatic Translation [0.0]
我々のゴールは、慣用的な言語の処理を改善することで翻訳の忠実度を高めることである。文化的なニュアンスを維持し、翻訳されたテキストがその意図と感情的共鳴を維持することを保証するため、これは大きな社会的影響を持つ。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 21:34:26 GMT)
Improved finite-size key rates for discrete-modulated continuous variable quantum key distribution under coherent attacks [0.0]
我々は,Alice氏が4つのコヒーレント状態の集合から選択し,Bobがヘテロダイン測定を行うCVQKDプロトコルについて検討する。有限サイズシステムにおけるコヒーレント攻撃に対するセキュリティ証明を行い、達成可能なキーレートを算出する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:18:31 GMT)
IMC 2024 Methods & Solutions Review [0.0]
Kaggleは過去3年間、Image Matching Challengeを主催してきた。このコンペティションは、2次元画像の集合を用いて3次元画像再構成問題を解決することに焦点を当てている。我々は,私的リーダーボードで0.153449を達成し,先進的なアンサンブル技術を導入する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:47:18 GMT)
Hawking radiation in quantum Hall system with an expanding edge: application of anomaly method [0.0]
我々は、拡張エッジを持つ量子ホール系において、ウィルツェクとロビンソンの手法をド・シッター時空のアナログに応用する。この系はキラルであるため、地平線付近で進入モードを課す必要はない。ド・ジッター地平線のギボンズ・ホーキング温度で外平部におけるホーキング放射のフラックスを求める。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 03:46:48 GMT)
Hardware-efficient variational quantum algorithm in trapped-ion quantum computer [0.0]
本研究では, トラップイオン量子シミュレータ, HEA-TI に適したハードウェア効率の変動量子アルゴリズムアンサッツについて検討する。我々は、全てのイオン間のプログラム可能な単一量子ビット回転と大域スピンスピン相互作用を活用し、従来のゲートベース手法における資源集約型2量子ビットゲートへの依存を減らす。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:02:20 GMT)
Global Out of Time Order Correlators as a Signature of Scrambling Dynamics of Local Observables [0.0]
Out-of-Time-Order Correlatorは、量子情報のスクランブルのプロキシとして機能する。情報スクランブルを探索するためのOTOCの最も実験的な実装は、地球規模の観測値に基づく間接的な測定に依存している。我々は、NMR実験の文脈において、OTOCとグローバル・ローカル・オブザーバブルの直接接続を確立する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:59:30 GMT)
Global Context Modeling in YOLOv8 for Pediatric Wrist Fracture Detection [0.0]
小児は日常的に手首を負傷することが多いが、骨折を負った放射線科医は手術前にX線画像を分析し解釈する必要がある。ディープラーニングの開発により、ニューラルネットワークモデルはコンピュータ支援診断(CAD)ツールとして機能するようになった。本稿では,GCブロックを用いたYOLOv8モデルの改良版であるYOLOv8モデルを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:36:07 GMT)
Fundamental mechanisms of energy exchanges in autonomous measurements based on dispersive qubit-light interaction [0.0]
自律的な測定スキームでは、システムのエネルギー変化はメーターのエネルギー変化によって補償されなければならない。ここでは、このような自律的なメートル系力学を理論的に研究する。我々は、このスペクトル変形の基盤となるメカニズムを明らかにし、量子ビットのエネルギー変化を補う方法を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:54:36 GMT)
From B Specifications to $\{log$\}$ Forgrams [0.0]
このクラスでは、学生がどのようにB仕様を$log$$forgramに変換できるか、これらのforgramをどのように実行し、どのようにプロパティを検証できるかを学ぶことができる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:09:31 GMT)
FlowCon: Out-of-Distribution Detection using Flow-Based Contrastive Learning [0.0]
我々は新しい密度に基づくOOD検出技術であるtextitFlowConを紹介する。我々の主な革新は、正規化フローの特性と教師付きコントラスト学習を効率的に組み合わせることである。経験的評価は、一般的な視覚データセットにまたがる手法の性能向上を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:33:56 GMT)
Federated Distillation for Medical Image Classification: Towards Trustworthy Computer-Aided Diagnosis [0.0]
医用画像分類はコンピュータ支援臨床診断において重要な役割を担っている。ディープラーニング技術は、効率を大幅に向上し、コストを削減した。医用画像データのプライバシーに敏感な性質は、集中的な記憶とモデルの訓練を複雑にする。本稿では,これらの問題に対処するためのフェデレーション学習に基づく,新たなプライバシ保護型医用画像分類フレームワークであるFedMICを提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:57:47 GMT)
Exploring LGBTQ+ Bias in Generative AI Answers across Different Country and Religious Contexts [0.0]
ChatGPT 3.5の回答は、バードが人権を強調し、LGBTQ+の問題をもっと支持したのとは対照的に、文化的相対性を示した。この研究は、AI応答の社会的および倫理的意味を理解することに寄与する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:38:19 GMT)
Effect of a Process Mining based Pre-processing Step in Prediction of the Critical Health Outcomes [0.0]
我々は、データセットの複雑さを減らし、データ品質を改善するために、既存の前処理アルゴリズムである結合を用いています。 MIMIC IIIとイリノイ大学病院の2つのデータベースから16の医療データセットが抽出された。事前処理されたイベントログは、決定的な結果を予測するために、Decay Mining (DREAM)アルゴリズムの入力としても使用された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 05:45:09 GMT)
Early-Stage Anomaly Detection: A Study of Model Performance on Complete vs. Partial Flows [0.0]
本研究では,異常検出システムにおける機械学習モデル,特にランダムフォレストの有効性について検討した。実世界のリアルタイムネットワーク環境に典型的な不完全なデータにモデルを適用する際に生じる性能格差について検討する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:14:25 GMT)
Do Quantum Neural Networks have Simplicity Bias? [0.0]
本研究では,量子ニューラルネットワーク(QNN)の帰納バイアスと表現性について検討する。ある種のQNNでは, 単純さのバイアスが可能であることを示すが, この種のQNNはQNNの表現性を制限していることを示す。また,QNNに高い表現性を持たせることは可能であるが,誘導バイアスや誘導バイアスが乏しいため,DNNと比較して一般化性能が低下することが示唆された。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:56:08 GMT)
Discovering Nuclear Models from Symbolic Machine Learning [0.0]
我々は,新しい記号型機械学習(ML)が従来の核物理モデルを再発見できるかどうかを考察する。多目的反復回帰手法を開発し、複数の観測対象物に対するシンボル回帰を処理した。提案手法では, 陽子数と中性子数に基づいて単純な解析関係を同定し, 最先端の原子核モデルに匹敵する精度で解釈可能なモデルを提供する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:47:09 GMT)
Direct Estimation of the Density of States for Fermionic Systems [0.0]
我々は状態密度(DOS)を推定して熱力学特性を抽出する量子アルゴリズムを開発した。我々のアプローチでは、フルヒルベルト空間の特定の部分空間に対してDOSを推定することができる。提案手法は時間進化におけるアルゴリズム誤差やゲートノイズに対して極めて堅牢であることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:05 GMT)
Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints [0.0]
マルチエージェント強化学習パラダイムに拡散モデルを統合する革新的なフレームワークを導入する。このアプローチは、協調動作をモデル化しながらリスク軽減を通じて、複数のエージェントが取るべき行動の安全性を特に向上させる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:22:15 GMT)
Differential Geometry of Contextuality [0.0]
文脈性は、長い間トポロジカルな性質と関連付けられてきた。我々は、ベクトル空間のベクトルとして状態、効果、変換の通常の識別を使い、それらを接空間にエンコードする。文脈性を符号化する2つの視点が量子論の解釈とどのように関連しているかを論じる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:20:55 GMT)
Controlling Plasmonic Catalysis via Strong Coupling with Electromagnetic Resonators [0.0]
プラズモニック励起はフェムト秒以内に崩壊し、非熱的(しばしば「ホット」と呼ばれる)電荷担体が化学反応を起こすために分子構造に注入される。共振器構造とプラズモンナノ粒子との強い結合は、プラズモン励起エネルギーと近傍分子への電荷注入エネルギーとのスペクトル重なりを制御できることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 15:15:49 GMT)
Continuous Optimization for Offline Change Point Detection and Estimation [0.0]
これは、通常の平均多重変化点モデルを、空間性を強制する正規化統計逆問題に再構成する。最近開発されたベストサブセット選択のための連続最適化フレームワーク(COMBSS)は、近日中に導入され、その問題に関連している。監督・監督されていない視点は、正規化ペナルティパラメータの選択のための異なるアプローチをテストすることで探索される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:19:59 GMT)
Contextuality in the Bundle Approach, n-Contextuality, and the Role of Holonomy [0.0]
文脈性(Contextuality)は、たとえ局所的な合意があるとしても、モデル全体の一貫した記述を構築することができないと理解することができる。バンドルアプローチでコンテキスト性を記述することができ、シナリオは単純複合体として表現される。我々は,n-contextualityと呼ばれる階層を導入し,シナリオのトポロジに対するモデルの文脈的振る舞いの依存性を探索する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 17:27:42 GMT)
Commodification of Compute [0.0]
本稿では,GCX(Global Compute Exchange)と呼ばれる,計算時間のコモディフィケーションのための新しいグローバルプラットフォームを提案する。 GCXは、セキュアで透明で効率的な計算パワーの購入と販売のためのマーケットプレースを作成する。このプラットフォームは、分散化され、効率的で透明なエコシステムを育み、計算資源市場を革新することを目的としています。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:12:32 GMT)
CogErgLLM: Exploring Large Language Model Systems Design Perspective Using Cognitive Ergonomics [0.0]
LLMと認知エルゴノミクスを統合することは、人間とAIの相互作用における安全性、信頼性、およびユーザ満足度を高めるために不可欠である。現在のLLM設計では、この統合が欠如していることが多く、人間の認知能力や制限を完全に満たさないシステムにつながっている。認知科学手法を取り入れることに十分な焦点が当てられると、LLM出力のバイアスが悪化する一方、ユーザ中心の設計原則の一貫性のない適用は、準最適ユーザー体験をもたらす。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:59:52 GMT)
Classifying Proposals of Decentralized Autonomous Organizations Using Large Language Models [0.0]
この研究は、カテゴリを特定し、それらをさらに再定義するための反復的なアプローチを適用し、各イテレーションにおいてプロンプトは95%の精度で100の提案を分類した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:47:44 GMT)
ChatGPT Code Detection: Techniques for Uncovering the Source of Code [0.0]
高度な分類技術を用いて、人間によって書かれたコードとChatGPTによって生成されたコードとを区別する。我々は、強力な埋め込み機能(ブラックボックス)と教師付き学習アルゴリズムを組み合わせた新しいアプローチを採用する。トレーニングされていない人間は、ランダムな推測よりも、同じタスクを解くことが示される。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 10:23:01 GMT)
Celeb-FBI: A Benchmark Dataset on Human Full Body Images and Age, Gender, Height and Weight Estimation using Deep Learning Approach [0.0]
「Celeb-FBI」データセットには、身長、年齢、体重、性別の詳細な情報とともに、7,211人の個人像が含まれている。我々はCNN,50層ResNet,16層VGGという3つの深層学習手法を用いて,人間のフルボディ画像から身長,体重,年齢,性別を推定する。結果から、ResNet-50の精度は79.18%、性別は95.43%、身長は85.60%、体重は81.91%であった。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 20:16:47 GMT)
CATT: Character-based Arabic Tashkeel Transformer [0.0]
タシュケル(Tashkeel)は、アラビア語のテキストの理解を大幅に強化する。本稿では,ATDモデルのトレーニングに新たなアプローチを提案する。 11の商用およびオープンソースモデルとともに、当社のモデルを評価します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:05:20 GMT)
Born statistics for quantum mechanical measurements from random walk potentials? [0.0]
シュロディンガー方程式は、ポテンシャルエネルギーが量子系をランダムウォークさせるときに固有状態への進化のボルン統計を予測できる。予測されたボルン確率を持つ固有状態に任意に近づいた測定において、ランダムウォークが量子状態にどのように影響するかを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:20:11 GMT)
Black box work extraction and composite hypothesis testing [0.0]
ブラックボックスワーク抽出は、量子熱力学において最も中心的なプロセスの1つである。ブラックボックス設定における最適抽出作業は,複合仮説テストタスクの性能によって完全に特徴づけられることを示す。また、この物理環境では、合成仮説が特定の相関を含む新しい量子シュタインの補題も示している。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 18:00:01 GMT)
Artificial intelligence and machine learning generated conjectures with TxGraffiti [0.0]
TxGraffitiが実装した機械学習とテクニックについて概説する。また、グラフ理論の予想を探求したい人なら誰でも利用できる新しいオンライン版も発表します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:03:09 GMT)
Annotation-free Automatic Music Transcription with Scalable Synthetic Data and Adversarial Domain Confusion [0.0]
そこで本研究では,MIDI-audio ペアデータの事前学習や対向領域の混乱を伴わない書き起こしモデルを提案する。実験では、トレーニングデータセットがMIDIアノテーションを含まない実世界のアプリケーションシナリオ下での手法を評価する。提案手法は,組合わせMIDI-audioの実際のデータセットを利用せずに,確立されたベースライン手法と比較して競争性能が向上した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:57:25 GMT)
An AI Architecture with the Capability to Explain Recognition Results [0.0]
本研究は、説明可能性に対するメトリクスの重要性に焦点をあて、性能向上をもたらす2つの方法に貢献する。第1の方法は説明不能なフローと説明不能なフローの組み合わせを導入し、意思決定の説明容易性を特徴づける指標を提案する。第2の方法は、システム内のニューラルネットワークの有効性を推定するための古典的なメトリクスを比較し、新しいメトリックをリードパフォーマーとして振る舞う。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 16:54:44 GMT)
Amplitude-noise-resilient entangling gates for trapped ions [0.0]
量子情報処理の耐雑音性は、フォールトトレランスしきい値に達するための重要な前提条件である。本研究では, アンハーモニシティの弱さが, 最先端実験条件と一致した振幅雑音抵抗性を実現する制御方式を認めることを示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:16:54 GMT)
A quantum mechanical evaluation of the intermediate scattering function [0.0]
中間散乱関数は散乱中心の熱波パケットの相関関数として解釈される。概念実証は、弾道移動中心の例で与えられる。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 12:40:14 GMT)
A quantum approach for optimal control [0.0]
非線形最適制御問題のクラスを解くための新しい変分量子アプローチを提案する。我々のアプローチは、ディラックの力学系の正準量子化と非エルミートハミルトニアン基底状態の解を統合する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 07:24:04 GMT)
A quantum annealing approach to the minimum distance problem of quantum codes [0.0]
本稿では,量子安定化器符号の最小距離を準拘束的二項最適化問題として再定式化することで計算する手法を提案する。 D-Wave Advantage 4.1quantum annealerと比較することにより,本手法の実用性を示す。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 19:39:24 GMT)
A Geometric Framework for Adversarial Vulnerability in Machine Learning [0.0]
この研究は、人工知能ネットワークにおけるcitetszegedy2013の興味深い脆弱性を理解するために数学を使う意図から始まった。その過程で、敵ドメイン以外のアプリケーションを含む新しいツールを開発します。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 11:01:15 GMT)
A Generalized Theory for Optical Cooling of a Trapped Atom with Spin [0.0]
我々は中性原子対における光冷却機構の統一的な定式化について述べる。光学式ツイーザにおける地中冷却を実現するための新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 13:55:48 GMT)
A Fixed-Parameter Tractable Algorithm for Counting Markov Equivalence Classes with the same Skeleton [0.0]
因果DAG(Bayesian Network)は、確率変数間の条件依存を符号化する一般的なツールである。しかし、同じ確率変数の集合上の2つの異なる因果DAGに対して、全く同じ条件依存の集合をエンコードすることが可能である。そのような因果DAGはマルコフ同値であり、マルコフ同値DAGの同値類はマルコフ同値類(Markov Equivalent Classs、MECs)として知られている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 04:41:05 GMT)
A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。この方法は決定論的情報ボトルネックアルゴリズムの変種であり、基盤構造に関する関連情報を保持しながらデータを最適に圧縮する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 09:06:19 GMT)
A Convex Hull Cheapest Insertion Heuristic for the Non-Euclidean TSP [0.0]
本稿では,多次元スケーリングを用いて,まず非ユークリッド空間からユークリッド空間へ点を投影し,そのアルゴリズムを初期化する凸包を生成する。提案アルゴリズムを評価するために、TSPLIBデータセットにセパレータを追加するか、L1ノルムを計量として使用することにより、非ユークリッド空間を生成する。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 02:54:12 GMT)
A Comparative Study of DSL Code Generation: Fine-Tuning vs. Optimized Retrieval Augmentation [0.0]
本稿では,Large Language Models (LLM) を用いた検索拡張生成(RAG)によるDSL生成の最適化について述べる。その結果, コード類似度測定では, 微調整モデルが最も優れていた。我々は、最適化されたRAGモデルが微調整されたモデルの品質と一致し、新しい、目に見えないAPIに利点をもたらすと結論付けている。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 01:28:51 GMT)
A 72h exploration of the co-evolution of food insecurity and international migration [0.0]
食品の安全性は、持続可能な開発のための2030年のアジェンダの主要な課題の1つである。これまでの研究は、気候変動、紛争、移住、家庭レベルでの食料安全保障のネクサスを調査してきた。我々は、国際的移民フローと食料不安全の共進化を全国規模で探求した。
論文参考訳（メタデータ） (Wed, 3 Jul 2024 14:03:21 GMT)