Fugu-MT: arxivの論文翻訳(概要)

Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models [115.5]
人為的なデータに基づく微調整言語モデル(LM)が普及している。我々は、スカラーフィードバックにアクセス可能なタスクにおいて、人間のデータを超えることができるかどうか検討する。 ReST$EM$はモデルサイズに好適にスケールし、人間のデータのみによる微調整を大幅に上回っていることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:12:09 GMT)
MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training [103.7]
MLLM(Performant Multimodal Large Language Models)を構築する。特に,さまざまなアーキテクチャコンポーネントとデータ選択の重要性について検討する。本稿では,画像キャプチャ,インターリーブ画像テキスト,テキストのみのデータを組み合わせた大規模マルチモーダル事前学習について述べる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:51:04 GMT)
BLINK: Multimodal Large Language Models Can See but Not Perceive [96.4]
Blinkはマルチモーダル言語モデル(LLM)のための新しいベンチマークであり、他の評価では見つからないコア視覚知覚能力に焦点を当てている。 Blinkは14の古典的なコンピュータビジョンタスクを3,807の複数の質問に修正し、単一の画像や複数の画像と組み合わせて視覚的にプロンプトする。 GPT-4V と Gemini は 51.26% と 45.72% であり、ランダムな推測よりも 13.17% と 7.63% 高い。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:54 GMT)
Introducing v0.5 of the AI Safety Benchmark from MLCommons [94.1]
本稿では,MLCommons AI Safety Working Groupが作成したAI Safety Benchmarkのv0.5を紹介する。このベンチマークは、チャットチューニング言語モデルを使用するAIシステムの安全性リスクを評価するように設計されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:01:00 GMT)
Progressive Multi-modal Conditional Prompt Tuning [92.5]
事前学習された視覚言語モデル(VLM)は、プロンプトによる顕著な一般化能力を示している。本稿では,ProMPT(Progressive Multi-modal Conditional Prompt Tuning)を提案する。 ProMPTは、画像と電流の符号化情報を反復的に利用することにより、V-L機能の最適化と整合化を繰り返す構造を利用する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 02:40:31 GMT)
A Mean-Field Analysis of Neural Gradient Descent-Ascent: Applications to Functional Conditional Moment Equations [90.9]
無限次元関数クラス上で定義されるミニマックス最適化問題について検討する。また、勾配降下度アルゴリズムの収束とニューラルネットワークの表現学習についても検討する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:46:08 GMT)
LongEmbed: Extending Embedding Models for Long Context Retrieval [87.6]
本稿では、埋め込みモデルのコンテキストウィンドウ拡張について検討し、追加のトレーニングを必要とせず、制限を32kまで押し上げる。まず、新たに構築したLongEmbedベンチマークにおいて、コンテキスト検索のための現在の埋め込みモデルの性能について検討する。実験では、PlaceRoのようなトレーニング不要のコンテキストウィンドウ拡張戦略が、既存の埋め込みモデルのコンテキストウィンドウを複数の折り畳みで効果的に拡張できることが示されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:29:23 GMT)
Matching the Statistical Query Lower Bound for k-sparse Parity Problems with Stochastic Gradient Descent [83.9]
勾配勾配降下(SGD)は,$d$次元ハイパーキューブ上の$k$パリティ問題を効率的に解くことができることを示す。次に、SGDでトレーニングされたニューラルネットワークがどのようにして、小さな統計的エラーで$k$-parityの問題を解決するかを実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:57:53 GMT)
Moving Object Segmentation: All You Need Is SAM (and Flow) [82.8]
SAMのセグメンテーション能力と移動物体の発見・グループ化能力を利用する光フローとSAMを組み合わせた2つのモデルについて検討する。第1のモデルでは、RGBではなく光の流れを入力としてSAMに適応させ、第2のモデルではRGBを入力として、フローをセグメント化プロンプトとして使用する。これらの驚くほど単純な方法は、追加の修正なしに、シングルオブジェクトとマルチオブジェクトのベンチマークにおいて、以前のアプローチをかなり上回っている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:53 GMT)
SOHES: Self-supervised Open-world Hierarchical Entity Segmentation [82.5]
この研究は、人間のアノテーションを必要としない新しいアプローチであるSOHES(Self-supervised Open World Hierarchical Entities)を提示する。視覚的特徴クラスタリングにより高品質な擬似ラベルを生成し,教師同士の学習によって擬似ラベルの雑音を補正する。学習データとして生画像を用いることにより,自己監督型オープンワールドセグメンテーションにおける前例のない性能を実現する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:46 GMT)
Towards Large Language Models as Copilots for Theorem Proving in Lean [81.9]
大規模な言語モデルでリーン推論を実行するためのフレームワークであるLean Copilotを紹介します。証明手順を提案し、中間的な証明目標を完了し、関連する前提を選択するためのツールを構築します。実験により, 提案手法の有効性を実証し, 提案手法の有効性を検証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 22:54:08 GMT)
Lazy Diffusion Transformer for Interactive Image Editing [79.8]
部分的な画像更新を効率的に生成する新しい拡散変換器であるLazyDiffusionを導入する。提案手法は,空白キャンバスや画像から,ユーザが局所的な画像修正のシーケンスを指定するインタラクティブな画像編集アプリケーションを対象としている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:27 GMT)
SocREval: Large Language Models with the Socratic Method for Reference-Free Reasoning Evaluation [78.2]
我々は,参照フリー推論評価における新規な設計手法であるSocREvalを開発した。 SocREvalはGPT-4の性能を大幅に改善し、既存の参照フリーおよび参照ベース推論評価指標を上回っている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:53:10 GMT)
V2Xum-LLM: Cross-Modal Video Summarization with Temporal Prompt Instruction Tuning [76.3]
Instruct-V2Xumは、YouTubeから3万の多様な動画を出力するクロスモーダルビデオ要約データセットである。 V2Xum-LLMは、ビデオ要約タスクを1つの大きな言語モデル(LLM)テキストデコーダに統合する最初のフレームワークである。実験により、V2Xum-LLaMAは複数のビデオ要約タスクにおいて強力なベースラインモデルより優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:32:46 GMT)
Enhancing Suicide Risk Assessment: A Speech-Based Automated Approach in Emergency Medicine [74.8]
救急部門における自殺リスクのある患者に対する専門的な精神医学的評価やケアへのアクセスが遅れたことは、タイムリーな介入において顕著なギャップを生じさせる。自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:33:57 GMT)
AesExpert: Towards Multi-modality Foundation Model for Image Aesthetics Perception [74.1]
我々は,21,904の多様なソースイメージと88Kの人間の自然言語フィードバックを備えたコーパスリッチな審美的批評データベースを開発した。 AesExpertと呼ばれる、マルチモダリティのAesthetic Expertモデルを実現するために、オープンソースの一般基盤モデルを微調整します。実験により、提案したAesExpertモデルは、最先端のMLLMよりもはるかに優れた審美的知覚性能を提供することが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:10:00 GMT)
Dynamic Typography: Bringing Text to Life via Video Diffusion Prior [73.7]
動的タイポグラフィー(Dynamic Typography)と呼ばれる自動テキストアニメーション方式を提案する。意味的意味を伝えるために文字を変形させ、ユーザプロンプトに基づいて活気ある動きを注入する。本手法は,ベクトルグラフィックス表現とエンドツーエンド最適化に基づくフレームワークを利用する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:06:29 GMT)
©Plug-in Authorization for Human Content Copyright Protection in Text-to-Image Model [71.5]
最先端のモデルは、オリジナルクリエーターを信用せずに高品質なコンテンツを作成する。本稿では,3つの操作 – 追加,抽出,組み合わせ – を導入した著作権プラグイン認証フレームワークを提案する。抽出により、クリエーターは侵害モデルから著作権を回復することができ、組み合わせることでユーザーは異なる著作権プラグインをマージすることができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:48:00 GMT)
Unified Physical-Digital Attack Detection Challenge [70.7]
Face Anti-Spoofing (FAS) は、顔認識(FR)システムを保護するために重要である。 UniAttackDataは、Unified Detectionのための最大の公開データセットである。我々は,一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元一元
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:52:11 GMT)
Neural Active Learning Beyond Bandits [70.0]
ストリームベースとプールベースの両方のアクティブラーニングをニューラルネットワーク近似を用いて検討する。ストリームベースおよびプールベースアクティブラーニングのためのニューラルネットワークを新たに設計したエクスプロイトと探索に基づく2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:52:14 GMT)
Reka Core, Flash, and Edge: A Series of Powerful Multimodal Language Models [69.4]
Rekaモデルはテキスト、画像、ビデオ、オーディオ入力で処理し、推論することができる。 Reka EdgeとReka Flashは最先端のモデルであるだけでなく、多くの大きなモデルよりも優れています。最も有能で最大のモデルであるReka Coreは、自動評価と盲人評価の両方において、最高のフロンティアモデルにアプローチしています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:48 GMT)
The Dog Walking Theory: Rethinking Convergence in Federated Learning [68.6]
Federated Learning(FL)は、さまざまなクライアントがプライベートデータを共有せずに、ひとつの強力なグローバルモデルをトレーニングできる、協調学習パラダイムである。 FLは様々なアプリケーションで有望な結果を示してきたが、異なるクライアント間でのデータ分散シフトに起因する収束問題に悩まされていることが知られている。本稿では,クライアントのローカルトレーニングを指導するためのemphleashタスクとして,サーバ側の外部から容易に収束できるタスクを活用する新しいFLアルゴリズムemphFedWalkを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:25:21 GMT)
Point-In-Context: Understanding Point Cloud via In-Context Learning [67.2]
In-context Learningによる3Dポイントクラウド理解のための新しいフレームワークであるPoint-In-Context(PIC)を紹介した。マスク付き点モデリングを3次元点群に効果的に拡張するという技術的課題に,Joint Smplingモジュールを導入して対処する。 In-Context LabelingとIn-Context Enhancingという2つの新しいトレーニング戦略を提案し、PICの拡張版であるPoint-In-Context-Segmenter(PIC-S)を作成している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:32:32 GMT)
Enhancing Length Extrapolation in Sequential Models with Pointer-Augmented Neural Memory [66.9]
本稿では,新しいより長いデータ列に対して,ニューラルネットワークによるシンボル処理の理解と適用を支援するために,Pointer-Augmented Neural Memory (PANM)を提案する。 PANMは、新しい物理アドレスとポインタ操作技術を使用して、人間とコンピュータのシンボル処理能力を模倣する外部のニューラルメモリを統合する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:03:46 GMT)
Learning Energy-Based Models by Cooperative Diffusion Recovery Likelihood [65.0]
高次元データに基づくエネルギーベースモデル(EBM)の訓練は、困難かつ時間を要する可能性がある。 EBMと、GANや拡散モデルのような他の生成フレームワークとの間には、サンプル品質に顕著なギャップがある。本研究では,協調拡散回復可能性 (CDRL) を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:02:03 GMT)
AID: Attention Interpolation of Text-to-Image Diffusion [64.9]
AID(Attention Interpolation via Diffusion)という,トレーニング不要な手法を導入する。 AIDは補間された注意を自己注意と融合させ、忠実性を高める。また,条件に依存した生成過程として,拡散による条件誘導注意補間(AID)も提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:11:54 GMT)
LongVQ: Long Sequence Modeling with Vector Quantization on Structured Memory [63.4]
自己保持機構の計算コストは、長いシーケンスの実用性を制限する。我々はLongVQと呼ばれる新しい手法を提案し、長さ固定されたコードブックとしてグローバルな抽象化を圧縮する。 LongVQは動的グローバルパターンとローカルパターンを効果的に維持し、長距離依存性の問題の欠如を補うのに役立つ。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:50:53 GMT)
Estimating the Hessian Matrix of Ranking Objectives for Stochastic Learning to Rank with Gradient Boosted Trees [63.2]
グラディエントブースト決定木(GBDT)のランク付け手法について紹介する。我々の主な貢献は、二階微分、すなわちヘッセン行列に対する新しい推定器である。推定器を既存のPL-Rankフレームワークに組み込む。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:53:32 GMT)
Uncovering Safety Risks in Open-source LLMs through Concept Activation Vector [62.2]
本稿では,概念に基づくモデル記述を用いたLLM攻撃手法を提案する。安全概念アクティベーションベクトル(SCAV)をLLMのアクティベーション空間から抽出し、適切に整列されたLCMに対する効率的な攻撃を可能にする。このことは、LLMが徹底的な安全調整をした後でも、社会に公開時に潜在的リスクを及ぼす可能性があることを示唆している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:46:25 GMT)
Length Generalization of Causal Transformers without Position Encoding [59.8]
より長い文への一般化は、最近のTransformerベースの言語モデルにとって重要である。位置符号化を伴わない変圧器長一般化特性について検討する。 NoPEは、一般的に使われる明示的な位置エンコーディングよりも長いシーケンスに拡張できるが、コンテキスト長が制限されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:38:32 GMT)
High-probability Convergence Bounds for Nonlinear Stochastic Gradient Descent Under Heavy-tailed Noise [59.3]
厳密な高確率収束は、重み付き雑音の存在下でのデータの学習を保証します。クリップのみを考える最先端技術と比較して、$in(1$)のノイズモーメントは、正しい1$としてゼロになる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:53:19 GMT)
Character is Destiny: Can Large Language Models Simulate Persona-Driven Decisions in Role-Playing? [59.0]
ペルソナ駆動意思決定における大規模言語モデルの能力のベンチマークを行う。高品質な小説において, LLM が先行する物語の登場人物の判断を予測できるかどうかを考察する。その結果、現状のLLMは、このタスクに有望な能力を示すが、改善の余地は十分にあることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:40:59 GMT)
Rephrase and Respond: Let Large Language Models Ask Better Questions for Themselves [58.0]
本稿では,Rephrase and Respond'(RaR)という手法を提案する。 RaRは、パフォーマンスを改善するためのシンプルだが効果的なプロンプト方法として機能する。また,RaRは理論的にも経験的にも,一般的なChain-of-Thought(CoT)法と相補的であることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:49:56 GMT)
Language Imbalance Can Boost Cross-lingual Generalisation [57.3]
本研究では,言語間一般化の非直感的な新規ドライバである言語不均衡について検討する。学習中に支配的な言語が存在することが、あまり頻度の低い言語の性能を高めることを観察する。分析を実言語に拡張するにつれ、頻繁な言語は依然として恩恵を受けていますが、言語不均衡が言語間の一般化を引き起こすかどうかは決定的ではありません。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:21:34 GMT)
G-HOP: Generative Hand-Object Prior for Interaction Reconstruction and Grasp Synthesis [57.1]
G-HOPは手-対象相互作用の前駆体である。人手は骨格距離場を介して表現し、物体の符号付き距離場と整合した表現を得る。この手動物体は、対話クリップからの再構成や人間のつかみ合成など、他の作業を容易にするための汎用的なガイダンスとして機能することを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:28 GMT)
Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing [56.8]
大規模言語モデルの自己改善のためのAlphaLLMを紹介する。モンテカルロ木探索(MCTS)とLLMを統合し、自己改善ループを確立する。実験の結果,AlphaLLM は付加アノテーションを使わずに LLM の性能を大幅に向上することがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:21:34 GMT)
Tendency-driven Mutual Exclusivity for Weakly Supervised Incremental Semantic Segmentation [56.2]
Weakly Incremental Learning for Semantic (WILSS)は、トレーニング済みのセグメンテーションモデルを利用して、コスト効率と手軽に利用できるイメージレベルのラベルを使用して、新しいクラスをセグメンテーションする。 WILSSを解く最も一般的な方法は、各新しいクラスのシード領域の生成であり、ピクセルレベルの監視の一形態として機能する。本研究は, 種子領域の挙動を綿密に調整した, 相互排他性に関する革新的, 傾向的関係について提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:23:24 GMT)
Parallel Decoding via Hidden Transfer for Lossless Large Language Model Acceleration [54.9]
本稿では,複数連続するトークンを1つのフォワードパスで同時に復号する,新しい並列復号法,すなわちthithidden Transferを提案する。加速度測定では,Medusa や Self-Speculative decoding など,単モデル加速技術よりも優れています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:17:06 GMT)
FecTek: Enhancing Term Weight in Lexicon-Based Retrieval with Feature Context and Term-level Knowledge [54.6]
FEature Context と TErm レベルの知識モジュールを導入して,革新的な手法を提案する。項重みの特徴コンテキスト表現を効果的に強化するために、FCM(Feature Context Module)が導入された。また,用語レベルの知識を効果的に活用し,用語重みのモデル化プロセスをインテリジェントに導くための用語レベルの知識誘導モジュール(TKGM)を開発した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:58:36 GMT)
The Efficiency Spectrum of Large Language Models: An Algorithmic Survey [54.2]
LLM(Large Language Models)の急速な成長は、様々なドメインを変換する原動力となっている。本稿では,LLMのエンドツーエンドのアルゴリズム開発に不可欠な多面的効率性について検討する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:10:28 GMT)
Generalized Schrödinger Bridge Matching [54.2]
一般化Schr"odinger Bridge (GSB) 問題設定は、機械学習の内外を問わず、多くの科学領域で一般的である。我々は最近の進歩に触発された新しいマッチングアルゴリズムである一般化シュリンガーブリッジマッチング(GSBM)を提案する。このような一般化は条件最適制御の解法として、変分近似を用いることができることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:25:25 GMT)
Hint-enhanced In-Context Learning wakes Large Language Models up for knowledge-intensive tasks [54.2]
大規模言語モデル(LLM)の規模拡大に伴い、インコンテキスト学習(ICL)能力が出現した。我々は、オープンドメイン質問応答におけるICLのパワーを探るため、Hint-enhanced In-Context Learning(HICL)と呼ばれる新しいパラダイムを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:08:44 GMT)
NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Dataset [53.8]
近赤外(NIR)画像を活用して、視認可能なRGB画像の復調を支援することで、この問題に対処する可能性を示している。既存の作品では、NIR情報を効果的に活用して現実のイメージを飾ることに苦戦している。先進デノナイジングネットワークにプラグイン・アンド・プレイ可能な効率的な選択核融合モジュール(SFM)を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:30:49 GMT)
MARformer: An Efficient Metal Artifact Reduction Transformer for Dental CBCT Images [53.6]
金属歯のインプラントはCBCTイメージングの過程で不愉快な金属加工物をもたらす可能性がある。歯科用CBCT画像から金属アーティファクト低減(MAR)を実現するための効率的なトランスフォーマーを開発した。 P2FFN (Patch-wise Perceptive Feed Forward Network) も提案されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:49:03 GMT)
Customizing Text-to-Image Diffusion with Camera Viewpoint Control [53.6]
モデルカスタマイズのためのカメラ視点の明示的な制御を可能にする新しいタスクを導入する。これにより、テキストプロンプトによって、さまざまな背景シーンのオブジェクトプロパティを変更することができます。本稿では,新しいオブジェクトのレンダリング・ビュー依存的な特徴に対して,2次元拡散過程を条件付けることを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:59:51 GMT)
When Authentication Is Not Enough: On the Security of Behavioral-Based Driver Authentication Systems [53.2]
本研究では,機械学習(ML)とディープラーニング(DL)アーキテクチャに基づく軽量な行動ベースドライバ認証システムの開発を行う。我々は、新たな回避攻撃のクラスであるGAN-CANを初めて提案し、攻撃者が完璧な攻撃成功率でこれらのシステムをどのように活用できるかを示した。コントリビューションを通じて、これらのシステムを安全に採用する実践者を支援し、車の盗難を軽減し、ドライバーのセキュリティを高める。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:42:07 GMT)
MeshLRM: Large Reconstruction Model for High-Quality Mesh [52.7]
MeshLRMは、わずか4つの入力画像から1秒未満で高品質なメッシュを再構築することができる。提案手法は,スパースビューからのメッシュ再構築を実現し,多くのダウンストリームアプリケーションを実現する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:41 GMT)
Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception [52.6]
自律型マルチモーダルモバイルデバイスエージェントMobile-Agentを紹介する。 Mobile-Agentはまず視覚認識ツールを利用して、アプリのフロントエンドインターフェイス内の視覚的要素とテキスト的要素の両方を正確に識別し、特定する。そして、複雑なオペレーションタスクを自律的に計画し、分解し、ステップバイステップでモバイルアプリをナビゲートする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:53:38 GMT)
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models [52.5]
大規模言語モデルに対するBIRDと呼ばれるベイズ推論フレームワークを提案する。 BIRDはモデル決定のための制御可能かつ解釈可能な確率推定を提供する。実験の結果、BIRDは65%以上の人の判断と一致した確率推定を生成することがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:17:23 GMT)
Online Advertisements with LLMs: Opportunities and Challenges [52.0]
本稿では,オンライン広告システムにおけるLarge Language Models(LLM)の活用の可能性について検討する。プライバシー、レイテンシ、信頼性、そしてそのようなシステムが満たさなければならないユーザや広告主の満足度など、基本的な要件を探求します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:45:12 GMT)
NeRF-MAE: Masked AutoEncoders for Self-Supervised 3D Representation Learning for Neural Radiance Fields [51.9]
提案手法は,RGB画像から有効な3D表現を生成する方法を示す。我々は、この表現を、提案した擬似RGBデータに基づいて大規模に事前訓練し、合計で1.6万枚以上の画像を生成する。我々は,NeRFの自己教師型プレトレーニングであるNeRF-MAE(NeRF-MAE)を目覚ましいスケールで実施し,様々な3Dタスクの性能向上を実現した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:57 GMT)
Ethical-Lens: Curbing Malicious Usages of Open-Source Text-to-Image Models [51.7]
我々はEthical-Lensというフレームワークを紹介した。 Ethical-Lensは、毒性とバイアス次元をまたいだテキストと画像のモデルにおける価値アライメントを保証する。実験の結果、Ethical-Lensは商業モデルに匹敵するレベルまでアライメント能力を向上することがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:38:25 GMT)
Observation, Analysis, and Solution: Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training [51.6]
コンピュータビジョンにおける大規模な視覚変換器(ViT)のためのマスク付き画像モデリング(MIM)の事前トレーニングにより、学習された自己教師付きVT機能に加えて、下流のパフォーマンスが期待できる。本稿では,ごく単純なViTの小型アーキテクチャによる微調整性能が,この事前学習パラダイムの恩恵を受けるかどうかを問う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:14:44 GMT)
From $r$ to $Q^*$: Your Language Model is Secretly a Q-Function [50.8]
Reinforcement Learning From Human Feedback (RLHF)は、次世代のジェネレーティブAIモデルの成功に不可欠である。直接選好最適化(DPO)は代替手法として登場している。 DPOは標準のRLHF設定と同じ目的を達成しているが、2つのアプローチの間にはミスマッチがある。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:37:02 GMT)
Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement [50.6]
Self-Polish(SP)は、与えられた問題を徐々に洗練し、より理解しやすく解けるように誘導することによって、モデルの推論を促進する新しい方法である。 SPは、CoTのような答え/推論サイドの他のすべてのプロンプトメソッドであり、最先端の技術とのシームレスな統合を可能にし、さらなる改善を可能にします。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:27:00 GMT)
Advancing the Robustness of Large Language Models through Self-Denoised Smoothing [50.5]
大規模言語モデル(LLM)は大きな成功を収めたが、敵の摂動に対する脆弱性は大きな懸念を引き起こしている。本稿では,LLMのマルチタスク特性を活用して,まずノイズの入力を識別し,次にこれらの復号化バージョンに基づいて予測を行う。 LLMのロバスト性を高めるために個別のモデルを訓練する必要がある従来のコンピュータビジョンのスムース化技術とは異なり、本手法は効率と柔軟性を著しく向上させる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:47:00 GMT)
MambaPupil: Bidirectional Selective Recurrent model for Event-based Eye tracking [50.3]
事象に基づく視線追跡は、高時間分解能と低冗長性で非常に有望である。点眼、固定、ササード、スムーズな追跡を含む眼球運動パターンの多様性と急激さは、眼球運動の局所化に重要な課題を提起する。本稿では、文脈時空間情報を完全に活用するための双方向の長期シーケンスモデリングと時間変化状態選択機構を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:09:25 GMT)
Alleviating Catastrophic Forgetting in Facial Expression Recognition with Emotion-Centered Models [49.3]
感情中心型生成的リプレイ (ECgr) は, 生成的対向ネットワークから合成画像を統合することで, この課題に対処する。 ECgrは、生成された画像の忠実性を保証するために品質保証アルゴリズムを組み込んでいる。 4つの多様な表情データセットに対する実験結果から,擬似リハーサル法により生成されたイメージを組み込むことで,ターゲットとするデータセットとソースデータセットのトレーニングが促進されることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:28:34 GMT)
Simultaneous symmetry breaking in spontaneous Floquet states: Floquet-Nambu-Goldstone modes, Floquet thermodynamics, and the time operator [49.2]
本研究では, 原子凝縮体の特異な場合に着目し, 自発フロッケ状態における同時対称性破砕について検討した。まず,ハミルトニアンのいくつかの対称性を同時に破壊する定常状態に対するナムブ・ゴールドストーン(NG)モードの量子化について述べる。フォーマリズムをフロケ状態にまで拡張し、同時にいくつかの対称性を破り、ゴールドストーンの定理は準エネルギーゼロのフロケ・ナンブ・ゴールドストーンモードの出現へと変換する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:00:01 GMT)
HardVis: Visual Analytics to Handle Instance Hardness Using Undersampling and Oversampling Techniques [48.8]
HardVisは、主に不均衡な分類シナリオでインスタンスの硬さを処理するために設計されたビジュアル分析システムである。ユーザはさまざまな視点からデータのサブセットを探索して、これらのパラメータをすべて決定できる。 HardVisの有効性と有効性は仮説的利用シナリオとユースケースで実証される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:37:02 GMT)
Partial-to-Partial Shape Matching with Geometric Consistency [47.5]
3次元形状の対応を見つけることは、コンピュータビジョン、グラフィックスなどにおいて、重要かつ長年にわたる問題である。我々は、幾何学的整合性を強い制約として利用することにより、既存の(あるいは人工的な)3次元フル形状マッチングと部分的から部分的な実世界の設定のギャップを埋める。三角積空間上に構築された新しい整数非線型プログラム形式により実現された部分対部分マッチングの幾何学的整合性を実現する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:14:07 GMT)
Guided Discrete Diffusion for Electronic Health Record Generation [47.1]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:50:46 GMT)
DeforestVis: Behavior Analysis of Machine Learning Models with Surrogate Decision Stumps [46.6]
複雑なMLモデルの振る舞いを要約する視覚解析ツールであるDeforestVisを提案する。 DeforestVisは、より多くの切り株をインクリメンタルに生成することで、複雑さとフィデリティのトレードオフを探索するのに役立つ。 DeforestVisの適用性と有用性について,2つのユースケースと,データアナリストとモデル開発者とのエキスパートインタビューで紹介する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:46:45 GMT)
Dynamic Modality and View Selection for Multimodal Emotion Recognition with Missing Modalities [46.5]
音声(声)や表情(画像)などの複数のチャンネルは、人間の感情を理解するのに不可欠である。重要なハードルのひとつは、AIモデルが特定のモダリティの欠如を管理する方法だ。本研究の中心は,1つのモダリティの欠如に直面した2つの戦略の性能とレジリエンスを評価することである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:18:14 GMT)
AmbigDocs: Reasoning across Documents on Different Entities under the Same Name [46.3]
混乱したエンティティの言及を扱うことは、言語モデル(LM)にとって重要なスキルである。この機能をテストするために、新しいベンチマークであるAmbigDocsを導入しました。あいまいな名前とそれに対応する答えの集合を含む質問を生成する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:12:01 GMT)
Spot-Compose: A Framework for Open-Vocabulary Object Retrieval and Drawer Manipulation in Point Clouds [45.9]
この研究は、人間中心環境におけるロボットのインタラクションと操作のための包括的なフレームワークに、最近の手法を統合することを目的としている。具体的には,コモディティ3Dスキャナの3次元再構成をオープン語彙のインスタンスセグメンテーションに活用する。本研究では,動的オブジェクト検索と引き出し開口を含む実世界の2つの実験において,モデルの性能とロバスト性を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:01:15 GMT)
Cost-Performance Optimization for Processing Low-Resource Language Tasks Using Commercial LLMs [45.4]
大規模言語モデル(LLM)は、高リソース言語(HRL)に対する印象的なゼロ/ファウショット推論と生成品質を示す。いくつかは低リソース言語(LRL)でトレーニングされ、優れたパフォーマンスを実現しています。 LLM は HRL よりも LRL よりも多くのトークンを生成するため,LRL が価格面で不利であることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:35:07 GMT)
NL2FOL: Translating Natural Language to First-Order Logic for Logical Fallacy Detection [45.3]
本研究では,自然言語を一階論理に変換することによって,論理的誤りを確実に検出する手法を設計する。次に、満足度モデュロ理論(SMT)を用いて、式の有効性を推論する。私たちのアプローチは堅牢で解釈可能で、トレーニングデータや微調整は必要ありません。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:20:48 GMT)
A survey on hardware-based malware detection approaches [45.2]
ハードウェアベースのマルウェア検出アプローチは、ハードウェアパフォーマンスカウンタと機械学習技術を活用する。このアプローチを慎重に分析し、最も一般的な方法、アルゴリズム、ツール、および輪郭を形成するデータセットを解明します。この議論は、協調的有効性のための混合ハードウェアとソフトウェアアプローチの構築、ハードウェア監視ユニットの不可欠な拡張、ハードウェアイベントとマルウェアアプリケーションの間の相関関係の理解を深めている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:27:28 GMT)
Real-World Efficient Blind Motion Deblurring via Blur Pixel Discretization [45.2]
我々は,デブロアリング(回帰)タスクを,画素の離散化と離散連続変換タスクに分解する。具体的には,ぼやけた画素を識別して画像残差誤差を生成し,連続的な形状に変換する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:22:56 GMT)
Bridging Stereo Geometry and BEV Representation with Reliable Mutual Interaction for Semantic Scene Completion [45.2]
3Dセマンティックシーン補完(SSC)は、限られた観測から密集した3Dシーンを推定する必要がある不適切な認識課題である。従来のカメラベースの手法は、固有の幾何学的曖昧さと不完全な観察のため、正確なセマンティックシーンを予測するのに苦労した。我々は,SSCにおけるステレオマッチング技術と鳥眼ビュー(BEV)表現学習を利用して,そのような問題に対処する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:31:00 GMT)
DeblurGS: Gaussian Splatting for Camera Motion Blur [45.1]
動きブル画像から鋭い3次元ガウススプラッティングを最適化するDeblurGSを提案する。我々は,3次元ガウススプラッティングの顕著な再構成能力を活用して,きめ細かなシャープシーンを復元する。提案手法は,6自由度カメラの動きをそれぞれのぼやけた観測のために推定し,それに対応するぼやけたレンダリングを合成する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:18:36 GMT)
6Img-to-3D: Few-Image Large-Scale Outdoor Driving Scene Reconstruction [45.0]
本稿では, 高速でスケーラブルなトランスフォーマーベースエンコーダ・レンダ法である6Img-to-3Dを3次元再構成に導入する。本手法は,大規模で非有界な屋外運転シナリオに対して,外向きの6つの入力画像から3次元のパラメータ化三面体を出力する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:58:16 GMT)
Predicting and Enhancing the Fairness of DNNs with the Curvature of Perceptual Manifolds [44.8]
近年の研究では、テールクラスは必ずしも学習が困難ではないことが示されており、サンプルバランスのデータセットではモデルバイアスが観察されている。本研究ではまず,モデルフェアネスを解析するための幾何学的視点を確立し,次いで,一連の幾何学的測度を体系的に提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:54:01 GMT)
InstructIE: A Bilingual Instruction-based Information Extraction Dataset [44.7]
大規模言語モデルは、一般的な自然言語処理でうまく機能するが、その有効性は情報抽出に最適ではない。最近の研究は、情報抽出命令に関する広範なデータがないことが主な理由であることを示している。 InstructIEは、12のドメインをカバーするバイリンガル命令に基づく情報抽出データセットである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:20:19 GMT)
FreeDiff: Progressive Frequency Truncation for Image Editing with Diffusion Models [44.3]
我々は、プログレッシブな$textbfFre$qu$textbfe$ncy truncationを用いて、ユニバーサル編集タスクのための$textbfDiff$usionモデルのガイダンスを洗練するために、新しいフリーアプローチを導入する。本手法は,様々な編集タスクや多様な画像に対して,最先端の手法で比較結果を得る。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:47:28 GMT)
WHAM: Reconstructing World-grounded Humans with Accurate 3D Motion [44.0]
WHAM(World-grounded Humans with Accurate Motion)は、ビデオから世界座標系で3次元の人間の動きを再構成する。 SLAM法から推定されるカメラ角速度と人間の動きを用いて、身体のグローバルな軌跡を推定する。複数のWildベンチマークで、既存の3Dモーションリカバリ手法よりも優れています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:43:25 GMT)
One-shot Empirical Privacy Estimation for Federated Learning [43.3]
ワンショット」アプローチは、モデルパラメータに適合する単一トレーニング実行において、モデルのプライバシ損失の効率的な監査や推定を可能にする。提案手法は,ガウス機構下でのプライバシー損失を正当に推定できることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:14:37 GMT)
TriForce: Lossless Acceleration of Long Sequence Generation with Hierarchical Speculative Decoding [43.3]
キーバリュー(KV)キャッシュは、効率的なロングシーケンスサポートのボトルネックとして現れている。 TriForceは階層的な投機的復号化システムであり、長いシーケンス生成にスケーラブルである。トリフォースの頑丈さは、様々な温度で一貫して卓越した性能で強調されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:25:54 GMT)
Monotonic Paraphrasing Improves Generalization of Language Model Prompting [42.7]
MonoParaはエンド・ツー・エンドのデコーディング戦略であり、プロンプトや命令を下位のパープレクティリティに言い換える。いかなる訓練も必要とせず、単調に言い換えられたプロンプトや命令の難易度を下げることができる。また、乱雑なタスク命令に対するLMの一般化を効果的に改善することが示されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:22:01 GMT)
On the Content Bias in Fréchet Video Distance [42.7]
Fr'echet Video Distance (FVD)は、ビデオ生成モデルを評価するための重要な指標である。本稿では,時間的リアリズムよりもフレーム単位の品質に対するFVDの偏りについて検討する。近年の大規模自己監督型ビデオモデルから抽出された特徴を持つFVDは画質に偏りが小さいことを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:58 GMT)
Single-temporal Supervised Remote Change Detection for Domain Generalization [42.6]
変化検出はリモートセンシング画像解析に広く応用されている。既存の方法はデータセットごとに個別にトレーニングモデルを必要とする。本稿では,変化検出領域の一般化のための視覚遅延事前学習に基づくマルチモーダルコントラスト学習(ChangeCLIP)を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:22:07 GMT)
Finding A Taxi with Illegal Driver Substitution Activity via Behavior Modelings [42.1]
タクシーの違法ドライバー代替(IDS)活動は、タクシー業界において重大な違法行為である。現在、IDSの活動は法執行機関によって手動で管理されている。法執行機関がIDS活動の傾向にあるタクシーを効率的に見つけるのに役立つ計算手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:47:31 GMT)
Quantum thermodynamics of the spin-boson model using the principle of minimal dissipation [41.9]
本研究では, 環境が作業量, 熱量, エントロピー生産量に与える影響について検討した。その結果, 弱い結合形態の作業, 熱, エントロピー生産に有意な差が認められた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:11:18 GMT)
A Perspective on Deep Vision Performance with Standard Image and Video Codecs [41.7]
エッジデバイスや携帯電話などのリソース制約のあるハードウェアは、ディープビジョンモデルにおける推論に必要な計算リソースを提供するために、クラウドサーバーに依存していることが多い。本稿では,ディープビジョンパイプラインにおける標準化コーデックの導入がもたらす意味について検討する。 JPEGとH.264の符号化により、幅広い視覚タスクやモデルにおける精度が大幅に低下することがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:58:05 GMT)
Integrated Sensing-Communication-Computation for Edge Artificial Intelligence [41.6]
統合センシング通信計算(I SCC)は,資源利用の向上に最重要課題である。本稿では、エッジ学習タスクとエッジAI推論タスクをアプリケーション層と物理層の両方で行うための各種のISCCスキームについて述べる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:04:16 GMT)
VideoGigaGAN: Towards Detail-rich Video Super-Resolution [41.4]
ビデオ・スーパーレゾリューション(VSR)アプローチは、アップサンプリングされたビデオに顕著な時間的一貫性を示す。本稿では,高頻度の細部と時間的整合性を持つビデオを生成する新しい生成型VSRモデルであるVideoGigaGANを紹介する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:53 GMT)
ShadowRefiner: Towards Mask-free Shadow Removal via Fast Fourier Transformer [41.0]
影に影響された画像は、しばしば色と照明の空間的な違いが顕著に現れる。我々はFast Fourier Transformerを介してマスクレスシャドウ除去・精細ネットワーク(ShadowRefiner)を導入する。本手法は,NTIRE 2024画像シャドウ除去チャレンジのフィデリティトラックにおいて,第2位を達成し,パーセプチュアルトラックのタイトルを獲得した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:53:33 GMT)
Fast Benchmarking of Asynchronous Multi-Fidelity Optimization on Zero-Cost Benchmarks [40.8]
我々は、ゼロコストベンチマークで効率的な並列HPOを実現するPythonパッケージを紹介した。提案手法は,ファイルシステムに格納された情報に基づいて,正確な返却順序を算出する。私たちのパッケージは pip install mfhpo-simulator でインストールできます。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:56:05 GMT)
Exploring Automated Distractor Generation for Math Multiple-choice Questions via Large Language Models [40.5]
マルチチョイス質問(MCQ)は、評価や実践において、管理しやすく、格付けし、信頼性の高いフォーマットであるため、ほぼ全てのレベルの教育においてユビキタスである。 MCQの最も重要な側面の1つは、実際の学生の間でよくある誤りや誤解を狙った誤った選択肢である。現在まで、高品質なイントラクタを開発するというタスクは、拡張性に制限のある教師や学習コンテンツデザイナにとって、労働力と時間を要するプロセスのままである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:12:19 GMT)
Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment [39.9]
ゼロショット・クロスランガルアライメントのための簡単なアプローチを評価する。言語間の整列モデルは、非整列モデルよりも人間の方が好まれる。異なる言語報酬モデルでは、同言語報酬モデルよりも優れた整列モデルが得られることがある。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:52:36 GMT)
Functional Protein Design with Local Domain Alignment [39.8]
本稿では,タンパク質データベースから抽出したテキストアノテーションを組み込んだマルチモーダルなタンパク質設計フレームワークであるProtein-Alignment Generation (PAAG)を提案する。具体的には、マルチレベルアライメントモジュール内でPAAGは、対応するドメインアノテーションに条件付けられた特定のドメインを含むタンパク質を明示的に生成することができる。実験の結果,PAAGのタンパク質表現が7つの予測タスクよりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:37:54 GMT)
Exploring Supersymmetry: Interchangeability Between Jaynes-Cummings and Anti-Jaynes-Cummings Models [39.6]
量子光学におけるJaynes-Cummings (JC) モデルと反Jaynes Cummings (AJC) モデルの間に存在する超対称接続は発見されていない。超対称手法を用いて,AJCモデルにおける可観測物の時間的進化を求める新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:00:34 GMT)
CrossIn: An Efficient Instruction Tuning Approach for Cross-Lingual Knowledge Alignment [38.4]
英語中心のモデルは、通常他の言語では準最適である。そこで本研究では,言語間命令チューニングデータの混合合成を利用したCrossInという新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:20:50 GMT)
Can We Edit Multimodal Large Language Models? [38.3]
マルチモーダル LLM を編集するための新しいベンチマーク MMEdit を構築した。様々なモデル編集ベースラインを含む総合的な実験を行い、異なるコンポーネントの編集の影響を分析する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:46:22 GMT)
SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels [37.8]
そこで本研究では,Salient Channel Tuning (SCT) と呼ばれる簡易かつ効果的な手法を提案する。実験はVTAB-1Kベンチマークの19タスク中18タスクに対して、VT-Bの0.11Mパラメータを追加することで完全な微調整を行う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:12:57 GMT)
Contract Scheduling with Distributional and Multiple Advice [37.6]
これまでの研究によると、割り込み時間に関する予測は、契約ベースのシステムの性能を改善するのに役立ちます。本稿では,予測が確率分布の形で行われる,より汎用的で現実的な学習強化設定の導入と研究を行う。提案手法は,分布設定における誤差の予測に頑健であることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:58:11 GMT)
Hypergraph Self-supervised Learning with Sampling-efficient Signals [36.7]
自己教師付き学習(SSL)は、高額なラベルなしでハイパーグラフ上で表現学習を行うための有望な代替手段を提供する。既存のハイパーグラフSSLモデルは、主にインスタンスレベルの識別戦略と対照的な手法に基づいている。 3つのサンプリング効率の自己教師型信号を持つハイパーグラフSSLフレームワークであるSE-HSSLを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:14:50 GMT)
Wav2code: Restore Clean Speech Representations via Codebook Lookup for Noise-Robust ASR [35.7]
ノイズロスASRの歪みを低減した特徴レベルSEを実装するために,Wav2codeという自己教師型フレームワークを提案する。そこで本研究では,入力ノイズ表現のグローバル依存性をモデル化し,クリーンなコードを正確に予測するトランスフォーマーベースのコード予測器を提案する。合成および実雑音データセットによる実験により、Wav2codeは音声歪みを解消し、様々な雑音条件下でのASR性能を向上させることができることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:39:57 GMT)
Constituents Correspond to Word Sequence Patterns among Sentences with Equivalent Predicate-Argument Structures: Unsupervised Constituency Parsing by Span Matching [35.6]
教師なし選挙区パーシング(英: Unsupervised constituency parsing)とは、目的の文において構文単位(つまり、構成要素)を形成する単語列を識別することである。本研究では,PASと等価な文集合における単語列パターンに対応するtextbfconstituentを実証的に検証する。本稿では,単語列パターンを初めて計算解析に適用する頻度に基づく手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:17:04 GMT)
Knowledgeable Preference Alignment for LLMs in Domain-specific Question Answering [35.3]
大規模言語モデル(LLM)は、ドメイン固有の質問応答(QA)の実際のシナリオにデプロイされる。本稿では,2つの課題に対処するための2種類の選好セットを構築するKnowPAT(KnowPAT)を紹介する。また,LLM選好と人間の選好を均一に一致させる新たなアライメント目標を設計する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:02:47 GMT)
ViGoR: Improving Visual Grounding of Large Vision Language Models with Fine-Grained Reward Modeling [35.1]
最近の大規模視覚言語モデル(LVLM)は、前例のない視覚的推論能力を示している。生成されたテキストは、しばしば視覚入力の不正確な接地に悩まされ、既存のシーン要素の幻覚などのエラーが発生する。そこで我々は,LVLMの視覚的接地性を高めるために,微粒な報酬モデルを用いた新しいフレームワークViGoRを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:33:53 GMT)
Inverse Neural Rendering for Explainable Multi-Object Tracking [35.1]
我々はRGBカメラから3Dマルチオブジェクト追跡をEmphInverse Rendering (IR)問題として再放送した。我々は、本質的に形状と外観特性を歪ませる生成潜在空間上の画像損失を最適化する。本手法の一般化とスケーリング能力は,合成データのみから生成前を学習することで検証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:37:53 GMT)
Non-negative Contrastive Learning [34.9]
深い表現は、ブラックボックス方式で下流タスクに転送する際の有望なパフォーマンスを示している。しかし、解釈可能性の欠如は依然として大きな課題である。解釈可能な特徴を導出するための非負のコントラスト学習を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:55:22 GMT)
Generalizable Face Landmarking Guided by Conditional Face Warping [34.5]
本研究では,ラベル付き実顔とラベル付けされていないスタイリング顔に基づいて,一般化可能な顔ランドマーク学習パラダイムを提案する。本手法は条件付きフェースワーナーのキーモジュールとして顔ランドマークを学習する。実験により,本手法は顔のランドマーク化タスクにおいて,既存の最先端領域適応手法よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:53:08 GMT)
mABC: multi-Agent Blockchain-Inspired Collaboration for root cause analysis in micro-services architecture [34.0]
クラウドネイティブなテクノロジにおけるマイクロサービスアーキテクチャの複雑さは、システムの安定性と効率性を維持する上での課題をもたらします。マイクロサービスアーキテクチャ(mABC)における根本原因分析のための先駆的フレームワークであるマルチエージェント型コラボレーションを提案する。 mABCは、マイクロサービスアーキテクチャにおける包括的な自動化された根本原因分析と解決を提供し、既存のベースラインと比較してAIOpsドメインの大幅な改善を実現している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:35:39 GMT)
Omniview-Tuning: Boosting Viewpoint Invariance of Vision-Language Pre-training Models [32.8]
100万以上のオブジェクトに対して400万以上のマルチビューイメージテキストペアのデータセットを構築します。我々はOmniview-Tuning(OVT)と呼ばれる新しい微調整フレームワークを設計する。 OVTは、ミニマックスのような最適化戦略を通じて、クロスポイントアライメントの目標を導入する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:41:33 GMT)
Evaluating AI for Law: Bridging the Gap with Open-Source Solutions [32.6]
本研究では,ChatGPTのような汎用AIの法的質問応答における性能を評価する。これらの問題を克服するためにドメイン固有の知識によって強化された基礎モデルを活用することを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:26:01 GMT)
ASID: Active Exploration for System Identification in Robotic Manipulation [32.3]
本稿では,少数の実世界のデータを活用して,シミュレーションモデルを自律的に洗練し,正確な制御戦略を立案する学習システムを提案する。本研究は, ロボット操作作業における調音, 質量, その他の物理パラメータの同定における, このパラダイムの有効性を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:35:38 GMT)
Does Gaussian Splatting need SFM Initialization? [31.7]
3次元ガウススプラッティングは、シーン再構成と新規なビュー合成のための汎用的で効果的な方法として受け入れられている。 Structure-from-Motion (SFM) アルゴリズムは克服すべき重要な限界である。 SFMデータへの依存を回避するために、NeRF再構成をどのように利用できるかを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:52:42 GMT)
Policy Improvement using Language Feedback Models [31.7]
本稿では, 言語フィードバックモデル (LFM) を導入し, 模擬学習に望ましい行動を特定する。 LFMを訓練するために,言語記述に適応した視覚的軌跡について,Large Language Models (LLMs) からフィードバックを得た。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:35:32 GMT)
Leveraging Domain Knowledge for Efficient Reward Modelling in RLHF: A Case-Study in E-Commerce Opinion Summarization [31.6]
本稿では,ドメイン知識を$varphi$に注入する新しい手法を提案する。 E-Commerce Opinion Summarizationにおける我々のアプローチを検証する。コントリビューションには、新しいReward Modelingテクニックと2つの新しいデータセットが含まれています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:38:22 GMT)
Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models [31.6]
混合一般化線形モデルにおいて、統計的に独立な2つの信号を推定する問題を考える。我々の特徴付けは、ランダム行列、自由確率、および近似メッセージパッシングアルゴリズムの理論からのツールの混合を利用する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:18:20 GMT)
MolCRAFT: Structure-Based Drug Design in Continuous Parameter Space [31.5]
近年, 構造に基づく医薬品デザイン(SBDD)の創成モデルが有望な成果を上げている。我々は,自己回帰的手法を適用し,SBDDに拡散する際の不整合問題の要因について,徹底的に研究する。連続パラメータ空間で機能する最初のSBDDモデルであるWessを紹介し、新しいノイズ低減サンプリング戦略を紹介します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:43:39 GMT)
A Family of Pretrained Transformer Language Models for Russian [31.2]
本稿では、エンコーダ(ruBERT, ruRoBERTa, ruELECTRA)、デコーダ(ruGPT-3)、エンコーダ-デコーダ(ruT5, FRED-T5)にまたがる13個のロシアトランスフォーマーLMのコレクションを紹介する。本稿では, モデルアーキテクチャの設計と事前学習について報告し, それらの一般化能力をロシア語理解および生成データセットおよびベンチマーク上で評価した結果について述べる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:54:25 GMT)
MLS-Track: Multilevel Semantic Interaction in RMOT [31.2]
本論文では,Unreal Engine 5をベースとした高品質で低コストなデータ生成手法を提案する。我々は新しいベンチマークデータセット、Refer-UE-Cityを構築し、主に交差点監視ビデオのシーンを含む。また、MLS-Trackと呼ばれるマルチレベル意味誘導型多目的フレームワークを提案し、モデルとテキスト間の相互作用を層単位で強化する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:31:03 GMT)
RAM: Towards an Ever-Improving Memory System by Learning from Communications [30.9]
RAMは、常に改善されたメモリを備えた革新的なRAGベースのフレームワークである。シミュレーションと実ユーザの両方による実験は、従来のRAG法や自己知識法よりも大幅に改善されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:58:51 GMT)
Exposing Image Splicing Traces in Scientific Publications via Uncertainty-guided Refinement [30.7]
画像操作の疑いのある科学出版物の急増は、多くの撤回につながった。画像スプライシング検出は、参照画像の欠如と典型的には小さな改ざんされた領域のため、より困難である。本稿では,破壊要因の影響を軽減するために,不確実性誘導型リファインメントネットワーク(URN)を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:32:30 GMT)
Debiased Distribution Compression [30.6]
本稿では, バイアス入力シーケンスによる圧縮に適した新しい圧縮手法を提案する。バーンイン,近似マルコフ連鎖モンテカルロ,テンパリングによるバイアスを克服しつつ,簡潔かつ正確な後続サマリーを提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:11:16 GMT)
Deep Learning Based Code Generation Methods: Literature Review [30.2]
本稿では、自然言語記述に従って関連するコードフラグメントを生成することを目的としたコード生成タスクに焦点を当てる。本稿では,ディープラーニングに基づくコード生成手法に関する現在の研究を体系的にレビューする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:18:20 GMT)
Optimal Parallelization Strategies for Active Flow Control in Deep Reinforcement Learning-Based Computational Fluid Dynamics [29.5]
本研究では、DRLに基づくアルゴリズムを並列設定で最適化することに焦点を当てる。我々は、AFC問題に使用される既存の最先端DRLフレームワークを検証し、その効率ボトルネックについて議論する。並列効率を約49%から約78%に向上させ,60コアで約47倍の高速化を実現した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:56:02 GMT)
A Quadrature Approach for General-Purpose Batch Bayesian Optimization via Probabilistic Lifting [29.5]
GPyTorch/BoTorchをベースとしたPythonライブラリであるSOBERと呼ばれるカーネル二次構造を用いた確率的昇降によるバッチベイズ最適化のための汎用的でモジュール化されたフレームワークを提案する。 1) 統一されたアプローチ下での下流タスクの冗長性。 2) ドメインに依存しないサンプリング(例えば、離散変数と混合変数、非ユークリッド空間)を提供する、取得関数の勾配を必要としない勾配のないサンプリング器。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:30:46 GMT)
Adaptive Memory Replay for Continual Learning [29.3]
新たなデータが利用可能になれば、ファンデーションモデルの更新は破滅的な忘れに繋がる」連続学習のための適応型メモリリプレイの枠組みを導入し、過去のデータのサンプリングをマルチアームバンディット問題と表現する。我々は,学習効率を犠牲にすることなく,最大10%の忘れ込みを低減しつつ,高い性能を維持するアプローチの有効性を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 22:01:56 GMT)
MaskCD: A Remote Sensing Change Detection Network Based on Mask Classification [29.2]
深層学習を用いたリモートセンシング(RS)画像からの変化(CD)を文献的に広く研究している。入力画像対から分類マスクを適応的に生成し,変化領域を検出するMaskCDを提案する。ピクセルワイズ表現を学習可能なマスク提案に復号することで、望まれる変更対象を再構築する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:05:15 GMT)
A Survey on Open Information Extraction from Rule-based Model to Large Language Model [29.0]
オープン情報抽出(OpenIE)は、構造化されていないテキストから構造化情報を引き出すための重要なNLPタスクである。本調査では,2007年から2024年までのOpenIE技術の概要を概説し,時系列的視点を強調した。この記事では、OpenIEアプローチをルールベース、ニューラル、トレーニング済みの大規模言語モデルに分類し、時系列フレームワーク内でそれぞれについて議論する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:47:27 GMT)
MultiPhys: Multi-Person Physics-aware 3D Motion Estimation [28.9]
モノクロビデオから多人数動作を復元する手法であるMultiPhysを紹介する。私たちの焦点は、様々なエンゲージメントの度合いで、ペアの個人間のコヒーレントな空間配置をキャプチャすることにあります。本研究では,運動量に基づく運動を物理シミュレーターに自動回帰的に供給するパイプラインを考案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:29:29 GMT)
AniClipart: Clipart Animation with Text-to-Video Priors [28.8]
AniClipartは、静的な画像をテキストからビデオへの事前案内による高品質なモーションシーケンスに変換するシステムである。実験結果から,提案したAniClipartは既存の画像・映像生成モデルより一貫して優れていることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:24:28 GMT)
AdvisorQA: Towards Helpful and Harmless Advice-seeking Question Answering with Collective Intelligence [28.7]
よりパーソナライズされた関心事に対するアドバイスを提供する上で,LSMの能力を評価するために開発された最初のベンチマークであるAdvancedQAを紹介する。私たちは、日常生活の質問、多様な応答、そして私たちの役に立つ度合いをトレーニングするための過半数の投票ランキングを含むベンチマークを完了しました。ベースライン実験は, 有用度測定, GPT-4, 人的評価により, AdvisorQAの有効性を検証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:15:41 GMT)
Gradient-Regularized Out-of-Distribution Detection [28.5]
現実のアプリケーションにおけるニューラルネットワークの課題の1つは、これらのモデルが元のトレーニングディストリビューションからデータが送られていないときに犯す過信エラーである。本稿では,学習中の損失関数の勾配に埋め込まれた情報を活用して,ネットワークが各サンプルに対して所望のOODスコアを学習できるようにする方法を提案する。また、トレーニング期間中に、より情報性の高いOODサンプルにネットワークを露出させるための、新しいエネルギーベースのサンプリング手法を開発した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:50:23 GMT)
Enhance Robustness of Language Models Against Variation Attack through Graph Integration [28.3]
文字変動攻撃に対する言語モデルのロバスト性を高めるための新しい手法であるCHINese vAriatioN Graph Enhancementを提案する。 CHANGE は PLM の逆操作テキストの解釈を本質的に強化する。多数のNLPタスクで実施された実験は、CHANGEが敵の攻撃と戦う際に、現在の言語モデルより優れていることを示している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:04:39 GMT)
RoNID: New Intent Discovery with Generated-Reliable Labels and Cluster-friendly Representations [27.8]
New Intent Discovery (NID)は、オープンワールドシナリオにおける新しい意図グループを特定することを目的としている。現在の手法は、不正確な擬似ラベルと表現学習に問題がある。本稿では,EMスタイルの手法により最適化されたロバスト・ニューインテント・ディスカバリー・フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:54:55 GMT)
Evaluating the Security of Merkle Trees in the Internet of Things: An Analysis of Data Falsification Probabilities [27.5]
本稿では,メルクルパスの長さとハッシュ長を考慮し,データ改ざん確率を計算する理論的枠組みを開発する。実験的な実験により理論モデルが検証され、様々なハッシュ長とメルクルパス長を持つシミュレーションが探索された。以上の結果より, より長いメルクル経路との逆関係と, ハッシュ長の増加に伴うファルシフィケーション確率の低下が示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:24:12 GMT)
Dynamic Gaussians Mesh: Consistent Mesh Reconstruction from Monocular Videos [27.5]
DG-Mesh(Dynamic Gaussians Mesh)は、単一のモノクロビデオから高忠実で時間に一貫性のあるメッシュを再構築するフレームワークである。我々の研究は、最近の3Dガウススプラッティングの進歩を活用して、ビデオから時間的一貫性のあるメッシュシーケンスを構築する。メッシュガイドによる密度化と変形したガウスへのプルーニングによるメッシュ再構築を実現するため,均等に分散したガウスアンを奨励するガウス・メシュアンチョリングを導入する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:58:16 GMT)
DoughNet: A Visual Predictive Model for Topological Manipulation of Deformable Objects [27.2]
弾塑性物体との相互作用を計画するトランスフォーマーアーキテクチャ DoughNetはロボット操作の計画を可能にし、ロボットや人間が作った目標を再現するために、適切なツール、ポーズ、開口幅を選択する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:55:23 GMT)
TIMIT Speaker Profiling: A Comparison of Multi-task learning and Single-task learning Approaches [27.2]
本研究は、TIMITデータセット上の4つの話者プロファイリングタスクを深層学習技術を用いて探索する。マルチタスク学習とシングルタスクモデルの可能性と課題を強調します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:59:54 GMT)
Generating Diverse Criteria On-the-Fly to Improve Point-wise LLM Rankers [26.8]
そこで本稿では,様々な視点から評価基準に基づいてランキングスコアを生成するランキング作成手法を提案する。 BEIRベンチマークから8つのデータセットを調査した本研究では,この多視点基準アンサンブルアプローチを取り入れたことにより,ポイントワイドLLMローカの性能が著しく向上したことを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:42:46 GMT)
Label Inference Attacks against Node-level Vertical Federated GNNs [26.8]
ゼロ・バックグラウンドの知識戦略を用いて,VFL (Vertical Federated Learning) のラベル推論攻撃について検討した。提案した攻撃であるBlindSageは、実験で素晴らしい結果をもたらし、ほとんどのケースで100%近い精度を実現しています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:49:21 GMT)
NORMAD: A Benchmark for Measuring the Cultural Adaptability of Large Language Models [26.6]
大規模言語モデルがアウトプットを多様な文化的規範に適応できるかどうかは不明である。我々は75カ国の社会的・文化的規範を表す2.6kストーリーを含む新しいデータセットであるNormAdを紹介した。我々の研究は、LLMがあらゆる文脈の粒度にわたる文化的推論に苦慮していることを明らかにした。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:48:50 GMT)
Routers in Vision Mixture of Experts: An Empirical Study [26.5]
Mixture-of-Experts (MoE)モデルは、計算コストを大幅に増加させることなく、モデル容量をスケールアップする有望な方法である。 MoEsの主要なコンポーネントはルータであり、どのパラメータ(専門家)プロセスのサブセットが埋め込み(トークン)を特徴付けるかを決定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:48:31 GMT)
One-Shot Sequential Federated Learning for Non-IID Data by Enhancing Local Model Diversity [26.1]
我々は,局所モデルの多様性向上戦略を提案することにより,非IIDデータに対する一発の逐次フェデレーション学習を改善する。提案手法は,既存のワンショットPFL法よりも優れた性能を示し,最先端のワンショットSFL法と比較して精度が向上する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:31:48 GMT)
Compositional Neural Textures [25.9]
合成ニューラルモデルを用いてテクスチャを表現するための、完全に教師なしのアプローチを導入する。我々は,各テキストを,空間的支持がその形状を近似する2次元ガウス関数と,その詳細な外観を符号化する関連する特徴として表現する。このアプローチは、画像テクスチャから他のイメージへの外観の移動、テクスチャの多様化、テクスチャの多様性の明確化と修正、編集の伝播、テクスチャアニメーション、ダイレクトテキスト操作など、幅広いアプリケーションを可能にする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:09:34 GMT)
Cross-model Mutual Learning for Exemplar-based Medical Image Segmentation [25.9]
Exemplar-based Medical Image(CMEMS)のためのクロスモデル相互学習フレームワーク外来医用画像のためのクロスモデル相互学習フレームワーク(CMEMS)について紹介する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:18:07 GMT)
KTRL+F: Knowledge-Augmented In-Document Search [25.7]
知識を付加した文書内検索タスクであるKTRL+Fを導入する。幻覚、高いレイテンシ、あるいは外部知識を活用する上での困難といった、既存のモデルの制限を見つけます。本稿では,高速化と性能の両立を図った知識付加句検索モデルを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:08:21 GMT)
Look, Listen, and Answer: Overcoming Biases for Audio-Visual Question Answering [25.6]
AVQA(Audio-Visual Question Answering)は、複雑なマルチモーダル推論タスクである。一般的なAVQAアプローチは、データセットのバイアスを過度に学習する傾向があり、結果として堅牢性が低下する。本研究では,公開データセット(textitMUSIC-AVQA)のテストスプリット内での質問の表現と,その後に分割された質問に対する分散シフトを導入する2つのステップで構築された新しいデータセットであるtextitMUSIC-AVQA-Rを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:16:02 GMT)
Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair [25.5]
同時機械翻訳(SiMT)システムにおいて、SIコーパスを用いた訓練は高品質で低レイテンシなシステムを実現する効果的な方法である。本稿では,既存の音声翻訳コーパスを解釈型データに変換し,原語順を維持し,大言語モデル(LLM-SI-Corpus)を用いてソースコンテンツ全体を保存する手法を提案する。 LLM-SI-Corpusを用いたテキスト・テキスト・音声・テキスト設定における微調整SiMTモデルは、オフラインデータセットでトレーニングされたモデルと同じ品質を維持しながら、レイテンシを低減することを実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:24:12 GMT)
Latent Concept-based Explanation of NLP Models [25.4]
本稿では、潜在概念に基づく予測のための説明を生成するLatent Concept Attribution法(LACOAT)を提案する。 LACOATは、有能な入力語の表現をトレーニング潜在空間にマッピングすることで機能し、この潜在空間内の文脈に基づく説明を予測できる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:50:50 GMT)
JailBreakV-28K: A Benchmark for Assessing the Robustness of MultiModal Large Language Models against Jailbreak Attacks [24.7]
本稿では,大規模言語モデルのジェイルブレイクを成功させる手法が,MLLMのジェイルブレークに等しく有効かどうかを検討する。 MLLM への LLM ジェイルブレイク手法の転送性を評価するための先駆的なベンチマークである JailBreakV-28K を紹介する。 LLMの高度なジェイルブレイク攻撃と、最近のMLLMのジェイルブレイク攻撃によるイメージベースのジェイルブレイク入力により、20000のテキストベースのジェイルブレイクプロンプトを生成します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:11:53 GMT)
Is this the real life? Is this just fantasy? The Misleading Success of Simulating Social Interactions With LLMs [24.6]
大規模言語モデル(LLM)はより豊かな社会シミュレーションを可能にし、様々な社会現象の研究を可能にしている。最近の研究は、これらのシミュレーションについて、人間とAIエージェントが現実世界で関与する不完全で情報非対称な相互作用と、基本的には異なっています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:55:07 GMT)
The devil is in the object boundary: towards annotation-free instance segmentation using Foundation Models [24.5]
オブジェクト検出とインスタンスのセグメンテーションでは、SAMやDINOのような基礎モデルは満足なパフォーマンスを達成するのに苦労する。我々は、新しい分類優先発見パイプラインにおいて、$textbfZip$, $textbfZ$ips up CL$textbfip$, SAMを提案する。 Zipは、COCOデータセット上のSAMのマスクAPを12.5%大きく向上させ、さまざまな設定で最先端のパフォーマンスを確立する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:22:38 GMT)
Value Approximation for Two-Player General-Sum Differential Games with State Constraints [24.0]
Hamilton-Jacobi-Isaacs (HJI) PDEを数値的に解くことで、2プレイヤー差分ゲームにおける平衡フィードバック制御が可能になるが、次元性(CoD)の呪いに直面している。物理インフォームドニューラルネットワーク(PINN)は、PDEの解決においてCoDを緩和する可能性を示しているが、バニラPINNはサンプリングの性質から不連続な解を学ぶのに不足している。本研究では,(1)監督均衡とHJI PDEの両方が指導するハイブリッド学習手法,(2)価値硬化手法の3つの可能性について検討する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:53:16 GMT)
PolyOculus: Simultaneous Multi-view Image-based Novel View Synthesis [24.0]
本稿では,複数の自己整合性を持つ新しいビューを同時に生成できるセットベース生成モデルを提案する。我々のアプローチは一度に1つの画像を生成することに限らず、可変数のビューを条件にすることができる。このモデルでは、ループや双眼の軌跡のような自然な順序のないビューを生成でき、そのようなタスクにおいて他の方法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:44:53 GMT)
Not All Voxels Are Equal: Hardness-Aware Semantic Scene Completion with Self-Distillation [23.9]
セマンティックコンプリート(セマンティックコンプリート、セマンティックコンプリート、セマンティックコンプリート、セマンティックコンプリート、セマンティックコンプリート)は、自動運転車に密集した幾何学的およびセマンティック情報を提供する。既存の方法は通常、ボクセルの分類問題を定式化し、訓練中に各ボクセルを等しく扱う。本稿では,シーンモデルを訓練するためのHアプローチを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:25:59 GMT)
Visually grounded few-shot word learning in low-resource settings [23.8]
そこで本研究では,数組の単語イメージ対から新しい単語とその視覚的描写を学習する音声モデルを提案する。提案手法では,与えられた単語イメージの例対を用いて,音声と画像の大規模なコレクションから教師なしの単語イメージトレーニングペアを抽出する。この新しいモデルでは、既存の英語ベンチマークの以前のアプローチよりも少ないショットでより良いパフォーマンスを実現している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:36:53 GMT)
Sequential Compositional Generalization in Multimodal Models [23.5]
我々は,複数の一様モデルと多様モデルの総合的な評価を行う。以上の結果から,バイモーダルモデルとトリモーダルモデルでは,テキストのみに比較して明確なエッジがみられた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:04:15 GMT)
Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery [23.4]
Generalized Class Discovery (GCD) はラベルを非ラベルデータに動的に割り当てることを目的としている。本稿では,学習可能な潜在的なプロトタイプを導入し,クラスタプロトタイプを拡張する適応型探索機構を提案する。我々の手法は、最も近い競争相手をかなりの差で上回っている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:26:30 GMT)
Secure Key from Quantum Discord [23.0]
特定の量子暗号プロトコルにおけるセキュリティの分析に不一致を利用する方法を示す。提案手法は,量子チャネルによる基底ミスアライメントだけでなく,量子ビット源および量子ビット測定の不完全性に対して頑健である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:53:56 GMT)
Cross-view and Cross-pose Completion for 3D Human Understanding [22.8]
画像のみを用いて人間中心のデータを扱う自己教師付き学習に基づく事前学習手法を提案する。身体中心タスクのためのモデルと手中心タスクのためのモデルを事前訓練する。汎用的なトランスフォーマーアーキテクチャでは、これらのモデルは、広範囲の人間中心の下流タスクにおいて、既存の自己教師付き事前学習方法より優れている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:03:04 GMT)
Planning with Language Models Through The Lens of Efficiency [22.5]
我々は、LSMを計画に使用するコストを分析し、最近の傾向が極めて不経済的であることを強調する。我々は,より効率的な手法を提案し,計算資源の有責任な利用を論じる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:27:29 GMT)
TextCenGen: Attention-Guided Text-Centric Background Adaptation for Text-to-Image Generation [22.4]
Text-to-image (T2I) 世代は、テキストの適応から固定背景へのシフトを目撃している。提案手法であるTextCenGenでは,テキストフレンドリーな画像生成のための空白領域の動的適応を導入している。提案手法では,T2Iモデルにおいて,予め定義されたテキスト領域のホワイトスペースを戦略的に保留する画像を生成するために,力による注意誘導を用いる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:10:24 GMT)
Aligning Language Models to Explicitly Handle Ambiguity [22.1]
音声言語では、発話は効率性のために不完全または曖昧な形をしていることが多い。モデルがユーザクエリの本質的なあいまいさを十分に扱うためには、非常に重要です。本稿では,あいまいな入力を明示的に処理する対話エージェントのアライメント手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:59:53 GMT)
LibriSQA: A Novel Dataset and Framework for Spoken Question Answering with Large Language Models [22.0]
本稿では,LibriSQAデータセット上でSpoken Question Answering(SQA)タスクを実行するための軽量なエンドツーエンドフレームワークを提案する。 ASRをSQAフォーマットに書き換えることで、ASRタスクの処理におけるフレームワークの機能をさらに裏付ける。我々の経験的発見は、多モーダル情報の整合と解釈に対するLLMの適性を高め、ユニバーサル多モーダルLLMの開発への道を開いた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:13:58 GMT)
Simultaneous Detection and Interaction Reasoning for Object-Centric Action Recognition [21.7]
エンドツーエンドのオブジェクト中心のアクション認識フレームワークを提案する。同時に1つのステージで検出と相互作用の推論を行う。我々はSomes-ElseとIkea-Assemblyという2つのデータセットで実験を行う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:06:12 GMT)
MTGA: Multi-view Temporal Granularity aligned Aggregation for Event-based Lip-reading [21.6]
唇読みは、話者の唇の動きの視覚情報を利用して、単語や文を認識することである。 MTGA(Multi-view Temporality-aligned Aggregation)と呼ばれる新しいフレームワークを提案する。本手法は, イベントベース, ビデオベースの唇読解法の両方に優れる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:16:56 GMT)
Multi-Agent Training beyond Zero-Sum with Correlated Equilibrium Meta-Solvers [21.5]
本稿では,n-player, general-sum extensive form game におけるエージェントのトレーニングアルゴリズムを提案する。また,メタソリューションとして相関平衡(CE)を提案するとともに,新しい解法概念であるGini Correlated Equilibrium(MGCE)を提案する。 JPSROのためのCEメタソルバを用いていくつかの実験を行い、n-player, general-sumゲーム上で収束を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:41:49 GMT)
State Space Models for Event Cameras [21.3]
イベントベースビジョンに学習可能な時間スケールパラメータを備えた状態空間モデル(SSM)を導入する。以上の結果から,SSMモデルではトレーニングが33%高速化され,トレーニング入力よりも高い周波数でテストした場合の性能劣化が最小限に抑えられることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:29:14 GMT)
Stochastic Smoothed Gradient Descent Ascent for Federated Minimax Optimization [20.7]
フェデレートされたミニマックス最適化は、さまざまな機械学習タスクに広く応用されているため、関心が高まりつつある。我々は、フェデレートされたミニマックス最適化のためのFederated Smoothed Descent Ascent (ESSGDA)と呼ばれる新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 22:40:38 GMT)
UIClip: A Data-driven Model for Assessing User Interface Design [20.7]
ユーザインタフェースの設計品質と視覚的関連性を評価するための機械学習モデルUIClipを開発した。 UIClipがUI設計品質の即時評価に依存するダウンストリームアプリケーションをどのように促進するかを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:43:08 GMT)
Transferability Ranking of Adversarial Examples [20.4]
本稿では,転送攻撃処理を洗練させるランキング戦略を提案する。多様な代理モデルの集合を利用することで, 逆例の転送可能性を予測することができる。提案手法を用いて, 対向例の移動率を, ランダムな選択から, ほぼ上界レベルまで20%に引き上げることができた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:41:58 GMT)
Beyond Average: Individualized Visual Scanpath Prediction [20.4]
個別化されたスキャンパス予測(ISP)は、様々な視覚的タスクにおいて、異なる個人がどのように注意をシフトするかを正確に予測することを目的としている。 ISPはオブザーバのユニークな注意特性を特徴付け統合するためのオブザーバエンコーダ、オブザーバ中心の機能統合アプローチ、適応的な固定優先順位付け機構を備えている。提案手法は,一般に異なるデータセット,モデルアーキテクチャ,視覚的タスクに適用可能であり,一般的なスキャンパスモデルを個別化するための包括的なツールを提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:51:42 GMT)
AccidentBlip2: Accident Detection With Multi-View MotionBlip2 [20.1]
AccidentBlip2は、事故リスクが発生するかどうかをリアルタイムで予測できるマルチモーダルな大規模言語モデルである。 AccidentBlip2は、いかなるBEVイメージやLiDARにも依存せず、推論パラメータの数と推論コストを大幅に削減することができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:54:25 GMT)
MedThink: Explaining Medical Visual Question Answering via Multimodal Decision-Making Rationale [19.9]
我々は、データ準備を効率化し、新しいベンチマークMedVQAデータセットを構築するための半自動アノテーションプロセスを開発した。 R-RADとR-SLAKEのデータセットは、中間的な医学的意思決定の根拠を提供する。 R-RADでは83.5%、R-SLAKEでは86.3%の精度が得られ、既存の最先端のベースラインを著しく上回っている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:53:19 GMT)
From Image to Video, what do we need in multimodal LLMs? [19.9]
MLLM(Multimodal Large Language Models)は、マルチモーダル情報を理解する上で重要な機能を示す。画像LLMからの映像LLMのための資源効率の高い開発パイプラインRED-VILLMを提案する。我々のアプローチは、よりコスト効率が高くスケーラブルなマルチモーダルモデルの進歩の可能性を強調します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 02:43:37 GMT)
SelectLLM: Can LLMs Select Important Instructions to Annotate? [19.6]
我々はSelectLLMを紹介した。これは大規模言語モデルで未記述の命令を選択的にアノテートするためのフレームワークである。我々の実験では、SelectLLMは命令チューニングベンチマークにおいて、他の最先端の手法と一致し、性能が良くなることを示した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:35:12 GMT)
XIMAGENET-12: An Explainable AI Benchmark Dataset for Model Robustness Evaluation [19.4]
XIMAGENET-12は、200K以上の画像と15,410のマニュアルセマンティックアノテーションで構成されている。本研究では、ロバスト性評価のための定量的基準を開発し、様々な条件下での視覚モデルの性能の微妙な理解を可能にする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:57:49 GMT)
Quantifying Aleatoric and Epistemic Uncertainty with Proper Scoring Rules [19.2]
不確実性表現と定量化は機械学習において最重要である。本稿では,適切なスコアリングルールに基づいて,アレータリックおよび(現状)不確実性の定量化のための尺度を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:20:19 GMT)
CogME: A Cognition-Inspired Multi-Dimensional Evaluation Metric for Story Understanding [19.1]
本稿では,物語理解に着目したAIモデルを対象とした認知型多次元評価指標であるCogMEを紹介する。我々は,タスクの性質を理解することに基づくメトリクスの必要性を論じ,人間の認知過程と密接に整合するように設計されている。このアプローチは、従来の全体的なスコアを超えて洞察を提供し、より高い認知機能をターゲットにしたより洗練されたAI開発のための道を開く。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:11:49 GMT)
FedEval-LLM: Federated Evaluation of Large Language Models on Downstream Tasks with Collective Wisdom [19.1]
大規模言語モデル(LLM)の協調学習のための有望なソリューションとして、フェデレートラーニング(FL)が登場した。ラベル付きテストセットと類似度に基づくメトリクスに依存する従来の評価手法は、許容できる答えのサブセットのみをカバーする。我々は、ラベル付きテストセットや外部ツールに依存することなく、下流タスクにおけるLCMの信頼性の高い性能測定を提供するFedEval-LLMを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:46:26 GMT)
Vesper: A Compact and Effective Pretrained Model for Speech Emotion Recognition [18.7]
本稿では,一般的な大規模事前学習モデル(PTM)を音声感情認識タスクに適用するパラダイムを提案する。本稿では,Vesperという,感情固有の事前学習エンコーダを提案する。ヴェスパーは、アコースティックおよびセマンティック表現をキャプチャする能力を改善するために階層的およびクロスレイヤーな自己スーパービジョンを使用している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:08:07 GMT)
Measuring Feature Dependency of Neural Networks by Collapsing Feature Dimensions in the Data Manifold [18.6]
ニューラルネットワークモデルの特徴依存性を測定するための新しい手法を提案する。その動機は、人間が理解可能な機能から情報を使っているかどうかを問うことによって、モデルをよりよく理解することにある。本手法は,合成画像データに基づいて学習した深層ニューラルネットワークモデルを用いて実験を行った。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:10:18 GMT)
Multi-Level Aggregation and Recursive Alignment Architecture for Efficient Parallel Inference Segmentation Network [18.5]
セグメンテーションタスク用にカスタマイズされた並列推論ネットワークを提案する。実時間速度を確保するために浅いバックボーンを使用し、モデル容量の削減と精度の向上のために3つのコアコンポーネントを提案する。我々のフレームワークは、CityscapesとCamVidデータセットの最先端のリアルタイム手法よりも、速度と精度のバランスが良くなっている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:33:32 GMT)
Hacking Task Confounder in Meta-Learning [18.2]
本稿では,メタ学習コーサル表現(MetaCRL)を提案する。我々の研究は、ベンチマークデータセット上での最先端(SOTA)性能を達成する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:31:28 GMT)
EVIT: Event-Oriented Instruction Tuning for Event Reasoning [18.0]
イベント推論は、特定の関係に従ってイベントを推論し、将来のイベントを予測することを目的としている。大規模言語モデル(LLM)は、その豊富な知識と推論能力のために、イベント推論において大きな進歩を遂げている。しかし、現在使われている命令調整モデルでは、これらのタスクを管理するのに例外的な習熟度が一貫して示されていない。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:14:53 GMT)
Noise Stability Optimization for Flat Minima with Tight Rates [18.0]
関数 $F(W) = mathbbE_U[f(W + U)]$ を最小化する方法を示す。私たちは、U$と$-U$の両方にノイズを加えるシンプルな実用的なアルゴリズムを設計します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:59:01 GMT)
Accounting for AI and Users Shaping One Another: The Role of Mathematical Models [17.9]
我々は,AIとユーザが相互にどのように形成するかを数学的に規定する形式的相互作用モデルの開発を論じる。ユーザと対話するAIシステムを設計、評価、監査する際に、正式なインタラクションモデルを活用するようにコミュニティに呼びかけます。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:49:02 GMT)
FedMID: A Data-Free Method for Using Intermediate Outputs as a Defense Mechanism Against Poisoning Attacks in Federated Learning [17.8]
フェデレーション学習は、クライアントからのローカルアップデートを組み合わせてグローバルモデルを生成する。本稿では,中間出力に基づく局所モデルの関数的マッピングを用いて,フェデレート学習における中毒攻撃の防御を行う新しいパラダイムを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:10:05 GMT)
How far are AI-powered programming assistants from meeting developers' needs? [17.8]
GitHub CopilotのようなIDE内AIコーディングアシスタントツール(ACAT)は、開発者のコーディング習慣に大きな影響を与えている。我々は,実開発シナリオをシミュレートし,27人のコンピュータサイエンス学生を募集し,その振る舞いを3つのACATを用いて調査する。 ACATは一般的にタスク完了率を高め、時間を短縮し、コード品質を改善し、自己認識の生産性を高めます。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:51:14 GMT)
CoReS: Orchestrating the Dance of Reasoning and Segmentation [17.8]
セグメンテーションを推論する行為は、人間の視覚探索の認知段階を反映すべきである。本稿では,Reasoning and Segmenting (CoReS) の連鎖を紹介する。実験では、ReasonSegデータセットで最先端の手法を7.1%上回るCoReSの優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:36:58 GMT)
Trusted Multi-view Learning with Label Noise [17.5]
マルチビュー学習手法は、意思決定の不確実性を無視しながら、意思決定精度の向上に焦点を当てることが多い。本稿では,この問題を解決するため,信頼度の高いマルチビューノイズ修正手法を提案する。我々は,TMNRと最先端のマルチビュー学習,および5つの公開データセットに基づくラベルノイズ学習ベースラインを実証的に比較した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:47:30 GMT)
Seeing Motion at Nighttime with an Event Camera [17.4]
イベントカメラは、高時間分解能(マイクロ秒)と高ダイナミックレンジ(120dB)で動的に反応する主に学習可能なイベントタイムスタンプキャリブレーションモジュール(LETC)を含む夜間イベント再構築ネットワーク(NER-Net)を提案する。我々は、64,200の空間的および時間的に整列した画像GTと低照度イベントを含む、同軸イメージングにより、ペア化された実光イベントデータセット(RLED)を構築した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:58:27 GMT)
StyleBooth: Image Style Editing with Multimodal Instruction [17.3]
原画像が与えられた場合、画像編集は提供された命令に一致した画像を生成することを目的としている。本稿では,画像スタイルの編集に焦点をあて,画像編集のための総合的なフレームワークであるStyleBoothを提案する。反復的なスタイル記述のチューニングと編集とユーザビリティのフィルタリングによって、StyleBoothデータセットは、コンテンツ一貫性のあるスタイリング/プレーンイメージペアを提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:58:55 GMT)
Adaptive Catalyst Discovery Using Multicriteria Bayesian Optimization with Representation Learning [17.0]
高性能触媒は、持続可能なエネルギー変換と人間の健康に不可欠である。触媒の発見は、巨大で高次元の構造と合成空間をナビゲートするための効率的なアプローチがないため、課題に直面している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:11:06 GMT)
Exploring Boundaries and Intensities in Offensive and Hate Speech: Unveiling the Complex Spectrum of Social Media Discourse [17.0]
本稿では,3つのタスクに対して8,258のツイートをアノテートしたAmharicのベンチマークデータセットを提案する。私たちの研究は、ほとんどのツイートが攻撃的でない、憎悪の度合いの低いレベルに属することを強調しています。民族的および政治的憎悪の対象の出現は、我々のデータセットに顕著に重複しており、エチオピアの社会政治の景観における複雑な関係を強調している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:52:50 GMT)
Long-lived oscillations of false and true vacuum states in neutral atom systems [16.9]
長距離リドバーグ相互作用を持つ1次元反強磁性中性原子鎖における偽状態と真真空状態の長寿命振動について検討した。反強磁性中性原子系とは異なる準粒子振動の新しいスペクトルシグネチャを同定する。提案装置の現在の中性原子プラットフォーム上での実験的アクセシビリティを評価する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:52:14 GMT)
False vacuum decay and nucleation dynamics in neutral atom systems [16.9]
偽真空崩壊と核生成は非平衡力学現象を研究する機会を与える。最近の研究は、1次元強磁性イジングスピンと超流体における偽真空崩壊を調べた。ライドバーグ相互作用を持つ1次元反強磁性中性原子鎖における偽真空核生成ダイナミクスについて検討した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:39:47 GMT)
How Do Recommendation Models Amplify Popularity Bias? An Analysis from the Spectral Perspective [16.7]
勧告システム(RS)は、しばしば人気バイアスに悩まされる。本稿では,主特異値の大きさに罰則を課すことにより,このバイアスを軽減する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:59:32 GMT)
S3R-Net: A Single-Stage Approach to Self-Supervised Shadow Removal [16.6]
本稿では,自己監視型シャドウ除去ネットワークであるS3R-Netを紹介する。 2分岐 WGAN モデルは、ユニファイト・アンド・アダプティフェノメノンに依存する自己超越を達成する。出力データのスタイルを統一し、不整合なシャドウフリー参照画像のデータベースから特徴を推測する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:36:37 GMT)
Concept Induction: Analyzing Unstructured Text with High-Level Concepts Using LLooM [16.5]
非構造化テキストから高レベルな概念を生成する計算プロセスである概念帰納法を導入する。本稿では,大規模な言語モデルを用いてサンプルテキストを反復的に合成する概念帰納アルゴリズムLLooMを提案する。 LLooMのコンセプトは、品質とデータカバレッジの観点から、従来のトピックモデルのテクニックにより改善されていることが分かりました。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:26:02 GMT)
Variational Multi-Modal Hypergraph Attention Network for Multi-Modal Relation Extraction [16.5]
マルチモーダル関係抽出のための変分マルチモーダルハイパーグラフアテンションネットワーク(VM-HAN)を提案する。 VM-HANは、マルチモーダル関係抽出タスクにおける最先端のパフォーマンスを達成し、精度と効率の点で既存の手法より優れている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:56:47 GMT)
Boolean Matching Reversible Circuits: Algorithm and Complexity [16.4]
入力否定と置換の同値性は量子時間では可逆であり、古典的な複雑性は指数関数的であることを示す。この結果は、自動化問題の解決における量子指数的スピードアップの初めての実証である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:47:17 GMT)
Geometric relative entropies and barycentric Rényi divergences [16.4]
単調な量子相対エントロピーは、P$が確率測度であるときに、単調なR'enyi量を定義する。 P$が確率測度であるときに、単調量子相対エントロピーが単調R'enyi量を定義することを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:11:56 GMT)
Personalized Forgetting Mechanism with Concept-Driven Knowledge Tracing [16.4]
概念駆動型パーソナライズドフォーッティング知識追跡モデル(CPF)を提案する。 CPFは知識概念間の階層的な関係を統合し、生徒のパーソナライズされた認知能力を統合する。我々のCPFは、生徒のパフォーマンスを予測するために、現在の忘れ曲線理論に基づく手法よりも優れています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:28:50 GMT)
Continual Offline Reinforcement Learning via Diffusion-based Dual Generative Replay [16.3]
本研究では, 逐次的オフラインタスクに取り組むために, 前方転送を容易にし, 破滅的な忘れを緩和する実践的パラダイムについて検討する。本稿では,生成した擬似データの同時再生により,過去の知識を保持できる2つの生成再生フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:49:02 GMT)
Stronger, Fewer, & Superior: Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation [16.1]
私たちはまず、ドメイン一般化セマンティック(DGSS)の文脈における様々なビジョン基礎モデル(VFM)を評価し、活用する。 DGSS にパラメータ効率よく VFM を利用するための頑健な微調整手法,すなわち Rein を導入する。トレーニング可能なパラメータが少ないため、ReinはDGSSタスクのVFMを効率よく微調整し、完全なパラメータの微調整を驚くほど上回った。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:33:37 GMT)
mOthello: When Do Cross-Lingual Representation Alignment and Cross-Lingual Transfer Emerge in Multilingual Models? [15.9]
本稿では,2つの質問を探索するテストベッドとして,合成タスクであるMultilingual Othello(mOthello)を提案する。多言語事前学習で訓練されたモデルは、全ての入力言語にまたがる言語ニュートラル表現を学習できないことがわかった。本稿では,言語ニュートラル表現の学習を誘導し,言語間移動を促進する多言語事前学習手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:03:08 GMT)
ProTA: Probabilistic Token Aggregation for Text-Video Retrieval [15.9]
本稿では,コンテンツ非対称性との相互相互作用を扱うための確率的トークン集約(textitProTA)を提案する。 textitProTAはMSR-VTT(50.9%)、LSMDC(25.8%)、DiDeMo(47.2%)を大幅に改善する
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:20:30 GMT)
Performance Evaluation of Segment Anything Model with Variational Prompting for Application to Non-Visible Spectrum Imagery [15.7]
この研究は、X線/赤外線モダリティに関心のあるオブジェクトのセグメンテーションにおけるセグメンション・任意のモデル機能を評価する。提案手法は,ボックスプロンプトが与えられた場合,SAMはオブジェクトをX線モードで分割できるが,その性能は点プロンプトによって異なる。このモダリティの低コントラストの性質を考えると、赤外線オブジェクトもポイントプロンプトでセグメント化することが困難である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:04:14 GMT)
SKIP: Skill-Localized Prompt Tuning for Inference Speed Boost-Up [15.7]
本稿では,SKIll-localized Prompt tuning (SKIP) と呼ばれる新しい手法を提案する。本手法は,言語モデルにおけるスキルローカライズされたサブネットワークの調査と活用により,推論効率を大幅に向上させる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:43:50 GMT)
Demonstration of DB-GPT: Next Generation Data Interaction System Empowered by Large Language Models [15.7]
我々は,大規模な言語モデルを従来のデータインタラクションタスクに統合した,革新的で製品対応のPythonライブラリDB-GPTを提案する。 DB-GPTは、自然言語で記述されたデータインタラクションタスクを理解し、LLMを利用したコンテキスト認識応答を提供するように設計されている。サービス指向マルチモデル管理フレームワーク(SMMF)は、データのプライバシとセキュリティを保証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:45:26 GMT)
Can We Catch the Elephant? The Evolvement of Hallucination Evaluation on Natural Language Generation: A Survey [15.7]
自然言語生成の幻覚(NLG)は、部屋の象のように見えますが、しばしば見落とされています。大きな言語モデル(LLM)では、さまざまな下流タスクやカジュアルな会話で幻覚が発生する。本稿では,幻覚評価手法の進化に関する包括的調査を行う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:52:18 GMT)
Chimera: A Lossless Decoding Method for Accelerating Large Language Models Inference by Fusing all Tokens [15.6]
投機的サンプリングに特化して設計された新しいフレームワークを提案する。このフレームワーク内では、以前に生成されたトークンを効果的に活用し、後続の単語を予測する軽量なドラフトモデルを導入する。我々は、バニラ自動回帰復号方式と比較して平均遅延速度比が2.7倍になるという印象的な結果を示した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:23:16 GMT)
Towards Realistic Scene Generation with LiDAR Diffusion Models [15.5]
拡散モデル(DM)はフォトリアリスティック画像合成において優れているが、LiDARシーン生成への適応は大きなハードルとなる。我々は,LiDARシーンのリアリズムを捉えるために,LiDAR拡散モデル(LiDM)を提案する。具体的には、実世界のLiDARパターンをシミュレートするための曲線ワイド圧縮、シーン幾何学を学ぶための点ワイド座標調整、フル3Dオブジェクトコンテキストに対するパッチワイド符号化を導入する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:22:37 GMT)
AquaSonic: Acoustic Manipulation of Underwater Data Center Operations and Resource Management [14.9]
水中データセンター(UDC)は、そのエネルギー効率と環境サステナビリティの恩恵により、次世代のデータストレージとして約束されている。本研究は, 耐故障性記憶装置, 資源配分ソフトウェア, 分散ファイルシステムのUDCにおける音響インジェクション攻撃に対する特異な脆弱性を明らかにする。我々は、プロファイルされたハードディスクドライブのデータセットに基づいてトレーニングされた、偽陽性率0%、真陽性率98.2%に達する新しい機械学習ベースの検出システムを定式化する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:26:29 GMT)
Efficiently Adversarial Examples Generation for Visual-Language Models under Targeted Transfer Scenarios using Diffusion Models [14.6]
本稿では,自然に制約のない逆の例を生成するAdvDiffVLMを紹介する。本手法は,既存のトランスファーベース攻撃法と比較して10Xから30Xまでの高速化を実現する。特にAdvDiffVLMは、GPT-4Vを含む商用VLMをブラックボックス方式で攻撃できる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:34:08 GMT)
Street TryOn: Learning In-the-Wild Virtual Try-On from Unpaired Person Images [14.6]
そこで本研究では,StreetTryOnベンチマークを用いて仮想試行性能の評価を行う。そこで本研究では,一組の人物画像から,ペアデータなしで学習できる新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:38:18 GMT)
Multi-view Graph Structural Representation Learning via Graph Coarsening [14.6]
グラフ分類のためのGTアーキテクチャ上でのグラフ粗大化(MSLgo)による新しい多視点グラフ構造表現学習モデルを提案する。具体的には、完全な構造表現を学ぶために、オリジナル、粗大化、変換の3つのユニークなビューを構築します。 6つの実世界のデータセットの実験は、様々なアーキテクチャから14のベースラインでMSLgoの改善を実証している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:03:37 GMT)
A unified Fourier slice method to derive ridgelet transform for a variety of depth-2 neural networks [14.5]
リッジレット変換は、与えられた関数$f$をパラメータ分布$gamma$にマッピングする擬逆演算子である。ユークリッド空間上のディープ2完全連結ネットワークに対して、リッジレット変換は閉形式表現まで発見されている。有限体 $mathbbF_p$ 上のネットワーク、抽象ヒルベルト空間 $mathcalH$ 上の群畳み込みネットワーク、非コンパクト対称空間 $G/K$ 上の完全連結ネットワーク、プーリング層など、様々な現代的なネットワークに対して変換を導出する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:10:58 GMT)
X-Light: Cross-City Traffic Signal Control Using Transformer on Transformer as Meta Multi-Agent Reinforcement Learner [14.1]
X-Light という名前の都市間メタマルチエージェント信号制御のための Transformer on Transformer (TonT) モデルを提案する。目に見えないシナリオに直接移行する場合、平均で+7.91%、場合によっては+16.3%のベースラインメソッドを超越する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:17:58 GMT)
MVDream: Multi-view Diffusion for 3D Generation [14.1]
本稿では,テキストプロンプトから一貫した多視点画像を生成可能な拡散モデルMVDreamを紹介する。 2次元データと3次元データの両方から学習すると、多視点拡散モデルは2次元拡散モデルの一般化可能性と3次元レンダリングの整合性を達成することができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:12:32 GMT)
Relaxed forced choice improves performance of visual quality assessment methods [14.0]
画像品質評価において、多数の被験者の個人評価から画像又は映像の集合的視覚品質スコアを得る。これらの実験でよく使われる形式は、2つの代替的な強制選択法である。緩和された代替選択形式は、推測による認知負荷と応答のノイズを低減することを目的としている。この研究は、これらの2つの応答形式を比較するために、大規模かつ包括的なクラウドソーシング実験を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:01:26 GMT)
Curriculum Point Prompting for Weakly-Supervised Referring Image Segmentation [13.9]
Point PrompTing (PPT)はCLIPのテキスト画像アライメント機能とSAMの強力なマスク生成機能を利用するポイントジェネレータである。 PPTは、mIoUの弱い監督技術よりも著しく、一貫して優れていた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:46:12 GMT)
Characterizing LLM Abstention Behavior in Science QA with Context Perturbations [13.9]
本研究では,LLMが不十分あるいは誤った文脈で科学的な疑問に答えることを禁じる能力について検討する。性能はモデルによって大きく異なり、提供されたコンテキストの種類や質問タイプによっても大きく異なることを示す。以上の結果から,QAデータセットの設計と評価において,モデル棄却の正しさと下流への影響をより効果的に評価するために,変更が必要であることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:26:43 GMT)
A Closer Look at AUROC and AUPRC under Class Imbalance [13.8]
機械学習(ML)において、精度-リコール曲線(AUPRC)の下の領域は、クラス不均衡のバイナリ分類タスクにおいて、受信操作特性(AUROC)の下の領域とモデルの比較において優れた指標である。本稿では, AUROC と AUPRC が確率論的用語で簡潔に関連できることを示す, 新たな数学的解析を通じて, この概念に挑戦する。 AUPRCは、一般的な信念に反して、クラス不均衡の場合には優れておらず、また、より頻度の高い正のラベルを持つサブポピュレーションのモデル改善を不当に支持する傾向にあるため、有害な指標である可能性も示している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:25:26 GMT)
Measuring Social Norms of Large Language Models [13.6]
本稿では,大規模言語モデルが社会規範を理解するかどうかを検証するための新たな課題を提案する。我々のデータセットは、402のスキルと12,383の質問からなる、最大の社会的規範スキルのセットを特徴としている。本研究では,大規模言語モデルに基づくマルチエージェント・フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:03:58 GMT)
Active robustness against the detuning-error for Rydberg quantum gates [13.5]
本稿では,多彩なノイズ源の影響に対して活発なロバスト性を有するRydbergブロックゲート群について紹介する。堅牢なパルスを持つゲートは、2光子デチューニングに作用するあらゆる種類のエラーに対する感度を著しく向上させることができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 02:32:00 GMT)
The Explicit values of the UBCT, the LBCT and the DBCT of the inverse function [13.2]
本稿では、任意の$n$に対して、逆関数 $F(x)=x2n-2$ over $gf_2n$ の性質をさらに調べる。 F(x)$のDBCTの詳細な分析は、ブーメラン攻撃に対するSボックスの抵抗性の評価に寄与する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:13:40 GMT)
From Form(s) to Meaning: Probing the Semantic Depths of Language Models Using Multisense Consistency [13.2]
言語間の一貫性とパラフレーズに重点を置いています。モデルのマルチセンス一貫性が欠如していることに気付き、検証のためにいくつかのフォローアップ分析を実行する。この観点では、LLMの理解は、一貫性と人間的類似性にはまだ程遠い、と結論付けています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:48:17 GMT)
Bootstrapping Autonomous Driving Radars with Self-Supervised Learning [13.1]
レーダモデルの訓練は、大規模レーダデータの注釈付けのコストと難しさによって妨げられている。本研究では,未ラベルのレーダデータを事前学習型レーダのみの埋め込みに活用して,自律型認識タスクを実現するための自己教師型学習フレームワークを提案する。下流オブジェクト検出に使用する場合、提案するセルフスーパービジョンフレームワークが、最先端の教師付きベースラインの精度をmAPで5.8%向上できることを実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:40:35 GMT)
MIDGET: Music Conditioned 3D Dance Generation [13.1]
MIDGETと呼ばれるMusIc条件付き3DダンスGeneraTionモデルを導入し、音楽リズムに合わせて鮮やかで高品質なダンスを生成する。フィールドにおける課題に対処するため,1) 異なるポーズ符号を格納するためのモーションVQ-VAEモデルに基づく事前学習されたメモリコードブック,2) 音楽とモーションの短縮によるポーズ符号を生成するモーションGPTモデル,3) 音楽特徴抽出のためのシンプルなフレームワーク,の3つの新しいコンポーネントを紹介した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:20:37 GMT)
Predicting human decisions with behavioral theories and machine learning [13.0]
BEAST Gradient Boosting (BEAST-GB) は,行動理論を機械学習技術と相乗する新しいハイブリッドモデルである。 BEAST-GBは,人的リスク選択のデータセットとして最大規模で,最先端のパフォーマンスを実現していることを示す。また、BEAST-GBは、新しい実験コンテキストにおける選択の振る舞いを効果的に予測するため、堅牢なドメイン一般化機能を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:10:17 GMT)
Large Language Models Can Plan Your Travels Rigorously with Formal Verification Tools [12.9]
大規模言語モデル(LLM)は、複雑な最適化問題を正確に解くことができない。本研究では, LLM を満足度変調理論 (SMT) 問題として, 旅行計画問題の定式化と解決を可能にする枠組みを提案する。我々のフレームワークは、データセットの平均成功率は78.6%、TravelPlannerは85.0%の有効なプランを生成することができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:36:37 GMT)
Challenging Negative Gender Stereotypes: A Study on the Effectiveness of Automated Counter-Stereotypes [12.7]
本研究では,オンラインコミュニケーションにおいて,ジェンダーのステレオタイプに自動的に対抗し,挑戦する11の戦略について検討する。我々は、AIによるジェンダーベースのカウンターステレオタイプを参加者に提示し、攻撃性、妥当性、そして潜在的有効性を評価するよう依頼する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:48:28 GMT)
Meta-Auxiliary Learning for Micro-Expression Recognition [12.6]
高速かつロバストなマイクロ圧縮認識を実現するために,LightmanNetと呼ばれる二分岐メタ補助学習手法を提案する。 LightmanNetは、二分岐二レベル最適化プロセスを通じて、限られたデータから一般的なMER知識を学習する。さまざまなベンチマークデータセットの実験では、LightmanNetの優れた堅牢性と効率が示されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:21:16 GMT)
Remote detectability from entanglement bootstrap I: Kirby's torus trick [12.5]
リモート検出可能性はしばしば、トポロジカルに順序付けられたシステムの研究における物理的仮定として扱われる。遠距離検出性は必要となる性質である,すなわち定理として導出する,という絡み合いブートストラップのアプローチを導出する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:44:14 GMT)
HR-APR: APR-agnostic Framework with Uncertainty Estimation and Hierarchical Refinement for Camera Relocalisation [12.3]
APR(Absolute Pose Regressors)は、モノクロ画像から直接カメラのポーズを推定するが、その精度は異なるクエリに対して不安定である。不確かさを意識したAPRは、推定されたポーズに関する不確実な情報を提供し、これらの信頼できない予測の影響を軽減する。本研究では,クエリとデータベースの特徴間のコサイン類似度推定として不確実性推定を定式化する新しいAPR非依存フレームワークHR-APRを紹介する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:29:39 GMT)
The Neutrality Fallacy: When Algorithmic Fairness Interventions are (Not) Positive Action [12.3]
我々は、アルゴリズムの公正な介入は差別を防ぐための手段として解釈されるべきであると主張している。私たちは、義務から「害を犯さない」へ、アルゴリズムによる意思決定のためのより適切なフレームワークに移行することを提案します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:44:35 GMT)
Cross Domain Early Crop Mapping using CropSTGAN [12.3]
本稿では,Crop Mapping Spectral-temporal Generative Adrial Neural Network (CropSTGAN)を紹介する。 CropSTGANは、ターゲットドメインのスペクトル特徴をソースドメインのスペクトル特徴に変換することを学習し、実質的に大きな相似性をブリッジする。実験では、CropSTGANは様々な最先端(SOTA)メソッドに対してベンチマークされる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:49:38 GMT)
Sample Complexity of the Linear Quadratic Regulator: A Reinforcement Learning Lens [12.0]
我々は,$widetildemathcalO (1/varepsilon)$関数評価において,$varepsilon$-optimalityを達成する最初のアルゴリズムを提供する。この結果は,2点勾配推定の領域外において,既存の文献を著しく改善する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:38:49 GMT)
SGRU: A High-Performance Structured Gated Recurrent Unit for Traffic Flow Prediction [11.9]
本稿では、構造化GRU層と非線形ユニットを含む構造化Gated Recurrent Unitsと、モデルの適合性を向上させるために複数の時間層を埋め込んだSGRUを提案する。我々は,カリフォルニアの4つの公共交通データセット(PeMS03,PeMS04,PeMS07,PeMS08)を回帰予測として評価した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 02:15:40 GMT)
S4TP: Social-Suitable and Safety-Sensitive Trajectory Planning for Autonomous Vehicles [11.8]
本稿では,社会に適合し,安全に配慮した軌道計画フレームワークを提案する。 SATP(Social-Aware Trajectory Prediction)とSADRF(Social-Aware Driving Risk Field)モジュールを統合している。 S4TPはすべてのシナリオで100%パスレートを達成し、現在の最先端の手法であるFantaの98.25%、予測決定の94.75%を上回っている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:58:02 GMT)
A Survey on the Densest Subgraph Problem and Its Variants [11.7]
デンスト部分グラフ問題は、与えられたグラフにおいて、誘導された部分グラフが密度の測度を最大化する頂点の部分集合を見つける必要がある。近年では、この問題に対する研究の関心が復活し、いくつかの重要な貢献がなされている。本調査は,本文献で提案されている多くの変種について,基礎的な結果の概要と包括的報告を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:30:56 GMT)
Sharing Parameter by Conjugation for Knowledge Graph Embeddings in Complex Space [11.3]
知識グラフ(英: Knowledge Graph, KG)は、現実世界における実体と関係の図形表現である。 KGのスケールアップと完成の必要性は,KGE(Knowledge Graph Embedding)を自動生成する。 KGEモデルにおける複素数に対する共役パラメータを用いたパラメータ共有手法を提案する。本手法は,最先端の非共役モデルに匹敵する性能を保ちつつ,メモリ効率を2倍に向上させる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:05:02 GMT)
RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generation [11.3]
Retrieval-Augmented Generation (RAG)は、様々な自然言語処理タスクにおいて大幅に改善されている。 RAGは長いシーケンス生成を導入し、高い計算とメモリコストをもたらす。本稿では,RAGに適したマルチレベル動的キャッシュシステムであるThothを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:32:30 GMT)
Who Validates the Validators? Aligning LLM-Assisted Evaluation of LLM Outputs with Human Preferences [11.2]
EvalGenは、評価基準の生成とアサーションの実装において、ユーザに自動アシストを提供する。質的研究は、EvalGenに対する全体的なサポートを見出すが、主観性と反復的なアライメントのプロセスを強調している。ユーザはアウトプットを格付けする基準が必要ですが、アウトプットのグレードは、ユーザが基準を定義するのに役立つのです。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:45:27 GMT)
Actions Speak Louder than Words: Trillion-Parameter Sequential Transducers for Generative Recommendations [11.2]
大規模なレコメンデーションシステムは、毎日数千億のユーザーアクションを扱う必要がある。何千もの機能を備えた大量のデータでトレーニングされているにも関わらず、業界におけるほとんどのDeep Learning Recommendation Model(DLRM)は、計算処理ではスケールできない。言語および視覚領域におけるトランスフォーマーの成功に触発され、推奨システムの基本設計選択を再考する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:38:55 GMT)
Relationship Discovery for Drug Recommendation [11.1]
DisMedは、パーソナライゼーションを強化するための患者の状態に焦点を当てたモデルである。 DisMedは、患者のプロファイルのカスタマイズを改善するだけでなく、精度と安全性の両方で主要なモデルを上回る。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:44:08 GMT)
Octopus v3: Technical Report for On-device Sub-billion Multimodal AI Agent [11.0]
マルチモーダルAIエージェントは、さまざまなタイプのデータから処理および学習する能力によって特徴付けられる。本稿では,AIエージェントアプリケーション用に設計された関数トークンの概念を取り入れたマルチモーダルモデルを提案する。我々はこのモデルがRaspberry Piのように制約のある幅広いエッジデバイス上で効率的に動作可能であることを実証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:32:52 GMT)
Runtime Analyses of NSGA-III on Many-Objective Problems [11.0]
本稿では,一般的な多目的ベンチマーク問題mLOTZ,mOMM,mCOCZにおけるNSGA-IIIのランタイム解析について述べる。これらのパラメータは,問題次元,目的数,適合範囲によってどのようにスケールするかを示す。我々の知る限り、これらは3つ以上の目的に対してNSGA-IIIの最初のランタイム解析である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:09:35 GMT)
Towards Multi-modal Transformers in Federated Learning [10.8]
本稿では,視覚言語領域におけるMFL(Transfer Multi-modal Federated Learning)のシナリオについて検討する。我々は,クライアント間の非モダリティと相互モダリティのギャップに対処することによって,FedCola(Federated modality complementary and collaboration)と呼ばれる新しいフレームワークを導入する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:04:27 GMT)
A Survey of Trojans in Neural Models of Source Code: Taxonomy and Techniques [10.8]
我々は、説明可能なAIと安全なAIの文献を研究し、コードの神経モデルの毒性を理解する。まず、コードのためのトロイの木馬AIの新しい分類法を確立し、コードのニューラルモデルにおけるトリガーの新しいアスペクトベースの分類を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:41:54 GMT)
TrajDeleter: Enabling Trajectory Forgetting in Offline Reinforcement Learning Agents [10.8]
本稿では、オフラインRLエージェントのための軌道学習のための最初の実践的アプローチであるTrajdeleterを提唱する。 Trajdeleterのキーとなるアイデアは、エージェントをガイドして、未学習の軌跡に関連する状態に遭遇した際のパフォーマンス低下を示すことである。 6つのオフラインRLアルゴリズムと3つのタスクで実施された大規模な実験は、トラジデレターがスクラッチから再トレーニングするのに必要な時間の約1.5%しか必要としていないことを示した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 22:23:24 GMT)
Understanding Optimal Feature Transfer via a Fine-Grained Bias-Variance Analysis [10.8]
下流性能の最適化を目標として、トランスファーラーニングについて検討する。任意の事前学習された特徴を入力として取る単純な線形モデルを導入する。下流タスクのアンサンブル上で平均される下流リスクを最小化することにより、最適事前学習表現を同定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:33:55 GMT)
Multi-view X-ray Image Synthesis with Multiple Domain Disentanglement from CT Scans [10.7]
過剰投与されたX線は、ある程度人間の健康への潜在的なリスクを重畳する。ボリュームスキャンからX線画像へのデータ駆動アルゴリズムは、ペア化されたX線とボリュームデータの不足によって制限される。我々は,3つの異なる画像領域からのコンテンツとスタイルのゆがみを利用して,X線画像をエンドツーエンドに合成するCT2X-GANを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:25:56 GMT)
Actor-Critic Reinforcement Learning with Phased Actor [10.6]
本稿では,政策勾配推定を改善するために,PAAC法における新しい段階的アクターを提案する。 PAACはアクターアップデートで$Q$とTDエラーの両方を処理している。その結果,PAACは総コスト,学習ばらつき,堅牢性,学習速度,成功率などによって,大幅な性能向上をもたらすことがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:27:31 GMT)
Physics-informed active learning for accelerating quantum chemical simulations [10.6]
本稿では,量子化学シミュレーションにおけるロバストなデータ効率ポテンシャル構築のためのエンドツーエンドALを提案する。本プロトコルは,物理インフォームドによるトレーニングポイントのサンプリング,初期データの自動選択,不確実性定量化に基づく。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:17:01 GMT)
Sampling-based Pareto Optimization for Chance-constrained Monotone Submodular Problems [10.5]
本稿では,確率制約を直接評価するサンプリングベース手法を提案する。より困難な設定でこの問題に対処するため、強化されたGSEMOアルゴリズムが導入された。 ASW-GSEMOとサンプリングベースの評価手法は、他のアルゴリズムよりも優れている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:15:20 GMT)
Private graphon estimation via sum-of-squares [10.0]
ブロックモデルを学習し,任意のブロックに対して一定の実行時間でグラフトン推定を行うための,最初の純粋ノード微分プライベートアルゴリズムを開発した。統計的ユーティリティは、これらの問題に対する以前の最良の情報理論(指数時間)ノードプライドメカニズムのそれと一致することを保証している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:35:16 GMT)
Privacy-Preserving UCB Decision Process Verification via zk-SNARKs [10.0]
zkUCBは、トレーニングデータとアルゴリズムパラメータの機密性を保護し、透明な UCB 意思決定を保証するように設計されている。実験ではzkUCBの優れた性能が強調され、量子化ビットの使用に対する報酬が強化された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:49:07 GMT)
Data-free Knowledge Distillation for Fine-grained Visual Categorization [10.0]
本稿では,DFKDを細粒度視覚分類(FGVC)タスクに拡張するDFKD-FGVCという手法を提案する。本研究では,広く使用されている3つのFGVCベンチマーク(Aircraft,Cars196,CUB200)に対するアプローチを評価し,その性能を実証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:44:56 GMT)
TeachNow: Enabling Teachers to Provide Spontaneous, Realtime 1:1 Help in Massive Online Courses [9.8]
TeachNowは、世界中のボランティア教師がMOOCの学生に1対1のヘルプセッションを即座に提供できるシステムだ。 TeachNowの自発的でオンデマンドな性質は、教師にスケジュールが許されるたびに助ける柔軟性を与えてくれる。 TeachNowのセッションは,学生のコース保持率を約15%向上させた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:50:21 GMT)
Harnessing Joint Rain-/Detail-aware Representations to Eliminate Intricate Rains [9.7]
我々は、CNNやTransformerベースのモデルを効率的に制御できるコンテキストベースのインスタンスレベル変調機構を開発する。また,降雨・降雨・降雨・降雨・降雨の表現を抽出するために,降雨・降雨・降雨対応学習戦略を考案した。 CoI-Mと雨量/深度を意識したコントラスト学習を組み合わせることで、混合データセットのトレーニングモデルに適した、革新的で強力なアルゴリズムであるCoICを開発する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:20:53 GMT)
Improving the interpretability of GNN predictions through conformal-based graph sparsification [9.6]
グラフニューラルネットワーク(GNN)は、グラフ分類タスクの解決において最先端のパフォーマンスを達成した。エッジやノードを除去することで,最も予測可能なサブグラフを見つけるGNNエンハンチング手法を提案する。我々は、共形予測に基づく報奨関数で得られる二段階最適化を解決するために強化学習を頼りにしている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:34:47 GMT)
Full Shot Predictions for the DIII-D Tokamak via Deep Recurrent Networks [9.5]
我々は、DIII-Dトカマクからの歴史的データを用いて、プラズマ放電のフルタイム進化を予測することができる深い再帰ネットワークを訓練する。続いて、異なるトレーニングと推論の手順が、ショット予測の品質とキャリブレーションにどのように影響するかを検討する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:05:57 GMT)
Quantifying and Enhancing Multi-modal Robustness with Modality Preference [9.4]
マルチモーダルモデルは、ユニモーダル攻撃や欠落状態のような広汎な摂動に対して脆弱である。より大きいユニモーダル表現マージンとより信頼性の高いモダリティの統合は、より高いロバスト性を達成するために必須の要素である。理論的な発見に触発されて,認証ロバストマルチモーダルトレーニング(Certible Robust Multi-modal Training)と呼ばれるトレーニング手順を導入する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:08:45 GMT)
Deconstructing Human-AI Collaboration: Agency, Interaction, and Adaptation [9.4]
我々は,人間-AIシステムの解析と記述を行うための,新しい統合された次元セットを提案する。我々の概念モデルは、エージェンシー、インタラクション、適応の3つのハイレベルな側面を中心としています。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:12:18 GMT)
AG-NeRF: Attention-guided Neural Radiance Fields for Multi-height Large-scale Outdoor Scene Rendering [9.4]
既存のニューラルラジアンス場(NeRF)をベースとした大規模屋外シーンのための新しいビュー合成法は主に1つの高度上に構築されている。我々は、AG-NeRFと呼ばれるエンドツーエンドのフレームワークを提案し、様々なシーンの高度に基づいて自由視点画像を合成することにより、良好な再構築を構築するためのトレーニングコストを削減しようとしている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:54:28 GMT)
AutoCast++: Enhancing World Event Prediction with Zero-shot Ranking-based Context Retrieval [9.4]
ゼロショットランキングに基づくコンテキスト検索システムであるAutoCast++を紹介する。提案手法は、まずゼロショットの質問パス関連性に基づいて記事を再ランク付けし、セマンティックな関連するニュースに注目する。我々は、ドメイン固有のトレーニングを必要とせずに、関連性評価と記事要約を行う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:41:23 GMT)
Gaining More Insight into Neural Semantic Parsing with Challenging Benchmarks [9.3]
並列平均銀行における意味解析と意味テキスト生成のためのニューラルモデルの評価を行った。まず、事前のランダム分割の代わりに、標準的なテストデータの信頼性を向上させるために、より体系的な分割手法を提案する。第二に、標準的なテストセットを除いて、談話構造を含む長いテキストを持つものと、構成的一般化に対処するものという2つの課題セットを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:59:12 GMT)
Replication in Requirements Engineering: the NLP for RE Case [9.3]
自然言語処理(NLP)技術は要求工学(RE)分野に広く応用されている。複製は、研究の文脈特異性を含むいくつかの要因によって妨げられる。我々は、複製関連情報を強調した研究論文の構造化要約を提供することを目的として、IDカードと呼ばれる新しいアーティファクトを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:20:13 GMT)
GraFIQs: Face Image Quality Assessment Using Gradient Magnitudes [9.2]
顔画像品質評価(FIQA)は、顔認識(FR)システムにおける顔画像の有用性を推定する。本研究では,事前学習したFRモデルの重量変化を検査し,顔画像の品質を評価する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:07:08 GMT)
Improving the perception of visual fiducial markers in the field using Adaptive Active Exposure Control [8.9]
本稿では、画像取得時のシャープ照明変動に対処するための勾配型アクティブカメラ露光制御手法を提案する。視覚タグを用いた水中操作の典型的なシナリオを考慮し,本手法と他の最先端露光制御法との比較実験を行った。その結果,ロボットの局所化精度は有意に向上した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:10:56 GMT)
Parallel Best Arm Identification in Heterogeneous Environments [8.9]
異種協調学習モデルにおける最適な腕識別問題の時間と通信ラウンド数のトレードオフについて検討する。ほぼ厳密な上界と下界を証明することにより、不均一な環境での協調学習が、同質な環境での学習よりも本質的に困難であることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:31:11 GMT)
Resilience through Scene Context in Visual Referring Expression Generation [8.9]
画像中のオブジェクトに対する参照表現生成(REG)におけるコンテキストの役割について検討する。我々は、REGにおけるシーンコンテキストに関する新たな視点を捉え、REGモデルをより弾力性のあるものにするためのリソースとして、コンテキスト情報が考えられることを仮定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:10:38 GMT)
Reducing Bias in Pre-trained Models by Tuning while Penalizing Change [8.9]
大量のデータに基づいてトレーニングされた深層モデルには、トレーニング期間中に存在する暗黙のバイアスが組み込まれていることが多い。新しいデータは、しばしば高価で、自律運転や医療意思決定のような分野では入手が困難である。本稿では,事前学習モデルを用いて,事前検出したバイアスを軽減するために重みを適応する変化ペナライゼーションに基づく手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:12:38 GMT)
Experimental Hybrid Shadow Tomography and Distillation [8.9]
我々は,光学系における非線形関数推定における計測コストを低減するため,高度なシャドウプロトコル,いわゆるハイブリッドシャドウ(HS)トモグラフィーを実装した。これらの高次関数を用いて仮想蒸留を行い、2つのノイズコピーから高純度量子状態を効果的に抽出する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:57:38 GMT)
Differential Equation Scaling Limits of Shaped and Unshaped Neural Networks [8.7]
類似した微分方程式に基づく2種類の不整形ネットワークのキャラクタリゼーションを求める。我々は第1次補正を階層的相関に導出する。これらの結果は、形状と未形状のネットワークアーキテクチャ間の接続を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:07:49 GMT)
LAPTOP-Diff: Layer Pruning and Normalized Distillation for Compressing Diffusion Models [8.7]
圧縮拡散モデル(LAPTOP-Diff)のための層プレーニングと正規化蒸留を提案する。提案したLAPTOP-Diffを用いて,SDXLとSDM-v1.5のU-Netを圧縮し,PickScoreを50%,PickScoreの最小4.0%,PickScoreの最小8.2%の低下を実現した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:58:07 GMT)
Group-On: Boosting One-Shot Segmentation with Supportive Query [8.6]
ワンショットセマンティックセグメンテーション(One-shot semantic segmentation)は、ONEアノテートされた同じクラスのサポートイメージのみを与えられたクエリイメージをセグメントすることを目的としている。本稿では,複数の問合せ画像をバッチにまとめるグループオンという,One-shotセマンティックセマンティックセマンティックセマンティクスのための新しいアプローチを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:10:04 GMT)
MP-DPD: Low-Complexity Mixed-Precision Neural Networks for Energy-Efficient Digital Predistortion of Wideband Power Amplifiers [8.6]
Digital Pre-Distortion (DPD) は広帯域RFパワー増幅器(PA)の信号品質を向上させる本稿では,エネルギー効率の DPD に対して,量子化された低精度固定点パラメータを用いたオープンソースの混合精度(MP)ニューラルネットワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:04:39 GMT)
Tailoring Generative Adversarial Networks for Smooth Airfoil Design [8.5]
Generative Adversarial Network (GAN) は、翼の設計を合成するための道具である。 GANの一般的な制限は、生成された翼面の滑らかさの固有の欠如である。本稿では, シームレスに構成された航空機翼の設計を行うために, カスタマイズされた損失関数を特徴とするGANモデルを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:26:43 GMT)
Designing Stable Neural Networks using Convex Analysis and ODEs [8.4]
提案するResNetスタイルのニューラルネットワークアーキテクチャは,非拡張型(1-Lipschitz)演算子を符号化する。提案手法は, 逆方向の頑健な画像分類問題, 画像デノイング問題, 逆方向のデブロアリング問題に適用される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:37:18 GMT)
Context-Aware Orchestration of Energy-Efficient Gossip Learning Schemes [8.4]
本稿では,Gossip Learningと学習プロセスの適応最適化を組み合わせた分散学習手法を提案する。本稿では,ノードごとのリアルタイムな最適化に依存するデータ駆動型OGL管理手法を提案する。その結果,提案手法は幅広いネットワークシナリオにおいて極めて効率的かつ効果的であることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:17:46 GMT)
SPOT: Point Cloud Based Stereo Visual Place Recognition for Similar and Opposing Viewpoints [8.3]
Same Place Opposing Trajectory (SPOT) は、ステレオ・ビジュアル・オドメトリー(VO)によって推定される構造にのみ依存する対向VPRの手法である。我々は、様々な照明条件下で、同様の方向と反対方向に駆動される6.7-7.6kmのルートを持つ公開データセット上でSPOTを評価する。 SPOTは、反対の視点のケースで最大91.7%のリコールを100%精度で達成し、また、全てのベースラインのテストや実行よりも高速なストレージを必要とする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:09:10 GMT)
Struggle with Adversarial Defense? Try Diffusion [8.3]
アドリア攻撃は微妙な摂動を導入して誤分類を引き起こす。拡散に基づく敵の訓練は、しばしば収束の課題と高い計算費用に遭遇する。本稿では,これらの問題を克服するために,真性最大化拡散(TMDC)を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:55:56 GMT)
Token-level Direct Preference Optimization [8.2]
微調整された事前訓練された大規模言語モデルは、それらを人間の価値観や意図と整合させるのに不可欠である。トークンレベルでポリシーを最適化することにより,LLMと人間の嗜好を一致させる新しいアプローチである,トークンレベルの直接選好最適化(TDPO)を導入する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:49:38 GMT)
Monitoring Critical Infrastructure Facilities During Disasters Using Large Language Models [8.2]
クリティカルインフラストラクチャー施設(CIF)は、特に大規模緊急時において、コミュニティの機能に不可欠である。本稿では,大規模言語モデル(LLM)の適用の可能性を探り,自然災害によるCIFの状況を監視する。我々は2つの異なる国の災害イベントからソーシャルメディアデータを分析し、CIFに対する報告された影響と、その影響の重大さと運用状況を明らかにする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:41:05 GMT)
Food Portion Estimation via 3D Object Scaling [8.2]
食事場面における3次元食品モデルと物理参照の力を活用して、2次元画像から食品の体積とエネルギーを推定する新しい枠組みを提案する。本手法は, 既存の部分推定法よりも高い精度で, 31.10 kCal (17.67%) の平均誤差を実現する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:23:37 GMT)
When Medical Imaging Met Self-Attention: A Love Story That Didn't Quite Work Out [8.1]
2つの異なる医療データセットに異なる自己注意変異を持つ、広く採用されている2つの畳み込みアーキテクチャを拡張します。完全畳み込みモデルに比べてバランスの取れた精度は著しく改善されていない。また, 皮膚病変画像における皮膚内視鏡像などの重要な特徴は, 自己注意を用いても学ばないことが明らかとなった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:18:41 GMT)
Exploring the landscape of large language models: Foundations, techniques, and challenges [8.0]
この記事では、コンテキスト内学習の力学と微調整アプローチのスペクトルについて光を当てている。革新的な強化学習フレームワークを通じて、LLMが人間の好みとより緊密に連携する方法について検討する。 LLMデプロイメントの倫理的側面は議論され、マインドフルで責任あるアプリケーションの必要性を浮き彫りにしている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:01:20 GMT)
CigaR: Cost-efficient Program Repair with LLMs [8.0]
CigaRはコスト効率のよいプログラム修復ツールで、パッチの自動生成に低数のトークンを使用する。広く使用されているDefects4JとHumanEval-Javaデータセットの429のバグに関する実験は、CigaRがトークンコストを73%削減したことを示している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:00:59 GMT)
Sandi: A System for Accountability and Applications in Direct Communication [7.8]
Sandiは、説明責任を通じてオンラインコミュニケーションへの信頼をもたらすシステムである。スコアは、以前の通信に基づいて送信者の信頼度を測定する。 Sandiは、送信者に対するスコア完全性保証、送信者と受信者に対する完全な通信プライバシー保証、レポーティングレシーバーを保護するレポータープライバシ保証、送信者を保護するアンリンクビリティ保証を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:04:07 GMT)
Robust Reinforcement Learning Objectives for Sequential Recommender Systems [7.4]
我々は、報酬の形で直接ユーザーフィードバックを取り入れ、ユーザのパーソナライズを高めるレコメンデーションシステムを開発する。 RLアルゴリズムを採用することで、政治外のトレーニング、拡張可能なアクションスペース、十分な報酬信号を持つデータセットの不足など、課題が提示される。これらの課題に対して、より効果的な解決策を提供するための拡張された方法論を導入します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:22:56 GMT)
Frequency-Aware Masked Autoencoders for Multimodal Pretraining on Biosignals [7.4]
周波数空間における生体信号の表現をパラメータ化することを学ぶ周波数対応マスク付きオートエンコーダを提案する。得られたアーキテクチャは、事前トレーニング中にマルチモーダル情報を効果的に利用し、テスト時に様々なタスクやモダリティにシームレスに適応できる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:48:44 GMT)
TrACT: A Training Dynamics Aware Contrastive Learning Framework for Long-tail Trajectory Prediction [7.3]
本稿では,よりリッチなトレーニングダイナミックス情報を,原型的コントラスト学習フレームワークに組み込むことを提案する。我々は,2つの大規模自然主義データセットを用いたアプローチの実証評価を行った。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:12:46 GMT)
AQM: A Refresh of the Abstract Qubit Model for Quantum Computing Co-design [7.2]
量子ビットは量子情報科学と応用の構成要素である。より高度なアルゴリズムとアプリケーションのための数学的フレームワークを提供する抽象量子ビットモデル(AQM)を導入する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:23:35 GMT)
An Online Spatial-Temporal Graph Trajectory Planner for Autonomous Vehicles [6.9]
本稿では,安全で快適なトラジェクトリを生成するために,新しいオンライン時空間グラフトラジェクトリプランナを提案する。プランナーをサポートするために、プランナーの運動的制約を決定する単純な振舞い層も提示される。その結果,提案したプランナは,前方方向と同等の快適な乗り心地を実現しつつ,安全かつ実現可能な軌道を生成できることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:22:29 GMT)
On the generic increase of observational entropy in isolated systems [6.9]
ランダムに選択されたユニタリ進化のシステムの観測エントロピーが、圧倒的な確率で増加する傾向を示す。システムの初期状態に関わらず,システムの大きさが十分に粗い観察では,その状態がマイクロカノニカル分布と実質的に区別できないことを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:27:04 GMT)
FCNCP: A Coupled Nonnegative CANDECOMP/PARAFAC Decomposition Based on Federated Learning [6.9]
本研究は,FCNCPと呼ばれるフェデレート学習に基づく,効率的な非負結合テンソル分解アルゴリズムフレームワークを開発することを提案する。これは高次元データ表現と分解におけるテンソル分解の優れた識別性能を組み合わせたものである。片側刺激は左右半球の活性化領域においてより対称な成分を誘導することがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:30:18 GMT)
Partial Large Kernel CNNs for Efficient Super-Resolution [6.8]
超解法(PLKSR)のためのPartial Large Kernel CNNを導入する。 PLKSRは、待ち時間68.1%、最大GPUメモリ占有率80.2%の削減を実現している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:55:44 GMT)
FIZZ: Factual Inconsistency Detection by Zoom-in Summary and Zoom-out Document [6.7]
そこで本研究では,Zoom-in概要とZoom-out文書による現実的不整合検出の高精度かつ解釈可能な手法を提案する。我々は、アダプティブ展開を通じて、要約から得られた原子事実とソース文書とを一致させる。実験結果から,提案手法が既存システムより有意に優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:57:17 GMT)
DST-GTN: Dynamic Spatio-Temporal Graph Transformer Network for Traffic Forecasting [6.5]
様々な時間に空間特性をカプセル化する動的時空間特徴 (Dyn-ST) という,詳細な特徴表現を新たに導入する。 DST-GTN(Dynamic Spatio-Temporal Graph Transformer Network)を提案する。 DST-GTNは、様々な交通予測タスクの最先端性能を達成し、安定性の向上を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:44:52 GMT)
Knowledge-Aware Multi-Intent Contrastive Learning for Multi-Behavior Recommendation [6.5]
マルチ行動レコメンデーションは、ビュー、カートの追加、購入など、さまざまな行動に基づいたより正確な選択を提供する。本稿では,KAMCL(Knowledge-Aware Multi-Intent Contrastive Learning)モデルを提案する。このモデルは、インテントを構築するために知識グラフ内の関係を利用し、より正確なレコメンデーションを達成するためのインテントの観点から、ユーザのマルチビヘイビア間の接続をマイニングすることを目的としている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:39:52 GMT)
Investigating Guiding Information for Adaptive Collocation Point Sampling in PINNs [6.5]
物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式や系の近似解を得る手段を提供する。 PINNの解の質は、これらのコロケーション点の数や分布を含む多くのパラメータに依存する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:58:31 GMT)
OPTiML: Dense Semantic Invariance Using Optimal Transport for Self-Supervised Medical Image Representation [6.4]
自己教師付き学習(SSL)は、アノテーションなしで学習できることから、医用画像解析の有望な技術として登場した。本稿では, 最適トランスポート(OT)を用いたSSLフレームワークOPTiMLを導入し, 密接なセマンティック不変性と細粒度の詳細を捉える。実験の結果,OPTiMLはすべての評価課題において最先端の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 02:59:48 GMT)
NeuRAD: Neural Rendering for Autonomous Driving [6.4]
神経放射場(NeRF)は自律走行(AD)コミュニティで人気を集めている。近年の手法は, 閉ループシミュレーションにおけるNeRFのポテンシャルを示し, ADシステムの試験を可能にしている。我々は,動的ADデータに適した,堅牢なビュー合成手法であるNeuRADを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:44:56 GMT)
Augmenting emotion features in irony detection with Large language modeling [6.3]
本研究では,感情中心のテキスト強化を促進するために,大規模言語モデル(LLM)を即時学習で適用する,新たな皮肉検出手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:11:17 GMT)
Reciprocal Attention Mixing Transformer for Lightweight Image Restoration [6.3]
本稿では,RAMiT(Reciprocal Attention Mixing Transformer)という軽量画像復元ネットワークを提案する。二次元(空間とチャネル)の自己アテンションを、異なる数のマルチヘッドと並行して使用する。超高分解能、カラーデノイング、グレースケールデノナイジング、低照度向上、デラリニングなど、複数の軽量IRタスクにおける最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:10:47 GMT)
Evaluating Search-Based Software Microbenchmark Prioritization [6.2]
本稿では,単目的と多目的の探索に基づくマイクロベンチマーク優先順位付け手法を実証的に評価する。検索アルゴリズム(SA)は競争力があるばかりでなく、最高の欲求、カバレッジベースのベースラインを上回りません。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:13:48 GMT)
SYNFAC-EDIT: Synthetic Imitation Edit Feedback for Factual Alignment in Clinical Summarization [6.1]
大規模言語モデル(LLM)は、要約タスクにおいて重要な成果を示したが、事実的不正確さに苦慮している。専門家がアノテートしたデータの高コスト化と可用性の限界に対処するため,本研究では革新的なパイプラインを導入する。 100B以上のGPTの変種を利用して、専門家レベルの編集フィードバックを提供する合成フィードバックエキスパートとして機能します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:50:43 GMT)
A Clustering Method with Graph Maximum Decoding Information [6.1]
本稿では,CMDIと呼ばれるグラフベースモデルにおけるデコード情報の最大化のための新しいクラスタリング手法を提案する。 CMDIは2次元構造情報理論を、グラフ構造抽出とグラフ分割という2つのフェーズからなるクラスタリングプロセスに組み込んでいる。 3つの実世界のデータセットに対する実証的な評価は、CMDIが古典的ベースライン法より優れており、より優れた復号化情報比(DI-R)を示すことを示している。これらの結果から,デコード情報の品質と計算効率を向上させるCMDIの有効性が示され,グラフベースのクラスタリング解析において有用なツールとして位置づけられた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:22:12 GMT)
MPC of Uncertain Nonlinear Systems with Meta-Learning for Fast Adaptation of Neural Predictive Models [6.0]
ニューラル状態空間モデル(NSSM)は、ディープエンコーダネットワークがデータから非線形性を学ぶ非線形系を近似するために用いられる。これにより非線形系を潜在空間の線形系に変換し、モデル予測制御(MPC)を用いて効果的な制御動作を決定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:29:43 GMT)
Explaining latent representations of generative models with large multimodal models [6.0]
データ生成潜在因子の解釈可能な表現を学習することは、人工知能の発展にとって重要なトピックである。大規模マルチモーダルモデルを用いた生成モデルにおいて,各潜伏変数を包括的に記述するフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:54:39 GMT)
JointViT: Modeling Oxygen Saturation Levels with Joint Supervision on Long-Tailed OCTA [5.9]
本稿では,ビジョントランスフォーマーアーキテクチャに基づく新しいモデルであるJointViTを提案する。本稿では,データ前処理時のバランシング向上手法を導入し,モデルの性能向上を図る。提案手法は他の最先端手法よりも優れ、全体的な精度は最大12.28%向上した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:23:05 GMT)
P-NAL: an Effective and Interpretable Entity Alignment Method [5.9]
非軸性論理(NAL)を用いた2種類の論理推論経路をキャプチャするエンティティアライメント手法であるP-NALを導入する。 P-NALは推論パスの結論を統合することで、実体と関係を反復的に整列する。実験結果から,本手法はHits@1で最先端の手法より優れており,DBP15Kの3つのデータセットで0.98以上,教師なし設定と教師なし設定の両方で達成できることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:55:02 GMT)
Streaming Anchor Loss: Augmenting Supervision with Temporal Significance [5.8]
様々な音声や知覚信号に対する高速なフレームワイズ応答のためのストリーミングニューラルネットワークモデルは、リソース制約のあるプラットフォームで広く採用されている。本稿では,学習能力の向上を目的とした新たな損失SAL(Streaming Anchor Loss)を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:11:43 GMT)
Beyond Spatio-Temporal Representations: Evolving Fourier Transform for Temporal Graphs [5.8]
本稿では、時間グラフ上の進化的表現をキャプチャする、最初の可逆スペクトル変換を提案する。我々は、進化するグラフスペクトルをキャプチャするために、EDTで誘導される単純なニューラルモデルを開発する。我々は,多数の大規模および標準時相グラフベンチマークにおいて理論的知見を実証的に検証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:13:19 GMT)
Stance Detection on Social Media with Fine-Tuned Large Language Models [5.7]
自然言語処理における重要なタスクであるスタンス検出は、テキスト解析に基づいて著者の視点を決定する。本研究は,早期の機械学習アプローチから画期的なBERTモデルへの移行による姿勢検出手法の進化を評価する。総合的な比較を行うため、ゼロショットおよび少数ショット学習シナリオにおいて、これらのモデルの性能を評価する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:25:29 GMT)
Using a Local Surrogate Model to Interpret Temporal Shifts in Global Annual Data [5.7]
本稿では、グローバルソースの年次データにおける経年変化を説明することに焦点を当てる。我が国では、国民の幸福指数、経済自由度、人口指標に光を当てるために、LIME(Local Interpretable Model-Agnostic Explanations)を採用している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:17:45 GMT)
Grammatical Error Correction for Code-Switched Sentences by Learners of English [5.7]
CSWテキスト上で文法誤り訂正システムの利用を初めて検討する。我々は、既存のGECコーパス内で異なるテキストのスパンを翻訳することで、合成されたCSW GECデータセットを生成する。次に,CSW比,スイッチポイント係数,言語制約に基づいて,これらのスパンを選択する方法について検討する。我々の最良のモデルは、モノリンガルデータセット上でのモデルの性能に影響を与えることなく、3つのCSWテストセットの平均1.57ドルF_0.5$を達成する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:05:30 GMT)
Stability-informed Bayesian Optimization for MPC Cost Function Learning [5.6]
本研究では,不完全な情報の下での予測制御パラメータの閉ループ学習について検討する。フィードフォワードニューラルネットワークとしてパラメータ化されたモデル予測制御器(MPC)コスト関数の学習には,制約付きベイズ最適化を用いる。 Lyapunov 候補として基礎となる MPC の最適値関数を利用して,学習した制御パラメータの安定性制約によってこの枠組みを拡張した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:49:09 GMT)
COMET: Neural Cost Model Explanation Framework [5.6]
ニューラルコストモデルに対する忠実で汎用的で直感的な説明を生成するための,最初のフレームワークであるCOMETを開発した。我々は、一般的なニューラルネットワークコストモデルであるIthemalに対するCOMETの説明を、正確なCPUシミュレーションベースのコストモデルであるuiCAに対して生成し、比較する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:05:15 GMT)
Image Compression and Reconstruction Based on Quantum Network [5.6]
量子ネットワークは、画像再構成をより効率的かつ正確にする。より少ないビットと高速な並列計算機能を使って、より複雑な画像情報を処理することができる。本稿では,量子ネットワークの基本構造,画像圧縮と再構成のプロセス,パラメータ学習法について紹介する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:39:58 GMT)
Proteus: Preserving Model Confidentiality during Graph Optimizations [5.4]
本稿では,独立政党によるモデル最適化を実現する新しいメカニズムであるProteusを提案する。 Proteusは、計算グラフをサブグラフに分割することで、保護されたモデルを難読化する。私たちの知る限り、Proteusはパフォーマンス最適化中にモデルの機密性に取り組む最初の作品です。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:23:25 GMT)
Learning a Stable, Safe, Distributed Feedback Controller for a Heterogeneous Platoon of Vehicles [5.3]
異種小隊のための安定で安全な分散制御系を学習するためのアルゴリズムを提案する。我々のアルゴリズムは、ニューラルネットワークの安定性と安全性証明書の学習における最近の進歩に依存している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:11:34 GMT)
Leakage Benchmarking for Universal Gate Sets [5.2]
リークは、量子コンピューティングにおいて、最も難しい問題の一つです。漏れはフォールトトレラント量子計算の発展に重大な障害をもたらす。本稿では,リークランダム化ベンチマークと呼ばれる,効率的かつ正確なベンチマークフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:22:39 GMT)
Aligning language models with human preferences [5.1]
大量のテキストデータに基づいて訓練された言語モデル(LM)は高度なスキルを習得することができる。また、人間の嗜好に反する行動を示す。 LMを人間の好みに合わせるためのいくつかのアプローチを検討します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:55:18 GMT)
Sketch-guided Image Inpainting with Partial Discrete Diffusion Process [5.0]
スケッチ誘導インペイントのための新しい部分離散拡散法(PDDP)を提案する。 PDDPは画像のマスキング領域を破損させ、手描きスケッチで条件付けられたこれらのマスキング領域を再構築する。提案するトランスモジュールは,2つの入力を受信する。マスク領域を含む画像はインペイントされ,クエリスケッチは逆拡散過程をモデル化する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:07:38 GMT)
CAUS: A Dataset for Question Generation based on Human Cognition Leveraging Large Language Models [5.0]
本稿では,大規模言語モデル,特に GPT-4 を用いて,不確実性を解決するための認知過程をエミュレートするためのCAUSデータセットを提案する。我々のアプローチは、推論とクエリの生成を刺激するために、不確実性に埋め込まれたシーン記述を提供することである。以上の結果から, GPT-4は, 適切な文脈や指示が与えられた場合に, 適切な質問を効果的に生成し, そのニュアンスを把握できることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:31:19 GMT)
CMNEE: A Large-Scale Document-Level Event Extraction Dataset based on Open-Source Chinese Military News [4.8]
大規模で文書レベルのオープンソースである中国の軍事ニュースイベント抽出データセットであるCMNEEを提案する。 17,000の文書と29,223のイベントが含まれており、すべて軍事領域の事前定義されたスキーマに基づいて手動で注釈付けされている。我々は,複数の最先端イベント抽出モデルを体系的評価で再現する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:02:35 GMT)
HCL-MTSAD: Hierarchical Contrastive Consistency Learning for Accurate Detection of Industrial Multivariate Time Series Anomalies [4.8]
本稿では,産業用MSSにおける異常検出のための自己教師付き階層的コントラスト整合学習手法を提案する。 HCL-MTSADはマルチレイヤのコントラスト損失を発生させることで、データの一貫性とタイムスタンプと時間的関連を広範囲にマイニングすることができる。 HCL-MTSADの異常検出能力は、F1スコアの平均1.8%で最先端のベンチマークモデルを上回っている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 04:15:35 GMT)
REF$^2$-NeRF: Reflection and Refraction aware Neural Radiance Field [4.7]
本稿では,ガラスケースを含むシーンのNeRFモデリング手法を提案する。リフレクションとリフレクションは、視聴者の視点に依存して独立な要素を用いてモデル化される。既存の手法と比較して,ガラス屈折率と全体像のより正確なモデリングが可能である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:03:44 GMT)
A cooperative strategy for diagnosing the root causes of quality requirement violations in multiagent systems [4.7]
本稿では,マルチエージェントシステムにおける品質要件違反の根本原因を特定することに焦点を当てた協調戦略を提案する。この戦略により、エージェントは互いに協力し合って、これらの違反がサービスプロバイダや関連するコンポーネント、あるいは通信インフラから生じるものかどうかを識別できます。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:41:33 GMT)
Toward Short-Term Glucose Prediction Solely Based on CGM Time Series [4.7]
TimeGluは、CGM時系列データに基づく短期的なグルコース予測のためのエンドツーエンドパイプラインである。患者の個人データを追加することなく、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:02:12 GMT)
DualFluidNet: an Attention-based Dual-pipeline Network for FLuid Simulation [4.7]
本研究では,注意型デュアルパイプネットワークを用いた3次元流体シミュレーションの革新的手法を提案する。グローバルな流体制御と物理法則のバランスを改善する方法を見つける。また、より複雑なシーンを扱うネットワークの能力をさらに探求する新たなデータセットであるTurton3Dを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:14:31 GMT)
Can LLMs perform structured graph reasoning? [4.7]
LLM(Pretrained Large Language Models)は、言語ベースのプロンプトだけで様々な推論能力を示す。本稿では,半構造化タスクのプロキシとして,様々なグラフ推論タスクを設計する。上記の課題に対して,5種類のインストラクト微細化LDM (GPT-4, GPT-3.5, Claude-2, Llama-2, Palm-2) をベンチマークした。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:04:12 GMT)
Visualization for Trust in Machine Learning Revisited: The State of the Field in 2023 [4.6]
可視化手法を解説したピアレビュー論文を収集し、以前に確立された分類スキーマに基づいて分類し、オンラインサーベイブラウザで542のテクニックを収集した。この結果から,過去3年間の機械学習モデルの信頼性向上に向けて,可視化技術の急速な発展傾向が示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:20:41 GMT)
Information theory unifies atomistic machine learning, uncertainty quantification, and materials thermodynamics [4.6]
情報の正確な記述は、原子論モデリングにおける様々な問題に関係している。本稿では, 位相変換, 運動事象, データセットの最適性, モデルなしUQの予測を原子シミュレーションから統一する情報理論フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:50:15 GMT)
FastVPINNs: Tensor-Driven Acceleration of VPINNs for Complex Geometries [4.6]
変分物理学情報ニューラルネットワーク(VPINN)は偏微分方程式の解法として変分損失関数を用いる。 FastVPINNは、従来のhp-VPINNと比較して、エポックあたりの平均トレーニング時間を100倍に短縮する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:21:28 GMT)
Polarization-entangled quantum frequency comb from a silicon nitride microring resonator [4.4]
集積マイクロ共振器は量子周波数コム(QFC)の実現を促進する集積化窒化ケイ素マイクロ共振器とサニャック干渉計を組み合わせたブロードバンド偏光結合量子周波数コムを試作した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:09:48 GMT)
Towards Application-Aware Quantum Circuit Compilation [4.3]
現在のコンパイルツールは、量子回路が実現した実際の応用を考慮せずに命令のシーケンスとして扱う。この研究では、アプリケーションが考慮されたことを明示的に取り入れ、ソリューションの品質を最適化することを目的とした、別のアプローチが検討されている。最初の結果は、このアプローチの利点を示している: 量子生成モデルの産業にインスパイアされた応用のために、提案されたアプローチは、Qiskitの最も最適化されたコンパイル方式よりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:00:02 GMT)
Towards a Foundation Model for Partial Differential Equation: Multi-Operator Learning and Extrapolation [4.3]
本稿では,PROSE-PDEという科学問題に対するマルチモーダル基礎モデルを提案する。本モデルは,物理系の制御方程式を並列に学習しながら,システムの将来の状態を予測できるマルチオペレータ学習手法である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:34:20 GMT)
Adjoint Sensitivities of Chaotic Flows without Adjoint Solvers: A Data-Driven Approach [4.3]
随伴感度分析は、すべてのシステムのパラメータに関して、興味のある量の勾配を提供する。コード固有でない随伴解法を提案する。カオス流の長期平均勾配に対するその応用を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:51:12 GMT)
VisEvol: Visual Analytics to Support Hyperparameter Search through Evolutionary Optimization [4.2]
機械学習(ML)モデルのトレーニングフェーズでは、通常、いくつかのハイパーパラメータを設定する必要がある。本稿では、ハイパーパラメータのインタラクティブな探索と、この進化過程への介入を支援するビジュアル分析ツールVisEvolを紹介する。 VisEvolの実用性と適用性は,2つのユースケースと,ツールの有効性を評価するML専門家へのインタビューで実証された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:23:23 GMT)
StackGenVis: Alignment of Data, Algorithms, and Models for Stacking Ensemble Learning Using Performance Metrics [4.2]
機械学習(ML)では、バッグング、ブースティング、スタックングといったアンサンブル手法が広く確立されている。 StackGenVisは、スタック化された一般化のためのビジュアル分析システムである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:02:16 GMT)
FeatureEnVi: Visual Analytics for Feature Engineering Using Stepwise Selection and Semi-Automatic Extraction Approaches [4.2]
本稿では,機能工学プロセスを支援するために特別に設計された視覚分析システムであるFeatureEnViを紹介する。提案システムは,ユーザが最も重要な機能を選択し,元の機能を強力な代替品に転換し,異なる機能生成の組み合わせを試すのに役立つ。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:00:24 GMT)
Device (In)Dependence of Deep Learning-based Image Age Approximation [4.1]
時間的画像法医学の目標は、同じデバイスからの画像に対して、デジタル画像の年齢を近似することである。本研究では,一つのデバイスからの画像にネットワークをトレーニングし,異なるデバイスからの画像にトレーニングされたモデルを適用することにより,これを実証的に評価する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:05:23 GMT)
A Configurable Pythonic Data Center Model for Sustainable Cooling and ML Integration [4.0]
データセンター設計の極めて高速なプロトタイピングを可能にするPythonライブラリであるPyDCMを紹介した。我々は、PyDCMの能力を実証し、データセンターをモデリングするためのEnergyPlusの既存の作業と比較する。 PyDCMは、サステナビリティを重視したデータセンタコントロールを示すスタンドアロンのGymnasium環境としても使用できる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:25:33 GMT)
Tailoring Fault-Tolerance to Quantum Algorithms [3.8]
我々はクリフォード・トロッター回路の物理実現を合成する解とスティッチのアルゴリズムを開発した。フラグガジェットを用いてこれらの回路の耐故障性を実現し,オーバーヘッドを最小限に抑える。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:15:15 GMT)
A Survey on 3D Egocentric Human Pose Estimation [3.6]
エゴセントリックな人間のポーズ推定は、人間のポーズを推定し、ファースト・パーソン・カメラの観点から身体表現を開発することを目的としている。近年、XR技術、人間とコンピュータのインタラクション、フィットネストラッキングといった分野に幅広く応用されているため、広く普及している。エゴセントリックな3次元ポーズ推定に関する提案された解決策に基づく体系的な文献レビューは行われていない。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:09:04 GMT)
GraphER: A Structure-aware Text-to-Graph Model for Entity and Relation Extraction [3.6]
自然言語処理(NLP)における情報抽出は重要な課題であるグラフ構造学習(GSL)として定式化する手法を提案する。この定式化により、エンティティとリレーショナル予測のためのより良い相互作用と構造インフォームド決定が可能になる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:09:37 GMT)
EnriCo: Enriched Representation and Globally Constrained Inference for Entity and Relation Extraction [3.6]
結合実体と関係抽出は、特に知識グラフの構築において、様々な応用において重要な役割を担っている。既存のアプローチはしばしば、表現の豊かさと出力構造におけるコヒーレンスという2つの重要な側面に欠ける。本研究では,これらの欠点を緩和するEnriCoを紹介する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:15:48 GMT)
Low-resolution Prior Equilibrium Network for CT Reconstruction [3.6]
本稿では,低分解能画像を導入し,ネットワークの堅牢性を改善するための効果的な正規化項を得る,新しいディープラーニングベースのCT再構成モデルを提案する。狭角化と狭角化の両問題を実験的に検討し, ノイズ低減, コントラスト・ツー・ノイズ比, エッジ細部保存の両面において, エンド・ツー・エンドの低分解能事前平衡モデルが他の最先端手法よりも優れていることを示した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:48:15 GMT)
t-viSNE: Interactive Assessment and Interpretation of t-SNE Projections [3.5]
t-viSNEは、t-SNEプロジェクションを視覚的に探索するためのインタラクティブツールである。本稿では, t-SNEプロジェクションの可視化のために, 一貫性があり, アクセスしやすく, 統合された様々なビューの集合を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:03:37 GMT)
VisRuler: Visual Analytics for Extracting Decision Rules from Bagged and Boosted Decision Trees [3.5]
バッグングとブースティングは、機械学習(ML)において、多くの個別決定木を生成する2つの一般的なアンサンブル手法である。本稿では,このようなMLモデルから決定を抽出するユーザを支援する視覚分析ツールを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:59:06 GMT)
MetaStackVis: Visually-Assisted Performance Evaluation of Metamodels [3.5]
本稿では,メタStackVisと呼ばれる新しい可視化ツールを用いて,代替メタモデルがアンサンブルの積み重ね性能に与える影響について検討する。我々のインタラクティブツールは、ユーザが予測可能な確率と複数のバリデーションメトリクスに応じて、異なる特異点とペアのメタモデルを視覚的に探索し、特定の問題のあるデータインスタンスを予測するのに役立つ。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:14:17 GMT)
iRAG: An Incremental Retrieval Augmented Generation System for Videos [3.5]
大規模マルチモーダルデータの対話的クエリを可能にするために,新たなインクリメンタルワークフローによりRAGを増強するiRAGを提案する。 iRAGはRAGをインクリメンタルワークフローで拡張する最初のシステムであり、大規模な実世界のマルチモーダルデータの効率的な対話型クエリをサポートする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:38:02 GMT)
Normative Requirements Operationalization with Large Language Models [3.5]
規範的な非機能要件は、社会的、法的、倫理的、共感的、文化的規範の違反を避けるために、システムが観察しなければならない制約を規定する。近年の研究では、規範的要件を特定するためにドメイン固有言語を使用してこの問題に対処している。本稿では,システム機能の抽象表現間の意味的関係を抽出するために,大規模言語モデルを用いた補完的アプローチを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:01:34 GMT)
EdgeFusion: On-Device Text-to-Image Generation [3.3]
我々はテキスト・ツー・イメージ生成のためのコンパクトSD変種BK-SDMを開発した。我々は、リソース制限エッジデバイス上で1秒未満のレイテンシで、わずか2ステップで、フォトリアリスティックなテキスト整列画像の高速生成を実現する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:02:54 GMT)
DimVis: Interpreting Visual Clusters in Dimensionality Reduction With Explainable Boosting Machine [3.3]
DimVisは、DRプロジェクションの解釈アシスタントとして、教師付きExplainable Boosting Machine(EBM)モデルを使用するツールである。本ツールは,視覚的クラスタにおける特徴関連性の解釈を提供することにより,高次元データ解析を容易にする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:56:10 GMT)
DF-DM: A foundational process model for multimodal data fusion in the artificial intelligence era [3.3]
本稿では,データマイニングのためのマルチモーダルデータフュージョンの新しいプロセスモデルを提案する。我々のモデルは、効率と信頼性を改善しつつ、計算コスト、複雑さ、バイアスを減らすことを目的としている。本研究は,糖尿病網膜症における網膜画像と患者のメタデータを用いた予測,衛星画像を用いた家庭内暴力予測,インターネット,国勢調査データ,放射線画像と臨床ノートによる臨床像と人口動態の同定という3つのユースケースを通じて有効性を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:52:42 GMT)
Control-based Graph Embeddings with Data Augmentation for Contrastive Learning [3.3]
グラフ上に定義された動的ネットワークの制御特性を利用した教師なしグラフ表現学習の課題について検討する。対照的な学習における重要なステップは、入力グラフから'拡張'グラフを作成することである。本稿では,ネットワークの制御特性を活用して,これらの拡張グラフを生成するユニークな手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:10:49 GMT)
End-To-End Training and Testing Gamification Framework to Learn Human Highway Driving [3.2]
本稿では,自律走行自動車のためのゲームベースのエンドツーエンド学習およびテストフレームワークを提案する。人気ゲーム「グランドセフト・オートV」を使って高速道路の運転データを収集する。エンド・ツー・エンドのアーキテクチャは、ゲーム画面の画像により車両を制御する操舵およびスロットル値を予測する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:14:08 GMT)
Monitoring Unmanned Aircraft: Specification, Integration, and Lessons-learned [3.2]
本稿では,Volocopterの設計した完全電動航空機へのランタイム監視の統合について報告する。モニターの正確な操作は、航空機の安全のために重要である。ストリームベースのモニタリングフレームワークであるRTLolaを使って、さまざまな要求に対してモニタを生成しました。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:42:24 GMT)
Theory of Mobility Rings in Non-Hermitian Systems [3.2]
非エルミート系におけるモビリティ・エッジは環構造を持ち、これは「モビリティ・リング」と呼ばれる。この論文で提案されるモビリティ環理論は、すべての非エルミート系に対して普遍的である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:37:45 GMT)
Self-supervised Learning of Rotation-invariant 3D Point Set Features using Transformer and its Self-distillation [3.2]
本稿では,オブジェクトレベルでの高精度かつ回転不変な3次元点集合特徴を取得するための,自己教師付き学習フレームワークを提案する。トークンを改良し,それを3次元点集合ごとに表現的回転不変の特徴に集約するために,自己認識機構を用いる。提案アルゴリズムは,既存のアルゴリズムよりも高精度な回転不変の3次元点集合特徴を学習する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:40:16 GMT)
Gait Recognition from Highly Compressed Videos [3.1]
一般的な緩和戦略は、頑健性を改善するためにノイズデータ上の微調整ポーズ推定モデルを含む。本稿では,監視映像の事前処理と改善を目的としたタスク対象のアーティファクト修正モデルを組み込んだ処理パイプラインを提案する。本実験は歩行解析性能の向上を図り,提案手法の有効性を裏付けるものである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:46:16 GMT)
Aligning Actions and Walking to LLM-Generated Textual Descriptions [3.1]
大規模言語モデル(LLM)は、様々な領域で顕著な機能を示している。本研究は, 動作パターンと歩行パターンの両方を包含して, 動作シーケンスのリッチなテキスト記述を生成するLLMの利用について検討する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:56:03 GMT)
Deep Neural Networks via Complex Network Theory: a Perspective [3.1]
ディープニューラルネットワーク(DNN)は、リンクと頂点が反復的にデータを処理し、タスクを亜最適に解くグラフとして表現することができる。複雑なネットワーク理論(CNT)は、統計物理学とグラフ理論を融合させ、その重みとニューロン構造を分析してニューラルネットワークを解釈する方法を提供する。本研究では,DNNのトレーニング分布から抽出した測定値を用いて既存のCNTメトリクスを拡張し,純粋なトポロジカル解析からディープラーニングの解釈可能性へ移行する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:17:43 GMT)
Coherent control of an optical tweezer phonon laser [3.1]
光ツイーザーフォノンレーザーのダイナミックスのコヒーレント制御は、異なる振動モード間のコヒーレンスを共有するために使用される。コヒーレンスを光ツイーザーフォノンレーザーの様々なモードで転送することができ、精度測定や量子情報処理にこれらのシステムを利用するためのステップである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:31:02 GMT)
Utilizing Adversarial Examples for Bias Mitigation and Accuracy Enhancement [3.1]
本稿では,コンピュータビジョンモデルにおけるバイアスを軽減するための新しい手法を提案する。提案手法は,カリキュラム学習フレームワークと詳細な逆数損失を組み合わせることで,逆数例を用いてモデルを微調整する。我々は,定性評価と定量的評価を併用し,従来の方法と比較してバイアス緩和と精度の向上を実証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 00:41:32 GMT)
Boson sampling enhanced quantum chemistry [3.0]
線形量子光学系のみを用いて分子の電子構造問題を解くためのハイブリッド量子古典アルゴリズムを提案する。私たちが提案した変分アンサッツは、相互作用しないボソン力学と古典的な計算化学手法のハイブリッドである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:17:26 GMT)
LD-Pruner: Efficient Pruning of Latent Diffusion Models using Task-Agnostic Insights [2.8]
本稿では,遅延拡散モデル圧縮のための新しい性能保存型構造化プルーニング手法であるLD-Prunerを紹介する。我々は,テキスト・トゥ・イメージ(T2I)生成,無条件画像生成(UIG),無条件音声生成(UAG)の3つのタスクに対するアプローチの有効性を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:35:37 GMT)
Evolutionary Multi-Objective Optimisation for Fairness-Aware Self Adjusting Memory Classifiers in Data Streams [2.8]
本稿では,データストリーム分類に適用した機械学習アルゴリズムの公平性を高める新しい手法を提案する。提案手法は、自己調整メモリK-Nearest-Neighbourアルゴリズムと進化的多目的最適化の長所を統合する。提案手法は競争精度を維持し, 差別を著しく低減することを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:59:04 GMT)
FuSeBMC v4: Improving code coverage with smart seeds via BMC, fuzzing and static analysis [2.8]
FuSeBMC v4は、種子を有用な性質で合成するテストジェネレータである。 FuSeBMCは、まず所定のCプログラムにゴールラベルをインクリメンタルにインジェクションすることで機能する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:40:04 GMT)
KDk: A Defense Mechanism Against Label Inference Attacks in Vertical Federated Learning [2.8]
Vertical Federated Learning (VFL) のシナリオでは、サンプルのラベルは、ラベル所有者である集約サーバを除くすべてのパーティからプライベートに保持される。最近の研究で、サーバからボトムモデルに返される勾配情報を利用することで、敵がプライベートラベルを推測できることが判明した。我々は,KDkという,知識蒸留とk匿名を組み合わせて防御機構を提供する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:51:02 GMT)
Automatic Speech Recognition using Advanced Deep Learning Approaches: A survey [2.7]
近年のディープラーニング(DL)の進歩は,自動音声認識(ASR)にとって重要な課題となっている。 ASRは、秘密のデータセットを含む広範なトレーニングデータセットに依存しており、かなりの計算とストレージリソースを必要としている。ディープトランスファーラーニング(DTL)、フェデレーションラーニング(FL)、強化ラーニング(RL)といった高度なDL技術はこれらの問題に対処する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:29:29 GMT)
Post-Training Network Compression for 3D Medical Image Segmentation: Reducing Computational Efforts via Tucker Decomposition [2.7]
本稿では,既存のモデルの分解により,セグメント化精度を損なうことなく,計算要求を低減できるタッカー因数分解法を提案する。提案手法では,推定時に必要となる浮動小数点演算(FLOP)とメモリを削減し,計算効率とセグメンテーション品質のトレードオフを調整可能とした。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:51:55 GMT)
Information Fusion in Multimodal IoT Systems for physical activity level monitoring [2.7]
本研究は、IoTシステムにおける情報融合を利用して、クラスタリング手法を用いて、各クラスタ内の振る舞いとキー特性の類似性を識別する。このアプローチは行動変化の早期発見を促進し、継続的な健康モニタリングのための行動ルーチンをより深く理解する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:36:03 GMT)
Dynamic Observation Policies in Observation Cost-Sensitive Reinforcement Learning [2.6]
材料設計、深海探査、惑星ロボット探査、医学などの応用においては、環境の状態を測定することや近似することに関連するコストが高くなる可能性がある。本稿では,Dep Dynamic Multi-Step Observationless Agent (DMSOA)を提案する。その結果、DMSOAは、文献から考慮された代替案よりも、より少ない意思決定手順と測定でより良い政策を学習していることが示される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:22:42 GMT)
Beyond development: Challenges in deploying machine learning models for structural engineering applications [2.6]
本稿では,2つの具体例を通して,デプロイメントに適した機械学習モデルを開発する上での課題について述べる。様々な落とし穴の中で、提示された議論は、モデルの過度な適合と過小評価、トレーニングデータ代表性、変数の欠落バイアス、およびクロスバリデーションに焦点を当てている。その結果、適応サンプリングによる厳密なモデル検証手法の実装の重要性、注意深い物理インフォームド特徴選択、モデルの複雑さと一般化可能性の両方について考察した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:40:42 GMT)
Blind Localization and Clustering of Anomalies in Textures [2.6]
画像中の異常検出と局所化は、コンピュータビジョンにおける成長分野である。そこで本稿では,視覚障害者を対象とした画像のクラスタリング手法を提案する。本稿では,視覚異常局所化とコントラスト学習を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:11:02 GMT)
Entanglement generation between two comoving Unruh-DeWitt detectors in the cosmological de Sitter spacetime [2.5]
2つの共振型2レベル検出器を同時に空間的位置で検討する。検出器は個別にスカラー場に結合し、2つの検出器間の結合につながる。対数ネガティリティを計算し、2つの検出器間の遅い時間に発生する絡み合いの度合いを定量化する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:20:07 GMT)
Low-rank tensor completion via tensor joint rank with logarithmic composite norm [2.5]
対数合成ノルム法(TJLC)を用いたテンソルジョイントランク法を提案する。提案手法は, 観測情報が1%以下であっても良好な回復を達成し, 観測情報の増加とともに回復性能が著しく向上する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:08:53 GMT)
DeepLocalization: Using change point detection for Temporal Action Localization [2.5]
DeepLocalizationは、ドライバーの行動を監視するために明示的に調整されたアクションのリアルタイムローカライゼーションのために考案された革新的なフレームワークである。我々の戦略は、ビデオ大言語モデル(Video Large Language Model, Video-LLM)と並行して、グラフベースの変更点検出を時間内のピンポイント行動に活用し、アクティビティを正確に分類する、という2つのアプローチを採用している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:25:59 GMT)
A Time-Inhomogeneous Markov Model for Resource Availability under Sparse Observations [2.4]
ルーティングアルゴリズムのようなスマートシティアプリケーションにとって、現在の状況に関する正確な時間情報は不可欠である。観測頻度が非常に稀な場合でも正確な予測が可能な時間不均一離散マルコフモデルを提案する。我々の新しいモデルは、最近の観測を過去のデータとブレンドすることができ、将来の状態に有用な確率的推定を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:00:59 GMT)
SNP: Structured Neuron-level Pruning to Preserve Attention Scores [2.4]
マルチヘッド自己注意(MSA)は視覚変換器(ViT)の重要な構成要素である我々は,新しいグラフ対応ニューロンレベルプルーニング法,構造化ニューロンレベルプルーニング(Structured Neuron-level Pruning, SNP)を提案する。提案手法は,エッジデバイスとサーバプロセッサの両方において,Transformerベースのモデルを効果的に圧縮・高速化する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:21:28 GMT)
GenVideo: One-shot Target-image and Shape Aware Video Editing using T2I Diffusion Models [2.4]
ターゲット画像認識型T2Iモデルを利用した動画編集のためのGenVideoを提案する。提案手法は,編集の時間的一貫性を維持しつつ,形状や大きさの異なる対象オブジェクトで編集を処理する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:25:27 GMT)
Electrical control of a Kondo spin screening cloud [2.3]
不純物スピンは、コンドスクリーニング雲(Kondo screening cloud)と呼ばれる、低温で伝導電子によって遮蔽される量子的絡み合いである。我々はこのような近藤箱を実現し、絡みを制御・監視するためのアプローチを開発する。電気的手法により固体中の空間的に拡張された量子多体絡みを操作・検出する方法を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:16:30 GMT)
Subtraction and Addition of Propagating Photons by Two-Level Emitters [2.3]
本研究では,非ガウス量子演算を伝搬場モードに実装するには,受動的2レベル非線形性が十分であることを示す。直観的量子軌道モデルの要素による単一光子サブトラクション過程を正確に記述する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:55:33 GMT)
TaCOS: Task-Specific Camera Optimization with Simulation [2.3]
本稿では,カメラをロボットタスクで協調設計するための新しいエンドツーエンド最適化手法を提案する。提案手法は,最近のコンピュータグラフィックス技術と物理カメラ特性を利用して,ソフトウェアでカメラのプロトタイプを作成する。物理カメラとの比較により, カメラシミュレーションの精度を検証し, 一般的な市販カメラよりも高い性能のカメラの設計を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:10:44 GMT)
A Symmetric Regressor for MRI-Based Assessment of Striatal Dopamine Transporter Uptake in Parkinson's Disease [2.2]
ドーパミントランスポーター(DAT)イメージングはパーキンソン病(PD)のモニタリングに一般的に用いられている近年,ニコラル領域のMRIパッチはより安全で簡便な代替手段として提案されている。本稿では,MRI パッチからの DAT 取り込み量を予測する対称回帰器を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:18:48 GMT)
emrQA-msquad: A Medical Dataset Structured with the SQuAD V2.0 Framework, Enriched with emrQA Medical Information [2.2]
emrQA-msquadデータセットは、医学用語の複雑さに対処するために開発された。 Span抽出タスク専用の医療データセットが導入され、システムの堅牢性が強化された。 BERT、RoBERTa、Tiny RoBERTaといったモデルの微調整により、F1スコアの範囲での応答精度は0.75から1.00に向上した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:06:00 GMT)
Confident Feature Ranking [2.1]
本稿では,グローバルな重要性値の不確実性を定量化する枠組みを提案する。本稿では,特徴値のポストホック解釈のための新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:44:26 GMT)
The Emerging AI Divide in the United States [2.0]
本研究では,米国住民の新たな生成型AIツールChatGPTに関する知識の空間的差異を特徴づける。西海岸州ではChatGPTを検索するユーザが最も多く、アパラチア州や湾岸州では検索率が継続的に低い。生成的AI技術は斬新なものだが、初期の取り込みの違いは、デジタルの限界化の慣れ親しんだ道を辿っているように見える。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:33:35 GMT)
Centralized vs. Decentralized Multi-Agent Reinforcement Learning for Enhanced Control of Electric Vehicle Charging Networks [1.9]
本稿では,MARL(Multi-Agent Reinforcement Learning)フレームワークを用いた分散・協調型充電戦略の新たなアプローチを提案する。本手法は, 住宅街におけるEV群を対象としたDDPGアルゴリズムに基づいて構築した。以上の結果から, CTDE-DDPGフレームワークは, 政策のばらつきや訓練の複雑さが高いにもかかわらず, 総変動率を約36パーセント, 充電コストを平均9.1程度削減することにより, 充電効率を著しく向上させることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:50:03 GMT)
Quantum Optical Approach to the $K$ Nearest Neighbour Algorithm [1.9]
我々は、$K$-Nearest Neighbourアルゴリズムのためのハイブリッド量子古典的アプローチを構築する。この情報は、単一の光子の助けを借りて、相分散多モードコヒーレント状態に埋め込まれる。我々のアルゴリズムに対応する量子光学アーキテクチャを提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:33:31 GMT)
How to Benchmark Vision Foundation Models for Semantic Segmentation? [1.9]
本稿では,視覚基盤モデル(VFM)をセマンティックセグメンテーションのためにベンチマークする方法について検討する。様々なVFMを様々な設定で微調整し、個々の設定がパフォーマンスランキングとトレーニング時間に与える影響を評価する。データセットとドメインシフト間でのパフォーマンスランキングが異なるため、トレーニングと評価に複数のデータセットを使用することも推奨されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:27:29 GMT)
D4C Glove-train: Solving the RPM and Bongard-logo Problem by Circumscribing and Building Distribution for Concepts [1.8]
本稿では,RPM問題を解決する新しいベースラインモデルLico-Netを紹介する。我々は、分布を通して抽象的推論問題において基礎となる概念を提唱するD3Cアプローチを推進している。 D3Cの計算効率を高めるために,D3C-cos変種を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:26:39 GMT)
FaceFilterSense: A Filter-Resistant Face Recognition and Facial Attribute Analysis Framework [1.7]
面白い自撮りフィルターは、顔の生体認証システムの機能に大きく影響を与えている。現在、顔のキーポイントを歪めているARベースのフィルターやフィルターは、最近流行し、裸眼でも顔が認識不能になっている。これらの制約を緩和するため、我々は最新のフィルタの全体的影響分析を行い、フィルタ画像を用いたユーザ認識モデルを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:43:26 GMT)
Transparent AI: Developing an Explainable Interface for Predicting Postoperative Complications [1.7]
我々は5つの重要な質問に答えるために設計された説明可能なAI(XAI)フレームワークを提案する。我々は,LIME(Local Interpretable Model-Agnostic Explanations)などの様々な手法を取り入れた。術後合併症の予測を目的としたXAIインタフェースの試作について紹介した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:01:27 GMT)
Graph Edits for Counterfactual Explanations: A comparative study [1.5]
我々は,グラフ編集における過去の取り組みを,比較研究を行うことで,反現実的な説明として拡張する。この目的のために、我々は入力データをグラフとして表現すべきかという重要な研究課題を提起する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:29:29 GMT)
Entangled states from arborescent knots [1.5]
このような結び目からベル状態、GHZ状態、クラスター状態を構築することができることを示す。後者は、測定ベースの量子コンピュータの基盤を形成するため、特に興味深い。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:36:04 GMT)
Negotiating the Shared Agency between Humans & AI in the Recommender System [1.4]
ユーザエージェンシーに関する懸念は、固有の不透明性(情報非対称性)とアルゴリズムにおける一方的な出力(パワー非対称性)の性質から生じている。我々は,エージェントの種類がユーザの知覚や経験にどのように影響するかを理解し,人間とAIの対話システムのためのガイドラインや設計を洗練するための実証的な証拠を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:05:22 GMT)
TensAIR: Real-Time Training of Neural Networks from Data-streams [1.4]
本稿では,ANNをリアルタイムにトレーニングする最初のOLシステムであるTensAIRについて述べる。 TensAIRは、分散化および非同期アーキテクチャを使用してANNモデルをトレーニングすることで、優れたパフォーマンスとスケーラビリティを実現する。我々は、(1)ネットワークにデプロイされたワーカノードの数、(2)データバッチが到着するスループットの観点から、TensAIRがほぼ線形なスケールアウト性能を達成することを実証的に実証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:07:35 GMT)
Enhancing AI Diagnostics: Autonomous Lesion Masking via Semi-Supervised Deep Learning [1.4]
本研究では,乳房超音波(US)画像における乳房病変の鑑別を目的とした,関心領域(ROI)を自律的に生成することを目的とした,教師なし領域適応手法を提案する。我々の半教師付き学習アプローチは、真のアノテーションを持つ小さな母乳USデータセットで訓練された原始モデルを利用する。このモデルはドメイン適応タスクのために反復的に洗練され、当社のプライベートな無注釈乳房データセットに擬似マスクを生成します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:25:00 GMT)
NLP-enabled trajectory map-matching in urban road networks using transformer sequence-to-sequence model [1.4]
本稿では、列列から列へのディープラーニングモデル、特にトランスフォーマーベースのエンコーダデコーダモデルを紹介し、マップマッチングアルゴリズムのサロゲートとして実行する。このモデルは、ニューヨーク州マンハッタンで収集されたGPSトレースを使って訓練され、評価されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:39:23 GMT)
Explainable Ponzi Schemes Detection on Ethereum [1.4]
ポンツィスキームは最も一般的な詐欺の一つである。本稿では,実世界のスマートポンジ契約を検出する分類器を提案する。優れた分類品質を保証し、AI技術を用いた分類への影響を調査する、小型で効果的な機能のセットを特定します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:51:25 GMT)
Simultaneous upper and lower bounds of American option prices with hedging via neural networks [1.4]
本稿では,ニューラルネットワークを用いたアメリカンスタイルオプション価格問題の解法を2つ紹介する。最初の方法は、一連のニューラルネットワークを使用して、オプション価格の下限と上限の両方を同時に計算する。 2つ目の方法は1つのグローバルネットワークで同じ目標を達成する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:50:32 GMT)
Deep Gaussian mixture model for unsupervised image segmentation [1.4]
多くのタスクにおいて、十分なピクセルレベルのラベルを得るのは非常に困難である。本稿では,ガウス混合モデル(GMM)と教師なしディープラーニング技術を組み合わせた手法を提案する。マルチシーケンスMRI画像における梗塞領域分割の例について, 様々な実験において本手法の利点を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:20:59 GMT)
Terrain-Informed Self-Supervised Learning: Enhancing Building Footprint Extraction from LiDAR Data with Limited Annotations [1.3]
フットプリントマップの構築は、広範な後処理なしで正確なフットプリント抽出を約束する。ディープラーニング手法は、一般化とラベルの効率の面で課題に直面している。リモートセンシングに適した地形認識型自己教師型学習を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:42:19 GMT)
Acting upon Imagination: when to trust imagined trajectories in model based reinforcement learning [1.3]
モデルベース強化学習(MBRL)は、行動の結果を予測する環境力学のモデル(s)を学習することを目的としている。仮想軌道のオンライン評価のための不確実性推定手法を提案する。その結果,性能を犠牲にすることなく計算コストを大幅に削減できることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:45:00 GMT)
PID Tuning using Cross-Entropy Deep Learning: a Lyapunov Stability Analysis [1.2]
この研究は、そのようなコントローラの安定性を実証的に研究する実験とメトリクスを提案する。クロスエントロピー深層学習法を用いて適応パラメータを決定するLB適応制御系において,この安定性解析を行う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:22:08 GMT)
Resource analysis for quantum-aided Byzantine agreement with the four-qubit singlet state [1.2]
分散コンピューティングでは、ビザンツ断層(Byzantine fault)は、コンポーネントが不整合に振る舞う状態であり、システムの異なるコンポーネントに対して異なる症状を示す。我々の研究は、量子通信プロトコルを多ビットの絡み合った状態に展開する上で重要な工学的側面を強調している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:26:43 GMT)
Concept Induction using LLMs: a user experiment for assessment [1.2]
本研究では,人間に対する説明として意味のある高レベルな概念を生成するために,LLM(Large Language Model)の可能性を探る。我々は、LLMによって生成された概念を、人間によって生成された概念とECII概念誘導システムという、他の2つの方法と比較する。人為的な説明は依然として優れているが, GPT-4 から派生した概念は, ECII が生成した概念よりも人間にとって理解しやすいことが示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:22:02 GMT)
When LLMs are Unfit Use FastFit: Fast and Effective Text Classification with Many Classes [1.2]
我々はFastFitを提案する。FastFitは、高速で正確な数ショット分類を提供するためのメソッドであり、Pythonパッケージ設計である。 FastFitは、バッチコントラスト学習とトークンレベルの類似度スコアを組み合わせた、新しいアプローチを採用している。パッケージはGitHubとPyPiで公開されており、NLP実践者向けのユーザフレンドリなソリューションを提供している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:48:05 GMT)
Adapting LLMs for Efficient Context Processing through Soft Prompt Compression [1.2]
本稿では,大規模言語モデルを合理化された文脈処理のために戦略的に調整する,革新的なフレームワークを提案する。我々の手法はSoftPromptCompと呼ばれ、動的に生成されたソフトプロンプトで自然言語をアマルガメイトし、簡潔でセマンティックに頑健な文脈の描写をフォージする。我々は,我々のフレームワークが計算オーバーヘッドを著しく減らし,LLMの有効性を様々なベンチマークで向上させることを実証した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:23:53 GMT)
Corpus Christi: Establishing Replicability when Sharing the Bread is Not Allowed [1.1]
コーパス生成に大きな影響を及ぼすバイナリ分析の課題を特定する。私たちは、複製性と代表性という科学的目標を育むための重要なコーパス要件の枠組みを導き出すためにそれらを使用します。このフレームワークを44階層の論文に適用し,704個のデータポイントを収集し,現在コーパス作成の共通基盤がないことを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:14:40 GMT)
Using Real-world Bug Bounty Programs in Secure Coding Course: Experience Report [1.1]
新しいサイバーセキュリティ専門家の育成は、地域の範囲が広いため難しい課題である。我々は、現実世界のバグ報奨金プログラムをサイバーセキュリティカリキュラムに統合するソリューションを提案する。セキュアなプログラミングコースにおいて,学期課題の選択肢として,学生にバグ報奨金プログラムへの参加を選択させる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:53:49 GMT)
Computer-Aided Diagnosis of Thoracic Diseases in Chest X-rays using hybrid CNN-Transformer Architecture [1.1]
自動コンピュータ支援診断システムは、胸部X線を解釈し、実行可能な洞察を提供することで、放射線科医を増強することができる。本研究では,DenseNet121 Convolutional Neural Network(CNN)を付加した新しいアーキテクチャを適用した。胸部X線による胸部疾患の診断において, 自己注意でCNNを増強する可能性が示唆された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:46:31 GMT)
Follow-Me AI: Energy-Efficient User Interaction with Smart Environments [1.1]
この記事では、スマート環境とのユーザインタラクションを強化するために設計されたコンセプトであるFollow-Me AIを紹介します。 Follow-Me AIは、ユーザの同意に基づいてデータ管理を交渉し、環境制御を調整し、ユーザの好みに応じて、環境内で利用可能なリソースを計算します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:00:25 GMT)
E-Vote Your Conscience: Perceptions of Coercion and Vote Buying, and the Usability of Fake Credentials in Online Voting [1.1]
オンライン投票は、個人投票よりも有権者の強制と投票による購入の影響を受ける。 1つの緩和策は、有権者に偽の投票資格を付与し、強制執行者に与えることである。偽の資格証は実際のものと同一に見えるが、最終集計から無言で省略された投下票である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:57:32 GMT)
Thermalization of isolated quantum many-body system and the role of entanglement [1.0]
絡み合いは, 普遍的ではなく, 特に熱分解剤として作用する可能性が示唆された。特に, エンタングルエネルギー固有状態における観測対象の期待値とその限界値は観測対象のミクロカノニカルおよび標準平均値と等価であることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 22:09:40 GMT)
AI-Based Automated Speech Therapy Tools for persons with Speech Sound Disorders: A Systematic Literature Review [1.0]
新型コロナウイルス(COVID-19)パンデミックは、音声障害(SSD)患者のための自動音声治療ツールの要件を開始した。このような自動化ツールを設計するためのガイドラインや,その自動化の度合いは,人間の専門家に比較して存在しない。モバイルベースでゲーミフィケーションされたアプリケーションは、最も頻繁な介入方法であった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:42:41 GMT)
From port-based teleportation to Frobenius reciprocity theorem: partially reduced irreducible representations and their applications [1.0]
我々は、$n$システムに作用するポートベースのテレポーテーション作用素のスペクトルが、対称群 $S(n-1)subset S(n)$ に対して、Jucys-Murphy作用素のスペクトルと非常に単純な方法で連結されていることを示す。このことは、対称群の表現論の観点から、テレポーレーションと基本対象の1つの間の技術的なレベルの関係を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:56:51 GMT)
Quantum dynamics of dissipative Chern insulator [1.0]
量子状態の時間的進化を数値シミュレーションにより検討する。リウヴィリアの隙間の開きと閉きは、システムの異なる減衰挙動をもたらすことが判明した。非エルミート皮膚効果の存在は、鋭い波面を持つキラル減衰現象を引き起こす。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 02:49:25 GMT)
VCC-INFUSE: Towards Accurate and Efficient Selection of Unlabeled Examples in Semi-supervised Learning [1.0]
既存の手法では、ラベルのないデータを効果的かつ効率的に利用できない。本稿では,変分信頼度 (VCC) と影響Function-based Unlabeled Sample Elimination (INFUSE) の2つの手法を提案する。提案手法は,複数のデータセットや設定において有効であり,誤り分類率を低減し,トレーニング時間を短縮する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 06:59:40 GMT)
What does CLIP know about peeling a banana? [1.0]
知的なロボットが日々の生活の物体を使えるようにするためには、必要なタスクに応じて物体を分割できることが不可欠だ。従来の割当セグメンテーションのための教師付き学習手法は、高価なピクセルレベルのアノテーションを必要とする。本稿では,大規模な事前学習型ビジョンランゲージモデルに埋め込まれた暗黙のアベイランス知識を活用することで,これらの制約を克服するAffordanceCLIPを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:06:05 GMT)
Neural Networks with Causal Graph Constraints: A New Approach for Treatment Effects Estimation [1.0]
因果グラフからの追加情報を考慮した新しいモデルNN-CGCを提案する。本手法は因果グラフの不完全性に対して頑健であり,部分因果情報の使用は無視するよりも望ましいことを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:57:17 GMT)
Warped Time Series Anomaly Detection [0.9]
本稿では,繰り返し動作を伴うシステムに焦点をあて,時系列の外れ値を検出する問題に対処する。 WarpEd Time Series Anomaly Detection (WETSAND) と呼ばれる全体的なアプローチは、動的時間ワープアルゴリズムとその変種を利用する。実験の結果、ウェットサンドは大きな信号にスケールし、人間に親しみやすいプロトタイプを計算し、非常に少ないデータで動作し、オートエンコーダのような汎用的な異常検出アプローチよりも優れていることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:35:24 GMT)
The graph alignment problem: fundamental limits and efficient algorithms [0.9]
グラフ同型問題のノイズバージョンは、エッジの大部分を保存する2つのグラフのノード間のマッチングを見つけることを目的としている。この論文は、この問題の基本的な情報理論的限界を理解すること、および、基礎となるデータのアライメントを回復できるアルゴリズムを設計および分析することに焦点を当てている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:31:13 GMT)
Explainable Deep Learning Models for Dynamic and Online Malware Classification [0.9]
本研究の目的は,様々な実行環境にまたがる説明可能なマルウェア分類を探索することである。我々は、動的およびオンライン分析環境から得られた特徴に基づいてマルウェアを分類するために、フィードフォワードニューラルネットワーク(FFNN)と畳み込みニューラルネットワーク(CNN)を訓練する。計算されたグローバルおよびローカルな説明の詳細な評価を行い、制限について議論し、最終的にはバランスの取れたアプローチを達成するための推奨事項を提示します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:07:51 GMT)
From Language Models to Practical Self-Improving Computer Agents [0.9]
我々は、多様なコンピュータタスクを実行し、自己改善できるAIコンピュータエージェントを作成するための方法論を開発する。我々は、LLMエージェントに検索、インターネット検索、Webナビゲーション、テキストエディタ機能を増強するよう促す。このエージェントは、これらの様々なツールを効果的に利用して、自動ソフトウェア開発やWebベースのタスクを含む問題を解決する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:50:10 GMT)
Enhanced LFTSformer: A Novel Long-Term Financial Time Series Prediction Model Using Advanced Feature Engineering and the DS Encoder Informer Architecture [0.9]
本研究では,拡張LFTSformerと呼ばれる長期金融時系列の予測モデルを提案する。このモデルは、いくつかの重要なイノベーションを通じて、自分自身を区別する。さまざまなベンチマークストックマーケットデータセットに関するシステマティックな実験は、強化LFTSformerが従来の機械学習モデルより優れていることを示している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:25:34 GMT)
Proactive Software Supply Chain Risk Management Framework (P-SSCRM) Version 1 [0.8]
プロアクティブなソフトウェアサプライチェーンリスク管理フレームワークは、セキュアなソフトウェアサプライチェーンリスク管理イニシアチブを理解し計画するのに役立つように設計されています。これは、ソフトウェアサプライチェーンのリスク管理イニシアチブをリードする9つの業界から、現実世界のデータを理解し分析するプロセスによって作成された。セキュアなソフトウェアサプライチェーンリスク管理プログラムを理解し、定量化し、開発するためのモデルを提示します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:24:26 GMT)
The collective use and evaluation of generative AI tools in digital humanities research: Survey-based results [0.7]
生成人工知能(GenAI)技術は研究に革命をもたらした。本稿では,デジタル人文科学研究者がGenAI技術をどのように採用し,実践し,批判的に評価するかを考察する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:33:00 GMT)
Diamond surfaces with lateral gradients for systematic optimization of surface chemistry for relaxometry -- A low pressure plasma-based approach [0.6]
窒素空孔(NV)中心と呼ばれるダイヤモンドの欠陥は、前例のない感度で測定できる。理想的なセンシング性能を達成するには、NVセンターは表面からナノメートル以内に配置する必要がある。ダイヤモンドの表面を比較するためにいくつかの試みがなされている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:47:44 GMT)
Parametrically-controlled microwave-photonic interface for the fluxonium [0.6]
マイクロ波誘起パラメトリック変換によるフラキソニウムと走行光子との対面方式を実験的に実証した。実演方式のシンプルさと柔軟性により,フラキソニウムをベースとしたリモートエンタングルメントアーキテクチャが実現される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:55:02 GMT)
Artificial Neural Networks to Recognize Speakers Division from Continuous Bengali Speech [0.5]
我々は,男性633人,女性633人を対象に,45時間以上の音声データを用いた。私たちは85.44%の精度を記録しました。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:17:20 GMT)
EuSQuAD: Automatically Translated and Aligned SQuAD2.0 for Basque [0.5]
この作業は、SQuAD2.0をバスク語に自動翻訳・調整する最初のイニシアチブであるEuSQuADを提示する。我々は、EuSQuADをトレーニングデータとしてサポートした広範囲な定性分析とQA実験により、EuSQuADの価値を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:31:57 GMT)
Adiabatic Transformations in Dissipative and Non-Hermitian Phase Transitions [0.5]
非エルミート量子系における相転移の研究に普遍的なアプローチを提供する量子幾何テンソルの新しい一般化を提案する。我々の一般化は、断熱変換の生成の概念に基づいており、リウヴィリア超作用素または有効非エルミート・ハミルトン作用素によって記述されたシステムに適用することができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:05:08 GMT)
SERENE: A Collusion Resilient Replication-based Verification Framework [0.4]
衝突検出と緩和のソリューションは、信頼できるサードパーティサーバーの使用や、検証されたタスクを必要とすることが多い。本稿では, 衝突作業者を検出し, 軽減する, 回復力のあるレプリケーションベースの検証フレームワークSERENEを提案する。我々はSERENEの性能をStaabらと比較し、平均50%と60%の精度で検出精度と緩和精度を向上した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:30:51 GMT)
Circular Systems Engineering [0.4]
本稿では,システムサステナビリティの新たなパラダイムである循環システム工学の概念を紹介する。エンド・ツー・エンド・サステナビリティとバイパーティイト・サステナビリティの2つの原則を定義します。循環原理の実装と導入につながる典型的な組織進化パターンを概説する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:11:49 GMT)
Assessing the Solvency of Virtual Asset Service Providers: Are Current Standards Sufficient? [0.4]
VASPは、分散台帳技術(DLT)を介してウォレットに整理された暗号通貨の交換、保持、転送を可能にする DLTトランザクションの公開にもかかわらず、VASPの暗号保持は、まだ体系的な監査手続きの対象にはなっていない。本稿では,3つの異なる情報源からの相互参照データを用いて,VASPの可解性を評価する手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:45:35 GMT)
Error-mitigated fermionic classical shadows on noisy quantum devices [0.4]
古典的シャドウ (CS) アルゴリズムは、必要な量子状態コピー数を減らして解を提供する。本稿では,ゲート独立性,時間定常性,マルコフ雑音(GTM)を仮定した誤り緩和型CSアルゴリズムを提案する。提案アルゴリズムは,GTMノイズに対する$widetildemathcal O(knk)$状態コピーと$widetildemathcal O(sqrtn)$キャリブレーションによる$k$-RDMを効率的に推定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:05:29 GMT)
Methods and strategies for improving the novel view synthesis quality of neural radiation field [0.3]
NeRF技術は、2D画像からシーンの3D暗黙モデルを学び、現実的な新しいビューイメージを合成することができる。 NeRF画像のレンダリング品質を改善する必要があるという問題に対して、多くの研究者が過去3年間のレンダリング品質を改善するための様々な方法を提案している。この研究は、研究者がこの分野における現在の技術状況と進化の文脈を素早く理解するのに役立ちます。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:37:42 GMT)
HalluciBot: Is There No Such Thing as a Bad Question? [0.3]
HalluciBotは、生成前の幻覚の確率を予測するモデルである。推論中には何世代も起動しない。幻覚的クエリのユーザ説明責任を計測するルーシックな手段を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 22:56:57 GMT)
The quantum gravity seeds for laws of nature [0.3]
我々は、空間と時間が基本でないかもしれない量子重力の枠組みの中で、標準法則(Hu)が直面する課題について議論する。量子エンタングルメント、量子遷移振幅、および量子因果履歴の役割を強調した。これらの特徴はまた、量子重力と量子情報理論の間の実りある重なり合いを強調している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:12:52 GMT)
Current Trends in Digital Twin Development, Maintenance, and Operation: An Interview Study [0.3]
デジタルツイン(DT)は、しばしば物理的実体と対応する仮想実体(VE)のペアリングとして定義される。デジタル双生児の生活段階と密接に関連している産学専門職19名を対象に半構造化面接を行った。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:00:32 GMT)
An introduction to infinite projected entangled-pair state methods for variational ground state simulations using automatic differentiation [0.3]
テンソルネットワークは量子物質の相の基底状態の大規模なクラスを忠実かつ効率的に捉えます近年、量子状態の変分最適化に関する複数の提案が進められている。本稿では,iPEPSフレームワークの現状を概観し,自動微分の詳細な解説を行う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:04:52 GMT)
PDE-CNNs: Axiomatic Derivations and Applications [0.2]
グループ畳み込みニューラルネットワーク(PDE-G-CNN)は、幾何学的に意味のある進化PDEの解法を、G-CNNの従来のコンポーネントの代用として利用する。我々は、PDE-CNNがより少ないパラメータを提供し、性能が向上し、CNNと比較してデータ効率が良くなる小さなネットワークを実験的に確認した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:40:58 GMT)
A New Reliable & Parsimonious Learning Strategy Comprising Two Layers of Gaussian Processes, to Address Inhomogeneous Empirical Correlation Structures [0.1]
利用可能なデータの相関構造における不均一性に対処しながら,変数のペア間の機能的関係を学習するための新しい戦略を提案する。探索関数を非定常ガウス過程(GP)の標本関数としてモデル化し、他の複数のGP内にネストする。私たちはこの新しい学習戦略を実際のデータセットで説明します。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:21:28 GMT)
Code conversion with the quantum Golay code for a universal transversal gate set [0.1]
The $[[7,1,3]$ Steane code and $[[23,1,7]$ quantum Golay code has been identified as good candidate for fault-tolerant quantum computing through code concatenation。この手順の重要な要素は、[49,1,5]$ triorthogonal code である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:06:29 GMT)
Approximation of group explainers with coalition structure using Monte Carlo sampling on the product space of coalitions and features [0.1]
我々は、与えられたMLモデルと予測ベクトルに基づく限界ゲームに対して、幅広い種類の線形ゲーム値と連立値に焦点を当てる。我々はモンテカルロサンプリングアルゴリズムを設計し、背景データセットのサイズに線形に依存する複雑さを減らし、それらを推定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:14:32 GMT)
Quasiparticle cooling algorithms for quantum many-body state preparation [0.1]
本研究では, 準粒子冷却力学を記述するための動力学理論フレームワークを開発し, 異なる冷却アルゴリズムの効率を比較する。この研究は、準粒子冷却アルゴリズムを、短期量子プロセッサ上での多体状態準備のための実用的で堅牢な方法として確立する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:31:30 GMT)
p-Adic Quantum Mechanics, the Dirac Equation, and the violation of Einstein causality [0.0]
本稿では、量子力学におけるプランク長におけるローレンツ対称性の破れについて研究する。位置変数として3次元の p-進ベクトルを用いるが、時間は実数のままである。プランク長の p-進は光速とは独立であり、空間の対称性の群によって決定される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:03:58 GMT)
floZ: Evidence estimation from posterior samples with normalizing flows [0.0]
本研究では,非正規化後部分布から抽出したサンプル群からベイズ証拠(およびその数値的不確実性)を推定する新しい手法を提案する。解析的に証拠が知られている分布、最大15のパラメータ空間次元で検証し、証拠を推定するための2つの最先端技術と比較する。例えば、変分推論、マルコフ連鎖モンテカルロサンプル、あるいは非正規化後密度からサンプルを届ける他の方法から証拠を推定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:16:02 GMT)
WebXR, A-Frame and Networked-Aframe as a Basis for an Open Metaverse: A Conceptual Architecture [0.0]
この研究は、AフレームとNetworked-Aframeフレームワークを活用する、WebXRベースのクロスプラットフォームの概念アーキテクチャを提案する。空間ウェブアプリの概念を導入することにより,メタバースについての議論に寄与する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:29:48 GMT)
ViLLM-Eval: A Comprehensive Evaluation Suite for Vietnamese Large Language Models [0.0]
ViLLM-Evalは、基礎モデルの高度な知識と推論能力を測定するために設計された総合的な評価スイートである。 ViLLM-Eval上での最も先進的なLCMの徹底的な評価により、最高の性能のモデルでさえ改善の余地があることが判明した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:41:23 GMT)
Urban highways are barriers to social ties [0.0]
都市ハイウェイは社会的つながりの低下と関連していることを示す。この障壁効果は特に短い距離で強く、ブラック地区を意図的に破壊したり孤立させたりするために建設された道路の歴史的事例と一致している。本研究では,エビデンスに基づく空間的不等式低減のための再検討計画について報告する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:56:40 GMT)
Transformer tricks: Removing weights for skipless transformers [0.0]
このマイクロペーパーは、MQAとGQAに適した数学的に等価なバージョンを提案する。例えば、ミストラル7BのスキップレスバージョンからQとPを取り除くと、重量の15%が取り除かれる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:45:19 GMT)
Towards an Approximation Theory of Observable Operator Models [0.0]
無限次元過程をモデル化するために可観測作用素モデル(OOMs)を用いることは、重要な理論的課題となる。将来の分布空間上の内積構造が厳密に確立され、可観測作用素の連続性が証明される。この論文で証明された元の定理は、将来の分布の無限次元空間をヒルベルト空間にするという根本的な障害を記述している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:45:47 GMT)
Toward a Quantum Information System Cybersecurity Taxonomy and Testbed: Exploiting a Unique Opportunity for Early Impact [0.0]
我々は、量子情報システムの最新の進歩を考慮に入れた、量子サイバーセキュリティの脆弱性に対する予備的な分類法を提案する。我々は、サイバーセキュリティと量子情報システムの専門家が共同でソフトウェアとハードウェアのセキュリティを実験的に評価できるようにするための、特定の目的のために設計、実装されたテストベッド環境を構想する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:56:21 GMT)
The inherent goodness of well educated intelligence [0.0]
本稿では,生物と人工シリコンのどちらがコンピュータ上に存在するのか,その知性について検討する。インテリジェンスの本質は、黄金の規則である「一つの集団的な行動」または「局所的な行動のグローバルな結果を知る」ことが分かる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:01:01 GMT)
The State of the Art in Enhancing Trust in Machine Learning Models with the Use of Visualizations [0.0]
機械学習(ML)モデルは、医学、バイオインフォマティクス、その他の科学など、様々な分野の複雑な応用で使われている。しかし、ブラックボックスの性質のため、それらが提供する結果を理解し、信頼することは難しいこともある。これにより、MLモデルの信頼性向上に関連する信頼性の高い視覚化ツールの需要が増加した。本稿では,インタラクティブな可視化によるMLモデルの信頼性向上について,STAR(State-of-the-Art Report)を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:00:21 GMT)
Temporal quantum eraser: Fusion gates with distinguishable photons [0.0]
2光子ゲートの理想的な操作は、識別可能な光子から回収できることを示す。一対の変調入射単光子源の間に時間量子消光器を導入する。同一光子の要求を解除する能力は、線形光学量子情報処理においてかなりの可能性を秘めている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:48:09 GMT)
Supervised Contrastive Vision Transformer for Breast Histopathological Image Classification [0.0]
浸潤性乳管癌(Invasive ductal carcinoma,IDC)は乳癌の最も多い形態である。 In this present a novel approach, Supervised Contrastive Vision Transformer (SupCon-ViT) to improve the classification of IDC。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:59:27 GMT)
Star exponentials from propagators and path integrals [0.0]
我々は、変形量子化形式に現れる恒星指数と、量子力学におけるプロパゲータに関連するファインマンの経路積分の関係に対処する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:17:44 GMT)
Social Links vs. Language Barriers: Decoding the Global Spread of Streaming Content [0.0]
我々は、Netflix、Spotify、YouTubeの3つの重要なストリーミングサービスの社会的側面を、各国のコンテンツの普及に重点を置いて検討する。 2年間のトレンドチャートデータセットを使用して、ストリーミングコンテンツは、ビデオ指向(Netflix)とオーディオ指向(Spotify)の2つのタイプに分けられる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:06:59 GMT)
Singular-limit analysis of gradient descent with noise injection [0.0]
雑音勾配降下系の小さなステップサイズの極限における極限ダイナミクスについて検討する。ノイズの構造が限界過程の形状だけでなく、進化が起こる時間スケールにも影響を及ぼすことを示す。結果はニューラルネットワークのトレーニングにインスパイアされているが、この定理は非自明なゼロロス集合を持つ損失のノイズ勾配勾配に適用される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:13:58 GMT)
Simple Information Processing Tasks with Unbounded Quantum Advantage [0.0]
古典的システムに対する量子システムの明確な非有界な優位性を検出することは可能であることを示す。古典的なシステムで可能な全ての量子通信タスクを実装するのに必要なすべての調整されたアクションを格納するために、有限記憶は使用できない。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:10:43 GMT)
Separating the wave and particle attributes of two entangled photons [0.0]
我々の常識では、量子オブジェクトの波動と粒子の性質は分離できない。本研究では、2つの絡み合った光子の波動特性と粒子特性を空間的に分離する実現可能な手法を提案する。我々のスキームはまた、2つの絡み合った光子の波動特性と粒子特性の観測がボーアの相補性原理に従うことを保証している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:45:48 GMT)
Self-Adjusting Evolutionary Algorithms Are Slow on Multimodal Landscapes [0.0]
正の結果が他の局所最適値に拡張されないことを示す。歪んだOneMaxベンチマークでは、自己調整の$(1, lambda)$-EAは、アルゴリズムがローカルオプティマからエスケープされるのを防ぐため、エリート的アルゴリズムと同じように遅くなる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:01:08 GMT)
Scalable spin squeezing from critical slowing down in short-range interacting systems [0.0]
本稿では,2次元U(1)対称系において,短距離相互作用でもスケーラブルなスクイージングが実現可能であることを示す。本研究は,量子シミュレーションと情報処理の多くの関連プラットフォームにおいて,潜在的な気象学的関心を持つ巨大な絡み合った状態を実現するための道を開くものである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:29:43 GMT)
SPIdepth: Strengthened Pose Information for Self-supervised Monocular Depth Estimation [0.0]
SPIdepthは、ポーズネットワークの強化を優先し、深度推定を改善する手法である。 SPIdepthはシーン理解と深度推定において顕著な進歩を達成している。本手法は, 自己教師型単分子深度推定において, 飛躍的な進歩を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:43:33 GMT)
Role of quantum correlations in daemonic expected utility [0.0]
本研究では, ある局所演算と古典的通信によって行われるデーモン的作業抽出における二部量子システムについて検討し, 量子相関の役割について検討する。具体的には、いわゆる絶対リスク回避によって、変動の影響を受けない非中立リスクエージェントが、平均的な作業にのみ影響を受ける中立リスクエージェントとは異なる量子相関をどう見るかを示し、説明する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:10:25 GMT)
Reductive Quantum Phase Estimation [0.0]
量子ビット数が少ない任意の位相の集合と、ユニタリな応用を区別する回路を示す。測定精度と位相差のトレードオフを示し、回路を特定の用途に最適に調整できるようにする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:24:21 GMT)
Redefining the Shortest Path Problem Formulation of the Linear Non-Gaussian Acyclic Model: Pairwise Likelihood Ratios, Prior Knowledge, and Path Enumeration [0.0]
本稿では,LiNGAM-SPPフレームワークの3倍拡張を提案する。パラメータチューニングの必要性は、kNNベースの相互情報の代わりに、ペアワイズ確率比を用いて排除される。先行知識の組み入れは、すべての因果順序のグラフ表現に実装されたノードスキッピング戦略によって実現される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:59:28 GMT)
Recoil heating of a dielectric particle illuminated by a linearly polarized plane wave within the Rayleigh regime [0.0]
電磁界のゆらぎから生じる粒子に作用するゆらぎ力を導出する。リコイル加熱は、浮遊光学の基本的な限界を課す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:35:18 GMT)
RAGAR, Your Falsehood RADAR: RAG-Augmented Reasoning for Political Fact-Checking using Multimodal Large Language Models [0.0]
マルチモーダルなファクトチェックの信頼性と効率を高めるための革新的なアプローチを導入する。これらのアプローチは、過去の証拠に基づいて答える必要がある次の質問を推論することで、マルチモーダルなクレームを扱うように設計されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:25:42 GMT)
Qubit dynamics driven by smooth pulses of finite duration [0.0]
パルス形状は時間内に直線的に始まり終了する。十分に定義された有限持続時間を持つ形状は、無限持続のパルスを切断する際に生じる刺激効果に悩まされない。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:51:52 GMT)
Quantum trajectory entanglement in various unravelings of Markovian dynamics [0.0]
量子多体力学の古典シミュレーションのコストは、しばしばシステム内の絡み合いの量によって決定される。オープン量子系力学を記述するマスター方程式を解く量子軌道法における絡み合いについて検討する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:19:26 GMT)
Quantum thermophoresis [0.0]
量子熱泳動は量子粒子の非局在化の増加とともにどのように振る舞うかを数値的に示す。量子状態において負の熱泳動とデュフォー効果がどのように現れるかについて議論する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:22:10 GMT)
Quantum revivals in HgTe/CdTe quantum wells and topological phase transitions [0.0]
我々は、解析をHgTe/CdTe量子井戸に拡張し、その電子電流波パケットの進化を研究する。この時間的進化に現れる2つの異なる周期性は、臨界厚さ付近で最小となることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:38:37 GMT)
Quantum Imaging Beyond the Standard-Quantum Limit and Phase Distillation [0.0]
非線形干渉計を用いた量子センシングは、バイカラーイメージングの可能性を秘めている。位相シフトアルゴリズムは、ノイズによって引き起こされる有害な効果に対してある程度頑健である。非線形干渉計の自発性および高利得性について検討した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 22:04:10 GMT)
Quantum Cheques [0.0]
量子チェークは公開鍵を使用して検証できるが、単一のユーザによってのみ検証できる。量子マネーとは異なり、QCは銀行が暗号を発行したときのみ量子通信を必要とする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:26:54 GMT)
PureForest: A Large-scale Aerial Lidar and Aerial Imagery Dataset for Tree Species Classification in Monospecific Forests [0.0]
木種分類用に設計された大規模でオープンなマルチモーダルデータセットであるPureForestデータセットを提案する。樹種分類のための現在の一般のLidarデータセットは、ほとんどの場合、数十ヘクタールの注釈付きヘクタールの小さな領域にしか達しないため、多様性が低い。対照的に、PureForestは18の樹種を13のセマンティッククラスに分類し、449の異なる単種林に339 km$2$で分布する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:23:10 GMT)
Pseudo-random generators using linear feedback shift registers with output extraction [0.0]
擬似ランダムビットストリームを生成するために線形フィードバックシフトレジスタによって供給される3つの抽出器について検討した。本報告の焦点は擬似ランダムビットストリームの品質とLFSRからの一次ストリームのビットの効率性である。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:03:09 GMT)
Protecting gauge symmetries in the the dynamics of SU(3) lattice gauge theories [0.0]
この研究は、SU(3)ゲージ理論の正確な力学を1+1$次元でシミュレートするための対称性保護プロトコルを2つ提示する。ここで提示される対称性保護スキームは、量子色力学の完全な理論をシミュレートするための重要なステップである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:05:22 GMT)
Protecting backaction-evading measurements from parametric instability [0.0]
総和と差分周波数から2つのポンプを変形させることにより,系の安定化とBAE性能の回復が可能であることを示す。また, 弱い信号検出実験で得られた加速度は, このデチューニング技術によってのみ達成可能であることを示した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:32:56 GMT)
Preserving Nature's Ledger: Blockchains in Biodiversity Conservation [0.0]
本稿では,生物多様性保護におけるブロックチェーン技術の統合について考察する。生態学的コンテキスト内でディジタルレジリエンスを構築する方法について、新たな視点を提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:13:35 GMT)
Predicting Traffic Congestion at Urban Intersections Using Data-Driven Modeling [0.0]
本研究は,米国の主要都市の交差点における混雑予測モデルの構築を目的とする。データセットには、座標、通り名、日時、トラフィックメトリクスを含む27の機能が含まれている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:44:32 GMT)
Physics-integrated generative modeling using attentive planar normalizing flow based variational autoencoder [0.0]
本研究の目的は,物理統合生成モデルにおける再構成の忠実さとノイズの改善である。モデルに注入されたノイズに対する生成モデルのロバスト性を改善するため,正規化フローベースVAEのエンコーダ部分の変更を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:38:14 GMT)
ParaFusion: A Large-Scale LLM-Driven English Paraphrase Dataset Infused with High-Quality Lexical and Syntactic Diversity [0.0]
既存のデータセットは構文と語彙の多様性に欠けており、結果として原文によく似たパラフレーズが生じる。本研究では,Large Language Models (LLM) を用いた大規模かつ高品質な英語パラフレーズデータセットであるParaFusionを紹介する。 ParaFusionは、高品質なデータで既存のデータセットを拡張し、語彙と構文の多様性を著しく向上し、セマンティックな類似性を維持している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:02:45 GMT)
OpenBezoar: Small, Cost-Effective and Open Models Trained on Mixes of Instruction Data [0.0]
本研究では,OpenLLaMA 3Bv2をベースモデルとして,OpenBezoarファミリを微調整するレシピについて述べる。我々はまず、Falcon-40Bモデルのオープンかつ非制限的命令微調整版を用いて、合成命令微調整データを生成する。次に、コスト効率のよいQLoRAに基づく教師あり微調整を各スキームで逐次行う。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:57:18 GMT)
NeuroLGP-SM: Scalable Surrogate-Assisted Neuroevolution for Deep Neural Networks [0.0]
進化的アルゴリズムは、人工深層ニューラルネットワーク(DNN)のアーキテクチャ構成とトレーニングにおいて重要な役割を果たす本研究では, DNNから出力される表現型距離ベクトルと, Kriging partial Least Squares (KPLS) を用いて探索する。提案手法はニューロLinear Genetic Programming surrogate model (NeuroLGP-SM) と名付けられ, 完全評価を必要とせず, DNNの適合性を効率的に正確に推定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 10:39:50 GMT)
Neural Methods for Amortised Parameter Inference [0.0]
統計的推論のためのシミュレーションベースの手法は、過去50年間に劇的に進化してきた。この分野では、ニューラルネットワークの表現能力を受け入れることで、新たな革命が起きている。結果として得られるツールは、高速なフィードフォワード操作を通じて推論を迅速に行うことができるという意味で、償却される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 19:57:06 GMT)
Multi-fidelity Gaussian process surrogate modeling for regression problems in physics [0.0]
多重忠実度法は、忠実度を増大させる階層内のモデルに連鎖させることによって解を提供する。提案手法は, 一般に, 単一忠実度法と比較して, 同じ計算コストで予測誤差が小さくなることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:52:12 GMT)
Metrology and multipartite entanglement in measurement-induced phase transition [0.0]
測定誘起相転移は、決定論的量子進化と繰り返し測定過程の競合から生じる。我々は、量子フィッシャー情報のスケーリング動作を通じて、位相間の多粒子交絡の遷移を実演する。この結果は、測定誘起相転移中の量子系の特徴に関する新たな知見を提供し、量子物理学の分野におけるさらなる研究の道筋を示すものである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:23:27 GMT)
Measurable Krylov Spaces and Eigenenergy Count in Quantum State Dynamics [0.0]
我々は、量子状態の時間発展のために新しいクリロフ空間を定義する。量子系がどのように表現的であるかを洞察する効果的な次元が導入された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:35:24 GMT)
Maximal Secret Reconstruction, Teleportation and Bell's Inequality [0.0]
純粋な3ビットシステムにおいて、秘密の共有可能な状態を特徴付ける。すべての秘密の共有可能な国家は、ベルの不平等を—コンストラクタとディーラーの両方で満たしている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:20:30 GMT)
Mapping back and forth between model predictive control and neural networks [0.0]
2次コストと線形制約を持つ線形系に対するモデル予測制御(MPC)は、暗黙のニューラルネットワークとして正確に表現されていることを示す。また、MPCの暗黙のニューラルネットワークを明示的なニューラルネットワークに"解き放つ"方法も導入されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 09:29:08 GMT)
Llama-VITS: Enhancing TTS Synthesis with Semantic Awareness [0.0]
本研究は,LLMを用いてテキストのセマンティックコンテンツを充実させることにより,TS合成を向上させる,革新的なアプローチであるLlama-VITSを紹介する。 Llama2を一次音声合成に利用することにより、Llama-VITSが元のVITSの自然性と一致することを示す。 EmoV_DB_bea_semデータセットでは,感情的に一貫した音声のキュレートされた選択により,感情のモチベーションが著しく向上する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 03:54:38 GMT)
Learning the Domain Specific Inverse NUFFT for Accelerated Spiral MRI using Diffusion Models [0.0]
我々は多コイル高アンサンプドスパイラルMRIのための生成拡散モデルに基づく再構成アルゴリズムを作成する。超高速スキャン時間(2D画像では0.02秒)で再構成した画像に高品質(構造的類似度 > 0.87)を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:40:23 GMT)
Large Language Models in Targeted Sentiment Analysis [0.0]
命令調整型大言語モデル(LLM)の感情分析能力について検討する。 RuSentNE-2023の感情分析の最良の結果は、微調整されたFlan-T5-xlによって達成された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:16:16 GMT)
Large Language Models for Synthetic Participatory Planning of Shared Automated Electric Mobility Systems [0.0]
本稿では,大規模言語モデル(LLM)を批判的に活用してデジタルアバターを作成する,新しい合成参加手法を提案する。これらの調整可能なエージェントは、目標を共同で識別し、SAEMS代替案を構想し、評価し、リスクと制約の下で実施をストラテジズする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:51:23 GMT)
Is artificial consciousness achievable? Lessons from the human brain [0.0]
進化の観点から,人工意識の発達に関する問題を分析する。我々は、人間の脳の進化と、その意識との関係を参照モデルとして捉えている。我々は,AIの認知処理における共通点と,人間の意識経験との違いを明確にすることを提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:59:44 GMT)
Intelligence Education made in Europe [0.0]
共同インテリジェンス教育がいかに成功するかを示す。我々は、すべての諜報機関と連邦機関が共に学術的に教育されているドイツの経験を描いている。これらの経験がヨーロッパレベル、すなわちICEにどのように移行されたかを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:25:46 GMT)
Instability of quadratic band degeneracies and the emergence of Dirac points [0.0]
V$ の典型的な小さな線形変形の下では、高対称性の $boldsymbolM$ 上の二次帯域縮退点がディラック点であることを示す。ウェーブパペットは、$boldsymbolD+$ または $boldsymbolD-$ のいずれかの近傍でスペクトル局在化され、対流項を持つディラック方程式の系によって支配される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:14:50 GMT)
Increasing Interference Detection in Quantum Cryptography using the Quantum Fourier Transform [0.0]
量子フーリエ変換(QFT)を利用した2つの量子暗号プロトコルを提案する。これらのプロトコルの最も重要な点は、このQFTの有効性を活用する新しいQKD手法である。さらに、既存の量子暗号化手法をQFTベースのアプローチで拡張して、盗聴検出を改善する方法について述べる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:04:03 GMT)
How Population Diversity Influences the Efficiency of Crossover [0.0]
我々は,$(mu+1)$ Genetic Algorithm on LeadingOnesをスピードアップするのに,多様性の量が必要であるという公式かつ一般的な基準を与える。自然に進化する多様性は、任意の$mu=O(sqrtn/log2 n)$に対して実質的なスピードアップを与えるに足らないことを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:41:27 GMT)
Global Counterfactual Directions [0.0]
拡散オートエンコーダの潜時空間は,大域的方向の形で与えられた分類器の推論過程を符号化することを示す。ブラックボックス方式で単一の画像のみを用いて2種類の方向を探索するプロキシベースの新しいアプローチを提案する。我々は,GCDとLatent Integrated Gradientsを自然に組み合わせることで,新たなブラックボックス属性法を実現できることを示した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:03:56 GMT)
Geometric quantum complexity of bosonic oscillator systems [0.0]
適当な作用素空間の幾何学的実現における最小測地線の長さは、演算の量子複雑性の測度を与える。複雑性に関する新たな洞察は、高次元への体系的な拡張や相互作用の可能性とともに、低次元の設定で見ることができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:59:22 GMT)
Generic free fermions with nearest neighbour interactions [0.0]
一般自由フェルミオンは1つの粒子スペクトルを持つ自由フェルミオンであり、$q$0共鳴条件を満たす。自由フェルミオンモデルでは、スペクトル形成係数のモーメントを解析することで、ポアソン統計が得られないことが示される。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:33:23 GMT)
Generalizing Machine Learning Evaluation through the Integration of Shannon Entropy and Rough Set Theory [0.0]
我々は、粗集合論の粒度とシャノンエントロピーの不確かさの定量化を相乗化する包括的枠組みを導入する。我々の手法は様々なデータセットで厳密にテストされており、予測性能を評価するだけでなく、基礎となるデータの複雑さとモデルロバスト性を照らす能力を示している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:22:42 GMT)
Full range spectral correlations and their spectral form factors in chaotic and integrable models [0.0]
系のスペクトルの固有エネルギー間の相関は、量子カオスの定義的な特徴である。線形ランプは短距離エネルギー相関だけでは形成できない。本研究は,カオス的行動と可積分的行動の相互補間を行う XXZ spin chain with disorder について述べる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:21:20 GMT)
Fortify the Guardian, Not the Treasure: Resilient Adversarial Detectors [0.0]
アダプティブアタックとは、攻撃者が防御を意識し、その戦略を適応させる攻撃である。提案手法は, クリーンな精度を損なうことなく, 敵の訓練を活用して攻撃を検知する能力を強化する。 CIFAR-10とSVHNデータセットの実験的評価により,提案アルゴリズムは,適応的敵攻撃を正確に識別する検出器の能力を大幅に向上することを示した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:13:09 GMT)
Faster Optimization Through Genetic Drift [0.0]
遺伝的アルゴリズム(cGA)は、大規模な子孫のソリューションを進化させるための低メモリの代替手段を提供する。我々は、OneMaxをより難しい丘登り問題であるDynamicBinValに置き換えると、両者がどう変化するかを研究する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:51:32 GMT)
Extended unitarity and absence of skin effect in periodically driven systems [0.0]
このような系の時間周期駆動は、SEをこの非対称性の有限強度まで排除することができる。 SEの欠如は非局在化相における拡張ユニタリティの出現と密接に関連していることがわかった。そこで本研究では,光ファンネリング機構のスイッチとして使用可能な,駆動システムの実験的実現の可能性を提案する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:22:45 GMT)
Expected Coordinate Improvement for High-Dimensional Bayesian Optimization [0.0]
本研究では,高次元ベイズ最適化のための予測座標改善(ECI)基準を提案する。提案手法では,各イテレーションにおいて最も高いECI値の座標を選択し,座標を反復することで座標を徐々にカバーする。数値実験により,提案アルゴリズムは5つの最先端高次元BOと比較して,標準的なBOアルゴリズムよりもはるかに優れた結果が得られることが示された。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:48:15 GMT)
Exact Solution of Bipartite Fluctuations in One-Dimensional Fermions [0.0]
交互状態から始まる一次元非相互作用フェルミオン力学における二部晶変動のばらつきについて検討する。その結果, 実験で観測された分散成長と, 適合パラメータを伴わずに定量的に一致していることが判明した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 07:11:32 GMT)
Enhancing Financial Inclusion and Regulatory Challenges: A Critical Analysis of Digital Banks and Alternative Lenders Through Digital Platforms, Machine Learning, and Large Language Models Integration [0.0]
本稿では,デジタル銀行と代替銀行が金融包摂性に与える影響とビジネスモデルがもたらす規制課題について考察する。デジタルプラットフォーム、機械学習(ML)、Large Language Models(LLM)の統合について論じる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:00:53 GMT)
Enhancing Embedding Performance through Large Language Model-based Text Enrichment and Rewriting [0.0]
本稿では,大規模な言語モデル(LLM)を活用して埋め込み処理前に入力テキストを豊かに書き直しすることで,埋め込み性能を向上させる新しい手法を提案する。このアプローチの有効性は、Banking77 Classification、TwitterSemEval 2015、Amazon Counter-factual Classificationの3つのデータセットで評価されている。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:58:56 GMT)
Enhancing Educational Efficiency: Generative AI Chatbots and DevOps in Education 4.0 [0.0]
本研究は,コンピュータサイエンス教育におけるイノベーティブな教育的アプローチをもたらすものである。人工知能(AI)とDevOpsから借用された方法論を組み合わせて、コンテンツ管理システム(CMS)開発における学習経験を強化する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:45:39 GMT)
Efficient Sentiment Analysis: A Resource-Aware Evaluation of Feature Extraction Techniques, Ensembling, and Deep Learning Models [0.0]
我々は,資源コストに着目した文書レベルの感情分析モデルを評価する。より小さなデータセットでは,資源消費の差が大きくなるにつれて精度の差が小さくなることがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:06:17 GMT)
Effective light-induced Hamiltonian for atoms with large nuclear spin [0.0]
外部共鳴光との結合は、核スピン状態の選択的かつコヒーレントに操作するための重要なツールである。このような非共鳴光による超低温フェルミオン原子の核スピン状態に対する有効ハミルトニアンの体系的導出を示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:00:01 GMT)
Dynamically enhancing qubit-photon interactions with anti-squeezing [0.0]
スクイージングの5.5dBにおいて、キュービットと発振器との分散相互作用の2倍の増大が観察された。この研究は、励起された光子の振動子を量子ビットに実験的に結合させ、その拡散を慎重に動機付ける。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:12:54 GMT)
Doped stabilizer states in many-body physics and where to find them [0.0]
この研究は、ドープ安定化状態と多体量子系における固有状態の構造の基本的な関係を明らかにする。我々は,低エネルギー固有状態の探索,クエンチダイナミクスのシミュレーション,およびこれらのシステムにおけるエンタングルメントエントロピーの計算といったタスクに対して,効率的な古典的アルゴリズムを開発する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 01:43:35 GMT)
Decoupled sound and amplitude modes in trapped dipolar supersolids [0.0]
遷移中の超流動モードから発生した第1の音、第2の音、ヒッグスモードがいかに分離されたかを示す。この結果は、調和トラップにおけるゴールドストーンとヒッグスモードの結合の概念を統一する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 17:59:41 GMT)
De-DSI: Decentralised Differentiable Search Index [0.0]
De-DSIは、情報検索のための真の分散化で大きな言語モデルを融合するフレームワークである。分散された環境での差別化検索インデックス(DSI)の概念を使用して、新しいユーザクエリとドキュメント識別子を効率的に接続する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:51:55 GMT)
Coupled states of cold 174-Yb atoms in a high-finesse cavity [0.0]
我々は,Yb原子の狭間結合線の強い集合結合から高精細光空洞の単一モードに生じる着衣状態の形成を実験的に理論的に検討した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:27:42 GMT)
Constraints on extra dimensions theories from gravitational quantum barrier experiments [0.0]
我々は、超低温中性子を含む量子バウンサー実験を、ブレーンワールドのシナリオで論じる。概して、超次元理論は、短距離での重力相互作用の強化を予測している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:20:30 GMT)
Complexity of Supersymmetric Systems and the Cohomology Problem [0.0]
我々は、$mathcal N=2 $ 超対称性を持つフェルミオンハミルトニアンの文脈における局所ハミルトニアン問題の複雑さを考える。これを研究する主な動機は、超対称系の基底状態エネルギーがちょうどゼロであることと、あるコホモロジー群が非自明であることである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:28:25 GMT)
Claim Check-Worthiness Detection: How Well do LLMs Grasp Annotation Guidelines? [0.0]
ファクトチェックを必要とするテキストセグメントを識別するために、ゼロショットと少数ショットのLCMプロンプトを使用する。各種領域の5つのCD/CWデータセットに対して,LLMの予測精度と校正精度を評価した。提案手法により, 最適急進的冗長性はドメイン依存であり, 文脈の追加は性能を向上しないことがわかった。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:31:05 GMT)
Can we accurately read or write quantum data? [0.0]
私は、全ハミルトニアンが下から有界であれば、正確な測定と準備は不可能であることを示す。この結果は、量子制御、量子コンピューティング、その他の量子技術の限界を再評価する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:55:50 GMT)
Can quantum theory be underpinned by a non-local hidden variable theory ? [0.0]
本稿では,2つの観測可能な部分系を持つ二部量子状態の一般ベル型非局所隠れ変数理論(NLHVT)による記述を考察する。 CGLMP (Collins-Gisin.-Liden-Massar-Popescu) 型のベル不等式を導出した。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 02:09:57 GMT)
CARE to Compare: A real-world dataset for anomaly detection in wind turbine data [0.0]
風力タービンの予測保守分野において,異常検出は重要な役割を担っている。さまざまなアプローチの比較では、さまざまなドメインのデータで構成されたベンチマーク、アクセス不可能なデータ、あるいは障害に関する詳細な情報を持たない数少ない公開データセットのいずれかが使用されている。本稿では、3つの異なる風力発電所にわたる36基の風力タービンのデータを含む高品質なデータセットを公表する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 05:56:21 GMT)
Beacon, a lightweight deep reinforcement learning benchmark library for flow control [0.0]
本研究では,7つの軽量な1次元フロー制御問題と2次元フロー制御問題からなるオープンソースのベンチマークライブラリであるBeaconを提案する。このコントリビューションでは、考慮すべき7つの問題を記述し、参照制御ソリューションを提供する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:58:27 GMT)
Back to Basics: Fast Denoising Iterative Algorithm [0.0]
ノイズ低減のための高速反復アルゴリズムであるBack to Basics (BTB)を紹介する。光コヒーレンス・トモグラフィー(OCT)における白色ガウス雑音の存在下での自然像,ポアソン分布画像デノイング,スペックル抑制の3症例について検討した。実験結果から,提案手法は画像品質を効果的に向上しうることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:39:15 GMT)
Area laws from classical entropies [0.0]
局所量子エントロピーの領域法則的なスケーリングは、量子場、多体系、時空に固有の絡み合いの中心的特徴である。不確実性原理によって導かれる真空寄与が減じられた場合、測定分布に対する古典的エントロピーに等しく現れることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:52:56 GMT)
Area laws for classical entropies in a spin-1 Bose-Einstein condensate [0.0]
古典エントロピーを好適に選択した古典的エントロピーとその古典的相互情報は、量子場理論で知られている量子エントロピーの典型的特徴を含む様々な解析的および数値的な証拠を提供する。我々は、k-アネレスト近傍推定器を用いて、基礎となる量子状態について追加の仮定をせずに、有限個のサンプルからエントロピー量を推定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:53:17 GMT)
Area laws and thermalization from classical entropies in a Bose-Einstein condensate [0.0]
局所量子エントロピーは、基礎となる量子状態の非線形機能である。好適に選択された古典的エントロピーがそれらの量子アナログと全く同じ特徴を捉えていることを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 16:53:03 GMT)
Apparent violation of causality in relativistic quantum mechanics [0.0]
相対論的理論では、微視的因果関係の原理は、情報は光速よりも速く移動できない」。ここでは、質量を持たない粒子と質量粒子の波動関数を考える。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 11:04:57 GMT)
Anharmonic Effects on the Squeezing of Axion Perturbations [0.0]
本研究では, 地平線出口から放射支配エポックまで, 軸索の変動モードの進化について検討した。非調和効果を考慮に入れれば、量子力学的粒子の生成と摂動のスクイーズ化が促進されることが分かる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 21:45:31 GMT)
Analytic thermodynamic properties of the Lieb-Liniger gas [0.0]
本稿では, 1次元ボース気体のリーブ・ライニガー模型の有限温度熱力学量を記述する, 近似解析手法の現状について概説する。この量子多体理論のパラダイムモデルは、物理学の多くの分野において重要な役割を果たす。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 23:12:21 GMT)
An Adaptive Metaheuristic Framework for Changing Environments [0.0]
本稿では動的環境向けに設計された適応メタヒューリスティックフレームワーク(AMF)を紹介する。 AMFは、問題の動的表現、リアルタイムセンシングシステム、適応技術を組み合わせて、継続的に変化する最適化環境をナビゲートする。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:47:53 GMT)
All-in-one Quantum Diamond Microscope for Sensor Characterization [0.0]
ダイヤモンド中の窒素空孔中心は、環境条件下での磁気センシングとイメージングにおいて主要なモダリティである。これらのセンサは、常磁性不純物やダイヤモンド結晶格子内の応力領域による劣化性能に悩まされる。この研究は、ミリスケールのNVダイアモンドセンサーチップのキー特性の同時マッピングと空間相関のための量子ダイヤモンド顕微鏡を実証する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:17:35 GMT)
Algebras of Interaction and Cooperation [0.0]
協調と相互作用の系は代数の乗法構造を持つベクトル空間で表される。自然数の基本的な解釈は自然代数学をもたらし、協調と相互作用に関する統一的な見解を与える。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 08:01:43 GMT)
Advancing Applications of Satellite Photogrammetry: Novel Approaches for Built-up Area Modeling and Natural Environment Monitoring using Stereo/Multi-view Satellite Image-derived 3D Data [0.0]
この論文は、ステレオおよびマルチビュー衛星画像から得られた3次元地理空間データに基づく、いくつかの新しいアプローチを探求する。衛星由来の3Dデータによる空間的・時間的課題に対処する新しいアプローチの4つの部分を紹介する。概して、この論文は、都市や環境問題に対処する衛星フォトグラムの応用の可能性を示している。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 20:02:52 GMT)
Actions francophones autour des normes e-learning à l'ISO [0.0]
e-Learningの将来は、ICT標準化国際インスタンス内で構築される予定だ。教育技術の標準化に責任を負うISOのサブミッション36は、間違いなく最も目立ったものである。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 12:29:30 GMT)
Abnormal solutions of Bethe--Salpeter equation with massless and massive exchanges [0.0]
We present the main properties of the so called ''abnormal solutions' of the Wick-Cutkosky model。これらの解は、非常に小さな結合エネルギーを持つにもかかわらず、非相対論的極限には存在しない。我々は、タキオン状態によってモデルを損なうことなく、そのような特異な解を得ることができる条件を決定する。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 13:41:14 GMT)
A relation between Krylov and Nielsen complexity [0.0]
クリロフ複雑性とニールセン複雑性は量子進化複雑性の定量化に成功している。 2つの量の間に関係があることが示される。すなわち、状態進化のクリロフ複雑性の時間平均は、ある行列のトレースとして表すことができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:34:05 GMT)
A new dataset for measuring the performance of blood vessel segmentation methods under distribution shifts [0.0]
VessMAPは、より大きな非注釈データセットから関連画像を慎重にサンプリングして取得した異種血管セグメンテーションデータセットである。ベースデータセットから原型と非典型の両方を選択する手法を開発した。新しいデータセットの可能性を示すために、ニューラルネットワークの検証性能は、ネットワークのトレーニングに使用する分割によって大きく変化することを示す。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 15:50:37 GMT)
A multi particle toy system with analytic solutions to investigate composite bosons in a harmonic potential [0.0]
2種類のフェルミオンが複合ボソンを形成する3次元玩具システムを構築した。基底関数は内部および外部ガウス関数から構成される。内部ガウス関数では、複合ボソンはフェルミオン的非有界な振る舞いからボゾン的有界な振る舞いへと調整することができる。
論文参考訳（メタデータ） (Thu, 18 Apr 2024 18:39:04 GMT)
A Large-Scale Exploration of $μ$-Transfer [0.0]
この$mu$-ization(mu$P)は、大規模なニューラルネットワークモデルを構築する際の課題に対する潜在的な解決策を提供する。明らかな約束にもかかわらず、$mu$Pのスケーリングルールはまだ広く採用されていない。この研究は、$mu$Pを実証的に調査し、単純な質問に答えることを目的としている:$mu$-Transferは、実際に最適な学習率を得られるか?
論文参考訳（メタデータ） (Thu, 18 Apr 2024 14:56:50 GMT)