Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.6] 眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:32:06 GMT)
Beyond Chain-of-Thought, Effective Graph-of-Thought Reasoning in Language Models [74.4] 本稿では,人間の思考過程をチェーンとしてだけでなく,グラフとしてモデル化するグラフ・オブ・ソート(GoT)推論を提案する。
GoTは人間の思考の連続しない性質を捉え、思考プロセスのより現実的なモデリングを可能にします。
テキストのみの推論タスクとマルチモーダル推論タスクでGoTの性能を評価する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:06:54 GMT)
A Closer Look at the Self-Verification Abilities of Large Language Models in Logical Reasoning [73.8] 論理的推論の文脈において,大規模言語モデル(LLM)の自己検証能力について詳しく検討する。
本研究の主目的は,既存のLCMが誤った推論手順を正確に識別するのに苦労し,自己検証法の有効性を保証できないことにある。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:54:44 GMT)
Supporting Vision-Language Model Inference with Confounder-pruning Knowledge Prompt [71.8] 視覚言語モデルは、オープンセットの視覚概念を扱うために、画像とテキストのペアを共通の空間に整列させることで事前訓練される。
事前訓練されたモデルの転送可能性を高めるため、最近の研究では、固定または学習可能なプロンプトが採用されている。
しかし、どのようにして、どのプロンプトが推論性能を改善するのかは、まだ不明である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:14:19 GMT)
EvalCrafter: Benchmarking and Evaluating Large Video Generation Models [70.2] これらのモデルはしばしば、マルチアスペクト能力を持つ非常に大きなデータセットで訓練されているので、単純な指標から大きな条件生成モデルを判断することは困難である、と我々は主張する。
我々のアプローチは、テキスト・ツー・ビデオ生成のための700のプロンプトの多種多様な包括的リストを作成することである。
そこで我々は、視覚的品質、コンテンツ品質、動作品質、テキスト・ビデオアライメントの観点から、慎重に設計されたベンチマークに基づいて、最先端のビデオ生成モデルを評価する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:58:50 GMT)
SurgicalPart-SAM: Part-to-Whole Collaborative Prompting for Surgical Instrument Segmentation [66.2] Segment Anything Model (SAM)は、ジェネリックオブジェクトセグメンテーションの約束を示し、様々なアプリケーションに可能性を提供します。
既存の方法では、SAMベースのフレームワークを手術データにチューニングすることで、手術器具セグメンテーション(SIS)にSAMを適用している。
本稿では,楽器構造知識をSAMの汎用知識と明確に統合する新しいSAM効率的なチューニング手法であるStuial Part-SAMを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:13:35 GMT)
PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.3] 複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:18:49 GMT)
Tactile Estimation of Extrinsic Contact Patch for Stable Placement [64.1] 本稿では,複雑な物体を積み重ねることを学ぶロボットのためのフィードバックスキルの設計について述べる。
つかんだ物体とその環境間の接触パッチを,力と触覚の観測により推定する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:15:02 GMT)
MuSR: Testing the Limits of Chain-of-thought with Multistep Soft Reasoning [63.8] 自然言語ナラティブで指定されたソフト推論タスクの言語モデルを評価するデータセットである MuSR を紹介する。
このデータセットには2つの重要な特徴がある。まず、ニューロシンボリック合成-自然生成アルゴリズムによって生成される。
第二に、私たちのデータセットインスタンスは、実世界の推論の領域に対応する無料のテキスト物語です。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 21:21:44 GMT)
Once for Both: Single Stage of Importance and Sparsity Search for Vision Transformer Compression [63.2] 重要度評価と疎度評価を1段階にまとめる方法について検討する。
重要度と疎度の両方を同時に評価するコスト効率の高いOFBを提案する。
実験により、OFBは最先端のサーチベースおよびプルーニングベース手法よりも優れた圧縮性能が得られることが示された。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:22:36 GMT)
Finding needles in a haystack: A Black-Box Approach to Invisible Watermark Detection [62.4] WaterMark Detection (WMD) は、ブラックボックスとアノテーションなしの設定下で最初に目に見えない透かし検出法である。
我々はオフセット学習の基礎を用いてWMDを開発し、クリーンな非透かしデータセットにより、透かしサンプルのみの影響を分離することができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:22:54 GMT)
LLM Paternity Test: Generated Text Detection with LLM Genetic Inheritance [58.6] 大きな言語モデル(LLM)は、様々な誤用のリスクを負うテキストを生成することができる。
モデル関連テキスト検出手法 LLM Paternity Test (LLM-Pat) を提案する。
高い類似性は、候補テキストが遺伝的特性に似た機械生成であることを示している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:34:49 GMT)
Contact-aware Human Motion Generation from Textual Descriptions [57.9] 我々は、接触認識テキストを表すRICH-CATという新しいデータセットを作成する。
そこで本研究では,テキストによる対話型人間の動作合成のためのCATMOという新しい手法を提案する。
本実験は,既存のテキスト・トゥ・モーション法と比較して,提案手法の優れた性能を示すものである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:08:39 GMT)
Visual Programming for Zero-shot Open-Vocabulary 3D Visual Grounding [57.6] 3D Visual Groundingはテキスト記述に基づく3Dオブジェクトのローカライズを目的としている。
ゼロショットオープン語彙3DVGのための新しいビジュアルプログラミング手法を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:21:14 GMT)
BEND: Bagging Deep Learning Training Based on Efficient Neural Network Diffusion [56.9] BEND(Efficient Neural Network Diffusion)に基づくバッグング深層学習学習アルゴリズムを提案する。
我々のアプローチは単純だが効果的であり、まず複数のトレーニングされたモデルの重みとバイアスを入力として、オートエンコーダと潜伏拡散モデルを訓練する。
提案したBENDアルゴリズムは,元のトレーニングモデルと拡散モデルの両方の平均および中央値の精度を一貫して向上させることができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:40:38 GMT)
The Frontier of Data Erasure: Machine Unlearning for Large Language Models [56.3] 大規模言語モデル(LLM)はAIの進歩の基礎となっている。
LLMは機密情報、偏見情報、著作権情報を記憶し、広めることによってリスクを生じさせる。
機械学習は、これらの懸念を軽減するための最先端のソリューションとして現れます。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:26:15 GMT)
Ghost Sentence: A Tool for Everyday Users to Copyright Data from Large Language Models [55.3] Webユーザデータは、事前訓練された大規模言語モデル(LLM)のエコシステムにおいて中心的な役割を果たす
そこで本研究では,利用者が繰り返し文書に個人パスフレーズを挿入することを提案する。
LLMの生成されたコンテンツに識別されると、ユーザは自分のデータがトレーニングに使われていることを確認できます。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:36:32 GMT)
SceneX:Procedural Controllable Large-scale Scene Generation via Large-language Models [54.0] 本稿では,デザイナーのテキスト記述に従って高品質なプロシージャモデルを自動生成する大規模シーン生成フレームワークであるSceneXを紹介する。
私たちのSceneXは、微妙な幾何学的レイアウトと構造を持つ2.5km×2.5kmの都市を生成でき、プロのPCGエンジニアの数週間の時間を大幅に短縮して、普通のユーザにとっては数時間に過ぎません。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:23:29 GMT)
Benchmarking LLM-based Machine Translation on Cultural Awareness [53.8] 文化的内容の翻訳は、効果的な異文化間コミュニケーションに不可欠である。
インコンテキスト学習の最近の進歩は、機械翻訳タスクにおける大規模言語モデル(LLM)のガイドに軽量なプロンプトを利用する。
我々は、文化的に関連する並列コーパスを構築するために、新しいデータキュレーションパイプラインを導入する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:20:02 GMT)
Spiking-LEAF: A Learnable Auditory front-end for Spiking Neural Networks [53.3] Spiking-LEAFは、SNNベースの音声処理用に慎重に設計された学習可能な聴覚フロントエンドである。
キーワードスポッティングと話者識別タスクにおいて、提案したSpking-LEAFは、聴覚フロントエンドのSOTAよりも優れている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:41:23 GMT)
Dissociating language and thought in large language models [52.4] 大規模言語モデル(LLM)は、人間の言語を習得する上で、今までに最も近いモデルである。
我々は、この区別を人間の神経科学に根ざし、形式的、機能的な能力は異なる神経機構に依存していることを示した。
LLMは形式的能力は驚くほど優れているが、機能的能力のタスクにおける性能はいまだに不明瞭である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 19:52:33 GMT)
Exploring 3D Human Pose Estimation and Forecasting from the Robot's Perspective: The HARPER Dataset [52.2] 本研究では,ユーザとスポット間のダイアドインタラクションにおける3次元ポーズ推定と予測のための新しいデータセットであるHARPERを紹介する。
キーノーベルティは、ロボットの視点、すなわちロボットのセンサーが捉えたデータに焦点を当てることである。
HARPERの基盤となるシナリオには15のアクションが含まれており、そのうち10つはロボットとユーザの間の物理的接触を含んでいる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:26:38 GMT)
DPoser: Diffusion Model as Robust 3D Human Pose Prior [51.8] 拡散モデルに基づいて構築された,頑丈で多目的な人間のポーズであるDPoserを紹介する。
DPoserは、様々なポーズ中心タスクを逆問題とみなし、効率的な解法として変分拡散サンプリングを用いる。
提案手法は、画像領域で使用される一般的な均一スケジューリングよりも大幅に改善され、それぞれ5.4%、17.2%、および3.8%の改善が達成された。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:54:21 GMT)
GaussianAvatar: Towards Realistic Human Avatar Modeling from a Single Video via Animatable 3D Gaussians [51.5] 一つのビデオから動的に3D映像を映し出すリアルな人間のアバターを作成するための効率的なアプローチを提案する。
GustafAvatarは、公開データセットと収集データセットの両方で検証されています。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:24:39 GMT)
When LLM-based Code Generation Meets the Software Development Process [50.8] 本稿では,ソフトウェア工学の確立した実践に触発されたコード生成フレームワークであるLCGを紹介する。
LLMエージェントは、LCGWaterfall、LCGTDD、LCGScrumといった様々なソフトウェアプロセスモデルをエミュレートする。
我々は,HumanEval,HumanEval-ET,MBPP,MBPP-ETの4つのコード生成ベンチマークでLCGを評価した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:04:48 GMT)
Holographic Global Convolutional Networks for Long-Range Prediction Tasks in Malware Detection [50.7] ホログラフィック還元表現(HRR)の特性を利用したホログラフィックグローバル畳み込みネットワーク(HGConv)を導入する。
他のグローバルな畳み込み法とは異なり、我々の手法は複雑なカーネル計算や人工カーネル設計を必要としない。
提案手法は,Microsoft Malware Classification Challenge, Drebin, EMBERのマルウェアベンチマークで新たなSOTA結果を得た。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:49:13 GMT)
Tandem Transformers for Inference Efficient LLMs [49.8] これらの問題に対処するために,新しいアーキテクチャであるタンデム変換器を導入する。
このアーキテクチャは、小さな自己回帰モデルとブロックモードで動作する大きなモデルを組み合わせたものである。
PaLM2プレトレーニングデータセットでは、PaLM2-BisonとPaLM2-Geckoのタンデムが次点予測精度を3.3%改善している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:29:17 GMT)
Ensuring Safe and High-Quality Outputs: A Guideline Library Approach for Language Models [48.9] 大きな言語モデル(LLM)は印象的な能力を示すだけでなく、バイアスのあるコンテンツ生成やプライバシの問題といったリスクも提示する。
現在のアライメント手法の1つは原則駆動の統合であるが、手作業によるルールの不正確さに起因する課題に直面している。
これらの課題に対処するための2段階のアプローチである Guide-Align を紹介します。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:26:41 GMT)
Rethinking the Evaluation Protocol of Domain Generalization [48.0] ドメインの一般化は、複数のトレーニングドメインから学んだ共通知識を活用して、見当たらないテストドメインに一般化することで、アウト・オブ・ディストリビューションの一般化の課題を解決することを目的としている。
本稿では,現在の評価プロトコルの2つの側面から,テストデータ情報漏洩のリスクについて検討する。
我々は,現在管理されている事前訓練を使わずに,自己指導型事前訓練やスクラッチから訓練を行うよう,現在のプロトコルの変更を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:14:23 GMT)
A Fairness-Oriented Reinforcement Learning Approach for the Operation and Control of Shared Micromobility Services [46.1] 本稿では,共有マイクロモビリティサービスの運用と制御における性能最適化とアルゴリズムフェアネスのバランスに関する先駆的な研究を紹介する。
提案手法は, Gini 指数によって測定された等値な結果が, 異なる駅カテゴリーで達成できることを特徴としている。
本稿では,共有マイクロモビリティサービスのための整形制御戦略における公平性の検討の重要性を強調した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:32:23 GMT)
Multi-agent transformer-accelerated RL for satisfaction of STL specifications [45.5] 時間依存型マルチエージェント変換器を提案し,時間依存型マルチエージェント問題を効率的に解く。
我々は統計学のツールを用いて、ポリシーの下で生成された軌道がタスクを満足する確率を検証する。
両事例において,本手法は文献ベースラインアルゴリズムよりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 19:13:01 GMT)
Modeling Unified Semantic Discourse Structure for High-quality Headline Generation [45.2] 文書意味論を表現するために,統一意味談話構造(S3)を提案する。
文、節、単語の階層的な構成は、本質的に全体文書の意味を特徴づける。
私たちの仕事は、見出しや要約生成以上の、幅広いドキュメントモデリングタスクに対してインストラクティブなものです。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:18:53 GMT)
Optimal Control of Spin Qudits Subject to Decoherence Using Amplitude-and-Frequency-Constrained Pulses [45.0] 信号の最大振幅と周波数を拘束できる定式化を導入する。
得られるパルスは、シュル・オーディンガーの方程式で達成されたパルスと比較して、連続的に操作忠実度を向上する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:10:38 GMT)
Extracting Lexical Features from Dialects via Interpretable Dialect Classifiers [43.8] 本稿では,解釈可能な方言を用いて,方言の語彙的特徴を識別する新しい手法を提案する。
本手法は,方言の変種に寄与する重要な言語固有の語彙の特徴を同定し,その同定に有効であることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 20:21:04 GMT)
PILOT: Legal Case Outcome Prediction with Case Law [43.7] 判例法を用いて判例結果の予測を行う際の2つのユニークな課題を同定する。
第一に、意思決定において裁判官の基本的な証拠となる関連する前例を特定することが重要である。
第二に、初期の事例は異なる法的文脈に従う可能性があるため、時間とともに法原則の進化を考慮する必要がある。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 21:13:35 GMT)
Negotiating the Shared Agency between Humans & AI in the Recommender System [42.6] ユーザエージェンシーに関する懸念は、固有の不透明性(情報非対称性)とアルゴリズムにおける一方的な出力(パワー非対称性)の性質から生じている。
我々は,エージェントの種類がユーザの知覚や経験にどのように影響するかを理解し,人間とAIの対話システムのためのガイドラインや設計を洗練するための実証的な証拠を提供する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 19:23:08 GMT)
A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.6] 実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。
我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:46:58 GMT)
Role of Locality and Weight Sharing in Image-Based Tasks: A Sample Complexity Separation between CNNs, LCNs, and FCNs [42.6] 視覚タスクは局所性と翻訳不変性の特性によって特徴づけられる。
これらのタスクにおける畳み込みニューラルネットワーク(CNN)の優れた性能は、そのアーキテクチャに埋め込まれた局所性や重み付けの帰納的バイアスに起因する。
CNNにおけるこれらのバイアスの統計的利点を、局所連結ニューラルネットワーク(LCN)と完全連結ニューラルネットワーク(FCN)で定量化しようとする試みは、以下のカテゴリに分類される。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:57:28 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [41.5] 本稿では,知識グラフにおけるマルチホップリンク予測を強化するために,知識グラフ大言語モデルフレームワーク(KG-LLM)を提案する。
知識グラフをチェーン・オブ・シークレットのプロンプトに変換することで、我々のフレームワークは、エンティティの潜在表現とその相互関係を識別し、学習するように設計されている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 19:09:27 GMT)
Large Language Models for Generative Recommendation: A Survey and Visionary Discussions [41.0] 大規模言語モデル(LLM)は、他の多くの分野、例えばレコメンダシステム(RS)を再構築する可能性がある。
本調査は, LLMに基づく生成レコメンデーションの進展, 方法, 今後の方向性を概観する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 17:05:42 GMT)
Local Features: Enhancing Variability Modeling in Software Product Lines [39.6] 製品構成中にシステムの特定の部分に選択的に適用するローカル機能を導入する。
ケーススタディは、局所的な特徴の概念が複雑なシステムの変数を定義するのにどう役立つかを示します。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 12:17:54 GMT)
KGQuiz: Evaluating the Generalization of Encoded Knowledge in Large Language Models [39.6] KGQuizは、大規模言語モデルの知識一般化能力を調べるための知識集約型ベンチマークである。
我々は,KGQuizベンチマークを用いて,5つの知識集約タスクと知識領域の10個のオープンソースおよびブラックボックスLCMを評価した。
我々は、KGQuizをテストベッドとして想定し、ドメインやタスクフォーマット間のパフォーマンスの微妙な変化を分析する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:45:55 GMT)
Using Human Feedback to Fine-tune Diffusion Models without Any Reward Model [38.3] 細管拡散モデルに対するD3PO(Denoising Diffusion Policy Optimization)法について述べる。
D3POは報酬モデルのトレーニングを省略するが、人間のフィードバックデータを用いてトレーニングされた最適報酬モデルとして効果的に機能する。
実験では,目的の相対尺度を人間の嗜好のプロキシとして使用し,地道報酬を用いた手法に匹敵する結果を与える。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:23:00 GMT)
Multilingual Coreference Resolution in Low-resource South Asian Languages [36.3] 韓国語31言語に翻訳データセット(TransMuCoRes)を導入する。
予測された翻訳のほぼ全てが正当性検査に合格し、英語の参照の75%は予測された翻訳と一致している。
本研究は,ヒンディー語黄金集合上でのエンド・ツー・エンドのコア参照分解モデルを評価する最初のものである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:22:58 GMT)
SEED: Customize Large Language Models with Sample-Efficient Adaptation for Code Generation [35.9] コード生成のための誤り駆動学習を用いたサンプル効率適応のためのSEEDという新しい適応手法を提案する。
複数のコード生成ベンチマークでPass@1の平均相対改善率は54.7%である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:51:11 GMT)
BaRDa: A Belief and Reasoning Dataset that Separates Factual Accuracy and Reasoning Ability [35.7] BaRDaデータセットには3000のエンターメントが含まれている(1787年有効、1213年無効)
実際の精度(真実)は74.1/80.6/82.6/87.1で、推論精度は63.1/78.0/71.8/79.2である。
このことは、事実の正確さと細部推論を改善するためのモデルの明確な進歩を示している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 21:43:04 GMT)
MixRED: A Mix-lingual Relation Extraction Dataset [35.6] 我々はMixREと呼ばれる混合言語シナリオにおける関係抽出を考慮した新しいタスクを提案する。
MixREDデータセットの構築に加えて,MixRED上での最先端教師付きモデルと大規模言語モデル(LLM)の評価を行った。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:18:14 GMT)
Boosting Few-Shot Learning via Attentive Feature Regularization [35.4] 多様体正規化に基づくFSL(Few-shot Learning)は,限られたトレーニングサンプルを用いた新規物体の認識能力の向上を目的としている。
本稿では,特徴適応性と識別性の向上を目的とした特徴正規化(AFR)を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:36:48 GMT)
Adaptive Super Resolution For One-Shot Talking-Head Generation [34.3] トーキングヘッド生成は、同一または異なるアイデンティティビデオの駆動下で、1つのソースポートレート画像でトーキングヘッドビデオを合成することを学ぶ。
いくつかの手法は、追加の超解像モジュールを導入して、合成ビデオの品質を改善しようとする。
追加の事前学習モジュールを使わずに高精細映像を合成する適応型高品質トーキングヘッドビデオ生成法を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:14:38 GMT)
3D-TransUNet for Brain Metastases Segmentation in the BraTS2023 Challenge [33.8] 我々は,脳腫瘍(BraTS-METS)2023チャレンジにおける3D-TransUNetモデルのトレーニングによって脳転移のセグメンテーションに対処する。
Decoderのみの3D-TransUNetモデルの使用はすでに顕著な結果をもたらしており、平均的な病変度Diceスコアは59.8%である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:03:12 GMT)
InstaFlow: One Step is Enough for High-Quality Diffusion-Based Text-to-Image Generation [33.7] 安定拡散(SD)を超高速1ステップモデルに変換するための新しいテキスト条件付きパイプラインを提案する。
我々は、SDレベルの画質を持つ最初の1ステップ拡散ベースのテキスト・ツー・イメージ・ジェネレータを作成し、MS COCO 2017-5kで23.3ドルのFIDを達成した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:22:39 GMT)
Understanding Emergent Abilities of Language Models from the Loss Perspective [32.8] モデルサイズやトレーニング計算の代わりに,事前学習損失のレンズの創発能力について検討した。
学習前損失が特定の閾値以下になると,あるタスクに対して,モデルが創発的能力を示すことが判明した。
これにより、事前学習の損失が低いモデルで現れるような、創発的能力を再定義するインスピレーションがもたらされる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:03:31 GMT)
Explore until Confident: Efficient Exploration for Embodied Question Answering [32.3] 我々は、大きな視覚言語モデルの強力な意味推論機能を活用して、質問を効率的に探索し、答える。
深度情報とVLMの視覚的プロンプトに基づいて,まずシーンのセマンティックマップを構築する手法を提案する。
次に、コンフォメーション予測を用いて、自信に答えるVLMの質問を校正し、いつ探索を中止するかをロボットが知ることができるようにする。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:04:03 GMT)
AOCIL: Exemplar-free Analytic Online Class Incremental Learning with Low Time and Resource Consumption [28.8] Online Class Incremental Learning (OCIL) はタスクバイタスクでモデルをトレーニングすることを目的としている。
これを解決するために、リプレイベースの手法は競合する結果を示すが、データプライバシに侵入する。
分析オンライン・インクリメンタル・ラーニング (AOCIL) を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:39:13 GMT)
Subtractive Mixture Models via Squaring: Representation and Learning [27.7] 提案手法は, 深層抽出混合物の学習と推論を行う方法である。
理論的には、減算を許容する正方形回路のクラスは、従来の添加剤の混合よりも指数関数的に表現可能であることを証明している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:41:47 GMT)
TablePuppet: A Generic Framework for Relational Federated Learning [27.3] 現在のフェデレーションラーニング(FL)は、分散トレーニングデータを単一のテーブルとして捉え、(行によって)水平または(列によって)垂直に分割する。
このシナリオでは、トレーニングデータを取得するために、結合やユニオンのような複雑な操作が必要です。
我々は,学習プロセスを2段階に分解するRFLの汎用フレームワークであるTablePuppetを提案し,(1)結合(LoJ)の学習,(2)結合(LoU)の学習の2段階を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:28:37 GMT)
Computational Sentence-level Metrics Predicting Human Sentence Comprehension [27.2] 本研究では,多言語大言語モデルを用いた文レベルメトリクスの計算手法を提案する。
文素因性および文関連性を測定し,言語全体にわたって人間が文章をどう理解するかを予測できるかどうかを検証した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 12:19:49 GMT)
Structure-Aware Sparse-View X-ray 3D Reconstruction [26.9] スパースビューX線3次元再構成のための構造対応X線ニューラルラジオ密度場(SAX-NeRF)を提案する。
Linefomerは、X線の各線分内の依存関係をモデル化することで、3D空間内のオブジェクトの内部構造をキャプチャする。
X3Dの実験では、SAX-NeRFは、新しいビュー合成とCT再構成において、従来のNeRF法を12.56と2.49dBで上回っている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 17:36:19 GMT)
A Survey for Federated Learning Evaluations: Goals and Measures [26.1] フェデレートラーニング(Federated Learning, FL)は、プライバシ保護機械学習のための新しいパラダイムである。
FLの評価は、その学際的な性質と、実用性、効率性、セキュリティといった様々な目標のために難しい。
我々はFLアルゴリズムの標準化された総合的な評価フレームワークを提供するオープンソースプラットフォームであるFedEvalを紹介した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:45:03 GMT)
Improving Low-Resource Knowledge Tracing Tasks by Supervised Pre-training and Importance Mechanism Fine-tuning [25.6] 上記の課題に対処するため,低リソースのKTフレームワークであるLoReKTを提案する。
一般的な"事前学習と微調整"パラダイムにインスパイアされた我々は、リッチリソースのKTデータセットから転送可能なパラメータと表現を学習することを目指している。
複数のKTデータソースからの学生のインタラクションを組み込むエンコーディング機構を設計する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:14:28 GMT)
Feature Completion Transformer for Occluded Person Re-identification [25.2] 咬合者の再同定(Re-ID)は,咬合者の破壊による課題である。
特徴空間に隠された部分の意味情報を暗黙的に補完する特徴補完変換器(FCFormer)を提案する。
FCFormerは優れたパフォーマンスを実現し、隠蔽されたデータセットに対してかなりのマージンで最先端の手法を上回ります。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:45:14 GMT)
Sparse Model Soups: A Recipe for Improved Pruning via Model Averaging [24.6] Sparse Model Soups (SMS) は,各プルー・リトレインサイクルを前フェーズから平均モデルに開始することでスパースモデルをマージする新しい手法である。
SMSはスパース性を保ち、スパースネットワークの利点を悪用し、モジュール化され、完全に並列化可能であり、IMPのパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:05:26 GMT)
NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation [23.7] VLN(Vision-and-Language Navigation)は、エージェントが言語命令に従って見えない環境でナビゲートできるようにすることを目的として、Embodied AIの重要な研究課題である。
本稿では,映像ベース大規模視覚言語モデル(VLM)であるNaVidを提案する。
NaVidは、地図、オドメーター、深さ入力を使わずに最先端のナビゲーション性能を実現するVLMの能力を示す最初の試みである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:54:01 GMT)
EDDA: A Encoder-Decoder Data Augmentation Framework for Zero-Shot Stance Detection [23.4] スタンス検出は、与えられたターゲットに対してテキストで表現された姿勢を決定することを目的としている。
ZSSDの最近のデータ拡張技術は、ターゲット間の伝達可能な知識を増加させる。
本稿では,エンコーダとデコーダのデータ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:29:29 GMT)
In-context Learning with Retrieved Demonstrations for Language Models: A Survey [23.2] インコンテクスト学習者(ICL)は入力コンテキストでのデモを少しだけ行うだけで、新しいタスクに適応できる。
最近の開発では、固定された一連のデモを使う代わりに、各入力クエリに合わせたデモを検索する。
本稿では,検索モデル,検索訓練手順,推論アルゴリズムの異なる設計選択について論じ,比較する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:35:45 GMT)
Migrate Demographic Group For Fair GNNs [23.1] グラフニューラルネットワーク(GNN)は,グラフ学習の性能が優れているため,多くのシナリオに適用されている。
FairMigrationは2つのトレーニングステージで構成されている。最初の段階では、GNNはパーソナライズされた自己教師型学習によって最初に最適化される。
第2段階では、新しい人口集団は凍結し、新しい人口集団と敵対訓練の制約の下で教師付き学習を行う。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:37:21 GMT)
VLM-CPL: Consensus Pseudo Labels from Vision-Language Models for Human Annotation-Free Pathological Image Classification [23.1] 本稿では,VLM(Venture-Language Models)を利用した画像分類法を提案する。
2つのノイズラベルフィルタリング技術と半教師付き学習戦略を統合した,コンセンサス擬似ラベルに基づく新しい手法 VLM-CPL を提案する。
実験の結果,HPHデータセットとLC25Kデータセットの精度は87.1%,95.1%であった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:24:30 GMT)
Generalizing to Unseen Domains with Wasserstein Distributional Robustness under Limited Source Knowledge [22.3] ドメインの一般化は、目に見えないターゲットドメインでうまく機能する普遍的なモデルを学ぶことを目的としている。
We propose a novel domain generalization framework called Wasserstein Distributionally Robust Domain Generalization (WDRDG)。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:32:22 GMT)
STEntConv: Predicting Disagreement with Stance Detection and a Signed Graph Convolutional Network [22.1] 本稿では,2つのポストの著者が同意するか否かを予測するための,単純で新しい教師なしの手法を提案する。
STEntConvは、ユーザのグラフと、スタンスによって重み付けされた名前付きエンティティを構築するモデルである。
この情報を含むと、さまざまな議論を呼んでいるサブレディットトピックに対するReddit投稿のデータセットにおける不一致検出性能が向上することを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:45:22 GMT)
Group Benefits Instances Selection for Data Purification [22.0] ラベルノイズと戦う既存の方法は通常、合成データセット上で設計およびテストされる。
本稿では,合成および実世界の両方のデータセットに対するノイズラベル問題を緩和するGRIPという手法を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:06:19 GMT)
TLIC: Learned Image Compression with ROI-Weighted Distortion and Bit Allocation [21.7] 本稿では,画像圧縮の追跡手法について述べる。
より優れた知覚品質を実現するために、現実的なテクスチャを生成するために、敵の損失を利用する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:44:14 GMT)
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models [21.6] IllusionVQA: 難解な錯視と難解なシーンのデータセットを提示する。
人間の評価は、人間が理解と局在において91.03%と100%の精度を達成することを明らかにしている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:06:32 GMT)
MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping [21.6] 本稿では,トラッキングタスクとしてマッピングを定式化するベクトルHDマッピングアルゴリズムを提案する。
提案手法であるMapTrackerは,2つの潜在表現のメモリバッファにセンサストリームを蓄積する。
MapTrackerは、nuScenesとAgroverse2データセットの両方で、既存のメソッドを大幅に上回っている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:05:25 GMT)
Few-shot Dialogue Strategy Learning for Motivational Interviewing via Inductive Reasoning [21.1] 本稿では,ユーザに対して肯定的なライフスタイル変化を取り入れるための対話システム構築の課題について考察する。
専門家によるデモンストレーションから,自然言語帰納規則の形で会話戦略を学習し,適用可能なフレームワークであるDIITを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:03:37 GMT)
MoSA: Mixture of Sparse Adapters for Visual Efficient Tuning [20.7] スパースアダプタの混合(英: Mixture of Sparse Adapters, MoSA)は、新しいアダプタチューニング法である。
MoSAは、余分な計算ストレージオーバーヘッドを伴わずに、標準よりも大幅にパフォーマンスが向上する。
MoSAは、他のAdapter Tuningメソッド、および他のベースラインを大きなマージンで一貫して上回っている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:00:15 GMT)
On the Privacy Effect of Data Enhancement via the Lens of Memorization [20.6] 我々は,記憶化という新たな視点からプライバシを調査することを提案する。
記憶のレンズを通して、以前デプロイされたMIAは、より高いプライバシーリスクを持つサンプルを特定する可能性が低いため、誤解を招く結果をもたらすことがわかった。
一般化ギャップとプライバシリークは, これまでの結果に比べて相関が低いことを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:33:32 GMT)
G-ACIL: Analytic Learning for Exemplar-Free Generalized Class Incremental Learning [20.5] 先例のない一般化型分析クラスインクリメンタルラーニング(G-ACIL)を提案する。
G-ACILは解析学習(勾配のない訓練手法)を採用し、GCILのシナリオに解析的解(すなわちクローズドフォーム)を提供する。
その結果, G-ACILは, 既存の競合GCIL法と比較して, 高い強靭性を示すことがわかった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:56:31 GMT)
An edge detection-based deep learning approach for tear meniscus height measurement [20.3] 深層学習フレームワークにおけるエッジ検出支援アノテーションに基づく自動TMH計測手法を提案する。
瞳孔領域と裂孔領域のセグメンテーションを改善するために、畳み込みニューラルネットワークInceptionv3が最初に実装された。
このアルゴリズムは、その品質に基づいて画像を自動的にスクリーニングし、瞳孔と涙孔領域を分離し、TMHを自動的に測定する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:16:26 GMT)
SimA: Simple Softmax-free Attention for Vision Transformers [19.6] 我々は、Softmaxレイヤの代わりに単純な$ell_$-normでクエリとキー行列を正規化する、SoftmaxフリーアテンションブロックSimAを導入する。
また,3種類のSOTA変圧器(DeiT,XCiT,CvT)に適用したSimAは,SoTAモデルと比較して,ソフトマックス層を必要とせずに精度が低いことを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:43:47 GMT)
ARO: Large Language Model Supervised Robotics Text2Skill Autonomous Learning [19.3] 本稿では,Large Language Model Supervised Robotics Text2Skill Autonomous Learningフレームワークを紹介する。
このフレームワークは、ロボットスキル学習プロセスにおける人間の参加を、大規模言語モデルに置き換えることを目的としている。
本稿では,人間の介入なしに部分的なタスクを完了できる完全自律型ロボットスキル学習の実現を実証する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:21:09 GMT)
An Upload-Efficient Scheme for Transferring Knowledge From a Server-Side Pre-trained Generator to Clients in Heterogeneous Federated Learning [18.9] 不均一フェデレートラーニング(HtFL)は、異なるモデルアーキテクチャを持つ複数のクライアントでの協調学習を可能にする。
我々はFedKTL(Federated Knowledge-Transfer Loop)と呼ばれる新しいアップロード効率の高い知識伝達方式を提案する。
当社のFedKTLは,サーバ上のジェネレータの推論により,クライアントタスクに関連するイメージベクタペアを生成することができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:24:09 GMT)
Offloading and Quality Control for AI Generated Content Services in 6G Mobile Edge Computing Networks [18.7] 本稿では, 逆拡散段階における拡散モデルのオフロード決定, 計算時間, 拡散ステップに対する共同最適化アルゴリズムを提案する。
実験結果から,提案アルゴリズムはベースラインよりも優れた継手最適化性能が得られることが示された。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:38:37 GMT)
Breaking Down the Defenses: A Comparative Survey of Attacks on Large Language Models [18.6] 大規模言語モデル(LLM)は自然言語処理(NLP)分野の基盤となっている。
本稿では,LSMを標的とした様々な攻撃形態の包括的調査を行う。
モデルアウトプットを操作するための敵攻撃、モデルトレーニングに影響を与えるデータ中毒、データエクスプロイトのトレーニングに関連するプライバシー上の懸念などについて調べる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:21:49 GMT)
X-Portrait: Expressive Portrait Animation with Hierarchical Motion Attention [18.2] 本稿では,表現的かつ時間的コヒーレントなポートレートアニメーションを生成するための,革新的な条件拡散モデルであるX-Portraitを提案する。
外観参照として1つのポートレートが与えられた場合、駆動ビデオから得られる動きをアニメーション化し、非常にダイナミックかつ微妙な表情をキャプチャすることを目的としている。
実験により,X-ポートレートの多彩な顔画像および表現力のある運転シーケンスに対する普遍的効果が示された。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 20:30:28 GMT)
What Do You See in Vehicle? Comprehensive Vision Solution for In-Vehicle Gaze Estimation [18.2] 本稿では,車内視線研究を進めるための3つの新しい要素について述べる。
まず、車内視線を捉えた先駆的なデータセットであるIVGazeを紹介する。
第2に、IVGazeを利用した車内視線推定に焦点を当てた。
第3に、GazeDPTRを拡張することで、視線ゾーン分類の新しい戦略を探求する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 01:22:15 GMT)
Graph Neural Networks can Recover the Hidden Features Solely from the Graph Structure [17.9] グラフニューラルネットワーク(GNN)は、グラフ学習問題の一般的なモデルである。
GNNはグラフ構造を自分自身で完全に活用できることを示す。
事実上、GNNは下流タスクに隠されたノード機能と明示的なノード機能の両方を使用することができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:17:35 GMT)
Towards Human-Like Machine Comprehension: Few-Shot Relational Learning in Visually-Rich Documents [16.8] Visually-Rich Documents (VRDs) ではキーバリュー関係が一般的である
これらの非テクスト的手がかりは、人間の理解とそのような関係三重項の獲得を大幅に促進する重要な指標となる。
本研究は,VRDにおけるキー-値関係三重項の抽出を目的とした,数発のリレーショナル学習に焦点を当てた。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:40:35 GMT)
GeNIe: Generative Hard Negative Images Through Diffusion [16.6] 本稿では,テキストプロンプトに条件付き潜伏拡散モデルを利用して,コントラストデータポイントをマージする新しい拡張手法であるGeNIeを紹介する。
近年の拡散に基づく画像編集技術に着想を得て, 画像の低レベル・背景特性を維持するために, 拡散反復回数を制限する。
提案手法の有効性を実証するために, 複数ショットと長テールの分布設定による実験を行った。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:38:41 GMT)
In-Context Matting [16.3] In-context matting, a novel task set of image mattingを紹介する。
In-context mattingは、同じフォアグラウンドカテゴリのターゲット画像のバッチに対する自動アルファ推定を可能にする。
IconMattingは、事前訓練されたテキスト-画像拡散モデルに基づいて構築されたコンテキスト内マッチングモデルである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:32:29 GMT)
Large Language Models for Mathematical Reasoning: Progresses and Challenges [15.9] 大規模言語モデル (LLM) は数学問題の自動解法を指向している。
この調査は4つの重要な次元に対処する試みである。
これは、この急速に発展する分野における現在の状況、成果、将来の課題に関する全体論的な視点を提供する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:45:57 GMT)
Inpainting-Driven Mask Optimization for Object Removal [15.4] 本稿では,画像塗布による物体除去の品質向上のためのマスク最適化手法を提案する。
本手法では, この領域ギャップを, セグメンテーションにより抽出した物体マスクを用いて塗装ネットワークを訓練することにより解決する。
被塗布用マスクを最適化するために、セグメンテーションネットワークは塗工ネットワークに接続され、塗工性能を向上させるために訓練されたエンド・ツー・エンドに接続される。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:52:16 GMT)
EAGLE: A Domain Generalization Framework for AI-generated Text Detection [15.3] 本稿では,未知のターゲットジェネレータからAI生成テキストを検出するための領域一般化フレームワークを提案する。
我々は,未知のターゲットジェネレータが生成したテキストの検出において,我々のフレームワークがいかに効果的に優れた性能を実現するかを実証する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:44:20 GMT)
EduAgent: Generative Student Agents in Learning [15.2] オンライン教育における学生シミュレーションは,様々な背景を持つ学生の動的学習行動に対処するために重要である。
ディープラーニングに基づく既存のシミュレーションモデルでは、教育的文脈における事前知識が欠如しているため、大規模なトレーニングデータが必要である。
本研究は,認知的事前知識を取り入れた新しい生成エージェントフレームワークであるEduAgentを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:19:17 GMT)
UPNeRF: A Unified Framework for Monocular 3D Object Reconstruction and Pose Estimation [15.2] ポース推定とNeRFに基づく再構成を統合した統一フレームワークUPNeRFを提案する。
UPNeRFはオブジェクトの次元推定を分離し、スケールと深さのあいまいさを解決するために洗練する。
UPNeRFは、KITTIとデータセットに例外的なクロスデータセットの一般化を示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:56:25 GMT)
FEEL: A Framework for Evaluating Emotional Support Capability with Large Language Models [14.9] Emotional Support Conversation (ESC) は、ユーザーが感情的なプレッシャーを軽減できる典型的な対話である。
現在の非人工的方法論は、エモオプション支援能力を効果的に評価する上で、課題に直面している。
本稿では,感情支援能力を評価するために,Large Language Models (LLMs) を用いた新しいモデルFEELを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:32:26 GMT)
Detection of Problem Gambling with Less Features Using Machine Learning Methods [14.2] 本稿では,限られた解析的特徴を用いたディープニューラルネットワークPGN4を提案する。
PGN4は102の機能を5つの機能に切ると、単なるパフォーマンス低下しか発生しない。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:49:01 GMT)
Depth Estimation fusing Image and Radar Measurements with Uncertain Directions [14.2] 従来のレーダ画像融合作業では、画像特徴は畳み込み層を通してレーダーによって測定された不確実なスパース深さとマージされる。
本手法は,画像のみを用いて特徴を計算し,レーダ深度を画素単位で調整することでこの問題を回避する。
提案手法は, レーダの正確な方向のみを学習することにより, トレーニングデータを改善するとともに, 従来手法では生レーダ測定を訓練していた。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:16:36 GMT)
Distributed Robust Learning based Formation Control of Mobile Robots based on Bioinspired Neural Dynamics [14.1] まず,変数構造とカスケード設計手法を用いた分散推定器を導入し,実時間性能向上のための微分情報の必要性を排除した。
そして、スムーズな制御入力を提供し、スピードジャンプ問題を効果的に解決することを目的とした、バイオインスパイアされたニューラルダイナミックベースのアプローチを用いて、キネマティックトラッキング制御法を開発した。
完全に未知の力学と乱れを持つロボットの課題に対処するために,学習に基づく頑健な動的コントローラを開発した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:36:12 GMT)
Convection-Diffusion Equation: A Theoretically Certified Framework for Neural Networks [14.0] ニューラルネットワークの偏微分方程式モデルについて検討する。
この写像は対流拡散方程式で定式化できることを示す。
拡散機構をネットワークアーキテクチャに組み込んだ新しいネットワーク構造を設計する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:26:36 GMT)
Time-series Initialization and Conditioning for Video-agnostic Stabilization of Video Super-Resolution using Recurrent Networks [13.9] ビデオスーパーレゾリューション(VSR)のためのリカレントニューラルネットワーク(RNN)は、通常ランダムにクリップされ、トリミングされた短いビデオで訓練される。
このRNNは超解像ショートビデオに最適化されているため、長いビデオのVSRはドメインギャップのために劣化する。
本稿では,VSRにおけるRNNのトレーニング戦略を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:16:07 GMT)
DS-NeRV: Implicit Neural Video Representation with Decomposed Static and Dynamic Codes [13.7] 本稿では,ビデオから学習可能な静的コードと動的コードに分解するDS-NeRVを提案する。
静的および動的コード表現の分離により,パラメータが 0.35M である 31.2 PSNR の高品質な再構成を実現する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:09:23 GMT)
Effect of Ambient-Intrinsic Dimension Gap on Adversarial Vulnerability [13.2] オフマンフォールド攻撃の存在は、データの内在次元と周囲次元の間の次元ギャップの自然な結果であると主張する。
2層ReLUネットワークの場合、次元ギャップが観測データ空間から引き出されたサンプルの一般化性能に影響を与えないにもかかわらず、クリーントレーニングされたモデルはオフマンフォールド方向の摂動に対してより脆弱であることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:22:00 GMT)
AttentionStore: Cost-effective Attention Reuse across Multi-turn Conversations in Large Language Model Serving [13.0] 本稿では,マルチターン会話におけるKVキャッシュの再利用を可能にする新しい注意機構であるAttentionStoreを提案する。
実験の結果、AttentionStoreは第1トークン(TTFT)までの時間を最大88%減少させることがわかった。
また、マルチターン会話のスループットを8.2$times$改善し、エンドツーエンドの推論コストを最大56%削減する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:42:49 GMT)
Multivariate Gaussian Approximation for Random Forest via Region-based Stabilization [12.8] ポアソン過程によって与えられる一連のトレーニングポイントに基づいて,ランダムな森林予測のためのガウス近似境界を導出する。
我々のアプローチは、ランダムな森林予測が地域ベースの安定化と呼ばれる特定の幾何学的特性を満たすという重要な観測に基づいている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:24:02 GMT)
Gaussian in the Wild: 3D Gaussian Splatting for Unconstrained Image Collections [12.8] 制約のない画像における光度変化と過渡オクルーダは、元のシーンを正確に再構築することが困難である。
本稿では,3次元ガウス点を用いてシーンを再構築し,各ポイントに固有の特徴と動的外観を分離する手法であるGaussian in the wild (GS-W)を提案する。
より多くの実験により、従来の手法と比較してGS-Wの再現性や細部が向上し、レンダリング速度が1,000倍に向上した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:55:41 GMT)
Bird's Eye View Based Pretrained World model for Visual Navigation [12.8] 本稿では,従来の世界モデルにおけるコンポーネントを,シミュレータ内で完全に訓練された堅牢なシステムに融合させる新しいシステムを提案する。
我々のロボットは、複雑なtextitFirst-Person View(FPV)ベースのRGBイメージからBEV表現への変換を最初に学習することでシミュレータでナビゲートすることを学ぶ。
実世界でのテストでは、FPVベースのRGB画像の知覚モデルを用いて、FPVからBEVトランスレータへの埋め込みを学習する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 00:28:21 GMT)
Deep Point Cloud Normal Estimation via Triplet Learning [12.3] 点雲の新しい正規推定法を提案する。
a) 局所パッチの表現を学習する特徴符号化と(b) 学習した表現を入力として取り、通常のベクトルを回帰する正規推定である。
本手法は,シャープな特徴を保存し,CAD形状の正常な推定結果を改善する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:52:51 GMT)
Who Uses Personas in Requirements Engineering: The Practitioners' Perspective [12.0] ソフトウェアプロジェクトでは通常、エンドユーザのニーズをよりよく理解するためにペルソナが使われます。
本稿では,26人のソフトウェア開発者,UI/UXデザイナ,ビジネスアナリスト,製品マネージャへのインタビューを含む2段階の調査結果を紹介する。
本研究は,異なるソフトウェアプロジェクトやIT企業におけるペルソナの頻度と有効性の変化を明らかにした。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 19:20:41 GMT)
LLMs Instruct LLMs:An Extraction and Editing Method [12.0] 複雑な文脈からの知識を大規模言語モデル(LLM)に組み込む逐次融合法を提案する。
提案手法では,質問応答の精度は71.69%であった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:03:36 GMT)
Live and Learn: Continual Action Clustering with Incremental Views [11.9] 本稿では,連続的な学習方法で行動カテゴリを学習可能な,新しい連続的行動クラスタリング法を提案する。
新しいカメラビューが到着すると、入ってくる新しいカメラビューを活用することで更新できるコンセンサスパーティションマトリックスのみを保持する必要がある。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:48:53 GMT)
TrustSQL: A Reliability Benchmark for Text-to-SQL Models with Diverse Unanswerable Questions [11.8] テキスト・ツー・アンサー・モデルの信頼性を評価するための新しいベンチマークであるTrustを提示する。
モデル評価のために,本課題に特化して設計された様々なモデリング手法について検討する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:12:52 GMT)
Learnable WSN Deployment of Evidential Collaborative Sensing Model [11.4] 無線センサネットワーク(WSN)では、検出タスクの実行において、カバレッジとデプロイメントが最も重要な2つの問題である。
我々は,WSNの検出能力を向上するセンサの協調センシングモデルを開発した。
学習可能なセンサ配置ネットワーク(LSDNet)を提案し,WSNの最適展開を実現する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:29:09 GMT)
Temporal-Spatial Object Relations Modeling for Vision-and-Language Navigation [11.4] VLN(Vision-and-Language Navigation)は、エージェントが視覚観察を通して記述された自然言語にナビゲートする必要がある課題である。
エージェントのナビゲーション能力は、通常内部オブジェクトまたは外部データセットを使用して学習されるオブジェクト間の関係によって強化することができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:44:43 GMT)
A Comparative Study of Artificial Potential Fields and Safety Filters [10.5] 人工電位場は,最近普及している制御バリア関数二次プログラム(CBF-QP)の安全性フィルタから導出できることを示す。
我々はCBF-QP安全フィルタの設計を拡張し、制御アフィン構造を特徴とするより一般的な動的モデルに対応する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:14:27 GMT)
Designing Sousveillance Tools for Gig Workers [10.3] 独立して契約した従業員として、ギグワーカーは職場監視の結果に不当に苦しむ。
批判的な理論家の中には、そのような権力の乱用に対処する潜在的手段としての監視を提案した者もいる。
半構造化インタビューを行い、ギグワーカーと共同設計活動を主導した。
我々は、監視経験に対するギグワーカーの態度と過去の経験を識別する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:08:00 GMT)
Ev-Edge: Efficient Execution of Event-based Vision Algorithms on Commodity Edge Platforms [10.1] Ev-Edgeは、エッジプラットフォーム上でのイベントベースのビジョンシステムのパフォーマンスを高めるために、3つの重要な最適化を含むフレームワークである。
様々な自律ナビゲーションタスクのための最先端ネットワークでは、Ev-Edgeはレイテンシが1.28x-2.05x改善され、エネルギーが1.23x-2.15xになった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:44:55 GMT)
Diffusion-based Aesthetic QR Code Generation via Scanning-Robust Perceptual Guidance [9.9] 日々のアプリケーションで広く使われているQRコードは、従来の白黒デザインのために視覚的な魅力を欠いている。
本稿では,事前学習した制御ネットを利用して,拡散モデルに基づく新しい審美的QRコード生成パイプラインを提案する。
定量的、質的、主観的な実験により、提案手法は様々な審美的なQRコードを詳細に生成できることを示した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:08:48 GMT)
Decentralized Multi-Armed Bandit Can Outperform Classic Upper Confidence Bound: A Homogeneous Case over Strongly Connected Graphs [9.8] 本稿では、複数のエージェントのネットワークが同じアームの集合に直面する均質な分散化されたマルチアームバンディット問題について検討する。
隣接関係を有向グラフで記述したマルチエージェントネットワークに対して,完全分散上界信頼度(UCB)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:41:10 GMT)
Differentiable Information Bottleneck for Deterministic Multi-view Clustering [9.7] 我々は、決定論的かつ分析的なMVCソリューションを提供する新しい微分可能情報ボトルネック(DIB)手法を提案する。
具体的には、まず、正規化されたカーネルグラム行列を利用して高次元空間の相互情報を直接適合させることを提案する。
そして、新たな相互情報測定に基づいて、解析勾配を持つ決定論的多視点ニューラルネットワークを明示的にトレーニングし、IBの原理をパラメータ化する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:13:22 GMT)
Human Motion Prediction under Unexpected Perturbation [9.5] 本研究では、予期せぬ物理的摂動下での動作を予測する人間の動き予測における新しい課題について検討する。
このタスクは、外部の衝撃に応答して、制御の少ない、未治療の、純粋な反応性の動作を予測することである。
本稿では、微分物理学とディープニューラルネットワークを大まかに活用する新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 17:17:08 GMT)
RAAMove: A Corpus for Analyzing Moves in Research Article Abstracts [9.5] RAAMoveは、研究論文(RA)における移動構造のアノテーション専用の包括的なコーパスである。
コーパスは、まず、エキスパートアノテータが手動で高品質なデータをアノテートし、次に、人間のアノテートデータに基づいて、BERTベースのモデルが自動アノテーションに使用される。
その結果、33,988の注釈付きインスタンスからなる大規模で高品質なコーパスが得られた。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:43:30 GMT)
No more optimization rules: LLM-enabled policy-based multi-modal query optimizer [9.4] 大規模言語モデル(LLM)は、機械学習とディープラーニングの分野で重要な瞬間となっている。
本稿では,LLM のクエリ最適化能力について検討し,新しい LLM とポリシーに基づくマルチモーダルクエリである LaPuda を設計する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 17:05:15 GMT)
Efficient Data Access Paths for Mixed Vector-Relational Search [8.8] 機械学習とベクトル埋め込みを用いたデータ処理手法の採用は、ベクトルデータ管理のためのシステム構築に大きな関心を喚起した。
ベクトルデータ管理の主流のアプローチは、ベクトル埋め込み全体を高速に検索するために特別なインデックス構造を使用することであるが、一度他の(メタ)データと組み合わせると、検索クエリはリレーショナル属性に対して選択的になる。
ベクトルインデックスは従来の関係データアクセスと異なるため、効率的な混合ベクトル関係探索のための代替アクセスパスを再検討し分析する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:34:17 GMT)
LMC: Fast Training of GNNs via Subgraph Sampling with Provable Convergence [8.6] 収束保証,すなわちローカルメッセージ補償(LMC)を用いた新しいサブグラフワイズサンプリング手法を提案する。
LMCは、後方パスのメッセージパスの定式化に基づいて、後方パスで破棄されたメッセージを検索する。
LMCは、効率の点で最先端のサブグラフワイドサンプリング法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:40:58 GMT)
Convergence Analysis of Stochastic Gradient Descent with MCMC Estimators [8.5] 勾配降下(SGD)とその変種は機械学習に不可欠である。
本稿では,マルコフ連鎖モンテカルロ(MCMC)推定器を用いて勾配を計算するSGDアルゴリズムについて考察する。
MCMC-SGDはサドル点から脱出し、$(epsilon,epsilon1/4)$2次定常点に達することが示されている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:26:31 GMT)
Multi-party Response Generation with Relation Disentanglement [8.5] 既存のニューラルレスポンス生成モデルは、双方向の会話で大幅に改善されている。
しかし、現実世界の対話の多くは複数の対話者を含み、会話の文脈の構造はより複雑である。
本研究では,人間ラベルを使わずに,会話の文脈内での微妙な手がかりに基づいて関係性を推論する手法を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:19:18 GMT)
Tactics2D: A Reinforcement Learning Environment Library with Generative Scenarios for Driving Decision-making [7.9] Tactics2DはオープンソースのReinforcement Learning環境ライブラリで、多様で困難なトラフィックシナリオを自動生成する。
その第一の目的は、研究者が学習に基づく駆動意思決定モデルを調べるためのアウト・オブ・ボックスツールキットを提供することである。
機能としては、現実世界のログやデータフォーマットとの広範な互換性、カスタマイズ可能なトラフィックシナリオコンポーネント、リッチな組み込み機能テンプレートなどがある。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:49:30 GMT)
K-pop Lyric Translation: Dataset, Analysis, and Neural-Modelling [7.8] 約89%がK-popの歌詞から成り立っている。
このデータセットは、韓国語と英語の歌詞を並べて、セクションごとに並べる。
ニューラル・リリック翻訳モデルを構築し,歌唱用リリック翻訳のための専用データセットの重要性を強調する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:33:06 GMT)
Towards Robust Multi-Modal Reasoning via Model Selection [7.7] LLMはエージェントの"脳"として機能し、協調的な多段階タスク解決のための複数のツールを編成する。
我々はテスト時に無視できるランタイムオーバーヘッドを持つプラグインとして、$textitM3$フレームワークを提案する。
実験の結果,我々のフレームワークは,ユーザ入力とサブタスク依存の両方を考慮した動的モデル選択を可能にすることがわかった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:01:39 GMT)
Emotion Recognition Using Transformers with Masked Learning [7.7] 本研究では、視覚変換器(ViT)と変換器(Transformer)のモデルを用いて、Valence-Arousal(VA)の推定に焦点をあてる。
このアプローチは、従来の畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ベースのメソッドを超越し、新しいTransformerベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:31:11 GMT)
On The Effectiveness of One-Class Support Vector Machine in Different Defect Prediction Scenarios [7.6] 欠陥予測は、ソフトウェアがエンドユーザに提供される前に障害を引き起こす可能性のあるソフトウェアコンポーネントを特定することを目的としている。
以前の研究では、ワンクラスサポートベクトルマシン(OCSVM)が、プロジェクト内欠陥予測のために2クラス分類器より優れていることが示されている。
一方のクラスからの学習が,他の2つの異なるシナリオにおいて効果的な欠陥予測モデルを生成するのに十分かどうかを検討する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:24:47 GMT)
Private measures, random walks, and synthetic data [7.6] 微分プライバシーは、情報理論のセキュリティ保証を提供する数学的概念である。
我々は、プライベートな合成データを効率的に構築できるデータセットからプライベートな尺度を開発する。
我々の構築における重要な要素は、独立確率変数と同様の連立分布を持つ新しい超規則ランダムウォークである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:41:45 GMT)
Phase estimation via coherent and photon-catalyzed squeezed vacuum states [7.3] 我々は,光触媒による圧縮真空状態と混合したコヒーレント状態をマッハ・ツェンダー干渉計に入力する手法を提案する。
位相測定精度は標準量子限界を超え、ハイゼンベルク極限を超える。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:26:04 GMT)
Understanding The Effectiveness of Lossy Compression in Machine Learning Training Sets [7.3] 機械学習と人工知能(ML/AI)技術は、ハイパフォーマンスコンピューティングでますます普及している。
データ圧縮はこれらの問題の解決策となり得るが、損失圧縮がモデル品質にどのように影響するかを深く理解する必要がある。
現代の損失圧縮手法は、品質の1%以下の損失に対して、50-100倍圧縮率の改善を達成できることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:14:37 GMT)
Fully Spiking Neural Network for Legged Robots [7.0] スパイキングニューラルネットワーク(SNN)は脚のあるロボットの処理に使われ、様々なシミュレーションされた地形で優れた結果が得られる。
SNNは、推論速度とエネルギー消費の観点から、従来のニューラルネットワークよりも自然な優位性を持っている。
よりバイオミメティックなニューラルネットワークを脚のあるロボットに適用することで、ニューラルネットワークの高消費電力による熱散逸と構造的負担をさらに軽減することができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:58:58 GMT)
Quantum LOSR networks cannot generate graph states with high fidelity [6.7] 我々は、連結グラフから生じる全てのマルチキュービットグラフ状態が、バイパルタイト源を持つ任意の量子ネットワークから生じることができないことを証明した。
マルチキュービットグラフ状態と任意のネットワーク状態の忠実度は9/10$を超えない。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:27:57 GMT)
Innovative Quantitative Analysis for Disease Progression Assessment in Familial Cerebral Cavernous Malformations [6.7] 家族性脳海綿状奇形 (FCCM) は中枢神経系の異常血管構造を特徴とする遺伝性疾患である。
本稿では,効率的なアノテーションモジュール,FCCM病変セグメンテーションモジュール,FCCM病変量統計モジュールからなるFCCMの定量的統計フレームワークを提案する。
我々のフレームワークは、効率的なデータアノテーションに基づいて、FCCM病変の正確なセグメンテーションを示し、Dice係数は93.22%である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:27:23 GMT)
Latent assimilation with implicit neural representations for unknown dynamics [6.7] 本研究は、LAINR(Latent Assimilation with Implicit Neural Representations)と呼ばれる新しい同化フレームワークを提案する。
Spherical Implicit Neural Representation (SINR)とデータ駆動型ニューラルネットワークの不確実性推定器を導入することにより、LAINRは同化過程における効率を向上させる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:16:40 GMT)
FusionINN: Invertible Image Fusion for Brain Tumor Monitoring [6.5] FusionINNは、融合した画像を効率よく生成し、ソース画像に分解することができる、新しい非可逆画像融合フレームワークである。
我々は、医療用画像融合のような生命に敏感な用途に欠かせない、融合した画像の分解可能性について、初めて調査する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:54:03 GMT)
A hybrid LLM workflow can help identify user privilege related variables in programs of any size [6.3] 本稿では,ユーザ権限関連変数の識別を支援するために,大規模言語モデル(LLM)ワークフローを導入する。
具体的には、プログラム内のすべての変数を監査し、変数とユーザ特権の関係(クローズネス)の程度であるUPRスコアを出力する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:18:46 GMT)
Distribution-consistency Structural Causal Models [6.3] 我々は,新しいテクスト分布-一貫性仮定を導入し,それに合わせて分布-一貫性構造因果モデル(DiscoSCM)を提案する。
モデルキャパシティの強化を具体化するために,DiscoSCM単独で実用的重要性を有する新たな因果パラメータ,一貫性のテキスト化(textitthe probability of consistency)を導入する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:15:31 GMT)
LCV2: An Efficient Pretraining-Free Framework for Grounded Visual Question Answering [6.3] LCV2モジュラー法は視覚言語マルチモーダル領域におけるグラウンドド視覚質問応答タスクに対して提案される。
このアプローチは、市販のVQAモデルと市販のビジュアルグラウンド(VG)モデルの間の中間メディエータとして、凍結した大言語モデル(LLM)に依存している。
このフレームワークは、低計算リソース下でのVQAグラウンディングタスクにデプロイすることができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:46:54 GMT)
AI for Biomedicine in the Era of Large Language Models [5.9] 大規模言語モデルの最近の進歩は、自然言語のタスクに長けている。
これらのモデルの可能性を生医学的知識発見に活用できるだろうか?
バイオメディカルデータの3つの重要なカテゴリに対する大規模言語モデルの応用について検討する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 01:40:22 GMT)
FrankenSplit: Efficient Neural Feature Compression with Shallow Variational Bottleneck Injection for Mobile Edge Computing [5.8] 資源依存型圧縮モデルのための新しいフレームワークを導入し,非対称環境下での手法を広範囲に評価する。
提案手法は精度を低下させることなく最先端のSC法よりも60%低く,既存の標準のオフロードよりも16倍高速である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:51:29 GMT)
Fast and Unified Path Gradient Estimators for Normalizing Flows [5.6] 流れの正規化のための経路勾配推定器は, 変分推定のための標準推定器に比べて, ばらつきが小さい。
計算効率を大幅に向上させる高速経路勾配推定器を提案する。
我々は、いくつかの自然科学応用において、その優れた性能と分散を実証的に確立する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:21:22 GMT)
MatchSeg: Towards Better Segmentation via Reference Image Matching [5.6] ほとんどショットラーニングは、サポートセットとして知られる小さなラベル付きデータセットを使用して、新しいラベル付きイメージの予測ラベルをガイドすることで、注釈付きデータの必要性を克服することを目的としている。
このパラダイムに着想を得たMatchSegは,戦略的基準画像マッチングによる医用画像のセグメンテーションを強化する新しいフレームワークである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:04:58 GMT)
The $\mathcal{PT}$-symmetric quantum Rabi model: Solutions and exceptional points [5.3] 非エルミート的な1光子と2光子量子ラビモデル(QRM)はボゴリューボフ作用素のアプローチによってそれぞれ解かれる。
両方の非エルミート系 QRM に対して、忠実度感受性は、非エルミート系における最近の観測と一致し、EP において負の無限大となる。
すべての固有状態は保存エネルギーとQRMパリティによってラベル付けすることができ、非エルミート QRM もヘルミート級数と同様に可積分であると主張する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:34:09 GMT)
AC4: Algebraic Computation Checker for Circuit Constraints in ZKPs [5.2] 本稿では,ZKP回路の2種類のバグをピンポイントする手法を提案する。
本稿では,この手法の実装を表現するためのツールAC4を提案する。
可溶範囲内では、AC4のチェック時間も顕著に改善されている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 01:44:57 GMT)
Sample and Communication Efficient Fully Decentralized MARL Policy Evaluation via a New Approach: Local TD update [4.9] 我々は,MARL-PEのサンプルと通信の複雑さを下げる上で,複数の局所的なTD更新ステップが効果的であることを示す。
理論的には、最適なサンプル複雑性に到達するために、局所的なTD更新アプローチの通信複雑性は$mathcalO (1/epsilon1/2log (1/epsilon))$である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 21:39:56 GMT)
Learning without Exact Guidance: Updating Large-scale High-resolution Land Cover Maps from Low-resolution Historical Labels [4.8] 大規模な高解像度(HR)の土地被覆マッピングは、地球の表面を調査し、人類が直面する多くの課題を解決するための重要な課題である。
本研究では,大規模人事地被覆地図作成のための効率的かつ弱教師付きフレームワーク(Paraformer)を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:51:35 GMT)
SAT Encoding of Partial Ordering Models for Graph Coloring Problems [4.8] グラフ着色問題と帯域幅着色問題に対する部分順序付けベースLPモデルの新たなSAT符号化を提案する。
広く研究されているGCPでは、新しいSATエンコーディングとDIMACSベンチマークセットの最先端アプローチを実験的に比較する。
理論解析により,部分順序付きSATとILPの定式化は古典的代入ベースモデルよりも大幅に小さいことがわかった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:48:41 GMT)
Adversarial Defense Teacher for Cross-Domain Object Detection under Poor Visibility Conditions [4.6] クロスドメインオブジェクト検出器は、トレーニングと実世界のデータ間のドメインシフトを扱う上で、課題に直面します。
本稿では,対人防衛教育(ADT:Adversarial Defense Teacher)というフレームワークについて紹介する。
以上の結果から,ADTはFogy Cityscapesで54.5%のmAPを達成した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:16:05 GMT)
Scaling Learning based Policy Optimization for Temporal Tasks via Dropout [4.4] 非線形環境下で動作する自律エージェントに対して,フィードバックコントローラを訓練するためのモデルに基づくアプローチを提案する。
この学習問題は、エージェントのタスク目標の時間的地平線に比例して繰り返し単位の数が比例する、リカレントニューラルネットワーク(RNN)のトレーニングとどのように似ているかを示す。
そこで我々は,ドロップアウトあるいは勾配サンプリングのアイデアに基づく新しい勾配近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 12:53:51 GMT)
Chain-of-Interaction: Enhancing Large Language Models for Psychiatric Behavior Understanding by Dyadic Contexts [4.4] 本稿では,対話型対話による精神科的意思決定支援のための大規模言語モデルを文脈化するための,対話型連鎖促進手法を提案する。
このアプローチにより、大規模言語モデルでは、患者の行動コーディングのためのコーディングスキーム、患者の状態、およびドメイン知識を活用することができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 04:02:01 GMT)
An active learning model to classify animal species in Hong Kong [4.3] カメラトラップは、動物を監視するための効率的で非侵襲的な方法として、世界中の生態学者によって使用されている。
近年のディープラーニングとコンピュータビジョンの進歩により、このプロセスの自動化が可能になった。
ここでは、香港で収集されたカメラトラップ画像に適用可能なモデルをトレーニングするために、深層学習ワークフローを使用します。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 01:42:19 GMT)
PEaCE: A Chemistry-Oriented Dataset for Optical Character Recognition on Scientific Documents [4.2] 合成と実世界の両方の記録を含むPEaCE(Printed English and Chemical Equations)データセットを提示する。
本研究では,トランスモデルを用いたOCRモデルの有効性を評価する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:20:36 GMT)
Leveraging Zero-Shot Prompting for Efficient Language Model Distillation [3.4] 本稿では, LLMをより小さく, アプリケーション固有のモデルに効率よく蒸留する方法を提案する。
LLMの推論機能を利用してラベルを生成し、ラベルのないデータに対して自然言語の合理性を生成する。
主な貢献は、教師モデルの合理性を引き出すため、ゼロショットの雇用である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:51:52 GMT)
Pairing from repulsion in a two-dimensional Fermi gas with soft-core interactions [3.4] 2次元のフェルミガスのモデル多体系について検討し, 素体相互作用は反発的であり, ソフトコアディスク電位の形をとる。
数値関数的再正規化群(FRG)によるこのモデルの零温度位相図を得る。
我々は、素の相互作用の運動量依存性に遡って、$f$-および$h$-waveペアリングの安定化と強化をたどる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:00:35 GMT)
The Effectiveness of Local Updates for Decentralized Learning under Data Heterogeneity [2.8] DGT(Decentralized Gradient Tracking)とDGD(Decentralized Gradient Descent)の2つの基本的な分散最適化手法を再検討する。
K > 1$ ローカル更新のステップを組み込むことで通信の複雑さを低減できることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 00:01:34 GMT)
VT-Former: An Exploratory Study on Vehicle Trajectory Prediction for Highway Surveillance through Graph Isomorphism and Transformer [2.8] 車両軌道予測(VTP)は、車両の過去と現在の動きに基づいて将来の位置を予測することを目的としている。
VTPは道路安全の重要な要素であり、交通管理、事故防止、ワークゾーン安全性、エネルギー最適化などの応用を支援する。
本稿では,高速道路の安全と監視のための新しいトランスフォーマーベースのVTPアプローチであるVT-Formerを紹介する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:27:17 GMT)
Fine Tuning LLM for Enterprise: Practical Guidelines and Recommendations [2.7] 我々は、企業リポジトリのプロプライエタリなドキュメントとコードを使用したオープンソースのLLMであるLLaMAの微調整に重点を置いている。
この作業の一環として、私たちは初心者に、ドキュメントやコードのための LLM の微調整から始める方法について、ガイドすることを目指しています。
また、さまざまなフォーマットでデータセットを作成するために、ドキュメンテーションとコードの両方に事前処理のレシピを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:25:01 GMT)
Spatio-Temporal Bi-directional Cross-frame Memory for Distractor Filtering Point Cloud Single Object Tracking [2.5] LIDARポイント内の1つのオブジェクトトラッキングは、コンピュータビジョンにおける重要なタスクである。
既存の手法は、ネットワーク経由の外観マッチングのみに依存するか、連続したフレームからの情報を利用するが、重大な課題に遭遇する。
我々は、これらの課題を緩和するために、STMD-Trackerという、革新的なクロスフレームバイテンポラルモーショントラッカーを設計する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:15:44 GMT)
Space Group Informed Transformer for Crystalline Materials Generation [2.4] 本稿では,変圧器を用いた空間群制御結晶生成のための自己回帰モデルであるCrystalFormerを紹介する。
クリスタルホルマーは、単位セル内の対称性に等価な原子の種類と位置を直接予測することで結晶を生成することを学ぶ。
以上の結果から,CrystalFormerは標準ベンチマークにおいて,生成した結晶材料の正当性,新奇性,安定性の両立を図っている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:01:45 GMT)
Cognitive resilience: Unraveling the proficiency of image-captioning models to interpret masked visual content [2.4] 本研究では,多様なデータセットから得られたマスク付き視覚コンテンツをデコードする画像キャプション(IC)モデルについて検討する。
本研究により, マスク画像からキャプションを生成できるICモデルの能力が, オリジナルとよく似ていることが明らかとなった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:53:00 GMT)
Integrating Wearable Sensor Data and Self-reported Diaries for Personalized Affect Forecasting [2.4] 本研究では,影響状況予測のためのマルチモーダル深層学習モデルを提案する。
このモデルは、トランスフォーマーエンコーダと事前訓練された言語モデルを組み合わせることで、客観的なメトリクスと自己報告された日記の統合分析を容易にする。
その結果, 予測精度82.50%, 負の影響82.76%, 前週の予測精度82.76%が得られた。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:27:49 GMT)
Feature Manipulation for DDPM based Change Detection [2.3] 変化検出はコンピュータビジョンの古典的なタスクであり、両時間画像ペアを入力として受け取り、意味的に変化し、変化しない領域を分離する。
拡散モデルは画像合成や特徴抽出機として使われ、下流の様々なタスクに適用されている。
LEVIR-CDデータセットのF1スコア(90.18)とIoU(83.86)が得られた。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:07:32 GMT)
Automated System-level Testing of Unmanned Aerial Systems [2.2] 国際安全基準の主な要件は、アビオニクスソフトウェアシステムの厳格なシステムレベルのテストを実行することである。
提案したアプローチ(AITester)は、モデルベースのテストと人工知能(AI)技術を使用して、さまざまなテストシナリオを自動生成、実行、評価する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:47:26 GMT)
A survey on Concept-based Approaches For Model Improvement [2.2] 概念は人間の思考基盤として知られている。
ディープニューラルネットワーク(DNN)における様々な概念表現とその発見アルゴリズムの体系的レビューと分類について述べる。
また,これらの手法を総合的に調査した最初の論文として,概念に基づくモデル改善文献について詳述する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:50:23 GMT)
Towards Low-Energy Adaptive Personalization for Resource-Constrained Devices [2.1] Target Block Fine-Tuning (TBFT) はリソース制約のあるデバイスのための低エネルギー適応型パーソナライズフレームワークである。
我々は、エネルギーコストを削減して最適な性能を達成するために、モデルの異なるブロックを微調整する。
Block Avg$と比較すると、TBFTは平均15.30%の精度向上を示している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:19:02 GMT)
Fast-DiM: Towards Fast Diffusion Morphs [2.1] 拡散モルフ (Diffusion Morphs, DiM) は, 高品質な顔形態を生成するための最新技術である。
そこで本研究では,NFEの低い品質のモーメントを生成できる新しいDIMパイプラインであるFast-DiMを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 23:04:00 GMT)
A Bayesian Multilingual Document Model for Zero-shot Topic Identification and Discovery [1.9] モデルは多言語シナリオへの BaySMM [Kesiraju et al 2020] の拡張である。
学習した不確実性を線形分類器で伝達し、ゼロショットの言語間話題識別に役立てる。
我々は、現在のデータセットを深く掘り下げることで、ゼロショット設定での言語間トピックの識別を再考する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:22:54 GMT)
A survey on knowledge-enhanced multimodal learning [1.9] マルチモーダル学習は、単一の関節表現に様々なモダリティを組み合わせることを目的とした、関心の高まりの分野である。
特に視覚言語学(VL)の分野では、画像やテキストを含む様々なタスクを対象とする複数のモデルやテクニックが開発されている。
VLモデルはトランスフォーマーの概念を拡張し、両方のモダリティが互いに学習できるようにし、前例のない性能を達成した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:48:14 GMT)
Understanding Domain-Size Generalization in Markov Logic Networks [1.8] マルコフ論理ネットワーク(MLN)の一般化挙動を,大きさの異なる関係構造にまたがって検討する。
我々は、この矛盾を定量化し、MLNパラメータの分散の観点から境界付ける。
我々は、正規化やドメインサイズ認識MLNなどのMLNパラメータの分散を減少させることで知られている解が、MLNの内部整合性を高めることを観察する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 21:16:56 GMT)
VLUE: A New Benchmark and Multi-task Knowledge Transfer Learning for Vietnamese Natural Language Understanding [1.8] 本稿ではベトナム語理解評価(VLUE)ベンチマークについて紹介する。
VLUEベンチマークは、テキスト分類、スパン抽出、自然言語理解など、異なるNLUタスクをカバーする5つのデータセットを含んでいる。
提案するCafeBERTは,VLUEベンチマークのすべてのタスクにおいて優れた結果が得られる,最先端の事前訓練モデルである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:26:49 GMT)
Sequential Estimation of Gaussian Process-based Deep State-Space Models [1.8] 状態空間モデルと深部状態空間モデルの未知点の逐次推定の問題を考える。
本稿では,ランダム特徴量に基づくガウス過程のパラメータを積分した粒子フィルタリング法を提案する。
提案手法は,潜伏過程をスケールと回転まで追跡できることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:57:18 GMT)
Initialisation and Topology Effects in Decentralised Federated Learning [1.6] 分散フェデレーション学習は、ネットワーク上の分散デバイス上で、個々の機械学習モデルの協調トレーニングを可能にする。
このアプローチはデータのプライバシを高め、単一障害点と集中的な調整の必要性を排除します。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:24:36 GMT)
Boarding for ISS: Imbalanced Self-Supervised: Discovery of a Scaled Autoencoder for Mixed Tabular Datasets [1.2] 不均衡な自己教師付き学習の分野は、広く研究されていない。
既存の研究は主に画像データセットに焦点を当てている。
バランス学習のための新しい指標として,マルチスーパーバイザードバランスMSEを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 10:37:22 GMT)
ContrastWSD: Enhancing Metaphor Detection with Word Sense Disambiguation Following the Metaphor Identification Procedure [1.0] メタファー識別法(MIP)と単語センス曖昧化(WSD)を統合したRoBERTaを用いたメタファメタメタファ検出モデルを提案する。
WSDモデルから派生した単語感覚を利用することで、メタファ検出プロセスを強化し、他の手法より優れる。
我々は,様々なベンチマークデータセットに対するアプローチを評価し,それを強力なベースラインと比較し,メタファ検出の促進効果を示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 03:15:42 GMT)
Local operator quench induced by two-dimensional inhomogeneous and homogeneous CFT Hamiltonians [0.9] 等角体理論(2d CFTs)における非平衡過程は、不均一および等質ハミルトニアンによって誘導される作用素の成長によるものである。
我々の主な発見は、ホログラフ CFT において、不均一ハミルトニアンによって誘導される非単元時間進化は、単元時間進化よりも長い状態情報を保持することができるということである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:04:38 GMT)
Causal Intersectionality and Dual Form of Gradient Descent for Multimodal Analysis: a Case Study on Hateful Memes [0.9] モデル機構が証拠に基づく意思決定に因果的影響を明らかにする方法について検討する。
この研究は、因果性とXAIに関する対話をさらに進める。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:07:54 GMT)
The Impact of Evolutionary Computation on Robotic Design: A Case Study with an Underactuated Hand Exoskeleton [0.7] 本研究では,ロボット設計最適化における進化計算法の可能性について検討する。
EC法は、ブルート力よりも正確で最適な解が得られる。
その結果, デバイスがユーザへ転送するトルクの程度において, 大幅な改善が見られた。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:50:20 GMT)
Safe Reinforcement Learning for Constrained Markov Decision Processes with Stochastic Stopping Time [0.7] 安全制約付きマルコフ決定過程に対するオンライン強化学習アルゴリズムを提案する。
学習方針は高い信頼を持って安全であることを示す。
また、プロキシセットと呼ばれる状態空間のサブセットを定義することで、効率的な探索を実現することができることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 20:22:30 GMT)
Calibrating the role of entanglement in variational quantum circuits [0.6] エンタングルメント(Entanglement)は、量子コンピューティングの重要な性質であり、古典的なものとは分離している。
2つの変分量子アルゴリズムの動作における絡み合いの役割を系統的に検討する。
QAOAを用いて解いたMAX-CUT問題に対して,絡み合い関数としての忠実度は層数に大きく依存することがわかった。
QNNの場合、高いテスト精度のトレーニング回路は高い絡み合いによって支えられ、強制的な絡み合いの制限はテスト精度の急激な低下をもたらす。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:29:21 GMT)
Towards a \textbf{RAG}-based Summarization Agent for the Electron-Ion Collider [0.6] A Retrieval Augmented Generation (RAG)ベースのEIC用要約AI(RAGS4EIC)が開発中である。
このAIエージェントは情報を凝縮するだけでなく、関連する応答を効果的に参照する。
まず、関連するすべての実験情報を含む包括的ベクトルデータベースを問合せし、次に、Large Language Model(LLM)を用いて、ユーザクエリと検索データに基づく引用に富んだ簡潔な要約を生成する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:32:46 GMT)
Topology and entanglement of molecular phase space [0.5] 分子回転状態と核スピン状態の量子位相空間を定式化する。
我々は分子を非対称、回転対称、回転対称の3つのタイプに分類する。
我々は、ハミルトニアン非依存な摂動対称状態空間における2つの特徴を同定する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:24:07 GMT)
LAMPER: LanguAge Model and Prompt EngineeRing for zero-shot time series classification [0.5] 本研究では,Pmpt EngineeRing(LAMPER)フレームワークを用いたLanguAgeモデルを構築し,多種多様なプロンプトの調整において,事前学習言語モデル(PLM)の適応性を体系的に評価する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:52:37 GMT)
MRC-based Nested Medical NER with Co-prediction and Adaptive Pre-training [0.4] 医療分野におけるモデルの能力向上のために,タスク適応型事前学習戦略を用いたMRC(Machine Reading)に基づく医療NERモデルを提案する。
提案手法は, 比較最先端モデル(SOTA)よりも優れている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:14:02 GMT)
Deep Learning Approach to Forecasting COVID-19 Cases in Residential Buildings of Hong Kong Public Housing Estates: The Role of Environment and Sociodemographics [0.3] 本研究は、新型コロナウイルスと研究地区の社会生態学の複雑な関係について検討する。
我々は、多頭部階層型畳み込みニューラルネットワークを用いて、階層的な関連した予測的特徴の膨大な配列を構造化した。
新型コロナウイルスの感染拡大に伴う感染拡大と、新型コロナウイルスの感染拡大に関連する要因が相違していることが判明した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:22:53 GMT)
Optimal Hospital Capacity Management During Demand Surges [0.1] 本研究では,サージイベント中の病院システム内のキャパシティ管理決定を最適化するためのデータ駆動型フレームワークを提案する。
2つの重要な決定は、戦術的な計画の観点で最適化されている。
この手法は、新型コロナウイルスのパンデミックの最盛期に病院システムで振り返って評価され、推奨された決定の潜在的影響を示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:06:06 GMT)
Using Large Language Models for OntoClean-based Ontology Refinement [0.0] 本稿では,大規模言語モデル(LLM)のOntoClean方法論への統合について検討する。
2つのプロンプト戦略を持つLSMを用いることで、ラベル付けプロセスにおける高い精度を実現することができることを示す。
この結果から, LLM が改良する可能性が示唆され, この統合を促進するためのプラグインソフトウェアの開発が提案されている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:09:50 GMT)
UPSS: a User-centric Private Storage System with its applications [0.0] ユーザ中心のプライベート共有システムであるUPSSを,従来あるいはセキュリティに敏感なアプリケーションの基盤として使用可能なストレージシステムとして紹介する。
UPSSのセキュリティ特性と性能特性が既存の暗号より優れており、その性能は成熟した従来のものと同等であることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:35:37 GMT)
The opaque law of artificial intelligence [0.0] 生成型AI(Chat-GPT)の最も優れたNLPモデルの一つのパフォーマンスを評価し、それが現在どこまで進んでいるかを確認する。
問題の分析は、イタリアの古典法に関するコメントで支持される。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:21:58 GMT)
The Limits of Perception: Analyzing Inconsistencies in Saliency Maps in XAI [0.0] 説明可能な人工知能(XAI)は、AIの意思決定プロセスの解明に不可欠である。
ブラックボックス」として機能し、その理由が曖昧でアクセスできないため、誤診のリスクが高まる。
この透明性へのシフトは、単に有益であるだけでなく、医療におけるAI統合の責任を負うための重要なステップでもある。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 02:15:23 GMT)
Supervised Learning via Ensembles of Diverse Functional Representations: the Functional Voting Classifier [0.0] 本稿では,アンサンブルメンバーの学習に異なる関数型データ表現を用いる方法と,多数決によるベースモデル予測をどのように組み合わせることができるかを示す。
このフレームワークは、機能的なデータでアンサンブルを投票するための基盤を提供し、FDAの文脈で非常に奨励された研究ラインを刺激することができる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:24:29 GMT)
Strategies and trade-offs for controllability and memory time of ultra-high-quality microwave cavities in circuit QED [0.0] 超高品質キャビティを用いた効率的な書き込み・読み出し操作は、量子ビットや他の非線形要素の制御に類似した品質要因を必要としないことを示す。
本研究は,超高品質マイクロ波空洞共振器を用いて,ボソニック量子ビットに符号化された情報を保存・処理するための潜在的ロードマップを探究する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:12:30 GMT)
Spatio-Temporal Graph Convolutional Network Combined Large Language Model: A Deep Learning Framework for Bike Demand Forecasting [0.0] 本研究では,時空間グラフ畳み込みネットワーク(STGCN)と大言語モデル(LLM)を組み合わせた新しいディープラーニングフレームワークを提案する。
提案したSTGCN-Lモデルでは,既存のモデルと比較して競争性能が向上し,自転車需要予測の可能性を示している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 05:47:19 GMT)
Semiclassical Limit of the Bogoliubov-de Gennes Equation [0.0] Vlasov方程式により、系のスピン=$frac2$フェルミオンの半古典的および平均場近似を確立する。
いくつかの半古典的状態に対して、二粒子動力学輸送方程式の高次補正を得る。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 16:19:21 GMT)
Relativistic stochastic hydrodynamics from quantum nonlinear projection operator [0.0] 我々は、量子非線形射影作用素の手法に基づいて、相対論的流体力学を体系的に導出する。
応用として、ガウス雑音を伴う相対論的流体力学方程式が導出され、臨界点付近の異常輸送現象の研究に応用できる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 12:33:13 GMT)
Relativistic exponential-type spinor orbitals and their use in many-electron Dirac equation solution [0.0] ディラック・クーロン型微分方程式とその解相対論的指数型スピノル軌道を導入する。
相対論的クーロンエネルギーはポアソン方程式のスペクトル解を用いて1$-$電子ポテンシャルを求めることで決定される。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 20:48:54 GMT)
Relational Quantum Mechanics, Quantum Relativism, and the Iteration of Relativity [0.0] 量子系の力学的性質が他の系と常に相対的であるという考え方は、最近、通貨を回復させた。
ある系が特定の参照に対して持つ性質について絶対的な事実があるだろうか。
より一般的には、RQMと量子相対論のパースペクティビスト版におけるプレーの現状について、いくつかの考察を締めくくる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 20:43:01 GMT)
Quantum state transfer performance of Heisenberg spin chains with site-dependent interactions designed using a generic genetic algorithm [0.0] 遺伝的アルゴリズムを用いてハイゼンベルクスピン鎖の設計について検討する。
チェーン長に沿って滑らかに変化する交換係数を持つハミルトニアンを得る。
以上の結果から,スムーズなハミルトニアンの移動能力は粗いハミルトニアンと同じかそれ以下であり,どちらも静的障害に対するロバスト性を示すことがわかった。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:47:49 GMT)
Quantum coherence enables hybrid multitask and multisource regimes in autonomous thermal machines [0.0] 非平衡効果は熱力学的タスクを行う熱デバイスの性能に大きな影響を及ぼす可能性がある。
本研究は,3端末機を駆動するサーマル貯水池に少量のコヒーレンスが存在することを示し,複合運転モードとハイブリッド運転モードの出現を可能にした。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 11:09:27 GMT)
Quantum advantage in temporally flat measurement-based quantum computation [0.0] 本研究では, 計測に基づく量子計算の効率性について検討した。
非適応MBQCを用いた決定論的評価が可能なブール関数群を同定する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 12:25:36 GMT)
Privacy Dashboards for Citizens and corresponding GDPR Services for Small Data Holders: A Literature Review [0.0] 我々は,小データ保有者に対する市民およびサービスに対するプライバシダッシュボードという形での救済を約束するソリューションに関する文献レビューを行う。
これは、市民が権利を行使し、小さなデータ保有者が義務に従えるようにするためのステップであるべきだ。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:17:10 GMT)
Online Action Learning in High Dimensions: A Conservative Perspective [0.0] 我々は、保守的な高次元崩壊する $epsilon_t$-greedy 則の累積後悔に対する妥当な境界を見出した。
理論的特性に影響を与えずに調整できるので、エンドユーザは、どの程度の安全性を期待できるかを確立するのに十分な柔軟性を持っていることを示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:01:03 GMT)
On the Fragility of Active Learners [0.0] アクティブラーニング(AL)技術は、予測精度を向上させる可能性が最も高いインスタンスを反復的に選択することで、ラベル付け予算を最大限に活用することを目的としている。
本研究では,異なる要因の組み合わせがAL手法から得られる利益を如何に隠蔽するかを検討する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:16:23 GMT)
LlamBERT: Large-scale low-cost data annotation in NLP [0.0] LlamBERTは、Large Language Modelsを利用して、大規模でラベルのないデータベースの小さなサブセットに注釈を付けるハイブリッドアプローチである。
以上の結果から,LlamBERTアプローチはコスト効率を向上しつつ,精度をわずかに損なうことが示唆された。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 21:54:34 GMT)
Leveraging Large Language Models for Preliminary Security Risk Analysis: A Mission-Critical Case Study [0.0] PSRAにおけるヒトの専門家の速度と精度は応答時間に大きく影響した。
PSRAにおける細調整モデル(FTM)の能力について先行研究は行われていない。
提案手法は,PSRAの誤りの低減,セキュリティリスク検出の迅速化,偽陽性と否定の最小化に成功している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:59:30 GMT)
Learning Concepts Definable in First-Order Logic with Counting [0.0] 次数構造のクラス上の FOCN は、線形時間で一貫した学習が可能であることを示す。
任意の定数$c$に対して少なくとも$(log log n)c$の次数の構造のクラスについて、ほぼ正しい(PAC)学習に拡張する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:14:50 GMT)
Kernel-Elastic Autoencoder for Molecular Design [0.0] Kernel-Elastic Autoencoder (KAE) はトランスフォーマーアーキテクチャに基づく自己教師型生成モデルである。
KAEは、ほぼ完全な再構成を維持しながら、分子生成において顕著な多様性を達成している。
我々は、広範囲のアプリケーションで生成することで、問題の解決にKAEを適用することができると期待している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:52:44 GMT)
K-Act2Emo: Korean Commonsense Knowledge Graph for Indirect Emotional Expression [0.0] 韓国のコモンセンス知識グラフ(CSKG)であるK-Act2Emoを紹介する。
我々は,肯定的な状況における推論,否定的な状況における推論,感情的な手がかりとして表現が役に立たない場合の推論に,推論型を分類する。
K-Act2Emoで微調整されたBARTベースの知識モデルは、GPT-4 Turboに匹敵するパフォーマンスレベルを達成し、韓国の様々な大規模言語モデルより優れている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 15:53:50 GMT)
Investigating Similarities Across Decentralized Financial (DeFi) Services [0.0] トランザクションデータを使用して、DeFiビルディングブロックを特定します。
これらはプロトコル固有のスマートコントラクトで、単一のトランザクション内で組み合わせて使用される。
本稿では,これらのブロックをスマートコントラクト属性とスマートコントラクト呼び出しのグラフ構造に基づいてクラスタに分類する手法を提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 09:36:31 GMT)
Intersubband polaritonic metasurfaces for high-contrast ultra-fast power limiting and optical switching [0.0] サブバンド・ポラトニック・メタサイトは、すべての凝縮物質系の中赤外周波数範囲において、最も強力な超高速非線形応答の1つをサポートする。
ここでは,超高速偏光性準曲面リミッタにおいて,大きな反射コントラストを実現するために材料とフォトニックナノ構造の相乗的最適化を示す。
デバイスは、サブバンド間遷移線幅を最小化し、光学飽和ナノ共振器の吸収を低減する最適化された半導体ヘテロ構造材料に基づいており、記録的な54%の反射コントラストを実現している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:54:31 GMT)
Improving Retrieval for RAG based Question Answering Models on Financial Documents [0.0] 本稿では,RAGパイプラインの既存の制約について検討し,テキスト検索の方法を紹介する。
高度なチャンキングテクニック、クエリ拡張、メタデータアノテーションの組み込み、再ランク付けアルゴリズムの適用、埋め込みアルゴリズムの微調整などの戦略を練っている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 00:49:40 GMT)
Horoballs and the subgradient method [0.0] 本研究では,アダマール空間上の凸対象に対する段階的アルゴリズムのスタイルの反復について考察する。
我々の反復は一般のアダマール空間に適用され、基礎空間自体にフレーム化され、対象のレベル集合の球面凸性に依存する。
特に、複雑性は空間曲率の低い境界に依存しない。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:34:18 GMT)
Geotokens and Geotransformers [0.0] 本稿では, 変圧器の入力成分であるジオトケンについて述べる。
典型的な言語列とは異なり、これらのトークンの場合、順序は地理的座標そのものほど重要ではない。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 22:02:56 GMT)
Generation of genuine all-way entanglement in defect-nuclear spin systems through dynamical decoupling sequences [0.0] マルチパーティの絡み合った状態は、検知、量子エラー補正、暗号に不可欠な資源である。
ここでは、最小のクロストークで高品質なGHZ$_M$ライクな状態を作成する方法を示す。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 19:39:08 GMT)
Fractal ground state of ion chains in periodic potentials [0.0] 周期ポテンシャルにおけるトラップイオンはフラストレーションされたウィグナー結晶のパラダイムである。
力学は長距離フレンケル・コントロワモデルによって捉えられる。
実験パラメータと,我々の予測を観察し,明らかにできる特徴について論じる。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:48:07 GMT)
Extracting Emotion Phrases from Tweets using BART [0.0] 本稿では,質問応答の枠組みに基づく感情分析にアプローチを適用する。
我々は、抽出する特定の感情を識別する自然言語質問を作成し、BARTにテキスト中の関連する感情的手がかりに注意を払うよう誘導する。
我々のアプローチは、テキストの完全なコンテキストと意味をキャプチャするなど、ほとんどの感情分析研究に対して、いくつかの利点を提供している。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 14:46:59 GMT)
Deep Gaussian Covariance Network with Trajectory Sampling for Data-Efficient Policy Search [0.0] 確率的世界モデルはモデルベース強化学習(MBRL)のデータ効率を向上させる
我々は,MBRL問題に対するデータ効率のよい解として,軌道サンプリングと深いガウス共分散ネットワーク(DGCN)を組み合わせることを提案する。
本研究では,4つのよく知られた実験環境を用いて,不確実性伝播法と確率モデルの組み合わせによるサンプル効率を向上する実験的なエビデンスを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 18:42:22 GMT)
Centered Masking for Language-Image Pre-Training [0.0] 言語画像事前学習(GLIP)のためのガウスマスキングについて紹介する。
GLIPは視覚言語モデルの事前学習中に画像パッチをマスキングする新しい、単純で効果的な手法である。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:24:31 GMT)
Carbon Intensity-Aware Adaptive Inference of DNNs [0.0] 我々のアルゴリズムは、低強度期間中により大きく、高精度なモデルを使用し、高強度期間中により小さく、より精度の低いモデルを使用する。
また, 炭素フットプリントの観点から, 適応モデル選択の有効性を定量的に測定する指標である炭素放出効率も導入した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 12:33:12 GMT)
An Entangled Universe [0.0] 我々は、インフレーション期の量子的性質の観察的なインプリントにつながる可能性がある初期の宇宙の量子署名を提案する。
銀河の高次相関関数において、このシグネチャをどのように測定できるかを示唆する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 06:50:54 GMT)
An Embarrassingly Simple Defense Against Backdoor Attacks On SSL [0.0] 自己監視学習(SSL)は、人間の監督なしにデータランドスケープに取り組むための強力なパラダイムとして登場した。
最近の研究はSSLがバックドア攻撃に対して脆弱であることを示している。
我々はSSLにおける周波数ベースの攻撃に対する2つの防御戦略を考案した。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 19:21:31 GMT)
ASI as the New God: Technocratic Theocracy [0.0] 本稿は、AIIの非並列的な能力が、神のような不確実性を人々に負わせるかもしれない、と論じる。
この分析は、AIIと全知性、全知性、全知性といった神的属性の類似性を引き出すことにより、技術的進歩を道徳的・倫理的優越性と融合させるリスクを浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 00:48:11 GMT)
A quantization of interacting particle systems [0.0] 相互作用する粒子系をグラフ上のマルコフ連鎖とみなす。
ドマニ・キンゼルモデルに対する量子化モデルの絶対ゼータ関数を計算する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 13:11:15 GMT)
A note on Majorana representation of quantum states [0.0] 任意の$d > 1$ に対して、次元 $d$ と $d-1$ qubits の量子状態はブロッホ球面の $d-1$ 点として表される。
ブロッホ球面上の$d-1$点と対応する$d-1$ qubitsを$d$次元量子状態を表す単純なスキームを提案する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 12:00:46 GMT)
A learning-based solution approach to the application placement problem in mobile edge computing under uncertainty [0.0] モバイルエッジコンピューティングサーバにアプリケーションを配置することは、多くのサーバ、ユーザ、そして彼らの要求にまつわる複雑な課題を示す。
これらのアプローチの1つは機械学習であり、エッジサーバにおけるアプリケーションの配置に最適なソリューションをエミュレートする。
本研究の目的は,モバイルエッジコンピューティングにおける高次元問題や,不確実性を伴うシナリオに対処するための,より効率的なアプローチを提供することである。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 08:27:02 GMT)
A general learning scheme for classical and quantum Ising machines [0.0] 本稿では,Ising構造に基づく機械学習モデルを提案する。
提案した学習モデルのトレーニングと実行に関する実験結果を示す。
特に量子領域では、量子リソースはモデルの実行とトレーニングの両方に使用され、量子機械学習において有望な視点を提供する。
論文参考訳(メタデータ) (Sat, 23 Mar 2024 07:35:03 GMT)