Fugu-MT: arxivの論文翻訳(概要)

MuirBench: A Comprehensive Benchmark for Robust Multi-image Understanding [150.3]
マルチモーダルLLMの堅牢なマルチイメージ理解機能に着目したベンチマークであるMuirBenchを紹介する。 MuirBenchは、12の多様なマルチイメージタスク(例えば、シーン理解、順序付け)で構成されており、10のカテゴリのマルチイメージ関係を含んでいる。 GPT-4oやGemini Proのような最高のパフォーマンスモデルでさえ、ムアベンチを解くことは困難であり、精度は68.0%、49.3%である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:56:14 GMT)
Multilingual Trolley Problems for Language Models [138.1]
この研究は、「道徳機械実験」という人間の道徳的嗜好に関する大規模横断的な研究から着想を得たものである。大規模な言語モデル(LLM)は、英語、韓国語、ハンガリー語、中国語などの言語では人間の好みと一致しているが、ヒンディー語やソマリ語(アフリカ)のような言語では一致していないことを示す。また, LLMが道徳的選択に与える説明を特徴付けるとともに, GPT-3によるGPT-4の決定と実用主義の裏側において, 公平性が最も有力であることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:02:53 GMT)
Enhancing Large Language Models in Coding Through Multi-Perspective Self-Consistency [128.0]
大規模言語モデル(LLM)は、コード生成において顕著な能力を示した。しかし、単一の試みで正しいソリューションを生成することは依然として課題である。本稿では,MPSC(Multi-Perspective Self-Consistency)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:02:02 GMT)
StyleDubber: Towards Multi-Scale Style Learning for Movie Dubbing [125.9]
フレームレベルから音素レベルへのダビング学習を切り替えるStyleDubberを提案する。本研究は,(1) 音素レベルで動作するマルチモーダルスタイル適応器を用いて,参照音声から発音スタイルを学習し,ビデオで提示される顔の感情によって伝達される中間表現を生成すること,(2) メルスペクトル復号と中間埋め込みからの精製プロセスの両方を案内して全体のスタイル表現を改善する発話レベル学習モジュール,(3) 唇同期を維持するための音素誘導唇整合器,の3つの構成要素を含む。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:42:36 GMT)
The Art of Saying No: Contextual Noncompliance in Language Models [123.4]
本稿では,ユーザの要求に従わないモデルについて,コンテキスト非準拠の包括的分類を導入する。我々の分類は、不完全、不完全、不完全、不決定、人為的要求を含む幅広いカテゴリーにまたがる。言語モデルの非準拠性をテストするために,1000個の非準拠プロンプトの新たな評価スイートを開発するために,この分類法を用いる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:12:51 GMT)
Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.6]
脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:31:21 GMT)
AutoRT: Embodied Foundation Models for Large Scale Orchestration of Robotic Agents [109.4]
AutoRTは、人間の監督を最小限に抑えて、完全に見えないシナリオで運用ロボットの展開をスケールアップするシステムである。われわれはAutoRTが複数の建物にまたがる20以上のロボットに指示を提示し、遠隔操作と自律ロボットポリシーを通じて77万個の実ロボットエピソードを収集するデモを行った。実験により,AutoRTが収集した「未使用データ」は極めて多種多様であり,AutoRTのLLMを使用することで,人間の好みに合わせることができるデータ収集ロボットの指示が可能であることを実証した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:52:26 GMT)
Certainly Uncertain: A Benchmark and Metric for Multimodal Epistemic and Aleatoric Awareness [106.5]
視覚言語AIシステムに特有の不確実性の分類法を提案する。また、精度と校正誤差の両方によく相関する新しい計量信頼度重み付き精度を導入する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:23:54 GMT)
VSP: Assessing the dual challenges of perception and reasoning in spatial planning tasks for VLMs [102.4]
視覚言語モデル(VLM)は、エキサイティングな言語モデル(LM)のクラスである。 VLMの未調査能力の1つは、視覚空間計画である。本研究は,これらのモデルにおける空間計画能力を概ね評価するベンチマークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 00:24:01 GMT)
Consistency Flow Matching: Defining Straight Flows with Velocity Consistency [97.3]
本稿では,速度場の自己整合性を明示する新しいFM法であるConsistency Flow Matching(Consistency-FM)を紹介する。予備実験により、一貫性FMは、一貫性モデルよりも4.4倍速く収束することにより、トレーニング効率を著しく向上することが示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:15:37 GMT)
ADD 2022: the First Audio Deep Synthesis Detection Challenge [92.4]
最初のオーディオディープ合成検出チャレンジ(ADD)は、ギャップを埋めるために動機付けられた。 ADD 2022には、低品質の偽オーディオ検出(LF)、部分的に偽オーディオ検出(PF)、オーディオ偽ゲーム(FG)の3つのトラックが含まれている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:06:53 GMT)
Rethinking Machine Unlearning for Large Language Models [85.9]
大規模言語モデル(LLM)の領域における機械学習の研究このイニシアチブは、望ましくないデータの影響(機密情報や違法情報など)と関連するモデル機能を排除することを目的としている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:15:50 GMT)
Learning to Refine with Fine-Grained Natural Language Feedback [81.7]
我々は,3つの異なるLLM能力の構成要素として,フィードバックによる洗練を検討することを提案する。このアプローチの重要な特性は、ステップ2の批判モデルがエラーに関するきめ細かいフィードバックを与えてくれることです。文書基盤要約の現実的整合性を改善する作業において,異なる機能モデルがこのアプローチの精細化の恩恵を受けることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:15:01 GMT)
Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.6]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:00:30 GMT)
Cradle: Empowering Foundation Agents Towards General Computer Control [80.0]
GCCに向けた予備的な試みとして,モジュール型かつフレキシブルなLMM駆動フレームワークであるCradleを紹介した。 Cradleは入力スクリーンショットを理解し、低レベルキーボードと高レベルプランニング後のマウス制御のために実行可能なコードを出力することができる。 Cradleは、これまで探索されていなかった4つの商用ビデオゲーム、5つのソフトウェアアプリケーション、そして包括的なベンチマークであるOSWorldで、目覚ましい一般化性と印象的なパフォーマンスを示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:23:13 GMT)
Towards Robust Speech Representation Learning for Thousands of Languages [77.3]
自己教師付き学習(SSL)は、ラベル付きデータの必要性を減らすことで、音声技術をより多くの言語に拡張するのに役立つ。我々は4057言語にまたがる100万時間以上のデータに基づいて訓練された、ユニバーサル音声のための言語横断言語であるXEUSを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:23:44 GMT)
Terminating Differentiable Tree Experts [77.2]
本稿では,変圧器と表現生成器の組み合わせを用いて木操作を学習するニューラルシンボリック微分木機械を提案する。まず、専門家の混在を導入することで、各ステップで使用される一連の異なるトランスフォーマーレイヤを取り除きます。また,モデルが自動生成するステップ数を選択するための新しい終端アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:45:38 GMT)
Revisiting Backdoor Attacks against Large Vision-Language Models [76.4]
本稿では,LVLMの命令チューニングにおけるバックドア攻撃の一般化可能性について実験的に検討する。以上に基づいて,既存のバックドア攻撃を修正した。本稿では,従来のシンプルなバックドア戦略でさえ,LVLMに深刻な脅威をもたらすことを指摘する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:36:01 GMT)
ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.6]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:33:41 GMT)
Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback [70.3]
リニアアライメントは、言語モデルと人間の好みを1つの推論ステップで整列する新しいアルゴリズムである。一般的な選好データセットとパーソナライズされた選好データセットの実験により、線形アライメントはLLMアライメントの性能と効率を大幅に向上させることが示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:24:29 GMT)
Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning [70.2]
人間のフィードバックによる強化学習(RLHF)は、現在の大規模言語モデルパイプラインにおいて広く採用されているアプローチである。提案手法では,(1)OODを回避するためのオン・ポリシー・クエリと,(2)プライオリティ・クエリの最も情報性の高いデータを選択するためのアクティブ・ラーニングという2つの重要なイノベーションを導入している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:09:19 GMT)
Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.8]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:17:50 GMT)
GSM-Plus: A Comprehensive Benchmark for Evaluating the Robustness of LLMs as Mathematical Problem Solvers [68.8]
大規模言語モデル (LLM) は、様々な数学的推論ベンチマークで顕著な性能を達成している。 1つの必須かつ頻繁な証拠は、数学の質問がわずかに変更されたとき、LLMは誤って振る舞うことができることである。このことは, LLMの数学推論能力の頑健性を評価するために, 幅広い質問のバリエーションを試すことによるものである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:46:03 GMT)
LexMatcher: Dictionary-centric Data Collection for LLM-based Machine Translation [67.2]
本稿では、バイリンガル辞書に見られる感覚のカバレッジによって駆動されるデータキュレーション手法であるLexMatcherを提案する。我々の手法は、WMT2022テストセットの確立されたベースラインよりも優れています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:00:23 GMT)
Masked Attribute Description Embedding for Cloth-Changing Person Re-identification [66.5]
衣服交換者再識別(CC-ReID)は,長期にわたって衣服を交換する者をマッチングすることを目的としている。 CC-ReIDの鍵となる課題は、顔、髪型、体型、歩行など、衣服に依存しない特徴を抽出することである。 CC-ReIDの視覚的外観と属性記述を統一するMasked Attribute Description Embedding (MADE)法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:56:26 GMT)
Coding for Intelligence from the Perspective of Category [66.1]
符号化の対象はデータの圧縮と再構成、インテリジェンスである。最近の傾向は、これらの2つの分野の潜在的均一性を示している。本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:47:02 GMT)
Learning Graph Structures and Uncertainty for Accurate and Calibrated Time-series Forecasting [65.4]
本稿では,時系列間の相関を利用して時系列間の構造を学習し,精度の高い正確な予測を行うSTOICを紹介する。幅広いベンチマークデータセットに対して、STOICは16%の精度とキャリブレーションのよい予測を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:14:32 GMT)
Product Geometries on Cholesky Manifolds with Applications to SPD Manifolds [65.0]
シンメトリー正定値(SPD)多様体上の2つの新しい測度をコレスキー多様体を通して提示する。私たちのメトリクスは使いやすく、計算効率が良く、数値的に安定しています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:46:13 GMT)
LLM-Select: Feature Selection with Large Language Models [64.5]
大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:23:40 GMT)
Why Does New Knowledge Create Messy Ripple Effects in LLMs? [64.5]
GradSimは、LMの知識がいつ、なぜ更新されたのかを効果的に示す指標である。 GradSimは、元の事実の勾配とその関連する知識の間のコサイン類似性によって計算される。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:33:44 GMT)
How to Boost Any Loss Function [63.6]
損失関数の高速化により効率よく最適化できることを示す。古典的な$0の注文設定ではまだ不可能な成果を達成できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:08:23 GMT)
PYRA: Parallel Yielding Re-Activation for Training-Inference Efficient Task Adaptation [61.6]
本稿では,PYRA(Parallel Yielding Re-Activation)手法を提案する。 PYRAは低圧縮率と高圧縮率の両方で競合する全ての手法より優れている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:18:21 GMT)
CFinBench: A Comprehensive Chinese Financial Benchmark for Large Language Models [61.3]
CFinBenchは、中国の文脈下での大規模言語モデル(LLM)の財務知識を評価するための評価ベンチマークである。この質問は、43の第二級カテゴリーにまたがる99,100の質問で構成されており、3つの質問タイプがある: シングルチョイス、マルチチョイス、そして判断である。結果は、GPT4といくつかの中国指向モデルがベンチマークをリードし、平均精度は60.16%であることを示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:34:36 GMT)
Accompanied Singing Voice Synthesis with Fully Text-controlled Melody [61.1]
Text-to-song (TTSong) は、歌声の伴奏を合成する音楽生成タスクである。完全テキスト制御されたメロディで高品質な曲を生成する最初のTTSongモデルであるMelodyLMを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:23:38 GMT)
Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion [61.0]
拡散強制(Diffusion Forcing)は、拡散モデルをトレーニングし、トークンの集合に独立した音レベルを付与する、新たなトレーニングパラダイムである。因果的次トーケン予測モデルを訓練して1つまたは複数の未来のトークンを生成することで、シーケンス生成モデルに拡散強制を適用する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:39:29 GMT)
GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.8]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:55:50 GMT)
Concise and Precise Context Compression for Tool-Using Language Models [60.6]
ツールを用いた言語モデルにおいて,ツール文書を簡潔かつ高精度な要約シーケンスに圧縮する2つの手法を提案する。 API-BankとAPIBenchの結果,最大16倍の圧縮率で上行ベースラインに匹敵する性能を示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:17:00 GMT)
Cocktail: A Comprehensive Information Retrieval Benchmark with LLM-Generated Documents Integration [60.5]
LLM(Large Language Models)の普及は、インターネット上のAIGC(AIGC)の流入につながっている。 AIGCの急増が情報検索システムに与える影響は、まだ明らかな疑問である。我々は、この混合ソースデータランドスケープでIRモデルを評価するのに適したベンチマークであるCocktailを紹介した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:23:37 GMT)
RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs [60.4]
大規模言語モデル(LLM)は、通常、検索拡張生成(RAG)において、レトリバーからトップkコンテキストを利用する。本稿では,RAGにおける文脈ランク付けと回答生成の両目的のために,単一のLLMをチューニング可能な新しい命令微調整フレームワークであるRanRAGを提案する。例えば、GPT-4-0613, GPT-4-turbo-2024-0409, ChatQA-1.5, RAGベンチマークの最先端性能を備えたオープンソースモデルなどである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:59:17 GMT)
Synthetic Multimodal Question Generation [60.3]
MMRAG(Multimodal Retrieval Augmented Generation)は,マルチモーダル文書に対する質問応答のための強力な手法である。マルチモーダル文書から直接質問と回答のペアを生成する合成データ生成フレームワークSMMQGを提案する。 SMMQGを用いて、ウィキペディア文書上の1024の質問のMMRAGデータセットを生成し、それを用いて最先端のモデルを評価する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:57:42 GMT)
Investigating Event-Based Cameras for Video Frame Interpolation in Sports [59.8]
本稿では,スポーツスローモーションビデオを生成するためのイベントベースビデオフレーム補間(VFI)モデルについて検討する。特に,スポーツ映像を撮影するためのRGBとイベントベースカメラを含むバイカメラ記録装置の設計と実装を行い,両カメラの時間的整列と空間的登録を行う。実験により,市販のイベントベースVFIモデルであるTimeLensが,スポーツビデオのスローモーション映像を効果的に生成できることが実証された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:39:08 GMT)
HRSAM: Efficiently Segment Anything in High-Resolution Images [59.5]
本稿では,Flash Attentionを統合し,Plain,Shifted,新たに提案されたCycle-Scan Windowを取り入れたHRSAMを提案する。サイクルスキャンウィンドウアテンションは、計算オーバーヘッドを最小限に抑えるため、最近開発されたステートスペースモデル(SSM)を採用している。高精度セグメンテーションデータセットHQSeg44KとDAVISの実験は、SAM蒸留HRSAMモデルが教師モデルより優れていることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:51:56 GMT)
Secure Semantic Communication via Paired Adversarial Residual Networks [59.5]
本稿では,セキュリティを意識したセマンティック通信システムに対する敵攻撃の正の側面について検討する。セマンティックトランスミッターの後に、セマンティックレシーバーの前に、一対のプラグイン可能なモジュールがインストールされる。提案手法は,高品質なセマンティック通信を維持しつつ,盗聴者を騙すことができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:32:20 GMT)
KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.2]
大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:44:22 GMT)
CEB: Compositional Evaluation Benchmark for Fairness in Large Language Models [58.6]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを処理するために、ますます多くデプロイされている。 LLMが示すバイアスを評価するために、研究者は最近、様々なデータセットを提案している。我々は,様々な社会的グループやタスクにまたがる様々なバイアスをカバーした構成的評価ベンチマークであるCEBを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:31:37 GMT)
Meta 3D AssetGen: Text-to-Mesh Generation with High-Quality Geometry, Texture, and PBR Materials [58.2]
AssetGenはテキストから3D生成の大幅な進歩である。テクスチャと素材制御を備えた忠実で高品質なメッシュを生成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:21:47 GMT)
Meta 3D Gen [57.3]
3DGenは、3Dアセットを作成でき、高速な忠実さと高品質な3D形状とテクスチャを1分以内で提供する。 3DGenは、現実世界のアプリケーションで3Dアセットのリライトに必要な物理ベースのレンダリング(PBR)をサポートする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:37:52 GMT)
Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.2]
カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:11:17 GMT)
PROC2PDDL: Open-Domain Planning Representations from Texts [56.6]
Proc2PDDLは、専門家によるPDDL表現と組み合わせたオープンドメインの手続きテキストを含む最初のデータセットである。以上の結果から, GPT-3.5は0%, GPT-4は35%, Proc2PDDLは極めて困難であることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:50:36 GMT)
WildAvatar: Web-scale In-the-wild Video Dataset for 3D Avatar Creation [55.9]
WildAvatar(ワイルドアバター)は、YouTubeから抽出されたウェブスケールの人間のアバター生成データセットである。我々は,アバター作成における現実のアプリケーションにおける未探索課題を,データセット上でいくつかの最先端アバター作成手法を評価した。データソースリンクとアノテーションを公開し、人間の3Dアバターの作成を進めます。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:17:48 GMT)
Quantum electrodynamics of lossy magnetodielectric samples in vacuum: modified Langevin noise formalism [55.2]
我々は、マクロな媒質中における電磁界の確立された正準量子化から、変形したランゲヴィンノイズの定式化を解析的に導出した。 2つの場のそれぞれが特定のボゾン作用素の項で表現できることを証明し、電磁ハミルトニアンを対角化する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:01:01 GMT)
A Modular Approach for Multimodal Summarization of TV Shows [55.2]
分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:22:14 GMT)
Image-GS: Content-Adaptive Image Representation via 2D Gaussians [55.2]
本稿では,コンテンツ適応型画像表現であるImage-GSを提案する。異方性2Dガウスアンをベースとして、Image-GSは高いメモリ効率を示し、高速なランダムアクセスをサポートし、自然なレベルのディテールスタックを提供する。画像-GSの一般的な効率性と忠実性は、最近のニューラルイメージ表現と業界標準テクスチャ圧縮機に対して検証される。この研究は、機械認識、アセットストリーミング、コンテンツ生成など、適応的な品質とリソース制御を必要とする新しいアプリケーションを開発するための洞察を与えてくれることを願っている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 00:45:21 GMT)
Meta 3D TextureGen: Fast and Consistent Texture Generation for 3D Objects [54.8]
高品質なテクスチャを20秒未満で生成することを目的とした,2つのシーケンシャルネットワークで構成される新しいフィードフォワード方式であるMeta 3D TextureGenを紹介する。提案手法は,2次元空間の3次元セマンティクスにテキスト・ツー・イメージ・モデルを適用し,それらを完全かつ高解像度なUVテクスチャマップに融合することにより,品質とスピードを向上する。さらに、任意の比率で任意のテクスチャをアップスケーリングできるテクスチャ拡張ネットワークを導入し、4kピクセルの解像度テクスチャを生成します。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:04:34 GMT)
GSQA: An End-to-End Model for Generative Spoken Question Answering [54.4]
本稿では,システムに抽象的推論を強制するGSQA(Generative Spoken Question Answering)モデルを提案する。本モデルでは, 抽出QAデータセットにおいて, 従来の抽出モデルよりも3%上回っている。我々のGSQAモデルは、幅広い質問に一般化する可能性を示し、それによって、抽象的QAの音声質問応答能力をさらに拡張する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:24:34 GMT)
A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.1]
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。また,モーザイクアーティファクトを緩和するのには単純だが有効であるHR特徴量に対して,きめ細かな近傍選択戦略を開発した。提案するReSFUフレームワークは,異なるセグメンテーションアプリケーション上での良好な性能を一貫して達成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:12:21 GMT)
Scope-enhanced Compositional Semantic Parsing for DRT [52.7]
談話表現のための構成的, 神経象徴的意味的ニューロシンボリックAMS理論について紹介する。我々は, AMS が良好な出力を確実に生成し, DRT 解析, 特に複雑な文に対して良好に動作することを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:50:15 GMT)
Aligning Human Motion Generation with Human Perceptions [51.8]
本研究では,大規模人間の知覚評価データセットであるMotionPerceptと,人間の動作批判モデルであるMotionCriticを導入することにより,ギャップを埋めるデータ駆動型アプローチを提案する。我々の批評家モデルは、運動品質を評価するためのより正確な指標を提供しており、容易に運動生成パイプラインに統合することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:01:59 GMT)
Homomorphism Autoencoder -- Learning Group Structured Representations from Observed Transitions [51.7]
本研究では,世界に作用するエージェントが,それを修飾する動作と整合した感覚情報の内部表現を学習できるようにする手法を提案する。既存の作業とは対照的に、我々のアプローチはグループの事前の知識を必要とせず、エージェントが実行可能なアクションのセットを制限しない。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:46:13 GMT)
GlotLID: Language Identification for Low-Resource Languages [51.4]
GlotLID-M は広い範囲、信頼性、効率性のデシラタを満たす LID モデルである。 1665の言語を識別し、以前の作業に比べてカバー範囲が大幅に増加した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:34:35 GMT)
ColorVideoVDP: A visual difference predictor for image, video and display distortions [51.3]
メトリックは、色調コントラスト感度とチャンネル間のコントラストマスキングという新しい心理物理学モデルに基づいて構築されている。ディスプレイの観察条件、幾何学的、および測光的特性を考慮に入れている。一般的なビデオストリーミングの歪みと、AR/VRディスプレイに関連する8つの新しい歪みを予測できるように訓練された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:16:38 GMT)
Observational Scaling Laws and the Predictability of Language Model Performance [51.2]
モデルトレーニングを回避し、80の公開モデルからスケーリング法則を構築する観察的アプローチを提案する。いくつかの創発現象が滑らかでシグモダルな挙動を辿り、小さなモデルから予測可能であることを示す。言語モデル機能の改善が進むにつれて、Chain-of-ThoughtやSelf-Consistencyといったポストトレーニング介入の影響を予測する方法を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:16:42 GMT)
Exploring the Role of Transliteration in In-Context Learning for Low-resource Languages Written in Non-Latin Scripts [50.4]
非ラテン文字で書かれた低リソース言語に対するLLMの性能向上にも効果があるか検討する。本稿では,(1) の原文,(2) ラテン文字,(3) の両文を対象とする3つのプロンプトテンプレートを提案する。本研究の結果から,翻訳の有効性はタスクタイプやモデルサイズによって異なることが明らかとなった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:51:20 GMT)
Exploring Federated Learning Dynamics for Black-and-White-Box DNN Traitor Tracing [49.2]
本稿では,フェデレートラーニングにおける白黒裏切り者追跡の適応について検討する。以上の結果から,情報漏えいを疑うデータ所有者を識別するコラシオン耐性トレプレクターの追跡は,訓練の初期段階においてもFLフレームワークで可能であることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:54:35 GMT)
Automated Text Scoring in the Age of Generative AI for the GPU-poor [49.2]
自動テキストスコアリングのためのオープンソースの小規模生成言語モデルの性能と効率を解析する。以上の結果から, GLMは, 最先端の高性能化には至らず, 適正な調整が可能であることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:17:01 GMT)
Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.7]
本稿では,人間とロボットの協調学習システムについて紹介する。これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。また、人間の操作者は、手動制御と自動制御のトレードオフを達成するために制御比率を調整できる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:15:11 GMT)
ValueScope: Unveiling Implicit Norms and Values via Return Potential Model of Social Interactions [47.9]
我々は、13のRedditコミュニティで言語的およびスタイリスティックな表現を識別し分析するためにValueScopeを使用します。我々の分析は、近縁なコミュニティでさえ、非常に多様な規範を示すことを示す定量的基盤を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:51:27 GMT)
Investigating the Effects of Large-Scale Pseudo-Stereo Data and Different Speech Foundation Model on Dialogue Generative Spoken Language Model [47.7]
単一チャネルの対話データを擬似ステレオデータに変換するパイプラインを開発する。これにより、トレーニングデータセットを2,000時間から17,600時間に拡大しました。この擬似ステレオデータの導入は、音声対話言語モデルの性能向上に有効であることが証明されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:22:41 GMT)
Data Augmentation using Large Language Models: Data Perspectives, Learning Paradigms and Challenges [47.5]
データ強化(DA)は、データ収集を必要とせずにトレーニング例を多様化することにより、モデルパフォーマンスを向上させる重要な手法として登場した。本調査では,大規模言語モデル(LLM)がDAに与える影響,特に自然言語処理(NLP)以降の文脈において,それらが持つ固有の課題と機会に対処する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:59:40 GMT)
Privacy Risks of General-Purpose AI Systems: A Foundation for Investigating Practitioner Perspectives [47.2]
強力なAIモデルによって、幅広いタスクでパフォーマンスが飛躍的に向上した。プライバシの懸念は、さまざまなプライバシのリスクとAIモデルの脆弱性をカバーした、豊富な文献につながっている。我々はこれらの調査論文の体系的なレビューを行い、GPAISにおけるプライバシーリスクの簡潔かつ有用な概観を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:49:48 GMT)
Learning Neural Volumetric Pose Features for Camera Localization [47.1]
本稿では,PoseMapと呼ばれるニューラルボリュームポーズ機能を導入し,カメラのローカライゼーションを強化した。我々のフレームワークは、拡張されたNeRFモジュールとともにAPR(Absolute Pose Regression)アーキテクチャを活用している。室内および屋外のベンチマークシーンで平均14.28%, 20.51%の性能向上が得られた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:36:58 GMT)
Understanding Alignment in Multimodal LLMs: A Comprehensive Study [46.3]
マルチモーダル大言語モデル(MLLM)における嗜好アライメントのそれぞれの側面を解析する。オフライン手法とオンライン手法を組み合わせることで,特定のシナリオにおけるモデルの性能が向上することを示す。 BDHS(Bias-Driven Hallucination Smpling)と呼ばれる,マルチモーダルな嗜好データ作成手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:55:03 GMT)
PromptIntern: Saving Inference Costs by Internalizing Recurrent Prompt during Large Language Model Fine-tuning [45.8]
本稿では,プログレッシブ微調整によるモデルパラメータへの迅速な知識を内部化するための新しい手法であるPromptInternを提案する。提案手法は推論トークンの90%以上を削減し、推論を4.2倍に高速化し、88.3%の金銭的コストを節約する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:21:14 GMT)
Privacy-Preserving Instructions for Aligning Large Language Models [45.7]
本稿では,データアノテーションとモデル微調整における実命令を置き換えるための合成命令を提案する。形式的な差分プライバシーは、プライベートな微調整されたジェネレータを使用して合成命令を生成することで保証される。教師付き微調整では、プライベートな合成命令で訓練されたモデルは、Vicunaのような主要なオープンソースモデルよりも優れている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:57:07 GMT)
AXIAL: Attention-based eXplainability for Interpretable Alzheimer's Localized Diagnosis using 2D CNNs on 3D MRI brain scans [45.6]
本研究では,3次元MRIを用いたアルツハイマー病診断の革新的手法を提案する。提案手法では,2次元CNNがボリューム表現を抽出できるソフトアテンション機構を採用している。ボクセルレベルの精度では、どの領域に注意が払われているかを同定し、これらの支配的な脳領域を同定する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:44:00 GMT)
StructLDM: Structured Latent Diffusion for 3D Human Generation [45.5]
StructLDMは2次元画像から学習した拡散に基づく非条件の人間の生成モデルである。ポーズ/ビュー/シェイプコントロールや、合成世代、部品認識の衣服編集、3Dバーチャルトライオンなどのハイレベルなタスクなど、さまざまなレベルのコントロール可能な3Dヒューマン生成と編集を可能にする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:53:03 GMT)
Lung-CADex: Fully automatic Zero-Shot Detection and Classification of Lung Nodules in Thoracic CT Images [45.3]
コンピュータ支援診断は早期の肺結節の検出に役立ち、その後の結節の特徴づけを促進する。 MedSAMと呼ばれるSegment Anything Modelの変種を用いて肺結節をゼロショットでセグメント化するためのCADeを提案する。また、放射能特徴のギャラリーを作成し、コントラスト学習を通じて画像と画像のペアを整列させることにより、良性/良性としての結節的特徴付けを行うCADxを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:30:25 GMT)
C3L: Content Correlated Vision-Language Instruction Tuning Data Generation via Contrastive Learning [45.2]
コントラスト学習(C3L)によるコンテンツ関連VLITデータ生成を提案する。具体的には、VLITデータと画像間のコンテンツ関連性を高める新しいコンテンツ関連モジュールを設計する。 LVLMのVLITデータ生成能力をさらに向上させるために、対照的な学習モジュールが導入された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:05:24 GMT)
Large-scale quantum reservoir learning with an analog quantum computer [45.2]
我々は中性原子アナログ量子コンピュータの量子力学を利用してデータを処理する量子貯水池学習アルゴリズムを開発した。アルゴリズムを実験的に実装し、機械学習タスクの様々なカテゴリで競合性能を達成する。本研究は,従来の量子相関を有効機械学習に活用する可能性を示すものである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:00:00 GMT)
Physical consequences of gauge optimization in quantum open systems evolutions [45.0]
我々は、ゲージ変換を自分自身で活用して、実用的な物理タスクを最適化できることを示します。まず、量子マルコフ力学において基礎となる対称性の固有構造を記述する。次に、量子熱力学における最適化の例を分析する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:22:11 GMT)
Efficient Sparse Attention needs Adaptive Token Release [44.5]
大規模言語モデル(LLM)は、幅広いテキスト中心のタスクで顕著な機能を示している。キャッシュからリソースを適応的にリリースし、必要なキー値状態の再構築を提案する。提案手法は,最大221.8%のスループット向上を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:58:44 GMT)
Knowledge of Knowledge: Exploring Known-Unknowns Uncertainty with Large Language Models [44.1]
我々は,不確定な回答がないことによる不確実性の高さを特徴とする,未知の疑問に対処することに注力する。研究を容易にするために,Known-Unknown Questions (KUQ) を用いた新しいデータセットを収集した。本稿では、このデータセットを用いて微調整したオープンソースのLLMの性能について検討し、未知のクエリと未知のクエリを区別する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:39:50 GMT)
ImageFlowNet: Forecasting Multiscale Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images [44.1]
ImageFlowNetは、共同埋め込み空間におけるマルチスケール表現を進化させる潜在空間フローフィールドを学習する新しいフレームワークである。我々は、ODEの定式化を支援し、高レベルの視覚的特徴を含む正規化を動機付ける理論的洞察を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:53:43 GMT)
Band-Attention Modulated RetNet for Face Forgery Detection [44.1]
トランスフォーマーネットワークは、大規模なデータセットにまたがるスケーラビリティのために、顔の偽造検出に広く利用されている。広義の視覚的コンテキストを効率的に処理する軽量ネットワークであるBAR-Netを導入する。本稿では、離散コサイン変換スペクトログラム全体を、学習可能な重み付き一連の周波数帯域として扱う適応周波数帯域変調機構を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:19:01 GMT)
Expressivity of Neural Networks with Random Weights and Learned Biases [44.0]
最近の研究は、任意の関数がパラメータの小さな部分集合をチューニングすることによって同様に学習できることを示し、普遍近似の境界を推し進めている。ランダムな重みを固定したフィードフォワードニューラルネットワークが、バイアスのみを学習することによって複数のタスクを実行することができることを示す理論的および数値的なエビデンスを提供する。我々の結果は神経科学に関係しており、シナプスの重みを変えることなく動的に行動に関連のある変化が起こる可能性を実証している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:48:36 GMT)
CountFormer: Multi-View Crowd Counting Transformer [43.9]
我々は,マルチビュー画像レベルの特徴をシーンレベルのボリューム表現に高めるために,textbfCountFormerと呼ばれる3D MVCフレームワークを提案する。カメラエンコーディング戦略を導入することで、CountFormerは、ボリュームクエリと画像レベルの機能にカメラパラメータを埋め込むことに成功した。提案手法は,様々な広く使用されているデータセットに対して,最先端のアプローチに対して好意的に機能する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:19:48 GMT)
Video Watermarking: Safeguarding Your Video from (Unauthorized) Annotations by Video-based LLMs [43.8]
ビデオウォーターマーキング(英語: Video Watermarking)は、ビデオベースの大規模言語モデルによって、未承認のアノテーションからビデオを保護する技術である。ビデオによるLLMの誤使用を防止しつつ視聴体験を保存している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:34:14 GMT)
Leveraging Large Language Models for Learning Complex Legal Concepts through Storytelling [43.2]
我々は,非専門家がストーリーテリングを通じて複雑な法的概念を学ぶのを支援するために,法律教育における大規模言語モデル(LLM)の新たな応用法を提案する。そこで我々は,294の複雑な法的教義からなり,それぞれに物語と複数の選択肢の質問が伴う新たなデータセットであるLegalStoriesを紹介した。 LLMが生成した物語は、定義のみに比較して、法的概念の理解と、非ネイティブ話者間の法律への関心を高めることが判明した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:50:42 GMT)
Uformer-ICS: A U-Shaped Transformer for Image Compressive Sensing Service [43.2]
画像CSタスクのための新しいU字型トランスとしてUformer-ICSを提案する。推定ブロック間隔に基づいて測定資源を割り当てる適応型サンプリングアーキテクチャを設計する。本モデルでは,画像の局所的特徴と長距離依存性を同時に利用することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:26:09 GMT)
PLeaS -- Merging Models with Permutations and Least Squares [43.2]
モデル決定型PLeaSをマージする2段階のアルゴリズムを提案する。 PLeaSはアライメントを最大化することで各層のノードに部分的にマッチする。マージされたモデルの重みをレイヤワイズ・リースト・スクエアの解として計算する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:24:04 GMT)
LPViT: Low-Power Semi-structured Pruning for Vision Transformers [42.9]
画像解析タスクのための畳み込みニューラルネットワークの代替手段として、ビジョントランスフォーマー(ViT)が登場した。 ViTの重大な欠点の1つは、リソース集約性であり、メモリフットプリント、複雑性、消費電力が増加することである。我々は,ViTの資源集約的な問題に対処するため,新しいブロック構造プルーニングを導入し,精度とハードウェアアクセラレーションのバランスのとれたトレードオフを提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:58:19 GMT)
A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses [42.1]
大きな言語モデル(LLM)は、x2013$x2013$methodsのリークに対して脆弱である。我々は、悪意ある目標を達成するために不寛容な情報を利用する推論敵と呼ばれる推論脅威モデルを導入する。私たちの研究は、安全なジェイルブレイクを解放するための要件と、関連するユーティリティコストに関する、理論上は初めての理解を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:19:25 GMT)
DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.1]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:33:32 GMT)
Towards a Holistic Framework for Multimodal Large Language Models in Three-dimensional Brain CT Report Generation [42.1]
2Dラジオグラフィーキャプションは、ボリューム3D解剖学における現実の診断課題を反映するものではない。我々は18,885組の3D-BrainCTデータセットを収集し,臨床ビジュアルインストラクション・チューニングを用いて,脳波モデルを用いて放射線治療を施した3D脳CTレポートを作成した。私たちの研究は、3Dの脳CTデータセットのキュレーション、微調整による解剖学的意味のある言語モデル、堅牢な放射線学評価指標の提案など、総合的な枠組みを具現化したものです。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:58:35 GMT)
ScaleDreamer: Scalable Text-to-3D Synthesis with Asynchronous Score Distillation [41.9]
テキスト・ツー・イメージの拡散先を利用することにより、スコア蒸留は、ペアのテキスト3Dトレーニングデータなしで3Dコンテンツを合成することができる。現在のスコア蒸留法は、大量のテキストプロンプトまでスケールアップするのは難しい。本稿では,拡散時間ステップを先行値にシフトすることで,ノイズ予測誤差を最小限に抑える非同期スコア蒸留法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:12:14 GMT)
Aligning Large Language Models with Human Preferences through Representation Engineering [41.8]
表現工学(RepE)の新たな分野から着想を得た本研究は,LLM内の活動パターンに埋め込まれた高レベルの人間の嗜好の関連表現を特定することを目的としている。この新しいアプローチは、人間フィードバックからの表現アライメント(Representation Alignment from Human Feedback、RAHF)と呼ばれ、効果的で、計算的に効率的で、実装が容易であることが証明されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:07:14 GMT)
MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification [41.5]
本稿では,マルチモーダル数学推論のための新しいベンチマークMM-MATHを提案する。 MM-MATHは、5,929個のオープンエンド中等教育数学問題と視覚的文脈を持ち、難易度、学級レベル、知識点の詳細な分類を行う。最高の性能モデルはMM-MATHで31%の精度しか達成していないが、人間では82%である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:46:23 GMT)
Knowledge Transfer from Vision Foundation Models for Efficient Training of Small Task-specific Models [41.3]
大量のデータセットに事前訓練されたビジョンファウンデーションモデル(VFM)は、さまざまな下流タスクで素晴らしいパフォーマンスを示す。高い推論計算コストのため、これらのモデルは現実世界の多くのアプリケーションにデプロイすることはできない。本稿では,課題指向の知識伝達手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 00:22:16 GMT)
Referring Atomic Video Action Recognition [40.9]
我々は、Referring Atomic Video Action Recognitionと呼ばれる新しいタスクを導入する。我々は、テキストで導かれる特定の個人の正しい原子活動を認識することに集中する。テキスト記述を手作業で記述した36,630のインスタンスを含むRefAVAデータセットを提示する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:13:05 GMT)
Preserving Full Degradation Details for Blind Image Super-Resolution [40.2]
劣化低分解能画像(LR)の再生による劣化表現の学習方法を提案する。復調器に入力LR画像の再構成を誘導することにより、その表現に全劣化情報をエンコードすることができる。実験により, 精度が高く, 強靭な劣化情報を抽出できることが確認された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:39:21 GMT)
Reliable Confidence Intervals for Information Retrieval Evaluation Using Generative A.I [39.9]
大規模言語モデル(LLM)は、相対的に計算コストの少ない大規模で関連アノテーションを生成することができる。本稿では,予測型推論と共形リスク制御に基づく2つの手法を提案する。実験の結果,CIは評価のばらつきと偏りの両方を正確に捉えていることがわかった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:44:00 GMT)
GraphWiz: An Instruction-Following Language Model for Graph Problems [39.7]
GraphInstructは、言語モデルに明示的な推論パスを用いて、幅広いグラフ問題に対処する機能を持たせるために設計されたデータセットである。 GraphWizは、明確な推論プロセスを生成しながら、さまざまなグラフ問題タイプを解決できるオープンソースの言語モデルです。拡張モデルであるGraphWiz-DPOは、9つのタスクで平均65%の精度を達成し、GPT-4を平均43.8%上回っている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:40:30 GMT)
To Forget or Not? Towards Practical Knowledge Unlearning for Large Language Models [39.4]
大規模な言語モデル(LLM)は、個人プライバシー情報や著作権資料などの機密データを必然的に保持する。知識未学習の最近の進歩は、特定の知識を消去するためにLLMパラメータを更新する。著作権付きコンテンツとユーザプライバシドメインを含むベンチマークであるKnowUnDoを導入し、未学習プロセスが必然的に本質的な知識を消去するかどうかを評価する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:34:16 GMT)
Occlusion-Aware Seamless Segmentation [38.8]
これら3つの課題に同時に取り組む新しいタスク,Occlusion-Aware Seamless (OASS)を導入する。ベンチマークのために、Blending Panoramic Amodal Seamlessのための新しい人間アノテーション付きデータセットを構築した。 BlendPASSデータセットの最先端性能を達成し、26.58%、mIoU43.66%という驚くべきmAPQに達した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:41:12 GMT)
Fake News Detection and Manipulation Reasoning via Large Vision-Language Models [38.5]
本稿では,Human-centric and Fact-related Fake News(HFFN)と呼ばれる偽ニュースの検出と操作の推論のためのベンチマークを紹介する。このベンチマークでは、詳細なマニュアルアノテーションによって、人間の中心性と、高い事実的関連性を強調している。 M-DRUM(Multi-modal News Detection and Reasoning langUage Model)が提示される。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:16:43 GMT)
Step-Controlled DPO: Leveraging Stepwise Error for Enhanced Mathematical Reasoning [38.1]
ステップ制御DPOは、特定のステップでエラーを発生させる数学的推論論理の負のサンプルを生成する。これらのサンプルをDPOトレーニングに適用することにより、SCDPOは推論エラーを理解し、正確な推論ステップを出力するようにモデルを整合させることができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:46:35 GMT)
PWM: Policy Learning with Large World Models [37.7]
強化学習(RL)は複雑なタスクにおいて印象的な結果を得たが、異なる実施形態を持つマルチタスク設定に苦戦している。我々は,大規模マルチタスク世界モデルから連続制御ポリシを学習する新しいモデルベースRLアルゴリズムである,大規模世界モデルを用いたポリシー学習(PWM)を紹介する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:47:03 GMT)
UltraPixel: Advancing Ultra-High-Resolution Image Synthesis to New Peaks [36.6]
カスケード拡散モデルを用いて高画質画像を複数解像度で生成する新しいアーキテクチャであるUltraPixelを提案する。後半の認知段階における低分解能画像のセマンティクスに富んだ表現を用いて、高精細高分解能画像の全生成を導く。我々のモデルは、データ要求を減らして高速なトレーニングを行い、フォトリアリスティックな高解像度画像を生成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:02:19 GMT)
MeMemo: On-device Retrieval Augmentation for Private and Personalized Text Generation [36.5]
我々はMeMemoを紹介した。MeMemoは最先端に近い近接検索技術であるHNSWをブラウザ環境に適用する最初のオープンソースのJavaScriptツールキットである。 MeMemoは、プライベートでパーソナライズされたコンテンツ作成やインタラクティブなプロトタイピングなど、エキサイティングな新しいデザインと研究の機会を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:08:55 GMT)
MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention [36.5]
Minference (Milliontokens Inference) は長周期処理の前処理を高速化するスパース計算法である。我々は,MInferenceが精度を維持しつつ,A100にプリフィルする際の推論遅延を最大10倍に効果的に低減できることを実証した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:59:56 GMT)
TrAME: Trajectory-Anchored Multi-View Editing for Text-Guided 3D Gaussian Splatting Manipulation [36.0]
TAS(Trajectory-Anchored Scheme)による複数ビューの整合性を保証するプログレッシブな3D編集戦略を提案する。 TASは2Dビュー編集と3D更新の間に密結合された反復プロセスを促進し、テキスト・ツー・イメージ・プロセスから得られるエラーの蓄積を防ぐ。本稿では,2次元ビューの編集中に,ソースブランチからのクロスビューセマンティクスと幾何参照を利用して,対象ブランチからアライメントされたビューを出力する,調整不要なビュー一貫性注意制御(VCAC)モジュールを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:06:58 GMT)
Bayesian Regret Minimization in Offline Bandits [35.8]
オフライン線形包帯におけるベイズ的後悔を最小限に抑える決定の仕方について検討する。 LCBへの依存は本質的にこの設定に欠陥がある、と我々は主張する。我々の限界は金融リスク対策への新たなつながりに大きく依存している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:10:03 GMT)
Indoor 3D Reconstruction with an Unknown Camera-Projector Pair [35.7]
カメラプロジェクタペア(CPP)を用いた構造的光ベース法は室内3次元再構成において重要な役割を担っている。従来の手法は通常、既知の対象から事前校正された、または多視点観測から自己校正された、既知の内在論を仮定する。既知のオブジェクトが存在しない2つのビューのみからCPPの内在性を確実に回復することは依然として困難である。 CPPの内在性に関する十分な制約は,室内のシーンでよく見られる未知の立方体角(C2)から導出できることが実証された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:30:13 GMT)
Ctrl-Room: Controllable Text-to-3D Room Meshes Generation with Layout Constraints [35.1]
我々はCtrl-Roomを提案する。Ctrl-Roomは、デザイナースタイルのレイアウトとテキストプロンプトから高忠実なテクスチャを持つ説得力のある3Dルームを生成できる。 Ctrl-Roomは、個々の家具アイテムのリサイズや移動といった多目的なインタラクティブな編集操作を可能にする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:40:32 GMT)
Robust Zero-Shot Text-to-Speech Synthesis with Reverse Inference Optimization [34.5]
本稿では,自己回帰モデルに基づく音声合成システム(TTS)の堅牢性を高めるために,リバース推論最適化(RIO)を提案する。 RIOは、RTSシステム自体によって生成された音声サンプルからRLHFで使用される例を選択するために、逆推論を使用する。 RIOは、トレーニングと推論条件の相違を低減し、ゼロショットTS性能の安定性を著しく向上する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:04:04 GMT)
Open Panoramic Segmentation [34.5]
我々は、FoV制限されたピンホール画像をオープン語彙設定でトレーニングする、Open Panoramic (OPS)と呼ばれる新しいタスクを定義する。また,DAN (Deformable Adapter Network) を用いた OOOPS モデルを提案し,パノラマセマンティックセマンティックセマンティクスの性能を大幅に向上させる。ピンホール源領域からの歪みを考慮した空間モデリング機能をさらに強化するため、ランダム等角射影(RERP)と呼ばれる新しいデータ拡張手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:00:32 GMT)
Predicting vs. Acting: A Trade-off Between World Modeling & Agent Modeling [34.4]
RLHF準拠のLMは、ベンチマークと長文生成の両方で前例のない能力を示している。 RLHFモデルが人間との対話を目的としたエージェントモデルになるにつれ、彼らは世界モデリングを失うように思われる。我々は、コヒーレントな長文生成を行うために、暗黙の青写真を通してランダム性を制限したRLHFモデルを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:22:54 GMT)
Towards the Next Frontier in Speech Representation Learning Using Disentanglement [34.2]
本稿では,フレームレベルと発話レベルのエンコーダモジュールから構成される音声の拡散自己監督学習(Learning2Diss)のためのフレームワークを提案する。提案したLearn2Dissは,フレームレベルのエンコーダ表現が意味的タスクを改善する一方で,発話レベルの表現が非意味的なタスクを改善することにより,様々なタスクにおける最先端の結果が得られることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:13:35 GMT)
Evaluating Character Understanding of Large Language Models via Character Profiling from Fictional Works [33.8]
大規模言語モデル(LLM)は印象的なパフォーマンスを示し、多くのAIアプリケーションに拍車をかけた。これらのRPAの前提条件は、LLMが架空の作品からキャラクターを理解する能力にある。これまでの努力は、基本的な分類タスクや特徴的模倣を通じて、この機能を評価してきた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:01:27 GMT)
Fixed-length Dense Descriptor for Efficient Fingerprint Matching [33.8]
指紋照合のためのFDD(Fixed-length Dense Descriptor)と呼ばれる3次元表現を提案する。 FDDは優れた空間特性を備えており、元の指紋の空間的関係を捉えることができる。各種指紋データを用いた実験により,FDDが他の固定長ディスクリプタよりも優れていることがわかった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:53:18 GMT)
Livestock feeding behaviour: A review on automated systems for ruminant monitoring [33.7]
本論文は,反響者の摂食行動の分析に関する最初のチュートリアルスタイルのレビューである。摂食行動に関連する信号を計測し分析するための主要なセンシング手法と主要な技術を評価する。また、価値ある情報を提供する自動監視システムの可能性を強調している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:04:32 GMT)
OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation [33.6]
本稿では,表現的キャプションを備えた高精度な高品質データセットOpenVid-1Mを紹介する。また、OpenVid-1Mから433K 1080pのビデオをキュレートしてOpenVidHD-0.4Mを作成し、高精細ビデオ生成を推進した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:40:29 GMT)
Selective Pre-training for Private Fine-tuning [33.6]
パブリックデータセットでの注意深い事前トレーニングは、小さな言語モデルを異なるプライバシでトレーニングするために不可欠であることを示す。その結果、より小さなモデルでは、注意深い事前トレーニングとプライベートな微調整によって、プライベートデータにアクセスできないはるかに大きなモデルの性能にマッチすることを示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:05:36 GMT)
MIGC++: Advanced Multi-Instance Generation Controller for Image Synthesis [33.5]
マルチインスタンス生成(MIG)タスクを導入し、単一のイメージ内で複数のインスタンスを生成することに焦点を当てる。 MIGは、インスタンス間の属性リークを避けること、多様なインスタンス記述をサポートすること、反復生成における一貫性を維持することの3つの大きな課題に直面している。これらの手法を評価するためにCOCO-MIGとMultimodal-MIGベンチマークを導入する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:59:37 GMT)
4D-Rotor Gaussian Splatting: Towards Efficient Novel View Synthesis for Dynamic Scenes [33.1]
異方性 4D XYZT Gaussian を用いた動的シーンの表現法である 4DRotorGS を紹介する。 4DRotorGSは空間的時間的表現として、複雑な力学と細部をモデル化する強力な能力を示している。さらに、3090 GPUで最大277FPS、4090 GPUで最大583FPSのリアルタイムレンダリング速度を達成するために、時間スライシングとアクセラレーションのフレームワークを実装しています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:33:07 GMT)
Revisiting Cascaded Ensembles for Efficient Inference [32.9]
機械学習推論をより効率的にするための一般的なアプローチは、サンプル固有の適応スキームを使用することである。本研究では適応推論の簡単なスキームについて検討する。私たちは、資源効率の良いモデルから始まり、より大きくより表現力のあるモデルへと成長する、アンサンブルのカスケード(CoE)を構築します。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:14:12 GMT)
SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration [32.9]
本研究では,大規模シーンにおけるリアルタイム手法間の最先端の精度を実現するビュー合成手法であるSMERFを紹介する。弊社のアプローチは、Webブラウザ内で6自由度(6DOF)を実現し、コモディティスマートフォンやラップトップ上でリアルタイムにレンダリングする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:26:28 GMT)
S2D: Sorted Speculative Decoding For More Efficient Deployment of Nested Large Language Models [32.7]
より高速な推論のためのドラフトモデルをデプロイするための、新しいマルチターゲットシナリオを紹介します。マルチターゲット設定における正規ベースラインよりも優れた、より効率的なソートされた投機的復号化機構を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:14:15 GMT)
HC-GLAD: Dual Hyperbolic Contrastive Learning for Unsupervised Graph-Level Anomaly Detection [32.6]
非教師付きグラフレベル異常検出(HC-GLAD、略して)のための新しい双曲双曲双曲型コントラスト学習法を提案する。ノード群接続を利用するために、金モチーフに基づいてハイパーグラフを構築し、その後ハイパーグラフ畳み込みを行う。実世界のグラフの階層性を維持するため、この領域に双曲幾何学を導入し、双曲型モデルを用いた双曲型空間におけるグラフと双曲型埋め込み学習を行う。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:38:32 GMT)
Efficient-Empathy: Towards Efficient and Effective Selection of Empathy Data [32.5]
感性・合理性スコアに基づくデータ選択アルゴリズムであるEfficient-Empathyを提案する。我々の訓練された感性モデルは、最先端(SoTA)の性能を効率的に達成する。感度と合理性データをMoE構造と組み合わせることで,さらに高い性能を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:11:52 GMT)
LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis [32.5]
ログ解析タスクにおける大規模言語モデルの性能を評価するために設計されたベンチマークスイートであるLogEvalを紹介する。このベンチマークでは、ログ解析、ログ異常検出、ログ障害診断、ログ要約などのタスクをカバーしている。 LogEvalは4000の公開ログデータエントリを使用して各タスクを評価し、各タスクに対して15の異なるプロンプトを使用して、徹底的で公正な評価を保証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:39:33 GMT)
Farsight: Fostering Responsible AI Awareness During AI Application Prototyping [32.2]
私たちはFarsightという、プロトタイピング中のAIアプリケーションから潜在的な害を識別する新しい対話型ツールを紹介します。ユーザのプロンプトに基づいて、Farsightは関連するAIインシデントに関するニュース記事を強調し、LLM生成したユースケースやステークホルダ、障害を調査、編集することを可能にする。 10人のAIプロトタイプを用いた共同設計研究と42人のAIプロトタイプを用いたユーザスタディから得られた知見を報告する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:12:05 GMT)
Counterfactual Data Augmentation with Denoising Diffusion for Graph Anomaly Detection [32.2]
グラフ異常検出のための教師なし対実データ拡張法CAGADを提案する。グラフ固有の拡散モデルを設計し、その近傍の一部(おそらく通常のもの)を異常なものに翻訳する。翻訳された異常な隣人を集約することで、偽造表現はより識別しやすくなり、さらに検出性能を主張する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:37:54 GMT)
WTU-EVAL: A Whether-or-Not Tool Usage Evaluation Benchmark for Large Language Models [31.7]
大きな言語モデル(LLM)は、NLPタスクに優れていますが、その能力を拡張するための外部ツールが必要です。 11個のデータセットでLCMを評価するためにW whether-or-notツール利用評価ベンチマーク(WTU-Eval)を導入する。 WTU-Eval 上での8つの LLM の結果は、LLM が一般的なデータセットでツールの使用方法を決定するのにしばしば苦労していることを示している。微調整のLlama2-7Bは14%の性能向上と16.8%の誤ったツール使用率の低下をもたらす。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:07:38 GMT)
Open-Source Conversational AI with SpeechBrain 1.0 [31.6]
SpeechBrainはオープンソースのConversational AIツールキットで、PyTorchをベースとしている。事前トレーニングされたモデルと、トレーニングに必要なコードとアルゴリズムの完全な“レシピ”の両方をリリースすることで、透明性と複製性を促進する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:53:10 GMT)
Extracting and Encoding: Leveraging Large Language Models and Medical Knowledge to Enhance Radiological Text Representation [31.4]
自由テキストラジオグラフィーレポートから高品質な事実文を抽出するための新しい2段階フレームワークを提案する。我々のフレームワークには胸部X線テキスト生成システムを評価するための新しい埋め込みベースのメトリクス(CXRFE)も含まれている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:39:19 GMT)
Efficient Evolutionary Search Over Chemical Space with Large Language Models [31.3]
最適化の目的は区別できない。化学対応大規模言語モデル(LLM)を進化的アルゴリズムに導入する。我々のアルゴリズムは最終解の質と収束速度の両方を改善する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:12:38 GMT)
Unveiling Global Interactive Patterns across Graphs: Towards Interpretable Graph Neural Networks [31.3]
グラフニューラルネットワーク(GNN)は、グラフマイニングの著名なフレームワークとして登場した。本稿では,グラフ分類に内在的に解釈可能な新しい手法を提案する。グローバル対話パターン(GIP)学習は、学習可能なグローバル対話パターンを導入し、決定を明示的に解釈する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:31:13 GMT)
SimCol3D -- 3D Reconstruction during Colonoscopy Challenge [31.0]
2022年のEndoVisのサブチャレンジSimCol3Dは、データ駆動深度を促進し、大腸内視鏡で予測する。合成大腸内視鏡画像からの深度予測は頑健に解けるが, ポーズ推定は未解決の課題である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:49:46 GMT)
FedIA: Federated Medical Image Segmentation with Heterogeneous Annotation Completeness [30.8]
フェデレーテッド・ラーニングは医療画像セグメンテーションの魅力的なパラダイムとして登場した。本稿では,医療実践における課題である不完全アノテーションについて述べる。この問題に対処するために、FedIAという新しいソリューションを紹介します。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:08:55 GMT)
A Bounding Box is Worth One Token: Interleaving Layout and Text in a Large Language Model for Document Understanding [30.8]
文書理解のための大規模言語モデル(LayTextLLM)にインターリービングレイアウトとテキストを導入する。 LayTextLLMは、各バウンディングボックスを単一の埋め込みに投影し、テキストでインターリーブする。また、キー情報抽出(KIE)と視覚質問応答(VQA)の性能向上も示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:29:05 GMT)
PIN-SLAM: LiDAR SLAM Using a Point-Based Implicit Neural Representation for Achieving Global Map Consistency [30.6]
PIN-SLAMは、弾性的かつコンパクトな点ベースの暗黙的ニューラルマップ表現に基づいて、一貫した一貫したマップを構築するシステムである。我々の暗黙の地図は、ループを閉じる際の大域的なポーズ調整とともに、本質的に弾性で変形可能なスパース最適化可能なニューラルポイントに基づいている。 PIN-SLAMは、最先端のLiDARオドメトリーやSLAMシステムと同等のポーズ推定精度を達成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:06:29 GMT)
Enhancing Multi-Class Anomaly Detection via Diffusion Refinement with Dual Conditioning [30.5]
一モデル毎の手法は、しばしば限定的な一般化能力に苦しむ。近年の1モデルオールカテゴリ方式の特徴再構築手法は, 異常サンプルの再構成やぼやけた再構築といった課題に直面している。本稿では,多クラス異常検出のための拡散モデルと変圧器を創造的に組み合わせる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:09:40 GMT)
Camera-LiDAR Cross-modality Gait Recognition [29.7]
本稿では,カメラとLiDAR,すなわちCL-Gait間の最初の相互モダリティ歩行認識フレームワークを提案する。私たちの知る限りでは、これはモダリティ間の歩行認識に対処する最初の試みである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:10:37 GMT)
Information Flow Control in Machine Learning through Modular Model Architecture [28.7]
今日の機械学習(ML)モデルでは、トレーニングデータの任意の部分がモデル出力に影響を与える可能性がある。トレーニングデータからモデル出力への情報フローの制御の欠如は、センシティブなデータに対するトレーニングモデルの大きな障害である。本稿では,機械学習のための情報フロー制御の概念を提案し,トランスフォーマー言語モデルアーキテクチャの拡張を開発する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:51:03 GMT)
Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Vision-Language Models [28.4]
我々は、翻訳された非英語、地理的、社会経済的統合プロンプトを定式化し、VLモデルの性能に与える影響を評価する。以上の結果から,地理的・社会経済的統合が低収入データにおけるVL性能を向上させることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:27:00 GMT)
An Examination on the Effectiveness of Divide-and-Conquer Prompting in Large Language Models [28.1]
本研究では,DACプロンプトが性能向上に寄与する特定のタスクの特定を支援する。実験結果が理論解析と一致した2つのケース(大整数算術と実数検証)を提示する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:18:18 GMT)
Magic Insert: Style-Aware Drag-and-Drop [28.1]
本稿では,ユーザが提供する画像から異なるスタイルのターゲット画像に対象物をドラッグアンドドロップするMagic Insertを提案する。スタイル認識のパーソナライゼーションでは,LoRAを用いた事前学習されたテキスト・ツー・イメージ拡散モデルの微調整を行い,対象画像上のテキストトークンを学習する。オブジェクト挿入にはBootstrapped Domain Adaptionを使用し、ドメイン固有のフォトリアリスティックオブジェクト挿入モデルをさまざまな芸術スタイルのドメインに適応させる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:59:50 GMT)
Skellam Mixture Mechanism: a Novel Approach to Federated Learning with Differential Privacy [27.9]
本稿では,モデルを共同で訓練する複数の参加者間でセンシティブなデータが分散されるシナリオに焦点を当てる。ディープニューラルネットワークは、基礎となるトレーニングデータを記憶する強力な能力を持っている。この問題の効果的な解決策は、勾配にランダムノイズを注入することで厳密なプライバシー保証を提供する差分プライバシを持つモデルを訓練することである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:03:28 GMT)
Conceptual Codebook Learning for Vision-Language Models [27.7]
視覚言語モデル(VLM)の一般化能力向上のためのCodebook Learning(CoCoLe)を提案する。視覚概念をキーとして,概念的プロンプトを値として,概念的コードブックを学習する。この概念的コードブック学習法は,視覚的・言語的モダリティの高度化を実現することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:16:06 GMT)
The Missing Piece in Model Editing: A Deep Dive into the Hidden Damage Brought By Model Editing [27.6]
大規模な言語モデルは、時代遅れまたは誤った情報の修正に不可欠である。これらのモデルを編集すると、しばしば、隠れた空間におけるリップル効果と呼ばれる複雑な問題が発生する。本稿では,モデルの適応とその後の編集の影響を定量的に評価する新しい評価手法を提案する。さらに,このリップル効果を緩和するモデル編集法であるSelective Impact Revision(SIR)を導入する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:07:56 GMT)
MTMamba: Enhancing Multi-Task Dense Scene Understanding by Mamba-Based Decoders [27.5]
マルチタスクシーン理解のための新しいマンバベースアーキテクチャであるMTMambaを提案する。 NYUDv2とPASCAL-Contextデータセットの実験では、TransformerベースのメソッドとCNNベースのメソッドよりも、MTMambaの方が優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:52:18 GMT)
Analog quantum simulation of parabolic partial differential equations using Jaynes-Cummings-like models [27.2]
パラボリック偏微分方程式の解を埋め込んだ量子状態を作成するための簡易なアナログ量子シミュレーションプロトコルを提案する。鍵となる考え方は、熱方程式を1次微分作用素のみを含む双曲型熱方程式系によって近似することである。 d-次元問題に対して、1つのd-レベル量子系 (qudit) を用いる方がより適切であることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:23:11 GMT)
Simple Augmentations of Logical Rules for Neuro-Symbolic Knowledge Graph Completion [27.1]
高品質で高カバレッジのルールセットは、NS-KGC(Neuro-Symbolic Knowledge Graph Completion)モデルの成功に不可欠である。最近の文献ではルールセットを生成するためのニューラルモデルを構築しているが、予備実験では高いカバレッジを維持するのに苦労していることが示されている。既存の規則集合に対して,(1)規則を帰納形式に変換すること,(2)構成関係の逆形式を使用する等価な規則を生成すること,(3)新しい規則を提案するランダムウォークの3つの簡単な拡張を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:07:59 GMT)
DynaSemble: Dynamic Ensembling of Textual and Structure-Based Models for Knowledge Graph Completion [27.1]
我々は知識グラフ補完(KGC)に対する2つの一般的なアプローチを考える。本研究では,クエリ依存型アンサンブル重み学習手法であるDynaSembleを提案する。 DynaSembleは、3つの標準KGCデータセットで最先端の結果を達成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:54:56 GMT)
Efficient Nearest Neighbor based Uncertainty Estimation for Natural Language Processing Tasks [26.3]
$k$-Nearest Neearbor Uncertainty Estimation (k$NN-UE) は、隣人からの距離と、隣人のラベル存在率を利用する不確実性推定手法である。実験の結果,提案手法は信頼性校正,選択予測,分布外検出において,ベースラインや最近の密度に基づく手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:33:31 GMT)
Are Data Augmentation Methods in Named Entity Recognition Applicable for Uncertainty Estimation? [26.3]
名前付きエンティティ認識(NER)タスクにおけるデータの増大が信頼度校正と不確実性評価に与える影響について検討する。また,データ拡張により,言語間および言語間におけるキャリブレーションや不確実性が向上することを示す。また,増量によりキャリブレーションや不確実性がさらに向上することが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:49:43 GMT)
MMedAgent: Learning to Use Medical Tools with Multi-modal Agent [26.3]
本報告では,医療分野向けに設計された最初のエージェントである textbfMulti-modal textbfMedical textbfAgent (MMedAgent) を紹介する。本研究では,7つのタスクを解く6つの医療ツールからなる指導訓練データセットをキュレートし,与えられたタスクに最適なツールをエージェントが選択できるようにする。 MMedAgentは、最先端のオープンソース手法やクローズドソースモデルであるGPT-4oと比較して、様々な医療タスクにおいて優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:58:23 GMT)
Predicting Visual Attention in Graphic Design Documents [25.9]
図形図形文書を自由に閲覧する際の視覚的注意を予測できるモデルを提案する。我々の研究は、文書領域を視線で固定する空間的注意と動的時間的秩序の両方を予測する最初の試みである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:15:21 GMT)
Beyond Numeric Awards: In-Context Dueling Bandits with LLM Agents [25.8]
文脈内意思決定は、人工知能の重要な能力である。本稿では,Dueling Bandits (DB) の文脈における意思決定者としてのLarge Language Models (LLMs) の性能について検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:18:14 GMT)
Forward Learning for Gradient-based Black-box Saliency Map Generation [25.6]
そこで我々は,ブラックボックス設定の勾配を推定し,モデル決定を解釈するためのサリエンシマップを生成する新しいフレームワークを提案する。本研究では,出力から入力までの勾配を推定し,その確率比法を用いてサリエンシマップ生成を行う。ブラックボックス設定における実験により,提案手法の有効性が検証され,精度の高い勾配推定と,生成した塩分濃度マップの説明可能性が確認された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:05:48 GMT)
Light-weight Fine-tuning Method for Defending Adversarial Noise in Pre-trained Medical Vision-Language Models [25.3]
微調整事前学習型視覚言語モデル(VLM)は、医用画像とテキスト描写相乗効果において顕著な能力を示した。多くの事前トレーニングデータセットは、患者プライバシの懸念によって制限されており、下流のパフォーマンスに悪影響を及ぼす可能性のあるノイズを含む可能性がある。本稿では,敵の攻撃を効果的に防御し,微調整時に上流の騒音の影響を是正する手法であるRAN(Creify Adversarial noise)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:48:43 GMT)
Adversarial Search Engine Optimization for Large Language Models [25.3]
大規模言語モデル(LLM)は、競合するサードパーティのコンテンツからモデルを選択するアプリケーションで、ますます使われている。我々は、LLMの選択を操作して攻撃者を支持する新しいタイプの攻撃であるPreference Manipulation Attacksを紹介する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:56:48 GMT)
No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models [25.3]
我々はCFGの中核となる原則を再考し、新しい方法である独立条件ガイダンス(ICG)を導入する。 ICGは特別な訓練手順を必要とせずにCFGの利点を提供する。提案手法は条件拡散モデルの学習過程を合理化し,任意の事前学習条件モデル上での推論にも適用可能である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:04:00 GMT)
FlowTrack: Point-level Flow Network for 3D Single Object Tracking [24.9]
3Dシングルオブジェクトトラッキング(SOT)は、モバイルロボティクスと自動運転の分野において重要なタスクである。従来の動きに基づくアプローチは、2つの連続するフレーム間の目標の相対的な移動を推定することで目標追跡を実現する。本研究では,FlowTrackと呼ばれる3次元SOTタスクのための多フレーム情報を用いた点レベルフロー手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:31:34 GMT)
Let the Expert Stick to His Last: Expert-Specialized Fine-Tuning for Sparse Architectural Large Language Models [24.9]
エキスパート特化ファインチューニング(Expert-Specialized Fine-Tuning、ESFT)は、他の専門家やモジュールを凍結しながら、下流のタスクに最も関係のある専門家をチューニングする。よりきめ細かい専門家によるMoEモデルは、下流タスクに最も関係のある専門家の組み合わせを選択する上でより有利である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:11:13 GMT)
Improving Steering and Verification in AI-Assisted Data Analysis with Interactive Task Decomposition [24.8]
LLMを利用するChatGPT Data Analysisのようなツールは、ユーザがデータ分析プログラミングの難しいタスクに取り組むのに役立つ可能性がある。しかし、私たちのフォーマティブな研究は、AI生成結果の検証とAIの運営において深刻な課題を明らかにしました。これらの課題に対処する2つの対照的なアプローチを開発した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:33:50 GMT)
Collaborative Multi-Agent Heterogeneous Multi-Armed Bandits [24.6]
我々は、N$エージェントからなる新しい協調設定について研究し、各エージェントがM$M$のマルチアームバンディットの1つを学習している。エージェント間の協調を容易にするアルゴリズムを2つのシナリオで開発する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:21:45 GMT)
ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos [24.5]
ReXTimeは、ビデオイベント内で時間的推論を実行するAIモデルの能力を厳格にテストするために設計されたベンチマークである。時間的推論と問合せのペアを生成する自動パイプラインを開発する。私たちのパイプラインは、手作業なしで9,695個のマシン生成サンプルのトレーニングデータセットを作成しています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:30:03 GMT)
FedEx: Expediting Federated Learning over Heterogeneous Mobile Devices by Overlapping and Participant Selection [24.4]
我々は、モバイルデバイス上でのFLトレーニングをアンダーライン化するための、新しいアンダーライン学習手法であるFedExを提案する。我々は、FedExが、メモリコストに制限のある不均一なモバイルデバイス上でのFLトレーニングのレイテンシを大幅に削減することを示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:16:36 GMT)
Organic or Diffused: Can We Distinguish Human Art from AI-generated Images? [24.4]
AIが生成した画像を人間のアートから取り除くことは、難しい問題だ。この問題に対処できないため、悪いアクターは、AIイメージを禁止したポリシーを掲げる人間芸術や企業に対してプレミアムを支払う個人を欺くことができる。 7つのスタイルにまたがって実際の人間のアートをキュレートし、5つの生成モデルからマッチング画像を生成し、8つの検出器を適用します。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:22:14 GMT)
Steerable Pyramid Transform Enables Robust Left Ventricle Quantification [24.2]
左室定量化(LV)のためのロバストモデル学習法について述べる。我々の成功は、固定されたフロントエンド処理に生物学的にインスパイアされたステアブルピラミッド変換(SPT)を採用することにある。我々のSPT拡張モデルは、最先端の手法に比べて合理的な予測精度を達成するだけでなく、入力摂動に対する堅牢性も著しく向上している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:41:55 GMT)
Whispering Experts: Neural Interventions for Toxicity Mitigation in Language Models [23.5]
毒性を規定するニューロンは、有害な文章を識別する能力によって決定できることを示す。我々は,AUROC適応(AurA)を提案する。これは,事前訓練された任意の大規模言語モデルに適用して毒性を軽減できる介入である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:48:29 GMT)
Breaking Bias, Building Bridges: Evaluation and Mitigation of Social Biases in LLMs via Contact Hypothesis [23.3]
大規模言語モデル(LLM)は、訓練データに偏見を反映し、社会的ステレオタイプや不平等を補強する社会バイアスを持続させる。本稿では,これらのモデルにプロンプトに対する非バイアス応答を付与する独自のデバイアス処理手法であるSocial Contact Debiasing(SCD)を提案する。我々の研究は、LLM応答が接触探究の際の社会的バイアスを示すことを示したが、より重要なことは、これらのバイアスは、SCD戦略に従ってLLaMA 2を指導する1つの時代において、最大40%減少させることができることである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:58:46 GMT)
BiasDora: Exploring Hidden Biased Associations in Vision-Language Models [23.3]
9つのバイアス次元にまたがる隠された暗黙の関連について検討した。相関関係が負性,毒性,極度にどのように変化するかを示す。私たちの研究は、既存の方法論では認識されない微妙で極端なバイアスを特定します。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:55:40 GMT)
Empowering 3D Visual Grounding with Reasoning Capabilities [23.2]
我々は3D推論基底と呼ばれる新しいタスクを提案し、新しいベンチマークScanReasonを導入する。 ScanReasonは、推論とグラウンドの相乗化を必要とする5つの推論タイプから10万以上の質問と回答のペアを提供する。提案手法は, 推論において, 分岐推論と接地ステップにより, さらなる性能向上を図っている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:37:56 GMT)
Enabling Discriminative Reasoning in Large Language Models for Legal Judgment Prediction [23.0]
人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。 ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:43:15 GMT)
Crossroads of Continents: Automated Artifact Extraction for Cultural Adaptation with Large Multimodal Models [22.9]
まず,67か国の9,935のイメージと10のコンセプトクラスを含む大規模データセットであるDale Streetを紹介した。次に、人工物抽出タスクによるモデルの深い文化理解を評価し、異なる国に関連する18,000以上の人工物を特定する。最後に,文化から文化へイメージを適応させるために,高度に構成可能なパイプラインであるCultureAdaptを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:55:41 GMT)
VFIMamba: Video Frame Interpolation with State Space Models [22.9]
フレーム間モデリングはビデオフレーム(VFI)の中間フレーム生成において重要である S6(Selective State Space Models)が登場し、ロングシーケンスモデリングに特化している。本稿では,S6モデルを用いたフレーム間モデリングのための新しいフレーム手法であるVFIMambaを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:48:18 GMT)
Single Image Test-Time Adaptation for Segmentation [22.6]
この研究では、セグメンテーションモデルを、テスト時に利用可能な他のデータなしで、単一のラベルのないイメージに適応させる方法について検討する。特に、この研究は、テスト時の自己監督的損失を最適化することで適応に焦点を当てている。我々のベースラインへの追加は、非適応ベースラインよりも3.51と3.28%増加する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:34:23 GMT)
SADL: An Effective In-Context Learning Method for Compositional Visual QA [22.1]
大規模視覚言語モデル(LVLM)は、ビジュアルQAでコンテキスト内学習(ICL)を実行するための新しい機能を提供する。本稿では,タスクのための新しい視覚言語プロンプトフレームワークであるSADLを紹介する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:41:39 GMT)
OpenSlot: Mixed Open-set Recognition with Object-centric Learning [21.9]
オープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか持たず、未知のテストセット(負)は既知のテストセット(正)から切り離されたラベル空間を持つと仮定する。本稿では、テスト画像が複数のクラスセマンティクスを含み、既知のクラスと未知のクラスが負に共起する混合OSR問題を紹介する。オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:00:55 GMT)
Universal Semi-Supervised Learning for Medical Image Classification [21.8]
セミ教師付き学習(SSL)は、適切なラベル付きトレーニングデータを収集するコストを削減できるため、多くの注目を集めている。従来のSSLは、ラベル付きデータとラベルなしデータが同じディストリビューションのものであるべきだという仮定に基づいて構築されている。本研究では,未表示のラベル付きデータを利用した半教師付き医療画像分類のための統一的なフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:28:08 GMT)
Survey on Knowledge Distillation for Large Language Models: Methods, Evaluation, and Application [21.6]
大規模言語モデル(LLM)は様々な領域で例外的な機能を示しており、学術と産業の両方から大きな関心を集めている。精度を維持しながら言語モデルを圧縮する努力は研究の焦点となっている。知識蒸留は、性能を著しく損なうことなく推論速度を向上する有効な手法として登場した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:14:42 GMT)
DiGRAF: Diffeomorphic Graph-Adaptive Activation Function [21.2]
グラフニューラルネットワーク(GNN)におけるグラフデータに特化したグラフ適応型アクティベーション関数を提案する。従来型およびグラフ固有のアクティベーション関数と比較して,DiGRAFの一貫性と優れた性能を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:33:40 GMT)
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather [21.0]
既存のLiDARセマンティックセグメンテーション手法は、悪天候下での性能低下に苦慮することが多い。悪天候の主な要因を特定し, 性能劣化の主な原因を特定するための玩具実験を行った。これらの知見に基づいて,新たな戦略的データ拡張手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:19:51 GMT)
Is Your AI-Generated Code Really Secure? Evaluating Large Language Models on Secure Code Generation with CodeSecEval [21.0]
大規模言語モデル(LLM)は、コード生成とコード修復に大きな進歩をもたらした。しかし、GitHubのようなオープンソースのリポジトリから無防備なデータを使用したトレーニングは、セキュリティ上の脆弱性を必然的に伝播するリスクを増大させる。我々は,コードLLMのセキュリティ面を正確に評価し,拡張することを目的とした総合的研究を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:13:21 GMT)
Physics-Informed Model and Hybrid Planning for Efficient Dyna-Style Reinforcement Learning [20.9]
実世界のアプリケーションに強化学習を適用するには、パフォーマンス、サンプル効率、推論時間の間のトレードオフに対処する必要がある。本研究では,システム力学の部分的な物理知識を活用することで,この3つの課題に対処する方法を実証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:32:57 GMT)
TokenPacker: Efficient Visual Projector for Multimodal LLM [20.9]
ビジュアルプロジェクタは、ビジュアルエンコーダとLarge Language Model(LLM)の間に必須のブリッジとして機能する。本稿では,密集した特徴を注入して凝縮した視覚トークンを生成するために,粗く細かなスキームを取り入れた新しいビジュアルプロジェクタを提案する。我々のアプローチでは、ビジュアルトークンを75%89%圧縮し、多様なベンチマークで同等またはさらに優れたパフォーマンスを実現しています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:10:55 GMT)
Private Hierarchical Governance for Encrypted Messaging [20.8]
プライバシのためのE2EEメッセージングを用いたプライベート階層型ガバナンスシステムを提案する。私たちは、メッセージ層セキュリティプロトコルの拡張が、リッチなガバナンスポリシーの集合を達成するのにいかに十分であるかを示します。我々は,コンテンツベースのコミュニティとプラットフォームモデレーション,コミュニティモデレーターの選挙,虐待的ユーザを排除するための投票などをサポートする,MlsGovというプロトタイプE2EEメッセージングシステムを構築している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:25:10 GMT)
Proposal Report for the 2nd SciCAP Competition 2024 [20.6]
本稿では補助情報を用いた文書要約手法を提案する。提案実験は,高品質なOCRデータを活用することで,記述対象に関するコンテンツを効率的に要約できることを実証した。提案手法は,2024年のSciCAPコンペティションにおいて,長字幕と短字幕で4.33点,短字幕で4.66点のスコアを得た。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:42:29 GMT)
Compare without Despair: Reliable Preference Evaluation with Generation Separability [20.5]
テストインスタンスがペアの選好評価にどの程度適しているかを推定する尺度であるセパビリティ(Separability)を導入する。候補テストインスタンスでは、セパビリティは1組のモデルから複数の世代をサンプリングし、2つの世代がどの程度区別可能であるかを測定する。実験により、分離性が高いインスタンスは、人間と自動レーダの両方からより一貫した選好格付けが得られることが示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:37:56 GMT)
SlideAVSR: A Dataset of Paper Explanation Videos for Audio-Visual Speech Recognition [20.5]
音声視覚音声認識(AVSR)は自動音声認識(ASR)のマルチモーダル拡張である本稿では,学術論文説明ビデオを用いたAVSRデータセットであるSlideAVSRを構築する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:43:59 GMT)
The Gossiping Insert-Eliminate Algorithm for Multi-Agent Bandits [20.3]
N$エージェントからなる分散マルチエージェントMulti Armed Bandit (MAB) のセットアップを検討する。我々のモデルでは、エージェントは任意の連結グラフ上で、ペアワイズなゴシップスタイルの通信を通じてメッセージを交換することで協調する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:36:25 GMT)
HGOT: Hierarchical Graph of Thoughts for Retrieval-Augmented In-Context Learning in Factuality Evaluation [20.2]
本稿では,文脈内学習における関連する文節の検索を促進するために,階層的思考グラフ(HGOT)を導入する。このフレームワークは、複雑なクエリを管理可能なサブクエリに分割する、分割/クエリ戦略を採用している。それは、最近提案された引用リコールと精度の指標を取り入れた、回答の選択のための自己一貫性の過半数投票を洗練する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:42:59 GMT)
Integrate the Essence and Eliminate the Dross: Fine-Grained Self-Consistency for Free-Form Language Generation [20.1]
本研究では,複数のサンプルから得られた詳細なコンセンサス知識を効果的に活用することにより,出力品質を最適化するFSCを提案する。 FSCの有効性は、要約、コード生成、数学的推論など、様々なタスクに関する広範な実験を通じて実証される。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:38:31 GMT)
SignAvatars: A Large-scale 3D Sign Language Holistic Motion Dataset and Benchmark [20.1]
SignAvatarsは、難聴者や難聴者のコミュニケーションギャップを埋めるために設計された、最初の大規模でマルチプロンプトな3D手話言語(SL)モーションデータセットである。データセットは153のシグナから7万本のビデオで構成され、合計8.34万フレームが分離されたサインと、連続的かつ協調的なサインの両方をカバーしている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:10:28 GMT)
LLMEasyQuant -- An Easy to Use Toolkit for LLM Quantization [19.8]
LLM量子化には多くの量子化方法が存在するが、ユーザフレンドリで、ローカルにデプロイしやすいものはほとんどない。このパッケージは、ユーザフレンドリで初心者の学習に適した量子化デプロイメントを容易にすることを目的としている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:34:50 GMT)
Securing Distributed Network Digital Twin Systems Against Model Poisoning Attacks [19.7]
ディジタルツイン(DT)は、リアルタイム監視、予測、意思決定能力の向上を具現化する。本研究では,分散ネットワークDTシステムにおけるセキュリティ上の課題について検討し,その後のネットワークアプリケーションの信頼性を損なう可能性がある。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:32:09 GMT)
Supporters and Skeptics: LLM-based Analysis of Engagement with Mental Health (Mis)Information Content on Video-sharing Platforms [19.5]
米国では5人に1人が精神疾患で暮らしている。ショートフォームビデオコンテンツは、メンタルヘルスとリソースを広めるための重要なコンジットとして機能するように成長してきた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:51:06 GMT)
A Practical Review of Mechanistic Interpretability for Transformer-Based Language Models [19.5]
機械的解釈可能性(MI)は、その内部計算をリバースエンジニアリングすることでニューラルネットワークモデルを理解しようとする、新たな解釈可能性のサブフィールドである。本稿は,MIにおける基礎研究対象,その調査に用いられている技術,MIの結果を評価するためのアプローチ,およびMIを用いてLMを理解することに起因する重要な知見と応用について概説する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:28:16 GMT)
When Automated Program Repair Meets Regression Testing -- An Extensive Study on 2 Million Patches [19.2]
自動プログラム修復(APR)は学術分野で広く研究され、産業から広く注目を集めている。従来の回帰テスト選択(RTS)技術は、パッチ毎に影響を受けるテストのみを実行するために利用することができる。本稿では,2M以上のパッチ上での12の最先端APRシステムに対して,様々なレベルで広く利用されているRTS技術について検討した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:22:24 GMT)
GraphSnapShot: Graph Machine Learning Acceleration with Fast Storage and Retrieval [19.2]
GraphSnapShotは、グラフ学習のための高速キャッシュ、ストレージ、検索、計算のためのフレームワークである。ロスレスグラフMLトレーニングでは、最大30%のトレーニングアクセラレーションと73%のメモリ削減を実現することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:24:13 GMT)
Pseudo-Labeling by Multi-Policy Viewfinder Network for Image Cropping [19.1]
我々は,ラベル付きデータとラベルなしデータの両方を併用して,画像収穫モデルのトレーニングデータの規模を拡大する可能性を探る。このアイデアは、教師モデルによってラベルのないデータのための擬似ラベルを作成し、これらの擬似ラベルで学生モデルを訓練する、擬似ラベル方式で実装することができる。本稿では,教師からの擬似ラベルの誤りを正すために,多種多様な修正ポリシーを提供する多言語ビューファインダーネットワーク(MPV-Net)を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:02:05 GMT)
Shall We Team Up: Exploring Spontaneous Cooperation of Competing LLM Agents [19.0]
本稿では、エージェントが文脈に深く関与し、明示的な指示なしに適応的な決定を行う自然現象の重要性を強調する。我々は,3つの競争シナリオにまたがる自発的な協力を探究し,協力の段階的出現をシミュレートした。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:56:09 GMT)
RVISA: Reasoning and Verification for Implicit Sentiment Analysis [18.8]
暗黙の感情分析(ISA)は、表現に有能なキュー語が欠如していることで大きな課題となる。本研究では,DO LLMの生成能力とED LLMの推論能力を利用した2段階推論フレームワークであるRVISAを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:07:54 GMT)
Contribution Evaluation of Heterogeneous Participants in Federated Learning via Prototypical Representations [18.7]
フェデレートラーニング(FL)における貢献評価は,様々な領域にまたがる適用性から重要な研究領域となっている。既存のコントリビューション評価手法は、主にデータボリューム、モデル類似性、補助的なテストデータセットに依存しており、様々なシナリオで成功している。本稿では、FLにおけるコントリビューション評価を、全く新しい表現の観点から検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:05:43 GMT)
GraphBEV: Towards Robust BEV Feature Alignment for Multi-Modal 3D Object Detection [18.2]
We propose a robust fusion framework called Graph BEV to integrate LiDAR and camera BEV features。我々のフレームワークは、悪臭のある条件下で、BEV Fusionを8.3%上回っている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:16:31 GMT)
Embedded Prompt Tuning: Towards Enhanced Calibration of Pretrained Models for Medical Images [18.1]
医用画像分類タスクに基礎モデルを適用する際の微調整手法の有効性について検討する。拡張チャネルにプロンプトトークンを埋め込む組込みプロンプトチューニング(EPT)手法を提案する。 EPTは、数ショットの医用画像分類タスクにおいて、いくつかの最先端の微調整方法よりも顕著に優れている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:11:43 GMT)
Breaking Language Barriers: Cross-Lingual Continual Pre-Training at Scale [18.0]
本稿では,既存のLLMから連続的に事前学習(CPT)を行うことにより,大規模言語モデル構築のための代替手法を検討する。 CPTはより高速に収束し、拡張性のある方法で重要なリソースを節約できる。スケールでの転送の有効性は、トレーニング期間と言語特性に影響され、データ再生に頑健である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:06:41 GMT)
Kanbun-LM: Reading and Translating Classical Chinese in Japanese Methods by Language Models [17.7]
世界で最初の古典漢文データセットを構築した。漢字の並べ替えや機械翻訳は漢文理解において重要な役割を担っている。コードとデータセットはGitHubでリリースしています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:39:31 GMT)
AutoSplat: Constrained Gaussian Splatting for Autonomous Driving Scene Reconstruction [17.6]
AutoSplatは、自動走行シーンの高度に現実的な再構築を実現するために、ガウシアンスプラッティングを使用したフレームワークである。我々は、前景オブジェクトの可視面と見えない面の両方を監督するために、反射ガウス整合性制約を導入する。 PandasetとKITTIの実験では、AutoSplatは様々な運転シナリオにおけるシーン再構築と新しいビュー合成において最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:36:50 GMT)
Strategic Demand-Planning in Wireless Networks: Can Generative-AI Save Spectrum and Energy? [17.6]
本稿では、需要ラベル付け、需要形成、需要再スケジューリングによる戦略的需要計画の概念を紹介する。 GenAIは、無線ネットワークにおける需要形成を容易にする強力なツールとして提案されている。 GenAIは、無線ネットワークのエネルギーとスペクトルを節約する機能を持つ。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:27:06 GMT)
SymPoint Revolutionized: Boosting Panoptic Symbol Spotting with Layer Feature Enhancement [17.3]
新規な合理化設計を特徴とする,堅牢で効率的なソリューションであるSymPoint-V2を紹介する。まず、グラフィカルなレイヤ情報をプリミティブな機能にエンコードするためのレイヤ機能拡張モジュール(LFE)を提案する。また、位置ガイド訓練法(PGT)を設計し、学習を容易にする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:45:09 GMT)
Metric-guided Image Reconstruction Bounds via Conformal Prediction [17.3]
本稿では,1つのアルゴリズムが生成した再構成を仮定して,下流のメトリクスの有効かつ分布自由な境界を計算するために,共形予測を用いる。本研究は,1) 地上の真理を伴わない試験時間画像再構成評価,2) 下流性能保証,3) 有意な上層/下層境界再構成,および4) 有意な統計的不整合/外層再構成を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:31:16 GMT)
Generative Monoculture in Large Language Models [17.2]
生成的モノカルチャーは、大きな言語モデル(LLM)で観察される行動である本研究は,本書レビューとコード生成タスクの分析を通じて,生成モノカルチャーの有病率を実験的に実証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:17:07 GMT)
Similarity Distance-Based Label Assignment for Tiny Object Detection [17.1]
そこで我々は,SimD(Simisity Distance)と呼ばれるシンプルだが効果的な戦略を導入し,ボックス間の類似性を評価する。我々のアプローチは、ラベル割り当てやNon Maximum Suppression(NMS)のためのIoUの代わりに、一般的なアンカーベース検出器に適用できる。 4つの主流となる小型物体検出データセットの実験により,本手法の優れた性能が示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:12:37 GMT)
Type-II Saddles and Probabilistic Stability of Stochastic Gradient Descent [16.8]
ニューラルネットワークのサドル点を2つのタイプに分けることができ、その中では、勾配ノイズがサドルで消えてしまうため、タイプIIサドルが特に逃れるのが困難である。これらのサドルの周りのSGDのダイナミクスは、ランダム行列積プロセスによって記述される先行次数へと導かれる。我々は,サドル点がSGDに対して魅力的あるいは反発的であり,その力学は,サドルに近い勾配の信号-雑音比に応じて,4つの異なる位相に分類できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:05:59 GMT)
Uncovering Safety Risks of Large Language Models through Concept Activation Vector [16.8]
大規模言語モデル(LLM)に対する攻撃を誘導する安全概念活性化ベクトルフレームワークを提案する。そこで我々は,攻撃プロンプトと埋め込みレベルの攻撃の両方を生成できるSCAV誘導攻撃法を開発した。本手法は,トレーニングデータが少なくなるとともに,攻撃成功率と応答品質を著しく向上させる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:17:57 GMT)
LDP: A Local Diffusion Planner for Efficient Robot Navigation and Collision Avoidance [16.8]
条件拡散モデルは,ロボットポリシーを学習するための効率的なツールとして実証されてきた。ダイナミックな障害物と迷路のような構造を特徴とする現実シナリオの複雑な性質は、ロボットの局所的なナビゲーション決定の複雑さを浮き彫りにする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:53:35 GMT)
AdaCQR: Enhancing Query Reformulation for Conversational Search via Sparse and Dense Retrieval Alignment [16.6]
本稿では,対話型検索再構成のための新しいフレームワークAdaCQRを提案する。 AdaCQRは、情報検索クエリの一般化性を向上させる。 TopiOCQAデータセットとQReCCデータセットの実験的評価は、AdaCQRが既存の手法よりも大幅に優れていることを示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:50:16 GMT)
Large Scale Hierarchical Industrial Demand Time-Series Forecasting incorporating Sparsity [16.6]
本研究では,階層全体にわたる確率的予測の精度と校正を可能にする新しい確率的階層モデルであるHAILSを提案する。我々は,1万製品を超える製品需要予測アプリケーションのために大手化学製造会社にHAILSをデプロイし,予測精度が8.5%,スパースタイムシリーズが23%向上したことを観察した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:40:08 GMT)
MORPHEUS: Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space [16.5]
従来のパーソナライズド・ダイアログ生成(PDG)は、外部ロールデータに依存しており、プライバシーの懸念を生じさせる可能性がある。 textbfPersonalized Dialogue textbfHistory by textbfExploring and textbfUtilizing Latent textbfSpace (MORPHEUS) through a three-stage training process。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:12:34 GMT)
Is Your Large Language Model Knowledgeable or a Choices-Only Cheater? [16.4]
最近の研究は、大きな言語モデル(LLM)が選択のみを使用して複数の選択肢の質問に答えることができることを示している。我々は、MCQAにおける選択のみのショートカットにLLMが過剰に頼っているかどうかを調査するコントラストセットを使用する。コントラストセットを検証した後、12個のLCMをテストし、これらのモデルが質問と選択の両方を与えられた場合、選択のみのショートカットに依存しないことを示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:06:53 GMT)
SoP: Unlock the Power of Social Facilitation for Automatic Jailbreak Attack [16.3]
私たちはJailbreakプロンプトを自動設計するフレームワークであるSoPを紹介します。 GPT-3.5-1106とGPT-4の安全アライメントを回避し,攻撃成功率88%と60%を達成した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:58:29 GMT)
TIGER: A Generating-Then-Ranking Framework for Practical Python Type Inference [16.2]
Pythonの動的型付けシステムは柔軟性と表現力を提供するが、型関連のエラーにつながる可能性がある。 TIGERはPythonの多様な型カテゴリを扱うための2段階生成レベル(GTR)フレームワークである。 ManyTypes4Pyデータセットに対する評価は、TIGERが様々な型カテゴリの既存のメソッドよりも優れていることを示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:29:02 GMT)
IFTT-PIN: A Self-Calibrating PIN-Entry Method [15.9]
明示的な校正手順を必要とせず,インターフェースのパーソナライズを可能にする新しい手法を実証する。自己校正の2階効果は、外部のオブザーバーがユーザが達成しようとしていることを容易に推測できないことである。 IFTT-PINは,最初の自己校正型PIN-entry法である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:58:28 GMT)
Generalized Event Cameras [15.7]
イベントカメラは、高解像度かつ最小の帯域幅で世界をキャプチャする。我々は、帯域幅効率のよいシーン強度を本質的に保持する一般化イベントカメラを設計する。私たちの単一光子イベントカメラは、低再生速度で高速で高忠実なイメージングを可能にします。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:48:32 GMT)
Why do LLaVA Vision-Language Models Reply to Images in English? [15.7]
一般的なマルチモーダル視覚言語モデル(VLM)で発生する驚くべき多言語バイアスを明らかにする。 LLaVAスタイルのVLMにクエリに画像を含めると、クエリの言語に関係なく、そのモデルが英語の応答を返す可能性が著しく高くなる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:01:55 GMT)
Reinforcement Learning for Edit-Based Non-Autoregressive Neural Machine Translation [15.6]
非自己回帰(NAR)言語モデルは、ニューラルネットワーク翻訳(NMT)の低レイテンシで知られている。 NARと自己回帰モデルの間には大きな復号化空間があり、目的語間の不整合を正確に捉えるのが困難である。本稿では,編集ベースNARモデルであるLevenshtein Transformerに強化学習(RL)を適用し,自己生成データを用いたRLが編集ベースNARモデルの性能を向上させることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:41:56 GMT)
MG-Verilog: Multi-grained Dataset Towards Enhanced LLM-assisted Verilog Generation [15.5]
大規模言語モデル(LLM)は、ドメイン固有の膨大なデータをカプセル化することによって、ハードウェア設計プロセスの合理化を約束している。既存の利用可能なハードウェアデータセットは、サイズ、複雑さ、詳細に制限されることが多い。本稿では,多段階の詳細な記述と対応するコードサンプルを包含したMulti-Grained-Verilog(MG-Verilog)データセットを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:21:24 GMT)
Differentially Private Graph Diffusion with Applications in Personalized PageRanks [15.5]
本研究は,雑音拡散イテレートを用いてエッジレベルの差分プライバシーを保証する新しいグラフ拡散フレームワークを提案する。このアルゴリズムは拡散当たりのラプラスノイズを注入し、低次ノードによって誘導される高感度を緩和する度合いベースの閾値関数を採用する。私たちのプライバシー損失分析は、PABI(Privacy Amplification by Iteration)に基づいています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:06:17 GMT)
Multiply-Robust Causal Change Attribution [15.5]
我々は,各因果メカニズムの貢献度を定量化するために,回帰法と再重み付け法を組み合わせた新しい推定方法を開発した。本手法はモンテカルロシミュレーションにおいて優れた性能を示し,その有効性を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:59:35 GMT)
ColPali: Efficient Document Retrieval with Vision Language Models [15.4]
複数のドメイン、言語、設定にまたがる様々なページレベルの検索タスクで構成されるVisual Document Retrieval Benchmark ViDoReを紹介する。現代のシステムの固有の欠点は、新しい検索モデルアーキテクチャであるColPaliの導入を動機付けている。 ColPaliは最新のドキュメント検索パイプラインよりも大幅に高速で、エンドツーエンドのトレーニングが可能である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:02:58 GMT)
FLea: Addressing Data Scarcity and Label Skew in Federated Learning via Privacy-preserving Feature Augmentation [15.3]
フェデレートラーニング(FL)は、ローカルデータを中央サーバに転送することなく、多数のエッジデバイスに分散したデータを活用することによって、モデル開発を可能にする。既存のFLメソッドは、デバイス間の不足やラベルスキュードデータを扱う際に問題に直面し、結果としてローカルモデルが過度に適合し、ドリフトする。我々は、以下のキーコンポーネントを組み込んだ textitFLea という先駆的なフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:37:34 GMT)
Vision-LSTM: xLSTM as Generic Vision Backbone [15.3]
コンピュータビジョンに対する xLSTM ビルディングブロックの適応である Vision-LSTM (ViL) を導入する。 ViLはxLSTMブロックのスタックで構成され、奇異ブロックはパッチトークンのシーケンスを上から下へ処理する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:39:46 GMT)
Face Reconstruction Transfer Attack as Out-of-Distribution Generalization [15.3]
未確認エンコーダに対する顔攻撃を転送できる顔画像の再構成を目指す。 OODの性質に着想を得て,疑似目標(ALSUV)を用いた平均遅延探索と教師なし検証による顔再構成伝達攻撃(FRTA)の解法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:21:44 GMT)
Zero-shot Video Restoration and Enhancement Using Pre-Trained Image Diffusion Model [15.2]
本稿では,事前学習した画像拡散モデルに基づいて,ゼロショット映像の復元と拡張を行うための第1のフレームワークを提案する。本稿では,時間的整合性誘導,時空間雑音共有,時間的整合性向上のための早期サンプリング戦略を提案する。実験により,より忠実度の高い時間的一貫したビデオの製作において,提案手法の優位性を示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:31:59 GMT)
Why does in-context learning fail sometimes? Evaluating in-context learning on open and closed questions [15.0]
オープン・クローズドな質問に対するタスクノベルティと難解さの関数として,文脈内学習の性能を測定した。反故意に、トピックとより整合したコンテキストは、必ずしもあまり関係のないコンテキストに役立ちません。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:52:30 GMT)
Naturalistic Music Decoding from EEG Data via Latent Diffusion Models [14.9]
本研究は,非侵襲的脳波データを用いて,高品質な音楽再生を実現するための最初の試みである。我々は、パブリックなNMED-Tデータセットでモデルをトレーニングし、ニューラルネットワークベースのメトリクスを提案する定量的評価を行う。本研究は,脳波データを用いた複雑な聴覚情報再構成の実現可能性に関する知見を提供する,ニューラルデコーディングと脳-コンピュータインタフェースの継続的な研究に寄与する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:00:46 GMT)
Inferring Resource-Oriented Intentions using LLMs for Static Resource Leak Detection [14.8]
リソースリークは、買収後にリリースされていないリソースによって引き起こされるもので、しばしばパフォーマンスの問題とシステムのクラッシュを引き起こす。既存の静的検出技術は、未リリースのリソースを見つけるために、事前に定義されたリソース取得/リリースAPIとnullチェック条件の機械的マッチングに依存している。 InferROIは、コード内のリソース指向の意図(取得、リリース、到達可能性検証)を直接推論する新しいアプローチである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:52:40 GMT)
DyGPrompt: Learning Feature and Time Prompts on Dynamic Graphs [14.6]
動的グラフモデリングのための新しいフレームワークであるDyGPromptを提案する。まず,タスクの目的と,事前学習タスクと下流タスクの動的変動のギャップに対処する2つのプロンプトを設計する。第2に,ノードと時間の特徴が相互に特徴付けされていることを認識し,下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:14:10 GMT)
Let Guidelines Guide You: A Prescriptive Guideline-Centered Data Annotation Methodology [14.5]
本稿では,各データサンプルに関連付けられたガイドラインの報告に焦点をあてた新しいデータアノテーション手法であるガイドライン中心アノテーションプロセスを紹介する。標準的な規範的アノテーションプロセスの主な3つの制限を特定し,ガイドライン中心の方法論がそれを克服する方法について述べる。本稿では,複数のタスクにまたがるアノテートデータを,単一のアノテートプロセスのコストで再利用する方法について論じる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:38:17 GMT)
Are There Exceptions to Goodhart's Law? On the Moral Justification of Fairness-Aware Machine Learning [14.4]
公正度対策はグッドハートの法則に特に敏感であると主張する。公正度尺度の正当性に関する道徳的推論の枠組みを提示する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:53:59 GMT)
Koopman Spectrum Nonlinear Regulators and Efficient Online Learning [14.1]
クープマンスペクトルコストの最小化により非線形システムを制御する新しいパラダイムを提案する。このパラダイムでは累積コストで不可能ないくつかの力学特性が実現可能であることを実証する。本稿では,いくつかの構造的前提の下で線形な後悔を楽しむオンライン学習アルゴリズムのサンプルを提示する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:53:08 GMT)
xLSTM-UNet can be an Effective 2D & 3D Medical Image Segmentation Backbone with Vision-LSTM (ViL) better than its Mamba Counterpart [13.8]
医用画像セグメンテーションのバックボーンとしてVision-LSTM(xLSTM)を利用するUNet構造化ディープラーニングニューラルネットワークであるxLSTM-UNetを提案する。 xLSTMはLong Short-Term Memory (LSTM) ネットワークの後継として最近提案された。以上の結果から,XLSTM-UNetはCNNベース,Transformerベース,およびMambaベースセグメンテーションネットワークの性能を一貫して上回っていることがわかった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:45:25 GMT)
Towards Federated Learning with On-device Training and Communication in 8-bit Floating Point [13.7]
近年の研究では、8ビット浮動小数点(FP8)がニューラルネットワークの効率的なトレーニングに利用できることが示されている。グローバルなFP32サーバモデルを維持しながらFP8クライアントトレーニングを組み合わせる新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:55:58 GMT)
Do Large Language Models Exhibit Cognitive Dissonance? Studying the Difference Between Revealed Beliefs and Stated Answers [13.6]
我々は,これらの能力が調整プロンプトとMCQの外部で測定可能かどうかを検討する。以上の結果から, LLMの回答は, Stated Answer と大きく異なることが示唆された。テキスト補完はLLMの中核にあるため,これらの結果は共通評価手法が部分画像のみを提供する可能性があることを示唆している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:02:04 GMT)
RLHF Can Speak Many Languages: Unlocking Multilingual Preference Optimization for LLMs [13.6]
高品質な多言語フィードバックデータを生成するための,新しいスケーラブルな手法を提案する。我々の選好訓練モデルはAya 23 8Bに対して54.4%の勝利率を達成した。その結果,世界の人口の半分をカバーする23言語にアライメント手法のフロンティアを広げた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:42:30 GMT)
Research on Autonomous Robots Navigation based on Reinforcement Learning [13.6]
我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 00:44:06 GMT)
Deep Imbalanced Regression to Estimate Vascular Age from PPG Data: a Novel Digital Biomarker for Cardiovascular Health [13.5]
Photoplethysmographyは、人間の血行動態をモニタリングするための重要なツールとして浮上している。現実の年齢分布は、しばしば不均衡であり、ディープラーニングモデルに重大な課題を提起する。深部不均衡な回帰タスクに対処するために,Dist Lossという,新しい,シンプルで効果的な損失関数を導入する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:22:36 GMT)
Estimating Noisy Class Posterior with Part-level Labels for Noisy Label Learning [13.5]
既存の手法は通常、ノイズのあるラベルを持つ分類モデルを訓練することで、ノイズの多いクラス後部を学習する。本稿では,教師付き情報をパートレベルのラベルで強化し,様々な部分からよりリッチな情報に集中・統合することをモデルに推奨する。提案手法は理論的に健全であり,実験結果から合成および実世界の雑音評価において実験的に有効であることが示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:06:15 GMT)
Towards Universal Mesh Movement Networks [13.5]
我々はUniversal Mesh Movement Network (UM2N)を紹介する。 UM2Nは、異なるサイズ分布と構造を持つメッシュを動かすために、非侵入的ゼロショット方式で適用することができる。本研究では, 実世界の津波シミュレーション事例とともに, 対流法とナビエ・ストークス法に基づく実例について検討した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:22:04 GMT)
Looking From the Future: Multi-order Iterations Can Enhance Adversarial Attack Transferability [13.4]
本稿では,LFF(Looking From the Future)という新しいシーケンス最適化概念を提案する。 LFFは、最初の局所最適化選択を洗練させるために、元の最適化プロセスを利用している。また,LFF攻撃やMLFF攻撃も提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:42:32 GMT)
On the consistency of hyper-parameter selection in value-based deep reinforcement learning [13.1]
本稿では,値に基づく深層強化学習エージェントのハイパーパラメータ選択の信頼性に着目した実証的研究を行う。我々の研究は、どのハイパーパラメーターがチューニングに最も重要かを確立するのに役立ち、どのチューニングが異なるトレーニング体制間で一貫性を持ち続けるかを明らかにするのに役立ちます。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:33:26 GMT)
Memory Kernel Coupling Theory: Obtain Time Correlation Function from Higher-order Moments [13.1]
このレターは、時間相関関数(TCF)を評価する一般的な形式であるメモリカーネル結合理論(MKCT)を提示する。補助核の急激な崩壊により、結合した運動方程式を高精度に切り離すことができる。この定式化は一般的なものであるが、典型的な開量子系(スピンボソンモデル)の数値的な実演を行う。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:40:40 GMT)
Pelican: Correcting Hallucination in Vision-LLMs via Claim Decomposition and Program of Thought Verification [13.1]
Pelicanは、クレーム検証を通じて幻覚を検出し緩和するために設計されたフレームワークである。実験の結果,MMHal-Benchの幻覚緩和法と比較すると,様々なベースラインLVLMにおいて覚醒率を$sim$8%-32%低下させ,また27%低下させた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:17:44 GMT)
Tiny-PULP-Dronets: Squeezing Neural Networks for Faster and Lighter Inference on Multi-Tasking Autonomous Nano-Drones [13.0]
この研究は、ナノドロンの自律ナビゲーションのためのステート・オブ・ザ・アート畳み込みニューラルネットワークであるPULP-Dronetから、モデルサイズを1桁以上圧縮する新しい手法であるTiny-PULP-Dronetへと移行した。この大規模な削減は、高レベルのインテリジェンスを達成するための基本的な要件であるナノドロンの安価なマルチタスクへの道を開く。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:24:57 GMT)
Change My Frame: Reframing in the Wild in r/ChangeMyView [12.9]
サブレディット r/ChangeMyView (CMV) に基づくリフレーミングを一般化する。我々は、CMVのコミュニティのインタラクションと規約を活用して、視点の変化を生み出す発話を特定するデータセットを構築します。この種のリフレーミングに関するデータセット作成と評価の課題について検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:09:11 GMT)
Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models [12.9]
本稿では,ストーリ生成のセマンティック一貫性と時間的一貫性を高めるために,リッチコンテキスト拡散モデル(RCDM)を提案する。 RCDMは、自動回帰モデルと比較して、1つの前方推論で一貫したストーリーを生成することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:58:07 GMT)
Adaptive Autopilot: Constrained DRL for Diverse Driving Behaviors [12.8]
本研究では,制約深度強化学習(C-DRL)を利用した独自のフレームワークである適応オートパイロット(AA)を導入する。 AAは、ドライバーの介入の必要性を減らすために、人間の運転を安全にエミュレートすることを目的としている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:08:01 GMT)
A Quantitative and Qualitative Evaluation of LLM-Based Explainable Fault Localization [12.8]
AutoFLは、提案された障害位置とともに、バグの説明を生成する。 JavaとPythonの798の現実世界のバグの実験では、AutoFLはメソッドレベルのcc@1を、ベースライン上で最大233.3%改善した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:25:16 GMT)
Fair Resource Allocation in Multi-Task Learning [12.8]
マルチタスク学習(MTL)はタスク間の共有知識を活用でき、データ効率と一般化性能が向上する。 MTLにおける大きな課題は、いくつかのタスクの公平な最適化を妨げる、矛盾する勾配の存在にある。通信ネットワークにおける公平なリソース割り当てに着想を得て,新しいMTL最適化法であるFairGradを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:09:32 GMT)
GVDIFF: Grounded Text-to-Video Generation with Diffusion Models [12.7]
本稿では,GVDIFFと呼ばれるグラウンドドテキスト・ビデオ生成フレームワークを提案する。対象物と接地条件を結びつける空間時空間接地層を導入し,空間時空間領域における接地生成能力を持つモデルを実現する。我々は、GVDIFFの基底生成能力を広く評価し、長距離ビデオ生成、シーケンシャルプロンプト、オブジェクト固有の編集など、その汎用性を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:36:23 GMT)
Prompt-based Pseudo-labeling Strategy for Sample-Efficient Semi-Supervised Extractive Summarization [12.6]
半教師付き学習(SSL)は、ラベル付きデータが不足し、ラベルなしデータが豊富であるシナリオで広く使われているテクニックである。標準SSLメソッドは、まず分類モデルをトレーニングし、次に分類器の信頼性値を使用して擬似ラベルを選択するために教師-学生パラダイムに従う。より正確な擬似ラベルでラベルなしのサンプルを抽出するLLMを用いたプロンプトベースの擬似ラベル方式を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:16:28 GMT)
Complexity of Digital Quantum Simulation in the Low-Energy Subspace: Applications and a Lower Bound [12.0]
シミュレーションの誤差は、様々なデジタル量子シミュレーションアルゴリズムや量子システムにおいて、ハミルトニアンの有効な低エネルギーノルムに依存することを示す。低エネルギー部分空間におけるスピンモデルをシミュレートするために、qDRIFTやランダムな置換のようなランダム化された積公式はより小さなトロッター数を必要とすることを証明した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:46:50 GMT)
CALICO: Confident Active Learning with Integrated Calibration [12.0]
トレーニングプロセス中にサンプル選択に使用される信頼度を自己校正するALフレームワークを提案する。ラベル付きサンプルが少ないソフトマックス分類器と比較して,分類性能が向上した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:05:19 GMT)
A Curious Case of Searching for the Correlation between Training Data and Adversarial Robustness of Transformer Textual Models [11.9]
既存の研究によると、微調整されたテキスト変換モデルは最先端の予測性能を実現するが、敵対的なテキスト摂動にも弱い。本稿では,トレーニングデータとモデルロバスト性との間にも強い相関関係があることを証明したい。様々な入力微調整コーパス特性を表す13の異なる特徴を抽出し,それらを用いて微調整モデルの対角的堅牢性を予測する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:29:11 GMT)
Depth-Aware Endoscopic Video Inpainting [11.9]
ビデオのインペイントは、破壊されたビデオコンテンツに、もっともらしい代替品を埋める。近年の内視鏡的映像の塗布は, 内視鏡的映像の質を高める可能性を示している。主に臨床参照のために重要な3次元空間的詳細を保存することなく2次元視覚情報を修復する。本稿では,新しいDepth-awareendoscopic Video Inpaintingフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:28:36 GMT)
TrustSQL: Benchmarking Text-to-SQL Reliability with Penalty-Based Scoring [11.8]
本稿では,任意の入力質問を正しく処理するモデルとして,テキスト・ツー・信頼性を評価するための新しいベンチマークを提案する。 2つのモデリング手法を用いて,新たなペナルティに基づく評価基準を用いた既存手法の評価を行った。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:32:22 GMT)
DVLO: Deep Visual-LiDAR Odometry with Local-to-Global Feature Fusion and Bi-Directional Structure Alignment [11.8]
画像は規則的で密度が高いが、LiDARポイントは秩序がなく、疎い。双方向構造アライメントを有する局所-グローバル融合ネットワークを提案する。本手法は,KITTI odometry と FlyingThings3D シーンフローデータセットの最先端性能を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:23:40 GMT)
MALT Powers Up Adversarial Attacks [11.7]
我々は,中規模ニアリニア性仮定に基づく新しい対向的ターゲット手法,textitMALT - メソスコピックニアリニアリティターゲティングを提案する。我々の攻撃は、標準ベンチマークデータセットCIFAR-100とImageNetにおけるAutoAttackの現在の状況に勝っている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:02:12 GMT)
Spatio-Temporal Graphical Counterfactuals: An Overview [11.6]
反現実は、人工知能がデータから知識を学習する上で、重要かつ困難なトピックである。本研究の目的は,思考を比較し,異なる対実モデル,理論,アプローチについて議論することである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:34:13 GMT)
What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models [11.4]
Language Models (LMs) という用語は常に再発明されており、その参照語はthesusの $textitShip のように更新されている。本稿では,この「textitShip of Language Models$ problem」について考察する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:45:55 GMT)
Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization [11.3]
セキュアなマルチパーティ計算に基づく意思決定ツリーのためのマルチパーティトレーニングフレームワークにより、複数のパーティが、プライバシ保護を備えた分散プライベートデータ上で、高性能モデルをトレーニングすることができる。決定木のための既存のマルチパーティトレーニングフレームワークは、通信オーバーヘッドが大きいため、コミュニケーションの非効率性を実証する。本稿では,コミュニケーション最適化による意思決定木のための効率的な3要素学習フレームワークであるEntsを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:33:52 GMT)
Pinyin Regularization in Error Correction for Chinese Speech Recognition with Large Language Models [11.3]
724Kの仮説と書き起こしのペアを持つ中国語ASRの誤り訂正を目的とした,特殊なベンチマークデータセットを構築した。本稿では,テキスト仮説から直接Pinyinを転写するプロンプトに対するPinyin正規化法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:16:47 GMT)
Evaluating the Robustness of Adverse Drug Event Classification Models Using Templates [11.3]
副作用 (ADE) は、薬物治療によって引き起こされる有害事象である。その重要性にもかかわらず、ADEはしばしば公式チャンネルで報告されていない。ソーシャルメディアにおけるADEの議論を検出する研究もある。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:09:24 GMT)
SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation [11.2]
Referring Expression Consistency (RES) は、テキストによって参照される画像において、対象オブジェクトのセグメンテーションマスクを提供することを目的としている。アルゴリズムの革新を取り入れたRESのための弱教師付きブートストラップアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:02:25 GMT)
Attack-Aware Noise Calibration for Differential Privacy [11.2]
差分プライバシー(DP)は、機密データに基づいて機械学習モデルをトレーニングする際のプライバシーリスクを軽減するために広く用いられるアプローチである。標準のプラクティスは、プライバシ予算パラメータ$epsilon$という観点からノイズスケールを選択することです。本稿では,エプシロン$を選択する中間ステップを回避して,ノイズスケールを所望の攻撃リスクレベルに調整する方法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:49:59 GMT)
Logistics Hub Location Optimization: A K-Means and P-Median Model Hybrid Approach Using Road Network Distances [11.0]
ロジスティックハブは、最終マイルの配送距離において重要な役割を果たす。電子商取引業界は、都市環境における資源配分の最適化の必要性を強めている。本研究では,ロジスティックハブの配置を最適化するためにハイブリッドアプローチを用いる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:52:11 GMT)
Domain Generalizable Knowledge Tracing via Concept Aggregation and Relation-Based Attention [11.0]
本稿では,知識追跡のための領域一般化手法を提案する。また,多様な領域からの学生同士の相互作用のシーケンスにおける概念格差を低減するために,概念集約アプローチを提案する。運動情報を完全に活用するために,ドメイン一般化KTタスクに適した知識追跡モデルDGRKTを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:13:44 GMT)
EIT-1M: One Million EEG-Image-Text Pairs for Human Visual-textual Recognition and More [10.9]
我々は,100万以上のEEG-image-textペアを持つ,EIT-1Mという新しい大規模マルチモーダルデータセットを提案する。我々のデータセットは、マルチモーダル情報の同時処理において、脳活動を反映する能力に優れている。我々は、さまざまなカテゴリや参加者のマルチモーダル刺激から得られる脳波データの詳細な分析と、透明性のためのデータ品質スコアを提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:11:15 GMT)
How to Learn in a Noisy World? Self-Correcting the Real-World Data Noise on Machine Translation [10.7]
実世界のハード・トゥ・デテクト・ミスアライメントノイズが機械翻訳に与える影響について検討する。トークンレベルでの不整合とクリーンなデータを区別するために,モデルの自己認識の信頼性が高まるのを観察することにより,自己補正手法を提案する。提案手法は,8つの翻訳タスクにまたがる実世界のノイズの多いWebマイニングデータセットに対して有効であることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:15:15 GMT)
Safe CoR: A Dual-Expert Approach to Integrating Imitation Learning and Safe Reinforcement Learning Using Constraint Rewards [10.7]
複雑な環境をナビゲートするための安全な報酬学習フレームワークを提案する。提案フレームワークは,実世界のJackalプラットフォーム上での制約違反を8,8$%削減する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:05:16 GMT)
Fast, Scalable, Energy-Efficient Non-element-wise Matrix Multiplication on FPGA [10.6]
現代のニューラルネットワーク(NN)アーキテクチャは、膨大な数の乗算演算に依存している。本稿ではFPGA上の高スループット,スケーラブル,エネルギー効率の非要素的行列乗算ユニットを提案する。 AMUを使用すると、FPGAベースの量子ニューラルネットワーク(QNN)アクセラレーターの最先端ソリューションよりも最大9倍高いスループットと112倍高いエネルギー効率が得られる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:28:10 GMT)
Multi-Grained Contrast for Data-Efficient Unsupervised Representation Learning [10.6]
教師なし表現学習のための新しいマルチグラインドコントラスト法(MGC)を提案する。具体的には、ポジティブビュー間の微妙な多重粒度対応を構築し、その上で、対応によって多粒度コントラストを行い、より一般的な教師なし表現を学習する。提案手法は,オブジェクト検出,インスタンスセグメンテーション,シーン解析,セマンティックセグメンテーション,キーポイント検出など,広範囲なダウンストリームタスクにおいて,既存の最先端手法よりも大幅に優れている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:35:21 GMT)
Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement [10.6]
マルチモーダルECG表現学習(MERL)は、テキストプロンプトでゼロショットECG分類を行うことができる。本稿では,外部の専門知識データベースを利用した臨床知識向上技術(CKEPE)アプローチを提案する。 MERLは、ゼロショット分類における平均75.2%のAUCスコアを(トレーニングデータなしで)達成し、10%の注釈付きトレーニングデータを持つ線形プローブeSSLメソッドよりも3.2%高い。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:51:11 GMT)
Zero-error communication under discrete-time Markovian dynamics [10.5]
離散時間)マルコフ力学を持つ開量子系を考える。我々の課題は、システムが任意に長い時間進化した後でも、完全に復元できるように、システムに情報を保存することである。これは、力学が混合されているとき、古典的な(参照量子)情報に対して正確には不可能であることを示す。さらに、このようなダイナミクスが完全な検索点を超えるエンコードされた情報をスクランブルする最小時間に、厳密な普遍的上限を与える。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:14:33 GMT)
Multi-Modal Video Dialog State Tracking in the Wild [10.5]
MST-MIXERは、汎用的なマルチモーダル状態追跡スキーム上で動作する新しいビデオダイアログモデルである。新たなマルチモーダルグラフ構造学習法を用いて,各入力モードの選択した構成成分の不足する基盤構造を予測する。 5つの挑戦的なベンチマークで、最先端の新たな結果を達成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:34:17 GMT)
QSync: Quantization-Minimized Synchronous Distributed Training Across Hybrid Devices [10.4]
QSyncは、ハイブリッドデバイス上で効率的な同期データ並列DNNトレーニングを可能にするトレーニングシステムである。そこで本研究では,QSyncが分散混合精度トレーニングを5%の誤差で正確にシミュレートできることを示し,その精度は0.27-1.03%向上した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:56:47 GMT)
Label Anything: Multi-Class Few-Shot Semantic Segmentation with Visual Prompts [10.3]
少ショットセマンティックセグメンテーション(FSS)用に設計された革新的なニューラルネットワークアーキテクチャであるLabel Anythingを紹介します。 Label Anythingは、クラス毎に必要最小限の例で、複数のクラスにまたがる顕著な一般化性を示す。包括的実験検証、特にCOCO-20i$ベンチマークにおける最先端の結果の達成は、Ravell Anythingの堅牢な一般化と柔軟性を裏付けるものです。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:08:06 GMT)
HOIMotion: Forecasting Human Motion During Human-Object Interactions Using Egocentric 3D Object Bounding Boxes [10.2]
本稿では,人間と物体の相互作用における人間の動き予測の新しい手法であるHOIMotionを提案する。提案手法は,過去の身体のポーズやエゴセントリックな3Dオブジェクト境界ボックスに関する情報を統合する。 HOIMotionは、最先端の手法よりも大きなマージンで一貫して優れていることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:58:35 GMT)
CatMemo at the FinLLM Challenge Task: Fine-Tuning Large Language Models using Data Fusion in Financial Applications [10.2]
IJCAI-2024 FinLLMの課題に対して,金融業務の3つの重要な領域におけるLLMの能力について検討した。金融分類、財務文書要約、単一株式取引について検討する。提案手法は,これらの多様なタスクを包括的かつ総合的に処理することを目的としており,LLMの多様かつ複雑な財務課題への対処能力の向上と意思決定能力の向上を図っている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:04:13 GMT)
BeNeRF: Neural Radiance Fields from a Single Blurry Image and Event Stream [10.0]
一つのぼやけた画像とそれに対応するイベントストリームからニューラル放射場(NeRF)を復元する可能性を示す。本手法は暗黙的なニューラルシーンの表現を共同で学習し,カメラの動きを復元する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:28:22 GMT)
Semantically Guided Representation Learning For Action Anticipation [9.8]
本稿では,S-GEAR(Semantically Guided Representation Learning)フレームワークを提案する。 S-GEARは視覚行動のプロトタイプを学び、言語モデルを利用して関係を構造化し、意味を誘導する。我々は,S-GEARが言語から視覚プロトタイプへ行動間の幾何学的関連を効果的に伝達することを示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:44:01 GMT)
Logarithmic regret bounds for continuous-time average-reward Markov decision processes [9.8]
無限水平平均回帰設定における連続時間決定過程(MDP)の強化学習について検討する。我々は、時間的地平線において対数的なインスタンス依存の後悔の下限を導出する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:57:21 GMT)
SOAF: Scene Occlusion-aware Neural Acoustic Field [9.7]
そこで我々は,Scene Occlusion-aware Acoustic Field (SOAF) と呼ばれる新しい手法を提案する。提案手法は,距離対応パラメトリック音波伝搬モデルを用いた音場に先行する手法である。そこで我々は、Fibonacci Sphereを用いて、受信機を中心にした局所音場から特徴を抽出し、新しい視聴のための音声を生成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:40:56 GMT)
VDD: Varied Drone Dataset for Semantic Segmentation [9.6]
7つのクラスにまたがる400の高解像度画像の大規模なラベル付きコレクションをリリースする。このデータセットは、様々なカメラアングルから撮影され、様々な照明条件の下で都市、工業、農村、自然のエリアで様々なシーンを特徴としている。私たちは、ドローンデータセットをベースラインとして7つの最先端モデルをトレーニングします。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:35:51 GMT)
A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data [9.6]
実世界のモデリングパイプラインは、しばしばデータセット固有の前処理と特徴工学を必要とするため、モデル中心の評価は偏りがあることを実証する。 Kaggleコンペティションから10の関連するデータセットを選択し、データセット毎に専門家レベルの前処理パイプラインを実装します。データセット固有の機能エンジニアリングの後、モデルランキングは大幅に変化し、性能差が減少し、モデル選択の重要性が低下する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:54:39 GMT)
Universal Approximation Theory: The basic theory for deep learning-based computer vision models [9.5]
コンピュータビジョン(CV)は人工知能において最も重要な分野の一つである。近年,畳み込みニューラルネットワーク(CNN)とトランスフォーマーに基づくさまざまなディープラーニングモデルが,CVの多様な問題に対処するために設計されている。これらのアルゴリズムはロボット工学や顔認識などの分野で実用化されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:08:30 GMT)
Natural Language Can Help Bridge the Sim2Real Gap [9.5]
Sim2Realは、現実世界のターゲットドメインでデータ不足を克服するための有望なパラダイムである。本稿では,画像の自然言語記述を領域間の統一信号として用いることを提案する。言語記述を予測するために、画像エンコーダをトレーニングすることは、有用な、データ効率の良い事前学習ステップとなることを実証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:29:04 GMT)
On the Robustness of Graph Reduction Against GNN Backdoor [9.4]
グラフニューラルネットワーク(GNN)は,グラフ構造化データ学習の有効性から,さまざまな領域で人気を集めている。バックドア中毒は、現実世界の応用に深刻な脅威をもたらす。粗大化やスパシフィケーションを含むグラフ削減技術は、大規模グラフ上でのGNNトレーニングを加速する有効な方法として現れている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:08:38 GMT)
Adversarial Magnification to Deceive Deepfake Detection through Super Resolution [9.4]
本稿では, 深度検出における対角攻撃の可能性として, 超解像法の適用について検討する。画像の視覚的外観におけるこれらの手法による最小限の変化は、ディープフェイク検出システムの性能に大きな影響を及ぼすことを示す。そこで我々は,超解像を高速かつブラックボックスとして,偽画像のキャモフラージュやプリスタン画像の偽アラーム生成に有効な手法として,新しい攻撃法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:17:36 GMT)
SwiftDiffusion: Efficient Diffusion Model Serving with Add-on Modules [9.4]
我々は,安定な拡散モデルとアドオンモジュールを用いて,高品質な画像を効率よく生成するシステムSwiftDiffusionを提案する。最先端のテキスト・ツー・イメージ配信システムと比較すると、SwiftDiffusionはレイテンシを最大5倍に削減し、スループットを最大2倍改善する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:59:08 GMT)
Augmenting Efficient Real-time Surgical Instrument Segmentation in Video with Point Tracking and Segment Anything [9.3]
手術器具のセグメンテーションを微調整した軽量SAMモデルとオンラインポイントトラッカーを組み合わせた新しいフレームワークを提案する。関心領域内のスパースポイントが追跡され、SAMをビデオシーケンス全体を通してプロンプトし、時間的一貫性を提供する。提案手法は,XMemとトランスフォーマーをベースとした完全教師付きセグメンテーション手法に匹敵する有望な性能を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:45:56 GMT)
Close, But Not There: Boosting Geographic Distance Sensitivity in Visual Place Recognition [9.2]
我々は、現在のVPR埋め込みの地理的距離感度の制限が、トップk検索を誤ってソートする確率が高いことを定式化する。我々は,視覚的に類似した画像のグラフから斜めをサンプリングすることにより,正および負の例を選択する新たなマイニング戦略であるCliqueMiningを提案する。提案手法は,VPR埋め込みの感度を極小範囲で向上させ,関連するベンチマークの精度を著しく向上させる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:49:01 GMT)
Self-Cooperation Knowledge Distillation for Novel Class Discovery [9.0]
新たなクラス発見(NCD)は、既知のクラスについて既に学んだ知識を活用することで、ラベルのないセットで未知のクラスと新しいクラスを発見することを目的としている。本研究では, 自己協調的知識蒸留法 (SCKD) を提案し, 各トレーニングサンプル(既知の, 新規, ラベル付, ラベル付, 未ラベル) を, レビューと発見の両方に活用する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:49:48 GMT)
D-Rax: Domain-specific Radiologic assistant leveraging multi-modal data and eXpert model predictions [8.9]
ドメイン固有の対話型無線支援ツールD-Raxを提案する。我々は胸部X線(CXR)画像の会話解析を強化し,放射線学的報告を支援する。オープン・エンド・会話とクローズド・会話の双方において,反応の統計的に有意な改善が認められた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:43:10 GMT)
Analytical Solution of a Three-layer Network with a Matrix Exponential Activation Function [8.8]
行列指数活性化関数を持つ3層ネットワークの解を求める。我々の証明は、深さのパワーと非活性化関数の使用を示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:59:34 GMT)
Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving [8.5]
ムーンケーキ(Mooncake)は、ムーンショットAIが提供するLLMサービスであるキミのサービスプラットフォームである。プリフィルとデコードクラスタを分離するKVCache中心の非集約アーキテクチャを備えている。 Mooncakeの革新的なアーキテクチャにより、Kimiは75%以上のリクエストを処理することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:49:35 GMT)
Synergy: Towards On-Body AI via Tiny AI Accelerator Collaboration on Wearables [8.4]
Synergyは、AIアクセラレータを搭載したウェアラブルに対して、システム駆動の全体的コラボレーションを通じて、AIアプリに最高のパフォーマンスを提供する。評価の結果,Synergyは平均23.0倍のスループット向上を実現し,レイテンシを73.9%,消費電力を15.8%削減した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:21:38 GMT)
An Interpretable Alternative to Neural Representation Learning for Rating Prediction -- Transparent Latent Class Modeling of User Reviews [8.4]
本稿では,レビュー情報に基づいてユーザおよび製品潜伏クラスを編成する透過確率モデルを提案する。本研究は,テキストベースニューラルネットワークと比較して,解釈可能性と予測性能の両面から評価する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:17:45 GMT)
MARLIN: A Cloud Integrated Robotic Solution to Support Intralogistics in Retail [8.4]
本稿では,サービスロボットのMARLINと,小売業における複雑なAIアプリケーションのためのクラウドシステムであるK4Rプラットフォームとの統合について述べる。 MarLINは、K4Rプラットフォームとデータを継続的に交換し、知覚、自律ナビゲーション、タスク計画におけるロボットの能力を改善する。我々はこれらの機能を、特に在庫棚の店員を支援することで、小売イントロロジクスのシナリオで活用する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:12:54 GMT)
Text-Aware Diffusion for Policy Learning [8.3]
テキスト対応政策学習のための高密度ゼロショット報酬信号を計算するために,TADPoLe(Text-Aware Diffusion for Policy Learning)を提案する。実験では,TADPoLeが新たな目標達成行動と連続移動行動のポリシーを学習できることを実証した。行動はゼロショットで学習され、基礎的な報酬や専門家によるデモンストレーションは行われず、人間の評価により質的にも自然である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:08:20 GMT)
Reusable Formal Verification of DAG-based Consensus Protocols [8.3]
DAGベースのコンセンサスプロトコルは、エネルギーフットプリントの削減とセキュリティ向上のために、ブロックチェーン企業によって採用されている。本稿では,2つのDAGプロトコルの安全仕様について述べる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:19:12 GMT)
Parameter Matching Attack: Enhancing Practical Applicability of Availability Attacks [8.2]
PMA(Matching Attack)と呼ばれる新しいアベイラビリティー・アプローチを提案する。 PMAは、データの一部を摂動できる場合に機能する最初のアベイラビリティ攻撃である。 PMAは既存の手法よりも優れており、トレーニングデータの一部が摂動した場合に顕著なモデル性能劣化を達成できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:15:12 GMT)
Linear Submodular Maximization with Bandit Feedback [7.9]
準モジュラー目的関数 $f:2UtomathbbR_geq 0$, ここでは $f=sum_i=1dw_iF_i$ に対する近似アルゴリズムの開発を検討する。 F_i$ 関数へのオラクルアクセスが期待できるが、係数 $w_i$ は未知であり、$f$ はノイズの多いクエリによってのみアクセス可能である。我々のアルゴリズムは、$fの線形構造を利用していないアルゴリズムと比較して、サンプル効率の点で大幅に改善されていることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:40:52 GMT)
Towards Human Understanding of Paraphrase Types in ChatGPT [7.7]
アトミック・パラフレーズ・タイプ(APT)は、パラフレーズを異なる言語的変化に分解する。 APTY(Atomic Paraphrase TYpes)は15のアノテーションによる500の文レベルのアノテーションと単語レベルのアノテーションのデータセットである。以上の結果から,ChatGPTは単純なAPTを生成できるが,複雑な構造に苦慮していることが明らかとなった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:35:10 GMT)
GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models [7.6]
ポスターはマーケティングと広告において重要な役割を担い、工業デザインに大きく貢献している。テキストレンダリングの精度が向上したにもかかわらず、エンドツーエンドのポスター生成の分野は未解明のままである。本稿では,整列学習に根ざした3つのクロスアテンション機構を用いたエンドツーエンドテキストレンダリングフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:17:49 GMT)
An End-to-End Speech Summarization Using Large Language Model [7.6]
音声要約(SSum)は、音声コンテンツから人間に似たテキスト要約を生成することを目的としている。大規模言語モデル(LLM)とマルチモーダル情報融合の研究は、新たな洞察をもたらした。本稿では、Q-Formerを音声テキストモダリティのコネクタとして利用するエンドツーエンドのSSumモデルを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:22:57 GMT)
Improved Genetic Algorithm Based on Greedy and Simulated Annealing Ideas for Vascular Robot Ordering Strategy [7.5]
本研究では,医療環境におけるABLVR血管ロボットの獲得,利用,維持を最適化するための包括的アプローチを提案する。ダイナミックな医療環境を考えると、ロボット船やオペレーターのためのロバストな資源配分モデルを含む。演算子に対する適応学習プロセスのユニークな要件と,ロボット部品のメンテナンスニーズを取り入れた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:20:41 GMT)
Hypernetworks for Personalizing ASR to Atypical Speech [7.5]
メタ学習型ハイパーネットワークを用いて,多種多様な非定型音声特性に対して,高度に個別化された発話レベル適応を生成する。ハイパーネットは,全パラメータ予算の0.1%を用いて,WERの相対的な75.2%削減を維持しつつ,分布外話者よりも一般化されていることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:51:54 GMT)
ECAT: A Entire space Continual and Adaptive Transfer Learning Framework for Cross-Domain Recommendation [7.5]
本稿では,ECAT と呼ばれる拡張空間連続・適応変換学習フレームワークを提案する。 ECATには2つのコアコンポーネントがある: まず、サンプル転送について、粗大なプロセスを実現する2段階の手法を提案する。第2に,空間データセット全体においてよく訓練されたモデルから表現を継続的に伝達する適応的知識蒸留法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:02:39 GMT)
Multi-level Reliable Guidance for Unpaired Multi-view Clustering [7.4]
MRG-UMC(Multi-level Reliable Guidance for UMC) という手法を提案する。 MRG-UMCはマルチレベルクラスタリングを活用して、インナービュー、クロスビュー、コモンビューにわたる信頼できるクラスタ構造を学習する。クロスビュー学習では、信頼性の高いビューガイダンスは、他のビューにおけるクラスタ構造の信頼性を高める。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:55:26 GMT)
Structure-Aware Consensus Network on Graphs with Few Labeled Nodes [7.4]
ラベル付きノードがほとんどないグラフノード分類は、監督が限られているため、大きな課題となる。従来の手法では、しばしばトランスダクティブな学習方法でグラフを利用する。本稿では,これらの課題を克服する構造対応コンセンサスネットワーク(SACN)を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:46:07 GMT)
Uniform Transformation: Refining Latent Representation in Variational Autoencoders [7.4]
本稿では,不規則な潜伏分布に対応するために,新しい適応型3段階一様変換(UT)モジュールを提案する。この手法は不規則分布を潜在空間の均一分布に再構成することにより、潜在表現の絡み合いと解釈可能性を大幅に向上させる。実験により,提案するUTモジュールの有効性を実証し,ベンチマークデータセット間の絡み合いの指標を改良した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:46:23 GMT)
Abstract Dialectical Frameworks are Boolean Networks (full version) [7.3]
我々は,これらの2つの形式主義の関係と,その相違を明らかにすること,および,個々の形式主義の新たな結果を確立するための対応について検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:37:05 GMT)
Core Knowledge Learning Framework for Graph Adaptation and Scalability Learning [7.2]
グラフ分類は、多様な予測タスクへの適応、複数のターゲットドメインでのトレーニング、小さなサンプル予測シナリオの処理など、いくつかのハードルに直面している。本手法は,様々なタスクからの洞察を取り入れることで,グラフ分類における適応性,拡張性,一般化性を向上させることを目的とする。実験の結果, 最先端手法と比較して, 提案手法による性能向上が顕著であった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:16:43 GMT)
Adaptive Modality Balanced Online Knowledge Distillation for Brain-Eye-Computer based Dim Object Detection [7.1]
本稿では,脳-眼-コンピュータによる空中画像検出システムを構築した。脳波画像データを用いた適応型モダリティバランスオンライン知識蒸留法(AMBOKD)を提案する。実世界のシナリオにおける公開データセットとシステム検証実験により,本手法の有効性と優位性を実証した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:30:23 GMT)
MIREncoder: Multi-modal IR-based Pretrained Embeddings for Performance Optimizations [6.9]
本稿では,Multi-modal IRベースのオートエンコーダであるMIREncoderを提案する。マルチモーダルなアプローチにより、コンパイル可能なプログラムからより優れた特徴を抽出できる。評価の結果,提案手法はオーバヘッドを低減しつつ,技術状況より優れることが示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:00:19 GMT)
Embodied AI in Mobile Robots: Coverage Path Planning with Large Language Models [6.9]
移動体エージェントのためのLLM方式の経路計画フレームワークを提案する。提案する多層アーキテクチャは,経路計画段階におけるLPMを用いて,移動エージェントの低レベルアクチュエータと統合する。本実験により,LLMの2次元平面推論能力と完全カバレッジパス計画タスクを改善することができることが示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:38:46 GMT)
Advancing Compressed Video Action Recognition through Progressive Knowledge Distillation [6.7]
圧縮ビデオアクション認識は、圧縮されたビデオ、すなわちモーションベクトル、残差、フレーム内の様々なモードを活用することで、ビデオサンプルを分類する。本稿では,PKD(Progressive Knowledge Distillation)を提案する。PKD(Progressive Knowledge Distillation)は,動きベクトルネットワークから始まる知識を蒸留し,残差を除去し,最後にフレーム内ネットワークを逐次改善し,IC精度を向上する手法である。実験では,PKDを用いたICのトレーニングの有効性を実証し,ICの精度を最大5.87%,11.42%向上させた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:30:01 GMT)
Unleash the Power of Local Representations for Few-Shot Classification [6.7]
訓練中に目に見えない新しいクラスに一般化することは、数発の分類において重要な課題である。最近の計量法は局所的な表現によってこの問題に対処しようとする。本研究では,局所表現の力を解き放ち,新しいクラスを一般化する手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:51:04 GMT)
LOGCAN++: Adaptive Local-global class-aware network for semantic segmentation of remote sensing imagery [6.7]
LOGCAN++はリモートセンシング画像用にカスタマイズされたセマンティックセグメンテーションモデルである。 GCA(Global Class Awareness)モジュールとLCA(Local Class Awareness)モジュールで構成されている。 LCAモジュールは、グローバルクラス表現と間接的にピクセルを関連付けるために、中間知覚要素としてローカルクラス表現を生成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:40:43 GMT)
Renard: A Modular Pipeline for Extracting Character Networks from Narrative Texts [6.6]
RenardはPythonライブラリで、ユーザーはナラティブテキストから文字ネットワークを抽出するカスタム自然言語処理(NLP)パイプラインを定義できる。レナードパイプラインはモジュラーであり、ユーザーは文字ネットワークを抽出するのに必要な各NLPサブタスクの実装を選択することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:14:59 GMT)
Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges [6.6]
審査員として機能する様々な大規模言語モデル(LLM)の性能について検討する。 LLMの客観的知識推論のベンチマークとしてTriviaQAを利用する。 Llama-370B と GPT-4 Turbo はどちらも人間に優れた整合性があることが判明した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:57:01 GMT)
Guylingo: The Republic of Guyana Creole Corpora [6.6]
クレオール語領域におけるNLP研究の進展を目的とした包括的コーパスについて述べる。我々はまず,この多言語コーパスの収集とデジタル化のための枠組みについて概説する。次に、クレオールにおける機械翻訳のためのNLPモデルの訓練と評価の課題を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:23:32 GMT)
Holistically-Nested Structure-Aware Graph Neural Network for Road Extraction [6.5]
本稿では,道路領域と道路境界の両方を同時に検出する新しいグラフニューラルネットワーク(GNN)を提案する。挑戦的データセットの実験により,提案手法が道路境界のデライン化と道路抽出精度を向上させることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:11:09 GMT)
Two Simple Proofs of Müller's Theorem [6.5]
ミュラーの定理はアルゴリズム情報理論と物理学の交わりにおける最も重要な結果である。古典的な情報源の量的な情報は、使用する物理モデルに不変である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:40:31 GMT)
Feynman-Kac Operator Expectation Estimator [6.5]
Feynman-Kac Operator expectation Estimator (FKEE) は数学的期待を推定するための革新的な手法である。 FKEEは拡散ブリッジモデルとファインマン・カック作用素の近似から構成される。 Feynman-Kac演算子を近似するために,Physically Informed Neural Networks (PINN) を用いる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:29:02 GMT)
Research on target detection method of distracted driving behavior based on improved YOLOv8 [6.4]
本研究では,BOTNetモジュール,GAMアテンション機構,EIoU損失関数を統合することで,従来のYOLOv8モデルに基づく改良されたYOLOv8検出手法を提案する。実験の結果, 精度は99.4%であり, 検出速度, 精度ともに良好であった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 00:43:41 GMT)
Contrastive independent component analysis [6.3]
コントラスト独立成分分析(cICA)を提案する。これは、独立成分分析をフォアグラウンドとバックグラウンドにまたがる独立潜伏変数に一般化する。我々は,cICAの識別可能性について検討し,その性能の可視化とデータ中のパターンの発見を,合成および実世界のデータセットを用いて実証した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:24:10 GMT)
SparseSSP: 3D Subcellular Structure Prediction from Sparse-View Transmitted Light Images [6.3]
従来の蛍光染色は、生きた細胞に光毒性があり、遅くて高価である。従来のアプローチでは、1対1のボクセルレベルの密度予測に3Dネットワークを使用している。本研究では,ターゲットボクセル格子内の蛍光強度を予測する効率的なフレームワークであるSparseSSPを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:08:51 GMT)
Stochastic Differential Equations models for Least-Squares Stochastic Gradient Descent [6.3]
グラディエントDescent(SGD)の連続時間モデルのダイナミクスについて検討する。我々は,SGDをモデル化する退化微分方程式(squareSDEs)を,トレーニング損失(有限サンプル)と集団1(オンライン設定)のいずれにおいても解析する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:52:21 GMT)
SUPER: Seated Upper Body Pose Estimation using mmWave Radars [6.2]
Superは、双対mmWaveレーダーを近接して利用する上半身の人間のポーズ推定のためのフレームワークである。軽量ニューラルネットワークは、上半身の大域的特徴と局所的特徴の両方を抽出し、Skinned Multi-Person Linear (SMPL)モデルの出力ポーズパラメータを抽出する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:32:34 GMT)
Leveraging Large Language Models for Actionable Course Evaluation Student Feedback to Lecturers [6.2]
コンピュータサイエンス科の75科以上で742名の学生が回答した。各コースについて,授業評価項目と動作可能な項目の要約を合成する。本研究は, 授業環境における教師に対して, 実感的, 行動的, 適切なフィードバックを生み出すために, 生成的AIを使用する可能性を強調した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:47:45 GMT)
A Closer Look at Classification Evaluation Metrics and a Critical Reflection of Common Evaluation Practice [6.1]
分類システムは数え切れないほど多くの論文で評価されている。しかし,評価の実践がしばしば誤りであることがわかった。多くの研究は、いわゆる「マクロ」メトリクスを使ってシステムをランク付けするが、そのようなメトリクスから何を期待するかを明確には示していない。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:53:09 GMT)
Hybrid Feature Collaborative Reconstruction Network for Few-Shot Fine-Grained Image Classification [6.1]
画像分類のためのHFCR-Net(Hybrid Feature Collaborative Restruction Network)を設計する。チャネルの特徴と空間的特徴を融合させ,クラス間差を増大させる。広範に使われている3つのきめ細かいデータセットに対する実験は、我々のアプローチの有効性と優位性を示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:14:00 GMT)
Metamorphic Runtime Monitoring of Autonomous Driving Systems [6.0]
メタモーフィックリレーショナル(MR)に基づく自律運転システム(ADS)のオンラインモニタリング手法であるMarMotを提案する。 MarMotは実行時のADSの不確実性を推定し、ADSの異常な動作を引き起こす可能性のある異常な状況の特定を可能にする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:44:33 GMT)
HyperLoader: Integrating Hypernetwork-Based LoRA and Adapter Layers into Multi-Task Transformers for Sequence Labelling [6.0]
マルチタスク設定におけるパラメータ効率の異なる微調整手法を組み合わせたシンプルな手法であるHyperLoaderを提案する。本手法は,全タスクの構造を捉えることで,マルチタスク学習の利点を組み合わせる。我々は、HyperLoaderが多くのデータセットで過去のアプローチより優れているという実証的な証拠を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:21:41 GMT)
Structure-based drug design by denoising voxel grids [6.0]
タンパク質構造を条件とした新しい3次元分子のスコアベース生成モデルであるVoxBindを提案する。我々のアプローチは分子を3次元原子密度格子として表現し、学習と生成に3次元ボクセル除去ネットワークを活用する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:28:28 GMT)
A Survey on Popularity Bias in Recommender Systems [6.0]
本稿では、人気バイアスの潜在的な原因について論じ、リコメンダシステムにおける人気バイアスを検出し、緩和し、定量化するための既存のアプローチをレビューする。本稿では,主に計算実験に基づく研究であり,推奨項目に長期的項目を含めることの実践的効果について,特定の仮定を前提として,今日の文献を批判的に論じる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:39:41 GMT)
TEII: Think, Explain, Interact and Iterate with Large Language Models to Solve Cross-lingual Emotion Detection [5.9]
言語間感情検出により,グローバルな傾向,世論,社会現象を大規模に分析することができる。我々のシステムは0.16F1スコアの絶対値でベースラインを上回り、競合するシステムの中では2位にランクインした。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:18:51 GMT)
Matching domain experts by training from scratch on domain knowledge [5.9]
近年,大きな言語モデル (LLM) は神経科学実験の結果を予測する上で,人間の専門家より優れています。ドメイン固有知識の13億トークンに対して,比較的小さな124MパラメータGPT-2モデルを訓練した。数兆のトークンで訓練された大型LLMよりも桁違いに小さいにもかかわらず、小さなモデルは神経科学の結果を予測する専門家レベルのパフォーマンスを達成した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:42:48 GMT)
Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties [5.8]
Multi-Peptideは、トランスフォーマーベースの言語モデルとグラフニューラルネットワーク(GNN)を組み合わせてペプチドの性質を予測する革新的なアプローチである。溶血性データセットおよび非汚泥性データセットの評価は、多ペプチドの堅牢性を示し、溶血性予測における最先端86.185%の精度を達成する。本研究は, 生体情報学におけるマルチモーダル学習の可能性を強調し, ペプチドを用いた研究・応用における正確かつ信頼性の高い予測方法を模索する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:13:47 GMT)
A Method to Facilitate Membership Inference Attacks in Deep Learning Models [5.7]
我々は,従来の技術よりも厳格に強力な新たな会員推論攻撃を実演する。私たちの攻撃は、敵がすべてのトレーニングサンプルを確実に識別する権限を与えます。これらのモデルは、共通の会員プライバシー監査の下で、増幅された会員リークを効果的に偽装できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:33:42 GMT)
ColorizeDiffusion: Adjustable Sketch Colorization with Reference Image and Text [5.7]
事前学習したCLIP画像エンコーダの異なる画像トークンを利用した画像誘導潜時拡散モデルの2つのバリエーションを紹介する。重み付きテキスト入力を用いて結果の逐次的調整を行うための,対応する操作手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:35:08 GMT)
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version) [5.5]
ロボット制御のための強化学習(RL)は通常、環境状態の詳細な表現を必要とする。空間オートエンコーダ(SAE)のようなキーポイント検出器は、高次元画像データから低次元表現を抽出する一般的な手法である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:09:19 GMT)
Black Big Boxes: Do Language Models Hide a Theory of Adjective Order? [5.4]
英語や他の言語では、複雑な名詞句の複数の形容詞は、多くの言語理論の標的となった複雑な順序付けパターンを示している。本稿では,人体における形容詞順選好(AOP)を説明するために設計された既存の仮説を概観し,言語モデルにおけるAOPを学習するための設定を開発する。理論言語学で特定された因子によって生成される予測よりも,全てのモデルの予測が人間のAOPにずっと近いことが判明した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:29:09 GMT)
Robust ADAS: Enhancing Robustness of Machine Learning-based Advanced Driver Assistance Systems for Adverse Weather [5.4]
本稿では,デノイングディープニューラルネットワークを前処理ステップとして,悪天候画像から晴天画像へ変換する。ドライバーの視認性が向上し、悪天候下での安全なナビゲーションに欠かせない。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:03:52 GMT)
LaMoD: Latent Motion Diffusion Model For Myocardial Strain Generation [5.4]
本稿では,標準CMRビデオから高精度なDENSE動作を予測するため,新しいラミネートモーション拡散モデル(LaMoD)を提案する。実験の結果,提案手法であるLaMoDは標準CMR画像の動作解析の精度を大幅に向上することが示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:54:32 GMT)
FineCLIPER: Multi-modal Fine-grained CLIP for Dynamic Facial Expression Recognition with AdaptERs [5.4]
適応器を用いた動的顔表情認識のためのマルチモーダルきめ細粒度CLIP(Fine CLIPER)を提案する。我々のFine CLIPERは、パラメータが少ないDFEW、FERV39k、MAFWデータセットで調整可能なSOTA性能を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:55:43 GMT)
Light scattering properties beyond weak-field excitation in atomic ensembles [5.3]
本研究では,原子アンサンブルの光散乱特性について,累積膨張法を用いて検討した。解析の結果, 弱い双極子-双極子相互作用 (DDI) の段階において, 1次展開は光深度に対する良好な予測をもたらすことがわかった。入射光の強度が増加すると、原子飽和効果が顕著になり、光透過性、エネルギーシフト、崩壊速度が著しく変化する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:36:18 GMT)
Slim-neck by GSConv: A lightweight-design for real-time detector architectures [5.3]
本稿では,新しい軽量畳み込み手法であるGSConvを導入し,モデルの軽量化と精度の向上を図る。本稿では,GSConv, Slim-Neck (SNs) に基づく設計提案を行い, リアルタイム検出器の計算コスト効率の向上を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:13:56 GMT)
"There Has To Be a Lot That We're Missing": Moderating AI-Generated Content on Reddit [5.2]
我々は、AIGCによるオンラインコミュニティモデレーターの経験に焦点を当てる。我々の研究によると、コミュニティは、イデオロギーと実践の両方の理由から、AIGCの使用を制限する規則を制定することを選択している。この急激な技術的変化に直面して,コミュニティの自立と自己決定を支援することの重要性を強調した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:13:08 GMT)
SINCERE: Supervised Information Noise-Contrastive Estimation REvisited [5.0]
これまでの研究では、InfoNCEを拡張して利用可能なクラスラベルから学ぶために、教師付きコントラスト(SupCon)損失が示唆されていた。本稿では,InfoNCE の教師付き拡張として Supervised InfoNCE Revisited (SINCERE) 損失を提案する。実験により、SINCEREは、異なるクラスから埋め込みを分離し、転送学習の分類精度を向上させることが示されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:02:39 GMT)
Zero Inflation as a Missing Data Problem: a Proxy-based Approach [5.0]
共通型のゼロ膨らんだデータは、ある真の値を誤ってゼロに置き換える。本稿では、ゼロインフレーションされたデータを、欠落データ問題の一般的なタイプとみなす。追加の仮定なしでは、ゼロインフレード変数を含むターゲットパラメータが特定されないことを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:59:47 GMT)
DrugCLIP: Contrastive Drug-Disease Interaction For Drug Repurposing [5.0]
DrugCLIPは、ネガティブなラベルなしで薬物と疾患の相互作用を学ぶための対照的な学習方法である。実地臨床試験記録に基づく薬物再服用データセットをキュレートした。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:41:59 GMT)
Towards More Realistic Extraction Attacks: An Adversarial Perspective [4.9]
言語モデルは、トレーニングデータの大部分を記憶しやすく、抽出攻撃に対して脆弱である。本稿では,言語モデルの脆さを活かして,敵対的観点からの抽出攻撃を再考する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:33:49 GMT)
Reconstruction of Cardiac Cine MRI Using Motion-Guided Deformable Alignment and Multi-Resolution Fusion [4.8]
心血管MRIの再構成を改善するために,新しいエンド・ツー・エンド深層学習ネットワークを開発した。提案手法は, よりリッチな細部と, 異なる加速度による心血管MRI再建のためのアーティファクトの少ない高品質な結果を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:07:25 GMT)
MomentsNeRF: Leveraging Orthogonal Moments for Few-Shot Neural Rendering [4.7]
ニューラルレンダリングのための新しいフレームワークであるMomentsNeRFを提案する。当社のアーキテクチャは,マルチシーンでトレーニングを行うための新しいトランスファー学習手法を提供する。我々のアプローチは、Gabor や Zernike のモーメントから抽出した機能をうまく活用する最初の方法です。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:02:48 GMT)
Sparse Variational Contaminated Noise Gaussian Process Regression with Applications in Geomagnetic Perturbations Forecasting [4.7]
大規模なデータセットに正規ノイズが汚染されたスパースガウス過程回帰モデルを適用するためのスケーラブルな推論アルゴリズムを提案する。提案手法は, 人工ニューラルネットワークベースラインと比較して, 類似のカバレッジと精度の予測間隔が短いことを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:25:19 GMT)
Accelerating Distributed Optimization: A Primal-Dual Perspective on Local Steps [4.5]
分散機械学習では、最適な通信を実現する現在のアルゴリズムは、通常、強い凸目標を必要とする。ラグランジアンが一般的であるにもかかわらず、通信ラウンドに対して(加速された)GAMS加速を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:14:54 GMT)
Joint-Dataset Learning and Cross-Consistent Regularization for Text-to-Motion Retrieval [4.5]
本稿では,自然動作記述に最も関係のあるシーケンスを検索することを目的とした,最近導入されたテキストモーション検索に注目した。これらの有望な道を探究する最近の努力にもかかわらず、大きな課題は、堅牢なテキストモーションモデルをトレーニングするための不十分なデータである。本稿では,複数のテキスト・モーション・データセットを同時にトレーニングする共同データセット学習について検討する。また、骨格データのプロセスシーケンスに特定の時間的注意をあてる、MoT++と呼ばれるトランスフォーマーベースのモーションエンコーダも導入する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:43:47 GMT)
A Hardware-Friendly Shuffling Countermeasure Against Side-Channel Attacks for Kyber [4.4]
CRYSTALS-Kyber(別名Kyber)は、唯一の鍵カプセル化機構(KEM)方式として標準化されている。実装上のサイドチャネルアタック(SCA)は、今後の移行に向けて十分に検討する必要がある。本稿では,新しいコンパクトシャッフルアーキテクチャを取り入れた,キーバーのセキュアで効率的なハードウェア実装を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:29:33 GMT)
Enable the Right to be Forgotten with Federated Client Unlearning in Medical Imaging [4.3]
医用画像における最初のFederated Client Unlearningフレームワークを紹介する。クライアントのアンラーニングプロセスにおいて、提案されたモデルコントラストのアンラーニングは、機能レベルのアンラーニングに向けた先駆的なステップである。頭蓋内出血の診断と皮膚病変の診断を含む2つの公開医用画像データセットの枠組みについて検討した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:21:11 GMT)
Light-weight End-to-End Graph Interest Network for CTR Prediction in E-commerce Search [4.3]
本稿では,ユーザの検索関心を効果的にマイニングするために,ライトウェイト・エンド・エンド・エンド・グラフ・関心ネットワーク (EGIN) という新しいアプローチを提案する。提案するEGINは,問合せ項目のヘテロジニアスグラフ,軽量グラフサンプリング,多目的ネットワークという3つの部分から構成される。提案したEGINの有効性を実証するため,公立および工業用両方のデータセットについて広範な実験を行った。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:05:55 GMT)
Reasoning in Large Language Models: A Geometric Perspective [4.3]
我々は,その幾何学的理解を通して,大規模言語モデル(LLM)の推論能力について検討する。 LLMの表現力と自己認識グラフの密度の関連性を確立する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:39:53 GMT)
RefExpo: Unveiling Software Project Structures through Advanced Dependency Graph Extraction [4.2]
RefExpoは、Java、Python、JavaScriptなどの複数の言語をサポートする、使いやすいDG抽出ツールである。 IntelliJプラグインSDKに基づいて、RefExpoはさまざまなプロジェクト構造と技術バージョンとの互換性を保証する。また、20のJavaおよびPythonプロジェクトのデータセットも提供しています。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:16:27 GMT)
AI in Action: Accelerating Progress Towards the Sustainable Development Goals [4.1]
私たちは、国連の持続可能な開発目標に対する行動を促進するAIの可能性を示すために、Googleの内部および共同研究、技術的作業、および社会的影響イニシアチブを描いています。この論文では、コンピュータビジョン、生成AI、自然言語処理、マルチモーダルAIを含むAIの能力を強調し、AIが17のSDGすべてにまたがる問題解決へのアプローチをどのように変えているかを示している。そして私たちは、大胆で責任あるイノベーションを推進し、インパクトを高め、アクセシビリティのギャップを埋め、すべての人がAIから恩恵を受けられるように、AI開発とデプロイメントに関する洞察を提供します。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:25:27 GMT)
Generative Model for Small Molecules with Latent Space RL Fine-Tuning to Protein Targets [4.0]
トレーニング中に発生する無効な断片化分子の数を減らすため,SAFEに改良を加えた。本モデルでは, 潜在空間からのサンプリングにより, 有効度90%, フラグメンテーション率1%の新規分子を生成できる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:01:37 GMT)
Novel Human Machine Interface via Robust Hand Gesture Recognition System using Channel Pruned YOLOv5s Model [4.0]
本稿では,チャネル型YOLOv5sモデルを用いた手動作検出と分類モデルを提案する。提案手法は,リアルタイムなジェスチャコマンドベースのHCIを実現するために,プルーニングされたYOLOv5sモデルをデプロイする方法を舗装する。提案システムの平均検出速度は60フレーム/秒 (fps) 以上に達している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:10:20 GMT)
Fusing Audio and Metadata Embeddings Improves Language-based Audio Retrieval [4.0]
生音声信号とテキスト記述とを一致させるには、音声の内容と記述の意味を理解する必要がある。本稿では,音声メタデータを付加的な手がかりとして用いたハイブリッド検索システムについて検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:13:14 GMT)
Evaluating the Ability of LLMs to Solve Semantics-Aware Process Mining Tasks [3.9]
大規模言語モデル(LLM)は、プロセスの振る舞いを理解することの恩恵を受けるプロセスマイニングタスクに取り組むために使用できる。本稿では,LLMがプロセスマイニングタスクに対処する能力について検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:44:49 GMT)
Facilitating Feature and Topology Lightweighting: An Ethereum Transaction Graph Compression Method for Malicious Account Detection [3.9]
Bitcoinは暗号通貨の主要なグローバルプラットフォームの一つとなり、金融エコシステムの多様化を促進する上で重要な役割を果たしている。従来の規制手法は通常、機能エンジニアリングや大規模トランザクショングラフマイニングを通じて悪意のあるアカウントを検出する。本稿では,TGC4Ethというトランザクショングラフ圧縮手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:59:02 GMT)
A Contrastive Learning Based Convolutional Neural Network for ERP Brain-Computer Interfaces [3.8]
クロスオブジェクトERP信号検出は、ERP信号成分の複雑さのために困難である。本稿では,マルチスケールの時間的特徴と空間的特徴を抽出するインセプション・モジュールを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:20:52 GMT)
Nollywood: Let's Go to the Movies! [3.8]
ナイジェリア英語をアメリカ英語に翻訳できる音声サブタイトルモデルを作成する。また、最も高度な毒性検知器を用いて、音声がどれほど有害であるかを検知します。我々の狙いは、方言理解の欠如からしばしば無視されるこれらのビデオのテキストを強調することである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:50:55 GMT)
Diffusion Models for Tabular Data Imputation and Synthetic Data Generation [3.7]
拡散モデルは、複雑なデータ分布をキャプチャできる強力な生成モデルとして登場した。本稿では,3つの重要な拡張を導入した表データの拡散モデルを提案する。コンディショニングアテンション機構は、条件と合成データの関係をキャプチャするモデルの能力を改善するように設計されている。変換器層は条件(エンコーダ)や合成データ(デコーダ)内の相互作用をモデル化し、動的マスキングにより、欠落したデータ計算と合成データ生成タスクの両方を効率的に処理できる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:27:06 GMT)
The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning [3.6]
我々は,神経科学にインスパイアされた自己教師対象の初期のセットと,表現学習のためのニューラルアーキテクチャを開発した。その結果、これらの目的によって学習された表現は、データとともにスケールし、対象、データセット、タスクをまたいで一般化し、ラベル付きデータのみを使用してより高速に学習されることが示されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:08:03 GMT)
Benchmarking bias: Expanding clinical AI model card to incorporate bias reporting of social and non-social factors [3.5]
社会的要因は、疾患依存、解剖学、または道具的要因などの他の要因がAIモデルのバイアスに与える影響を考察する。非社会的要因は、疾患依存、解剖学、または道具的要因などの他の要因がAIモデルのバイアスに与える影響を考察する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:51:46 GMT)
Show Less, Instruct More: Enriching Prompts with Definitions and Guidelines for Zero-Shot NER [3.5]
より少ない例でモデルに指示することで、未確認のエンティティタグに対処するために設計されたSLIMERを提案する。実験では、特に目に見えない名前付きエンティティをラベル付けする場合、定義とガイドラインがより良いパフォーマンス、より速く、より堅牢な学習をもたらすことを示した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:55:24 GMT)
A Depression Detection Method Based on Multi-Modal Feature Fusion Using Cross-Attention [3.5]
世界の人口の約3.8%が落ち込んでいる。低所得国と中所得国の75%以上が未治療のままである。本稿では,クロスアテンションを用いたマルチモーダル特徴融合に基づく抑うつ検出手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:13:35 GMT)
Parameter-Selective Continual Test-Time Adaptation [3.5]
継続的テスト時間適応(CTTA)は、継続的なドメインシフトの下でテスト期間中に、事前トレーニングされたモデルを常に変化する環境に適応することを目的としている。 PSMT法は、ドメインシフトの下でMTネットワーク内の臨界パラメータを効果的に更新することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:18:15 GMT)
Automatic Adaptation Rule Optimization via Large Language Models [3.5]
ルールベースの適応は、人間の可読性と迅速な応答を特徴とする自己適応の基本的なアプローチである。本稿では,大規模言語モデル(LLM)を適応規則の構築と最適化の能力として活用する。 SWIMにおける予備実験により,本手法の有効性と限界が検証された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:06:40 GMT)
Free Energy in a Circumplex Model of Emotion [3.4]
感情科学では、感情はしばしば多次元として表現される。本研究では,感情を2次元の原子価と覚醒スペクトルにマッピングすることで,感情の円積モデルを採用することを提案する。情緒的状態において,先行と対象存在の操作が常識的変動をもたらすことを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:52:25 GMT)
On the Expressive Power of Sparse Geometric MPNNs [3.4]
幾何学グラフに対するメッセージパッシングニューラルネットワークの表現力について検討する。非等価な幾何グラフの一般的なペアは、メッセージパッシングネットワークによって分離可能であることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:48:22 GMT)
The Solution for the ICCV 2023 Perception Test Challenge 2023 -- Task 6 -- Grounded videoQA [3.4]
本研究により,ビデオ質問応答のための固定されたベースライン法は,視覚的グラウンドと物体追跡の2つの主要なステップを含むことが明らかとなった。最初のステップでは、選択されたフレームが明確に識別可能なターゲットオブジェクトを欠いている可能性がある。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:13:27 GMT)
Nondestructive discrimination of Bell states between distant parties [3.4]
本稿では, 2つの距離に分散した任意のベル状態を, 破壊することなく識別する手法を提案する。実用量子プロセッサに適用した場合,本手法は古典的限界を超えることができることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:12:37 GMT)
Uncertainty-Aware Decarbonization for Datacenters [3.4]
時間と空間の2種類の不確実性を特定し解析する。本研究では,不確実性を定量化する上での時間的ダイナミクスに対処するための共形予測に基づくフレームワークを提案する。本研究では,時間的および空間的負荷シフトに着目して,生産電力トレースを用いた2つのケーススタディを行う。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:04:16 GMT)
Belief sharing: a blessing or a curse [3.3]
コミュニケーションは、自由エネルギーの最小化エージェント間の信念を共有しているとみなすことができる。本研究では, 後部信念の否定的共有が, エコー室と自己疑念の否定的社会的ダイナミクスを引き起こすことを実証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:46:42 GMT)
AI Age Discrepancy: A Novel Parameter for Frailty Assessment in Kidney Tumor Patients [3.2]
本稿では,術前腹部CT検査の機械学習解析から得られた新しい指標であるAI Age Discrepancyを紹介する。高いAI年齢差は、確立された要因とは無関係に、長期入院と総合生存率の低下と大きく関連している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:40:04 GMT)
Semi-Markov Processes in Open Quantum Systems. III. Large Deviations of First Passage Time Statistics [3.2]
半マルコフ過程法は、開量子系における変数をカウントする最初の通過時間統計量の大きな偏差を計算するために用いられる。これらの結果は、駆動された2レベル量子システムを用いて説明し、古典力学および熱力学の不確実性関係の量子違反を探索するために応用する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:22:11 GMT)
Let it shine: Autofluorescence of Papanicolaou-stain improves AI-based cytological oral cancer detection [3.2]
早期に検出された口腔癌は治療可能であるが、後期に致命的になることが多い。コンピュータ支援法は、費用対効果と正確な細胞学的解析に不可欠である。本研究は,マルチモーダルイメージングとディープフュージョンを用いた,AIによる口腔癌検出の改善を目的とする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:05:35 GMT)
How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs? [3.2]
このような手法のメタ評価を行い、その信頼性を幅広いタスクにわたって評価する。自動評価手法は、特定の条件下で人間の評価を近似することができるが、その妥当性は文脈に依存している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:46:09 GMT)
Beyond Weak Cramér Rao Bound for Distributed Phases Using Multiphoton Polarization GHZ State: Exact Quantum Fisher Matrix Results [3.1]
これまでの研究では、正確な量子フィッシャー情報行列の正確な境界よりもはるかに弱いクラムエルラオ境界に依存していた。我々は正確な量子Cram'er-Rao境界を導出し、それが射影測定によって飽和であることを確認した。これは、より正確で効率的な分散センシングの道を開くために重要である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:44:25 GMT)
Deep Configuration Performance Learning: A Systematic Survey and Taxonomy [3.1]
我々は6つの索引付けサービスにまたがる1,206件の検索済み論文を網羅し,ソフトウェアのパフォーマンス学習におけるディープラーニングのトピックを包括的にレビューする。本研究は, 構成データ作成に関連する技術について, 重要な統計, 分類学, 強度, 弱点, 最適利用シナリオについて概説した。また、調査した研究から、優れた実践と潜在的に問題となる現象を同定し、その分野における将来の機会に関する実行可能な提案と洞察を包括的にまとめる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:28:00 GMT)
Characteristic Learning for Provable One Step Generation [3.0]
本稿では,GAN(Generative Adversarial Networks)におけるサンプリング効率とフローベースモデルの安定した性能を組み合わせた一段階生成モデルを提案する。我々のモデルは、確率密度輸送を通常の微分方程式(ODE)で記述できる特性によって駆動される。 2-ワッサーシュタイン距離における特性発生器の非漸近収束速度を確立するために,速度マッチング,オイラー離散化,特性適合の誤差を解析した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:14:41 GMT)
Dynamic Q&A of Clinical Documents with Large Language Models [3.0]
本研究は,臨床ノートにおける動的質問応答のための大規模言語モデル(LLM)を用いた自然言語インタフェースを提案する。様々な埋め込みモデルと高度なLLMを利用する実験は、高い計算要求にもかかわらず、ウィザード・ヴィクナの優れた精度を示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:14:29 GMT)
The Solution for The PST-KDD-2024 OAG-Challenge [3.0]
我々は KDD-2024 OAG-Challenge 紙のソーストレーストラックに第2位の解を導入する。提案手法は主にBERTとGCNの2つの手法に基づいており,最終提案におけるBERTとGCNの推論結果を組み合わせたものである。最終的に,我々の解法は,競技において顕著なスコア0.47691を達成した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:15:05 GMT)
AHMsys: An Automated HVAC Modeling System for BIM Project [3.0]
AHMsysは、2D Computer-Aided Design (CAD) 図面から3D加熱・換気・空調(英語版)モデルを生成するプロセスを自動化するように設計されている。提案したAHMsysは,本質的なHVACオブジェクト情報を自動で前処理し抽出し,詳細な3Dモデルを作成することにより,Akilaにおけるビルディング情報モデリングプロセスの20%の作業スケジュールを大幅に短縮する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:59:19 GMT)
GRASP: A Grid-Based Benchmark for Evaluating Commonsense Spatial Reasoning [2.9]
空間的推論は、純粋に言語ベースのものではなく、計画の最低限の程度を必要とする、中核的な常識スキルの1つである。既存のCSR(Commonsense Spatial Reasoning)ベンチマークでは、Large Language Models(LLM)がテキストベースの空間記述をどのように解釈するかを評価する傾向にある。我々は、エージェントがエネルギー収集問題に対処する16,000のグリッドベースの環境からなる、$textbfGRASP$という大規模なベンチマークを構築した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:27:46 GMT)
RollupTheCrowd: Leveraging ZkRollups for a Scalable and Privacy-Preserving Reputation-based Crowdsourcing Platform [2.9]
現在のブロックチェーンベースのクラウドソーシングの評判ソリューションは、ブロックチェーンのスケーラビリティを損なうことなく、効率性とプライバシの両方を確保するという課題に対処することができない。本稿では,zkRollupsを活用してユーザのプライバシ保護とシステムのスケーラビリティ向上を実現する,ブロックチェーンを活用した新たなクラウドソーシングフレームワークであるRollupTheCrowdを紹介する。本フレームワークは,クラウドソーシングのインタラクションを評価することにより,労働者の信頼度を評価する,効果的かつプライバシ保護の評判モデルを含む。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:51:32 GMT)
Topological defects of 2+1D systems from line excitations in 3+1D bulk [2.9]
2+1D 位相相では、バルク内の任意の励起と境界 1+1D 共形場理論における位相点欠陥/一次場の間に直接対応が存在する。本研究では, 3+1D位相における線励起が境界2+1D理論における線欠陥となる方法について, トポロジカルホログラフィー/シンメトリートポロジカル場理論の枠組みを用いて検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:59:48 GMT)
missForestPredict -- Missing data imputation for prediction settings [2.8]
missForestPredictは、MissForest命令アルゴリズムの高速でユーザフレンドリな適応である。 missForestPredictでは、命令で使用される変数のエラー監視と制御が拡張されている。 missForestPredictは、短い計算時間内で予測設定で競合する結果を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:45:46 GMT)
Non-asymptotic oracle inequalities for the Lasso in high-dimensional mixture of experts [2.8]
ソフトマックスゲーティング関数を持つガウスモデルとガウス専門家のクラスを考察する。我々の知る限りでは、SGMoEモデルの$l_1$-regularization特性を非漸近的観点から初めて研究する。我々は、SGMoEモデルに対するラッソ推定器のKulback-Leibler損失の非漸近的理論的制御を保証するために、ラッソペナルティの正規化パラメータの低い境界を与える。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:04:08 GMT)
Neurocache: Efficient Vector Retrieval for Long-range Language Modeling [2.7]
Neurocacheは、外部ベクトルキャッシュを使用して、大きな言語モデル(LLM)の効果的なコンテキストサイズを拡張するアプローチである。ニューロキャッシュは,(1)キャッシュサイズを小さくする圧縮状態の保存,(2)推論速度を増大させるトークン毎の単一検索操作,(3)検索ウィンドウを隣接する状態に拡張することにより,従来の方法を改善する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:59:29 GMT)
LLM-Oracle Machines [2.7]
本稿では,大規模言語モデル(LLM)のクラスタをオラクルとして利用することにより,オーラクルチューリングマシン(OTM)の概念の拡張を提案する。各LLMはブラックボックスとして機能し、その専門知識内でクエリに応答できるが、遅延がある。 LLM-OMの基本,拡張,障害回避,および$epsilon$-faultの4つのバリエーションを紹介した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:07:07 GMT)
UAV-assisted Distributed Learning for Environmental Monitoring in Rural Environments [2.6]
本稿では,無人航空機(UAV)を地域におけるIoT環境モニタリングのカバレッジ拡張中継として活用する,革新的なアプローチを提案する。提案手法は,エッジデバイス,UAV,サーバ間のスプリットラーニング(SL)戦略を統合し,推論機構の適応性と性能を向上させる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:21:03 GMT)
Sign Language Recognition Based On Facial Expression and Hand Skeleton [2.6]
我々は手と表情の骨格的特徴を統合した手話認識ネットワークを提案する。表情情報を取り入れることで、手話認識の精度と堅牢性が向上する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:02:51 GMT)
Introducing a Physics-informed Deep Learning Framework for Bridge Scour Prediction [2.5]
本稿では,深層学習を用いたせん断予測のためのスカラー物理インフォームドニューラルネットワーク(SPINN)を提案する。 SPINNは、過去の監視データに基づいて開発され、物理に基づく経験方程式を補助的損失成分としてニューラルネットワークに統合する。いくつかの橋梁の場合、SPINNは予測エラーを最大50%削減した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:55:11 GMT)
Helpful assistant or fruitful facilitator? Investigating how personas affect language model behavior [2.4]
大きな言語モデル(LLM)から世代をパーソナライズし、ステアリングする方法の1つは、ペルソナを割り当てることである。本稿では,ペルソナがモデル行動の多様な側面に与える影響について考察する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:36:54 GMT)
Operator Learning of Lipschitz Operators: An Information-Theoretic Perspective [2.4]
この研究は、リプシッツ連続作用素の一般クラスに対する神経作用素近似の複雑さに対処する。我々の主な貢献は、2つの近似設定におけるリプシッツ作用素の計量エントロピーの低い境界を確立することである。使用したアクティベーション関数にかかわらず、近似精度が$epsilon$に達する神経オペレーターアーキテクチャは、$epsilon-1$で指数関数的に大きいサイズでなければならない。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:13:03 GMT)
Causal inference approach to appraise long-term effects of maintenance policy on functional performance of asphalt pavements [2.4]
アスファルト舗装は、繰り返しの交通負荷や連続的な気候周期によるストレスやひずみによる機能的または構造的損傷による交通安全上の深刻な問題を引き起こす。本研究では,従来の因果構造モデルと潜在的結果モデルフレームワークを組み合わせた新たな因果推論手法を提案する。その結果, 本手法は, 予防的維持治療の効果を正確に評価し, 異なる予防的維持アプローチの機能を十分に発揮するための維持時間を評価できることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:22:42 GMT)
Stimulated emission tomography for efficient characterization of spatial entanglement [2.4]
タイプII SPDC結晶が生成する絡み合った光子対の軌道角運動量(OAM)スペクトルを測定する。我々は,OAMスペクトルの強いアイドラー生成と理論予測との良好な一致を観察する。この実験は、超薄型SPDC源による2光子波動関数の効率的な測定の道を開くことを期待する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:15:47 GMT)
Tensor network influence functionals in the continuous-time limit: connections to quantum embedding, bath discretization, and higher-order time propagation [2.4]
我々は、境界IF-MPS形式におけるアンダーソン不純物モデルのクエンチ力学に対する高次時間プロパゲータを実装した。静的な浴の離散化を伴う状態ベクトル伝播に対して,IF-MPSの動的特性とそれに伴う高能率浴の動的特性の利点を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:34:36 GMT)
Systematic Literature Review on Application of Learning-based Approaches in Continuous Integration [2.3]
機械学習(ML)とディープラーニング(DL)は生データを分析して、特定のフェーズにおける貴重な洞察を抽出する。ソフトウェアプロジェクトにおける継続的プラクティスの台頭は、これらの学習ベースの手法による継続的インテグレーション(CI)の自動化を強調している。この研究は、CIにおける学習ベースの手法の包括的概要を提供し、CIタスク自動化を開発する研究者や実践者に貴重な洞察を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:29:56 GMT)
Lightweight Large Language Model for Medication Enquiry: Med-Pal [2.3]
大規模言語モデル(LLM)は、患者教育によるデジタルヘルス開発を支援する潜在的ソリューションとして浮上している。 Med-Palは、微細で専門的なキュレートされたデータセットで微調整された、薬物ドメイン固有のLLM-チャットボットである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:32:39 GMT)
Example-Based Automatic Migration of Continuous Integration Systems [2.3]
継続的インテグレーション(CI)は、コード変更の統合とテストの高速化に広く採用されているプラクティスです。開発者はしばしば、マトリックスの構築やロギングの改善といった機能を追求して、CIシステム間で移行する。この移行は、新しいCIシステムとその構文に関する知識が限られているため、集中的かつエラーを起こしやすい。本稿では,CIシステムの自動マイグレーションのための新しいアプローチとして,CIMigを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:19:21 GMT)
Error mitigation with stabilized noise in superconducting quantum processors [2.3]
我々は,量子ビット-TLS相互作用のチューニングが雑音不安定を低減し,より信頼性の高い誤り軽減性能を実現することを実験的に実証した。ここで導入された機能は、非自明なスケールのソリッドステートプロセッサ上での量子アプリケーションの探索に不可欠であると期待する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:47:07 GMT)
Latent Diffusion Model for Generating Ensembles of Climate Simulations [2.3]
我々は、広範囲の気候シミュレーションに基づいて、新しい生成的深層学習アプローチを訓練する。潜在空間表現を利用することで、我々のモデルは最小限のメモリを必要とする大規模なアンサンブルをオンザフライで迅速に生成できる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:59:24 GMT)
Scaling SNNs Trained Using Equilibrium Propagation to Convolutional Architectures [2.2]
平衡伝播(Equilibrium Propagation、EP)は、収束性リカレントニューラルネットワーク(RNN)のために開発された生物学的に妥当な局所学習アルゴリズムである。 EPは、BPTTによって訓練されるスパイキングニューラルネットワーク(SNN)をトレーニングする強力な候補である。本稿では,EP を用いた畳み込みスパイク収束 RNN の訓練のための定式化を行い,スパイク収束 RNN と非スパイク収束 RNN とのギャップを埋める。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:24:29 GMT)
Generative AI for Synthetic Data Across Multiple Medical Modalities: A Systematic Review of Recent Developments and Challenges [2.2]
本稿では,様々な医療データ型を合成するための生成モデルについて,体系的に検討する。本研究は、幅広い医療データモダリティを包含し、様々な生成モデルについて検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:51:09 GMT)
Towards Training Music Taggers on Synthetic Data [2.2]
我々は、よく知られたGTZANデータセットの分類に従う合成データセットであるGTZAN-synthを、データボリュームの10倍の大きさでリリースする。ドメイン適応,転送学習,タスクの微調整戦略について検討し,最後の2つの選択肢が精度の向上をもたらすという結論を導いた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:54:23 GMT)
Navigating Connected Car Cybersecurity: Location Anomaly Detection with RAN Data [2.1]
ハイジャックやスパイ活動を含むサイバー攻撃は、コネクテッドカーに重大な脅威をもたらす。本稿では,Radio Access Network (RAN) イベント監視による潜在的な攻撃を識別するための新しいアプローチを提案する。本論文の主な貢献は,複数箇所に同時に出現するデバイスを識別する位置異常検出モジュールである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:42:45 GMT)
Scalable Multi-Output Gaussian Processes with Stochastic Variational Inference [2.1]
遅延可変MOGP (LV-MOGP) は、データポイントが少ない新しい出力への効率的な一般化を可能にする。 LV-MOGPの複雑性は出力数とともに線形に増加する。本稿では,LV-MOGPに対して,入力と出力の両方にミニバッチを適用可能な変分推論手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:53:56 GMT)
The Files are in the Computer: Copyright, Memorization, and Generative-AI Systems [2.1]
生成AIシステムを開発する企業に対する著作権訴訟の中心的な問題は、生成AIモデルがトレーニングしたデータを「記憶」する程度である。このエッセイでは、暗記に関する会話と、米国著作権法で認識されるコピーとの関係を明確にしようとする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:58:13 GMT)
VRBiom: A New Periocular Dataset for Biometric Applications of HMD [2.1]
VRBiomデータセットは、NIRスペクトルで記録された25人の個人から取得された900本の短いビデオで構成されている。実世界の変動を包含するために、データセットは3つの視線条件(安定、移動、部分的に閉じた目)で記録される。データセットは、虹彩や/または眼周囲認識のような生体計測用ユースケースのモデルの評価、トレーニング、適応に使用することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:47:50 GMT)
Greedy-DiM: Greedy Algorithms for Unreasonably Effective Face Morphs [2.1]
拡散モルフ (Diffusion Morphs, DiM) は近年提案されているモルフ攻撃であり, 表現に基づくモルフ攻撃の最先端性能を実現している。同一性に基づく関数によって導かれる最適ステップを探索するDiMモデルの反復サンプリングプロセスに関する欲求戦略を提案する。提案アルゴリズムは,100%のMMPMRで試験されたFRシステムの全てを騙し,比較した他の全てのモルヒネアルゴリズムを上回り,不合理に有効であることがわかった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:48:49 GMT)
SMILe: Leveraging Submodular Mutual Information For Robust Few-Shot Object Detection [2.1]
Few-Shot Object Detection (FSOD) において、オブジェクトクラスの融合と忘れは重要な課題である。本稿では,相互情報機能を導入した新しいサブモジュール型相互情報学習フレームワークを提案する。提案手法は,バックボーンアーキテクチャに依存しないFSODの既存手法に一般化する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:53:43 GMT)
Quantum-embeddable stochastic matrices [2.0]
古典的埋め込み可能性問題の量子バージョンについて検討する。より大きな遷移行列の集合は、メモリレスモデルによって説明できることを示す。また、古典的あるいは量子的メモリレス力学によって説明できないランダム過程のゼロではない測度も特定する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:39:24 GMT)
Lattice-Based Quantum Advantage from Rotated Measurements [2.0]
我々は、$XY$-planeの量子ビット測定範囲全体を利用する新しい手法を示す。パウリ-Z$補正まで$XY$平面上の任意の状態のブラインド遠隔準備のためのワンラウンドプロトコルを構築する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:29:20 GMT)
USP: A Unified Sequence Parallelism Approach for Long Context Generative AI [2.0]
シーケンス並列性(SP)は、生成AIモデルの長期コンテキスト機能をアンロックする鍵となっている。本稿では,最先端SPアプローチ,すなわちDeepSpeed-UlyssesとRing-Attentionについて検討し,統一SPアプローチを提案する。 LLAMA3-8BモデルトレーニングにSPを用いた2つの8xA800ノードに対して,シーケンス長208Kを用いた47%のMFUを達成した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:03:26 GMT)
A mathematical framework of intelligence and consciousness based on Riemannian Geometry [2.0]
知性を理解することは神経科学、認知科学、人工知能の中心的な研究である。幾何解析の最近の進歩は、高次元情報表現と組織に対する新たな洞察を明らかにしている。この写本は、知性と意識の構造とダイナミクスを記述する数学的枠組みを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:17:56 GMT)
Practical Guide for Causal Pathways and Sub-group Disparity Analysis [1.9]
我々は因果不均質分析を用いて、感度特性と結果の間の因果関係を定量化し、検証する。当社の2段階の調査は、レースがセンシティブな属性として機能するデータセットに焦点を当てています。本研究は,ML分類誤差が最も大きい部分群が,最も影響を受けやすい部分群であることが実証された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:51:01 GMT)
Explaining Deep Learning for ECG Analysis: Building Blocks for Auditing and Knowledge Discovery [1.9]
深層ニューラルネットワークは、心電図データを解析するのにますます人気になっている。これらのモデルのブラックボックスの性質による透明性の欠如は、一般的な懸念である。この問題に対処するためには、説明可能なAI(XAI)メソッドを用いることができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:58:23 GMT)
Funny Valen-Tine: Solving visual abstract reasoning problems through defining the solution distribution [1.8]
本稿では,確率的ハイライトモデルに基づく新しいベースラインモデルであるValenを紹介する。 Valen は RPM と Bongard-Logo の問題を解決し、汎用的なソリューションを提供している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:04:20 GMT)
ResearchBot: Bridging the Gap between Academic Research and Practical Programming Communities [1.8]
このプロジェクトでは、学術と産業のギャップを埋めるためのツールであるResearchBotを導入する。 ResearchBotはモジュール的なアプローチを採用し、質問を理解し、クエリをキュレートして関連論文を取得し、論文内容を要約する。 ResearchBotの中核的な目的は、業界の専門家のための学術的知識へのアクセスを民主化することだ。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:17:13 GMT)
Geometric statistics with subspace structure preservation for SPD matrices [1.7]
本稿では,部分空間構造を保存するSPD値データ処理のためのフレームワークを提案する。これは半定円錐のトンプソン幾何学を用いて達成される。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:22:36 GMT)
A Generalized Evolutionary Metaheuristic (GEM) Algorithm for Engineering Optimization [1.7]
近年の大きなトレンドは、自然に着想を得たメタヒュースティックアルゴリズム(NIMA)の利用である。文献には540以上のアルゴリズムがあり、異なるアルゴリズムの探索機構を理解するための統一的なフレームワークはない。 20以上の異なるアルゴリズムを統一する一般化された進化的メタヒューリスティックアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:55:15 GMT)
Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints [1.6]
提案手法は,局所的・グローバルな経路計画タスクにおいて,既存の手法よりも優れていることを示す。提案手法は,提案手法が局所的・グローバルな経路計画タスクにおいて既存手法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:06:49 GMT)
Are there identifiable structural parts in the sentence embedding whole? [1.6]
変圧器モデルからの文の埋め込みは固定長ベクトルで多くの言語情報を符号化する。これらの埋め込みは、分離できる情報の重なり合う層で構成されているという仮説を探求する。本稿では,既知のチャンク構造を持つ文と2つの言語知能データセットからなるデータセットを用いた場合について述べる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:14:48 GMT)
Swish-T : Enhancing Swish Activation with Tanh Bias for Improved Neural Network Performance [1.6]
Swish-T は元の Swish 関数に Tanh バイアスを加えることで定義される。 Tanhバイアスは、初期トレーニング段階での負の値のより広範な受け入れを可能にする。 Swish-Tファミリーの優位性は、様々なモデルやベンチマークデータセットで実証的に実証されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:48:06 GMT)
Chemical Shift Encoding based Double Bonds Quantification in Triglycerides using Deep Image Prior [1.6]
本研究では, 化学シフトエンコードされたマルチエコ勾配エコー画像からトリグリセリド二重結合をネットワークトレーニングなしで定量化する深層学習法について検討した。信号制約に基づいたコスト関数を用いて、ニューラルネットワークを1つのデータセットで反復的に更新する。その結果,Pearson相関係数は0.96。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:43:39 GMT)
Fine-grained Prompt Tuning: A Parameter and Memory Efficient Transfer Learning Method for High-resolution Medical Image Classification [1.6]
きめ細かいPrompt Tuning(FPT)は、訓練済みのモデルを下流のタスクに転送するコスト効率の良い方法である。 FPTは他のPETL法と比較してメモリ消費を大幅に削減する。 FPTは, サイズ, モダリティ, 複雑さの異なる4つの医療データセットで評価した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:28:03 GMT)
A reproducible 3D convolutional neural network with dual attention module (3D-DAM) for Alzheimer's disease classification [1.6]
本稿では,アルツハイマー病分類のための2つの注意モジュールを備えた3次元畳み込みニューラルネットワークを提案する。このモデルをADNIデータベースでトレーニングし、2つの独立したデータセットで本手法の一般化性を検証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:08:55 GMT)
Deep Learning Based Apparent Diffusion Coefficient Map Generation1 from Multi-parametric MR Images for Patients with Diffuse Gliomas [1.5]
拡散強調(DWI)MRIから得られたADCマップは、組織内の水分子に関する機能的測定を提供する。本研究では,多パラメータMR画像からADCマップを合成するディープラーニングフレームワークを開発することを目的とする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:08:40 GMT)
LtU-ILI: An All-in-One Framework for Implicit Inference in Astrophysics and Cosmology [1.5]
本稿では,LtU-ILIパイプライン(Learning the Universe Implicit Likelihood Inference:LtU-ILI)を提案する。これは天体物理学と宇宙論における最先端の機械学習(ML)推論である。天体物理学や宇宙論の諸問題にまたがる実応用を提示する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:38:18 GMT)
Reproducibility in Machine Learning-based Research: Overview, Barriers and Drivers [1.5]
様々な分野の研究は、現在結果の認識に関する課題を経験している。この問題は、機械学習(ML)の研究でも広く用いられている。 MLによる研究のレベルは相変わらず不満足である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:36:32 GMT)
Reinforcement Learning and Machine ethics:a systematic review [1.5]
本稿では,強化学習における機械倫理と機械倫理のための強化学習の体系的レビューを行う。我々は、倫理的行動をもたらすために使用される倫理的仕様、強化学習の構成要素と枠組み、環境の傾向を強調した。本研究の体系的レビューは,機械倫理学と強化学習の融合をめざして,機械倫理の状況のギャップを埋めることを目的としている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:54:00 GMT)
Mining Constraints from Reference Process Models for Detecting Best-Practice Violations in Event Log [1.4]
本稿では,参照モデルコレクションから宣言的ベストプラクティス制約をマイニングするためのフレームワークを提案する。本稿では,実世界のプロセスモデルコレクションとイベントログに基づく評価により,ベストプラクティス違反を検出するフレームワークの能力を実証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:05:37 GMT)
Unsettled Law: Time to Generate New Approaches? [1.4]
我々は、生成人工知能(GenAI)による倫理的・社会的意味の深い重要かつ未解決ないくつかの法的問題を特定する。我々の重要な貢献は、学術や実践者がより有用な調査や議論を行えるように、GenAI特有の問題を正式に特定することである。我々は、GenAIの特徴として、汎用性、大規模なデータセットへの依存、広く普及する社会的利益と害の両方の可能性などを挙げ、既存の法的パラダイムの再評価の必要性を論じる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:51:41 GMT)
Improving Visual Storytelling with Multimodal Large Language Models [1.3]
本稿では,大規模言語モデル(LLM)と大規模視覚言語モデル(LVLM)を活用した新しいアプローチを提案する。様々な視覚的ストーリーからなる新しいデータセットを導入し、詳細なキャプションとマルチモーダル要素を付加する。本手法では,教師付き学習と強化学習を組み合わせてモデルを微調整し,物語生成能力を向上する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:13:55 GMT)
Evidential Uncertainty Sets in Deep Classifiers Using Conformal Prediction [1.2]
画像分類器に対して,共形予測セットを生成するためのEvidential Conformal Prediction (ECP)法を提案する。本手法は,Evidential Deep Learning (EDL) にルーツを持つ非整合スコア関数に基づく。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:38:45 GMT)
Do CAA, CT, and DANE Interlink in Certificate Deployments? A Web PKI Measurement Study [1.2]
証明書の誤用や誤発行は、Web PKIセキュリティモデルを脅かす。 DNS/DNSSEC レコード CAA と TLSA と CT ログを,使用中の証明書の観点から検討した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:20:31 GMT)
Probabilistic 3D Correspondence Prediction from Sparse Unsegmented Images [1.2]
スパース画像データから3次元対応を予測する統一モデルであるSPI-CorrNetを提案する。 LGE MRI左房データセットとAbdomen CT-1K肝データセットを用いた実験により,スパース画像駆動SSMの精度とロバスト性の向上が示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:56:20 GMT)
SiamTST: A Novel Representation Learning Framework for Enhanced Multivariate Time Series Forecasting applied to Telco Networks [1.2]
多変量時系列の表現学習フレームワークSiamTSTを紹介する。 SiamTSTは、注意力、チャンネル非依存のパッチ、正規化技術を備えたSiameseネットワークを統合し、優れた性能を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:26:16 GMT)
Joint Segmentation and Image Reconstruction with Error Prediction in Photoacoustic Imaging using Deep Learning [1.1]
本稿では,ハイブリッドベイズ畳み込みニューラルネットワーク(Hybrid-BCNN)を提案する。その結果,精度の高いPAセグメンテーションと画像が得られ,誤差予測は実際の誤差と統計的に非常に相関していることがわかった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:35:58 GMT)
Learning Paradigms and Modelling Methodologies for Digital Twins in Process Industry [1.1]
デジタルツイン(Digital Twins、DT)は、センサーデータと高度なデータベースまたは物理ベースのモデル、あるいはその組み合わせを組み合わせた物理製造システムの仮想レプリカで、プロセス監視、予測制御、意思決定支援など、さまざまな産業関連タスクに対処する。 DTのバックボーン、すなわち、これらのモデルをサポートする具体的なモデリング方法論とアーキテクチャフレームワークは、複雑で多様性があり、急速に進化し、最新の最先端の手法と競争の激しい市場のトップに留まる傾向を徹底的に理解する必要がある。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:05:10 GMT)
FreeCG: Free the Design Space of Clebsch-Gordan Transform for machine learning force field [1.1]
置換不変入力にCG変換層を実装することで、対称性に影響を与えることなく、この層の設計が完全に自由になることを示す。我々は,群CG変換をスパースパス,抽象エッジシャッフル,アテンションエンハンサーで実現し,強力かつ効率的なCG変換層を形成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:40:29 GMT)
Safety-Driven Deep Reinforcement Learning Framework for Cobots: A Sim2Real Approach [1.0]
本研究では,深部強化学習(DRL)におけるロボットシミュレーションに安全性制約を取り入れた新しい手法を提案する。このフレームワークは、速度制約のような安全要件の特定の部分をDRLモデルに直接統合する。提案手法は,テストシナリオの平均成功率を16.5%向上させる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:56:17 GMT)
Instant Photorealistic Neural Radiance Fields Stylization [1.0]
Instant Neural Radiance Fields Stylizationは3Dシーンのマルチビュー画像スタイリングのための新しいアプローチである。我々のアプローチは、位置埋め込みにハッシュテーブルベースの位置エンコーダを使用するニューラルネットワークプリミティブに基づく神経放射場をモデル化する。最新のGPUハードウェアでは10分以内で、様々な角度で一貫した外観でスタイリングされた新しいビューを生成することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:48:32 GMT)
BoostDream: Efficient Refining for High-Quality Text-to-3D Generation from Multi-View Diffusion [1.0]
BoostDreamは、粗い3D資産を高品質に変換するために設計された、高効率なプラグアンドプレイ3D精製手法である。本研究では, フィードフォワード生成により得られた3次元アセットと異なる表現に適合する3次元モデル蒸留を導入する。新たな多視点SDS損失を設計し、多視点認識2次元拡散モデルを用いて3次元資産を洗練させる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:32:02 GMT)
Increasing the Measured Effective Quantum Volume with Zero Noise Extrapolation [1.0]
ZNEはベンダーが測定した量子体積よりも有効な量子体積を増大させることができることを示す。具体的には、4つのIBM量子超伝導プロセッサユニットの有効量子量を測定する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:57:54 GMT)
Weighted Intersection over Union (wIoU) for Evaluating Image Segmentation [1.0]
意味的セグメンテーションのための重み付け分割(wIoU)と呼ばれる新しい評価尺度を提案する。まず、境界距離マップから生成される重みマップを構築し、境界重み係数に基づいて各画素の重み付け評価を可能にする。我々は,33シーンのデータセット上でwIoUの有効性を検証し,その柔軟性を実証した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:11:39 GMT)
Towards Robust Cardiac Segmentation using Graph Convolutional Networks [1.0]
本稿では,心解剖学に基づく2つの畳み込み環を用いたグラフアーキテクチャを提案する。この予測器は,分布外および不適な入力画像をリアルタイムに検出できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:31:04 GMT)
Hierarchical Decoupling Capacitor Optimization for Power Distribution Network of 2.5D ICs with Co-Analysis of Frequency and Time Domains Based on Deep Reinforcement Learning [1.0]
我々は,チップ上の小型信号ノイズとSSNの両方に対処するために,深部強化学習を用いた新しい2相最適化フローを提案する。我々の知る限り、これは小さな信号ノイズとSN伝搬の両方に同時に対処する最初の二重領域最適化戦略である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:12:55 GMT)
State Transfer in Noisy Modular Quantum Networks [0.9]
モジュラ構造を持つ雑音量子ネットワーク上でのガウス状態の転送を考察する。ネットワークトポロジとネットワーク構成に影響を及ぼす2つのノイズモデルを比較する。我々の結果は、一般にモジュラーネットワークはモノリシックネットワークよりもノイズに対して堅牢であることを示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:39:49 GMT)
Footprints of Data in a Classifier Model: The Privacy Issues and Their Mitigation through Data Obfuscation [0.9]
トレーニングデータのフットプリントを予測モデルに埋め込むことはテストデータとトレーニングデータのパフォーマンス品質の違いは、モデルをトレーニングしたデータの受動的識別を引き起こす。この研究は、データフットプリントから生じる脆弱性に対処することに焦点を当てている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:56:37 GMT)
Optimized Receiver Design for Entanglement-Assisted Communication using BPSK [0.8]
絡み合い支援通信のための2x2光ハイブリッド受信機を提案する。従来提案していた10モード以上の光パラメトリック増幅器ベース受信機と比較して,誤差確率が約10%低いことを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:28:46 GMT)
RISC-V R-Extension: Advancing Efficiency with Rented-Pipeline for Edge DNN Processing [0.8]
本稿では,エッジデバイス上でのディープニューラルネットワーク(DNN)プロセス効率向上のための新しいアプローチであるRISC-V R-extensionを紹介する。この拡張はレンタルパイプラインステージとアーキテクチャパイプラインレジスタ(APR)を備えており、クリティカルな操作の実行を最適化し、レイテンシとメモリアクセス頻度を低減している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:25:05 GMT)
Real HSI-MSI-PAN image dataset for the hyperspectral/multi-spectral/panchromatic image fusion and super-resolution fields [0.8]
ハイパースペクトル画像(HSI)融合実験のほとんどは、異なる融合法を比較するためのシミュレーションデータセットに基づいている。 HSI/MSI/PAN画像データセットを公開し、ハイパースペクトル画像融合の分野の開発を促進する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:01:16 GMT)
High-rate intercity quantum key distribution with a semiconductor single-photon source [0.8]
量子鍵分布(QKD)は、盗聴者による一般的な攻撃に対して安全である情報の伝達を可能にする。 QKDプロトコルにおけるオンデマンド量子光源の使用は、セキュリティの向上と耐久損失の最大化に役立つと期待されている。ここでは、明るい決定論的単一光子源を用いたQKD実験について報告する。円ブラッグ格子構造に埋め込まれた半導体QDから放射される通信Cバンド内の高レート単一光子を用いて偏光符号化に基づくBB84プロトコルを実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:51:29 GMT)
Embedded FPGA Developments in 130nm and 28nm CMOS for Machine Learning in Particle Detector Readout [0.7]
フィールドプログラマブルゲートアレイ(eFPGA)技術は、アプリケーション固有の集積回路(ASIC)の設計における再構成可能なロジックの実装を可能にする FABulous"と呼ばれるオープンソースのフレームワークは、130nmと28nmのCMOS技術ノードを用いたeFPGAの設計に使用された。ソースにおけるセンサデータの削減のために設計された機械学習ベースの分類器を合成し、eFPGA上に構成した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:25:00 GMT)
Wildfire Autonomous Response and Prediction Using Cellular Automata (WARP-CA) [0.7]
WARP-CAモデルはパーリンノイズを用いた地形生成とセルラーオートマタ(CA)のダイナミズムを統合し,山火事の拡散をシミュレートする。我々は,UAVやUGVなどの自律型エージェントを模擬して,山火事を管理するマルチエージェント強化学習の可能性を探る。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:01:59 GMT)
Effective Technical Reviews [0.7]
プログラムの実行は、プログラムの正しさをレビューする究極のテストである一方で、プログラムは開発初期に発生し、効果的に実行された場合の問題を見つけることができる。プログラマは、プログラムを効果的にレビューし、インタフェースの問題から様々な問題を見つけることができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:19:52 GMT)
Analytics of Longitudinal System Monitoring Data for Performance Prediction [0.7]
スケジューラキューで待機しているジョブのパフォーマンスを予測できるデータ駆動モデルを作成します。我々はこれらの予測モデルを詳細に分析し、主要な性能予測因子である特徴を特定する。このようなモデルがアプリケーションに依存しないことを実証し、トレーニングに含まれていないアプリケーションのパフォーマンスを予測するために使用できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:02:59 GMT)
The Epistemic Uncertainty Hole: an issue of Bayesian Neural Networks [0.7]
モデルのサイズとトレーニングセットのサイズに関する「最新の不確実性指標」の進化は、理論的な期待に反することを示します。と呼ぶこの現象は、BDLの適用可能性全体を損なうというよりは、より問題となる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:54:46 GMT)
Global calibration of large-scale photonic integrated circuits [0.7]
大規模フォトニック集積回路を大域的に校正するための機械学習手法を提案する。本手法は、PIC上の全熱光学位相シフト器の非線形位相電流関係を同時に学習するために、カスタムネットワークを利用する。結果は、フォトニック量子情報処理における大規模PICの応用に大きな恩恵をもたらすだろう。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:14:02 GMT)
Hybrid Rotational Cavity Optomechanics Using Atomic Superfluid in a Ring [0.6]
ローゲール・ガウスモードによって駆動される光学キャビティ内に、環状に閉じ込められたボース・アインシュタイン凝縮体(BEC)を含むハイブリッド光学系を導入する。捕捉されたBECの回転は、ミラーの共鳴周波数における量子ゆらぎを減少させる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:06:06 GMT)
Efficient Stochastic Differential Equation for DEM Super Resolution with Void Filling [0.6]
DEM(Digital Elevation Model)はリモートセンシングやフォトグラム計測において基本的な役割を担う。既存のアプローチは、DEMヴォイドを埋めるか、あるいは無傷のDEMに超解像を適用することだけを目的としている。本稿では,ヴォイド問題と低分解能問題とを同時に扱う統合生成モデルを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:13:34 GMT)
Subsystem CSS codes, a tighter stabilizer-to-CSS mapping, and Goursat's Lemma [0.5]
本研究では,2つの基本となる古典符号のデータのみを用いて,Steane型デコーダを開発する。サブシステム安定化器のコードは、物理的、論理的、ゲージ的キューディットの2倍、コード距離の2倍のサブシステムCSSコードを生成するために「倍」できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:39:48 GMT)
Research on Reliable and Safe Occupancy Grid Prediction in Underground Parking Lots [0.5]
この研究は、特に地下駐車場のような見過ごされがちな場所で、屋内自動運転に取り組む。 CARLAのシミュレーションプラットフォームを使用して、データ収集のための現実的な駐車モデルを作成する。占有グリッドネットワークは、このデータを処理して車両の経路や障害物を予測し、複雑な屋内環境におけるシステムの知覚を高める。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:56:14 GMT)
Large Skew-t Copula Models and Asymmetric Dependence in Intraday Equity Returns [0.5]
スクリュー・トゥ・コプラモデル(英語版)は、非対称かつ極端なテール依存を可能にするため、財務データのモデリングに魅力的なものである。 Azzalini と Capitanio (2003) の skew-t 分布に暗黙的に表されるコプラは、2つの一般的な代替スキュー-t コプラよりも高レベルな対非対称依存を可能にすることを示す。本稿では,高速かつ高精度なベイズ変分推論(VI)手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:27:27 GMT)
Programming higher-order interactions of Rydberg atoms [0.4]
Rydberg-atom graph gadgets is introduced to effective program $K$-th order interaction within a Rydberg atom system。よいスケーリングの振る舞いである$O(NK)$は、$N$-頂点ハイパーグラフ最適化問題に必要な原子の数の観点から期待されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:49:22 GMT)
Spectral Graph Reasoning Network for Hyperspectral Image Classification [0.4]
畳み込みニューラルネットワーク(CNN)は、ハイパースペクトル画像(HSI)分類において顕著な性能を達成した。本稿では、2つの重要なモジュールからなるスペクトルグラフ推論ネットワーク(SGR)学習フレームワークを提案する。 2つのHSIデータセットの実験により、提案したアーキテクチャが分類精度を大幅に改善できることが示されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:29:23 GMT)
A Max-Flow approach to Random Tensor Networks [0.4]
確率論のツールを用いたランダムテンソルネットワーク(RTN)の絡み合いエントロピーについて検討する。ランダムテンソルネットワーク(英: random tensor network)は、グラフ(またはネットワーク)構造によって決定される特定の幾何を持つテンソルに対する特定の確率モデルであると考えることができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:00:01 GMT)
Automatic Counting and Classification of Mosquito Eggs in Field Traps [0.4]
蚊が卵を挿入するフィールドトラップの解析は、不妊虫技術(SIT)が適切に機能していることを確認するのに不可欠である。これは、ハッチした卵の数は、不妊オスが野生の卵と競合していないことを示唆している可能性があるためである。トラップの研究は顕微鏡で手作業で行われ、非常に時間がかかり、ヒューマンエラーを起こしやすい。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:12:20 GMT)
Semi-device-independently characterizing quantum temporal correlations [0.4]
一般時相シナリオにおける量子時間相関を特徴付けるための枠組みを開発する。我々のフレームワークは、時間的シナリオにおける量子認証の自然なツールとして機能します。我々は,時間的ベルの不等式の最大値違反を含む,いくつかの応用を提示する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:39:09 GMT)
QOG:Question and Options Generation based on Language Model [0.4]
質問-オプション生成(QOG)は、与えられたコンテキストの一連の質問-オプションペアを生成するタスクである。微調整シーケンス・ツー・シーケンス言語モデル(LM)に基づく3つの異なる手法を用いてQOGモデルを開発する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:21:03 GMT)
Robust Hilbert space fragmentation in group-valued loop models [0.3]
我々は、量子力学における堅牢なエルゴディディディティの破れを示す大規模なモデルを紹介する。我々の研究は「位相的に頑健な空間の断片化」に関する最近の議論に触発されている。我々はゲージ理論へのクリップ接続を作り、この構成は北エフの量子二重群を無限群に一般化する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:04:09 GMT)
Exploiting Spatial Diversity in Earth-to-Satellite Quantum-Classical Communications [0.3]
空間的多様性を利用することで,絡み合い分布の有効性が向上することを示す。我々は,大(典型的には符号化)と小(量子変調)のコヒーレント状態の移譲が,フェージングチャネルの多様性の活用の恩恵を受けることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:47:01 GMT)
A Comprehensive Study on A Tapered Paul Trap: From Design to Potential Applications [0.3]
本稿では, 先端電極の対称軸に高周波電極が傾斜しているテーパポールトラップについて述べる。この構成により、このトラップに閉じ込められた荷電粒子は、その半径方向の自由度と軸方向の自由度が結合される。同じ設計で単一原子熱エンジンを実験的に実現し、ゼプトニュートン力の増幅が実現された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:03:48 GMT)
Ensemble of pre-trained language models and data augmentation for hate speech detection from Arabic tweets [0.3]
本研究では,従来手作業でラベル付けされていたアンサンブル学習と半教師付き学習を活用する新しい手法を提案する。我々は、アラビア語のツイートを、非憎悪、一般憎悪、人種、宗教、セクシズムの5つのクラスに分類して、ベンチマークデータセットで実験を行った。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:26:26 GMT)
Quantifying total correlations in quantum systems through the Pearson correlation coefficient [0.2]
量子状態は古典的あるいは量子的な方法で相関しうること、すなわち2つのケースは互いに排他的であることを示す。また、少なくとも2量子ビット系の場合、局所的に非互換な観測可能なペア間の相関の分布は、システムが古典的あるいは量子的相関を含むかどうかについての洞察を与える。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:33:22 GMT)
Enabling Large Batch Size Training for DNN Models Beyond the Memory Limit While Maintaining Performance [0.2]
最近のディープラーニングモデルは、大規模なバッチサイズを使用してトレーニングするのは難しい。マシンはモデルと大きなデータバッチサイズの両方に対応するのに十分なメモリを持っていないかもしれない。本稿では,マイクロバッチ処理(MBP)と呼ばれる手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:33:39 GMT)
Entanglement engineering of optomechanical systems by reinforcement learning [0.2]
エンタングルメント工学におけるモデルフリーな深層強化学習手法を開発した。我々は、線形または非線形光子-フォノン相互作用を持つ量子光学系を用いて、プロトコルの動作を実証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:47:06 GMT)
Virtually Objective Quantification of in vitro Wound Healing Scratch Assays with the Segment Anything Model [0.2]
細胞生物学において、インビトロ・スクラッチ・アッセイ(in vitro scratch assay)は、傷の閉鎖率を評価するために広く用いられている。本稿では,対話型ポイントプロンプトに基づくディープ・ファンデーション・モデルであるセグメント・アプライス・モデルを利用する。結果は、ドメインエキスパートの手作業によるセグメンテーションと比較しても、サーバ内およびサーバ間の変動が非常に少なかった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:45:56 GMT)
Structure-inspired Ansatz and Warm Start of Variational Quantum Algorithms for Quadratic Unconstrained Binary Optimization Problems [0.2]
本稿では、変分量子固有解器を用いて2次非制約二元最適化問題に対処する構造に着想を得たアンザッツを提案する。本稿では,想像的時間進化に基づく新しいウォームスタート手法を提案する。このウォームスタート法は成功率を著しく向上させ,変分量子固有解法の収束に必要なイテレーション数を削減できることを実証する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:00:05 GMT)
Remote sensing framework for geological mapping via stacked autoencoders and clustering [0.2]
本研究では、リモートセンシングデータを処理するための教師なし機械学習ベースのフレームワークを提案する。オーストラリアのムタウィンチ地域の地質マッピングの枠組みを評価するために,ランドサット8,ASTER,Sentinel-2のデータセットを用いた。本フレームワークは,岩盤単位を効率的に識別し,正確かつ解釈可能な地質図を生成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:52:15 GMT)
To Do or Not to Do: Semantics and Patterns for Do Activities in UML PSSM State Machines [0.1]
DoActivity振舞いは、ある状態に入力された状態マシンとは独立して実行される振舞いを記述する。仕様や教科書は、doActivityの振る舞い構造をどのように適切に使用するべきかについて曖昧である。そこで本研究では,仕様書のテキスト,意味モデル,実行可能なテストケース,PSSMをサポートするシミュレータの相互チェックから,セマンティックスを解析した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:21:04 GMT)
Quantum harmonic oscillator in a time dependent noncommutative background [0.1]
本研究は,非可換高調波発振器の動作を時間依存性の背景から検討する。本稿では,標準ボップシフト関係の一般化形式を利用して,可換変数の項で表現するシステムについて検討する。我々の研究は[1]の発見と一致しており、特に座標写像関係が標準のボップシフト関係に還元される特定の極限においてである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:25:15 GMT)
Fake News Detection: It's All in the Data! [0.1]
調査では、データセットの重要な特徴、採用されているさまざまなラベルシステム、モデルのパフォーマンスに影響を及ぼす偏見を慎重に概説している。 GitHubリポジトリは、公開可能なデータセットを単一のユーザフレンドリなポータルに統合する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:12:06 GMT)
Open foundation models for Azerbaijani language [0.0]
多言語大言語モデルはアゼルバイジャンにおける言語理解と生成システムの開発を可能にした。プロダクショングレードのシステムのほとんどは、GPT-4のようなクラウドソリューションに依存している。本稿では,アゼルバイジャンのオープンソース基盤モデルを推進しているいくつかの取り組みについて述べる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:05:47 GMT)
ViG-Bias: Visually Grounded Bias Discovery and Mitigation [0.0]
視覚的基底バイアス発見・緩和(ViG-Bias)を導入し,発見・緩和性能の向上を図る。視覚的説明を取り入れることで、DOMINO、FACTS、Bias-to-Textといった既存の手法が強化されることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:10:10 GMT)
Using eye tracking to investigate what native Chinese speakers notice about linguistic landscape images [0.0]
本稿では、視線追跡技術を用いて、言語景観の実際の固定について研究する。定着時間と定着時間の2次元において,在来中国語話者の言語景観への定着は,一般的な景観のそれよりも大きい。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:32:47 GMT)
User-friendly confidence regions for quantum state tomography [0.0]
有限統計学では、実験データは量子状態に関する完全な情報を与えることができない。この限られた知識を表現する一般的な方法は、状態空間に信頼領域を提供することである。ここでは、これらの問題を解決する信頼領域を構築し、不平等に最適なサンプルコストと現実的なパラメータに対する優れた性能を有する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:38:10 GMT)
Two-mode squeezing and SU(1,1) interferometry with trapped ions [0.0]
単一イオンの2つの運動モードに対して, 1モードと2モードの回路を実験的に実装した。これは、トラップ電極に印加される振動電位を用いて、所要の変位、スクイーズ、2モードスクイーズ、ビームスプリッタ演算を実装することで達成される。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:51:02 GMT)
Two-Step Q-Learning [0.0]
そこで本研究では,重要でない2段階のQ-ラーニングアルゴリズムを提案する。数値実験により、2段階のQ-ラーニングとそのスムーズな変形の優れた性能が示された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:39:00 GMT)
Towards Unsupervised Question Answering System with Multi-level Summarization for Legal Text [0.0]
本稿では,SCaLARチームによるSemEval-2024 Task 5: Legal Argument Reasoning in Civil procedureについて要約する。ラベルを生成するための,単純ながら斬新な類似性と距離に基づく教師なしアプローチを提案する。調査では, マクロF1スコアが20ポイント上昇し, テストセットが10ポイント上昇した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:35:53 GMT)
Topological Discrimination of Steep to Supersteep Gap to Emergence of Tunneling in Adiabatic Quantum Processes [0.0]
量子アニール過程の速度を制限するギャップは、3つの正則なモルフォロジーを必要とすることが示されている。境界線に比例した下肢尾の位置は、超音速と急激な差別を許容する。ツバメ尾境界相互作用の欠如は、軽度のギャップを特徴づける。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:15:32 GMT)
Theory of Complex Particle without Extra Dimensions [0.0]
ミンコフスキー時空における複素粒子の臨界次元は、$D = 4$であり、$D = 2, 4$ または 6$ はユークリッド時空において許される。次元に対する制限の起源は、正準理論の量子化における第三次制約の存在である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:25:13 GMT)
Task-Synchronized Recurrent Neural Networks [0.0]
リカレントニューラルネットワーク(RNN)は、伝統的に事実を無視し、時間差を追加入力として与えたり、データを再サンプリングしたりする。我々は、データやタスクの時間と一致するように、RNNを効果的に再サンプリングするエレガントな代替手法を提案する。我々は、我々のモデルがデータの時間的非均一性を効果的に補償できることを実証的に確認し、データ再サンプリングや古典的RNN手法、代替的なRNNモデルと比較することを実証した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:15:19 GMT)
Talking to Machines: do you read me? [0.0]
本稿では,この技術の現状を概観し,会話エージェントのオープンな研究課題を概観する。課題指向対話(TOD:Task-Oriented Dialogues)への私の貢献は、CIFREにおける研究アソシエイトおよび産業監督の両立である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:19:46 GMT)
Tackling CS education in K-12: Implementing a Google CS4HS Grant Program in a Rural Underserved Area [0.0]
本稿では、農村部におけるGoogle CS4HS助成金の実施について論じる。実装の主要な要素は、対面のハンズオンワークショップ、続いて7週間の大学院レベルのオンラインサマーコースである。教員は、カリキュラムを実践する一年間、オンラインの実践コミュニティで支援された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:36:06 GMT)
Suppression of noise in separation estimation of optical sources with spatial-mode demultiplexing [0.0]
空間モード分解による超解像は急速に劣化する。これは、直接撮像で知られているレイリーの呪い(レイリーの呪い)という用語で見ることができる。本稿では,騒音の破壊的影響を抑制する手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:08:26 GMT)
Structured Partial Stochasticity in Bayesian Neural Networks [0.0]
本稿では,ニューロン置換対称性を除去する重みの決定論的サブセットを選択するための構造的手法を提案する。大幅に単純化された後続分布により,既存の近似推論方式の性能は大幅に向上した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:55:33 GMT)
Statistical Advantages of Oblique Randomized Decision Trees and Forests [0.0]
リッジ関数のフレキシブル次元縮小モデルクラスに対して一般化誤差と収束率を求める。軸方向のモンドリアン木のリスクに対する低い境界は、これらの線形次元減少モデルに対してこれらの推定値が最適であることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:35:22 GMT)
Stabilizing quantum simulations of lattice gauge theories by dissipation [0.0]
雑音量子ハードウェアに関する格子ゲージ理論は、コヒーレントかつ不整合誤差によるゲージ対称性の違反に悩まされる。本研究では,局所的なゲージ違反の検出に依存したアクティブな補正手法について検討し,その後,物理ゲージセクターに散逸的にシステムを戻して修正する。補正方式はゲージ対称性の保護を確実にするだけでなく、ゲージ不変セクター内においてもシミュレーション結果の有効性も向上することを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:22:58 GMT)
Soft Language Prompts for Language Transfer [0.0]
自然言語処理(NLP)における言語間知識伝達の課題本研究では,パラメータ効率のよい微調整法を組み合わせることで,言語間NLPアプリケーションを改善するための知見を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:50:03 GMT)
Shapiro steps in driven atomic Josephson junctions [0.0]
2次元の原子雲とトンネル障壁を結合させることにより実現した原子ジョセフソン接合について検討した。障壁を一定の速度で移動させることで、dcとacのジョセフソン状態は、接合を横断するゼロと非ゼロの原子密度差によって特徴づけられる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:26:03 GMT)
Session: End-To-End Encrypted Conversations With Minimal Metadata Leakage [0.0]
Sessionはオープンソースの公開鍵ベースのセキュアメッセージングアプリケーションである。分散ストレージサーバのセットとオニオンルーティングプロトコルを使用して、エンドツーエンドのメッセージを送信する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:50:44 GMT)
SeqMate: A Novel Large Language Model Pipeline for Automating RNA Sequencing [0.0]
SeqMateは、大規模言語モデル(LLM)のパワーを活用してワンクリック分析を可能にするツールで、データ準備と分析の両方を自動化する。生成AIの力を利用することで、SeqMateはこれらの発見を分析し、制御/制御/ユーザプロンプトされた遺伝子について書かれたレポートを作成することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:28:30 GMT)
Sentient observers and the ontology of spacetime [0.0]
ガリレオと特殊相対性理論とゲージ対称性に繋がったのと同じ基準で、宇宙や時空の構造を与える観測可能な一意の集合を特定する方法がないことを示す。これは、時空と観測者の感性の間に強いつながりがあることを示しており、いくつかの初期の相対性理論や一般相対性理論への貢献者が予想していた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:48:28 GMT)
SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks [0.0]
本研究では,一意に効率的な残差ネットワークであるEfficient-ResNetを用いたエンコーダデコーダアーキテクチャを提案する。アテンションブーティングゲート(AbG)とアテンションブーイングモジュール(AbM)は、グローバルコンテキストの出力の等価サイズで同変および特徴に基づく意味情報を融合することを目的として展開される。我々のネットワークは、挑戦的なCamVidとCityscapesのデータセットでテストされており、提案手法により、残余ネットワークに対する大幅な改善が示されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:48:30 GMT)
SAVE: Segment Audio-Visual Easy way using Segment Anything Model [0.0]
そこで本研究では,AVSタスクに対して,事前学習セグメントモデル(SAM)を効率的に適用するための軽量なアプローチSAVEを提案する。提案手法は,符号化段階における効果的な音声と視覚の融合と相互作用を実現する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:22:28 GMT)
Revolutionising Role-Playing Games with ChatGPT [0.0]
本研究の目的は,AIによるシミュレーションが学生の学習経験に与える影響を分析することである。ヴィゴツキーの社会文化的理論に基づいて、ChatGPTは学生に戦略的意思決定プロセスのより深い理解を与えるために用いられた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:21:40 GMT)
Reinforcement Learning from Human Feedback: Whose Culture, Whose Values, Whose Perspectives? [0.0]
大規模言語モデル(LLM)の文脈におけるRL(Reinforcement from Human Feedback)における多元主義の倫理的優位性について論じる。社会と多元主義の哲学に基づいて、RHLFをより人間のニーズに反応させる方法と、その過程での課題にどう対処できるかを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:07:27 GMT)
Rectified Iterative Disparity for Stereo Matching [0.0]
コストボリュームに基づく不確実性不確実性推定(UEC)を提案する。画像対から得られるコストボリュームの豊富な類似性情報に基づいて,提案したUCCは,計算コストの低い競合性能を実現することができる。提案手法を組み合わせた高性能ステレオアーキテクチャDR Stereoを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 04:42:56 GMT)
Realization of a magic-wavelength nanofiber-based two-color dipole trap with sub-$λ/2$ spacing [0.0]
セシウムD2ラインの共振波長の半分以下の間隔で周期的に1次元のトラップ部位の配列を生成する。配列中の原子のトラップを実演し、その結果のトラップ構成を特徴付ける。マジックトラップ波長とラムダ/2$スペーシングを併用したナノファイバーベースの光インタフェースの実装は、新しい放射効果の探索に向けた重要なステップである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:06:51 GMT)
Rapidly-rotating quantum droplets confined in a harmonic potential [0.0]
2次元の「対称」量子滴は調和ポテンシャルで回転する。渦格子を用いた状態記述には、純粋に数値的なアプローチとウィグナー・セイッツ近似を用いる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:40:49 GMT)
RETINA: a hardware-in-the-loop optical facility with reduced optical aberrations [0.0]
視覚に基づくナビゲーションアルゴリズムは、低コストで汎用的なセンサーで軌道上の宇宙船の状態を決定する効果的な解決策として自らを確立している。実験室で軌道環境をエミュレートするために、専用のシミュレーションフレームワークを開発する必要がある。本稿では,RETINAと呼ばれる低収差光学設備の設計について述べる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:26:37 GMT)
Quantum states as countable convex combination of pure states with bounded energy [0.0]
無限次元状態において、E で有界なエネルギーを持つ状態が与えられたとき、E で有界なエネルギーを持つ純状態の可算凸結合として状態を記述することができる。我々は、ギブの仮説を満たすハミルトニアンに対してはそのような状態は存在しないと結論づける。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:53:53 GMT)
Quantum collective motion of macroscopic mechanical oscillators [0.0]
超伝導回路のオプティメカルプラットフォームにおいて,共振器と共振器を結合した6つの機械振動子の集合挙動について述べる。実験により,オプトメカニカルカップリング率の増加は,個々の機械振動子から集合モードへの遷移を誘導することを示した。このようなモードとキャビティとの結合速度は、Tavis-Cummingsシステムと同様、結合振動子数とともに増加する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:32:19 GMT)
Quantum Curriculum Learning [0.0]
本稿では,量子データのための量子カリキュラム学習(Q-CurL)というフレームワークを提案する。 Q-CurLは、より難しいタスクに進む前に、学習モデルに単純なタスクやデータを導入します。実証的な証拠は、Q-CurLが一元学習タスクの訓練収束と一般化を促進することを示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:44:14 GMT)
Quadrature Coherence Scale of Linear Combinations of Gaussian Functions in Phase Space [0.0]
ガウス関数の線形結合として表現可能なウィグナー関数を特徴とする量子状態の二次コヒーレンススケールの計算法を提案する。二次コヒーレンススケールは,損失の存在下での非古典性のスケーラビリティを検証するための貴重なツールであることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:48:15 GMT)
Pushing the Boundary: Specialising Deep Configuration Performance Learning [0.0]
この論文は、構成性能モデリングにおけるディープラーニング技術に関する体系的な文献レビューから始まる。第一の知識のギャップは、どの符号化方式が優れているかについての理解の欠如である。第二の知識ギャップは、構成のランドスケープから受け継がれた空間である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:59:19 GMT)
Prompt Stability Scoring for Text Annotation with Large Language Models [0.0]
研究者たちは、テキストアノテーションに言語モデル(LM)をますます利用している。これらのアプローチは、一連の命令に従って与えられた出力を返すようモデルに指示するプロンプトにのみ依存する。これは分類ルーチンの複製可能性に疑問を投げかける。この問題に対処するため、研究者は通常、我々が「急速安定」と呼ぶものを決定するために、意味論的に類似した様々なプロンプトをテストしてきた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:11:18 GMT)
Proceedings of the 2nd International Workshop on Adaptive Cyber Defense [0.0]
第2回アダプティブ・サイバー・ディフェンスに関する国際ワークショップがフロリダ州のフロリダ工科大学で開催された。このワークショップは、人工知能(AI)と機械学習(ML)のユニークな応用を探求する研究を共有するために組織された。サイバードメインは現在、人間の専門家に大きく依存することなく、確実かつ効果的に防御することはできない。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:45:39 GMT)
Princeton seminars on physics and philosophy [0.0]
これらは、私が2024年11月にプリンストン哲学部で招待される一連のセミナーのために準備された講義ノートです。それらは、量子重力の概念構造、量子力学の解釈、時間の構造、その方向と未来の開放性、そして観念論と反境界主義に関する概念が進化するという事実に関する一般的な考察をカバーしている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:03:33 GMT)
Predictive Simultaneous Interpretation: Harnessing Large Language Models for Democratizing Real-Time Multilingual Communication [0.0]
本稿では,話者発話を予測し,木のような構造で複数の可能性を拡張することによって,リアルタイム翻訳を生成する新しいアルゴリズムを提案する。我々の理論的分析は、実証的な例によって支持されており、このアプローチが最小のレイテンシでより自然で流動的な翻訳につながることを示唆している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:18:28 GMT)
Predicting correlations in superradiant emission from a cascaded quantum system [0.0]
新しい種類のカスケード量子系がナノファイバー結合型冷原子アンサンブルを用いて実現されている。スピンの切り抜きウィグナー近似に基づく新しいシミュレーション手法を開発した。シミュレーションツールでは、2階の量子コヒーレンス関数$g(2)$と2レベルエミッターの強い励起カスケード系によって放出される他の光場の相関関数を予測することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:51:40 GMT)
Phase driven unconventional superradiance phase transition in non-Hermitian cascaded quantum Rabi cavities [0.0]
本研究では、非エルミート量子ラビ空洞における超放射相転移をもたらす位相駆動対称性の破れについて検討する。観測器で検証した超放射位相境界を解析的に導出する。位相駆動型第1次および第2次超放射光相転移を同定し,第2次遷移の量子臨界度に着目した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:32:54 GMT)
Parametric Light-Matter Interaction in the Single-Photon Strong Coupling Limit [0.0]
超伝導トランスモン量子ビットを用いたパラメトリック結合マイクロ波回路の新しいパラダイムを実証する。強いサイドバンド駆動を適用すると、オンデマンドで非線形のJaynes-Cummingsが線形共振器と相互作用する。このデモンストレーションは、新しい光子圧量子情報処理ハードウェアを開発するための道を開く。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:45:34 GMT)
PT symmetric fermionic particle oscillations in even dimensional representations [0.0]
相対論的および非相対論的系の量子力学的粒子振動の新しいクラスについて述べる。ハミルトン群は、PT内積に関して自己共役であるように、最初から選択される。結果として生じる量子力学的進化はユニタリであり、確率は振動によって保存される。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 08:09:35 GMT)
PO-MSCKF: An Efficient Visual-Inertial Odometry by Reconstructing the Multi-State Constrained Kalman Filter with the Pose-only Theory [0.0]
視覚慣性オドメトリー(VIO)は、ペイロード制約ロボットにとって不可欠である。そこで本研究では,MSCKF VIOを多視点構造記述(Pose-Only (PO) multi-view geometry description)を用いて再構成する。新しいフィルタは特徴位置情報を一切必要とせず、計算コストと線形化誤差を除去する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:18:35 GMT)
Output Range Analysis for Deep Neural Networks based on Simulated Annealing Processes [0.0]
本稿では,Deep Neural Networks (DNN) のレンジ推定手法を提案する。提案手法はDNNにおける局所的幾何学的情報の欠如と非線形性に対処し,多目的性を実現する。制約的な仮定を避けるための単純でフレンドリーなアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 22:47:40 GMT)
Origin of the Arrow of Time in Quantum Mechanics [0.0]
時間の矢印は自然に量子力学的進化によって引き起こされる。極限$cal N rightarrow infty$ では、矢印は「歯」によって固定される。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:23:24 GMT)
Open quantum dynamics with variational non-Gaussian states and the truncated Wigner approximation [0.0]
本稿では、変分非ガウス状態と量子軌道のアプローチを組み合わせ、スピンボソン系の開力学をシミュレートする枠組みを提案する。オープン量子系に対する最近開発された truncated Wigner 近似が、同じハミルトニアンに対してどのように適用できるかを論じる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:10:03 GMT)
On the Counting of Involutory MDS Matrices [0.0]
本稿では、アダマール MDS およびインボリュートリーアダマール MDS 行列を、フィールド$mathbbF_2r$ で 4$ で列挙する。上界は、次数 4$ over $mathbbF_2r$ のすべての不揮発性MDS行列の数に対して導かれる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:26:39 GMT)
On the Anatomy of Attention [0.0]
本稿では、機械学習モデルについて体系的に関連付け、推論するために、カテゴリ理論図式形式を導入する。我々の図は直感的にアーキテクチャを提示するが、重要な詳細を欠くことなく、モデル間の自然な関係はグラフィカルな変換によって捉えられる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:50:26 GMT)
Nonclassical resource for continuous variable telecloning with non-Gaussian advantage [0.0]
テレクロニングプロトコルは、単一の送信者から共有絡み状態を介して複数の受信者に量子状態を分配する。ガウス的資源と非ガウス的資源の両方を用いて得られた最適なテレクロニング特性について検討した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:59:50 GMT)
Min-Max-Jump distance and its applications [0.0]
我々は,Min-Max-Jump 距離(MMJ 距離)の3つの応用を探索する。 MMJベースのK平均は、K平均をMMJ距離で修正する。 MMJに基づくシルエット係数は、Silhouette係数をMMJ距離で補正する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 03:24:09 GMT)
Long-range interacting systems are locally non-interacting [0.0]
長距離相互作用システムは情報伝達のための非線形光円錐のような新しい物理学を示す。我々は、量子状態の減少によって得られた熱力学的極限局所的性質が、創発的非相互作用理論によって記述されていることを証明した。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:34:58 GMT)
Local Description of Decoherence of Quantum Superpositions by Black Holes and Other Bodies [0.0]
我々は、アリスの研究室内の量子場の局所的な2点関数の観点から、デコヒーレンスを記述することができることを示す。局所的な視点から、ウンルー真空中のシュワルツシルト時空におけるデコヒーレンスを明示的に計算する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:00:03 GMT)
LlamAr & GemmAr: Enhancing LLMs Through Arabic Instruction-Tuning [0.0]
InstAr-500kは、コンテンツの生成と収集によって生成された新しいアラビア文字の命令データセットである。次に、複数の下流タスクにおいて、Llama-3-8B-InstructとGemma-7B-ITの2つのオープンソースモデルを微調整することで、このデータセットを評価する。複数の評価結果に基づき, アラビアNLPベンチマークにおいて, 微調整モデルにより最先端の性能が得られた。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:43:49 GMT)
Leveraging Latent Evolutionary Optimization for Targeted Molecule Generation [0.0]
分子生成(LEOMol)における遅延進化最適化という革新的なアプローチを提案する。 LEOMolは最適化分子の効率的な生成のための生成モデリングフレームワークである。提案手法は,従来の最先端モデルよりも優れた性能を示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:42:21 GMT)
Integrating quantum and classical computing for multi-energy system optimization using Benders decomposition [0.0]
量子コンピュータと古典コンピュータの最適化を組み合わせたハイブリッドBenders分解手法を提案する。本研究では,コスト最適多エネルギーシステムの設計を事例スタディで実施する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:12:15 GMT)
Information Design for Differential Privacy [0.0]
企業や統計機関は、データを収集、分析、公開する個人のプライバシーを守らなければならない。エンドユーザーに対する出力値の最大化を目的として,そのようなメカニズムを選択することの問題点を考察する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:24:24 GMT)
Indian Stock Market Prediction using Augmented Financial Intelligence ML [0.0]
本稿では,Superforecasters予測を付加した機械学習アルゴリズムを用いた価格予測モデルを提案する。これらのモデルは平均絶対誤差を用いて予測精度を決定する。主な目標は、予測不可能な変化や株価の変化を予想するスーパープレキャストの特定と予測の追跡である。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:58:50 GMT)
Improving Explainability of Softmax Classifiers Using a Prototype-Based Joint Embedding Method [0.0]
本稿では,ソフトマックス分類器の説明可能性向上のための試作手法を提案する。モデルアーキテクチャの変更とトレーニングにより、予測に寄与する原型例のサンプル化が可能となる。我々は、ソフトマックスの信頼性よりも分布データから検出できる不確実性の指標を得る。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:59:09 GMT)
Imposing Constraints on Driver Hamiltonians and Mixing Operators: From Theory to Practical Implementation [0.0]
制約部分集合を満たすハミルトン項を見つけるための一般表現を与え、これらを用いて関連する問題の複雑さを特徴づける。次に、これらのプリミティブをハミルトンドライバとユニタリミキサーに変換して、制約付き量子アニール演算子Ansatz (CQA) と量子交換演算子Ansatz (QAOA) に使用できるアルゴリズム的な手順を与える。実験により,12～22のインスタンスに対してこれらのアプローチを実証的にベンチマークし,最適相対性能を示すとともに,指数曲線が2次速度アップと一致することを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:23:02 GMT)
Imaginary gap-closed points and dynamics in a class of dissipative systems [0.0]
本稿では,消散系における虚空ギャップ閉点とその関連力学について検討する。 IGC点がバルク損失確率のパワー-ロー崩壊を誘導し、「エッジバースト」と呼ばれる境界現象を引き起こすことを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:28:19 GMT)
Identification of a natural fieldlike entanglement resource in trapped-ion chains [0.0]
イオン鎖の電磁トラップは、非自明な絡み合った量子状態形成の過程と見なすことができる。局所モードの解離部分集合間の絡み合いの減衰は、絡み合い構造の特徴を示す。自然界からの「拡大した絡み合った状態のイメージング」を通じて、量子場シミュレーションを初期化するためのフレームワークが確立されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:42:34 GMT)
Hybrid Quantum-Classical Photonic Neural Networks [0.0]
従来のネットワーク層とトレーニング可能な連続可変量子回路の組み合わせを示す。分類タスクでは、ハイブリッドネットワークは2倍の大きさの完全古典的ネットワークに対してベンチマークすると、同じ性能を達成する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:31:38 GMT)
Human Oversight of Artificial Intelligence and Technical Standardisation [0.0]
AIのグローバルガバナンスの中で、人間の監視の要件は、いくつかの規制形式に具体化されている。そのため、欧州連合(EU)の立法府は、人間の監督に対する法的要件を「取り除く」ために、過去よりもはるかに進んでいる。 AI意思決定プロセスにおける人間の位置に関する疑問は、特に注目されるべきである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 07:43:46 GMT)
Hamiltonian Engineering of collective XYZ spin models in an optical cavity [0.0]
合成量子システムを用いた量子シミュレーションは、多体物理学におけるオープンな疑問を探求するユニークな機会を提供する。ここでは、任意の二次ハミルトニアンあるいは事実上無限の範囲チューナブルなハイゼンベルクXYZモデルとのオール・ツー・オールな相互作用を実現することができる。 2つ以上の関連する運動量状態を含むプラットフォームの汎用性は、キャビティトーンを追加することで、量子シミュレーションや、物質波干渉計や、光学時計や磁気センサなどの量子センサーにおける量子センシングの豊富な機会を開放するハミルトニアンの柔軟性と組み合わさったものです。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 23:25:49 GMT)
Generative Large Language Models in Automated Fact-Checking: A Survey [0.0]
オンラインプラットフォームにおける偽情報の拡散は、深刻な社会的困難を招いている。偽情報の量が増加するには、自動的な方法が必要である。大規模言語モデル(LLM)は、ファクトチェッカーを支援するための有望な機会を提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:16:46 GMT)
GPTCast: a weather language model for precipitation nowcasting [0.0]
GPTCastは、レーダベースの降雨をアンサンブルする深層学習法である。我々は、トークン化レーダ画像を用いて降水動態を学習するために、GPTモデルを用いて予測を行う。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:25:58 GMT)
GCF: Graph Convolutional Networks for Facial Expression Recognition [0.0]
表情認識のためのグラフ畳み込みネットワーク(CNN)を提案する。 GCFは、カスタムアーキテクチャまたは事前訓練されたモデルを使用して、機能抽出のためにCNNを統合する。 CK+, JAFFE, FERGなどのベンチマークデータセット上でGCFを評価する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:27:33 GMT)
Federated Distillation for Medical Image Classification: Towards Trustworthy Computer-Aided Diagnosis [0.0]
医用画像分類はコンピュータ支援臨床診断において重要な役割を担っている。ディープラーニング技術は、効率を大幅に向上し、コストを削減した。医用画像データのプライバシーに敏感な性質は、集中的な記憶とモデルの訓練を複雑にする。本稿では,これらの問題に対処するためのフェデレーション学習に基づく,新たなプライバシ保護型医用画像分類フレームワークであるFedMICを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:38:06 GMT)
Fault-tolerance of the [[8,1,4]] non-CSS code [0.0]
既知の[[8,1,4]]非CSSコードのフォールトトレランスを示し、コードの論理的エラー率について検討する。我々は,Gottesman氏が提供した安定化器符号の符号化手順を選択し,CSS以外のコードのクラスの設定に適合するように修正する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 06:20:33 GMT)
Fast Ground State to Ground State Separation of Small Ion Crystals [0.0]
捕捉されたイオンの線形結晶を異なるサブセットに迅速に分離することは、捕捉されたイオン量子コンピューティングアーキテクチャを実現するために重要である。我々は,同種結晶と混合種結晶のより小さな部分集合への分離を記述するのに使用できる一般的な理論的枠組みを紹介する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 01:51:11 GMT)
EvolBA: Evolutionary Boundary Attack under Hard-label Black Box condition [0.0]
研究によると、ディープニューラルネットワーク(DNN)には、敵対的事例(AE)の誤認識につながる脆弱性がある。本研究では, HL-BB条件下での共分散行列適応進化戦略 (CMA-ES) を用いて, AE を生成するための EvolBA という逆攻撃手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:12:52 GMT)
Estimation of high-dimensional unitary transformations saturating the Quantum Cramér-Rao bound [0.0]
本稿では,$d$次元のユニタリ変換を推定する手法を提案する。従来の情報がない場合でも、標準的な量子プロセストモグラフィーよりも高精度で2次元のユニタリ変換を推定できることを数値シミュレーションで示している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:20:16 GMT)
Estimation of AMOC transition probabilities using a machine learning based rare-event algorithm [0.0]
アトランティック・メリディショナル・オーバーターン循環(Atlantic Meridional Overturning Circulation、AMOC)は、地球規模の気候の重要な構成要素である。本研究では、AMOCが特定の時間窓内で崩壊する確率を計算する。希少なアルゴリズムと機械学習を結合することで、遷移確率を正確に推定できることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:06:43 GMT)
Equidistribution-based training of Free Knot Splines and ReLU Neural Networks [0.0]
直交線形ユニット(ReLU)アクティベーション機能を持つ浅層ニューラルネットワーク(NN)を用いた一次元関数近似の問題点を考察する。ネットワークの幅が大きくなるにつれて,悪条件が急速に低下することを示す。我々は、ReLU NNのトレーニング手順を改善するために、最適片方向線形補間理論を利用する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:51:36 GMT)
Ensuring Responsible Sourcing of Large Language Model Training Data Through Knowledge Graph Comparison [0.0]
近年,大手言語モデル (LLM) 開発者に対する著作権付きコーポラの出版社,新聞,その他のクリエーターが盗作罪で告訴されている。本稿では,大規模言語モデルの訓練や微調整に知識源が用いられているかどうかを評価するための,新たなシステムであるプラジャリズム検出システムを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 20:49:21 GMT)
Enhancing Deep Neural Network Training Efficiency and Performance through Linear Prediction [0.0]
ディープニューラルネットワーク(DNN)は、コンピュータビジョンや自然言語処理など、さまざまな分野で大きな成功を収めている。本稿では,DNNの学習効率を最適化する手法を提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:57:06 GMT)
Enabling Student Innovation through Virtual Reality Development [0.0]
大学コンピュータサイエンス(CS)プログラムでは、開発プラットフォームとして学生をVRに公開することが重要である。本稿では,学生主導のVRプロジェクトがCSカリキュラム全体において,基本的なCS概念を網羅する形でどのように利用されているかを説明する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:28:04 GMT)
Efficient Bit Labeling in Factorization Machines with Annealing for Traveling Salesman Problem [0.0]
2次的制約のないバイナリ最適化問題は、機械学習の助けを借りて解決される。本研究は, 収束速度と2値ラベリング法における精度の依存性について検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:26:38 GMT)
Effect of antiprotons on hydrogen-like ions in external magnetic fields [0.0]
1つのアンチプロトンと1つの水素様イオンからなる準分子化合物について検討した。 2中心ポテンシャルを持つディラック方程式は、双対平衡有限基底集合法を用いて数値的に解かれる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:45:32 GMT)
Divide And Conquer: Learning Chaotic Dynamical Systems With Multistep Penalty Neural Ordinary Differential Equations [0.0]
多段階ペナルティ・ヌード(MP-NODE)は、倉本-シヴァシンスキー方程式や2次元コルモゴロフ流のようなカオス系に適用される。カオスシステムを最小二乗のランドスケープと同じような方法で最適化し、計算コストを大幅に削減することができる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 02:54:49 GMT)
Distributional Regression U-Nets for the Postprocessing of Precipitation Ensemble Forecasts [0.0]
グリッド型降水アンサンブル予測のためのグローバル統計後処理手法を提案する。このU-Netベースの分布回帰法は,スコアリングルール最小化によって推定されるパラメトリック分布の形で,限界分布を予測する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:16:04 GMT)
DiffStyler: Diffusion-based Localized Image Style Transfer [0.0]
画像スタイル転送は、色、ブラシストローク、形状など、スタイルターゲットの特徴的な特性を持つデジタルイメージを埋め込むことを目的としている。任意のスタイル転送手法の進歩にもかかわらず、コンテンツセマンティクスとスタイル属性の微妙な均衡は依然として大きな課題である。本稿ではDiffStylerについて紹介する。DiffStylerは、任意の画像スタイルの効率的な転送を容易にする新しいアプローチである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:36:26 GMT)
Detecting Driver Fatigue With Eye Blink Behavior [0.0]
交通事故は毎年、何百万人もの死者と数十億ドルの経済損失を引き起こしている。様々な研究は、カメラベースのソリューションを用いてドライバーの睡眠/覚醒状態を検出することに焦点を当てている。本研究では、点眼周波数に加えて、ドライバ適応型点眼行動特徴セットを評価し、疲労状態を検出する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 12:41:51 GMT)
Density effects on the interferometry of Efimov states by modulating magnetic fields [0.0]
変調磁場による熱ガス中のエフィモフトリマーの動的結合は非常に実りがあることが証明された。エフィモフ三量体と第1原子二量体との重畳は依然として同じであり、高い振動率のフリンジの周波数は低い値に変化する。後者は、密度プロファイルがトラップ状態の寄与を調べるため、自由空間における三量体と原子二量体の周波数を参照する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 19:17:14 GMT)
Demonstration of the Rodeo Algorithm on a Quantum Computer [0.0]
Rodeoアルゴリズムは、量子コンピュータ上で観測可能な任意の固有状態の準備と固有値推定のための効率的なアルゴリズムである。固有状態生成のための位相推定や断熱進化のようなよく知られたアルゴリズムよりも指数関数的に高速である。実際の量子デバイス上ではまだ実装されていない。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 00:32:21 GMT)
Decentralized Intelligence Network (DIN) [0.0]
分散インテリジェンスネットワーク(DIN)は、プロバイダや機関間のデータの断片化とサイロ化に起因する、データ主権とAI利用の課題に対処する。この包括的なフレームワークは、スケーラブルなデータソースへのアクセス障壁を克服する。効果的なAIトレーニングをサポートし、参加者がデータのコントロールを維持し、金銭的に利益を享受し、分散型でスケーラブルなエコシステムに貢献できるようにする。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:40:06 GMT)
Database Systems Course: Service Learning Project [0.0]
本稿では,上層および大学院レベルのデータベースシステムコースで使用されるサービス学習プロジェクトについて述べる。学生は実際のクライアントのために小さなデータベースプロジェクトを完了します。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:53:29 GMT)
Convexity of noncontextual wirings and how they order the set of correlations [0.0]
我々は自由操作を非コンテキスト配線(NCW)と考える。 NCWを介して異なるリソースを変換する方法に関するいくつかの基本的な事実を実証する。その結果,ベルシナリオ以外のシナリオにおいてNCWによって誘導される複雑な順序付けが明らかとなった。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 10:10:08 GMT)
Computing $\varphi(N)$ for an RSA module with a single quantum query [0.0]
RSAモジュールの$N$に対して$varphi(N)$を、ランダムに選択された整数の代入として$N$を演算する計算時間アルゴリズムを与える。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 14:14:32 GMT)
Computational Fluid Dynamics on Quantum Computers [0.0]
Qubitは計算流体力学(CFD)のための量子解に取り組んでいる我々は、変分量子CFD(VQCFD)アルゴリズムとそれに基づく2Dソフトウェアプロトタイプを作成しました。量子シミュレータ上でSoftware Prototypeをテストすることにより、CFDの根底にある偏微分方程式を量子コンピュータで解くことができることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:30:45 GMT)
Completely entangled subspaces of entanglement depth $k$ [0.0]
完全に絡み合う部分空間: 絡み合い深さ$k$$$k$-CESs)。これらの部分空間と拡張不可能な製品ベース(UPB)の関係について論じる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:19:39 GMT)
Comparative Evaluation of Learning Models for Bionic Robots: Non-Linear Transfer Function Identifications [0.0]
本研究は,アンサンブル学習モデル,正規化ベースモデル,カーネルベースモデル,ニューラルネットワークモデルなど,4種類のモデルをトレーニングする。主な目的は、モデルフリー制御の適用のための包括的な評価戦略とフレームワークを提供することである。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:00:23 GMT)
Collective photon emission in solid state environments: Concatenating non-markovian and markovian dynamics [0.0]
固体量子エミッタの集合発光とマルチキュービットダイナミクスについて検討する。量子放出体に対するフォノンの効果は超高速非マルコフ力学によって説明される。単一量子エミッタの場合、第1の方法は高速で遅いフォノン力学を過大評価し、第2の方法はポーラロン法であることを示す。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:07:01 GMT)
Coherent information for CSS codes under decoherence [0.0]
Calderbank-Shor-Steane (CSS) コードと呼ばれるクラスには、トーリックコード、カラーコード、フラクトンなど多くの重要な例が含まれている。近年の研究では、これらのQECCの復号化遷移は、混合状態から情報理論量を計算することによって本質的に捕捉できることが示されている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:00:02 GMT)
Characterizing the Interpretability of Attention Maps in Digital Pathology [0.0]
本稿では,デジタル病理学において,注意ネットワークが関連する機能に対応する能力を評価する枠組みを提案する。人工モデルの共同設立者を作り、専用の解釈可能性メトリクスを使用します。以上の結果から,AMMILモデルがフレームワーク内で期待どおりに動作していることが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:58:58 GMT)
Certifying nonlocal properties of noisy quantum operations [0.0]
我々は、測定プロトコルで得られた相関から量子チャネルの非局所的性質を認証するための統一的なフレームワークを提供する。特殊ケースにおいて非局所性や絡み合いを生じさせるものもあれば, 異なるデフォーカスノイズモデルの効果について検討する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 18:00:06 GMT)
CMOS-fabricated ultraviolet light modulators using low-loss alumina piezo-optomechanical photonic circuits [0.0]
CMOSファブリケート型圧電オプトメカニカル光光学集積回路プラットフォームを紫外および青色の波長で実証する。圧電駆動型MEMSカンチレバー位相シフト器を320nmまで下げたブロードバンド振幅変調器を30dBの高減衰率で示す。これらの結果は、UVフォトニクス、量子科学、センシング、分光学における様々な新しい応用の扉を開く必要がある。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:40:34 GMT)
BMW Agents -- A Framework For Task Automation Through Multi-Agent Collaboration [0.0]
我々は、様々なドメインにわたる複雑なユースケースアプリケーションを扱う柔軟なエージェントエンジニアリングフレームワークの設計に重点を置いている。提案するフレームワークは,産業用アプリケーションの信頼性を提供し,複数の自律エージェントに対して,スケーラブルでフレキシブルで協調的なワークフローを保証するためのテクニックを提供する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 11:45:05 GMT)
Automated Knowledge Graph Learning in Industrial Processes [0.0]
本稿では,時系列データから知識グラフを自動学習するフレームワークについて紹介する。我々のフレームワークは、産業データセットに固有の複雑さに対処し、意思決定、プロセス最適化、知識発見を改善する知識グラフに変換する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 09:47:56 GMT)
Assessing the Effectiveness of GPT-4o in Climate Change Evidence Synthesis and Systematic Assessments: Preliminary Insights [0.0]
GPT-4oは最先端の大規模言語モデル(LLM)である我々は,GPT-4oによる気候変動適応に関する科学的文献からの抽出の有効性を評価した。その結果,GPT-4oは低熟練タスクでは高い精度が得られるが,利害関係者の識別や適応応答の深さ評価などの中高熟練タスクでは信頼性が低いことが示唆された。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 13:14:57 GMT)
Assessing the Code Clone Detection Capability of Large Language Models [0.0]
評価には、さまざまなクローンタイプのコードペアと類似度のレベルでモデルをテストすることが含まれる。 GPT-4はすべてのクローンタイプでGPT-3.5を一貫して上回っている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:20:44 GMT)
A note on Majorana representation of quantum states [0.0]
任意の$d > 1$ に対して、次元 $d$ と $d-1$ qubits の量子状態はブロッホ球面の $d-1$ 点として表される。ブロッホ球面上の$d-1$点と対応する$d-1$ qubitsを$d$次元量子状態を表す単純なスキームを提案する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 15:55:21 GMT)
A new twist on the Majorana surface code: Bosonic and fermionic defects for fault-tolerant quantum computation [0.0]
マヨラナゼロモード(MZM)は、位相的に保護された量子コンピューティングハードウェアの候補である。 MSC符号のツイストは量子ビットの2倍の量を符号化できることを示す。我々は、より少ないリソースを用いて、普遍的な論理量子ビットと論理的MZMを実行する方法を説明する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:15:25 GMT)
A Survey of Accessible Explainable Artificial Intelligence Research [0.0]
本稿では、説明可能な人工知能(XAI)のアクセシビリティに関する研究について、系統的な文献レビューを行う。提案手法は,XAIとアクセシビリティーの交差点を捉えるために,いくつかの学術データベースを検索語で検索することを含む。我々は、デジタル包摂とアクセシビリティを促進するために、XAI開発に障害コミュニティを含めることの重要性を強調している。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:09:46 GMT)
A Pattern Language for Machine Learning Tasks [0.0]
我々は客観的関数を学習者の行動に関する制約と見なしている。動作の中核となるタスクと実装の詳細を分離できる形式的なグラフィカル言語を開発する。概念実証として、「マニピュレータ」と呼ぶ生成モデルに分類器を変換できる新しいタスクを設計する。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 16:50:27 GMT)
A Novel Approach to Image EEG Sleep Data for Improving Quality of Life in Patients Suffering From Brain Injuries Using DreamDiffusion [0.0]
脳の信号を画像に変換することは、コマトース患者の思考をより深く理解するために重要である。伝統的に、脳波によって収集された脳信号は、テキストにのみ変換される。 GitHubで利用可能なオープンソースモデルの新たな方法によって、DreamDiffusionは、脳波を直接イメージに変換するのに使用できる。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 21:26:28 GMT)
A Fixed-Parameter Tractable Algorithm for Counting Markov Equivalence Classes with the same Skeleton [0.0]
因果DAG(Bayesian Network)は、確率変数間の条件依存を符号化する一般的なツールである。しかし、同じ確率変数の集合上の2つの異なる因果DAGに対して、全く同じ条件依存の集合をエンコードすることが可能である。そのような因果DAGはマルコフ同値であり、マルコフ同値DAGの同値類はマルコフ同値類(Markov Equivalent Classs、MECs)として知られている。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 05:19:32 GMT)
$ε$-Uniform Mixing in Discrete Quantum Walks [0.0]
離散量子ウォークの確率分布が任意に均一に近づくかどうかを考察する。我々は、正則な非二部グラフ上のこの現象を、それらの隣接固有値と固有射影の観点から特徴づける。
論文参考訳（メタデータ） (Tue, 2 Jul 2024 17:58:06 GMT)