MuirBench: A Comprehensive Benchmark for Robust Multi-image Understanding [150.3] マルチモーダルLLMの堅牢なマルチイメージ理解機能に着目したベンチマークであるMuirBenchを紹介する。
MuirBenchは、12の多様なマルチイメージタスク(例えば、シーン理解、順序付け)で構成されており、10のカテゴリのマルチイメージ関係を含んでいる。
GPT-4oやGemini Proのような最高のパフォーマンスモデルでさえ、ムアベンチを解くことは困難であり、精度は68.0%、49.3%である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:56:14 GMT)
Multilingual Trolley Problems for Language Models [138.1] この研究は、「道徳機械実験」という人間の道徳的嗜好に関する大規模横断的な研究から着想を得たものである。
大規模な言語モデル(LLM)は、英語、韓国語、ハンガリー語、中国語などの言語では人間の好みと一致しているが、ヒンディー語やソマリ語(アフリカ)のような言語では一致していないことを示す。
また, LLMが道徳的選択に与える説明を特徴付けるとともに, GPT-3によるGPT-4の決定と実用主義の裏側において, 公平性が最も有力であることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:02:53 GMT)
Enhancing Large Language Models in Coding Through Multi-Perspective Self-Consistency [128.0] 大規模言語モデル(LLM)は、コード生成において顕著な能力を示した。
しかし、単一の試みで正しいソリューションを生成することは依然として課題である。
本稿では,MPSC(Multi-Perspective Self-Consistency)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:02:02 GMT)
StyleDubber: Towards Multi-Scale Style Learning for Movie Dubbing [125.9] フレームレベルから音素レベルへのダビング学習を切り替えるStyleDubberを提案する。
本研究は,(1) 音素レベルで動作するマルチモーダルスタイル適応器を用いて,参照音声から発音スタイルを学習し,ビデオで提示される顔の感情によって伝達される中間表現を生成すること,(2) メルスペクトル復号と中間埋め込みからの精製プロセスの両方を案内して全体のスタイル表現を改善する発話レベル学習モジュール,(3) 唇同期を維持するための音素誘導唇整合器,の3つの構成要素を含む。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:42:36 GMT)
The Art of Saying No: Contextual Noncompliance in Language Models [123.4] 本稿では,ユーザの要求に従わないモデルについて,コンテキスト非準拠の包括的分類を導入する。
我々の分類は、不完全、不完全、不完全、不決定、人為的要求を含む幅広いカテゴリーにまたがる。
言語モデルの非準拠性をテストするために,1000個の非準拠プロンプトの新たな評価スイートを開発するために,この分類法を用いる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:12:51 GMT)
Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.6] 脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。
ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。
提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:31:21 GMT)
AutoRT: Embodied Foundation Models for Large Scale Orchestration of Robotic Agents [109.4] AutoRTは、人間の監督を最小限に抑えて、完全に見えないシナリオで運用ロボットの展開をスケールアップするシステムである。
われわれはAutoRTが複数の建物にまたがる20以上のロボットに指示を提示し、遠隔操作と自律ロボットポリシーを通じて77万個の実ロボットエピソードを収集するデモを行った。
実験により,AutoRTが収集した「未使用データ」は極めて多種多様であり,AutoRTのLLMを使用することで,人間の好みに合わせることができるデータ収集ロボットの指示が可能であることを実証した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:52:26 GMT)
Certainly Uncertain: A Benchmark and Metric for Multimodal Epistemic and Aleatoric Awareness [106.5] 視覚言語AIシステムに特有の不確実性の分類法を提案する。
また、精度と校正誤差の両方によく相関する新しい計量信頼度重み付き精度を導入する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 04:23:54 GMT)
VSP: Assessing the dual challenges of perception and reasoning in spatial planning tasks for VLMs [102.4] 視覚言語モデル(VLM)は、エキサイティングな言語モデル(LM)のクラスである。
VLMの未調査能力の1つは、視覚空間計画である。
本研究は,これらのモデルにおける空間計画能力を概ね評価するベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 00:24:01 GMT)
ADD 2022: the First Audio Deep Synthesis Detection Challenge [92.4] 最初のオーディオディープ合成検出チャレンジ(ADD)は、ギャップを埋めるために動機付けられた。
ADD 2022には、低品質の偽オーディオ検出(LF)、部分的に偽オーディオ検出(PF)、オーディオ偽ゲーム(FG)の3つのトラックが含まれている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 04:06:53 GMT)
Rethinking Machine Unlearning for Large Language Models [85.9] 大規模言語モデル(LLM)の領域における機械学習の研究
このイニシアチブは、望ましくないデータの影響(機密情報や違法情報など)と関連するモデル機能を排除することを目的としている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:15:50 GMT)
Learning to Refine with Fine-Grained Natural Language Feedback [81.7] 我々は,3つの異なるLLM能力の構成要素として,フィードバックによる洗練を検討することを提案する。
このアプローチの重要な特性は、ステップ2の批判モデルがエラーに関するきめ細かいフィードバックを与えてくれることです。
文書基盤要約の現実的整合性を改善する作業において,異なる機能モデルがこのアプローチの精細化の恩恵を受けることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:15:01 GMT)
Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.6] 脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:00:30 GMT)
Cradle: Empowering Foundation Agents Towards General Computer Control [80.0] GCCに向けた予備的な試みとして,モジュール型かつフレキシブルなLMM駆動フレームワークであるCradleを紹介した。
Cradleは入力スクリーンショットを理解し、低レベルキーボードと高レベルプランニング後のマウス制御のために実行可能なコードを出力することができる。
Cradleは、これまで探索されていなかった4つの商用ビデオゲーム、5つのソフトウェアアプリケーション、そして包括的なベンチマークであるOSWorldで、目覚ましい一般化性と印象的なパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:23:13 GMT)
Towards Robust Speech Representation Learning for Thousands of Languages [77.3] 自己教師付き学習(SSL)は、ラベル付きデータの必要性を減らすことで、音声技術をより多くの言語に拡張するのに役立つ。
我々は4057言語にまたがる100万時間以上のデータに基づいて訓練された、ユニバーサル音声のための言語横断言語であるXEUSを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:23:44 GMT)
Revisiting Backdoor Attacks against Large Vision-Language Models [76.4] 本稿では,LVLMの命令チューニングにおけるバックドア攻撃の一般化可能性について実験的に検討する。
以上に基づいて,既存のバックドア攻撃を修正した。
本稿では,従来のシンプルなバックドア戦略でさえ,LVLMに深刻な脅威をもたらすことを指摘する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:36:01 GMT)
ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.6] 非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:33:41 GMT)
Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback [70.3] リニアアライメントは、言語モデルと人間の好みを1つの推論ステップで整列する新しいアルゴリズムである。
一般的な選好データセットとパーソナライズされた選好データセットの実験により、線形アライメントはLLMアライメントの性能と効率を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:24:29 GMT)
Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning [70.2] 人間のフィードバックによる強化学習(RLHF)は、現在の大規模言語モデルパイプラインにおいて広く採用されているアプローチである。
提案手法では,(1)OODを回避するためのオン・ポリシー・クエリと,(2)プライオリティ・クエリの最も情報性の高いデータを選択するためのアクティブ・ラーニングという2つの重要なイノベーションを導入している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:09:19 GMT)
GSM-Plus: A Comprehensive Benchmark for Evaluating the Robustness of LLMs as Mathematical Problem Solvers [68.8] 大規模言語モデル (LLM) は、様々な数学的推論ベンチマークで顕著な性能を達成している。
1つの必須かつ頻繁な証拠は、数学の質問がわずかに変更されたとき、LLMは誤って振る舞うことができることである。
このことは, LLMの数学推論能力の頑健性を評価するために, 幅広い質問のバリエーションを試すことによるものである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:46:03 GMT)
LexMatcher: Dictionary-centric Data Collection for LLM-based Machine Translation [67.2] 本稿では、バイリンガル辞書に見られる感覚のカバレッジによって駆動されるデータキュレーション手法であるLexMatcherを提案する。
我々の手法は、WMT2022テストセットの確立されたベースラインよりも優れています。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:00:23 GMT)
Coding for Intelligence from the Perspective of Category [66.1] 符号化の対象はデータの圧縮と再構成、インテリジェンスである。
最近の傾向は、これらの2つの分野の潜在的均一性を示している。
本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:47:02 GMT)
Learning Graph Structures and Uncertainty for Accurate and Calibrated Time-series Forecasting [65.4] 本稿では,時系列間の相関を利用して時系列間の構造を学習し,精度の高い正確な予測を行うSTOICを紹介する。
幅広いベンチマークデータセットに対して、STOICは16%の精度とキャリブレーションのよい予測を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:14:32 GMT)
Product Geometries on Cholesky Manifolds with Applications to SPD Manifolds [65.0] シンメトリー正定値(SPD)多様体上の2つの新しい測度をコレスキー多様体を通して提示する。
私たちのメトリクスは使いやすく、計算効率が良く、数値的に安定しています。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:46:13 GMT)
LLM-Select: Feature Selection with Large Language Models [64.5] 大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。
以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:23:40 GMT)
Why Does New Knowledge Create Messy Ripple Effects in LLMs? [64.5] GradSimは、LMの知識がいつ、なぜ更新されたのかを効果的に示す指標である。
GradSimは、元の事実の勾配とその関連する知識の間のコサイン類似性によって計算される。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:33:44 GMT)
How to Boost Any Loss Function [63.6] 損失関数の高速化により効率よく最適化できることを示す。
古典的な$0の注文設定ではまだ不可能な成果を達成できることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:08:23 GMT)
CFinBench: A Comprehensive Chinese Financial Benchmark for Large Language Models [61.3] CFinBenchは、中国の文脈下での大規模言語モデル(LLM)の財務知識を評価するための評価ベンチマークである。
この質問は、43の第二級カテゴリーにまたがる99,100の質問で構成されており、3つの質問タイプがある: シングルチョイス、マルチチョイス、そして判断である。
結果は、GPT4といくつかの中国指向モデルがベンチマークをリードし、平均精度は60.16%であることを示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:34:36 GMT)
GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.8] 拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:55:50 GMT)
Concise and Precise Context Compression for Tool-Using Language Models [60.6] ツールを用いた言語モデルにおいて,ツール文書を簡潔かつ高精度な要約シーケンスに圧縮する2つの手法を提案する。
API-BankとAPIBenchの結果,最大16倍の圧縮率で上行ベースラインに匹敵する性能を示した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:17:00 GMT)
Cocktail: A Comprehensive Information Retrieval Benchmark with LLM-Generated Documents Integration [60.5] LLM(Large Language Models)の普及は、インターネット上のAIGC(AIGC)の流入につながっている。
AIGCの急増が情報検索システムに与える影響は、まだ明らかな疑問である。
我々は、この混合ソースデータランドスケープでIRモデルを評価するのに適したベンチマークであるCocktailを紹介した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:23:37 GMT)
Secure Semantic Communication via Paired Adversarial Residual Networks [59.5] 本稿では,セキュリティを意識したセマンティック通信システムに対する敵攻撃の正の側面について検討する。
セマンティックトランスミッターの後に、セマンティックレシーバーの前に、一対のプラグイン可能なモジュールがインストールされる。
提案手法は,高品質なセマンティック通信を維持しつつ,盗聴者を騙すことができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:32:20 GMT)
KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.2] 大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。
現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。
このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:44:22 GMT)
CEB: Compositional Evaluation Benchmark for Fairness in Large Language Models [58.6] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを処理するために、ますます多くデプロイされている。
LLMが示すバイアスを評価するために、研究者は最近、様々なデータセットを提案している。
我々は,様々な社会的グループやタスクにまたがる様々なバイアスをカバーした構成的評価ベンチマークであるCEBを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:31:37 GMT)
Meta 3D AssetGen: Text-to-Mesh Generation with High-Quality Geometry, Texture, and PBR Materials [58.2] AssetGenはテキストから3D生成の大幅な進歩である。
テクスチャと素材制御を備えた忠実で高品質なメッシュを生成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:21:47 GMT)
Meta 3D Gen [57.3] 3DGenは、3Dアセットを作成でき、高速な忠実さと高品質な3D形状とテクスチャを1分以内で提供する。
3DGenは、現実世界のアプリケーションで3Dアセットのリライトに必要な物理ベースのレンダリング(PBR)をサポートする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:37:52 GMT)
Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.2] カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。
提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:11:17 GMT)
A Modular Approach for Multimodal Summarization of TV Shows [55.2] 分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。
我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。
我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:22:14 GMT)
Meta 3D TextureGen: Fast and Consistent Texture Generation for 3D Objects [54.8] 高品質なテクスチャを20秒未満で生成することを目的とした,2つのシーケンシャルネットワークで構成される新しいフィードフォワード方式であるMeta 3D TextureGenを紹介する。
提案手法は,2次元空間の3次元セマンティクスにテキスト・ツー・イメージ・モデルを適用し,それらを完全かつ高解像度なUVテクスチャマップに融合することにより,品質とスピードを向上する。
さらに、任意の比率で任意のテクスチャをアップスケーリングできるテクスチャ拡張ネットワークを導入し、4kピクセルの解像度テクスチャを生成します。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:04:34 GMT)
GSQA: An End-to-End Model for Generative Spoken Question Answering [54.4] 本稿では,システムに抽象的推論を強制するGSQA(Generative Spoken Question Answering)モデルを提案する。
本モデルでは, 抽出QAデータセットにおいて, 従来の抽出モデルよりも3%上回っている。
我々のGSQAモデルは、幅広い質問に一般化する可能性を示し、それによって、抽象的QAの音声質問応答能力をさらに拡張する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:24:34 GMT)
A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.1] 本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
また,モーザイクアーティファクトを緩和するのには単純だが有効であるHR特徴量に対して,きめ細かな近傍選択戦略を開発した。
提案するReSFUフレームワークは,異なるセグメンテーションアプリケーション上での良好な性能を一貫して達成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:12:21 GMT)
Aligning Human Motion Generation with Human Perceptions [51.8] 本研究では,大規模人間の知覚評価データセットであるMotionPerceptと,人間の動作批判モデルであるMotionCriticを導入することにより,ギャップを埋めるデータ駆動型アプローチを提案する。
我々の批評家モデルは、運動品質を評価するためのより正確な指標を提供しており、容易に運動生成パイプラインに統合することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:01:59 GMT)
Homomorphism Autoencoder -- Learning Group Structured Representations from Observed Transitions [51.7] 本研究では,世界に作用するエージェントが,それを修飾する動作と整合した感覚情報の内部表現を学習できるようにする手法を提案する。
既存の作業とは対照的に、我々のアプローチはグループの事前の知識を必要とせず、エージェントが実行可能なアクションのセットを制限しない。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:46:13 GMT)
GlotLID: Language Identification for Low-Resource Languages [51.4] GlotLID-M は広い範囲、信頼性、効率性のデシラタを満たす LID モデルである。
1665の言語を識別し、以前の作業に比べてカバー範囲が大幅に増加した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 23:34:35 GMT)
ColorVideoVDP: A visual difference predictor for image, video and display distortions [51.3] メトリックは、色調コントラスト感度とチャンネル間のコントラストマスキングという新しい心理物理学モデルに基づいて構築されている。
ディスプレイの観察条件、幾何学的、および測光的特性を考慮に入れている。
一般的なビデオストリーミングの歪みと、AR/VRディスプレイに関連する8つの新しい歪みを予測できるように訓練された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:16:38 GMT)
Observational Scaling Laws and the Predictability of Language Model Performance [51.2] モデルトレーニングを回避し、80の公開モデルからスケーリング法則を構築する観察的アプローチを提案する。
いくつかの創発現象が滑らかでシグモダルな挙動を辿り、小さなモデルから予測可能であることを示す。
言語モデル機能の改善が進むにつれて、Chain-of-ThoughtやSelf-Consistencyといったポストトレーニング介入の影響を予測する方法を示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:16:42 GMT)
Exploring the Role of Transliteration in In-Context Learning for Low-resource Languages Written in Non-Latin Scripts [50.4] 非ラテン文字で書かれた低リソース言語に対するLLMの性能向上にも効果があるか検討する。
本稿では,(1) の原文,(2) ラテン文字,(3) の両文を対象とする3つのプロンプトテンプレートを提案する。
本研究の結果から,翻訳の有効性はタスクタイプやモデルサイズによって異なることが明らかとなった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:51:20 GMT)
Automated Text Scoring in the Age of Generative AI for the GPU-poor [49.2] 自動テキストスコアリングのためのオープンソースの小規模生成言語モデルの性能と効率を解析する。
以上の結果から, GLMは, 最先端の高性能化には至らず, 適正な調整が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:17:01 GMT)
ValueScope: Unveiling Implicit Norms and Values via Return Potential Model of Social Interactions [47.9] 我々は、13のRedditコミュニティで言語的およびスタイリスティックな表現を識別し分析するためにValueScopeを使用します。
我々の分析は、近縁なコミュニティでさえ、非常に多様な規範を示すことを示す定量的基盤を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:51:27 GMT)
Investigating the Effects of Large-Scale Pseudo-Stereo Data and Different Speech Foundation Model on Dialogue Generative Spoken Language Model [47.7] 単一チャネルの対話データを擬似ステレオデータに変換するパイプラインを開発する。
これにより、トレーニングデータセットを2,000時間から17,600時間に拡大しました。
この擬似ステレオデータの導入は、音声対話言語モデルの性能向上に有効であることが証明されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:22:41 GMT)
Data Augmentation using Large Language Models: Data Perspectives, Learning Paradigms and Challenges [47.5] データ強化(DA)は、データ収集を必要とせずにトレーニング例を多様化することにより、モデルパフォーマンスを向上させる重要な手法として登場した。
本調査では,大規模言語モデル(LLM)がDAに与える影響,特に自然言語処理(NLP)以降の文脈において,それらが持つ固有の課題と機会に対処する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:59:40 GMT)
Privacy Risks of General-Purpose AI Systems: A Foundation for Investigating Practitioner Perspectives [47.2] 強力なAIモデルによって、幅広いタスクでパフォーマンスが飛躍的に向上した。
プライバシの懸念は、さまざまなプライバシのリスクとAIモデルの脆弱性をカバーした、豊富な文献につながっている。
我々はこれらの調査論文の体系的なレビューを行い、GPAISにおけるプライバシーリスクの簡潔かつ有用な概観を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:49:48 GMT)
Learning Neural Volumetric Pose Features for Camera Localization [47.1] 本稿では,PoseMapと呼ばれるニューラルボリュームポーズ機能を導入し,カメラのローカライゼーションを強化した。
我々のフレームワークは、拡張されたNeRFモジュールとともにAPR(Absolute Pose Regression)アーキテクチャを活用している。
室内および屋外のベンチマークシーンで平均14.28%, 20.51%の性能向上が得られた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:36:58 GMT)
Understanding Alignment in Multimodal LLMs: A Comprehensive Study [46.3] マルチモーダル大言語モデル(MLLM)における嗜好アライメントのそれぞれの側面を解析する。
オフライン手法とオンライン手法を組み合わせることで,特定のシナリオにおけるモデルの性能が向上することを示す。
BDHS(Bias-Driven Hallucination Smpling)と呼ばれる,マルチモーダルな嗜好データ作成手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:55:03 GMT)
PromptIntern: Saving Inference Costs by Internalizing Recurrent Prompt during Large Language Model Fine-tuning [45.8] 本稿では,プログレッシブ微調整によるモデルパラメータへの迅速な知識を内部化するための新しい手法であるPromptInternを提案する。
提案手法は推論トークンの90%以上を削減し、推論を4.2倍に高速化し、88.3%の金銭的コストを節約する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:21:14 GMT)
Privacy-Preserving Instructions for Aligning Large Language Models [45.7] 本稿では,データアノテーションとモデル微調整における実命令を置き換えるための合成命令を提案する。
形式的な差分プライバシーは、プライベートな微調整されたジェネレータを使用して合成命令を生成することで保証される。
教師付き微調整では、プライベートな合成命令で訓練されたモデルは、Vicunaのような主要なオープンソースモデルよりも優れている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:57:07 GMT)
AXIAL: Attention-based eXplainability for Interpretable Alzheimer's Localized Diagnosis using 2D CNNs on 3D MRI brain scans [45.6] 本研究では,3次元MRIを用いたアルツハイマー病診断の革新的手法を提案する。
提案手法では,2次元CNNがボリューム表現を抽出できるソフトアテンション機構を採用している。
ボクセルレベルの精度では、どの領域に注意が払われているかを同定し、これらの支配的な脳領域を同定する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:44:00 GMT)
StructLDM: Structured Latent Diffusion for 3D Human Generation [45.5] StructLDMは2次元画像から学習した拡散に基づく非条件の人間の生成モデルである。
ポーズ/ビュー/シェイプコントロールや、合成世代、部品認識の衣服編集、3Dバーチャルトライオンなどのハイレベルなタスクなど、さまざまなレベルのコントロール可能な3Dヒューマン生成と編集を可能にする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:53:03 GMT)
Lung-CADex: Fully automatic Zero-Shot Detection and Classification of Lung Nodules in Thoracic CT Images [45.3] コンピュータ支援診断は早期の肺結節の検出に役立ち、その後の結節の特徴づけを促進する。
MedSAMと呼ばれるSegment Anything Modelの変種を用いて肺結節をゼロショットでセグメント化するためのCADeを提案する。
また、放射能特徴のギャラリーを作成し、コントラスト学習を通じて画像と画像のペアを整列させることにより、良性/良性としての結節的特徴付けを行うCADxを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:30:25 GMT)
Video Watermarking: Safeguarding Your Video from (Unauthorized) Annotations by Video-based LLMs [43.8] ビデオウォーターマーキング(英語: Video Watermarking)は、ビデオベースの大規模言語モデルによって、未承認のアノテーションからビデオを保護する技術である。
ビデオによるLLMの誤使用を防止しつつ視聴体験を保存している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:34:14 GMT)
Leveraging Large Language Models for Learning Complex Legal Concepts through Storytelling [43.2] 我々は,非専門家がストーリーテリングを通じて複雑な法的概念を学ぶのを支援するために,法律教育における大規模言語モデル(LLM)の新たな応用法を提案する。
そこで我々は,294の複雑な法的教義からなり,それぞれに物語と複数の選択肢の質問が伴う新たなデータセットであるLegalStoriesを紹介した。
LLMが生成した物語は、定義のみに比較して、法的概念の理解と、非ネイティブ話者間の法律への関心を高めることが判明した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:50:42 GMT)
Uformer-ICS: A U-Shaped Transformer for Image Compressive Sensing Service [43.2] 画像CSタスクのための新しいU字型トランスとしてUformer-ICSを提案する。
推定ブロック間隔に基づいて測定資源を割り当てる適応型サンプリングアーキテクチャを設計する。
本モデルでは,画像の局所的特徴と長距離依存性を同時に利用することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:26:09 GMT)
PLeaS -- Merging Models with Permutations and Least Squares [43.2] モデル決定型PLeaSをマージする2段階のアルゴリズムを提案する。
PLeaSはアライメントを最大化することで各層のノードに部分的にマッチする。
マージされたモデルの重みをレイヤワイズ・リースト・スクエアの解として計算する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:24:04 GMT)
A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses [42.1] 大きな言語モデル(LLM)は、x2013$x2013$methodsのリークに対して脆弱である。
我々は、悪意ある目標を達成するために不寛容な情報を利用する推論敵と呼ばれる推論脅威モデルを導入する。
私たちの研究は、安全なジェイルブレイクを解放するための要件と、関連するユーティリティコストに関する、理論上は初めての理解を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:19:25 GMT)
DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.1] 本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:33:32 GMT)
Towards a Holistic Framework for Multimodal Large Language Models in Three-dimensional Brain CT Report Generation [42.1] 2Dラジオグラフィーキャプションは、ボリューム3D解剖学における現実の診断課題を反映するものではない。
我々は18,885組の3D-BrainCTデータセットを収集し,臨床ビジュアルインストラクション・チューニングを用いて,脳波モデルを用いて放射線治療を施した3D脳CTレポートを作成した。
私たちの研究は、3Dの脳CTデータセットのキュレーション、微調整による解剖学的意味のある言語モデル、堅牢な放射線学評価指標の提案など、総合的な枠組みを具現化したものです。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:58:35 GMT)
Aligning Large Language Models with Human Preferences through Representation Engineering [41.8] 表現工学(RepE)の新たな分野から着想を得た本研究は,LLM内の活動パターンに埋め込まれた高レベルの人間の嗜好の関連表現を特定することを目的としている。
この新しいアプローチは、人間フィードバックからの表現アライメント(Representation Alignment from Human Feedback、RAHF)と呼ばれ、効果的で、計算的に効率的で、実装が容易であることが証明されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 04:07:14 GMT)
MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification [41.5] 本稿では,マルチモーダル数学推論のための新しいベンチマークMM-MATHを提案する。
MM-MATHは、5,929個のオープンエンド中等教育数学問題と視覚的文脈を持ち、難易度、学級レベル、知識点の詳細な分類を行う。
最高の性能モデルはMM-MATHで31%の精度しか達成していないが、人間では82%である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:46:23 GMT)
Knowledge Transfer from Vision Foundation Models for Efficient Training of Small Task-specific Models [41.3] 大量のデータセットに事前訓練されたビジョンファウンデーションモデル(VFM)は、さまざまな下流タスクで素晴らしいパフォーマンスを示す。
高い推論計算コストのため、これらのモデルは現実世界の多くのアプリケーションにデプロイすることはできない。
本稿では,課題指向の知識伝達手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 00:22:16 GMT)
Referring Atomic Video Action Recognition [40.9] 我々は、Referring Atomic Video Action Recognitionと呼ばれる新しいタスクを導入する。
我々は、テキストで導かれる特定の個人の正しい原子活動を認識することに集中する。
テキスト記述を手作業で記述した36,630のインスタンスを含むRefAVAデータセットを提示する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:13:05 GMT)
Reliable Confidence Intervals for Information Retrieval Evaluation Using Generative A.I [39.9] 大規模言語モデル(LLM)は、相対的に計算コストの少ない大規模で関連アノテーションを生成することができる。
本稿では,予測型推論と共形リスク制御に基づく2つの手法を提案する。
実験の結果,CIは評価のばらつきと偏りの両方を正確に捉えていることがわかった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:44:00 GMT)
GraphWiz: An Instruction-Following Language Model for Graph Problems [39.7] GraphInstructは、言語モデルに明示的な推論パスを用いて、幅広いグラフ問題に対処する機能を持たせるために設計されたデータセットである。
GraphWizは、明確な推論プロセスを生成しながら、さまざまなグラフ問題タイプを解決できるオープンソースの言語モデルです。
拡張モデルであるGraphWiz-DPOは、9つのタスクで平均65%の精度を達成し、GPT-4を平均43.8%上回っている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:40:30 GMT)
To Forget or Not? Towards Practical Knowledge Unlearning for Large Language Models [39.4] 大規模な言語モデル(LLM)は、個人プライバシー情報や著作権資料などの機密データを必然的に保持する。
知識未学習の最近の進歩は、特定の知識を消去するためにLLMパラメータを更新する。
著作権付きコンテンツとユーザプライバシドメインを含むベンチマークであるKnowUnDoを導入し、未学習プロセスが必然的に本質的な知識を消去するかどうかを評価する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:34:16 GMT)
Predicting vs. Acting: A Trade-off Between World Modeling & Agent Modeling [34.4] RLHF準拠のLMは、ベンチマークと長文生成の両方で前例のない能力を示している。
RLHFモデルが人間との対話を目的としたエージェントモデルになるにつれ、彼らは世界モデリングを失うように思われる。
我々は、コヒーレントな長文生成を行うために、暗黙の青写真を通してランダム性を制限したRLHFモデルを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:22:54 GMT)
Towards the Next Frontier in Speech Representation Learning Using Disentanglement [34.2] 本稿では,フレームレベルと発話レベルのエンコーダモジュールから構成される音声の拡散自己監督学習(Learning2Diss)のためのフレームワークを提案する。
提案したLearn2Dissは,フレームレベルのエンコーダ表現が意味的タスクを改善する一方で,発話レベルの表現が非意味的なタスクを改善することにより,様々なタスクにおける最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:13:35 GMT)
Evaluating Character Understanding of Large Language Models via Character Profiling from Fictional Works [33.8] 大規模言語モデル(LLM)は印象的なパフォーマンスを示し、多くのAIアプリケーションに拍車をかけた。
これらのRPAの前提条件は、LLMが架空の作品からキャラクターを理解する能力にある。
これまでの努力は、基本的な分類タスクや特徴的模倣を通じて、この機能を評価してきた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:01:27 GMT)
S2D: Sorted Speculative Decoding For More Efficient Deployment of Nested Large Language Models [32.7] より高速な推論のためのドラフトモデルをデプロイするための、新しいマルチターゲットシナリオを紹介します。
マルチターゲット設定における正規ベースラインよりも優れた、より効率的なソートされた投機的復号化機構を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:14:15 GMT)
Efficient-Empathy: Towards Efficient and Effective Selection of Empathy Data [32.5] 感性・合理性スコアに基づくデータ選択アルゴリズムであるEfficient-Empathyを提案する。
我々の訓練された感性モデルは、最先端(SoTA)の性能を効率的に達成する。
感度と合理性データをMoE構造と組み合わせることで,さらに高い性能を実現する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 04:11:52 GMT)
LogEval: A Comprehensive Benchmark Suite for Large Language Models In Log Analysis [32.5] ログ解析タスクにおける大規模言語モデルの性能を評価するために設計されたベンチマークスイートであるLogEvalを紹介する。
このベンチマークでは、ログ解析、ログ異常検出、ログ障害診断、ログ要約などのタスクをカバーしている。
LogEvalは4000の公開ログデータエントリを使用して各タスクを評価し、各タスクに対して15の異なるプロンプトを使用して、徹底的で公正な評価を保証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:39:33 GMT)
Farsight: Fostering Responsible AI Awareness During AI Application Prototyping [32.2] 私たちはFarsightという、プロトタイピング中のAIアプリケーションから潜在的な害を識別する新しい対話型ツールを紹介します。
ユーザのプロンプトに基づいて、Farsightは関連するAIインシデントに関するニュース記事を強調し、LLM生成したユースケースやステークホルダ、障害を調査、編集することを可能にする。
10人のAIプロトタイプを用いた共同設計研究と42人のAIプロトタイプを用いたユーザスタディから得られた知見を報告する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:12:05 GMT)
Counterfactual Data Augmentation with Denoising Diffusion for Graph Anomaly Detection [32.2] グラフ異常検出のための教師なし対実データ拡張法CAGADを提案する。
グラフ固有の拡散モデルを設計し、その近傍の一部(おそらく通常のもの)を異常なものに翻訳する。
翻訳された異常な隣人を集約することで、偽造表現はより識別しやすくなり、さらに検出性能を主張する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:37:54 GMT)
WTU-EVAL: A Whether-or-Not Tool Usage Evaluation Benchmark for Large Language Models [31.7] 大きな言語モデル(LLM)は、NLPタスクに優れていますが、その能力を拡張するための外部ツールが必要です。
11個のデータセットでLCMを評価するためにW whether-or-notツール利用評価ベンチマーク(WTU-Eval)を導入する。
WTU-Eval 上での8つの LLM の結果は、LLM が一般的なデータセットでツールの使用方法を決定するのにしばしば苦労していることを示している。
微調整のLlama2-7Bは14%の性能向上と16.8%の誤ったツール使用率の低下をもたらす。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:07:38 GMT)
Open-Source Conversational AI with SpeechBrain 1.0 [31.6] SpeechBrainはオープンソースのConversational AIツールキットで、PyTorchをベースとしている。
事前トレーニングされたモデルと、トレーニングに必要なコードとアルゴリズムの完全な“レシピ”の両方をリリースすることで、透明性と複製性を促進する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:53:10 GMT)
Extracting and Encoding: Leveraging Large Language Models and Medical Knowledge to Enhance Radiological Text Representation [31.4] 自由テキストラジオグラフィーレポートから高品質な事実文を抽出するための新しい2段階フレームワークを提案する。
我々のフレームワークには胸部X線テキスト生成システムを評価するための新しい埋め込みベースのメトリクス(CXRFE)も含まれている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 04:39:19 GMT)
Efficient Evolutionary Search Over Chemical Space with Large Language Models [31.3] 最適化の目的は区別できない。
化学対応大規模言語モデル(LLM)を進化的アルゴリズムに導入する。
我々のアルゴリズムは最終解の質と収束速度の両方を改善する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:12:38 GMT)
Unveiling Global Interactive Patterns across Graphs: Towards Interpretable Graph Neural Networks [31.3] グラフニューラルネットワーク(GNN)は、グラフマイニングの著名なフレームワークとして登場した。
本稿では,グラフ分類に内在的に解釈可能な新しい手法を提案する。
グローバル対話パターン(GIP)学習は、学習可能なグローバル対話パターンを導入し、決定を明示的に解釈する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:31:13 GMT)
SimCol3D -- 3D Reconstruction during Colonoscopy Challenge [31.0] 2022年のEndoVisのサブチャレンジSimCol3Dは、データ駆動深度を促進し、大腸内視鏡で予測する。
合成大腸内視鏡画像からの深度予測は頑健に解けるが, ポーズ推定は未解決の課題である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:49:46 GMT)
FedIA: Federated Medical Image Segmentation with Heterogeneous Annotation Completeness [30.8] フェデレーテッド・ラーニングは医療画像セグメンテーションの魅力的なパラダイムとして登場した。
本稿では,医療実践における課題である不完全アノテーションについて述べる。
この問題に対処するために、FedIAという新しいソリューションを紹介します。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:08:55 GMT)
A Bounding Box is Worth One Token: Interleaving Layout and Text in a Large Language Model for Document Understanding [30.8] 文書理解のための大規模言語モデル(LayTextLLM)にインターリービングレイアウトとテキストを導入する。
LayTextLLMは、各バウンディングボックスを単一の埋め込みに投影し、テキストでインターリーブする。
また、キー情報抽出(KIE)と視覚質問応答(VQA)の性能向上も示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:29:05 GMT)
PIN-SLAM: LiDAR SLAM Using a Point-Based Implicit Neural Representation for Achieving Global Map Consistency [30.6] PIN-SLAMは、弾性的かつコンパクトな点ベースの暗黙的ニューラルマップ表現に基づいて、一貫した一貫したマップを構築するシステムである。
我々の暗黙の地図は、ループを閉じる際の大域的なポーズ調整とともに、本質的に弾性で変形可能なスパース最適化可能なニューラルポイントに基づいている。
PIN-SLAMは、最先端のLiDARオドメトリーやSLAMシステムと同等のポーズ推定精度を達成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:06:29 GMT)
Information Flow Control in Machine Learning through Modular Model Architecture [28.7] 今日の機械学習(ML)モデルでは、トレーニングデータの任意の部分がモデル出力に影響を与える可能性がある。
トレーニングデータからモデル出力への情報フローの制御の欠如は、センシティブなデータに対するトレーニングモデルの大きな障害である。
本稿では,機械学習のための情報フロー制御の概念を提案し,トランスフォーマー言語モデルアーキテクチャの拡張を開発する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:51:03 GMT)
An Examination on the Effectiveness of Divide-and-Conquer Prompting in Large Language Models [28.1] 本研究では,DACプロンプトが性能向上に寄与する特定のタスクの特定を支援する。
実験結果が理論解析と一致した2つのケース(大整数算術と実数検証)を提示する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:18:18 GMT)
The Missing Piece in Model Editing: A Deep Dive into the Hidden Damage Brought By Model Editing [27.6] 大規模な言語モデルは、時代遅れまたは誤った情報の修正に不可欠である。
これらのモデルを編集すると、しばしば、隠れた空間におけるリップル効果と呼ばれる複雑な問題が発生する。
本稿では,モデルの適応とその後の編集の影響を定量的に評価する新しい評価手法を提案する。
さらに,このリップル効果を緩和するモデル編集法であるSelective Impact Revision(SIR)を導入する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:07:56 GMT)
MTMamba: Enhancing Multi-Task Dense Scene Understanding by Mamba-Based Decoders [27.5] マルチタスクシーン理解のための新しいマンバベースアーキテクチャであるMTMambaを提案する。
NYUDv2とPASCAL-Contextデータセットの実験では、TransformerベースのメソッドとCNNベースのメソッドよりも、MTMambaの方が優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:52:18 GMT)
Analog quantum simulation of parabolic partial differential equations using Jaynes-Cummings-like models [27.2] パラボリック偏微分方程式の解を埋め込んだ量子状態を作成するための簡易なアナログ量子シミュレーションプロトコルを提案する。
鍵となる考え方は、熱方程式を1次微分作用素のみを含む双曲型熱方程式系によって近似することである。
d-次元問題に対して、1つのd-レベル量子系 (qudit) を用いる方がより適切であることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:23:11 GMT)
DynaSemble: Dynamic Ensembling of Textual and Structure-Based Models for Knowledge Graph Completion [27.1] 我々は知識グラフ補完(KGC)に対する2つの一般的なアプローチを考える。
本研究では,クエリ依存型アンサンブル重み学習手法であるDynaSembleを提案する。
DynaSembleは、3つの標準KGCデータセットで最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:54:56 GMT)
Efficient Nearest Neighbor based Uncertainty Estimation for Natural Language Processing Tasks [26.3] $k$-Nearest Neearbor Uncertainty Estimation (k$NN-UE) は、隣人からの距離と、隣人のラベル存在率を利用する不確実性推定手法である。
実験の結果,提案手法は信頼性校正,選択予測,分布外検出において,ベースラインや最近の密度に基づく手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:33:31 GMT)
Are Data Augmentation Methods in Named Entity Recognition Applicable for Uncertainty Estimation? [26.3] 名前付きエンティティ認識(NER)タスクにおけるデータの増大が信頼度校正と不確実性評価に与える影響について検討する。
また,データ拡張により,言語間および言語間におけるキャリブレーションや不確実性が向上することを示す。
また,増量によりキャリブレーションや不確実性がさらに向上することが示唆された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:49:43 GMT)
MMedAgent: Learning to Use Medical Tools with Multi-modal Agent [26.3] 本報告では,医療分野向けに設計された最初のエージェントである textbfMulti-modal textbfMedical textbfAgent (MMedAgent) を紹介する。
本研究では,7つのタスクを解く6つの医療ツールからなる指導訓練データセットをキュレートし,与えられたタスクに最適なツールをエージェントが選択できるようにする。
MMedAgentは、最先端のオープンソース手法やクローズドソースモデルであるGPT-4oと比較して、様々な医療タスクにおいて優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:58:23 GMT)
Light-weight Fine-tuning Method for Defending Adversarial Noise in Pre-trained Medical Vision-Language Models [25.3] 微調整事前学習型視覚言語モデル(VLM)は、医用画像とテキスト描写相乗効果において顕著な能力を示した。
多くの事前トレーニングデータセットは、患者プライバシの懸念によって制限されており、下流のパフォーマンスに悪影響を及ぼす可能性のあるノイズを含む可能性がある。
本稿では,敵の攻撃を効果的に防御し,微調整時に上流の騒音の影響を是正する手法であるRAN(Creify Adversarial noise)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 23:48:43 GMT)
Adversarial Search Engine Optimization for Large Language Models [25.3] 大規模言語モデル(LLM)は、競合するサードパーティのコンテンツからモデルを選択するアプリケーションで、ますます使われている。
我々は、LLMの選択を操作して攻撃者を支持する新しいタイプの攻撃であるPreference Manipulation Attacksを紹介する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:56:48 GMT)
No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models [25.3] 我々はCFGの中核となる原則を再考し、新しい方法である独立条件ガイダンス(ICG)を導入する。
ICGは特別な訓練手順を必要とせずにCFGの利点を提供する。
提案手法は条件拡散モデルの学習過程を合理化し,任意の事前学習条件モデル上での推論にも適用可能である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:04:00 GMT)
FlowTrack: Point-level Flow Network for 3D Single Object Tracking [24.9] 3Dシングルオブジェクトトラッキング(SOT)は、モバイルロボティクスと自動運転の分野において重要なタスクである。
従来の動きに基づくアプローチは、2つの連続するフレーム間の目標の相対的な移動を推定することで目標追跡を実現する。
本研究では,FlowTrackと呼ばれる3次元SOTタスクのための多フレーム情報を用いた点レベルフロー手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:31:34 GMT)
Let the Expert Stick to His Last: Expert-Specialized Fine-Tuning for Sparse Architectural Large Language Models [24.9] エキスパート特化ファインチューニング(Expert-Specialized Fine-Tuning、ESFT)は、他の専門家やモジュールを凍結しながら、下流のタスクに最も関係のある専門家をチューニングする。
よりきめ細かい専門家によるMoEモデルは、下流タスクに最も関係のある専門家の組み合わせを選択する上でより有利である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:11:13 GMT)
Improving Steering and Verification in AI-Assisted Data Analysis with Interactive Task Decomposition [24.8] LLMを利用するChatGPT Data Analysisのようなツールは、ユーザがデータ分析プログラミングの難しいタスクに取り組むのに役立つ可能性がある。
しかし、私たちのフォーマティブな研究は、AI生成結果の検証とAIの運営において深刻な課題を明らかにしました。
これらの課題に対処する2つの対照的なアプローチを開発した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:33:50 GMT)
ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos [24.5] ReXTimeは、ビデオイベント内で時間的推論を実行するAIモデルの能力を厳格にテストするために設計されたベンチマークである。
時間的推論と問合せのペアを生成する自動パイプラインを開発する。
私たちのパイプラインは、手作業なしで9,695個のマシン生成サンプルのトレーニングデータセットを作成しています。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:30:03 GMT)
FedEx: Expediting Federated Learning over Heterogeneous Mobile Devices by Overlapping and Participant Selection [24.4] 我々は、モバイルデバイス上でのFLトレーニングをアンダーライン化するための、新しいアンダーライン学習手法であるFedExを提案する。
我々は、FedExが、メモリコストに制限のある不均一なモバイルデバイス上でのFLトレーニングのレイテンシを大幅に削減することを示した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:16:36 GMT)
Organic or Diffused: Can We Distinguish Human Art from AI-generated Images? [24.4] AIが生成した画像を人間のアートから取り除くことは、難しい問題だ。
この問題に対処できないため、悪いアクターは、AIイメージを禁止したポリシーを掲げる人間芸術や企業に対してプレミアムを支払う個人を欺くことができる。
7つのスタイルにまたがって実際の人間のアートをキュレートし、5つの生成モデルからマッチング画像を生成し、8つの検出器を適用します。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:22:14 GMT)
Whispering Experts: Neural Interventions for Toxicity Mitigation in Language Models [23.5] 毒性を規定するニューロンは、有害な文章を識別する能力によって決定できることを示す。
我々は,AUROC適応(AurA)を提案する。これは,事前訓練された任意の大規模言語モデルに適用して毒性を軽減できる介入である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:48:29 GMT)
Breaking Bias, Building Bridges: Evaluation and Mitigation of Social Biases in LLMs via Contact Hypothesis [23.3] 大規模言語モデル(LLM)は、訓練データに偏見を反映し、社会的ステレオタイプや不平等を補強する社会バイアスを持続させる。
本稿では,これらのモデルにプロンプトに対する非バイアス応答を付与する独自のデバイアス処理手法であるSocial Contact Debiasing(SCD)を提案する。
我々の研究は、LLM応答が接触探究の際の社会的バイアスを示すことを示したが、より重要なことは、これらのバイアスは、SCD戦略に従ってLLaMA 2を指導する1つの時代において、最大40%減少させることができることである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:58:46 GMT)
Enabling Discriminative Reasoning in Large Language Models for Legal Judgment Prediction [23.0] 人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。
ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。
広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:43:15 GMT)
Crossroads of Continents: Automated Artifact Extraction for Cultural Adaptation with Large Multimodal Models [22.9] まず,67か国の9,935のイメージと10のコンセプトクラスを含む大規模データセットであるDale Streetを紹介した。
次に、人工物抽出タスクによるモデルの深い文化理解を評価し、異なる国に関連する18,000以上の人工物を特定する。
最後に,文化から文化へイメージを適応させるために,高度に構成可能なパイプラインであるCultureAdaptを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:55:41 GMT)
VFIMamba: Video Frame Interpolation with State Space Models [22.9] フレーム間モデリングはビデオフレーム(VFI)の中間フレーム生成において重要である
S6(Selective State Space Models)が登場し、ロングシーケンスモデリングに特化している。
本稿では,S6モデルを用いたフレーム間モデリングのための新しいフレーム手法であるVFIMambaを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:48:18 GMT)
Single Image Test-Time Adaptation for Segmentation [22.6] この研究では、セグメンテーションモデルを、テスト時に利用可能な他のデータなしで、単一のラベルのないイメージに適応させる方法について検討する。
特に、この研究は、テスト時の自己監督的損失を最適化することで適応に焦点を当てている。
我々のベースラインへの追加は、非適応ベースラインよりも3.51と3.28%増加する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:34:23 GMT)
SADL: An Effective In-Context Learning Method for Compositional Visual QA [22.1] 大規模視覚言語モデル(LVLM)は、ビジュアルQAでコンテキスト内学習(ICL)を実行するための新しい機能を提供する。
本稿では,タスクのための新しい視覚言語プロンプトフレームワークであるSADLを紹介する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:41:39 GMT)
Universal Semi-Supervised Learning for Medical Image Classification [21.8] セミ教師付き学習(SSL)は、適切なラベル付きトレーニングデータを収集するコストを削減できるため、多くの注目を集めている。
従来のSSLは、ラベル付きデータとラベルなしデータが同じディストリビューションのものであるべきだという仮定に基づいて構築されている。
本研究では,未表示のラベル付きデータを利用した半教師付き医療画像分類のための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:28:08 GMT)
Survey on Knowledge Distillation for Large Language Models: Methods, Evaluation, and Application [21.6] 大規模言語モデル(LLM)は様々な領域で例外的な機能を示しており、学術と産業の両方から大きな関心を集めている。
精度を維持しながら言語モデルを圧縮する努力は研究の焦点となっている。
知識蒸留は、性能を著しく損なうことなく推論速度を向上する有効な手法として登場した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:14:42 GMT)
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather [21.0] 既存のLiDARセマンティックセグメンテーション手法は、悪天候下での性能低下に苦慮することが多い。
悪天候の主な要因を特定し, 性能劣化の主な原因を特定するための玩具実験を行った。
これらの知見に基づいて,新たな戦略的データ拡張手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:19:51 GMT)
Is Your AI-Generated Code Really Secure? Evaluating Large Language Models on Secure Code Generation with CodeSecEval [21.0] 大規模言語モデル(LLM)は、コード生成とコード修復に大きな進歩をもたらした。
しかし、GitHubのようなオープンソースのリポジトリから無防備なデータを使用したトレーニングは、セキュリティ上の脆弱性を必然的に伝播するリスクを増大させる。
我々は,コードLLMのセキュリティ面を正確に評価し,拡張することを目的とした総合的研究を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:13:21 GMT)
Physics-Informed Model and Hybrid Planning for Efficient Dyna-Style Reinforcement Learning [20.9] 実世界のアプリケーションに強化学習を適用するには、パフォーマンス、サンプル効率、推論時間の間のトレードオフに対処する必要がある。
本研究では,システム力学の部分的な物理知識を活用することで,この3つの課題に対処する方法を実証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:32:57 GMT)
TokenPacker: Efficient Visual Projector for Multimodal LLM [20.9] ビジュアルプロジェクタは、ビジュアルエンコーダとLarge Language Model(LLM)の間に必須のブリッジとして機能する。
本稿では,密集した特徴を注入して凝縮した視覚トークンを生成するために,粗く細かなスキームを取り入れた新しいビジュアルプロジェクタを提案する。
我々のアプローチでは、ビジュアルトークンを75%89%圧縮し、多様なベンチマークで同等またはさらに優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:10:55 GMT)
HGOT: Hierarchical Graph of Thoughts for Retrieval-Augmented In-Context Learning in Factuality Evaluation [20.2] 本稿では,文脈内学習における関連する文節の検索を促進するために,階層的思考グラフ(HGOT)を導入する。
このフレームワークは、複雑なクエリを管理可能なサブクエリに分割する、分割/クエリ戦略を採用している。
それは、最近提案された引用リコールと精度の指標を取り入れた、回答の選択のための自己一貫性の過半数投票を洗練する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:42:59 GMT)
Integrate the Essence and Eliminate the Dross: Fine-Grained Self-Consistency for Free-Form Language Generation [20.1] 本研究では,複数のサンプルから得られた詳細なコンセンサス知識を効果的に活用することにより,出力品質を最適化するFSCを提案する。
FSCの有効性は、要約、コード生成、数学的推論など、様々なタスクに関する広範な実験を通じて実証される。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:38:31 GMT)
SignAvatars: A Large-scale 3D Sign Language Holistic Motion Dataset and Benchmark [20.1] SignAvatarsは、難聴者や難聴者のコミュニケーションギャップを埋めるために設計された、最初の大規模でマルチプロンプトな3D手話言語(SL)モーションデータセットである。
データセットは153のシグナから7万本のビデオで構成され、合計8.34万フレームが分離されたサインと、連続的かつ協調的なサインの両方をカバーしている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:10:28 GMT)
LLMEasyQuant -- An Easy to Use Toolkit for LLM Quantization [19.8] LLM量子化には多くの量子化方法が存在するが、ユーザフレンドリで、ローカルにデプロイしやすいものはほとんどない。
このパッケージは、ユーザフレンドリで初心者の学習に適した量子化デプロイメントを容易にすることを目的としている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:34:50 GMT)
Securing Distributed Network Digital Twin Systems Against Model Poisoning Attacks [19.7] ディジタルツイン(DT)は、リアルタイム監視、予測、意思決定能力の向上を具現化する。
本研究では,分散ネットワークDTシステムにおけるセキュリティ上の課題について検討し,その後のネットワークアプリケーションの信頼性を損なう可能性がある。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:32:09 GMT)
Supporters and Skeptics: LLM-based Analysis of Engagement with Mental Health (Mis)Information Content on Video-sharing Platforms [19.5] 米国では5人に1人が精神疾患で暮らしている。
ショートフォームビデオコンテンツは、メンタルヘルスとリソースを広めるための重要なコンジットとして機能するように成長してきた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:51:06 GMT)
A Practical Review of Mechanistic Interpretability for Transformer-Based Language Models [19.5] 機械的解釈可能性(MI)は、その内部計算をリバースエンジニアリングすることでニューラルネットワークモデルを理解しようとする、新たな解釈可能性のサブフィールドである。
本稿は,MIにおける基礎研究対象,その調査に用いられている技術,MIの結果を評価するためのアプローチ,およびMIを用いてLMを理解することに起因する重要な知見と応用について概説する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:28:16 GMT)
When Automated Program Repair Meets Regression Testing -- An Extensive Study on 2 Million Patches [19.2] 自動プログラム修復(APR)は学術分野で広く研究され、産業から広く注目を集めている。
従来の回帰テスト選択(RTS)技術は、パッチ毎に影響を受けるテストのみを実行するために利用することができる。
本稿では,2M以上のパッチ上での12の最先端APRシステムに対して,様々なレベルで広く利用されているRTS技術について検討した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:22:24 GMT)
GraphSnapShot: Graph Machine Learning Acceleration with Fast Storage and Retrieval [19.2] GraphSnapShotは、グラフ学習のための高速キャッシュ、ストレージ、検索、計算のためのフレームワークである。
ロスレスグラフMLトレーニングでは、最大30%のトレーニングアクセラレーションと73%のメモリ削減を実現することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:24:13 GMT)
Pseudo-Labeling by Multi-Policy Viewfinder Network for Image Cropping [19.1] 我々は,ラベル付きデータとラベルなしデータの両方を併用して,画像収穫モデルのトレーニングデータの規模を拡大する可能性を探る。
このアイデアは、教師モデルによってラベルのないデータのための擬似ラベルを作成し、これらの擬似ラベルで学生モデルを訓練する、擬似ラベル方式で実装することができる。
本稿では,教師からの擬似ラベルの誤りを正すために,多種多様な修正ポリシーを提供する多言語ビューファインダーネットワーク(MPV-Net)を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:02:05 GMT)
Shall We Team Up: Exploring Spontaneous Cooperation of Competing LLM Agents [19.0] 本稿では、エージェントが文脈に深く関与し、明示的な指示なしに適応的な決定を行う自然現象の重要性を強調する。
我々は,3つの競争シナリオにまたがる自発的な協力を探究し,協力の段階的出現をシミュレートした。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:56:09 GMT)
RVISA: Reasoning and Verification for Implicit Sentiment Analysis [18.8] 暗黙の感情分析(ISA)は、表現に有能なキュー語が欠如していることで大きな課題となる。
本研究では,DO LLMの生成能力とED LLMの推論能力を利用した2段階推論フレームワークであるRVISAを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:07:54 GMT)
Contribution Evaluation of Heterogeneous Participants in Federated Learning via Prototypical Representations [18.7] フェデレートラーニング(FL)における貢献評価は,様々な領域にまたがる適用性から重要な研究領域となっている。
既存のコントリビューション評価手法は、主にデータボリューム、モデル類似性、補助的なテストデータセットに依存しており、様々なシナリオで成功している。
本稿では、FLにおけるコントリビューション評価を、全く新しい表現の観点から検討する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:05:43 GMT)
GraphBEV: Towards Robust BEV Feature Alignment for Multi-Modal 3D Object Detection [18.2] We propose a robust fusion framework called Graph BEV to integrate LiDAR and camera BEV features。
我々のフレームワークは、悪臭のある条件下で、BEV Fusionを8.3%上回っている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:16:31 GMT)
Embedded Prompt Tuning: Towards Enhanced Calibration of Pretrained Models for Medical Images [18.1] 医用画像分類タスクに基礎モデルを適用する際の微調整手法の有効性について検討する。
拡張チャネルにプロンプトトークンを埋め込む組込みプロンプトチューニング(EPT)手法を提案する。
EPTは、数ショットの医用画像分類タスクにおいて、いくつかの最先端の微調整方法よりも顕著に優れている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:11:43 GMT)
Breaking Language Barriers: Cross-Lingual Continual Pre-Training at Scale [18.0] 本稿では,既存のLLMから連続的に事前学習(CPT)を行うことにより,大規模言語モデル構築のための代替手法を検討する。
CPTはより高速に収束し、拡張性のある方法で重要なリソースを節約できる。
スケールでの転送の有効性は、トレーニング期間と言語特性に影響され、データ再生に頑健である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:06:41 GMT)
Kanbun-LM: Reading and Translating Classical Chinese in Japanese Methods by Language Models [17.7] 世界で最初の古典漢文データセットを構築した。
漢字の並べ替えや機械翻訳は漢文理解において重要な役割を担っている。
コードとデータセットはGitHubでリリースしています。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:39:31 GMT)
AutoSplat: Constrained Gaussian Splatting for Autonomous Driving Scene Reconstruction [17.6] AutoSplatは、自動走行シーンの高度に現実的な再構築を実現するために、ガウシアンスプラッティングを使用したフレームワークである。
我々は、前景オブジェクトの可視面と見えない面の両方を監督するために、反射ガウス整合性制約を導入する。
PandasetとKITTIの実験では、AutoSplatは様々な運転シナリオにおけるシーン再構築と新しいビュー合成において最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:36:50 GMT)
Strategic Demand-Planning in Wireless Networks: Can Generative-AI Save Spectrum and Energy? [17.6] 本稿では、需要ラベル付け、需要形成、需要再スケジューリングによる戦略的需要計画の概念を紹介する。
GenAIは、無線ネットワークにおける需要形成を容易にする強力なツールとして提案されている。
GenAIは、無線ネットワークのエネルギーとスペクトルを節約する機能を持つ。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:27:06 GMT)
MORPHEUS: Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space [16.5] 従来のパーソナライズド・ダイアログ生成(PDG)は、外部ロールデータに依存しており、プライバシーの懸念を生じさせる可能性がある。
textbfPersonalized Dialogue textbfHistory by textbfExploring and textbfUtilizing Latent textbfSpace (MORPHEUS) through a three-stage training process。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:12:34 GMT)
Is Your Large Language Model Knowledgeable or a Choices-Only Cheater? [16.4] 最近の研究は、大きな言語モデル(LLM)が選択のみを使用して複数の選択肢の質問に答えることができることを示している。
我々は、MCQAにおける選択のみのショートカットにLLMが過剰に頼っているかどうかを調査するコントラストセットを使用する。
コントラストセットを検証した後、12個のLCMをテストし、これらのモデルが質問と選択の両方を与えられた場合、選択のみのショートカットに依存しないことを示した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:06:53 GMT)
SoP: Unlock the Power of Social Facilitation for Automatic Jailbreak Attack [16.3] 私たちはJailbreakプロンプトを自動設計するフレームワークであるSoPを紹介します。
GPT-3.5-1106とGPT-4の安全アライメントを回避し,攻撃成功率88%と60%を達成した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:58:29 GMT)
TIGER: A Generating-Then-Ranking Framework for Practical Python Type Inference [16.2] Pythonの動的型付けシステムは柔軟性と表現力を提供するが、型関連のエラーにつながる可能性がある。
TIGERはPythonの多様な型カテゴリを扱うための2段階生成レベル(GTR)フレームワークである。
ManyTypes4Pyデータセットに対する評価は、TIGERが様々な型カテゴリの既存のメソッドよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:29:02 GMT)
DyGPrompt: Learning Feature and Time Prompts on Dynamic Graphs [14.6] 動的グラフモデリングのための新しいフレームワークであるDyGPromptを提案する。
まず,タスクの目的と,事前学習タスクと下流タスクの動的変動のギャップに対処する2つのプロンプトを設計する。
第2に,ノードと時間の特徴が相互に特徴付けされていることを認識し,下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:14:10 GMT)
Let Guidelines Guide You: A Prescriptive Guideline-Centered Data Annotation Methodology [14.5] 本稿では,各データサンプルに関連付けられたガイドラインの報告に焦点をあてた新しいデータアノテーション手法であるガイドライン中心アノテーションプロセスを紹介する。
標準的な規範的アノテーションプロセスの主な3つの制限を特定し,ガイドライン中心の方法論がそれを克服する方法について述べる。
本稿では,複数のタスクにまたがるアノテートデータを,単一のアノテートプロセスのコストで再利用する方法について論じる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:38:17 GMT)
Are There Exceptions to Goodhart's Law? On the Moral Justification of Fairness-Aware Machine Learning [14.4] 公正度対策はグッドハートの法則に特に敏感であると主張する。
公正度尺度の正当性に関する道徳的推論の枠組みを提示する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:53:59 GMT)
xLSTM-UNet can be an Effective 2D & 3D Medical Image Segmentation Backbone with Vision-LSTM (ViL) better than its Mamba Counterpart [13.8] 医用画像セグメンテーションのバックボーンとしてVision-LSTM(xLSTM)を利用するUNet構造化ディープラーニングニューラルネットワークであるxLSTM-UNetを提案する。
xLSTMはLong Short-Term Memory (LSTM) ネットワークの後継として最近提案された。
以上の結果から,XLSTM-UNetはCNNベース,Transformerベース,およびMambaベースセグメンテーションネットワークの性能を一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:45:25 GMT)
Towards Federated Learning with On-device Training and Communication in 8-bit Floating Point [13.7] 近年の研究では、8ビット浮動小数点(FP8)がニューラルネットワークの効率的なトレーニングに利用できることが示されている。
グローバルなFP32サーバモデルを維持しながらFP8クライアントトレーニングを組み合わせる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:55:58 GMT)
Do Large Language Models Exhibit Cognitive Dissonance? Studying the Difference Between Revealed Beliefs and Stated Answers [13.6] 我々は,これらの能力が調整プロンプトとMCQの外部で測定可能かどうかを検討する。
以上の結果から, LLMの回答は, Stated Answer と大きく異なることが示唆された。
テキスト補完はLLMの中核にあるため,これらの結果は共通評価手法が部分画像のみを提供する可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:02:04 GMT)
RLHF Can Speak Many Languages: Unlocking Multilingual Preference Optimization for LLMs [13.6] 高品質な多言語フィードバックデータを生成するための,新しいスケーラブルな手法を提案する。
我々の選好訓練モデルはAya 23 8Bに対して54.4%の勝利率を達成した。
その結果,世界の人口の半分をカバーする23言語にアライメント手法のフロンティアを広げた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:42:30 GMT)
Research on Autonomous Robots Navigation based on Reinforcement Learning [13.6] 我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。
様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 00:44:06 GMT)
Deep Imbalanced Regression to Estimate Vascular Age from PPG Data: a Novel Digital Biomarker for Cardiovascular Health [13.5] Photoplethysmographyは、人間の血行動態をモニタリングするための重要なツールとして浮上している。
現実の年齢分布は、しばしば不均衡であり、ディープラーニングモデルに重大な課題を提起する。
深部不均衡な回帰タスクに対処するために,Dist Lossという,新しい,シンプルで効果的な損失関数を導入する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:22:36 GMT)
Estimating Noisy Class Posterior with Part-level Labels for Noisy Label Learning [13.5] 既存の手法は通常、ノイズのあるラベルを持つ分類モデルを訓練することで、ノイズの多いクラス後部を学習する。
本稿では,教師付き情報をパートレベルのラベルで強化し,様々な部分からよりリッチな情報に集中・統合することをモデルに推奨する。
提案手法は理論的に健全であり,実験結果から合成および実世界の雑音評価において実験的に有効であることが示された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:06:15 GMT)
Towards Universal Mesh Movement Networks [13.5] 我々はUniversal Mesh Movement Network (UM2N)を紹介する。
UM2Nは、異なるサイズ分布と構造を持つメッシュを動かすために、非侵入的ゼロショット方式で適用することができる。
本研究では, 実世界の津波シミュレーション事例とともに, 対流法とナビエ・ストークス法に基づく実例について検討した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:22:04 GMT)
Looking From the Future: Multi-order Iterations Can Enhance Adversarial Attack Transferability [13.4] 本稿では,LFF(Looking From the Future)という新しいシーケンス最適化概念を提案する。
LFFは、最初の局所最適化選択を洗練させるために、元の最適化プロセスを利用している。
また,LFF攻撃やMLFF攻撃も提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:42:32 GMT)
On the consistency of hyper-parameter selection in value-based deep reinforcement learning [13.1] 本稿では,値に基づく深層強化学習エージェントのハイパーパラメータ選択の信頼性に着目した実証的研究を行う。
我々の研究は、どのハイパーパラメーターがチューニングに最も重要かを確立するのに役立ち、どのチューニングが異なるトレーニング体制間で一貫性を持ち続けるかを明らかにするのに役立ちます。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:33:26 GMT)
Memory Kernel Coupling Theory: Obtain Time Correlation Function from Higher-order Moments [13.1] このレターは、時間相関関数(TCF)を評価する一般的な形式であるメモリカーネル結合理論(MKCT)を提示する。
補助核の急激な崩壊により、結合した運動方程式を高精度に切り離すことができる。
この定式化は一般的なものであるが、典型的な開量子系(スピンボソンモデル)の数値的な実演を行う。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:40:40 GMT)
Pelican: Correcting Hallucination in Vision-LLMs via Claim Decomposition and Program of Thought Verification [13.1] Pelicanは、クレーム検証を通じて幻覚を検出し緩和するために設計されたフレームワークである。
実験の結果,MMHal-Benchの幻覚緩和法と比較すると,様々なベースラインLVLMにおいて覚醒率を$sim$8%-32%低下させ,また27%低下させた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:17:44 GMT)
Tiny-PULP-Dronets: Squeezing Neural Networks for Faster and Lighter Inference on Multi-Tasking Autonomous Nano-Drones [13.0] この研究は、ナノドロンの自律ナビゲーションのためのステート・オブ・ザ・アート畳み込みニューラルネットワークであるPULP-Dronetから、モデルサイズを1桁以上圧縮する新しい手法であるTiny-PULP-Dronetへと移行した。
この大規模な削減は、高レベルのインテリジェンスを達成するための基本的な要件であるナノドロンの安価なマルチタスクへの道を開く。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:24:57 GMT)
Change My Frame: Reframing in the Wild in r/ChangeMyView [12.9] サブレディット r/ChangeMyView (CMV) に基づくリフレーミングを一般化する。
我々は、CMVのコミュニティのインタラクションと規約を活用して、視点の変化を生み出す発話を特定するデータセットを構築します。
この種のリフレーミングに関するデータセット作成と評価の課題について検討する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:09:11 GMT)
Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models [12.9] 本稿では,ストーリ生成のセマンティック一貫性と時間的一貫性を高めるために,リッチコンテキスト拡散モデル(RCDM)を提案する。
RCDMは、自動回帰モデルと比較して、1つの前方推論で一貫したストーリーを生成することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:58:07 GMT)
Adaptive Autopilot: Constrained DRL for Diverse Driving Behaviors [12.8] 本研究では,制約深度強化学習(C-DRL)を利用した独自のフレームワークである適応オートパイロット(AA)を導入する。
AAは、ドライバーの介入の必要性を減らすために、人間の運転を安全にエミュレートすることを目的としている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:08:01 GMT)
A Quantitative and Qualitative Evaluation of LLM-Based Explainable Fault Localization [12.8] AutoFLは、提案された障害位置とともに、バグの説明を生成する。
JavaとPythonの798の現実世界のバグの実験では、AutoFLはメソッドレベルのcc@1を、ベースライン上で最大233.3%改善した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:25:16 GMT)
Complexity of Digital Quantum Simulation in the Low-Energy Subspace: Applications and a Lower Bound [12.0] シミュレーションの誤差は、様々なデジタル量子シミュレーションアルゴリズムや量子システムにおいて、ハミルトニアンの有効な低エネルギーノルムに依存することを示す。
低エネルギー部分空間におけるスピンモデルをシミュレートするために、qDRIFTやランダムな置換のようなランダム化された積公式はより小さなトロッター数を必要とすることを証明した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:46:50 GMT)
CALICO: Confident Active Learning with Integrated Calibration [12.0] トレーニングプロセス中にサンプル選択に使用される信頼度を自己校正するALフレームワークを提案する。
ラベル付きサンプルが少ないソフトマックス分類器と比較して,分類性能が向上した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:05:19 GMT)
A Curious Case of Searching for the Correlation between Training Data and Adversarial Robustness of Transformer Textual Models [11.9] 既存の研究によると、微調整されたテキスト変換モデルは最先端の予測性能を実現するが、敵対的なテキスト摂動にも弱い。
本稿では,トレーニングデータとモデルロバスト性との間にも強い相関関係があることを証明したい。
様々な入力微調整コーパス特性を表す13の異なる特徴を抽出し,それらを用いて微調整モデルの対角的堅牢性を予測する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:29:11 GMT)
Depth-Aware Endoscopic Video Inpainting [11.9] ビデオのインペイントは、破壊されたビデオコンテンツに、もっともらしい代替品を埋める。
近年の内視鏡的映像の塗布は, 内視鏡的映像の質を高める可能性を示している。
主に臨床参照のために重要な3次元空間的詳細を保存することなく2次元視覚情報を修復する。
本稿では,新しいDepth-awareendoscopic Video Inpaintingフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:28:36 GMT)
What We Talk About When We Talk About LMs: Implicit Paradigm Shifts and the Ship of Language Models [11.4] Language Models (LMs) という用語は常に再発明されており、その参照語はthesusの $textitShip のように更新されている。
本稿では,この「textitShip of Language Models$ problem」について考察する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:45:55 GMT)
Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization [11.3] セキュアなマルチパーティ計算に基づく意思決定ツリーのためのマルチパーティトレーニングフレームワークにより、複数のパーティが、プライバシ保護を備えた分散プライベートデータ上で、高性能モデルをトレーニングすることができる。
決定木のための既存のマルチパーティトレーニングフレームワークは、通信オーバーヘッドが大きいため、コミュニケーションの非効率性を実証する。
本稿では,コミュニケーション最適化による意思決定木のための効率的な3要素学習フレームワークであるEntsを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:33:52 GMT)
Pinyin Regularization in Error Correction for Chinese Speech Recognition with Large Language Models [11.3] 724Kの仮説と書き起こしのペアを持つ中国語ASRの誤り訂正を目的とした,特殊なベンチマークデータセットを構築した。
本稿では,テキスト仮説から直接Pinyinを転写するプロンプトに対するPinyin正規化法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:16:47 GMT)
Evaluating the Robustness of Adverse Drug Event Classification Models Using Templates [11.3] 副作用 (ADE) は、薬物治療によって引き起こされる有害事象である。
その重要性にもかかわらず、ADEはしばしば公式チャンネルで報告されていない。
ソーシャルメディアにおけるADEの議論を検出する研究もある。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:09:24 GMT)
EIT-1M: One Million EEG-Image-Text Pairs for Human Visual-textual Recognition and More [10.9] 我々は,100万以上のEEG-image-textペアを持つ,EIT-1Mという新しい大規模マルチモーダルデータセットを提案する。
我々のデータセットは、マルチモーダル情報の同時処理において、脳活動を反映する能力に優れている。
我々は、さまざまなカテゴリや参加者のマルチモーダル刺激から得られる脳波データの詳細な分析と、透明性のためのデータ品質スコアを提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:11:15 GMT)
How to Learn in a Noisy World? Self-Correcting the Real-World Data Noise on Machine Translation [10.7] 実世界のハード・トゥ・デテクト・ミスアライメントノイズが機械翻訳に与える影響について検討する。
トークンレベルでの不整合とクリーンなデータを区別するために,モデルの自己認識の信頼性が高まるのを観察することにより,自己補正手法を提案する。
提案手法は,8つの翻訳タスクにまたがる実世界のノイズの多いWebマイニングデータセットに対して有効であることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:15:15 GMT)
Safe CoR: A Dual-Expert Approach to Integrating Imitation Learning and Safe Reinforcement Learning Using Constraint Rewards [10.7] 複雑な環境をナビゲートするための安全な報酬学習フレームワークを提案する。
提案フレームワークは,実世界のJackalプラットフォーム上での制約違反を8,8$%削減する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:05:16 GMT)
Zero-error communication under discrete-time Markovian dynamics [10.5] 離散時間)マルコフ力学を持つ開量子系を考える。
我々の課題は、システムが任意に長い時間進化した後でも、完全に復元できるように、システムに情報を保存することである。
これは、力学が混合されているとき、古典的な(参照量子)情報に対して正確には不可能であることを示す。
さらに、このようなダイナミクスが完全な検索点を超えるエンコードされた情報をスクランブルする最小時間に、厳密な普遍的上限を与える。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:14:33 GMT)
Multi-Modal Video Dialog State Tracking in the Wild [10.5] MST-MIXERは、汎用的なマルチモーダル状態追跡スキーム上で動作する新しいビデオダイアログモデルである。
新たなマルチモーダルグラフ構造学習法を用いて,各入力モードの選択した構成成分の不足する基盤構造を予測する。
5つの挑戦的なベンチマークで、最先端の新たな結果を達成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:34:17 GMT)
QSync: Quantization-Minimized Synchronous Distributed Training Across Hybrid Devices [10.4] QSyncは、ハイブリッドデバイス上で効率的な同期データ並列DNNトレーニングを可能にするトレーニングシステムである。
そこで本研究では,QSyncが分散混合精度トレーニングを5%の誤差で正確にシミュレートできることを示し,その精度は0.27-1.03%向上した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:56:47 GMT)
HOIMotion: Forecasting Human Motion During Human-Object Interactions Using Egocentric 3D Object Bounding Boxes [10.2] 本稿では,人間と物体の相互作用における人間の動き予測の新しい手法であるHOIMotionを提案する。
提案手法は,過去の身体のポーズやエゴセントリックな3Dオブジェクト境界ボックスに関する情報を統合する。
HOIMotionは、最先端の手法よりも大きなマージンで一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:58:35 GMT)
CatMemo at the FinLLM Challenge Task: Fine-Tuning Large Language Models using Data Fusion in Financial Applications [10.2] IJCAI-2024 FinLLMの課題に対して,金融業務の3つの重要な領域におけるLLMの能力について検討した。
金融分類、財務文書要約、単一株式取引について検討する。
提案手法は,これらの多様なタスクを包括的かつ総合的に処理することを目的としており,LLMの多様かつ複雑な財務課題への対処能力の向上と意思決定能力の向上を図っている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:04:13 GMT)
BeNeRF: Neural Radiance Fields from a Single Blurry Image and Event Stream [10.0] 一つのぼやけた画像とそれに対応するイベントストリームからニューラル放射場(NeRF)を復元する可能性を示す。
本手法は暗黙的なニューラルシーンの表現を共同で学習し,カメラの動きを復元する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:28:22 GMT)
A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data [9.6] 実世界のモデリングパイプラインは、しばしばデータセット固有の前処理と特徴工学を必要とするため、モデル中心の評価は偏りがあることを実証する。
Kaggleコンペティションから10の関連するデータセットを選択し、データセット毎に専門家レベルの前処理パイプラインを実装します。
データセット固有の機能エンジニアリングの後、モデルランキングは大幅に変化し、性能差が減少し、モデル選択の重要性が低下する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:54:39 GMT)
Universal Approximation Theory: The basic theory for deep learning-based computer vision models [9.5] コンピュータビジョン(CV)は人工知能において最も重要な分野の一つである。
近年,畳み込みニューラルネットワーク(CNN)とトランスフォーマーに基づくさまざまなディープラーニングモデルが,CVの多様な問題に対処するために設計されている。
これらのアルゴリズムはロボット工学や顔認識などの分野で実用化されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:08:30 GMT)
Natural Language Can Help Bridge the Sim2Real Gap [9.5] Sim2Realは、現実世界のターゲットドメインでデータ不足を克服するための有望なパラダイムである。
本稿では,画像の自然言語記述を領域間の統一信号として用いることを提案する。
言語記述を予測するために、画像エンコーダをトレーニングすることは、有用な、データ効率の良い事前学習ステップとなることを実証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:29:04 GMT)
On the Robustness of Graph Reduction Against GNN Backdoor [9.4] グラフニューラルネットワーク(GNN)は,グラフ構造化データ学習の有効性から,さまざまな領域で人気を集めている。
バックドア中毒は、現実世界の応用に深刻な脅威をもたらす。
粗大化やスパシフィケーションを含むグラフ削減技術は、大規模グラフ上でのGNNトレーニングを加速する有効な方法として現れている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:08:38 GMT)
Adversarial Magnification to Deceive Deepfake Detection through Super Resolution [9.4] 本稿では, 深度検出における対角攻撃の可能性として, 超解像法の適用について検討する。
画像の視覚的外観におけるこれらの手法による最小限の変化は、ディープフェイク検出システムの性能に大きな影響を及ぼすことを示す。
そこで我々は,超解像を高速かつブラックボックスとして,偽画像のキャモフラージュやプリスタン画像の偽アラーム生成に有効な手法として,新しい攻撃法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:17:36 GMT)
SwiftDiffusion: Efficient Diffusion Model Serving with Add-on Modules [9.4] 我々は,安定な拡散モデルとアドオンモジュールを用いて,高品質な画像を効率よく生成するシステムSwiftDiffusionを提案する。
最先端のテキスト・ツー・イメージ配信システムと比較すると、SwiftDiffusionはレイテンシを最大5倍に削減し、スループットを最大2倍改善する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:59:08 GMT)
Augmenting Efficient Real-time Surgical Instrument Segmentation in Video with Point Tracking and Segment Anything [9.3] 手術器具のセグメンテーションを微調整した軽量SAMモデルとオンラインポイントトラッカーを組み合わせた新しいフレームワークを提案する。
関心領域内のスパースポイントが追跡され、SAMをビデオシーケンス全体を通してプロンプトし、時間的一貫性を提供する。
提案手法は,XMemとトランスフォーマーをベースとした完全教師付きセグメンテーション手法に匹敵する有望な性能を実現する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:45:56 GMT)
Close, But Not There: Boosting Geographic Distance Sensitivity in Visual Place Recognition [9.2] 我々は、現在のVPR埋め込みの地理的距離感度の制限が、トップk検索を誤ってソートする確率が高いことを定式化する。
我々は,視覚的に類似した画像のグラフから斜めをサンプリングすることにより,正および負の例を選択する新たなマイニング戦略であるCliqueMiningを提案する。
提案手法は,VPR埋め込みの感度を極小範囲で向上させ,関連するベンチマークの精度を著しく向上させる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:49:01 GMT)
D-Rax: Domain-specific Radiologic assistant leveraging multi-modal data and eXpert model predictions [8.9] ドメイン固有の対話型無線支援ツールD-Raxを提案する。
我々は胸部X線(CXR)画像の会話解析を強化し,放射線学的報告を支援する。
オープン・エンド・会話とクローズド・会話の双方において,反応の統計的に有意な改善が認められた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:43:10 GMT)
Analytical Solution of a Three-layer Network with a Matrix Exponential Activation Function [8.8] 行列指数活性化関数を持つ3層ネットワークの解を求める。
我々の証明は、深さのパワーと非活性化関数の使用を示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:59:34 GMT)
Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving [8.5] ムーンケーキ(Mooncake)は、ムーンショットAIが提供するLLMサービスであるキミのサービスプラットフォームである。
プリフィルとデコードクラスタを分離するKVCache中心の非集約アーキテクチャを備えている。
Mooncakeの革新的なアーキテクチャにより、Kimiは75%以上のリクエストを処理することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:49:35 GMT)
Synergy: Towards On-Body AI via Tiny AI Accelerator Collaboration on Wearables [8.4] Synergyは、AIアクセラレータを搭載したウェアラブルに対して、システム駆動の全体的コラボレーションを通じて、AIアプリに最高のパフォーマンスを提供する。
評価の結果,Synergyは平均23.0倍のスループット向上を実現し,レイテンシを73.9%,消費電力を15.8%削減した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:21:38 GMT)
An Interpretable Alternative to Neural Representation Learning for Rating Prediction -- Transparent Latent Class Modeling of User Reviews [8.4] 本稿では,レビュー情報に基づいてユーザおよび製品潜伏クラスを編成する透過確率モデルを提案する。
本研究は,テキストベースニューラルネットワークと比較して,解釈可能性と予測性能の両面から評価する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:17:45 GMT)
MARLIN: A Cloud Integrated Robotic Solution to Support Intralogistics in Retail [8.4] 本稿では,サービスロボットのMARLINと,小売業における複雑なAIアプリケーションのためのクラウドシステムであるK4Rプラットフォームとの統合について述べる。
MarLINは、K4Rプラットフォームとデータを継続的に交換し、知覚、自律ナビゲーション、タスク計画におけるロボットの能力を改善する。
我々はこれらの機能を、特に在庫棚の店員を支援することで、小売イントロロジクスのシナリオで活用する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:12:54 GMT)
Text-Aware Diffusion for Policy Learning [8.3] テキスト対応政策学習のための高密度ゼロショット報酬信号を計算するために,TADPoLe(Text-Aware Diffusion for Policy Learning)を提案する。
実験では,TADPoLeが新たな目標達成行動と連続移動行動のポリシーを学習できることを実証した。
行動はゼロショットで学習され、基礎的な報酬や専門家によるデモンストレーションは行われず、人間の評価により質的にも自然である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:08:20 GMT)
Towards Human Understanding of Paraphrase Types in ChatGPT [7.7] アトミック・パラフレーズ・タイプ(APT)は、パラフレーズを異なる言語的変化に分解する。
APTY(Atomic Paraphrase TYpes)は15のアノテーションによる500の文レベルのアノテーションと単語レベルのアノテーションのデータセットである。
以上の結果から,ChatGPTは単純なAPTを生成できるが,複雑な構造に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:35:10 GMT)
GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models [7.6] ポスターはマーケティングと広告において重要な役割を担い、工業デザインに大きく貢献している。
テキストレンダリングの精度が向上したにもかかわらず、エンドツーエンドのポスター生成の分野は未解明のままである。
本稿では,整列学習に根ざした3つのクロスアテンション機構を用いたエンドツーエンドテキストレンダリングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:17:49 GMT)
An End-to-End Speech Summarization Using Large Language Model [7.6] 音声要約(SSum)は、音声コンテンツから人間に似たテキスト要約を生成することを目的としている。
大規模言語モデル(LLM)とマルチモーダル情報融合の研究は、新たな洞察をもたらした。
本稿では、Q-Formerを音声テキストモダリティのコネクタとして利用するエンドツーエンドのSSumモデルを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:22:57 GMT)
Improved Genetic Algorithm Based on Greedy and Simulated Annealing Ideas for Vascular Robot Ordering Strategy [7.5] 本研究では,医療環境におけるABLVR血管ロボットの獲得,利用,維持を最適化するための包括的アプローチを提案する。
ダイナミックな医療環境を考えると、ロボット船やオペレーターのためのロバストな資源配分モデルを含む。
演算子に対する適応学習プロセスのユニークな要件と,ロボット部品のメンテナンスニーズを取り入れた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:20:41 GMT)
Hypernetworks for Personalizing ASR to Atypical Speech [7.5] メタ学習型ハイパーネットワークを用いて,多種多様な非定型音声特性に対して,高度に個別化された発話レベル適応を生成する。
ハイパーネットは,全パラメータ予算の0.1%を用いて,WERの相対的な75.2%削減を維持しつつ,分布外話者よりも一般化されていることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:51:54 GMT)
ECAT: A Entire space Continual and Adaptive Transfer Learning Framework for Cross-Domain Recommendation [7.5] 本稿では,ECAT と呼ばれる拡張空間連続・適応変換学習フレームワークを提案する。
ECATには2つのコアコンポーネントがある: まず、サンプル転送について、粗大なプロセスを実現する2段階の手法を提案する。
第2に,空間データセット全体においてよく訓練されたモデルから表現を継続的に伝達する適応的知識蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:02:39 GMT)
Embodied AI in Mobile Robots: Coverage Path Planning with Large Language Models [6.9] 移動体エージェントのためのLLM方式の経路計画フレームワークを提案する。
提案する多層アーキテクチャは,経路計画段階におけるLPMを用いて,移動エージェントの低レベルアクチュエータと統合する。
本実験により,LLMの2次元平面推論能力と完全カバレッジパス計画タスクを改善することができることが示された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:38:46 GMT)
Unleash the Power of Local Representations for Few-Shot Classification [6.7] 訓練中に目に見えない新しいクラスに一般化することは、数発の分類において重要な課題である。
最近の計量法は局所的な表現によってこの問題に対処しようとする。
本研究では,局所表現の力を解き放ち,新しいクラスを一般化する手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:51:04 GMT)
LOGCAN++: Adaptive Local-global class-aware network for semantic segmentation of remote sensing imagery [6.7] LOGCAN++はリモートセンシング画像用にカスタマイズされたセマンティックセグメンテーションモデルである。
GCA(Global Class Awareness)モジュールとLCA(Local Class Awareness)モジュールで構成されている。
LCAモジュールは、グローバルクラス表現と間接的にピクセルを関連付けるために、中間知覚要素としてローカルクラス表現を生成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:40:43 GMT)
Renard: A Modular Pipeline for Extracting Character Networks from Narrative Texts [6.6] RenardはPythonライブラリで、ユーザーはナラティブテキストから文字ネットワークを抽出するカスタム自然言語処理(NLP)パイプラインを定義できる。
レナードパイプラインはモジュラーであり、ユーザーは文字ネットワークを抽出するのに必要な各NLPサブタスクの実装を選択することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:14:59 GMT)
Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges [6.6] 審査員として機能する様々な大規模言語モデル(LLM)の性能について検討する。
LLMの客観的知識推論のベンチマークとしてTriviaQAを利用する。
Llama-370B と GPT-4 Turbo はどちらも人間に優れた整合性があることが判明した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:57:01 GMT)
Guylingo: The Republic of Guyana Creole Corpora [6.6] クレオール語領域におけるNLP研究の進展を目的とした包括的コーパスについて述べる。
我々はまず,この多言語コーパスの収集とデジタル化のための枠組みについて概説する。
次に、クレオールにおける機械翻訳のためのNLPモデルの訓練と評価の課題を示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:23:32 GMT)
SUPER: Seated Upper Body Pose Estimation using mmWave Radars [6.2] Superは、双対mmWaveレーダーを近接して利用する上半身の人間のポーズ推定のためのフレームワークである。
軽量ニューラルネットワークは、上半身の大域的特徴と局所的特徴の両方を抽出し、Skinned Multi-Person Linear (SMPL)モデルの出力ポーズパラメータを抽出する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:32:34 GMT)
Leveraging Large Language Models for Actionable Course Evaluation Student Feedback to Lecturers [6.2] コンピュータサイエンス科の75科以上で742名の学生が回答した。
各コースについて,授業評価項目と動作可能な項目の要約を合成する。
本研究は, 授業環境における教師に対して, 実感的, 行動的, 適切なフィードバックを生み出すために, 生成的AIを使用する可能性を強調した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:47:45 GMT)
A Closer Look at Classification Evaluation Metrics and a Critical Reflection of Common Evaluation Practice [6.1] 分類システムは数え切れないほど多くの論文で評価されている。
しかし,評価の実践がしばしば誤りであることがわかった。
多くの研究は、いわゆる「マクロ」メトリクスを使ってシステムをランク付けするが、そのようなメトリクスから何を期待するかを明確には示していない。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:53:09 GMT)
Metamorphic Runtime Monitoring of Autonomous Driving Systems [6.0] メタモーフィックリレーショナル(MR)に基づく自律運転システム(ADS)のオンラインモニタリング手法であるMarMotを提案する。
MarMotは実行時のADSの不確実性を推定し、ADSの異常な動作を引き起こす可能性のある異常な状況の特定を可能にする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:44:33 GMT)
HyperLoader: Integrating Hypernetwork-Based LoRA and Adapter Layers into Multi-Task Transformers for Sequence Labelling [6.0] マルチタスク設定におけるパラメータ効率の異なる微調整手法を組み合わせたシンプルな手法であるHyperLoaderを提案する。
本手法は,全タスクの構造を捉えることで,マルチタスク学習の利点を組み合わせる。
我々は、HyperLoaderが多くのデータセットで過去のアプローチより優れているという実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:21:41 GMT)
Structure-based drug design by denoising voxel grids [6.0] タンパク質構造を条件とした新しい3次元分子のスコアベース生成モデルであるVoxBindを提案する。
我々のアプローチは分子を3次元原子密度格子として表現し、学習と生成に3次元ボクセル除去ネットワークを活用する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:28:28 GMT)
A Survey on Popularity Bias in Recommender Systems [6.0] 本稿では、人気バイアスの潜在的な原因について論じ、リコメンダシステムにおける人気バイアスを検出し、緩和し、定量化するための既存のアプローチをレビューする。
本稿では,主に計算実験に基づく研究であり,推奨項目に長期的項目を含めることの実践的効果について,特定の仮定を前提として,今日の文献を批判的に論じる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:39:41 GMT)
TEII: Think, Explain, Interact and Iterate with Large Language Models to Solve Cross-lingual Emotion Detection [5.9] 言語間感情検出により,グローバルな傾向,世論,社会現象を大規模に分析することができる。
我々のシステムは0.16F1スコアの絶対値でベースラインを上回り、競合するシステムの中では2位にランクインした。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:18:51 GMT)
Matching domain experts by training from scratch on domain knowledge [5.9] 近年,大きな言語モデル (LLM) は神経科学実験の結果を予測する上で,人間の専門家より優れています。
ドメイン固有知識の13億トークンに対して,比較的小さな124MパラメータGPT-2モデルを訓練した。
数兆のトークンで訓練された大型LLMよりも桁違いに小さいにもかかわらず、小さなモデルは神経科学の結果を予測する専門家レベルのパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:42:48 GMT)
A Method to Facilitate Membership Inference Attacks in Deep Learning Models [5.7] 我々は,従来の技術よりも厳格に強力な新たな会員推論攻撃を実演する。
私たちの攻撃は、敵がすべてのトレーニングサンプルを確実に識別する権限を与えます。
これらのモデルは、共通の会員プライバシー監査の下で、増幅された会員リークを効果的に偽装できることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:33:42 GMT)
ColorizeDiffusion: Adjustable Sketch Colorization with Reference Image and Text [5.7] 事前学習したCLIP画像エンコーダの異なる画像トークンを利用した画像誘導潜時拡散モデルの2つのバリエーションを紹介する。
重み付きテキスト入力を用いて結果の逐次的調整を行うための,対応する操作手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:35:08 GMT)
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version) [5.5] ロボット制御のための強化学習(RL)は通常、環境状態の詳細な表現を必要とする。
空間オートエンコーダ(SAE)のようなキーポイント検出器は、高次元画像データから低次元表現を抽出する一般的な手法である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:09:19 GMT)
Black Big Boxes: Do Language Models Hide a Theory of Adjective Order? [5.4] 英語や他の言語では、複雑な名詞句の複数の形容詞は、多くの言語理論の標的となった複雑な順序付けパターンを示している。
本稿では,人体における形容詞順選好(AOP)を説明するために設計された既存の仮説を概観し,言語モデルにおけるAOPを学習するための設定を開発する。
理論言語学で特定された因子によって生成される予測よりも,全てのモデルの予測が人間のAOPにずっと近いことが判明した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:29:09 GMT)
Robust ADAS: Enhancing Robustness of Machine Learning-based Advanced Driver Assistance Systems for Adverse Weather [5.4] 本稿では,デノイングディープニューラルネットワークを前処理ステップとして,悪天候画像から晴天画像へ変換する。
ドライバーの視認性が向上し、悪天候下での安全なナビゲーションに欠かせない。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:03:52 GMT)
LaMoD: Latent Motion Diffusion Model For Myocardial Strain Generation [5.4] 本稿では,標準CMRビデオから高精度なDENSE動作を予測するため,新しいラミネートモーション拡散モデル(LaMoD)を提案する。
実験の結果,提案手法であるLaMoDは標準CMR画像の動作解析の精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:54:32 GMT)
Slim-neck by GSConv: A lightweight-design for real-time detector architectures [5.3] 本稿では,新しい軽量畳み込み手法であるGSConvを導入し,モデルの軽量化と精度の向上を図る。
本稿では,GSConv, Slim-Neck (SNs) に基づく設計提案を行い, リアルタイム検出器の計算コスト効率の向上を実現する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:13:56 GMT)
"There Has To Be a Lot That We're Missing": Moderating AI-Generated Content on Reddit [5.2] 我々は、AIGCによるオンラインコミュニティモデレーターの経験に焦点を当てる。
我々の研究によると、コミュニティは、イデオロギーと実践の両方の理由から、AIGCの使用を制限する規則を制定することを選択している。
この急激な技術的変化に直面して,コミュニティの自立と自己決定を支援することの重要性を強調した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:13:08 GMT)
Zero Inflation as a Missing Data Problem: a Proxy-based Approach [5.0] 共通型のゼロ膨らんだデータは、ある真の値を誤ってゼロに置き換える。
本稿では、ゼロインフレーションされたデータを、欠落データ問題の一般的なタイプとみなす。
追加の仮定なしでは、ゼロインフレード変数を含むターゲットパラメータが特定されないことを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:59:47 GMT)
DrugCLIP: Contrastive Drug-Disease Interaction For Drug Repurposing [5.0] DrugCLIPは、ネガティブなラベルなしで薬物と疾患の相互作用を学ぶための対照的な学習方法である。
実地臨床試験記録に基づく薬物再服用データセットをキュレートした。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:41:59 GMT)
Towards More Realistic Extraction Attacks: An Adversarial Perspective [4.9] 言語モデルは、トレーニングデータの大部分を記憶しやすく、抽出攻撃に対して脆弱である。
本稿では,言語モデルの脆さを活かして,敵対的観点からの抽出攻撃を再考する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:33:49 GMT)
Reconstruction of Cardiac Cine MRI Using Motion-Guided Deformable Alignment and Multi-Resolution Fusion [4.8] 心血管MRIの再構成を改善するために,新しいエンド・ツー・エンド深層学習ネットワークを開発した。
提案手法は, よりリッチな細部と, 異なる加速度による心血管MRI再建のためのアーティファクトの少ない高品質な結果を示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:07:25 GMT)
Sparse Variational Contaminated Noise Gaussian Process Regression with Applications in Geomagnetic Perturbations Forecasting [4.7] 大規模なデータセットに正規ノイズが汚染されたスパースガウス過程回帰モデルを適用するためのスケーラブルな推論アルゴリズムを提案する。
提案手法は, 人工ニューラルネットワークベースラインと比較して, 類似のカバレッジと精度の予測間隔が短いことを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:25:19 GMT)
Accelerating Distributed Optimization: A Primal-Dual Perspective on Local Steps [4.5] 分散機械学習では、最適な通信を実現する現在のアルゴリズムは、通常、強い凸目標を必要とする。
ラグランジアンが一般的であるにもかかわらず、通信ラウンドに対して(加速された)GAMS加速を示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:14:54 GMT)
Joint-Dataset Learning and Cross-Consistent Regularization for Text-to-Motion Retrieval [4.5] 本稿では,自然動作記述に最も関係のあるシーケンスを検索することを目的とした,最近導入されたテキストモーション検索に注目した。
これらの有望な道を探究する最近の努力にもかかわらず、大きな課題は、堅牢なテキストモーションモデルをトレーニングするための不十分なデータである。
本稿では,複数のテキスト・モーション・データセットを同時にトレーニングする共同データセット学習について検討する。
また、骨格データのプロセスシーケンスに特定の時間的注意をあてる、MoT++と呼ばれるトランスフォーマーベースのモーションエンコーダも導入する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:43:47 GMT)
A Hardware-Friendly Shuffling Countermeasure Against Side-Channel Attacks for Kyber [4.4] CRYSTALS-Kyber(別名Kyber)は、唯一の鍵カプセル化機構(KEM)方式として標準化されている。
実装上のサイドチャネルアタック(SCA)は、今後の移行に向けて十分に検討する必要がある。
本稿では,新しいコンパクトシャッフルアーキテクチャを取り入れた,キーバーのセキュアで効率的なハードウェア実装を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:29:33 GMT)
Enable the Right to be Forgotten with Federated Client Unlearning in Medical Imaging [4.3] 医用画像における最初のFederated Client Unlearningフレームワークを紹介する。
クライアントのアンラーニングプロセスにおいて、提案されたモデルコントラストのアンラーニングは、機能レベルのアンラーニングに向けた先駆的なステップである。
頭蓋内出血の診断と皮膚病変の診断を含む2つの公開医用画像データセットの枠組みについて検討した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:21:11 GMT)
Reasoning in Large Language Models: A Geometric Perspective [4.3] 我々は,その幾何学的理解を通して,大規模言語モデル(LLM)の推論能力について検討する。
LLMの表現力と自己認識グラフの密度の関連性を確立する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:39:53 GMT)
AI in Action: Accelerating Progress Towards the Sustainable Development Goals [4.1] 私たちは、国連の持続可能な開発目標に対する行動を促進するAIの可能性を示すために、Googleの内部および共同研究、技術的作業、および社会的影響イニシアチブを描いています。
この論文では、コンピュータビジョン、生成AI、自然言語処理、マルチモーダルAIを含むAIの能力を強調し、AIが17のSDGすべてにまたがる問題解決へのアプローチをどのように変えているかを示している。
そして私たちは、大胆で責任あるイノベーションを推進し、インパクトを高め、アクセシビリティのギャップを埋め、すべての人がAIから恩恵を受けられるように、AI開発とデプロイメントに関する洞察を提供します。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 23:25:27 GMT)
Generative Model for Small Molecules with Latent Space RL Fine-Tuning to Protein Targets [4.0] トレーニング中に発生する無効な断片化分子の数を減らすため,SAFEに改良を加えた。
本モデルでは, 潜在空間からのサンプリングにより, 有効度90%, フラグメンテーション率1%の新規分子を生成できる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:01:37 GMT)
Novel Human Machine Interface via Robust Hand Gesture Recognition System using Channel Pruned YOLOv5s Model [4.0] 本稿では,チャネル型YOLOv5sモデルを用いた手動作検出と分類モデルを提案する。
提案手法は,リアルタイムなジェスチャコマンドベースのHCIを実現するために,プルーニングされたYOLOv5sモデルをデプロイする方法を舗装する。
提案システムの平均検出速度は60フレーム/秒 (fps) 以上に達している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:10:20 GMT)
Evaluating the Ability of LLMs to Solve Semantics-Aware Process Mining Tasks [3.9] 大規模言語モデル(LLM)は、プロセスの振る舞いを理解することの恩恵を受けるプロセスマイニングタスクに取り組むために使用できる。
本稿では,LLMがプロセスマイニングタスクに対処する能力について検討する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:44:49 GMT)
Facilitating Feature and Topology Lightweighting: An Ethereum Transaction Graph Compression Method for Malicious Account Detection [3.9] Bitcoinは暗号通貨の主要なグローバルプラットフォームの一つとなり、金融エコシステムの多様化を促進する上で重要な役割を果たしている。
従来の規制手法は通常、機能エンジニアリングや大規模トランザクショングラフマイニングを通じて悪意のあるアカウントを検出する。
本稿では,TGC4Ethというトランザクショングラフ圧縮手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:59:02 GMT)
A Contrastive Learning Based Convolutional Neural Network for ERP Brain-Computer Interfaces [3.8] クロスオブジェクトERP信号検出は、ERP信号成分の複雑さのために困難である。
本稿では,マルチスケールの時間的特徴と空間的特徴を抽出するインセプション・モジュールを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:20:52 GMT)
Nollywood: Let's Go to the Movies! [3.8] ナイジェリア英語をアメリカ英語に翻訳できる音声サブタイトルモデルを作成する。
また、最も高度な毒性検知器を用いて、音声がどれほど有害であるかを検知します。
我々の狙いは、方言理解の欠如からしばしば無視されるこれらのビデオのテキストを強調することである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:50:55 GMT)
Diffusion Models for Tabular Data Imputation and Synthetic Data Generation [3.7] 拡散モデルは、複雑なデータ分布をキャプチャできる強力な生成モデルとして登場した。
本稿では,3つの重要な拡張を導入した表データの拡散モデルを提案する。
コンディショニングアテンション機構は、条件と合成データの関係をキャプチャするモデルの能力を改善するように設計されている。
変換器層は条件(エンコーダ)や合成データ(デコーダ)内の相互作用をモデル化し、動的マスキングにより、欠落したデータ計算と合成データ生成タスクの両方を効率的に処理できる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:27:06 GMT)
The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning [3.6] 我々は,神経科学にインスパイアされた自己教師対象の初期のセットと,表現学習のためのニューラルアーキテクチャを開発した。
その結果、これらの目的によって学習された表現は、データとともにスケールし、対象、データセット、タスクをまたいで一般化し、ラベル付きデータのみを使用してより高速に学習されることが示されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:08:03 GMT)
Benchmarking bias: Expanding clinical AI model card to incorporate bias reporting of social and non-social factors [3.5] 社会的要因は、疾患依存、解剖学、または道具的要因などの他の要因がAIモデルのバイアスに与える影響を考察する。
非社会的要因は、疾患依存、解剖学、または道具的要因などの他の要因がAIモデルのバイアスに与える影響を考察する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:51:46 GMT)
Show Less, Instruct More: Enriching Prompts with Definitions and Guidelines for Zero-Shot NER [3.5] より少ない例でモデルに指示することで、未確認のエンティティタグに対処するために設計されたSLIMERを提案する。
実験では、特に目に見えない名前付きエンティティをラベル付けする場合、定義とガイドラインがより良いパフォーマンス、より速く、より堅牢な学習をもたらすことを示した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:55:24 GMT)
A Depression Detection Method Based on Multi-Modal Feature Fusion Using Cross-Attention [3.5] 世界の人口の約3.8%が落ち込んでいる。
低所得国と中所得国の75%以上が未治療のままである。
本稿では,クロスアテンションを用いたマルチモーダル特徴融合に基づく抑うつ検出手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:13:35 GMT)
Automatic Adaptation Rule Optimization via Large Language Models [3.5] ルールベースの適応は、人間の可読性と迅速な応答を特徴とする自己適応の基本的なアプローチである。
本稿では,大規模言語モデル(LLM)を適応規則の構築と最適化の能力として活用する。
SWIMにおける予備実験により,本手法の有効性と限界が検証された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:06:40 GMT)
Free Energy in a Circumplex Model of Emotion [3.4] 感情科学では、感情はしばしば多次元として表現される。
本研究では,感情を2次元の原子価と覚醒スペクトルにマッピングすることで,感情の円積モデルを採用することを提案する。
情緒的状態において,先行と対象存在の操作が常識的変動をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:52:25 GMT)
On the Expressive Power of Sparse Geometric MPNNs [3.4] 幾何学グラフに対するメッセージパッシングニューラルネットワークの表現力について検討する。
非等価な幾何グラフの一般的なペアは、メッセージパッシングネットワークによって分離可能であることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:48:22 GMT)
The Solution for the ICCV 2023 Perception Test Challenge 2023 -- Task 6 -- Grounded videoQA [3.4] 本研究により,ビデオ質問応答のための固定されたベースライン法は,視覚的グラウンドと物体追跡の2つの主要なステップを含むことが明らかとなった。
最初のステップでは、選択されたフレームが明確に識別可能なターゲットオブジェクトを欠いている可能性がある。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:13:27 GMT)
Nondestructive discrimination of Bell states between distant parties [3.4] 本稿では, 2つの距離に分散した任意のベル状態を, 破壊することなく識別する手法を提案する。
実用量子プロセッサに適用した場合,本手法は古典的限界を超えることができることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:12:37 GMT)
Belief sharing: a blessing or a curse [3.3] コミュニケーションは、自由エネルギーの最小化エージェント間の信念を共有しているとみなすことができる。
本研究では, 後部信念の否定的共有が, エコー室と自己疑念の否定的社会的ダイナミクスを引き起こすことを実証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:46:42 GMT)
AI Age Discrepancy: A Novel Parameter for Frailty Assessment in Kidney Tumor Patients [3.2] 本稿では,術前腹部CT検査の機械学習解析から得られた新しい指標であるAI Age Discrepancyを紹介する。
高いAI年齢差は、確立された要因とは無関係に、長期入院と総合生存率の低下と大きく関連している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:40:04 GMT)
Semi-Markov Processes in Open Quantum Systems. III. Large Deviations of First Passage Time Statistics [3.2] 半マルコフ過程法は、開量子系における変数をカウントする最初の通過時間統計量の大きな偏差を計算するために用いられる。
これらの結果は、駆動された2レベル量子システムを用いて説明し、古典力学および熱力学の不確実性関係の量子違反を探索するために応用する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 04:22:11 GMT)
Let it shine: Autofluorescence of Papanicolaou-stain improves AI-based cytological oral cancer detection [3.2] 早期に検出された口腔癌は治療可能であるが、後期に致命的になることが多い。
コンピュータ支援法は、費用対効果と正確な細胞学的解析に不可欠である。
本研究は,マルチモーダルイメージングとディープフュージョンを用いた,AIによる口腔癌検出の改善を目的とする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:05:35 GMT)
How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs? [3.2] このような手法のメタ評価を行い、その信頼性を幅広いタスクにわたって評価する。
自動評価手法は、特定の条件下で人間の評価を近似することができるが、その妥当性は文脈に依存している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:46:09 GMT)
Deep Configuration Performance Learning: A Systematic Survey and Taxonomy [3.1] 我々は6つの索引付けサービスにまたがる1,206件の検索済み論文を網羅し,ソフトウェアのパフォーマンス学習におけるディープラーニングのトピックを包括的にレビューする。
本研究は, 構成データ作成に関連する技術について, 重要な統計, 分類学, 強度, 弱点, 最適利用シナリオについて概説した。
また、調査した研究から、優れた実践と潜在的に問題となる現象を同定し、その分野における将来の機会に関する実行可能な提案と洞察を包括的にまとめる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:28:00 GMT)
Characteristic Learning for Provable One Step Generation [3.0] 本稿では,GAN(Generative Adversarial Networks)におけるサンプリング効率とフローベースモデルの安定した性能を組み合わせた一段階生成モデルを提案する。
我々のモデルは、確率密度輸送を通常の微分方程式(ODE)で記述できる特性によって駆動される。
2-ワッサーシュタイン距離における特性発生器の非漸近収束速度を確立するために,速度マッチング,オイラー離散化,特性適合の誤差を解析した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:14:41 GMT)
Dynamic Q&A of Clinical Documents with Large Language Models [3.0] 本研究は,臨床ノートにおける動的質問応答のための大規模言語モデル(LLM)を用いた自然言語インタフェースを提案する。
様々な埋め込みモデルと高度なLLMを利用する実験は、高い計算要求にもかかわらず、ウィザード・ヴィクナの優れた精度を示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:14:29 GMT)
The Solution for The PST-KDD-2024 OAG-Challenge [3.0] 我々は KDD-2024 OAG-Challenge 紙のソーストレーストラックに第2位の解を導入する。
提案手法は主にBERTとGCNの2つの手法に基づいており,最終提案におけるBERTとGCNの推論結果を組み合わせたものである。
最終的に,我々の解法は,競技において顕著なスコア0.47691を達成した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:15:05 GMT)
AHMsys: An Automated HVAC Modeling System for BIM Project [3.0] AHMsysは、2D Computer-Aided Design (CAD) 図面から3D加熱・換気・空調(英語版)モデルを生成するプロセスを自動化するように設計されている。
提案したAHMsysは,本質的なHVACオブジェクト情報を自動で前処理し抽出し,詳細な3Dモデルを作成することにより,Akilaにおけるビルディング情報モデリングプロセスの20%の作業スケジュールを大幅に短縮する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:59:19 GMT)
GRASP: A Grid-Based Benchmark for Evaluating Commonsense Spatial Reasoning [2.9] 空間的推論は、純粋に言語ベースのものではなく、計画の最低限の程度を必要とする、中核的な常識スキルの1つである。
既存のCSR(Commonsense Spatial Reasoning)ベンチマークでは、Large Language Models(LLM)がテキストベースの空間記述をどのように解釈するかを評価する傾向にある。
我々は、エージェントがエネルギー収集問題に対処する16,000のグリッドベースの環境からなる、$textbfGRASP$という大規模なベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:27:46 GMT)
RollupTheCrowd: Leveraging ZkRollups for a Scalable and Privacy-Preserving Reputation-based Crowdsourcing Platform [2.9] 現在のブロックチェーンベースのクラウドソーシングの評判ソリューションは、ブロックチェーンのスケーラビリティを損なうことなく、効率性とプライバシの両方を確保するという課題に対処することができない。
本稿では,zkRollupsを活用してユーザのプライバシ保護とシステムのスケーラビリティ向上を実現する,ブロックチェーンを活用した新たなクラウドソーシングフレームワークであるRollupTheCrowdを紹介する。
本フレームワークは,クラウドソーシングのインタラクションを評価することにより,労働者の信頼度を評価する,効果的かつプライバシ保護の評判モデルを含む。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:51:32 GMT)
Topological defects of 2+1D systems from line excitations in 3+1D bulk [2.9] 2+1D 位相相では、バルク内の任意の励起と境界 1+1D 共形場理論における位相点欠陥/一次場の間に直接対応が存在する。
本研究では, 3+1D位相における線励起が境界2+1D理論における線欠陥となる方法について, トポロジカルホログラフィー/シンメトリートポロジカル場理論の枠組みを用いて検討する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:59:48 GMT)
missForestPredict -- Missing data imputation for prediction settings [2.8] missForestPredictは、MissForest命令アルゴリズムの高速でユーザフレンドリな適応である。
missForestPredictでは、命令で使用される変数のエラー監視と制御が拡張されている。
missForestPredictは、短い計算時間内で予測設定で競合する結果を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:45:46 GMT)
Non-asymptotic oracle inequalities for the Lasso in high-dimensional mixture of experts [2.8] ソフトマックスゲーティング関数を持つガウスモデルとガウス専門家のクラスを考察する。
我々の知る限りでは、SGMoEモデルの$l_1$-regularization特性を非漸近的観点から初めて研究する。
我々は、SGMoEモデルに対するラッソ推定器のKulback-Leibler損失の非漸近的理論的制御を保証するために、ラッソペナルティの正規化パラメータの低い境界を与える。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:04:08 GMT)
Neurocache: Efficient Vector Retrieval for Long-range Language Modeling [2.7] Neurocacheは、外部ベクトルキャッシュを使用して、大きな言語モデル(LLM)の効果的なコンテキストサイズを拡張するアプローチである。
ニューロキャッシュは,(1)キャッシュサイズを小さくする圧縮状態の保存,(2)推論速度を増大させるトークン毎の単一検索操作,(3)検索ウィンドウを隣接する状態に拡張することにより,従来の方法を改善する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:59:29 GMT)
UAV-assisted Distributed Learning for Environmental Monitoring in Rural Environments [2.6] 本稿では,無人航空機(UAV)を地域におけるIoT環境モニタリングのカバレッジ拡張中継として活用する,革新的なアプローチを提案する。
提案手法は,エッジデバイス,UAV,サーバ間のスプリットラーニング(SL)戦略を統合し,推論機構の適応性と性能を向上させる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:21:03 GMT)
Sign Language Recognition Based On Facial Expression and Hand Skeleton [2.6] 我々は手と表情の骨格的特徴を統合した手話認識ネットワークを提案する。
表情情報を取り入れることで、手話認識の精度と堅牢性が向上する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:02:51 GMT)
Introducing a Physics-informed Deep Learning Framework for Bridge Scour Prediction [2.5] 本稿では,深層学習を用いたせん断予測のためのスカラー物理インフォームドニューラルネットワーク(SPINN)を提案する。
SPINNは、過去の監視データに基づいて開発され、物理に基づく経験方程式を補助的損失成分としてニューラルネットワークに統合する。
いくつかの橋梁の場合、SPINNは予測エラーを最大50%削減した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:55:11 GMT)
Helpful assistant or fruitful facilitator? Investigating how personas affect language model behavior [2.4] 大きな言語モデル(LLM)から世代をパーソナライズし、ステアリングする方法の1つは、ペルソナを割り当てることである。
本稿では,ペルソナがモデル行動の多様な側面に与える影響について考察する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:36:54 GMT)
Operator Learning of Lipschitz Operators: An Information-Theoretic Perspective [2.4] この研究は、リプシッツ連続作用素の一般クラスに対する神経作用素近似の複雑さに対処する。
我々の主な貢献は、2つの近似設定におけるリプシッツ作用素の計量エントロピーの低い境界を確立することである。
使用したアクティベーション関数にかかわらず、近似精度が$epsilon$に達する神経オペレーターアーキテクチャは、$epsilon-1$で指数関数的に大きいサイズでなければならない。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:13:03 GMT)
Causal inference approach to appraise long-term effects of maintenance policy on functional performance of asphalt pavements [2.4] アスファルト舗装は、繰り返しの交通負荷や連続的な気候周期によるストレスやひずみによる機能的または構造的損傷による交通安全上の深刻な問題を引き起こす。
本研究では,従来の因果構造モデルと潜在的結果モデルフレームワークを組み合わせた新たな因果推論手法を提案する。
その結果, 本手法は, 予防的維持治療の効果を正確に評価し, 異なる予防的維持アプローチの機能を十分に発揮するための維持時間を評価できることが示唆された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:22:42 GMT)
Tensor network influence functionals in the continuous-time limit: connections to quantum embedding, bath discretization, and higher-order time propagation [2.4] 我々は、境界IF-MPS形式におけるアンダーソン不純物モデルのクエンチ力学に対する高次時間プロパゲータを実装した。
静的な浴の離散化を伴う状態ベクトル伝播に対して,IF-MPSの動的特性とそれに伴う高能率浴の動的特性の利点を示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:34:36 GMT)
Systematic Literature Review on Application of Learning-based Approaches in Continuous Integration [2.3] 機械学習(ML)とディープラーニング(DL)は生データを分析して、特定のフェーズにおける貴重な洞察を抽出する。
ソフトウェアプロジェクトにおける継続的プラクティスの台頭は、これらの学習ベースの手法による継続的インテグレーション(CI)の自動化を強調している。
この研究は、CIにおける学習ベースの手法の包括的概要を提供し、CIタスク自動化を開発する研究者や実践者に貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:29:56 GMT)
Lightweight Large Language Model for Medication Enquiry: Med-Pal [2.3] 大規模言語モデル(LLM)は、患者教育によるデジタルヘルス開発を支援する潜在的ソリューションとして浮上している。
Med-Palは、微細で専門的なキュレートされたデータセットで微調整された、薬物ドメイン固有のLLM-チャットボットである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:32:39 GMT)
Example-Based Automatic Migration of Continuous Integration Systems [2.3] 継続的インテグレーション(CI)は、コード変更の統合とテストの高速化に広く採用されているプラクティスです。
開発者はしばしば、マトリックスの構築やロギングの改善といった機能を追求して、CIシステム間で移行する。
この移行は、新しいCIシステムとその構文に関する知識が限られているため、集中的かつエラーを起こしやすい。
本稿では,CIシステムの自動マイグレーションのための新しいアプローチとして,CIMigを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:19:21 GMT)
Error mitigation with stabilized noise in superconducting quantum processors [2.3] 我々は,量子ビット-TLS相互作用のチューニングが雑音不安定を低減し,より信頼性の高い誤り軽減性能を実現することを実験的に実証した。
ここで導入された機能は、非自明なスケールのソリッドステートプロセッサ上での量子アプリケーションの探索に不可欠であると期待する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:47:07 GMT)
Latent Diffusion Model for Generating Ensembles of Climate Simulations [2.3] 我々は、広範囲の気候シミュレーションに基づいて、新しい生成的深層学習アプローチを訓練する。
潜在空間表現を利用することで、我々のモデルは最小限のメモリを必要とする大規模なアンサンブルをオンザフライで迅速に生成できる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:59:24 GMT)
Generative AI for Synthetic Data Across Multiple Medical Modalities: A Systematic Review of Recent Developments and Challenges [2.2] 本稿では,様々な医療データ型を合成するための生成モデルについて,体系的に検討する。
本研究は、幅広い医療データモダリティを包含し、様々な生成モデルについて検討する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:51:09 GMT)
Towards Training Music Taggers on Synthetic Data [2.2] 我々は、よく知られたGTZANデータセットの分類に従う合成データセットであるGTZAN-synthを、データボリュームの10倍の大きさでリリースする。
ドメイン適応,転送学習,タスクの微調整戦略について検討し,最後の2つの選択肢が精度の向上をもたらすという結論を導いた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:54:23 GMT)
Navigating Connected Car Cybersecurity: Location Anomaly Detection with RAN Data [2.1] ハイジャックやスパイ活動を含むサイバー攻撃は、コネクテッドカーに重大な脅威をもたらす。
本稿では,Radio Access Network (RAN) イベント監視による潜在的な攻撃を識別するための新しいアプローチを提案する。
本論文の主な貢献は,複数箇所に同時に出現するデバイスを識別する位置異常検出モジュールである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:42:45 GMT)
The Files are in the Computer: Copyright, Memorization, and Generative-AI Systems [2.1] 生成AIシステムを開発する企業に対する著作権訴訟の中心的な問題は、生成AIモデルがトレーニングしたデータを「記憶」する程度である。
このエッセイでは、暗記に関する会話と、米国著作権法で認識されるコピーとの関係を明確にしようとする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:58:13 GMT)
VRBiom: A New Periocular Dataset for Biometric Applications of HMD [2.1] VRBiomデータセットは、NIRスペクトルで記録された25人の個人から取得された900本の短いビデオで構成されている。
実世界の変動を包含するために、データセットは3つの視線条件(安定、移動、部分的に閉じた目)で記録される。
データセットは、虹彩や/または眼周囲認識のような生体計測用ユースケースのモデルの評価、トレーニング、適応に使用することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:47:50 GMT)
USP: A Unified Sequence Parallelism Approach for Long Context Generative AI [2.0] シーケンス並列性(SP)は、生成AIモデルの長期コンテキスト機能をアンロックする鍵となっている。
本稿では,最先端SPアプローチ,すなわちDeepSpeed-UlyssesとRing-Attentionについて検討し,統一SPアプローチを提案する。
LLAMA3-8BモデルトレーニングにSPを用いた2つの8xA800ノードに対して,シーケンス長208Kを用いた47%のMFUを達成した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:03:26 GMT)
A mathematical framework of intelligence and consciousness based on Riemannian Geometry [2.0] 知性を理解することは神経科学、認知科学、人工知能の中心的な研究である。
幾何解析の最近の進歩は、高次元情報表現と組織に対する新たな洞察を明らかにしている。
この写本は、知性と意識の構造とダイナミクスを記述する数学的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 04:17:56 GMT)
Practical Guide for Causal Pathways and Sub-group Disparity Analysis [1.9] 我々は因果不均質分析を用いて、感度特性と結果の間の因果関係を定量化し、検証する。
当社の2段階の調査は、レースがセンシティブな属性として機能するデータセットに焦点を当てています。
本研究は,ML分類誤差が最も大きい部分群が,最も影響を受けやすい部分群であることが実証された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:51:01 GMT)
Explaining Deep Learning for ECG Analysis: Building Blocks for Auditing and Knowledge Discovery [1.9] 深層ニューラルネットワークは、心電図データを解析するのにますます人気になっている。
これらのモデルのブラックボックスの性質による透明性の欠如は、一般的な懸念である。
この問題に対処するためには、説明可能なAI(XAI)メソッドを用いることができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:58:23 GMT)
Funny Valen-Tine: Solving visual abstract reasoning problems through defining the solution distribution [1.8] 本稿では,確率的ハイライトモデルに基づく新しいベースラインモデルであるValenを紹介する。
Valen は RPM と Bongard-Logo の問題を解決し、汎用的なソリューションを提供している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:04:20 GMT)
ResearchBot: Bridging the Gap between Academic Research and Practical Programming Communities [1.8] このプロジェクトでは、学術と産業のギャップを埋めるためのツールであるResearchBotを導入する。
ResearchBotはモジュール的なアプローチを採用し、質問を理解し、クエリをキュレートして関連論文を取得し、論文内容を要約する。
ResearchBotの中核的な目的は、業界の専門家のための学術的知識へのアクセスを民主化することだ。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:17:13 GMT)
Geometric statistics with subspace structure preservation for SPD matrices [1.7] 本稿では,部分空間構造を保存するSPD値データ処理のためのフレームワークを提案する。
これは半定円錐のトンプソン幾何学を用いて達成される。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:22:36 GMT)
A Generalized Evolutionary Metaheuristic (GEM) Algorithm for Engineering Optimization [1.7] 近年の大きなトレンドは、自然に着想を得たメタヒュースティックアルゴリズム(NIMA)の利用である。
文献には540以上のアルゴリズムがあり、異なるアルゴリズムの探索機構を理解するための統一的なフレームワークはない。
20以上の異なるアルゴリズムを統一する一般化された進化的メタヒューリスティックアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:55:15 GMT)
Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints [1.6] 提案手法は,局所的・グローバルな経路計画タスクにおいて,既存の手法よりも優れていることを示す。
提案手法は,提案手法が局所的・グローバルな経路計画タスクにおいて既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:06:49 GMT)
Are there identifiable structural parts in the sentence embedding whole? [1.6] 変圧器モデルからの文の埋め込みは固定長ベクトルで多くの言語情報を符号化する。
これらの埋め込みは、分離できる情報の重なり合う層で構成されているという仮説を探求する。
本稿では,既知のチャンク構造を持つ文と2つの言語知能データセットからなるデータセットを用いた場合について述べる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:14:48 GMT)
Chemical Shift Encoding based Double Bonds Quantification in Triglycerides using Deep Image Prior [1.6] 本研究では, 化学シフトエンコードされたマルチエコ勾配エコー画像からトリグリセリド二重結合をネットワークトレーニングなしで定量化する深層学習法について検討した。
信号制約に基づいたコスト関数を用いて、ニューラルネットワークを1つのデータセットで反復的に更新する。
その結果,Pearson相関係数は0.96。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:43:39 GMT)
Fine-grained Prompt Tuning: A Parameter and Memory Efficient Transfer Learning Method for High-resolution Medical Image Classification [1.6] きめ細かいPrompt Tuning(FPT)は、訓練済みのモデルを下流のタスクに転送するコスト効率の良い方法である。
FPTは他のPETL法と比較してメモリ消費を大幅に削減する。
FPTは, サイズ, モダリティ, 複雑さの異なる4つの医療データセットで評価した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:28:03 GMT)
A reproducible 3D convolutional neural network with dual attention module (3D-DAM) for Alzheimer's disease classification [1.6] 本稿では,アルツハイマー病分類のための2つの注意モジュールを備えた3次元畳み込みニューラルネットワークを提案する。
このモデルをADNIデータベースでトレーニングし、2つの独立したデータセットで本手法の一般化性を検証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:08:55 GMT)
Deep Learning Based Apparent Diffusion Coefficient Map Generation1 from Multi-parametric MR Images for Patients with Diffuse Gliomas [1.5] 拡散強調(DWI)MRIから得られたADCマップは、組織内の水分子に関する機能的測定を提供する。
本研究では,多パラメータMR画像からADCマップを合成するディープラーニングフレームワークを開発することを目的とする。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:08:40 GMT)
LtU-ILI: An All-in-One Framework for Implicit Inference in Astrophysics and Cosmology [1.5] 本稿では,LtU-ILIパイプライン(Learning the Universe Implicit Likelihood Inference:LtU-ILI)を提案する。
これは天体物理学と宇宙論における最先端の機械学習(ML)推論である。
天体物理学や宇宙論の諸問題にまたがる実応用を提示する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:38:18 GMT)
Reproducibility in Machine Learning-based Research: Overview, Barriers and Drivers [1.5] 様々な分野の研究は、現在結果の認識に関する課題を経験している。
この問題は、機械学習(ML)の研究でも広く用いられている。
MLによる研究のレベルは相変わらず不満足である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:36:32 GMT)
Mining Constraints from Reference Process Models for Detecting Best-Practice Violations in Event Log [1.4] 本稿では,参照モデルコレクションから宣言的ベストプラクティス制約をマイニングするためのフレームワークを提案する。
本稿では,実世界のプロセスモデルコレクションとイベントログに基づく評価により,ベストプラクティス違反を検出するフレームワークの能力を実証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:05:37 GMT)
Unsettled Law: Time to Generate New Approaches? [1.4] 我々は、生成人工知能(GenAI)による倫理的・社会的意味の深い重要かつ未解決ないくつかの法的問題を特定する。
我々の重要な貢献は、学術や実践者がより有用な調査や議論を行えるように、GenAI特有の問題を正式に特定することである。
我々は、GenAIの特徴として、汎用性、大規模なデータセットへの依存、広く普及する社会的利益と害の両方の可能性などを挙げ、既存の法的パラダイムの再評価の必要性を論じる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:51:41 GMT)
Improving Visual Storytelling with Multimodal Large Language Models [1.3] 本稿では,大規模言語モデル(LLM)と大規模視覚言語モデル(LVLM)を活用した新しいアプローチを提案する。
様々な視覚的ストーリーからなる新しいデータセットを導入し、詳細なキャプションとマルチモーダル要素を付加する。
本手法では,教師付き学習と強化学習を組み合わせてモデルを微調整し,物語生成能力を向上する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:13:55 GMT)
Evidential Uncertainty Sets in Deep Classifiers Using Conformal Prediction [1.2] 画像分類器に対して,共形予測セットを生成するためのEvidential Conformal Prediction (ECP)法を提案する。
本手法は,Evidential Deep Learning (EDL) にルーツを持つ非整合スコア関数に基づく。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:38:45 GMT)
Do CAA, CT, and DANE Interlink in Certificate Deployments? A Web PKI Measurement Study [1.2] 証明書の誤用や誤発行は、Web PKIセキュリティモデルを脅かす。
DNS/DNSSEC レコード CAA と TLSA と CT ログを,使用中の証明書の観点から検討した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:20:31 GMT)
Probabilistic 3D Correspondence Prediction from Sparse Unsegmented Images [1.2] スパース画像データから3次元対応を予測する統一モデルであるSPI-CorrNetを提案する。
LGE MRI左房データセットとAbdomen CT-1K肝データセットを用いた実験により,スパース画像駆動SSMの精度とロバスト性の向上が示された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:56:20 GMT)
SiamTST: A Novel Representation Learning Framework for Enhanced Multivariate Time Series Forecasting applied to Telco Networks [1.2] 多変量時系列の表現学習フレームワークSiamTSTを紹介する。
SiamTSTは、注意力、チャンネル非依存のパッチ、正規化技術を備えたSiameseネットワークを統合し、優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:26:16 GMT)
Joint Segmentation and Image Reconstruction with Error Prediction in Photoacoustic Imaging using Deep Learning [1.1] 本稿では,ハイブリッドベイズ畳み込みニューラルネットワーク(Hybrid-BCNN)を提案する。
その結果,精度の高いPAセグメンテーションと画像が得られ,誤差予測は実際の誤差と統計的に非常に相関していることがわかった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:35:58 GMT)
Learning Paradigms and Modelling Methodologies for Digital Twins in Process Industry [1.1] デジタルツイン(Digital Twins、DT)は、センサーデータと高度なデータベースまたは物理ベースのモデル、あるいはその組み合わせを組み合わせた物理製造システムの仮想レプリカで、プロセス監視、予測制御、意思決定支援など、さまざまな産業関連タスクに対処する。
DTのバックボーン、すなわち、これらのモデルをサポートする具体的なモデリング方法論とアーキテクチャフレームワークは、複雑で多様性があり、急速に進化し、最新の最先端の手法と競争の激しい市場のトップに留まる傾向を徹底的に理解する必要がある。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:05:10 GMT)
FreeCG: Free the Design Space of Clebsch-Gordan Transform for machine learning force field [1.1] 置換不変入力にCG変換層を実装することで、対称性に影響を与えることなく、この層の設計が完全に自由になることを示す。
我々は,群CG変換をスパースパス,抽象エッジシャッフル,アテンションエンハンサーで実現し,強力かつ効率的なCG変換層を形成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:40:29 GMT)
Safety-Driven Deep Reinforcement Learning Framework for Cobots: A Sim2Real Approach [1.0] 本研究では,深部強化学習(DRL)におけるロボットシミュレーションに安全性制約を取り入れた新しい手法を提案する。
このフレームワークは、速度制約のような安全要件の特定の部分をDRLモデルに直接統合する。
提案手法は,テストシナリオの平均成功率を16.5%向上させる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:56:17 GMT)
Increasing the Measured Effective Quantum Volume with Zero Noise Extrapolation [1.0] ZNEはベンダーが測定した量子体積よりも有効な量子体積を増大させることができることを示す。
具体的には、4つのIBM量子超伝導プロセッサユニットの有効量子量を測定する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:57:54 GMT)
Weighted Intersection over Union (wIoU) for Evaluating Image Segmentation [1.0] 意味的セグメンテーションのための重み付け分割(wIoU)と呼ばれる新しい評価尺度を提案する。
まず、境界距離マップから生成される重みマップを構築し、境界重み係数に基づいて各画素の重み付け評価を可能にする。
我々は,33シーンのデータセット上でwIoUの有効性を検証し,その柔軟性を実証した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:11:39 GMT)
Towards Robust Cardiac Segmentation using Graph Convolutional Networks [1.0] 本稿では,心解剖学に基づく2つの畳み込み環を用いたグラフアーキテクチャを提案する。
この予測器は,分布外および不適な入力画像をリアルタイムに検出できることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:31:04 GMT)
Hierarchical Decoupling Capacitor Optimization for Power Distribution Network of 2.5D ICs with Co-Analysis of Frequency and Time Domains Based on Deep Reinforcement Learning [1.0] 我々は,チップ上の小型信号ノイズとSSNの両方に対処するために,深部強化学習を用いた新しい2相最適化フローを提案する。
我々の知る限り、これは小さな信号ノイズとSN伝搬の両方に同時に対処する最初の二重領域最適化戦略である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:12:55 GMT)
State Transfer in Noisy Modular Quantum Networks [0.9] モジュラ構造を持つ雑音量子ネットワーク上でのガウス状態の転送を考察する。
ネットワークトポロジとネットワーク構成に影響を及ぼす2つのノイズモデルを比較する。
我々の結果は、一般にモジュラーネットワークはモノリシックネットワークよりもノイズに対して堅牢であることを示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:39:49 GMT)
Footprints of Data in a Classifier Model: The Privacy Issues and Their Mitigation through Data Obfuscation [0.9] トレーニングデータのフットプリントを 予測モデルに埋め込むことは
テストデータとトレーニングデータのパフォーマンス品質の違いは、モデルをトレーニングしたデータの受動的識別を引き起こす。
この研究は、データフットプリントから生じる脆弱性に対処することに焦点を当てている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:56:37 GMT)
Optimized Receiver Design for Entanglement-Assisted Communication using BPSK [0.8] 絡み合い支援通信のための2x2光ハイブリッド受信機を提案する。
従来提案していた10モード以上の光パラメトリック増幅器ベース受信機と比較して,誤差確率が約10%低いことを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:28:46 GMT)
Analytics of Longitudinal System Monitoring Data for Performance Prediction [0.7] スケジューラキューで待機しているジョブのパフォーマンスを予測できるデータ駆動モデルを作成します。
我々はこれらの予測モデルを詳細に分析し、主要な性能予測因子である特徴を特定する。
このようなモデルがアプリケーションに依存しないことを実証し、トレーニングに含まれていないアプリケーションのパフォーマンスを予測するために使用できることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:02:59 GMT)
The Epistemic Uncertainty Hole: an issue of Bayesian Neural Networks [0.7] モデルのサイズとトレーニングセットのサイズに関する「最新の不確実性指標」の進化は、理論的な期待に反することを示します。
と呼ぶこの現象は、BDLの適用可能性全体を損なうというよりは、より問題となる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:54:46 GMT)
Global calibration of large-scale photonic integrated circuits [0.7] 大規模フォトニック集積回路を大域的に校正するための機械学習手法を提案する。
本手法は、PIC上の全熱光学位相シフト器の非線形位相電流関係を同時に学習するために、カスタムネットワークを利用する。
結果は、フォトニック量子情報処理における大規模PICの応用に大きな恩恵をもたらすだろう。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:14:02 GMT)
Hybrid Rotational Cavity Optomechanics Using Atomic Superfluid in a Ring [0.6] ローゲール・ガウスモードによって駆動される光学キャビティ内に、環状に閉じ込められたボース・アインシュタイン凝縮体(BEC)を含むハイブリッド光学系を導入する。
捕捉されたBECの回転は、ミラーの共鳴周波数における量子ゆらぎを減少させる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:06:06 GMT)
Efficient Stochastic Differential Equation for DEM Super Resolution with Void Filling [0.6] DEM(Digital Elevation Model)はリモートセンシングやフォトグラム計測において基本的な役割を担う。
既存のアプローチは、DEMヴォイドを埋めるか、あるいは無傷のDEMに超解像を適用することだけを目的としている。
本稿では,ヴォイド問題と低分解能問題とを同時に扱う統合生成モデルを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:13:34 GMT)
Subsystem CSS codes, a tighter stabilizer-to-CSS mapping, and Goursat's Lemma [0.5] 本研究では,2つの基本となる古典符号のデータのみを用いて,Steane型デコーダを開発する。
サブシステム安定化器のコードは、物理的、論理的、ゲージ的キューディットの2倍、コード距離の2倍のサブシステムCSSコードを生成するために「倍」できることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:39:48 GMT)
Research on Reliable and Safe Occupancy Grid Prediction in Underground Parking Lots [0.5] この研究は、特に地下駐車場のような見過ごされがちな場所で、屋内自動運転に取り組む。
CARLAのシミュレーションプラットフォームを使用して、データ収集のための現実的な駐車モデルを作成する。
占有グリッドネットワークは、このデータを処理して車両の経路や障害物を予測し、複雑な屋内環境におけるシステムの知覚を高める。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:56:14 GMT)
Large Skew-t Copula Models and Asymmetric Dependence in Intraday Equity Returns [0.5] スクリュー・トゥ・コプラモデル(英語版)は、非対称かつ極端なテール依存を可能にするため、財務データのモデリングに魅力的なものである。
Azzalini と Capitanio (2003) の skew-t 分布に暗黙的に表されるコプラは、2つの一般的な代替スキュー-t コプラよりも高レベルな対非対称依存を可能にすることを示す。
本稿では,高速かつ高精度なベイズ変分推論(VI)手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:27:27 GMT)
Programming higher-order interactions of Rydberg atoms [0.4] Rydberg-atom graph gadgets is introduced to effective program $K$-th order interaction within a Rydberg atom system。
よいスケーリングの振る舞いである$O(NK)$は、$N$-頂点ハイパーグラフ最適化問題に必要な原子の数の観点から期待されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:49:22 GMT)
A Max-Flow approach to Random Tensor Networks [0.4] 確率論のツールを用いたランダムテンソルネットワーク(RTN)の絡み合いエントロピーについて検討する。
ランダムテンソルネットワーク(英: random tensor network)は、グラフ(またはネットワーク)構造によって決定される特定の幾何を持つテンソルに対する特定の確率モデルであると考えることができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:00:01 GMT)
Automatic Counting and Classification of Mosquito Eggs in Field Traps [0.4] 蚊が卵を挿入するフィールドトラップの解析は、不妊虫技術(SIT)が適切に機能していることを確認するのに不可欠である。
これは、ハッチした卵の数は、不妊オスが野生の卵と競合していないことを示唆している可能性があるためである。
トラップの研究は顕微鏡で手作業で行われ、非常に時間がかかり、ヒューマンエラーを起こしやすい。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:12:20 GMT)
QOG:Question and Options Generation based on Language Model [0.4] 質問-オプション生成(QOG)は、与えられたコンテキストの一連の質問-オプションペアを生成するタスクである。
微調整シーケンス・ツー・シーケンス言語モデル(LM)に基づく3つの異なる手法を用いてQOGモデルを開発する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:21:03 GMT)
Robust Hilbert space fragmentation in group-valued loop models [0.3] 我々は、量子力学における堅牢なエルゴディディディティの破れを示す大規模なモデルを紹介する。
我々の研究は「位相的に頑健な空間の断片化」に関する最近の議論に触発されている。
我々はゲージ理論へのクリップ接続を作り、この構成は北エフの量子二重群を無限群に一般化する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:04:09 GMT)
A Comprehensive Study on A Tapered Paul Trap: From Design to Potential Applications [0.3] 本稿では, 先端電極の対称軸に高周波電極が傾斜しているテーパポールトラップについて述べる。
この構成により、このトラップに閉じ込められた荷電粒子は、その半径方向の自由度と軸方向の自由度が結合される。
同じ設計で単一原子熱エンジンを実験的に実現し、ゼプトニュートン力の増幅が実現された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:03:48 GMT)
Ensemble of pre-trained language models and data augmentation for hate speech detection from Arabic tweets [0.3] 本研究では,従来手作業でラベル付けされていたアンサンブル学習と半教師付き学習を活用する新しい手法を提案する。
我々は、アラビア語のツイートを、非憎悪、一般憎悪、人種、宗教、セクシズムの5つのクラスに分類して、ベンチマークデータセットで実験を行った。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:26:26 GMT)
Quantifying total correlations in quantum systems through the Pearson correlation coefficient [0.2] 量子状態は古典的あるいは量子的な方法で相関しうること、すなわち2つのケースは互いに排他的であることを示す。
また、少なくとも2量子ビット系の場合、局所的に非互換な観測可能なペア間の相関の分布は、システムが古典的あるいは量子的相関を含むかどうかについての洞察を与える。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:33:22 GMT)
Enabling Large Batch Size Training for DNN Models Beyond the Memory Limit While Maintaining Performance [0.2] 最近のディープラーニングモデルは、大規模なバッチサイズを使用してトレーニングするのは難しい。
マシンはモデルと大きなデータバッチサイズの両方に対応するのに十分なメモリを持っていないかもしれない。
本稿では,マイクロバッチ処理(MBP)と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:33:39 GMT)
Entanglement engineering of optomechanical systems by reinforcement learning [0.2] エンタングルメント工学におけるモデルフリーな深層強化学習手法を開発した。
我々は、線形または非線形光子-フォノン相互作用を持つ量子光学系を用いて、プロトコルの動作を実証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:47:06 GMT)
Virtually Objective Quantification of in vitro Wound Healing Scratch Assays with the Segment Anything Model [0.2] 細胞生物学において、インビトロ・スクラッチ・アッセイ(in vitro scratch assay)は、傷の閉鎖率を評価するために広く用いられている。
本稿では,対話型ポイントプロンプトに基づくディープ・ファンデーション・モデルであるセグメント・アプライス・モデルを利用する。
結果は、ドメインエキスパートの手作業によるセグメンテーションと比較しても、サーバ内およびサーバ間の変動が非常に少なかった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:45:56 GMT)
Structure-inspired Ansatz and Warm Start of Variational Quantum Algorithms for Quadratic Unconstrained Binary Optimization Problems [0.2] 本稿では、変分量子固有解器を用いて2次非制約二元最適化問題に対処する構造に着想を得たアンザッツを提案する。
本稿では,想像的時間進化に基づく新しいウォームスタート手法を提案する。
このウォームスタート法は成功率を著しく向上させ,変分量子固有解法の収束に必要なイテレーション数を削減できることを実証する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:00:05 GMT)
Remote sensing framework for geological mapping via stacked autoencoders and clustering [0.2] 本研究では、リモートセンシングデータを処理するための教師なし機械学習ベースのフレームワークを提案する。
オーストラリアのムタウィンチ地域の地質マッピングの枠組みを評価するために,ランドサット8,ASTER,Sentinel-2のデータセットを用いた。
本フレームワークは,岩盤単位を効率的に識別し,正確かつ解釈可能な地質図を生成する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:52:15 GMT)
To Do or Not to Do: Semantics and Patterns for Do Activities in UML PSSM State Machines [0.1] DoActivity振舞いは、ある状態に入力された状態マシンとは独立して実行される振舞いを記述する。
仕様や教科書は、doActivityの振る舞い構造をどのように適切に使用するべきかについて曖昧である。
そこで本研究では,仕様書のテキスト,意味モデル,実行可能なテストケース,PSSMをサポートするシミュレータの相互チェックから,セマンティックスを解析した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:21:04 GMT)
Quantum harmonic oscillator in a time dependent noncommutative background [0.1] 本研究は,非可換高調波発振器の動作を時間依存性の背景から検討する。
本稿では,標準ボップシフト関係の一般化形式を利用して,可換変数の項で表現するシステムについて検討する。
我々の研究は[1]の発見と一致しており、特に座標写像関係が標準のボップシフト関係に還元される特定の極限においてである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:25:15 GMT)
Fake News Detection: It's All in the Data! [0.1] 調査では、データセットの重要な特徴、採用されているさまざまなラベルシステム、モデルのパフォーマンスに影響を及ぼす偏見を慎重に概説している。
GitHubリポジトリは、公開可能なデータセットを単一のユーザフレンドリなポータルに統合する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:12:06 GMT)
Open foundation models for Azerbaijani language [0.0] 多言語大言語モデルはアゼルバイジャンにおける言語理解と生成システムの開発を可能にした。
プロダクショングレードのシステムのほとんどは、GPT-4のようなクラウドソリューションに依存している。
本稿では,アゼルバイジャンのオープンソース基盤モデルを推進しているいくつかの取り組みについて述べる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:05:47 GMT)
Using eye tracking to investigate what native Chinese speakers notice about linguistic landscape images [0.0] 本稿では、視線追跡技術を用いて、言語景観の実際の固定について研究する。
定着時間と定着時間の2次元において,在来中国語話者の言語景観への定着は,一般的な景観のそれよりも大きい。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:32:47 GMT)
User-friendly confidence regions for quantum state tomography [0.0] 有限統計学では、実験データは量子状態に関する完全な情報を与えることができない。
この限られた知識を表現する一般的な方法は、状態空間に信頼領域を提供することである。
ここでは、これらの問題を解決する信頼領域を構築し、不平等に最適なサンプルコストと現実的なパラメータに対する優れた性能を有する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:38:10 GMT)
Two-mode squeezing and SU(1,1) interferometry with trapped ions [0.0] 単一イオンの2つの運動モードに対して, 1モードと2モードの回路を実験的に実装した。
これは、トラップ電極に印加される振動電位を用いて、所要の変位、スクイーズ、2モードスクイーズ、ビームスプリッタ演算を実装することで達成される。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:51:02 GMT)
Towards Unsupervised Question Answering System with Multi-level Summarization for Legal Text [0.0] 本稿では,SCaLARチームによるSemEval-2024 Task 5: Legal Argument Reasoning in Civil procedureについて要約する。
ラベルを生成するための,単純ながら斬新な類似性と距離に基づく教師なしアプローチを提案する。
調査では, マクロF1スコアが20ポイント上昇し, テストセットが10ポイント上昇した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:35:53 GMT)
Topological Discrimination of Steep to Supersteep Gap to Emergence of Tunneling in Adiabatic Quantum Processes [0.0] 量子アニール過程の速度を制限するギャップは、3つの正則なモルフォロジーを必要とすることが示されている。
境界線に比例した下肢尾の位置は、超音速と急激な差別を許容する。
ツバメ尾境界相互作用の欠如は、軽度のギャップを特徴づける。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:15:32 GMT)
Theory of Complex Particle without Extra Dimensions [0.0] ミンコフスキー時空における複素粒子の臨界次元は、$D = 4$であり、$D = 2, 4$ または 6$ はユークリッド時空において許される。
次元に対する制限の起源は、正準理論の量子化における第三次制約の存在である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:25:13 GMT)
Talking to Machines: do you read me? [0.0] 本稿では,この技術の現状を概観し,会話エージェントのオープンな研究課題を概観する。
課題指向対話(TOD:Task-Oriented Dialogues)への私の貢献は、CIFREにおける研究アソシエイトおよび産業監督の両立である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:19:46 GMT)
Tackling CS education in K-12: Implementing a Google CS4HS Grant Program in a Rural Underserved Area [0.0] 本稿では、農村部におけるGoogle CS4HS助成金の実施について論じる。
実装の主要な要素は、対面のハンズオンワークショップ、続いて7週間の大学院レベルのオンラインサマーコースである。
教員は、カリキュラムを実践する一年間、オンラインの実践コミュニティで支援された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:36:06 GMT)
Suppression of noise in separation estimation of optical sources with spatial-mode demultiplexing [0.0] 空間モード分解による超解像は急速に劣化する。
これは、直接撮像で知られているレイリーの呪い(レイリーの呪い)という用語で見ることができる。
本稿では,騒音の破壊的影響を抑制する手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:08:26 GMT)
Statistical Advantages of Oblique Randomized Decision Trees and Forests [0.0] リッジ関数のフレキシブル次元縮小モデルクラスに対して一般化誤差と収束率を求める。
軸方向のモンドリアン木のリスクに対する低い境界は、これらの線形次元減少モデルに対してこれらの推定値が最適であることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:35:22 GMT)
Stabilizing quantum simulations of lattice gauge theories by dissipation [0.0] 雑音量子ハードウェアに関する格子ゲージ理論は、コヒーレントかつ不整合誤差によるゲージ対称性の違反に悩まされる。
本研究では,局所的なゲージ違反の検出に依存したアクティブな補正手法について検討し,その後,物理ゲージセクターに散逸的にシステムを戻して修正する。
補正方式はゲージ対称性の保護を確実にするだけでなく、ゲージ不変セクター内においてもシミュレーション結果の有効性も向上することを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:22:58 GMT)
Soft Language Prompts for Language Transfer [0.0] 自然言語処理(NLP)における言語間知識伝達の課題
本研究では,パラメータ効率のよい微調整法を組み合わせることで,言語間NLPアプリケーションを改善するための知見を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:50:03 GMT)
SeqMate: A Novel Large Language Model Pipeline for Automating RNA Sequencing [0.0] SeqMateは、大規模言語モデル(LLM)のパワーを活用してワンクリック分析を可能にするツールで、データ準備と分析の両方を自動化する。
生成AIの力を利用することで、SeqMateはこれらの発見を分析し、制御/制御/ユーザプロンプトされた遺伝子について書かれたレポートを作成することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:28:30 GMT)
Sentient observers and the ontology of spacetime [0.0] ガリレオと特殊相対性理論とゲージ対称性に繋がったのと同じ基準で、宇宙や時空の構造を与える観測可能な一意の集合を特定する方法がないことを示す。
これは、時空と観測者の感性の間に強いつながりがあることを示しており、いくつかの初期の相対性理論や一般相対性理論への貢献者が予想していた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:48:28 GMT)
SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks [0.0] 本研究では,一意に効率的な残差ネットワークであるEfficient-ResNetを用いたエンコーダデコーダアーキテクチャを提案する。
アテンションブーティングゲート(AbG)とアテンションブーイングモジュール(AbM)は、グローバルコンテキストの出力の等価サイズで同変および特徴に基づく意味情報を融合することを目的として展開される。
我々のネットワークは、挑戦的なCamVidとCityscapesのデータセットでテストされており、提案手法により、残余ネットワークに対する大幅な改善が示されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:48:30 GMT)
SAVE: Segment Audio-Visual Easy way using Segment Anything Model [0.0] そこで本研究では,AVSタスクに対して,事前学習セグメントモデル(SAM)を効率的に適用するための軽量なアプローチSAVEを提案する。
提案手法は,符号化段階における効果的な音声と視覚の融合と相互作用を実現する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:22:28 GMT)
Revolutionising Role-Playing Games with ChatGPT [0.0] 本研究の目的は,AIによるシミュレーションが学生の学習経験に与える影響を分析することである。
ヴィゴツキーの社会文化的理論に基づいて、ChatGPTは学生に戦略的意思決定プロセスのより深い理解を与えるために用いられた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:21:40 GMT)
Reinforcement Learning from Human Feedback: Whose Culture, Whose Values, Whose Perspectives? [0.0] 大規模言語モデル(LLM)の文脈におけるRL(Reinforcement from Human Feedback)における多元主義の倫理的優位性について論じる。
社会と多元主義の哲学に基づいて、RHLFをより人間のニーズに反応させる方法と、その過程での課題にどう対処できるかを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:07:27 GMT)
Realization of a magic-wavelength nanofiber-based two-color dipole trap with sub-$λ/2$ spacing [0.0] セシウムD2ラインの共振波長の半分以下の間隔で周期的に1次元のトラップ部位の配列を生成する。
配列中の原子のトラップを実演し、その結果のトラップ構成を特徴付ける。
マジックトラップ波長とラムダ/2$スペーシングを併用したナノファイバーベースの光インタフェースの実装は、新しい放射効果の探索に向けた重要なステップである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:06:51 GMT)
Rapidly-rotating quantum droplets confined in a harmonic potential [0.0] 2次元の「対称」量子滴は調和ポテンシャルで回転する。
渦格子を用いた状態記述には、純粋に数値的なアプローチとウィグナー・セイッツ近似を用いる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:40:49 GMT)
RETINA: a hardware-in-the-loop optical facility with reduced optical aberrations [0.0] 視覚に基づくナビゲーションアルゴリズムは、低コストで汎用的なセンサーで軌道上の宇宙船の状態を決定する効果的な解決策として自らを確立している。
実験室で軌道環境をエミュレートするために、専用のシミュレーションフレームワークを開発する必要がある。
本稿では,RETINAと呼ばれる低収差光学設備の設計について述べる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:26:37 GMT)
Quantum states as countable convex combination of pure states with bounded energy [0.0] 無限次元状態において、E で有界なエネルギーを持つ状態が与えられたとき、E で有界なエネルギーを持つ純状態の可算凸結合として状態を記述することができる。
我々は、ギブの仮説を満たすハミルトニアンに対してはそのような状態は存在しないと結論づける。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:53:53 GMT)
Quadrature Coherence Scale of Linear Combinations of Gaussian Functions in Phase Space [0.0] ガウス関数の線形結合として表現可能なウィグナー関数を特徴とする量子状態の二次コヒーレンススケールの計算法を提案する。
二次コヒーレンススケールは,損失の存在下での非古典性のスケーラビリティを検証するための貴重なツールであることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:48:15 GMT)
Pushing the Boundary: Specialising Deep Configuration Performance Learning [0.0] この論文は、構成性能モデリングにおけるディープラーニング技術に関する体系的な文献レビューから始まる。
第一の知識のギャップは、どの符号化方式が優れているかについての理解の欠如である。
第二の知識ギャップは、構成のランドスケープから受け継がれた空間である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:59:19 GMT)
Prompt Stability Scoring for Text Annotation with Large Language Models [0.0] 研究者たちは、テキストアノテーションに言語モデル(LM)をますます利用している。
これらのアプローチは、一連の命令に従って与えられた出力を返すようモデルに指示するプロンプトにのみ依存する。
これは分類ルーチンの複製可能性に疑問を投げかける。
この問題に対処するため、研究者は通常、我々が「急速安定」と呼ぶものを決定するために、意味論的に類似した様々なプロンプトをテストしてきた。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:11:18 GMT)
Proceedings of the 2nd International Workshop on Adaptive Cyber Defense [0.0] 第2回アダプティブ・サイバー・ディフェンスに関する国際ワークショップがフロリダ州のフロリダ工科大学で開催された。
このワークショップは、人工知能(AI)と機械学習(ML)のユニークな応用を探求する研究を共有するために組織された。
サイバードメインは現在、人間の専門家に大きく依存することなく、確実かつ効果的に防御することはできない。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:45:39 GMT)
Princeton seminars on physics and philosophy [0.0] これらは、私が2024年11月にプリンストン哲学部で招待される一連のセミナーのために準備された講義ノートです。
それらは、量子重力の概念構造、量子力学の解釈、時間の構造、その方向と未来の開放性、そして観念論と反境界主義に関する概念が進化するという事実に関する一般的な考察をカバーしている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:03:33 GMT)
Predictive Simultaneous Interpretation: Harnessing Large Language Models for Democratizing Real-Time Multilingual Communication [0.0] 本稿では,話者発話を予測し,木のような構造で複数の可能性を拡張することによって,リアルタイム翻訳を生成する新しいアルゴリズムを提案する。
我々の理論的分析は、実証的な例によって支持されており、このアプローチが最小のレイテンシでより自然で流動的な翻訳につながることを示唆している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:18:28 GMT)
Predicting correlations in superradiant emission from a cascaded quantum system [0.0] 新しい種類のカスケード量子系がナノファイバー結合型冷原子アンサンブルを用いて実現されている。
スピンの切り抜きウィグナー近似に基づく新しいシミュレーション手法を開発した。
シミュレーションツールでは、2階の量子コヒーレンス関数$g(2)$と2レベルエミッターの強い励起カスケード系によって放出される他の光場の相関関数を予測することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:51:40 GMT)
Parametric Light-Matter Interaction in the Single-Photon Strong Coupling Limit [0.0] 超伝導トランスモン量子ビットを用いたパラメトリック結合マイクロ波回路の新しいパラダイムを実証する。
強いサイドバンド駆動を適用すると、オンデマンドで非線形のJaynes-Cummingsが線形共振器と相互作用する。
このデモンストレーションは、新しい光子圧量子情報処理ハードウェアを開発するための道を開く。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:45:34 GMT)
PT symmetric fermionic particle oscillations in even dimensional representations [0.0] 相対論的および非相対論的系の量子力学的粒子振動の新しいクラスについて述べる。
ハミルトン群は、PT内積に関して自己共役であるように、最初から選択される。
結果として生じる量子力学的進化はユニタリであり、確率は振動によって保存される。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 08:09:35 GMT)
PO-MSCKF: An Efficient Visual-Inertial Odometry by Reconstructing the Multi-State Constrained Kalman Filter with the Pose-only Theory [0.0] 視覚慣性オドメトリー(VIO)は、ペイロード制約ロボットにとって不可欠である。
そこで本研究では,MSCKF VIOを多視点構造記述(Pose-Only (PO) multi-view geometry description)を用いて再構成する。
新しいフィルタは特徴位置情報を一切必要とせず、計算コストと線形化誤差を除去する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:18:35 GMT)
Output Range Analysis for Deep Neural Networks based on Simulated Annealing Processes [0.0] 本稿では,Deep Neural Networks (DNN) のレンジ推定手法を提案する。
提案手法はDNNにおける局所的幾何学的情報の欠如と非線形性に対処し,多目的性を実現する。
制約的な仮定を避けるための単純でフレンドリーなアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 22:47:40 GMT)
Origin of the Arrow of Time in Quantum Mechanics [0.0] 時間の矢印は自然に量子力学的進化によって引き起こされる。
極限$cal N rightarrow infty$ では、矢印は「歯」によって固定される。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:23:24 GMT)
Open quantum dynamics with variational non-Gaussian states and the truncated Wigner approximation [0.0] 本稿では、変分非ガウス状態と量子軌道のアプローチを組み合わせ、スピンボソン系の開力学をシミュレートする枠組みを提案する。
オープン量子系に対する最近開発された truncated Wigner 近似が、同じハミルトニアンに対してどのように適用できるかを論じる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:10:03 GMT)
On the Counting of Involutory MDS Matrices [0.0] 本稿では、アダマール MDS およびインボリュートリー アダマール MDS 行列を、フィールド$mathbbF_2r$ で 4$ で列挙する。
上界は、次数 4$ over $mathbbF_2r$ のすべての不揮発性MDS行列の数に対して導かれる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:26:39 GMT)
On the Anatomy of Attention [0.0] 本稿では、機械学習モデルについて体系的に関連付け、推論するために、カテゴリ理論図式形式を導入する。
我々の図は直感的にアーキテクチャを提示するが、重要な詳細を欠くことなく、モデル間の自然な関係はグラフィカルな変換によって捉えられる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:50:26 GMT)
Nonclassical resource for continuous variable telecloning with non-Gaussian advantage [0.0] テレクロニングプロトコルは、単一の送信者から共有絡み状態を介して複数の受信者に量子状態を分配する。
ガウス的資源と非ガウス的資源の両方を用いて得られた最適なテレクロニング特性について検討した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:59:50 GMT)
Min-Max-Jump distance and its applications [0.0] 我々は,Min-Max-Jump 距離(MMJ 距離)の3つの応用を探索する。
MMJベースのK平均は、K平均をMMJ距離で修正する。
MMJに基づくシルエット係数は、Silhouette係数をMMJ距離で補正する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 03:24:09 GMT)
Long-range interacting systems are locally non-interacting [0.0] 長距離相互作用システムは情報伝達のための非線形光円錐のような新しい物理学を示す。
我々は、量子状態の減少によって得られた熱力学的極限局所的性質が、創発的非相互作用理論によって記述されていることを証明した。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:34:58 GMT)
Local Description of Decoherence of Quantum Superpositions by Black Holes and Other Bodies [0.0] 我々は、アリスの研究室内の量子場の局所的な2点関数の観点から、デコヒーレンスを記述することができることを示す。
局所的な視点から、ウンルー真空中のシュワルツシルト時空におけるデコヒーレンスを明示的に計算する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:00:03 GMT)
Integrating quantum and classical computing for multi-energy system optimization using Benders decomposition [0.0] 量子コンピュータと古典コンピュータの最適化を組み合わせたハイブリッドBenders分解手法を提案する。
本研究では,コスト最適多エネルギーシステムの設計を事例スタディで実施する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:12:15 GMT)
Information Design for Differential Privacy [0.0] 企業や統計機関は、データを収集、分析、公開する個人のプライバシーを守らなければならない。
エンドユーザーに対する出力値の最大化を目的として,そのようなメカニズムを選択することの問題点を考察する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:24:24 GMT)
Indian Stock Market Prediction using Augmented Financial Intelligence ML [0.0] 本稿では,Superforecasters予測を付加した機械学習アルゴリズムを用いた価格予測モデルを提案する。
これらのモデルは平均絶対誤差を用いて予測精度を決定する。
主な目標は、予測不可能な変化や株価の変化を予想するスーパープレキャストの特定と予測の追跡である。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 12:58:50 GMT)
Improving Explainability of Softmax Classifiers Using a Prototype-Based Joint Embedding Method [0.0] 本稿では,ソフトマックス分類器の説明可能性向上のための試作手法を提案する。
モデルアーキテクチャの変更とトレーニングにより、予測に寄与する原型例のサンプル化が可能となる。
我々は、ソフトマックスの信頼性よりも分布データから検出できる不確実性の指標を得る。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:59:09 GMT)
Imposing Constraints on Driver Hamiltonians and Mixing Operators: From Theory to Practical Implementation [0.0] 制約部分集合を満たすハミルトン項を見つけるための一般表現を与え、これらを用いて関連する問題の複雑さを特徴づける。
次に、これらのプリミティブをハミルトンドライバとユニタリミキサーに変換して、制約付き量子アニール演算子Ansatz (CQA) と量子交換演算子Ansatz (QAOA) に使用できるアルゴリズム的な手順を与える。
実験により,12~22のインスタンスに対してこれらのアプローチを実証的にベンチマークし,最適相対性能を示すとともに,指数曲線が2次速度アップと一致することを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:23:02 GMT)
Imaginary gap-closed points and dynamics in a class of dissipative systems [0.0] 本稿では,消散系における虚空ギャップ閉点とその関連力学について検討する。
IGC点がバルク損失確率のパワー-ロー崩壊を誘導し、「エッジバースト」と呼ばれる境界現象を引き起こすことを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:28:19 GMT)
Identification of a natural fieldlike entanglement resource in trapped-ion chains [0.0] イオン鎖の電磁トラップは、非自明な絡み合った量子状態形成の過程と見なすことができる。
局所モードの解離部分集合間の絡み合いの減衰は、絡み合い構造の特徴を示す。
自然界からの「拡大した絡み合った状態のイメージング」を通じて、量子場シミュレーションを初期化するためのフレームワークが確立されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:42:34 GMT)
Human Oversight of Artificial Intelligence and Technical Standardisation [0.0] AIのグローバルガバナンスの中で、人間の監視の要件は、いくつかの規制形式に具体化されている。
そのため、欧州連合(EU)の立法府は、人間の監督に対する法的要件を「取り除く」ために、過去よりもはるかに進んでいる。
AI意思決定プロセスにおける人間の位置に関する疑問は、特に注目されるべきである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 07:43:46 GMT)
Hamiltonian Engineering of collective XYZ spin models in an optical cavity [0.0] 合成量子システムを用いた量子シミュレーションは、多体物理学におけるオープンな疑問を探求するユニークな機会を提供する。
ここでは、任意の二次ハミルトニアンあるいは事実上無限の範囲チューナブルなハイゼンベルクXYZモデルとのオール・ツー・オールな相互作用を実現することができる。
2つ以上の関連する運動量状態を含むプラットフォームの汎用性は、キャビティトーンを追加することで、量子シミュレーションや、物質波干渉計や、光学時計や磁気センサなどの量子センサーにおける量子センシングの豊富な機会を開放するハミルトニアンの柔軟性と組み合わさったものです。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 23:25:49 GMT)
Generative Large Language Models in Automated Fact-Checking: A Survey [0.0] オンラインプラットフォームにおける偽情報の拡散は、深刻な社会的困難を招いている。
偽情報の量が増加するには、自動的な方法が必要である。
大規模言語モデル(LLM)は、ファクトチェッカーを支援するための有望な機会を提供する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:16:46 GMT)
GPTCast: a weather language model for precipitation nowcasting [0.0] GPTCastは、レーダベースの降雨をアンサンブルする深層学習法である。
我々は、トークン化レーダ画像を用いて降水動態を学習するために、GPTモデルを用いて予測を行う。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:25:58 GMT)
Federated Distillation for Medical Image Classification: Towards Trustworthy Computer-Aided Diagnosis [0.0] 医用画像分類はコンピュータ支援臨床診断において重要な役割を担っている。
ディープラーニング技術は、効率を大幅に向上し、コストを削減した。
医用画像データのプライバシーに敏感な性質は、集中的な記憶とモデルの訓練を複雑にする。
本稿では,これらの問題に対処するためのフェデレーション学習に基づく,新たなプライバシ保護型医用画像分類フレームワークであるFedMICを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:38:06 GMT)
Fault-tolerance of the [[8,1,4]] non-CSS code [0.0] 既知の[[8,1,4]]非CSSコードのフォールトトレランスを示し、コードの論理的エラー率について検討する。
我々は,Gottesman氏が提供した安定化器符号の符号化手順を選択し,CSS以外のコードのクラスの設定に適合するように修正する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 06:20:33 GMT)
Fast Ground State to Ground State Separation of Small Ion Crystals [0.0] 捕捉されたイオンの線形結晶を異なるサブセットに迅速に分離することは、捕捉されたイオン量子コンピューティングアーキテクチャを実現するために重要である。
我々は,同種結晶と混合種結晶のより小さな部分集合への分離を記述するのに使用できる一般的な理論的枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 01:51:11 GMT)
Estimation of high-dimensional unitary transformations saturating the Quantum Cramér-Rao bound [0.0] 本稿では,$d$次元のユニタリ変換を推定する手法を提案する。
従来の情報がない場合でも、標準的な量子プロセストモグラフィーよりも高精度で2次元のユニタリ変換を推定できることを数値シミュレーションで示している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:20:16 GMT)
Estimation of AMOC transition probabilities using a machine learning based rare-event algorithm [0.0] アトランティック・メリディショナル・オーバーターン循環(Atlantic Meridional Overturning Circulation、AMOC)は、地球規模の気候の重要な構成要素である。
本研究では、AMOCが特定の時間窓内で崩壊する確率を計算する。
希少なアルゴリズムと機械学習を結合することで、遷移確率を正確に推定できることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:06:43 GMT)
Equidistribution-based training of Free Knot Splines and ReLU Neural Networks [0.0] 直交線形ユニット(ReLU)アクティベーション機能を持つ浅層ニューラルネットワーク(NN)を用いた一次元関数近似の問題点を考察する。
ネットワークの幅が大きくなるにつれて,悪条件が急速に低下することを示す。
我々は、ReLU NNのトレーニング手順を改善するために、最適片方向線形補間理論を利用する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:51:36 GMT)
Ensuring Responsible Sourcing of Large Language Model Training Data Through Knowledge Graph Comparison [0.0] 近年,大手言語モデル (LLM) 開発者に対する著作権付きコーポラの出版社,新聞,その他のクリエーターが盗作罪で告訴されている。
本稿では,大規模言語モデルの訓練や微調整に知識源が用いられているかどうかを評価するための,新たなシステムであるプラジャリズム検出システムを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 20:49:21 GMT)
Enhancing Deep Neural Network Training Efficiency and Performance through Linear Prediction [0.0] ディープニューラルネットワーク(DNN)は、コンピュータビジョンや自然言語処理など、さまざまな分野で大きな成功を収めている。
本稿では,DNNの学習効率を最適化する手法を提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:57:06 GMT)
Enabling Student Innovation through Virtual Reality Development [0.0] 大学コンピュータサイエンス(CS)プログラムでは、開発プラットフォームとして学生をVRに公開することが重要である。
本稿では,学生主導のVRプロジェクトがCSカリキュラム全体において,基本的なCS概念を網羅する形でどのように利用されているかを説明する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:28:04 GMT)
Efficient Bit Labeling in Factorization Machines with Annealing for Traveling Salesman Problem [0.0] 2次的制約のないバイナリ最適化問題は、機械学習の助けを借りて解決される。
本研究は, 収束速度と2値ラベリング法における精度の依存性について検討する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:26:38 GMT)
Effect of antiprotons on hydrogen-like ions in external magnetic fields [0.0] 1つのアンチプロトンと1つの水素様イオンからなる準分子化合物について検討した。
2中心ポテンシャルを持つディラック方程式は、双対平衡有限基底集合法を用いて数値的に解かれる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 09:45:32 GMT)
Divide And Conquer: Learning Chaotic Dynamical Systems With Multistep Penalty Neural Ordinary Differential Equations [0.0] 多段階ペナルティ・ヌード(MP-NODE)は、倉本-シヴァシンスキー方程式や2次元コルモゴロフ流のようなカオス系に適用される。
カオスシステムを最小二乗のランドスケープと同じような方法で最適化し、計算コストを大幅に削減することができる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 02:54:49 GMT)
Distributional Regression U-Nets for the Postprocessing of Precipitation Ensemble Forecasts [0.0] グリッド型降水アンサンブル予測のためのグローバル統計後処理手法を提案する。
このU-Netベースの分布回帰法は,スコアリングルール最小化によって推定されるパラメトリック分布の形で,限界分布を予測する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:16:04 GMT)
Density effects on the interferometry of Efimov states by modulating magnetic fields [0.0] 変調磁場による熱ガス中のエフィモフトリマーの動的結合は非常に実りがあることが証明された。
エフィモフ三量体と第1原子二量体との重畳は依然として同じであり、高い振動率のフリンジの周波数は低い値に変化する。
後者は、密度プロファイルがトラップ状態の寄与を調べるため、自由空間における三量体と原子二量体の周波数を参照する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 19:17:14 GMT)
Demonstration of the Rodeo Algorithm on a Quantum Computer [0.0] Rodeoアルゴリズムは、量子コンピュータ上で観測可能な任意の固有状態の準備と固有値推定のための効率的なアルゴリズムである。
固有状態生成のための位相推定や断熱進化のようなよく知られたアルゴリズムよりも指数関数的に高速である。
実際の量子デバイス上ではまだ実装されていない。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 00:32:21 GMT)
Database Systems Course: Service Learning Project [0.0] 本稿では,上層および大学院レベルのデータベースシステムコースで使用されるサービス学習プロジェクトについて述べる。
学生は実際のクライアントのために小さなデータベースプロジェクトを完了します。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:53:29 GMT)
Convexity of noncontextual wirings and how they order the set of correlations [0.0] 我々は自由操作を非コンテキスト配線(NCW)と考える。
NCWを介して異なるリソースを変換する方法に関するいくつかの基本的な事実を実証する。
その結果,ベルシナリオ以外のシナリオにおいてNCWによって誘導される複雑な順序付けが明らかとなった。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 10:10:08 GMT)
Computing $\varphi(N)$ for an RSA module with a single quantum query [0.0] RSAモジュールの$N$に対して$varphi(N)$を、ランダムに選択された整数の代入として$N$を演算する計算時間アルゴリズムを与える。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 14:14:32 GMT)
Comparative Evaluation of Learning Models for Bionic Robots: Non-Linear Transfer Function Identifications [0.0] 本研究は,アンサンブル学習モデル,正規化ベースモデル,カーネルベースモデル,ニューラルネットワークモデルなど,4種類のモデルをトレーニングする。
主な目的は、モデルフリー制御の適用のための包括的な評価戦略とフレームワークを提供することである。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:00:23 GMT)
Collective photon emission in solid state environments: Concatenating non-markovian and markovian dynamics [0.0] 固体量子エミッタの集合発光とマルチキュービットダイナミクスについて検討する。
量子放出体に対するフォノンの効果は超高速非マルコフ力学によって説明される。
単一量子エミッタの場合、第1の方法は高速で遅いフォノン力学を過大評価し、第2の方法はポーラロン法であることを示す。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 11:07:01 GMT)
Coherent information for CSS codes under decoherence [0.0] Calderbank-Shor-Steane (CSS) コードと呼ばれるクラスには、トーリックコード、カラーコード、フラクトンなど多くの重要な例が含まれている。
近年の研究では、これらのQECCの復号化遷移は、混合状態から情報理論量を計算することによって本質的に捕捉できることが示されている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 18:00:02 GMT)
Characterizing the Interpretability of Attention Maps in Digital Pathology [0.0] 本稿では,デジタル病理学において,注意ネットワークが関連する機能に対応する能力を評価する枠組みを提案する。
人工モデルの共同設立者を作り、専用の解釈可能性メトリクスを使用します。
以上の結果から,AMMILモデルがフレームワーク内で期待どおりに動作していることが示唆された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:58:58 GMT)
Assessing the Effectiveness of GPT-4o in Climate Change Evidence Synthesis and Systematic Assessments: Preliminary Insights [0.0] GPT-4oは最先端の大規模言語モデル(LLM)である
我々は,GPT-4oによる気候変動適応に関する科学的文献からの抽出の有効性を評価した。
その結果,GPT-4oは低熟練タスクでは高い精度が得られるが,利害関係者の識別や適応応答の深さ評価などの中高熟練タスクでは信頼性が低いことが示唆された。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 13:14:57 GMT)
Assessing the Code Clone Detection Capability of Large Language Models [0.0] 評価には、さまざまなクローンタイプのコードペアと類似度のレベルでモデルをテストすることが含まれる。
GPT-4はすべてのクローンタイプでGPT-3.5を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:20:44 GMT)
A note on Majorana representation of quantum states [0.0] 任意の$d > 1$ に対して、次元 $d$ と $d-1$ qubits の量子状態はブロッホ球面の $d-1$ 点として表される。
ブロッホ球面上の$d-1$点と対応する$d-1$ qubitsを$d$次元量子状態を表す単純なスキームを提案する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 15:55:21 GMT)
A new twist on the Majorana surface code: Bosonic and fermionic defects for fault-tolerant quantum computation [0.0] マヨラナゼロモード(MZM)は、位相的に保護された量子コンピューティングハードウェアの候補である。
MSC符号のツイストは量子ビットの2倍の量を符号化できることを示す。
我々は、より少ないリソースを用いて、普遍的な論理量子ビットと論理的MZMを実行する方法を説明する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 17:15:25 GMT)
A Survey of Accessible Explainable Artificial Intelligence Research [0.0] 本稿では、説明可能な人工知能(XAI)のアクセシビリティに関する研究について、系統的な文献レビューを行う。
提案手法は,XAIとアクセシビリティーの交差点を捉えるために,いくつかの学術データベースを検索語で検索することを含む。
我々は、デジタル包摂とアクセシビリティを促進するために、XAI開発に障害コミュニティを含めることの重要性を強調している。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:09:46 GMT)
A Pattern Language for Machine Learning Tasks [0.0] 我々は客観的関数を学習者の行動に関する制約と見なしている。
動作の中核となるタスクと実装の詳細を分離できる形式的なグラフィカル言語を開発する。
概念実証として、「マニピュレータ」と呼ぶ生成モデルに分類器を変換できる新しいタスクを設計する。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 16:50:27 GMT)
A Novel Approach to Image EEG Sleep Data for Improving Quality of Life in Patients Suffering From Brain Injuries Using DreamDiffusion [0.0] 脳の信号を画像に変換することは、コマトース患者の思考をより深く理解するために重要である。
伝統的に、脳波によって収集された脳信号は、テキストにのみ変換される。
GitHubで利用可能なオープンソースモデルの新たな方法によって、DreamDiffusionは、脳波を直接イメージに変換するのに使用できる。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 21:26:28 GMT)
A Fixed-Parameter Tractable Algorithm for Counting Markov Equivalence Classes with the same Skeleton [0.0] 因果DAG(Bayesian Network)は、確率変数間の条件依存を符号化する一般的なツールである。
しかし、同じ確率変数の集合上の2つの異なる因果DAGに対して、全く同じ条件依存の集合をエンコードすることが可能である。
そのような因果DAGはマルコフ同値であり、マルコフ同値DAGの同値類はマルコフ同値類(Markov Equivalent Classs、MECs)として知られている。
論文参考訳(メタデータ) (Tue, 2 Jul 2024 05:19:32 GMT)