InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output [138.2] InternLM-XComposer-2.5 (IXC-2.5) は、長文入力と出力をサポートする汎用的な大規模言語モデルである。
IXC-2.5は様々なテキストイメージの理解と構成の応用に優れる。
IXC-2.5は28のベンチマークで評価され、16のベンチマークで既存のオープンソースの最先端モデルを上回っている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:59:21 GMT)
Mixture of insighTful Experts (MoTE): The Synergy of Thought Chains and Expert Mixtures in Self-Alignment [103.1] 従来のアライメント戦略は人間の介入に大きく依存しており、例えばSupervised Fine-Tuning(SFT)やReinforcement Learning from Human Feedback(RLHF)などである。
本稿では、AlignCoTと呼ばれる思考の連鎖(CoT)アプローチを利用した新しい自己アライメント手法を提案する。
本稿では、AlignCoTプロセスの各コンポーネントを強化するために専門家の混合を適用し、アライメント効率を著しく向上させるMoTEアーキテクチャについて紹介する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:04:25 GMT)
Anti-Collapse Loss for Deep Metric Learning Based on Coding Rate Metric [99.2] DMLは、分類、クラスタリング、検索といった下流タスクのための識別可能な高次元埋め込み空間を学習することを目的としている。
埋め込み空間の構造を維持し,特徴の崩壊を避けるために,反崩壊損失と呼ばれる新しい損失関数を提案する。
ベンチマークデータセットの総合実験により,提案手法が既存の最先端手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:44:20 GMT)
Found in the Middle: Calibrating Positional Attention Bias Improves Long Context Utilization [97.8] 大規模言語モデル(LLM)は、入力の中央に位置する関連する情報を取得するのに苦労する。
この現象はミドル・イン・ザ・ミドル問題として知られている。
また,中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級中級健常者を対象に,長期にわたる中級中級中級中級中級健常者を対象とした。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:40:00 GMT)
Jailbreaking Black Box Large Language Models in Twenty Queries [97.3] 大規模言語モデル(LLM)は、敵のジェイルブレイクに対して脆弱である。
LLMへのブラックボックスアクセスのみのセマンティックジェイルブレイクを生成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:50:34 GMT)
BLINK: Multimodal Large Language Models Can See but Not Perceive [96.4] Blinkはマルチモーダル言語モデル(LLM)のための新しいベンチマークであり、他の評価では見つからないコア視覚知覚能力に焦点を当てている。
Blinkは14の古典的なコンピュータビジョンタスクを3,807の複数の質問に修正し、単一の画像や複数の画像と組み合わせて視覚的にプロンプトする。
GPT-4V と Gemini は 51.26% と 45.72% であり、ランダムな推測よりも 13.17% と 7.63% 高い。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:44:45 GMT)
52B to 1T: Lessons Learned via Tele-FLM Series [96.2] 我々は、SFTデータ構築のための"less is more"アプローチをサポートするTele-FLM-52B上のSupervised Fine-tuning(SFT)について論じる。
520億から102億へと、そしてその後1兆のパラメータへと、モデルを段階的に成長させるためのベストプラクティスに関する実験と分析を実演する。
我々は、さらなるトレーニングと研究を進めるために、Tele-FLM-1Tと呼ばれる1Tモデルのチェックポイントをオープンソース化する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:21:02 GMT)
Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.6] 我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。
凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:36:19 GMT)
Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset [74.7] Emotion and Intent Joint Understanding in Multimodal Conversation (MC-EIU)は、マルチモーダルな会話履歴に現れる意味情報をデコードすることを目的としている。
MC-EIUは多くのヒューマン・コンピュータ・インタフェースのテクノロジーを実現している。
MC-EIUデータセットは,7つの感情カテゴリー,9つの意図カテゴリ,3つのモダリティ,すなわちテキスト,音響,視覚的内容,および英語とマンダリンの2つの言語を特徴とする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:56:00 GMT)
ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models [74.6] 活性化スパーシリティ(Activation sparsity)とは、活性化出力の間に弱い分散要素が存在することを指す。
本稿では,PLMを高活性化空間にプッシュするために,"ProSparse" という,シンプルで効果的なスペース化手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:56:49 GMT)
Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time [73.8] 本稿では、画像と音声のきめ細かい理解を備えた音声視覚LLMであるMeerkatを紹介する。
Meerkatは、音声参照画像の接地、画像案内音声の時間的局所化、音声-視覚的事実チェックといった課題に取り組むことができる。
我々は、これらの下流タスクすべてにおいて、37.12%の相対的な改善で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:01:30 GMT)
Self-supervised ASR Models and Features For Dysarthric and Elderly Speech Recognition [71.9] 本稿では,TDNNとConformer ASRシステムにSSLプリトレーニングモデルとその機能を統合するアプローチについて検討する。
ドメイン適応型HuBERT、wav2vec2-conformer、マルチ言語型XLSRモデルを統合することで構築されたTDNNシステムは、スタンドアロンの微調整型SSL事前訓練モデルより一貫して優れている。
DementiaBank Pitt の高齢者音声認識出力を用いて,アルツハイマー病の検出精度の向上も行った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:33:39 GMT)
Evaluating and Analyzing Relationship Hallucinations in LVLMs [69.8] 視覚関係の幻覚を評価するための新しいベンチマークであるR-Benchを紹介する。
R-Benchは、関係の存在に焦点を当てたイメージレベルの質問と、局所的な視覚的理解を評価するインスタンスレベルの質問を特徴としている。
我々は,関係関連性,主観関連性,関係対象性という,幻覚につながる3つの関係共起関係を同定する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:02:35 GMT)
LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models [69.7] 暗黙的および明示的な信頼マーカーを校正するリスナー対応微調整法 (LACIE) を提案する。
我々は,LACIEがリスナーをモデル化し,回答が正しいかどうかだけでなく,リスナーに受け入れられるかどうかを考察する。
LACIEによるトレーニングの結果、正しい回答の受け入れレベルを維持しながら、誤った回答が受け入れられる割合が47%減少することがわかった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:49:23 GMT)
Expressive Gaussian Human Avatars from Monocular RGB Video [69.6] EVAは3DガウスとSMPL-Xに基づいて細部を巧みに彫刻する乾燥可能な人間モデルである。
SMPL-XモデルをRGBフレームに整合させることが,効果的なアバター学習において重要であることを強調した。
本稿では,勾配閾値を適応的に調整する適応密度制御戦略を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:36:27 GMT)
Accelerating Diffusion Sampling with Optimized Time Steps [69.2] 拡散確率モデル(DPM)は高分解能画像合成において顕著な性能を示した。
彼らのサンプリング効率は、通常多くのサンプリングステップのため、依然として望まれている。
DPM用高次数値ODEソルバの最近の進歩により、サンプリングステップがはるかに少ない高品質な画像の生成が可能になった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:16:31 GMT)
DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception [66.9] 本稿では,拡散モデルの生成的フィードバックを利用して画像エンコーダのセマンティックな分布を整合させる,シンプルで効果的なアプローチであるDEEMを提案する。
DEEMは、訓練可能なパラメータを少なくし、事前訓練データが少なく、ベースモデルのサイズを小さくし、幻覚を緩和するための強化された堅牢性と優れた能力を示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:30:53 GMT)
Unveiling the Safety of GPT-4o: An Empirical Study using Jailbreak Attacks [65.8] 本稿では,GPT-4oのジェイルブレイク攻撃に対する厳密な評価を行う。
新たに導入されたオーディオモダリティは、GPT-4oに対するジェイルブレイク攻撃のための新しい攻撃ベクトルを開く。
既存のブラックボックスマルチモーダル・ジェイルブレイク攻撃は、GPT-4oとGPT-4Vに対してほとんど効果がない。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:51:21 GMT)
Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long Contexts [65.0] 視覚言語モデル(VLM)における長文抽出推論評価のためのベンチマークジェネレータであるLoCoVQAを提案する。
LoCoVQAは、数学的推論、VQA、そしてより長い視覚的コンテキストを持つ文字認識タスクのテスト例を拡張している。
このテストは、VLMがクエリに応答する際の無関係な情報をどの程度無視できるかを評価する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:55:59 GMT)
Fine-Tuning with Divergent Chains of Thought Boosts Reasoning Through Self-Correction in Language Models [63.4] 本稿では,複数の推論連鎖を比較するためにモデルを必要とすることによって,性能を向上する新しい手法を提案する。
DCoTデータセットの命令チューニングにより、より小さく、よりアクセスしやすい言語モデルの性能が向上することがわかった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:01:18 GMT)
LLM Internal States Reveal Hallucination Risk Faced With a Query [62.3] 人間は、クエリに直面したとき、私たちが知らないことを認識できる自己認識プロセスを持っています。
本稿では,大規模言語モデルが応答生成に先立って,自身の幻覚リスクを推定できるかどうかを検討する。
確率推定器により, LLM自己評価を利用して, 平均幻覚推定精度84.32%を達成する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:08:52 GMT)
Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.2] 差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:05:20 GMT)
Learning to Mitigate Externalities: the Coase Theorem with Hindsight Rationality [62.2] 経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。
我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。
次に、プレイヤーが全福祉を最大化する交渉戦略を学習できるようにするための政策を設計する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:35:17 GMT)
Injecting linguistic knowledge into BERT for Dialogue State Tracking [60.4] 本稿では,教師なしの枠組みを用いて言語知識を抽出する手法を提案する。
次に、この知識を用いて、対話状態追跡(DST)タスクにおけるBERTの性能と解釈可能性を高める。
このフレームワークを様々なDSTタスクでベンチマークし、精度の顕著な改善を観察する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:59:32 GMT)
Modern Neighborhood Components Analysis: A Deep Tabular Baseline Two Decades Later [59.9] 我々は、インスタンス間のセマンティックな類似性をキャプチャする線形射影を学習するために設計された古典的近傍成分分析(NCA)を再考する。
学習目的の調整や深層学習アーキテクチャの統合といった微調整は,NAAの性能を著しく向上させることがわかった。
また,提案したModernNCAの効率性と予測精度を向上する,近隣のサンプリング戦略も導入する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:38:57 GMT)
Investigating Event-Based Cameras for Video Frame Interpolation in Sports [59.8] 本稿では,スポーツスローモーションビデオを生成するためのイベントベースビデオフレーム補間(VFI)モデルについて検討する。
特に,スポーツ映像を撮影するためのRGBとイベントベースカメラを含むバイカメラ記録装置の設計と実装を行い,両カメラの時間的整列と空間的登録を行う。
実験により,市販のイベントベースVFIモデルであるTimeLensが,スポーツビデオのスローモーション映像を効果的に生成できることが実証された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:32:51 GMT)
CaLMQA: Exploring culturally specific long-form question answering across 23 languages [58.2] CaLMQAは、23の言語にまたがる1.5Kの文化的に特定の質問のコレクションであり、51の文化的に翻訳された質問は、英語から22の言語に翻訳されている。
コミュニティのWebフォーラムから自然に発生する質問を収集し、ネイティブスピーカーを雇い、FijianやKirndiといった未調査言語をカバーする質問を書いています。
私たちのデータセットには、文化的トピック(伝統、法律、ニュースなど)とネイティブスピーカーの言語使用を反映した、多種多様な複雑な質問が含まれています。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:33:55 GMT)
STAR: A First-Ever Dataset and A Large-Scale Benchmark for Scene Graph Generation in Large-Size Satellite Imagery [58.0] 衛星画像(SAI)におけるシーングラフ生成(SGG)は、地理空間シナリオの認識から認識への理解を促進する。
画像サイズは512 x 768から27,860 x 31,096ピクセル(STAR)である。
大規模SAIにおいてSGGを実現するために,オブジェクト検出(OBD)やペアプルーニング,SGGの関係予測に関するSAIを理解するためのコンテキスト認識カスケード認知(CAC)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:00:31 GMT)
LLMs can learn self-restraint through iterative self-reflection [57.3] 大規模言語モデル(LLM)は、特定のトピックに関連する知識と不確実性に基づいて、その振る舞いを動的に適応できなければならない。
この適応的行動は、私たちが自己規制と呼ぶもので、教えるのは簡単ではない。
モデルが信頼している場合にのみ応答を生成できるようにするユーティリティ関数を考案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:46:52 GMT)
BVI-RLV: A Fully Registered Dataset and Benchmarks for Low-Light Video Enhancement [57.0] 本稿では,2つの異なる低照度条件下での様々な動きシナリオを持つ40のシーンからなる低照度映像データセットを提案する。
我々は、プログラム可能なモータードリーを用いて、通常の光で捉えた完全に登録された地上真実データを提供し、異なる光レベルにわたるピクセルワイドフレームアライメントのための画像ベースアプローチによりそれを洗練する。
実験の結果,Low-light Video enhancement (LLVE) における完全登録ビデオペアの重要性が示された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 22:41:49 GMT)
CoIR: A Comprehensive Benchmark for Code Information Retrieval Models [56.7] textbfInformation textbfRetrieval Benchmark(textbfInformation textbfRetrieval Benchmark)は,コード検索機能の評価に特化して設計された,堅牢で包括的なベンチマークである。
名前は、Textbftenを巧みにキュレートしたコードデータセットから成り、textbfs7の異なるドメインにまたがる、textbfeight特有の検索タスクにまたがる。
我々は9つの広く使われている検索モデルを名前を用いて評価し、最先端のシステムであってもコード検索タスクの実行に重大な困難を見出した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:58:20 GMT)
SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.1] ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。
このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:30:45 GMT)
Four Ways to Improve Verbo-visual Fusion for Dense 3D Visual Grounding [56.0] 3Dビジュアルグラウンドティング(3D visual grounding)は、自然言語で記述された3Dシーンでオブジェクトをローカライズするタスクである。
そこで本研究では,高密度な3次元グラウンドネットワークを提案し,グラウンド性能向上を目的とした4つの新しいスタンドアローンモジュールを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:01:52 GMT)
Evaluating Automatic Metrics with Incremental Machine Translation Systems [55.8] 商業機械翻訳からなるデータセットを導入し,12の翻訳方向から6年間にわたって収集した。
商業システムは時間とともに改善され、より最近の翻訳の好みに基づいて機械翻訳(MT)メトリクスを評価することができると仮定する。
本研究は、MTメトリックス研究におけるいくつかの過去の知見を確認し、測定値評価のためのテストベッドとしてデータセットの価値を実証する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:04:17 GMT)
On Generalization for Generative Flow Networks [54.2] 生成フローネットワーク(GFlowNets)は、非正規化確率分布からのサンプリングの課題に対処するために設計された革新的な学習パラダイムとして登場した。
本稿では,GFlowNetsの文脈で一般化を形式化し,一般化と安定性を結びつけるとともに,これらのモデルの能力を評価する実験を行い,報酬関数の未知の部分を明らかにする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:42:21 GMT)
Generalized Gouy Rotation of Electron Vortex beams in uniform magnetic fields [54.0] 磁場中における相対論的同軸方程式の正確な解を用いた磁場中のEVBのダイナミクスについて検討する。
一般化されたグーイ回転の下で異なる状態について統一的に記述し、グーイ位相をEVB回転角にリンクする。
この研究は、磁場中のEVBのダイナミクスに関する新たな洞察を与え、渦粒子のビーム操作とビーム光学の実践的応用を示唆している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:29:56 GMT)
DistiLLM: Towards Streamlined Distillation for Large Language Models [53.5] DistiLLMは自動回帰言語モデルのためのより効率的で効率的なKDフレームワークである。
DisiLLMは,(1)新しいスキューKulback-Leibler分散損失,(2)学生生成出力の効率向上を目的とした適応型オフ政治アプローチの2つのコンポーネントから構成される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 04:57:41 GMT)
A robust three-way classifier with shadowed granular-balls based on justifiable granularity [53.4] 我々は、不確実なデータのために、影付きGBの頑健な3方向分類器を構築した。
本モデルでは,不確実なデータ管理を実証し,分類リスクを効果的に軽減する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:54:45 GMT)
Who Wrote this Code? Watermarking for Code Generation [53.2] 本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。
実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:09:52 GMT)
On Tractable $Φ$-Equilibria in Non-Concave Games [53.2] 非凹面ゲームはゲーム理論と最適化に重大な課題をもたらす。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
また,オンライングラディエントDescentは,非自明な状況下で効率よく$Phi$-equilibriaを近似できることを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:26:58 GMT)
Combining AI Control Systems and Human Decision Support via Robustness and Criticality [53.1] 我々は、逆説(AE)の方法論を最先端の強化学習フレームワークに拡張する。
学習したAI制御システムは、敵のタンパリングに対する堅牢性を示す。
トレーニング/学習フレームワークでは、この技術は人間のインタラクションを通じてAIの決定と説明の両方を改善することができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:38:57 GMT)
ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.1] 前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:33:31 GMT)
Knowledge Composition using Task Vectors with Learned Anisotropic Scaling [51.5] 本稿では,パラメータブロックと異なる学習係数を線形に組み合わせ,タスクベクトルレベルでの異方性スケーリングを実現するアルゴリズムであるaTLASを紹介する。
このような線形結合は事前学習されたモデルの低内在性を明示的に利用しており、学習可能なパラメータは数係数のみであることを示す。
本稿では,タスク算術,少数ショット認識,テスト時間適応において,教師なしあるいは教師なしの目的を用いた手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:54:08 GMT)
How Does Quantization Affect Multilingual LLMs? [50.9] 量子化技術は、大規模な言語モデルの推論速度と展開を改善するために広く使われている。
量子化多言語 LLM の徹底的な解析を行い、言語間および様々なスケールでその性能に焦点をあてる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:39:40 GMT)
A Unified Framework for 3D Scene Understanding [50.7] UniSeg3Dは統一された3Dセグメンテーションフレームワークで、単一のモデル内でパノプト、セマンティック、インスタンス、インタラクティブ、参照、オープン語彙セグメンテーションタスクを実現する。
タスク間の知識共有を促進し、総合的な3Dシーン理解を促進する。
ScanNet20、ScanRefer、ScanNet200を含む3つのベンチマークの実験は、UniSeg3Dが現在のSOTAメソッドより一貫して優れていることを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:50:07 GMT)
Let the Code LLM Edit Itself When You Edit the Code [50.5] underlinetextbfPositional textbfIntegrity textbfEncoding (PIE)
PIEは、標準的な完全再計算手法に比べて計算オーバーヘッドを85%以上削減する。
その結果、PIEは計算オーバーヘッドを標準の完全再計算手法に比べて85%以上削減することを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:34:03 GMT)
Online Variational Sequential Monte Carlo [50.0] 我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:47:36 GMT)
A Case Study on Context-Aware Neural Machine Translation with Multi-Task Learning [49.6] 文書レベルのニューラルネットワーク翻訳(DocNMT)では、コンテクストやソース文のエンコーディングにおいてマルチエンコーダアプローチが一般的である。
近年の研究では、コンテキストエンコーダがノイズを発生させ、コンテキストの選択に頑健なモデルを実現することが示されている。
本稿では、マルチタスク学習(MTL)を通してコンテキストエンコーディングを明示的にモデル化することで、コンテキスト選択に敏感なモデルを実現することにより、この観察をさらに検討する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:50:49 GMT)
A Simple Baseline for Spoken Language to Sign Language Translation with 3D Avatars [49.6] Spoken2Signは、音声言語を手話に変換するシステムである。
本稿では,グロスビデオ辞書の作成,サインビデオ毎の3Dサインの推定,スポンケン2サインモデルのトレーニングという3つのステップからなる単純なベースラインを提案する。
私たちが知っている限りでは、最初にSpken2Signタスクを3Dサインの出力フォーマットで提示します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:04:14 GMT)
Boosting the Power of Small Multimodal Reasoning Models to Match Larger Models with Self-Consistency Training [49.3] マルチモーダル推論(multimodal reasoning)は、複数のモーダルをまたいだモデルによる質問に答える難しいタスクである。
既存のアプローチでは、言語と視覚のモダリティを2段階の推論フレームワークに組み込むことで進歩している。
MC-CoTは,複数の合理性と回答を生成し,投票プロセスを通じて最も正確な選択を行う自己整合性学習戦略である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:56:47 GMT)
Reconsidering utility: unveiling the limitations of synthetic mobility data generation algorithms in real-life scenarios [49.2] 実世界の応用性の観点から,5つの最先端合成手法の有用性を評価した。
我々は、GPS追跡タクシーのような細粒度都市の動きを符号化するいわゆる旅行データに焦点を当てる。
あるモデルは妥当な時間内にデータを生成することができず、別のモデルはマップマッチングの要件を満たすためにあまりに多くのジャンプを生成する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:08:05 GMT)
2500 vibronic eigenstates of the NO$_3$ radical [49.2] 我々は電子の$tilde X 2A'$状態に関連する振動スペクトルを再検討する。
反対称曲げ運動では、非常に大きな対称性によって誘導されるレベル分割が見つかる。
本研究は,非無視的非透析効果について考察し,ボルン・オッペンハイマー近似がスペクトルに有意な誤差をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:00:00 GMT)
A Computational Framework for Solving Wasserstein Lagrangian Flows [48.9] 一般に、最適密度経路は未知であり、これらの変動問題の解法は計算的に困難である。
本稿では,これらすべての問題に統一的な視点からアプローチする,新しいディープラーニングベースのフレームワークを提案する。
提案手法は, 単セル軌道推定における従来の手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:23:42 GMT)
Learning Action Conditions from Instructional Manuals for Instruction Understanding [48.5] 本稿では,行動条件推論というタスクを提案し,命令マニュアルにおける行動条件の事前条件と後条件の高品質なアノテートデータセットを収集する。
本稿では,オンライン指導マニュアルから大規模トレーニングインスタンスを自動構築する弱い教師付きアプローチを提案し,人間に注釈を付けて検証したデータセットをキュレートし,現在のNLPモデルが命令テキストの動作条件依存性をいかに推測できるかを検証した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:49:28 GMT)
The Shortcomings of Force-from-Motion in Robot Learning [48.0] 我々は、ロボット学習におけるより対話的な行動空間について論じる。
現在のロボット学習のアプローチは、インタラクションに対するポリシー制御を明示的に提供しない動き中心のアクション空間に焦点を当てている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:23:02 GMT)
MIA-Bench: Towards Better Instruction Following Evaluation of Multimodal LLMs [47.9] MIA-Benchは、マルチモーダルな大規模言語モデル(MLLM)を、複雑な命令に厳密に準拠する能力に基づいて評価するために設計されたベンチマークである。
私たちのベンチマークでは、400のイメージプロンプトペアで構成されており、それぞれが階層化された命令に対するモデルのコンプライアンスに挑戦するために作られています。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:11:45 GMT)
Nearly Linear Sparsification of $\ell_p$ Subspace Approximation [47.8] $ell_p$ 部分空間近似問題のNP硬度に対処する一般的なアプローチは、強いコアセットを計算することである。
我々は、$ell_p$部分空間近似に対して、ランクパラメータ$k$にほぼ最適に依存する強いコアセットを構築するための最初のアルゴリズムを得る。
我々の手法は、オフライン設定と同様のバウンダリを持つ$ell_p$サブスペース近似のための、ほぼ最適に近いオンライン強力なコアセットにも繋がる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:49:28 GMT)
How Deep Neural Networks Learn Compositional Data: The Random Hierarchy Model [47.6] 言語と画像の階層構造にインスパイアされた合成タスクのファミリーであるランダム階層モデルを紹介する。
深層ネットワークは、等価なグループを交換するために不変な内部表現を開発することでタスクを学習する。
この結果から, ネットワークは次元の呪いを克服し, 不変表現を構築できることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:57:00 GMT)
DialogGen: Multi-modal Interactive Dialogue System for Multi-turn Text-to-Image Generation [46.1] 市販のMLLMとT2Iモデルを連携させてマルチモーダル対話システムを構築するためのDialogGenを提案する。
描画プロンプトアライメント、注意深いトレーニングデータキュレーション、エラー修正で構成されている。
ダイアログジェネレーションとユーザスタディに関する実験は、他の最先端モデルと比較してダイアログジェネレーションの有効性を実証している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:09:53 GMT)
Tuning-Free Alignment of Diffusion Models with Direct Noise Optimization [45.8] 直接雑音最適化(DNO)という新しいアライメント手法を提案する。
設計上、DNOはチューニング不要で、生成中にオンライン形式でアライメントが発生するため、プロンプトに依存しない。
我々は、人間のフィードバックデータに基づいて訓練された複数の人気報酬関数について広範な実験を行い、提案したDNOアプローチが、最先端の報酬スコアと高画質を、すべて生成に適切な時間予算で達成できることを実証した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:45:45 GMT)
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations [45.6] AURORAデータセット(AURORA data)は、ビデオやシミュレーションエンジンから人間に注釈を付け、キュレートされた高品質なトレーニングデータの集合である。
AURORA-finetuned model on a new expert-curated benchmark across 8 various editing task。
我々のモデルは従来の編集モデルよりもはるかに優れており、人間のレーティングによって判断される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:36:33 GMT)
Are Large Language Models Consistent over Value-laden Questions? [45.4] 大きな言語モデル(LLM)は、調査回答を特定の値にバイアスしているように見える。
価値の一貫性は、パラフレーズ、ユースケース、翻訳、トピック内での回答の類似性として定義します。
モデルは、パラフレーズ、ユースケース、翻訳、トピック内で比較的一貫性がある。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:53:54 GMT)
A Self-Supervised Task for Fault Detection in Satellite Multivariate Time Series [45.3] この研究は、複雑な分布と高次元分布をモデル化する能力で有名な物理インフォームドリアルNVPニューラルネットワークを活用する新しいアプローチを提案する。
実験には、セルフスーパービジョンによる事前トレーニング、マルチタスク学習、スタンドアロンのセルフ教師付きトレーニングなど、さまざまな構成が含まれている。
結果は、すべての設定で大幅にパフォーマンスが向上したことを示している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:19:41 GMT)
SemioLLM: Assessing Large Language Models for Semiological Analysis in Epilepsy Research [45.2] 大規模言語モデルは、一般的な医学的知識をエンコードする能力において有望な結果を示している。
内科的知識を活用しててててんかんの診断を行う技術について検討した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:02:12 GMT)
Back to the Color: Learning Depth to Specific Color Transformation for Unsupervised Depth Estimation [45.1] 合成色と実世界の色の違いは、実世界のシーンにおける深度推定に重大な課題をもたらす。
実世界のデータに基づいて訓練されたモデルを用いて,奥行きからリアルな色を予測するフレームワークBack2Colorを提案する。
また、VADepthは、変換器よりも計算量が少なく、精度も高いVision Attention Networkをベースにしている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:08:22 GMT)
Meta-Learning Based Optimization for Large Scale Wireless Systems [45.0] 文献における従来の最適化アルゴリズムの限界は、無線システムにおける送信アンテナ数や通信ユーザ数によって増大することが知られている。
本稿では,教師なしメタラーニングに基づく手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:09:00 GMT)
Towards Negotiative Dialogue for the Talkamatic Dialogue Manager [45.0] 本稿では,TDM(Talkamatic Dialogue Manager)の開発版に実装された,交渉対話に関連する対話現象について述べる。
この実装は、TDMにおける交渉対話の一般的な特徴を網羅する最初のステップである。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:49:18 GMT)
Thermal masses and trapped-ion quantum spin models: a self-consistent approach to Yukawa-type interactions in the $λ\!φ^4$ model [45.0] 閉じ込められたイオン系における磁気の量子シミュレーションは、スピン間の相互相互作用を仲介するために結晶振動を利用する。
これらの相互作用は、フォノンが粗粒のクライン=ゴードン場によって記述される長波長相対論的理論によって説明できる。
レーザ冷却により制御できる熱効果は、相互作用するQFTにおける熱質量の出現を通じて、この流れを明らかにすることができることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:51:08 GMT)
Integrability and dark states of the XX spin-1 central spin model in a transverse field [45.0] XX中心スピンモデルは、結合が存在するXY平面に向いた磁場の存在下で積分可能である。
スピン-1/2の場合、非スキュー対称 XXZ Richardson-Gaudin 模型の適切な極限により、磁場が平面内成分を含むように傾いた場合でも積分可能であることを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:47:22 GMT)
Video Watermarking: Safeguarding Your Video from (Unauthorized) Annotations by Video-based LLMs [43.8] ビデオウォーターマーキング(英語: Video Watermarking)は、ビデオベースの大規模言語モデルによって、未承認のアノテーションからビデオを保護する技術である。
ビデオによるLLMの誤使用を防止しつつ視聴体験を保存している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:48:18 GMT)
Towards Efficient Pixel Labeling for Industrial Anomaly Detection and Localization [43.5] 本稿では,新しいインタラクティブ画像(IIS)アルゴリズムであるADClickを紹介する。
ADClickは、実際の欠陥画像に対して「地中真実」の異常マスクを効率よく生成する。
我々は ADClick の能力を ADClick-Seg に拡張する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:12:43 GMT)
Budget-Aware Pruning: Handling Multiple Domains with Less Parameters [43.3] この作業は、ユーザ定義の予算に従って複数のドメインを処理可能なモデルを立案することを目的としている。
これを実現するために、全てのドメインがベースラインモデルから同様のフィルタのサブセットを使用するように促します。
提案されたアプローチは、テスト時に複数のドメインを処理する数少ない作業の1つでありながら、リソース制限されたデバイスに適応することで革新的になる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:16:57 GMT)
Fast maneuver recovery from aerial observation: trajectory clustering and outliers rejection [43.1] 2種類のVulnerable Road Users (VRU) が提案される軌道クラスタリング手法によって検討される。
2つの環境がメソッド開発のテストとして機能し、3つの異なる交差点と1つのラウンドアバウトとなる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:22:21 GMT)
TieBot: Learning to Knot a Tie from Visual Demonstration through a Real-to-Sim-to-Real Approach [42.9] この研究は、ロボットがネクタイを結びつくことを学べるリアルタイムの学習システムTieBotを紹介している。
実演ビデオからネクタイのメッシュ列を推定する階層的特徴マッチング手法を提案する。
我々のパイプラインは、学習されたポリシーが実世界の実行に適用されたときに残留ポリシーを学習する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:16:41 GMT)
Can 3D Vision-Language Models Truly Understand Natural Language? [42.7] 既存の3D-VLモデルは言語入力のスタイルに敏感であり、同じ意味を持つ文を理解するのに苦労するが、異なる変種で書かれる。
本稿では,様々なタスクにまたがって3D-VLモデルを体系的に評価し,異なる言語スタイルのバリエーションを提示した場合のパフォーマンスをベンチマークする言語頑健性タスクを提案する。
包括的評価により,様々な3D-VLタスクにまたがる既存モデルの性能低下が明らかとなった。
最先端の3D-LLMでさえ、同じ文の変種を理解することができない。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:21:38 GMT)
Expressivity of Graph Neural Networks Through the Lens of Adversarial Robustness [42.1] 我々は、理論的に可能であり、実証的に達成された表現力の間の大きなギャップを明らかにするためのツールとして、敵の頑健性を用いる。
また,グラフ構造に対する小さな摂動に対しても,より強力なGNNが一般化できないことを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:21:19 GMT)
Multiple-Resolution Tokenization for Time Series Forecasting with an Application to Pricing [41.9] 本稿では,時系列のトークン化に着目した時系列予測のためのトランスフォーマーアーキテクチャを提案する。
我々のアーキテクチャは、利用可能なすべてのデータにまたがって、多くのスケールで効率的な表現を同時に学習することを目的としています。
我々は,このモデルを,大手小売店のマークダウンチームが直面している現実的な予測問題に適用する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:07:16 GMT)
Aligning Large Language Models with Human Preferences through Representation Engineering [41.8] 表現工学(RepE)の新たな分野から着想を得た本研究は,LLM内の活動パターンに埋め込まれた高レベルの人間の嗜好の関連表現を特定することを目的としている。
この新しいアプローチは、人間フィードバックからの表現アライメント(Representation Alignment from Human Feedback、RAHF)と呼ばれ、効果的で、計算的に効率的で、実装が容易であることが証明されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:21:02 GMT)
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model [41.3] 初期ビジョン言語Fusion-based SAM (EVF-SAM) について紹介する。
EVF-SAMは、マルチモーダルプロンプト(画像とテキスト)を利用する、シンプルだが効果的な参照セグメンテーション手法である
BEIT-3をベースとしたEVF-SAMにより,RefCOCO/+/gにおける表現セグメンテーションの最先端性能が得られた。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:59:52 GMT)
JailbreakHunter: A Visual Analytics Approach for Jailbreak Prompts Discovery from Large-Scale Human-LLM Conversational Datasets [41.3] 大規模言語モデル (LLM) は注目されているが、誤用リスクが懸念されている。
JailbreakHunterは、大規模な人間とLLMの会話データセットでジェイルブレイクプロンプトを特定するためのビジュアル分析手法である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:10:41 GMT)
A Formal Model for Artificial Intelligence Applications in Automation Systems [41.2] 本稿では,自動化システムにおけるAIアプリケーションの明確かつ構造化されたドキュメンテーションを提供するために,標準を用いた形式モデルを提案する。
自動化システム(AIAS)における人工知能の情報モデルは、設計パターンを利用して、自動化システムとAIソフトウェアの様々な側面をマッピングし、リンクする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:05:32 GMT)
Learning and Forgetting Unsafe Examples in Large Language Models [41.1] 大規模言語モデル(LLM)は、サードパーティのカスタム微調整データから学習する。
協調LLMは、安全でないコンテンツを容易に学習できるが、より安全なコンテンツに微調整した場合には、それを忘れやすい傾向にある。
このアルゴリズムは、モデルがそのデータに対して忘れている信号がどれほど強いかに基づいて、安全でないデータをフィルタリングする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:13:31 GMT)
ShadowRefiner: Towards Mask-free Shadow Removal via Fast Fourier Transformer [41.0] 影に影響された画像は、しばしば色と照明の空間的な違いが顕著に現れる。
我々はFast Fourier Transformerを介してマスクレスシャドウ除去・精細ネットワーク(ShadowRefiner)を導入する。
本手法は,NTIRE 2024画像シャドウ除去チャレンジのフィデリティトラックにおいて,第2位を達成し,パーセプチュアルトラックのタイトルを獲得した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:38:39 GMT)
Call Me When Necessary: LLMs can Efficiently and Faithfully Reason over Structured Environments [41.0] 本稿では,構造化環境に対する効率的な推論を行うために,Reasoning-Path-Editing (Readi)を提案する。
Readiはクエリが与えられた推論パスを生成し、必要なときにのみそのパスを編集する。
3つのKGQAデータセットと2つのTableQAデータセットの実験結果から、Readiの有効性が示された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:23:59 GMT)
KeyVideoLLM: Towards Large-scale Video Keyframe Selection [40.7] KeyVideoLLMは、ビデオLLMデータを効率的に管理するためのテキストフレーム類似性に基づく選択方法である。
データ圧縮速度は最大60.9倍に向上し、ディスクスペースの要求を大幅に低減する。
既存の選択方法と比較して、処理速度を最大200倍に向上させる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:41:44 GMT)
One Fits All: Learning Fair Graph Neural Networks for Various Sensitive Attributes [40.6] 不変学習,すなわちFairINVに基づくグラフフェアネスフレームワークを提案する。
FairINVはセンシティブな属性分割を取り入れ、ラベルと各種のセンシティブな属性の間の急激な相関を排除し、公正なGNNを訓練する。
いくつかの実世界のデータセットの実験結果から、FairINVは最先端のフェアネスアプローチを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:53:47 GMT)
Fisher-aware Quantization for DETR Detectors with Critical-category Objectives [40.6] この研究は、タスククリティカルなカテゴリのサブセット、すなわちクリティカルカテゴリのパフォーマンスを定義します。
特定の臨界カテゴリは量子化に対する感度が高く、量子化対応訓練(QAT)後に過度に適合する傾向にある。
このエビデンスを用いて、臨界カテゴリーの損失ランドスケープに対して、フィッシャー対応の混合精度量子化スキームと、QATに対するフィッシャートラス正規化を適用する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:35:53 GMT)
Merlin:Empowering Multimodal LLMs with Foresight Minds [40.5] MLLM(Multimodal Large Language Models)の既存の学習フレームワークへの将来のモデリングの統合について紹介する。
本稿では,MLLMをフォレスト・マインドで強化する2つの革新的な手法を提案する。
FPTはトラジェクトリを中心とした様々なタスクを共同で訓練し、MLLMは与えられた初期観測からトラジェクトリ全体への参加と予測の仕方を学ぶことができる。
FITはMLLMに対して、まず関連するオブジェクトの軌道を予測し、それに基づいて将来の事象を推論する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:58:12 GMT)
MentalAgora: A Gateway to Advanced Personalized Care in Mental Health through Multi-Agent Debating and Attribute Control [40.2] MentalAgoraは、複数のエージェント間の相互作用によって強化された大きな言語モデルを利用した新しいフレームワークである。
このフレームワークは,戦略的議論,カウンセラー作成の調整,応答生成という3つの段階を通じて動作する。
実験やユーザスタディを含む評価は、MentalAgoraがプロの標準と整合し、ユーザの好みを効果的に満たしていることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:19:38 GMT)
GraphWiz: An Instruction-Following Language Model for Graph Problems [39.7] GraphInstructは、言語モデルに明示的な推論パスを用いて、幅広いグラフ問題に対処する機能を持たせるために設計されたデータセットである。
GraphWizは、明確な推論プロセスを生成しながら、さまざまなグラフ問題タイプを解決できるオープンソースの言語モデルです。
拡張モデルであるGraphWiz-DPOは、9つのタスクで平均65%の精度を達成し、GPT-4を平均43.8%上回っている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:39:59 GMT)
On Evaluating Explanation Utility for Human-AI Decision Making in NLP [39.6] 既存のメトリクスをレビューし、アプリケーショングラウンド評価に適したデータセットの要件を確立する。
我々は,人間-AIチームの形成と研究のために,芸術の状態を再評価することの重要性を実証する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 23:53:27 GMT)
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better [39.6] すべての合成画像は、最終的にジェネレータを訓練するために使用される上流データに由来する。
我々は, LAION-2Bから直接取得した目標実画像に対して, 安定拡散によって生成されたタスク関連ターゲット合成データを微調整と比較した。
解析の結果,このアンダーパフォーマンスは生成物と,合成画像中のタスク関連視覚的詳細が不正確なためであることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:00:50 GMT)
Learning to Reduce: Towards Improving Performance of Large Language Models on Structured Data [39.3] 大規模言語モデル(LLM)は、幅広い下流タスクにおいて有能なパフォーマンスを実現している。
本稿では、オン・ポリシー・ラーニングを用いて言語モデルを微調整し、入力された構造化データの縮小版を生成するフレームワークであるLearning to Reduceを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:51:50 GMT)
A Wolf in Sheep's Clothing: Practical Black-box Adversarial Attacks for Evading Learning-based Windows Malware Detection in the Wild [39.3] MalGuiseは、既存の学習ベースのWindowsマルウェア検出システムのセキュリティリスクを評価するブラックボックス敵攻撃フレームワークである。
MalGuiseの攻撃成功率は95%を超え、生成したマルウェアファイルの91%以上が同じセマンティクスを維持している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:01:19 GMT)
Investigating Decoder-only Large Language Models for Speech-to-text Translation [39.2] 大規模言語モデル (LLM) は、様々なドメインにまたがる例外的な推論能力、一般化可能性、およびレイテンシで知られている。
我々は,LLMが直接符号化された音声表現を消費し,テキスト翻訳を生成することができるデコーダのみのアーキテクチャを提案する。
本モデルでは,プロプライエタリなデータを必要としないモデル間で,CoVoST 2およびFLEURSの最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:42:49 GMT)
Social Bias Evaluation for Large Language Models Requires Prompt Variations [38.9] 大規模言語モデル(LLM)は、かなりの社会的偏見を示す。
本稿では,高速変動変化におけるLDMの感度について検討する。
LLMは、そのプロンプトによって引き起こされる社会的偏見と性能のトレードオフがあることが示される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:12:04 GMT)
SF-GNN: Self Filter for Message Lossless Propagation in Deep Graph Neural Network [38.7] グラフニューラルネットワーク(GNN)は,グラフの伝播と集約によるグラフ構造情報の符号化を主目的とする。
等質グラフ、異質グラフ、知識グラフのようなより複雑なグラフなど、複数の種類のグラフの表現学習において優れた性能を発揮した。
深部GNNの性能劣化現象に対して,新しい視点を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:40:39 GMT)
Multi-Scenario Combination Based on Multi-Agent Reinforcement Learning to Optimize the Advertising Recommendation System [38.5] 本稿では,異なるシナリオを共通の目的の下で整列するマルチエージェント・リカレント決定性ポリシー勾配(MARDPG)アルゴリズムを提案する。
その結果,クリックスルー率 (CTR) , コンバージョン率, 総売上など, 指標の大幅な改善が見られた。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:33:20 GMT)
FairMedFM: Fairness Benchmarking for Medical Imaging Foundation Models [37.8] 医療画像における基礎モデル(FM)研究のためのフェアネスベンチマークであるFairMedFMを紹介する。
FairMedFMは17の一般的な医療画像データセットと統合されており、様々なモダリティ、次元、機密属性を含んでいる。
ゼロショット学習、線形探索、パラメータ効率のよい微調整、様々な下流タスク、分類とセグメンテーションなど、広く使われている20のFMを探索する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:37:36 GMT)
PWM: Policy Learning with Large World Models [37.7] 強化学習(RL)は複雑なタスクにおいて印象的な結果を得たが、異なる実施形態を持つマルチタスク設定に苦戦している。
我々は,大規模マルチタスク世界モデルから連続制御ポリシを学習する新しいモデルベースRLアルゴリズムである,大規模世界モデルを用いたポリシー学習(PWM)を紹介する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:24:02 GMT)
PosMLP-Video: Spatial and Temporal Relative Position Encoding for Efficient Video Recognition [37.6] PosMLP-Videoは、ビデオ認識のための軽量だが強力なバックボーンのようなモデルである。
ImageNet1Kで事前トレーニングされたPosMLP-Videoは59.0%/70.3%のトップ-1精度を達成した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:07:14 GMT)
Cyclic Refiner: Object-Aware Temporal Representation Learning for Multi-View 3D Detection and Tracking [37.2] マルチビュー3次元検出・追跡タスクのための統合オブジェクト認識時間学習フレームワークを提案する。
提案モデルでは,異なる設計のベースラインよりも一貫した性能向上を実現している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:10:19 GMT)
Graph and Skipped Transformer: Exploiting Spatial and Temporal Modeling Capacities for Efficient 3D Human Pose Estimation [36.9] 我々は、簡潔なグラフとSkipped Transformerアーキテクチャを用いて、Transformer-temporal情報を活用するためのグローバルなアプローチを採っている。
具体的には、3Dポーズの段階では、粗粒の体部が展開され、完全なデータ駆動適応モデルが構築される。
実験はHuman3.6M、MPI-INF-3DHP、Human-Evaベンチマークで行われた。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:42:09 GMT)
Jamba: A Hybrid Transformer-Mamba Language Model [36.5] 本稿では,新しいハイブリッドなTransformer-Mamba混在型アーキテクチャに基づく,新しいベースとなる大規模言語モデルであるJambaを紹介する。
JambaはTransformer層とMamba層のブロックをインターリーブし、両方のモデルファミリーの利点を享受する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:30:33 GMT)
Pistis-RAG: A Scalable Cascading Framework Towards Content-Centric Retrieval-Augmented Generation [36.5] Pistis-RAGは、大規模検索拡張生成(RAG)システムの課題に対処するために設計されたスケーラブルなマルチステージフレームワークである。
私たちのフレームワークは、マッチング、序列、ランク付け、推論、集約という、異なるステージで構成されています。
我々の新しいランキングステージは、情報検索の原則を取り入れたRAGシステムに特化して設計されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:54:16 GMT)
Free-SurGS: SfM-Free 3D Gaussian Splatting for Surgical Scene Reconstruction [36.5] 手術シーンのリアルタイム3D再構成は,コンピュータ支援手術において重要な役割を担っている。
近年の3次元ガウススプラッティングの進歩は、リアルタイムな新規なビュー合成に大きな可能性を示している。
外科的シーン再構成のためのSfMフリー3DGS法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:49:35 GMT)
SlerpFace: Face Template Protection via Spherical Linear Interpolation [35.7] 本稿では,事前保護の無効化が可能な拡散モデルを用いて,新たなプライバシ攻撃形態を特定する。
この攻撃は、テンプレートから高品質でアイデンティティを保存する顔画像を合成し、人の外観を明らかにする。
本稿では,拡散モデルの生成能力に関する研究に基づいて,テンプレートをノイズ様の分布に回転させることにより,攻撃に対する防御を提案する。
提案手法は,新しい顔テンプレート保護技術であるSlerpFaceとして実装されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:07:36 GMT)
MindBench: A Comprehensive Benchmark for Mind Map Structure Recognition and Analysis [35.3] 文書分析にMindBenchという新しいベンチマークを導入する。
これには、厳密に構築されたバイリンガル認証または合成画像、詳細なアノテーション、評価指標、ベースラインモデルが含まれる。
これらのタスクには、完全パース、部分パース、位置関連パース、構造化された視覚質問応答(VQA)、位置関連VQAが含まれる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:39:18 GMT)
Advanced Framework for Animal Sound Classification With Features Optimization [35.3] 一般的な動物音響分類に適用可能な自動分類フレームワークを提案する。
提案手法は,精度,リコール,精度を25%以上向上させる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:33:47 GMT)
ConCodeEval: Evaluating Large Language Models for Code Constraints in Domain-Specific Languages [35.2] 大規模言語モデル(LLM)は、ゼロショットと少数ショットの設定で様々なテキスト生成タスクの自然言語制約を理解するのに苦労する。
5つの表現にまたがってコードとして表現されるハード制約とソフト制約を用いてLLMの可制御性を評価するための2つの新しいタスクを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:36:13 GMT)
Analog Quantum Simulator of a Quantum Field Theory with Fermion-Spin Systems in Silicon [34.8] フェルミオンを量子ビットにマッピングすることは、2+1$以上の時空次元で困難である。
シリコン中のドーパントアレイを用いた固有フェルミオンスピンアナログ量子シミュレータを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:00:52 GMT)
Character-Adapter: Prompt-Guided Region Control for High-Fidelity Character Customization [34.3] character-Adapterは、参照文字の詳細を保持するイメージを生成するために設計されたプラグイン・アンド・プレイのフレームワークである。
character-Adapterは、参照文字のきめ細かい地域的特徴を保証するために、プロンプト誘導セグメンテーションを使用する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:26:35 GMT)
Explicitly Guided Information Interaction Network for Cross-modal Point Cloud Completion [34.1] EGIInetはビュー誘導ポイントクラウドコンプリート(ViPC)タスクのモデルである。
本稿では,モーダルアライメントをサポートする情報インタラクション戦略を提案する。
我々は,従来の手法に比べてパラメータが少ないにもかかわらず,ベンチマークデータセットにおいて新しい最先端(XMFnet上で+16% CD)を実現する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:03:56 GMT)
Temporal Interest Network for User Response Prediction [34.0] 本稿では,行動と対象間の意味的・時間的相関を同時に捉えるための時間的関心ネットワーク(TIN)を提案する。
TINは2023年10月から運用に成功し、WeChat Momentsのトラフィックに対応している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 23:28:10 GMT)
Unifying Floquet theory of longitudinal and dispersive readout [33.7] 回路QEDにおける長手および分散読み出しのフロケ理論を考案する。
超伝導及びスピンハイブリッドcQED系に応用する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:00:47 GMT)
Model and Feature Diversity for Bayesian Neural Networks in Mutual Learning [33.6] 深層学習によるBNNの性能向上のための新しい手法を提案する。
実験結果から, 分類精度, 負の対数類似度, キャリブレーション誤差が有意に向上した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:25:25 GMT)
What Affects the Stability of Tool Learning? An Empirical Study on the Robustness of Tool Learning Frameworks [33.5] 本稿では,ツール学習フレームワークの性能に及ぼす内部要因と外部要因の影響について検討する。
今後の研究には、LCMが試行錯誤の増加から大きな恩恵を受けることができるという観察など、洞察に富んだ結論がいくつか見出される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:06:05 GMT)
Noise Contrastive Alignment of Language Models with Explicit Rewards [32.9] 我々は、NCEを利用して、スカラー評価で明示的に注釈付けされた報酬データセットを扱う際のギャップを埋める、LMアライメントのための一般的なフレームワークを提案する。
我々のフレームワークは2つの並列アルゴリズム、NAAとInfoNCAで構成されており、どちらも報酬データと嗜好データからLMポリシーを直接抽出することができる。
NCA と InfoNCA を比較することで,DPO/InfoNCA の減少傾向は,反応の相違による相対可能性の調整に焦点が当てられていることが示される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:53:06 GMT)
Nuisances via Negativa: Adjusting for Spurious Correlations via Data Augmentation [32.7] ラベルとの関係の異なる特徴はニュアンスである。
ニュアンスとラベルの関係を利用するモデルは、これらの関係が変化するとパフォーマンスが低下する。
我々は,意味論に関する知識をデータに悪用して利用するためのアプローチを開発する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:06:56 GMT)
Surface-based parcellation and vertex-wise analysis of ultra high-resolution ex vivo 7 tesla MRI in Alzheimer's disease and related dementias [32.6] アルツハイマー病と関連する認知症にまたがる等方分解能の0.3mmで、82個の脳半球外T2wの1-of-in-kindデータセットを提出した。
Desikan-Killiany-Tourville (DKT) 脳のアトラスを用いて,超高分解能の生体外脳組織を母体空間分解能で解析するために,高速で使いやすく自動表面ベースパイプラインを開発した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:09:31 GMT)
Spectral Estimators for Structured Generalized Linear Models via Approximate Message Passing [28.9] 本研究では,高次元一般化線形モデルにおけるパラメータ推定の問題について考察する。
広く使われているにもかかわらず、厳密なパフォーマンス特性とデータ前処理の原則が、構造化されていない設計でのみ利用可能である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:43:58 GMT)
PharmaGPT: Domain-Specific Large Language Models for Bio-Pharmaceutical and Chemistry [28.4] 大規模言語モデル(LLM)は、複雑な機能工学の必要性を最小限に抑えて、自然言語処理(NLP)に革命をもたらした。
しかし、生物医薬品や化学といった専門分野へのLSMの応用は、まだほとんど解明されていない。
本研究では,13億~70億のパラメータを持つ多言語LLMのスイートであるPharmGPTについて紹介する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:56:40 GMT)
Probing the Feasibility of Multilingual Speaker Anonymization [28.4] 最先端の匿名化システムを9言語に拡張する。
プライバシー攻撃や音声劣化に対する匿名化音声の堅牢性をテストする実験は、全ての言語でこのシステムの全体的な成功を示している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:12:53 GMT)
Align and Aggregate: Compositional Reasoning with Video Alignment and Answer Aggregation for Video Question-Answering [28.4] Video Question-Answering (VideoQA) は一般にブラックボックスとして機能し、それらの推論プロセスを理解し、一貫した構成的推論を行うのが困難である。
本稿では,ビデオコーディネータと応答アグリゲータモジュールを統合することで,既存のVidQA手法の構成整合性と精度を両立させるフレームワークを提案する。
本フレームワークは,既存手法の構成整合性と精度を向上し,より解釈可能な実世界のVidQAモデルを実現する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:07:21 GMT)
Knowledge Transfer with Simulated Inter-Image Erasing for Weakly Supervised Semantic Segmentation [28.2] 弱教師付きセマンティックセグメンテーションのためのtextbfKnowledge textbfTransfer with textbfSimulated Inter-Image textbfErasing (KTSE) アプローチを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:54:33 GMT)
Vision-driven Automated Mobile GUI Testing via Multimodal Large Language Model [28.0] 本稿では,マルチモーダル大規模言語モデルを用いて,非クラッシュな機能的バグを検出する視覚駆動型GUIテスト手法を提案する。
GUIテキスト情報を抽出し、スクリーンショットと整列して視覚プロンプトを形成することで、MLLMはGUIコンテキストを理解することができる。
VisionDroidは、Google Playの29の新しいバグを特定し、そのうち19が確認され、修正されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:58:09 GMT)
Defect Spectrum: A Granular Look of Large-Scale Defect Datasets with Rich Semantics [28.0] Defect Spectrumは、広範囲の産業的欠陥に対して、正確でセマンティックな、そして大規模なアノテーションを提供する包括的なベンチマークである。
4つの重要な産業ベンチマークに基づいて、私たちのデータセットは既存のアノテーションを洗練し、単一のイメージ内の複数の欠陥タイプを識別する、リッチなセマンティックな詳細を導入します。
また、高品質で多様な欠陥画像を作成するために設計された2段階拡散ベースジェネレータであるDefect-Genを紹介する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:11:54 GMT)
A Survey on Trustworthiness in Foundation Models for Medical Image Analysis [27.9] 本稿では, 主な医用画像の基盤モデルについて概説する。
本稿では,医療画像解析の基礎モデル作成の課題について考察する。
我々は、これらのモデルが患者ケアに革命をもたらすための将来的な可能性を探求する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:07:57 GMT)
Quantum coarsening and collective dynamics on a programmable quantum simulator [27.8] 我々は、(2+1)Dイジング量子相転移における集合力学を実験的に研究した。
順序づけられた領域の進化を決定的に準備し、追従することにより、粗い領域は領域境界の曲率によって駆動されることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:29:12 GMT)
FSM: A Finite State Machine Based Zero-Shot Prompting Paradigm for Multi-Hop Question Answering [26.4] 大きな言語モデル (LLM) とチェーン・オブ・シント (COT) のプロンプトは、単純な自然言語推論タスクにおいて印象的な能力を示している。
本稿では,複雑なタスクに対するLLMの推論能力を高めるために,FSM(Finite State Machine)というプロンプト手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:01:01 GMT)
Foster Adaptivity and Balance in Learning with Noisy Labels [26.3] 我々はtextbfSelf-adaptivtextbfE とクラスバランスtextbfD 方式でラベルノイズに対処するための textbfSED という新しい手法を提案する。
平均教師モデルは、ノイズの多いサンプルのラベルを修正するために使用される。
また,検出した雑音に異なる重みを割り当てる自己適応型およびクラスバランスのサンプル再重み付け機構を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:10:24 GMT)
Explainable Natural Language Processing for Corporate Sustainability Analysis [26.3] コーポレート・サステナビリティの概念は、コーポレート・オペレーションの多様で複雑な性質のために複雑である。
企業サステナビリティ評価は、企業サステナビリティの取り組みを反映したデータと、それらを評価するアナリストの両方で主観性に悩まされている。
我々は、説明可能な自然言語処理(XNLP)は企業サステナビリティ分析を大幅に向上させることができると主張している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:27:51 GMT)
Adam-mini: Use Fewer Learning Rates To Gain More [26.0] Adam-miniはAdamの学習率リソースを削減してメモリを削減します。
Adam-miniは、メモリフットプリントを45%から50%削減したAdamWよりも、オンパーまたは優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:38:17 GMT)
Multi-Task Domain Adaptation for Language Grounding with 3D Objects [26.0] 本稿では,3次元オブジェクトを用いたDA4LG(Domain Adaptation for Language Grounding)という新しい手法を提案する。
具体的には、DA4LGは、視覚言語アライメントを実現するために、マルチタスク学習を備えたビジュアルアダプタモジュールで構成されている。
実験の結果,DA4LGは視覚的および非視覚的言語記述間で競合的に機能することが示された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:47:58 GMT)
FRoG: Evaluating Fuzzy Reasoning of Generalized Quantifiers in Large Language Models [25.5] ファジィ推論のための新しいベンチマークFRoGを導入する。
ファジィ推論は大きな言語モデルにとって大きな課題であり続けている。
また、強い数学的推論スキルが必ずしもベンチマークの成功を示すものではないことも示している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:37:53 GMT)
Raw Text is All you Need: Knowledge-intensive Multi-turn Instruction Tuning for Large Language Model [25.5] 本稿では,対話論理のCoD-Chainを利用して,多言語モデル(LLM)を指導指導のための知識集約型多元対話を生成する新しいフレームワークR2Sを提案する。
オープンソースデータセットとドメイン固有のWebcrawledドキュメントの両方の生文書をベンチマークK-BENCHに統合することにより、Wikipedia(英語)、Science(中国語)、Artifacts(中国語)などのさまざまな領域をカバーする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:04:10 GMT)
Reasoning Runtime Behavior of a Program with LLM: How Far Are We? [25.5] コードのための大規模な言語モデル(LLM)は、強力なコード理解と生成能力を示している。
コード推論は、コードLLMの最も重要な能力の1つである。
本稿では,プログラム実行によるLLMのコード推論能力と一貫性を評価するためのフレームワークであるRevalを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 04:10:43 GMT)
Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems [25.1] LLM(Large Language Model)ベースのTODシステムは、コンテキスト内例を通してタスクを学習する能力のため、限られたデータでも優れている。
低データ設定におけるアライメントを改善するために,タスク固有のヒントでLLMを相乗化するSyncTODを提案する。
ChatGPTでは、SyncTODは低データ設定でLLMベースのベースラインやSoTAモデルよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:26:24 GMT)
GLADformer: A Mixed Perspective for Graph-level Anomaly Detection [25.0] マルチパースペクティブなグラフレベルの異常検出器であるGLADformerを提案する。
具体的には、まず、グローバルスペクトル拡張を用いたグラフトランスフォーマーモジュールを設計する。
局所的な異常特性を明らかにするため、帯域通過スペクトルGNNメッセージパッシングモジュールをカスタマイズする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 04:30:01 GMT)
Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory [24.9] 我々は,認知行動療法(Cognitive Behavioral Therapy, CBT)の目標指向的, 構造化的アプローチを用いて, 実生活インタラクションをエミュレートする多ターン対話データセットを作成する。
我々は、実際のカウンセリングセッションの評価、専門家の評価との整合性の確保に使用される確立された心理学的基準をベンチマークする。
Cactusで訓練されたモデルであるCamelはカウンセリングスキルにおいて他のモデルよりも優れており、カウンセリングエージェントとしての有効性と可能性を強調している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:41:31 GMT)
JailBreakV-28K: A Benchmark for Assessing the Robustness of MultiModal Large Language Models against Jailbreak Attacks [24.7] 本稿では,大規模言語モデルのジェイルブレイクを成功させる手法が,MLLMのジェイルブレークに等しく有効かどうかを検討する。
MLLM への LLM ジェイルブレイク手法の転送性を評価するための先駆的なベンチマークである JailBreakV-28K を紹介する。
LLMの高度なジェイルブレイク攻撃と、最近のMLLMのジェイルブレイク攻撃によるイメージベースのジェイルブレイク入力により、20000のテキストベースのジェイルブレイクプロンプトを生成します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:08:14 GMT)
SOS! Soft Prompt Attack Against Open-Source Large Language Models [24.6] オープンソースの大規模言語モデル(LLM)は、一般大衆と業界の両方で人気が高まっている。
一部のオープンソースLLMは使用前に承認を必要としており、サードパーティが容易にアクセス可能なバージョンを公開している。
我々は、計算要求が低く、クリーンなデータやモデルの重みの変更を必要としない新しいトレーニングタイムアタック、SOSを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:35:16 GMT)
I-MedSAM: Implicit Medical Image Segmentation with Segment Anything [24.0] 提案するI-MedSAMは、連続表現とSAMの両方の利点を利用して、クロスドメイン能力と正確な境界線を求める。
トレーニング可能なパラメータが1.6Mしかない提案手法は、離散的および暗黙的を含む既存の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:23:57 GMT)
BACON: Supercharge Your VLM with Bag-of-Concept Graph to Mitigate Hallucinations [23.8] 視覚言語モデル(VLM)の特権を味わう言語能力に制限のあるBag-of-Concept Graph(BACON)ギフトモデル
BACONはアノテーションを基本的な最小要素に分解し、それらをグラフ構造で示す。
100Kの注釈付き画像でデータセットを収集し、優れた機能を備えたVLMを実現する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:55:27 GMT)
Efficient Training of Language Models with Compact and Consistent Next Token Distributions [23.3] 我々は, コーパスを崩壊した$n$-gramの分布で事前集約することで, より良いモデルをより高速に訓練できることを示す。
我々の近似は、より大きなデータセットやモデルへのゲインのスケーラビリティを促進する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:40:41 GMT)
Enabling Discriminative Reasoning in LLMs for Legal Judgment Prediction [23.0] 人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。
ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。
広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:25:23 GMT)
GraCoRe: Benchmarking Graph Comprehension and Complex Reasoning in Large Language Models [22.7] 本稿では,大規模言語モデルのグラフ理解と推論を体系的に評価するベンチマークであるGraCoReを提案する。
GraCoReは、純粋なグラフとヘテロジニアスグラフ上のモデルを分類およびテストするために、3階層の階層分類を使用する。
キーとなる発見は、セマンティックエンリッチメントが推論性能を高め、ノード順序付けがタスクの成功に影響を及ぼし、長いテキストを処理する能力が必ずしもグラフの理解や推論を改善するとは限らないことである。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:12:38 GMT)
Correlation-Guided Query-Dependency Calibration for Video Temporal Grounding [22.6] 相関ガイドによる検出TRansformerは、クエリ関連ビデオクリップのヒントを提供する。
CG-DETRは時間的接地のための様々なベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:05:02 GMT)
Conformal Prediction for Causal Effects of Continuous Treatments [22.1] 本研究では, 連続処理の潜在的な結果に対する新しいコンフォメーション予測法を提案する。
共形予測区間が正当性スコアが未知であっても有効となるように、不確実性推定によって導入された追加的不確実性を考慮する。
我々の知る限りでは、確率スコアが不明で、データから推定しなければならない場合、我々は、継続的治療のための共形予測を最初に提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:34:33 GMT)
MedVH: Towards Systematic Evaluation of Hallucination for Large Vision Language Models in the Medical Context [21.6] LVLM(Large Vision Language Models)は、最近、自然画像やテキストデータにおける様々なタスクにおいて、優れたパフォーマンスを実現している。
それらの進歩にもかかわらず、より小さなデータセットで微調整された場合の幻覚に対するこれらのモデルの堅牢性について、精査された研究がなされている。
領域固有のLVLMの幻覚を評価するために,新しいベンチマークデータセットであるMedVH(MedVH)を導入する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:59:03 GMT)
Single Character Perturbations Break LLM Alignment [20.8] モデル入力の端に空間を付加するだけで、モデルディフェンスを壊すことが可能であることを示す。
トークン化されたトレーニングデータに単一空間が存在する状況は、モデルにトリガーされた時にリストを生成することを奨励する。
本研究は, 現行モデルアライメントの脆弱さを浮き彫りにして, より堅牢なアライメント手法の開発の重要性を推し進めるものである。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:03:10 GMT)
Self-Evaluation as a Defense Against Adversarial Attacks on LLMs [20.8] モデル入力の端に空間を付加するだけで、モデルディフェンスを壊すことが可能であることを示す。
トークン化されたトレーニングデータに単一空間が存在する状況は、モデルにトリガーされた時にリストを生成することを奨励する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:03:42 GMT)
Convergence of flow-based generative models via proximal gradient descent in Wasserstein space [20.8] フローベースの生成モデルは、データ生成と可能性の計算において一定の利点がある。
本研究では,進行流モデルによるデータ分布の生成を理論的に保証する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:05:43 GMT)
Explainable AI for Comparative Analysis of Intrusion Detection Models [20.7] 本研究は,ネットワークトラフィックから侵入検出を行うために,各種機械学習モデルを二分分類および多クラス分類のタスクに解析する。
すべてのモデルをUNSW-NB15データセットで90%の精度でトレーニングしました。
また、Random Forestは正確さ、時間効率、堅牢性という点で最高のパフォーマンスを提供します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:32:51 GMT)
Planetarium: A Rigorous Benchmark for Translating Text to Structured Planning Languages [20.6] benchmarkNameは、計画タスクの自然言語記述からPDDLコードを生成する言語モデルの性能を評価するために設計されたベンチマークである。
13のタスクにまたがる132,037ドルのテキスト-PDDLペアのデータセットを,さまざまな難易度で提示する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:59:53 GMT)
SFC: Achieve Accurate Fast Convolution under Low-precision Arithmetic [20.2] WinogradやFFTといった高速畳み込みアルゴリズムは、深層モデルの畳み込み操作を効率的に高速化することができる。
これらのアルゴリズムは推論精度を維持するために高精度演算に依存しており、これはモデルの量子化と矛盾する。
本稿では、離散フーリエ変換をシンボル計算で拡張することにより、高速畳み込みのための新しい代数変換であるSFCを提案する。
我々の新しいアルゴリズムは、量子化アルゴリズムと高速畳み込み量子化に関する既存の研究の両方を超越しながら、精度を維持しながら量子化モデルの効率をさらに向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:38:14 GMT)
Monotone Generative Modeling via a Gromov-Monge Embedding [19.9] 本稿では, 基礎となるデータ分布の低次元構造を同定し, 基礎となる幾何学を保ちながら低次元の潜在空間にマッピングし, 埋め込み分布への参照測度を最適に伝達する新しいモデルを提案する。
数値実験により,高画質画像の生成とモード崩壊とトレーニング不安定性の両面に対するロバスト性を示す手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:35:27 GMT)
Large Language Model Agents for Improving Engagement with Behavior Change Interventions: Application to Digital Mindfulness [17.1] 大規模言語モデルは、社会的支援をエミュレートできる人間のような対話を提供するという約束を示す。
LLMエージェントがマインドフルネス運動のユーザエンゲージメントに与える影響を評価するために2つのランダム化実験を行った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:43:16 GMT)
STRIDE: Simple Type Recognition In Decompiled Executables [16.8] そこで本研究では,デコンパイラトークンのシーケンスをトレーニングデータと一致させることで,変数名や型を予測する手法STRIDEを提案する。
3つのベンチマークデータセットで評価した結果、STRIDEは可変リタイピングとリネームの両方において、最先端の機械学習モデルに匹敵するパフォーマンスを実現していることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:09:41 GMT)
Scalable Zero-Knowledge Proofs for Verifying Cryptographic Hashing in Blockchain Applications [16.7] ゼロ知識証明(ZKP)は、現代のブロックチェーンシステムのスケーラビリティ問題に対処するための、有望なソリューションとして登場した。
本研究では,暗号ハッシュの計算完全性を保証するため,ZKPの生成と検証を行う手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 21:19:01 GMT)
uDistil-Whisper: Label-Free Data Filtering for Knowledge Distillation via Large-Scale Pseudo Labelling [16.7] ラベル付きデータを使わずに比較的小さなモデルにWhisperモデルを蒸留可能であることを示す。
私たちのモデルは、教師モデルと同等以上の性能を維持しながら、計算とメモリ効率が25~50%向上しています。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:54:08 GMT)
Codec-ASR: Training Performant Automatic Speech Recognition Systems with Discrete Speech Representations [16.6] 本稿では、離散符号を用いたASRシステム構築に関する総合的な分析を行う。
本稿では,量子化スキームや時間領域,スペクトル特徴符号化などの異なる手法について検討する。
同様のビットレートでEncodecを上回るパイプラインを導入する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:51:41 GMT)
LANE: Logic Alignment of Non-tuning Large Language Models and Online Recommendation Systems for Explainable Reason Generation [16.0] 大きな言語モデル(LLM)を活用することで、包括的なレコメンデーションロジック生成の新しい機会を提供する。
レコメンデーションタスクのための微調整LDMモデルは、計算コストと既存のシステムとのアライメントの問題を引き起こす。
本研究は,LLMとオンラインレコメンデーションシステムとの連携を,LLMのチューニングを伴わない効果的戦略LANEを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:20:31 GMT)
LoRA-Guard: Parameter-Efficient Guardrail Adaptation for Content Moderation of Large Language Models [15.9] 大規模言語モデル(LLM)のコンテンツモデレーションのための安全アライメントの代替としてガードレールが登場した。
LLMとガードレールモデル間の知識共有に依存するパラメータ効率の高いガードレール適応法であるLoRA-Guardを導入する。
LoRA-Guardは100-1000倍のパラメータオーバヘッドで既存の手法より優れ、精度を保ちながらオンデバイスコンテンツのモデレーションを実現している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:38:40 GMT)
Solving Motion Planning Tasks with a Scalable Generative Model [15.9] 本稿では,運転シーンのダイナミクスを学習する生成モデルに基づく効率的な解を提案する。
我々の革新的なデザインは、モデルがフルオートレグレッシブモードとパーシャルオートレグレッシブモードの両方で動作できるようにする。
提案した生成モデルは,様々な動作計画タスクの基盤となる可能性がある。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:57:05 GMT)
Differential Encoding for Improved Representation Learning over Graphs [15.8] メッセージパッシングパラダイムとグローバルアテンションメカニズムは、基本的にノードの埋め込みを生成する。
支配的な情報がノード自身からなのか、あるいはノードの隣人からなのかは不明だ。
本稿では,失った情報の問題に対処する差分符号化手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:23:33 GMT)
General Communication Enhancement via the Quantum Switch [15.8] 我々は$mathcalP_n>0$が、量子$tt SWITCH$による通信強化に必要な条件であり、十分な条件であると予想する。
次に、BB84チャネルのプライベートキャパシティを高める量子$tt SWITCH$を含む通信プロトコルを定式化する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:47:13 GMT)
Temperature-scaling surprisal estimates improve fit to human reading times -- but does it do so for the "right reasons"? [15.8] 大規模な言語モデルのキャリブレーションは,通常モデルサイズによって改善されることを示す。
温度スケーリングの確率は、読み取り時間に体系的に適合することがわかった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:12:32 GMT)
Parm: Efficient Training of Large Sparsely-Activated Models with Dedicated Schedules [15.7] 本稿では,MP+EP+ESP学習を高速化するParmを提案する。
Parmは、1.13$times$から5.77$times$のスピードアップを実現し、1296年に手動で設定されたMoEレイヤと、2つの現実世界のMoEモデルで約3$times$の改善を行った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:51:11 GMT)
ITEM: Improving Training and Evaluation of Message-Passing based GNNs for top-k recommendation [15.6] グラフニューラルネットワーク(GNN)はトップkレコメンデーションタスクで注目されている。
GNNは、NDCG@kやRecall@kといったランキングベースのメトリクスで評価される。
評価指標を直接最適化するためのランキング損失関数の利用について検討する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:35:23 GMT)
The Role of Privacy Guarantees in Voluntary Donation of Private Data for Altruistic Goals [15.5] 本研究は,4つのプライバシ保証の下で新たな治療法の開発に医療データを寄付する意思について,ヴィグネット調査を実施している。
以上の結果から,収集データの種類がプライバシの期待に強く影響していることが判明した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:50:48 GMT)
Non-Adversarial Learning: Vector-Quantized Common Latent Space for Multi-Sequence MRI [15.5] 本稿では,各列の離散表現を圧縮し,列間の共通潜在空間のガウス分布を推定する生成モデルを提案する。
BraTS2021データセットを用いた実験では、我々の非敵モデルは他のGANベースの手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:37:01 GMT)
EgoFlowNet: Non-Rigid Scene Flow from Point Clouds with Ego-Motion Support [15.1] 本稿では,オブジェクトをベースとした抽象化を必要とせず,弱い教師付きで訓練されたポイントレベルのシーンフロー推定ネットワークを提案する。
提案手法は,エゴモーションとシーンフローの2つの並列分岐を暗黙的に駆動する二分分割マスクを推定する。
現実的なKITTIのシーンでは,地上点の存在下では,EgoFlowNetは最先端の手法よりも優れた性能を示している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:53:50 GMT)
Optimal thresholds and algorithms for a model of multi-modal learning in high dimensions [15.0] 本論文は,このモデルに対する近似メッセージパッシング(AMP)アルゴリズムを導出し,その性能を高次元限界で特徴づける。
AMPの線形化は、広く使われている部分最小二乗法(PLS)および正準相関解析法(CCA)と数値的に比較される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 21:48:23 GMT)
VIVA: A Benchmark for Vision-Grounded Decision-Making with Human Values [14.1] 本稿では,人間のVAluによって駆動されるVsion-grounded decision-makingのベンチマークであるVIVAを紹介する。
Vilaには、さまざまな現実世界の状況と手動による注釈付き決定を描いている1,062のイメージが含まれている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:59:06 GMT)
Consistent Point Orientation for Manifold Surfaces via Boundary Integration [13.9] 我々は、多様体表面からサンプリングされた点雲に対して、大域的に一貫した正規値を生成するための新しいアプローチを導入する。
提案手法は, ノイズ, 外れ値, 複雑なトポロジ, 細い構造に対する強靭性を示す, 最先端の手法より優れる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:40:21 GMT)
Model Guidance via Explanations Turns Image Classifiers into Segmentation Models [13.9] 説明可能なAI手法による画像分類網の入力から生成した熱マップは、多くの場合、入力画像のセグメンテーションに類似している。
ヒートマップは、画像レベルの監督を伴う弱い教師付きセグメンテーションを達成するためにも活用されている。
差分型ヒートマップアーキテクチャは, 標準的なセグメンテーション損失のトレーニングにおいて, 競争力のある結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:10:23 GMT)
Semi-Supervised Semantic Segmentation via Marginal Contextual Information [13.7] 半教師付きセマンティックセグメンテーションにおける擬似ラベルを強化する新しい信頼度向上手法を提案する。
S4MCと命名された本手法は,擬似ラベルの品質を維持しつつ,トレーニング中に使用するラベルなしデータの量を増加させる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:58:22 GMT)
UFRec: Integrating Uniformity and Frequency to Enhance Sequential Recommendations [13.7] 逐次レコメンデーションのための革新的な双方向拡張手法であるUFRecを紹介する。
UFRecは、シーケンスの均一性とアイテム頻度を利用してパフォーマンスを向上し、特に一様でないシーケンスと低い頻度のアイテムの表現を改善している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:32:34 GMT)
Evaluation of Retrieval-Augmented Generation: A Survey [13.6] 本稿では,Retrieval-Augmented Generation (RAG)システムの評価とベンチマークについて概観する。
具体的には、検索・生成要素の定量化指標(関連性、正確性、忠実性など)について検討・比較する。
次に、様々なデータセットとメトリクスを分析し、現在のベンチマークの限界について議論し、RAGベンチマークの分野を前進させる潜在的な方向性を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 04:59:32 GMT)
How and Why LLMs Use Deprecated APIs in Code Completion? An Empirical Study [13.6] 大規模言語モデル(LLM)では、ライブラリの迅速かつ継続的な進化のために、コード補完は、正しく最新のアプリケーションプログラミングインタフェース(API)を使用するのに苦労する可能性がある。
この研究には、7つの高度なLLM、人気のあるPythonライブラリの145のAPIマッピング、28125の補完プロンプトが含まれていた。
我々は,textscReplaceAPI と textscInsertPrompt の2つの軽量固定手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:37:04 GMT)
Enhancing Translation Accuracy of Large Language Models through Continual Pre-Training on Parallel Data [13.6] 本稿では,並列データに対して,事前学習された大規模言語モデルを継続的に事前学習する2相学習手法を提案する。
日本語と英語と日本語の13種類のテストセットを用いて,これらの手法の評価を行った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:23:36 GMT)
LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control [13.6] Portrait Animationは、単一のソースイメージからビデオを合成し、それを外観参照として使用し、駆動ビデオ、オーディオ、テキスト、または生成から派生したモーションで合成することを目的としている。
我々はLivePortraitというビデオ駆動のポートレート・アニメーション・フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:41:39 GMT)
Images Speak Louder than Words: Understanding and Mitigating Bias in Vision-Language Model from a Causal Mediation Perspective [13.5] 広範囲なデータセットで事前訓練された視覚言語モデルは、性情報とオブジェクトやシナリオを関連付けることによって、必然的にバイアスを学習することができる。
本稿では,因果媒介分析を取り入れた枠組みを提案し,バイアス発生と伝播の経路を計測・マッピングする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:19:45 GMT)
The More the Merrier? Navigating Accuracy vs. Energy Efficiency Design Trade-Offs in Ensemble Learning Systems [13.5] 我々は,精度とエネルギー消費のトレードオフの可能性について,アンサンブル学習のための3種類の設計判断を分析した。
我々はJの精度(F1スコア)とエネルギー消費(トレーニングと推論の両方)を測定した。
私たちは、サブセットベースのトレーニング、多数決投票、決定木、ネイブベイズ、KNNのようなエネルギー効率の良いMLアルゴリズムを使用して、小さな(最大3モデルまたは2モデル)アンサンブルを設計することを推奨します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:45:17 GMT)
Representation learning with CGAN for casual inference [13.5] 因果推論のためのCGANを用いた条件表現学習についてはほとんど研究されていない。
本稿では,敵対的アイデアを取り入れた表現学習関数の探索手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:51:57 GMT)
Probing Perfection: The Relentless Art of Meddling for Pulmonary Airway Segmentation from HRCT via a Human-AI Collaboration Based Active Learning Method [13.4] 肺気管分節症では, 注記データの不足が主訴である。
ディープラーニング(DL)メソッドは、'ブラックボックス'モデルの不透明さとパフォーマンス向上の必要性という課題に直面します。
多様なクエリ戦略とさまざまなDLモデルを組み合わせることで、これらの課題に対処する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 23:27:53 GMT)
Towards Efficient and Optimal Covariance-Adaptive Algorithms for Combinatorial Semi-Bandits [12.7] プレイヤーが$d$ベースアイテムを含むセットのパワーセットから$P$アクションの中から選択する半帯域の問題に対処する。
提案手法は半帯域フィードバックを効果的に活用し,帯域フィードバックアプローチより優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:29:43 GMT)
GMM-ResNext: Combining Generative and Discriminative Models for Speaker Verification [12.6] 話者検証のためのGMM-ResNextモデルを提案する。
2つの性関連GMMに基づく2経路GMM-ResNextモデルも提案されている。
提案されたGMM-ResNextは、VoxCeleb1-OテストセットのResNet34とECAPA-TDNNと比較して、EERの48.1%と11.3%の相対的な改善を実現している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:14:18 GMT)
Mixture-of-Experts for Open Set Domain Adaptation: A Dual-Space Detection Approach [12.6] Open Set Domain Adaptation (OSDA)は、ソースとターゲットドメイン間の分散とラベルシフトに同時に対処することを目的としている。
画像特徴空間とルーティング特徴空間の不整合を利用して未知のクラスサンプルをしきい値なしで検出するDual-Space Detectionを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:51:56 GMT)
Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba [11.4] イベントカメラは、最小限の電力を消費しながら、低レイテンシで高ダイナミックレンジで環境光の変化を効率的に検出する。
イベントデータを処理する現在のアプローチでは、フレームベースの表現に変換することが多い。
Point Cloudは3D処理の一般的な表現であり、イベントカメラのスパースと非同期性に適合するのに適している。
提案するEventMambaは,最先端(SOTA)のフレームベース手法と比較しても,競合的な結果が得られる,効率的かつ効果的なPoint Cloudフレームワークである。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:17:06 GMT)
Biomechanics-informed Non-rigid Medical Image Registration and its Inverse Material Property Estimation with Linear and Nonlinear Elasticity [11.4] 本稿では,生体力学的制約のない医用画像登録と軟組織材料特性の正確な同定を物理インフォームドニューラルネットワーク(PINN)を用いて検討する。
複素非線形弾性理論を利用して、満たすべき生体力学的制約の物理法則を表す偏微分方程式(PDE)を正式に確立する。
前立腺癌生検の臨床例から、変形しないMRI画像と変形したMR画像のペアを用いて、2つの実験が実施された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:26:07 GMT)
On the Client Preference of LLM Fine-tuning in Federated Learning [11.4] 人間のフィードバックによる強化学習(RLHF)は、好みのデータセットを用いて事前訓練された大規模言語モデル(LLM)を微調整する。
提案するFedBisを用いて、クライアントが好みのデータセットでバイナリセレクタを協調的にトレーニングする実行可能なフレームワークを提案する。
我々はまた、クライアントを好みに応じてバランスの取れたクラスタに整理し、複数のセレクタを訓練する新しいアルゴリズムであるFedBiscuitを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:02:24 GMT)
Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization [11.3] セキュアなマルチパーティ計算に基づく意思決定ツリーのためのマルチパーティトレーニングフレームワークにより、複数のパーティが、プライバシ保護を備えた分散プライベートデータ上で、高性能モデルをトレーニングすることができる。
決定木のための既存のマルチパーティトレーニングフレームワークは、通信オーバーヘッドが大きいため、コミュニケーションの非効率性を実証する。
本稿では,コミュニケーション最適化による意思決定木のための効率的な3要素学習フレームワークであるEntsを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:01:42 GMT)
BeNeRF: Neural Radiance Fields from a Single Blurry Image and Event Stream [11.2] 一つのぼやけた画像とそれに対応するイベントストリームからニューラル放射場(NeRF)を復元する可能性を示す。
本手法は暗黙的なニューラルシーンの表現を共同で学習し,カメラの動きを復元する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:17:05 GMT)
Learning Disentangled Representation in Object-Centric Models for Visual Dynamics Prediction via Transformers [11.2] 最近の研究は、オブジェクト中心の表現が学習力学の精度を大幅に向上させることを示した。
対象中心モデルにおける視覚力学予測の精度をさらに向上することは可能か?
我々は、オブジェクトが持つ可能性のある属性の種類について、具体的な仮定をすることなく、静的なイメージ citepnsb の場合のこのような非絡み合い表現を学習しようと試みる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:43:54 GMT)
Feature-Specific Coefficients of Determination in Tree Ensembles [11.0] ツリーアンサンブル法は、解釈が難しいモデルで予測を期待できる。
最近のShapley値の導入は、予測された値に対する高速な計算アルゴリズムを伴って、興味をそそる結果を示している。
本稿では,2次損失に関するShapley値を計算する際に,計算複雑性を時間に短縮する効率的なアルゴリズムQ-SHAPを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 21:27:29 GMT)
Large language models, physics-based modeling, experimental measurements: the trinity of data-scarce learning of polymer properties [11.0] 大規模言語モデル(LLM)は、評価、分析、設計のための高速で正確な物質モデリングパラダイムとして約束される。
データ不足の病理に対処する物理ベースのトレーニングパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:57:40 GMT)
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation [10.9] AIoT技術は現代の養鶏経営において重要なトレンドとなり、農業作業の最適化と人的ワークロード削減の可能性を秘めている。
本稿では,エッジAI機能付きCMOSセンサを備えた軽量でインテリジェントなカメラを用いて,ニワトリとその健康状態を特定するための,リアルタイムかつコンパクトなエッジAI対応検出器を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:21:07 GMT)
PRD: Peer Rank and Discussion Improve Large Language Model based Evaluations [10.7] 現代の大規模言語モデル(LLM)は、自動評価と比較が難しい。
本稿では,全ての解答対に対するLLMのペアワイズ選好を考慮に入れたピアランク(PR)アルゴリズムを提案する。
我々のアプローチは高い精度を実現し、人間の判断とよく一致していることがわかりました。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 04:34:03 GMT)
Strong-to-Weak Spontaneous Symmetry Breaking in Mixed Quantum States [10.4] 我々は、(固定対称性の電荷を持つ)正準アンサンブルにおける非零温度の熱状態は、自発的に強い対称性を破るべきであることを示した。
我々は、(固定対称性の電荷を持つ)正準アンサンブルにおける非零温度の熱状態は、自発的に強い対称性を破るべきであると論じる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:04:25 GMT)
Geometrically Local Quantum and Classical Codes from Subdivision [10.4] 幾何学的に局所的な量子符号は$mathbbRD$内の誤り訂正符号であり、チェックは固定空間距離内の量子ビットにのみ作用する。
最近、Portnoyはコードによってポリログまでの最適な寸法と距離を達成し、大きなブレークスルーを遂げた。
本稿では、このステップを回避し、優れた量子低密度パリティチェック符号、バランスの取れた積符号の族が自然に2次元構造を持つことに気づき、構成を合理化する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:14:03 GMT)
Dielectric Fano Nanoantennas for Enabling Sub-Nanosecond Lifetimes in NV-based Single Photon Emitters [10.3] 誘電体ナノアンテナはプラズモンよりも強い発光増強を提供する。
界面エミッタはパーセル増強係数が10、サブns発光寿命が9、偏光コントラストが9である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:15:59 GMT)
Understanding the Expressive Power and Mechanisms of Transformer for Sequence Modeling [10.2] ドット積自己注意などのトランスフォーマーの異なる成分が表現力に影響を及ぼすメカニズムについて検討する。
本研究では,トランスフォーマーにおける臨界パラメータの役割を明らかにする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:23:24 GMT)
A subpolynomial-time algorithm for the free energy of one-dimensional quantum systems in the thermodynamic limit [10.2] 局所的, 翻訳的, 1次元量子系の自由エネルギーを近似する古典的アルゴリズムを導入する。
我々のアルゴリズムは、任意の温度$T > 0のサブポリノミカル時間で実行される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:41:37 GMT)
Federated Learning for Zero-Day Attack Detection in 5G and Beyond V2X Networks [9.9] Connected and Automated Vehicles(CAV)は、5GおよびBeyondネットワーク(5GB)上にあり、セキュリティとプライバシ攻撃のベクトルの増加に対して脆弱である。
本稿では,ネットワークトラフィックパターンのみに依存する攻撃を検知するディープ・オートエンコーダ法を利用した新しい検出機構を提案する。
連合学習を用いて、提案した侵入検知システムは、CAVのプライバシーを維持し、通信オーバーヘッドを最小限に抑えながら、大規模で多様なネットワークトラフィックで訓練することができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:42:31 GMT)
Speaker- and Text-Independent Estimation of Articulatory Movements and Phoneme Alignments from Speech [9.8] 本稿では,従来別々に扱われていたAAIとPTAの動作推定という2つのタスクの組み合わせを紹介する。
我々はこの共同作業を音響音素-調音音声インバージョン(APTAI)と呼ぶ。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:13:04 GMT)
When Benchmarks are Targets: Revealing the Sensitivity of Large Language Model Leaderboards [9.8] 既存のリーダーボードでは,LLMの相対的な性能は細部まで非常に敏感であることが示されている。
一般的なマルチチョイス質問ベンチマーク(MMLUなど)では、選択の順序や解答の選択方法の変更など、ベンチマークに対する小さな摂動が最大8位までランクが変更されることが示されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:20:43 GMT)
CRUISE on Quantum Computing for Feature Selection in Recommender Systems [9.7] 我々は、推奨アルゴリズムにおける特徴選択問題に対処するためにQuantum Annealersを使用します。
対実解析を取り入れることで、項目ベースKNN推薦アルゴリズムの性能を大幅に改善する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:34:56 GMT)
SOAF: Scene Occlusion-aware Neural Acoustic Field [9.7] そこで我々は,Scene Occlusion-aware Acoustic Field (SOAF) と呼ばれる新しい手法を提案する。
提案手法は,距離対応パラメトリック音波伝搬モデルを用いた音場に先行する手法である。
そこで我々は、Fibonacci Sphereを用いて、受信機を中心にした局所音場から特徴を抽出し、新しい視聴のための音声を生成する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:24:37 GMT)
Multi-Task Decision-Making for Multi-User 360 Video Processing over Wireless Networks [9.6] 無線マルチユーザーバーチャルリアリティ(VR)システムにおいて,360度ビデオ処理におけるマルチタスク決定問題について検討する。
これはデータボリュームと帯域幅の増大を犠牲にしている。
本稿では,ビデオフレーム間の再バッファリング時間と品質変化がユーザおよびビデオ要求に依存する,制約付きクオリティ・オブ・エクスペリエンス(QoE)問題を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:09:25 GMT)
Attention Incorporated Network for Sharing Low-rank, Image and K-space Information during MR Image Reconstruction to Achieve Single Breath-hold Cardiac Cine Imaging [9.5] 我々は,MRI再構成のための新しい深層学習ネットワークに,低ランク,画像,k空間を含む複数の領域からの情報を埋め込むことを提案する。
A-LIKNetは並列ブランチ構造を採用し、k空間と画像領域で独立した学習を可能にする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:54:43 GMT)
Holistic view of the road transportation system based on real-time data sharing mechanism [9.5] 本稿では,リアルタイム共有機構に基づく道路交通システムの時空グローバルビューを構築する。
道路利用者と管理者の両方が、近くの車両の運転意図や道路インフラのリアルタイム状態にタイムリーにアクセスできる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:10:05 GMT)
Learnability in Online Kernel Selection with Memory Constraint via Data-dependent Regret Analysis [9.5] 本稿では,オンライン学習可能性,メモリ制約,データ複雑性の関連性を示す。
本稿では,2種類の損失関数に対してデータ依存上界を与えるアルゴリズムフレームワークを提案する。
以上の結果から,2つのデータ複雑度が線形である場合,小さなメモリ制約内で学習が可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:42:46 GMT)
Joint Optimization of Resource Allocation and Data Selection for Fast and Cost-Efficient Federated Edge Learning [9.5] FEEL(FEEL)を導入したワイヤレスエッジでの学習
本稿では,効率的なシステム,連合型共同資源割り当てとデータ選択を提案する。
共同資源配分とデータ選択という提案手法の優位性を検証した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:03:59 GMT)
Towards a Scalable Reference-Free Evaluation of Generative Models [9.3] 本稿では、VENDIとRKEのエントロピースコアを推定するためのカーネルエントロピー近似(FKEA)法を提案する。
我々は、FKEAの数値性能を、標準画像、テキスト、ビデオデータセットに適用して広範囲に評価する。
実験結果から,大規模生成モデルに適用する手法のスケーラビリティと解釈可能性を示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:54:58 GMT)
Exploiting Dialect Identification in Automatic Dialectal Text Normalization [9.3] 我々は、方言アラビア語を標準オーソグラフィー(CODA)に標準化することを目指している。
我々はCODAフィケーションのタスクに基づいて,新たに開発されたシーケンス・ツー・シーケンスのモデルをベンチマークした。
方言識別情報を使用することで,すべての方言のパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:30:03 GMT)
What's color got to do with it? Face recognition in grayscale [9.3] 最先端のディープCNNフェイスマーカは通常、カラーフェイスイメージの広範なトレーニングセットを使用して作成される。
本研究は、トレーニングセットのグレースケールまたはカラーバージョンでトレーニングした場合、そのようなマーカがほぼ同一の精度に達することを明らかにした。
より浅いモデルは、複雑な表現をモデル化する能力に欠けており、色に関連するような低レベルの特徴に強く依存している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:43:41 GMT)
Universal Gloss-level Representation for Gloss-free Sign Language Translation and Production [9.1] Universal Gloss-level Representation (UniGloR)は手話翻訳と手話生成のための統一的で自己指導型のソリューションである。
本結果は,UniGloRの翻訳および生産における有効性を示すものである。
本研究は, 自己指導型学習を統一的に実現し, 革新的かつ実践的な応用の道を開くことを示唆する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:12:36 GMT)
PII-Compass: Guiding LLM training data extraction prompts towards the target PII via grounding [9.0] ドメイン内データを用いて手作業で構築した抽出プロンプトを接地することで,個人識別情報(PII)の抽出性を向上させることができることを示す。
提案手法は,1,128,128,2308問合せでそれぞれ0.92%,3.9%,6.86%のPII電話番号抽出率,すなわち15人に15人の電話番号を抽出可能である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:20:04 GMT)
ESBMC-Python: A Bounded Model Checker for Python Programs [9.0] 本稿では,Pythonプログラムの検証ツールを紹介する。
入力プログラムを抽象構文木に変換し、型情報を推論し追加する。
この記述を、満足度モジュラー理論の解法を用いて評価された公式に変換する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:38:14 GMT)
Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment [8.9] 量子化対応直接選好最適化(QDPO)は、量子化大言語モデル(LLM)の会話能力を改善する
各種言語における2つの命令調整LDMにおいて,QDPOは,既存のPTQや知識蒸留細調整技術と比較して,会話能力の向上に優れた性能を示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:19:06 GMT)
YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [8.8] 従来の溶解度予測技術は、しばしば分子トラクチャーの複雑な性質を捉えるのに失敗し、予測と実際の結果の間に顕著な違いをもたらす。
本研究では,注目に基づくトランスフォーマー,Long Short-Term Memory(LSTM)ネットワーク,GCN(Graph Convolutional Networks)を組み合わせた新しいディープラーニングフレームワークを提案する。
本手法は,0.55の相関係数(R2$)と0.59のルート平均角誤差(RMSE)を達成し,ベンチマークモデルのスコア(R2$)と0.61(RMSE)を上回った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:12:02 GMT)
Fine-Grained Scene Image Classification with Modality-Agnostic Adapter [8.8] MAA(Modality-Agnostic Adapter)と呼ばれる新しいマルチモーダル特徴融合手法を提案する。
我々は分散のモーダル差を排除し、その後、意味レベルの特徴融合のためにモダリティに依存しないトランスフォーマーエンコーダを使用する。
実験により,MAAは従来の手法と同一のモーダル性を適用することで,ベンチマーク上での最先端の結果が得られることを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:57:14 GMT)
ISWSST: Index-space-wave State Superposition Transformers for Multispectral Remotely Sensed Imagery Semantic Segmentation [8.7] Index-space-wave state superposition Transformer (ISWSST) は、MSRSIセマンティックセグメンテーションのために提案される最初の方法である。
ISWSSTは、MSRSIセグメンテーションタスクの最先端アーキテクチャよりも検証され、優れている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:54:17 GMT)
Correlated Privacy Mechanisms for Differentially Private Distributed Mean Estimation [8.7] CorDP-DMEは、ローカルディファレンシャルプライバシ(LDP)と分散DP(SecAgg)のギャップにまたがる新しいDP-DMEである。
我々はCorDP-DMEの情報理論解析を行い、任意のプライバシパラメータの下での実用性に関する理論的保証を導出する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:22:33 GMT)
How high-status women promote repeated collaboration among women in male-dominated contexts [8.6] ある女性が地位が急な階層で上位にある場合、そのチームの他の女性は、男性よりも再び協力する可能性が高い。
急な階層では、上位階級の女性であるが上位階級の男性ではない女性は、同様の地位にある下層階級の男性よりも、下層階級の女性が再び協力する傾向にある。
現状階層は, 若年者同士の反復的コラボレーションに特に有害であるのに対し, 急激な地位階層の女性は, 男女間のネガティブな影響を緩和することが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:41:48 GMT)
SAFT: Towards Out-of-Distribution Generalization in Fine-Tuning [8.6] Sparse Adaptation for Fine-Tuning (SAFT) を導入する。これは、ファインチューニングが事前訓練されたモデルにおける一般的な知識を忘れないようにする手法である。
モデルパラメータのわずか0.1%で、SAFTはCLIPの性能を大幅に改善できる。
ImageNetのほんの数ショットの学習ベンチマークで、SAFTはOOD設定における従来の微調整法よりも平均5.15%向上した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:56:55 GMT)
Documenting Ethical Considerations in Open Source AI Models [8.5] 本研究では,開発者がオープンソースAIモデルの倫理的側面を実際にどのように文書化しているかを検討する。
2,347の文書の最初の集合をフィルタリングした後、265の関連文書を特定した。
モデル行動リスク、モデルユースケース、モデルリスク軽減の6つのテーマが浮かび上がっています。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:08:01 GMT)
ObfuscaTune: Obfuscated Offsite Fine-tuning and Inference of Proprietary LLMs on Private Datasets [8.5] この研究は、モデルプロバイダが所有する独自のLLMの推論と微調整を行うという、未解明のタイムリーな問題に対処する。
本稿では, シンプルで効率的な難読化手法と秘密計算の効率的な利用を併用した, 新規で効率的で完全かつ実用的保存手法であるObfuscaTuneを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:54:08 GMT)
IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization [8.5] IncogniTextは,テキストを匿名化して潜在的敵を誤認し,誤った属性値を予測する手法である。
実証評価の結果,私的属性の漏洩が90%以上減少した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:49:03 GMT)
Unveiling and Controlling Anomalous Attention Distribution in Transformers [8.5] ウェイバー現象は、要素が情報への貢献に影響を与えることなく過剰な注意を吸収することを可能にする。
特定のモデルでは、位置符号化と注意パターンの違いにより、モデルによるウェイブラー要素の選択は2つの方法に分類できることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:19:59 GMT)
How Similar Are Elected Politicians and Their Constituents? Quantitative Evidence From Online Social Network [8.4] 選出された政治家とその構成員のオンライン談話を比較する。
政治家は、選挙区が右派または左派の政治家を選出するかどうかにかかわらず、内容やスタイルの観点からも、その構成員と等しく似ている傾向にある。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:36:26 GMT)
Fredformer: Frequency Debiased Transformer for Time Series Forecasting [8.4] Transformerモデルは時系列予測において主要なパフォーマンスを示している。
データの中で低周波の特徴を学習し、高周波の特徴を見落とし、周波数バイアスを示す傾向がある。
そこで我々はFredformerを提案する。Fredformerは、異なる周波数帯域にまたがる特徴を均等に学習することで、周波数バイアスを軽減するために設計されたフレームワークである。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:24:39 GMT)
Soft Begging: Modular and Efficient Shielding of LLMs against Prompt Injection and Jailbreaking based on Prompt Tuning [8.3] この抽象概念は、"soft begging"と呼ばれる、インジェクションやジェイルブレイク攻撃から大きな言語モデルを保護する新しいアプローチを探求している。
本稿では,インジェクションとジェイルブレイクについて概説し,この手法の理論的基礎を紹介し,その有効性について論じる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:52:09 GMT)
WizardMerge -- Save Us From Merging Without Any Clues [8.2] WizardMergeは、Gitのマージ結果を利用して、テキストとLLVM-IRレベルのコードブロック依存を検索する補助ツールです。
その結果、WizardMergeは競合の合併コストを減少させ、23.85%の削減を実現している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:40:29 GMT)
Generation and characterization of customized perfect Laguerre-Gaussian beams with arbitrary profiles [8.2] 所望の曲線の周囲に最大強度が局在するパーフェクトラゲール・ガウスビーム(PLG)の発生を実験的に実証した。
我々はこれらのビームの伝搬特性を特徴付け、同じ強度プロファイルを持つ非回折因果ビームと比較する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:40:59 GMT)
Artificial Inductive Bias for Synthetic Tabular Data Generation in Data-Scarce Scenarios [8.1] 本稿では,限られた実データ環境下でDGM(Deep Generative Models)を用いて,現実的で信頼性の高い合成データを生成する手法を提案する。
本稿では,移動学習とメタ学習技術を用いて,DGMにおける人工的帰納バイアスを生成する方法を提案する。
我々は,2つの最先端DGM,すなわち変分オートエンコーダとジェネレーティブ・アダクティブ・アダクティブ・ネットワークを用いて,人工的帰納バイアスがより優れた合成データ品質をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:53:42 GMT)
An Organism Starts with a Single Pix-Cell: A Neural Cellular Diffusion for High-Resolution Image Synthesis [8.0] 我々は、GeCA(Generative Cellular Automata)と呼ばれる新しいモデルのファミリーを紹介する。
GeCAは2つの画像モダリティ(Fundus and Optical Coherence Tomography, OCT)にまたがる網膜疾患分類の効果的な拡張ツールとして評価される
データが不足し,クラス分布が本質的に歪んでいるOCT画像の文脈では,GeCAは11種類の眼科領域の性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:26:09 GMT)
Mast Kalandar at SemEval-2024 Task 8: On the Trail of Textual Origins: RoBERTa-BiLSTM Approach to Detect AI-Generated Text [8.0] SemEval 2024は、マルチジェネレータ、マルチドメイン、マルチ言語ブラックボックスマシン生成テキスト検出のタスクを導入している。
本稿では,テキストをAI生成か人間かの2つのカテゴリに分類するために,RoBERTa-BiLSTMに基づく分類器を提案する。
私たちのアーキテクチャは、125の内、80.83の正確さで、公式のリーダーボードで46位でした。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:22:23 GMT)
RobocupGym: A challenging continuous control benchmark in Robocup [7.9] 本稿では,オープンソースのrcssserver3dサッカーサーバをベースとしたRobocupベースのRL環境を提案する。
各タスクでは、RLエージェントがシミュレートされたロボットを制御し、ボールや他のエージェントと対話することができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:26:32 GMT)
Lift, Splat, Map: Lifting Foundation Masks for Label-Free Semantic Scene Completion [7.8] 本研究では,鳥の視線における連続的,オープンなセマンティクスと高度認識の表現を予測するためのLSMapを提案する。
我々のモデルは1枚のRGBD画像しか必要とせず、人間のラベルを必要とせず、リアルタイムに動作する。
事前学習された表現は、教師なしのセマンティックシーンの完了時に、既存の視覚基盤モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:08:05 GMT)
Wideband Coherent Microwave Conversion via Magnon Nonlinearity in Hybrid Quantum System [7.7] ダイヤモンド中の窒素空孔中心と磁性薄膜CoFeBを結合したハイブリッド量子システムにおけるマイクロ波周波数変換法を実証した。
我々は、0.1GHzから12GHzまでの変換帯域を実現し、最大$mathrm25th$オーダー周波数変換を行う。
磁場中における磁壁などの対称性の破れから生じる非線形性から,本手法は他のスピントロニクスデバイスとスピン量子ビットのハイブリッド系に適応できることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:33:34 GMT)
ULLER: A Unified Language for Learning and Reasoning [7.7] 我々はニューロシンボリック人工知能(NeSy)のための統一言語を提案する。
ULLER(Unified Language for LEarning and Reasoning)と呼ぶ。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:34:31 GMT)
Are demographically invariant models and representations in medical imaging fair? [7.7] 人口統計属性をエンコードしないモデルが望ましいかどうかを問う。
医用画像の公平性には,人口的不変表現は必要ではなく,十分ではないと結論づける。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:52:58 GMT)
CiteAssist: A System for Automated Preprint Citation and BibTeX Generation [7.1] CiteAssistは、プリプリントのためのBibエントリの自動生成システムである。
CiteAssistはPDFの最後にBibの引用を自動的に添付し、文書の最初のページにリンクする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:18:29 GMT)
Improving Sequential Query Recommendation with Immediate User Feedback [6.9] 本稿では,対話型データ探索設定における次のクエリレコメンデーションのためのアルゴリズムを提案する。
人気のあるオンライン文献発見サービスからログファイルを用いて大規模な実験を行った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:44:31 GMT)
HRDE: Retrieval-Augmented Large Language Models for Chinese Health Rumor Detection and Explainability [6.8] 本稿では、一般的な健康関連質問のWebスクレイピングを通じて、12万件の健康関連噂(HealthRCN)を含むデータセットを構築する。
我々は,中国の健康噂の検出と説明可能性 (HRDE) のための検索強化された大規模言語モデルを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:18:40 GMT)
Value-Penalized Auxiliary Control from Examples for Learning without Rewards or Demonstrations [6.8] 本研究は,実例(VPACE)から価値額化補助制御を導入する。
我々は、スケジュールされた補助制御と補助タスクの例を追加することで、サンプルベース制御における探索を大幅に改善する。
3つのシミュレーション環境と1つの実際のロボット操作環境,21のタスクにまたがって,本手法が学習効率を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:54:11 GMT)
Curvature Clues: Decoding Deep Learning Privacy with Input Loss Curvature [6.7] 入力に対する損失の曲率(所定入力損失曲率)は、入力に関する損失のヘシアンのトレースである。
我々は,プライバシとトレーニングセットのサイズに基づいて,列車試験の識別可能性の上限を導出する理論的枠組みを開発する。
この洞察は、入力損失曲率を利用した新しいブラックボックスメンバーシップ推論攻撃の開発を促進する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:47:46 GMT)
Self-distilled Masked Attention guided masked image modeling with noise Regularized Teacher (SMART) for medical image analysis [6.7] 注意誘導型マスク画像モデリング(MIM)を用いた事前学習型視覚変換器(ViT)は、自然画像解析において下流の精度を向上することを示した。
我々は,MIMの選択的マスキングを誘導するために,雑音の多い運動量更新教師を組み合わせた共蒸留スウィントランスを開発した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:49:33 GMT)
Wearable Device-Based Real-Time Monitoring of Physiological Signals: Evaluating Cognitive Load Across Different Tasks [6.7] 本研究は,中等教育学生の脳波(EEG)データに対する認知負荷評価を行うために,最先端のウェアラブルモニタリング技術を用いている。
この研究は、中等教育学生の認知負荷を評価するための応用価値と、様々な課題にまたがる有用性について考察した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:33:29 GMT)
e-Health CSIRO at "Discharge Me!" 2024: Generating Discharge Summary Sections with Fine-tuned Language Models [6.5] BioNLP 2024 Shared Task on Streamlining Discharge Documentation (Discharge Me!
我々は,複数のオープンソース言語モデル (LM) を微調整し,デコーダのみとエンコーダのみを含む生成タスクにアプローチする。
その結果, 生成作業において, 目標区間に先行する放電概要の内容に対する条件付けが有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:32:28 GMT)
Deep learning for 3D human pose estimation and mesh recovery: A survey [6.5] 本稿では過去5年間の3次元ポーズ推定のためのディープラーニング手法の進歩を概観する。
我々の知る限りでは、この調査は人間の3次元ポーズ推定のためのディープラーニング手法を包括的にカバーした最初のものであることは間違いない。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:52:33 GMT)
Breeding the Cat Through Superposition of Two Schrodinger Kittens Based on Coupled Waveguides [6.5] オプティカル・シュロディンガーの猫(SC)は、フォールトトレラント量子コンピューティングを実現する可能性から、非常に期待されている。
ここでは、2つの近傍のコヒーレント状態が干渉し、拡大したコヒーレント状態に成長する2つの子猫の重ね合わせにより、大きなSC様状態が生成されることを実証する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:22:38 GMT)
Solving the Inverse Problem of Electrocardiography for Cardiac Digital Twins: A Survey [6.2] ECG逆問題の解決は、正確な仮想心臓モデリングに不可欠である。
近年の進歩は、仮想心臓モデリングの強化に大きく貢献している。
本稿では,ECG逆問題の解法を包括的に検討することを目的とする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:32:37 GMT)
Barium Titanate and Lithium Niobate Permittivity and Pockels Coefficients from MHz to Sub-THz Frequencies [6.1] ニオブ酸リチウム(LN)およびチタン酸バリウム(BTO)のポッケルス係数と誘電率の最初の測定を行った。
これらの性質は、LNのこの周波数範囲にわたって一定であるが、BTOにおいて有意な周波数依存性を持つ。
この研究は、高速BTOデバイスの設計と新しい電気光学材料の開発に基礎を置いている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:37:44 GMT)
Learning from Memory: Non-Parametric Memory Augmented Self-Supervised Learning of Visual Features [6.1] 提案手法では,ニューラルネットワークをメモリコンポーネントに拡張して,現在のイメージビューとこれまで遭遇した概念を比較する。
我々は, 線形, 転送学習, ローショット分類, 画像検索など, 多数の視覚課題に対して, 提案手法をベンチマークする。
実験結果は,新たな正規化子を使わずに安定したSSLトレーニングを実現するための提案手法の有効性を固めるものである。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:46:08 GMT)
Accelerated Proton Resonance Frequency-based Magnetic Resonance Thermometry by Optimized Deep Learning Method [5.9] 本研究の目的は, 動的MR温度マップ再構成における時間分解能の向上である。
トレーニング最適化手法と5つの古典的ニューラルネットワークを2倍および4倍のアンダーサンプリングk空間データに適用した。
深層学習に基づく再建は、臨床FUS熱療法におけるMRサーモメトリーの精度と効率を著しく向上させることができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:49:38 GMT)
ColorizeDiffusion: Adjustable Sketch Colorization with Reference Image and Text [5.7] 事前学習したCLIP画像エンコーダの異なる画像トークンを利用した画像誘導潜時拡散モデルの2つのバリエーションを紹介する。
重み付きテキスト入力を用いて結果の逐次的調整を行うための,対応する操作手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 04:18:49 GMT)
Terrain Classification Enhanced with Uncertainty for Space Exploration Robots from Proprioceptive Data [5.6] 地層分類における不確かさを定量化するニューラルネットワークを提案する。
入力としてプロプリセプティブデータのみを使用して時系列対応アーキテクチャにおいて,モンテカルロ・ドロップアウト,DropConnect,Flipoutによるニューラルネットワークを実現する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:10:50 GMT)
Anomaly-based Framework for Detecting Power Overloading Cyberattacks in Smart Grid AMI [5.6] 本稿では回帰決定木に基づく2段階異常検出フレームワークを提案する。
導入された検出手法は、エネルギー消費の規則性と予測可能性を利用して参照消費パターンを構築する。
アイルランドの500人の顧客を対象とした,実世界の公用エネルギー消費データセットに関する広範な実験を行った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:52:23 GMT)
Transport meets Variational Inference: Controlled Monte Carlo Diffusions [5.6] 本稿では,経路空間上の発散に着目したサンプリングおよび生成モデリングのための原理的かつ体系的な枠組みを提案する。
ベイズ計算のためのemphControlled Monte Carlo Diffusion sampler (CMCD)を開発した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 23:25:33 GMT)
A Systematic Performance Analysis of Deep Perceptual Loss Networks: Breaking Transfer Learning Conventions [5.5] ディープ・パーセプチュアル・ロス(英: Deep Perceptual Los)とは、2つの画像間の誤差をニューラルネットワークから抽出したディープ・特徴間の距離として計算する画像のロス関数の一種である。
本研究は,4つの異なるアプリケーション領域における事前学習損失ネットワークの効果を評価する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:36:43 GMT)
NEBULA: Neural Empirical Bayes Under Latent Representations for Efficient and Controllable Design of Molecular Libraries [5.4] NEBULAはシード化合物を中心とした大規模分子ライブラリーをスケーラブルに生成するための,最初の潜伏3次元生成モデルである。
NEBULAは、サンプルの品質を犠牲にすることなく、既存の方法よりもほぼ1桁早く大きな分子ライブラリを生成する。
ここでのアプローチは、機械学習ベースの薬物発見に極めて有効になることを期待しています。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:10:43 GMT)
A Radiometric Correction based Optical Modeling Approach to Removing Reflection Noise in TLS Point Clouds of Urban Scenes [3.8] TLSが取得した点雲は反射面からの仮想点を含むことが多く、乱れを引き起こす。
本研究では,TLS点雲に対する反射ノイズ除去アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:17:41 GMT)
A Role of Environmental Complexity on Representation Learning in Deep Reinforcement Learning Agents [3.7] 我々は、深層強化学習エージェントを訓練するためのシミュレーションナビゲーション環境を開発した。
ショートカットおよびナビゲーションキューへの露出頻度を変調し,異なる能力を有する人工エージェントの開発に繋がった。
これらのエージェントを駆動する人工ニューラルネットワークの符号化表現について検討し、表現学習における複雑なダイナミクスを明らかにした。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:27:26 GMT)
Face4RAG: Factual Consistency Evaluation for Retrieval Augmented Generation in Chinese [3.7] 従来の検索時拡張世代(RAG)における事実整合性エラーの大きな問題は、FCE(Factual Consistency Evaluation)の研究を動機づけている
我々は,基礎となるLarge Language Models (LLM) に依存しないRAGのための,最初の総合的なFCEベンチマークemphFace4RAGを提案する。
提案するベンチマークでは,既存のFCE手法が論理的誤りを検出できないことを発見した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:49:34 GMT)
Precision at Scale: Domain-Specific Datasets On-Demand [3.6] Precision at Scale (PaS)は、オンデマンドでドメイン固有のデータセットを自動生成するための新しい方法である。
PaSパイプラインは、最先端の基盤モデルと生成モデルを活用して、任意のドメインに属するイメージのコレクションを作成する。
自動生成されたドメイン固有データセットは、ImageNet-1kやImageNet-21kのような大規模教師付きデータセットよりも、事前トレーニングが優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:17:42 GMT)
Protecting Privacy in Classifiers by Token Manipulation [3.5] テキスト分類モデルに焦点をあて、様々なトークンマッピングとコンテキスト化された操作機能について検討する。
いくつかのトークンマッピング関数の実装は簡単で簡単ですが、ダウンストリームタスクのパフォーマンスに大きな影響を与えます。
比較すると、文脈化された操作はパフォーマンスを改善する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:31:52 GMT)
For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives [3.4] この研究は、ソーシャルメディアプラットフォームにおける画像の社会的・文化的影響を大規模に調査するためのフレームワークであるFRESCOを提示する。
FRESCOは、最新のコンピュータビジョン技術を用いて、画像を数値変数と分類変数に分解する。
このフレームワークは、線や色のような基本的な視覚的特徴を含むプラスティックレベル、特定の実体や概念を表す図形レベル、特にオブザーバーとオブザーバーの視点を構築することに焦点を当てた啓示レベルという3つのレベルにわたって画像を分析する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:57:38 GMT)
A Framework for Quantum Finite-State Languages with Density Mapping [3.1] 量子有限状態オートマトン(Quantum finite-state Automaticon, QFA)は、有限メモリを持つ量子系の進化をシミュレートする理論モデルである。
本稿では,QFAを構築し,シミュレーション精度を最大化するための,シンプルで直感的な方法を提供するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:06:37 GMT)
Scaling Data-Driven Building Energy Modelling using Large Language Models [3.0] 本稿では,ビル管理システムにおけるデータ駆動型モデルの開発に伴うスケーラビリティ問題に対処する手法を提案する。
我々は、大規模言語モデル(LLM)を使用して、BMSから構造化データを処理するコードを生成し、BMS固有の要求に対してデータ駆動モデルを構築します。
ケーススタディでは、プロンプトテンプレートの下での双方向のプロンプトは、高いコード生成率とコード精度を実現し、人件費を大幅に削減できることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:34:24 GMT)
ENOT: Expectile Regularization for Fast and Accurate Training of Neural Optimal Transport [3.0] 最適な輸送計画の正確かつ効率的に推定する新しい手法を提案する。
expectile Regularized Neural Transport Optimal (ENOT) と呼ばれる。
ENOTは二重ポテンシャルの学習過程に結合条件を強制する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:02:39 GMT)
Social Bias in Large Language Models For Bangla: An Empirical Study on Gender and Religious Bias [3.0] LLM生成したバングラ語に対する2種類の社会的バイアスについて検討した。
これは、バングラのLLMのバイアス評価を私たちの知識の最大限に活用する、この種の研究としては初めてのものです。
すべてのコードとリソースは、Bangla NLPにおけるバイアス関連研究の進展のために公開されています。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 22:45:36 GMT)
Knowledge-based Consistency Testing of Large Language Models [3.0] 我々は,大規模言語モデル(LLM)の不整合性と知識ギャップを系統的に公開し,測定する。
テストケース構築に知識グラフを活用する自動テストフレームワーク(KONTEST)を提案する。
KONTESTは、意味論的に等価なクエリとテストオラクルの組み合わせによって、LLMの世界の知識の不整合を調査し、測定する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:16:54 GMT)
Performance optimization of a finite-time quantum tricycle [2.9] 有限時間外界駆動型量子三サイクルモデルを確立する。
我々は,三輪車の冷却性能を,冷却速度と実測値を考慮して最適化する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:19:03 GMT)
Recompression Based JPEG Tamper Detection and Localization Using Deep Neural Network Eliminating Compression Factor Dependency [2.8] 本稿では,JPEG画像におけるrepression based forgeryの存在を検出することができる畳み込みニューラルネットワークに基づくディープラーニングアーキテクチャを提案する。
本研究では,リ圧縮機能に基づく画像操作領域のローカライズも目的とする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:19:35 GMT)
On Large Language Models in National Security Applications [2.8] 2023年初頭のGPT-4の圧倒的な成功は、国家安全保障を含む様々な分野にわたる大規模言語モデル(LLM)の変革の可能性を強調した。
本稿では,情報処理,意思決定,運用効率に革命をもたらす可能性を分析し,国家安全保障におけるLLM統合の意義について考察する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:53:22 GMT)
A Framework For Refining Text Classification and Object Recognition from Academic Articles [2.7] 現在の学術論文のデータマイニング手法はルールベース(RB)または機械学習(ML)アプローチを採用している。
我々は,機械学習とルールベースのスキームハイブリッドであるテクストブロックリファインメントフレームワーク(TBRF)を開発した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:46:32 GMT)
Context is Important in Depressive Language: A Study of the Interaction Between the Sentiments and Linguistic Markers in Reddit Discussions [2.7] 本研究では,抑うつにおける言語マーカーと感情表現の文脈としての議論トピックの影響について検討した。
我々の感情分析では、抑うつ者の感情の強さは、コントロールよりも否定的感情と肯定的感情の両方が高いことが判明した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:51:53 GMT)
Fine-tuning Large Language Models with Sequential Instructions [2.5] 既存の命令調整モデルでは、複数の命令でクエリに応答するのに苦労していることがわかった。
我々は、微調整データの一部がシーケンシャルに関連したタスクの連鎖を含むべきであると論じる。
既存のデータセットの命令を多種多様な複雑なシーケンシャルな命令に変換することで、このプロセスを自動化する。
逐次指導チューニングを行ったモデルでは、符号化、数学、オープンエンド生成の結果が改善された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:18:44 GMT)
FairJob: A Real-World Dataset for Fairness in Online Systems [2.4] 広告における求人推薦のためのフェアネス対応データセットを提案する。
収集され、プライバシー基準とビジネス機密に準拠する準備が整った。
匿名化され、センシティブな属性のプロキシを含むにもかかわらず、データセットは予測力を保持します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:30:39 GMT)
Multi-domain improves out-of-distribution and data-limited scenarios for medical image analysis [2.3] 特殊ドメインの代わりに複数のドメインを組み込んだモデルを用いることで、特殊モデルで観測される制限が大幅に軽減されることを示す。
臓器認識では、従来の特殊なモデルと比較して、マルチドメインモデルは精度を最大8%向上させることができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:15:46 GMT)
Enhanced high-dimensional teleportation in correlated amplitude damping noise by weak measurement and environment-assisted measurement [1.9] 弱い測定(WM)と環境支援測定(EAM)によるCADノイズのクォートテレポーテーション向上のための2つの方策
その結果,CADノイズの相関効果は成功の確率を増大させることがわかった。
我々の研究は、量子技術としてのWMとEAMの能力を拡張し、クォート通信におけるCADノイズに対処する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:45:55 GMT)
Tripartite GHZ Entanglement in Monitored Random Clifford Circuits [1.9] 多数体の多部量子絡み合いはよく理解されていない。
我々は、ランダムなクリフォード回路によって生成される状態から抽出できる三部晶グリーンバーガー・ホーネ・ザイリンガー状態(GHZ)の量を数値的に研究する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:36:49 GMT)
Precise and Efficient Orbit Prediction in LEO with Machine Learning using Exogenous Variables [1.9] 地球の軌道における宇宙物体の量の増加は、宇宙状況認識(Space situational Awareness, SSA)にとって重要な課題である。
正確な軌道予測は、宇宙物体の位置と速度を予測し、衝突回避と宇宙デブリの緩和のために重要である。
機械学習と時系列技術を用いることで、計算コストが非常に低い位置決め誤差を発生させることができることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:12:33 GMT)
VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation [1.8] VCHAR(Variance-Driven Complex Human Activity Recognition)は、原子活動の出力を特定の間隔での分布として扱う新しいフレームワークである。
VCHARは、原子活動の正確な時間的・シーケンシャルなラベル付けを必要とせず、複雑な活動認識の精度を高める。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:24:36 GMT)
Solving the inverse problem of microscopy deconvolution with a residual Beylkin-Coifman-Rokhlin neural network [1.8] 光顕微鏡(LM)における従来の明示的手法は、画像取得時に点拡散関数(PSF)に依存する。
本稿では、光学デコンボリューションを近似するために、革新的な物理インフォームドニューラルネットワークであるMulti-Stage Residual-BCR Net(m-rBCR)を提案する。
明示的なデコンボリューション法(例えばリチャードソン=ルーシー)や他の最先端NNモデルとは対照的に、m-rBCRモデルは他の候補よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:09:59 GMT)
Developing a Novel Image Marker to Predict the Clinical Outcome of Neoadjuvant Chemotherapy (NACT) for Ovarian Cancer Patients [1.8] ネオアジュバント化学療法(ネオアジュバントセラピー、Neoadjuvant chemotherapy, NACT)は、卵巣がんの進行期における治療法の一つ。
NACTに対する部分的反応は、近位部破裂手術を引き起こす可能性があり、予後不良を引き起こす。
我々は,NATの早期に高精度な予後予測を実現するために,新しい画像マーカーを開発した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:58:56 GMT)
XferBench: a Data-Driven Benchmark for Emergent Language [1.7] 創発的言語の全体的な品質を評価するためのベンチマークを導入する。
人間の言語における下流のNLPタスクの事前学習データとして、創発言語を用いてこれを計測する。
我々は,人,合成,創発的な言語ベースラインを用いて,ベンチマークの有効性を実証的に検証する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:02:26 GMT)
A Review of the Applications of Deep Learning-Based Emergent Communication [1.7] 創発的コミュニケーション(英: Emergent Communication)または創発的言語(英: emergent language)は、人間の言語に似たコミュニケーションシステムが深層強化学習環境においてどのように出現するかを研究する研究分野である。
本稿では,機械学習,自然言語処理,言語学,認知科学における創発的コミュニケーション研究の応用を包括的にレビューする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:43:54 GMT)
Physics-Informed Boundary Integral Networks (PIBI-Nets): A Data-Driven Approach for Solving Partial Differential Equations [1.6] 偏微分方程式(PDE)は力学系の関連する現象を記述するために広く用いられる。
高次元設定では、PINNは計算領域全体にわたって密度の高いコロケーションポイントを必要とするため、しばしば計算上の問題に悩まされる。
本稿では,PDEを元の問題空間よりも1次元以下で解くためのデータ駆動手法として,Physical-Informed Boundary Networks(PIBI-Nets)を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:31:06 GMT)
Chemical Shift Encoding based Double Bonds Quantification in Triglycerides using Deep Image Prior [1.6] 本研究では, 化学シフトエンコードされたマルチエコ勾配エコー画像からトリグリセリド二重結合をネットワークトレーニングなしで定量化する深層学習法について検討した。
信号制約に基づいたコスト関数を用いて、ニューラルネットワークを1つのデータセットで反復的に更新する。
その結果,Pearson相関係数は0.96。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:40:52 GMT)
Towards Semantically Enriched Embeddings for Knowledge Graph Completion [1.5] 本稿では,KG埋め込み生成のバリエーションに基づいて,既存のKG完了アルゴリズムについて論じる。
その後、KG、LLM内の型情報を利用したアルゴリズムに移行し、最後に、異なる記述論理公理で表されるセマンティクスをキャプチャするアルゴリズムに移行する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:00:37 GMT)
RIDGE: Reproducibility, Integrity, Dependability, Generalizability, and Efficiency Assessment of Medical Image Segmentation Models [1.5] 本稿では, 深層学習に基づく医用画像分割モデルの再現性, 統合性, 依存性, 一般化性, 効率性を評価するための RIDGE チェックリストを提案する。
RIDGEチェックリストは単なる評価ツールではなく、研究の質と透明性の向上を目指す研究者のためのガイドラインでもある。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:57:53 GMT)
The sudden death of quantum advantage in correlation generations [1.4] 量子ノイズの強度が0から連続的に上昇すると、量子的優位性は徐々に低下し、最終的には完全に消える。
驚くべきことに、いくつかのケースでは、量子ノイズの強さが一定の点を超えると、量子の利点は無視できないレベルから突然消えてしまう。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:22:53 GMT)
Cheshire qudits from fractional quantum spin Hall states in twisted MoTe$_2$ [1.4] ツイストされたMoTe$$$ホモ双層は、分数量子スピンホール(FQSH)状態と整合した輸送シグネチャを示す。
我々は,そのようなFQSH状態のパンチホールから形成された,チェシャークイディットと呼ばれるトポロジカル量子メモリ要素を構築する経路について述べる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:00:01 GMT)
AntibotV: A Multilevel Behaviour-based Framework for Botnets Detection in Vehicular Networks [1.4] 本稿では,車載ネットワークにおける車載ボットネット検出のためのマルチレベル動作ベースフレームワークであるAntibotVを提案する。
提案するフレームワークは,攻撃検知のための2つの主要モジュールを結合し,第1のモジュールはネットワークレベルで車両の活動をモニタし,第2のモジュールは車内活動をモニタする。
実験の結果,提案手法は既存手法よりも優れており,検出率は97%以上であり,偽陽性率は0.14%以下であることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 21:07:49 GMT)
Machine Learning Models for Improved Tracking from Range-Doppler Map Images [1.4] 地中移動目標指標(GMTI)レーダのレンジ・ドップラー・マップ(RDM)画像におけるターゲット検出と不確実性推定のための新しい機械学習モデルを提案する。
これらのモデルの出力を用いることで、複雑なマルチターゲット空対地追跡シナリオに対して、複数の仮説トラッカーの性能を大幅に向上できることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:20:24 GMT)
Domain-independent detection of known anomalies [1.3] 異常検出アプローチは、スパースな名目データで訓練することができるが、ドメインの一般化アプローチは、以前は目に見えないドメイン内のオブジェクトを検出することができる。
3つの新しいデータセットを生成することにより、確立されたMVTec ADデータセットを改良する。
SEMLPは、平均画像レベルのAUROCが87.2%であるのに対して、MIROは80.4%である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:35:52 GMT)
GPTQT: Quantize Large Language Models Twice to Push the Efficiency [1.3] 本稿では,学習後量子化手法であるGPTQTを導入し,メモリ使用量の削減と処理速度の向上を図る。
重みの量子化誤差の最小化は非効率であり、過度に適合することを示した。
GPTQTは、最初は線形量子化を用いて重みを相対的に高いビットに量子化し、続いて得られた重みを低ビットバイナリ符号化に変換する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:08:01 GMT)
Enhancements for Real-Time Monte-Carlo Tree Search in General Video Game Playing [1.3] 本稿では,汎用ゲームプレイング(GVGP)におけるモンテカルロ木探索(MCTS)の8つの拡張について論じる。
これらのいくつかは既存の文献から知られており、拡張またはGVGPの文脈で導入されている。
ほとんどの拡張は、個別に適用された場合の勝利率の統計的に有意な増加をもたらすことが示されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:18:28 GMT)
Regurgitative Training: The Value of Real Data in Training Large Language Models [1.3] LLMの性能に及ぼす「相対的学習」の影響について検討した。
退行訓練がLSMの性能を著しく向上させる強い証拠が得られている。
本稿では,3つの異なる戦略を提案して評価する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:42:55 GMT)
IWISDM: Assessing instruction following in multimodal models at scale [1.2] 我々は,視覚言語タスクの無制限な配列を生成するために,指示された仮想VISual Decision Making (iWISDM)環境を紹介する。
iWISDMを用いて,様々な複雑性レベルにわたる視覚課題に追従する命令の3つの異なるベンチマークをコンパイルした。
本研究は,既存のマルチモーダルモデルと創発的マルチモーダルモデルの両方の命令順守性を評価するための頑健なベンチマークとしてiWISDMを確立した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 21:44:23 GMT)
Towards Human-AI Collaboration in Healthcare: Guided Deferral Systems with Large Language Models [1.2] 大規模言語モデル(LLM)は、医療における様々なアプリケーションに有用な技術を提供する。
彼らの幻覚傾向は、批判的な意思決定の状況において受け入れ難い不確実性をもたらす。
人間とAIのコラボレーションは、より良い結果を得るために人間とAIの強みを組み合わせることで、この不確実性を軽減することができる。
本稿では,AIが人間の意思決定者に対してケースをデフェクトした場合にインテリジェントなガイダンスを提供する,新しいガイド付きデフェラルシステムを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:49:15 GMT)
A multi-objective combinatorial optimisation framework for large scale hierarchical population synthesis [1.2] エージェントベースのシミュレーションでは、エージェントの合成集団は個人の構造、行動、相互作用を表現するために一般的に使用される。
大規模集団合成のための多目的最適化手法を提案する。
提案手法は, 個人と世帯間の複雑な階層構造をサポートし, 大規模に拡張可能であり, 連続表復元誤差の最小化を実現する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:01:12 GMT)
Individual Tree Detection in Large-Scale Urban Environments using High-Resolution Multispectral Imagery [1.2] 本研究では,都市環境における個々の木検出のための新しい深層学習手法を提案する。
畳み込みニューラルネットワークを用いて、個々の木の位置を示す信頼マップを回帰する。
本手法は,公共空間とプライベート空間の両方で樹木を検出することによって,完全な空間被覆を実現する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:23:16 GMT)
Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition [1.1] 本稿では,ターゲットアクセントに関する事前知識を必要としないQifusion-Netと呼ばれる層適応核融合モデルを提案する。
実験の結果,提案手法は,複数のアクセントテストデータセットに対して,22.1$%と17.2$%の文字誤り率(CER)を相対的に低減し,ベースラインを上回った。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:35:52 GMT)
A higher-order transformation approach to the formalization and analysis of BPMN using graph transformation systems [1.1] 本稿ではBPMNの実行セマンティクスの形式化を提案する。
私たちのアプローチは、BPMNモデルからグラフ変換システムへの高次の変換に基づいています。
このアプローチの能力を示すため、オープンソースのWebベースツールとして実装しました。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:28:48 GMT)
Smart City Surveillance Unveiling Indian Person Attributes in Real Time [1.1] このプロジェクトは、人々の属性をリアルタイムで識別し分析できる、インドの都市のためのスマート監視システムの構築に焦点を当てている。
人工知能や機械学習などの高度な技術を使って、システムは上半身の色、身に着けているもの、装着しているアクセサリー、ヘッドギアなどの属性を認識できる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:47:59 GMT)
LLMcap: Large Language Model for Unsupervised PCAP Failure Detection [1.0] 機械学習は代替手段を提供するが、ラベル付きデータの不足は精度を制限している。
そこで本研究では,PCAP故障検出のための自己教師付き大規模言語モデル(LLMcap)を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:59:27 GMT)
A multicategory jet image classification framework using deep neural network [0.9] 著者らは、粒子とジェットの特徴抽出によるジェットカテゴリー分離性に注目し、その結果、ジェット分類のための計算効率の良い解釈可能なモデルを生み出した。
この研究は、分離可能な潜在空間で表される高次元データセットがジェット分類のためのより単純なアーキテクチャをもたらすことを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 22:00:35 GMT)
The solving degrees for computing Gröbner bases of affine semi-regular polynomial sequences [0.9] 本研究では,アフィン半正則配列の解度とその均質化配列について検討する。
これらの結果は,Gr"オブザーバー基底の計算方法の正確性に関する数学的に厳密な証明を与えると考えられる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:03:56 GMT)
Accelerating quantum imaginary-time evolution with random measurements [0.9] 量子想像時間進化(Quantum imaginary-time evolution、QITE)は、ハミルトニアンの温度または基底状態を作成するための有望なツールである。
量子フィッシャー情報行列(QFIM)の高速化によるQITEの高速化
本稿では,いくつかの分子システムで実演し,試行するランダム計測想像時間進化(RMITE)アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:06:32 GMT)
Entropy-based Guidance of Deep Neural Networks for Accelerated Convergence and Improved Performance [0.9] 完全に接続された畳み込みニューラルネットワークの処理データとしてエントロピーの変化を測定するために、新しい数学的結果を得る。
ネットワーク処理データとしてのエントロピーの変化を効果的に測定することにより、良好なネットワークに不可欠なパターンを視覚化し、同定することができる。
ベンチマークデータセットにおける画像圧縮、画像分類、イメージセグメンテーションの実験は、これらの損失がニューラルネットワークを誘導し、少ない次元でリッチな潜在データ表現を学習することを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 23:15:39 GMT)
Can machine learning solve the challenge of adaptive learning and the individualization of learning paths? A field experiment in an online learning platform [0.8] デジタル技術に基づく学習内容の個別化は、大きな個人的および社会的利益をもたらす。
大規模なデジタル自己学習プラットフォーム上でランダム化制御試験を行う。
我々は,2つの畳み込みニューラルネットワークに基づくアルゴリズムを開発し,学習経路に応じて4,365ドルの学習者にタスクを割り当てる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:04:05 GMT)
Implementation and Analysis of GPU Algorithms for Vecchia Approximation [0.8] Vecchia Approximationは計算複雑性を減らすために広く使われており、恥ずかしい並列アルゴリズムで計算することができる。
Vecchia Approximationのためにマルチコアソフトウェアが開発されたが、グラフィックス処理ユニット(GPU)上で動作するように設計されたソフトウェアは不足している。
我々の新しい手法は他の2つより優れており、GpGpU Rパッケージに表示されます。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:24:44 GMT)
Measuring Trotter error and its application to precision-guaranteed Hamiltonian simulations [0.8] 本研究では,量子回路上でのアシラリー量子ビットを使わずにトロッター誤差を測定する手法を開発した。
我々は、トロッター化精度を保証し、トロッター$(m,n)$というアルゴリズムを開発する。
適応的に選択された$mathrmdt$は、既知のトロッター誤差の上限から推定されるものより約10倍大きい。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 23:37:26 GMT)
Fast photon-mediated entanglement of continuously-cooled trapped ions for quantum networking [0.8] 我々は、各イオンから1つの可視光子を真空0.8NAの目的によって集めることで、2つのコトラップされた原子バリウムイオン量子ビットを絡み合わせる。
これにより、クォービットは、観測された忠実度が F > 94% 以下の絡み合ったベル状態に投影される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:56:22 GMT)
Magnetic Hysteresis Modeling with Neural Operators [0.8] 本稿では、磁場間のマッピングを学習することで、磁場を示す法則をモデル化するためのニューラル演算子を提案する。
ニューラル演算子(ディープ演算子ネットワークとフーリエニューラル演算子)は、新しい一階反転曲線とマイナーループを予測するために使用される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:45:45 GMT)
What's the Magic Word? A Control Theory of LLM Prompting [0.7] 我々は制御理論のレンズを通して迅速な工学を探求する。
LLMのパネルの制御性に関する実験結果を示す。
短いプロンプトシーケンスは、特定の出力の可能性を劇的に変えることができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 22:23:50 GMT)
Can GitHub Issues Help in pp Review Classifications? [0.7] GitHubイシューから抽出した情報を活用することでラベル付きデータセットの拡張を支援する新しいアプローチを提案する。
以上の結果から,データ拡張にラベル付き問題を用いることで,F1スコアが6.3,機能要求が7.2に向上することが示された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:54:04 GMT)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.7] ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:31:30 GMT)
Iris and Palmprint Multimodal Biometric Recognition using Novel Preactivated Inverted ResNet and Hybrid Metaheuristic Optimized DenseNet [0.7] 本稿では,アイリスとヤシプリントを用いた深層学習アルゴリズムを用いた新しいマルチモーダルバイオメトリック認識システムを提案する。
システムの性能は、精度、検出誤差トレードオフ(DET)曲線、EER(Equal Error Rate)曲線、トータルトレーニング時間に基づいて評価される。
CASIA Palmprint、MMU、BMPD、IITデータセットでテストされたマルチモーダル認識アーキテクチャは、100%の認識精度を実現し、不定形虹彩およびパームプリント識別アプローチを上回っている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:55:15 GMT)
3D Multimodal Image Registration for Plant Phenotyping [0.7] 植物フェノタイピングのための複合マルチモーダルモニタリングシステムにおける複数のカメラ技術の利用は、有望な利益をもたらす。
クロスモーダルパターンの有効利用は、ピクセル・正確なアライメントを実現するために、正確な画像登録に依存する。
本稿では,飛行時間カメラからの深度情報を登録プロセスに統合することにより,これらの課題に対処する新しいマルチモーダル3D画像登録手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:29:46 GMT)
YOLOv5, YOLOv8 and YOLOv10: The Go-To Detectors for Real-time Vision [0.7] 本稿では、YOLOv5, YOLOv8, YOLOv10に着目し、YOLO(You Only Look Once)オブジェクト検出アルゴリズムの進化に焦点を当てた。
これらのバージョンにまたがるエッジデプロイメントのアーキテクチャの進歩、パフォーマンスの改善、適合性を分析します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:40:20 GMT)
How Reliable and Stable are Explanations of XAI Methods? [0.5] ブラックボックスモデルは、社会の中で生活している人間の日常生活にますます使われている。
XAI(Explainable Artificial Intelligence)メソッドが登場し、モデルが特定の予測を行う方法に関するさらなる説明が生まれている。
その結果、現在のXAI法は1つの特定の方法を除いて摂動に敏感であることが判明した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:47:41 GMT)
Explanations Based on Item Response Theory (eXirt): A Model-Specific Method to Explain Tree-Ensemble Model in Trust Perspective [0.5] Ciu、Dalex、Eli5、Lofo、Shap、Skaterといった手法がブラックボックスモデルを説明するために登場した。
Xirtは、ツリーアンサンブルモデルのグローバルな説明とIRTを通してモデルのインスタンスのローカルな説明を生成することができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:08:04 GMT)
Transformers and Cortical Waves: Encoders for Pulling In Context Across Time [0.4] 本研究では,入力シーケンス中の単語のペア間の関連性を計算することにより,変換器の時間的文脈を向上できることを示す。
単一大脳皮質領域や複数の領域を横断する神経活動の波は、同様の符号化原理を実装できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:41:07 GMT)
Quantum State Synthesis: Relation with Decision Complexity Classes and Impossibility of Synthesis Error Reduction [0.3] 本研究では、量子状態合成複雑性クラスと従来の決定複雑性クラスとの関係について検討する。
特に,量子状態合成複雑性クラスにおける合成の質を特徴付ける合成誤差パラメータの役割について検討する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:26:38 GMT)
Matrix product state approximations to quantum states of low energy variance [0.3] 有限エネルギー密度を持つ1次元系における純粋量子状態の効率的なシミュレート方法を示す。
我々は、スペクトルの大部分に中程度の絡み合いエントロピーを持つ非常に狭い支持状態が存在することを証明した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:41:00 GMT)
Balancing Patient Privacy and Health Data Security: The Role of Compliance in Protected Health Information (PHI) Sharing [0.3] 保護された健康情報(PHI)の共有は、患者のケアの質とコーディネーションを著しく向上させ、より正確な診断、効率的な治療計画、患者の歴史の包括的理解に寄与する。
HIPAAのような法律で要求されるような厳格なプライバシーとセキュリティポリシーへのコンプライアンスは、PHIを保護するために重要である。
我々は、スマートコントラクトを統合し、同意関連プロセスを部分的に自動化し、PHIへのアクセスと共有が患者の好みや法的要件に従っていることを保証するブロックチェーン技術を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:49:33 GMT)
Decomposition of Difficulties in Complex Optimization Problems Using a Bilevel Approach [0.3] 実際の最適化問題には、特定の最適化方法に依存する場合、しばしば難解な様々な困難が含まれている。
複雑な最適化問題に対して2つのアプローチを同時に適用できる分解戦略を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:59:17 GMT)
A primer on synthetic health data [0.3] 深層生成モデルの最近の進歩は、現実的な合成健康データセットを作成する可能性を大きく広げている。
これらの合成データセットは、患者のアイデンティティやセンシティブな情報を開示することなく、特徴、パターン、全体的な科学的結論を保存することを目的としている。
しかし、合成データセットの類似性と予測ユーティリティを継続的に評価する方法など、多くの疑問や課題が残っている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:28:13 GMT)
STF: Sentence Transformer Fine-Tuning For Topic Categorization With Limited Data [0.3] Sentence Transformers Fine-tuning (STF) は、事前訓練されたSentence Transformersモデルと微調整を利用して、ツイートからトピックを正確に分類するトピック検出システムである。
我々の主な貢献は、事前訓練された文変換言語モデルを適用することで、ツイートトピック分類における有望な結果の達成である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:34:56 GMT)
Beating Grover search for low-energy estimation and state preparation [0.2] 多体ハミルトニアンの基底状態エネルギーの推定は、量子物理学の多くの分野において中心的な課題である。
この研究において、量子アルゴリズムは、任意の$k$ボディハミルトン$H$を与えられた場合、基底状態エネルギーの見積もりを計算する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:47:06 GMT)
AI Emergency Preparedness: Examining the federal government's ability to detect and respond to AI-related national security threats [0.2] 緊急準備は、政府のAI進捗の監視と予測能力を向上させることができる。
1)コントロールの喪失(人間のコントロールを逃れることのできる強力なAIシステムからの脅威)、(2)悪意のあるアクターによるサイバーセキュリティの脅威、(3)生物兵器の増殖。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:54:01 GMT)
Synthetic data: How could it be used for infectious disease research? [0.2] 人工データセット生成の可能性に関連する潜在的な負の要因について懸念が高まっている。
これには、サイバー犯罪のような分野における生成的人工知能の潜在的な誤用が含まれる。
合成データは、特にデータプライバシ、研究、データセットのバランシングと機械学習モデルのバイアス低減において、大きなメリットを提供する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:13:04 GMT)
Large Language Models as Evaluators for Scientific Synthesis [0.2] 我々は,5つの関連論文の要約から,GPT-4による100の質問とそれらの合成のデータセットを用いて,人間の品質評価を検証した。
予備的な結果から、LLMは品質評価に幾らか適合する論理的説明を提供することができるが、より深い統計分析により、LLMと人間の評価との間には弱い相関関係が示されている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:21:27 GMT)
Development of Machine Learning Classifiers for Blood-based Diagnosis and Prognosis of Suspected Acute Infections and Sepsis [0.2] 急性感染症・敗血症の迅速かつ正確な診断・予後の医学的ニーズに機械学習を適用した。
我々のソリューションは、Mirna (TM) Instrument と組込み TriVerity (TM) 分類器からなる。
マーナ・トリバーティ・システムはアメリカ合衆国食品医薬品局(FDA)によって画期的な装置に指定された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:20:26 GMT)
Human-like Linguistic Biases in Neural Speech Models: Phonetic Categorization and Phonotactic Constraints in Wav2Vec2.0 [0.1] We study how how Wav2Vec2solvs phonotactic constraints。
我々は/l/と/r/の音響連続体に音を合成し、制御された文脈に埋め込む。
人間と同様に、Wav2Vec2モデルは、このようなあいまいな音を処理する際に、音素的に許容できるカテゴリーに対してバイアスを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:04:31 GMT)
High-Entanglement Capabilities for Variational Quantum Algorithms: The Poisson Equation Case [0.1] 離散方程式行列(DPEM)は計算流体力学の分野において不可欠である。
量子コンピュータでそれを解くアルゴリズムは、指数空間と時間複雑性のスピードアップを与える可能性がある。
本研究は,計算流体力学の将来に量子コンピュータが関与することを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:21:08 GMT)
ZEAL: Surgical Skill Assessment with Zero-shot Tool Inference Using Unified Foundation Model [0.1] 本研究はZEAL (unifiEd foundAtion modeLを用いたゼロショット手術ツールセグメンテーションによる外科的スキル評価)について紹介する。
ZEALはセグメンテーションマスクを予測し、楽器と周辺の両方の本質的な特徴を捉えている。
外科的スキルスコアを生成し、客観的な熟練度を提供する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:20:56 GMT)
A new heuristic approach for contextuality degree estimates and its four- to six-qubit portrayals [0.1] 本稿では,量子的文脈構成の文脈性度とそれに対応する不満足な部分の上限を求める新しい手法を紹介し,記述する。
SATソルバをベースとした従来手法は3キュービットに制限されていたが,本手法はより高速で汎用性が高い。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 08:59:30 GMT)
Identification of Device Dependencies Using Link Prediction [0.1] グラフベース機械学習に基づく新しいアプローチを用いて,依存関係の識別に対処する。
この手法は、コンピュータネットワークの通信グラフの潜在表現に基づくリンク予測に属する。
ネットワーク依存に課される時間条件を満たすIPアドレスをランダムにウォーキングする。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:28:09 GMT)
When big data actually are low-rank, or entrywise approximation of certain function-generated matrices [0.0] 我々は、特定の分析関数のクラスに対して、そのような行列は$m$に依存しないランクの正確なエントリーワイズ近似を許容する、という文献の議論に反論する。
n × n$ の関数生成行列が次数 $varepsilon$ のエントリーワイド誤差で階数 $mathcalO(log(n) varepsilon-2 Mathrmpolylog(varepsilon-1)$ で近似できる関数のより狭い3つのクラスを記述する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:29:47 GMT)
Variational Quantum Crank-Nicolson and Method of Lines for the Solution of Initial Value Problems [0.0] Inlicit Crank-Nicolson と Method of Lines (MoL) による初期値問題の解法として変分量子アルゴリズムを用いる。
実装を説明するために開発された例は、Advection equation、一階結合方程式系として記述された波動方程式、非線形の場合として粘性バーガース方程式である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:30:50 GMT)
Using Natural Language Processing and Networks to Automate Structured Literature Reviews: An Application to Farmers Climate Change Adaptation [0.0] 本研究の目的は、変数関係を抽出し、それらの結果をネットワークを用いて合成することで、自然言語処理を巧みに活用することである。
一例として,農家の気候変動適応の分析に本手法を適用した。
その結果,自然言語処理とネットワークを記述的手法で併用することで,文献レビューの結果を高速かつ解釈可能な方法で合成できることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:41:20 GMT)
Universal Quantum Tomography With Deep Neural Networks [0.0] 純量子状態トモグラフィーと混合量子状態トモグラフィーの両方に対する2つのニューラルネットワークに基づくアプローチを提案する。
提案手法は,実験データから混合量子状態の再構成を行なえることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:15:26 GMT)
Understanding and Generalizing Unique Decompositions of Generators of Dynamical Semigroups [0.0] 量子力学的半群のすべての生成元は、両方のトレースが消滅すると仮定して、一意に閉部分と散逸部分に分解されることを示す。
上記の分解は、B$重み付き内積に関するものであることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:20:56 GMT)
Towards Asimov's Psychohistory: Harnessing Topological Data Analysis, Artificial Intelligence and Social Media data to Forecast Societal Trends [0.0] ビッグデータや高度な計算手法の時代には、大規模社会行動の予測がますます実現可能になっている。
本稿では,計算能力と数学的枠組みの統合を理論的に検討する。
これらのツールは、大きなコミュニティのダイナミクスに前例のない明快さをもたらしている、と私は論じます。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:44:36 GMT)
Tensor Networks for Lattice Gauge Theories beyond one dimension: a Roadmap [0.0] ネットワーク法(Network method)は、平衡外における多体量子システムを研究するための数値ツールとアルゴリズムのクラスである。
彼らは高エネルギー物理学における関連する問題に近づく格子ゲージ理論のシミュレーションに重要な応用を見出した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:30:04 GMT)
Teleporting two-qubit entanglement across 19 qubits on a superconducting quantum computer [0.0] 我々は、127量子ビットのIBM量子デバイス上で準備された2量子状態の絡み合いと忠実さを測定し、追跡する。
2ビットグラフ状態の絡み合いは、選択後のアプローチを用いて、少なくとも19ホップのテレポーテーション後に持続することを示す。
ゲート誤差から得られたものと比較して,2ビットの負性から決定される経路において,より高いレベルのテレポーテッド絡みを観測する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:18:06 GMT)
Simulating electron-vibron energy transfer with quantum dots and resonators [0.0] ゲート可能な半導体量子ドット(QD)は、アナログ量子シミュレーションのための汎用的なプラットフォームを提供する。
単一モードマイクロ波共振器をQDに容量的に結合することで分子振動モードを表現する。
電圧バイアス三重量子ドット(TQD)系から単一減衰共振器モードへのゲート可変エネルギー移動について検討した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:35:17 GMT)
Sentence-level Aggregation of Lexical Metrics Correlate Stronger with Human Judgements than Corpus-level Aggregation [0.0] 個々のセグメントレベルのスコアを平均すると、BLEUやchrFのようなメトリクスは人間の判断と非常に強く相関する。
本稿では,低リソース言語に対する機械翻訳システムの評価をより信頼性の高いものにする上で有効である。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:46:24 GMT)
Security Approaches for Data Provenance in the Internet of Things: A Systematic Literature Review [0.0] Internet of Things(IoT)は、保護されていない環境にデプロイされるリソース制限されたデバイスに依存している。
シングルホップとマルチホップのシナリオでは、データ転送中にさまざまなタイプのリスクが直面する可能性がある。
これらの脆弱性に対処することが重要です。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:25:36 GMT)
Qudit-native measurement protocol for dynamical correlations using Hadamard tests [0.0] 動的相関は、基礎となる量子多体系の重要な平衡特性を示す。
我々は、quditオブザーバブルをユニタリ演算に分解することで、この制限を克服する修正されたプロトコルを提案する。
この方式は様々なプラットフォームで容易に実装でき、幅広いアプリケーションを提供できる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:01:29 GMT)
Quasi-probability distribution of work in a measurement-based quantum Otto engine [0.0] 測定に基づく量子オットーエンジンの動作統計について検討し、そこでは量子非選択的測定を用いてエンジンを駆動する。
我々は、ある作業値の確率が負になりうることを実証し、位相空間で見られる準確率分布と似ていることを示した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:09:10 GMT)
Position and Altitude of the Nao Camera Head from Two Points on the Soccer Field plus the Gravitational Direction [0.0] サッカーをするためには、ロボットはフィールド上の現在の位置を適切に見積もる必要がある。
標準プラットフォームリーグの直ロボットは視野が限られているため、カメラフレームが認識できるのは1つか2つの点のみである。
簡易テトラヘドロンの形状から,カメラの被写体と高さhの座標(x, y)を決定する手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:06:34 GMT)
Plant Doctor: A hybrid machine learning and image segmentation software to quantify plant damage in video footage [0.0] 本研究では,アクセス可能なカメラで撮影した映像を用いて,街路植物の自動診断を行うAIシステムを提案する。
本システムは,都市部における病気のコントロールを支援するため,日常的に植物の健康をモニタリングすることを目的としている。
その結果, 葉の損傷診断におけるシステムの堅牢性と精度が示され, 大規模都会の植物病モニタリングにも応用できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:11:18 GMT)
Parametric Light-Matter Interaction in the Single-Photon Strong Coupling Limit [0.0] 本稿では、パラメトリック結合マイクロ波回路の新しいパラダイムを実証する。
1つの線形マイクロ波空洞を超伝導トランスモン量子ビットに置き換える。
強いサイドバンド駆動を適用すると、オンデマンドで非線形のJaynes-Cummingsが線形共振器と相互作用する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:43:52 GMT)
PPO-based Dynamic Control of Uncertain Floating Platforms in the Zero-G Environment [0.0] 本稿では,PPO(Proximal Policy Optimization)とMPC(Model Predictive Control)を組み合わせた革新的なアプローチを提案する。
従来の制御手法とは異なり、このPPO-MPCアプローチはMPC予測から学習し、モデル化されていない力学や乱れに適応する。
この研究は、宇宙探査の進歩を約束するゼロ重力環境における浮体プラットフォーム制御の新しい可能性を開く。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:51:06 GMT)
PCL-Indexability and Whittle Index for Restless Bandits with General Observation Models [0.0] 我々は、任意の初期信念から始まる可算な信念状態空間を持つレスレス・バンディットとして問題を定式化する。
有限状態問題に対するNino-Mora と Bertsimas の AG アルゴリズムを適用可能な問題に変換する近似法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:09:14 GMT)
Multi-Attention Integrated Deep Learning Frameworks for Enhanced Breast Cancer Segmentation and Identification [0.0] 超音波画像を用いた乳腺腫瘍の正確な診断・分類は医学的課題である。
本研究は,乳がん腫瘍の超音波画像からの分類と分類を目的とした多目的ディープラーニング(DL)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:40:26 GMT)
Meson Mass Sets Onset Time of Anomalous Dynamical Quantum Phase Transitions [0.0] 我々は、異常DQPTの開始時刻が、大域対称性破壊相の閉じ込められた状態における中間子質量と、電力法則を介して直接接続されているかを示す。
以上の結果から,中間子と異常DQPTの直接的関連が指摘され,外因性極端平衡臨界度を分類するための後者のパワーが強調された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:00:00 GMT)
MedPix 2.0: A Comprehensive Multimodal Biomedical Dataset for Advanced AI Applications [0.0] 本稿では、データセットMedPix 2.0を構築するためのワークフロー全体について説明する。
データセットとともに、MongoDBインスタンスを効率的にナビゲートするためのGUIを開発しました。
また、分類タスクをスキャンするために、MedPix 2.0でトレーニングされたCLIPベースのモデルを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:49:21 GMT)
Majorana fermion induced power-law scaling in the violation of Wiedemann-Franz law [0.0] マヨラナ境界状態による2次元トポロジカル絶縁体におけるウィーデマン・フランツの法則の違反は、単一粒子像におけるローレンツ比によって研究される。
本研究では,バチカー電圧温度プローブを用いた非弾性散乱によるMBSの存在と欠如におけるローレンツ比のスケーリングについて検討した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 06:25:42 GMT)
M5: A Whole Genome Bacterial Encoder at Single Nucleotide Resolution [0.0] 線形アテンション機構は、エンコーダのみ変換器(M5)のコンテキスト長を、細菌全ゲノム上で事前訓練された数百万の単一ヌクレオチド分解基盤モデルに拡張する。
M5小モデルは、トレーニング中に最大196Kヌクレオチド、テスト中に2Mヌクレオチドを含む40gbのメモリを持つ1つのA100 GPUで完全にトレーニングされ、テストされる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:30:44 GMT)
Long-lived magnetization in an atomic spin chain tuned to a diabolic point [0.0] 量子サイズ効果が顕著になるところまで磁化の量子トンネル(QTM)を拡大する
磁気異方性点(DP)と呼ばれる水平交差付近の磁化寿命の非単調変動を観測する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 00:51:09 GMT)
Lattices, Gates, and Curves: GKP codes as a Rosetta stone [0.0] GKP クリフォードゲートが対応するGKP格子のシンプレクティック自己同型としてどのように生じるかを説明する。
単一モードのGKP符号に対して、楕円曲線のモジュライ空間を持つすべてのGKP符号の空間を同定する。
我々はGKP符号の普遍的なファミリーを構築し、繊維束の耐障害性を明確に構築する方法を示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:57:53 GMT)
Integration of Artificial Intelligence in Educational Measurement: Efficacy of ChatGPT in Data Generation within the Scope of Item Response Theory [0.0] 本研究の目的は,項目応答理論(IRT)の枠組みにおけるデータ生成アルゴリズム開発におけるChatGPT 3.5の有効性を検討することである。
ChatGPT 3.5はIRTの仮定に合致するデータを生成するのにかなり成功したが、研究者によって開発されたアルゴリズムと比較して項目パラメータのシミュレーション条件を満たすのに効果が低いと判断された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:09:09 GMT)
Hawking radiation in quantum Hall system with an expanding edge: application of anomaly method [0.0] 我々は、拡張エッジを持つ量子ホール系において、ウィルツェクとロビンソンの手法をド・シッター時空のアナログに応用する。
この系はキラルであるため、地平線付近で進入モードを課す必要はない。
ド・ジッター地平線のギボンズ・ホーキング温度で外平部におけるホーキング放射のフラックスを求める。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 03:46:48 GMT)
Global Out of Time Order Correlators as a Signature of Scrambling Dynamics of Local Observables [0.0] Out-of-Time-Order Correlatorは、量子情報のスクランブルのプロキシとして機能する。
情報スクランブルを探索するためのOTOCの最も実験的な実装は、地球規模の観測値に基づく間接的な測定に依存している。
我々は、NMR実験の文脈において、OTOCとグローバル・ローカル・オブザーバブルの直接接続を確立する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:59:30 GMT)
Global Context Modeling in YOLOv8 for Pediatric Wrist Fracture Detection [0.0] 小児は日常的に手首を負傷することが多いが、骨折を負った放射線科医は手術前にX線画像を分析し解釈する必要がある。
ディープラーニングの開発により、ニューラルネットワークモデルはコンピュータ支援診断(CAD)ツールとして機能するようになった。
本稿では,GCブロックを用いたYOLOv8モデルの改良版であるYOLOv8モデルを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:36:07 GMT)
Fundamental mechanisms of energy exchanges in autonomous measurements based on dispersive qubit-light interaction [0.0] 自律的な測定スキームでは、システムのエネルギー変化はメーターのエネルギー変化によって補償されなければならない。
ここでは、このような自律的なメートル系力学を理論的に研究する。
我々は、このスペクトル変形の基盤となるメカニズムを明らかにし、量子ビットのエネルギー変化を補う方法を示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:54:36 GMT)
From B Specifications to $\{log$\}$ Forgrams [0.0] このクラスでは、学生がどのようにB仕様を$log$$forgramに変換できるか、これらのforgramをどのように実行し、どのようにプロパティを検証できるかを学ぶことができる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:09:31 GMT)
Federated Distillation for Medical Image Classification: Towards Trustworthy Computer-Aided Diagnosis [0.0] 医用画像分類はコンピュータ支援臨床診断において重要な役割を担っている。
ディープラーニング技術は、効率を大幅に向上し、コストを削減した。
医用画像データのプライバシーに敏感な性質は、集中的な記憶とモデルの訓練を複雑にする。
本稿では,これらの問題に対処するためのフェデレーション学習に基づく,新たなプライバシ保護型医用画像分類フレームワークであるFedMICを提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:57:47 GMT)
Exploring LGBTQ+ Bias in Generative AI Answers across Different Country and Religious Contexts [0.0] ChatGPT 3.5の回答は、バードが人権を強調し、LGBTQ+の問題をもっと支持したのとは対照的に、文化的相対性を示した。
この研究は、AI応答の社会的および倫理的意味を理解することに寄与する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:38:19 GMT)
Effect of a Process Mining based Pre-processing Step in Prediction of the Critical Health Outcomes [0.0] 我々は、データセットの複雑さを減らし、データ品質を改善するために、既存の前処理アルゴリズムである結合を用いています。
MIMIC IIIとイリノイ大学病院の2つのデータベースから16の医療データセットが抽出された。
事前処理されたイベントログは、決定的な結果を予測するために、Decay Mining (DREAM)アルゴリズムの入力としても使用された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 05:45:09 GMT)
Early-Stage Anomaly Detection: A Study of Model Performance on Complete vs. Partial Flows [0.0] 本研究では,異常検出システムにおける機械学習モデル,特にランダムフォレストの有効性について検討した。
実世界のリアルタイムネットワーク環境に典型的な不完全なデータにモデルを適用する際に生じる性能格差について検討する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:14:25 GMT)
Do Quantum Neural Networks have Simplicity Bias? [0.0] 本研究では,量子ニューラルネットワーク(QNN)の帰納バイアスと表現性について検討する。
ある種のQNNでは, 単純さのバイアスが可能であることを示すが, この種のQNNはQNNの表現性を制限していることを示す。
また,QNNに高い表現性を持たせることは可能であるが,誘導バイアスや誘導バイアスが乏しいため,DNNと比較して一般化性能が低下することが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:56:08 GMT)
Direct Estimation of the Density of States for Fermionic Systems [0.0] 我々は状態密度(DOS)を推定して熱力学特性を抽出する量子アルゴリズムを開発した。
我々のアプローチでは、フルヒルベルト空間の特定の部分空間に対してDOSを推定することができる。
提案手法は時間進化におけるアルゴリズム誤差やゲートノイズに対して極めて堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:00:05 GMT)
Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints [0.0] マルチエージェント強化学習パラダイムに拡散モデルを統合する革新的なフレームワークを導入する。
このアプローチは、協調動作をモデル化しながらリスク軽減を通じて、複数のエージェントが取るべき行動の安全性を特に向上させる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:22:15 GMT)
Controlling Plasmonic Catalysis via Strong Coupling with Electromagnetic Resonators [0.0] プラズモニック励起はフェムト秒以内に崩壊し、非熱的(しばしば「ホット」と呼ばれる)電荷担体が化学反応を起こすために分子構造に注入される。
共振器構造とプラズモンナノ粒子との強い結合は、プラズモン励起エネルギーと近傍分子への電荷注入エネルギーとのスペクトル重なりを制御できることを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 15:15:49 GMT)
Continuous Optimization for Offline Change Point Detection and Estimation [0.0] これは、通常の平均多重変化点モデルを、空間性を強制する正規化統計逆問題に再構成する。
最近開発されたベストサブセット選択のための連続最適化フレームワーク(COMBSS)は、近日中に導入され、その問題に関連している。
監督・監督されていない視点は、正規化ペナルティパラメータの選択のための異なるアプローチをテストすることで探索される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:19:59 GMT)
Contextuality in the Bundle Approach, n-Contextuality, and the Role of Holonomy [0.0] 文脈性(Contextuality)は、たとえ局所的な合意があるとしても、モデル全体の一貫した記述を構築することができないと理解することができる。
バンドルアプローチでコンテキスト性を記述することができ、シナリオは単純複合体として表現される。
我々は,n-contextualityと呼ばれる階層を導入し,シナリオのトポロジに対するモデルの文脈的振る舞いの依存性を探索する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 17:27:42 GMT)
CogErgLLM: Exploring Large Language Model Systems Design Perspective Using Cognitive Ergonomics [0.0] LLMと認知エルゴノミクスを統合することは、人間とAIの相互作用における安全性、信頼性、およびユーザ満足度を高めるために不可欠である。
現在のLLM設計では、この統合が欠如していることが多く、人間の認知能力や制限を完全に満たさないシステムにつながっている。
認知科学手法を取り入れることに十分な焦点が当てられると、LLM出力のバイアスが悪化する一方、ユーザ中心の設計原則の一貫性のない適用は、準最適ユーザー体験をもたらす。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:59:52 GMT)
Classifying Proposals of Decentralized Autonomous Organizations Using Large Language Models [0.0] この研究は、カテゴリを特定し、それらをさらに再定義するための反復的なアプローチを適用し、各イテレーションにおいてプロンプトは95%の精度で100の提案を分類した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:47:44 GMT)
ChatGPT Code Detection: Techniques for Uncovering the Source of Code [0.0] 高度な分類技術を用いて、人間によって書かれたコードとChatGPTによって生成されたコードとを区別する。
我々は、強力な埋め込み機能(ブラックボックス)と教師付き学習アルゴリズムを組み合わせた新しいアプローチを採用する。
トレーニングされていない人間は、ランダムな推測よりも、同じタスクを解くことが示される。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 10:23:01 GMT)
Celeb-FBI: A Benchmark Dataset on Human Full Body Images and Age, Gender, Height and Weight Estimation using Deep Learning Approach [0.0] 「Celeb-FBI」データセットには、身長、年齢、体重、性別の詳細な情報とともに、7,211人の個人像が含まれている。
我々はCNN,50層ResNet,16層VGGという3つの深層学習手法を用いて,人間のフルボディ画像から身長,体重,年齢,性別を推定する。
結果から、ResNet-50の精度は79.18%、性別は95.43%、身長は85.60%、体重は81.91%であった。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 20:16:47 GMT)
Born statistics for quantum mechanical measurements from random walk potentials? [0.0] シュロディンガー方程式は、ポテンシャルエネルギーが量子系をランダムウォークさせるときに固有状態への進化のボルン統計を予測できる。
予測されたボルン確率を持つ固有状態に任意に近づいた測定において、ランダムウォークが量子状態にどのように影響するかを示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:20:11 GMT)
Black box work extraction and composite hypothesis testing [0.0] ブラックボックスワーク抽出は、量子熱力学において最も中心的なプロセスの1つである。
ブラックボックス設定における最適抽出作業は,複合仮説テストタスクの性能によって完全に特徴づけられることを示す。
また、この物理環境では、合成仮説が特定の相関を含む新しい量子シュタインの補題も示している。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 18:00:01 GMT)
Artificial intelligence and machine learning generated conjectures with TxGraffiti [0.0] TxGraffitiが実装した機械学習とテクニックについて概説する。
また、グラフ理論の予想を探求したい人なら誰でも利用できる新しいオンライン版も発表します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:03:09 GMT)
Annotation-free Automatic Music Transcription with Scalable Synthetic Data and Adversarial Domain Confusion [0.0] そこで本研究では,MIDI-audio ペアデータの事前学習や対向領域の混乱を伴わない書き起こしモデルを提案する。
実験では、トレーニングデータセットがMIDIアノテーションを含まない実世界のアプリケーションシナリオ下での手法を評価する。
提案手法は,組合わせMIDI-audioの実際のデータセットを利用せずに,確立されたベースライン手法と比較して競争性能が向上した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:57:25 GMT)
An AI Architecture with the Capability to Explain Recognition Results [0.0] 本研究は、説明可能性に対するメトリクスの重要性に焦点をあて、性能向上をもたらす2つの方法に貢献する。
第1の方法は説明不能なフローと説明不能なフローの組み合わせを導入し、意思決定の説明容易性を特徴づける指標を提案する。
第2の方法は、システム内のニューラルネットワークの有効性を推定するための古典的なメトリクスを比較し、新しいメトリックをリードパフォーマーとして振る舞う。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 16:54:44 GMT)
A quantum mechanical evaluation of the intermediate scattering function [0.0] 中間散乱関数は散乱中心の熱波パケットの相関関数として解釈される。
概念実証は、弾道移動中心の例で与えられる。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 12:40:14 GMT)
A quantum approach for optimal control [0.0] 非線形最適制御問題のクラスを解くための新しい変分量子アプローチを提案する。
我々のアプローチは、ディラックの力学系の正準量子化と非エルミートハミルトニアン基底状態の解を統合する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 07:24:04 GMT)
A quantum annealing approach to the minimum distance problem of quantum codes [0.0] 本稿では,量子安定化器符号の最小距離を準拘束的二項最適化問題として再定式化することで計算する手法を提案する。
D-Wave Advantage 4.1quantum annealerと比較することにより,本手法の実用性を示す。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 19:39:24 GMT)
A Geometric Framework for Adversarial Vulnerability in Machine Learning [0.0] この研究は、人工知能ネットワークにおけるcitetszegedy2013の興味深い脆弱性を理解するために数学を使う意図から始まった。
その過程で、敵ドメイン以外のアプリケーションを含む新しいツールを開発します。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 11:01:15 GMT)
A Generalized Theory for Optical Cooling of a Trapped Atom with Spin [0.0] 我々は中性原子対における光冷却機構の統一的な定式化について述べる。
光学式ツイーザにおける地中冷却を実現するための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 13:55:48 GMT)
A Fixed-Parameter Tractable Algorithm for Counting Markov Equivalence Classes with the same Skeleton [0.0] 因果DAG(Bayesian Network)は、確率変数間の条件依存を符号化する一般的なツールである。
しかし、同じ確率変数の集合上の2つの異なる因果DAGに対して、全く同じ条件依存の集合をエンコードすることが可能である。
そのような因果DAGはマルコフ同値であり、マルコフ同値DAGの同値類はマルコフ同値類(Markov Equivalent Classs、MECs)として知られている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 04:41:05 GMT)
A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0] 混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。
この方法は決定論的情報ボトルネックアルゴリズムの変種であり、基盤構造に関する関連情報を保持しながらデータを最適に圧縮する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 09:06:19 GMT)
A Convex Hull Cheapest Insertion Heuristic for the Non-Euclidean TSP [0.0] 本稿では,多次元スケーリングを用いて,まず非ユークリッド空間からユークリッド空間へ点を投影し,そのアルゴリズムを初期化する凸包を生成する。
提案アルゴリズムを評価するために、TSPLIBデータセットにセパレータを追加するか、L1ノルムを計量として使用することにより、非ユークリッド空間を生成する。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 02:54:12 GMT)
A Comparative Study of DSL Code Generation: Fine-Tuning vs. Optimized Retrieval Augmentation [0.0] 本稿では,Large Language Models (LLM) を用いた検索拡張生成(RAG)によるDSL生成の最適化について述べる。
その結果, コード類似度測定では, 微調整モデルが最も優れていた。
我々は、最適化されたRAGモデルが微調整されたモデルの品質と一致し、新しい、目に見えないAPIに利点をもたらすと結論付けている。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 01:28:51 GMT)
A 72h exploration of the co-evolution of food insecurity and international migration [0.0] 食品の安全性は、持続可能な開発のための2030年のアジェンダの主要な課題の1つである。
これまでの研究は、気候変動、紛争、移住、家庭レベルでの食料安全保障のネクサスを調査してきた。
我々は、国際的移民フローと食料不安全の共進化を全国規模で探求した。
論文参考訳(メタデータ) (Wed, 3 Jul 2024 14:03:21 GMT)