JailbreakBench: An Open Robustness Benchmark for Jailbreaking Large Language Models [123.7] ジェイルブレイク攻撃は、大きな言語モデル(LLM)が有害、非倫理的、またはその他の不快なコンテンツを生成する原因となる。
これらの攻撃を評価することは、現在のベンチマークと評価テクニックの収集が適切に対処していない、多くの課題を提示します。
JailbreakBenchは、以下のコンポーネントを備えたオープンソースのベンチマークである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:15:10 GMT)
Bootstrapped Pre-training with Dynamic Identifier Prediction for Generative Retrieval [109.0] 生成検索は、クエリに応答して関連するドキュメント識別子を直接生成するために、識別可能な検索インデックスを使用する。
近年の研究では、微調整による下流検索タスクを強化するために、慎重に訓練された事前学習タスクで訓練された強力な生成検索モデルの可能性を強調している。
生成検索のためのブートストラップ付き事前学習手法であるBootRetを導入し,事前学習中に文書識別子を動的に調整し,コーパスの継続に対応する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:42:36 GMT)
UltraFeedback: Boosting Language Models with Scaled AI Feedback [99.5] 大規模で高品質で多様なAIフィードバックデータセットである textscUltraFeedback を提示する。
我々の研究は、強力なオープンソースのチャット言語モデルを構築する上で、スケールしたAIフィードバックデータの有効性を検証する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:24:39 GMT)
Scaling Exponents Across Parameterizations and Optimizers [94.5] 本稿では,先行研究における重要な仮定を考察し,パラメータ化の新たな視点を提案する。
私たちの経験的調査には、3つの組み合わせでトレーニングされた数万のモデルが含まれています。
最高の学習率のスケーリング基準は、以前の作業の仮定から除外されることがよくあります。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:40:09 GMT)
Learning a Diffusion Model Policy from Rewards via Q-Score Matching [93.0] 本稿では,拡散モデルポリシの構造を学習されたQ-関数に関連付ける理論的枠組みを提案する。
本稿では,この理論からQスコアマッチングを示す新しいポリシー更新手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:24:36 GMT)
CAT-SAM: Conditional Tuning for Few-Shot Adaptation of Segment Anything Model [90.3] 本稿では,CAT-SAM(ConditionAl Tuning Network)を提案する。
CAT-SAMはSAM全体を凍結し、マスクデコーダとイメージエンコーダに少数の学習可能なパラメータを同時に適用する。
Cat-SAM 変種は、非常に困難なワンショット適応設定の下でも、常に優れた目標セグメンテーション性能を達成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:23:47 GMT)
DataDream: Few-shot Guided Dataset Generation [90.1] 実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:15:01 GMT)
Generalized Unbiased Scene Graph Generation [85.2] 一般化Unbiased Scene Graph Generation (G-USGG)は、述語レベルと概念レベルの不均衡を考慮に入れている。
本稿では,まれ/非一般的/共通概念間のバランスの取れた学習プロセスを確実にするマルチコンセプト学習(MCL)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:53:47 GMT)
R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [83.8] Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。
SFLの課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータが相手のジャミングに感受性を持つことである。
これは、言語理解に不可欠である大規模言語モデル(LLM)における単語埋め込みパラメータに対して特に顕著である。
無線ネットワーク上でのLLM(R-SFLLM)を用いたレジリエンスSFLのための物理層フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:21:29 GMT)
Identifying Speakers in Dialogue Transcripts: A Text-based Approach Using Pretrained Language Models [83.8] 本稿では,デジタルメディアアーカイブにおけるコンテンツアクセシビリティと検索可能性を高める重要な課題である,対話テキスト中の話者名を識別する手法を提案する。
本稿では,メディアサムコーパスから派生した大規模データセットについて述べる。
本稿では,話者名を正確に属性付けるために,対話中の文脈的手がかりを活用する,話者IDに適したトランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:03:58 GMT)
FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models [81.0] 我々は27のソースデータセットから派生した1.10万のマルチターン会話からなるフィードバック・リファインメント・データセットを構築した。
データ収集のスケールアップには、FIRE-100KとFIRE-1Mの2つのコンポーネントが使用される:FIRE-100KはGPT-4Vで生成され、FIRE-1MはFIRE-100Kで訓練されたモデルを介して自由に生成される。
FIRE-100KおよびFIRE-1M上でのLLaVAの微調整によりFIRE-LLaVAモデルを構築し、FIRE-Bench上で顕著なフィードバック精錬能力を示し、未学習のVLMを50%上回る性能を示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:00:45 GMT)
Learning to Make Keypoints Sub-Pixel Accurate [80.6] 本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:39:56 GMT)
Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5] テキストの匿名化は、プライバシーを維持しながら機密データを共有するために重要である。
既存の技術は、大規模言語モデルの再識別攻撃能力の新たな課題に直面している。
本稿では,3つのLCMベースコンポーネント – プライバシ評価器,ユーティリティ評価器,最適化コンポーネント – で構成されるフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:28:56 GMT)
VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models [78.8] PyTorchに基づく大規模マルチモーダリティモデルを評価するためのオープンソースツールキットを提案する。
VLMEvalKitは70以上の大規模なマルチモダリティモデルを実装しており、プロプライエタリなAPIとオープンソースモデルの両方を含んでいる。
マルチモーダル学習研究の進展を追跡するために,OpenVLM Leaderboardを主催する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:06:15 GMT)
MotionCtrl: A Unified and Flexible Motion Controller for Video Generation [77.1] ビデオ中の動きは、主にカメラの動きによって誘導されるカメラの動きと、物体の動きによって生じる物体の動きから成り立っている。
本稿では,カメラと物体の動きを効果的かつ独立に制御するビデオ生成用統合モーションコントローラであるMotionCtrlを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:27:10 GMT)
PromptRobust: Towards Evaluating the Robustness of Large Language Models on Adversarial Prompts [76.2] 本研究は、文字、単語、文、意味といった複数のレベルにわたるプロンプトを標的とした、敵対的なテキスト攻撃を多用する。
相手のプロンプトは、感情分析、自然言語推論、読書理解、機械翻訳、数学の問題解決など様々なタスクに使用される。
以上の結果から,現代の大規模言語モデルでは,敵対的プロンプトに対して頑健ではないことが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:29:49 GMT)
Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.0] マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:05:03 GMT)
Controllable Navigation Instruction Generation with Chain of Thought Prompting [74.3] 本稿では,C-インストラクタを提案する。C-インストラクタは,スタイル制御およびコンテンツ制御可能な命令生成のために,チェーン・オブ・シンクタスタイルのプロンプトを利用する。
C-インストラクタは生成した命令をより追従しやすくし、ランドマークオブジェクトの操作に対する制御性を高める。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:09:34 GMT)
Towards Effective and Efficient Non-autoregressive Decoding Using Block-based Attention Mask [73.5] AMDはアテンションマスクを用いて隠された出力ラベルの連続ブロック内で並列NAR推論を行う。
ビームサーチアルゴリズムは、CTC、ARデコーダ、AMD確率の動的融合を利用するように設計されている。
LibriSpeech-100hrコーパスの実験では、AMDモジュールを組み込んだトリパルタイトデコーダが最大1.73倍のデコード速度比を生み出すことを示唆している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:34:46 GMT)
SuperGaussian: Repurposing Video Models for 3D Super Resolution [67.2] 本稿では,幾何学的および外観的詳細を付加することにより,粗い3次元モデルをアップサンプルする,単純でモジュラーで汎用的な手法を提案する。
既存の3次元超解像モデルを直接再利用できることを実証する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:41:59 GMT)
OmniBind: Large-scale Omni Multimodal Representation via Binding Spaces [67.1] 我々は,70億から300億のパラメータからなる大規模マルチモーダル関節表現モデルOmniBindを提案する。
全てのモダリティにまたがるデータペアが不足しているため、スクラッチから大規模モデルをトレーニングする代わりに、様々な事前訓練された専門家モデルの空間を再マッピングし結合することを提案する。
実験では、OmniBindのオムニ表現モデルとしての汎用性と優位性を示し、多様なアプリケーションに対するその大きな可能性を強調している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:24:31 GMT)
Efficient Training with Denoised Neural Weights [65.1] この研究は、初期化のために神経重みを合成するウェイトジェネレータを構築するための新しい一歩を踏み出した。
本稿では,モデル重みの収集を容易にするために,GANを用いた画像間翻訳タスクを例に挙げる。
拡散モデルによって予測される重み付き画像翻訳モデルを初期化することにより、トレーニングは43.3秒しか必要としない。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:59:42 GMT)
What Makes and Breaks Safety Fine-tuning? A Mechanistic Study [65.0] 安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。
安全でない入力の健全な側面をキャプチャする合成データ生成フレームワークを設計する。
これを用いて,3つのよく知られた安全微調整手法について検討する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:19:15 GMT)
VISA: Reasoning Video Object Segmentation via Large Language Models [64.3] 我々は新しいタスク、Reasoning Video Object(ReasonVOS)を導入する。
このタスクは、複雑な推論能力を必要とする暗黙のテキストクエリに応答して、セグメンテーションマスクのシーケンスを生成することを目的としている。
本稿では、ReasonVOSに取り組むためにVISA(ビデオベース大規模言語命令付きアシスタント)を導入する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:29:29 GMT)
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction [63.7] 既存の手法は、視覚言語モデル(VLM)の頑健なオープン語彙認識機能を活用することにより、オープン語彙オブジェクト検出を強化している。
本稿では,視覚的概念間の関係を生かしたLanguage Model Instruction(LaMI)戦略を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:58:33 GMT)
LanEvil: Benchmarking the Robustness of Lane Detection to Environmental Illusions [61.9] レーン検出(LD)は自律走行システムにおいて不可欠な要素であり、適応型クルーズ制御や自動車線センターなどの基本的な機能を提供している。
既存のLDベンチマークは主に、環境錯覚に対するLDモデルの堅牢性を無視し、一般的なケースを評価することに焦点を当てている。
本稿では、LDに対する環境錯覚による潜在的な脅威について検討し、LanEvilの最初の総合ベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:50:34 GMT)
Self-Guided Generation of Minority Samples Using Diffusion Models [57.3] データ多様体の低密度領域に居住する少数サンプルを生成するための新しい手法を提案する。
我々のフレームワークは拡散モデルに基づいて構築されており、ガイドドサンプリングの原理を生かしている。
実データセットのベンチマーク実験により、我々のアプローチは現実的な低自由度マイノリティインスタンスを作成する能力を大幅に改善できることが示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:03:29 GMT)
Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.2] カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。
提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:04:29 GMT)
Are Large Language Models Strategic Decision Makers? A Study of Performance and Bias in Two-Player Non-Zero-Sum Games [56.7] 大規模言語モデル(LLM)は、現実世界での利用が増えているが、その戦略能力はほとんど解明されていない。
戦略ゲーム,Stag Hunt と Prisoner Dilemma における LLM の動作について検討し,異なる設定とプロンプト下での性能変動を分析した。
以上の結果から,(1)位置バイアス,(2)支払いバイアス,(3)行動バイアスの少なくとも1つが評価された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:19:27 GMT)
Encapsulating Knowledge in One Prompt [56.3] KiOPは、元のモデルを変更したり、トレーニングデータにアクセスする必要なしに、さまざまなモデルからの知識を単独のプロンプトにカプセル化する。
実用性の観点から、このパラダイムは、データアクセス不能なコンテキストにおけるVisual Promptの有効性を証明している。
様々なデータセットとモデルを用いた実験は、提案したKiOP知識伝達パラダイムの有効性を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:35:23 GMT)
Estimating the Energy Footprint of Software Systems: a Primer [56.2] この文書は、この分野で研究を始めたい研究者の出発点となることを目的としている。
私たちは、グリーンソフトウェア開発をサポートするために、ソフトウェアシステムのエネルギーフットプリントをどのように見積もることができるかについて話します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:21:30 GMT)
Four Ways to Improve Verbo-visual Fusion for Dense 3D Visual Grounding [56.0] 3Dビジュアルグラウンドティング(3D visual grounding)は、自然言語で記述された3Dシーンでオブジェクトをローカライズするタスクである。
そこで本研究では,高密度な3次元グラウンドネットワークを提案し,グラウンド性能向上を目的とした4つの新しいスタンドアローンモジュールを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:14:11 GMT)
PerlDiff: Controllable Street View Synthesis Using Perspective-Layout Diffusion Models [55.1] PerlDiffは、3次元幾何学情報を完全に活用した効果的なストリートビュー画像生成手法である。
この結果から,我々のPerlDiffはNuScenesおよびKITTIデータセットの生成精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:05:17 GMT)
Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.7] モデルアタック(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:38:49 GMT)
BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.5] 多くの複雑な実世界のクエリは、関連する文書を特定するために詳細な推論を必要とする。
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
brightbenchmarkは、さまざまなドメインから収集された1,398の現実世界のクエリから構築されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:58:27 GMT)
Representation Bias in Political Sample Simulations with Large Language Models [54.5] 本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。
GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:52:26 GMT)
Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [54.2] コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:32:28 GMT)
The Latency Price of Threshold Cryptosystem in Blockchains [52.4] 本稿では,Byzantine-fault Tolerant(BFT)コンセンサスプロトコルを用いた,しきい値暗号とブロックチェーンのクラス間の相互作用について検討する。
しきい値暗号システムに対する既存のアプローチは、しきい値暗号プロトコルを実行するための少なくとも1つのメッセージ遅延の遅延オーバーヘッドを導入している。
しきい値が狭いブロックチェーンネイティブのしきい値暗号システムに対して,このオーバーヘッドを取り除く機構を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:53:04 GMT)
Physics of Language Models: Part 3.2, Knowledge Manipulation [51.7] 本稿では,4つの基本的な知識操作タスクについて検討する。
言語モデルは知識検索に優れるが、最も単純な分類や比較タスクにも耐え難い。
また, GPT-4のような近代的な事前学習言語モデルにも適用できる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:33:12 GMT)
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction [51.7] 大規模言語モデル(LLM)は膨大な量の世界の知識を格納することができ、しばしば質問応答によって抽出できる。
モデルが知識を抽出する能力と,トレーニングデータの多様な多様性尺度との間には,強い相関関係が認められた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:22:51 GMT)
The Foundations of Tokenization: Statistical and Computational Concerns [51.4] トークン化とは、アルファベット上の文字の文字列を語彙上のトークンの列に変換するプラクティスである。
本稿では,トークン化の基礎を形式的観点から説明する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:12:28 GMT)
A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.4] 自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。
SSLによって、モデルは豊富で安価なラベル付きデータから学ぶことができ、ラベルが高価でアクセス不能なトレーニングモデルのコストを大幅に削減できる。
コンピュータビジョンでは、SSLは事前トレーニングや、教師付き転送、より小さなラベル付きデータセットでの少数ショット学習、および/または教師なしクラスタリングといったダウンストリームタスクとして広く使用されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:17:36 GMT)
Large Language Models for Relevance Judgment in Product Search [48.6] 検索クエリに対する検索および再ランクされたアイテムの高い関連性は、製品検索の成功の土台である。
本稿では,大規模言語モデル(LLM)を活用して,クエリ・イテムペア(QIP)の関連判断を大規模に自動化する手法について述べる。
本研究は,製品検索における関連判断の自動化の分野への直接的な影響を示唆するものである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:01:55 GMT)
Within the Dynamic Context: Inertia-aware 3D Human Modeling with Pose Sequence [47.2] 本研究では、現在のフレームのポーズ状態だけでなく、過去のポーズ状態にも人間の外観の変化が依存していることを明らかにする。
非剛性変形に対するデルタポーズシーケンス表現を利用した新しい手法であるDycoを導入する。
さらに, 慣性を考慮した3次元人間の手法は, 異なる速度での慣性による外観変化を前例なくシミュレートすることができる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:12:46 GMT)
Animate3D: Animating Any 3D Model with Multi-view Video Diffusion [47.1] Animate3Dは静的な3Dモデルをアニメーションするための新しいフレームワークである。
MV-VDMは静的3Dオブジェクトのマルチビューレンダリングに条件付けされている。
Animate3Dは従来のアプローチよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:35:57 GMT)
Towards Reliable Evaluation and Fast Training of Robust Semantic Segmentation Models [47.0] 我々は,mIoUとmIoUの精度の異なる指標を最小化する,いくつかの問題固有の新規攻撃を提案する。
驚くべきことに、セマンティックセグメンテーションモデルに対する既存の敵の訓練の試みは、弱かったり、全く損なわれなかったりする。
最近提案された堅牢なImageNetバックボーンを用いて,PASCAL-VOCとADE20kの最大6倍のトレーニング時間を持つ,対向的に堅牢なセマンティックセマンティックセマンティクスモデルを得ることができることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:54:12 GMT)
TeethDreamer: 3D Teeth Reconstruction from Five Intra-oral Photographs [45.1] そこで我々は,上下顎歯の形状と位置を復元する3次元再構築フレームワークTeethDreamerを提案する。
口腔内5枚の写真から,まず大きな拡散モデルの事前知識を活用して,新しい多視点画像を生成する。
生成したビュー間の3D整合性を確保するために,逆拡散プロセスに3D対応機能アテンション機構を統合する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:24:32 GMT)
A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0] 時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。
LLMの入力に生テキストを直接統合しても、ゼロショット補間性能は向上しないことがわかった。
対照的に、特定の複雑なイベントや微調整LDMに生テキストを組み込むことで、性能が大幅に向上する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:58:54 GMT)
BraTS-PEDs: Results of the Multi-Consortium International Pediatric Brain Tumor Segmentation Challenge 2023 [44.6] 小児脳腫瘍に焦点を当てた第1回BraTS-PEDs 2023チャレンジの結果を報告する。
BraTS-PEDs 2023は、磁気共鳴画像による小児脳グリオーマの体積分割アルゴリズムの評価を目的とした。
小児腫瘍分析におけるトップパフォーマンスのAIアプローチには、nnU-NetとSwin UNETR、Auto3DSeg、あるいはnnU-Netの自己組織化フレームワークによるアンサンブルが含まれていた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:52:45 GMT)
FairProof : Confidential and Certifiable Fairness for Neural Networks [40.8] 消費者の心の中では、機械学習モデルの公平性に関する不信が高まっている。
我々は、Zero-Knowledge Proofsを使用して、機密性を保ちながらモデルの公正性を公に検証するシステムであるnameを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 00:56:20 GMT)
Trust No Bot: Discovering Personal Disclosures in Human-LLM Conversations in the Wild [40.6] 人間とチャットボットのインタラクションにおける個人の開示を測定することで、ユーザのAIリテラシーをよりよく理解することができる。
我々は、実際のユーザが商用のGPTモデルに対して行った個人情報を詳細に分析する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:05:31 GMT)
Toward Tiny and High-quality Facial Makeup with Data Amplify Learning [40.4] 小型メイクモデル「TinyBeauty」とともに「データ増幅学習」を提案する。
DALの中核となる考え方は、DDA(Diffusion-based Data Amplifier)を使用して、モデルトレーニングのために制限されたイメージを"増幅"することにある。
TinyBeautyはiPhone 13で460fpsという驚くべき速度を実現している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:43:04 GMT)
A Comparative Study of Image Restoration Networks for General Backbone Network Design [39.7] 5つの古典的画像復元タスクの比較研究を行った。
ベンチマーク結果を提示し、異なるモデルの性能格差の背景にある理由を解析する。
我々は,新しい画像復元バックボーンネットワークであるX-Restormerを設計する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:08:15 GMT)
Advanced Model Consistency Restoration with Higher-Order Short-Cut Rules [39.6] 我々は、同期中に、より複雑なSC規則をオンザフライで計算する手法を開発した。
これらの高階のSCルールは、複数の変更を1ステップで処理しなければならない場合に、より複雑なシナリオに対処することができます。
評価により、高次SCルールのオンザフライでの計算のオーバーヘッドは許容可能であり、時には全体的な性能も向上することが示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:25:48 GMT)
Learning on Graphs with Large Language Models(LLMs): A Deep Dive into Model Robustness [39.6] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示している。
LLMがグラフ上での学習において堅牢性を示すかどうかは不明である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:05:31 GMT)
Far from Perfect: Quantum Error Correction with (Hyperinvariant) Evenbly Codes [38.7] Evenbly コードと呼ばれる新しいクビット符号のクラスを導入します。
我々の研究は、イブリー符号が実用的な量子コンピューティングアプリケーションにとって有望であることを示している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:18:13 GMT)
InterFusion: Text-Driven Generation of 3D Human-Object Interaction [38.4] ゼロショットテキスト・ツー・3D方式でテキスト記述から3次元オブジェクト間相互作用(HOI)を生成する複雑な課題に取り組む。
本稿では,HOI生成に特化して設計された2段階フレームワークであるInterFusionを紹介する。
実験の結果,InterFusionは3次元HOI生成において既存の最先端手法よりも優れていたことが確認された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:20:31 GMT)
One-Shot Unlearning of Personal Identities [38.4] O-UPI (One-Shot Unlearning of Personal Identities) は、トレーニングデータがアクセスできない場合の未学習モデルを評価する。
CelebAとCelebA-HQデータセットの忘れを、異なる学習セットサイズでベンチマークする。
得られたサンプルとトレーニング時に使用するデータとの相違点がある場合,データ可用性が制限された場合,既存のアプローチは困難であることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:00:54 GMT)
Uniformly Accelerated Motion Model for Inter Prediction [38.3] 自然ビデオでは、通常、変動速度を持つ複数の移動物体が存在し、その結果、コンパクトに表現することが難しい複雑な運動場が生じる。
Versatile Video Coding (VVC) では、既存のインター予測手法は連続するフレーム間の均一な速度運動を仮定する。
本研究では,動画フレーム間の移動物体の運動関連要素(速度,加速度)を利用する一様加速度運動モデル(UAMM)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:46:29 GMT)
XTraffic: A Dataset Where Traffic Meets Incidents with Explainability and More [38.1] トラヒックとインシデントという2つの非常に相関の深いトラックで研究が行われている。
XTrafficデータセットには、トラフィック、すなわち、トラフィックフロー、車線占有率、平均車両速度の時系列インデックスが含まれている。
各ノードは、レーンの詳細な物理ポリシーレベルのメタ属性を含む。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:16:01 GMT)
AU-vMAE: Knowledge-Guide Action Units Detection via Video Masked Autoencoder [38.0] 顔行動単位(FAU)検出のためのビデオレベルの事前学習方式を提案する。
我々の設計の中心は、ビデオマインドオートエンコーダに基づく事前訓練されたビデオ特徴抽出器である。
提案手法は,BP4DおよびdisFA FAUsデータセットで使用されている既存の最先端手法と比較して,性能の大幅な向上を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:07:47 GMT)
NeedleBench: Can LLMs Do Retrieval and Reasoning in 1 Million Context Window? [37.6] NeedleBenchは、バイリンガルの長期コンテキスト能力を評価するための、徐々に難しいタスクからなるフレームワークである。
私たちはこのフレームワークを使って、主要なオープンソースモデルがその疑問に関連する重要な情報をどの程度正確に特定できるかを評価する。
本稿では,実世界の長文タスクに現れる可能性の高い論理的推論課題の複雑さを模倣するAncestral Trace Challengeを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:59:06 GMT)
LMExplainer: Grounding Knowledge and Explaining Language Models [37.6] GPT-4のような言語モデル(LM)は、AIアプリケーションにおいて重要であるが、不透明な意思決定プロセスは、特に安全クリティカルな領域において、ユーザの信頼を低下させる。
LMExplainerは,人間の直感的,理解可能な説明を通じて,LMの推論過程を明らかにする新しい知識基盤説明器である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:53:31 GMT)
CycleHOI: Improving Human-Object Interaction Detection with Cycle Consistency of Detection and Generation [37.5] 本稿では,人間と物体の相互作用(HOI)の検出性能を高めるために,CycleHOIという新しい学習フレームワークを提案する。
我々の鍵となる設計は、HOI検出器のトレーニングのための新しいサイクル整合性損失を導入することである。
我々は,CycleHOIの有効性と一般化力を検証するための広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:55:43 GMT)
CodeV: Empowering LLMs for Verilog Generation through Multi-Level Summarization [37.4] 本稿では,オープンソースの命令調整型Verilog生成用LLMであるCodeVを紹介する。
CodeVは以前のオープンソースSOTAを14.4%(VerilogEvalのBetterV)と11.3%(RTLCoder in RTLLM)で相対的に上回っている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:53:59 GMT)
Cover-separable Fixed Neural Network Steganography via Deep Generative Models [37.1] 我々は、Cs-FNNSという、カバー分離可能な固定ニューラルネットワークステレオグラフィーを提案する。
Cs-FNNSでは,シークレットデータを受容不能な摂動に直接エンコードするSPSアルゴリズムを提案する。
本稿では,視覚的品質と非検出性の観点から,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:47:06 GMT)
The Devil is in the Statistics: Mitigating and Exploiting Statistics Difference for Generalizable Semi-supervised Medical Image Segmentation [36.5] この課題に対処するために、半教師付きドメインの一般化が提案されている。
医療機関間のドメインシフトが、異なる特徴統計を引き起こすことを観察する。
この現象は、目に見えない領域の一般化を促進するために利用することができる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:41:48 GMT)
Explaining the Implicit Neural Canvas: Connecting Pixels to Neurons by Tracing their Contributions [36.4] Implicit Neural Representation (INR) は、信号の連続表現として訓練されたニューラルネットワークである。
我々の研究は、各ニューロンの出力画素への寄与の強さを調べることによって、INRの特性を説明する統一的な枠組みである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:04:34 GMT)
Optical Mode Control, Switching and Shaping In Few Mode Fiber Using a Fiber Piano [36.1] SMF-28ファイバーと半/4ウェーブプレートへの準最適結合により、このファイバピアノは所望の空間モードを生成・再生できることがわかった。
空間モードプロファイルの制御は、単一の光子レベルにまで拡張される。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:24:44 GMT)
Reflective Instruction Tuning: Mitigating Hallucinations in Large Vision-Language Models [36.1] 大規模視覚言語モデル(LVLM)は様々な視覚言語タスクにおいて有望な性能を示す。
幻覚に敏感であり、視覚内容や指示と不一致な出力を生成する。
本稿では,理科学習を視覚的指導調律に統合した反射的指導調律を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:32:45 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [35.4] 本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。
それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。
データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:20:39 GMT)
ReLaX-VQA: Residual Fragment and Layer Stack Extraction for Enhancing Video Quality Assessment [35.0] 本稿では, NR-VQA(No-Reference Video Quality Assessment)モデルであるReLaX-VQAを提案する。
ReLaX-VQAは、残留フレームと光学フローの断片と、サンプルフレームの空間的特徴の異なる表現を用いて、動きと空間的知覚を高める。
我々は、NR-VQAのさらなる研究と応用を促進するために、コードをオープンソース化し、訓練されたモデルを公開します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:33:55 GMT)
NeuSurfEmb: A Complete Pipeline for Dense Correspondence-based 6D Object Pose Estimation without CAD Models [34.9] CADモデルを必要とせず、入力として少数の実画像のみを必要とする最先端のポーズ推定器を訓練できるパイプラインを提案する。
提案手法は,Structure-from-Motion (SfM) とオブジェクトに依存しないセグメンテーションに基づいて,半自動で学習するNeuS2オブジェクト表現に基づいている。
提案手法をLINEMOD-Occlusionデータセット上で評価し,各コンポーネントの影響を広範囲に検討し,CADモデルとPBRデータに基づくアプローチによる競合性能を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 22:48:22 GMT)
Diff-Reg v1: Diffusion Matching Model for Registration Problem [34.6] 既存の手法では、幾何学的あるいは意味的な特徴を利用して潜在的な対応を生成する。
従来はシングルパス予測に頼っていた手法は、複雑なシナリオにおいて局所的なミニマと競合する可能性がある。
本稿では,ロバスト対応推定のための拡散マッチングモデルを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:48:21 GMT)
GV-Bench: Benchmarking Local Feature Matching for Geometric Verification of Long-term Loop Closure Detection [32.5] ループクロージャは軌道推定における正しいドリフトを補正し、グローバルに一貫したマップを構築する。
偽ループ閉鎖は致命的であり、堅牢性を保証するための追加のステップとして検証が必要である。
本稿では,長期条件下でのループ閉鎖検出の幾何的検証を対象とする統一ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:05:19 GMT)
Bridge Past and Future: Overcoming Information Asymmetry in Incremental Object Detection [32.2] 漸進的な物体検出において、知識蒸留は破滅的な忘れを緩和する有効な方法であることが証明されている。
以前の研究は、過去のモデルの知識を保存し、画像が過去、現在、そして将来の段階のカテゴリを同時に含んでいることを無視することに焦点を当てていた。
本稿では,ブリッジ・パス・アンド・フューチャー(BPF)と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:37:12 GMT)
Approximating Probabilistic Inference in Statistical EL with Knowledge Graph Embeddings [32.1] 統計的EL(SEL)の例を用いて,知識グラフの埋め込みを用いて確率的推論を効率的に近似する方法を説明する。
我々は,ランタイムと音質保証の証明を提供し,我々のアプローチのランタイムと近似品質を実証的に評価する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:08:33 GMT)
A Watermark-Conditioned Diffusion Model for IP Protection [32.0] 拡散モデルにおけるコンテンツ著作権保護のための統一的な透かしフレームワークを提案する。
そこで我々はWaDiffと呼ばれるWadmark条件付き拡散モデルを提案する。
本手法は,検出タスクと所有者識別タスクの両方において有効かつ堅牢である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:40:37 GMT)
LiCamPose: Combining Multi-View LiDAR and RGB Cameras for Robust Single-frame 3D Human Pose Estimation [31.7] LiCamPoseは、マルチビューRGBとスパースポイントクラウド情報を統合して、単一のフレームで堅牢な3Dポーズを推定するパイプラインである。
LiCamPoseは、2つの公開データセット、1つの合成データセット、1つの挑戦的な自己収集データセットを含む4つのデータセットで評価されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:30:58 GMT)
Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling [31.6] 階層的状態空間モデル(HiSS)は概念的にシンプルで,連続的な逐次予測のための新しい手法である。
HiSSスタックは、時間階層を生成するために、互いに上にステートスペースモデルを構造化する。
HiSSは、因果変換器、LSTM、S4、Mambaといった最先端のシーケンスモデルをMSEで少なくとも23%上回っている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:38:41 GMT)
Turbo: Informativity-Driven Acceleration Plug-In for Vision-Language Large Models [31.1] Turboは、情報次数を参照するデータをソートするプラグインで、トップレベルのデータだけを使ってコストを節約する。
複数のVLMベンチマークにおいて,我々はTurboの良好な加速を無視可能な性能低下下で完全に実証する実験を行った。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:35:26 GMT)
LOTUS: Enabling Semantic Queries with LLMs Over Tables of Unstructured and Structured Data [30.8] 構成可能なAIベースの操作でリレーショナルモデルを拡張するプログラミングインターフェースであるセマンティック演算子を導入する。
我々は,PandasライクなAPIを備えたオープンソースのクエリエンジンであるLOTUSで,演算子といくつかの最適化を実装した。
我々は,ファクトチェック,極端なマルチラベル分類,検索など,一連の実アプリケーションにおいてLOTUSの有効性を実証する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:19:14 GMT)
PRET: Planning with Directed Fidelity Trajectory for Vision and Language Navigation [30.7] 視覚と言語ナビゲーションは、エージェントが自然言語の指示に従ってナビゲートする必要があるタスクである。
近年の手法では、各ステップで構築されたトポロジーマップのサブゴールを予測し、長期的な行動計画を可能にする。
本稿では,指示と指向性軌道のアライメントを考慮し,ナビゲーション計画を容易にする方法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:22:18 GMT)
We are Who We Cite: Bridges of Influence Between Natural Language Processing and Other Academic Fields [30.6] 自然言語処理の分野横断は減少している。
NLPの引用の8%以下は言語学に関するものである。
NLPの引用の3%以下は数学と心理学に関するものである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:50:11 GMT)
Real-time Holistic Robot Pose Estimation with Unknown States [30.4] RGB画像からロボットのポーズを推定することは、コンピュータビジョンとロボット工学において重要な問題である。
従来の手法では、例えば接地型ロボットの関節角など、ロボットの内部状態の完全な知識が想定されていた。
本研究は,RGB画像からリアルタイムロボットのポーズ推定を行う上で,既知のロボットの状態を必要としない効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:57:48 GMT)
Context-Guided Diffusion for Out-of-Distribution Molecular and Protein Design [30.2] 我々は、ラベルのないデータと滑らかな制約を利用して、ガイド付き拡散モデルのアウト・オブ・ディストリビューション一般化を改善するシンプルなプラグ・アンド・プレイ法である文脈誘導拡散法(CGD)を開発した。
このアプローチは、連続的、離散的、グラフ構造化された拡散プロセスや、薬物発見、材料科学、タンパク質設計にまたがる応用など、様々な状況において、大幅なパフォーマンス向上をもたらす。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:34:00 GMT)
Learning to Break Deep Perceptual Hashing: The Use Case NeuralHash [29.7] Appleは最近、子供の性的虐待物質を検出するための深い知覚的ハッシュシステムNeuralHashを発表した。
ユーザのプライバシとシステムの信頼性の保護について、大衆の批判が持ち上がった。
現在の深い知覚的ハッシュは、堅牢でない可能性がある。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:48:41 GMT)
Gradient Flows and Riemannian Structure in the Gromov-Wasserstein Geometry [29.7] 本稿ではGromov-Wasserstein(GW)幾何学における勾配流について検討する。
本稿では,$mathbbRd上の分布間の内部積 GW (IGW) 距離に着目した。
固有IGW幾何を創り出す固有IGW幾何を同定し,それを用いて,IGWのベナモ・ブレニエ式を定式化する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:53:23 GMT)
WebCanvas: Benchmarking Web Agents in Online Environments [29.3] WebCanvasは、Webエージェントのための革新的なオンライン評価フレームワークである。
我々は、推論のためのモジュールを備えたエージェントフレームワークをオープンソースとして公開し、コミュニティがオンライン推論と評価を行うための基盤を提供します。
ベストパフォーマンスエージェントは,Mind2Web-Liveテストセット上でのタスク成功率23.1%,タスク完了率48.8%を達成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:19:21 GMT)
3D-COCO: extension of MS-COCO dataset for image detection and 3D reconstruction modules [29.1] 3D-COCOは、3Dモデルと2D-3Dアライメントアノテーションを提供するMS-COCOデータセットの拡張である。
3D-COCOのオープンソース性は、新しい3D関連トピック研究の道を開くためのプレミアである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:14:45 GMT)
How Control Information Influences Multilingual Text Image Generation and Editing? [29.0] TextGenは、制御情報を最適化することによって生成品質を向上させるように設計された新しいフレームワークである。
制御情報の異なる役割を異なる段階で整合させるために、2段階生成フレームワークを用いる。
本手法は、中国語と英語の両方のテキスト生成における最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:40:21 GMT)
A Reference Architecture for Designing Foundation Model based Systems [28.8] ファンデーションモデルが将来のAIシステムの基本的なビルディングブロックになる、という広いコンセンサスがある。
基礎モデルをAIシステムに組み込むことは、責任と安全性に関する重要な懸念を提起する。
本稿では,基礎モデルに基づくシステム設計のためのパターン指向参照アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:35:43 GMT)
Revisiting Deep Ensemble for Out-of-Distribution Detection: A Loss Landscape Perspective [28.5] Out-of-Distribution (OoD) は、In-Distribution (InD) データからOoDサンプルを検出する方法である。
我々は,OoD検出における損失景観とモードアンサンブルの新しい視点を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:49:19 GMT)
Private prediction for large-scale synthetic text generation [28.5] 大規模言語モデル(LLM)を用いた微分プライベートテキスト生成手法を提案する。
プライベートな予測フレームワークでは、差分プライバシー保証を満たすために出力された合成データのみを必要とする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:28:40 GMT)
The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research [28.4] 我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。
NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:53:19 GMT)
TeacherLM: Teaching to Fish Rather Than Giving the Fish, Language Modeling Likewise [27.9] 我々は,ほとんどのNLPサンプルに対して,関連する基本,思考の連鎖,一般的な誤りを注釈できるTeachLM-7.1Bを提案する。
このモデルはMMLUで52.3のゼロショットスコアを獲得し、100B以上のパラメータを持つほとんどのモデルを上回った。
TeacherLMシリーズのモデルと拡張データセットをオープンソースとしてリリースします。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:02:01 GMT)
EgoExo-Fitness: Towards Egocentric and Exocentric Full-Body Action Understanding [27.9] EgoExo-Fitnessは新しいフルボディアクション理解データセットである。
シンクロナイズドエゴセントリックカメラと固定型エゴセントリックカメラで撮影されたフィットネス・シーケンス・ビデオが特徴。
EgoExo-Fitnessは、エゴセントリックでエゴセントリックなフルボディの行動理解を研究するための新しいリソースを提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:35:49 GMT)
SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning [27.7] 自己教師付き学習(SSL)は、データ表現を符号化する一般的な手法である。
SSLエンコーダに埋め込まれたTrojan攻撃は隠蔽的に動作し、複数のユーザやデバイスに分散する。
SSLエンコーダのバックドア脅威を特定し軽減するためのソリューションとしてSSL-Cleanseを導入します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:07:24 GMT)
Does Refusal Training in LLMs Generalize to the Past Tense? [27.5] 我々は、現在の拒絶訓練アプローチにおける興味深い一般化のギャップを明らかにする。
本手法をLlama-3 8B, GPT-3.5 Turbo, Gemma-2 9B, Phi-3-Mini, GPT-4o, R2D2モデルで系統的に評価した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:59:55 GMT)
Learning Semantic Latent Directions for Accurate and Controllable Human Motion Prediction [26.0] この課題に対する解決策として,SLD(Semantic Latent Directions)を導入する。
SLDは潜在空間を制約し、意味のある動作意味学を学ぶ。
現実主義と多様性のバランスを保ちながら動きを正確に予測する上で,本手法の優位性を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:31:59 GMT)
The Importance of Online Data: Understanding Preference Fine-tuning via Coverage [25.8] 選好微調整におけるオンライン手法とオフライン手法の類似点と相違点について検討した。
グローバルなカバレッジ条件は、オフラインのコントラスト手法が最適ポリシーに収束するのに必要かつ十分であることを示す。
KL正規化のためのオンラインデータとコントラストベースの選好最適化にオフラインデータを利用するハイブリッド選好最適化アルゴリズムを導出する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:51:38 GMT)
Convex Analysis at Infinity: An Introduction to Astral Space [25.8] $mathbbRn$ 上の凸函数は、有限最小化子を持つわけではない。
無限遠点が加わったような$mathbbRn$のコンパクトな拡張であるアストラル空間について研究する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:26:24 GMT)
MedContext: Learning Contextual Cues for Efficient Volumetric Medical Segmentation [25.7] 医用3次元セグメンテーションのためのユニバーサルトレーニングフレームワークMedContextを提案する。
本手法は,教師付きボクセルセグメンテーションタスクと協調して,自己教師付きコンテキストキューを効果的に学習する。
MedContextの有効性は、複数の3D医療データセットと4つの最先端モデルアーキテクチャで検証されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:24:41 GMT)
Hypergraph Multi-modal Large Language Model: Exploiting EEG and Eye-tracking Modalities to Evaluate Heterogeneous Responses for Video Understanding [25.5] ビデオの創造性と内容の理解はしばしば個人によって異なり、年齢、経験、性別によって焦点や認知レベルが異なる。
実世界のアプリケーションとのギャップを埋めるために,ビデオデータセット用の大規模主観応答指標を導入する。
我々は,異なるユーザ間での映像コンテンツの認知的理解度を分析し,評価するためのタスクとプロトコルを開発した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:47:20 GMT)
Interactions with Generative Information Retrieval Systems [25.1] 既存の検索エンジンでは、インタラクションはいくつかの事前定義されたアクションに限られている。
生成IRシステムへ移行する大きな利点は、情報ニーズとフィードバックの豊かな表現をユーザに提供することである。
本章では、生成IRシステムにおける相互作用の役割について概説する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:12:22 GMT)
PlayBest: Professional Basketball Player Behavior Synthesis via Planning with Diffusion [24.5] 本稿ではプレイヤーの意思決定を改善する方法であるPlayBest(PLAYer BEhavior DynamicThesis)を紹介する。
本研究では,NBA選手の運動追跡データから,拡散確率モデルを拡張し,環境動態を学習する。
以上の結果から,このモデルは,効率的なプレーを実現する合理的なバスケットボールコースの創出に優れることが明らかとなった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:01:27 GMT)
Revisiting Relation Extraction in the era of Large Language Models [24.3] 関係抽出(RE)は、テキストからエンティティ間の意味的関係を推測する中核的なNLPタスクである。
近年の研究では、入力に条件付きで生成するターゲット文字列としてエンティティ間の関係を線形化することで、その問題を列列化タスクとして扱っている。
ここでは、従来の作業よりも大きい言語モデル(GPT-3とFlan-T5)を用いて、標準的なREタスクの性能を様々なレベルの監督下で評価し、このアプローチの限界を推し進める。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:04:10 GMT)
Efficiently Training 7B LLM with 1 Million Sequence Length on 8 GPUs [24.1] 大規模言語モデル(LLM)は、よりクリエイティブなアプリケーションを促進するために、拡張コンテキスト長を使用して訓練されている。
本稿では,メモリ管理を微粒化するための新しいフレームワークであるMEMOを提案する。
我々は,MEMOがMegatron-LMやDeepSpeedと比較して平均2.42倍,2.26倍のMFUを達成することを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:59:49 GMT)
REVEAL-IT: REinforcement learning with Visibility of Evolving Agent poLicy for InTerpretability [23.8] REVEAL-ITは複雑な環境下でのエージェントの学習過程を説明するための新しいフレームワークである。
各種学習課題における政策構造とエージェントの学習過程を可視化する。
GNNベースの説明者は、ポリシーの最も重要な部分を強調することを学び、エージェントの学習プロセスについてより明確で堅牢な説明を提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:13:08 GMT)
Exploring the Use of Abusive Generative AI Models on Civitai [22.5] 本稿では,AIGCソーシャルプラットフォームとして最大規模のCivitaiを用いて,乱用コンテンツの生成について検討する。
87Kモデルと2M画像を含む包括的データセットを構築した。
これらのプラットフォームをよりよく管理するためのモデレーション戦略について議論する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:18:03 GMT)
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather [21.0] 既存のLiDARセマンティックセグメンテーション手法は、悪天候下での性能低下に苦慮することが多い。
これまでの研究は、悪天候をシミュレートしたり、トレーニング中に普遍的なデータ拡張を採用することでこの問題に対処してきた。
本稿では,性能劣化の主な原因を特定するために,新たな戦略データ拡張手法を提案する。
提案手法はセマンティックKITTI-to-SemanticSTFベンチマークで39.5 mIoUを達成し,ベースラインを8.1%改善し,新たな最先端技術を確立した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:32:33 GMT)
MINI-LLM: Memory-Efficient Structured Pruning for Large Language Models [21.0] 大規模言語モデル(LLM)は劇的に成長する。
これらのモデルの圧縮と高速化の傾向が増している。
本研究では, 粒度, アクティベーション, 勾配を適切に統合したハイブリッドプルーニング基準を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:59:44 GMT)
Improving Unsupervised Video Object Segmentation via Fake Flow Generation [20.9] 本稿では,単一画像からの擬似光フローをシミュレートする新しいデータ生成手法を提案する。
光フローマップは深度マップに大きく依存していることから着想を得て,各画像の深度マップを精細化し,拡大することにより,偽の光フローを生成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:32:50 GMT)
Why long model-based rollouts are no reason for bad Q-value estimates [20.8] 本研究の目的は,長期ロールアウトが必ずしも指数関数的に増大するエラーを生じさせるわけではなく,モデルフリー法よりもQ値推定が優れていることを示すことである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:17:00 GMT)
Global atmospheric data assimilation with multi-modal masked autoencoders [20.8] EarthNetはデータ同化のためのマルチモーダル基礎モデルである。
衛星観測のみから、地球規模のギャップに満ちた大気状態を予測することを学ぶ。
大気の3次元温度と湿度の地球規模の0.16度の再分析データセットを生成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:15:51 GMT)
Neural Compression of Atmospheric States [19.9] ニューラルネットワークの手法を用いて大気状態を圧縮する手法を提案する。
モデルの両方の族が小さな平均誤差のデシラタを満たすことを示す。
大気中における1000倍を超える圧縮比を示すとともに, 大気中における圧縮と減圧を約1秒の速さで示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:38:39 GMT)
Distribution Alignment for Fully Test-Time Adaptation with Dynamic Online Data Streams [19.9] TTA(Test-Time Adaptation)は、テストデータストリームの適応と推論を可能にする。
本稿では,TTAにおける新しい配電アライメント損失を提案する。
我々は、非i.d.シナリオにおける既存の手法を超越し、理想的なi.d.仮定の下で競争性能を維持する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:33:23 GMT)
LoFTI: Localization and Factuality Transfer to Indian Locales [19.8] LLMのローカライゼーションと実際のテキスト転送機能を評価するために,LoFTIという新しいベンチマークを導入する。
LoFTIは、ソースおよびターゲットロケーションのエンティティに関する事実的なステートメントで構成されている。
我々は,LoFTIが高品質な評価ベンチマークであり,GPT-4を含む全てのモデルが,様々な局所性レベルで歪んだ結果を生成することを示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:20:43 GMT)
Multi-Channel Masked Autoencoder and Comprehensive Evaluations for Reconstructing 12-Lead ECG from Arbitrary Single-Lead ECG [19.7] 本研究では,実シングルリードECGから12リードECGを再構成するためのマルチチャネルマスク付きオートエンコーダ(MCMA)を提案する。
実験の結果,生成した信号と実信号の可視化結果から,提案手法の有効性が示された。
本研究は,信号レベル,特徴レベル,診断レベル評価を含む総合評価ベンチマークECGGenEvalを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:17:45 GMT)
Continuous Embedding Attacks via Clipped Inputs in Jailbreaking Large Language Models [19.7] 大規模言語モデル(LLM)に対するセキュリティ上の懸念は最近エスカレートされ、個別のプロンプトにおけるジェイルブレイクの試みを阻止することに焦点が当てられている。
本研究では,LSM入力に対する直接攻撃を行うための新しいチャネルを提案する。
この対策として,CLIPというシンプルで効果的な戦略を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:53:00 GMT)
DreamCatalyst: Fast and High-Quality 3D Editing via Controlling Editability and Identity Preservation [17.9] DreamCatalystは、SDSベースの編集を拡散逆プロセスとして解釈する新しいフレームワークである。
目的関数はサンプリングダイナミクスを考慮し,DreamCatalystの最適化プロセスを拡散逆過程の近似とする。
我々の高品質モードは、スピードと品質の両面で現在の最先端のNeRF編集方法より優れています。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:26:14 GMT)
Isometric Representation Learning for Disentangled Latent Space of Diffusion Models [17.6] 等方的拡散(Isometric Diffusion)を提案し、幾何正則化器を備えた拡散モデルを用いてモデルを誘導し、トレーニングデータ多様体の幾何学的音響潜在空間を学習する。
このアプローチにより拡散モデルはより不整合な潜在空間を学習することができ、より滑らかで正確に逆転し、潜在空間に直接属性を制御できるようになる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:36:01 GMT)
Enhancing Perceptual Quality in Video Super-Resolution through Temporally-Consistent Detail Synthesis using Diffusion Models [17.6] 本稿では,リアルタイムかつ時間的に一貫性のある細部を合成することにより,高画質映像の知覚品質を向上させるためのDMに基づくVSR手法であるStableVSRを提案する。
本稿では,既存のVSRの最先端手法と比較して,時間的整合性を向上しつつ,高画質映像の知覚品質を高める上でのStableVSRの有効性を実証する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:32:42 GMT)
Exploring Active Learning in Meta-Learning: Enhancing Context Set Labeling [17.6] いくつかの設定では、ラベルのどのポイントを積極的に選択することが可能である。
ガウス混合体を適合させてラベルのどの点を選択するかを選択する自然アルゴリズムを提案する。
提案アルゴリズムは、複数のベンチマークデータセットにまたがる様々なメタラーニングアルゴリズムを使用する場合、最先端のアクティブラーニング手法より優れている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:38:01 GMT)
Generalized Coverage for More Robust Low-Budget Active Learning [17.5] ProbCoverは、選択したデータポイントで与えられた半径のボールでデータ分布を"カバー"しようとする。
本稿では,ProbCoverのアルゴリズムを一般化して,このカバレッジを最適化する効率的なグリージー手法を提案する。
総合的な実験では、MaxHerdingは複数の低予算画像分類ベンチマークで既存のアクティブな学習方法を上回っている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:21:51 GMT)
SurroFlow: A Flow-Based Surrogate Model for Parameter Space Exploration and Uncertainty Quantification [17.2] 既存のディープラーニングベースのサロゲートモデルは、効率的なデータ生成を容易にするが、不確実な定量化、効率的なパラメータ空間探索、逆予測に不足する。
シミュレーションパラメータとシミュレーション出力の間の可逆変換を学習するために,フローベースサロゲートモデルを正規化した新しいモデルであるSurroFlowを紹介した。
本フレームワークは,科学的サロゲートモデルの信頼性と探索能力を向上しつつ,計算コストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:08:49 GMT)
Human-AI Collaborative Taxonomy Construction: A Case Study in Profession-Specific Writing Assistants [17.1] LLM(Large Language Models)は、テキストのリビジョンやストーリー生成など、複数の作業において人間を支援する。
本稿では,ドメイン固有書記アシスタントのガイドラインとして,人間とAIの連携による分類学開発手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 00:13:09 GMT)
Building AI Agents for Autonomous Clouds: Challenges and Design Principles [17.0] AI for IT Operations(AIOps)は、障害のローカライゼーションや根本原因分析といった複雑な運用タスクを自動化することを目的としている。
このビジョンペーパーは、まず要求をフレーミングし、次に設計決定について議論することで、そのようなフレームワークの基礎を定めています。
アプリケーションをオーケストレーションし,カオスエンジニアリングを使用してリアルタイム障害を注入するエージェント-クラウドインターフェースを活用したプロトタイプ実装であるAIOpsLabと,障害のローカライズと解決を行うエージェントとのインターフェースを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:40:43 GMT)
SphereHead: Stable 3D Full-head Synthesis with Spherical Tri-plane Representation [17.0] PanoHeadは、正面と後方の両方のビューの画像をフルヘッド合成するために、大規模なデータセットを使用することの可能性を証明している。
本研究では,人間の頭部の幾何学的特徴に適合する球面座標系における新しい三面体表現であるSphereHeadを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:52:40 GMT)
Mitigating Catastrophic Forgetting in Language Transfer via Model Merging [16.8] ブランチ・アンド・マージ(BaM)は複数のモデルを反復的にマージする手法である。
BaMは、これが低等級であるがより高い品質の重量変化をもたらすという知見に基づいている。
ブルガリア語とドイツ語の実証研究において、BaMは、マッチングやターゲットドメインの性能の向上を伴いながら、忘れを著しく低減できることを示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:48:06 GMT)
End-user Comprehension of Transfer Risks in Smart Contracts [16.3] 転送結果とユーザ目標に深刻な影響を与える5つの転送リスクに焦点を当てる。
我々は,110名の参加者とUSDT/MetaMaskによるスマートコントラクト転送リスクのエンドユーザー理解について調査した。
我々は,次のトップ78のERC-20スマートコントラクト(USDT以降)について,手動および自動ソースコード解析を行い,これらのリスクの有病率を明らかにした。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:18:45 GMT)
Understanding Counting in Small Transformers: The Interplay between Attention and Feed-Forward Layers [16.3] 我々はヒストグラムタスクで訓練された単純な変圧器モデルを分析する。
目標は、固定アルファベットからの入力シーケンスにおける各項目の発生をカウントすることである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:48:10 GMT)
TIGER: A Generating-Then-Ranking Framework for Practical Python Type Inference [16.2] Pythonの動的型付けシステムは柔軟性と表現力を提供するが、型関連のエラーにつながる可能性がある。
TIGERはPythonの多様な型カテゴリを扱うための2段階生成レベル(GTR)フレームワークである。
ManyTypes4Pyデータセットに対する評価は、TIGERが様々な型カテゴリの既存のメソッドよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:26:45 GMT)
Probing the Efficacy of Federated Parameter-Efficient Fine-Tuning of Vision Transformers for Medical Image Classification [16.1] 様々な下流タスクのための微調整事前訓練モデルは、医療画像領域において重要な問題である。
これらのモデルの大規模なサイズは、フェデレート学習における通信負担を軽減するために、パラメータ効率のよい微調整(PEFT)を使用する必要がある。
本研究では,医用画像分類のためのビジョントランスフォーマー(ViT)モデルに適用するための各種PEFT戦略について検討する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:28:50 GMT)
A Single Online Agent Can Efficiently Learn Mean Field Games [16.0] 平均場ゲーム (MFGs) は大規模人口システムの振る舞いをモデル化するための有望なフレームワークである。
本稿では,オンラインサンプルを用いてMFNEを学習できるオンライン単エージェントモデルフリー学習方式を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:03:23 GMT)
Local Feature Selection without Label or Feature Leakage for Interpretable Machine Learning Predictions [15.8] ラベルと特徴リークの概念を定式化することで、ミスリード選択の問題に対処する。
本稿では,SUWRと呼ばれるリークがないことを示す,最初の局所特徴選択手法を提案する。
実験結果から,SUWRは過度に適合する傾向が低く,最先端の予測性能と高い特徴選択間隔を併せ持つことが明らかとなった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:36:30 GMT)
RobotKeyframing: Learning Locomotion with High-Level Objectives via Mixture of Dense and Sparse Rewards [15.8] 本稿では,脚ロボットのための新しい学習ベース制御フレームワークを提案する。
脚のあるロボットの自然な移動における高レベルな目標を取り入れている。
マルチクリティック強化学習アルゴリズムを用いて、密集した報酬とスパース報酬の混合を処理する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:15:35 GMT)
Think Big, Generate Quick: LLM-to-SLM for Fast Autoregressive Decoding [15.7] 大規模言語モデル(LLM)は、実際にはユビキタスなものとなり、翻訳、要約、命令の追従といった生成タスクに広く利用されている。
本稿では,異なるサイズの言語モデルを組み合わせて,自己回帰復号化の効率を高めるハイブリッド手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:10:45 GMT)
Lost and Found: Overcoming Detector Failures in Online Multi-Object Tracking [15.5] マルチオブジェクト追跡(MOT)は、時間とともに複数のオブジェクトのアイデンティティと位置を正確に推定する。
現代の検出器は、あるフレーム内のいくつかのオブジェクトを見逃すことがあるため、トラッカーは早めに追跡をやめる。
オンラインTbDシステムと互換性のある汎用フレームワークであるBUSCAを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:19:48 GMT)
Single Layer Single Gradient Unlearning [15.4] モデルパラメータの単一層のみを変更できる1時間勾配しか必要としない効率的な手法を提案する。
CLIP, 安定拡散, VLM など, 様々なモデルにおける本手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:52:36 GMT)
Designing Decision Support Systems Using Counterfactual Prediction Sets [15.1] 分類タスクの意思決定支援システムは主に、基底真理ラベルの価値を予測するために設計されている。
本稿では,オンライン学習の観点から,このようなシステムの設計を再考する。
私たちは専門家のモデルを必要としない方法論を開発しています。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:52:02 GMT)
UrbanWorld: An Urban World Model for 3D City Generation [15.1] UrbanWorldは、フレキシブルな制御条件を備えたカスタマイズされたリアルでインタラクティブな3D都市世界を自動生成できる、最初の生成的都市世界モデルである。
高忠実な3D都市環境は、シミュレーションにおいて一般的なAIとマシン知覚システムの現実的なフィードバックと相互作用を可能にする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:59:29 GMT)
Large Vision-Language Models as Emotion Recognizers in Context Awareness [14.9] 文脈対応感情認識(CAER)は、様々な文脈から感情を知覚する必要がある複雑で重要なタスクである。
以前のアプローチは主に、イメージから感情的な手がかりを抽出する洗練されたアーキテクチャを設計することに焦点を当てていた。
本稿では,LVLM(Large Vision-Language Models)を活用したCAERタスクの実現の可能性について,体系的に検討する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:28:06 GMT)
Defining 'Good': Evaluation Framework for Synthetic Smart Meter Data [14.8] スマートメーターデータセットのプライバシーリスクを評価するには,標準プライバシ攻撃手法が不十分であることを示す。
本稿では,トレーニングデータを不確実なアウトレーラで注入し,それらのアウトレーラに直接プライバシ攻撃を発生させる手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:41:27 GMT)
Synchronization is All You Need: Exocentric-to-Egocentric Transfer for Temporal Action Segmentation with Unlabeled Synchronized Video Pairs [14.6] 我々は、当初、外向型(固定型)カメラ用に設計された時間的アクションセグメンテーションシステムを、ウェアラブルカメラが映像データをキャプチャするエゴセントリックなシナリオに転送する問題を考える。
本稿では,既存のラベル付きエキソセントリックビデオを活用する新しい手法と,ラベル付き,同期化されたエキソセントリックビデオペアの新たなセットを提案する。
Assembly101とEgoExo4Dの実験は、従来の教師なし領域適応と時間的アライメントに対する提案手法の有効性を示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:27:04 GMT)
Street TryOn: Learning In-the-Wild Virtual Try-On from Unpaired Person Images [14.6] 仮想トライオンアプリケーションをサポートするためのStreetTryOnベンチマークを導入する。
また,一対のデータを必要とせず,一対の人物画像から直接仮想試行を学習する手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:04:41 GMT)
HeightFormer: Explicit Height Modeling without Extra Data for Camera-only 3D Object Detection in Bird's Eye View [14.2] 視覚に基づくバードアイビュー(Bird's Eye View, BEV)の表現は、自律運転のための新たな知覚定式化である。
我々は、LiDARのような余分なデータを必要とせず、任意のカメラリグやタイプに適合できるBEV空間の高さを明示的にモデル化することを提案する。
自己再帰的手法で高さと不確実性をモデル化するHeightFormerを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:10:46 GMT)
Split Conformal Prediction under Data Contamination [14.2] データ汚染環境における分割共形予測の堅牢性について検討する。
構築した集合のカバレッジと効率に及ぼす劣化したデータの影響を定量化する。
本稿では,汚染ロバスト・コンフォーマル予測(Contamination Robust Conformal Prediction)と呼ぶ分類設定の調整を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:52:54 GMT)
BadRobot: Jailbreaking LLM-based Embodied AI in the Physical World [14.2] 人工人工知能(英語: Embodied AI, AI)は、センサーやアクチュエータを通して物理世界と対話する人工知能システムである。
大規模言語モデル(LLM)は言語命令を深く探求し、複雑なタスクの計画策定において重要な役割を担います。
LLMベースのエンボディAIロボットは広く普及し、家庭や産業で一般的になると予想されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:13:16 GMT)
SGIFormer: Semantic-guided and Geometric-enhanced Interleaving Transformer for 3D Instance Segmentation [14.2] 本稿では,SGIFormerという3次元インスタンスセグメンテーションのための新しい手法を提案する。
Semantic-Guided Mix Query (SMQ)とGeometric-enhanced Interleaving Transformer (GIT)デコーダで構成されている。
ScanNet V2、ScanNet200、そして挑戦的な高忠実度ScanNet++ベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:17:28 GMT)
SwitchCIT: Switching for Continual Instruction Tuning of Large Language Models [14.1] 大規模言語モデル(LLM)は、様々な領域、特に一般的な言語理解において印象的な能力を発揮している。
しかし、これらのモデルは大量のテキストデータに基づいて訓練されており、命令によって引き起こされる特定のタスクに対して微妙に最適化されていないかもしれない。
本研究は, LLMの連続的な命令学習において, パラメータ効率の高いチューニングモデルに演算をルーティングする切替機構を通じて, 破滅的な忘れに対処するものである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:37:33 GMT)
Exploring connections of spectral analysis and transfer learning in medical imaging [13.8] 自然画像と医用画像で事前学習したモデル間での学習優先順位の顕著な相違について検討した。
モデルの学習優先度がアーティファクトのパワースペクトル密度と一致した場合、そのアーティファクトに過度に適合する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:49:48 GMT)
Generalization Error Curves for Analytic Spectral Algorithms under Power-law Decay [13.8] 本稿では,カーネル勾配勾配法における一般化誤差曲線の完全な特徴付けを行う。
ニューラル・タンジェント・カーネル理論により、これらの結果は広義のニューラルネットワークを訓練する際の一般化行動の理解を大幅に改善する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:15:57 GMT)
An efficient framework based on large foundation model for cervical cytopathology whole slide image screening [13.7] 本稿では,教師なし・弱教師付き学習によるWSIレベルラベルのみを用いた頚部細胞病理学WSI分類のための効率的なフレームワークを提案する。
CSDおよびFNAC 2019データセットで実施された実験は、提案手法が様々なMIL手法の性能を高め、最先端(SOTA)性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:21:54 GMT)
SES: Bridging the Gap Between Explainability and Prediction of Graph Neural Networks [13.7] 本稿では、説明可能性と予測のギャップを埋める自己説明型自己教師型グラフニューラルネットワーク(SES)を提案する。
SESは説明可能なトレーニングと予測学習の2つのプロセスから構成される。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:46:57 GMT)
Graph Structure Prompt Learning: A Novel Methodology to Improve Performance of Graph Neural Networks [13.7] グラフネットワーク(GNN)のトレーニングを強化するための新しいグラフ構造Prompt Learning法(GPL)を提案する。
GPLはタスク非依存のグラフ構造損失を利用して、GNNが下流タスクを同時に解決しながら固有のグラフ特性を学習することを奨励している。
11の実世界のデータセットの実験では、ニューラルネットワークによってトレーニングされた後、GNNはノード分類、グラフ分類、エッジタスクにおいて、元のパフォーマンスを大幅に上回った。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:59:18 GMT)
UniRec: A Dual Enhancement of Uniformity and Frequency in Sequential Recommendations [13.7] 新たな双方向拡張シーケンシャルレコメンデーション手法であるUniRecを提案する。
UniRecは、一様でないシーケンスと少ない頻度のアイテムの表現を改善している。
我々の知る限り、UniRecは特徴増強のための均一性と周波数の特性を利用する最初の方法である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:20:16 GMT)
Towards the Law of Capacity Gap in Distilling Language Models [13.6] 言語モデル (LM) 蒸留は, 大規模教師のLMに居住する知識を小学生に活用することを目的とした, 流行の分野である。
本論文は, より大きい教師は, より小さい教師から蒸留したものに比べて, 必ずしも優れた生徒になるとは限らないことを論じる。
最適教師尺度は, モデルアーキテクチャやデータスケールにまたがる学生尺度とほぼ一貫して線形に相関していることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:55:03 GMT)
Enhancing Stochastic Optimization for Statistical Efficiency Using ROOT-SGD with Diminishing Stepsize [13.4] 本稿では,最適化と統計効率のギャップを埋める手法であるtextsfROOT-SGDを再検討する。
提案手法は, 念入りに設計したステップサイズ戦略を統合することにより, テキストfROOT-SGDの性能と信頼性を向上させる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:59:35 GMT)
Benchmarking the Attribution Quality of Vision Models [13.3] 本稿では,広く使用されているインクリメンタル削除プロトコルの2つの基本的な限界を克服する新しい評価プロトコルを提案する。
これにより、23の帰属手法と8つの異なる視覚モデルの設計選択が帰属品質にどのように影響するかを評価することができる。
本研究は,本質的に説明可能なモデルが標準モデルより優れており,生の帰属値が従来よりも高い帰属品質を示すことを発見した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:02:20 GMT)
Enhancing Covert Communication in Relay Systems Using Multi-Antenna Technique [13.1] 本稿では,マルチアンテナ技術を利用して,リレーシステムにおける秘密通信性能を向上させる。
まず,S,R,Dのそれぞれが単一アンテナを採用する場合のシナリオを考察し,仮説テストと統計理論を適用して,隠れた性能モデリングの理論的枠組みを開発する。
本研究では,マルチアンテナ技術が2ホップリレーシステムにおけるカバート性能をいかに向上させるかを示すために,広範な数値計算結果を提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:08:15 GMT)
SFPNet: Sparse Focal Point Network for Semantic Segmentation on General LiDAR Point Clouds [13.1] 本稿では、ウィンドウアテンションをスパース焦点変調に置き換えることで、市場で広く普及している様々なLiDARに対応するためのフレームワークを提案する。
我々のSFPNetは、複数のレベルのコンテキストを抽出し、ゲート機構を用いて動的に集約することができる。
また,ロボットアプリケーションのための大規模ハイブリッド型LiDARセマンティックセマンティックセマンティックセマンティックデータセットについても紹介する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:22:09 GMT)
MapDistill: Boosting Efficient Camera-based HD Map Construction via Camera-LiDAR Fusion Model Distillation [13.1] 我々は,KD(Knowledge Distillation)というアイデアを初めて,効率的なHDマップ構築に利用した。
我々は、高性能カメラ-LiDAR融合モデルから軽量カメラ専用モデルへ知識を伝達する、MapDistillと呼ばれる新しいKDベースのアプローチを導入する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:00:20 GMT)
Mitigating biases in big mobility data: a case study of monitoring large-scale transit systems [12.3] 本研究では,大きなモビリティデータセットのバイアスを評価し,緩和法を開発した。
今回の研究では、GoogleとAppleのモビリティデータを例として、政府機関のベンチマークデータと比較します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:22:16 GMT)
Enhancing Split Computing and Early Exit Applications through Predefined Sparsity [12.3] Deep Neural Networks(DNN)は、オブジェクト分類やアクション認識からスマートビルディングやヘルスケアまで、幅広い問題で最先端のパフォーマンスを達成した。
計算要件は、リソースに制約のあるエッジデバイスへのデプロイメントを妨げます。
本稿では,事前定義された空間性の概念とスプリットコンピューティング(SC)とEarly Exit(EE)を組み合わせることで,この問題に対処する新しいアプローチを提案する。
実験の結果, 性能を損なうことなく, 記憶量と計算複雑性を4倍に削減できることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:24:04 GMT)
Bridging the Gap Between Information Seeking and Product Search Systems: Q&A Recommendation for E-commerce [12.3] 我々は,製品検索に関連する質問応答(Q&A)ペアを推薦し,購入決定を支援することを提案する。
我々は、この新興分野における今後の研究を促進するための課題、オープンな課題、そして解決策を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:34:40 GMT)
Semi-Supervised Object Detection: A Survey on Progress from CNN to Transformer [12.0] 本稿では,物体検出のための半教師付き学習における27の最先端開発について概説する。
データ拡張テクニック、擬似ラベル戦略、一貫性の正則化、敵の訓練方法などをカバーする。
我々は,既存の課題を克服し,物体検出のための半教師あり学習における新たな方向性を探るため,さらなる研究の関心を喚起することを目的としている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:28:59 GMT)
Review-Feedback-Reason (ReFeR): A Novel Framework for NLG Evaluation and Reasoning [12.0] ReFeR(Review-Feedback-Reason)は、LPMエージェントを用いたNLGのための新しい評価フレームワークである。
NLGタスクの2つの既存のベンチマークデータセットを使用して、ReFeRを厳格にテストする。
3つの推論ベンチマークに応用することで,方法論の有効性を強調した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:25:26 GMT)
Dance Any Beat: Blending Beats with Visuals in Dance Video Generation [12.0] 音楽によってガイドされた個人の画像から直接ダンスビデオを生成するという新しいタスクを導入する。
我々のソリューションであるDance Any Beat Diffusion Model (DabFusion)は、参照画像と楽曲を使用してダンスビデオを生成する。
AIST++データセットを用いてDabFusionの性能評価を行い,映像品質,オーディオ・ビデオ同期,モーション・ミュージックアライメントに着目した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:09:27 GMT)
COMET: "Cone of experience" enhanced large multimodal model for mathematical problem generation [12.0] 本稿では,数学問題生成のための大規模マルチモーダルモデルであるCOMETを提案する。
相互能力の促進と応用論理の観点から、我々は、茎生成と問題解決を数学的問題生成に統合する。
このフレームワークは、微調整データを象徴的な経験、象徴的な経験、直接的な経験に分割し、教師のキャリア成長における経験と類似性を引き出す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:02:16 GMT)
MaskVD: Region Masking for Efficient Video Object Detection [11.8] ビデオタスクは計算量が多く、リアルタイムアプリケーションにデプロイする際の課題となる。
本稿では,ビデオフレームにおけるマスキング領域の戦略を提案する。
以前のフレームから抽出した特徴を活用することで、ViTバックボーンはリージョンマスキングの恩恵を直接受けられる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:01:49 GMT)
Formal Verification of Unknown Dynamical Systems via Gaussian Process Regression [11.7] 安全クリティカルなシナリオにおける自律システムの活用には、不確実性の存在下での行動を検証する必要がある。
本研究では,非モデル化された力学と雑音測定を用いた離散時間力学システムの検証フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:33:04 GMT)
Exploring Quantization for Efficient Pre-Training of Transformer Language Models [11.7] 本研究の目的は,変圧器の効率的な事前学習における量子化の影響を検討することである。
重み、アクティベーション、勾配、状態に直線量子化を体系的に適用することにより、トレーニング中のモデル効率、安定性、性能への影響を評価する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:42:09 GMT)
CUPID: Leveraging ChatGPT for More Accurate Duplicate Bug Report Detection [11.4] 重複バグレポート検出(DBRD)は、学術と産業の両方において長年の課題である。
本稿では,従来のDBRD手法と最先端LLMを組み合わせたCUPIDという手法を提案する。
CUPIDは、解析されたすべてのデータセットで0.602から0.654までのRecall Rate@10スコアに達する、最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:56:24 GMT)
Nonreciprocal Single-Photon Band Structure in a Coupled-Spinning-Resonator chain [11.3] 共振共振器チェーンにおける単一光子バンド構造と単一光子の輸送について解析する。
我々の研究は、非相互または相互の単光子バンド構造を達成、操作、切り替えするための新しい経路を開く。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:10:08 GMT)
Expressive Power of ReLU and Step Networks under Floating-Point Operations [11.3] 二項しきい値単位またはReLUを用いたニューラルネットワークは、任意の有限入力/出力ペアを記憶可能であることを示す。
また,浮動小数点演算が有意および指数の両方に有限ビットを使用する場合,暗記および普遍近似に関する同様の結果を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:00:31 GMT)
MergeNet: Explicit Mesh Reconstruction from Sparse Point Clouds via Edge Prediction [11.3] 既存の暗黙の手法は、優れた滑らかで水密なメッシュを生成する。
顔を直接ポイントから形成することで、明示的な手法がより効率的になる。
本稿では,メッシュ再構成を局所接続予測問題に変換する edGE(Net) による MEshMerge 再構成を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:19:16 GMT)
Rethinking LiDAR Domain Generalization: Single Source as Multiple Density Domains [11.3] 領域一般化のための密度識別特徴埋め込み (DDFE) モジュールを提案する。
DDFEモジュールは、単一のソースドメイン内で密度固有の特徴を抽出するために慎重に設計されている。
さらに、ソースデータの密度スペクトルを拡大することを目的とした、シンプルながら効果的な密度拡張手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:24:01 GMT)
A Pilot Study of GSLM-based Simulation of Foreign Accentuation Only Using Native Speech Corpora [11.3] 生成音声言語モデル(GSLM)を用いた外国人アクセントの人的プロセスのシミュレーション手法を提案する。
我々は、言語Aの音声を言語BのGSLMに入力し、Bのアクセントを入力音声に加えることで、このプロセスをシミュレートする。
実験の結果,L1がBである話者が生成したAの実際のサンプルと比較すると,出力音声の合成アクセントは非常に自然であることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:29:00 GMT)
AIGC for Industrial Time Series: From Deep Generative Models to Large Generative Models [10.9] 本稿では,DGMからLGMへの産業時系列生成モデルの概要を概説する。
まず,産業時系列生成のためのDGMベースのAIGCフレームワークを提案する。このフレームワークでは,先進的な産業用DGMを調査し,多視点分類を提案する。
さらに, 産業用LGMの構築に必要な重要な技術は, 大規模産業用データセット, 複合産業用LGMアーキテクチャ, 産業用時系列の自己監督訓練, 産業用ダウンストリームタスクの微調整の4つの側面から分析する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:16:54 GMT)
Towards Multi-modal Transformers in Federated Learning [10.8] 本稿では,視覚言語領域におけるMFL(Transfer Multi-modal Federated Learning)のシナリオについて検討する。
我々は,クライアント間の非モダリティと相互モダリティのギャップに対処することによって,FedCola(Federated modality complementary and collaboration)と呼ばれる新しいフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:19:34 GMT)
Beware of Validation by Eye: Visual Validation of Linear Trends in Scatterplots [10.7] 斜面の視覚的評価の精度は斜面の視覚的検証よりも高い。
どちらの場合も「急すぎる」斜面に偏りがあることがわかりました。
第2の実験では,レグレッション・ビジュアライゼーションのための共通設計を導入することで,視覚的妥当性が向上するかどうかを検討した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:41:24 GMT)
Physics-informed active learning for accelerating quantum chemical simulations [10.6] 本稿では,量子化学シミュレーションにおけるロバストなデータ効率ポテンシャル構築のためのエンドツーエンドALを提案する。
本プロトコルは,物理インフォームドによるトレーニングポイントのサンプリング,初期データの自動選択,不確実性定量化,収束モニタリングに基づく。
これらの調査は、高性能コンピューティングクラスタ上での純粋な量子化学計算ではなく、数週間を要した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:16:46 GMT)
I$^2$-SLAM: Inverting Imaging Process for Robust Photorealistic Dense SLAM [10.5] カジュアルビデオは、しばしば動きのぼやけや様々な外観に悩まされ、コヒーレントな3D視覚表現の最終的な品質を低下させる。
本稿では、線形HDR放射率マップを用いて測定値の収集を行うSLAMシステムに物理画像を統合することを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:31:33 GMT)
Positive and Unlabeled Data: Model, Estimation, Inference, and Classification [10.4] 本研究では、二重指数傾斜モデル(DETM)による正・ラベルなし(PU)データへの新たなアプローチを提案する。
従来の手法は、完全にランダム(SCAR)PUデータでのみ適用されるため、しばしば不足する。
我々のDEMの二重構造は、ランダムPUデータで選択されたより複雑で未探索な構造を効果的に許容する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:06:02 GMT)
MASIVE: Open-Ended Affective State Identification in English and Spanish [10.4] 本研究は,人間が感情経験を説明するために使用する言葉を含む,事実上拘束力のないテクスタフェクティブな状態にまで範囲を広げる。
私たちは、英語とスペイン語でReddit投稿のデータセットであるMASIVEを収集し、公開しています。
このタスクでは、より小さな微調整された多言語モデルの方が、地域固有のスペイン感情状態においても、ずっと大きなLLMより優れていることが分かる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:43:47 GMT)
LHRS-Bot: Empowering Remote Sensing with VGI-Enhanced Large Multimodal Language Model [10.3] 本稿では,新しい視覚言語アライメント戦略とカリキュラム学習手法を通じて,RS画像理解に適したMLLMであるLHRS-Botを紹介する。
総合的な実験により、LHRS-BotはRS画像の深い理解と、RS領域内でニュアンス推論を行う能力を示すことが示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:40:34 GMT)
When Should Algorithms Resign? A Proposal for AI Governance [10.2] アルゴリズムの辞退は、ガバナンスを直接AIシステムに埋め込むことによって、人工知能(AI)の使用を管理する戦略的アプローチである。
アクセスAI出力の制限やパフォーマンス評価の表示など、AIからの意図的かつインフォームドな切り離しが伴う。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:40:37 GMT)
Sparse Training for Federated Learning with Regularized Error Correction [9.9] Federated Learning(FL)は、ディープニューラルネットワーク(DNN)モデルをトレーニングする上で大きなメリットがあるため、大きな関心を集めている。
FLAREは、FLプロセスへの埋め込みを正規化した更新モデルの累積引き込みによる新しいスパーストレーニング手法を提案する。
FLAREの性能は、多種多様な複雑なモデルに関する広範な実験を通じて検証され、顕著なスパーシリティレベル(現在の最先端の10倍以上の)を達成するとともに、精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:59:48 GMT)
DFDRNN: A dual-feature based neural network for drug repositioning [9.7] 薬物再配置は経済的に効率的な戦略であり、既存の薬物に対する新しい表示を、当初の承認を超えて発見するために用いられる。
我々は、薬物や疾患の正確なエンコーディングを実現するために、二重機能麻薬再配置ニューラルネットワークモデルを設計する。
6つの最先端の手法と比較して、DFDRNNは4つのベンチマークデータセットで他よりも優れている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:02:18 GMT)
3DGS.zip: A survey on 3D Gaussian Splatting Compression Methods [9.7] 本稿では,3次元ガウススプラッティング圧縮法について,様々なベンチマークにおける統計的性能に着目して検討する。
評価されたデータセットには、TurpsAndTemples、MipNeRF360、DeepBlending、SyntheticNeRFがある。
各手法について,Pak Signal-to-Noise Ratio (PSNR), Structure similarity Index (SSIM), Learned Perceptual Image Patch similarity (LPIPS)を報告する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:47:46 GMT)
Contrastive Sequential-Diffusion Learning: An approach to Multi-Scene Instructional Video Synthesis [9.7] アクション中心のシーケンス記述には、次のステップが即時前のステップではなく、前のステップで視覚的に一貫性を持たなければならない、非線形パターンが含まれている。
本稿では,最も適切なシーンを選択して,次のシーンの復調過程をガイドし,条件付けするコントラッシブ・シーケンシャルな映像拡散手法を提案する。
実世界のデータを用いた実験では,従来の作業と比較して,モデルの実用性と整合性の向上が示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:03:05 GMT)
NeSIG: A Neuro-Symbolic Method for Learning to Generate Planning Problems [9.2] 我々はNe SIGを提案し、私たちの知る限り、計画問題を自動的に生成する最初のドメインに依存しない手法を提案する。
マルコフ決定プロセスとして問題生成を定式化し、Deep Reinforcement Learningを用いて2つの生成ポリシーを訓練して問題を生成する。
結果は、Ne SIGがドメイン固有のジェネレータよりもはるかに難しい、有効で多様な問題を自動生成できることを示している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:37:41 GMT)
InstructAV: Instruction Fine-tuning Large Language Models for Authorship Verification [9.2] 本稿では,著者確認のための新しいアプローチであるInstructAVを紹介する。
このアプローチでは,パラメータ効率の細かいチューニング(PEFT)手法と併用して,精度と説明可能性の向上を図る。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:27:01 GMT)
SpaceJAM: a Lightweight and Regularization-free Method for Fast Joint Alignment of Images [9.1] 教師なしの関節アライメントは、高複雑性、幾何学的歪み、局所的あるいは大域的最適性への収束といった課題によって特徴づけられる。
本稿では,JA タスクに効率と簡易さで対処する新しいアプローチである SpaceJAM について紹介する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:32:39 GMT)
This Probably Looks Exactly Like That: An Invertible Prototypical Network [9.0] プロトタイプニューラルネットワークは、概念アノテーションなしで人間に理解可能な機械学習を実現するための、エキサイティングな方法だ。
原型的説明に対する間接的解釈関数への依存は、プロトタイプの情報的力に厳しい制限を課すことが判明した。
本稿では,ガウス混合モデルを用いて正規化フローを構成することにより,ProtoFlowと呼ばれるモデルを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:51:02 GMT)
FLIPHAT: Joint Differential Privacy for High Dimensional Sparse Linear Bandits [8.9] 高次元スパース線形帯域は、シーケンシャルな意思決定問題の効率的なモデルとして機能する。
データプライバシの懸念により、我々は、共同でプライベートな高次元の疎線形帯域について検討する。
また,FLIPHATは対数的要因を最適に再現できることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:34:21 GMT)
Enabling MCTS Explainability for Sequential Planning Through Computation Tree Logic [8.8] モンテカルロ木探索(MCTS)は、シーケンシャルな計画作業のための最も有能なオンライン検索アルゴリズムの1つである。
実世界のデプロイメントにおけるパフォーマンスは高いが、MCTSの本質的な計算は、技術的なバックグラウンドのないユーザにとって理解を困難にしている。
本稿では,MCTSを交通ルーティングサービスに利用し,最適化された経路計画を構築するためにアルゴリズムを統合することを検討する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:00:31 GMT)
Practical Guidelines for the Selection and Evaluation of Natural Language Processing Techniques in Requirements Engineering [8.8] 自然言語(NL)は現在、要求自動化の基盤となっている。
多くの異なるNLPソリューション戦略が利用可能であるため、特定のREタスクに対して適切な戦略を選択することは困難である。
特に,従来のNLP,特徴ベース機械学習,言語モデルに基づく手法など,さまざまな戦略を選択する方法について議論する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:06:02 GMT)
SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image Synthesis [8.8] SCP-Diff は SIS on Cityscapes, ADE20K and COCO-Stuff の新たな最先端の成果を設定し、Cityscapes の FID は 10.53 である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:40:17 GMT)
Large Language Models as Misleading Assistants in Conversation [8.6] 本稿では,Large Language Models (LLMs) の読解作業における支援の文脈において,誤認する能力について検討する。
我々は,(1)モデルが真理的な援助を提供するよう促された場合,(2)モデルが微妙に誤解を招くよう促された場合,(3)間違った回答を求めるよう促された場合,の結果を比較した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:45:22 GMT)
Learning Modality-agnostic Representation for Semantic Segmentation from Any Modalities [8.5] Any2Segは、任意の視覚的条件におけるモダリティの組み合わせから堅牢なセグメンテーションを実現する新しいフレームワークである。
4つのモダリティを持つ2つのベンチマークの実験は、Any2Segがマルチモーダル設定の下で最先端を達成することを示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:34:38 GMT)
Dissipationless topological quantum computation for Majorana objects in sparse-dense mixed encoding process [8.3] マヨラナオブジェクトに基づくトポロジカル量子計算は重要な課題である。
2量子ビットの量子ゲートのいくつかは、量子ビットのフェルミオンパリティに依存している。
所望のフェルミオンパリティから所望のフェミオンパリティへの情報の非散逸補正を可能にするトポロジカル操作を考案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:51:17 GMT)
OAM-TCD: A globally diverse dataset of high-resolution tree cover maps [8.3] OpenMap (OAM) から得られた高解像度の空中画像において, ツリークラウンデライン化(TCD)のための新しいオープンアクセスデータセットを提案する。
我々のデータセットであるOAM-TCDは、50722048x2048px画像を10cm/px解像度で、関連する280k個以上の木と56k個の木からなる。
データセットを使用して、既存の最先端モデルと比較する参照インスタンスとセマンティックセグメンテーションモデルをトレーニングする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:11:29 GMT)
Ev-GS: Event-based Gaussian splatting for Efficient and Accurate Radiance Field Rendering [8.3] 単眼イベントカメラから3次元ガウススプラッティングを推定する最初のCNIインフォームドスキームであるEv-GSを紹介する。
Ev-GSは、ぼかしを減らし、視覚的品質を改善したリアルなビューをレンダリングすることで、フレームベースの信号を入力として取り出す手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:15:13 GMT)
Weak-coupling limits of the quantum Langevin equation for an oscillator [7.9] 量子ランゲヴィン方程式のレベルで'Born-Markov'のような近似を実装するとどうなるかを示す。
この背景には、回転波近似についてもコメントする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:51:26 GMT)
Paraphrase Types for Generation and Detection [7.8] これらのタスクをパラフレーズ型生成とパラフレーズ型検出と呼ぶ。
以上の結果から,従来の手法は二項分類のシナリオではうまく機能するが,微粒なパラフレーズ型の含みは大きな課題となることが示唆された。
我々は、パラフレーズ型が将来、パラフレーズモデルの開発とタスクの解決のための新しいパラダイムを解き放つことができると考えている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:55:21 GMT)
Centering the Value of Every Modality: Towards Efficient and Resilient Modality-agnostic Semantic Segmentation [7.8] 最近の試みでは、RGBのモダリティを中心とみなし、その他を補助的とみなし、2つの枝を持つ非対称なアーキテクチャを生み出している。
本稿では,コンパクトモデルから高性能モデルまで,様々なバックボーンと柔軟にペアリングできるMAGICという新しい手法を提案する。
提案手法は, モデルパラメータを60%削減しつつ, 最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:19:59 GMT)
Learning local equivariant representations for quantum operators [7.7] 本稿では,複数の量子演算子を予測するための新しいディープラーニングモデルSLEMを提案する。
SLEMは、計算効率を劇的に改善しながら最先端の精度を達成する。
SLEMの能力は多種多様な2次元および3次元材料にまたがって実証し,限られた訓練データでも高い精度を達成できることを示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:52:49 GMT)
ParamNet: A Dynamic Parameter Network for Fast Multi-to-One Stain Normalization [7.4] 静止正規化は、デジタル病理画像の色と明るさの差を効果的に低減することができる。
本研究では,動的パラメータネットワークを導入し,ParamNetと呼ばれる新しい染色正規化法を提案する。
その結果、ParamNetは25秒で10万×100,000のスライド画像(WSI)を正規化できることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:26:12 GMT)
Dynamic Dimension Wrapping (DDW) Algorithm: A Novel Approach for Efficient Cross-Dimensional Search in Dynamic Multidimensional Spaces [7.4] 本研究では,新しい最適化アルゴリズム-動的次元ラッピング(DDW)アルゴリズムを提案する。
DDWは優れた探索効率を示し、実際の最適解に最も近い検索結果を提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:41:35 GMT)
AFIDAF: Alternating Fourier and Image Domain Adaptive Filters as an Efficient Alternative to Attention in ViTs [7.4] 本稿では,特徴抽出のためのFourierと画像領域フィルタリングを交互に行う手法を提案する。
軽量モデル間の性能はImageNet-1K分類の最先端レベルに達する。
我々のアプローチは、視覚変換器(ViT)を圧縮するための新しいツールとしても機能する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:53:11 GMT)
Enhancing Scene Graph Generation with Hierarchical Relationships and Commonsense Knowledge [7.3] この研究は、関係階層とコモンセンス知識の両方によってシーングラフを生成するための拡張されたアプローチを導入する。
我々は,シーングラフ予測システムから結果を批判するために基礎モデルを活用する,堅牢なコモンセンス検証パイプラインを実装した。
Visual GenomeとOpenImage V6データセットの実験では、既存のシーングラフ生成アルゴリズムのプラグインとプレイの拡張として、提案されたモジュールをシームレスに統合できることが示されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:39:05 GMT)
A Central Motor System Inspired Pre-training Reinforcement Learning for Robotic Control [7.2] 本稿では,ロボットがリッチモータースキルを習得することのできる,事前学習型強化学習アルゴリズムを提案する。
まず,任意運動の選択機構を利用して,脳に類似したスキルベースネットワークを設計する。
本研究では,4種類のロボットと22種類のタスク環境について実験を行い,提案手法により,柔軟な運動能力を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:57:18 GMT)
Quantised Global Autoencoder: A Holistic Approach to Representing Visual Data [7.2] 量子化されたオートエンコーダでは、画像は通常、局所的なパッチに分割され、それぞれが1つのトークンでエンコードされる。
本手法は,入力信号を大域周波数の重畳に変換するスペクトル分解に着想を得たものである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:05:20 GMT)
Empowering Safe Reinforcement Learning for Power System Control with CommonPower [7.1] RLコントローラのフレキシブルでモデルベースの保護を可能にするPythonツールCommonPowerを紹介した。
CommonPowerは、単一エージェントRL、マルチエージェントRL、最適制御のための統一インターフェースを提供し、異なる予測メソッドをシームレスに統合する。
我々は、異なる安全ガードを特徴とするRLエージェントと、エネルギー管理のコンテキストにおけるモデル予測制御器を比較した数値ケーススタディにより、CommonPowerの汎用性を実証する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:48:19 GMT)
Stepping Stones: A Progressive Training Strategy for Audio-Visual Semantic Segmentation [7.1] AVSS (Audio-Visual Semantic) は映像中の音源の画素レベルのローカライゼーションを実現することを目的としており、AVSS (Audio-Visual Semantic) は音声視覚シーンの意味的理解を追求している。
従来の方法は、エンドツーエンドのトレーニングにおいて、このマッシュアップを扱うのに苦労しており、学習とサブ最適化が不十分である。
textitStepping Stonesと呼ばれる2段階のトレーニング戦略を提案し、AVSSタスクを2つの単純なサブタスクに分解する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:08:30 GMT)
Information Scrambling in Free Fermion Systems with a Sole Interaction [7.1] 我々は、自由フェルミオンホッピング項と単独相互作用からなるブラウン回路とクリフォード回路を構築する。
両回路とも,演算子のスクランブルの発生が明らかとなった。
1次元システムでは、演算子と絡み合いの両方が拡散スケーリングを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:49:39 GMT)
SPINACH: SPARQL-Based Information Navigation for Challenging Real-World Questions [6.9] 本稿では,Wikidata の "Request a Query" フォーラムからの KBQA データセットである SPINACH データセットを紹介する。
データセットに加えて、このような難しい問題に対して、人間の専門家がどのようにSPARQLを書くかを模した、KBQAアプローチであるSPINACHエージェントも導入しています。
我々の新しいSPINACHデータセットでは、SPINACHエージェントは、最高のGPT-4ベースのKBQAエージェントを含む全てのベースラインを38.1%上回る。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:18:21 GMT)
Combining Wasserstein-1 and Wasserstein-2 proximals: robust manifold learning via well-posed generative flows [6.8] 低次元多様体に支持された学習分布の連続時間生成フローを定式化する。
We show that the Wasserstein-1 proximal operator regularize $f$-divergences to be compareds。
また, ワッサーシュタイン2近似作用素は, 最適輸送コストを加算することにより, 生成フローの経路を正則化することを示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:34:31 GMT)
Sim-Grasp: Learning 6-DOF Grasp Policies for Cluttered Environments Using a Synthetic Benchmark [6.8] シム・グラスプ(Sim-Grasp)は、6-DOF2指グルーピングシステムで、乱雑な環境下でのオブジェクト操作を改善するための高度な言語モデルを統合する。
我々はSim-Grasp-Datasetを紹介し、500のシナリオに7.9百万のアノテートラベルを持つ1,550のオブジェクトを含み、ポイントクラウドから把握ポーズを生成するSim-GraspNetを開発した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 22:12:11 GMT)
Novel Artistic Scene-Centric Datasets for Effective Transfer Learning in Fragrant Spaces [6.8] 文化遺産研究でしばしば見落とされ、人間の経験やアイデンティティを形作る上で重要な役割を担っている。
弱ラベル付き学習データを用いた移動学習手法は、香り空間の分類を著しく改善できることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:18:05 GMT)
MRIo3DS-Net: A Mutually Reinforcing Images to 3D Surface RNN-like framework for model-adaptation indoor 3D reconstruction [6.8] 本稿では,モデル適応型屋内3次元再構成のための3次元表面リカレントニューラルネットワークに画像を相互に補強するエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:46:57 GMT)
Beyond Spatial Explanations: Explainable Face Recognition in the Frequency Domain [6.7] 我々は、探索されていない周波数領域における説明可能な顔認識について、一歩前進して検討する。
この研究は、周波数領域における検証に基づく決定の説明可能性について初めて提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:29:24 GMT)
Bike Frames: Understanding the Implicit Portrayal of Cyclists in the News [6.4] 報道機関のイデオロギーと報告スタイルは、しばしばサイクリングに対する大衆の認識に影響を及ぼす。
本稿では,ニュース見出し中のサイクリストの知覚を検知する手法を開発する。
BikeFrame Chain-of-Codeフレームワークを導入し、サイクリストの知覚を予測し、事故に関連する見出しを特定し、欠陥を判定する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:42:44 GMT)
Bridging Weighted First Order Model Counting and Graph Polynomials [6.3] 重み付き一階述語モデルカウント問題(WFOMC)は、与えられた一階述語論理文のモデルの重み付き和を計算することを要求する。
Weak Connectedness Polynomials and Strong Connectedness Polynomials for first-order logic sentences。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:01:25 GMT)
DynSyn: Dynamical Synergistic Representation for Efficient Learning and Control in Overactuated Embodied Systems [6.2] 制御機構の研究は、高次元の過度なシステムの制御に関する洞察を与える。
神経力学における筋シナジーとして知られるアクチュエータの協調は、運動指令の生成を単純化する予備的なメカニズムであると考えられている。
この理論を動機として,動的シナジスティック表現(DynSyn)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:09:59 GMT)
Improved Belief Propagation Decoding on Surface Codes with High Accuracy and Low Latency [5.9] EWAInit-BPは、順序統計復号処理を行わないBP改善の中で最高精度を達成している。
理論上のO(1)時間複雑性と高精度により、高精度リアルタイムデコーダの候補となる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:03:06 GMT)
A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility [5.2] 本稿では,艦隊スケジューリング問題の包括的最適化について述べる。
また、代替ソリューションのアプローチの必要性も認識している。
新しい模倣アプローチは、目に見えない最悪のシナリオにおいて、パフォーマンスと顕著な改善を実現する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:51:24 GMT)
Dataset Dictionary Learning in a Wasserstein Space for Federated Domain Adaptation [5.0] マルチソースドメイン適応(MSDA、Multi-Source Domain Adaptation)は、複数の関連する異種ソースデータセットをラベル付けされていないターゲットデータセットに適合させるという、難しいシナリオである。
我々の研究は、この課題に対処するために、分散データセット辞書学習という新しいアプローチを提案する。
我々のアルゴリズムは、各クライアントの基盤となる分布を、プライベートなバリ中心座標によって重み付けされたパブリック原子のワッサーシュタインバリセンタとして表現する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:13:54 GMT)
SHMamba: Structured Hyperbolic State Space Model for Audio-Visual Question Answering [5.0] AVQA(Audio-Visual Question Answering)のマルチモーダル入力により,特徴抽出と融合処理がより困難になる。
我々は、双曲幾何学と状態空間モデルの利点を統合するために、構造化双曲状態空間モデル(SHMamba: Structured Hyperbolic State Space Model)を提案する。
提案手法は,現行のすべての主要な手法の優越性を実証し,実用的なアプリケーションシナリオに適した方法である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:09:56 GMT)
FR-SLAM: A SLAM Improvement Method Based on Floor Plan Registration [5.0] 本稿では,形態素に基づくフロアプラン登録アルゴリズムを用いて,フロアプラン登録に基づくSLAM法を提案する。
これにより、包括的なモーションマップの迅速な取得と効率的な経路計画が容易になり、迅速なナビゲーションが短い時間枠内で位置を目標にすることができる。
実データとシミュレーションデータを用いて行った実験は,他のベンチマークアルゴリズムと比較すると,フロアプランの登録精度の向上と時間消費の短縮を実現している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:23:38 GMT)
DaCapo: Accelerating Continuous Learning in Autonomous Systems for Video Analytics [5.0] 本稿では,自律型システムによる推論,ラベリング,トレーニングの同時実行を可能にする,継続的学習のためのハードウェアアルゴリズムであるDaCapoを提案する。
DaCapoは、最先端の継続的学習システムであるEkyaとEOMUよりも6.5%と5.5%高い精度を実現し、消費電力は254倍少ない。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:32:01 GMT)
Quantum Maximum Entropy Inference and Hamiltonian Learning [5.0] この研究は、最大エントロピー推論とグラフィカルモデルの学習のためのアルゴリズムを量子領域に拡張する。
量子反復スケーリング(QIS)として知られる一般化は単純であるが、重要な課題は量子問題インスタンスの非可換性にある。
準ニュートン法によるQISとGDの性能向上について検討する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:11:34 GMT)
Fast Diffusion-Based Counterfactuals for Shortcut Removal and Generation [5.0] ショートカット学習は、モデルがターゲットラベルと急激なショートカット特徴の間の相関を利用するときである。
これは医学的画像において一般的であり、治療と臨床的アノテーションは疾患のラベルと相関し、疾患を予測するためのショートカットを容易にする。
本稿では,高速拡散に基づく反ファクト画像生成による潜在的ショートカット特徴の影響の新しい検出と定量化を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:45:40 GMT)
Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors [5.0] 本稿では,バイナリ重み付きニューラルネットワークのサブビット圧縮を実現するために,ビット列を持つタイル型ニューラルネットワーク層に対する新しい量子化方式を提案する。
私たちは完全に接続された層と畳み込み層の両方にアプローチを採用しています。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:55:38 GMT)
Market or Markets? Investigating Google Search's Market Shares Under Horizontal and Vertical Segmentation [4.9] 本稿では,オンライン検索の水平および垂直のセグメンテーションの下で,Google検索のマーケットシェアを初めて分析する。
Google Searchは、他の水平検索エンジンと比較して71.8%の参加者のクエリを受け取ります。
以上の結果から,Google検索の市場パワーとオンライン市場全体の概念化に関する,現在かつ現在進行中の議論について報告する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:09:55 GMT)
Ubiquitous Metadata: Design and Fabrication of Embedded Markers for Real-World Object Identification and Interaction [4.9] 物理的な領域とデジタル領域の収束は、没入的な経験とシームレスな相互作用の新しい時代を支えてきた。
物理的オブジェクトと仮想オブジェクトを接続する堅牢で効率的な方法が求められている。
本稿では, 組込み機械可読マーカーの設計, 製作, 検出を通じて, このギャップを埋める新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:14:52 GMT)
Improving Engagement and Efficacy of mHealth Micro-Interventions for Stress Coping: an In-The-Wild Study [4.7] パーソナライズされたコンテキスト認識介入選択アルゴリズムは、mHealth介入のエンゲージメントと有効性を改善する。
短時間でも1分間の介入は、知覚されるストレスレベルを著しく減少させる。
本研究は,個人化された文脈認識介入選択アルゴリズムを導入することで文献に寄与する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:22:22 GMT)
Detection of Global Anomalies on Distributed IoT Edges with Device-to-Device Communication [4.6] 本稿では,ワイヤレスアドホックフェデレートラーニングを用いた分散異常検知器の学習のための,完全分散協調方式を提案する。
サンプルはローカルデバイスでは稀だが,対象ドメインの全デバイスでは稀であるGlobal Anomalyの概念を紹介した。
両装置は, 偽陽性率の低いグローバル異常検出の閾値を, 例外なく高い真陽性率を達成し, 協調的に検出できることを確認した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:50:25 GMT)
Beyond Words: On Large Language Models Actionability in Mission-Critical Risk Analysis [4.5] リスク分析の原則はコンテキストレスです。
リスク分析には、国内外の規制や基準に関する膨大な知識が必要である。
大規模な言語モデルは、人間よりも少ない時間で情報を素早く要約することができ、特定のタスクに微調整することができる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:45:50 GMT)
Physical partisan proximity outweighs online ties in predicting US voting outcomes [4.5] 影響のある分極と社会的分裂の増大は、社会の混合や、オンラインや物理的な空間における情報の拡散に影響を及ぼす。
我々は、同じ社会的文脈への物理的な近接と露出、オンラインの社会的結びつき、住居のソートという、パルチザンの露出の3つの次元を比較した。
以上の結果から,選挙結果が不確実なスウィング郡では,物理パルチザン近接が投票パターンの最良の予測要因であることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:02:18 GMT)
Sociotechnical Implications of Generative Artificial Intelligence for Information Access [4.4] 生成AI技術は、情報にアクセスし、既存の情報検索システムの有効性を改善する新しい方法を可能にする。
本稿では、情報アクセスの文脈において、生成AIを採用する際のシステム的結果とリスクについて概説する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:47:13 GMT)
Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection [4.3] 本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争力のある性能を実現する手法を提案する。
大規模ネットワークから小さなネットワークへ知識を伝達するために,リレーショナル自己教師型蒸留を利用することで,少ない記述子サイズの軽量ネットワークのトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:39:27 GMT)
A Transformer-based Approach for Augmenting Software Engineering Chatbots Datasets [4.3] ソフトウェアエンジニアリングデータセットを拡張するための自動トランスフォーマーベースのアプローチを提案する。
3つのソフトウェアエンジニアリングデータセットを用いて,拡張アプローチがRasa NLUの性能に与える影響を評価する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:48:44 GMT)
FoodMem: Near Real-time and Precise Food Video Segmentation [4.3] 現在の制限は、不正確な栄養分析、非効率な作物管理、最適な食品加工に繋がる。
本研究では,高品質でほぼリアルタイムなセグメンテーションとビデオ中の食品の追跡のための堅牢なフレームワークの開発を紹介する。
私たちは、360度シーンのビデオシーケンスから食品を分割する新しいフレームワーク、FoodMemを紹介します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:15:07 GMT)
Challenges of Multilingual Program Specification and Analysis [4.2] マルチ言語プログラミングで一般的に使用される特徴が,その特徴を特定・解析する能力に与える影響について論じる。
多言語プログラムのいくつかの例と、その振る舞いを公式に推論する複雑さについて述べる。
また、多言語プログラム分析における技術の現状を要約し、オープンなままの課題を含める。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:29:54 GMT)
Revisiting the Impact of Pursuing Modularity for Code Generation [4.2] コード生成におけるモジュラリティの影響を,その定量的測定のための新しい測定基準を導入することによって評価する。
驚くべきことに、このトピックに関する従来の知恵とは異なり、モジュラリティはコード生成モデルのパフォーマンスを改善するための中核的な要素ではない。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:48:24 GMT)
A PLMs based protein retrieval framework [4.1] 本稿では,配列類似性に対するバイアスを緩和する新規なタンパク質検索フレームワークを提案する。
我々のフレームワークは、タンパク質の配列を高次元の特徴空間に埋め込むために、タンパク質言語モデル(PLM)を主導的に活用する。
大規模な実験により、我々のフレームワークは類似タンパク質と異種タンパク質の両方を等しく回収できることが示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:52:42 GMT)
ScribblePrompt: Fast and Flexible Interactive Segmentation for Any Biomedical Image [4.1] 本稿では,バイオメディカルイメージングのためのフレキシブルニューラルネットワークを用いたインタラクティブセグメンテーションツールであるemphScribblePromptを紹介する。
ドメインの専門家によるユーザスタディでは、ScribblePromptはアノテーションの時間を28%削減し、Diceを15%改善した。
インタラクティブなデモでScribblePromptを紹介し、コードを提供し、https://scribbleprompt.csail.mit.eduでscribbleアノテーションのデータセットをリリースします。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:21:42 GMT)
Multi-reservoir enhanced loading of tweezer atom arrays [4.0] 単一原子光トウィーザアレイへの負荷改善のための種非依存手法を提案する。
提案手法は4回のリロードサイクル後に96$%の負荷率を達成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:37:41 GMT)
Deciphering the Role of Representation Disentanglement: Investigating Compositional Generalization in CLIP Models [3.9] 構成分布(C-OoD)の一般化はCLIPモデルでは比較的未探索である。
本研究は,CLIPモデルの一般化において,画像およびテキスト表現の歪み,特に構成要素について重要な役割を担っていることを明らかにした。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:42:05 GMT)
Safe Online Convex Optimization with Multi-Point Feedback [3.9] 我々は,ゼロオーダー情報のみを使用しながら,サブ線形後悔とゼロ制約違反を同時に達成する必要がある安全なオンライン凸最適化環境について検討する。
特に,各ラウンドで$d + 1$ポイントを選択し,各ポイントで制約関数とコスト関数の値を受け取るマルチポイントフィードバック設定を考える。
この問題に対処するために,前向き差分勾配推定と楽観的かつ悲観的なアクションセットを利用して,$mathcalO(d sqrtT)$ regret and zero constraintを実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:09:26 GMT)
Accelerating Simulation of Two-Phase Flows with Neural PDE Surrogates [3.9] 二相流問題のスケーリングシミュレーションを支援するツールとして,ニューラルPDEソルバを検討・拡張する。
この問題に対する既存の数値解法を、領域の様々な測度を含むより複雑な設定に拡張する。
その結果,最大3桁の速さで液滴力学を正確にモデル化できることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:41:22 GMT)
Automating psychological hypothesis generation with AI: when large language models meet causal graph [3.9] 我々は,大言語モデル(LLM)を用いて43,312の心理学記事を分析し,因果関係のペアを抽出した。
リンク予測アルゴリズムを適用して、幸福に焦点をあてた130の心理学的仮説を作成した」
この結果から,因果知識グラフなどの機械学習技術を組み合わせることで,心理学における自動発見に革命をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:12:45 GMT)
On the Calibration of Epistemic Uncertainty: Principles, Paradoxes and Conflictual Loss [3.8] 証拠不確実性は、Deep Ensembles、Bayesian Deep Networks、Evidential Deep Networksによって生成される。
測定可能ではあるが、この形の不確実性は客観的に校正することは困難である。
以上の要件に則った競合損失という,深層アンサンブルの正規化関数を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:21:28 GMT)
A Discrete Perspective Towards the Construction of Sparse Probabilistic Boolean Networks [3.8] スパースPBNを構築するための新しいGreedy Entry removal (GER)アルゴリズムを提案する。
GERは最先端のスパースPBN構築アルゴリズムの中で最高の性能を提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:50:04 GMT)
Uhlmann-quench, A Protocol to Measure the Uhlmann Phase [3.8] 混合量子状態のクエンチ力学に幾何学的位相を組み込む形式を提示する。
ウルマンクエンチ(Uhlmann quench)は、混合状態における量子力学と幾何学的過程の間の相互作用を研究するためのルートを提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:59:30 GMT)
Towards Neuro-Symbolic Video Understanding [3.8] 長期的時間的推論は、フレーム検索システムにとって重要なデシダータムである。
この失敗の主な理由は、フレーム単位の認識と時間的推論を1つのディープネットワークに織り込むためである。
本稿では,個々のフレームの意味的理解に視覚言語モデルを活用するシステムを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:55:58 GMT)
psifx -- Psychological and Social Interactions Feature Extraction Package [3.6] psifxはマルチモーダルな特徴抽出ツールキットである。
それは、人間の科学研究に最先端の機械学習技術を使うことを容易にし、民主化することを目的としている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:30:03 GMT)
A Novel Lexicon for the Moral Foundation of Liberty [3.5] 自由の道徳的価値は、議論を呼んでいる社会問題に対してスタンスを取るという点において、我々の推論システムにおける中心的な概念である。
3000以上の注釈付きデータから評価した新しいリバティ辞書を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:49:05 GMT)
Coexistence of non-Hermitian skin effect and extended states in one-dimensional nonreciprocal lattices [3.4] スタッガートオンサイト変調と非相互ホッピングを持つ一次元非エルミート格子について検討する。
本研究は,非エルミート系におけるオンサイト変調と非相互ホッピングの複雑な相互作用を明らかにする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:26:22 GMT)
HyperAggregation: Aggregating over Graph Edges with Hypernetworks [3.4] HyperAggregationは、グラフニューラルネットワークのためのハイパーネットワークベースの集約機能である。
これは、誘導的およびトランスダクティブな設定の両方において、ホモ親和性およびヘテロ親和性データセットに効果的に使用できる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:52:03 GMT)
A Foundation Model for Brain Lesion Segmentation with Mixture of Modality Experts [3.2] 本稿では3次元脳病変分割のための普遍的基礎モデルを提案する。
我々は,様々な画像モダリティに対応する複数のエキスパートネットワークを備えた,新しいMixture of Modality Experts (MoME) フレームワークを定式化する。
我々のモデルは最先端のユニバーサルモデルより優れており、目に見えないデータセットに有望な一般化を提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:59:11 GMT)
AdaptEval: Evaluating Large Language Models on Domain Adaptation for Text Summarization [3.1] 本研究では,多言語モデル(LLM)のドメイン適応能力について,各ドメイン間の要約タスクで評価する。
本稿では、最初のドメイン適応評価スイートであるAdaptEvalを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:50:39 GMT)
A replica analysis of under-bagging [3.1] Under-bagging (UB) は、不均衡なデータに基づいて分類器を訓練するための一般的なアンサンブル学習手法である。
アンダーサンプリングによる試料径の減少による分散の増大を抑えるためにバッジを用いることは自然なアプローチである。
近年、一般化線形モデルでは、クラス不均衡構造を考慮しない単純バッグングとリッジ正則化が同じ結果をもたらすことが指摘されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:19:07 GMT)
Characteristic Learning for Provable One Step Generation [3.0] 本稿では,GAN(Generative Adversarial Networks)におけるサンプリング効率とフローベースモデルの安定した性能を組み合わせた一段階生成モデルを提案する。
我々のモデルは、確率密度輸送を通常の微分方程式(ODE)で記述できる特性によって駆動される。
2-ワッサーシュタイン距離における特性発生器の非漸近収束速度を確立するために,速度マッチング,オイラー離散化,特性適合の誤差を解析した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:41:53 GMT)
Spatial Coherence Loss: All Objects Matter in Salient and Camouflaged Object Detection [3.0] 正確な意味分析を行うには、学習のどの段階でも現れる全てのオブジェクトレベルの予測を学習する必要がある。
本稿では,隣接画素間の相互応答を広範に使用する単一応答損失関数に組み込んだ新しい損失関数である空間コヒーレンス損失(SCLoss)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:23:30 GMT)
Estimating Agreement by Chance for Sequence Annotation [3.0] 本稿では,シーケンスアノテーションタスクにおける確率一致を推定する基礎となるランダムアノテーションを生成するための新しいモデルを提案する。
我々は,各注釈付きテキストセグメントの確率的位置の計算と,それに続く確率的一致推定を可能にするために,分布の分析形式をうまく導出する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:32:47 GMT)
On the Need for Configurable Travel Recommender Systems: A Systematic Mapping Study [3.0] 再利用の最小化と市場投入のスピードアップを促進する設定アプローチで開発者をサポートするのではなく、さまざまなコンテキストに対して、スクラッチからTRSを構築する傾向があります。
分析の結果,運用状況と密接な関係を持つTLSの開発において,TLSプロバイダを支援する構成サポートが欠如していることが明らかになった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:33:59 GMT)
A Meta-Learning Approach for Multi-Objective Reinforcement Learning in Sustainable Home Environments [3.0] 我々はメタラーニングパラダイムを用いて最先端のMORLアルゴリズムを拡張した。
環境環境変化を検出するために,自動エンコーダ(AE)に基づく教師なしの手法を用いる。
本研究は,住宅機器スケジューリングにおけるMORLの適用性を評価し,エネルギー管理におけるメタラーニングの有効性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:23:20 GMT)
Beyond Incompatibility: Trade-offs between Mutually Exclusive Fairness Criteria in Machine Learning and Law [3.0] 本稿では,3つのフェアネス基準を連続的に補間する新しいアルゴリズム(FAir Interpolation Method: FAIM)を提案する。
我々は,合成データ,CompASデータセット,電子商取引部門による新たな実世界のデータセットに適用した場合のアルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:29:01 GMT)
Data selection method for assessment of autonomous vehicles [2.9] 本稿では,自律走行車の評価を行う上で,実用的で柔軟かつ効率的なデータ選択手法を提案する。
我々の考えは、選択したデータのメタデータ分布と予め定義されたメタデータ分布との類似性を最適化することである。
大規模なデータセットBDD100Kの実験では,提案手法が効率的にデータ選択タスクを実行できることが示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:35:38 GMT)
GraphFM: A Scalable Framework for Multi-Graph Pretraining [2.9] 本稿では,さまざまな領域のグラフデータセットにまたがるノード分類タスクに適した,スケーラブルなマルチグラフ・マルチタスク事前学習手法を提案する。
我々は,740万以上のノードと1億1900万のエッジからなる152のグラフデータセットのモデルをトレーニングすることで,このアプローチの有効性を実証する。
以上の結果から,多種多様な実・合成グラフの事前学習により適応性と安定性が向上し,最先端のスペシャリストモデルと競合する結果が得られた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:51:43 GMT)
Click-Gaussian: Interactive Segmentation to Any 3D Gaussians [2.8] Click-Gaussian は2段階の粒度の区別可能な特徴場を学習する。
私たちのメソッドは、従来のメソッドの15~130倍の速さで、1クリックあたり10ミリ秒で動作します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:49:27 GMT)
Reasoning with Large Language Models, a Survey [2.8] 本稿では,LSMによるプロンプトベース推論の急速に進展する分野について概説する。
我々の分類学は、多段階推論の生成、評価、制御の異なる方法を特定します。
我々は, 自己改善, 自己回帰, 推論過程のいくつかのメタ能力が, プロンプトの司法的利用によって可能であることを発見した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:49:35 GMT)
Zero-Shot Adaptation for Approximate Posterior Sampling of Diffusion Models in Inverse Problems [2.8] 画像の逆問題に対するゼロショット近似後方サンプリング(ZAPS)を提案する。
ZAPSはサンプリングステップの数を修正し、物理学誘導損失関数によるゼロショットトレーニングを使用して、不規則な時間ステップ毎にログライクな重みを学習する。
以上の結果から,ZAPSは推定時間を短縮し,不規則な騒音スケジュールに頑健性を提供し,再現性の向上を図っている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 00:09:37 GMT)
Imitation of human motion achieves natural head movements for humanoid robots in an active-speaker detection task [2.8] 頭の動きは社会的人間と人間の相互作用に不可欠である。
そこで本研究では,直型ヒューマノイドロボットの頭部運動生成に生成型AIパイプラインを用いた。
その結果,会話中の話者を積極的に追跡しながら,人間の頭部の動きを自然に模倣することに成功した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:08:40 GMT)
Quantum Coherence, Dynamics and Their connections [2.8] 時間に依存しないハミルトニアンにとって、平均的な進化速度を決定するのは量子コヒーレンスであることを示す。
時間依存ハミルトニアンに対しては、ある量子ビットの進化における距離の上限を1つ与える。
一般量子系では、量子コヒーレンスと量子力学の関係についても論じる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:21:59 GMT)
A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting [2.8] この研究は安定拡散の上に構築され、汎視的セグメンテーションに対する潜時拡散アプローチを提案する。
トレーニングは,(1)部分分割マスクを潜伏空間に投影する浅層オートエンコーダの訓練,(2)潜伏空間における画像条件付きサンプリングを可能にする拡散モデルの訓練,の2段階からなる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:52:54 GMT)
How Personality Traits Influence Negotiation Outcomes? A Simulation based on Large Language Models [2.7] 本稿では,Large Language Model (LLM) エージェントに着目したシミュレーションフレームワークを提案する。
実験結果から, LLMシミュレーションの行動傾向は, 人間の交渉で観察された行動パターンを再現できることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:52:51 GMT)
Quantum computation in fermionic thermal field theories [2.7] 量子アルゴリズムを用いてフェルミオンのみを含む熱場理論を研究する。
1+1次元のマヨラナフェルミオンの熱分布や熱場理論のエネルギー密度などの数値的な結果を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:18:54 GMT)
NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks [2.6] この研究は、任意の整数のみのコナールニューラルネットワーク(CNN)を学習するための新しいフレームワークであるNITRO-Dを導入する。
NiTRO-Dは、量子化スキームを導入することなく整数のみのCNNのトレーニングを可能にする文献における最初のフレームワークである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:16:49 GMT)
ClaimCompare: A Data Pipeline for Evaluation of Novelty Destroying Patent Pairs [2.6] 我々は、IRおよびMLモデルのトレーニングに適したラベル付き特許請求データセットを生成するように設計された、新しいデータパイプラインであるCrimCompareを紹介する。
私たちの知る限りでは、ClaymCompareは、特許データセットを破壊する新規性を複数生成できる最初のパイプラインです。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:38:45 GMT)
Learning secondary tool affordances of human partners using iCub robot's egocentric data [2.6] 我々は、人間のパートナーの二次ツールの余裕を学習する問題に対処する。
我々は、iCubロボットを使用して、3台のカメラで人間のパートナーを観察し、4つの異なるツールを使用して20個のオブジェクトに対してアクションを実行する。
以上の結果から,iCubロボットは深層学習アーキテクチャにより,セカンダリツールの価格を予測できることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:14:13 GMT)
Zero-shot Cross-Lingual Transfer for Synthetic Data Generation in Grammatical Error Detection [2.6] 様々な言語からのデータを用いてモデルを訓練し、他の言語で合成エラーを生成する。
これらの合成誤差コーパスは、GEDモデルのトレーニングに使用される。
このアプローチは、現在最先端のアノテーションのないGEDメソッドよりも優れている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:35:15 GMT)
BinaryAlign: Word Alignment as Binary Sequence Labeling [2.6] 本稿では,バイナリシーケンスラベリングに基づく単語アライメント手法であるBinaryAlignを提案する。
非英語対におけるBinaryAlignの性能について検討する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:11:06 GMT)
Cross-lingual QA: A Key to Unlocking In-context Cross-lingual Performance [2.4] クロスランガルQAは、質問と回答の部分のみを翻訳し、翻訳コストを削減できる言語間プロンプト手法である。
4つのタイプ的多言語ベンチマークの実験により、クロスランガルQAはモデルに効果的に刺激を与え、クロスランガルの知識を引き出すことを示した。
本研究は,言語間実例を用いたオープンソースMLLMの高速化により,モデルスケールの増大に伴い,性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:18:48 GMT)
Diff-MTS: Temporal-Augmented Conditional Diffusion-based AIGC for Industrial Time Series Towards the Large Model Era [2.3] 本稿では,MTS生成のための時間拡張適応拡散モデルDiff-MTSを提案する。
MTSデータの複雑な時間的依存関係とダイナミックスをよりよく扱うことを目的としている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:38:40 GMT)
Towards a Benchmark for Causal Business Process Reasoning with LLMs [2.3] 大きな言語モデル(LLM)は、組織の効率向上やタスクの自動化にますます使われています。
近年の取り組みは、推論、計画、意思決定といった活動にLLMを採用するよう拡張されている。
本研究は, LLMの因果的・プロセス的視点を推論する能力を評価するため, ベンチマーク開発のための種子を植え付けるものである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:48:32 GMT)
Sharif-MGTD at SemEval-2024 Task 8: A Transformer-Based Approach to Detect Machine Generated Text [2.2] MGTは自然言語処理において重要な研究領域となっている。
本研究では,強力なニューラルアーキテクチャであるRoBERTaベーストランスを微調整し,MGT検出に対処する効果について検討する。
提案システムでは,テストデータセットの78.9%の精度を達成し,参加者の57位に位置づけた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:33:01 GMT)
Fine-Tuning Medical Language Models for Enhanced Long-Contextual Understanding and Domain Expertise [2.2] 大規模言語モデル(LLM)は様々な専門分野に広く応用されている。
特定のドメイン知識の改善にもかかわらず,長期理解における医学的LLMの性能は著しく低下している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:37:20 GMT)
Dynamical Quantum Phase Transition and Thermal Equilibrium in the Lattice Thirring Model [2.2] 臨界相と質量相の両方で平衡から切り離された格子チリングモデルの進化をシミュレートする。
我々は、動的量子相転移が存在するために必要な初期状態のエネルギー密度の閾値を同定する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 00:51:01 GMT)
Mapping savannah woody vegetation at the species level with multispecral drone and hyperspectral EnMAP data [2.1] 本研究は南アフリカのサバンナの種レベルでの分画木質被覆(FWC)の正確なマッピングを目標としている。
乾季EnMAP画像のFWCマッピングにおいて, 4つの機械学習回帰アルゴリズムを検証した。
その結果,FWCを種レベルで正確にマッピングする手法の妥当性が示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:44:41 GMT)
Accounting for Work Zone Disruptions in Traffic Flow Forecasting [2.1] 我々は、畳み込みグラフニューラルネットワークアーキテクチャの上に構築し、新しい道路作業ゾーンのためのグラフ畳み込みモデルを示す。
このモデルは、バージニア共和国のワークゾーンの存在下でのトラフィックを最小限に抑える2つのデータセットで評価される。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:48:24 GMT)
Backpropagation through space, time, and the brain [2.1] 我々は、ニューロンの物理的、動的ネットワークにおける完全局所的時間的クレジット割り当てのための計算フレームワークであるGeneral Latent Equilibriumを紹介する。
特に、GLEは樹状樹の形態を利用して、単一ニューロンのより複雑な情報保存と処理を可能にしている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:37:05 GMT)
VideoClusterNet: Self-Supervised and Adaptive Clustering For Videos [2.1] Video Face Clusteringは、検出された顔のトラックを共通の顔認証でまとめることを目的としている。
この問題は、ビデオフレームにまたがる特定の顔のポーズ、表情、外観、照明のバリエーションが多岐にわたるため、非常に難しい。
本稿では,ジェネリック・フェイスIDモデルを,完全に自己管理された新しいビデオ・フェイス・トラックに適応させることを学習する,新しいビデオ・フェイス・クラスタリング手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 23:34:55 GMT)
Latency optimized Deep Neural Networks (DNNs): An Artificial Intelligence approach at the Edge using Multiprocessor System on Chip (MPSoC) [1.9] モバイルデバイスにおけるエッジコンピューティング(Edge at Edge)は、この要件に対処するための最適化されたアプローチのひとつだ。
本研究では,低レイテンシ・電力最適化型スマートモバイルシステムの実現の可能性と課題について考察する。
組込みFPGAエッジデバイス上でのニューラルネットワーク(NN)の性能と実装可能性について論じる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:51:41 GMT)
Learning Global and Local Features of Power Load Series Through Transformer and 2D-CNN: An image-based Multi-step Forecasting Approach Incorporating Phase Space Reconstruction [1.9] 本研究では、PSRとニューラルネットワークを統合することで、新しいマルチステップ予測手法を提案する。
PSR-GALIENと呼ばれる新しいディープラーニングモデルは、エンドツーエンド処理のために設計されている。
その結果、PSR-GALIENの予測性能は、最先端の6つのディープラーニングモデルと比較すると、これらのベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:59:13 GMT)
Joint Data Inpainting and Graph Learning via Unrolled Neural Networks [1.9] 基礎となるグラフトポロジと欠測値の両方を推定するアルゴリズムを提案する。
提案手法はグラフ学習とグラフ信号再構成アルゴリズムの両方に利用できる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:46:41 GMT)
LiteGPT: Large Vision-Language Model for Joint Chest X-ray Localization and Classification Task [1.9] 医用イメージングのための統合フレームワーク LiteGPT を提案する。
複数の事前学習されたビジュアルエンコーダを利用して情報を強化し、視覚言語モデルの性能を向上させる。
本研究は,医用画像における共同局所化と分類の新たな課題に視覚言語モデルを用いた最初の研究である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:19:02 GMT)
Investigating Imperceptibility of Adversarial Attacks on Tabular Data: An Empirical Analysis [1.7] 敵対的攻撃は、入力データに知覚不能な摂動を導入することによって、機械学習モデルが誤った予測を行う可能性がある。
本研究は,表型データに対する敵攻撃の非受容性を評価するための特性セットを定義する。
この評価は、特に近接性、感度、偏差に関して、攻撃の成功と不可避性の間のトレードオフを明らかにしている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:55:25 GMT)
Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints [1.6] 提案手法は,局所的・グローバルな経路計画タスクにおいて,既存の手法よりも優れていることを示す。
提案手法は,提案手法が局所的・グローバルな経路計画タスクにおいて既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:41:27 GMT)
LAB-Bench: Measuring Capabilities of Language Models for Biology Research [1.6] 言語エージェント生物学ベンチマーク(LAB-Bench)を紹介する。
これは、AIシステムを評価するための2,400以上の複数の選択質問のデータセットである。
また,本ベンチマークに対して,複数のフロンティア言語モデルの性能を測定し,人間の専門生物学研究者と比較して結果を報告する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:54:55 GMT)
Walking through Hilbert Space with Quantum Computers [1.5] このレビューは、計算化学の重要な領域における複雑なサンプリングタスクに取り組む量子アルゴリズムの最近の進歩を強調している。
我々は、ハイブリッド量子古典から完全量子まで、幅広い量子アルゴリズムをレビューする。
量子計算の優位性を達成するための可能性と課題について論じる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:43:44 GMT)
Tackling Oversmoothing in GNN via Graph Sparsification: A Truss-based Approach [1.5] 本稿では,グラフの高密度領域からエッジを抽出する新鮮で柔軟なトラスグラフスペーシフィケーションモデルを提案する。
次に、GIN、SAGPool、GMT、DiffPool、MinCutPool、HGP-SL、DMonPool、AdamGNNといった最先端のベースラインGNNとプールモデルでスパーシフィケーションモデルを利用する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:21:36 GMT)
Hydra: Brokering Cloud and HPC Resources to Support the Execution of Heterogeneous Workloads at Scale [1.5] Hydraは、商用プライベートクラウドとHPCプラットフォームからリソースを同時に取得できる、クラウド内のHPCブローカシステムである。
商用プライベートクラウドとHPCプラットフォームからリソースを同時取得可能な,クラウド内HPCブローカシステムであるHydraを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:59:46 GMT)
Improved particle-flow event reconstruction with scalable neural networks for current and future particle detectors [1.5] 電子-陽電子衝突における事象再構成のためのスケーラブルな機械学習モデルについて, フル検出器シミュレーションに基づく検討を行った。
グラフニューラルネットワークとカーネルベースのトランスフォーマーを比較し、現実的な再構築を実現しつつ、操作を回避できることを実証する。
最良のグラフニューラルネットワークモデルでは、ルールベースのアルゴリズムと比較して、ジェット横運動量分解能が最大50%向上している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:57:44 GMT)
LoRA-PT: Low-Rank Adapting UNETR for Hippocampus Segmentation Using Principal Tensor Singular Values and Vectors [1.4] 海馬は様々な精神疾患に関連する重要な脳構造である。
深層学習に基づく手法は海馬のセグメンテーションに大きな進歩をもたらした。
そこで本研究では,LoRA-PTと呼ばれるパラメータ効率の高いファインチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 00:40:57 GMT)
Strategizing against Q-learners: A Control-theoretical Approach [1.4] 敵のQ-ラーニングアルゴリズムを知っていれば、いかに戦略的に洗練されたエージェントが素質のQ-ラーナーを活用できるかを定量化する。
連続状態空間に取り組むための量子化に基づく近似スキームを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:13:25 GMT)
Thorns and Algorithms: Navigating Generative AI Challenges Inspired by Giraffes and Acacias [1.4] 人間とジェネレーティブAI(Gen AI)の相互作用は、アフリカサバンナのキリンとアカシアのダイナミックな関係と、洞察に富んでいる。
この論文は、まだ環境をマスターしている若いキリンのように、人間がGen AIに適応し形作りする初期段階にあることを探求する。
偏見、誤報、プライバシー侵害などのリスクを軽減するために、人間が開発し、精錬している戦略を掘り下げる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:53:25 GMT)
TM-PATHVQA:90000+ Textless Multilingual Questions for Medical Visual Question Answering [1.3] 本研究は,テキストレス多言語病理VQAデータセットを導入することで,音声ベースのVQAシステムを実現する。
このデータセットは5,004の病理画像と70時間の音声に基づいて、98,397の多言語音声質問と回答からなる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:54:45 GMT)
Generally-Occurring Model Change for Robust Counterfactual Explanations [1.3] モデル変更に対する対実的説明生成アルゴリズムの堅牢性について検討する。
本稿では,まず自然発生モデル変化の概念を一般化する。
また、モデルパラメータ変化のより一般的な概念である、モデル変化の一般発生についても提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:44:00 GMT)
GPT Assisted Annotation of Rhetorical and Linguistic Features for Interpretable Propaganda Technique Detection in News Text [1.3] 本研究は, 説得の言語に関する文献で同定された22の修辞的, 言語学的特徴を分類した。
WebアプリケーションであるRhetAnnは、そうでなければかなりの精神的な努力を最小限に抑えるように設計されている。
注釈付きデータの小さなセットは、生成的大言語モデル(LLM)であるGPT-3.5を微調整し、残りのデータに注釈を付けた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:15:39 GMT)
AI and the Iterable Epistopics of Risk [1.3] AIが社会に提示するリスクは、一般的な計算によって管理可能であると広く理解されている。
本稿では、規制当局、開発者、サイバーセキュリティの専門家によるリスクの把握と管理について詳述する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:43:18 GMT)
Impossibility of latent inner product recovery via rate distortion [1.2] d gtrsim n h(p)$ ここで、$h(p)$ が二元エントロピー函数であれば、内部積を回復することは不可能である。
この証明は、確立された速度歪曲理論に従う。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:23:29 GMT)
Improved Quantum Power Method and Numerical Integration Using Quantum Singular Value Transformation [1.1] 最初に、QSVTフレームワークが最近導入された量子パワー法を加速できることを示し、実行時間を大幅に改善した。
矩形法などいくつかの基本数値積分手法をQSVTフレームワークに組み込んだ結果,グリッドのサイズや点数に対する高速化が得られた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:11:35 GMT)
ImPORTance -- Machine Learning-Driven Analysis of Global Port Significance and Network Dynamics for Improved Operational Efficiency [1.0] 本研究は, 船舶の移動によって形成される接続網を解析し, 重要港で共有される共通特性について検討することを目的とする。
本研究の成果は, 産業における港湾開発, 資源配分, インフラ計画に関連する意思決定プロセスについて報告することを目的としている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:58:04 GMT)
Not Another Imputation Method: A Transformer-based Model for Missing Values in Tabular Datasets [1.0] NAIM(Not Another Imputation Method)は、従来の計算手法を使わずに欠落した値を扱うために設計されたトランスフォーマーベースのモデルである。
NAIMは機能固有の埋め込みと、利用可能なデータから効果的に学習するマスク付き自己認識機構を採用している。
5つの公開データセット上でNAIMを広範囲に評価した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:43:47 GMT)
What Makes a Meme a Meme? Identifying Memes for Memetics-Aware Dataset Creation [0.9] マルチモーダルインターネットミームは現在、オンライン談話におけるユビキタスなフィクスチャとなっている。
ミームはミームを模倣してシンボルに変換する過程である。
我々は,ミームと非ミームコンテンツとを識別するミーム識別プロトコルを開発した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:48:36 GMT)
Monocular pose estimation of articulated surgical instruments in open surgery [0.9] 本研究は,開腹手術における手術器具の単眼6Dポーズ推定への新たなアプローチとして,物体調音,対称性,注釈付き実世界のデータの欠如といった課題に対処する。
提案手法は,(1)手術器具の3次元モデリングと調音リギングを用いた合成データ生成,(2)ポーズ推定とハイブリッドな幾何学的融合戦略を組み合わせたポーズ推定フレームワーク,(3)自動生成擬似ラベルを用いた実ビデオデータへのドメイン適応を用いた,合成データと実際の注釈データの両方を利用したトレーニング戦略,の3つの構成要素から構成される。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:47:35 GMT)
Pseudorandom density matrices [0.8] Pseudorandom state (PRS) は、任意の効率的な量子アルゴリズムによってハールランダム状態と区別できない状態アンサンブルである。
一般化されたヒルベルト・シュミットのアンサンブルと計算的に区別できない$n$-qubit状態のアンサンブルであるPRDMを導入する。
m=omega(log n)$のPRDMは、ユニタリノイズチャネルと最近導入された$mathsfPostBQP$攻撃に対して堅牢である。
また、効率よくハールランダム状態と区別できないPRSのノイズロバストな概念である、メモリレスPSSも導入する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:14:58 GMT)
Advantages of multistage quantum walks over QAOA [0.8] 量子近似最適化アルゴリズム(QAOA)と多段量子ウォーク(MSQW)を比較する。
等価資源を用いて,MSQWがQAOAより優れていることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:35:53 GMT)
Characterising transformations between quantum objects, 'completeness' of quantum properties, and transformations without a fixed causal order [0.8] 量子力学における重要な対象は、特定のアフィン/線型空間の間の線型写像である。
直接的で使いやすい方法でこれらのプロパティを推論するフレームワークを提供する。
我々は、高次量子変換において、不定因性の存在が自然に出現する方法について論じる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:49:03 GMT)
Detection of Malaria Vector Breeding Habitats using Topographic Models [0.8] 本研究では,地球規模で利用可能なDEMデータに基づく実用的な地形モデルを提案する。
ガーナのオプアシ地域を調査し,様々な地形特性が異なる水域に与える影響について検討した。
我々の最良モデルは、小水位検出に地形変数を用いた以前の試みよりも優れていた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:05:39 GMT)
L2AI: lightweight three-factor authentication and authorization in IOMT blockchain-based environment [0.7] 医療用インターネット・オブ・モノ(IoMT)は、個人が最小限のインタラクションで重要なアクティビティをリモートで管理することを可能にする。
本稿では,ブロックチェーン環境におけるリアルタイムデータにアクセスするための,軽量な多要素認証と匿名ユーザ認証方式を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:33:46 GMT)
GenMix: Combining Generative and Mixture Data Augmentation for Medical Image Classification [0.7] 我々はGenMixと呼ばれる新しいデータ拡張手法を提案する。
両方の手法の強みを利用するために、生成的アプローチと混合的アプローチを組み合わせる。
我々はGenMixが様々な生成モデルの性能を向上させることを実証した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 22:07:08 GMT)
Rethinking Learned Image Compression: Context is All You Need [0.6] 本稿では,エンコーダ,デコーダ,コンテキストモデルのスケーリングパラメータの有効性を解析する。
文脈を最適化することにより,PSNRの達成率と最先端性能をさらに向上させ,VVCよりもBD-RATEの方が14.39%向上したことを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:50:10 GMT)
CCoE: A Compact LLM with Collaboration of Experts [0.6] 我々は、強力なドメインエキスパートを簡単に結合して大きな言語モデル(LLM)に融合するフレームワークを提案する。
コード、法、テキストから数学、医学の分野の専門家5人から始めます。その結果、私たちのCCoEフレームワークは、異なるドメインのオリジナルベースモデルにおいて、トレーニングのリソースが少ないだけでなく、推論も簡単に、効率的に10%-20%パフォーマンスを向上できます。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:03:58 GMT)
Flatfish Disease Detection Based on Part Segmentation Approach and Disease Image Generation [0.6] ヒラメは、世界中で大量に消費される主要な養殖種である。
密集した農業環境のため、ヒラメは怪我や病気の影響を受けやすい。
本研究では, 魚の病気画像を生成的対向ネットワークと画像調和法を用いて拡張する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 03:32:10 GMT)
Schema Matching with Large Language Models: an Experimental Study [0.6] 本稿では,市販のLarge Language Models (LLM) を用いてスキーママッチングを行う。
本研究の目的は,2つの関係スキーマの要素間の意味的対応を名前と記述のみを用いて識別することである。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:33:00 GMT)
Ancient Korean Archive Translation: Comparison Analysis on Statistical phrase alignment, LLM in-context learning, and inter-methodological approach [0.5] 本研究における提案手法の性能はBLEUスコア36.71で,SOLAR-10.7Bの文脈学習と既存のSeq2Seqモデルに勝っている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:26:21 GMT)
Coarse-grained dynamics in quantum many-body systems using the maximum entropy principle [0.5] 我々は、最大エントロピー原理に基づいて、微視的な状態を粗い粒状状態に割り当てる逆写像を構築する。
我々は、スワップとコントロールノーゲートを持つ2量子システムと、Isingスピンチェーンまたはオールツーオールインタラクションで構成される$n$量子システムについて検討する。
これらの力学は非線型性や非マルコビアン性のような非定型的な量子挙動を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:11:14 GMT)
QOG:Question and Options Generation based on Language Model [0.4] 質問-オプション生成(QOG)は、与えられたコンテキストの一連の質問-オプションペアを生成するタスクである。
微調整シーケンス・ツー・シーケンス言語モデル(LM)に基づく3つの異なる手法を用いてQOGモデルを開発する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:12:03 GMT)
Enhancing TinyML Security: Study of Adversarial Attack Transferability [0.4] この研究は、リソース制約の組込みハードウェア上でAIモデルの敵対的脆弱性を掘り下げるものである。
以上の結果から,強力なホストマシンからの敵攻撃は,ESP32やRaspberry Piなど,より小型で安全性の低いデバイスに転送される可能性が示唆された。
このことは、敵対的攻撃が小さなデバイスに拡張され、脆弱性が強調され、TinyMLデプロイメントにおける強化されたセキュリティ対策の必要性を強調していることを示している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:55:25 GMT)
An Explainable Deep Learning-Based Method For Schizophrenia Diagnosis Using Generative Data-Augmentation [0.3] 脳波記録を用いた統合失調症の自動診断にディープラーニングを用いた手法を応用した。
このアプローチは、診断の精度を高める強力な手法である生成データ拡張を利用する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:51:24 GMT)
An AI System for Continuous Knee Osteoarthritis Severity Grading Using Self-Supervised Anomaly Detection with Limited Data [0.3] 本研究は膝OAの自動連続グルーピングのための3段階的アプローチを提案する。
正常度の中心までの距離に基づいて、健康な膝X線の堅牢な表現と疾患の重症度を学ぶ。
提案手法は,OA検出率において最大24%のマージンで既存の技術よりも優れており,疾患重症度スコアはKellgren-Lawrenceグレーティングシステムと人間専門家の成績と同等のレベルで相関している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:37:33 GMT)
Genomic Language Models: Opportunities and Challenges [0.3] ゲノム言語モデル(gLM)は、ゲノムの理解を著しく前進させる可能性があり、様々なスケールのDNA要素が相互作用して複雑な機能を引き起こす。
本稿では、フィットネス予測、シーケンス設計、伝達学習など、gLMの重要応用を強調して、この可能性を実証する。
本稿では,gLMの開発と評価について論じる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:57:35 GMT)
Global Optimisation of Black-Box Functions with Generative Models in the Wasserstein Space [0.3] ブラックボックスシミュレータの最適化はシミュレータや高次元では困難である。
我々は、パラメータ空間全体のブラックボックス応答をモデル化するために、深い生成的サロゲートアプローチを用いる。
次に、この知識を活用して、ワッサーシュタイン距離に基づいて提案された不確実性を推定する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:09:47 GMT)
Self Attention with Temporal Prior: Can We Learn More from Arrow of Time? [0.3] 本稿では,注目層がデータセットの短期的時間バイアスをよりよく符号化できる簡易かつ効率的な手法を提案する。
本実験は,ほとんどのタスクやデータセットにおいて,最高の性能を示すモデルと比較して,例外的な分類結果を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:09:08 GMT)
Simplifying the Theory on Over-Smoothing [0.3] グラフの畳み込みは過剰な平滑化を引き起こす。
本稿では,過度な平滑化がパワーの特殊な場合であることを示すことによって,これらの方向を整列させようとする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:00:42 GMT)
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors [0.2] Vibravox corpusには38時間の音声サンプルと188人の参加者が異なる音環境下で記録した生理的音が含まれている。
音声認識や話者検証など,様々な音声関連課題について一連の実験を行った。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:16:10 GMT)
Large Visual-Language Models Are Also Good Classifiers: A Study of In-Context Multimodal Fake News Detection [0.2] 本稿ではまず,CLIPモデルと比較し,LVLMとGPT4VのFND特性について検討する。
次に,標準文脈学習(ICL)をLVLMと統合し,FND性能の向上に言及する。
textbfIn-context textbfMultimodal textbfFake textbfNews textbfD
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:28:23 GMT)
Violation of the Leggett-Garg Inequality for Dynamics of a Bose-Einstein Condensate in a Double-Well Potential [0.0] 二重井戸電位におけるボソン系のレゲット・ガルグ不等式(LGI)の違反について検討した。
我々の分析では、LGIはジョゼフソンの振動によって侵害されているが、強い結合状態では非侵害であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:26:28 GMT)
V2X-M2C: Efficient Multi-Module Collaborative Perception with Two Connections [0.0] 複数モジュールからなる協調認識モデル $textbfV2X-M2C$ を導入する。
実験により、V2X-M2Cは最先端の知覚性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:51:52 GMT)
Unraveling Rodeo Algorithm Through the Zeeman Model [0.0] 任意の初期状態を考慮したハミルトニアン一般に対する固有状態と固有値スペクトルを決定するために、ロデオアルゴリズムを解く。
我々はPennylaneとQiskitのプラットフォームリソースを利用して、ハミルトンが1スピンと2スピンのゼーマンモデルによって記述されるシナリオを分析する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 01:29:25 GMT)
Universal neural network potentials as descriptors: Towards scalable chemical property prediction using quantum and classical computers [0.0] 本稿では,化学特性予測のための汎用記述子として,普遍的ニューラルネットワークポテンシャルの中間情報を利用する汎用的アプローチを提案する。
本稿では,M3GNet や MACE などのグラフニューラルネットワークを用いた伝達学習が,NMR の化学シフトを予測するための最先端手法に匹敵する精度を実現することを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:17:14 GMT)
Undergraduate setup for measuring the Bell inequalities and performing Quantum State Tomography [0.0] 提案されたセットアップは多用途で費用対効果があり、複数の教室操作モードが可能である。
実験の結果、光子の量子状態の操作が成功し、高忠実な絡み合った状態が達成された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:22:30 GMT)
Transforming Agency. On the mode of existence of Large Language Models [0.0] 本稿では,ChatGPTのような大規模言語モデル(LLM)のオントロジ的特徴について検討する。
また,ChatGPTは,言語オートマトンやインターロケータ,言語オートマトンとして特徴付けられるべきだと論じる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:53:15 GMT)
Towards consistency of rule-based explainer and black box model -- fusion of rule induction and XAI-based feature importance [0.0] ルールベースのモデルは、人間の理解可能な表現、すなわち解釈可能な表現を提供する。
このような説明の生成には、ルールベースモデルによるブラックボックスモデルの近似が含まれる。
ルールベースモデルが近似したブラックボックスモデルと同じ方法で決定を行うかどうかは、まだ調査されていない。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:56:29 GMT)
The object detection method aids in image reconstruction evaluation and clinical interpretation of meniscal abnormalities [0.0] 本研究では,ディープラーニング(DL)画像再構成の品質と異常検出性能の関係について検討した。
再建画像における半月面異常の解釈を強化するための人工知能アシスタントの有効性を評価する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:25:28 GMT)
The Structure of the Majorana Clifford Group [0.0] 量子情報科学において、クリフォード作用素と安定化符号は量子ビット(または量子ビット)系において中心的な役割を果たす
決定的な役割はフェルミオンパリティ対称性 (fermion parity symmetric) によって演じられる。
パリティ保存 fermionic Cliffords の部分群は二進体 $mathbbF$ 上の群で表現できることを証明し、演算子をブレイディングして生成し、任意の(偶数の)マヨラナ安定化符号を構成する方法を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:20:14 GMT)
The Slow Growth of Entanglement in Long-range Interacting Spins Chains due to Destructive Interference between quasi-Particles [0.0] 本稿では,低温におけるハイゼンベルクスピン鎖の機構を理論的に明らかにする。
この機構は、有効光円錐の外側の準粒子間の破壊的干渉に起因する。
我々は、破壊干渉効果の直接の顕在化として、捕捉されたイオンの鎖で実験的に観察可能であることを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:59:19 GMT)
The IoT Breaches your Household Again [0.0] 本稿は、一見無害なデバイスの脆弱性がユーザを重大なリスクに晒す方法を明らかにする。
これらの発見が、同じIoTエコシステム内の他のスマートデバイス間で、部分的にも完全にも、どのように複製できるかを実証する。
調査は、スマート電球(Tapo L530E, Tapo L510E V2, Tapo L630)、スマートプラグ(Tapo P100)、スマートカメラ(Tapo C200)を含むTp-Link Tapoの範囲に焦点を当てた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:30:37 GMT)
Teleportation of unknown qubit via Star type tripartite states [0.0] プロトタイプの$W$ stateは標準的なテレポーテーションには役に立たないことが知られている。
我々は、非プロトタイプの$W$状態の線型重ね合わせとスピンフルプ版を取り、$Star$クラスに属することを示した。
チャネルとして使用するためには、真の三部体の絡み合いが必須ではないことが観察された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:56:25 GMT)
Socioeconomic factors of national representation in the global film festival circuit: skewed toward the large and wealthy, but small countries can beat the odds [0.0] 本研究では,グローバル・フィルム・フェスティバル・サーキットにおいて,各国の経済・人口・地理的要因がどのように表現されるかを分析する。
これは、いくつかのオープンアクセスデータセットの組み合わせに依存しており、10年間で世界中で約600のフェスティバルで2万本以上の映画を3万本以上上映している。
フェスティバル画面は、確かに大富裕国の映画に支配されているが、その偏見は世界の人口と経済格差に完全に比例していないことが示されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:35:53 GMT)
Simple Fermionic backflow states via a systematically improvable tensor decomposition [0.0] 相関電子の波動関数に対して,機械学習のパラメータ化とテンソル階数分解の場を近づける効果的なアンザッツを提案する。
CANDECOMP/PARAFAC (CP) Tenor Factorization of a general backflow transformation in second Quantization for a simple, compact and systematically improvable Fermionic state。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:37:20 GMT)
Representation of Context-Specific Causal Models with Observational and Interventional Data [0.0] CStreesと呼ばれるコンテキスト固有条件独立モデルの新たなファミリーを導入する。
この族は、一般的な介入DAGモデルを定義する因子化特性の一般化を可能にする新しい分解基準によって定義される。
CStreeモデルを実際のデータセットに適用し、データ依存構造とソフトな介入摂動の文脈固有の性質を明らかにする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:43:16 GMT)
Relevance of Anisotropy in the Kondo Effect -- Lessons From the Symplectic Case [0.0] シンプレクティック対称性を持つ近藤模型は, 超伝導アイランドデバイスの有効低エネルギー理論として最近提案された。
鉛とのカップリングにおける非対称性が非フェルミ液体を不安定化することを示す。
結果は、近藤結合における異方性は常に無関係であるという共通の誤解を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:01:18 GMT)
Predicting Emotion Intensity in Polish Political Texts: Comparing Supervised Models and Large Language Models in a Resource-Poor Language [0.0] 本研究では,ポーランドの政治文における感情の強さを予測するために,大規模言語モデル(LLM)の利用について検討する。
本研究は,ソーシャルメディアテキスト1万件の注釈付きコーパスを用いた教師付きモデルと比較した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:53:14 GMT)
Phylotrack: C++ and Python libraries for in silico phylogenetic tracking [0.0] Phylotrackプロジェクトは、シリコの進化における系統の追跡と解析のためのライブラリを提供する。
プロジェクトは,1) Phylotracklibと,2) Phylotrackpy: Phylotracklibを囲むPythonラッパーで,Pybind11で作成された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 22:40:03 GMT)
Personalized Conversational Travel Assistant powered by Generative AI [0.0] モリスCTE研究プロジェクトは、イタリア経済成長大臣(MIMIT)が出資している。
この研究は、イタリア経済成長大臣(MIMIT)が出資したMoise CTE研究プロジェクト(英語版)で進行中である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:18:12 GMT)
Perceived Importance of ICT Proficiency for Teaching, Learning, and Career Progression among Physical Education Teachers in Pampanga [0.0] この研究は、フィリピンのパンパンガ州メキシコの高等学校PE教師のICT統合の現状を垣間見ることができる。
本研究は,政策立案者,管理者,研修プログラム開発者が,PE教師のICT能力の向上に重点を置くことを示唆している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:14:48 GMT)
Path integral for the quartic oscillator: An accurate analytic formula for the partition function [0.0] 正確な分割関数は、温度と結合定数$g$に依存する有効周波数を持つ調和振動子の分配関数によって近似される。
極めて顕著に、この公式は正確な分割関数の重要な特徴を定性的かつ定量的に再現する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:33:59 GMT)
Parity-deformed $su(2)$ and $so(3)$ Algebras: a Basis for Quantum Optics and Quantum Communications Applications [0.0] 単モード系と二モード系に対するウィグナー代数は、それらをリフレクション作用素として加えると考えられる。
関連する退化 $su(2)$ algebra, $su_nu(2)$, and the deformed $so(3)$ algebra, $so_nu(3)$ は、広く使われているジョルダン・シュウィンガーおよびホルシュタイン・プリマコフ実現に対して構成される。
parity-deformed $so_nu(3)$ representation は、量子ビット系と量子ビット系の研究における潜在的な応用のために解析される。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:27:14 GMT)
Operational quantification of simultaneous correlations in complementary bases of two-qubit states via one-sided semi-device-independent steering [0.0] 2量子状態の場合、一方の半デバイス非依存的ステアビリティの定量化と、相互に偏りのない基底における同時相関の情報理論的定量化の関係について検討する。
我々は,2量子状態の相補的基底における同時相関の操作的特徴について,直観を隠蔽するために,量子ステアリング楕円体形式(quantum steering ellipsoid formalism)を導出する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:17:59 GMT)
On the importance of learning non-local dynamics for stable data-driven climate modeling: A 1D gravity wave-QBO testbed [0.0] 機械学習(ML)技術は、気候モデルのためのサブグリッドスケールパラメータ化の学習において有望であることを示している。
しかし、データ駆動パラメータ化の大きな問題はモデル不安定性である。
ここでは、ML理論と気候物理を組み合わせて、NNベースのパラメータ化における不安定性の源となる問題に対処する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 00:58:41 GMT)
On the Fragility of Active Learners for Text Classification [0.0] アクティブラーニング(AL)技術は、学習に最も価値のあるインスタンスを反復的に選択することで、ラベル付け予算を最適に活用する。
データセットに最も適したALアルゴリズムを選択するための所定の基準はない。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 22:24:35 GMT)
Non-stabilizerness versus entanglement in matrix product states [0.0] マトリックス生成物状態(MPS)における絡み合いと非安定化剤性(マジックとも呼ばれる)の関係について検討する。
我々は,MPSの相互情報計算の観点から,パウリ・マルコフ連鎖がいかに技術の現状をリセットするかを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:51:01 GMT)
Non-commutative probability, joint distributions, conditioning, and the associated polymorphisms [0.0] 可換ポリモルフィズムと非可換ポリモルフィズムの並列性を示す。
私たちの重点はプロセスからの条件分布への適用です。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:28:47 GMT)
Minimally Entangled Typical Thermal States for Classical and Quantum Simulation of Gauge Theories at Finite Temperature and Density [0.0] 有限温度と密度で強い結合ゲージ理論をシミュレートすることは、核物理学や高エネルギー物理学における長年の挑戦である。
本研究では,最小絡み合った典型的な熱状態(METTS)アプローチの有用性について検討し,古典的および量子的両方の研究を容易にする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:44:01 GMT)
Microscopic parametrizations for gate set tomography under coloured noise [0.0] 駆動相における時間相関ノイズ下での量子ゲートの顕微鏡的パラメトリゼーションにより,必要な資源を削減できることを示す。
有限相関時間と非マルコフ量子進化の影響を含むゲート集合の最小パラメトリゼーションについて議論する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:39:52 GMT)
Linear multidimensional regression with interactive fixed-effects [0.0] 本稿では,3次元以上の多次元パネルデータに対する線形かつ付加的に分離可能なモデルについて検討する。
2つのアプローチは、係数を推定する際、これらの未観測のインタラクティブな固定効果を考慮に入れていると考えられる。
ビールの需要弾力性を推定する手法が提案されている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:02:46 GMT)
Leveraging Segment Anything Model in Identifying Buildings within Refugee Camps (SAM4Refugee) from Satellite Imagery for Humanitarian Operations [0.0] 本研究は,セグメンテーション・セグメンテーション・タスクにおいて,セグメンテーション・アロイング・モデル(SAM)とその分岐の一つであるSAM-Adapterの利用について検討する。
SAM-AdapterはSAMの軽量な適応であり、様々な難民キャンプでこの抽出作業の強力なツールとして登場した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:52:58 GMT)
LaVy: Vietnamese Multimodal Large Language Model [0.0] LLM(Large Language Models)とMLLM(Multimodal Large Language Models)は、複雑な推論と言語理解において印象的な能力を持つ嵐によって世界を席巻している。
ベトナムの大規模言語モデルに関連する作品が多数あり、マルチモーダリティにおける高品質な資源の欠如はベトナムのMLLMの進歩を妨げている。
本稿では,現在最先端のベトナム語MLLMであるLaVyを導入することでこの問題に対処し,また,MLLMのベトナム語視覚言語タスクに対する理解を評価するためのLaVy-Benchベンチマークも導入する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:37:43 GMT)
LLMs-in-the-loop Part-1: Expert Small AI Models for Bio-Medical Text Translation [0.0] 本研究では,医療用テキストに最適化された教師ありニューラルマシン翻訳モデルを開発するために,新しい"LLMs-in-the-loop"アプローチを提案する。
6つの言語での独自の平行コーパスは、科学論文、人工的に生成された臨床文書、医療文書から編纂された。
MarianMTベースのモデルは、Google Translate、DeepL、GPT-4-Turboより優れている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:32:23 GMT)
Knowledge-based Drug Samples' Comparison [0.0] ドラッグ・サンプル・コンファレンス(英: Drug sample comparison)は、フランス国家警察が麻薬の流通ネットワークを識別するプロセスである。
現在のアプローチは、法医学の専門家による手動比較に基づいている。
我々は、現在のプロセスを改善するために専門家の知識を取得し、形式化し、指定するためのアプローチを提示します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:16:17 GMT)
InvAgent: A Large Language Model based Multi-Agent System for Inventory Management in Supply Chains [0.0] 本研究では,大規模言語モデル (LLM) を用いて複数エージェントの在庫管理システムを管理する手法を提案する。
我々のモデルであるInvAgentはレジリエンスを高め、サプライチェーンネットワーク全体の効率を向上させる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:55:17 GMT)
Hawking radiation in quantum Hall system with an expanding edge: application of anomaly method [0.0] 我々は、拡張エッジを持つ量子ホール系において、ウィルツェクとロビンソンの手法をド・シッター時空のアナログに応用する。
この系はキラルであるため、地平線付近で進入モードを課す必要はない。
ド・ジッター地平線のギボンズ・ホーキング温度で外平部におけるホーキング放射のフラックスを求める。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:06:21 GMT)
Hatred Stems from Ignorance! Distillation of the Persuasion Modes in Countering Conversational Hate Speech [0.0] 本研究は、説得モードを理性、感情、信頼性に蒸留する。
クローズド(複数ターン)とオープン(単ターン)の2つのタイプの会話において、人種差別、セクシズム、宗教的偏見に関する使用を評価している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:58:42 GMT)
Harmonizing Safety and Speed: A Human-Algorithm Approach to Enhance the FDA's Medical Device Clearance Policy [0.0] 我々は、FDAが510(k)医療機器のクリアランスプロセスを改善するために、人間とアルゴリズムを組み合わせたアプローチを開発した。
まず,510(k)医療機器のリコールリスクを推定する機械学習手法を開発した。
次に、FDAの委員会への承認、拒絶、延期を推奨するデータ駆動クリアランス政策を提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:11:29 GMT)
Fast Ground State to Ground State Separation of Small Ion Crystals [0.0] 捕捉されたイオンの線形結晶を異なるサブセットに迅速に分離することは、捕捉されたイオン量子コンピューティングアーキテクチャを実現するために重要である。
我々は,同種結晶と混合種結晶のより小さな部分集合への分離を記述するのに使用できる一般的な理論的枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:00:41 GMT)
Extending the Tavis-Cummings model for molecular ensembles -- Exploring the effects of dipole self energies and static dipole moments [0.0] 分子アンサンブルに対するTavis-Cummingsモデルを拡張した。
光共振器に共振結合したMgH$+$分子の励起状態ダイナミクスと分光をシミュレートする。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 12:32:52 GMT)
Evaluation of Extra Pixel Interpolation with Mask Processing for Medical Image Segmentation with Deep Learning [0.0] 筆者らは、BICベースの画像とマスク処理とBICとNNベースの画像とマスク処理の両方の効果を評価した。
評価の結果、BIC-496モデル/ネットワークは8.9578%(画像サイズ256 x 256)で、NN-NNネットワークは1.0%(画像サイズ384 x 384)増加した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:07:55 GMT)
Entanglement Structure of Non-Gaussian States and How to Measure It [0.0] 本稿では,実験的な相関関数による量子状態の制約を行うプロトコルを提案する。
この方法は量子状態の絡み合い構造の計測を可能にする。
提案プロトコルは,現在および今後の実験能力とともに有用であることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:00:01 GMT)
Ensemble Transport Filter via Optimized Maximum Mean Discrepancy [0.0] 本稿では, 粒子フィルタの解析段階をトランスポートマップで再構築し, アンサンブルに基づく新しいフィルタ法を提案する。
トランスポートマップは、最大平均離散損失関数によって記述された最適化問題によって構築される。
アンサンブルカルマンフィルタに対する提案手法の利点を示すために,いくつかの数値例を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:54:12 GMT)
Enhancement of nonclassical properties of two-mode squeezed vacuum state with postselected von Neumann measurement [0.0] 弱値増幅が2モードスクイーズ真空状態の非古典的特性に及ぼす影響について検討した。
選択後弱測定に基づく2モードスクイーズ真空状態の利点を示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:23:22 GMT)
Empirical fits to inclusive electron-carbon scattering data obtained by deep-learning methods [0.0] 広い運動領域における炭素の電子散乱断面積に対する経験的適合性を得る。
このようなモデル非依存のパラメトリゼーションを得るための2つの異なる方法とそれに対応する不確実性を考える。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 09:00:04 GMT)
Efficient detection of non-classicality of continuous variable states using moments of Wigner function [0.0] 非古典状態の重要なサブクラスである負のウィグナー関数を持つ状態は、量子情報処理タスクの貴重な資源として機能する。
負のウィグナー関数を示す量子状態を検出するための基準を提供する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:54:41 GMT)
Educational Personalized Learning Path Planning with Large Language Models [0.0] 本稿では,これらの課題に対処するために,大規模言語モデル(LLM)と迅速なエンジニアリングを統合する新しいアプローチを提案する。
学習者固有の情報を組み込んだプロンプトを設計することにより,LLama-2-70B や GPT-4 などの LLM をガイドし,パーソナライズ,一貫性,教育的な学習経路を生成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:32:56 GMT)
Discrete-Time Quantum Walks: A Quantum Advantage for Graph Representation [0.0] この論文は、複雑なグラフトポロジをヒルベルト空間に包含し、グラフ解析の有効性を著しく向上させる。
この発展は量子コンピューティングとグラフ理論の交差に革命をもたらすことを約束する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:49:49 GMT)
DiNO-Diffusion. Scaling Medical Diffusion via Self-Supervised Pre-Training [0.0] Dino-Diffusionは潜在拡散モデル(LDM)の自己教師型手法である
アノテーションへの依存をなくすことで、私たちのトレーニングは、公開胸部X線データセットから868万以上の未ラベル画像を活用する。
小さなデータプールからでも意味的に多様な合成データセットを生成するために使用できる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:51:21 GMT)
Dephasing and error dynamics affecting a singlet-triplet qubit during coherent spin shuttling [0.0] 我々は,コヒーレントスピンシャットリング中の一重項量子ビットの劣化と緩和に寄与する崩壊ダイナミクスを探索する。
我々は、スピンシャットリングによる遠方量子ビットの絡み合いに対する将来の実装を奨励する指標として、シャトルの誤り率を1時間10〜4ドルから少なくとも103ドルまで見積もる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:59:28 GMT)
Deep Learning without Global Optimization by Random Fourier Neural Networks [0.0] 本稿では、ランダムな複雑な指数関数活性化関数を利用する様々なディープニューラルネットワークのための新しいトレーニングアルゴリズムを提案する。
提案手法では,マルコフ連鎖モンテカルロサンプリング法を用いてネットワーク層を反復的に訓練する。
複雑な指数的活性化関数を持つ残留ネットワークの理論的近似速度を一貫して達成する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 16:23:40 GMT)
Deconvolution with a Box [0.0] 箱(正方形波)によるデコンボリューションは、ピクセルシフトカメラによる超高分解能の鍵となる操作である。
凸最適化を用いてスパース信号の完全再構成が可能であることを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 13:02:54 GMT)
DMRG study of the theta-dependent mass spectrum in the 2-flavor Schwinger model [0.0] ハミルトン形式論における2ドルフレーバーシュウィンガーモデルの$theta$依存質量スペクトルについて検討する。
複合粒子の質量、ピオンとシグマ中間体は2つの独立した方法で計算される。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 05:23:20 GMT)
Constructing a fully homomorphic encryption scheme with the Yoneda Lemma [0.0] 本稿では, Yoneda Lemmaの適用を通じて, 非対称暗号の同型暗号システムの基盤を再定義する。
これは、ElGamal、RSA、Benaloh、RegevのLWE、NTRUEncryptといった広く採用されているシステムが、Yoneda Lemmaの原則から直接派生していることを示している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:02:09 GMT)
Condensation of vanishing photon emission rates in random atomic clouds [0.0] 寒冷な原子雲の放射動力学に関連するユークリッド確率行列の特性を解析する。
協調性パラメータによって制御された新しい相転移の証拠を提示する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:43:21 GMT)
Complementarity between quantum entanglement, geometrical and dynamical appearances in $N$ spin-$1/2$ system under all-range Ising model [0.0] 現代幾何学は距離や曲率といった要素間の相互関係を研究する。
我々はこれらの構造を全範囲イジングモデルの下でN$相互作用スピン-1/2$の物理系で探索する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:52:20 GMT)
Competition of long-range interactions and noise at ramped quench dynamical quantum phase transition: The case of the long-range pairing Kitaev chain [0.0] ノイズのない/ノイズの多い線形時間依存化学ポテンシャルを持つ長距離ペア北エフモデルの非平衡ダイナミクスについて検討した。
ランプが1つの臨界点を横切ることを示す一方、短距離ペアの北エフモデルでは1つの臨界時間スケールを示す。
3つのDQPT時間スケールを持つ領域はノイズの存在下で縮小することがわかった。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:51:33 GMT)
ColorwAI: Generative Colorways of Textiles through GAN and Diffusion Disentanglement [0.0] StyleGAN と Diffusion のカラーアンタングルを用いた「世代別カラーウェイ」の創出が提案されている。
StyleGANのW空間は、人間の色の概念と最もよく一致している。
そこで本研究では,色道創出のための創造システムを考案し,専門家のアンケートや創造理論を通じて評価することを提案する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:51:01 GMT)
Code Documentation and Analysis to Secure Software Development [0.0] CoDATは、さまざまなレベルのコードドキュメント間の一貫性を維持するように設計されたツールである。
Intellij IDEAで実装されている。
私たちは、コードの断片とそれを記述するコメントの間のセマンティックな一貫性をチェックするために、大きな言語モデルを使用します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:25:44 GMT)
ChatBCG: Can AI Read Your Slide Deck? [0.0] 本稿では,GPT 4o と Gemini Flash-1.5 の精度を評価する。
これらのモデルは、複雑なグラフやラベル付けされていないグラフを含む場合、現在、デッキを正確にエンドツーエンドに読むことはできないと結論付けています。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 06:00:45 GMT)
CM-DQN: A Value-Based Deep Reinforcement Learning Model to Simulate Confirmation Bias [0.0] 本稿では,人間の意思決定過程をシミュレートするために,Deep Reinforcement Learning(CM-DQN)に新たなアルゴリズムを提案する。
我々は,Lunar Lander環境において,確認的,不確認的バイアス,非バイアスを用いて学習効果を観察する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 04:29:04 GMT)
Bringing AI Participation Down to Scale: A Comment on Open AIs Democratic Inputs to AI Project [0.0] Open AI Democratic Inputsプログラムをレビューし、生成AIへの公的な参加のための手順を設計するための10のチームに資金を提供した。
我々は, LLMの一般性, 抽象的価値の抽出, 問題ではなく解決策の募集, 民主主義への参加など, 共有された仮定をいくつか挙げる。
私たちは代わりに、特定のコミュニティやユースケースを含むAI参加を呼びかけ、修正すべき具体的な問題を提起します。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 11:22:34 GMT)
Black box work extraction and composite hypothesis testing [0.0] ブラックボックスワーク抽出は、量子熱力学において最も中心的なプロセスの1つである。
ブラックボックス設定における最適抽出作業は,複合仮説テストタスクの性能によって完全に特徴づけられることを示す。
また、この物理環境では、合成仮説が特定の相関を含む新しい量子シュタインの補題も示している。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 08:07:44 GMT)
Beyond the Request: Harnessing HTTP Response Headers for Cross-Browser Web Tracker Classification in an Imbalanced Setting [0.0] 本研究は、二項化HTTP応答ヘッダを用いたWebトラッカー検出のための効果的な機械学習分類器を設計する試みである。
10の教師付きモデルがChromeデータ上でトレーニングされ、1年後のChromeデータセットを含むすべてのブラウザでテストされた。
結果は、ChromeとFirefoxで高い精度、F1スコア、精度、リコール、最小ログロスエラーを示した。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 07:45:21 GMT)
Behavior of correlation functions in the dynamics of the Multiparticle Quantum Arnol'd Cat [0.0] アーノールの猫(アーノールの猫、英: Arnol'd cat)は、古典的および量子的なハミルトン系の一般化である。
私は、量子古典対応の問題に焦点をあてて、このシステムを以前の一連の研究で研究してきた。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 10:46:08 GMT)
Bayesian Causal Forests for Longitudinal Data: Assessing the Impact of Part-Time Work on Growth in High School Mathematics Achievement [0.0] ベイジアンカウサル林の長手延長について紹介する。
このモデルは、数学的能力における個々の成長と、パートタイム作業への参加の影響の両方を柔軟に識別することができる。
その結果、ほとんどの学生にとってパートタイムワークの負の影響が明らかとなったが、当初は学校所有感が低い学生にとって潜在的利益が示唆された。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 17:18:33 GMT)
BUSClean: Open-source software for breast ultrasound image pre-processing and knowledge extraction for medical AI [0.0] 臨床乳房超音波データセットを自動処理するオープンソースソフトウェアソリューションを提案する。
このアルゴリズムは、ソノグラフアノテーションからBUSスキャンフィルタリング、クリーニング、知識抽出を行う。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:02:51 GMT)
Are Linear Regression Models White Box and Interpretable? [0.0] 説明可能な人工知能(XAI)は、モデルを理解し解釈するために機械学習モデルに適用または組み込んだ一連のツールとアルゴリズムである。
線形回帰を含む単純なモデルは実装が容易であり、計算の複雑さが小さく、出力を視覚化するのも容易である。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 21:05:51 GMT)
Are ELECTRA's Sentence Embeddings Beyond Repair? The Case of Semantic Textual Similarity [0.0] ELECTRAの埋め込みを修復する新しいTMFT法を提案する。
TMFTはパラメータ効率を高めながら、スピアマン相関係数を8点以上改善する。
我々は分析を様々なモデルサイズと言語に拡張する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 19:38:43 GMT)
Approximating the Number of Relevant Variables in a Parity Implies Proper Learning [0.0] パリティ関数の関連変数数を近似することはパリティを適切に学習するのと同じくらい難しいことを示す。
2つ目の結果では、任意の$T(n)$-timeアルゴリズムから、任意のパリティ$f$に対して、関連する変数の数を$gamma$-approximation($d(f)$ of $f$)を返すことを示す。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:20:30 GMT)
Agglomerative Clustering of Simulation Output Distributions Using Regularized Wasserstein Distance [0.0] 本研究では,シミュレータが生成するデータに対するクラスタリング手法の適用について検討し,異常検出,事前最適化,オンラインモニタリングへの応用について述べる。
本稿では,正規化ワッサースタイン距離を用いて経験的分布をクラスタリングする集合的クラスタリングアルゴリズムを導入し,その手法をコールセンタモデルに適用する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:07:32 GMT)
Active Suppression of Quantum Dephasing in Resonantly Driven Ensembles [0.0] 我々は、原子対内のコヒーレントな集団移動に対するランダムな原子位置の影響を抑制するために量子制御を用いてきた。
この方法は、非共振ラビ周波数の結合強度の低下を利用して、非線形光学における準位相マッチングと類似して達成可能な集団移動をコヒーレントに増幅する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 18:26:45 GMT)
Accurate Numerical Simulations of Open Quantum Systems Using Spectral Tensor Trains [0.0] 量子ビット間のデコヒーレンス(英語版)は、量子計算における主要なボトルネックである。
数値計算法Q-ASPEN(Quantum Accelerated Propagator Evaluation)を提案する。
Q-ASPENは任意に正確であり、誤り訂正量子計算に必要なリソースを推定するために適用することができる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 02:33:27 GMT)
Accelerated creation of NOON states with ultracold atoms via counterdiabatic driving [0.0] 量子制御プロトコルは、N$超低温ボソニック原子を2つのモードで生成するために提案される。
この状態は、最初に全てのボソンが配置され、他の2つのモードと対称に結合された第3モードを用いて作成することができる。
この第3モードのエネルギーを他のモードのエネルギーレベルに調整することで、NOON状態の断熱的な生成が可能になる。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 15:39:16 GMT)
A Theoretical Formulation of Many-body Message Passing Neural Networks [0.0] 我々は高次ノード相互作用をモデル化する多体メッセージパッシングニューラルネットワーク(MPNN)フレームワークを提案する。
グローバルエッジリッチ曲率で重み付けしたモチーフラプラシアンに局所化スペクトルフィルタを適用した。
我々は、我々の定式化が隣接ノード置換に不変であることを証明し、その感度境界を導出し、学習されたグラフポテンシャルの範囲を束縛する。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 14:18:48 GMT)
A Hitchhiker's Guide to Deep Chemical Language Processing for Bioactivity Prediction [0.0] 化学言語処理(CLP)は、薬物発見における深層学習の顕著なアプローチとして現れている。
ここでは,CLPトレーニングの重要な要素を分析し,新参者や専門家のガイドラインを提供する。
この「ヒッチハイカーのガイド」は、特定の方法論的選択の重要性を強調しているだけでなく、研究者に実践的な勧告を与えている。
論文参考訳(メタデータ) (Tue, 16 Jul 2024 20:13:31 GMT)