大規模言語モデル（LLM）はどのようにして侵害されるのか？その対策は？

翻訳：清水浩平

LLMの普及に伴い、モデルそのものを標的とした攻撃が増加しています。モデルファイルに不正な指示を埋め込む手法、悪意のあるLoRA（Low-Rank Adaptation）によるファインチューニングの悪用、そして学習データへの意図的な汚染（データポイズニング）など、攻撃者が利用する手口は多岐にわたります。

本稿では、これらの攻撃手法を具体的に整理し、組織がLLMを安全に運用するために講じるべき対策を解説します。モデルの入手経路の検証、推論時の出力監視、サプライチェーン全体にわたるセキュリティ管理など、実務に直結する防御策を中心に取り上げます。

全文はトレンドマイクロのサイトでお読みいただけます →