AIモデルは、組み込みの安全チェックを回避するために乗っ取られる可能性がある
2025年2月25日 ローダ・ウィルソン著 The Exposé 研究者らは、AIプログラムに有害な反応を防ぐために設けられたガードレールを回避する「思考の連鎖を乗っ取る」という手法を開発した。 「思考の連鎖」とは、AIモデルに提示された指示を、回答を出す前に一連の中間ステ...
2025/02/26 09:57
2025年2月 (1件〜100件)
「ブログリーダー」を活用して、C62(シロクニ)さんをフォローしませんか?