メインカテゴリーを選択しなおす
中国製DeepSeek AIの自己学習アルゴリズムに問題アリ
これまでの生成AIモデルは、人間がAIの回答の良し悪しをラベル付けし、モデルが正確性や一貫性といった優れた特徴を模倣するように促す「人間のフィードバックによる強化学習(RLHF)」として知られる手法を取り入れて改善されてきた。DeepSeekは人間のフィードバックを排除して自己学習。人間のフィードバックを排除し、自身の間違いを認識して修正するアルゴリズムを設計した。つまり強化人間ならぬ、強化AIと言う事である。更にはDeepSeekの言語モデルは独自ではなく、OpenAIのデータを不正入手して作成されたもの。OpenAI says it has evidence China’s DeepSee…