大規模言語モデルに困難な推論を克服する償却ベイズ推論
LLMでChain-of-Thoughtは潜在トークン列を事後分布列から生成するタスクとみなせる。LLMのファインチューニング時にGFlowNetsを使って潜在変数を順に生成するように学習。推論の途中経過を潜在変数とみなすアプローチは興味深い(以前もRAGであった https://t.co/3pf3gA4eDO
2024/05/24 11:50
2024年5月 (1件〜100件)
「ブログリーダー」を活用して、TAKさんをフォローしませんか?