大規模言語モデル入門を購入

AIと言えば、なんといってもChatGPT!こいつが2022年の暮れ頃でしょうか、登場してから怯える毎日が始まりました。

ChatGPTの仕組みを理解できれば、不安は払拭されるかもしれないと思い、こちらを購入。

読みはじめましたが… 第1章で早くも挫折。意味わからん数式が当たり前のように出てきました。

でも、活性化関数とか、ソフトマックス関数とか、どこかで見たことあるようなないような…と思ってたら、2017年くらいに買ってさらっと読んだ「ゼロから作るDeep Leaning」に説明があったことを思い出しました。

やはりこれは名著だ…。これからやり直していくことにします。

大規模言語モデルとは言え、同じDeep Learningでできてるんですね。よし、頑張るぞ!

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

上部へスクロール