GPT-ossをollamaで試してみた – ロボット作成日記

以下OllamaのデフォルトのGUIで動かいてみたときのシステムの状態

アイドル時

20B実行時

120B実行時

120BはVRAMに乗らないのは当然だけど一応動いためちゃくちゃ遅かったけど。
20BもVRAMに乗らなかった。ollamaでは４bit量子化の恩恵は受けられないのかもしれない。それとも何か設定があるのか？