GPT-ossうまくデータが取れてない。英語では帰ってきた。

ollamaからうまくデータが取れない。langchainのアップデートしてみたけどうまくいかない。

別のこともやっているし、いったんは保留しておく。

追記:英語で指示出したらトークンが返ってきた。日本語がダメなのかな。でも同じ質問をollama guiでやると普通に帰ってくる。ちなみぬ英語で帰ってきたときのtpsは50位出てた。

GPT-ossをollamaで試してみた

以下OllamaのデフォルトのGUIで動かいてみたときのシステムの状態

アイドル時

20B実行時

120B実行時

120BはVRAMに乗らないのは当然だけど一応動いためちゃくちゃ遅かったけど。
20BもVRAMに乗らなかった。ollamaでは4bit量子化の恩恵は受けられないのかもしれない。それとも何か設定があるのか?