GPT-ossうまくデータが取れてない。英語では帰ってきた。

ollamaからうまくデータが取れない。langchainのアップデートしてみたけどうまくいかない。

別のこともやっているし、いったんは保留しておく。

追記:英語で指示出したらトークンが返ってきた。日本語がダメなのかな。でも同じ質問をollama guiでやると普通に帰ってくる。ちなみぬ英語で帰ってきたときのtpsは50位出てた。

GPT-ossをollamaで試してみた

以下OllamaのデフォルトのGUIで動かいてみたときのシステムの状態

アイドル時

20B実行時

120B実行時

120BはVRAMに乗らないのは当然だけど一応動いためちゃくちゃ遅かったけど。
20BもVRAMに乗らなかった。ollamaでは4bit量子化の恩恵は受けられないのかもしれない。それとも何か設定があるのか?

いろいろどうまとめるか。

一部不具合見つけて直したりしている。あと俺まで作ってきたエージェントをどうするかも迷っている。新しく複数のモデルを選択できるようになっているので、そのあたりをどうまとめるのか。今後新しいのを作るときどうするのか。なんというか頭の中が散らかってまとまらない。

比較用のツールのようなものを作成中

今比較用のツールのようなもの作成中。

今プログラムの作成にAIを使用してはいるけど、
AIはひな型を作らせるにはいいけど細かな修正はまだあまりうまくないね。あとこれまでのコードを無視して自分流に書き換えようとするからそのあたりの扱いが大変。コード量的には7-8割は作ってくれるけど残りの2割は自分でやらないとという感じだな。0からコード書かせた場合、修正とかの相性もいいだろうからもっといけるのかもしれないけど。