ロボット作成日記 – のんびり無理せずロボット作成

メモリを外に

履歴管理のため、llmbaseにあったメモリ管理を外に出した。甘利美和巣くなったとは思えないが、それでもまとまっていたころよりはまし。

どうもこれまで使えない感じだったが、使えるソフトのイメージがわきつつある。

他の機材を検討するも

今ローカルllmの速度に不満があるので、他のDgx sparkとか、AI max pro 395とかのベンチマーク調べて見たけど、oss-gpt120Bはかなり伸びるみたいだけど、一番伸びてほしいサイズ２４－３０Bであまり伸びてないからなんかいいや、となった。

ここまでのところでアップロードしようとしたけど相対importに変えてまとめ直してみる。

oss-gptが早い

oss-gpt20bがたの同サイズのモデルと比べて2-3倍速い。カスタマイズで優遇されているのか？構造の問題か。

あとNvidiaのドライバ更新でAIの速度上がったきがする。

実際確認してみて

KVキャッシュはとってこれなかった。まあ重くなりすぎるからかな。あとはwebserch付けたらいったんアップロードかな。そしたらそのあとでテキストデータの履歴管理つけて、そのあとoperation強化かな。

thinkingがうまく取れない。

いったんほりゅにしようと思う。
AIにミニマムのllmのAPIラップ作らせてみたらollamaではうまくthinkingもとれた。しばらくしたら、langchainから変更も考えたほうがいいかも。あと、kvキャッシュとってこれるのがollamaだけと知って、履歴管理どうしようかと思っている。<- なんかAIごとにこの辺り言っていることが違う。