いつもの悪い癖が出始めた。

RAGの延長で長期記憶管理みたいなことをやろうとしてたのだけど、テキストだけでなくイメージや音声も、となって、音声のリアルタイム変換とかもやり始めて収集つかなくなりそう。いったんテキストだけで簡単なの動かしてみないと。

tool対応前提のエージェント作成中

これまでtool利用があまりうまくいっていなかったのでtool利用ができないことを前提に作ってきたけど、なんか今は逆にtoolを利用せずにこちらでフォーマット指定してやろうとするとあまりうまくいってないような気がする。それとOperator…はがちがちすぎる感がある。

なので、次はtool利用を前提にもっとllmの能力に頼ったふわっとした感じの作りにしようと思う。

ところでministral-3:14bがすごくいい感じに感じるのは気のせい?

昨日公開部分に注意事項を追記

だいぶできてきた。

WebserchやPythonProgramerAgent、RooterAgentはそれなりに動作している。

OperationcodeCreatorAgentは落ちる。

とりあえず上三つだけで出してみようかな。そもそも元からあまりまともに動いてなかったというのもあるし。
ツールもそれなりに使えてる。

違和感の正体

メモリ周りいじってて、なんかかみ合わないなと感じていた原因が分かった。

LangChainにしろ、LangGraphにしろ、スレッドベースでメモリ管理というのが設計思想にある。

しかし、私の場合キャラクターベースでのメモリ管理というのが設計思想だから、かみ合ってなかった。

Lang—にもSysTemPrompt設定する部分があるからLang—はこの辺りが混ざっているのではなかろうか。私もこの辺りの思想を言語ができてやっと気づけた。

langgraphへの置き換え進む

LangGraphでこれまでのを書き換えている最中。ストリーミング表示とツールの使用は確認できた。
あとLMstudioに対応させた。
メモリ周りがきちんと動作しているか確認が必要。