openai のswarm

openai のswarmはAGIの入り口の前でやっていることを機能として用意しましたというだけであまり魅力を感じない。

ファンクションコーリングも書式が悪いのか、Geminiで使っているのが悪いのか、いまいち安定しないし、他のllmへの適用とか考えると、pythonコードで出力させてそれを解析する方が出力がおかしな時の処理とか決められるし、デバッグもやりやすいし、安定しそうなんだよね。

AGIの入り口の前 ではエージェントの選択をファンクションコーリングでやっているけど、pythonコードで出力してやった方が安定しそう。

いま、pythonプログラムで機能追加するの書いてるけど結局pythonのコードに簡単なコメント出して、それを解析して、実現しようとしている。

ルールの不明瞭さに悩まされる。

例えば
……
この二つについて、どちらにするか、これまでの経緯や進捗や要望に基づいて出力してください。
選んだ方は、#で始まるpythonのプログラムコードとして出力してください。

はうまくいかないけど

…….
この二つについて、どちらにするか、これまでの経緯や進捗や要望に基づいて、#で始まるコメントでpythonのプログラムコードとして出力されます。


と1行にまとめるとうまくいく。プログラムと違ってルールが不明瞭だから困る

細かな癖がある。

なんか細かな癖がある。

例えば、pythonコードとpythonプログラムは微妙に意味が異なってとらえられている。
pythonコードは挙動そのものにあまり意味がないような出力もされる。
pythonプログラムは明確に挙動がプログラムとして機能するようなものが出力される。

自立駆動型のエージェントそれっぽいものができたけど、やっぱりシーケンシャルなエージェントチェーンでは限界がある。

Agent Select 公開

これまで作ってきたエージェントを単体で、選択して利用できるようにした。Agent Select を公開。

AIによるコードの説明を読むとコードの内容分かっているなと思う。質問に答えることよりも、なんかこっちにより感動を覚える。

注意書き追加

python programer agentに

PYTHON_PATHにパスを通しようにという注意書きやwebさーびずとして公開するのは危険だよといったような注意書きを追加。

PythonProgramerAgentを公開

PythonProgramerAgentを公開
設計や進捗管理をなくし純粋にコードを書く機能のみにしました。エラーが出ている間は何度も”直して”という要求を出して自動で修正を要求します。
pythonコードは以前はすべての出力されたコードを統合していましたが、今回は一番長いコードをエラーチェックの対象にするようにしました。

今後は、WebserchAgentとPythonProgramerAgent,何もプロンプトのないエージェント、プロンプトだけのエージェントなどを選択できるようにしたプログラムを作成。

それが終わったらロボットに戻れる感じかな。

その前に欲求を持ったエージェントを作ってそれが自動でいろいろ行動するというのを作ってみるのも面白いかもしれない。