python programer agentに
PYTHON_PATHにパスを通しようにという注意書きやwebさーびずとして公開するのは危険だよといったような注意書きを追加。
python programer agentに
PYTHON_PATHにパスを通しようにという注意書きやwebさーびずとして公開するのは危険だよといったような注意書きを追加。
PythonProgramerAgentを公開
設計や進捗管理をなくし純粋にコードを書く機能のみにしました。エラーが出ている間は何度も”直して”という要求を出して自動で修正を要求します。
pythonコードは以前はすべての出力されたコードを統合していましたが、今回は一番長いコードをエラーチェックの対象にするようにしました。
今後は、WebserchAgentとPythonProgramerAgent,何もプロンプトのないエージェント、プロンプトだけのエージェントなどを選択できるようにしたプログラムを作成。
それが終わったらロボットに戻れる感じかな。
その前に欲求を持ったエージェントを作ってそれが自動でいろいろ行動するというのを作ってみるのも面白いかもしれない。
Web serch Agent 公開
ロジックで組めるところはロジックで組む方が思い通りになりやすい。
今はまだ、補佐的な役割にした方が扱いやすい。お金払ってより高度なAIを使えば違うのかもしれないけど。ローカルでやることも考慮すると、今の無料環境で動くようにしておく必要がある。
この後プログラマーのを今回のような感じでまとめて、サイドメニューでエージェントを切り替えて使用できるようにする。ぐらいまでやっておきたいかな。
正直全く上手く動いてないし、エラーも出るし、まとまってもいないし、文体も安定してないけど公開。まあこの先にAGI、ASIがあるよね。というコード。
“作業を続けてください。”と検索結果の後につけることで、どうにか次の検索結果のurlをクリックさせて内容を読ませることに成功した。ただ2番目の検索結果まで読ませるのはできてない。1つの指示で連鎖的な作業させることはできたけど、繰り返しのforやwhileループはできていない。でも最低限の機能はできたかな。あとは、このあたりをうまくロジックで組んでどう連携させるかな気がする。
なんだったんだろう。とりあえず検索機能は呼ぶようになった。webページの情報取得はまだ。
プロンプトを簡素にしてクエリという単語をキーワードに置き換えたりしたら呼ぶようになった。
geminiがweb検索機能やwebページの情報を取る機能の呼び出しを断固として使用しないのは何なの。
エラーは出なくなってきたけど、今度はテトリスが完成しなくなってしまった。
調整が大変。
save_textは動くけどsave_python_fileは確実にgeminiがエラーを返してくる。何かセキュリティに引っかかっているのかもしれない。
save_textでもシステムプロンプトでは無視される。ユーザー要求として出して初めて保存してくれる感じ。
コードの保存は独自のコードで出力解析してやった方が安定しそう。
ユーザーの質問に答えるように訓練されてるからかな。なんか連鎖的に作業させようとするのが良くないのかなあ。そのあたり考慮して進めてみる。