なんだったんだろう。とりあえず検索機能は呼ぶようになった。webページの情報取得はまだ。
プロンプトを簡素にしてクエリという単語をキーワードに置き換えたりしたら呼ぶようになった。
なんだったんだろう。とりあえず検索機能は呼ぶようになった。webページの情報取得はまだ。
プロンプトを簡素にしてクエリという単語をキーワードに置き換えたりしたら呼ぶようになった。
geminiがweb検索機能やwebページの情報を取る機能の呼び出しを断固として使用しないのは何なの。
エラーは出なくなってきたけど、今度はテトリスが完成しなくなってしまった。
調整が大変。
save_textは動くけどsave_python_fileは確実にgeminiがエラーを返してくる。何かセキュリティに引っかかっているのかもしれない。
save_textでもシステムプロンプトでは無視される。ユーザー要求として出して初めて保存してくれる感じ。
コードの保存は独自のコードで出力解析してやった方が安定しそう。
ユーザーの質問に答えるように訓練されてるからかな。なんか連鎖的に作業させようとするのが良くないのかなあ。そのあたり考慮して進めてみる。
AIは単純なのは10いったら7、8は返してくれる感じ、ほんとに簡単なのは9,10の時もある。ただ、複雑で難しくなるとあっという間に3くらいまでしか返してくれなくなる。
とりあえずはそこそこ複雑な問題でも7くらいまでは返してもらえるようにするのが目標かな。
とりあえず、試しにミニマムなテトリスをコードを直接書かずにすべてAIにコードを書かす形で作れたけど、何度もやり取りが必要だったり、コードを見ておかしい理由を説明しなくてはいけなかったりするから、これを指摘できるシステムプロンプトを作るのは大変そうだ。
AIエージェントづくりが楽しくてこっちの作業は全く手についていない。
ソースコード公開。ほんとコードをたた出しただけ、解説もなんもない。コードはあるけど、まだスピーカーやマイク周りの動作は確認できてない。とりあえずサーボモーターや足回りのモーターが動いたレベル。
なんか思ったより多くて公開に苦労した。もう少し整理したほうがいいかも。
トップページ
を作ってみた。ここに追加していく感じになると思う。まずは、ソースコードを出す。
そのあと手直しをしながらシステム構成とかを書く感じかな。
正直ソース公開してこれはいったん終わりにして2足歩行とかに移ることも考えたけど、このロボット、正直現状では使い物にならない。それでは寂しいので、”まあ使える”ぐらいまでは仕上げようと思う。
例えば、ロボット側の起動時にモニターやキーボード接続しなくてもいいようにするとか、壊れてしまった部分の強度を上げるとか。カメラ間距離を変えて、視界を改善するとか。ちょっと思いつくだけでもこれだけある。
モーター周りは動いた。プログラムは多少手直しが必要だろうけど、動くには動いた。
ただ動画撮影前に壊れた。
ほかにもいろいろ問題あるけどいったんここまでの情報をまとめて公開しようと思う。