HACK
THE
PLANET
<RETURN_TO_ROOT
DECRYPTED_DATA // 2026-05-17

テスト設計ってむずかしい話

動作確認って見ればいい話じゃなかった

自宅のサーバーがちゃんと動いているかって確認するのは結構むずかしいと感じることが多い
すでにVMだけでも30台ちかくあってそれに一つ一つSSHとかRDPして設定見たり、アクセスして使えるか見たりするのはとってもめんどくさい

Zabbixで監視は間違っていないけど、構築してそれがちゃんと動いているかの確認を監視設定でやるのはちょっと違う
だからこそVM共通で見るもの、物理だと何が違うのか、アプリごとになにをみるのかっていうのはしっかりと設計が必要だったりする

運用で仕事してたときはテスト設計で見ないといけないところ、どうやって確認するのか、エビデンスをどう管理するのかを資料にしてレビューをしてた
まぁ何回も似たようなサーバーを作ってるとたいだいテンプレになってくるけど

自宅のサーバーは気軽に構築している分、監視も適当だし構築スクリプトのチェックもけっこういい加減にしていた
とくに相反するスクリプトの確認スクリプトがそれぞれあるからオールグリーンにならずに、個別で見ないといけないのがだるいんだよね

テスト設計を時間があるときにしっかりやってチェックスクリプトを作り直したいなぁ
きちんとできていることを自分以外のものに担保させたい

AIが検証用サーバーを構築する時代になった

最近Hermes Agentを使っているけどこれ結構いい
OpenClawから移行しているんだけど、よく出来てると思う

というのもOpenClawは自分自身を使いこなせてなくて、SKILLの登録もちゃんと言ってあげないとやらないし
覚えてほしいこともちゃんとメモしろって言わないと覚えない、思い出すときもメモを読めって言わないといけなかったり
メモリー機能があるはずなのに、メモリーを読めと言わないと文脈から過去の会話を探したりしない

たとえば、「昨日何話したっけ?」って言ってもAIのコンテキストになければ覚えていないって言われる
そこでメモリーを読めというとようやくJSONを解析して答えるって感じ

総じてAI越しにCLIを触っている感覚があるんだよね

でもHermes Agentはそこがよくできていて、何も言わなくてもSKILLを色々作ったり、記憶は言わなくてもメモリーに読み書きしているし
自分自身の使い方をちゃんと把握している感があるんだよね

それでWebをPythonで操作できるから、自作のOpenStackの設定画面を操作して検証サーバーを建てさせることができたり
特定のUserdataを指定させることでHermesがrootでログインできるサーバーを構築させたりもできる

しかもClaude Codeを別で立てとけばHermesで使っているGPT-5.5で解決できないものとかコードレビューにClaudeが使えたりする
別のサーバーにSSHできるって強いね、1つのサーバーだと巻き添えが発生するけど別サーバーだったら巻き添え気にせずに機能追加っぽいことができる

今のところHermesは一般サーバーのrootログインはできないようにしているから、スクリプトを作らせてroot承認できるシステムを作りたいなぁと思ったり
ただ、この手のエージェントが作成するスクリプトって読むことを前提にしてなさすぎて結構複雑になりがちだから自分がレビューするの大変そう

HASH: 5F323032... [VERIFIED]