QE Frameworkは、AIにコーディング作業をさせるときに スペック・実行・検証を自動的に組み込んで、 「いい加減だった」または「見当違いなものを作った」をシステムレベルで防ぎます。
なぜ必要か。 AIに「これ直して」と言うと、大抵3つのうちどれかが壊れます。リクエストが曖昧でAIが推測する、実行はしたが何をしたか追跡できない、または「完成しました」と言うが実は半分しかできていない状態。人間の開発者同士の間でもこの問題を防ぐために スペック → 実装 → レビューを行います。QEはAIに同じ規律を強制します。
何が違うか。 単なるプロンプト集ではありません。すべてのタスクが TASK_REQUEST(何をするのか)と VERIFY_CHECKLIST(どう確認するのか)の2つのファイルとして先に保存されます。実行はその後に行われ、各チェックリスト項目がyes/noで判定された後でのみ「完了」になります。途中で失敗すると、自動的に再試行仕様が生成されます。
何が保証されるか。 (1) ユーザーはAIが何をする計画なのか実行前に見ます。(2) AIは自分の結果を自分で採点しません。別の検証・監督ステップがあります。(3) どのステップでもClaudeまたはCodexに切り替え可能で、外部APIを直接呼び出さないため、依存関係が分離されます。
QEを理解する最速の方法 — 作業室(スタジオ)として想像してください。
/Qinit — プロジェクトにフレームワークをインストール(CLAUDE.md、.qe/ディレクトリ自動生成)/Qplan "やりたいこと1行" — AIがロードマップとステップを提案します/Qgs Phase 1: 短い名前 — 具体的なスペック文書2つが生成されます(承認したらすぐ実行)/Qplanから始めてもいいです。 Qplanが作業規模を自動判定して、簡単な作業(バグ1つ・小さいリファクター)と判定されたら、ロードマップなしに/Qgs Fix: …に直接進みます。規模判定はユーザーがしなくても大丈夫です。Qplanが Micro / Small / Full に分けて自動的に経路を決めます。
/Qplanが作業規模を判定 — 「バグ1つだからマイクロスケール」と判定して、1行のプランを提案します。
ロードマップ・ステップなしに次に進みます。
/Qgsが TASK_REQUEST(どのファイルのどの関数をどう直すのか)と
VERIFY_CHECKLIST(直した後に何を確認するのか)を作ります。ユーザーはこの2つのファイルをさっと見て
「そう、この通りやって」と承認。
/Qatomic-runがチェックリストを並列実行。ファイルが複数なら複数のAI従業員(Haiku)が
同時に分割して修正します。Hookが毎回「ちゃんとやってるか?」を自動確認。
/Qcode-run-taskがテストを実行してVERIFY_CHECKLISTを1つずつ確認。
1つでも失敗したら自動で修正 → 再実行 → 再検証(最大3回)。通過したら「完了」報告。
全体Referenceを読む前に知っていると便利な単語。
main への push、破壊的操作の連鎖実行のリスクあり。要件が明確で、全ステップがロールバック可能で、独立したフィーチャーブランチ上のときのみ有効化。完全な事前チェックリストは USAGE_GUIDE §10 を参照。セッション終了前には必ず /Qutopia off を実行。/Qcontract と /Qverify-contract で使用。/Qcontractcreate / edit / list / approve で .qe/contracts/active/ の契約を作成・更新・承認。承認は対話ゲート(AskUserQuestion)+ .qe/contracts/.lock ハッシュ記録の 2 層防御。/Qverify-contractEcontract-judge エージェント)による契約準拠検証スキル。3 ハッシュ(contract / impl / test)キャッシュで同内容の再判定を回避。単一契約(<name>)または一括(--all)モードに対応。/Qcode-run-task Step 4.10 で自動呼び出し。