AIに「全部やっといて」は事故のもと。仕事を任せる“足場”の作り方

「このリポジトリ、いい感じに整理しといて」

そう頼んだ翌朝、AIは“いい感じ”に40ファイルを書き換えていました。動くコードもちゃんとあった。でも、消したらまずい設定ファイルまで、きれいさっぱり“整理”されていたんです。

ヒヤッとした経験、ありませんか。

賢いはずのAIが、なぜ平気で事故を起こすのか。理由はシンプルで、「賢いこと」と「安全に働けること」はまったく別物だからです。テストでは満点なのに、初めてのバイトでレジを壊す新人。あれと同じです。能力の問題じゃなくて、足場の問題なんですね。

その足場のことを、最近は ハーネス（harness） と呼びます。今日はこれを、専門用語をなるべく使わずに解説します。

ハーネスって、要するに何？

ハーネスは、AIの「外側」に置く小さなプログラムです。

イメージしやすいのは、工事現場の安全帯（命綱）や、子ども用の自転車の補助輪。本人の能力はそのままに、落ちないようにする仕組みのことです。AIでいえば、こんな役割を持ちます。

何を読ませるか決める（全部は見せない）
何を作らせるか決める（ゴールをはっきりさせる）
どこまで勝手にやらせ、どこで人間に確認させるか決める
できあがったものが壊れていないか、機械的にチェックする

「いいプロンプトを書く」のは、このうちのほんの一部です。プロンプトばかり磨いても事故が減らないのは、補助輪なしで一輪車の練習をしているようなものだからです。

なぜ今、わざわざ注目されるのか

少し前まで、AIに頼むことといえば「文章を書いて」「コードを書いて」くらいでした。出てきたものを人間が読んで判断すればよかった。

ところが今は、AIに作業そのものを任せ始めています。ファイルを読む、既存の記事と被らないネタを選ぶ、変更点を確認する、外部サービスに登録する、失敗したら原因を報告する——ここまで来ると、間に人間が毎回挟まれません。だから「勝手にやって事故る」リスクが一気に上がったわけです。

Claude Codeの評判がいいのも、モデルが賢いからというより、この足場がよくできているからです。ファイルを読む道具、検索する道具、危険な操作を止める仕組み、プロジェクトのルールを覚えさせる仕組み。そういう「地味な周辺」がしっかりしている。流行っているのは魔法のプロンプトではなく、その地味な周辺なんです。

まず動かしてみる：30行の最小ハーネス

説明より、動かしたほうが早いです。AIに「読み書き」だけを許し、決めたフォルダの外には絶対に手を出させない、最小の足場を作ってみましょう。Node.jsとAnthropicのAPIキーがあれば動きます。

まず準備します。

mkdir harness-demo && cd harness-demo
npm init -y
npm install @anthropic-ai/sdk
mkdir sandbox
echo "# メモ" > sandbox/note.md

次に「許可リスト」を書きます。これがハーネスの心臓部です。sandbox の外は触らせない、という宣言です。

{
  "workspace": "./sandbox",
  "maxSteps": 6
}

そして本体（harness.mjs）。覚えてほしいのは1か所だけ。safePath が「フォルダの外に出ようとしたら止める」門番です。これがあるだけで、冒頭の“40ファイル事故”は起きません。

import Anthropic from "@anthropic-ai/sdk";
import { readFile, writeFile } from "node:fs/promises";
import path from "node:path";

const client = new Anthropic();
const policy = JSON.parse(await readFile(new URL("./policy.json", import.meta.url), "utf8"));
const root = path.resolve(policy.workspace);

// 門番：作業フォルダの外に出ようとしたら、その場で止める
function safePath(p) {
  const resolved = path.resolve(root, p);
  if (resolved !== root && !resolved.startsWith(root + path.sep)) {
    throw new Error(`${p} は作業フォルダの外です。sandbox の中だけ触れます。`);
  }
  return resolved;
}

const tools = [
  { name: "read_file", description: "sandbox内のテキストを読む",
    input_schema: { type: "object", properties: { path: { type: "string" } }, required: ["path"] } },
  { name: "write_file", description: "sandbox内にテキストを書く",
    input_schema: { type: "object", properties: { path: { type: "string" }, content: { type: "string" } }, required: ["path", "content"] } },
];

async function useTool(name, input) {
  if (name === "read_file") return await readFile(safePath(input.path), "utf8");
  if (name === "write_file") { await writeFile(safePath(input.path), input.content, "utf8"); return "書き込みOK"; }
  throw new Error(`知らない道具: ${name}`);
}

const messages = [{ role: "user", content: process.argv.slice(2).join(" ") || "note.md を読んで、要約を summary.md に書いて。" }];

for (let step = 0; step < policy.maxSteps; step++) {
  const res = await client.messages.create({
    model: process.env.ANTHROPIC_MODEL || "claude-sonnet-4-6",
    max_tokens: 1024,
    tools,
    system: "あなたは慎重なファイル係です。必要なときだけ道具を使い、作業はsandbox内に限ります。",
    messages,
  });
  messages.push({ role: "assistant", content: res.content });

  const calls = res.content.filter((b) => b.type === "tool_use");
  if (calls.length === 0) { console.log(res.content.find((b) => b.type === "text")?.text ?? ""); break; }

  const results = [];
  for (const c of calls) {
    try { results.push({ type: "tool_result", tool_use_id: c.id, content: String(await useTool(c.name, c.input)).slice(0, 4000) }); }
    catch (e) { results.push({ type: "tool_result", tool_use_id: c.id, is_error: true, content: e.message }); }
  }
  messages.push({ role: "user", content: results });
}

実行はこれだけ。

node harness.mjs

たった数十行ですが、もう「AI本体」「使える道具」「許可の範囲」「やり直しの上限」「壊れたら止まる仕組み」が分かれています。これがハーネスの骨格です。あとはここに、検索・テスト実行・承認待ち・通知を足していくと、Claude Codeのような形に育っていきます。

こんな場面で効く（3つ）

1. 記事や資料の“量産チェック” 「ブログ書いて」で終わらせると、AIは平気で薄い記事や“ほぼ同じネタ”を量産します。そこでハーネスに「既存タイトルを読む→被らない切り口を選ぶ→本文を書く→文字数とリンクを機械チェック」と段取りを持たせる。すると、出来の良し悪しを人が悩む前に、門番が薄い記事を弾いてくれます。僕はこれで、公開前に止まる下書きが月に何本も出るようになりました。止まってくれてありがたい、という感覚です。

2. 問い合わせの仕分け 「来た問い合わせを読んで、商談になりそうなものだけ教えて」。読むのは自動でいい。でも、顧客リストへの登録は人間がボタンを押すまで保留にする。これをハーネスで強制します。読み取りは自動、書き込みは下書き（dry-run）、最終登録だけ人間。誤分類したお客さんを本番のデータベースに勝手に突っ込む事故が、これで消えます。

3. デプロイ前のひと呼吸 公開ボタンを押す前に、ビルドが通るか・環境変数が揃っているか・差分が想定どおりか・戻す手順があるか、を必ず確認させる。AIは失敗ログの“最後の行”だけ見て見当違いを直しがちなので、「どこを見るか」を先に決めておくのがコツです。ログは全部渡さず、関係する数十行に絞る。これだけで的外れな修正がぐっと減ります。

Claude Codeから“盗める”3つの設計

自分でハーネスを作るとき、ゼロから考える必要はありません。Claude Codeはお手本の宝庫です。全部マネしなくていいので、次の3つだけ早めに取り入れると一気に安定します。

ひとつ目は、ルールを階層に分けること。毎回変わらない約束ごとは設定ファイルへ、今回だけの指示はその場のメモへ、長く使う好みは別の場所へ。ぜんぶ毎回プロンプトに書くと、長くなって精度が落ちます。

ふたつ目は、確定的な作業はコマンドに任せること。整形・チェック・テストは、AIにお願いするより npm test のようなコマンドで回したほうが速くて確実です。AIには「考える」仕事だけ残します。

みっつ目は、重い調べ物は別の担当に逃がすこと。長いログや大量のファイル読みをメインの会話に流し込むと、肝心の判断がぼやけます。下調べは別プロセスにやらせ、結論だけ受け取る。これだけで判断のキレが戻ります。

僕がやらかした失敗3つ

正直に書きます。最初のハーネスは事故だらけでした。

ひとつ目は、道具を渡しすぎたこと。便利だろうと30個くらい用意したら、AIが「どれ使えば？」と迷って、変な選択を連発しました。今は最初5〜10個に絞っています。

ふたつ目は、エラーメッセージが不親切だったこと。Error: failed とだけ返していたら、AIは何も直せません。README.md が見つかりません。sandbox には note.md だけあります のように、原因と次の一手まで書いて返したら、急に自己解決し始めました。

みっつ目は、確認を人間の目だけに頼ったこと。「最後に僕がチェックすればいい」は、忙しい日に必ず破綻します。文字数・リンク切れ・型エラーみたいな機械でわかる門番を置いてからは、夜中の確認がぐっと減りました。

始めるなら、ここから

いきなり「全自動の賢いエージェント」を作らないでください。失敗しても戻せる、小さい仕事をひとつ選ぶ。下書き記事のチェック、PRの一次レビュー、問い合わせの仕分け、ステージング公開前の確認。このくらいがちょうどいいです。

順番はいつも同じです。①読ませる範囲を狭く決める→②ゴール（成果物）をはっきりさせる→③確認はできるだけコマンドにやらせる→④危ない操作（削除・本番DB・課金・force push）は最初は全部「人間に聞く」にする。安全だと分かった操作だけ、あとから自動に格上げする。この順番を守るだけで、事故は驚くほど減ります。

権限の決め方は Claude Code権限設定ガイドに、チームで使うときの土台づくりは CLAUDE.mdベストプラクティスにまとめています。長い作業を分けたいならサブエージェント活用パターンも合わせてどうぞ。公式の考え方は Claude Agent SDK のドキュメントが一次情報です。

実際に試した結果

冒頭の“40ファイル事故”以来、僕は「AIを信じるかどうか」で悩むのをやめました。代わりに見るのは、どの門番で止まったかです。最小ハーネスに safePath を1つ足しただけで、フォルダ外の事故はゼロになりました。文字数とリンクの自動チェックを足したら、薄い記事が公開前に止まるようになりました。賢いAIを探すより、転んでもケガしない足場を先に作る。遠回りに見えて、これがいちばん速い、というのが今の実感です。

まとめ

ハーネスエンジニアリングは、プロンプトを飾る技術ではありません。AIに何を見せ、何をさせ、どこで止め、どう確かめるかを設計する技術です。まずは上の30行を動かして、自分の仕事に「門番」をひとつ足すところから始めてみてください。AIの仕事の質は、モデルの賢さより、その外側の足場で決まります。

もっと体系的に、自分の業務へAIを安全に組み込みたい人は教材・テンプレート一覧を、チーム全体で権限・レビュー・検証まで整えたい人は研修・導入相談をのぞいてみてください。

AIに「全部やっといて」は事故のもと。仕事を任せる“足場”の作り方

ハーネスって、要するに何？

なぜ今、わざわざ注目されるのか

まず動かしてみる：30行の最小ハーネス

こんな場面で効く（3つ）

Claude Codeから“盗める”3つの設計

僕がやらかした失敗3つ

始めるなら、ここから

実際に試した結果

まとめ

無料PDF: Claude Code はじめてのチートシート

Claude Codeを仕事で使える形にしませんか？

関連書籍・参考図書

関連記事

Claude Code権限セーフティラダー: 初心者がallowを広げる順番

Claude Code Small PR Proof Pack: 小さなPRをレビュー可能にする証拠セット

Claude Codeのコミット前レビューゲート: 差分、テスト、CTAをまとめて止める型

次に使える教材・相談

Claude Code プロンプトテンプレート集 50選