Prompt Engineering Lanjutan untuk Claude Code dan Codex: Task Brief yang Bisa Diverifikasi

Jika hasil Claude Code atau Codex kadang bagus dan kadang melenceng, masalahnya sering bukan modelnya. Masalahnya adalah cara tugas diberikan. Prompt engineering lanjutan bukan soal kalimat ajaib. Ini soal desain workflow: tujuan, scope, konteks, batasan, acceptance criteria, verifikasi, dan handoff dalam satu paket kerja.

Artikel ini menjelaskan cara membuat “prompt packet” yang bisa langsung dipakai di Claude Code dan Codex. Pemula bisa menyalin template, tetapi strukturnya cukup kuat untuk tim, repositori nyata, pekerjaan paralel, kode produksi, dan artikel yang sudah publish. Jika perlu fondasi, mulai dari 5 tips untuk prompt yang lebih baik dan praktik terbaik CLAUDE.md.

Perilaku tool dapat berubah, jadi klaim tentang fitur harus merujuk dokumen resmi. Untuk Claude Code, mulai dari Claude Code overview, Memory, dan prompt engineering overview. Untuk Codex, gunakan OpenAI Codex docs dan AGENTS.md guidance.

Lanjutan Berarti Kontrak Kerja

Prompt yang lemah bukan hanya prompt yang pendek. Ia tidak punya aturan keputusan, tidak menyebut file yang tidak boleh disentuh, tidak mendefinisikan selesai, dan tidak meminta bukti. Jika celah itu ada, agent akan menebak.

Prompt praktis sebaiknya berfungsi seperti kontrak kerja kecil.

Bagian	Isi yang ditulis	Kegagalan jika hilang
Goal	Hasil yang dibutuhkan	Jawaban terlihat masuk akal tetapi menyelesaikan masalah yang salah
Scope	Area yang boleh dan tidak boleh berubah	Refactor tidak terkait ikut masuk diff
Context	Dokumen, kode serupa, referensi resmi	Agent menyalin pola lama atau mengarang perilaku
Constraints	Aturan dan perubahan yang dilarang	Dependency, API, atau gaya berubah tanpa sengaja
Acceptance criteria	Cara menilai selesai	Review berubah menjadi selera pribadi
Verification	Command dan pengecekan manual	Pekerjaan selesai tanpa bukti

Overview prompt engineering dari Anthropic menempatkan kriteria sukses dan pengujian empiris sebagai dasar. Untuk coding agent, ini lebih penting karena Claude Code dan Codex dapat membaca file, mengedit file, dan menjalankan command sebelum hasilnya benar-benar tervalidasi.

Simpan Prompt Packet Sebagai File

Mengetik instruksi panjang di chat setiap kali sulit ditinjau dan sulit dipakai ulang. File seperti prompt-packet.md membuat tugas lebih stabil. Cuplikan Bash berikut membuat packet minimal.

cat > prompt-packet.md <<'EOF'
# Goal
Improve one published article so it is practical, accurate, and ready for review.

# Scope
May edit:
- site/src/content/blog/example-article.mdx

Do not edit:
- heroImage
- slug
- unrelated articles
- package or deployment files

# Context to read
- AGENTS.md
- site/src/content/blog/claude-md-best-practices.mdx
- Official docs relevant to the article topic

# Constraints
- Preserve existing frontmatter keys unless this task explicitly changes them.
- Use copy-pasteable examples, not pseudocode.
- Avoid unsupported claims. Link to official docs for tool behavior.
- Keep paragraphs short enough for mobile reading.

# Acceptance criteria
- updatedDate is 2026-06-02.
- The article has at least three concrete use cases.
- The article names specific pitfalls and how to avoid them.
- The article includes an internal link, an official external link, and a natural CTA.
- The final section explains what was actually verified.

# Verification
- node scripts/check-code-fences.mjs
- node scripts/check-updated-article-quality.mjs
- Read the diff once as a critical reviewer.

# Return format
- Changed files
- Key improvements
- Checks run
- Residual risks
EOF

Saat menggunakannya, beri instruksi pendek: “Baca prompt-packet.md terlebih dahulu, periksa file target dan konteks yang tercantum, lalu bekerja hanya di dalam Scope.” Ini bukan birokrasi. Ini mencegah agent mengubah halaman tetangga, gambar, konfigurasi, atau kode yang tidak relevan karena ingin membantu.

Periksa Prompt Sebelum Dipakai

Prompt adalah prosa, sehingga kualitasnya mudah bergeser. Checker kecil bisa menangkap struktur yang hilang. Simpan sebagai check-prompt-packet.cjs.

// save as check-prompt-packet.cjs
const fs = require("node:fs");

const file = process.argv[2] || "prompt-packet.md";
const text = fs.readFileSync(file, "utf8");

const required = [
  "# Goal",
  "# Scope",
  "# Context to read",
  "# Acceptance criteria",
  "# Verification",
  "# Return format",
];

const missing = required.filter((heading) => !text.includes(heading));
const hasDoNotTouch = /do not (edit|change|touch)/i.test(text);
const hasCommand = /npm run|npm test|pnpm |yarn |node scripts\//i.test(text);

if (missing.length || !hasDoNotTouch || !hasCommand) {
  console.error("Prompt packet is not ready.");
  if (missing.length) console.error("Missing headings: " + missing.join(", "));
  if (!hasDoNotTouch) console.error("Add an explicit do-not-touch boundary.");
  if (!hasCommand) console.error("Add at least one verification command.");
  process.exit(1);
}

console.log("Prompt packet looks actionable.");

Jalankan seperti ini.

node check-prompt-packet.cjs prompt-packet.md

Sengaja sederhana, tetapi efektif. Dalam operasi artikel Masa, kegagalan paling sering terjadi saat batas “do not edit” atau bukti akhir tidak ditulis. Di kode produk juga sama. Jika request tidak mendefinisikan selesai, reviewer hanya bisa menilai berdasarkan selera.

Ubah Tujuan Kabur Menjadi Acceptance Criteria

“Perbaiki artikel ini”, “kuatkan SEO”, dan “buat siap produksi” adalah niat yang masuk akal, tetapi tidak bisa diverifikasi. Ubah menjadi kriteria yang bisa lulus atau gagal.

Prompt lemah:

Tolong perbaiki artikel ini dan kuatkan SEO.

Prompt yang bisa dipakai:

Rewrite artikel ini sebagai panduan praktis untuk developer yang mulai memakai Claude Code.

Acceptance criteria:
- Judul memuat "Claude Code" dan "prompt engineering".
- Description kurang dari 120 karakter.
- Body memuat minimal tiga use case konkret.
- Ada minimal dua contoh prompt buruk dan dua versi yang diperbaiki.
- Artikel memuat link dokumentasi resmi dan artikel internal terkait.
- Bagian akhir menyebut apa yang benar-benar diverifikasi.
- Jalankan code-fence check setelah edit dan laporkan hasilnya.

Untuk implementasi, buat kriterianya teknis.

Acceptance criteria:
- Jangan mengubah tipe public API.
- Tambahkan validasi dan error yang terlihat oleh user.
- Tambahkan atau update minimal satu failing-path test.
- Jalankan npm test dan npm run build, lalu laporkan hasil.
- Jelaskan file yang berubah dan file relevan yang diperiksa tetapi tidak diubah.

Acceptance criteria bukan untuk micromanage agent. Tujuannya adalah menyamakan standar review sebelum pekerjaan dimulai.

Kelola Context Budget

Dokumentasi Memory Claude Code menjelaskan bahwa CLAUDE.md dan auto memory dimuat sebagai konteks, bukan konfigurasi yang dipaksakan. Instruksi lebih panjang tidak otomatis lebih ditaati. Aturan penting justru bisa tenggelam.

Bagi konteks menjadi tiga lapisan.

Lapisan	Contoh	Tempat terbaik
Selalu perlu	Build command, naming rule, area terlarang	`CLAUDE.md` atau `AGENTS.md`
Spesifik tugas	File target, implementasi mirip, standar kualitas	`prompt-packet.md`
Dibaca jika perlu	Spec panjang, catatan lama, log mentah	Sebut nama file saja

Kesalahan umum adalah menempelkan semua materi. Jika meeting notes, desain lama, log, dan tugas sekarang dicampur, agent harus menebak prioritas. Tulis urutan baca.

Context to read in order:
1. AGENTS.md for project rules.
2. The target article.
3. One similar high-quality article for tone and structure.
4. Official docs only for tool behavior.

Ignore:
- Old brainstorming notes unless they contradict the current implementation.
- Unrelated product pages.
- Generated files and build output.

Instruksi kecil ini mengurangi eksplorasi sia-sia. Ini juga penting ketika beberapa worker mengedit slug berbeda secara paralel, karena file yang terlihat tidak otomatis boleh diedit.

Pisahkan Contoh Dari Constraints

Contoh menunjukkan pola yang ingin ditiru. Constraint menentukan batas. Jika dicampur, prompt menjadi samar.

Prompt lemah:

Buat halaman ini seperti artikel productivity tips.

Prompt lebih baik:

Reference style:
- Use site/src/content/blog-id/claude-code-productivity-tips.mdx only for section density and CTA placement.
- Do not copy its examples or claims.

Constraints:
- Keep this article focused on prompt engineering.
- Do not introduce pricing claims.
- Preserve heroImage and slug.

Jangan berhenti di “jangan rusak”. Beri batas positif juga. “Jangan tambah library” lebih baik menjadi “gunakan hanya dependency yang sudah ada”. “Jangan ubah terlalu banyak” lebih baik menjadi “edit hanya file yang tercantum dan pertahankan public API”.

Minta Loop Iterasi Yang Aman

Untuk pekerjaan serius, satu instruksi raksasa lebih rapuh daripada loop yang jelas.

Baca target, aturan, dan contoh berkualitas terdekat.
Jelaskan rencana singkat.
Edit hanya dalam scope.
Verifikasi dengan command dan cek manual.
Laporkan perubahan, bukti, dan risiko.

Tulis langsung dalam prompt.

Workflow:
- First inspect the target file and the nearest quality reference.
- If the change is larger than two files, explain the plan before editing.
- Edit only the files listed in Scope.
- After editing, run the Verification commands if feasible.
- End with a verification receipt, not a general summary.

Verification receipt adalah bukti kerja. Pola lengkapnya ada di panduan verification receipt, tetapi format minimum ini cukup untuk pekerjaan harian.

Verification receipt:
- Changed files:
- Commands run:
- Results:
- Manual checks:
- Could not verify:
- Residual risks:

Empat Use Case Konkret

Use case pertama adalah bug fix. Berikan gejala, langkah reproduksi, perilaku yang diharapkan, log, dan file yang boleh diedit. Minta agent menjelaskan kemungkinan penyebab sebelum mengedit, lalu membuat fix terkecil dan menambahkan failing-path test. Ini menghindari perbaikan kosmetik.

Use case kedua adalah fitur kecil. Jelaskan perubahan yang terlihat oleh user, apakah API atau database boleh berubah, pola UI mana yang harus diikuti, dan test apa yang membuktikan hasil. Untuk menambah field kategori di contact form, masukkan opsi, validasi, payload, analytics event, dan lokalisasi.

Use case ketiga adalah rewrite artikel. Berikan pembaca, search intent, panjang target, contoh wajib, failure case, internal link, CTA, dan sumber resmi. Di ClaudeCodeLab, ini mencegah artikel tipis berubah hanya menjadi ringkasan yang lebih halus, bukan panduan yang bisa dijalankan.

Use case keempat adalah code review. Prompt review lebih butuh format daripada kreativitas. Minta severity, file dan line, kondisi reproduksi, arah fix, dan test yang hilang. Daripada “review semua”, prioritaskan security, data loss, perubahan public API, dan error path tanpa test.

Failure Mode Yang Sering Muncul

Failure 1: mencampur tujuan. “Refactor, percepat, perbaiki SEO, dan ubah CTA” adalah beberapa pekerjaan. Pakai satu tujuan per packet.

Failure 2: hanya menulis larangan. “Jangan rusak” tidak menjelaskan apa yang boleh dilakukan. Pasangkan area terlarang dengan area yang boleh diubah.

Failure 3: memperlakukan pengetahuan lama sebagai perilaku resmi. Claude Code, Codex, memory, settings, dan AGENTS.md dapat berubah. Tautkan dokumen resmi dan jangan mengklaim lebih dari yang didukung dokumen.

Failure 4: membuat verifikasi opsional. Jika command tidak bisa dijalankan, agent harus melaporkannya. Diam lebih buruk daripada gap yang jelas.

Failure 5: membiarkan prompt bagus terkunci di chat. Pindahkan instruksi yang berhasil ke prompt-packet.md, CLAUDE.md, atau checklist review tim. Untuk kerja tim, gabungkan dengan aturan handoff Claude Code.

CTA: Standarkan Sebelum Diskalakan

Anda tidak perlu menulis packet ini dari nol setiap hari. Mulai dari cheatsheet gratis untuk cek harian, bandingkan material reusable di produk dan template, dan gunakan training atau konsultasi Claude Code ketika tim perlu menyesuaikan CLAUDE.md, permissions, review, verification receipt, dan kualitas artikel ke repositori nyata.

Yang Saya Verifikasi Untuk Artikel Ini

Untuk artikel ini, saya mengecek official Claude Code overview untuk klaim bahwa Claude Code dapat membaca codebase, mengedit file, dan menjalankan command. Saya mengecek Memory untuk membedakan CLAUDE.md, auto memory, dan konfigurasi yang dipaksakan. Saya juga mengecek prompt engineering overview Anthropic untuk prinsip bahwa success criteria dan test perlu ditetapkan sebelum prompt dioptimalkan, lalu menyelaraskan bagian Codex dengan OpenAI Codex docs dan AGENTS.md guidance. Kesimpulan praktisnya: perlakukan prompt sebagai kontrak kerja yang bisa direview, bukan pesan chat sekali pakai.