Deep Dive: Anthropic When AI builds itself review bottleneck

เมื่อ AI เริ่มสร้าง AI เอง: คอขวดใหม่คือมนุษย์รีวิว

Anthropic Institute เพิ่งเผยแพร่รายงาน When AI builds itself ซึ่งพูดถึงความเป็นไปได้ของ recursive self-improvement หรือ AI ที่ช่วยสร้าง AI รุ่นถัดไปเองมากขึ้นเรื่อย ๆ

แต่มุมที่ผมคิดว่าสำคัญกับธุรกิจไทยไม่ใช่ภาพไกลระดับ “AI สร้างตัวเอง” เท่านั้น

มุมที่ใกล้กว่าคือ ถ้า AI agent ทำงานได้เร็วขึ้นมาก ระบบทำงานของบริษัทเราตามทันหรือยัง

1) เกิดอะไรขึ้น

Anthropic บอกว่า ณ พฤษภาคม 2026 โค้ดที่ merge เข้า production codebase ของบริษัทมากกว่า 80% ถูก authored โดย Claude

ก่อน Claude Code เปิด research preview ในเดือนกุมภาพันธ์ 2025 ตัวเลขนี้ยังอยู่ระดับ low single digits เท่านั้น

Anthropic ยังบอกว่าใน Q2 2026 engineer เฉลี่ย merge code ได้มากกว่าปี 2024 ถึง 8 เท่า แม้บริษัทจะย้ำเองว่า lines of code ไม่ใช่ตัววัด productivity ที่สมบูรณ์

สาระสำคัญคือ AI ไม่ได้แค่ช่วย suggest code อีกต่อไป แต่มันเริ่ม run code, edit files, delegate work, run experiments และทำงานต่อเนื่องในช่วงเวลาที่ยาวขึ้น

2) ทำไมมันสำคัญกว่าข่าว productivity

ถ้ามองแบบผิวเผิน เรื่องนี้คือข่าวว่า engineer ทำงานได้เร็วขึ้น

แต่ถ้ามองแบบ operator ข่าวจริงคือคอขวดกำลังย้ายจาก “การผลิตงาน” ไปสู่ “การเลือกโจทย์และตรวจงาน”

Anthropic ระบุชัดว่าความได้เปรียบของมนุษย์ตอนนี้ยังอยู่ที่ big picture, judgment, research taste, การเลือกปัญหาที่ควรแก้ และการตัดสินใจว่า output ไหนควรเชื่อ

เมื่อ AI ผลิตงานได้เร็วขึ้น human review จึงเริ่มกลายเป็น bottleneck

นี่เป็น pattern ที่บริษัททั่วไปจะเจอเหมือนกัน ไม่ว่าจะเป็นทีม marketing, support, sales, developer, finance หรือ operations

3) ตัวเลขที่ควรจำ

ตัวเลขแรกคือมากกว่า 80% ของ production code ที่ Anthropic merge ในเดือนพฤษภาคม 2026 ถูก authored โดย Claude

ตัวเลขที่สองคือ engineer เฉลี่ย merge code ได้มากขึ้น 8 เท่าใน Q2 2026 เมื่อเทียบกับปี 2024

ตัวเลขที่สามคือ Anthropic รายงานว่า success rate ของ Claude บน open-ended tasks สูงขึ้นมาก โดยกลุ่มงานที่เปิดกว้างที่สุดขึ้นไปถึง 76% ในเดือนพฤษภาคม 2026

ตัวเลขเหล่านี้ไม่ควรถูกอ่านว่า “AI ถูกเสมอ” แต่ควรถูกอ่านว่า “AI ทำงานได้มากพอจนระบบรีวิวเดิมไม่พอ”

4) ธุรกิจไทยควรแปลเป็นระบบอย่างไร

คำถามสำคัญไม่ใช่แค่ว่าใช้ Claude, ChatGPT, Gemini, Codex หรือ Copilot ตัวไหน

คำถามคือบริษัทมีระบบรองรับ AI work หรือยัง

อย่างน้อยควรมี 5 อย่าง

หนึ่ง เป้าหมายงานต้องชัด AI ต้องรู้ว่างานนี้ถือว่าจบเมื่อมีหลักฐานอะไร

สอง ต้องมี proof log ทุกงานที่ AI ทำควรบอกได้ว่าใช้แหล่งข้อมูลไหน ทดสอบอะไร และมีข้อจำกัดอะไร

สาม ต้องมี review lane งาน low-risk อาจให้ AI เดินต่อได้ แต่งานที่กระทบเงิน ลูกค้า กฎหมาย ความปลอดภัย หรือ public reputation ต้องมีคน approve

สี่ ต้องมี stop rule ถ้า scope บาน ข้อมูลไม่พอ หรือ AI เริ่มเดา ต้องหยุดก่อน

ห้า workflow ต้อง versioned ไม่ใช่อยู่ใน prompt ครั้งเดียว GitHub Blog เรื่อง custom agents ใน Copilot CLI ชี้ไปทางเดียวกัน: เอา workflow, guardrail, tool list และ output format มาเก็บเป็นไฟล์ที่ทีมรีวิวและปรับปรุงได้

5) มุมมองของผม

AI agent ที่ดีไม่ได้แทนมนุษย์ด้วยการทำทุกอย่างเองแบบไร้คนดู

มันเปลี่ยนหน้าที่มนุษย์จากคนลงมือทุก task เป็นคนตั้งโจทย์ ตรวจหลักฐาน ออกแบบรั้ว และตัดสินใจเรื่องที่มีผลกระทบจริง

ถ้าบริษัทไม่มี operating system ตรงนี้ AI จะสร้าง output ได้เร็วขึ้นก็จริง

แต่ของผิดก็จะถูกผลิตเร็วขึ้นด้วย

ดังนั้นบทเรียนจาก Anthropic ไม่ใช่แค่ “AI เก่งมาก”

บทเรียนคือ บริษัทที่อยากใช้ AI agent จริงต้องสร้างระบบรีวิวให้เร็วและละเอียดพอ ๆ กับระบบผลิตงาน

Leave a Comment

สอบถามข้อมูล
Scroll to Top
คอร์สใหม่ Claude Cowork: Zero → Hero Early Bird 2,990 บาท ดูคอร์ส