
Claude Opus 4.7 ไม่ได้แย่ลง แต่มันหยุดเดาแทนเราแล้ว
ช่วง 2-3 วันที่ผ่านมา ผมว่ามีคนใช้ Claude Opus 4.7 อยู่สองกลุ่มชัดมาก
กลุ่มแรกบอกว่า มันดีขึ้น แม่นขึ้น และเอาไปทำงาน agentic ได้จริงกว่าเดิม อีกกลุ่มบอกว่า มันแปลกขึ้น ดื้อขึ้น และ prompt เดิมที่เคยใช้ได้กลับไม่เวิร์ก
ความน่าสนใจคือ ทั้งสองกลุ่มอาจพูดถูกพร้อมกัน
เพราะสิ่งที่ Anthropic เปลี่ยนใน Opus 4.7 ไม่ใช่แค่ความเก่งของโมเดล แต่คือ วิธีที่มันตีความ intent ของเรา
TL;DR
Claude Opus 4.7 ไม่ได้แย่ลงแบบตรงๆ แต่มัน “หยุดเดาแทนเรา” มากขึ้น ถ้าทีมไหนเคยพึ่ง prompt แบบกว้างๆ หรือหวังให้โมเดลเติมช่องว่างเอง 4.7 จะทำให้รู้สึกว่ามัน regress แต่ถ้าเปลี่ยนมาเขียน intent ให้ชัด แยก strategic context ออกจาก per-task intent และปรับ effort ให้เหมาะ มันจะนิ่งขึ้น แม่นขึ้น และเหมาะกับงาน agentic มากกว่าเดิม
Why chosen: อิง pattern claude_ecosystem ผสม ai_how_to เพราะเป็นข่าวและคู่มือที่กระทบคนใช้ Claude โดยตรง ไม่ใช่แค่ release note และมีมุม workflow change ที่แปลงเป็นคำแนะนำใช้งานได้ทันที
สิ่งที่เปลี่ยนจริงใน Opus 4.7
Anthropic เขียนไว้ใน migration guide ทางการ ชัดมากว่า Claude Opus 4.7
- ตีความคำสั่งแบบตรงตัวมากขึ้น
- จะไม่ silently generalize สิ่งที่เราไม่ได้ระบุชัด
- ใช้ effort level อย่างเคร่งครัดกว่ารุ่นก่อน
- มีแนวโน้มเรียก tools และ spawn subagents น้อยลงถ้าเราไม่ได้บอกชัด
นี่สำคัญมาก เพราะมันทำให้ 4.7 ดูเหมือน “แย่ลง” สำหรับคนที่คุ้นกับ workflow เดิม
แต่ในอีกมุม มันอาจไม่ได้แย่ลงเลย มันแค่ เลิกช่วยเดาแทนเรา
ประเด็นที่คู่มือของ Paweł Huryn จับได้แม่น
ชิ้น The Ultimate Guide to Claude Opus 4.7 ของ Paweł Huryn น่าสนใจตรงที่เขาไม่ได้อ่าน 4.7 แบบ benchmark อย่างเดียว
เขาอ่านมันแบบคนที่ใช้ Claude ทำงานจริง
แกนกลางของบทความคือ ถ้า 4.6 เคยช่วย “เติมช่องว่าง” ตอนเราสั่งไม่ชัด 4.7 จะเอาคำสั่งเราแบบตรงกว่าเดิม
ประโยคนี้ผมว่ามันอธิบายทุกอย่าง
ถ้า workflow เดิมของคุณพึ่งความสามารถแบบ “เดี๋ยวมันน่าจะเข้าใจเอง” คุณจะเจ็บกับ 4.7 ทันที แต่ถ้า workflow ของคุณมี intent ชัด มี success criteria ชัด และมี context ที่จัดวางดี คุณจะได้ประโยชน์จาก 4.7 มากกว่าเดิม
จาก Prompt Engineering ไป Intent Engineering
ผมว่าคำที่สำคัญที่สุดของชิ้นนี้คือคำว่า intent engineering
ไม่ใช่การเขียน prompt ให้ยาวขึ้น ไม่ใช่การเพิ่มกฎอีกสิบข้อ และไม่ใช่การทำ CLAUDE.md ให้บวมที่สุด
แต่คือการแยกให้ชัดว่าอะไรคือ
- Strategic context เช่น เรากำลังสร้างอะไร ใครคือผู้ใช้ ข้อห้ามคืออะไร งานแบบไหนถือว่าดี
- Per-task intent คือรอบนี้เราอยากให้ Claude ทำอะไรให้เสร็จ
แนวคิดนี้ตรงกับการทำงานจริงในองค์กรดีมาก
ตอนทำ data platform หรือ omnichannel integration ปัญหาใหญ่ไม่ใช่ทีม “ไม่เก่งพอ” อย่างเดียว แต่คือ requirement ไม่ชัด, success criteria ไม่ชัด, แล้วทุกคนพยายามเดา intent กันเอง ผลสุดท้ายคือ rework
Claude Opus 4.7 ก็เหมือนกัน ถ้า intent ของเรายังฟุ้ง มันจะไม่ค่อยช่วยอุ้มเหมือนเดิมแล้ว
4 เรื่องที่คนใช้ Claude ควรปรับทันที
1) หยุดหวังให้ prompt กว้างๆ พาไปถึงคำตอบเอง
Anthropic ระบุชัดว่า 4.7 จะ literal มากขึ้น โดยเฉพาะที่ effort ต่ำ
ถ้าต้องการให้มัน apply กฎเดียวกันกับทุก section, ทุก item, หรือทุกไฟล์ ต้องบอก scope ให้ชัด
จากเดิมที่เราเคยเขียนประมาณว่า
ช่วยจัดเอกสารนี้ให้เรียบร้อย
ตอนนี้อาจต้องเขียนให้ชัดกว่าเดิม เช่น
จัดรูปแบบทุก section ให้เหมือนกันทั้งหมด, ใส่ heading ระดับเดียวกัน, และ rewrite ทุก bullet ให้สั้นลงในโทนเดียวกัน
2) ย้าย strategic context ไปไว้ใน CLAUDE.md
ทั้ง Anthropic docs และบทความของ Paweł ชี้ตรงกันว่า การแยก context ถาวรออกจาก task ชั่วคราวช่วยได้มาก
พูดง่ายๆ คือ อย่าจ่ายค่า “เล่าเรื่องเดิมใหม่” ทุก session
ถ้าคุณใช้ Claude Code หรือมี agent workflow ประจำ ควรเก็บสิ่งเหล่านี้ไว้ใน CLAUDE.md:
- โปรเจกต์นี้คืออะไร
- ผู้ใช้หลักคือใคร
- ข้อห้ามทางธุรกิจหรือเทคนิคคืออะไร
- งานแบบไหนถือว่า done
แล้วใช้แต่ละ turn เพื่อบอกเฉพาะ intent ของงานนั้นจริงๆ
3) เลิกใส่ scaffolding เยอะโดยไม่จำเป็น
Anthropic บอกเองว่า Opus 4.7 ให้ progress updates ระหว่าง long agentic traces ได้ดีขึ้น
นั่นแปลว่า instruction ประเภท
- สรุปทุก 3 tool calls
- บอกแผนก่อนทำทุกครั้ง
- รายงานสถานะทุกช่วง
อาจกลายเป็นของเกินในหลาย workflow
ถ้าใส่มากไป คุณไม่ได้ช่วยมันเสมอไป บางทีคุณกำลังทำให้ trace ยาวขึ้น ค่าใช้จ่ายสูงขึ้น และทำให้ output แข็งขึ้นโดยไม่จำเป็น
4) ปรับ effort ให้ถูกงาน ไม่ใช่ดัน max ตลอด
Opus 4.7 เปลี่ยนจาก budget_tokens เดิมไปเป็น adaptive thinking + effort
Anthropic แนะนำว่า:
- งาน coding และ agentic เริ่มที่
xhigh - งานที่ sensitive ต่อคุณภาพควรอย่างน้อย
high maxใช้เฉพาะตอนที่โจทย์ยากจริง เพราะอาจ overthinking ได้
นี่สำคัญกับคนทำ product มาก
เพราะการย้ายมา 4.7 ไม่ใช่แค่เทียบค่า model price หน้า pricing page แต่ต้องคิดเรื่อง cost per correct output ด้วย
ถ้าตั้ง effort สูงเกินจำเป็น คุณจะได้ค่าใช้จ่ายเพิ่มโดยไม่ได้คุณภาพเพิ่มเท่ากัน
แล้วเรื่อง cost ต้องระวังอะไรบ้าง
Migration guide ระบุว่า Opus 4.7 ใช้ tokenizer ใหม่ ซึ่งอาจทำให้ input token เพิ่มขึ้นได้ประมาณ 1.0 ถึง 1.35 เท่าเมื่อเทียบกับรุ่นก่อน ขึ้นกับลักษณะของข้อความ
นอกจากนี้ยังมีอีกหลายจุดที่ทำให้ bill เปลี่ยน:
- adaptive thinking ถ้าเปิดใช้และตั้ง effort สูง
- image workloads ที่ละเอียดขึ้น
- long interactive sessions ที่มี user turns หลายรอบ
เพราะฉะนั้น ถ้าใครย้ายจาก 4.6 มา 4.7 แล้วรู้สึกว่าแพงขึ้น มันอาจไม่ได้มาจากราคา model อย่างเดียว แต่มาจาก รูปแบบการใช้งาน ด้วย
สิ่งที่ผมว่าองค์กรควรตีความจากเรื่องนี้
หลายทีมยังมองการอัปเกรดโมเดลเหมือนเปลี่ยน engine รถ ใส่ของใหม่แล้วรถควรวิ่งดีขึ้นทันที
แต่ Opus 4.7 ทำให้เห็นชัดว่า AI model upgrade เริ่มไม่ใช่แค่เรื่อง model แล้ว มันคือ workflow upgrade
ถ้าคุณมีทีมที่ใช้ Claude ทำ coding, research, internal copilots หรือ customer-facing agents สิ่งที่ต้องรีวิวไม่ใช่แค่ benchmark แต่คือ:
- prompt ไหนพึ่ง model เดาเยอะเกินไป
- task ไหนยังไม่ได้แยก strategic context ออกจาก task intent
- workflow ไหนใช้ effort แพงเกินจำเป็น
- instruction ไหนควรลบออก เพราะโมเดลทำเองได้แล้ว
ใครจะได้ประโยชน์จาก Opus 4.7 มากที่สุด
| กลุ่ม | ทำไมถึงได้ประโยชน์ |
|---|---|
| ทีมที่มี prompt discipline ดีอยู่แล้ว | ยิ่งชัด ยิ่งได้ความแม่นของ 4.7 เต็มๆ |
| ทีมที่ใช้ Claude Code หรือ agent workflow | 4.7 เหมาะกับ long-horizon work มาก แต่ต้องสั่งให้ชัดขึ้น |
| ทีม product / internal tools | เริ่มวัดได้ชัดขึ้นว่า cost มาจาก intent ที่ไม่ชัด หรือมาจาก model จริง |
| องค์กรที่อยากสร้าง agent แบบ production | บังคับให้ทีมคิดเรื่อง success criteria และ context architecture จริงจัง |
แล้วใครจะเจ็บ
ทีมที่น่าจะเจ็บที่สุดคือทีมที่ใช้ AI แบบ “ช่วยเดาให้หน่อย” มาตลอด
ถ้า prompt เต็มไปด้วยคำกว้างๆ ถ้าไม่มีตัวอย่าง output ที่ดี ถ้าไม่ได้ระบุ scope ถ้าใช้ max effort จนเป็น default
4.7 จะทำให้ทุกจุดอ่อนพวกนี้ชัดขึ้นทันที
สรุป
ชิ้นของ Paweł Huryn มีค่าตรงที่มันช่วยเปลี่ยนคำถาม
จากเดิมที่หลายคนถามว่า
Claude Opus 4.7 ดีกว่า 4.6 ไหม
มาเป็นคำถามที่สำคัญกว่า
workflow ของเราดีพอสำหรับ 4.7 หรือยัง
ผมว่าคำตอบที่ตรงที่สุดคือ Claude Opus 4.7 ไม่ได้แย่ลง แต่มันหยุดเดาแทนเราแล้ว
และสำหรับคนที่ทำงานกับ AI จริง นี่อาจเป็นข่าวดีมากกว่าข่าวร้าย
เพราะเมื่อ model หยุดอุ้มความกำกวมของเรา เราก็เริ่มถูกบังคับให้สร้าง workflow ที่โตเป็นผู้ใหญ่มากขึ้น
—
FAQ
ถาม: ถ้า 4.7 ดูแย่กว่า 4.6 แปลว่าควร downgrade ไหม? ไม่จำเป็นครับ ก่อน downgrade ควรเช็กก่อนว่า prompt เดิมพึ่งการเดา, ใช้ effort ต่ำเกินไป, หรือมี scaffolding เกินจำเป็นหรือเปล่า เพราะหลายเคสไม่ได้เป็นปัญหาที่ model อย่างเดียว แต่เป็นปัญหาที่ workflow
ถาม: สิ่งแรกที่ควรทำถ้าจะย้ายมา 4.7 คืออะไร? รีวิว prompt/harness ก่อนเลย โดยเฉพาะงานที่เคยพึ่งคำสั่งกว้างๆ จากนั้นแยก strategic context ไปไว้ใน CLAUDE.md และกำหนด success criteria ให้ชัดขึ้น
ถาม: 4.7 เหมาะกับงานแบบไหนที่สุด? Anthropic ระบุว่ามันเด่นใน long-horizon agentic work, knowledge work, vision และ memory tasks แต่จะได้ผลดีมากที่สุดเมื่อ intent ชัดและ effort เหมาะกับงาน
ถาม: ถ้าจะคุม cost ควรเริ่มตรงไหน? เริ่มที่ effort level, จำนวนรอบโต้ตอบ, และขนาด context ก่อนครับ ไม่ใช่ดูแต่ราคาต่อ token อย่างเดียว เพราะ tokenizer ใหม่และ adaptive thinking มีผลต่อ bill มาก
—
เนื้อหาและมุมมองโดย Arty | มี Espresso Bot ☕🤖 ช่วยรวบรวมข้อมูลและจัดเรียบเรียง
