Deep dive 2026 06 14 hermes agent returns tomorrow

เนื้อหาในบทความนี้

Hermes Agent: AI Coworker ที่จำงาน ทำซ้ำ และกลับมาทำงานพรุ่งนี้

Aakash Gupta เขียนถึง Hermes Agent ด้วยประโยคหนึ่งที่ผมว่าจับแก่นได้ดีมากครับ

คนไม่ได้อยู่กับ Hermes เพราะมันเป็น agent ตัวใหม่ แต่อยู่เพราะมันเป็น agent ตัวแรก ๆ ที่ “ยังทำงานต่อ” หลังจากเราหยุดถาม

นี่คือจุดที่ทำให้ Hermes น่าสนใจกว่า chatbot ทั่วไป

เพราะ chatbot ปกติทำงานแบบนี้:

เราเปิดแชท เราถาม มันตอบ จบ

พรุ่งนี้ถ้าจะให้มันทำงานต่อ เราต้องกลับมาเปิดแชทใหม่ เล่าบริบทใหม่ ส่งไฟล์ใหม่ อธิบาย workflow ใหม่ แล้วหวังว่ามันจะเข้าใจเหมือนเดิม

แต่ Hermes พยายามออกแบบตัวเองเป็นอีกแบบ:

เป็น AI coworker runtime ที่มี memory, skills, tools, cron, messaging gateway และ learning loop

แปลเป็นภาษาธุรกิจง่าย ๆ:

Chatbot ช่วยคุณคิดวันนี้ Hermes พยายามช่วยคุณคิด จำ ทำ และกลับมาทำงานต่อพรุ่งนี้

1) The chatbot tax: มี AI แต่ยังต้องทำงานเอง

Aakash เปิดด้วยภาพที่หลายบริษัทน่าจะคุ้นมาก

ปีที่แล้วเราเพิ่ม Claude หรือ ChatGPT เข้า Slack สองคนใช้ทุกวัน ที่เหลือเปิดเดือนละสองครั้ง Monday metrics deck ยังทำมือเหมือนเดิม

เขาเรียกสิ่งนี้ว่า chatbot tax

ผมชอบคำนี้ เพราะมันแทงใจมาก

หลายองค์กรคิดว่าการมี AI ในช่องแชทคือ transformation แล้ว แต่ในชีวิตจริง งานยังไม่ขยับ เพราะ AI ยังไม่ได้อยู่ใน workflow จริง

มันตอบได้ แต่ไม่ตามงาน มันสรุปได้ แต่ไม่กลับมาทำซ้ำ มันช่วยเขียนได้ แต่ไม่รู้ว่าสัปดาห์ที่แล้วเราแก้อะไรไว้ มันฉลาดใน turn เดียว แต่ไม่มีชีวิตการทำงานระยะยาว

สำหรับธุรกิจไทย นี่คือจุดแยกสำคัญ:

ถ้า AI ยังต้องรอให้คนเปิดแชท, copy ข้อมูล, paste context, และสั่งใหม่ทุกครั้ง มันยังเป็น “เครื่องมือช่วยตอบ” ไม่ใช่ “เพื่อนร่วมงาน”

2) Hermes ต่างตรงไหน: memory, skills, cron, tools

จาก official docs ของ Nous Research, Hermes วางตัวเองเป็น self-improving autonomous AI agent ไม่ใช่ coding copilot ที่ติดอยู่กับ IDE และไม่ใช่ chatbot wrapper รอบ model ตัวเดียว

สิ่งที่ทำให้ภาพนี้ต่าง มี 4 ชั้นหลัก

Memory

Hermes มี memory และ context files ที่ทำให้ agent รู้ว่าคุณเป็นใคร ชอบรับคำตอบแบบไหน โปรเจกต์สำคัญคืออะไร และอะไรควรจำข้าม session

ตรงนี้ไม่ควรขายเกินจริงนะครับ

Memory ไม่ได้แปลว่า AI จำทุกอย่างถูกต้องตลอดเวลา และไม่ใช่ทุก memory layer ถูกใช้ทุก turn

แต่ในเชิง operator มันแก้ปัญหาสำคัญมาก: ไม่ต้องเริ่มจากศูนย์ทุกครั้ง

Skills

งานที่ทำสำเร็จแล้วไม่ควรกลายเป็น prompt ที่หายไปในแชท

Hermes ใช้ skills เป็น procedural memory

ถ้าเคยแก้ปัญหาแบบหนึ่งสำเร็จ วิธีนั้นควรถูกเก็บเป็น playbook ที่เรียกใช้ซ้ำได้ และปรับปรุงได้เมื่อเจอ edge case ใหม่

นี่คือจุดที่ AI เริ่ม “เรียนงาน” เหมือนคนในทีมมากขึ้น

Cron

งานบางอย่างไม่ควรรอให้เราถาม

เช่น weekly briefing, daily monitor, lead scan, content queue check, system health report, payment follow-up, reminder ก่อน meeting

Hermes มี cron scheduling ที่ให้ agent กลับมาทำงานตามเวลา และส่งผลกลับไปยังช่องทางที่เราตั้งไว้

แต่ข้อแม้สำคัญคือ runtime ต้องออนไลน์

ถ้า laptop ปิดสนิทหรือ gateway ไม่ทำงาน งานก็ไม่ควรมาถึงแบบเวทมนตร์

ทางที่จริงจังคือรันบน VPS, server, sandbox, หรือ infrastructure ที่ถูกออกแบบให้เปิดอยู่

Tools and gateway

Agent ที่ทำงานจริงต้องมีมือมีตา

Hermes มี built-in tools, browser, web, terminal, file, image, TTS, MCP, และ messaging gateway หลาย platform

แปลว่าเราไม่จำเป็นต้องนั่งหน้า terminal เสมอไป เราคุยกับมันผ่าน Telegram หรือ Slack ได้ และให้มันทำงานบน machine หรือ cloud ที่กำหนดไว้ได้

ตรงนี้เป็นจุดที่ chatbot เริ่มกลายเป็น coworker runtime

3) ตัวอย่างที่ Aakash ยก: briefing, health coach, image workflow

Aakash ยก use case ไว้ 3 แบบ ซึ่งผมว่าเป็นตัวอย่างที่ดีมาก เพราะไม่ใช่ demo สวย ๆ แบบ launch video แต่เป็นงานที่มี pattern ซ้ำ

Weekly briefing

ตั้งครั้งเดียวให้ทุกอาทิตย์เช็ก calendar, weather, sports, flight prices แล้วส่งเข้ามือถือก่อนตื่น

ถ้าทำด้วย ChatGPT Tasks อย่างเดียว มันคือ prompt ที่ยิงตามเวลา

แต่ถ้าทำแบบ Hermes ที่มี memory และ skill loop งานควรค่อย ๆ ดีขึ้น เพราะระบบเริ่มรู้ว่า section ไหนสำคัญ, อะไรควรมาก่อน, อะไรไม่ต้องยาว, และ pattern ไหนของผู้ใช้ควรถูกเก็บไว้

นี่คือคำว่า compounding ที่จับต้องได้

Health coach

ผู้ใช้ text log ง่าย ๆ เช่น นอนกี่ชั่วโมง, วิ่งกี่นาที, วันที่ skip gym, วันที่ประชุมหนัก

พอสะสมหลายสัปดาห์ agent เริ่มเห็น pattern และเตือนก่อนวันที่มีแนวโน้มหลุด

ประเด็นไม่ใช่ health app ใหม่ ประเด็นคือ agent ที่รู้ context ส่วนตัวและกลับมาบอก insight ก่อนเราถาม

แต่ use case นี้ก็เสี่ยงเรื่อง privacy สูง ถ้าข้อมูลสุขภาพไปเข้า model cloud ต้องรู้ว่ากำลังส่งอะไรให้ใคร ถ้าต้องการ privacy มากขึ้น อาจต้องเลือก local model หรือควบคุม provider ให้ชัด

Image workflow from phone

Aakash ยกตัวอย่าง ComfyUI skill: ให้ Hermes รับคำสั่งจากมือถือ แล้วไปจัด workflow/run บนเครื่องของเราเอง

ประเด็นใหญ่คือ AI ไม่ได้อยู่แค่ในกล่องแชท มันกลายเป็น controller ที่คุยกับ tool จริงได้

สำหรับธุรกิจ ภาพเดียวกันนี้ใช้กับงานอื่นได้อีกเยอะ:

ดึง lead เข้า CRM
สรุป call note
ตรวจ content queue
ทำ report จาก spreadsheet
เช็ก ticket ที่ค้าง
เตือน invoice หรือ payment
ตรวจ page ก่อน publish

งานพวกนี้ไม่ต้องการ AI ที่พูดเก่งอย่างเดียว ต้องการ AI ที่รู้ขั้นตอนและทำซ้ำได้

4) ทำไม v0.16 Surface Release สำคัญ

source หลักของ Aakash เขียนก่อน Hermes v0.16 Surface Release แต่ข่าว v0.16 วันที่ 5 มิถุนายน 2026 ทำให้ภาพนี้ชัดขึ้นอีก

Release นี้เพิ่ม native desktop app, web dashboard/admin panel, remote gateway connection, Nous Portal quick setup, model picker ที่ใช้ง่ายขึ้น และ security hardening หลายจุด

แปลเป็นภาษาคนใช้งาน:

Hermes กำลังขยับจากเครื่องมือของคนสาย terminal ไปเป็น product surface ที่คนทั่วไปแตะได้มากขึ้น

นี่สำคัญมาก

เพราะ AI Agent ที่ดีแค่ใน terminal จะไปได้ไกลในกลุ่ม developer แต่จะยากกับธุรกิจทั่วไป

ถ้าจะให้เจ้าของกิจการ, marketer, ops, admin, sales, finance ใช้จริง มันต้องมี surface ที่คนอยู่กับมันได้

desktop, web dashboard, messaging, remote gateway จึงไม่ใช่ feature แต่มันคือสะพานจาก agent nerd tool ไปสู่ coworker system

5) บทเรียนสำหรับธุรกิจไทย: อย่าเริ่มจาก tool ให้เริ่มจากงานที่กลับมาพรุ่งนี้

ผมไม่คิดว่าคำตอบคือ “ทุกบริษัทต้องลง Hermes วันนี้”

คำตอบที่ถูกกว่าคือ ทุกบริษัทควรเริ่มถามว่า:

งานไหนในบริษัทควรมี AI ที่กลับมาทำต่อพรุ่งนี้ได้

ลองเช็กด้วย 5 คำถามนี้ครับ

1) งานนี้เกิดซ้ำไหม

ถ้าเกิดทุกวัน ทุกสัปดาห์ หรือทุกเดือน มีโอกาสทำเป็น agent workflow ได้

2) input ชัดไหม

เช่น calendar, inbox, CRM, spreadsheet, website, GitHub issue, LINE chat, payment record

3) output ตรวจได้ไหม

เช่น report, checklist, summary, draft, queue status, screenshot, source list

4) ต้องมี approval ตรงไหน

AI ควรร่างได้ สรุปได้ เตือนได้ แนะนำได้ แต่บาง action เช่น ส่งลูกค้า, publish, จ่ายเงิน, delete data ต้องให้คนกดอนุมัติ

5) ต้องจำอะไรข้ามวัน

ถ้างานต้องรู้ preference, prior decision, customer context, product rule, หรือ SOP เดิม แปลว่า memory และ skills เริ่มมีคุณค่า

ถ้าตอบ 5 ข้อนี้ได้ คุณจะเริ่มเห็นว่า AI Agent ไม่ใช่ของเล่น มันคือชั้น operating system ของงานซ้ำ ๆ

6) จุดที่ต้องระวัง: learning loop เรียนรู้ผิดได้

Aakash เขียนข้อจำกัดไว้ดีมาก และผมอยากย้ำ

Hermes หรือ agent runtime แบบนี้ไม่ได้แปลว่า “ปล่อย AI ทำเองได้หมด”

ข้อควรระวังมีอย่างน้อย 4 เรื่อง

Runtime ต้องอยู่จริง

ถ้าจะให้ agent ส่ง briefing ตอน 7 โมง มันต้องมี process ที่ทำงานอยู่จริง

จะเป็น laptop ที่ไม่ sleep, server, VPS, sandbox, หรือ cloud runtime ก็ได้ แต่ต้องออกแบบให้มันไม่หายไปพร้อมกับฝาพับ notebook

Memory ต้องมี hygiene

จำเยอะไม่ได้แปลว่าดี

จำผิด, จำของชั่วคราว, จำข้อมูลเก่า, หรือจำความชอบที่ไม่ควรถาวร อันตรายกว่าลืมด้วยซ้ำ

Memory ที่ดีต้องรู้ว่าอะไรควรเก็บ อะไรควรอยู่ในเอกสาร/wiki และอะไรควรทิ้ง

Tools ต้องมีสิทธิ์เท่าที่จำเป็น

ถ้า agent มีมือไปแตะระบบจริง ต้องมี permission, scope, approval, audit และ rollback

ไม่ใช่ให้ key ทุกอย่างแล้วหวังว่ามันจะสุภาพ

Proof ต้องมาก่อนคำว่า done

AI ที่ทำงานต่อเนื่องต้องแสดงหลักฐานเสมอ:

ดึง source จากไหน
แก้ไฟล์ไหน
test อะไร
ส่งอะไรไปแล้วหรือยังไม่ส่ง
blocker คืออะไร
ต้องให้คนตัดสินอะไร

ไม่มี proof ก็ยังไม่ควรเรียกว่าเสร็จ

7) มุม Data-Espresso: Hermes คือภาพตัวอย่างของ AI Coworker runtime

สำหรับผม Hermes สำคัญเพราะมันทำให้คำว่า AI Coworker ชัดขึ้น

ไม่ใช่คนเสมือนที่คุยเก่ง ไม่ใช่ avatar ไม่ใช่ chatbot ที่ใส่ชื่อบริษัท

แต่เป็น runtime ที่มีบ้าน มีความจำ มีเครื่องมือ มี skill มี schedule และมีช่องทางสื่อสารกับคนจริง

นี่คือเหตุผลที่ OPB Stack ของ Data-Espresso วางแนวคิด sandbox/VPS/workspace ไว้ด้วย

ถ้าจะให้ AI ทำงานต่อเนื่อง มันต้องมีที่อยู่ของมัน มี environment ของมัน มี data boundary ของมัน มี approval gate ของมัน และมี proof log ของมัน

ถ้าอยากเห็นภาพแบบ managed sandbox สำหรับ AI coworker ในบริบทธุรกิจไทย ดูต่อได้ที่ OPB Stack ครับ

Hermes เป็นหนึ่งในภาพที่ชัดมากของแนวทางนี้

ธุรกิจไทยที่ยังเริ่มจาก “จะใช้ model อะไรดี” อาจถามใหม่ได้ว่า:

เราจะให้ AI กลับมาทำงานอะไรซ้ำ ๆ โดยปลอดภัย และมีคนตรวจตรงไหน

ถ้าตอบคำถามนี้ได้ การเลือก model หรือ tool จะง่ายขึ้นเยอะ

สรุป

Hermes Agent ไม่ได้น่าสนใจเพราะมันมี feature เยอะ

มันน่าสนใจเพราะมันทำให้เราเห็นรูปทรงใหม่ของ AI ในงานจริง

จาก AI ที่ตอบเมื่อเราถาม ไปเป็น AI ที่จำบริบท, ใช้ procedure, แตะเครื่องมือ, กลับมาตามเวลา, และส่งงานกลับมาหาเราในช่องทางที่เราใช้จริง

แต่พลังแบบนี้ต้องมาคู่กับขอบเขต

sandbox, permission, approval, proof, memory hygiene และ runtime ที่ไม่ดับกลางทาง

ถ้าธุรกิจยังมอง AI เป็นช่องแชทหนึ่งช่อง ก็จะได้คำตอบเก่งขึ้น

แต่ถ้ามอง AI เป็น coworker runtime ที่กลับมาทำงานพรุ่งนี้ได้ เราจะเริ่มออกแบบงานใหม่ได้จริงครับ

อ่านแล้ว: 47

Deep Dive: Hermes Agent ที่กลับมาทำงานพรุ่งนี้