- 4
- มิถุนายน
13 คำศัพท์พื้นฐานของ Claude/LLM ที่ทีมในองค์กร — ตั้งแต่ผู้บริหารถึง dev — ควรเข้าใจร่วมกันก่อนตัดสินใจซื้อ: กลุ่มพื้นฐาน (LLM · Pretraining · Fine-tuning · Tokens · Context Window), การตอบและ tuning ที่กระทบ UX (Temperature · Latency · TTFT), หลักการของ Anthropic (HHH · RLHF), และการเชื่อม Claude เข้าระบบในองค์กร (MCP · MCP Connector · RAG) — บทความนี้เป็น Thai original อิงแนวคิดจากเอกสาร Anthropic + เติม Thai context ที่เกี่ยวกับองค์กรไทย (ราคา · ภาษา · compliance · use case จริง)
กลุ่ม 1 / 4 — พื้นฐาน LLM: Claude คืออะไร ทำงานอย่างไร
LLM Large Language Model
โมเดล AI ขนาดใหญ่ที่เรียนรู้จาก text จำนวนมหาศาล สามารถเขียน-ตอบ-สรุป-แปล-เขียนโค้ดได้ในระดับใกล้เคียงคน · Claude คือ LLM ตัวหนึ่ง ผ่าน pretraining + fine-tuning + RLHF มาจน "พูดคุยได้" และเป็น "ผู้ช่วย" ไม่ใช่แค่ wordbox
ในตลาดปี 2026 LLM เชิงพาณิชย์หลัก: Claude (Anthropic) · ChatGPT (OpenAI) · Gemini (Google) · Llama (Meta, open-weight) · ฝั่งจีนมี DeepSeek, Qwen ฯลฯ — แต่ละค่ายมีจุดแข็งต่างกัน อ่านเปรียบเทียบที่ ChatGPT vs Claude vs Gemini
Pretraining
ขั้นตอนแรกของการสอน LLM — ป้อน text มหาศาลให้ model เรียน "ทำนายคำต่อไป" ซ้ำๆ จนเข้าใจ pattern ของภาษา · ผลลัพธ์: model ที่ "รู้ภาษา" แต่ ยังไม่เก่งทำตามคำสั่ง ต้องผ่าน fine-tuning + RLHF ต่อจึงจะเป็น "assistant"
THAI CONTEXTClaude pretrain ด้วย Thai text ในปริมาณที่มาก = เก่งภาษาไทยตั้งแต่ "base" — ไม่ใช่ติด add-on ทีหลัง · จึงเข้าใจบริบทไทยได้ดีกว่า LLM ที่ pretrain ด้วยอังกฤษเป็นหลักแล้วค่อย translate
Fine-tuning การปรับแต่งโมเดล
การ train โมเดลที่ pretrain แล้ว ต่อด้วย dataset เฉพาะทาง เพื่อให้โมเดล "เลียนแบบ" pattern ของ data ใหม่ · Claude ที่เราใช้กันคือ Claude ที่ผ่าน fine-tuning มาเป็น helpful assistant แล้ว ไม่ใช่ raw pretrained model
Anthropic API ปัจจุบันไม่เปิดให้ลูกค้า fine-tune Claude (ต่างจาก OpenAI ที่เปิด fine-tuning ของ GPT) — ถ้าสนใจต้องคุยกับ Anthropic sales · ทางเลือกที่นิยมกว่า: ใช้ RAG (อ่านต่อด้านล่าง) + Prompt engineering — ส่วนใหญ่เพียงพอ ไม่ต้อง fine-tune
THAI CONTEXTลูกค้าไทยที่อยากให้ Claude "เก่งเรื่องเฉพาะ" (เช่น กฎหมายไทย · SOP องค์กร · product catalog) — เริ่มที่ RAG เสมอ ก่อน · ปลอดภัยกว่า · ไม่เปลี่ยน behavior ของ base model · update ข้อมูลได้ทันที (ดู RAG ด้านล่าง)
Tokens โทเค็น
หน่วยย่อยที่ LLM ใช้ประมวลผล · 1 token อาจเป็น 1 คำ, ส่วนของคำ, หรือตัวอักษร · สำหรับภาษาอังกฤษ 1 token ≈ 3.5 ตัวอักษร (≈ 0.75 คำ)
ทำไมต้องสนใจ token:
- Billing — Claude API คิดค่าใช้จ่ายเป็น token (input + output)
- Context window — มี limit เป็น token ไม่ใช่ตัวอักษร
- Performance — prompt ยาว = ช้าและแพง
THAI CONTEXTภาษาไทยใช้ token มากกว่าภาษาอังกฤษต่อความหมายเดียวกัน — เพราะ tokenizer ของ Anthropic ไม่ได้ optimize สำหรับไทยเหมือนอังกฤษ ประมาณ: ข้อความไทย 1,000 ตัวอักษร ≈ 400–600 tokens (อังกฤษ 1,000 ตัวอักษร ≈ 250 tokens) → cost ของ Claude สำหรับ workload ไทยจะสูงกว่าอังกฤษ ~1.5–2 เท่าต่อเนื้อหาเทียบเท่ากัน · ลูกค้าไทยที่จะใช้ Claude API ปริมาณมาก ควรคำนวณ budget ด้วย token ratio ที่จริง
Context Window หน้าต่างบริบท
"พื้นที่จดจำชั่วคราว" ของ LLM ขณะตอบ — ไม่ใช่ data ที่ใช้ train แต่เป็น "working memory" ของแต่ละการสนทนา · context window ใหญ่ = อ่านเอกสารยาวๆ ได้ทีเดียว, ใช้ history ยาวได้, รักษา coherence ได้ดี
Claude Opus 4.7 มี context window 200K+ tokens = อ่านสัญญายาวร้อยหน้าได้ในครั้งเดียว · เป็นจุดต่างหลักจาก LLM เก่าๆ ที่ใหญ่แค่ 8K-32K · เปรียบเทียบ: GPT-4 context window 128K · Gemini 1M (ใหญ่สุดในตลาด แต่ pricing/quality trade-off)
หมายเหตุ: context window ใหญ่ไม่ได้แปลว่า "จำได้ตลอดการสนทนา" — ทุก call ต้องส่ง history เต็มไปด้วยทุกครั้ง (Claude API stateless) · อ่านต่อที่ Claude ZDR — ทำไม API stateless ต้องเก็บ context เอง
กลุ่ม 2 / 4 — การตอบและ Tuning ที่กระทบ UX
Temperature
Parameter ที่คุม "ความสุ่ม" ของคำตอบ — ค่าสูง → คำตอบหลากหลาย เรียกความคิดสร้างสรรค์ · ค่าต่ำ → คำตอบเสถียร ตรงประเด็น · range ทั่วไป 0–1 (บางครั้ง 0–2)
หมายเหตุสำคัญ: แม้ตั้ง temperature=0 ก็ไม่ deterministic 100% — input เดียวกันอาจได้ output ไม่เหมือนเดิม ถ้าต้องการ deterministic จริงต้องวาง infrastructure เพิ่ม (caching, seed) — Anthropic ระบุข้อจำกัดนี้ไว้ในเอกสาร
THAI CONTEXTลูกค้า Enterprise/ภาครัฐที่ต้องการ "consistency" สำหรับ compliance audit — temp=0 ไม่พอ ต้องเพิ่ม caching/RAG/snapshot ของ output · ส่วนงาน creative writing / marketing → ใช้ temp 0.7–1.0 ก็เปิดไอเดียกว้าง
Latency เวลาตอบกลับ
เวลาทั้งหมดตั้งแต่ส่ง prompt จนได้ output เต็ม · สำคัญสำหรับ chatbot, agent, real-time app · ปัจจัย: ขนาดโมเดล, hardware, network, ความยาว prompt/response
THAI CONTEXTAnthropic infrastructure อยู่ที่สหรัฐฯ default — latency จากไทย ≈ 150–250ms (round-trip) · ถ้าใช้ผ่าน AWS Bedrock APAC (Singapore) latency ลด ~50–100ms · สำหรับ realtime UX (chat แบบ live, voice) ทุก 100ms มีผล UX
TTFT Time to First Token
เวลาตั้งแต่ส่ง prompt จน Claude เริ่ม "พิมพ์" คำแรก · ต่างจาก latency รวม (TTFT = เริ่ม, latency = จบ) · UX สำคัญ — ผู้ใช้เห็น "Claude เริ่มตอบแล้ว" เร็ว = รู้สึกดี แม้ response เต็มจะใช้เวลาอีก 5 วินาที
ปัจจัยที่กระทบ TTFT: ขนาดโมเดล (Opus ช้ากว่า Haiku) · prompt ความซับซ้อน · cache hit (ดู prompt caching ในเอกสาร Anthropic)
กลุ่ม 3 / 4 — หลักการของ Anthropic: ทำไม Claude ต่างจาก LLM อื่น
HHH Helpful, Honest, Harmless
กรอบ 3 H ที่ Anthropic ใช้เป็นเป้าหมายในการ train Claude เป็น "framework เฉพาะของ Anthropic" ที่บริษัทอื่นไม่ได้ใช้คำนี้:
- Helpful (เป็นประโยชน์) — Claude พยายามทำงาน/ตอบให้ได้ดีที่สุดในขอบเขตที่ทำได้
- Honest (ซื่อสัตย์) — ตอบความจริง ไม่ hallucinate / confabulate ยอมรับว่าไม่รู้เมื่อไม่รู้
- Harmless (ไม่ทำอันตราย) — ไม่เลือกปฏิบัติ, ปฏิเสธคำขอที่อันตราย/ผิดจริยธรรม พร้อมอธิบาย
Anthropic ลงทุนหนักในงานวิจัย Constitutional AI — แทนที่จะให้คน label ทุก output ใช้ "หลักการ" (constitution) ให้ Claude วัดตัวเอง · นี่เป็นจุดต่างของ Claude vs ChatGPT/Gemini ที่ฝ่าย risk/compliance ใช้พิจารณาเลือก vendor
THAI CONTEXTผู้บริหารและฝ่ายกฎหมายไทยที่ห่วงเรื่อง AI ตอบมั่ว / ตอบคำถามที่ละเอียดอ่อน — HHH เป็นเหตุผลทางเทคนิคที่ใช้ตอบคำถาม "ทำไมเลือก Claude" ได้ชัด · ปกติ Claude จะปฏิเสธคำถามที่เสี่ยง explicit (ลามก/อาวุธ/medical advice ฯลฯ) มากกว่า LLM ค่ายอื่น
RLHF Reinforcement Learning from Human Feedback
เทคนิคที่ให้ "ความคิดเห็นของคน" สอน model ให้ตอบในแบบที่คนชอบ · วิธี: ให้คน rank output 2+ ตัวจาก model → model เรียนรู้ที่จะตอบใกล้กับของที่คน rank สูง · เป็นเทคนิคหลักที่ Claude ใช้ปรับ behavior หลัง pretraining
Claude (และ ChatGPT, Gemini) ทั้งหมดใช้ RLHF เป็นแกนหลัก — ผลคือ AI ที่ "พูดคุยได้" ไม่ใช่ "ทำนายข้อความถัดไป" แบบดิบๆ · งานวิจัยต้นทาง: Anthropic's RLHF paper (arxiv)
กลุ่ม 4 / 4 — การเชื่อม Claude เข้าระบบในองค์กร
MCP Model Context Protocol
Protocol เปิดที่ Anthropic ริเริ่มในปี 2024 สำหรับให้ application ส่ง context (data, tools, services) ให้ LLM ในรูปแบบมาตรฐาน · เปรียบเหมือน "USB-C ของ AI" — เสียบกับอะไรก็ได้
Use case ในองค์กร: เชื่อม Claude เข้า database ภายใน, file storage, ERP, helpdesk, CRM — โดยไม่ต้องเขียน integration ตัวเอง ใช้ MCP server ที่มีอยู่ (community + Anthropic + third-party)
อ่านบทความเฉพาะที่ Claude MCP — Model Context Protocol สำหรับองค์กร
MCP Connector
Feature ใน Claude Messages API ที่ให้ลูกค้าเชื่อม MCP server ได้โดยไม่ต้องเขียน MCP client เอง · ส่งคำขอผ่าน API ปกติ + ระบุ MCP server endpoint ก็พอ · รองรับ tool calling · ปัจจุบันเป็น beta
THAI CONTEXTDev team ไทยที่อยาก integrate Claude เข้าระบบในองค์กรเร็วๆ — MCP connector ลด integration time จาก "ออกแบบ MCP client เอง" เหลือ "เรียก API ปกติ" · เหมาะกับ pilot/proof-of-concept ก่อนลงทุนทำ integration เต็ม
RAG Retrieval Augmented Generation
เทคนิคให้ LLM "ค้น" ข้อมูลจากแหล่งภายนอก ก่อนตอบ · ทำงาน: ผู้ใช้ถามคำถาม → ระบบค้น relevant chunk จาก database (vector DB / knowledge base) → ส่ง chunks นั้นเข้า context window พร้อม prompt → Claude อ่านและตอบโดยอ้างอิงข้อมูล
ประโยชน์:
- ตอบด้วยข้อมูลล่าสุด/เฉพาะองค์กร โดยไม่ต้อง fine-tune
- update ข้อมูลได้ทันที (แค่แก้ใน database)
- อ้างอิงได้ (citation) — บอกว่าตอบจากเอกสารไหน
- ลด hallucination เพราะ ground truth อยู่ใน context
THAI CONTEXTRAG = ทางเลือกอันดับ 1 สำหรับลูกค้าไทยที่อยากให้ Claude "เก่งเรื่ององค์กรตัวเอง" เช่น SOP, HR policy, product catalog, ระบบราชการเฉพาะ · เก็บข้อมูลใน vector DB (pgvector, Pinecone, Weaviate ฯลฯ) · ปลอดภัยกว่า fine-tune เพราะ data ไม่เข้า model · update ได้ตลอดเวลา · Grand Linux ช่วยออกแบบ RAG architecture + integration ได้
สรุป
13 คำศัพท์นี้คือ "คำพื้นฐาน" ที่ทำให้ทีมในองค์กรพูดภาษาเดียวกันเรื่อง Claude — ผู้บริหารเข้าใจ Helpful/Honest/Harmless ในระดับ governance · ทีม IT เข้าใจ context window / RAG / MCP ในระดับ architecture · ทีมจัดซื้อเข้าใจ tokens ในระดับ budget · ทีมกฎหมายเข้าใจ pretraining/fine-tuning ในระดับ compliance
ถ้าทีมขององค์กรเข้าใจคำเหล่านี้ตรงกัน การตัดสินใจซื้อ Claude จะคล่องและถูกต้องขึ้น — ไม่ต้องมี "คนแปล" ระหว่าง dev กับ procurement กับ legal · ต่อยอด: อ่าน ราคา Claude AI ทุกแพ็กเกจ และ Claude Enterprise
คำศัพท์ AI ไม่ใช่เรื่องของ dev อย่างเดียว — เมื่อผู้บริหาร ฝ่ายจัดซื้อ และฝ่ายกฎหมายเข้าใจคำเดียวกัน การตัดสินใจเรื่อง Claude ในองค์กรจะเร็วและแม่นยำขึ้นมาก
- ทีมงาน Saeree ERP
📖 แหล่งอ้างอิง
คำจำกัดความของ LLM, Tokens, Context Window, Temperature, Latency, TTFT, Pretraining, Fine-tuning, RLHF, RAG เป็นแนวคิดมาตรฐานในวงการ AI/NLP อ้างอิงจากตำราเรียนและงานวิจัยจำนวนมาก · HHH (Helpful/Honest/Harmless) และ MCP (Model Context Protocol) เป็นกรอบที่ Anthropic ริเริ่ม — ดูเอกสารต้นทางที่ Anthropic Claude API Glossary · งานวิจัย Constitutional AI ของ Anthropic: Constitutional AI: Harmlessness from AI Feedback · งานวิจัย RLHF: Training a Helpful and Harmless Assistant with RLHF
บทความนี้เป็น Thai original ของ Grand Linux Solution — เขียนจากความเข้าใจในแนวคิดเหล่านี้ + เติม Thai context (ราคา · ภาษา · compliance · use case ในองค์กรไทย) ไม่ใช่การแปลเอกสาร Anthropic ตรงตัว
หมายเหตุ: ข้อมูลเชิงเทคนิค (context window size · token ratio · API features) อ้างอิงสภาพปี 2026 อาจเปลี่ยนเมื่อ Anthropic อัปเดต · ตรวจสอบกับเอกสาร Anthropic เป็นทางการก่อนตัดสินใจระดับ contract
