AI Glossary สำหรับองค์กรไทย

4
มิถุนายน

13 คำศัพท์พื้นฐานของ Claude/LLM ที่ทีมในองค์กร — ตั้งแต่ผู้บริหารถึง dev — ควรเข้าใจร่วมกันก่อนตัดสินใจซื้อ: กลุ่มพื้นฐาน (LLM · Pretraining · Fine-tuning · Tokens · Context Window), การตอบและ tuning ที่กระทบ UX (Temperature · Latency · TTFT), หลักการของ Anthropic (HHH · RLHF), และการเชื่อม Claude เข้าระบบในองค์กร (MCP · MCP Connector · RAG) — บทความนี้เป็น Thai original อิงแนวคิดจากเอกสาร Anthropic + เติม Thai context ที่เกี่ยวกับองค์กรไทย (ราคา · ภาษา · compliance · use case จริง)

กลุ่ม 1 / 4 — พื้นฐาน LLM: Claude คืออะไร ทำงานอย่างไร

LLM Large Language Model

โมเดล AI ขนาดใหญ่ที่เรียนรู้จาก text จำนวนมหาศาล สามารถเขียน-ตอบ-สรุป-แปล-เขียนโค้ดได้ในระดับใกล้เคียงคน · Claude คือ LLM ตัวหนึ่ง ผ่าน pretraining + fine-tuning + RLHF มาจน "พูดคุยได้" และเป็น "ผู้ช่วย" ไม่ใช่แค่ wordbox

ในตลาดปี 2026 LLM เชิงพาณิชย์หลัก: Claude (Anthropic) · ChatGPT (OpenAI) · Gemini (Google) · Llama (Meta, open-weight) · ฝั่งจีนมี DeepSeek, Qwen ฯลฯ — แต่ละค่ายมีจุดแข็งต่างกัน อ่านเปรียบเทียบที่ ChatGPT vs Claude vs Gemini

Pretraining

ขั้นตอนแรกของการสอน LLM — ป้อน text มหาศาลให้ model เรียน "ทำนายคำต่อไป" ซ้ำๆ จนเข้าใจ pattern ของภาษา · ผลลัพธ์: model ที่ "รู้ภาษา" แต่ ยังไม่เก่งทำตามคำสั่ง ต้องผ่าน fine-tuning + RLHF ต่อจึงจะเป็น "assistant"

THAI CONTEXTClaude pretrain ด้วย Thai text ในปริมาณที่มาก = เก่งภาษาไทยตั้งแต่ "base" — ไม่ใช่ติด add-on ทีหลัง · จึงเข้าใจบริบทไทยได้ดีกว่า LLM ที่ pretrain ด้วยอังกฤษเป็นหลักแล้วค่อย translate

Fine-tuning การปรับแต่งโมเดล

การ train โมเดลที่ pretrain แล้ว ต่อด้วย dataset เฉพาะทาง เพื่อให้โมเดล "เลียนแบบ" pattern ของ data ใหม่ · Claude ที่เราใช้กันคือ Claude ที่ผ่าน fine-tuning มาเป็น helpful assistant แล้ว ไม่ใช่ raw pretrained model

Anthropic API ปัจจุบันไม่เปิดให้ลูกค้า fine-tune Claude (ต่างจาก OpenAI ที่เปิด fine-tuning ของ GPT) — ถ้าสนใจต้องคุยกับ Anthropic sales · ทางเลือกที่นิยมกว่า: ใช้ RAG (อ่านต่อด้านล่าง) + Prompt engineering — ส่วนใหญ่เพียงพอ ไม่ต้อง fine-tune

THAI CONTEXTลูกค้าไทยที่อยากให้ Claude "เก่งเรื่องเฉพาะ" (เช่น กฎหมายไทย · SOP องค์กร · product catalog) — เริ่มที่ RAG เสมอ ก่อน · ปลอดภัยกว่า · ไม่เปลี่ยน behavior ของ base model · update ข้อมูลได้ทันที (ดู RAG ด้านล่าง)

Tokens โทเค็น

หน่วยย่อยที่ LLM ใช้ประมวลผล · 1 token อาจเป็น 1 คำ, ส่วนของคำ, หรือตัวอักษร · สำหรับภาษาอังกฤษ 1 token ≈ 3.5 ตัวอักษร (≈ 0.75 คำ)

ทำไมต้องสนใจ token:

Billing — Claude API คิดค่าใช้จ่ายเป็น token (input + output)
Context window — มี limit เป็น token ไม่ใช่ตัวอักษร
Performance — prompt ยาว = ช้าและแพง

THAI CONTEXTภาษาไทยใช้ token มากกว่าภาษาอังกฤษต่อความหมายเดียวกัน — เพราะ tokenizer ของ Anthropic ไม่ได้ optimize สำหรับไทยเหมือนอังกฤษ ประมาณ: ข้อความไทย 1,000 ตัวอักษร ≈ 400–600 tokens (อังกฤษ 1,000 ตัวอักษร ≈ 250 tokens) → cost ของ Claude สำหรับ workload ไทยจะสูงกว่าอังกฤษ ~1.5–2 เท่าต่อเนื้อหาเทียบเท่ากัน · ลูกค้าไทยที่จะใช้ Claude API ปริมาณมาก ควรคำนวณ budget ด้วย token ratio ที่จริง

Context Window หน้าต่างบริบท

"พื้นที่จดจำชั่วคราว" ของ LLM ขณะตอบ — ไม่ใช่ data ที่ใช้ train แต่เป็น "working memory" ของแต่ละการสนทนา · context window ใหญ่ = อ่านเอกสารยาวๆ ได้ทีเดียว, ใช้ history ยาวได้, รักษา coherence ได้ดี

Claude Opus 4.7 มี context window 200K+ tokens = อ่านสัญญายาวร้อยหน้าได้ในครั้งเดียว · เป็นจุดต่างหลักจาก LLM เก่าๆ ที่ใหญ่แค่ 8K-32K · เปรียบเทียบ: GPT-4 context window 128K · Gemini 1M (ใหญ่สุดในตลาด แต่ pricing/quality trade-off)

หมายเหตุ: context window ใหญ่ไม่ได้แปลว่า "จำได้ตลอดการสนทนา" — ทุก call ต้องส่ง history เต็มไปด้วยทุกครั้ง (Claude API stateless) · อ่านต่อที่ Claude ZDR — ทำไม API stateless ต้องเก็บ context เอง

กลุ่ม 2 / 4 — การตอบและ Tuning ที่กระทบ UX

Temperature

Parameter ที่คุม "ความสุ่ม" ของคำตอบ — ค่าสูง → คำตอบหลากหลาย เรียกความคิดสร้างสรรค์ · ค่าต่ำ → คำตอบเสถียร ตรงประเด็น · range ทั่วไป 0–1 (บางครั้ง 0–2)

หมายเหตุสำคัญ: แม้ตั้ง temperature=0 ก็ไม่ deterministic 100% — input เดียวกันอาจได้ output ไม่เหมือนเดิม ถ้าต้องการ deterministic จริงต้องวาง infrastructure เพิ่ม (caching, seed) — Anthropic ระบุข้อจำกัดนี้ไว้ในเอกสาร

THAI CONTEXTลูกค้า Enterprise/ภาครัฐที่ต้องการ "consistency" สำหรับ compliance audit — temp=0 ไม่พอ ต้องเพิ่ม caching/RAG/snapshot ของ output · ส่วนงาน creative writing / marketing → ใช้ temp 0.7–1.0 ก็เปิดไอเดียกว้าง

Latency เวลาตอบกลับ

เวลาทั้งหมดตั้งแต่ส่ง prompt จนได้ output เต็ม · สำคัญสำหรับ chatbot, agent, real-time app · ปัจจัย: ขนาดโมเดล, hardware, network, ความยาว prompt/response

THAI CONTEXTAnthropic infrastructure อยู่ที่สหรัฐฯ default — latency จากไทย ≈ 150–250ms (round-trip) · ถ้าใช้ผ่าน AWS Bedrock APAC (Singapore) latency ลด ~50–100ms · สำหรับ realtime UX (chat แบบ live, voice) ทุก 100ms มีผล UX

TTFT Time to First Token

เวลาตั้งแต่ส่ง prompt จน Claude เริ่ม "พิมพ์" คำแรก · ต่างจาก latency รวม (TTFT = เริ่ม, latency = จบ) · UX สำคัญ — ผู้ใช้เห็น "Claude เริ่มตอบแล้ว" เร็ว = รู้สึกดี แม้ response เต็มจะใช้เวลาอีก 5 วินาที

ปัจจัยที่กระทบ TTFT: ขนาดโมเดล (Opus ช้ากว่า Haiku) · prompt ความซับซ้อน · cache hit (ดู prompt caching ในเอกสาร Anthropic)

กลุ่ม 3 / 4 — หลักการของ Anthropic: ทำไม Claude ต่างจาก LLM อื่น

HHH Helpful, Honest, Harmless

กรอบ 3 H ที่ Anthropic ใช้เป็นเป้าหมายในการ train Claude เป็น "framework เฉพาะของ Anthropic" ที่บริษัทอื่นไม่ได้ใช้คำนี้:

Helpful (เป็นประโยชน์) — Claude พยายามทำงาน/ตอบให้ได้ดีที่สุดในขอบเขตที่ทำได้
Honest (ซื่อสัตย์) — ตอบความจริง ไม่ hallucinate / confabulate ยอมรับว่าไม่รู้เมื่อไม่รู้
Harmless (ไม่ทำอันตราย) — ไม่เลือกปฏิบัติ, ปฏิเสธคำขอที่อันตราย/ผิดจริยธรรม พร้อมอธิบาย

Anthropic ลงทุนหนักในงานวิจัย Constitutional AI — แทนที่จะให้คน label ทุก output ใช้ "หลักการ" (constitution) ให้ Claude วัดตัวเอง · นี่เป็นจุดต่างของ Claude vs ChatGPT/Gemini ที่ฝ่าย risk/compliance ใช้พิจารณาเลือก vendor

THAI CONTEXTผู้บริหารและฝ่ายกฎหมายไทยที่ห่วงเรื่อง AI ตอบมั่ว / ตอบคำถามที่ละเอียดอ่อน — HHH เป็นเหตุผลทางเทคนิคที่ใช้ตอบคำถาม "ทำไมเลือก Claude" ได้ชัด · ปกติ Claude จะปฏิเสธคำถามที่เสี่ยง explicit (ลามก/อาวุธ/medical advice ฯลฯ) มากกว่า LLM ค่ายอื่น

RLHF Reinforcement Learning from Human Feedback

เทคนิคที่ให้ "ความคิดเห็นของคน" สอน model ให้ตอบในแบบที่คนชอบ · วิธี: ให้คน rank output 2+ ตัวจาก model → model เรียนรู้ที่จะตอบใกล้กับของที่คน rank สูง · เป็นเทคนิคหลักที่ Claude ใช้ปรับ behavior หลัง pretraining

Claude (และ ChatGPT, Gemini) ทั้งหมดใช้ RLHF เป็นแกนหลัก — ผลคือ AI ที่ "พูดคุยได้" ไม่ใช่ "ทำนายข้อความถัดไป" แบบดิบๆ · งานวิจัยต้นทาง: Anthropic's RLHF paper (arxiv)

กลุ่ม 4 / 4 — การเชื่อม Claude เข้าระบบในองค์กร

MCP Model Context Protocol

Protocol เปิดที่ Anthropic ริเริ่มในปี 2024 สำหรับให้ application ส่ง context (data, tools, services) ให้ LLM ในรูปแบบมาตรฐาน · เปรียบเหมือน "USB-C ของ AI" — เสียบกับอะไรก็ได้

Use case ในองค์กร: เชื่อม Claude เข้า database ภายใน, file storage, ERP, helpdesk, CRM — โดยไม่ต้องเขียน integration ตัวเอง ใช้ MCP server ที่มีอยู่ (community + Anthropic + third-party)

อ่านบทความเฉพาะที่ Claude MCP — Model Context Protocol สำหรับองค์กร

MCP Connector

Feature ใน Claude Messages API ที่ให้ลูกค้าเชื่อม MCP server ได้โดยไม่ต้องเขียน MCP client เอง · ส่งคำขอผ่าน API ปกติ + ระบุ MCP server endpoint ก็พอ · รองรับ tool calling · ปัจจุบันเป็น beta

THAI CONTEXTDev team ไทยที่อยาก integrate Claude เข้าระบบในองค์กรเร็วๆ — MCP connector ลด integration time จาก "ออกแบบ MCP client เอง" เหลือ "เรียก API ปกติ" · เหมาะกับ pilot/proof-of-concept ก่อนลงทุนทำ integration เต็ม

RAG Retrieval Augmented Generation

เทคนิคให้ LLM "ค้น" ข้อมูลจากแหล่งภายนอก ก่อนตอบ · ทำงาน: ผู้ใช้ถามคำถาม → ระบบค้น relevant chunk จาก database (vector DB / knowledge base) → ส่ง chunks นั้นเข้า context window พร้อม prompt → Claude อ่านและตอบโดยอ้างอิงข้อมูล

ประโยชน์:

ตอบด้วยข้อมูลล่าสุด/เฉพาะองค์กร โดยไม่ต้อง fine-tune
update ข้อมูลได้ทันที (แค่แก้ใน database)
อ้างอิงได้ (citation) — บอกว่าตอบจากเอกสารไหน
ลด hallucination เพราะ ground truth อยู่ใน context

THAI CONTEXTRAG = ทางเลือกอันดับ 1 สำหรับลูกค้าไทยที่อยากให้ Claude "เก่งเรื่ององค์กรตัวเอง" เช่น SOP, HR policy, product catalog, ระบบราชการเฉพาะ · เก็บข้อมูลใน vector DB (pgvector, Pinecone, Weaviate ฯลฯ) · ปลอดภัยกว่า fine-tune เพราะ data ไม่เข้า model · update ได้ตลอดเวลา · Grand Linux ช่วยออกแบบ RAG architecture + integration ได้

สรุป

13 คำศัพท์นี้คือ "คำพื้นฐาน" ที่ทำให้ทีมในองค์กรพูดภาษาเดียวกันเรื่อง Claude — ผู้บริหารเข้าใจ Helpful/Honest/Harmless ในระดับ governance · ทีม IT เข้าใจ context window / RAG / MCP ในระดับ architecture · ทีมจัดซื้อเข้าใจ tokens ในระดับ budget · ทีมกฎหมายเข้าใจ pretraining/fine-tuning ในระดับ compliance

ถ้าทีมขององค์กรเข้าใจคำเหล่านี้ตรงกัน การตัดสินใจซื้อ Claude จะคล่องและถูกต้องขึ้น — ไม่ต้องมี "คนแปล" ระหว่าง dev กับ procurement กับ legal · ต่อยอด: อ่าน ราคา Claude AI ทุกแพ็กเกจ และ Claude Enterprise

คำศัพท์ AI ไม่ใช่เรื่องของ dev อย่างเดียว — เมื่อผู้บริหาร ฝ่ายจัดซื้อ และฝ่ายกฎหมายเข้าใจคำเดียวกัน การตัดสินใจเรื่อง Claude ในองค์กรจะเร็วและแม่นยำขึ้นมาก
- ทีมงาน Saeree ERP

📖 แหล่งอ้างอิง

คำจำกัดความของ LLM, Tokens, Context Window, Temperature, Latency, TTFT, Pretraining, Fine-tuning, RLHF, RAG เป็นแนวคิดมาตรฐานในวงการ AI/NLP อ้างอิงจากตำราเรียนและงานวิจัยจำนวนมาก · HHH (Helpful/Honest/Harmless) และ MCP (Model Context Protocol) เป็นกรอบที่ Anthropic ริเริ่ม — ดูเอกสารต้นทางที่ Anthropic Claude API Glossary · งานวิจัย Constitutional AI ของ Anthropic: Constitutional AI: Harmlessness from AI Feedback · งานวิจัย RLHF: Training a Helpful and Harmless Assistant with RLHF

บทความนี้เป็น Thai original ของ Grand Linux Solution — เขียนจากความเข้าใจในแนวคิดเหล่านี้ + เติม Thai context (ราคา · ภาษา · compliance · use case ในองค์กรไทย) ไม่ใช่การแปลเอกสาร Anthropic ตรงตัว

หมายเหตุ: ข้อมูลเชิงเทคนิค (context window size · token ratio · API features) อ้างอิงสภาพปี 2026 อาจเปลี่ยนเมื่อ Anthropic อัปเดต · ตรวจสอบกับเอกสาร Anthropic เป็นทางการก่อนตัดสินใจระดับ contract

กลุ่ม 1 / 4 — พื้นฐาน LLM: Claude คืออะไร ทำงานอย่างไร

LLM Large Language Model

Pretraining

Fine-tuning การปรับแต่งโมเดล

Tokens โทเค็น

Context Window หน้าต่างบริบท

กลุ่ม 2 / 4 — การตอบและ Tuning ที่กระทบ UX

Temperature

Latency เวลาตอบกลับ

TTFT Time to First Token

กลุ่ม 3 / 4 — หลักการของ Anthropic: ทำไม Claude ต่างจาก LLM อื่น

HHH Helpful, Honest, Harmless

RLHF Reinforcement Learning from Human Feedback

กลุ่ม 4 / 4 — การเชื่อม Claude เข้าระบบในองค์กร

MCP Model Context Protocol

MCP Connector

RAG Retrieval Augmented Generation

สรุป

📖 แหล่งอ้างอิง

อยากใช้ Claude ในองค์กร แต่ทีมยังไม่เข้าใจ AI เพียงพอ?

ต้องการซื้อ Claude สำหรับองค์กรในไทย?

เกี่ยวกับผู้เขียน

สุรีระยา ลิ้มไพบูลย์

เกี่ยวกับ Saeree ERP

โซลูชั่น

แหล่งข้อมูล

ติดต่อเรา

AI Glossary สำหรับองค์กรไทย

กลุ่ม 1 / 4 — พื้นฐาน LLM: Claude คืออะไร ทำงานอย่างไร

LLM Large Language Model

Pretraining

Fine-tuning การปรับแต่งโมเดล

Tokens โทเค็น

Context Window หน้าต่างบริบท

กลุ่ม 2 / 4 — การตอบและ Tuning ที่กระทบ UX

Temperature

Latency เวลาตอบกลับ

TTFT Time to First Token

กลุ่ม 3 / 4 — หลักการของ Anthropic: ทำไม Claude ต่างจาก LLM อื่น

HHH Helpful, Honest, Harmless

RLHF Reinforcement Learning from Human Feedback

กลุ่ม 4 / 4 — การเชื่อม Claude เข้าระบบในองค์กร

MCP Model Context Protocol

MCP Connector

RAG Retrieval Augmented Generation

สรุป

📖 แหล่งอ้างอิง

อยากใช้ Claude ในองค์กร แต่ทีมยังไม่เข้าใจ AI เพียงพอ?

ต้องการซื้อ Claude สำหรับองค์กรในไทย?

เกี่ยวกับผู้เขียน

สุรีระยา ลิ้มไพบูลย์

AI Glossary สำหรับองค์กรไทย — 13 คำศัพท์ Claude / LLM ที่ทีมต้องรู้ก่อนตัดสินใจ

Claude ZDR (Zero Data Retention) — ทำงานยังไง ต้องเก็บ context เองหรือไม่

Claude MCP คืออะไร? เจาะลึก Model Context Protocol แบบครบทุกมุม

อย่าพลาดข่าวสารจากเรา

เกี่ยวกับ Saeree ERP

โซลูชั่น

แหล่งข้อมูล

ติดต่อเรา