Saeree ERP - ระบบ ERP ครบวงจรสำหรับธุรกิจไทย ติดต่อเรา

บทความ: Data Warehouse คืออะไร

Data Warehouse คลังข้อมูลสำหรับหน่วยงานภาครัฐ
  • 21
  • กุมภาพันธ์

หน่วยงานภาครัฐที่ใช้ระบบ ERP มาสักระยะ มักเจอคำถามจากผู้บริหารว่า "มีข้อมูลเยอะมากในระบบ แต่ทำไมดึงมาวิเคราะห์ภาพรวมได้ยากจัง?" — สาเหตุคือ ERP ถูกออกแบบมาเพื่อ บันทึกธุรกรรมรายวัน (Transaction) เช่น บันทึกเบิกจ่ายงบประมาณ บันทึกจัดซื้อจัดจ้าง — ไม่ใช่เพื่อวิเคราะห์ข้อมูลย้อนหลังข้ามกองหรือข้ามปีงบประมาณ บทความนี้จะอธิบายว่า Data Warehouse คืออะไร ต่างจาก Database ปกติอย่างไร และทำไมหน่วยงานภาครัฐควรเริ่มคิดเรื่องนี้

Data Warehouse คืออะไร?

Data Warehouse (คลังข้อมูล) คือระบบจัดเก็บข้อมูลขนาดใหญ่ที่ถูกออกแบบมาโดยเฉพาะเพื่อ การวิเคราะห์และการทำรายงาน (Analytics & Reporting) — ไม่ใช่เพื่อบันทึกธุรกรรมรายวัน

แนวคิดนี้ถูกนำเสนอโดย Bill Inmon ในช่วงปี 1990 โดยให้คำจำกัดความว่า Data Warehouse คือ:

"A subject-oriented, integrated, non-volatile, and time-variant collection of data in support of management's decisions."

- Bill Inmon, บิดาแห่ง Data Warehouse

แปลเป็นภาษาที่เข้าใจง่ายคือ Data Warehouse มี 4 คุณสมบัติหลัก:

คุณสมบัติ ความหมาย ตัวอย่างในบริบทภาครัฐ
Subject-Oriented
(จัดตามหัวข้อ)
จัดข้อมูลตามหัวข้อที่ต้องการวิเคราะห์ ไม่ใช่ตามระบบที่สร้างข้อมูล ข้อมูล "การเบิกจ่ายงบประมาณ" รวมจากทุกกอง ทุกแผนงาน ไว้ที่เดียว
Integrated
(รวมเป็นหนึ่ง)
รวมข้อมูลจากหลายระบบ ทำให้เป็นรูปแบบเดียวกัน ข้อมูลจาก ERP + GFMIS + e-GP + ระบบ HR → รวมเป็น Format เดียว
Non-Volatile
(ไม่ถูกเปลี่ยน)
ข้อมูลที่เข้ามาแล้วจะไม่ถูกแก้ไขหรือลบ — เก็บเป็นประวัติ ข้อมูลการเบิกจ่ายปีงบประมาณ 2568 จะไม่ถูกเปลี่ยน แม้จะมีการปรับปรุงในปีงบประมาณปัจจุบัน
Time-Variant
(มีมิติเวลา)
เก็บข้อมูลตามช่วงเวลา เปรียบเทียบข้ามปีงบประมาณได้ เปรียบเทียบผลการเบิกจ่ายงบลงทุนย้อนหลัง 5 ปี ดูว่าปีไหนเบิกจ่ายได้ตามเป้า

Data Warehouse ต่างจาก Database ในระบบ ERP อย่างไร?

หลายหน่วยงานสงสัยว่า "ก็มี Database อยู่แล้วในระบบ ERP ทำไมต้องมี Data Warehouse อีก?" — คำตอบคือ ถูกออกแบบมาคนละวัตถุประสงค์:

หัวข้อ OLTP Database (ในระบบ ERP) Data Warehouse (OLAP)
วัตถุประสงค์ บันทึกธุรกรรมรายวัน (เบิกจ่าย, จัดซื้อ, รับพัสดุ) วิเคราะห์ข้อมูลเชิงลึก รายงานผู้บริหาร
ลักษณะข้อมูล ข้อมูลปัจจุบัน เปลี่ยนแปลงตลอดเวลา ข้อมูลประวัติ (Historical) สะสมหลายปีงบประมาณ
การ Query อ่าน-เขียนทีละรายการ เน้นความเร็ว อ่านข้อมูลจำนวนมาก รวม (Aggregate) ข้ามตาราง
โครงสร้าง Normalized (3NF) — ลดความซ้ำซ้อน เหมาะกับการเขียน Denormalized (Star/Snowflake Schema) — เหมาะกับการอ่านเร็ว
ผู้ใช้งาน เจ้าหน้าที่ปฏิบัติงาน (การเงิน, พัสดุ, บัญชี) ผู้บริหาร, สำนักนโยบายและแผน, สตง., ทีมวิเคราะห์
ตัวอย่างคำถาม "ใบสั่งซื้อเลขที่ PO-2569-001 อนุมัติแล้วหรือยัง?" "อัตราเบิกจ่ายงบลงทุนไตรมาส 1 ปี 2569 เทียบกับ 3 ปีย้อนหลังเป็นอย่างไร?"

สรุปง่ายๆ: Database ในระบบ ERP เหมือน "สมุดบันทึกการเบิกจ่ายรายวัน" — จดทุกรายการที่เกิดขึ้น ส่วน Data Warehouse เหมือน "รายงานผลการดำเนินงานประจำปี" — รวบรวมข้อมูลจากทุกสมุด ทุกกอง มาวิเคราะห์เทรนด์และสนับสนุนการตัดสินใจเชิงนโยบาย

องค์ประกอบหลักของ Data Warehouse

Data Warehouse ไม่ใช่แค่ "ฐานข้อมูลอีกตัว" — แต่เป็น สถาปัตยกรรมทั้งระบบ ที่ประกอบด้วย:

1. Data Sources (แหล่งข้อมูล)

สำหรับหน่วยงานภาครัฐ แหล่งข้อมูลมักมาจากหลายระบบ:

  • ระบบ ERP — ข้อมูลบัญชี จัดซื้อจัดจ้าง คลังพัสดุ งบประมาณ HR
  • GFMIS — ระบบบริหารการเงินการคลังภาครัฐ
  • e-GP — ระบบจัดซื้อจัดจ้างภาครัฐด้วยอิเล็กทรอนิกส์
  • ระบบ HR / ระบบสารบรรณ — ข้อมูลบุคลากรและเอกสาร
  • ข้อมูลภายนอก — ตัวชี้วัด KPI จาก สำนักงบประมาณ, ก.พ.ร., สตง.

2. ETL Process (Extract, Transform, Load)

นี่คือ หัวใจของ Data Warehouse — กระบวนการดึงข้อมูลจากแหล่งต่างๆ มาแปลงให้เป็นรูปแบบเดียวกัน แล้วโหลดเข้าคลัง:

ขั้นตอน ทำอะไร ตัวอย่างในภาครัฐ
Extract (ดึง) ดึงข้อมูลจากระบบต้นทาง ดึงข้อมูลการเบิกจ่ายจาก ERP และ GFMIS ทุกคืน 02:00 น.
Transform (แปลง) ทำความสะอาด แปลงรูปแบบ คำนวณค่าใหม่ แปลงรหัสหน่วยงานให้ตรงกัน, คำนวณ % เบิกจ่ายเทียบกับเป้า, จัดกลุ่มตามแผนงาน/ผลผลิต
Load (โหลด) โหลดข้อมูลที่แปลงแล้วเข้า Data Warehouse เพิ่มข้อมูลเบิกจ่ายใหม่เข้าตาราง Fact_Budget_Execution ทุกวัน

3. Data Warehouse Storage

ส่วนจัดเก็บข้อมูลหลัก ออกแบบตามรูปแบบที่เหมาะกับการวิเคราะห์:

  • Star Schema — ตาราง Fact (ข้อมูลตัวเลข เช่น ยอดเบิกจ่าย) อยู่ตรงกลาง ล้อมรอบด้วย Dimension (มิติ เช่น ปีงบประมาณ, หน่วยงาน, แผนงาน)
  • Snowflake Schema — คล้าย Star แต่ Dimension ถูก Normalize เพิ่มเติม เหมาะเมื่อมีลำดับชั้นซับซ้อน

4. BI Tools (เครื่องมือวิเคราะห์)

เครื่องมือที่ดึงข้อมูลจาก Data Warehouse มาสร้าง Dashboard และรายงาน:

  • Apache Superset — Open Source ฟรี เหมาะกับหน่วยงานที่ต้องการลดค่าลิขสิทธิ์
  • Metabase — Open Source ใช้งานง่าย ไม่ต้องเขียน SQL ก็สร้างรายงานได้
  • Power BI — จาก Microsoft เชื่อมต่อกับระบบต่างๆ ได้ง่าย
  • Tableau — สร้าง Visualization สวยงาม เหมาะกับการนำเสนอผู้บริหาร

Star Schema — โครงสร้างที่นิยมที่สุด

Star Schema เป็นรูปแบบการออกแบบ Data Warehouse ที่ใช้มากที่สุด เพราะ เข้าใจง่ายและ Query เร็ว ประกอบด้วย 2 ส่วน:

ประเภทตาราง หน้าที่ ตัวอย่างในภาครัฐ
Fact Table
(ตารางข้อเท็จจริง)
เก็บตัวเลขที่วัดได้ (Measures) เช่น ยอดเบิกจ่าย จำนวนสัญญา Fact_Budget_Execution: วันที่, รหัสแผนงาน, รหัสหน่วยงาน, ยอดเบิกจ่าย, งบจัดสรร
Dimension Table
(ตารางมิติ)
เก็บข้อมูลบริบท (Context) ที่ใช้กรองหรือจัดกลุ่ม Dim_Agency: รหัสหน่วยงาน, ชื่อกอง/สำนัก, สังกัดกระทรวง

ตัวอย่าง Star Schema สำหรับวิเคราะห์การเบิกจ่ายงบประมาณ

ตาราง Fact_Budget_Execution (ตรงกลาง) เชื่อมกับ:

  • Dim_Fiscal_Year — ปีงบประมาณ, ไตรมาส, เดือน
  • Dim_Agency — กอง/สำนัก, สังกัด, ระดับ
  • Dim_Budget_Plan — แผนงาน, ผลผลิต, กิจกรรม, โครงการ
  • Dim_Expense_Type — งบบุคลากร, งบดำเนินงาน, งบลงทุน, งบอุดหนุน, งบรายจ่ายอื่น
  • Dim_Procurement_Method — วิธีจัดซื้อ (e-bidding, เฉพาะเจาะจง, คัดเลือก)

ด้วยโครงสร้างแบบนี้ สามารถตอบคำถามจากผู้บริหารได้ทันที เช่น:

  • "กอง A เบิกจ่ายงบลงทุนไตรมาส 1 ได้กี่ % เทียบกับเป้าที่ สงป. กำหนด?"
  • "โครงการไหนมีมูลค่าจัดซื้อจัดจ้างสูงสุดในปีงบประมาณ 2569?"
  • "อัตราเบิกจ่ายงบดำเนินงานของทุกกอง เรียงจากสูงสุดไปต่ำสุด?"
  • "เปรียบเทียบการเบิกจ่ายงบลงทุนย้อนหลัง 3 ปี แยกตามไตรมาส"

Data Warehouse กับ Data Lake ต่างกันอย่างไร?

อีกคำที่มักได้ยินคู่กันคือ Data Lake — ทั้งสองเป็นที่เก็บข้อมูลขนาดใหญ่ แต่ต่างกัน:

หัวข้อ Data Warehouse Data Lake
ข้อมูลที่เก็บ Structured (มีโครงสร้างชัดเจน) Structured + Semi-structured + Unstructured
การจัดรูปแบบ Schema-on-Write (กำหนดโครงสร้างก่อนเขียน) Schema-on-Read (กำหนดโครงสร้างตอนอ่าน)
คุณภาพข้อมูล สูง — ผ่าน ETL ทำความสะอาดแล้ว หลากหลาย — ข้อมูลดิบยังไม่แปลง
เหมาะกับ รายงานผู้บริหาร, Dashboard, ตรวจสอบภายใน Machine Learning, วิเคราะห์เชิงลึก, เก็บเอกสารดิบ
ค่าใช้จ่าย สูงกว่า (ต้องออกแบบ Schema + ETL) ต่ำกว่า (เก็บดิบๆ ก่อน แปลงทีหลัง)

สำหรับหน่วยงานภาครัฐที่ต้องการ รายงานผู้บริหารและรองรับการตรวจสอบจาก สตง. — Data Warehouse เป็นทางเลือกที่ตรงจุดกว่า เพราะข้อมูลถูกจัดระเบียบ มีคุณภาพ และพร้อมใช้งานทันที

ทำไมหน่วยงานภาครัฐควรมี Data Warehouse?

1. รายงานผู้บริหารข้ามกอง ข้ามแผนงาน แบบ Real-time

ผู้บริหารระดับอธิบดีหรือรองอธิบดีต้องเห็นภาพรวมทั้งหน่วยงาน — ไม่ใช่แค่ข้อมูลกองใดกองหนึ่ง แต่ใน ERP แต่ละโมดูลมีรายงานแยกกัน ถ้าอยากดู "ผลเบิกจ่ายทุกกอง + สถานะจัดซื้อจัดจ้าง + อัตรากำลัง + งบคงเหลือ ทั้งหมดในหน้าเดียว" — ต้องมี Data Warehouse

2. รองรับ KPI และตัวชี้วัดจาก สงป. / ก.พ.ร.

หลายตัวชี้วัดของหน่วยงานภาครัฐเกี่ยวข้องกับ อัตราเบิกจ่ายงบประมาณ ทั้งงบดำเนินงานและงบลงทุน — Data Warehouse ช่วยคำนวณตัวชี้วัดเหล่านี้ได้อัตโนมัติ ไม่ต้องรอเจ้าหน้าที่รวบรวมข้อมูลจากหลายแหล่ง

3. วิเคราะห์เทรนด์ย้อนหลังหลายปีงบประมาณ

ERP มักเก็บข้อมูลปีงบประมาณปัจจุบันและปีก่อนหน้า — แต่ Data Warehouse เก็บข้อมูล ย้อนหลังได้หลายปี เพื่อวิเคราะห์แนวโน้ม:

  • อัตราเบิกจ่ายงบลงทุนดีขึ้นหรือแย่ลงทุกปี?
  • โครงการประเภทไหนที่มักล่าช้ากว่ากำหนด?
  • หมวดรายจ่ายไหนที่มีเงินเหลือจ่ายคืนสูงสุดทุกปี?
  • เทรนด์การจัดซื้อจัดจ้างแบบ e-bidding เทียบกับวิธีเฉพาะเจาะจงเป็นอย่างไร?

4. รองรับการตรวจสอบจาก สตง.

Data Warehouse เก็บข้อมูลแบบ Non-Volatile — ข้อมูลที่เข้ามาแล้วไม่ถูกแก้ไข มี Audit Trail ครบถ้วน ช่วยให้หน่วยงานสามารถ สืบค้นข้อมูลย้อนหลังได้รวดเร็ว เมื่อ สตง. หรือหน่วยตรวจสอบภายในต้องการตรวจสอบ

5. ลดภาระระบบ ERP

การ Query ข้อมูลจำนวนมากเพื่อทำรายงานสรุป จะ ทำให้ ERP ช้าลง เพราะ Database ต้องทำงานหนัก — Data Warehouse แก้ปัญหานี้โดยแยกงานวิเคราะห์ออกมาต่างหาก ไม่กระทบการทำงานรายวันของเจ้าหน้าที่

ตัวอย่างการนำ Data Warehouse ไปใช้ในภาครัฐ

สถานการณ์ ไม่มี Data Warehouse มี Data Warehouse
ผู้บริหารถาม "เบิกจ่ายงบลงทุนได้กี่ %?" เจ้าหน้าที่ต้องดึงข้อมูลจาก ERP + GFMIS มาทำ Excel — ใช้เวลา 1-2 วัน เปิด Dashboard เห็นทันที — แยกตามกอง ตามแผนงาน ตามไตรมาส
สตง. ขอข้อมูลจัดซื้อจัดจ้างย้อนหลัง 3 ปี ต้องค้นหาจากหลายระบบ หลายไฟล์ Excel — อาจใช้เวลาเป็นสัปดาห์ Query จาก Data Warehouse ได้ทันที — ข้อมูลครบ ถูกต้อง ตรวจสอบได้
จัดทำคำของบประมาณปีหน้า ดูข้อมูลได้แค่ 1-2 ปีย้อนหลัง ขาดข้อมูลสนับสนุน วิเคราะห์เทรนด์การใช้จ่ายย้อนหลัง 5 ปี พร้อมแยกตามแผนงาน/กิจกรรม เพื่อจัดทำคำขอที่มีข้อมูลรองรับ
ติดตามผลการดำเนินงานตามแผนยุทธศาสตร์ แต่ละกองรายงานคนละรูปแบบ รวมไม่ได้ Dashboard แสดงผลงานเทียบกับเป้าหมายแบบ Real-time ทุกกอง ทุกตัวชี้วัด

เริ่มต้น Data Warehouse อย่างไร — สำหรับหน่วยงานภาครัฐ

  1. กำหนดคำถามเชิงนโยบายก่อน

    อย่าเริ่มจาก "เราอยากมี Data Warehouse" — เริ่มจาก "ผู้บริหารต้องการตอบคำถามอะไร?" เช่น อัตราเบิกจ่ายแยกตามไตรมาส, สถานะจัดซื้อจัดจ้างรวม, งบคงเหลือแยกตามแผนงาน

  2. ตรวจสอบคุณภาพข้อมูลในระบบ ERP

    Data Warehouse ดีได้แค่เท่าที่ข้อมูลต้นทางดี — ถ้าข้อมูลใน ERP ยังไม่ครบ ไม่ถูกต้อง ไม่สม่ำเสมอ (เช่น บางกองยังลงรายการไม่ครบ บางรายการลงผิดหมวด) ต้องแก้ตรงนี้ก่อน

  3. เลือกเครื่องมือที่เหมาะกับหน่วยงาน

    สำหรับหน่วยงานภาครัฐที่ต้องคำนึงเรื่องลิขสิทธิ์ซอฟต์แวร์ ทางเลือก Open Source ที่เหมาะสม:

    • PostgreSQL — Open Source ฟรี รองรับ Data Warehouse ขนาดกลาง ไม่ต้องจ่ายค่าลิขสิทธิ์
    • ClickHouse — Column-oriented DB ออกแบบสำหรับ Analytics โดยเฉพาะ Open Source
    • Apache Superset + Metabase — เครื่องมือ BI ที่ฟรีและ Open Source
  4. ออกแบบ ETL Pipeline

    กำหนดว่าจะดึงข้อมูลจาก ERP อย่างไร แปลงอย่างไร โหลดเข้า Data Warehouse บ่อยแค่ไหน (รายวัน? รายชั่วโมง?)

  5. เริ่มจากเล็กๆ — 1 Subject Area

    อย่าพยายามทำทุกอย่างพร้อมกัน เริ่มจาก Subject Area ที่มีความต้องการสูงสุดก่อน เช่น "การเบิกจ่ายงบประมาณ" — เพราะเป็นเรื่องที่ทุกหน่วยงานต้องรายงาน แล้วค่อยขยายไป จัดซื้อจัดจ้าง พัสดุ HR

Saeree ERP กับ Data Warehouse

Saeree ERP ใช้ PostgreSQL เป็นฐานข้อมูลหลัก ซึ่งเป็นข้อได้เปรียบสำคัญสำหรับหน่วยงานภาครัฐที่ต้องการทำ Data Warehouse:

จุดเด่น รายละเอียด
Open Source — ไม่มีค่าลิขสิทธิ์ ทั้ง ERP Database และ Data Warehouse ใช้ PostgreSQL ได้เลย ไม่ต้องจ่ายค่า License ซ้ำซ้อน ช่วยประหยัดงบประมาณ
Open Data Format ข้อมูลใน PostgreSQL ดึงออกมาได้ง่าย ไม่ถูกล็อคกับ Vendor สอดคล้องกับนโยบาย Open Data ภาครัฐ
SQL Standard ใช้ SQL มาตรฐาน เชื่อมต่อกับเครื่องมือ ETL และ BI ได้ทุกตัว ไม่ว่าจะเป็น Superset, Metabase หรือ Power BI
Logical Replication ดึงข้อมูลแบบ Real-time จาก ERP ไปยัง Data Warehouse โดยไม่กระทบประสิทธิภาพระบบ ERP ที่เจ้าหน้าที่ใช้งานอยู่
โครงสร้างข้อมูลครบทุกโมดูล ข้อมูลงบประมาณ จัดซื้อจัดจ้าง คลังพัสดุ บัญชี HR มีความสัมพันธ์ที่ชัดเจน พร้อมเป็น Data Source สำหรับ Data Warehouse

Data Warehouse ไม่ใช่โปรเจกต์ IT — แต่เป็นการลงทุนเพื่อให้หน่วยงานภาครัฐ ตัดสินใจเชิงนโยบายจากข้อมูลจริง (Data-Driven Decision Making) รายงานได้โปร่งใส ตรวจสอบได้ และรองรับทิศทาง Digital Government ของประเทศ

- ทีมงาน Saeree ERP

สรุป

  • Data Warehouse คือคลังข้อมูลที่ออกแบบมาเพื่อวิเคราะห์ ไม่ใช่เพื่อบันทึกธุรกรรม
  • ต่างจาก Database ตรงที่เก็บข้อมูลประวัติ รวมจากหลายระบบ (ERP, GFMIS, e-GP) ออกแบบให้อ่านเร็ว
  • ETL Process คือหัวใจ — ดึง แปลง โหลดข้อมูลจากแหล่งต่างๆ เข้าคลัง
  • Star Schema เป็นรูปแบบที่นิยมที่สุด — Fact Table (ยอดเบิกจ่าย) + Dimension Tables (ปีงบ, หน่วยงาน, แผนงาน)
  • สำหรับภาครัฐ — ช่วยรายงานผู้บริหาร ติดตาม KPI เบิกจ่าย รองรับ สตง. และสนับสนุนการจัดทำคำของบประมาณ
  • เริ่มจากคำถามเชิงนโยบาย ไม่ใช่จากเทคโนโลยี — ผู้บริหารอยากรู้อะไร ค่อยออกแบบตาม

หากหน่วยงานของท่านกำลังมองหาระบบ ERP ที่มีฐานข้อมูลเปิดและพร้อมเชื่อมต่อ Data Warehouse สามารถนัดหมาย Demo หรือติดต่อทีมที่ปรึกษาเพื่อประเมินความพร้อมของหน่วยงาน

สนใจระบบ ERP สำหรับหน่วยงานของท่าน?

ปรึกษาผู้เชี่ยวชาญจาก Grand Linux Solution ฟรี ไม่มีค่าใช้จ่าย

ขอ Demo ฟรี

โทร 02-347-7730 | sale@grandlinux.com

image

เกี่ยวกับผู้เขียน

ทีมงานผู้เชี่ยวชาญด้านระบบ ERP จากบริษัท แกรนด์ลีนุกซ์ โซลูชั่น จำกัด พร้อมให้คำปรึกษาและบริการด้านระบบ ERP ครบวงจร