- 21
- กุมภาพันธ์
หน่วยงานภาครัฐที่ใช้ระบบ ERP มาสักระยะ มักเจอคำถามจากผู้บริหารว่า "มีข้อมูลเยอะมากในระบบ แต่ทำไมดึงมาวิเคราะห์ภาพรวมได้ยากจัง?" — สาเหตุคือ ERP ถูกออกแบบมาเพื่อ บันทึกธุรกรรมรายวัน (Transaction) เช่น บันทึกเบิกจ่ายงบประมาณ บันทึกจัดซื้อจัดจ้าง — ไม่ใช่เพื่อวิเคราะห์ข้อมูลย้อนหลังข้ามกองหรือข้ามปีงบประมาณ บทความนี้จะอธิบายว่า Data Warehouse คืออะไร ต่างจาก Database ปกติอย่างไร และทำไมหน่วยงานภาครัฐควรเริ่มคิดเรื่องนี้
Data Warehouse คืออะไร?
Data Warehouse (คลังข้อมูล) คือระบบจัดเก็บข้อมูลขนาดใหญ่ที่ถูกออกแบบมาโดยเฉพาะเพื่อ การวิเคราะห์และการทำรายงาน (Analytics & Reporting) — ไม่ใช่เพื่อบันทึกธุรกรรมรายวัน
แนวคิดนี้ถูกนำเสนอโดย Bill Inmon ในช่วงปี 1990 โดยให้คำจำกัดความว่า Data Warehouse คือ:
"A subject-oriented, integrated, non-volatile, and time-variant collection of data in support of management's decisions."
- Bill Inmon, บิดาแห่ง Data Warehouse
แปลเป็นภาษาที่เข้าใจง่ายคือ Data Warehouse มี 4 คุณสมบัติหลัก:
| คุณสมบัติ | ความหมาย | ตัวอย่างในบริบทภาครัฐ |
|---|---|---|
| Subject-Oriented (จัดตามหัวข้อ) |
จัดข้อมูลตามหัวข้อที่ต้องการวิเคราะห์ ไม่ใช่ตามระบบที่สร้างข้อมูล | ข้อมูล "การเบิกจ่ายงบประมาณ" รวมจากทุกกอง ทุกแผนงาน ไว้ที่เดียว |
| Integrated (รวมเป็นหนึ่ง) |
รวมข้อมูลจากหลายระบบ ทำให้เป็นรูปแบบเดียวกัน | ข้อมูลจาก ERP + GFMIS + e-GP + ระบบ HR → รวมเป็น Format เดียว |
| Non-Volatile (ไม่ถูกเปลี่ยน) |
ข้อมูลที่เข้ามาแล้วจะไม่ถูกแก้ไขหรือลบ — เก็บเป็นประวัติ | ข้อมูลการเบิกจ่ายปีงบประมาณ 2568 จะไม่ถูกเปลี่ยน แม้จะมีการปรับปรุงในปีงบประมาณปัจจุบัน |
| Time-Variant (มีมิติเวลา) |
เก็บข้อมูลตามช่วงเวลา เปรียบเทียบข้ามปีงบประมาณได้ | เปรียบเทียบผลการเบิกจ่ายงบลงทุนย้อนหลัง 5 ปี ดูว่าปีไหนเบิกจ่ายได้ตามเป้า |
Data Warehouse ต่างจาก Database ในระบบ ERP อย่างไร?
หลายหน่วยงานสงสัยว่า "ก็มี Database อยู่แล้วในระบบ ERP ทำไมต้องมี Data Warehouse อีก?" — คำตอบคือ ถูกออกแบบมาคนละวัตถุประสงค์:
| หัวข้อ | OLTP Database (ในระบบ ERP) | Data Warehouse (OLAP) |
|---|---|---|
| วัตถุประสงค์ | บันทึกธุรกรรมรายวัน (เบิกจ่าย, จัดซื้อ, รับพัสดุ) | วิเคราะห์ข้อมูลเชิงลึก รายงานผู้บริหาร |
| ลักษณะข้อมูล | ข้อมูลปัจจุบัน เปลี่ยนแปลงตลอดเวลา | ข้อมูลประวัติ (Historical) สะสมหลายปีงบประมาณ |
| การ Query | อ่าน-เขียนทีละรายการ เน้นความเร็ว | อ่านข้อมูลจำนวนมาก รวม (Aggregate) ข้ามตาราง |
| โครงสร้าง | Normalized (3NF) — ลดความซ้ำซ้อน เหมาะกับการเขียน | Denormalized (Star/Snowflake Schema) — เหมาะกับการอ่านเร็ว |
| ผู้ใช้งาน | เจ้าหน้าที่ปฏิบัติงาน (การเงิน, พัสดุ, บัญชี) | ผู้บริหาร, สำนักนโยบายและแผน, สตง., ทีมวิเคราะห์ |
| ตัวอย่างคำถาม | "ใบสั่งซื้อเลขที่ PO-2569-001 อนุมัติแล้วหรือยัง?" | "อัตราเบิกจ่ายงบลงทุนไตรมาส 1 ปี 2569 เทียบกับ 3 ปีย้อนหลังเป็นอย่างไร?" |
สรุปง่ายๆ: Database ในระบบ ERP เหมือน "สมุดบันทึกการเบิกจ่ายรายวัน" — จดทุกรายการที่เกิดขึ้น ส่วน Data Warehouse เหมือน "รายงานผลการดำเนินงานประจำปี" — รวบรวมข้อมูลจากทุกสมุด ทุกกอง มาวิเคราะห์เทรนด์และสนับสนุนการตัดสินใจเชิงนโยบาย
องค์ประกอบหลักของ Data Warehouse
Data Warehouse ไม่ใช่แค่ "ฐานข้อมูลอีกตัว" — แต่เป็น สถาปัตยกรรมทั้งระบบ ที่ประกอบด้วย:
1. Data Sources (แหล่งข้อมูล)
สำหรับหน่วยงานภาครัฐ แหล่งข้อมูลมักมาจากหลายระบบ:
- ระบบ ERP — ข้อมูลบัญชี จัดซื้อจัดจ้าง คลังพัสดุ งบประมาณ HR
- GFMIS — ระบบบริหารการเงินการคลังภาครัฐ
- e-GP — ระบบจัดซื้อจัดจ้างภาครัฐด้วยอิเล็กทรอนิกส์
- ระบบ HR / ระบบสารบรรณ — ข้อมูลบุคลากรและเอกสาร
- ข้อมูลภายนอก — ตัวชี้วัด KPI จาก สำนักงบประมาณ, ก.พ.ร., สตง.
2. ETL Process (Extract, Transform, Load)
นี่คือ หัวใจของ Data Warehouse — กระบวนการดึงข้อมูลจากแหล่งต่างๆ มาแปลงให้เป็นรูปแบบเดียวกัน แล้วโหลดเข้าคลัง:
| ขั้นตอน | ทำอะไร | ตัวอย่างในภาครัฐ |
|---|---|---|
| Extract (ดึง) | ดึงข้อมูลจากระบบต้นทาง | ดึงข้อมูลการเบิกจ่ายจาก ERP และ GFMIS ทุกคืน 02:00 น. |
| Transform (แปลง) | ทำความสะอาด แปลงรูปแบบ คำนวณค่าใหม่ | แปลงรหัสหน่วยงานให้ตรงกัน, คำนวณ % เบิกจ่ายเทียบกับเป้า, จัดกลุ่มตามแผนงาน/ผลผลิต |
| Load (โหลด) | โหลดข้อมูลที่แปลงแล้วเข้า Data Warehouse | เพิ่มข้อมูลเบิกจ่ายใหม่เข้าตาราง Fact_Budget_Execution ทุกวัน |
3. Data Warehouse Storage
ส่วนจัดเก็บข้อมูลหลัก ออกแบบตามรูปแบบที่เหมาะกับการวิเคราะห์:
- Star Schema — ตาราง Fact (ข้อมูลตัวเลข เช่น ยอดเบิกจ่าย) อยู่ตรงกลาง ล้อมรอบด้วย Dimension (มิติ เช่น ปีงบประมาณ, หน่วยงาน, แผนงาน)
- Snowflake Schema — คล้าย Star แต่ Dimension ถูก Normalize เพิ่มเติม เหมาะเมื่อมีลำดับชั้นซับซ้อน
4. BI Tools (เครื่องมือวิเคราะห์)
เครื่องมือที่ดึงข้อมูลจาก Data Warehouse มาสร้าง Dashboard และรายงาน:
- Apache Superset — Open Source ฟรี เหมาะกับหน่วยงานที่ต้องการลดค่าลิขสิทธิ์
- Metabase — Open Source ใช้งานง่าย ไม่ต้องเขียน SQL ก็สร้างรายงานได้
- Power BI — จาก Microsoft เชื่อมต่อกับระบบต่างๆ ได้ง่าย
- Tableau — สร้าง Visualization สวยงาม เหมาะกับการนำเสนอผู้บริหาร
Star Schema — โครงสร้างที่นิยมที่สุด
Star Schema เป็นรูปแบบการออกแบบ Data Warehouse ที่ใช้มากที่สุด เพราะ เข้าใจง่ายและ Query เร็ว ประกอบด้วย 2 ส่วน:
| ประเภทตาราง | หน้าที่ | ตัวอย่างในภาครัฐ |
|---|---|---|
| Fact Table (ตารางข้อเท็จจริง) |
เก็บตัวเลขที่วัดได้ (Measures) เช่น ยอดเบิกจ่าย จำนวนสัญญา | Fact_Budget_Execution: วันที่, รหัสแผนงาน, รหัสหน่วยงาน, ยอดเบิกจ่าย, งบจัดสรร |
| Dimension Table (ตารางมิติ) |
เก็บข้อมูลบริบท (Context) ที่ใช้กรองหรือจัดกลุ่ม | Dim_Agency: รหัสหน่วยงาน, ชื่อกอง/สำนัก, สังกัดกระทรวง |
ตัวอย่าง Star Schema สำหรับวิเคราะห์การเบิกจ่ายงบประมาณ
ตาราง Fact_Budget_Execution (ตรงกลาง) เชื่อมกับ:
- Dim_Fiscal_Year — ปีงบประมาณ, ไตรมาส, เดือน
- Dim_Agency — กอง/สำนัก, สังกัด, ระดับ
- Dim_Budget_Plan — แผนงาน, ผลผลิต, กิจกรรม, โครงการ
- Dim_Expense_Type — งบบุคลากร, งบดำเนินงาน, งบลงทุน, งบอุดหนุน, งบรายจ่ายอื่น
- Dim_Procurement_Method — วิธีจัดซื้อ (e-bidding, เฉพาะเจาะจง, คัดเลือก)
ด้วยโครงสร้างแบบนี้ สามารถตอบคำถามจากผู้บริหารได้ทันที เช่น:
- "กอง A เบิกจ่ายงบลงทุนไตรมาส 1 ได้กี่ % เทียบกับเป้าที่ สงป. กำหนด?"
- "โครงการไหนมีมูลค่าจัดซื้อจัดจ้างสูงสุดในปีงบประมาณ 2569?"
- "อัตราเบิกจ่ายงบดำเนินงานของทุกกอง เรียงจากสูงสุดไปต่ำสุด?"
- "เปรียบเทียบการเบิกจ่ายงบลงทุนย้อนหลัง 3 ปี แยกตามไตรมาส"
Data Warehouse กับ Data Lake ต่างกันอย่างไร?
อีกคำที่มักได้ยินคู่กันคือ Data Lake — ทั้งสองเป็นที่เก็บข้อมูลขนาดใหญ่ แต่ต่างกัน:
| หัวข้อ | Data Warehouse | Data Lake |
|---|---|---|
| ข้อมูลที่เก็บ | Structured (มีโครงสร้างชัดเจน) | Structured + Semi-structured + Unstructured |
| การจัดรูปแบบ | Schema-on-Write (กำหนดโครงสร้างก่อนเขียน) | Schema-on-Read (กำหนดโครงสร้างตอนอ่าน) |
| คุณภาพข้อมูล | สูง — ผ่าน ETL ทำความสะอาดแล้ว | หลากหลาย — ข้อมูลดิบยังไม่แปลง |
| เหมาะกับ | รายงานผู้บริหาร, Dashboard, ตรวจสอบภายใน | Machine Learning, วิเคราะห์เชิงลึก, เก็บเอกสารดิบ |
| ค่าใช้จ่าย | สูงกว่า (ต้องออกแบบ Schema + ETL) | ต่ำกว่า (เก็บดิบๆ ก่อน แปลงทีหลัง) |
สำหรับหน่วยงานภาครัฐที่ต้องการ รายงานผู้บริหารและรองรับการตรวจสอบจาก สตง. — Data Warehouse เป็นทางเลือกที่ตรงจุดกว่า เพราะข้อมูลถูกจัดระเบียบ มีคุณภาพ และพร้อมใช้งานทันที
ทำไมหน่วยงานภาครัฐควรมี Data Warehouse?
1. รายงานผู้บริหารข้ามกอง ข้ามแผนงาน แบบ Real-time
ผู้บริหารระดับอธิบดีหรือรองอธิบดีต้องเห็นภาพรวมทั้งหน่วยงาน — ไม่ใช่แค่ข้อมูลกองใดกองหนึ่ง แต่ใน ERP แต่ละโมดูลมีรายงานแยกกัน ถ้าอยากดู "ผลเบิกจ่ายทุกกอง + สถานะจัดซื้อจัดจ้าง + อัตรากำลัง + งบคงเหลือ ทั้งหมดในหน้าเดียว" — ต้องมี Data Warehouse
2. รองรับ KPI และตัวชี้วัดจาก สงป. / ก.พ.ร.
หลายตัวชี้วัดของหน่วยงานภาครัฐเกี่ยวข้องกับ อัตราเบิกจ่ายงบประมาณ ทั้งงบดำเนินงานและงบลงทุน — Data Warehouse ช่วยคำนวณตัวชี้วัดเหล่านี้ได้อัตโนมัติ ไม่ต้องรอเจ้าหน้าที่รวบรวมข้อมูลจากหลายแหล่ง
3. วิเคราะห์เทรนด์ย้อนหลังหลายปีงบประมาณ
ERP มักเก็บข้อมูลปีงบประมาณปัจจุบันและปีก่อนหน้า — แต่ Data Warehouse เก็บข้อมูล ย้อนหลังได้หลายปี เพื่อวิเคราะห์แนวโน้ม:
- อัตราเบิกจ่ายงบลงทุนดีขึ้นหรือแย่ลงทุกปี?
- โครงการประเภทไหนที่มักล่าช้ากว่ากำหนด?
- หมวดรายจ่ายไหนที่มีเงินเหลือจ่ายคืนสูงสุดทุกปี?
- เทรนด์การจัดซื้อจัดจ้างแบบ e-bidding เทียบกับวิธีเฉพาะเจาะจงเป็นอย่างไร?
4. รองรับการตรวจสอบจาก สตง.
Data Warehouse เก็บข้อมูลแบบ Non-Volatile — ข้อมูลที่เข้ามาแล้วไม่ถูกแก้ไข มี Audit Trail ครบถ้วน ช่วยให้หน่วยงานสามารถ สืบค้นข้อมูลย้อนหลังได้รวดเร็ว เมื่อ สตง. หรือหน่วยตรวจสอบภายในต้องการตรวจสอบ
5. ลดภาระระบบ ERP
การ Query ข้อมูลจำนวนมากเพื่อทำรายงานสรุป จะ ทำให้ ERP ช้าลง เพราะ Database ต้องทำงานหนัก — Data Warehouse แก้ปัญหานี้โดยแยกงานวิเคราะห์ออกมาต่างหาก ไม่กระทบการทำงานรายวันของเจ้าหน้าที่
ตัวอย่างการนำ Data Warehouse ไปใช้ในภาครัฐ
| สถานการณ์ | ไม่มี Data Warehouse | มี Data Warehouse |
|---|---|---|
| ผู้บริหารถาม "เบิกจ่ายงบลงทุนได้กี่ %?" | เจ้าหน้าที่ต้องดึงข้อมูลจาก ERP + GFMIS มาทำ Excel — ใช้เวลา 1-2 วัน | เปิด Dashboard เห็นทันที — แยกตามกอง ตามแผนงาน ตามไตรมาส |
| สตง. ขอข้อมูลจัดซื้อจัดจ้างย้อนหลัง 3 ปี | ต้องค้นหาจากหลายระบบ หลายไฟล์ Excel — อาจใช้เวลาเป็นสัปดาห์ | Query จาก Data Warehouse ได้ทันที — ข้อมูลครบ ถูกต้อง ตรวจสอบได้ |
| จัดทำคำของบประมาณปีหน้า | ดูข้อมูลได้แค่ 1-2 ปีย้อนหลัง ขาดข้อมูลสนับสนุน | วิเคราะห์เทรนด์การใช้จ่ายย้อนหลัง 5 ปี พร้อมแยกตามแผนงาน/กิจกรรม เพื่อจัดทำคำขอที่มีข้อมูลรองรับ |
| ติดตามผลการดำเนินงานตามแผนยุทธศาสตร์ | แต่ละกองรายงานคนละรูปแบบ รวมไม่ได้ | Dashboard แสดงผลงานเทียบกับเป้าหมายแบบ Real-time ทุกกอง ทุกตัวชี้วัด |
เริ่มต้น Data Warehouse อย่างไร — สำหรับหน่วยงานภาครัฐ
-
กำหนดคำถามเชิงนโยบายก่อน
อย่าเริ่มจาก "เราอยากมี Data Warehouse" — เริ่มจาก "ผู้บริหารต้องการตอบคำถามอะไร?" เช่น อัตราเบิกจ่ายแยกตามไตรมาส, สถานะจัดซื้อจัดจ้างรวม, งบคงเหลือแยกตามแผนงาน
-
ตรวจสอบคุณภาพข้อมูลในระบบ ERP
Data Warehouse ดีได้แค่เท่าที่ข้อมูลต้นทางดี — ถ้าข้อมูลใน ERP ยังไม่ครบ ไม่ถูกต้อง ไม่สม่ำเสมอ (เช่น บางกองยังลงรายการไม่ครบ บางรายการลงผิดหมวด) ต้องแก้ตรงนี้ก่อน
-
เลือกเครื่องมือที่เหมาะกับหน่วยงาน
สำหรับหน่วยงานภาครัฐที่ต้องคำนึงเรื่องลิขสิทธิ์ซอฟต์แวร์ ทางเลือก Open Source ที่เหมาะสม:
- PostgreSQL — Open Source ฟรี รองรับ Data Warehouse ขนาดกลาง ไม่ต้องจ่ายค่าลิขสิทธิ์
- ClickHouse — Column-oriented DB ออกแบบสำหรับ Analytics โดยเฉพาะ Open Source
- Apache Superset + Metabase — เครื่องมือ BI ที่ฟรีและ Open Source
-
ออกแบบ ETL Pipeline
กำหนดว่าจะดึงข้อมูลจาก ERP อย่างไร แปลงอย่างไร โหลดเข้า Data Warehouse บ่อยแค่ไหน (รายวัน? รายชั่วโมง?)
-
เริ่มจากเล็กๆ — 1 Subject Area
อย่าพยายามทำทุกอย่างพร้อมกัน เริ่มจาก Subject Area ที่มีความต้องการสูงสุดก่อน เช่น "การเบิกจ่ายงบประมาณ" — เพราะเป็นเรื่องที่ทุกหน่วยงานต้องรายงาน แล้วค่อยขยายไป จัดซื้อจัดจ้าง พัสดุ HR
Saeree ERP กับ Data Warehouse
Saeree ERP ใช้ PostgreSQL เป็นฐานข้อมูลหลัก ซึ่งเป็นข้อได้เปรียบสำคัญสำหรับหน่วยงานภาครัฐที่ต้องการทำ Data Warehouse:
| จุดเด่น | รายละเอียด |
|---|---|
| Open Source — ไม่มีค่าลิขสิทธิ์ | ทั้ง ERP Database และ Data Warehouse ใช้ PostgreSQL ได้เลย ไม่ต้องจ่ายค่า License ซ้ำซ้อน ช่วยประหยัดงบประมาณ |
| Open Data Format | ข้อมูลใน PostgreSQL ดึงออกมาได้ง่าย ไม่ถูกล็อคกับ Vendor สอดคล้องกับนโยบาย Open Data ภาครัฐ |
| SQL Standard | ใช้ SQL มาตรฐาน เชื่อมต่อกับเครื่องมือ ETL และ BI ได้ทุกตัว ไม่ว่าจะเป็น Superset, Metabase หรือ Power BI |
| Logical Replication | ดึงข้อมูลแบบ Real-time จาก ERP ไปยัง Data Warehouse โดยไม่กระทบประสิทธิภาพระบบ ERP ที่เจ้าหน้าที่ใช้งานอยู่ |
| โครงสร้างข้อมูลครบทุกโมดูล | ข้อมูลงบประมาณ จัดซื้อจัดจ้าง คลังพัสดุ บัญชี HR มีความสัมพันธ์ที่ชัดเจน พร้อมเป็น Data Source สำหรับ Data Warehouse |
Data Warehouse ไม่ใช่โปรเจกต์ IT — แต่เป็นการลงทุนเพื่อให้หน่วยงานภาครัฐ ตัดสินใจเชิงนโยบายจากข้อมูลจริง (Data-Driven Decision Making) รายงานได้โปร่งใส ตรวจสอบได้ และรองรับทิศทาง Digital Government ของประเทศ
- ทีมงาน Saeree ERP
สรุป
- Data Warehouse คือคลังข้อมูลที่ออกแบบมาเพื่อวิเคราะห์ ไม่ใช่เพื่อบันทึกธุรกรรม
- ต่างจาก Database ตรงที่เก็บข้อมูลประวัติ รวมจากหลายระบบ (ERP, GFMIS, e-GP) ออกแบบให้อ่านเร็ว
- ETL Process คือหัวใจ — ดึง แปลง โหลดข้อมูลจากแหล่งต่างๆ เข้าคลัง
- Star Schema เป็นรูปแบบที่นิยมที่สุด — Fact Table (ยอดเบิกจ่าย) + Dimension Tables (ปีงบ, หน่วยงาน, แผนงาน)
- สำหรับภาครัฐ — ช่วยรายงานผู้บริหาร ติดตาม KPI เบิกจ่าย รองรับ สตง. และสนับสนุนการจัดทำคำของบประมาณ
- เริ่มจากคำถามเชิงนโยบาย ไม่ใช่จากเทคโนโลยี — ผู้บริหารอยากรู้อะไร ค่อยออกแบบตาม
หากหน่วยงานของท่านกำลังมองหาระบบ ERP ที่มีฐานข้อมูลเปิดและพร้อมเชื่อมต่อ Data Warehouse สามารถนัดหมาย Demo หรือติดต่อทีมที่ปรึกษาเพื่อประเมินความพร้อมของหน่วยงาน
