วันศุกร์ที่ 22 พฤษภาคม พ.ศ. 2552

Data ware House





การพัฒนาระบบคลังข้อมูล (Building a Data Warehouse)
บทคัดย่อดาต้าแวร์เฮ้าส์ หรือคลังข้อมูล คือฐานข้อมูลขนาดใหญ่ที่รวบรวมข้อมูลทั้งจากแหล่งข้อมูลภายในและภายนอกองค์กร โดยมีรูปแบบและวัตถุประสงค์ ของการจัดเก็บข้อมูลแตกต่างจากฐานข้อมูลปฏิบัตการทั่วไป การพัฒนาระบบคลังข้อมูลเริ่มจากการออกแบบฐานข้อมูล ซึ่งวิธีการหนึ่งเรียกว่า ระเบียบวิธี 9 ชั้นของ Kimball จะเน้นที่การออกแบบจากระบบงานย่อยหรือดาต้ามาร์ทของแต่ละระบบงานในองค์กรก่อนจึงนำส่วนย่อยๆ นั้นมารวมเป็นระบบคลังข้อมูลขององค์กรต่อไป ทั้งนี้กระบวนการหนึ่งที่สำคัญมากในการพัฒนาระบบคลังข้อมูล คือการนำข้อมูลจากแหล่งข้อมูลเข้าสู่ดาต้ามาร์ทของแต่ละระบบ หรือเรียกว่าการแปลงข้อมูล โดยจะต้องกำหนดการส่งข้อมูล รวบรวมหรือสร้างข้อมูลภายนอก วางแผนและสร้างรูทีนการแปลงข้อมูล จึงตรวจสอบความถูกต้องของข้อมูลที่ได้ก่อนนำเข้าสู่คลังข้อมูลเพื่อให้เป็นข้อมูลที่เหมาะสมที่จะนำไปวิเคราะห์ต่อไป
1. บทนำเนื่องจากสภาพเศรษฐกิจปัจจุบันที่ยังไม่จัดว่าพ้นภาระวิกฤตธุรกิจหลายประเภท จึงยังต้องการ การวิเคราะห์ วางแผน และตัดสินใจอย่างถูกต้อง รวดเร็วเพื่อช่วยให้ธุรกิจสามารถดำเนินไปได้ ดังนั้นข้อมูลจึงเป็นปัจจัยสำคัญยิ่งยวดต่อการดำเนินการนั้น การใช้ข้อมูลเป็นเครื่องมือสำคัญในการตัดสินใจการลงทุนทางธุรกิจและวางแผนกลยุทธ์ทางการตลาดเพื่อแข่งขันกับคู่แข่งทางการค้า ฉะนั้นก็อาจกล่าวได้ว่าการมีข้อมูลมากทำให้มีโอกาสและมีชัยเหนือคู่แข่งในระดับหนึ่ง แต่ทว่าหากมองในทางกลับกัน การมีข้อมูลจำนวนมากแต่ขาดการจัดเรียงให้เป็นระบบยุ่งยากในการเข้าถึงและค้นคืน ธุรกิจอาจต้องเสียค่าใช้จ่ายจำนวนมหาศาลในการเก็บรักษาข้อมูลเหล่านั้นไว้โดยไม่จำเป็น เพราะไม่ได้รับประโยชน์จากข้อมูลที่มี นอกจากนี้หากมีการนำข้อมูลมาวิเคราะห์อย่างผิดพลาดอาจจะก่อให้เกิดผลเสียหายได้ ซึ่งเป็นการสูญเสียโอกาสทางธุรกิจไป เพราะฉะนั้นในยุคที่ผู้บริหารมีความต้องการใช้ข้อมูล เพื่อการตัดสินใจมากขึ้น การจัดระบบระเบียบข้อมูล เพื่อนำเสนอข้อมูลที่มีคุณค่าและผ่านการกลั่นกรองแล้วแก่ผู้บริหารเพื่อใช้ในการตัดสินใจให้ทันต่อเหตุการณ์จึงเป็นสิ่งที่จำเป็นอย่างยิ่งแนวความคิดของการสร้างคลังข้อมูลจึงเกิดขึ้นเพื่อเป็นที่เก็บรวบรวมข้อมูลสำคัญและจำเป็นจากแหล่งต่างๆ ซึ่งเป็นประโยชน์ต่อการตัดสินใจของผู้บริหาร เพื่อให้ผู้บริหารสามารถเรียกใช้ข้อมูลที่ต้องการได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น ข้อมูลเชิงบริหารนี้จะสามารถช่วยลดปัญหาที่เกิดจากการใช้ข้อมูลจากฐานปฏิบัติการ (operational database) ซึ่งเป็นการเก็บข้อมูลในรูปแบบ transaction system ได้ ซึ่งโดยทั่วไปปัญหาที่พบเมื่อต้องการข้อมูลที่ช่วยในการตัดสินใจได้แก่- การเรียงข้อมูลจากฐานข้อมูลปฏิบัติการ ซึ่งมีขนาดใหญ่ ทำให้ประสิทธิภาพของระบบลดลงและทำงานได้ช้าลง- ข้อมูลที่นำเสนอมีรูปแบบเดียว ไม่สามารถเปลี่ยนแปลงได้ตามความต้องการของผู้บริหาร- ไม่สามารถหาคำตอบในเชิงพยากรณ์ได้- ไม่ตอบสนองการทำคิวรี่ที่ซับซ้อนได้ดีเท่าที่ควร- ข้อมูลถูกจัดเก็บอยู่ตามฐานข้อมูลของระบบงานต่างๆ ซึ่งยากแก่การเรียกใช้และขาดความสัมพันธ์ทางธุรกิจ
2. สิ่งที่ควรพิจารณาก่อนสร้างคลังข้อมูลเนื่องจากการลงทุนสร้างคลังข้อมูลขึ้นมาใช้เพื่อสนับสนุนการทำงานขององค์กรนั้นจำเป็นต้องมีค่าใช้จ่ายในการลงทุนมหาศาล ทั้งที่สามารถวัดออกมาเป็นตัวเงินได้ เช่นค่าใช้จ่ายด้านฮาร์ดแวร์ ซอฟต์แวร์ และ infrastructure อื่นๆ ที่จำเป็นต้องใช้ ส่วนค่าใช้จ่ายที่ไม่เป็นตัวเงิน แต่มีความสำคัญอย่างมากได้แก่ กำลังแรงงานที่เสียไปของทรัพยากรบุคคลขององค์กรและเวลาที่ใช้ในการพัฒนา ดังนั้น เมื่อองค์กรตัดสินใจสร้างคลังข้อมูลขึ้นแล้ว ควรจะประสบความสำเร็จด้วย ทั้งนี้ Poe ได้เสนอ The Big Eight หรือ 8 ประการที่ควรให้ความสนใจ โดยมีรายละเอียดดังนี้
ควรมีเป้าหมายที่ชัดเจนร่วมของการสร้างระบบนี้ของคนในองค์กร เหมือนการตอบคำถามว่าทำไมคุณถึงคิดจะสร้างคลังข้อมูล? ซึ่งคำตอบขององค์กร ที่จะได้คือเป้าหมายที่ต้องการ โดยควรจะเขียนเป้าหมายนี้ออกมาเป็นลายลักษณ์อักษรที่ชัดเจน เพื่อให้ทีมพัฒนาได้เข้าใจเป้าหมายร่วมกัน
ทำความเข้าใจสถาปัตยกรรมของระบบ เพื่อให้ทีมพัฒนาเข้าใจตรงกัน ในที่นี้หมายถึง blueprint ที่แสดง E-R model รวมของระบบความเข้าใจที่ตรงกันทำให้งานเดินไปได้เร็วขึ้น
เทคโนโลยี่ที่ใช้ควรอยู่ในวิสัยที่เหมาะสม ทั้งด้านของตัวเงินและความยากง่ายในการเรียนรู้ ทั้งนี้หมายรวมทั้งฮาร์ดแวร์ ซอฟต์แวร์ และเครือข่าย อาจต้องมีการทดสอบและฝึกอบรมก่อนการใช้งานจริง
ทีมงานต้องมีวิสัยทัศน์เชิงบวกในการทำงาน เนื่องจากทีมพัฒนามักมาจากส่วนงานด้านเทคโนโลยีสารสรเทศ แต่ในเนื้องานจริงๆ แล้วผู้ใช้ขั้นปลายเป็นส่วนงานอื่นๆ ขององค์กร ดังนั้นจึงจำเป็นอย่างยิ่งที่จะให้ผู้ใช้ขั้นปลายที่เป็นเจ้าของงานเข้ามาร่วมทำงานด้วยตั่งแต่ต้นโครงการ
ต้องมั่นใจได้ว่าทีมพัฒนาเข้าใจเป็นอย่างดีถึงความแตกต่างกันระหว่างฐานข้อมูลปฏิบัติการและฐานข้อมูลสนับสนุนการตัดสินใจ
จัดให้มีการฝึกอบรม โดยควรเป็นการฝึกอบรมก่อนเริ่มโครงการ โดยเฉพาะอย่างยิ่งการฝึกอบรมเกี่ยวกับเครื่องมือที่องค์กรจะใช้พัฒนา ทั้งนี้อาจเป็นการฝึกอบรมจากบริษัทผู้ขาย
ควรหาบุคลากรที่มีประสบการณ์ในการพัฒนาคลังข้อมูลเพื่อทำหน้าที่เป็นผู้จัดการโครงการหรือถ้าในองค์กรไม่เคยมีประสบการณ์เลย อาจจ้างที่ปรึกษาที่มีความเชี่ยวชาญและมีประสบการณ์ด้านนี้โดยเฉพาะมาช่วยทีมพัฒนา
โปรแกรมที่จะใช้นำเสนอข้อมูลในคลังข้อมูล ต้องสามารถเรียนรู้ได้ง่ายและผู้ใช้สามารถใช้งานได้อย่างมีประสิทธิภาพ
3.แนวคิดเกี่ยวกับคลังข้อมูล3.1 นิยามของคลังข้อมูลคลังข้อมูล หมายถึง ฐานข้อมูลขนาดใหญ่ขององค์กรหรือหน่วยงานหนึ่งๆ ซึ่งเก็บรวบรวมข้อมูลจากฐานข้อมูลระบบงานประจำวัน หรือเรียกอีกอย่างว่า operational database และฐานข้อมูลอื่นภายนอกองค์กร หรือเรียกว่า external database โดยข้อมูลที่ถูกจัดเก็บในคลังข้อมูลนั้น มีวัตถุประสงค์ในการนำมาใช้งานและมีลักษณะของการจัดเก็บแตกต่างไปจากข้อมูลในฐานข้อมูลระบบงานอื่น โดยข้อมูลในคลังข้อมูลจะถูกนำมาใช้เพื่อสนับสนุนการตัดสินใจบริหารงานของผู้บริหาร โดยเฉพาะการเป็นข้อมูลพื้นฐานให้กับระบบงาน เพื่อการบริหารงานอื่น เช่น ระบบ DSS และระบบ CRM เป็นต้น3.2 คุณลักษณะเฉพาะของคลังข้อมูลจากนิยามของคลังข้อมูลที่บอกถึงความแตกต่างกันระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ ซึ่งสามารถสรุปคุณลักษณะของคลังข้อมูลได้ดังนี้1. Subject oriented หรือการแบ่งโครงสร้างตามเนื้อหา หมายถึง คลังข้อมูลถูกออกแบบมาเพื่อมุ่งเน้นไปในแต่ละเนื้อหาที่สนใจ ไม่ได้เน้นไปที่การทำงานหรือกระบวนการแต่ละอย่างโดยเฉพาะเหมือนอย่างฐานข้อมูลปฏิบัติการในส่วนของรายละเอียดข้อมูลที่จัดเก็บในระบบทั้งสองแบบก็จะแตกต่างกันไปตามความต้องการใช้งานด้วยเช่นกัน คลังข้อมูลจะไม่จำกัดเก็บข้อมูลที่ไม่มีส่วนเกี่ยวข้องกับการประมวลผลเพื่อสนับสนุนการตัดสินใจ ในขณะที่ข้อมูลนั้นจะถูกเก็บไว้ในฐานข้อมูลปฏิบัติการหากมีส่วนที่เกี่ยวข้องกับกระบวนการทำงาน2. Integration หรือการรวมเป็นหนึ่ง ซึ่งถือได้ว่าเป็นคุณลักษณะที่สำคัญที่สุดของคลังข้อมูล คือการรวบรวมข้อมูลจากหลายฐานข้อมูลปฏิบัติการเข้าด้วยกัน และทำให้ข้อมูลมีมาตราฐานเดียวกัน เช่นกำหนดให้มีค่าตัวแปรของข้อมูลในเนื่อหาเดียวกันให้เป็นแบบเดียวกันทั้งหมด3. Time variancy หรือความสัมพันธ์กับเวลา หมายถึงข้อมูลในคลังข้อมูล จะต้องจัดเก็บโดยกำหนดช่วงเวลาเอาไว้ โดยจะสัมพันธ์กับการดำเนินธุรกิจของหน่วยธุรกิจนั้น เพราะในการตัดสินด้านการบริหารจำเป็นต้องมีข้อมูลเปรียบเทียบในแต่ละช่วงเวลา แต่ละจุดของข้อมูลจะเกี่ยวข้องกับจุดของเวลาและข้อมูลแต่ละจุดสามารถเปรียบเทียบกันได้ตามแกนของเวลา4. Nonvolatile หรือความเสถียรของข้อมูล หมายถึงข้อมูลในคลังข้อมูลจะไม่เปลี่ยนแปลงบ่อย ไม่ว่าจะเป็นการเพิ่มเติมข้อมูลใหม่ หรือการปรับปรุงแก้ไขข้อมูลเดิมที่บรรจุอยู่แล้ว ผู้ใช้ทำได้เพียงการเข้าถึงข้อมูลเท่านั้น
4. สถาปัตยกรรมคลังข้อมูล (Data Wharehouse Architrcture- DWA)DWA เป็นโครงสร้างมาตราฐานที่ใช้บ่อย เพื่อให้เข้าใจแนวคิด และกระบวนการของคลังข้อมูลนั้นๆ ซึ่งโดยทั่วไปแล้วคลังข้อมูลแต่ละระบบอาจจะมีรูปแบบที่ไม่เหมือนกันได้ เพื่อให้เหมาะสมกับองค์กรนั้นๆ ทั้งนี้ส่วนประกอบต่างๆ ภายใน DWA ที่สำคัฯได้แก่1. Operational database หรือ external database layer ทำหน้าที่จัดการกับข้อมูลในระบบงานปฏิบัติการหรือแหล่งข้อมูลภายนอกองค์กร2. Information access layer เป็นส่วนที่ผู้ใช้ปลายทางติดต่อผ่านโดยตรง ประกอบด้วยฮาร์ดแวร์และซอฟต์แวร์ ที่ใช้ในการแสดงผลเพื่อวิเคราะห์ โดยมีเครื่องมือช่วย เป็นตัวกลางที่ผู้ใช้ใช้ติดต่อกับคลังข้อมูล โดยในปัจจุบันเครื่องมือที่ได้รับความนิยมเพิ่มขึ้นอย่างรวดเร็วนั้นคือ Online Analytical Processing Tool หรือ OLAP tool ซึ่งเป็นเครื่องมือที่มีความสามารถในการวิเคราะห์ที่ซับซ้อน และแสดงข้อมูลในรูปแบบหลายมิติ3. Data access layer เป็นส่วนต่อประสานระหว่าง Information access layer กับ operational layer4. Data directory (metadata) layer เพื่อให้เข้าใจถึงข้อมูลได้ง่ายขึ้น และเป็นการเพิ่มความเร็วในการเรียกและดึงข้อมูลของคลังข้อมูล5. Process management layer ทำหน้าที่จัดการกระบวนการทำงานทั้งหมด6. Application messaging layer เป็นมิดเดิลแวร์ ทำหน้าที่ในการส่งข้อมูลภายในองค์กรผ่านทางเคลือข่าย7. Data warehouse (physical) layer เป็นแหล่งเก็บข้อมูลของทั้ง information data และ external data ในรูปแบบที่ง่ายแก่การเข้าถึงและยืดหยุ่นได้8. Data staging layer เป็นกระบวนการการแก้ไข และดึงข้อมูลจาก external database
5. เทคนิคในการสร้างคลังข้อมูล5.1 การเคลื่อนที่ของข้อมูลในคลังข้อมูลข้อมูลที่จัดเก็บภายในคลังข้อมูลมีการเคลื่อนที่ของข้อมูล (information flow) 5 ประเภท ดังนี้1. Inflow คือการนำข้อมูลจากฐานข้อมูลอื่นเข้าสู่คลังข้อมูลทั้งฐานข้อมูลภายในและภายนอกองค์กร โดยในขั้นนี้อาจมีการเปลี่ยนแปลงโรงสร้างข้อมูล การทำ denormalize การลบหรือการเพิ่มฟิลด์เพื่อให้ข้อมูลทั้งหมดอยู่ในเนื้อหาที่สนใจเดียวกัน ในขั้นตอนนี้อาจใช้เครื่องมือที่เรียกว่า data warehouse tool2. Upflow เมื่อข้อมูลที่เราต้องการอยู่ในคลังข้อมูลแล้ว ในบางครั้งอาจต้องมีการเพิ่มคุณค่าให้กับข้อมูลด้วยเพื่อให้ข้อมูลอยู่ในรูปแบบที่เป็นประโยชน์มากที่สุดต่อการนำเครื่องมือมาใช้ ซึ่งได้แก่การจัดกลุ่มข้อมูลหาค่าทางสถิติที่ซับซ้อน จัดข้อมูลให้อยู่ในรูปแบบหรือเทมเพลตมาตราฐาน3. Downflow เป็นขั้นตอนของการปรับปรุงเปลี่ยนแปลงข้อมูลเก่า และไม่อยู่ในเนื่อหาที่องค์กรสนใจออกไปจากคลังข้อมูลขององค์กร4. Outflow เป็นขั้นตอนที่ผู้ใช้เรียกใช้ข้อมูลในคลังข้อมูลผ่านเครื่องมือต่างๆ โดยการเรียกใช้อาจมีเพียงขอเรียกเป็นครั้งคราวเป็นประจำทุกวัน/เดือน หรือแม้กระทั่งต้องการแบบทันที5. Metaflow ข้อมูลที่จัดเก็บในคลังข้อมูลจะถูกทำข้อมูลไว้อีกชุดหนึ่ง เป็นแหล่งที่มาของข้อมูลนั้น หรือแม้กระทั่งที่อยู่ของข้อมูลนั้นในคลังข้อมูลและข้อมูลอื่นที่เกี่ยวข้อง5.2 วิธีการออกแบบฐานข้อมูลสำหรับคลังข้อมูลวิธีการนี้ถูกเสนอโดย Kimball ในปี 1996 เรียกว่าระเบียบวิธี 9 ชั้น หรือ Nine-Step Methodology โดยวิธีการนี้เริ่มจากการออกแบบจากส่วนย่อยที่แสดงถึงแต่ละระบบงานขององค์กร หรือเรียกอีกอย่างหนึ่งว่าดาต้ามาร์ท (data mart) โดยเมื่อออกแบบแต่ละส่วนสำเร็จแล้ว จึงนำมารวมกันเป็นคลังข้อมูล ขององค์กรในขั้นสุดท้าย ซึ่งขั้นตอนทั้ง 9 ขั้นตอน มีรายละเอียดดังนี้1. กำหนดดาต้ามาร์ท คือการเลือกว่าจะสร้างดาต้ามาร์ทของระบบงานใดบ้าง และระบบงานใดเป็นระบบงานแรกโดยองค์กรจะต้องสร้าง E-R model ที่รวมระบบงานทุกระบบขององค์กรไว้ แสดงการเชื่อมโยงของแต่ละระบบงานอย่างชัดเจน และสิ่งที่ต้องคำนึงถึงในการเลือกระบบงานที่จะเป็นดาต้ามาร์ทแรกนั้น มี 3 ปัจจัยที่เกี่ยวข้อง ได้แก่ จะต้องสามารถพัฒนาออกมาได้ทันตามเวลาที่ต้องการ โดยอยู่ในงบประมาณที่กำหนดไว้และต้องตอบปัญหาทางธุรกิจให้แก่องค์กรได้ ดังนั้นดาต้ามาร์ทแรกควรจะเป็นของระบบงานที่นำรายได้เข้ามาสู่องค์กรได้ เช่น ระบบงานขาย เป็นต้น2. กำหนด fact table ของดาต้ามาร์ท คือกำหนดเนื่อหาหลักที่ควรจะเป็นของดาต้ามาร์ท โดยการเลือกเอนทิตีหลักและกระบวนการที่เกี่ยวกับเอนทริตีนั้นๆ ออกมาจาก E-R model ขององค์กร นั้นหมายถึงว่าจะทำให้เราทราบถึง dimension table ที่ควรจะมีด้วย3. กำหนดแอตทริบิวต์ที่จำเป็นในแต่ละ dimension table คือการกำหนดแอตทริบิวต์ที่บอกหรืออธิบายรายละเอียดของ dimension ได้ ทั้งนี้แอตทริบิวต์ที่เป็น primary key ควรเป็นค่าที่คำนวณได้ กรณีที่มีดาต้ามาร์ทมากกว่าหนึ่งดาต้ามาร์ทมี dimension เหมือนกัน นั่นหมายถึงว่า แอตทริบิวตืใน dimension นั้นจะต้องเหมือนกันทุกประการ นั้นไม่อาจจะแก้ไขปัญหาการจัดเก็บข้อมูลซ้ำซ้อน อันนำมาสู่ความแตกต่างกันของข้อมูลชุดเดียวกัน ปัญหานี้จึงเป็นการดีที่จะมีการใช้ dimension table ร่วมกันในแต่ละ fact table ที่จำเป็นต้องมี dimension ดังกล่าว โดยเรียก dimension table ลักษณะแบบนี้ว่า comformed และเรียก fact table ว่า fact constellation เราสามารถกำหนดข้อดีของการใช้ dimension table ร่วมกันได้ดังนี้(1) แน่ใจได้ว่าในแต่ละรายงานจะออกมาสอดคล้องกัน(2) สามารถสร้างดาต้ามาร์ทในเวลาต่างๆ กันได้(3) สามารถเข้าถึงดาต้ามาร์ทโดยผู้พัฒนากลุ่มอื่นๆ(4) สามารถรวบรวมดาต้ามาร์ทหลายๆ อันเข้าด้วยกัน(5) สามารถออกแบบคลังข้อมูลร่วมกันได้4. กำหนดแอตทริบิวต์ที่จำเป็นใน fact table โดยแอตทริบิวต์หลักใน fact table จะมาจาก primary key ในแต่ละ dimension table นอกจากนี้แล้ว ยังสามารถมีแอตทริบิวต์ที่จำเป็นอื่นๆ ประกอบอยู่ด้วย เช่น แอตทริบิวต์ที่ได้จากการคำนวณค่าเบื่องต้นที่จำเป็นสำหรับการคงอยู่ของแอตทริบิวต์อื่นใน fact table เรียกอีกอย่างหนึ่งว่า measure การกำหนดแอตทริบิวต์นี้ไม่ควรจะเลือกแอตทริบิวต์ที่คำนวณไม่ได้ เช่นเป็นตัวหนังสือหรือไม่ใช่ตัวเลข เป็นต้น และไม่ควรเลือกแอตทริบิวต์ที่ไม่เกี่ยวข้องกับเนื่อหาของ fact table ที่เราสนใจด้วย5. จัดเก็บค่าการคำนวณเบื้องต้นใน fact table คือการจัดเก็บที่ได้จากการคำนวณให้เป็นแอตทริบิวต์ใน fact table ถึงแม้ว่าจะสามารถหาค่าได้จากแอตทริบิวต์อื่นๆ ก็ตาม ทั้งนี้เพื่อให้การสอบถามมีประสิทธิภาพมากขึ้น สามารถทำงานด้วยความเร็วที่เพิ่มขึ้น เนื่องจากไม่ต้องคำนวณค่าใหม่ทั้งหมด ถึงแม้ว่าจะเกิดความซ้ำซ้อนของข้อมูลในการจัดเก็บบ้างก็ตาม6. เขียนคำอธิบาย dimension table ทั้งนี้ก็เพื่อให้ผู้ใช้สามารถใช้งานดาต้ามาร์ทได้อย่างมีประสิทธิภาพเพราะเกิดความเข้าใจอย่างดีในส่วนต่างๆ7. กำหนดระยะเวลาในการจัดเก็บข้อมูลในฐานข้อมูล โดยอาจจะเป็นการจัดเก็บเพียงช่วงระยะเวลา 1-2 ปี หรือนานกว่านั้น ขึ้นอยู่กับความต้องการขององค์กร เนื่องจากองค์กรแต่ละประเภทมีความต้องการในการจัดเก็บข้อมูลต่างช่วงเวลากัน ทั้งนี้ขึ้นอยู่กับความจำเป็นหรือข้อกำหนดในการดำเนินธุรกิจมีข้อสังเกตอยู่ 2 ประการที่น่าสนใจและสำคัญสำหรับการออกแบบแอตทริบิวต์ในเรื่องของการจัดเก็บข้อมูล ดังนี้(1) ข้อมูลที่ถูกจัดเก็บไว้นานเกินไปมักเกิดปัญหาการอ่าน หรือแปลข้อมูลนั้นๆ จากแฟ้มหรือเทปเก่า(2) เมื่อมีการนำรูปแบบเก่าของ dimension table มาใช้อาจเกิดปัญหาการเปลี่ยนแปลงของ dimension อย่างช้าๆ ได้8. การติดตามปัญหาการเปลี่ยนแปลงของ dimension อย่างช้าๆ คือ การเปลี่ยนเอาแอตทริบิวต์ของ dimension table เก่ามาใช้แล้วส่งผลกระทบต่อข้อมูลปัจจุบันของ dimension table โดยสามารถแบ่งประเภทของปัญหาที่เกิดได้ 3 ประเภท ดังนี้(1) เกิดการเขียนทับข้อมูลใหม่โดยข้อมูลเก่า(2) เกิดเรคอร์ดใหม่ๆ ขึ้นใน dimension(3) เกิดเรคอร์ดที่มีทั้งค่าเก่าและใหม่ปนกันไป9. กำหนดคิวรี่เป็นการออกแบบด้านกานภาพเพื่อให้ผู้ใช้เกิดความสะดวกในการใช้งานและสามารถทำงานได้อย่างมีประสิทธิภาพเมื่อดำเนินการทั้ง 9 ขั้นตอนสำหรับแต่ละดาต้ามาร์ทเสร็จแล้ว จึงจะนำทั้งหมดมารวมกันเป็นภาพของคลังข้อมูลขององค์กรต่อไป5.3 การแปลงข้อมูลเข้าสู่ดาต้ามาร์ทเมื่อเราออกแบบฐานข้อมูลสำหรับแต่ละดาต้ามาร์ทเสร็จแล้ว ขั้นตอนต่อไปที่สำคัญยิ่งก็คือการนำข้อมูลจากแหล่งข้อมูลไปแปลงให้อยู่ในแพลตฟอร์มของฐานข้อมูลที่ได้ออกแบบไว้ นั่นก็คือการแปลงข้อมูล หรือ Extraction Transformation and Loading (ETL) นั่นเอง โดยที่คุณภาพของการแปลงข้อมูลเป็นสิ่งสำคัญมากสำหรับการสร้างคลังข้อมูล จะแตกต่างกันไปตามคลังข้อมูลที่แต่ละองค์กรต้องการ โดยที่การแปลงข้อมูลหมายรวมตั้งแต่การวิเคราะห์แหล่งข้อมูล กำหนดการส่งข้อมูลรวบรวมหรือสร้างข้อมูลภายนอก วางแผนและสร้างรูทีนของการแปลงข้อมูล และตรวจสอบความถูกต้องของข้อมูลที่ได้สามารถสรุปเป็นขั้นตอนได้ดังนี้1. วิเคราะห์แหล่งข้อมูล เช่น ปริมาณของข้อมูล จำนวนและชนิดของการเข้าถึงแหล่งข้อมูล แพลตฟอร์มและภาษาโปรแกรมที่ใช้ เป็นต้น2. ย้ายข้อมูลที่ต้องการจากระบบเดิมมาไว้ในบริเวณที่ใช้ปรับแต่งข้อมูล หรือเรียกบริเวณนี้ว่า staging area เพื่อนำมาเลือกเฉพาะส่วนที่ต้องการแปลงข้อมูลและตรวจสอบความถูกต้อง หรือการทำความสะอาดข้อมูล3. กำหนด primary key ของ fact table และ dimension table และกำหนด foreign key ระหว่าง fact table กับ dimension table4. ย้ายข้อมูลที่ทำความสะอาดแล้วจาก staging area ลงสู่เซิร์ฟเวอร์ของดาต้ามาร์ท5. สร้าง metadata ของแต่ละดาต้ามาร์ท โดยเก็บรายละเอียดของข้อมูลการอัปเดตและส่งออกไปไว้ในดาต้ามาร์ท6. ตรวจสอบความถูกต้องของข้อมูล ซึ่งจะต้องกระทำตลอดทั้งกระบวนการแปลงข้อมูลจำทำได้ดังนี้(1) ตรวจสอบผลรวมทั้งหมดของจำนวนข้อมูลที่ดึงมาจากแหล่งข้อมูลที่เพิ่มเข้าไป(2) ตรวจแก้ข้อมูลในระบบเดิมของแหล่งข้อมูล หรือในรูทีนของการแปลง ซึ่งควรจะเก็บข้อมูลในการตรวจแก้ไว้ใน metadata ของการแปลงข้อมูลด้วย(3) ตรวจสอบค่าของข้อมูลให้ถูกต้องในกระบวนการรวบรวมข้อมูล(4) ตรวจสอบผลรวมของข้อมูลหลังจากย้ายข้อมูลลงสู่ดาต้ามาร์ทแล้ว
6. สรุปคลังข้อมูลเป็นการรวบรวมข้อมูลจากฐานข้อมูลของระบบงานปฏิบัติงานประจำวันขององค์กร แล้วนำมาแปลงข้อมูลให้อยู่ในรูปแบบ ที่เหมาะสมในการเก็บและสะดวกในการใช้งาน แล้วจึงนำข้อมูลนั้นเข้าไปเก็บในคลังข้อมูลการพัฒนาหรือสร้างคลังข้อมูลจากฐานข้อมูลจะต้องมีการพิจารณาถึงองคืประกอบที่จำเป็นในการสร้างให้เหมาะสมด้วย ทั้งนี้เพื่อให้เกิดความคุ้มค่าในการลงทุนและเกิดประโยชน์สูงสุดต่อองค์กร ถึงแม้ว่าเทคโนโลยีคลังข้อมูล จะให้ประสิทธิภาพในการใช้ข้อมูลอย่างมากก็ตาม แต่สิ่งที่ต้องคำนึงด้วยคือทรัพยากรที่องค์กรจะต้องทุ่มเทลงไปในการพัฒนาที่อาจจะเกิดขึ้นจนองค์กรไม่สามารถจะพัฒนาระบบนี้จนสำเร็จ และนำมาใช้งานได้ เกิดการลงทุนที่สูญเปล่า ดังนั้นจึงต้องมีการวางแผนควบคุมและจัดการให้รอบคอบ

Data mining


ความรู้พื้นฐานเกี่ยวกับดาต้าไมนิ่ง
2.1 ความหมายของดาต้าไมนิ่ง ดาต้าไมนิ่ง(Data Mining) คือการค้นหาความสัมพันธ์และรูปแบบทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูล แต่ได้ถูกซ่อนไว้ภายในข้อมูลจํานวนมาก ดาต้าไมนิ่งจะทําการสํารวจละวิเคราะห์อย่างอัตโนมัติหรือกึ่งอัตโนมัติ ในปริมาณข้อมูลจํานวนมากให้อยู่ในรูปแบบที่เต็มไปด้วยความหมายและอยู่ในรูปของกฎ โดยความสัมพันธ์เหล่านี้แสดงให้เห็นถึงความรู้ต่างๆที่มีประโยชน์ในฐานข้อมูล ในปัจจุบันองค์กรส่วนใหญ่จะเผชิญกับปัญหาของ “ข้อมูลดิบจํานวนมากแต่ข้อมูลที่ประยุกต้ใช้ ได้นั้นมีน้อย” ดาต้าไมนิ่งจึงเป็นสาขาที่คาดว่าจะเป็นที่รู้จักและนํามาใช้ประยุกต์ใช้อย่างแพร่หลาย เนื่องจากดาต้าไมนิ่งสามารถดึคามรู้ออกมาจากข้อมูลจํานวนมากที่ถูกเก็บสะสมไว้ ในโลกของธุรกิจปัจจุบันบริษัทต่างๆจะพยายามหาเทคนิคที่สามารถนําความสําเร็จมาสู่บริษัท เช่น ในโลกธุรกิจขนาดย่อมจะสร้างความสัมพันธ์กับลูกค้า โดยสังเกตจากความต้องการ ความชอบและความสนใจของลูกค้า และอาจมีการเรียนรู้ได้จากผลสะท้อนในอดีตว่าจะทําอย่างไรให้การบริการลูกค้ามีประสิทธิภาพดีขึ้นในอนาคต หรือ บริษัทที่เป.นผู.ออกบัตรเครดิตและธนาคารต่างๆ จะมีขบวนการที่ใช้ ดาต้าไมนิ่งให้เป็นประโยชน์ ในการตัดสินใจว่าลูกค้ากลุ่มใดเป็นกลุ่มที่ดี , ทําความเข้าใจลูกค้า , ช่วยในการแยกประเภทของลูกค้าและจะทํานายกลุ่มของประชากรที่คาดว่าจะมาเป็นลูกค้าในอนาคต เป็นต้น อย่างไรก็ตามการเรียนรู้นั้นต้องมากกว่าการเก็บสะสมข้อมูลอย่างตรงไปตรงมา ซึ่งจะทําให้การทํางานไม่ เป็นประสิทธิภาพ
2.2 วัฎจักรขั้นตอนการทํางานของดาต้าไมนิ่ง วัฎจักรขั้นตอนการทํางานของดาต้าไมนิ่งประกอบไปด้วย 4 ขั้นตอนหลักๆ ดังนี้
2.2.1 การระบุโอกาสทางธุรกิจหรือการระบุปัญหาที่เกิดขึ้นกับธุรกิจ เป็นการระบุขอบเขตของข้อมูลที่จะนํามาทําการวิเคราะห์เพื่อหาความได้เปรียบทางการตลาดหรือเพื่อนํามาทําการแก้ไขปัญหา
2.2.2 ส่วนของดาต้าไมนิ่ง เป็นการนําเทคนิคของดาต้าไมนิ่ง ไปใช้ถ่ายทอดหรือทําการเปลี่ยนแปลงข้อมูลดิบให้อยู่ในรูปของข้อมูลที่จะนําไปใช้ได้จริงในทางธุรกิจ
2.2.3 การปฏิบัติตามข.อมูล คือการนําเอาข.อมูลที่เป.นผลลัพธ.ของส.วนดาต.าไมนิ่งมาลองปฏิบัติจริงกับธุรกิจ
2.2.4 การวัดประสิทธิภาพจากผลลัพธ์ การวัดประสิทธิภาพของเทคนิคของดาต้าไมนิ่งที่จะนํามาใช้จากผลลัพธ์ ซึ่งสามารถตรวจสอบได้หลายทาง เช่น วัดจากส่วนแบ่งของตลาด , วัดจากปริมาณลูกค้า หรือ วัดจากกําไรสุทธิ เป็นต้น จากทั้ง 4 ขั้นตอนที่กล่าวมาข้างต้นคือการนําเอาดาต้าไมนิ่งไปใช้กับระบบทางธุรกิจ โดยแต่ละขั้นตอนจะพึ่งพาอาศัยกัน ผลลัพธ์จากขั้นตอนหนึ่งจะกลายมาเป็นอินพุทจากอีกขั้นตอนต่อไป ซึ่งดาต้าไมนิ่งจะเปลี่ยนข้อมูลดิบให้เป็นข้อมูลประยุกต์ ดังนั้นการระบุแหล่งข้อมูลที่ถูกต้องจึงเป็นสิ่งที่สําคัญอย่างยิ่งต่อผลลัพธ์ที่ได้จากการวิเคราะห์
2.3 งานของดาต้าไมนิ่ง (Task of data mining) ในทางปฏิบัติจริงดาต้าไมนิ่งจะประสบความสําเร็จกับงานบางกลุ่มเท่านั้น และต้องอยู่ภายใต้ ภาวะที่จัด ปัญหาเหมาะสมกับการใช้เทคนิคดาต้าไมนิ่งจะเป็นปัญหาที่ต้องใช้เหตุผลในการแก้, ปัญหาที่เกียวข้องกับเศรษฐศาสตร์และการเงิน ซึ่งจะสามารถจัดรูปแบบของธูรกิจให้อยู่ในรูปแบบของงานทั้ง 6 งานได้ ดังนี้
1. การจัดหมวดหมู่ (Classification)
2. การประเมินค่า (Estimation)
3. การทํานายล่วงหน้า (Prediction)
4. การจัดกลุ่มโดยอาศัยความใกล้ชิด (Affinity Group)
5. การรวมตัว (Clustering)
6. การบรรยาย (Description) ไม่มีเทคนิคหรือเครื่องมือเพียงชนิดเดียวของดาต้าไมนิ่งที่เหมาะสมกับงานทุกชนิด งานในแต่ล.ะชนิดก็จะมีเทคนิคของดาต้าไมนิ่งที่แตกต่างกันไปขึ้นอยู่กับชนิดของงาน
2.3.1 การจัดหมวดหมู่ การจัดหมวดหมู่ถือว่าเป็นงานธรรมดาทั่วไปของดาต้าไมนิ่ง เพราะการทําความเข้าใจและการติดต่อสื่อสารต่างๆ ก็เกี่ยวข้องกับการแบ่งเป็นหมวดหมู่ , การจัดแยกประเภท และการแบ่งแยกชนิด โดยการจัดหมวดหมู่ประกอบด้วยการสํารวจจุดเด่นของวัตถุที่ปรากฏออกมา และทําการกําหนดจุดเด่นนั้นๆ เป็นตัวที่ใช้แบ่งหมวดหมู่ งานในการแบ่งหมวดหมู่ คือการบ่งบอกลักษณะ โดยการอธิบายจุดเด่นที่เป็นที่รู้จักดีในหมวดหมู่นั้น และเทรนนิ่งเซต (Training Set) ของตัวอย่างในแต่ละหมวดหมู่ ซึ่งมีภาระหน้าที่ในการสร้างโมเดลของบางชนิดที่ไม่สามารถจะจัดหมวดหมู่ของข้อมูลได้ ให้สามารถจัดเป็นหมวดหมู่ได้ ตัวอย่างของการจัดหมวดหมู่ เช่น การจัดหมวดหมู่ของผู้ยื่นขอเครดิต เป็นระดับต่ำ ระดับกลาง และระดับสูง ของความเสี่ยงที่จะได้รับ เป็นต้น
2.3.2 การประเมินค่า การประเมินค่าทางธุรกิจอย่างต่อเนื่องจะก่อให้เกิดผลลัพธ์ที่มีประโยชน์กับธูรกิจ การป้อนข้อมูลที่เรามีอยู่เข้าไป เพื่อใช้ในการประเมินสิ่งต่างๆ ที่จะก่อให้เกิดประโยชน์ หรือสําหรับตัวแปรที่เราไม่รู้ค่าแน่นอน เช่น รายได้จากการค่า ,จุดสูงสุดทางธุรกิจ หรือดุลยภาพของบัตรเครดิต ในทางปฏิบัติการประเมินค่าจะถูกใช้ในการทํางานการจัดหมวดหมู่ ตัวอย่างของการประเมินค่าเช่น การประเมินรายได้รวมของครอบครัว หรือการประเมินจํานวนบุตรในครอบครัว
2.3.3 การทํานายล่วงหน้า การทํานายล่วงหน้าก็เป็นงานที่มีลักษณะคล้ายกับการจัดหมวดหมู่หรือการประเมินค่า ยกเว้นเพียงแต่จะใช้สถิติการบันทึกของการจัดหมวดหมู่ในการทํานายอนาคตของพฤติกรรมหรือการประเมินค่าที่จะเกิดขึ้นในอนาคต ตัวอย่างของงานการทํานายล่วงหน้า เช่น การทํานายการเปลี่ยนแปลงพฤติกรรมของตลาด หรือการทํานายจํานวนลูกค้าที่จะออกจากธุรกิจของเราใน 6 เดือนข้างหน้า เป็นต้น
2.3.4 การจัดกลุ่มโดยอาศัยความใกล้ชิดกันหรือการวิเคราะห์ของตลาด งานในการจัดกลุ่มหรือการวิเคราะห์ตลาด คือการตัดสินใจรวมสิ่งที่สามารถไปด้วยกันเข้าไว้ในกลุ่มเดียวกัน ตัวอย่างของการจัดกลุ่มโดยอาศัยความใกล้ชิดกันหรือการวิเคราะห์ของตลาด เช่น การตัดสินใจวาสิ่งใดบ้างที่จะไปอยู่ด้วยกันอย่างสม่ำเสมอในรถเข็นในซุปเปอร์มาร์เก็ต
2.3.5 การรวมตัว การรวมตัวคืองานที่ทําการรวมส่วนต่างๆ ในแต่ละส่วนที่ต่างชนิดกันให้อยู่ในรวมกันเป็นกลุ่มย่อย หรือคลัสเตอร์ โดยในแต่ละคลัสเตอร์อาจจะประกอบด้วยส่วนต่างๆที่ต่างชนิดกัน ซึ่งความแตกต่างของการรวมตัวจากการจัดหมวดหมู่ คือ การรวมตัวจะไม่พึ่งพาอาศัยการกําหนดหมวดหมู่ล่วงหน้า และไม่ ใช้ตัวอย่าง ข้อมูลจะรวมตัวกันบนพื้นฐานของความคล้ายในตัวเอง
2.3.6 การบรรยาย ในบางครั้งวัตถุประสงค์ของดาต้าไมนิ่ง คือต้องการอธิบายความสับสนของฐานข้อมูลในทางที่จะเพิ่มความเข้าใจในส่วนของประชากร , ผลิตภัณฑ์ , หรือขบวนการให้มากขึ้น เทคนิคดาต้าไมนิ่งส่วนใหญ่ต้องการเทรนนิ่งข้อมูลจํานวนมากที่ประกอบด้วยหลายๆ ตัวอย่างเพื่อจะสร้างกฎที่ใช้ในการจัดหมวดหมู่ , กฎของความสัมพันธ์, คลัสเตอร์ ,การทํานายล่วงหน้า ดังนั้นชุดของข้อมูลขนาดเล็กจะนําไปสู่ความไม่น่าไว้วางใจของผลสรุปทีได้ ไม่มีเทคนิคใดเลยที่จะสามารถแก้ปัญหาของดาต้าไมนิ่งได้ทุกปัญหา ดังนั้นความหลากหลายของเทคนิคจึงเป็นสิ่งที่จําเป็นในการไปสู่วิธีการแก้ปัญหาของดาต้าไมนิ่งได้ดีที่สุด
2.4 เทคนิคของดาต้าไมนิ่ง การแก้ปัญหาของงานชนิดต่างๆ โดยใช้วิธีดาต้าไมนิ่ง ในแต่ละงานก็จะมีเทคนิคของดาต้าไมนิ่งที่จะนํามาใช้ได้อย่างเหมาะสม โดยเทคนิคของดาต้าไมนิ่งนั้นมีมากมาย ซึ่งจะขอยกตัวอย่างของเทคนิคที่ถูกใช้กันค่อนข้างแพร่หลาย
2.4.1 นิวรอนเน็ตเวิร์ก นิวรอนเน็ตเวิร์ก คือระบบทีมีการประมวลผลข้อมูลซึ่งรวมคุณสมบัติของไบโอลอจิกคอลนิวรอนเน็ตเวิร์ก ถูกพัฒนาขึ้นโดยโมเดลทางคณิตศาสตร์ของกระบวนการเรียนรู้ของมนุษย์ และจะเรียนรู้ จากชุดข้อมูลของชุดความรู้ (Training Set) นิวรอนเน็ตเวิร์ก ประกอบด้วยหน่วยความจําจํานวนมากเรียกว่า นิวรอน , เซลหรือโหนด แต่ละนิวรอนต่อกันโดยคอนเน็กชั้นลิ่ง (Connection Link) ที่ค่าน้ำาหนัก (Weight) ของมันอยู่ โดยค่าน้ำาหนักจะแสดงรายละเอียดที่เน็ตเวิร์กใช้ในการแก้ปัญหา โดยนิวรอนเนตเวิร์กถูกใช้ในการแก้ปัญหาอย่างกว้างขวาง เช่น การเก็บและการเรียกข้อมูล, การแยกประเภทของข้อมูล, การเปลี่ยนจากรูปแบบของอินพุทให้อยู่ในรูปแบบของเอาท์พุท, ความสามารถในการตรวจสอบรูปแบบของข้อมูลที่คล้ายคลึงกับความคิดของมนุษย์ เป็นต้น ถึงแม้ว่านิวรอนเน็ตเวิร์ก สามารถนําไปประยุกต์ใช้กับงานหลายๆ ชนิดได้อย่างมีประสิทธิภาพ แต่นิวรอนเน็ตเวิร์ก ก็ยังมีข้อเสียอยู่บ้าง ดังนี้
1. นิวรอนเน็ตเวิร์กเป็นวิธีที่ยากต่อการทําความเข้าใจในโมเดลที่ถูกผลิตออกมา
2. นิวรอนเน็ตเวิร์กมีคุณสมบัติที่ไวต่อรูปแบบของอินพุท ถ้าเราแทนข้อมูลด้วยรูปแบบที่แตกต่างกันก็จะสามารถผลิตผลลัพธ์ที่แตกต่างกันออกมา ดังนั้นการกําหนดค่าเริ่มต้นให้กับข้อมูลจึงเป้นส่วนที่มีความสําคัญส่วนหนึ่ง
2.4.2 จีเนติก อัลกอริทึ่ม (Genetic Algorithms : GA) จีเนติก อัลกอริทึ่ม เป็นทฤษฎีที่จําลองกระบวนการวิวัฒนาการทางธรรมชาติ คือการคัดเลือกทางธรรมชาติ ละอาศัยพื้นฐานความคิดทางพันธุกรรมในการถ่ายทอดลักษณะต่างๆ ไปยังรุ่นถัดไป ที่สามารถนํามาพัฒนาใช้ในการหาคําตอบที่เหมาะสมที่สุดของแต่ละปัญหา จีเนติก อัลกอริทึ่มเป็นวิธีการหาคําตอบโดยการพิจารณา และดําเนินการจากกลุ.มของคําตอบของปัญหาที่ถูกสร้างขึ้นมาโดยการเข้ารหัส คือการแปลงค่าตัวแปรหรือพารามิเตอร์ของปัญหาให้อยู่ในรูปโครงสร้างของโครโมโซมที่กําหนด เพื่อคัดเลือกโครโมโซมคําตอบที่เหมาะสมสําหรับสร้างวิวัฒนาการของคําตอบให้ดีขึ้นตามกระบวนการทางพันธุศาสตร์ โดยการแลกเปลี่ยนค่าพารามิเตอร์ต่างๆ ระหว่างโครโมโซมที่ถูกคัดเลือกอันจะทําให้คําตอบของปัญหาถูกปรับปรุงให้ดีขึ้น จีเนติก อัลกอริทึ่มใช.กระบวนการหลักๆ 3 กระบวนการในการหาคําตอบที่ใกล้เคียงหรือดีที่สุดของปัญหาดังนี้
1. การคัดเลือก (Selection)
2. การครอสโอเวอร์ (Crossover)
3. การมิวเตชั่น (Mutation) ถึงแม้ว่าในปัจจุบันจีเนติก อัลกอริทึ่ม ยังเป็นวิธีการที่ไม่ได้แพร่หลายนัก แต่สาขาวิชาทางด้าน จีเนติก อัลกอริทึ่มก็นับว่าเป็นอีกสาขาวิชาหนึ่งที่สนใจและน่าจะเป็นวิธีที่ได้รับความนิยมในอีกไม่กี่ปี ข้างหน้า เนื่องมาจากสามารถนํามาประยุกต์ใช้ได้กับหลายๆ ปัญหารวมทั้งปัญหาทางดาต้าไมนิ่งอีกด้วย
2.5 บทสรุป ดาต้าไมนิ่งคือการค้นหาความสัมพันธ์และรูปแบบทั้งหมด ซึ่งมีอยู่จริงในฐานข้อมูล แต่ได้ถกซ่อนไว้ภายในข้อมูลจํานวนมากอย่างอัตโนมัติหรือกึ่งอัตโนมัติ โดยดาต้าไมนิ่งจะเหมาะกับการแก้ปัญหาบางชนิดเท่านั้น เช่น ปัญหาที่ต้องใช้เหตุผลในการแก้ หรือปัญหาที่เกี่ยวข้องกับเศรษฐศาสตร์และการเงิน เป็นต้น ดาต้าไมนิ่งมีเทคนิคต่าง ๆ ที่ใช้ในการแก้ปัญหาอยู่หลายเทคนิค ซึ่งจะไม่มีเทคนิคใดเลยที่สามารถแก้ปัญหาของดาต้าไมนิ่งได้ทุกปัญหา ดังนั้นความหลากหลายของเทคนิคเป็นสิ่งที่จําเป็นที่จะนําไปสู่วิธีการแก้ปัญหาของดาต้าไมนิ่งได้ดีที่สุด

แนะนำตัว




ชญาตรา คำชะนาม


ชื่อเล่น บุ๋ม


เกิดวันที่ 5 ตุลาคม 2519


สถานที่เกิด อ.บึงบูรพ์


ที่อยู่ปัจจุบัน 136 หมู่ 1 ต.แต้


อ.อุทุมพรพิสัย


จ.ศรีสะเกษ 33120


โทคศัพท์045-691085



องค์ความรู้

ชื่อตำแหน่ง เจ้าพนักงานการเงินและบัญชี 3
หน้าที่และความรับผิดชอบ ปฏิบัตงานเกี่ยวกับงานการเงินและบัญชีที่มีหน้าที่ความรับผิดชอบและคุณภาพของงานไม่สูงนัก หรือปฏิบัติงานการเงินและบัญชีที่ยากพอสมควร ภายใต้การกำกับตรวจสอบบ้าง และปฏิบัติหน้าที่อื่นตามที่ได้รับมอบหมาย
ลักษณะงานที่ปฏิบัติ ปฏิบัติงานที่ยากพอสมควร หรือมีความรับผิดชอบไม่สูงนักเกี่ยวกับงานการเงินและบัญชีโดยปฏิบัติหน้าที่อย่างใดอย่างหนึ่ง หรือหลายอย่าง เช่น ตรวจสอบหลักฐาน และใบสำคัญการเบิกจ่ายเงิน จัดทำบัญชีทั่วไปของราชการ เช่น ทำบัญชีเงินสด บัญชีเงินฝากธนาคาร บัญชีแยกประเภท เป็นต้น ช่วยพิจารณา ตั้งงบประมาณหมวดที่ไม่มีปัญหา เช่น ค่าเช่าบ้าน ค่าล่วงเวลา ค่าใช้สอย ค่าวัสดุ เป็นต้น ควบคุมการเบิกจ่ายเงินงบประมาณ ตรวจทางการตั้งฎีกาเบิกจ่าย ทำหนังสือโต้ตอบเกี่ยวกับการเงิน การบัญชี การงบประมาณ จัดสรรเงินงบประมาณ รายจ่ายตามยอดที่ได้รับอนุมัติแล้ว ตรวจสอบงบเดือน ทำรายงานการเงิน ให้คำปรึกษาแนะนำในการปฏิบัติงานแก่เจ้าหน้าที่ระดับรองลงมา ติดต่อประสานงานและปฏิบัติหน้าที่อื่นที่เกี่ยวข้อง
คุณสมบัติเฉพาะสำหรับตำแหน่ง มีคุณสมบัติเฉพาะสำหรับตำแหน่งเจ้าพนักงานการเงินและบัญชี 2 และได้ดำรงตำแหน่งในระดับ 2 หรือที่ ก.อบต. เทียบเท่ามาแล้วไม่น้อยกว่า 2 ปี โดยจะต้องปฏิบัติราชการเกี่ยวกับงานการเงินและบัญชี หรืองานอื่นที่เกี่ยวข้องมาแล้วไม่น้อยกว่า 1 ปี กำหนดเวลา 2 ปี ให้เพิ่มเป็น 3 ปี สำหรับผู้มีคุณสมบัติเฉพาะสำหรับตำแหน่งเจ้าพนักงานการเงินและบัญชี 2 ข้อ 1
ความรู้ความสามารถที่ต้องการ นอกจากจะมีความรู้ความสามารถเช่นเดียวกับเจ้าพนักงานการเงินและบัญชี 2 แล้วจะต้อง 1. มีความรู้ทั่วไปเกี่ยวกับเหตุการณ์ปัจจุบันในด้านการเมือง เศรษฐกิจ และสังคม โดยเฉพาะ อย่างยิ่งของประเทศไทย 2. มีความสามารถในการศึกษา หาข้อมูล วิเคราะห์ปัญหาและสรุปเหตุผล
แผนผังองค์กร

พนักงานส่วนตำบล
คณะผู้บริหาร นายประสาน ขันติวงศ์ นายก อบต.
นายวิรัตน์ ยานนท์ รองนายกฯ
นายเทศ ชูเลิศ รองนายกฯ
นายกลม พิมพ์วัน เลขานายกฯ





สำนักปลัด นายอารยะ จันทร์มหา ปลัดองค์การบริหารส่วนตำบล
นายประวินธร ชมภูบุตร จนท.วิเคราะห์นโยบายและแผน
นางสายฝน ชนะสิทธิ์ เจ้าหน้าที่บริหารงานทั่วไป
นายอภิเชษฐ์ หึงขุนทด ผู้ช่วยเจ้าพนักงานธุรการ
นายประยงค์ สิงห์กุรัง นักพัฒนาชุมชน

นายบุญธรรม สงผัด นักการภารโรง


ส่วนการคลัง นางธนาภรณ์ พรหมคุณ หัวหน้าส่วนการคลัง
น.ส.ชญาตรา คำชะนาม เจ้าหน้าที่การเงินและบัญชี (ส่วนการคลัง)
นางพรเพ็ญ พลรัมย์ เจ้าหน้าที่ตรวจสอบภายใน
นางศิรินยา บุญครอบ เจ้าหน้าที่พัสดุ
นางสาวสุพัฒนา สงผัด ผช.จนท.จัดเก็บรายได้


ส่วนการศึกษา ศาสนาและวัฒนธรรม น.ส.จิราวรรณ โสภาค นักวิชาการศึกษา
นางสาวจุฑารัตน์ โสมาลีย์ ผู้ช่วยครูผู้ดูแลเด็กฯ
น.ส.อัจฉราวดี บูรณ์เจริญ ผู้ช่วยครูผู้ดูแลเด็กฯ
น.ส.สมปอง มะโนรัตน์ ผู้ช่วยครูผู้ดูแลเด็ก
นางเฮียม ธงไชย ผู้ช่วยครูผู้ดูแลเด็กฯ




ส่วนโยธา นายบุญกอง พันธ์คำ หัวหน้าส่วนโยธา
น.ส.ยุพิน อุ่นอบ เจ้าหน้าที่ธุรการ (ส่วนโยธา)
นายชานนท์ รู้จิต

วันเสาร์ที่ 16 พฤษภาคม พ.ศ. 2552

สถานที่ทำงาน



ประวัติองค์การบริหารส่วนตำบลเสียว
ประวัติการก่อตั้งหมู่บ้าน บ้านเสียว จากคำบอกเล่าของคนเฒ่าคนแก่ เล่าต่อ ๆ กันมาว่าบรรพบุรุษของบ้านเสียวเดิมอพยพมาจากเวียงจันทร์ประเทศลาว มีท้าวบุญเรืองเป็นหัวหน้าอพยพมาอยู่ในเขตหนองบัวลำภู จ.อุดรธานี (ปัจจุบันเป็น จ.หนองบัวลำภู) ถูกเจ้าถิ่นรังแกจึงอพยพมาอยู่ทางทิศเหนือของบ้านตาโกน (ปัจจุบันเรียกบ้านเสียวเก่า) อยู่ได้ไม่นานเนื่องจากสภาพพื้นที่ไม่เหมาะสม และเกิดอาเพศแผ่นดินแยกแตกเป็นรอยลึก


ในปี พ.ศ. 2323 ท้าวบุญเรืองซึ่งเป็นหัวหน้าได้นำอพยพมาตั้งถิ่นฐานใหม่ใกล้กับหนองน้ำเห็นว่าเป็นพื้นที่อุดมสมบูรณ์จึงเป็นหมู่บ้านให้ชื่อว่า บ้านเสียว ซึ่งให้ชื่อตามชื่อหมู่บ้านเดิมของท้าวบุญเรืองที่อยู่ประเทศลาวก่อนอพยพมา กำนันคนแรกที่ได้รับการแต่งตั้ง คือ นายอ้วน สุมาลีย์ เมื่อ พ.ศ. 2372 ส่วนกำนันคนปัจจุบันคือ นายสีทา แขมคำ


อดีตตำบลเสียว มีอยู่ 15 หมู่บ้านแยกเป็นตำบลอีเซ 6 หมู่บ้าน ปัจจุบันตำบลเสียวมี 17 หมู่บ้าน เป็นเขตการปกครองของ อ.โพธิ์ศรีสุวรรณ จ.ศรีสะเกษ เป็นองค์การบริหารส่วนตำบลเสียว โดยได้รับการยกฐานะเมื่อวันที่ 23 กุมภาพันธ์ 2540