เทคโนโลยีฐานข้อมูล
เทคโนโลยีทางคอมพิวเตอร์ได้มีการพัฒนาอย่างรวดเร็วทั้งในส่วนฮาร์ดแวร์ (Hardware) และซอฟต์แวร์ (Software) โดยเฉพาะในส่วนของฮาร์ดแวร์ได้รับการพัฒนาให้มีประสิทธิภาพสูงขึ้นโดยมีการเพิ่ม ความเร็วในการประมวลผลและสามารถที่จะรองรับงานได้ทั้งในส่วนการประมวลข้อมูล (Data Processing) การประมวลคำ (Word processing) การประมวลผลภาพ (Image processing) ทำให้โปรแกรมที่ใช้ในการจัดการฐานข้อมูลเพื่อการใช้คอมพิวเตอร์ในการเก็บข้อมูลข่าวสาร จะทำให้ผู้ใช้สามารถเรียกข้อมูลข่าวสารนั้นได้อย่างรวดเร็ว นอกจากนั้นยังสามารถทำกรรมวิธีต่างๆ เช่น การเลือก การจัดกลุ่ม การปรับปรุงฯลฯ ได้อีกด้วยในการนำข้อมูลเข้าและออก จึงทำให้ต้องมีโปรแกรมเพื่อจัดข้อมูลเหล่านั้น ซึ่งเรียกว่า ระบบการจัดการ ฐานข้อมูล (Database Management System : DBMS) เทคโนโลยีเหล่านี้ได้รับการพัฒนาอย่างต่อเนื่อง ตั้งแต่อดีตจนถึงปัจจุบัน นิยมเลือกใช้ระบบการจัดการฐาน ข้อมูลที่เป็นแบบ RDBMS (Relational Database Management System) ซึ่งจะจัดการในส่วนของ Back-end ของระบบงานฯ ทั้งหมด ในปัจจุบันมีผู้ผลิต Relational RDBMS ที่มีประสิทธิภาพสูงมากมาย ถ้านักพัฒนาระบบงานฯ สามารถเลือกใช้ให้เหมาะสมกับแต่ละระบบงานฯ ก็จะเกิดประโยชน์และประสิทธิภาพสูงสุด ทั้งในด้านการพัฒนาระบบ งานคอมพิวเตอร์ การใช้งาน ความพอใจของผู้ใช้งานรวมทั้งต้นทุนในการลงทุนอีกด้วย
การจัดการข้อมูล
การจัดการข้อมูล (Data management) ข้อมูล คือข้อเท็จจริงที่เกิดขึ้นของกิจกรรมใดกิจกรรมหนึ่ง โดยการสังเกต การจดบันทึก การสัมภาษณ์และการออกแบบสอบถาม ข้อมูลที่ได้มานั้นยังคงเป็นข้อมูลดิบ ไม่สามารถที่จะนำมาใช้ในการตัดสินใจในการกระทำในเชิงการจัดการและข้อมูลที่รวบรวมมามักจะไม่มีการจัดระเบียบอาจจะมีการซ้ำซ้อนของข้อมูลหรือข้อมูลชนิดเดียวกันอาจจะขัดแย้งกันก็ได้ ดังนั้นองค์การจะต้องมีการวางแผนในการจัดการบริหารฐาน ข้อมูลที่ดีจึงจะได้ประโยชน์จากข้อมูลที่จัดเรียบเรียงไว้
คำนิยามของฐานข้อมูลจึงมีความหมายถึงการเก็บรวบรวมข้อมูลของผู้ใช้และสามารถที่จะนำข้อมูลนั้นออกมาใช้ร่วมกันได้โดยไม่มีการซ้ำซ้อนของข้อมูลหรือความขัดแย้งของข้อมูล โดยทั่วไปข้อมูลมักจะประกอบด้วยข้อมูลย่อยหลายๆ ส่วน (Field) โดยที่แต่ละส่วนจะไม่มีความหมาย เช่น ชื่อนิสิต ชี่อวิชา หรือเกรด แต่ถ้าเอาหลายส่วนมารวมกันจะเกิดความหมายขึ้น เช่น นิสิตคนนี้ชื่ออะไร ลงทะเบียนวิชาอะไรและได้เกรดเท่าไร การที่เราเอาข้อมูลของหลายส่วนมารวมกันจะเกิดเป็นรายการ (Record) และในกรณีที่เอาหลายๆรายการมารวมกันจะเกิดเป็นแฟ้มข้อมูล (File) แต่ถ้าหากเอาหลายแฟ้มข้อมูลมารวมกันจะเกิดเป็นฐานข้อมูล (Database) ดังนั้นจะเห็นได้ว่าฐานข้อมูลจะเกิดจากบิต (Bit) หรือเลขฐานสอง มารวมกัน 8 บิต เพื่อก่อให้เกิดไบต์ (Byte) หรือตัวอักษร (Character) ขึ้นมาจากนั้นจึงกลายเป็นฟิลด์ของข้อมูล แสดงลำดับขั้นในการเกิดฐานข้อมูล
หากจะเปรียบเทียบฐานข้อมูลกับระบบการเก็บเอกสารแบบดั้งเดิม ฐานข้อมูลเปรียบเสมือนตู้เอกสาร ซึ่งในตู้เอกสารจะประกอบด้วยหลายลิ้นชัก แต่ละลิ้นชักเปรียบเสมือนแฟ้มข้อมูลและในแต่ละแฟ้มข้อมูลจะประกอบด้วย รายการของแต่ละบุคคลรวมกันอยู่ โดยที่แต่ละบุคคลก็จะประกอบด้วยฟิลด์ที่เกี่ยวข้องหลายฟิลด์ดังรูป แสดงการเปรียบเทียบฐานข้อมูลกับตู้เอกสาร
การจัดการข้อมูลจะมีประสิทธิภาพสูงสุด เมื่อผู้จัดการได้รับข้อมูลข่าวสารตามที่ต้องการได้อย่างรวดเร็ว ผู้จัดการจำเป็นจะต้องรู้ว่าอะไรเป็นข้อมูลที่เราสามารถหาได้และจะเข้าถึงข้อมูลนั้นได้อย่างไร การนำข้อมูลนั้นมาช่วยในการตัดสินใจ ในปัจจุบันข้อมูลและสารสนเทศที่จะใช้ในการตัดสินใจเกี่ยวกับการจัดการ ส่วนใหญ่จะถูกเก็บในรูปของแฟ้มข้อมูลและฐานข้อมูลทางคอมพิวเตอร์ โดยผู้บริหารระดับกลางและระดับล่างมักจะใช้แฟ้มข้อมูลและฐานข้อมูลในการดำเนินวันต่อวันและใช้ในการพัฒนาแผนประกอบ ส่วนผู้บริหารระดับสูงมักจะใช้ข้อมูลทั้งภายในและภายนอก ฐานข้อมูลเพื่อใช้ในการพัฒนา การจัดทำแผนกลยุทธ์ต่างๆ จะเห็นได้ว่าบริหารทุกระดับจะได้ใช้ประโยชน์จากฐานข้อมูลเพื่อช่วยในการบริหารและการตัดสินใจ
ประเด็นหลักในการบริหารข้อมูล (Major Issue in data management) ประกอบด้วย
- ความสามารถในการเข้าถึงข้อมูล (Access) ได้ง่าย รวดเร็วและถูกต้อง โดยจะต้องมีการกำหนดสิทธิในการเรียกใช้ข้อมูลตามลำดับความสำคัญของผู้ใช้
- จะต้องมีระบบรักษาความปลอดภัยของข้อมูล (Security) ข้อมูลที่จัดเก็บไว้จะต้องมีระบบรักษาความปลอดภัย เพื่อป้องกันการจารกรรมข้อมูล
- สามารถเปลี่ยนแปลงแก้ไขในอนาคตได้ (Edit) ทั้งนี้เนื่องจากแผนที่วางไว้อาจจะต้องมีการเปลี่ยนแปลงตามสถานการณ์ จึงทำให้ต้องมีการจัดระเบียบข้อมูล แก้ไขข้อมูล พร้อมทั้งจัดหาข้อมูลมารเพิ่มเติม
- ข้อมูลที่จัดเก็บอาจจะต้องมีการจัดแบ่งเป็นส่วนหรือสร้างเป็นตาราง เพื่อง่ายแก่การปรับปรุงข้อมูล ในลักษณะการจัดการฐานข้อมูลแบบสัมพันธ์ (Relational database) ซึ่งจะกล่าวถึงภายหลัง
ส่วนต่อประสานผู้ใช้หรือตัวเชื่อมผู้ใช้ (User Interface) หมายถึง อุปกรณ์ที่ช่วยให้ผู้ใช้สามารถ ติดต่อ สื่อสารกับคอมพิวเตอร์ได้ เช่นจอภาพ (Terminal) แป้นพิมพ์ (Keyboard) เมาส์ (Mouse) และเมนู(Menu) ดังนั้น ผู้ใช้และผู้บริหารจำเป็นจะต้องรู้เกี่ยวกับลักษณะของข้อมูลที่จะนำมาใช้ โปรแกรมการจัดการ และข้อจำกัดในการใช้โปรแกรม
ข้อดีของการประมวลผลฐานข้อมูล
1. ข้อมูลมีการเก็บรวมกันและสามารถใช้ข้อมูลร่วมกันได้ ในระบบฐานข้อมูลจะมีการเก็บข้อมูลไว้ในที่เดียวกันเรียกว่าฐานข้อมูล โปรแกรมประยุกต์สามารถออกคำสั่งผ่าน DBMS ให้ทำการอ่านข้อมูลจากหลายตารางได้
2. ลดความซ้ำซ้อนของข้อมูลในการประมวลผล ฐานข้อมูลจะมีความซ้ำซ้อนของข้อมูลน้อยที่สุดเนื่องจาก ข้อมูลจะถูกเก็บเพียงที่เดียวในฐานข้อมูล
3. สามารถหลีกเลี่ยงความขัดแย้งของข้อมูลที่อาจเกิดขึ้นได้ ข้อมูลจะมีความถูกต้อง ไม่มีความขัดแย้ง
4. การควบคุมความคงสภาพของข้อมูล ความคงสภาพ (Integrity) ของข้อมูล คือความถูกต้อง ความคล้องจอง ความสมเหตุสมผลหรือความเชื่อถือได้ของข้อมูล
5. การจัดการข้อมูลในฐานข้อมูลสามารถทำได้ง่าย การจัดการกับฐานข้อมูล ไม่ว่าเป็นการเรียกใช้ข้อมูล การเพิ่มเติมข้อมูลการแก้ไขข้อมูลหรือการลบข้อมูลของตารางใดภายในฐานข้อมูล จะสามารถทำได้ง่ายโดยการออกคำสั่งผ่านไปยัง DBMS ซึ่ง DBMS จะเป็นตัวจัดการข้อมูลภายในฐานข้อมูลให้เอง
6. ความเป็นอิสระระหว่างโปรแกรมประยุกต์และข้อมูล โปรแกรมประยุกต์ที่เขียนขึ้นจะไม่ขึ้นกับโครงสร้าง ของตารางภายในฐานข้อมูล และโปรแกรมประยุกต์ไม่จำเป็นต้องเก็บโครงสร้างของตารางที่ใช้ไว้ ดังนั้นเมื่อมีการ เปลี่ยนแปลงโครงสร้างของตาราง โปรแกรมประยุกต์ก็ไม่จำเป็นต้องมีการเปลี่ยนแปลงตามไปด้วย
7. การมีผู้ควบคุมเพียงคนเดียวได้ผู้ควบคุมฐานข้อมูลเรียกว่า DBA (Database Administrator) ซึ่งเป็น ผู้บริหารและจัดการฐานข้อมูลทั้งหมด โดยสามารถจัดการกับโครงสร้างของฐานข้อมูลได้ กำหนดสิทธิการใช้งานฐาน ข้อมูลได้เพื่อป้องกันผู้ที่ไม่มีส่วนเกี่ยวข้องเข้าไปใช้งานฐานข้อมูลและไม่สามารถเข้าไปก่อความเสียหายกับระบบฐาน ข้อมูลได้ ข้อมูลที่เก็บอยู่ในฐานข้อมูล ควรมีคุณสมบัติดังต่อไปนี้
- มีความถูกต้อง ทันสมัย สมเหตุสมผล
- มีความซ้ำซ้อนของข้อมูลน้อยที่สุด
- มีการแบ่งกันใช้งานข้อ
การจัดการแฟ้มข้อมูล
การจัดการแฟ้มข้อมูล (File Management) ในอดีตข้อมูลที่จัดเก็บไว้จะอยู่ในรูปของแฟ้มข้อมูลอิสระ (Conventional File) ซึ่งระบบงานแต่ละระบบก็จะสร้างแฟ้มของตนเองขึ้นมาโดยไม่เกี่ยวข้องสัมพันธ์กัน เช่น ระบบบัญชี ที่สร้างแฟ้มข้อมูลของตนเอง ระบบพัสดุคงคลัง (Inventory) ระบบการจ่ายเงินเดือน(Payroll) ระบบออกบิล (Billing) และระบบอื่นๆต่างก็มีแฟ้มข้อมูลเป็นของตนเอง หากมีการปรับปรุงแก้ไขก็จะทำเฉพาะส่วนจึงทำข้อมูลขององค์การ บางครั้งเกิดสับสนเนื่องจากข้อมูลขัดแย้งกันและในบางองค์การอาจจะมีการเขียนโปรแกรมโดยใช้ภาษาที่เขียนที่ต่างกัน เช่นภาษาโคบอล (COBOL language) ภาษาอาร์พีจี(RPG) ภาษาปาสคาล (PASCAL) หรือภาษาซี (C language) ซึ่งมีลักษณะของแฟ้มข้อมูลที่สร้างด้วยภาษาที่ต่างกันก็ไม่สามารถจะใช้งานร่วมกันได้ จึงทำให้องค์การเกิดการสูญเสียในข้อมูล ดังนั้นก่อนที่องค์การจะนำคอมพิวเตอร์มาใช้จะต้องมีการวางแผนถึงระบบการบริหารแฟ้มข้อมูล การแบ่งประเภทของแฟ้มข้อมูลและการจัดระเบียบแฟ้มข้อมูล
รูปแฟ้มประวัติลูกค้า จากตัวอย่างเราอาจจะกำหนดคีย์ที่ใช้ในการค้นหาข้อมูลโดยใช้รหัสลูกค้าหรือชื่อลูกค้า ในการหาข้อมูลก็ได้ขึ้นอยู่กับโปรแกรมเป็นตัวกำหนด
ประเภทของแฟ้มข้อมูล
ประเภทของแฟ้มข้อมูล (File Type) เราสามารถจำแนกแฟ้มข้อมูลออกตามลักษณะของข้อมูลที่เก็บบันทึกไว้และสามารถแบ่งแฟ้มข้อมูลออกเป็น 2 ประเภทใหญ่ๆ คือ
1.แฟ้มข้อมูลหลัก (Master File) เป็นแฟ้มข้อมูลซึ่งเก็บข้อมูลที่สำคัญ เช่น แฟ้มข้อมูลประวัติ ลูกค้า (Customer master file) ตามที่กล่าวไว้ข้างต้น แฟ้มข้อมูลประวัติผู้จัดส่งสินค้า (Supplier master file) แฟ้มข้อมูลสินค้าคงเหลือ (Inventory master file) แฟ้มข้อมูลบัญชี (Account master file) เป็นต้น ซึ่งแฟ้มข้อมูลหลักเหล่านี้เป็นส่วนประกอบของระบบงานบัญชี (Account system)
2. แฟ้มรายการปรับปรุง (Transaction file) เป็นแฟ้มที่บันทึกข้อมูลเกี่ยวกับแฟ้มข้อมูลหลักที่มีการเปลี่ยนแปลงในแต่ละวัน รายการที่เกิดขึ้นต้องนำไปปรับปรุงกับแฟ้มข้อมูลหลักเพื่อให้แฟ้มข้อมูลหลักมีข้อมูลที่ทันสมัยอยู่ตลอดเวลา
การปรับปรุงแฟ้มข้อมูลสามารถทำได้หลายอย่าง เช่น การเพิ่มรายการ (Add record) การลบรายการ (Delete record) และการแก้ไขรายการ (Edit)การจัดระเบียบแฟ้มข้อมูล (File organization) มีวิธีการจัดได้หลายประเภท เช่น
1.การจัดระเบียบแฟ้มข้อมูลแบบตามลำดับ (Sequential File organization) ลักษณะการจัดข้อมูลรายการจะเรียงตามฟิลด์ที่กำหนด (Key field) เช่น เรียงจากน้อยไปหามากหรือจากมากไปหาน้อยหรือเรียงตามตัวอักษร โดยส่วนมากมักจะใช้เทปแม่เหล็กเป็นสื่อในการเก็บข้อมูลซึ่งการเก็บโดยวิธีนี้จะมีทั้งข้อดีและข้อเสีย ดังนี้
ตารางแสดงข้อดีและข้อเสียในการจัดระเบียบแฟ้มข้อมูลตามลำดับ
2. การจัดระเบียนแฟ้มข้อมูลแบบตรงหรือแบบสุ่ม (Direct or random file organization) โดยส่วนมากมักจะใช้จานแม่เหล็ก (Hard disk) เป็นหน่วยเก็บข้อมูล การบันทึกหรือการเรียกข้อมูลขึ้นมาสามารถเรียกได้โดยตรง ไม่ต้องผ่านรายการอื่นก่อน เราเรียกวิธีนี้ว่าการเข้าถึงข้อมูลโดยตรง (Direct access) หรือการเข้าถึงโดยการสุ่ม (Random Access) การค้นหาข้อมูลโดยวิธีนี้จะเร็วกว่าแบบตามลำดับ ทั้งนี้เพราะการค้นหาจะกำหนดดัชนี (Index) จะนั้นจะวิ่งไปหาข้อมูลที่ต้องการหรืออาจจะเข้าหาข้อมูลแบบอาศัยดัชนีและเรียงลำดับควบคู่กัน (Indexed Sequential Access Method (ISAM) โดยวิธีนี้จะกำหนดดัชนีที่ต้องการค้นหาข้อมูล เมื่อพบแล้วต้องการเอาข้อมูลมาอีกกี่ รายการก็ให้เรียงตามลำดับของรายการที่ต้องการ ซึ่งการเก็บโดยวิธีนี้มีทั้งข้อดีและข้อเสีย
อุปสรรคในการจัดการแฟ้มข้อมูลแบบดั้งเดิม (Traditional or Conventional file) คือ หน่วยสำรองข้อมูล (Storage) จะมีแฟ้มข้อมูลหลักอยู่และในแฟ้มข้อมูลหลัก (Master file) จะประกอบด้วยข้อมูลต่างๆ (Data Element) เช่น A-Z แต่ละแผนกก็จะต้องเขียนโปรแกรมประยุกต์ (Application Program) ของงานตนเองขึ้นมา ซึ่งแต่ละงานอาจจะมีการเรียกใช้แฟ้มข้อมูลร่วมกัน แสดงการใช้แฟ้มข้อมูลแบบดั้งเดิม
รูปแสดงการใช้แฟ้มข้อมูลแบบดั้งเดิม(Traditional file) กับงานประยุกต์ต่างๆ
จากรูปจะเห็นว่าโปรแกรมประยุกต์ต่างๆ อาจจะมีการเรียกใช้แฟ้มข้อมูลร่วมกัน ซึ่งทำให้โอกาสที่จะเกิด ข้อผิดพลาด (Error) มีมากขึ้น หากไม่มีการควบคุมการใช้แฟ้มที่ดี ดังนั้นปัญหาอาจจะเกิดขึ้นได้หลายประการเช่น
1. การซ้ำซ้อน และการสับสนของข้อมูล (Data Redundancy and confusion) 2. ข้อมูลและโปรแกรมขึ้นต่อกัน (Program-data dependence) 3. ขาดความยืดหยุ่น (Lack of flexibility) 4. ขาดความปลอดภัยของข้อมูล (Poor security) 5. ข้อมูลขาดความสะดวกในการใช้และการแบ่งปันกัน (Lack of data sharing and availability)
วิธีการประมวลผล
วิธีการประมวลผล (Processing Technique) การใช้คอมพิวเตอร์เพื่อช่วยในการประมวลผลทางธุรกิจนั้นมีวิธีการประมวลผลได้หลายแบบดังนี้
1. การประมวลผลแบบชุด (Batch Processing) คือ การประมวลผลโดยผู้ใช้จะทำการรวบรวมเอกสารที่ต้องการประมวลผลไว้เป็นชุดๆ ซึ่งแต่ละชุดอาจจะกำหนดเท่ากับเอกสาร 10 หรือ 20 รายการหรือมากกว่าก็ได้แต่ให้มีขนาดเท่ากัน แล้วป้อนข้อมูลดังกล่าวสู่เครื่องคอมพิวเตอร์ จากนั้นจึงใช้คำสั่งให้ประมวลผลพร้อมกันที่ละชุดตัวอย่าง บริษัทหนึ่งอาจจะใช้เครื่องคอมพิวเตอร์เพื่อออกบิลโดยมีการรวบรวมใบสั่งซื้อจากลูกค้าภายในหนึ่งวันจากแผนกขาย จากนั้นก็ส่งให้แผนกคอมพิวเตอร์ทำการป้อนข้อมูลและตรวจสอบความ ถูกต้องของข้อมูลก่อนที่จะเก็บบันทึกไว้ จากนั้นก็จะนำข้อมูลดังกล่าวไปประมวลผล ซึ่งอาจจะต้องอาศัยแฟ้มข้อมูลอื่นๆ มาประกอบการประมวลผล เช่น แฟ้ม ข้อมูลสินค้าคงเหลือ แฟ้มข้อมูลลูกหนี้ กรณีลูกค้าซื้อเงินเชื่อและแฟ้มประวัติลูกค้า เป็นต้น จากนั้นก็จะนำข้อมูล ดังกล่าวไปประมวลผล ซึ่งอาจจะต้องอาศัยแฟ้มข้อมูลอื่นๆ มาประกอบการประมวลผล เช่น แฟ้มข้อมูลสินค้าคงเหลือ แฟ้ม ข้อมูลลูกหนี้ กรณีลูกค้าซื้อ เงินเชื่อและแฟ้มประวัติลูกค้า เป็นต้น จากนั้นจึงออกบิลเพื่อส่งต่อให้กับผู้ขายเพื่อเบิกสินต้าที่แผนกพัสดุ สินค้าหรือโกดัง (Warehouse) พิจารณา แสดงข้อดีและข้อเสียของการประมวลผลแบบชุด
รูปแสดงขั้นตอนการรวบรวมบิลเป็นชุดก่อนประมวลผลแบบชุด
ตารางที่ 5.4 แสดงข้อดีและข้อเสียของการประมวลผลแบบโต้ตอบ(Interactive)
2. การประมวลผลแบบโต้ตอบ (Interactive) หมายถึง การทำงานในลักษณะที่มีการโต้ตอบระหว่างผู้ใช้กับเครื่องคอมพิวเตอร์ โดยผู้ใช้สามารถที่จะตรวจสอบข้อมูลได้ตลอดเวลา เช่น กรณีที่ลูกค้า นายวัลลภ คลองหก จากบริษัทราชมงคล จำกัด ติดต่อซื้อเครื่องคอมพิวเตอร์จากแผนกขาย เจ้าหน้าที่พนักงานขายจะต้องป้อนรหัสลูกค้าเพื่อเรียกประวัตินายวัลลภขึ้นมาพิจารณาว่าในขณะนี้ได้สั่งซื้อสินค้าเกินวงเงินเครดิตหรือไม่ ถ้าไม่เกินก็อนุมัติการขายแต่ถ้าหากเกินก็อาจจะให้ชำระเป็นเงินสด จากนั้นจะมีการตรวจสอบแฟ้มสินค้าคงคลังว่ามีสินค้าดังกล่าวหรือไม่เพื่อตัดสต็อก (Stock) แล้วพิมพ์บิลเพื่อจัดส่งให้ลูกค้า แสดงการทำงานการออกบิลโดยการประมวลผลแบบโต้ตอบ
ตารางแสดงข้อดีและข้อเสียของการประมวลผลแบบโต้ตอบ
3. การประมวลผลแบบออนไลน์ (Online processing) คือ การประมวลผลร่วมกันระหว่างคอมพิวเตอร์ที่ ต่อพ่วงกับระบบสื่อสาร (Communication) โดยอาศัยอุปกรณ์ต่อพ่วง เช่น โมเด็ม (Modem) ซึ่งลักษณะการทำงานอาจจะมีเครื่องคอมพิวเตอร์หลายเครื่องต่อพ่วงกันในระบบเครือข่าย (Network) ซึ่งอาจจะเป็นเครื่องคอมพิวเตอร์ ขนาดใหญ่ ขนาดกลางหรือไมโครคอมพิวเตอร์ก็ได้ โดยที่เครื่องคอมพิวเตอร์แต่ละเครื่องไม่จำเป็นต้องอยู่ใกล้กันแต่สามารถที่จะติดต่อสื่อสารกันได้โดยมีการส่งผ่านข้อมูลไปมาระหว่างกัน ในระบบไมโครคอมพิวเตอร์เราอาจจะสร้างเครือข่ายในลักษณะเครือขายเฉพาะ (Local Area Network(LAN) ซึ่งเป็นเครือข่ายใกล้ๆ หรืออาจสร้างเครือข่ายงานกว้าง [Wide Area Network(WAN) ซึ่งเป็นเครือข่ายคอมพิวเตอร์ที่อยู่ห่างไกลกันมากแต่เชื่อมต่อกันได้โดยระบบ โทรคมนาคม เช่น โทรศัพท์หรือดาวเทียม ในเชิงธุรกิจกรณีที่พนักงานขายอยู่ต่างจังหวัดและจะส่งใบสั่งซื้อของลูกค้า เข้ามาที่สำนักงานใหญ่ก็สามารถทำได้โดยส่งข้อมูลผ่านทางสายโทรศัพท์แล้วพิมพ์บิลทีสำนักงาน จากนั้นก็จัดส่งสินค้าให้กับลูกค้าตามใบสั่ง
รูปแสดงการส่งข้อมูลผ่านสายโทรศัพท์
ระบบการจัดการฐานข้อมูล จะมีส่วนประกอบที่สำคัญ 3 ส่วนได้แก่
1. ภาษาคำนิยามของข้อมูล [Data Definition Language (DDL)] ในส่วนนี้จะกล่าวถึงส่วนประกอบของระบบการจัดการฐาน ข้อมูลว่าข้อมูลแต่ละส่วนประกอบด้วยอะไรบ้าง (Data element) ในฐานข้อมูลซึ่งเป็นภาษาทางการที่นักเขียนโปรแกรมใช้ในการ สร้างเนื้อหาข้อมูลและโครงสร้างข้อมูลก่อนที่ข้อมูลดังกล่าวจะถูกแปลงเป็นแบบฟอร์มที่สต้องการของโปรแกรมประยุกต์หรือในส่วนของ DDL จะประกอบด้วยคำสั่งที่ใช้ในการกำหนดโครงสร้างข้อมูลว่ามีคอลัมน์อะไร แต่ละคอลัมน์เก็บข้อมูลประเภทใด รวมถึงการเพิ่มคอลัมน์ การกำหนดดัชนี เป็นต้น 2. ภาษาการจัดการฐานข้อมูล (Data Manipulation Language (DML) เป็นภาษาเฉพาะที่ใช้ในการจัดการระบบฐานข้อมูล ซึ่งอาจจะเป็นการเชื่อมโปรแกรมภาษาในยุคที่สามและยุคที่สี่เข้าด้วยกันเพื่อจัดการข้อมูลในฐานข้อมูล ภาษานี้มักจะประกอบด้วยคำ สิ่งที่อนุญาตให้ผู้ใช้สามารถสร้างโปรแกรมพิเศษขึ้นมา รวมถึงข้อมูลต่างๆ ในปัจจุบันที่นิยมใช้ ได้แก่ ภาษา SQL(Structure Query Language) แต่ถ้าหากเป็นเครื่องคอมพิวเตอร์ขนาดใหญ่ DBMS มักจะสร้างด้วยภาษาโคบอล (COBOL language) ภาษาฟอร์แทน (FORTRAN) และภาษาอื่นในยุคที่สาม 3. พจนานุกรมข้อมูล (Data Dictionary) เป็นเครื่องมือสำหรับการเก็บและการจัดข้อมูลสำหรับการบำรุงรักษาในฐานข้อมูล โดยพจนานุกรมจะมีการกำหนดชื่อของสิ่งต่างๆ (Entity) และระบุไว้ในโปรแกรมฐานข้อมูล เช่น ชื่อของฟิลด์ ชื่อของโปรแกรมที่ใช้รายละเอียดของข้อมูล ผู้มีสิทธิ์ใช้และผู้ที่รับผิดชอบ แสดงส่วนประกอบของระบบการจัดการฐานข้อมูล
แสดงส่วนประกอบของระบบจัดการฐานข้อมูล (Elements of a database management systems)
ข้อดีและข้อเสียของระบบการจัดการฐานข้อมูล ระบบการจัดการฐานข้อมูลจะมีทั้งข้อดีและข้อเสียในการที่องค์การจะนำระบบนี้มาใช้กับหน่วยงาของตนโดยเฉพาะหน่วยงานที่เคยใช้คอมพิวเตอร์แล้วแต่ได้จัดแฟ้มแบบดั้งเดิม (Convention File) การที่จะแปลงระบบเดิมให้เป็นระบบใหม่จะทำได้ยากและไม่สมบูรณ์ ไม่คุ้มกับการลงทุน ทั้งนี้เนื่องจากค่าใช้จ่าในการพัฒนาฐานข้อมูลจะต้องประกอบด้วย
1. ค่าใช้จ่ายเกี่ยวกับบุคลากรโดยเฉพาะผู้ดูแลระบบฐานข้อมูล (Database Administrator(DBA) และคณะ 2. ค่าใช้จ่ายเกี่ยวกับการสร้างฐานข้อมูลโดยแปลงข้อมูลเก่ให้เป็นฐานข้อมูลและจะต้องมีการแก้ไขโปรแกรมเก่า 3. การเพิ่มอุปกรณ์ของเครื่องคอมพิวเตอร์เพื่อทำให้มีหน่วยจัดเก็บข้อมูลที่ใหญ่ขึ้น มีการเข้าถึง(Access) ข้อมูลที่รวดเร็ว อาจต้องมีการเพิ่มโพรเซสเซอร์ 4. ค่าใช้จ่ายทางด้านโปรแกรมประยุกต์
นอกจากนั้นยังอาจจะเกิดอุปสรรคในการพัฒนาระบบข้อมูล
1. ความผิดพลาดจากการป้อนข้อมูลเข้าย่อมมีผลกระทบกับหน่วยงานอื่นทีนำข้อมูลนั้นไปใช้เนื่องจากไม่มี ข้อมูลอื่นที่มาเทียบกับข้อมูลในฐานข้อมูลชุดนั้น 2. สร้างแฟ้มข้อมูลร่วมเพื่อตอบสนองกับองค์การ ทุกแผนกกระทำได้ยากเนื่องจากแต่ละแผนกอาจจะต้องการได้ข้อมูลในความละเอียดที่ไม่เท่ากัน ผู้จัดการระดับล่างต้องการใช้ข้อมูลเพื่อการทำงานวันต่อวัน แต่ผู้บริหารระดับสูงต้องการใช้ข้อมูลเพื่อการวางแผน ดังนั้นการออกแบบฐานข้อมูลจึงทำได้ยากมาก 3. ในเรื่องของความปลอดภัยทั้งนี้เนื่องจากทุกแผนกมีการใช้ข้อมูลร่วมกันจึงต้องมีการสร้างระบบป้องกันความปลอดภัยของข้อมูลเพื่อไม่ให้ข้อมูลรั่วไหล จะต้องมีการกำหนดรหัสผ่าน (Password) และการจัดลำดับความสำคัญของงาน (Priority) รวมถึงการกำหนดสิทธ์ในการใช้งานของผู้ใช้แต่ละคน ซึ่งเป็นการยุ่งยากสำหรับการใช้ฐาน ข้อมูลร่วมกัน ไม่เหมือนกับระบบเดิม ทุกแผนกมีสิทธิ์ใช้ เครื่องของตนเองได้เต็มที่ มีอิสระในการตัดสินใจ
ส่วนข้อดีในการจัดการฐานข้อมูล
1. ลดความยุ่งยากของข้อมูลภายในองค์การโดยรวมข้อมูลไว้ที่จุดหนึ่งและผู้ควบคุมดูแลการใช้ข้อมูล การเข้าถึงข้อมูล การนำข้อมูลไปใช้ประโยชน์และดูแลความปลอดภัย 2. ลดการซ้ำซ้อนของข้อมูล (Redundancy) ในกรณีที่ข้อมูลอยู่เป็นเอกเทศ 3. ลดความสับสน (Confusion) ของข้อมูลภายในองค์การ 4. ค่าใช้จ่ายในการพัฒนาโปรแกรมและการบำรุงรักษาภายหลังจากระบบสมบูรณ์แล้วจะลดลงเมื่อเทียบกับแบบเก่า 5. มีความยืดหยุ่นในการขยายฐานข้อมูล การปรับปรุงแก้ไขทำได้ง่ายกว่า 6. การเข้าถึงข้อมูลและความสะดวกในการใช้สารสนเทศมีเพิ่มขึ้น
การออกแบบฐานข้อมูล
การออกแบบฐานข้อมูล (Designing Databases) มีความสำคัญต่อการจัดการระบบฐานข้อมูล (DBMS) ทั้งนี้เนื่องจากข้อมูลที่อยู่ภายในฐานข้อมูลจะต้องศึกษาถึงความสัมพันธ์ของข้อมูล โครงสร้างของข้อมูลการเข้าถึงข้อมูลและกระบวนการที่โปรแกรมประยุกต์จะเรียกใช้ฐานข้อมูล ดังนั้น เราจึงสามารถแบ่งวิธีการสร้างฐานข้อมูลได้ 3 ประเภท
1. รูปแบบข้อมูลแบบลำดับขั้น หรือโครงสร้างแบบลำดับขั้น (Hierarchical data model) วิธีการสร้างฐาน ข้อมูลแบบลำดับขั้นถูกพัฒนาโดยบริษัท ไอบีเอ็ม จำกัด ในปี 1980 ได้รับความนิยมมาก ในการพัฒนาฐานข้อมูลบนเครื่องคอมพิวเตอร์ขนาดใหญ่และขนาดกลาง โดยที่โครงสร้างข้อมูลจะสร้างรูปแบบเหมือนต้นไม้ โดยความสัมพันธ์เป็นแบบหนึ่งต่อหลาย (One- to -Many) ดังรูป แสดงโครงสร้างลำดับขั้นของผู้สอนทักษะผู้สอน หลักสูตรที่สอน
แสดงส่วนประกอบของระบบจัดการฐานข้อมูล (Elements of a database management systems)
ข้อดีและข้อเสียของระบบการจัดการฐานข้อมูล ระบบการจัดการฐานข้อมูลจะมีทั้งข้อดีและข้อเสียในการที่องค์การจะนำระบบนี้มาใช้กับหน่วยงาของตนโดยเฉพาะหน่วยงานที่เคยใช้คอมพิวเตอร์แล้วแต่ได้จัดแฟ้มแบบดั้งเดิม (Convention File) การที่จะแปลงระบบเดิมให้เป็นระบบใหม่จะทำได้ยากและไม่สมบูรณ์ ไม่คุ้มกับการลงทุน ทั้งนี้เนื่องจากค่าใช้จ่าในการพัฒนาฐานข้อมูลจะต้องประกอบด้วย
วิธีการจัดแบบลำดับขั้นเป็นการจัดกลุ่มของข้อมูลที่มีความสัมพันธ์กันและกำหนดให้เป็นเซ็กเมนต์ (Segment) โดยมีการแยกประเภทของเซ็กเมนต์ว่าเป็นเซ็กเมนต์ราก (Root segment) หรือ เซ็กเมนต์ที่เป็นตัวพึ่ง(Dependent segment) แสดงถึงฐานข้อมูลของฝ่ายที่มีการเปิดอบรมของบริษัทหนึ่งซึ่งจัดอยู่ในรูปแบบลำดับขั้น เซ็กเมนต์ที่เป็นราก คือ ชื่อฝ่าย (Department name) โดยมีเซ็กเมนต์ที่เป็นตัวพึ่ง 2 เซ็กเมนต์คือ เซ็กเม็นผู้สอน(Instructor) และหลักสูตร (Course) สำหรับเซ็กเมนต์ผู้สอนก็จะมีตัวพึ่งอีก 1 เซ็กเมนต์ คือ เซ็กเมนต์ความชำนาญ(Skill) ส่วนเซ็กเมนต์หลักสูตรก็จะมีตัวพึ่งเป็นเซ็กเมนต์เปิดสอนโดยและเข้าเซ็กเมนต์สุดท้ายก็คือเซ็กเมนต์ผู้เรียนซึ่งเป็นตัวพึ่งของเซ็กเมนต์เปิดสอนโดย
การติดต่อของข้อมูลแบบลำดับขั้นจำเป้นจะต้องอาศัยตัวชี้ (Pointer) ซึ่งสามารถแบ่งตัวชี้ออกเป็น 2 ประเภท คือ
1. ตัวชี้เซ็กเมนต์ที่เป็นตัวพึ่ง (Child Pointer) 2. ตัวชี้เซ็กเมนต์ระดับเดียวกัน (Twin Pointer)
ข้อดีและข้อเสียของโครงสร้างแบบลำดับขั้น คือ สามารถสร้างความสัมพันธ์ให้เด่นชัดของข้อมูลแต่ละลำดับว่าข้อมูลเป็นเซ็กเมนต์ราก หรือเป็นพ่อแม่(Parent) และข้อมูลเป็นเซ็กเมนต์ตัวพึ่งหรือตัวลูก (Child) ส่วนข้อเสีย โครงสร้างแบบนี้มีความคล่องตัวน้อย เพราะต้องเริ่มอ่านจากเซ็กเมนต์ที่เป็นรากก่อน นอกจากนั้นการออกแบบฐาน ข้อมูลต้องระมัดระวังการซ้ำซ้อนของข้อมูล
2. รูปแบบข้อมูลแบบเครือข่าย (Network data Model) ฐานข้อมูลแบบเครือข่ายมีความคล้ายคลึงกับฐาน ข้อมูลแบบลำดับชั้น ต่างกันที่โครงสร้างแบบเครือข่าย อาจจะมีการติดต่อหลายต่อหนึ่ง (Many-to-one) หรือ หลายต่อหลาย (Many-to-many) กล่าวคือลูก (Child) อาจมีพ่อแม่ (Parent) มากกว่าหนึ่ง สำหรับตัวอย่างฐานข้อมูลแบบเครือข่ายใหลองพิจารณาการจัดการข้อมูลของห้องสมุด ซึ่งรายการจะประกอบด้วย ชื่อเรื่อง ผู้แต่ง สำนักพิมพ์ ที่อยู่ ประเภทหนังสือ และปีที่พิมพ์ ดังนั้นการจัดข้อมูลแบบเก่าจะทำให้ข้อมูลซ้ำซ้อนกันมาก
จากรูปจะเห็นว่าโอกาสที่ข้อมูลจะซ้ำซ้อนมีมากในระบบการจัดการแฟ้มแบบเก่า หนังสือแต่ละเล่มหรือแต่ละชื่อเรื่องต่างก็มีรายการแยกต่างหาก ดังนั้นบรรดาผู้แต่งที่แต่งหนังสือมากกว่าหนึ่งเล่มจะปรากฏมากว่าหนึ่งครั้งในไฟล์นอกจากนั้นสำนักพิมพ์แต่ละแห่งพิมพ์หนังสือหลายเล่ม ดังนั้นชื่อของสำนักพิมพ์ ที่อยู่ก็จะปรากฏซ้ำๆกันในไฟล์ข้อมูลรวม ดังนั้นผู้วางระบบฐานข้อมูลจึงแนะนำให้สร้างฐานข้อมูลลักษณะเครือข่าย
เพื่อลดความซ้ำซ้อน โดยการสร้างความสัมพันธ์ระหว่างรายการเข้าด้วยกัน จะเห็นว่าความสัมพันธ์แบบหนึ่งต่อหลายรายการ (Record) ระหว่างรายการชื่อสำนักพิมพ์และชื่อเรื่อง ซึ่งแสดงโดยมีรูปลูกศรซ้อนกัน 2 หัวเราเรียกรวมชื่อสำนักพิมพ์และชื่อเรื่องซึ่งมีความสัมพันธ์กันว่าเซตและเรียกว่าสกีมา(Schema) ดังนั้นชื่อผู้แต่งแต่ละคนจะปรากฏเพียงหนึ่งครั้งและเชื่อมโยงกับชื่อหนังสือที่เป็นผู้แต่ง ขณะที่ชื่อสำนักพิมพ์ก็เชื่อมโยงกับหนังสือที่ตนเป็นผู้พิมพ์ เมื่อต้องการเข้าถึงรายการจะสามารถเข้าถึงผ่านทางชื่อเรื่อง ชื่อผู้แต่ง หรือชื่อสำนักพิมพ์ ก็ได้ โดยอาศัยเส้นทางเชื่อมต่อระหว่าง รายการ ทำให้ข้อมูลทุกรายการสามารถติดต่อถึงกันได้อย่างถูกต้อง รายการหรือเรคอร์ดสมาชิก (Member) เช่น เรียก เรคอร์ดของผู้แต่งก่อนก็เป็นเรคอร์ดนำและหาตัวเชื่อมเพื่อไปค้นหารายชื่อหนังสือที่แต่งซึ่งเป็นเรคอร์ดสมาชิกก็จะปรากฏขึ้น
ข้อดีและข้อเสียของโครงสร้างแบบเครือข่าย คือเรคอร์ดแต่ละประเภท สามารถใช้เป็นเรคอร์ดนำได้โดยกล่าวถึงก่อน ส่วนการซ้ำซ้อนของข้อมูลจะมีน้อยมากเนื่องจากเรคอร์ดสมาชิกสามารถใช้ร่วมกันได้ เช่น รายละเอียดของหนังสือหนึ่งเล่มอาจจะแต่งจากผู้แต่งหลายคน จึงสามารถใช้ร่วมกันได้ ข้อเสีย ความสัมพันธ์ของเรคอร์ดประเภทต่างๆไม่ควรจะเกิน 3 ประเภท เช่น ชื่อเรื่อง ผู้แต่ง สำนักพิมพ์ หากมีความสัมพันธ์หลายประเภท อาจจะออกแบบเครือข่ายไม่ได้หรือยุ่งยากขึ้น เนื่องจากมีข้อจำกัดในการออกแบบ
3. รูปแบบความสัมพันธ์ข้อมูล (Relation data model) เป็นลักษณะการออกแบบฐานข้อมูลโดยจัดข้อมูลให้อยู่ในรูปของตารางที่มีระบบคล้ายแฟ้ม โดยที่ข้อมูลแต่ละแถว (Row) ของตารางจะแทนเรคอร์ด (Record) ส่วน ข้อมูลนแนวดิ่งจะแทนคอลัมน์ (Column) ซึ่งเป็นขอบเขตของข้อมูล (Field) โดยที่ตารางแต่ละตารางที่สร้างขึ้นจะเป็นอิสระ ดังนั้นผู้ออกแบบฐานข้อมูลจะต้องมีการวางแผนถึงตารางข้อมูลที่จำเป็นต้องใช้ เช่นระบบฐานข้อมูลบริษัทแห่งหนึ่ง ประกอบด้วย ตารางประวัติพนักงาน ตารางแผนกและตารางข้อมูลโครงการ แสดงประวัติพนักงาน ตารางแผนก และตารางข้อมูลโครงการ
ตารางแสดงประวัติพนักงาน ตารางแผนก และตารางข้อมูลโครงการ
ในกรณีที่ผู้ใช้ต้องการเรียกข้อมูลจากตารางทั้ง 3 มาใช้ก็สามารถทำได้โดยการสร้างตารางใหม่ ดังแสดงการสร้างตารางรหัสพนักงานว่าอยู่แผนกไหน ทำงานโครงการอะไรและระยะเวลาในการทำ
ข้อดีและข้อเสียของโครงสร้างแบบสัมพันธ์ คือ สามารถสร้างตารางข้นมาใหม่โดยอาศัยหลักการทางคณิตศาสตร์และค้นหาว่าข้อมูลในฐานข้อมูลมีข้อมูลร่วมกับตารางที่สร้างขึ้นมาใหม่หรือไม่ ถ้ามีก็ให้ประมวลผลโดยการอ่านเพิ่มเติมปรับปรุงหรือยกเลิกรายการ ข้อเสีย คือ การศึกษาวิธีการเขียนโปรแกรมและใช้ฐานข้อมูลจะต้องอิงหลักทฤษฏีทางคณิตสาศตร์จึงทำให้การศึกษาเพิ่มเติมของผู้ใช้ ยากแก่การเข้าใจ แต่ในปัจจุบันมีโปรแกรมการสร้างฐานข้อมูลหลายโปรแกรมที่พยายามทำให้การเรียนรู้และการใช้ง่ายขึ้น เช่น โปรแกรมการสร้างฐานข้อมูลโดยใช้ภาษา SQL(Structured Query Language) เป็นต้น
อ้างอิง
Comments