วิทยาการข้อมูล
by 19 ณภัสนันท์ ไหมแก้ว 506
1. คุณลักษณะของ Big Data
1.1. ปริมาณข้อมูล(Volume)
1.1.1. คือ คุณลักษณะของข้อมูลที่มีปริมาณมหาศาลซึ่งในอดีตเทคโนโลยีการเก็บข้อมูลที่มีขนาดใหญ่นั้นไม่สามารถทำได้แต่ในปัจจุบันเทคโนโลยีBig Dataทำให้การบริหารจัดการการประมวลผลของข้อมูลที่มีขนาดใหญ่นี้เป็นเรื่องที่สะดวกขึ้น
1.2. ความเร็วในการเพิ่มของข้อมูล(Velocity)
1.2.1. คือ คุณลักษณะของข้อมูลที่มีการเปลี่ยนแปลงอย่างรวดเร็วตลอดเวลาซึ่งมักเป็นแบบทันทีทันใด(Real-time)
1.3. ความหลากหลายของข้อมูล(Variety)
1.3.1. คือคุณลักษณะของข้อมูลที่มีความหลากหลายรูปแบบที่เป็นรูปแบบที่มีโครงสร้างและไม่มีโครงสร้าง
1.4. คุณภาพของข้อมูล(Veracity)
1.4.1. คือ คุณลักษณะของข้อมูลที่ต้องมีคุณภาพมีความถูกต้องเชื่อถือได้หากข้อมูลมีคุณภาพต่ำจะส่งผลกระทบต่อการประมวลผลและการวิเคราะห์ข้อมูลได้เช่นกัน
2. องค์ความรู้สำหรับวิทยาการข้อมูล
2.1. ความเร็วในการเพิ่มขึ้นของข้อมูล(Velocity)
2.2. คุณภาพของข้อมูล(Veracity)
2.3. 1.ความรู้ด้านคณิตสาดและสถิติ(Mathematics)
2.3.1. คือ การนำหลักการทางด้านคณิตสาดและสถิติมาใช้ใน การวิเคราะห์ข้อมูล
2.4. 2.ความรู้ด้านวิทยาการคอมพิวเตอร์(Computer Science)
2.4.1. คือการนำความรู้ทางด้านคอมพิวเตอร์มาช่วยในการวิเคราะห์ข้อมูลโดยใช้ความรู้ทางด้านวิทยาการคอมพิวเตอร์
2.5. 3.ความรู้เฉพาะทาง(Domain Expertise)
2.5.1. คือ การนำองค์ความรู้เฉพาะทางต่างๆมาช่วยในการวิเคราะห์ข้อมูลเพื่อหาความรู้ที่ซ่อนอยู่
3. Big Data
3.1. คือ คือการนำข้อมูลที่มีปริมาณมหาศาล (ซึ่งโดยทั่วไปนั้นปริมาณข้อมูลจะสูงกว่าคลังข้อมูล) มาจัดเก็บประมวลผลการใช้กระบวนการวิเคราะห์ต่าง ๆ และแสดงผลด้วยวิธีที่เหมาะสมเพื่อให้สามารถนำข้อมูลเหล่านี้ไปใช้ประโยชน์ในด้านต่าง ๆ ได้เช่นการวิเคราะห์ด้านสุขภาพการพยากรณ์ด้านการเศรษฐกิจการกำหนดรูปแบบทางการตลาดของสินค้าต่าง ๆ Big Data ไม่ใช่เพียงแค่การจัดซื้อจัดหาคอมพิวเตอร์ที่มีสมรรถนะสูงหรืออุปกรณ์การจัดเก็บข้อมูลเพื่อมาเก็บข้อมูลขนาดใหญ่นี้ แต่ Big Data หมายรวมถึงการพยายามสร้างมูลค่าของข้อมูลที่มีมากมายมหาศาลด้วยการวิเคราะห์และประมวลผลต่าง ๆ นนเอง Big Data มีปริมาณข้อมูลเริ่มต้นตั้งแต่ 1 Terabyte ขึ้นไป (เท่ากับ 1,024 Gigabyte) โดยสามารถเป็นได้ทั้งข้อมูลที่มีโครงสร้างไม่มีโครงสร้างหรือกึ่งโครงสร้างได้เช่นกันเช่นเดียวกับประเภทของข้อมูลทั่วไป
3.2. คือ คือการนำข้อมูลที่มีปริมาณมหาศาล (ซึ่งโดยทั่วไปนั้นปริมาณข้อมูลจะสูงกว่าคลังข้อมูล) มาจัดเก็บประมวลผลการใช้กระบวนการวิเคราะห์ต่าง ๆ และแสดงผลด้วยวิธีที่เหมาะสมเพื่อให้สามารถนำข้อมูลเหล่านี้ไปใช้ประโยชน์ในด้านต่าง ๆ ได้เช่นการวิเคราะห์ด้านสุขภาพการพยากรณ์ด้านการเศรษฐกิจการกำหนดรูปแบบทางการตลาดของสินค้าต่าง ๆ Big Data ไม่ใช่เพียงแค่การจัดซื้อจัดหาคอมพิวเตอร์ที่มีสมรรถนะสูงหรืออุปกรณ์การจัดเก็บข้อมูลเพื่อมาเก็บข้อมูลขนาดใหญ่นี้ แต่ Big Data หมายรวมถึงการพยายามสร้างมูลค่าของข้อมูลที่มีมากมายมหาศาลด้วยการวิเคราะห์และประมวลผลต่าง ๆ นนเอง Big Data มีปริมาณข้อมูลเริ่มต้นตั้งแต่ 1 Terabyte ขึ้นไป (เท่ากับ 1,024 Gigabyte) โดยสามารถเป็นได้ทั้งข้อมูลที่มีโครงสร้างไม่มีโครงสร้างหรือกึ่งโครงสร้างได้เช่นกันเช่นเดียวกับประเภทของข้อมูลทั่วไป