Get Started. It's Free
or sign up with your email address
วิทยาการคำนวณ by Mind Map: วิทยาการคำนวณ

1. วิทยาการข้อมูล

1.1. ความหมาย

1.1.1. วิทยาการข้อมูล(Data_Science)คือศาสตร์ในการจัดการจัดเก็บรวบรวมตรวจสอบประมวลผลวิเคราะห์และนำเสนอผลของการวิเคราะห์ข้อมูลเพื่อนำไปสู่การค้นหาความรู้ที่ซ่อนอยู่ในข้อมูลซึ่งสามารถนำไปใช้ประโยชน์ได้โดยวิทยาการข้อมูลจะดำเนินการวิเคราะห์ข้อมูลตามกระบวนการวิทยาการข้อมูลโดยนักวิทยาศาสตร์ข้อมูล(Data_Scientist) จะใช้Big_Dataเป็นแหล่งข้อมูลหลักเนื่องจากBig_Dataเป็นข้อมูลขนาดใหญ่และมีคุณลักษณะสำคัญ4ประการคือปริมาณข้อมูลความเร็วในการเพิ่มขึ้นของข้อมูลความหลากหลายของข้อมูลและคุณภาพของข้อมูลหากสามารถค้นหาความรู้ที่ซ่อนอยู่ในBig_Dataจะทำให้เกิดประโยชนในด้านต่างๆได้มากมาย

2. องค์ความรู้สำหรับวิทยาการข้อมูล

2.1. วิทยาการข้อมูลเกิดจากการบูรณาการร่วมกันระหว่างความรู้3ด้านซึ่งนักวิทยาศาสตร์ข้อมูลจำเป็นต้องมีความรู้ทั้ง3ด้านดังนี้

2.1.1. ความรู้ด้านคณิตศาสตร์และสถิติ(Mathematics)คือการนำหลักการทางด้านคณิตศาสตร์และสถิติมาใช้ในการวิเคราะห์ข้อมูล

2.1.2. ความรู้ด้านวิทยาการคอมพิวเตอร์(ComputerScience)คือการนำความรู้ทางด้านคอมพิวเตอร์เช่นการประมวลผลข้อมูลการเขียนโปรแกรมมาช่วยในการวิเคราะห์ข้อมูลโดยการใช้ความรู้ด้านวิทยาการคอมพิวเตอร์นั้นยังหมายรวมถึงการใช้แนวคิดเชิงคำนวณวิธีคิดในเชิงอัลกอริทึมเพื่อใช้ในจัดการและการประมวลผลข้อมูลด้วยเช่นกัน

2.1.3. ความรู้เฉพาะทาง(DomainExpertise)คือการนำองค์ความเฉพาะทางต่างๆเช่นความรู้ด้านเศรษฐศาสตร์ความด้านการตลาดความรู้ด้านธุรกิจเพื่อนำความเฉพาะทางเหล่านี้มาช่วยในการวิเคราะห์ข้อมูลเพื่อค้นหาความรู้ที่ซ่อนอยู่เช่นหากต้องการวิเคราะห์ข้อมูลด้านการตลาดและกลุ่มเป้าหมายของลูกค้าเพื่อนำไปสู่การออกแบบผลิตภัณฑ์เพื่อให้เกิดความพึงพอใจของลูกค้าจำเป็นต้องใช้ทักษะความรู้ด้านการตลาดและออกแบบผลิตภัณฑ์

3. ข้อมูลขนาดใหญ่ (Bigdata)

3.1. ความหมาย

3.1.1. เนื่องจากปริมาณการใช้งานข้อมูลต่างๆมีอัตราการเติบโตที่สูงขึ้นแบบก้าวกระโดดโดยข้อมูลเหล่านี้เป็นข้อมูลที่มีหลากหลายรูปแบบเช่นข้อความภาพเสียงอีกทั้งเป็นข้อมูลที่มีโครงสร้างและ ไม่มีโครงสร้างจึงจำเป็นต้องมีการบริหารจัดการข้อมูลเหล่านี้เพื่อให้สามารถนำข้อมูลมาใช้ประโยชน์ต่างๆได้อย่างมากมายมหาศาลและมีประสิทธิภาพสูงสุดซึ่งการบริหารจัดการข้อมูลขนาดมหาศาลนี้เรียกว่าBig_Data

3.2. ความหมาย Big Data

3.2.1. คือการนำข้อมูลที่มีปริมาณมหาศาล(ซึ่งโดยทั่วไปนั้นปริมาณข้อมูลจะสูงกว่าคลังข้อมูล)มาจัดเก็บประมวลผลการใช้กระบวนการวิเคราะห์ต่างๆและแสดงผลด้วยวิธีที่เหมาะสมเพื่อให้สามารถนำข้อมูลเหล่านี้ไปใช้ประโยชน์ในด้านต่างๆได้ เช่นการวิเคราะห์ด้านสุขภาพการพยากรณ์ด้านการเศรษฐกิจการกำหนดรูปแบบทางการตลาดของสินค้าต่างๆBig_Dataไม่ใช่เพียงแค่การจัดซื้อจัดหาคอมพิวเตอร์ที่มีสมรรถนะสูงหรืออุปกรณ์การจัดเก็บข้อมูล เพื่อมาเก็บข้อมูลขนาดใหญ่นี้แต่Big_Dataหมายรวมถึงการพยายามสร้างมูลค่าของข้อมูลที่มีมากมายมหาศาลด้วยการวิเคราะห์และประมวลผลต่างๆนั่นเองBig_Dataมีปริมาณข้อมูลเริ่มต้นตั้งแต่1Terabyteขึ้นไป(เท่ากับ1,024Gigabyte)โดยสามารถเป็นได้ทั้งข้อมูลที่มีโครงสร้างไม่มีโครงสร้างหรือกึ่งโครงสร้างได้เช่นกันเช่นเดียวกับประเภทของข้อมูลทั่วไป

4. คุณลักษณะของ Bigdata

4.1. มี 4 ประการ (4 Vs Model)

4.1.1. ปริมาณข้อมูล(Volume)คือคุณลักษณะของข้อมูลที่มีปริมาณมหาศาลซึ่งในอดีตเทคโนโลยีการเก็บข้อมูลที่มีขนาดใหญ่นั้นไม่สามารถทำได้แต่ในปัจจุบันเทคโนโลยี Big_Dataทำให้การบริหารจัดการการประมวลผลข้อมูลที่มีขนาดใหญ่นี้เป็นเรื่องที่สะดวกขึ้น

4.1.2. ความเร็วในการเพิ่มขึ้นของข้อมูล(Velocity)คือคุณลักษณะของข้อมูลที่มีการเปลี่ยนแปลงอย่างรวดเร็วตลอดเวลาซึ่งมักเป็นแบบทันทีทันใด (Real-time)เช่นข้อมูลการใช้งานเครือข่ายสังคมออนไลน์ข้อมูลการทำธุรกรรมทางการเงินต่างๆ

4.1.3. ความหลากหลายของข้อมูล(Variety)คือคุณลักษณะของข้อมูลที่มีหลากหลายรูปแบบทั้งที่เป็นรูปแบบที่มีโครงสร้างเช่นฐานข้อมูลต่างๆรูปแบบข้อมูลที่ไม่มีโครงสร้างเช่นข้อความรูปภาพเสียงวีดิทัศน์

4.1.4. คุณภาพของข้อมูล(Veracity)คือคุณลักษณะของข้อมูลที่ต้องมีคุณภาพมีความถูกต้องเชื่อถือได้หากข้อมูลมีคุณภาพต่ำจะส่งผลกระทบต่อการประมวลผลและการวิเคราะห์ข้อมูลได้เชนกน