Big Data - ทฤษฎีและการปฏิบัติใหม่ ข้อมูลใหญ่
คำว่า "Big Data" อาจเป็นที่รู้จักในปัจจุบัน แต่ก็ยังมีความสับสนเล็กน้อยเกี่ยวกับความหมายที่แท้จริง ในความเป็นจริง แนวคิดนี้มีการพัฒนาอย่างต่อเนื่องและได้รับการกำหนดใหม่ เนื่องจากยังคงเป็นแรงผลักดันเบื้องหลังการเปลี่ยนแปลงทางดิจิทัลที่เกิดขึ้นอย่างต่อเนื่อง รวมถึงปัญญาประดิษฐ์ วิทยาศาสตร์ข้อมูล และอินเทอร์เน็ตของสรรพสิ่ง แต่เทคโนโลยี Big-Data คืออะไร และมันเปลี่ยนแปลงโลกของเราอย่างไร? เรามาลองทำความเข้าใจแก่นแท้ของเทคโนโลยี Big Data และความหมายของคำง่ายๆ กัน
ทุกอย่างเริ่มต้นด้วยการระเบิดของปริมาณข้อมูลที่เราสร้างขึ้นตั้งแต่รุ่งอรุณของยุคดิจิทัล สาเหตุหลักมาจากการพัฒนาคอมพิวเตอร์ อินเทอร์เน็ต และเทคโนโลยีที่สามารถ "ฉกฉวย" ข้อมูลจากโลกรอบตัวเราได้ ข้อมูลในตัวเองไม่ใช่สิ่งประดิษฐ์ใหม่ แม้กระทั่งก่อนยุคของคอมพิวเตอร์และฐานข้อมูล เราใช้บันทึกธุรกรรมที่เป็นกระดาษ บันทึกลูกค้า และไฟล์เก็บถาวรที่ประกอบเป็นข้อมูล คอมพิวเตอร์ โดยเฉพาะสเปรดชีตและฐานข้อมูลทำให้เราจัดเก็บและจัดระเบียบข้อมูลในวงกว้างได้อย่างง่ายดาย ทันใดนั้นข้อมูลก็พร้อมใช้งานเพียงคลิกเดียว
อย่างไรก็ตาม เรามาไกลจากตารางและฐานข้อมูลดั้งเดิมมาก วันนี้ ทุกสองวันเราสร้างข้อมูลมากที่สุดเท่าที่เราได้รับตั้งแต่เริ่มต้นจนถึงปี 2000 ถูกต้องทุกสองวัน และปริมาณข้อมูลที่เราสร้างขึ้นยังคงเพิ่มขึ้นแบบทวีคูณ ภายในปี 2563 ปริมาณข้อมูลดิจิทัลที่มีอยู่จะเพิ่มขึ้นจากประมาณ 5 เซตตะไบต์เป็น 20 เซตตะไบต์
ทุกวันนี้ เกือบทุกการกระทำที่เราทำย่อมทิ้งร่องรอยไว้ เราสร้างข้อมูลทุกครั้งที่ออนไลน์ เมื่อเราพกพาสมาร์ทโฟนที่ติดตั้งเครื่องมือค้นหา เมื่อเราพูดคุยกับเพื่อนผ่านโซเชียลเน็ตเวิร์กหรือการแชท ฯลฯ นอกจากนี้ ปริมาณข้อมูลที่เครื่องสร้างขึ้นก็มีการเติบโตอย่างรวดเร็วเช่นกัน ข้อมูลถูกสร้างขึ้นและแบ่งปันเมื่ออุปกรณ์สมาร์ทโฮมของเราสื่อสารกันหรือกับโฮมเซิร์ฟเวอร์ของพวกเขา อุปกรณ์อุตสาหกรรมในโรงงานและโรงงานมีเซ็นเซอร์ที่สะสมและส่งข้อมูลเพิ่มมากขึ้น
คำว่า "ข้อมูลขนาดใหญ่" หมายถึงการรวบรวมข้อมูลทั้งหมดนี้และความสามารถของเราในการนำไปใช้ให้เกิดประโยชน์ในด้านต่างๆ มากมาย รวมถึงธุรกิจด้วย
เทคโนโลยี Big-Data ทำงานอย่างไร?
Big Data ทำงานบนหลักการ ยิ่งคุณรู้เกี่ยวกับหัวข้อหรือปรากฏการณ์เฉพาะมากเท่าไร คุณก็ยิ่งสามารถบรรลุความเข้าใจใหม่ๆ และคาดการณ์สิ่งที่จะเกิดขึ้นในอนาคตได้อย่างน่าเชื่อถือมากขึ้นเท่านั้น เมื่อเราเปรียบเทียบจุดข้อมูลมากขึ้น ความสัมพันธ์ก็เกิดขึ้นซึ่งก่อนหน้านี้ถูกซ่อนไว้ และความสัมพันธ์เหล่านี้ช่วยให้เราเรียนรู้และตัดสินใจได้ดีขึ้น โดยส่วนใหญ่มักทำผ่านกระบวนการที่เกี่ยวข้องกับการสร้างแบบจำลองตามข้อมูลที่เราสามารถรวบรวมได้ จากนั้นจึงทำการจำลองที่ปรับแต่งค่าของจุดข้อมูลในแต่ละครั้ง และติดตามว่าจุดข้อมูลเหล่านั้นส่งผลต่อผลลัพธ์ของเราอย่างไร กระบวนการนี้เป็นแบบอัตโนมัติ เทคโนโลยีการวิเคราะห์สมัยใหม่จะจำลองสถานการณ์เหล่านี้นับล้าน โดยปรับแต่งตัวแปรที่เป็นไปได้ทั้งหมดจนกว่าจะพบแบบจำลองหรือแนวคิดที่ช่วยแก้ปัญหาที่พวกเขากำลังดำเนินการอยู่
Bill Gates แขวนเนื้อหาที่เป็นกระดาษในซีดีแผ่นเดียว
จนกระทั่งเมื่อไม่นานมานี้ ข้อมูลถูกจำกัดอยู่เพียงสเปรดชีตหรือฐานข้อมูล และทุกอย่างได้รับการจัดระเบียบและเรียบร้อยมาก สิ่งใดก็ตามที่ไม่สามารถจัดระเบียบเป็นแถวและคอลัมน์ได้ง่าย ๆ ถือว่าซับซ้อนเกินกว่าจะใช้งานและถูกละเลย อย่างไรก็ตาม ความก้าวหน้าในด้านการจัดเก็บและการวิเคราะห์หมายความว่าเราสามารถรวบรวม จัดเก็บ และประมวลผลข้อมูลประเภทต่างๆ จำนวนมากได้ ด้วยเหตุนี้ “ข้อมูล” ในปัจจุบันจึงหมายถึงอะไรก็ได้ตั้งแต่ฐานข้อมูลไปจนถึงภาพถ่าย วิดีโอ การบันทึกเสียง ข้อความที่เป็นลายลักษณ์อักษร และข้อมูลเซ็นเซอร์
เพื่อให้เข้าใจถึงข้อมูลที่ยุ่งเหยิงทั้งหมดนี้ โครงการที่ใช้ Big Data มักใช้การวิเคราะห์ที่ล้ำสมัยโดยใช้ปัญญาประดิษฐ์และการเรียนรู้ด้วยคอมพิวเตอร์ ด้วยการสอนเครื่องคอมพิวเตอร์เพื่อกำหนดว่าข้อมูลเฉพาะคืออะไร เช่น ผ่านการจดจำรูปแบบหรือการประมวลผลภาษาธรรมชาติ เราสามารถสอนให้พวกเขาระบุรูปแบบได้รวดเร็วและเชื่อถือได้มากกว่าที่เราสามารถทำได้
Big Data ถูกนำมาใช้อย่างไร?
ข้อมูลเซ็นเซอร์ ข้อความ เสียง รูปภาพ และวิดีโอที่เพิ่มมากขึ้นอย่างต่อเนื่อง หมายความว่าขณะนี้เราสามารถใช้ข้อมูลในลักษณะที่ไม่อาจจินตนาการได้เมื่อไม่กี่ปีที่ผ่านมา นี่คือการนำการเปลี่ยนแปลงเชิงปฏิวัติมาสู่โลกธุรกิจในเกือบทุกอุตสาหกรรม ปัจจุบัน บริษัทต่างๆ สามารถคาดการณ์ได้อย่างแม่นยำอย่างไม่น่าเชื่อว่าลูกค้าประเภทใดที่ต้องการจะซื้อและเมื่อใด Big Data ยังช่วยให้บริษัทต่างๆ ดำเนินกิจกรรมต่างๆ ได้อย่างมีประสิทธิภาพมากขึ้นอีกด้วย
แม้จะอยู่นอกธุรกิจ โครงการที่เกี่ยวข้องกับ Big Data กำลังช่วยเปลี่ยนแปลงโลกของเราในรูปแบบต่างๆ:
- การปรับปรุงการดูแลสุขภาพ – ยาที่ขับเคลื่อนด้วยข้อมูลมีความสามารถในการวิเคราะห์ข้อมูลทางการแพทย์และรูปภาพจำนวนมหาศาลให้เป็นแบบจำลองที่สามารถช่วยตรวจหาโรคได้ตั้งแต่ระยะเริ่มแรก และพัฒนายาใหม่ๆ
- การทำนายและการตอบสนองต่อภัยพิบัติทางธรรมชาติและที่มนุษย์สร้างขึ้น ข้อมูลเซ็นเซอร์สามารถวิเคราะห์เพื่อคาดการณ์บริเวณที่อาจเกิดแผ่นดินไหวได้ และรูปแบบพฤติกรรมของมนุษย์ก็ให้ข้อมูลเบาะแสที่ช่วยให้องค์กรต่างๆ สามารถให้ความช่วยเหลือผู้รอดชีวิตได้ เทคโนโลยี Big Data ยังใช้เพื่อติดตามและป้องกันการไหลเวียนของผู้ลี้ภัยจากเขตสงครามทั่วโลก
- การป้องกันอาชญากรรม กองกำลังตำรวจกำลังใช้กลยุทธ์ที่ขับเคลื่อนด้วยข้อมูลมากขึ้นเรื่อยๆ ซึ่งรวมเอาข้อมูลข่าวกรองของตนเองและข้อมูลสาธารณะเพื่อใช้ทรัพยากรอย่างมีประสิทธิภาพมากขึ้นและดำเนินการป้องปรามเมื่อจำเป็น
หนังสือที่ดีที่สุดเกี่ยวกับเทคโนโลยี Big-Data
- ทุกคนโกหก. โปรแกรมค้นหา Big Data และอินเทอร์เน็ตรู้ทุกอย่างเกี่ยวกับคุณ
- ข้อมูลใหญ่. รวมเทคโนโลยีไว้ในเล่มเดียว
- อุตสาหกรรมความสุข Big Data และเทคโนโลยีใหม่ๆ ช่วยเพิ่มอารมณ์ความรู้สึกให้กับสินค้าและบริการได้อย่างไร
- การปฏิวัติด้านการวิเคราะห์ วิธีปรับปรุงธุรกิจของคุณในยุค Big Data โดยใช้การวิเคราะห์การดำเนินงาน
ปัญหาเกี่ยวกับข้อมูลขนาดใหญ่
Big Data ให้แนวคิดและโอกาสที่ไม่เคยมีมาก่อนแก่เรา แต่ยังก่อให้เกิดปัญหาและคำถามที่ต้องแก้ไข:
- ความเป็นส่วนตัวของข้อมูล – Big Data ที่เราสร้างขึ้นในปัจจุบันประกอบด้วยข้อมูลมากมายเกี่ยวกับชีวิตส่วนตัวของเรา ซึ่งเป็นความเป็นส่วนตัวที่เรามีสิทธิ์ทุกประการ เรากำลังถูกขอให้รักษาสมดุลระหว่างปริมาณข้อมูลส่วนบุคคลที่เราเปิดเผยกับความสะดวกสบายที่แอปและบริการที่ใช้ Big Data นำเสนอมากขึ้นเรื่อยๆ
- ความปลอดภัยของข้อมูล - แม้ว่าเราจะตัดสินใจว่าเราพอใจกับใครบางคนที่มีข้อมูลของเราเพื่อวัตถุประสงค์เฉพาะ แต่เราจะสามารถไว้วางใจให้พวกเขารักษาข้อมูลของเราให้ปลอดภัยได้หรือไม่?
- การเลือกปฏิบัติด้านข้อมูล - เมื่อทราบข้อมูลทั้งหมดแล้ว การเลือกปฏิบัติต่อบุคคลโดยอาศัยข้อมูลจากชีวิตส่วนตัวของพวกเขาจะเป็นที่ยอมรับหรือไม่ เราใช้คะแนนเครดิตเพื่อตัดสินใจว่าใครสามารถกู้ยืมเงินได้อยู่แล้ว และการประกันภัยก็ขับเคลื่อนด้วยข้อมูลจำนวนมากเช่นกัน เราควรคาดหวังว่าจะได้รับการวิเคราะห์และประเมินในรายละเอียดมากขึ้น แต่ต้องระมัดระวังเพื่อให้แน่ใจว่าสิ่งนี้จะไม่ทำให้ชีวิตยากขึ้นสำหรับผู้ที่มีทรัพยากรน้อยลงและการเข้าถึงข้อมูลอย่างจำกัด
การปฏิบัติงานเหล่านี้เป็นองค์ประกอบสำคัญของ Big Data และต้องได้รับการแก้ไขโดยองค์กรที่ต้องการใช้ข้อมูลดังกล่าว การไม่ทำเช่นนี้อาจทำให้ธุรกิจมีความเสี่ยง ไม่เพียงแต่ในแง่ของชื่อเสียงเท่านั้น แต่ยังรวมถึงทางกฎหมายและทางการเงินด้วย
มองไปสู่อนาคต
ข้อมูลกำลังเปลี่ยนแปลงโลกและชีวิตของเราอย่างที่ไม่เคยเกิดขึ้นมาก่อน หาก Big Data มีความสามารถทั้งหมดนี้ในวันนี้ ลองจินตนาการดูว่าพรุ่งนี้จะมีความสามารถอะไรบ้าง ปริมาณข้อมูลที่เราสามารถใช้ได้จะเพิ่มขึ้นเท่านั้น และเทคโนโลยีการวิเคราะห์ก็จะก้าวหน้ายิ่งขึ้นไปอีก
สำหรับธุรกิจ ความสามารถในการประยุกต์ Big Data จะมีความสำคัญมากขึ้นในอีกไม่กี่ปีข้างหน้า เฉพาะบริษัทที่มองว่าข้อมูลเป็นสินทรัพย์เชิงกลยุทธ์เท่านั้นที่จะอยู่รอดและเจริญเติบโตได้ ผู้ที่เพิกเฉยต่อการปฏิวัติครั้งนี้ก็เสี่ยงที่จะถูกทิ้งไว้ข้างหลัง
คำว่า Big Data มักจะหมายถึงข้อมูลที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้างจำนวนเท่าใดก็ได้ อย่างไรก็ตาม รายการที่สองและสามสามารถและควรสั่งซื้อเพื่อการวิเคราะห์ข้อมูลในภายหลัง Big Data ไม่ได้เทียบเท่ากับปริมาณจริงใดๆ แต่เมื่อพูดถึง Big Data ในกรณีส่วนใหญ่ เราหมายถึงข้อมูลเทราไบต์ เพตาไบต์ และแม้แต่ไบต์พิเศษ ธุรกิจใดๆ ก็ตามสามารถสะสมข้อมูลจำนวนนี้ในช่วงเวลาหนึ่งได้ หรือในกรณีที่บริษัทต้องการรับข้อมูลจำนวนมากแบบเรียลไทม์
การวิเคราะห์ข้อมูลขนาดใหญ่
เมื่อพูดถึงการวิเคราะห์ Big Data เราหมายถึงการรวบรวมและจัดเก็บข้อมูลจากแหล่งต่างๆ เป็นหลัก ตัวอย่างเช่น ข้อมูลเกี่ยวกับลูกค้าที่ซื้อสินค้า คุณลักษณะของพวกเขา ข้อมูลเกี่ยวกับแคมเปญโฆษณาที่เปิดตัวและการประเมินประสิทธิผล ข้อมูลศูนย์ติดต่อ ใช่ ข้อมูลทั้งหมดนี้สามารถเปรียบเทียบและวิเคราะห์ได้ เป็นไปได้และจำเป็น แต่ในการทำเช่นนี้ คุณต้องตั้งค่าระบบที่ช่วยให้คุณสามารถรวบรวมและแปลงข้อมูลโดยไม่บิดเบือน จัดเก็บ และสุดท้ายก็แสดงภาพได้ เห็นด้วย เนื่องจากข้อมูลขนาดใหญ่ ตารางที่พิมพ์ลงบนหน้าหลายพันหน้าช่วยได้เพียงเล็กน้อยในการตัดสินใจทางธุรกิจ
1. การมาถึงของข้อมูลขนาดใหญ่
บริการส่วนใหญ่ที่รวบรวมข้อมูลเกี่ยวกับการกระทำของผู้ใช้มีความสามารถในการส่งออกได้ เพื่อให้แน่ใจว่าพวกเขาจะมาถึงบริษัทในรูปแบบที่มีโครงสร้าง จึงมีการใช้ระบบต่างๆ เช่น Alteryx ซอฟต์แวร์นี้ช่วยให้คุณรับข้อมูลและประมวลผลโดยอัตโนมัติ แต่ที่สำคัญที่สุดคือแปลงเป็นรูปแบบและรูปแบบที่ต้องการโดยไม่บิดเบือน
2. การจัดเก็บและการประมวลผลข้อมูลขนาดใหญ่
เกือบทุกครั้งเมื่อรวบรวมข้อมูลจำนวนมาก ปัญหาในการจัดเก็บข้อมูลก็เกิดขึ้น ในบรรดาแพลตฟอร์มทั้งหมดที่เราศึกษา บริษัทของฉันชอบ Vertica มากกว่า แตกต่างจากผลิตภัณฑ์อื่นๆ Vertica สามารถ "คืน" ข้อมูลที่จัดเก็บไว้ในผลิตภัณฑ์ได้อย่างรวดเร็ว ข้อเสียได้แก่ การบันทึกเป็นเวลานาน แต่เมื่อวิเคราะห์ข้อมูลขนาดใหญ่ ความเร็วของการส่งคืนจะมาเป็นอันดับแรก ตัวอย่างเช่น หากเรากำลังพูดถึงการคอมไพล์โดยใช้ข้อมูลขนาดเพตะไบต์ ความเร็วในการอัพโหลดก็เป็นหนึ่งในคุณสมบัติที่สำคัญที่สุด
3. การแสดงข้อมูลขนาดใหญ่
และสุดท้าย ขั้นตอนที่สามของการวิเคราะห์ข้อมูลจำนวนมากก็คือ ในการดำเนินการนี้ คุณต้องมีแพลตฟอร์มที่สามารถแสดงข้อมูลที่ได้รับทั้งหมดในรูปแบบภาพที่สะดวก ในความเห็นของเรา ผลิตภัณฑ์ซอฟต์แวร์เพียงตัวเดียวเท่านั้นที่สามารถรับมือกับงานนี้ได้ - Tableau แน่นอนว่าหนึ่งในโซลูชั่นที่ดีที่สุดในปัจจุบันที่สามารถแสดงข้อมูลใด ๆ ด้วยสายตา เปลี่ยนงานของบริษัทให้เป็นแบบจำลองสามมิติ รวบรวมการดำเนินการของทุกแผนกเป็นห่วงโซ่ที่พึ่งพาซึ่งกันและกัน (คุณสามารถอ่านเพิ่มเติมเกี่ยวกับความสามารถของ Tableau)
โปรดทราบว่าตอนนี้เกือบทุกบริษัทสามารถสร้าง Big Data ของตนเองได้ การวิเคราะห์ข้อมูลขนาดใหญ่ไม่ใช่กระบวนการที่ซับซ้อนและมีราคาแพงอีกต่อไป ขณะนี้ฝ่ายบริหารของบริษัทจำเป็นต้องกำหนดคำถามให้กับข้อมูลที่รวบรวมไว้อย่างถูกต้อง ขณะเดียวกันก็ไม่เหลือพื้นที่สีเทาที่มองไม่เห็นอีกต่อไป
ดาวน์โหลด Tableau