คือ ที่รวมของชุดข้อมูลที่มีขนาดใหญ่และซับซ้อน ยากต่อการประมวลผล หรือเกินความสามารถที่จะดักจับ บริหารจัดการ การจัดเก็บ การค้นหา การแบ่งปัน การส่งถ่าย และการวิเคราะห์ ด้วยเครื่องมือระบบฐานข้อมูลที่มีอยู่ในปัจจุบัน ด้วยเหตุนี้ แพลตฟอร์มใหม่สำหรับ "big data" จึงได้เกิดขึ้นเพื่อให้สามารถจัดการกับข้อมูลจำนวนมากเช่นนั้นได้ ตัวอย่างเช่น Apache Hadoop
Big Data เป็นระเบียบวิธีในการวิเคราะห์ข้อมูล ที่รองรับโดยสถาปัตยกรรมและเทคโนโลยียุคใหม่ที่รองรับการตรวจจับข้อมูลที่ไหลด้วยความเร็วสูง รวมทั้งการจัดเก็บเพื่อนำมาวิเคราะห์ (Villars, Olofson, & Eastwood, 2011) ข้อมูลเหล่านี้ไม่เพียงแต่ชนิดที่มีโครงสร้างเท่านั้น แต่รวมทั้งที่เป็นแบบไร้โครงสร้าง และไม่มีรูปแบบหรือฟอร์แมตมาตรฐาน (Coronel, Morris, & Rob, 2013).
แหล่งที่มาของข้อมูลและปริมาณมีมากเกินกว่าระบบฐานข้อมูลในองค์กรจะรับมือได้ข้อมูลเหล่านี้รวมทั้ง e-mail ข้อมูลที่มาจากอุปกรณ์โทรศัพท์เคลื่อนที่ รวมทั้งข้อมูลจากสังคมออนไลน์ (Villars,Olofson, & Eastwood, 2011)
1 PB = 1000000000000000B = 1015bytes = 1000terabytes.
1 ZB = 1000000000000000000000bytes = 10007bytes = 1021bytes = 1000exabytes = 1 billion terabytes.
1 YB = 1000000000000000000000000bytes = 10008bytes = 1024bytes = 1000zettabytes = 1 trillion terabytes.