کلان داده (Big Data) چیست؟

آنچه در ادامه میخوانید:

می توان گفت یکی از اصطلاحاتی که در سال های اخیر در زمینه ی فناوری اطلاعات زیاد شنیده شده است، بیگ دیتا یا کلان داده است. جالب است بدانید بیگ دیتا (Big Data) فقط در حوزه فناوری اطلاعات مطرح نمی شود. حتی کاربرد های زیادی در در پزشکی، اقتصاد، بانکداری و حسابداری و … نیز دارد.

مفهوم کلان داده یا بیگ دیتا

تا حدودی هر شخصی و با هر سطح دانشی می تواند حدس بزند که در مفهوم کلان داده، بحث از حجم بالای دیتا و اطلاعات است. حجمی که هر روز رو به افزایش است و هر یک از ما، جلوه‌هایی از آن را پیرامون خود مشاهده کرده‌ایم. اجازه بدهید یک تعریف رسمی و علمی را از کلان داده ارائه دهیم.

بیگ دیتا (Big Data) به معنای دارایی‌های اطلاعاتی در یک مجموعه یا سازمان است که دو ویژگی زیر را دارا هستند.

  1. حجم بالا دارند.
  2. با سرعت زیاد تولید می‌شوند و تنوع گسترده دارند.

این حجم از اطلاعات در ادامه نیازمند شیوه‌های پردازش نوآورانه با هزینه‌ی مناسب هستند تا بتوان از آن‌ برای اتوماسیون فرایندها، تصمیم گیری، بهبود نگرش و بینش در سازمان بهره گرفت. در تمامی تعریف هایی که از بیگ دیتا شنیده شده است سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) به چشم می خورد.

رشد تجارت الکترونیکی چگونه بر سه پارامتر حجم، سرعت و تنوع تاثیر گذاشته است؟

  • حجم داده ها: در تراکنش های الکترونیکی نسبت به فاکتور های سنتی حجم بالایی از اطلاعات ثبت می شوند. مثلا زمان تراکنش، ایمیل، اطلاعات تماس، آی پی آدرس ها و بسیاری از موارد دیگر، در صورتی که در فاکتور های سنتی نیاز به درج و ذخیره ی این موارد نبود.
  • سرعت تولید داده‌ ها : همانطور که می دانید زیرساخت های الکترونیکی به سرعت تولید داده ها منجر می شوند. برای مثال تعداد فاکتور هایی که در یک وبسایت فروش منتشر می شود، بسیار بیشتر از تعداد فاکتورهایی است که در صندوق یک فروشگاه صادر می شود. به عبارت دیگر تسریع زمان انجام هر فعالیت‌ و افزایش تعداد فعالیت‌ها در واحد زمان، باعث بالا رفتن تولید حجم زیادی از داده ها شده است.
  • تنوع در داده‌ها : اگر به اطلاعات مختلفی که در طول روز مبادله و ثبت می شوند فکر کنید، خواهید دید که تنوع زیادی را در بر می گیرد. فرض کنید اطلاعات چندصد هزار فاکتور را در اختیار دارید که طی دو یا سه سال در یک فروشگاه صادر شده است. این اطلاعات از افراد مختلف، محصولات مختلف و زمان های متفاوتی است.

چه مواردی منجر به چالش های جدید تری در مدیریت داده ها شده است؟

کافی است به نرم افزاهای اجتماعی که هر روزه از آن استفاده می کنیم فکر کنید.  نرم افزار های پیام رسان و پلتفرم های اجتماعی روزانه حجم بالایی از داده را تولید می کنند. در طی سال های اخیر گسترش اینترنت اشیا هم توانسته به حجم، سرعت و تنوع تولید داده‌ها بیفزاید. افزایش روز افزون سهم تراکنش‌های دیجیتال نمونه ای دیگر از این موارد است.

در قسمت بعدی به چالش‌های عملیاتی و تحلیلی در بحث کلان داده ها و همچنین کاربردهای بیگ دیتا می پردازیم.

امتیاز این مقاله

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقالات مرتبط