کلان داده یا big data چیست و چه معایب و مزایایی دارد؟

کلان داده یا Big data چیست و چه مزایایی دارد؟

نه صرفا در مبحث شبکه، بلکه در خیلی از مباحث ممکن است به واژه کلان داده برخورد کنیم. Big Data در واقع یکی از اصلی ترین مباحث در بحث آمار و خیلی از صنایع می باشد. به این خاطر که این موضوع در بیشتر مباحث شبکه مطرح می شود و در شبکه ما با داده ها خیلی سر و کار داریم، تصمیم گرفته شد که به سراغ این موضوع برویم و کمی بیشتر با مفهوم آن آشنا بشویم. در این مقاله قرار است به چیستی و تاریخچه کلان داده ، ویژگی های آن ، اهمیت و مزایای آن بپردازیم. مبحث جالبی که شاید به نظر به ساده برسد، اما زوایای پیچیده ای دارد که بدون کشف آن ها شاید نتوانیم با قاطعیت درباره این موضوع صحبت کنیم. پس در این مقاله همراه ما باشید که قرار است زیر و بم کلان داده یا  همان Big Data را کشف کنیم و درباره آن صحبت کنیم.

کلان-داده
نگهداری شبکه
برای اطلاعات بیشتر از خدمات نگهداری شبکه کلیک کنید
کامکو

کلان داده

کلان داده یا همان Big Data مفهومی است که به مقدار عظیمی از داده (چه ساختار یافته باشد و چه بدون ساختار) اشاره می کند. امروزه بیشتر صنایع و مشاغل مربوط با پشتیبانی شبکه با این مفهوم درگیر هستند و درباره آن صحبت می کنند. در این مفهوم اندازه و بزرگی داده ها نیست که در صنایع اهمیت دارد، بلکه آن کارهاییست که با این کلان داده می شود انجام داد. از این کلان داده ها می توانیم برای استخراج کردن اطلاعات با ارزش برای تصمیم گیری های مهم در امور نگهداری شبکه  استفاده کنیم و با آنالیز درست این داده ها می توانیم استراتژی های حساس و دقیقی را تنظیم کنیم. استراتژی هایی که واقعا بدون وجودن این Big Data ها احتمالا تنظیمشان غیر ممکن بود و همیشه هم تنظیم و ارائه یک استراتژی درست، به اطلاعات محکم و قوی و قابل استنادی نیاز دارد که به طرق مختلف می توانیم آن را بدست بیاوریم.

کلان داده از کجا آمد؟

گفتیم که کلان داده به حجم بزرگی از اطلاعات در خدمات پشتیبانی شبکه و سخت افزار اشاره دارد که ممکن است آنقدر پیچیدگی داشته باشند که نتوانیم آن ها را با روش های سنتی مورد تحلیل و بررسی قرار بدهیم. خیلی وقت است که این داده ها در حال کشف و ذخیره سازی هستند اما برای اولین بار مفهوم “کلان داده” در سال 2000 میلادی توسط داگ لنی بیان شد که یک تحلیلگر صنعتی بود. داگ لنی برای Big Data 3 ویژگی در نظر گرفت که در حال حاضر این ویژگی ها به عدد 5 ارتقا پیدا کردن و به 5V معروف هستند به این خاطر که کلمات انگلیسی این ویژگی ها با حرف V شروع می شوند.

ویژگی های Big Data

Big Data ها باید ارزشمند باشند و واقعا به کار بیاییند. در غیر این صورت نمی شود از آن ها برای رشد کسب و کار های خودمان استفاده کنیم. اگر می خواهیم این داده ها را جمع آوری کنیم باید حتما این اطمینان را داشته باشیم که قرار است داده ها به ما در امور مختلف پشتیبانی شبکه های کامپیوتری کمک کنند. متاسفانه بعضی از کلان داده هایی که سازمان ها جمع آوری می کنند فاقد ارزش هستند و فقط دارند حجم زیادی از منابع سخت افزاری را اشغال می کنند، بدون اینکه ذره ای وجود آن ها اهمیت داشته باشد.

ویژگی های Big Data

حجم (Volume)

اولین ویژگی کلان داده حجم است که به این موضوع اشاره دارد که سازمان ها داده ها را از منابع مختلف مانند معاملات، دستگاه های هوشمند، تجهیزات صنعتی، رسانه های اجتماعی، فیلم ها و موارد دیگری جمع آوری می کنند. ذخیره این داده به خاطر مشکل فضا همیشه یک دردسر بود اما امروزه با پیشرفت تکنولوژی این مهم هم انجام شده است و دیگر مشکلی از بابت ذخیره سازی داده رایانه ها وجود ندارد.

نرخ تولید بالا (Velocity)

همه کلان داده ها را نمی شود به صورت مقطعی جمع آوری کرد و بعثی از این داده ها در گذر زمان هستند که بدست می آیند. مثلا در طی سال ها بود که این موضوع بدست آمد که روزانه 180 میلیارد جست و جو در گوگل انجام می شود یا روزانه 900 میلیون تصویر در فیسبوک بارگذاری می شوند. مثلا نمی شد که این داده ها را در روز های اول تاسیس فیسبوک بدست آورد اما در حال حاضر می توان اطلاعاتی از آن ها داشت.

تنوع پذیری (Variety)

به علاوه افزایش سرعت و تنوع در داده ها، نمی توان جریان این داده ها را پیش بینی کرد. مثلا داده ها ممکن است در طول زمان تغییر کنند و همین موضوع برای کسب و کار هایی که با کلان داده ها سر و کار دارند چالش بزرگی محسوب می شود. برای همین هم هست که سازمان ها و مشاغل باید پیش بینی کنند که چه چیزی قرار است ترند شود و چگونه می توانیم این ترند ها را مدیریت کنیم و از آن ها به نفع خودمان استفاده کنیم.

تنوع پذیری (Variety)

ارزش (Value)

Big Data ها باید ارزشمند باشند و واقعا به کار بیاییند. در غیر این صورت نمی شود از آن ها برای رشد کسب و کار های خودمان استفاده کنیم. اگر می خواهیم این داده ها را جمع آوری کنیم باید حتما این اطمینان را داشته باشیم که قرار است داده ها به ما در امور مختلف کمک کنند. متاسفانه بعضی از کلان داده هایی که سازمان ها جمع آوری می کنند فاقد ارزش هستند و فقط دارند حجم زیادی از منابع سخت افزاری را اشغال می کنند، بدون اینکه ذره ای وجود آن ها اهمیت داشته باشد.

صحت (Veracity)

کلان داده ها باید درست و دقیق باشند. وقتی از صحت بیگ دیتا ها صحبت می کنیم، صرفا منظور ما کیفیت آن ها نیست بلکه باید مواردی مانند تعصب، ناهنجاری ها، ناسازگاری ها، تکثیر ها و بی ثباتی ها را که دقت ما را از ما می گیرند را از ویژگی های داده هیمان حذف کنیم. برای مثال داده های رسانه های اجتماعی ممکن است ناپایدار باشند چون در یک زمان ممکن است داده ها به یک نوع و در زمان دیگر، نوع دیگری باشد. کسب و کار ها باید برای بدست آوردن این اطلاعات بتوانند رابطه های موارد را با یکدیگر نیز مورد بررسی قرار داهند.

کلان داده ها به چند دسته تقسیم می شوند؟

کلان داده ها به سه دسته زیر تقسیم بندی می شوند:

  • داده های بدون ساختار
  • داده های نیمه ساختار یافته
  • داده های ساختار یافته

کلان داده ها به چند دسته تقسیم می شوند؟

مزایای کلان داده ها چیست؟

  • کاهش هزینه ها
  • صرفه جویی در زمان
  • توسعه و پیشرفت و ارائه پیشنهادات در جهت بهبود
  • تصمیم گیری های هوشمندانه
  • تعیین علل نارسایی ها و مشکلات در گذر زمان
  • ارائه ارزش های به مشتریان برای خرید ها در کسب و کار ها
  • محاسبه ریسک های موجود در کمتر از چند دقیقه
  • تشخیص رفتار های کلاه بردارانه قبل از اینکه کسب و کار یا سازمان دچار آسیب بشود.

این مطلب رو به اشتراک بگذار...

Twitter
Facebook
Telegram
LinkedIn
WhatsApp
ارسال نظر

آدرس ایمیل شما منتشر نخواهد شد.