کلان داده ها ترکیبی از داده های ساختار یافته ، نیمه ساختار یافته و بدون ساختار است که توسط سازمان ها جمع آوری شده است. این می تواند برای اطلاعات ما باشد و در پروژه های یادگیری ماشین استفاده شود. و مدل سازی پیش بینی کننده و دیگر برنامه های کاربردی تحلیلی پیشرفته.
در دنیای امروز حجم زیادی از اطلاعات باید پردازش شود. این حجم زیاد از داده را کامپیوتر ها باید ساختاربندی کرده و پردازش کنند. به این حجم از اطلاعات big data و یا کلان داده می گویند.
در تعریف بیگ دیتا یا کلان داده چیست بایستی گفت big data به معنای میزان عظیمی دادههای ساختاربندی شده و نشده است که این پتانسیل را دارد که به شرکتها کمک کند تا عملیاتهای خود را، بهبود بخشیده و تصمیمات سریعتر و هوشمندانهتری اتخاذ نمایند. تعداد این داده ها به قدری است که پردازش آنها به وسیله دیتابیسهای سنتی و نرم افزارهای موجود، دشوار بود.
در اکثر سازمانها میزان دادهها خیلی بزرگ است یا با سرعت زیادی حرکت میکند و ظرفیت پردازش فعلی سازمانها را، رد کرده است. در کنار این مشکلات بیگ دیتا پتانسیل این را دارد که به شرکتها کمک کند تا عملیاتهای خود را، بهبود بخشیده و تصمیمات سریعتر و هوشمندانهتری اتخاذ نمایند. در حال حاضر تمام کسب و کارهای بزرگ داخل و خارج از ایران با این مفهوم درگیر هستند.
دغدغه حجم کلان دادههای تولید بشر به طور جدی از دهههای ۶۰ و ۷۰ میلادی آغاز شد با این همه اصطلاح دادههای کلان (Big Data)، مفهمومی امروزی و جدید است. در سال ۱۹۹۷ دیوید اِیسورت در مقالهای بیان کرد که چالشهایی برای سیستم کامپیوتری وجود دارد و آن هم وجود مجموعه دادههای بسیار بزرگ است که بر روی حافظههای معمولی قابل ذخیره سازی نیست. این مجموعه، داده بزرگ (Big Data) نام گرفت و اصطلاح Big Data یا همان دادههای بزرگ برای اولین بار در کتابخانه دیجیتال ACM تعریف و بکار گرفته شد.
در سال ۲۰۰۰ مطالعه جامعی بر روی تعیین کمیت داده در شرایط ذخیره سازی انجام شد. دادههایی که در سالهای قبل تولید شده و به حد ۱.۵ اگزابایت رسیده بودند، در فضای بزرگی مانند رسانههای ذخیره سازی مغناطیسی ثبت و نگهداری شده اند. سال ۲۰۰۵ تیم اوریِلی، در مقاله «وب ۲.۰ چیست»، بیان کرد: پایگاه دادهای باید وجود داشته باشد تا تمامی اطلاعات را در خود قرار داده، سپس آنها را مدیریت کند و ما آنها را به عنوان افزار اطلاعاتی و نه به عنوان یک نرم افزار، بشناسیم.
شرکت ها از داده های کلان در سیستم های خود برای بهبود عملیات ، ارائه خدمات بهتر به مشتریان ، ایجاد کمپین های بازاریابی شخصی و اقدامات دیگر استفاده می کنند که در نهایت می تواند درآمد و سود را افزایش دهد. مشاغلی که به طور موثر از آن استفاده می کنند دارای مزیت رقابتی بالقوه ای نسبت به آنهایی هستند که از آن استفاده نمی کنند زیرا قادر به تصمیم گیری های تجاری سریعتر و آگاهانه تری هستند.
به عنوان مثال ، داده های بزرگ بینش ارزشمندی را در مورد مشتریان ارائه می دهد که شرکت ها می توانند برای افزایش بازاریابی ، تبلیغات و تبلیغات خود به منظور افزایش مشارکت و نرخ تبدیل مشتری استفاده کنند. هم داده های تاریخی و هم زمان واقعی را می توان برای ارزیابی ترجیحات در حال تغییر مصرف کنندگان یا خریداران شرکتها تجزیه و تحلیل کرد و مشاغل بتوانند بیشتر به خواسته ها و نیازهای مشتری پاسخگو باشند.
داده های بزرگ همچنین توسط محققان پزشکی برای شناسایی علائم بیماری و عوامل خطر و توسط پزشکان برای کمک به تشخیص بیماری ها و شرایط پزشکی در استفاده می شود. علاوه بر این ، ترکیبی از داده های پرونده های الکترونیکی سلامت ، سایت های رسانه های اجتماعی ، وب و سایر منابع به سازمان های مراقبت های بهداشتی و سازمان های دولتی اطلاعات به روز در مورد تهدیدها یا شیوع بیماری های عفونی می دهد.
در اینجا چند مثال دیگر از نحوه استفاده از کلان داده ها توسط سازمانها آورده شده است:
بیگ دیتا یا کلان داده با سه ویژگی اصلی شناخته میشود:
این ویژگیها تنها مربوط به دادههای بیگ دیتا نیست. بلکه به فناوری ذخیره سازی و پردازش این اطلاعات نیز اطلاق میشود. این فناوری شامل ابزارها و فرایندهایی است که میبایست دادههای بی ساختار خیلی بزرگ را، فراخوانی نمایند.
حجم دادهها در بررسی بیگ دیتا دارای اهمیت است زیرا دادههای بیگ دیتا شامل انواع دادههای اشتباه، پردازش نشده، صحیح ،پردازش شده و… خواهند بود. سرعت دریافت اطلاعات با توجه به همزمانی استفاده از اینترنت و ذخیره دادهها، بسیار بالا است. تنوع دادههای بیگ دیتا بسیار بالاست، زیرا شامل بازهی بزرگی از انواع داده مانند صدا، تصویر، متن، فیلم و… هستند.
از آنجاییکه big data زمان و هزینه ی زیادی برای بارگذاری در دیتابیسهای سنتی برای تحلیل در بر دارد، تحلیل بیگ دیتا روشهای نوینی برای تحلیل و ذخیره سازی دادهها به وجود آمورد که کمتر به الگو و حجم داده توجه میکنند.
در عوض دادهی خام در محلی جمع آوری شده و به وسیلهی ماشینهای یادگیرنده و هوش مصنوعی، بررسی میشوند تا بتوانند به وسیله استفاده از الگوریتمهای بسیار پیچیده، الگوهای تکرار شوندهای را بیابند. سپس این الگوریتمهای تکرار شونده مورد استفاده قرار گرفته و اقدام به تحلیل داده مینمایند.
با این روش بار دیگر نیاز نیست کل داده به صورت تک به تک به صورت مستقل، پرداز شوند. تنها کافیست نتیجه خروجی الگوریتمهای به کار گرفته شده استخراج، و از آنها برای تحلیل و پردازش استفاده کنیم.
اطلاعات بیگ دیتا برای انواع فعالیتهای تجاری، بازاریابی، تجزیه و تحلیل بازار و… کاربرد دارند. شرکتها از بیگ دیتا جمع شده بر روی سیستمهای خود جهت بهبود عملیاتها، ارایه خدمات پس از فروش مناسبتر، کمپینهای تبلیغاتی اختصاصیتر و افزایش سوددهی، استفاده میکنند. شرکتهایی که از بیگ دیتا استفاده میکنند از مزیت رقابتی بهتری به نسبت شرکتهایی که نمیکنند، برخوردار هستند. این مزیت رقابتی به این دلیل ایجاد میشود که، آنها میتوانند تصمیمهای درست تر و سریعتری براساس اطلاعات جمع آوری شده، اتخاذ نمایند.
بنابراین در این مقاله ما داده های بزرگ را مورد بحث قرار دادیم. و همه مسائل مربوط به آن و ما امیدواریم که شما در مورد آن اطلاعات کسب کنید.
در عصر حاضر، فناوری اطلاعات و هوش مصنوعی (AI) به سرعت در حال دگرگونسازی جنبههای…
دنیای تکنولوژی همیشه در حال تغییر است و هر روز یک فناوری تازه جایگزین روشهای…
آموزش جامع نصب Django روی اوبونتو مقدمه اگر به دنبال ساخت یک وبسایت یا اپلیکیشن…
آموزش گامبهگام حذف محدودیت Grace Period در Remote Desktop Services یکی از مشکلات رایج در…
پروتکل Remote Desktop Protocol (RDP) یکی از متداولترین روشها برای مدیریت سرورهای ویندوزی از راه…
شبکه های ارتباطی در طی چند دهه اخیر دچار تحولات بنیادینی شده اند. در آغاز،…