داده کاوی چیست: در سالهای اخیر بعضی تحقیقات بازاریابی در فروشگاههای آمریکا نشان داده اند مشتریانی که برای خرید شیر به فروشگاه میآیند معمولا نان هم خریداری میکنند. مدیران بسیاری از فروشگاهها پس از این اتفاق تصمیم گرفتند نان و شیر را با فاصله از هم قرار داده و بین این دو، کالاهای کم مصرف را بگذارند. با این روش، میزان فروش این کالاها افزایش یافت و به رونق آن فروشگاهها کمک زیادی کرد. داده اولیه در این تحقیقات نوع خریدهای مردم بوده و دانشی که این داده را قابل استفاده کرده، علم داده کاوی (Data Mining) است. در این مطلب قصد داریم شما را با این علم جادویی آشنا کنیم.
داده کاوی چیست؟
امروزه شرکتها از طریق ارائه خدمات و ارتباط مستمر با مشتری، اطلاعات زیادی به دست میآورند که اگر راه استفاده از این دادهها را بدانند، سود بسیاری خواهند برد. داده کاوی (Data Mining) به زبان ساده یک روش حل مسئله است که با تحلیل حجم زیادی از داده ها، الگوهای تکرارشونده ای را از آنها استخراج میکند. سپس با پیداکردن ارتباطات بین اتفاقات مختلف و این الگوها، راه حل هایی برای چالشها ارائه میدهد. در واقع دیتا ماینینگ از اطلاعاتی که ممکن است کاربردی نداشته باشند، نتایج ارزشمندی کشف کرده و آنها را قابل استفاده میکند.
دیتا ماینینگ علمی قوی است که میتواند در همه چیز سرک بکشد و از دل ندانستهها بسیاری از سوالات ما را جواب دهد. امروزه اهمیت این علم در شرکتهای بزرگ به قدری شناخته شده است که قبل از تصمیم گیری و برنامه ریزی برای انجام کمپینهای تخصصی و یا طراحی محصولات پر هزینه، ابتدا برای به دست آوردن دادههای عمومی اقدام میکنند.
اهمیت و کاربرد دیتا ماینینگ چیست؟
در دنیایی که اکثر ارتباطات از قید مکان و زمان رهایی پیدا کرده و همه چیز بر مبنای ارتباطات مجازی است، گرفتن اطلاعات از مشتریان نادیده نعمت بزرگی برای شرکتها خواهد بود. گرچه سازمانها برای حفظ ارتباط با مشتری و فروش تلاش میکنند، اما هنوز هم بسیاری از پرچمداران تکنولوژی دنیا توسط رقیبانشان به راحتی قابل دسترسی نیستند. ممکن است یکی از رازهای بزرگ این موفقیت، بهره مندی از دانش داده کاوی باشد. در بعضی از این شرکتها داده کاوی به قدری مهم و جا افتاده است که حتی اقدام به ایجاد کمپین هایی برای جمع آوری داده میکنند.
۱۰YearsChallenge
چندی پیش کمپینی با عنوان چالش ۱۰ سال (۱۰YearsChallenge) در شبکههای اجتماعی مانند اینستاگرام، توییتر و فیسبوک مطرح شد که طی آن، افراد تصاویری از وضعیت الان و ۱۰ سال قبل خود را منتشر میکردند. این چالش با استقبال بسیار زیاد کاربران در سراسر دنیا مواجه شد و در رسانهها نیز جنجال به پا کرد. زیرا برخی منابعی که هنوز تایید یا رد نشده اند، این چالش را ترفند جدید مارک زاکربرگ برای تست الگوریتم تشخیص چهره فیسبوک دانستند. اگر این حرف درست باشد احتمالا زاکربرگ توانسته در بهینهترین حالت ممکن، حجم زیادی داده متنوع و جدید را جمع آوری کند.
در حقیقت سازمان هایی که از داده کاوی برای تحلیل رقبا و بازار استفاده میکنند قادر به پیش بینی ترندهای روز خواهند بود. از این رو در برنامههای آینده شرکت هم جهت با خواسته عموم پیش رفته و قبل از سایر رقبا توجه مشتریان را به خود جلب میکنند.
این حرف در زمینههای دیگر مانند علمی و سلامت، سیاسی و حتی در اقتصاد هم صدق میکند. دادهها در مسائلی مانند بررسی الگوهای شیوع ویروسها و اثرگذاری داروها، مشاهده بازخورد مردم در مقابل اقدامات سیاستمداران و حتی در تصمیمات بازار بورس نیز بسیار کاربرد دارند.
داده کاوی در هر زمینه ای که به آن نیاز است، میتواند کاربرد داشته باشد. امروزه دیتا ماینینگ در مواردی مانند:
- سلامت عمومی: که در جهت گسترش فرهنگ بهداشت با کمترین هزینه، در مناطق مختلف جهان است.
- تحقیقات بازار خرید مشتریان: این مبحث که به نوعی کاربرد داده کاوی در مدیریت است در پی شناسایی کالاهای مرتبط با سبد خرید مشتری است تا امکان خرید آنها را افزایش دهد.
- آموزش: فعالیت این زمینه در جهت بهبود کیفیت سیستم آموزشی و هدایت صحیح دانش آموزان است.
- ساخت و عمران: تلاش این حوزه در جهت تسهیل راه سازی و الگوهای بهینه شهری با توجه به افزایش جمعیت است.
- مدیریت ارتباطات مشتریان (CRM) : هدف بهبود روابط مشتریان با شرکتها و افزایش بهره وری است.
- جلوگیری از حملات الکترونیکی بانکی : به منظور شناسایی الگوریتمهای حمله مورد استفاده قرار میگیرد.
- تحقیقات جنایی و جرم شناسی : از داده کاوی میتوان برای بررسی ارتباطات بین حوادث جنایی و… استفاده کرد.
و بسیاری حوزههای دیگر کاربرد دارد.
ارتباط کسبوکارهای آنلاین و داده کاوی چیست؟
یک شبکهی اجتماعی مانند اینستاگرام را در نظر بگیرید. کاربری یک تصویر در صفحهی خود منتشر میکند و با این کار باعث ایجاد یک داده جدید در این اپلیکیشن میشود. حال افراد دیگری که این شخص را دنبال کردهاند، آن تصویر را میبینند که هر بار دیده شدن این تصویر نیز یک دادهی جدید تولید میکند. لایک کردن و کامنت گذاشتن توسط کاربران مختلف نیز، باعث ایجاد دادهی جدید میشود. تصور کنید که همین فرایند ساده به طور روزانه در بسیاری از اپلیکیشنها انجام شده و تولید چندین ترابایت داده میکند.
هنگامی که سرعت تولید دادهها افزایش پیدا کرده و حجم آنها نیز بسیار بزرگتر میشود، روشهای سنتی مانند الگوریتمهای مرسوم، دیگر توانایی پردازش این حجم از دادهها را در زمان معقول ندارند. برای مثال، همان شبکهی اجتماعی اینستاگرام را تصور کنید که تعداد بسیار زیادی کاربر و عکس و لایک و کامنت در آن قرار دارند.
یک مثال
فرض کنید در این شبکهی اجتماعی بخواهیم از بین چند میلیون کاربر، دو نفر که علایقشان شبیه به هم هست را شناسایی کرده و به عنوان یک پیشنهاد، آنها را به هم معرفی کنیم تا همدیگر را دنبال کنند. با استفاده از یک الگوریتمِ عادی احتمالاً سالیان سال طول خواهد کشید تا بتوانیم این کار را انجام دهیم. چون پیچیدگیِ زمانیِ این مسئله «نمایی» است. ولی خبر خوب این است که برای توسعه چنین سیستمهایی، روشهای جدیدی به وجود آمدهاند که به روشها و تکنیکهای داده کاوی و یادگیری ماشین (Machine Learning)، معروف هستند.