معرفی انواع روش های یادگیری ماشینی
در این مقاله انواع روش های یادگیری ماشینی را بررسی می کنیم، پس اجازه دهید این روش ها را یاد بگیریم.
- یادگیری ماشینی درخت تصمیم
- قانون وابستگی را یاد بگیرید
- شبکه های عصبی مصنوعی
- یادگیری ماشینی عمیق
- برنامه نویسی منطق استقرایی
- خوشه بندی(Clustering)
- شبکه های بیزی(Bayesian networks)
- یادگیری ماشینی بازنمایی (Representation learning)
- فرهنگ لغت تُنُک (Sparse dictionary learning)
یادگیری درخت تصمیم
روش یادگیری درخت تصمیم از درخت تصمیم به عنوان یک مدل پیشبینیکننده استفاده میکند که مشاهدات موجود در مورد یک موجود را در نتیجهگیری در مورد ارزش عینی شی مینویسد.
قانون وابستگی را یاد بگیرید
یادگیری قانون وابستگی راهی برای کشف روابط جالب بین متغیرها در پایگاه داده های بزرگ است.
شبکه های عصبی مصنوعی
الگوریتم شبکه عصبی مصنوعی (ANN) که معمولاً به عنوان «شبکه عصبی» (NN) شناخته میشود، الگوریتمی است که توسط ساختار و جنبههای عملکردی شبکههای عصبی بیولوژیکی ایجاد میشود. همچنین در این شبکه محاسبات در گروه های نورون مصنوعی ساختار یافته و اطلاعات را به صورت محاسباتی پردازش می کنند. شبکههای عصبی مدرن ابزارهایی برای مدلسازی غیرخطی دادههای آماری هستند. بنابراین این شبکهها معمولاً برای مدلسازی ارتباطات پیچیده بین ورودیها و خروجیها، مدلسازی دادهها یا بهدست آوردن ساختاری آماری در توزیع شانس دوگانه در بین متغیرهای مشاهده شده استفاده میشوند.
یادگیری عمیق
در سالهای اخیر، کاهش هزینههای سختافزار و تولید پردازندههای گرافیکی برای استفاده شخصی، به ایجاد مفهوم یادگیری عمیق کمک کرده است که از چندین لایه پنهان در یک شبکه عصبی مصنوعی تشکیل شده است. همچنین، این روش سعی میکند مدلسازی کند که مغز انسان چگونه نور و صدا را به بینایی و شنوایی پردازش میکند. علاوه بر این، برخی از کاربردهای موفق یادگیری عمیق شامل جوایز بینایی ماشین و گفتار است.
برنامه نویسی منطق استقرایی
برنامه نویسی منطقی استقرایی (ILP) راهی برای نشان دادن یادگیری با استفاده از برنامه نویسی منطقی به عنوان ارائه یکنواخت ورودی (داده ها)، جزئیات پس زمینه و فرضیه ها است. سیستم ILP با رمزگذاری دانش پیشینه عمومی و مجموعه ای از مثال ها که به عنوان پایگاه داده ای از حقایق نمایش داده می شود، یک برنامه منطقی را استخراج می کند که همه مدل های مثبت را برمی گرداند و به یکی از نمونه های مخالف منجر نمی شود. برنامه نویسی استقرایی یک رشته مرتبط است که شامل زبان برنامه نویسی برای نمایش فرضیه ها (و نه فقط برنامه نویسی منطقی) مانند برنامه های موجود است.
خوشه بندی(Clustering)
تجزیه و تحلیل خوشه ای به معنای دستهبندی عبارات به زیرمجموعهها (که به نام خوشه شناخته میشوند) است. ایدههای درون یک خوشه بر اساس یک معیار یا معیار از پیش تعیین شده مشابه هستند و نظرات در سایر خوشهها متفاوت است. تکنیکهای خوشهبندی مختلف، فرضیههای مختلفی در مورد ساختار دادهها دارند، که اغلب با یک متریک شباهت تعریف میشوند و برای مثال، با تراکم داخلی (شباهت بین اعضای یک خوشه) و جداسازی بین خوشههای مختلف ارزیابی میشوند. روشهای دیگر بر اساس چگالی محاسبه شده و همبستگی نمودار است. خوشهبندی یک روش یادگیری بدون نظارت و یک روش استاندارد برای تجزیه و تحلیل دادههای آماری است.
شبکه های بیزی(Bayesian networks)
شبکه بیزی یا مدل گراف جهت دار غیر دایره ای، یک مدل نمودار احتمالی است که مجموعه ای از متغیرهای تصادفی را نشان می دهد. همچنین و استقلال شرطی آنها توسط یک گراف جهت دار غیر دایره ای (DAG). به عنوان مثال، شبکه بیزی می تواند پیوندهای بالقوه بین مشکلات و علائم را پیش بینی کند. با علائم، شبکه می تواند احتمال شرایط مختلف را محاسبه کند. الگوریتم های عملی هستند که استنتاج و یادگیری را انجام می دهند.
یادگیری بازنمایی(Representation learning)
هدف برخی از الگوریتمهای یادگیری ماشینی، بهویژه الگوریتمهای یادگیری ماشینی بدون نظارت، بهبود نمایش ورودیهای ارائهشده در فرآیند آموزش است. مدلهای کلاسیک در این زمینه شامل تحلیل مؤلفههای اصلی و تحلیل خوشهای هستند. الگوریتمهای یادگیری ماشینی معمولاً سعی میکنند اطلاعات موجود در ورودیها را حفظ کنند. با این حال، هدف آنها تبدیل این اطلاعات به یک نمایش مفید برای مراحل پیشپردازش، طبقهبندی یا پیشبینی و همچنین توانایی بازسازی اطلاعات است. این الگوریتمها دادههایی را که از یک توزیع ناشناخته تولید شدهاند، ارائه میکنند، در حالی که لزوماً به ویژگیهای غیرمحتمل در آن توزیع وفادار نیستند.
الگوریتمهای یادگیری منیفولد نیز به دنبال ایجاد نمایشهای کمبعدی هستند. الگوریتمهای کدگذاری تنک (Sparse Coding) تلاش میکنند با محدودیتهایی، مانند داشتن نمایشهای تنک (پر از صفر)، همین کار را انجام دهند.
الگوریتمهای یادگیری ماشینی زیرفضای چندخطی، نمایشهای کمبعدی را مستقیماً از دادههای چندبعدی بدون تبدیل آنها به اشکال برداری (بُعد بالا) استخراج میکنند. در این راستا، الگوریتمهای یادگیری ماشینی عمیق چندین سطح از ویژگیها را کشف میکنند که سطوح بالاتر را با اجزای مفهومیتر از اجزای سطح پایینتر میسازند. همچنین، استدلال شده است که یک ماشین هوشمند ماشینی است که میتواند نمایشی را بیاموزد که جنبههای اساسی تغییر را که دادههای تجربی را توصیف میکند، متمایز سازد.
یادگیری فرهنگ لغت فرهنگ لغت تُنُک(Sparse dictionary learning)
در این روش، دادهها به عنوان ترکیبی خطی از اجزای اساسی نمایش داده میشوند و فرض بر این است که ضرایب این ترکیبها تنک هستند. فرض کنید xxx دادهای با بُعد ddd و DDD ماتریسی از ابعاد d×nd \times nd×n است که هر ستون آن نمایانگر یک تابع پایه است. RRR ضریب xxx با استفاده از DDD است. از نظر ریاضی، یادگیری یک فرهنگ لغت تنک به معنای یافتن یک نمایندگی x≈Drx \approx Drx≈Dr است که در آن rrr تنک باشد. به طور کلی، فرض بر این است که nnn بزرگتر از ddd باشد تا آزادی بیشتری برای مدل فراهم شود.
علاوه بر این، یادگیری فرهنگ لغت با مدلهای تنک به شدت NP-hard و چالشبرانگیز است – یکی از روشهای خلاقانه محبوب برای یادگیری فرهنگ لغت، روش K-SVD است.
یادگیری فرهنگ لغت تنک در چندین حوزه کاربرد دارد. در دستهبندی، هدف انتخاب کلاسی است که دادههای ناشناخته به آن تعلق دارد. فرض کنید که فرهنگ لغتی برای هر نوع کلاسی از قبل ساخته شده است. سپس داده جدید به کلاسی مرتبط میشود که فرهنگ لغت آن کلاس بهترین نمایندگی را از آن داده ارائه میدهد. همچنین، از یادگیری فرهنگ لغت تنک برای کاهش نویز در تصاویر استفاده شده است. ایده اصلی این است که یک تصویر واضح میتواند به صورت پراکنده با استفاده از فرهنگ لغت تصویر نمایان شود، اما نویز نمیتواند به همین شیوه نمایش داده شود.
جمع بندی
بنابراین در این مقاله انواع روش های یادگیری ماشینی و هر نکته ضروری در مورد آنها را توضیح دادیم.