- تفاوت بین یادگیری تحت نظارت و بدون نظارت چیست؟
- یادگیری تحت نظارت چیست؟
- انواع یادگیری تحت نظارت چیست؟
- طبقه بندی
- رگرسیون
- رگرسیون خطی
- رگرسیون لجستیک
- نمونه های یادگیری تحت نظارت
- یادگیری بدون نظارت چیست؟
- انواع یادگیری بدون نظارت چیست؟
- خوشه بندی
- انجمن
- در اینجا نمونه ای از پنج سفر خریدی است که آنها ممکن است به عنوان بخشی از مجموعه داده خود استفاده کنند:
- کاهش ابعاد
- نمونه های یادگیری بدون نظارت
- انتخاب بین یادگیری تحت نظارت و بدون نظارت
- یادگیری تحت نظارت در مقابل یادگیری بدون نظارت خلاصه شد
- چی یاد گرفتی؟
یادگیری ماشینی (ML) در حال تغییر نحوه عملکرد سازمان ها در سراسر صنایع است. چه در بخش مراقبت های بهداشتی، خدمات مالی، بازاریابی، خدمات مشتری یا هر بخش دیگری کار کنید، مدل های ML می توانند به شما در انجام وظایف مختلف کمک کنند.
اما ابتدا باید مدل ها را آموزش دهید تا کمک مورد نیاز خود را دریافت کنید. نوع وظایفی که میخواهید به شما کمک کند تأثیر میگذارد که آیا باید مدلهای خود را با استفاده از یادگیری تحت نظارت یا بدون نظارت آموزش دهید.
تفاوت بین یادگیری تحت نظارت و بدون نظارت چیست؟
تفاوت اصلی بین یادگیری تحت نظارت و بدون نظارت، نوع داده (برچسب یا بدون برچسب) و اهداف (مورد انتظار یا ناشناخته) است.
دادههای برچسبگذاریشده برای یادگیری نظارتشده برای کار، و استفاده کسبوکارها حیاتی است نرم افزار برچسب گذاری داده ها برای تبدیل داده های بدون برچسب به داده های برچسب دار و ساخت الگوریتم های هوش مصنوعی (AI).
یادگیری تحت نظارت چیست؟
یادگیری تحت نظارت نوعی از یادگیری ماشینی (ML) که از مجموعه داده های برچسب گذاری شده برای شناسایی الگوها و روابط بین داده های ورودی و خروجی استفاده می کند. برای انجام این کار به داده های برچسب گذاری شده ای نیاز دارد که شامل ورودی ها (یا ویژگی ها) و خروجی ها (دسته ها یا برچسب ها) باشد. الگوریتم ها اطلاعات ورودی را تجزیه و تحلیل می کنند و سپس خروجی مورد نظر را استنباط می کنند.
وقتی نوبت به یادگیری تحت نظارت میرسد، میدانیم که چه نوع خروجیهایی را باید انتظار داشته باشیم، که به مدل کمک میکند تا تشخیص دهد که چه چیزی پاسخ صحیح را میداند.
انواع یادگیری تحت نظارت چیست؟
دو مورد از متداولترین روشهای یادگیری تحت نظارت، طبقهبندی و رگرسیون هستند.
طبقه بندی
همانطور که از نام آن پیداست، الگوریتمهای طبقهبندی دادهها را با اختصاص دادن آنها به دستهها یا خروجیهای خاص بر اساس اطلاعات ورودی، گروهبندی میکنند. اطلاعات ورودی از ویژگی ها تشکیل شده است و الگوریتم از این ویژگی ها برای اختصاص دادن هر نقطه داده به یک برچسب طبقه بندی شده از پیش تعریف شده استفاده می کند.
یکی از رایجترین نمونههای طبقهبندی روزانه، استفاده از فیلترهای اسپم در صندوقهای ایمیل است. هر ایمیلی که دریافت میکنید ورودی است که ارائهدهنده ایمیل شما بهعنوان «هرزنامه» یا «نه هرزنامه» طبقهبندی میکند و آن را به پوشه مناسب هدایت میکند. به عبارت دیگر، یک مدل یادگیری نظارت شده برای پیشبینی اینکه آیا ایمیل دریافتی اسپم است یا خیر، با استفاده از مجموعه داده برچسبگذاری شده متشکل از ایمیلهای مجاز و هرزنامه آموزش داده میشود.
برای انجام این پیشبینیها، الگوریتم ویژگیهای ایمیلهای موجود در مجموعه داده را تحلیل میکند که میتواند شامل عناصری مانند آدرس ایمیل فرستنده، خط موضوع، عبارات کلیدی در متن اصلی و طول ایمیل باشد.
رگرسیون
الگوریتم های رگرسیون برای درک رابطه بین متغیرهای وابسته و مستقل برای پیش بینی های آینده استفاده می شود.
فرض کنید یک شرکت خودروسازی می خواهد مسافت پیموده شده یک مدل جدید خودرو را پیش بینی کند. این شرکت خودروسازی میتواند مجموعه دادههای برچسبگذاریشده مدلهای قبلی خود را با ویژگیهایی مانند اندازه موتور، وزن، و ، بخار به یک الگوریتم یادگیری تحت نظارت تغذیه کند. این مدل رابطه بین ویژگیها و مسافت پیموده شده مدلهای قبلی را یاد میگیرد و به آن کمک میکند تا مسافت پیموده شده مدل جدید خودرو را پیشبینی کند.
رگرسیون خطی
رگرسیون خطی از معادلات خطی برای مدل سازی رابطه بین نقاط داده استفاده می کند. تلاش برای یافتن بهترین خط خطی مناسب بین متغیرهای مستقل و وابسته برای پیشبینی متغیرهای پیوسته است. به عنوان مثال، می توانید از یک مدل رگرسیون خطی برای پیش بینی قیمت یک خانه برای فروش با استفاده از داده های قیمت گذاری برای خانه های مشابه در منطقه استفاده کنید.
رگرسیون لجستیک
رگرسیون لجستیک برای حل مسائل طبقه بندی استفاده می شود. می تواند به محاسبه یا پیش بینی احتمال وقوع یک رویداد به صورت بله یا خیر کمک کند. به این رگرسیون لجستیک باینری می گویند. به عنوان مثال، حرفه پزشکی از رگرسیون لجستیک برای پیش بینی خوش خیم یا بدخیم بودن توموری که در عکس اشعه ایکس ظاهر می شود، استفاده می کند.
نمونه های یادگیری تحت نظارت
برخی از رایج ترین کاربردهای یادگیری تحت نظارت عبارتند از:
- تشخیص هرزنامه: همانطور که قبلا ذکر شد، ارائه دهندگان ایمیل از تکنیک های یادگیری نظارت شده برای طبقه بندی محتوای هرزنامه و غیر هرزنامه استفاده می کنند. این کار بر اساس ویژگیهای هر ایمیل (یا ورودی)، مانند آدرس ایمیل فرستنده، خط موضوع و کپی متن، و الگوهایی که مدل یاد میگیرد، انجام میشود.
- شی و تشخیص تصویر: ما میتوانیم مدلها را بر روی مجموعه داده بزرگی از تصاویر برچسبگذاری شده، مانند گربهها و سگها آموزش دهیم. سپس، مدل میتواند ویژگیهایی مانند اشکال، رنگها، بافتها و ساختارها را از تصاویر استخراج کند تا نحوه تشخیص این اشیاء را در آینده بیاموزد.
- تحلیل احساسات مشتری: شرکتها میتوانند نظرات مشتریان را تجزیه و تحلیل کنند تا با آموزش مدلی با استفاده از نظرات برچسبگذاری شده، احساسات آنها (مثلاً مثبت، منفی یا خنثی) را تعیین کنند. مدل یاد می گیرد که کلمات و ویژگی های خاص را با احساسات مختلف مرتبط کند و می تواند نظرات مشتریان جدید را بر این اساس طبقه بندی کند.
یادگیری بدون نظارت چیست؟
یادگیری بدون نظارت نوعی از یادگیری ماشینی است که از الگوریتمهایی برای تجزیه و تحلیل مجموعه دادههای بدون برچسب بدون نظارت انسان استفاده میکند. برخلاف یادگیری تحت نظارت، که در آن ما می دانیم چه نتایجی را باید انتظار داشته باشیم، هدف این روش کشف الگوها و کشف بینش داده ها بدون آموزش یا برچسب قبلی است.
انواع یادگیری بدون نظارت چیست؟
الگوریتمهای یادگیری بدون نظارت برای کارهای پیچیده که در آن کاربران میخواهند الگوهای شناسایی نشده قبلی را در مجموعه دادهها کشف کنند، مناسبتر هستند. سه نوع سطح بالا یادگیری بدون نظارت عبارتند از خوشه بندی، تداعی و کاهش ابعاد. چندین رویکرد و تکنیک برای این انواع وجود دارد.
خوشه بندی
خوشهبندی یک تکنیک یادگیری بدون نظارت است که دادههای بدون برچسب را بر اساس شباهتها یا تفاوتهای بین نقاط داده به گروهها یا همانطور که از نامش پیداست، به خوشهها تقسیم میکند. الگوریتم های خوشه بندی به دنبال گروه های طبیعی در میان داده های دسته بندی نشده می گردند.
برای مثال، یک الگوریتم یادگیری بدون نظارت میتواند مجموعه دادهای بدون برچسب از حیوانات مختلف زمین، آب و هوا را بگیرد و آنها را بر اساس ساختار و شباهتها در خوشههایی سازماندهی کند.
الگوریتم های خوشه بندی شامل انواع زیر است:
- خوشه بندی انحصاری: همانطور که از نام آن پیداست، یک نقطه داده تنها می تواند در یک خوشه خاص وجود داشته باشد، زمانی که از این رویکرد استفاده می شود، زیرا رابطه انحصاری است. به خوشه بندی انحصاری، خوشه بندی سخت نیز گفته می شود.
- خوشه بندی همپوشانی: برخلاف خوشهبندی انحصاری، الگوریتمهای همپوشانی اجازه میدهند که یک نقطه داده در دو یا چند خوشه گروهبندی شود. خوشهبندی همپوشانی به عنوان خوشهبندی نرم نیز نامیده میشود.
- خوشه بندی سلسله مراتبی: یک مجموعه داده بر اساس شباهت بین نقاط داده به خوشه ها تقسیم می شود. سپس، خوشه ها بر اساس روابط سلسله مراتبی سازماندهی می شوند. دو نوع خوشه بندی سلسله مراتبی وجود دارد: تجمعی و تقسیمی.
- خوشه بندی تجمعی داده ها را به روشی از پایین به بالا دسته بندی می کند، به این معنی که نقاط داده ایزوله می شوند و سپس با به وجود آمدن شباهت ها ادغام می شوند تا زمانی که یک خوشه را تشکیل دهند.
- خوشه بندی تفرقه انگیز رویکرد مخالف را اتخاذ می کند، روشی از بالا به پایین برای تقسیم خوشه ها بر اساس تفاوت بین داده ها.
- خوشه بندی احتمالی: همانطور که از نام آن پیداست، در یک مدل خوشهبندی احتمالی، نقاط داده بر اساس احتمال تعلق آنها به یک توزیع خوشهبندی میشوند. خوشهبندی احتمالی به اشیا اجازه میدهد به یک یا چند خوشه تعلق داشته باشند.
انجمن
در این رویکرد مبتنی بر قوانین یادگیری بدون نظارت، الگوریتمهای یادگیری به دنبال همبستگیهای if-then و روابط بین نقاط داده میشوند. این تکنیک معمولاً برای تجزیه و تحلیل عادات خرید مشتری استفاده میشود و شرکتها را قادر میسازد تا روابط بین محصولات را برای بهینهسازی جایگاههای محصول و استراتژیهای بازاریابی هدفمند خود درک کنند.
تصور کنید یک فروشگاه مواد غذایی بخواهد بهتر بفهمد که خریداران آنها اغلب چه اقلامی را با هم می خرند. این فروشگاه دارای مجموعه داده ای است که شامل لیستی از سفرهای خرید است، که در هر سفر به جزئیات می توان گفت که خریدار کدام کالا را در فروشگاه خریداری کرده است.
در اینجا نمونه ای از پنج سفر خریدی است که آنها ممکن است به عنوان بخشی از مجموعه داده خود استفاده کنند:
- خریدار 1: شیر
- خریدار 2: شیر و کلوچه
- خریدار 3: کلوچه، نان و موز
- خریدار 4: نان و موز
- خریدار 5: شیر، کلوچه، چیپس، نان و بستنی
فروشگاه میتواند برای جستجوی اقلامی که خریداران اغلب در یک سفر خرید میخرند، از انجمن استفاده کند. آنها می توانند شروع به استنباط قوانین if-then کنند، مانند: اگر کسی شیر بخرد، اغلب کلوچه نیز می خرد.
سپس، الگوریتم می تواند اطمینان و احتمال خرید این اقلام را با هم از طریق یک سری محاسبات و معادلات محاسبه کند. با پیدا ، اقلامی که خریداران با هم میخرند، خواربارفروشی میتواند تاکتیکهایی مانند قرار دادن اقلام در کنار یکدیگر برای تشویق به خرید آنها با هم یا ارائه قیمت با تخفیف برای خرید هر دو کالا به کار گیرد. این فروشگاه خرید را برای مشتریان خود راحت تر می کند و فروش را افزایش می دهد.
کاهش ابعاد
کاهش ابعاد یک تکنیک یادگیری بدون نظارت است که تعداد ویژگیها یا ابعاد یک مجموعه داده را کاهش میدهد و تجسم دادهها را آسانتر میکند. با استخراج ویژگی های ضروری از داده ها و کاهش موارد نامربوط یا تصادفی بدون به خطر انداختن یکپارچگی داده های اصلی کار می کند.
نمونه های یادگیری بدون نظارت
برخی از موارد استفاده روزمره برای یادگیری بدون نظارت شامل موارد زیر است:
- تقسیم بندی مشتریان: کسبوکارها میتوانند از الگوریتمهای یادگیری بدون نظارت برای ایجاد نمایههای شخصیت خریدار با خوشهبندی ویژگیها، رفتارها یا الگوهای مشترک مشتریان خود استفاده کنند. به عنوان مثال، یک شرکت خرده فروشی ممکن است از تقسیم بندی مشتریان برای شناسایی خریداران ارزان قیمت، خریداران فصلی و مشتریان با ارزش استفاده کند. با در نظر گرفتن این پروفایل ها، این شرکت می تواند پیشنهادات شخصی و تجربیات متناسب با اولویت های هر گروه ایجاد کند.
- تشخیص ناهنجاری: در تشخیص ناهنجاری، هدف شناسایی نقاط داده ای است که از بقیه مجموعه داده ها منحرف می شوند. از آنجایی که ناهنجاریها اغلب نادر هستند و بسیار متفاوت هستند، برچسبگذاری آنها به عنوان بخشی از مجموعه داده برچسبگذاری شده میتواند چالش برانگیز باشد، بنابراین تکنیکهای یادگیری بدون نظارت برای شناسایی این موارد نادر مناسب هستند. مدلها میتوانند به کشف الگوها یا ساختارهایی در دادهها کمک کنند که رفتار غیرعادی را نشان میدهند، بنابراین این انحرافها میتوانند به عنوان ناهنجاری ذکر شوند. نظارت بر تراکنش های مالی برای شناسایی رفتارهای متقلبانه نمونه بارز این موضوع است.
انتخاب بین یادگیری تحت نظارت و بدون نظارت
انتخاب مدل آموزشی مناسب برای دستیابی به اهداف کسبوکار و خروجیهای هدف بستگی به دادههای شما و مورد استفاده از آن دارد. هنگام تصمیم گیری در مورد اینکه آیا یادگیری تحت نظارت یا بدون نظارت بهترین کار را برای شما دارد، سؤالات زیر را در نظر بگیرید:
- آیا با مجموعه داده برچسب دار یا بدون برچسب کار می کنید؟ تیم شما با چه اندازه مجموعه داده کار می کند؟ آیا داده های شما برچسب گذاری شده است؟ یا اینکه اگر این مسیر را انتخاب کنید، دانشمندان داده شما زمان و تخصص لازم برای اعتبارسنجی و برچسب گذاری مجموعه داده های شما را دارند؟ به یاد داشته باشید، اگر میخواهید یادگیری تحت نظارت را دنبال کنید، مجموعه دادههای برچسبگذاری شده ضروری هستند.
- به حل چه مشکلاتی امیدوار هستید؟ آیا می خواهید مدلی را آموزش دهید که به شما در حل یک مشکل موجود و درک داده های خود کمک کند؟ یا می خواهید با داده های بدون برچسب کار کنید تا به الگوریتم اجازه دهید الگوها و روندهای جدید را کشف کند؟ مدلهای یادگیری نظارت شده برای حل یک مشکل موجود، مانند پیشبینی با استفاده از دادههای از پیش موجود، بهترین کار را دارند. یادگیری بدون نظارت برای کشف بینش ها و الگوهای جدید در مجموعه داده ها بهتر عمل می کند.
یادگیری تحت نظارت در مقابل یادگیری بدون نظارت خلاصه شد
یادگیری تحت نظارت و بدون نظارت را مقایسه کنید تا بفهمید کدامیک برای شما بهتر عمل می کند.
یادگیری تحت نظارت |
یادگیری بدون نظارت |
|
داده های ورودی |
به مجموعه داده های برچسب دار نیاز دارد |
از مجموعه داده های بدون برچسب استفاده می کند |
هدف |
یک نتیجه را پیشبینی کنید یا بر اساس آن دادهها را طبقهبندی کنید (یعنی شما یک نتیجه دلخواه را در ذهن دارید) |
الگوها، ساختارها یا روابط جدید بین داده ها را کشف کنید |
انواع |
دو نوع رایج: طبقه بندی و رگرسیون |
خوشه بندی، تداعی و کاهش ابعاد |
موارد استفاده رایج |
تشخیص هرزنامه، تشخیص تصویر و اشیا، و تجزیه و تحلیل احساسات مشتری |
تقسیم بندی مشتری و تشخیص ناهنجاری |
چی یاد گرفتی؟
مدلهای یادگیری نظارتشده به دادههای آموزشی برچسبگذاری شده با درک اینکه خروجی مورد نظر باید چگونه باشد، نیاز دارند. مدلهای یادگیری بدون نظارت با دادههای ورودی بدون برچسب کار میکنند تا الگوها یا روندها را در مجموعه دادهها بدون نتایج از پیش تعیینشده شناسایی کنند. اینکه آیا یادگیری تحت نظارت یا بدون نظارت را انتخاب می کنید به ماهیت داده ها و اهداف شما بستگی دارد.
عمیق تر در فناوری هوش مصنوعی شیرجه بزنید و یاد بگیرید که چگونه هوش عمومی مصنوعی (AGI) می تواند مانند انسان ها عمل کند و اطلاعات را درک کند.
منبع: https://learn.g2.com/supervised-vs-unsupervised-learning