یادگیری تحت نظارت در مقابل یادگیری بدون نظارت: انواع و موارد استفاده

یادگیری ماشینی (ML) در حال تغییر نحوه عملکرد سازمان ها در سراسر صنایع است. چه در بخش مراقبت های بهداشتی، خدمات مالی، بازاریابی، خدمات مشتری یا هر بخش دیگری کار کنید، مدل های ML می توانند به شما در انجام وظایف مختلف کمک کنند.

اما ابتدا باید مدل ها را آموزش دهید تا کمک مورد نیاز خود را دریافت کنید. نوع وظایفی که می‌خواهید به شما کمک کند تأثیر می‌گذارد که آیا باید مدل‌های خود را با استفاده از یادگیری تحت نظارت یا بدون نظارت آموزش دهید.

داده‌های برچسب‌گذاری‌شده برای یادگیری نظارت‌شده برای کار، و استفاده کسب‌وکارها حیاتی است نرم افزار برچسب گذاری داده ها برای تبدیل داده های بدون برچسب به داده های برچسب دار و ساخت الگوریتم های هوش مصنوعی (AI).

یادگیری تحت نظارت چیست؟

یادگیری تحت نظارت نوعی از یادگیری ماشینی (ML) که از مجموعه داده های برچسب گذاری شده برای شناسایی الگوها و روابط بین داده های ورودی و خروجی استفاده می کند. برای انجام این کار به داده های برچسب گذاری شده ای نیاز دارد که شامل ورودی ها (یا ویژگی ها) و خروجی ها (دسته ها یا برچسب ها) باشد. الگوریتم ها اطلاعات ورودی را تجزیه و تحلیل می کنند و سپس خروجی مورد نظر را استنباط می کنند.

وقتی نوبت به یادگیری تحت نظارت می‌رسد، می‌دانیم که چه نوع خروجی‌هایی را باید انتظار داشته باشیم، که به مدل کمک می‌کند تا تشخیص دهد که چه چیزی پاسخ صحیح را می‌داند.

انواع یادگیری تحت نظارت چیست؟

دو مورد از متداول‌ترین روش‌های یادگیری تحت نظارت، طبقه‌بندی و رگرسیون هستند.

طبقه بندی

همانطور که از نام آن پیداست، الگوریتم‌های طبقه‌بندی داده‌ها را با اختصاص دادن آن‌ها به دسته‌ها یا خروجی‌های خاص بر اساس اطلاعات ورودی، گروه‌بندی می‌کنند. اطلاعات ورودی از ویژگی ها تشکیل شده است و الگوریتم از این ویژگی ها برای اختصاص دادن هر نقطه داده به یک برچسب طبقه بندی شده از پیش تعریف شده استفاده می کند.

یکی از رایج‌ترین نمونه‌های طبقه‌بندی روزانه، استفاده از فیلترهای اسپم در صندوق‌های ایمیل است. هر ایمیلی که دریافت می‌کنید ورودی است که ارائه‌دهنده ایمیل شما به‌عنوان «هرزنامه» یا «نه هرزنامه» طبقه‌بندی می‌کند و آن را به پوشه مناسب هدایت می‌کند. به عبارت دیگر، یک مدل یادگیری نظارت شده برای پیش‌بینی اینکه آیا ایمیل دریافتی اسپم است یا خیر، با استفاده از مجموعه داده برچسب‌گذاری شده متشکل از ایمیل‌های مجاز و هرزنامه آموزش داده می‌شود.

برای انجام این پیش‌بینی‌ها، الگوریتم ویژگی‌های ایمیل‌های موجود در مجموعه داده را تحلیل می‌کند که می‌تواند شامل عناصری مانند آدرس ایمیل فرستنده، خط موضوع، عبارات کلیدی در متن اصلی و طول ایمیل باشد.

رگرسیون

الگوریتم های رگرسیون برای درک رابطه بین متغیرهای وابسته و مستقل برای پیش بینی های آینده استفاده می شود.

فرض کنید یک شرکت خودروسازی می خواهد مسافت پیموده شده یک مدل جدید خودرو را پیش بینی کند. این شرکت خودروسازی می‌تواند مجموعه داده‌های برچسب‌گذاری‌شده مدل‌های قبلی خود را با ویژگی‌هایی مانند اندازه موتور، وزن، و ، بخار به یک الگوریتم یادگیری تحت نظارت تغذیه کند. این مدل رابطه بین ویژگی‌ها و مسافت پیموده شده مدل‌های قبلی را یاد می‌گیرد و به آن کمک می‌کند تا مسافت پیموده شده مدل جدید خودرو را پیش‌بینی کند.

  سیم های رنگی | وبلاگ ست

رگرسیون خطی

رگرسیون خطی از معادلات خطی برای مدل سازی رابطه بین نقاط داده استفاده می کند. تلاش برای یافتن بهترین خط خطی مناسب بین متغیرهای مستقل و وابسته برای پیش‌بینی متغیرهای پیوسته است. به عنوان مثال، می توانید از یک مدل رگرسیون خطی برای پیش بینی قیمت یک خانه برای فروش با استفاده از داده های قیمت گذاری برای خانه های مشابه در منطقه استفاده کنید.

رگرسیون لجستیک

رگرسیون لجستیک برای حل مسائل طبقه بندی استفاده می شود. می تواند به محاسبه یا پیش بینی احتمال وقوع یک رویداد به صورت بله یا خیر کمک کند. به این رگرسیون لجستیک باینری می گویند. به عنوان مثال، حرفه پزشکی از رگرسیون لجستیک برای پیش بینی خوش خیم یا بدخیم بودن توموری که در عکس اشعه ایکس ظاهر می شود، استفاده می کند.

نمونه های یادگیری تحت نظارت

برخی از رایج ترین کاربردهای یادگیری تحت نظارت عبارتند از:

  • تشخیص هرزنامه: همانطور که قبلا ذکر شد، ارائه دهندگان ایمیل از تکنیک های یادگیری نظارت شده برای طبقه بندی محتوای هرزنامه و غیر هرزنامه استفاده می کنند. این کار بر اساس ویژگی‌های هر ایمیل (یا ورودی)، مانند آدرس ایمیل فرستنده، خط موضوع و کپی متن، و الگوهایی که مدل یاد می‌گیرد، انجام می‌شود.
  • شی و تشخیص تصویر: ما می‌توانیم مدل‌ها را بر روی مجموعه داده بزرگی از تصاویر برچسب‌گذاری شده، مانند گربه‌ها و سگ‌ها آموزش دهیم. سپس، مدل می‌تواند ویژگی‌هایی مانند اشکال، رنگ‌ها، بافت‌ها و ساختارها را از تصاویر استخراج کند تا نحوه تشخیص این اشیاء را در آینده بیاموزد.
  • تحلیل احساسات مشتری: شرکت‌ها می‌توانند نظرات مشتریان را تجزیه و تحلیل کنند تا با آموزش مدلی با استفاده از نظرات برچسب‌گذاری شده، احساسات آنها (مثلاً مثبت، منفی یا خنثی) را تعیین کنند. مدل یاد می گیرد که کلمات و ویژگی های خاص را با احساسات مختلف مرتبط کند و می تواند نظرات مشتریان جدید را بر این اساس طبقه بندی کند.

یادگیری بدون نظارت چیست؟

یادگیری بدون نظارت نوعی از یادگیری ماشینی است که از الگوریتم‌هایی برای تجزیه و تحلیل مجموعه داده‌های بدون برچسب بدون نظارت انسان استفاده می‌کند. برخلاف یادگیری تحت نظارت، که در آن ما می دانیم چه نتایجی را باید انتظار داشته باشیم، هدف این روش کشف الگوها و کشف بینش داده ها بدون آموزش یا برچسب قبلی است.

انواع یادگیری بدون نظارت چیست؟

الگوریتم‌های یادگیری بدون نظارت برای کارهای پیچیده که در آن کاربران می‌خواهند الگوهای شناسایی نشده قبلی را در مجموعه داده‌ها کشف کنند، مناسب‌تر هستند. سه نوع سطح بالا یادگیری بدون نظارت عبارتند از خوشه بندی، تداعی و کاهش ابعاد. چندین رویکرد و تکنیک برای این انواع وجود دارد.

خوشه بندی

خوشه‌بندی یک تکنیک یادگیری بدون نظارت است که داده‌های بدون برچسب را بر اساس شباهت‌ها یا تفاوت‌های بین نقاط داده به گروه‌ها یا همان‌طور که از نامش پیداست، به خوشه‌ها تقسیم می‌کند. الگوریتم های خوشه بندی به دنبال گروه های طبیعی در میان داده های دسته بندی نشده می گردند.

برای مثال، یک الگوریتم یادگیری بدون نظارت می‌تواند مجموعه داده‌ای بدون برچسب از حیوانات مختلف زمین، آب و هوا را بگیرد و آنها را بر اساس ساختار و شباهت‌ها در خوشه‌هایی سازمان‌دهی کند.

الگوریتم های خوشه بندی شامل انواع زیر است:

  • خوشه بندی انحصاری: همانطور که از نام آن پیداست، یک نقطه داده تنها می تواند در یک خوشه خاص وجود داشته باشد، زمانی که از این رویکرد استفاده می شود، زیرا رابطه انحصاری است. به خوشه بندی انحصاری، خوشه بندی سخت نیز گفته می شود.
  • خوشه بندی همپوشانی: برخلاف خوشه‌بندی انحصاری، الگوریتم‌های همپوشانی اجازه می‌دهند که یک نقطه داده در دو یا چند خوشه گروه‌بندی شود. خوشه‌بندی همپوشانی به عنوان خوشه‌بندی نرم نیز نامیده می‌شود.
  • خوشه بندی سلسله مراتبی: یک مجموعه داده بر اساس شباهت بین نقاط داده به خوشه ها تقسیم می شود. سپس، خوشه ها بر اساس روابط سلسله مراتبی سازماندهی می شوند. دو نوع خوشه بندی سلسله مراتبی وجود دارد: تجمعی و تقسیمی.
    • خوشه بندی تجمعی داده ها را به روشی از پایین به بالا دسته بندی می کند، به این معنی که نقاط داده ایزوله می شوند و سپس با به وجود آمدن شباهت ها ادغام می شوند تا زمانی که یک خوشه را تشکیل دهند.
    • خوشه بندی تفرقه انگیز رویکرد مخالف را اتخاذ می کند، روشی از بالا به پایین برای تقسیم خوشه ها بر اساس تفاوت بین داده ها.
  • خوشه بندی احتمالی: همانطور که از نام آن پیداست، در یک مدل خوشه‌بندی احتمالی، نقاط داده بر اساس احتمال تعلق آنها به یک توزیع خوشه‌بندی می‌شوند. خوشه‌بندی احتمالی به اشیا اجازه می‌دهد به یک یا چند خوشه تعلق داشته باشند.
  Personal Selling: Build Lasting Customer Relationships

انجمن

در این رویکرد مبتنی بر قوانین یادگیری بدون نظارت، الگوریتم‌های یادگیری به دنبال همبستگی‌های if-then و روابط بین نقاط داده می‌شوند. این تکنیک معمولاً برای تجزیه و تحلیل عادات خرید مشتری استفاده می‌شود و شرکت‌ها را قادر می‌سازد تا روابط بین محصولات را برای بهینه‌سازی جایگاه‌های محصول و استراتژی‌های بازاریابی هدفمند خود درک کنند.

تصور کنید یک فروشگاه مواد غذایی بخواهد بهتر بفهمد که خریداران آنها اغلب چه اقلامی را با هم می خرند. این فروشگاه دارای مجموعه داده ای است که شامل لیستی از سفرهای خرید است، که در هر سفر به جزئیات می توان گفت که خریدار کدام کالا را در فروشگاه خریداری کرده است.

در اینجا نمونه ای از پنج سفر خریدی است که آنها ممکن است به عنوان بخشی از مجموعه داده خود استفاده کنند:

  • خریدار 1: شیر
  • خریدار 2: شیر و کلوچه
  • خریدار 3: کلوچه، نان و موز
  • خریدار 4: نان و موز
  • خریدار 5: شیر، کلوچه، چیپس، نان و بستنی

فروشگاه می‌تواند برای جستجوی اقلامی که خریداران اغلب در یک سفر خرید می‌خرند، از انجمن استفاده کند. آنها می توانند شروع به استنباط قوانین if-then کنند، مانند: اگر کسی شیر بخرد، اغلب کلوچه نیز می خرد.

سپس، الگوریتم می تواند اطمینان و احتمال خرید این اقلام را با هم از طریق یک سری محاسبات و معادلات محاسبه کند. با پیدا ، اقلامی که خریداران با هم می‌خرند، خواربارفروشی می‌تواند تاکتیک‌هایی مانند قرار دادن اقلام در کنار یکدیگر برای تشویق به خرید آن‌ها با هم یا ارائه قیمت با تخفیف برای خرید هر دو کالا به کار گیرد. این فروشگاه خرید را برای مشتریان خود راحت تر می کند و فروش را افزایش می دهد.

کاهش ابعاد

کاهش ابعاد یک تکنیک یادگیری بدون نظارت است که تعداد ویژگی‌ها یا ابعاد یک مجموعه داده را کاهش می‌دهد و تجسم داده‌ها را آسان‌تر می‌کند. با استخراج ویژگی های ضروری از داده ها و کاهش موارد نامربوط یا تصادفی بدون به خطر انداختن یکپارچگی داده های اصلی کار می کند.

نمونه های یادگیری بدون نظارت

برخی از موارد استفاده روزمره برای یادگیری بدون نظارت شامل موارد زیر است:

  • تقسیم بندی مشتریان: کسب‌وکارها می‌توانند از الگوریتم‌های یادگیری بدون نظارت برای ایجاد نمایه‌های شخصیت خریدار با خوشه‌بندی ویژگی‌ها، رفتارها یا الگوهای مشترک مشتریان خود استفاده کنند. به عنوان مثال، یک شرکت خرده فروشی ممکن است از تقسیم بندی مشتریان برای شناسایی خریداران ارزان قیمت، خریداران فصلی و مشتریان با ارزش استفاده کند. با در نظر گرفتن این پروفایل ها، این شرکت می تواند پیشنهادات شخصی و تجربیات متناسب با اولویت های هر گروه ایجاد کند.
  • تشخیص ناهنجاری: در تشخیص ناهنجاری، هدف شناسایی نقاط داده ای است که از بقیه مجموعه داده ها منحرف می شوند. از آنجایی که ناهنجاری‌ها اغلب نادر هستند و بسیار متفاوت هستند، برچسب‌گذاری آنها به عنوان بخشی از مجموعه داده برچسب‌گذاری شده می‌تواند چالش برانگیز باشد، بنابراین تکنیک‌های یادگیری بدون نظارت برای شناسایی این موارد نادر مناسب هستند. مدل‌ها می‌توانند به کشف الگوها یا ساختارهایی در داده‌ها کمک کنند که رفتار غیرعادی را نشان می‌دهند، بنابراین این انحراف‌ها می‌توانند به عنوان ناهنجاری ذکر شوند. نظارت بر تراکنش های مالی برای شناسایی رفتارهای متقلبانه نمونه بارز این موضوع است.
  چرا حفظ توجه دیگر یک استراتژی محتوایی ارزشمند نیست؟

انتخاب بین یادگیری تحت نظارت و بدون نظارت

انتخاب مدل آموزشی مناسب برای دستیابی به اهداف کسب‌وکار و خروجی‌های هدف بستگی به داده‌های شما و مورد استفاده از آن دارد. هنگام تصمیم گیری در مورد اینکه آیا یادگیری تحت نظارت یا بدون نظارت بهترین کار را برای شما دارد، سؤالات زیر را در نظر بگیرید:

  • آیا با مجموعه داده برچسب دار یا بدون برچسب کار می کنید؟ تیم شما با چه اندازه مجموعه داده کار می کند؟ آیا داده های شما برچسب گذاری شده است؟ یا اینکه اگر این مسیر را انتخاب کنید، دانشمندان داده شما زمان و تخصص لازم برای اعتبارسنجی و برچسب گذاری مجموعه داده های شما را دارند؟ به یاد داشته باشید، اگر می‌خواهید یادگیری تحت نظارت را دنبال کنید، مجموعه داده‌های برچسب‌گذاری شده ضروری هستند.
  • به حل چه مشکلاتی امیدوار هستید؟ آیا می خواهید مدلی را آموزش دهید که به شما در حل یک مشکل موجود و درک داده های خود کمک کند؟ یا می خواهید با داده های بدون برچسب کار کنید تا به الگوریتم اجازه دهید الگوها و روندهای جدید را کشف کند؟ مدل‌های یادگیری نظارت شده برای حل یک مشکل موجود، مانند پیش‌بینی با استفاده از داده‌های از پیش موجود، بهترین کار را دارند. یادگیری بدون نظارت برای کشف بینش ها و الگوهای جدید در مجموعه داده ها بهتر عمل می کند.

یادگیری تحت نظارت در مقابل یادگیری بدون نظارت خلاصه شد

یادگیری تحت نظارت و بدون نظارت را مقایسه کنید تا بفهمید کدامیک برای شما بهتر عمل می کند.

یادگیری تحت نظارت

یادگیری بدون نظارت

داده های ورودی

به مجموعه داده های برچسب دار نیاز دارد

از مجموعه داده های بدون برچسب استفاده می کند

هدف

یک نتیجه را پیش‌بینی کنید یا بر اساس آن داده‌ها را طبقه‌بندی کنید (یعنی شما یک نتیجه دلخواه را در ذهن دارید)

الگوها، ساختارها یا روابط جدید بین داده ها را کشف کنید

انواع

دو نوع رایج: طبقه بندی و رگرسیون

خوشه بندی، تداعی و کاهش ابعاد

موارد استفاده رایج

تشخیص هرزنامه، تشخیص تصویر و اشیا، و تجزیه و تحلیل احساسات مشتری

تقسیم بندی مشتری و تشخیص ناهنجاری

چی یاد گرفتی؟

مدل‌های یادگیری نظارت‌شده به داده‌های آموزشی برچسب‌گذاری شده با درک اینکه خروجی مورد نظر باید چگونه باشد، نیاز دارند. مدل‌های یادگیری بدون نظارت با داده‌های ورودی بدون برچسب کار می‌کنند تا الگوها یا روندها را در مجموعه داده‌ها بدون نتایج از پیش تعیین‌شده شناسایی کنند. اینکه آیا یادگیری تحت نظارت یا بدون نظارت را انتخاب می کنید به ماهیت داده ها و اهداف شما بستگی دارد.

عمیق تر در فناوری هوش مصنوعی شیرجه بزنید و یاد بگیرید که چگونه هوش عمومی مصنوعی (AGI) می تواند مانند انسان ها عمل کند و اطلاعات را درک کند.

منبع: https://learn.g2.com/supervised-vs-unsupervised-learning

404 error content does not exist anymore. Knowledge panels – serp feature. With vidiq’s support, emma’s youtube channel flourished.