آغازگر ماشین یادگیری هوش مصنوعی

به گزارش علمی نیوز و به نقل از Psychology Today، این احتمال وجود دارد که شما در حال حاضر هر روز از خدماتی استفاده می کنید که توسط هوش مصنوعی (AI) ارائه می شود. اما دقیقاً چه چیزی به یادگیری ماشینی قدرت می دهد؟ بیایید نگاهی به موتور زیر کاپوت یادگیری ماشینی هوش مصنوعی بیندازیم.
یادگیری ماشینی زیرمجموعهای از هوش مصنوعی است که برای انجام وظایف نیازی به کدنویسی صریح (برنامهنویسی) ندارد. این امر با ارائه الگوریتم های یادگیری ماشینی با مقادیر زیادی داده برای "یادگیری" و پردازش به دست می آید. یادگیری ماشینی به روشی انجام می شود که تحت نظارت، بدون نظارت، نیمه نظارت یا با روش های تقویتی انجام می شود.
یادگیری ماشینی تحت نظارت از دادههای آموزشی برچسبگذاری شده استفاده میکند—برای هر ورودی، یک مقدار خروجی شناخته شده و مرتبط وجود دارد. هدف از یادگیری تحت نظارت یادگیری تابعی است که به بهترین وجه رابطه بین داده های ورودی و خروجی را تخمین می زند. در حالی که در یادگیری بدون نظارت، هیچ داده آموزشی خروجی برچسبگذاری شدهای مرتبط با دادههای ورودی وجود ندارد، بنابراین هدف این است که ماشین از دادههای آموزشی ورودی ارائهشده استنتاج کند – شناسایی شباهتها و تفاوتهای بین نقاط داده. یادگیری ماشین نیمه نظارت شده از برخی داده های آموزشی برچسب گذاری شده استفاده می کند.
یادگیری تقویتی (RL) روشی است که در آن یادگیری از طریق عوامل نرم افزاری در تعامل با محیط آن با هدف به حداکثر رساندن پاداش به دست می آید. فرآیندهای تصمیم گیری مارکوف (MDPs) معمولاً برای یادگیری تقویتی استفاده می شوند. MDP تصمیم گیری را در محیط های نامشخص مدل سازی ریاضی می کند.
در قلب هوش مصنوعی، ریاضیات و آمار مورد استفاده در الگوریتمهای کامپیوتری، روشهایی برای حل یک مسئله است. الگوریتمهایی که رگرسیون ، طبقهبندی یا خوشهبندی را انجام میدهند، نمونههایی از کارهای رایج یادگیری ماشین هستند.
مفهوم رگرسیون توسط چندمتخصص سر فرانسیس گالتون (پسر عموی چارلز داروین) در مقالات تحقیقاتی ژنتیک خود با عنوان "پسرفت به سمت متوسط در قامت ارثی" و "ارث طبیعی" منتشر شده به ترتیب در سال 1886 و 1889 معرفی شد. «رگرسیون به سمت میانگین» پدیدهای است برای دادههای پرت که خارج از هنجار هستند تا دفعه بعد که اندازهگیری میشوند به میانگین نزدیکتر شوند. از نظر علمی، رگرسیون به میانگین معمولاً به دلیل اشتباهات در نمونهگیری دادهها رخ میدهد. این می تواند زمانی رخ دهد که حجم نمونه خیلی کوچک باشد یا اگر نمونه ها به طور تصادفی انتخاب نشده باشند.
روشی برای اندیشیدن به این موضوع در زمینه ضرب المثل آشنای «از میز دور شوید» است، وقتی در کازینو جلوتر هستید، زیرا برنده شدن یک نقطه پرت تصادفی است و با گذشت زمان، نتیجه به سمت میانگین باخت عقب میرود. بردهای رگهای نتایج غیرمعمولی هستند و احتمال اینکه با گذشت زمان در صورت ادامه بازی، در نهایت شروع به شکست کنید، زیاد است.
رگرسیون خطی ساده ترین شکل رگرسیون است که برای تحلیل پیش بینی در الگوریتم های یادگیری ماشین استفاده می شود. هدف به حداقل رساندن خطا بین مقدار واقعی الگوریتم و مقدار پیش بینی شده است. یک تابع هزینه که به عنوان تابع میانگین مربعات خطا (MSE) نیز شناخته می شود، خطاهای پیش بینی را اندازه گیری می کند.
گرادیان نزول یک الگوریتم بهینهسازی برای یادگیری ماشینی است که برای شناسایی مقادیر ضرایب (پارامترهای) یک تابع استفاده میشود که تابع هزینه را به حداقل میرساند.
رگرسیون خطی نسبتاً ساده و سرراست است. با این حال، اغلب اوقات، در هر مجموعه داده معین، رابطه بین دو متغیر مستقیماً متناسب نیست، و بنابراین نمی توان با رگرسیون خطی به دست آورد. در یادگیری ماشین، معمولاً از تکنیکهای رگرسیون غیرخطی استفاده میشود. نمونه هایی از الگوریتم های رگرسیون غیرخطی شامل روش های گرادیان نزولی، گاوس-نیوتن و روش های لونبرگ-مارکوارت است.
یکی دیگر از کارهای رایج یادگیری ماشین، طبقه بندی است. طبقهبندی، یادگیری ماشینی تحت نظارت است که در آن رایانه از دادههای آموزشی برچسبگذاری شده یاد میگیرد و یادگیری را با هدف پیشبینی دقیق کلاس برای دادهها اعمال میکند. برای مثال، در کمدی «سیلیکون ولی» HBO، یکی از شخصیتهای مبتکر، آقای جیان یانگ، یک برنامه هوش مصنوعی به نام «نه هات داگ» ایجاد کرد تا تصاویر را به عنوان هات داگ یا غیر هات داگ طبقه بندی کند. در زندگی واقعی، تیم آنگلید، مشاور فنی اصلی نمایش، یک برنامه Not Hotdog ایجاد کرد. مانند هر یادگیری ماشینی، کمیت و کیفیت آموزش مهم است. در این مورد، آنگلید در پست وبلاگ خود در Medium نوشت که به دلیل سوگیری در مجموعه داده اولیه استفاده شده، این برنامه "نمی تواند هات داگ های سبک فرانسوی، هات داگ های آسیایی، و چیزهای عجیب دیگری را که ما تجربه شخصی فوری با آنها نداشتیم، تشخیص دهد." و اینکه هوش مصنوعی تحت تأثیر همان تعصبات انسانی است که ما طعمه آنها می شویم، از طریق مجموعه های آموزشی که انسان ها ارائه می دهند.
سومین نوع اصلی کار یادگیری ماشین، خوشهبندی است - سازماندهی دادههای بدون برچسب در گروههای مشابه از طریق یادگیری ماشینی بدون نظارت. برای نشان دادن مفهوم خوشهبندی، بیایید به نمونهای از تجزیه و تحلیل خوشهای آماری مبتنی بر انسان نگاهی بیندازیم - کار انجام شده توسط جان اسنو، MD، یکی از اولین اپیدمیولوژیستها بود. دکتر اسنو موارد وبا را نقشهبرداری کرد و متوجه شد که خوشههایی از شیوع در نزدیکی یک پمپ آب هستند. همانطور که مشخص است، آب آن پمپ با پوشک کثیف یک نوزاد مبتلا به وبا آلوده شده است. دکتر اسنو این نظریه را مطرح کرد که وبا یک بیماری منتقله از طریق آب در طی یک شیوع بزرگ در سال 1854 در محله لندن در سوهو بود. بر اساس تجزیه و تحلیل دقیق خود، او به این نتیجه رسید که وبا آنطور که فکر غالب در آن زمان بود، ناشی از «میاسما» («هوای بد») نیست.
افزایش اخیر سرمایهگذاریهای هوش مصنوعی (AI) در بسیاری از بخشهای صنعت عمدتاً به دلیل قابلیتهای تشخیص الگو از یادگیری عمیق است، یک روش یادگیری ماشینی بیش از دو لایه شبکههای عصبی . یادگیری عمیق شبکه های عصبی متشکل از دو یا چند لایه هستند که از پردازش غیرخطی استفاده می کنند. یادگیری عمیق برای تشخیص الگوی پیشرفته ای است که برای تشخیص تصویر و گفتار استفاده می شود. این تکنیک زمانی بهینه است که مجموعه داده های بزرگی برای آموزش در دسترس باشد.
هوش مصنوعی در برنامه های رسانه های اجتماعی ، جستجوی اینترنتی، پیشنهادات خرید آنلاین، ربات های خدمات مشتری، پزشکی شخصی، تجارت مالی، مدیریت تولید صنعتی ، کشف داروهای پزشکی، پیشگیری از تقلب، تجزیه و تحلیل هوش تجاری، استخدام منابع انسانی، دستیاران مجازی، وسایل نقلیه خودران در هم تنیده شده است. ، موتورهای ترجمه، تشخیص چهره، تبدیل تصاویر به رنگ و حتی ورزش های الکترونیکی . حوزه های بین رشته ای ریاضیات، آمار، علم داده و علوم کامپیوتر در یادگیری ماشینی همگرا می شوند، که به نوبه خود، نحوه زندگی، کار و بازی ما را به سرعت تغییر می دهد.