
ITFuturist.ir
ChatGPT یک ربات چت هوش مصنوعی (AI) است که توسط OpenAI توسعه یافته و در نوامبر 2022 منتشر شد. این ربات بر روی مدلهای زبان بزرگ GPT-3.5 و GPT-4 OpenAI ساخته شده است و بهخوبی تنظیم شده است. رویکرد انتقال یادگیری (با استفاده از تکنیک های یادگیری تحت نظارت و تقویتی) می باشد.
ChatGPT به عنوان یک نمونه اولیه در 30 نوامبر 2022 راه اندازی شد و توجهات را به دلیل پاسخ های دقیق و پاسخ های واضح در بسیاری از حوزه های دانش به خود جلب کرد. تمایل آن به ارائه با اطمینان پاسخ های نادرست واقعی به عنوان یک اشکال مهم شناسایی شده است. در سال 2023، پس از انتشار ChatGPT، ارزش OpenAI 29میلیارد دلار آمریکا برآورد شد. ظهور ربات چت باعث افزایش رقابت در فضا شده است و انگیزه ایجاد Bard گوگل و LLaMA متا را ایجاد کرده است.
نسخه اصلی ChatGPT بر اساس GPT-3.5 بود. نسخه ای مبتنی بر GPT-4، جدیدترین مدل OpenAI، در 14 مارس 2023 منتشر شد و برای مشترکین پولی به صورت محدود در دسترس است.
آموزش
ChatGPT عضوی از خانواده مدل های زبانی ترانسفورماتور از پیش آموزش دیده (GPT) است. این برنامه بر روی یک نسخه بهبودیافته از OpenAI’s GPT-3 که با نام “GPT-3.5” شناخته می شود، تنظیم شده است. فرآیند تنظیم دقیق، هم یادگیری تحت نظارت و هم یادگیری تقویتی را در فرآیندی به نام یادگیری تقویتی از بازخورد انسانی (RLHF) تحت تأثیر قرار داد. هر دو رویکرد از مربیان انسانی برای بهبود عملکرد مدل استفاده می کنند. در مورد یادگیری تحت نظارت، مدل با مکالماتی ارائه شد که در آن مربیان هر دو طرف را بازی کردند: کاربر و دستیار هوش مصنوعی. در مرحله یادگیری تقویتی، مربیان انسان ابتدا پاسخ هایی را که مدل در مکالمه قبلی ایجاد کرده بود، رتبه بندی کردند. این رتبهبندیها برای ایجاد «مدلهای پاداش» که برای تنظیم دقیق مدل با استفاده از چندین تکرار از مدل بهینه سازی سیاست مبدایی( Proximal Policy Optimization (PPO) ) استفاده می نماید.
ChatGPT در ابتدا از یک زیرساخت ابر محاسباتی Microsoft Azure استفاده میکرد که توسط پردازندههای گرافیکی Nvidia پشتیبانی میشد، که مایکروسافت به طور خاص برای OpenAI ساخته بود و طبق گزارشها «صدها میلیون دلار» هزینه داشت. پس از موفقیت ChatGPT، مایکروسافت به طور چشمگیری زیرساخت OpenAI را در سال 2023 ارتقا داد.
OpenAI دادههای کاربران ChatGPT را جمعآوری میکند تا سرویس را آموزش دهد و بهینهسازی کند. کاربران میتوانند به پاسخهایی که از ChatGPT دریافت میکنند رأی مثبت یا منفی بدهند و یک فیلد متنی را با بازخورد اضافی پر کنند.
منبع
آینده پژوهی
بیشتر درباره آینده پژوهی
مطالب بیشتر
چرا خرده فروشان در اتخاذ تجزیه و تحلیل داده های پیشرفته شکست می خورند؟
انقلابی دیگر در فناوری هوش مصنوعی
کوتوله های تکنولوژی