در طی چند سال اخیر، تحولات گسترده ای در حوزه هوش مصنوعی ایجاد شده است. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد و شوک بزرگی به این حوزه وارد کرده است. این مدل هوش مصنوعی قدرتمند، توانایی درک تصاویر و متون را دارد. به گفته OpenAI، هوش مصنوعی GPT-4، از ورودی های متنی و تصاویر نیز پشتیبانی کرده و رشد و پیشرفت قبل توجهی نسبت به مدل پیشین خود یعنی GPT-3.5 که تنها از ورودی های متنی پشتیبانی میکند، داشته است. در این مقاله، به تجزیه و تحلیل کامل ویژگی های پیشرفته GPT-4 پرداخته و قابلیتهای جدیدی که ارائه میکند را شرح میدهیم.
GPT-4 چیست؟
در طی چند ماه اخیر، بحث های زیادی پیرامون هوش مصنوعی اتفاق افتاد و موارد زیادی از تاثیر ChatGPT در زندگی انسان بیان شد. طی چند روز اخیر نیز شرکت OpenAI، از هوش مصنوعی جدید خود یعنی GPT-4 رونمایی کرده و افراد زیادی قصد آشنایی با آن را دارند. GPT-4 جدیدترین نسخه از سیستم های مدل زبان OpenAI است.
نسخه قبلی آن، GPT 3.5، ربات چت بسیار محبوب ChatGPT را در نوامبر ۲۰۲۲ راه اندازی کرد. GPT مخفف Generative Pre-trained Transformer (GPT)، نوعی مدل زبانی است که از یادگیری عمیق برای تولید متن محاوره ای شبیه انسان استفاده میکند. GPT-4 در ۱۴ مارس ۲۰۲۳ توسط OpenAI، تقریباً چهار ماه پس از اینکه این شرکت ChatGPT را برای عموم در پایان نوامبر ۲۰۲۲ راه اندازی کرد، رونمایی شد.
ترانسفورماتورهای از پیش آموزش دیده (GPT) نوعی مدل یادگیری عمیق هستند که برای تولید متنی شبیه به انسان استفاده میشوند. کاربردهای رایج این هوش مصنوعی عبارت است از: پاسخ دادن به سوالات، خلاصه کردن متن، ترجمه متن به زبان های دیگر، تولید کد، ایجاد پست های وبلاگ، داستان ها، گفتگوها و سایر انواع محتوا. این مدل یک مدل چندوجهی بزرگ است که میتواند هم ورودی تصویر و هم متن را بپذیرد و خروجی متن تولید کند. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد
انتشار اخیر GPT-4 نقطه عطف مهمی در زمینه هوش مصنوعی، به ویژه در حوزه پردازش زبان است. شرکت OpenAI به مدت شش ماه، با استفاده از برنامه های آزمایشی مختلف و ChatGPT، به طور مداوم این مدل را سنجیده تا به نتایج خوبی دست پیدا کند. موفق هم شده است و این مدل توانایی حل مسائل بسیار دشوار با سرعت و دقت بالا را دارد. در حال حاضر نیز، چندین شرکت مانند دولینگو و Stripe، با OpenAI برای ادغام GPT-4 با خدماتشان اعلام آمادگی کرده اند.
پیش از وجود GPT
انقلاب هوش مصنوعی کنونی در حوزه زبان، تنها با اختراع مد لهای ترانسفورماتور امکانپذیر و با BERT گوگل در سال ۲۰۱۷ نیز شروع شد. پیش از این، از سرویس هایی استفاده میشد که برای خروجی تک کلمات یا عبارات کوتاه عملکرد خوبی داشتند، اما نمیتوانستند محتواهای طولانی تری تولید کنند. در همین زمان GPT-1 معرفی شد.
GPT-1
در سال ۲۰۱۸، OpenAI مقالهای (بهبود درک زبان توسط پیشآموزش مولد) درباره استفاده از درک زبان طبیعی با استفاده از مدل زبان GPT-1 منتشر کرد. این مدل تنها اثبات مفهوم بود و به صورت عمومی منتشر نشد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد
GPT-2
سال بعد، OpenAI مقاله دیگری را در مورد آخرین مدل خود یعنی GPT-2 منتشر کرد. این بار، این مدل در دسترس جامعه علاقه مند به یادگیری ماشین قرار گرفت و برای کارهای تولید متن نیز استفاده شد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد
GPT-3
در سال ۲۰۲۰، OpenAI مقاله دیگری در مورد مدل GPT-3 خود منتشر کرد. این مدل ۱۰۰ برابر پارامترهای بیشتری نسبت به GPT-2 داشت و بر روی یک مجموعه داده متنی حتی بزرگتر آموزش داده شد که در نتیجه عملکرد مدل بهتری داشت. این مدل با تکرارهای مختلفی که به عنوان سری GPT-3.5 شناخته می شوند، از جمله ChatGPT متمرکز بر مکالمه، به بهبود عملکرد خود ادامه داد.
این نسخه با توانایی خود در تولید صفحات متنی شبیه به انسان، جهان را غافلگیر کرد. ChatGPT تبدیل به سریعترین برنامه وب در حال رشد شد و تنها در دو ماه به ۱۰۰ میلیون کاربر رسید. پس از این نسخه، به تازگی نسخه جدیدتر یعنی GPT-4 منتشر شده است.
چگونه می توان به GPT-4 دسترسی پیدا کرد؟
OpenAI هنوز قابلیت های بصری GPT-4 را از طریق هر پلتفرمی را در دسترس قرار نداده است، زیرا شرکت تحقیقاتی برای شروع تنها با یک شریک واحد همکاری می کند. با این حال، راه هایی برای دسترسی به قابلیت ورودی متن GPT-4 وجود دارد. تنها راه دسترسی به قابلیت ورودی متن از طریق OpenAI، اشتراک در ChatGPT Plus است که دسترسی مشترکین به مدل زبان را با قیمت ۲۰ دلار در ماه تضمین میکند.
یک راه رایگان برای دسترسی به قابلیت متن GPT-4 وجود دارد و آن با استفاده از BingChat است. روزی که GPT-4 توسط OpenAI رونمایی شد، مایکروسافت اعلام کرد که چت ربات خود یعنی، Bing Chat، از زمان عرضه آن در پنج هفته پیش، بر روی GPT-4 اجرا شده است. بینگ چت ربات چت مایکروسافت است که بر روی پیشرفته ترین LLM OpenAI – GPT-4 اجرا میشود.
به گفته شرکت مایکروسافت، در عرض یک ماه پس از راه اندازی، ۴۵ میلیون چت بر روی پلتفرم Bing chat، با ۱۰۰ میلیون کاربر فعال روزانه انجام شد. محبوبیت چت بات از این واقعیت ناشی می شود که دارای توانایی های مشابه ChatGPT است اما دسترسی کامل به اینترنت دارد که ChatGPT ندارد. عموم می توانند با ارائه درخواست، برای دسترسی به آن اقدام کنند. استفاده از بینگ چت رایگان است اما نیاز به ثبت نام دارد.
در حال حاضر، GPT-4، تنها برای مشترکین پولی ChatGPT در دسترس است. برای مشاهده قابلیت های ChatGPT، میتوانید به وب سایت فروشگاه جعو استور که ارائه دهنده اکانت های اشتراکی مختلف است، مراجعه کنید.
GPT-4 چه کاری میتواند انجام دهد؟
از آنجایی که GPT-4 یک مدل چندوجهی بزرگ است، میتواند هم ورودیهای متن و تصویر را بپذیرد و هم متنی شبیه انسان را خروجی دهد. به عنوان مثال، با GPT-4، میتوانید یک برگه از سوالات را در آن آپلود کنید، GPT-4 میتواند آن را اسکن کند و به سؤالات موجود در برگه پاسخ دهد. همچنین میتواند نموداری را که آپلود میکنید را بخواند و بر اساس داده های ارائه شده محاسباتی انجام دهد. قابلیتهای فکری نیز در این مدل بیشتر بهبود یافتهاند و در یک سری آزمون های محک شبیه سازی شده، بهتر از GPT-3.5 عمل میکنند.
OpenAI، GPT-4 را با شبیه سازی امتحانات طراحی شده برای انسان ها، مانند آزمون یکنواخت وکالت و LSAT برای وکلا، و SAT برای پذیرش دانشگاه، ارزیابی کرد. نتایج نشان داد که GPT-4 عملکردی در سطح انسانی در معیارهای مختلف حرفه ای و دانشگاهی به دست آورد. OpenAI همچنین GPT-4 را بر روی معیارهای سنتی طراحی شده برای مدلهای یادگیری ماشین نیز ارزیابی کرد،
جایی که از مدلهای زبان بزرگ موجود و بیشتر مدلهای پیشرفته که ممکن است شامل پروتکلهای آموزشی خاص یا پروتکلهای آموزشی اضافی باشد، بهتر عمل کرد. این معیارها شامل سؤالات چندگزینه ای در ۵۷ موضوع، استدلال در مورد رویدادهای روزمره، سؤالات علوم چندگزینه ای کلاس ابتدایی و موارد دیگر بود. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد
OpenAI با ترجمه معیار MMLU، مجموعهای از ۱۴۰۰۰ مسئله چند گزینهای که شامل ۵۷ موضوع است، به زبانهای مختلف با استفاده از Azure Translate، قابلیت GPT-4 را در زبان های دیگر را نیز آزمایش کرد. در ۲۴ زبان از ۲۶ زبان آزمایش شده، GPT-4 عملکرد بهتری نسبت به عملکرد زبان GPT-3.5 و سایر مدل های دیگر داشت. به طور کلی، نتایج پایه ای تر GPT-4 نشان دهنده پیشرفت قابل توجهی در تلاش OpenAI برای توسعه مدل های هوش مصنوعی با قابلیت های پیشرفته تر است.
قابلیت های جدید GPT-4
- بهبود عملکرد به نسبت نسخه قبلی: همانطور که ممکن است انتظار داشته باشید، GPT-4 به نسبت مدل های GPT-3.5، در زمینه صحت واقعی پاسخ ها بهبود یافته و تعداد دفعاتی که ممکن است خطاهای واقعی یا استدلالی را مرتکب شود ،کمتر است. GPT-4 همچنین “هدایت پذیری” را که توانایی تغییر رفتار بر اساس درخواست کاربر است را نیز بهبود میبخشد. به عنوان مثال، میتوانید به آن دستور دهید که با سبک یا لحن یا صدای متفاوتی بنویسد.
- استفاده از ورودی های بصری در GPT-4: یکی از تغییرات عمده دیگر این است که GPT-4 می تواند از ورودی های تصویر و متن نیز استفاده کند. کاربران میتوانند با وارد کردن متن و تصاویر به هم ریخته، هر چشم انداز یا وظیفه زبانی سیستم را مشخص کنند. نمونههایی نشان میدهند که GPT-4 به درستی تصاویر پیچیدهای مانند نمودارها، میمها و عکس هایی از مقالات دانشگاهی را تفسیر میکند.
OpenAI، آخرین مدل خود یعنی GPT-4 که به توسعه سریع حوزه هوش مصنوعی در بیزینس کمک می کند را ارائه کرده است. سازمانها در حال حاضر از ابزارهای پیشرفته تر هوش مصنوعی برای انجام عملیات روزانه خود استفاده میکنند، و GPT-3 و GPT-3.5 OpenAI در شش ماه گذشته محبوبیت خاصی پیدا کردهاند و به ChatGPT جذابی تبدیل شدهاند.
به دایل این محبوبیت، مدل جدید چندوجهی نیز چند روز پیش ارائه شد. به این معنی که کاربران میتوانند از متن و تصاویر به عنوان ورودی استفاده کنند و به عنوان خلاق ترین و قدرتمندترین مدل ساخته شده توسط OpenAI معرفی شده است. این شرکت میگوید که GPT-4 دارای پیشرفتهای بزرگی است. همان طور که پیش از این نیز مردم را با توانایی خود در ایجاد متنی شبیه به انسان و تولید تصاویر و کدهای رایانهای متحیر کرده است. محققان می گویند این توانایی ها پتانسیل تغییر علم را دارند.
این شرکت همچنین تاکید کرده است که GPT-4 ایمنتر از نسخههای قبلی است و به شدت به مرزهای تعیینشده توسط توسعهدهندگان و کاربران خود پایبند است. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد
GPT-4 در مقابل GPT-3
همان طور در بخش های قبلی این مقاله از جعو استور بیان کردیم، در تمام معیارها، GPT-4 پیشرفت قابل توجهی نسبت به مدلهای قبل از خود دارد. با کنار گذاشتن این واقعیت که می تواند تصاویر را مدیریت کند، قابلیتی که در مدل GPT-4 وجود دارد این است که می تواند خروجی های ظریف تر، قابل اعتمادتر و چالش برانگیزتر از GPT-3 یا GPT-3.5 داشته باشد.
در آزمون های شبیه سازی شده طراحی شده برای انسان، GPT-4 تا حد زیادی از نتایج GPT-3.5 پیشی گرفت. در صدک ۹۰ برای Uniform Bar در مقابل نتایج صدک ۱۰ GPT-3.5 و صدک ۸۸ برای LSAT در مقابل صدک ۴۰ GPT-3.5 قرار گرفت. GPT-4 همچنین امتیاز بالایی در معیار درک زبان چندوظیفه عظیم (MMLU) کسب کرد، که مدل ها را در برابر ۱۴۰۰۰ سؤال چند گزینه ای بر اساس طیف وسیعی از موضوعاتی که در مجموعه های آموزشی پوشش داده نشده است، قرار میدهد.
OpenAI همچنین ادعا میکند که GPT-4 در طیف وسیعی از معیارهای یادگیری ماشینی (ML) از مدلهای زبان بزرگ (LLM) مانند Google’s Palm و Meta’s LLaMA بهتر عمل کرده است. OpenAI در پست وبلاگ خود در GPT-4 میگوید: «به طور قابل توجهی بسیاری از ویژگیهای ایمنی GPT-4 در مقایسه با GPT-3.5 بهبود بخشیده شده است.
تمایل مدل به پاسخگویی به درخواستهای محتوای غیرمجاز در مقایسه با GPT-3.5 تا ۸۲ درصد کاهش داده شده و GPT-4 به درخواست های حساس (مانند توصیه های پزشکی و آسیب رساندن به خود) ۲۹ درصد بیشتر پاسخ میدهد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد
مزایای تجاری GPT-4 چیست؟
یکی از ویژگی های برجسته GPT-4 ماهیت چند وجهی آن است که به کسب و کارها اجازه میدهد تا طیف وسیع تری از داده ها را نسبت به قبل به آن وارد کنند. شرکت ها میتوانند از این مدل برای خلاصهسازی فایل های PDF، جمع آوری و زمینه سازی داده های نمودار، تحلیل و نقد قراردادها یا شناسایی سریع بی نظمی های بصری در زیر ساخت فیزیکی، استفاده کنند. GPT-4 می تواند تصاویر و همچنین اطلاعات را از تصاویر استخراج و پردازش کند.
یکی دیگر از ویژگی های جدید GPT-4 که کسب و کارها می توانند آن را به ویژه مفید بدانند، پایبندی بیشتر آن به مرزهای تعیین شده توسط آموزش داده شده به وسیله کاربران است. OpenAI قابلیت «هدایت پذیری» بهبود یافته خود را برجسته می کند، که GPT-4 را مطابق دستورالعمل ها نگه می دارد و در عین حال میزان خطاها را کاهش میدهد. برخلاف ChatGPT، GPT-4 می تواند تصاویر را ببیند و درک کند، در حالی که اولی تنها به متن محدود میشود.
GPT-4 میتواند تصاویر را بگیرد و آنها را پردازش کند تا اطلاعات مرتبط و دقیقی را بیابد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد