شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

در طی چند سال اخیر، تحولات گسترده ای در حوزه هوش مصنوعی ایجاد شده است. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد و شوک بزرگی به این حوزه وارد کرده است. این مدل هوش مصنوعی قدرتمند، توانایی درک تصاویر و متون را دارد. به گفته OpenAI، هوش مصنوعی GPT-4، از ورودی ‌های متنی و تصاویر نیز پشتیبانی کرده و رشد و پیشرفت قبل توجهی نسبت به مدل پیشین خود یعنی GPT-3.5 که تنها از ورودی های متنی پشتیبانی می‌کند، داشته است. در این مقاله، به تجزیه و تحلیل کامل ویژگی های پیشرفته GPT-4 پرداخته و قابلیت‌های جدیدی که ارائه می‌کند را شرح می‌دهیم.

GPT-4 چیست؟

در طی چند ماه اخیر، بحث های زیادی پیرامون هوش مصنوعی اتفاق افتاد و موارد زیادی از تاثیر ChatGPT در زندگی انسان بیان شد. طی چند روز اخیر نیز شرکت OpenAI، از هوش مصنوعی جدید خود یعنی GPT-4 رونمایی کرده و افراد زیادی قصد آشنایی با آن را دارند. GPT-4 جدیدترین نسخه از سیستم های مدل زبان OpenAI است.

نسخه قبلی آن، GPT 3.5، ربات چت بسیار محبوب ChatGPT را در نوامبر ۲۰۲۲ راه اندازی کرد. GPT مخفف Generative Pre-trained Transformer (GPT)، نوعی مدل زبانی است که از یادگیری عمیق برای تولید متن محاوره ای شبیه انسان استفاده می‌کند. GPT-4 در ۱۴ مارس ۲۰۲۳ توسط OpenAI، تقریباً چهار ماه پس از اینکه این شرکت ChatGPT را برای عموم در پایان نوامبر ۲۰۲۲ راه اندازی کرد، رونمایی شد.

ترانسفورماتورهای از پیش آموزش دیده (GPT) نوعی مدل یادگیری عمیق هستند که برای تولید متنی شبیه به انسان استفاده می‌شوند. کاربردهای رایج این هوش مصنوعی عبارت است از: پاسخ دادن به سوالات، خلاصه کردن متن، ترجمه متن به زبان های دیگر، تولید کد، ایجاد پست ‌های وبلاگ، داستان ‌ها، گفتگوها و سایر انواع محتوا. این مدل یک مدل چندوجهی بزرگ است که می‌تواند هم ورودی تصویر و هم متن را بپذیرد و خروجی متن تولید کند. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

انتشار اخیر GPT-4 نقطه عطف مهمی در زمینه هوش مصنوعی، به ویژه در حوزه پردازش زبان است. شرکت OpenAI به مدت شش ماه، با استفاده از برنامه ‌های آزمایشی مختلف و ChatGPT، به طور مداوم این مدل را سنجیده تا به نتایج خوبی دست پیدا کند. موفق هم شده است و این مدل توانایی حل مسائل بسیار دشوار با سرعت و دقت بالا را دارد. در حال حاضر نیز، چندین شرکت مانند دولینگو و Stripe، با OpenAI برای ادغام GPT-4 با خدماتشان اعلام آمادگی کرده اند.

پیش از وجود GPT

انقلاب هوش مصنوعی کنونی در حوزه زبان، تنها با اختراع مد ل‌های ترانسفورماتور امکان‌پذیر و با BERT گوگل در سال ۲۰۱۷ نیز شروع شد. پیش از این، از سرویس هایی استفاده می‌شد که برای خروجی تک کلمات یا عبارات کوتاه عملکرد خوبی داشتند، اما نمی‌توانستند محتواهای طولانی‌ تری تولید کنند. در همین زمان GPT-1 معرفی شد.

GPT-1

در سال ۲۰۱۸، OpenAI مقاله‌ای (بهبود درک زبان توسط پیش‌آموزش مولد) درباره استفاده از درک زبان طبیعی با استفاده از مدل زبان GPT-1 منتشر کرد. این مدل تنها اثبات مفهوم بود و به صورت عمومی منتشر نشد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

GPT-2

سال بعد، OpenAI مقاله دیگری را در مورد آخرین مدل خود یعنی GPT-2 منتشر کرد. این بار، این مدل در دسترس جامعه علاقه مند به یادگیری ماشین قرار گرفت و برای کارهای تولید متن نیز استفاده شد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

GPT-3

در سال ۲۰۲۰، OpenAI مقاله دیگری در مورد مدل GPT-3 خود منتشر کرد. این مدل ۱۰۰ برابر پارامترهای بیشتری نسبت به GPT-2 داشت و بر روی یک مجموعه داده متنی حتی بزرگتر آموزش داده شد که در نتیجه عملکرد مدل بهتری داشت. این مدل با تکرارهای مختلفی که به عنوان سری GPT-3.5 شناخته می شوند، از جمله ChatGPT متمرکز بر مکالمه، به بهبود عملکرد خود ادامه داد.

این نسخه با توانایی خود در تولید صفحات متنی شبیه به انسان، جهان را غافلگیر کرد. ChatGPT تبدیل به سریعترین برنامه وب در حال رشد شد و تنها در دو ماه به ۱۰۰ میلیون کاربر رسید. پس از این نسخه، به تازگی نسخه جدیدتر یعنی GPT-4 منتشر شده است.

چگونه می توان به GPT-4 دسترسی پیدا کرد؟

OpenAI هنوز قابلیت های بصری GPT-4 را از طریق هر پلتفرمی را در دسترس قرار نداده است، زیرا شرکت تحقیقاتی برای شروع تنها با یک شریک واحد همکاری می کند. با این حال، راه هایی برای دسترسی به قابلیت ورودی متن GPT-4 وجود دارد. تنها راه دسترسی به قابلیت ورودی متن از طریق OpenAI، اشتراک در ChatGPT Plus است که دسترسی مشترکین به مدل زبان را با قیمت ۲۰ دلار در ماه تضمین می‌کند.

یک راه رایگان برای دسترسی به قابلیت متن GPT-4 وجود دارد و آن با استفاده از BingChat است. روزی که GPT-4 توسط OpenAI رونمایی شد، مایکروسافت اعلام کرد که چت ربات خود یعنی، Bing Chat، از زمان عرضه آن در پنج هفته پیش، بر روی GPT-4 اجرا شده است. بینگ چت ربات چت مایکروسافت است که بر روی پیشرفته ترین LLM OpenAI – GPT-4 اجرا می‌شود.

به گفته شرکت مایکروسافت، در عرض یک ماه پس از راه اندازی، ۴۵ میلیون چت بر روی پلتفرم Bing chat، با ۱۰۰ میلیون کاربر فعال روزانه انجام شد. محبوبیت چت بات از این واقعیت ناشی می شود که دارای توانایی های مشابه ChatGPT است اما دسترسی کامل به اینترنت دارد که ChatGPT ندارد. عموم می توانند با ارائه درخواست، برای دسترسی به آن اقدام کنند. استفاده از بینگ چت رایگان است اما نیاز به ثبت نام دارد.

در حال حاضر، GPT-4، تنها برای مشترکین پولی ChatGPT در دسترس است. برای مشاهده قابلیت های ChatGPT، می‌توانید به وب سایت فروشگاه جعو استور که ارائه دهنده اکانت های اشتراکی مختلف است، مراجعه کنید.

GPT-4 چه کاری می‌تواند انجام دهد؟

از آنجایی که GPT-4 یک مدل چندوجهی بزرگ است، می‌تواند هم ورودی‌های متن و تصویر را بپذیرد و هم متنی شبیه انسان را خروجی دهد. به عنوان مثال، با GPT-4، می‌توانید یک برگه از سوالات را در آن آپلود کنید، GPT-4 می‌تواند آن را اسکن کند و به سؤالات موجود در برگه پاسخ دهد. همچنین می‌تواند نموداری را که آپلود می‌کنید را بخواند و بر اساس داده های ارائه شده محاسباتی انجام دهد. قابلیت‌های فکری نیز در این مدل بیشتر بهبود یافته‌اند و در یک سری آزمون‌ های محک شبیه‌ سازی‌ شده، بهتر از GPT-3.5 عمل می‌کنند.

OpenAI، GPT-4 را با شبیه سازی امتحانات طراحی شده برای انسان ها، مانند آزمون یکنواخت وکالت و LSAT برای وکلا، و SAT برای پذیرش دانشگاه، ارزیابی کرد. نتایج نشان داد که GPT-4 عملکردی در سطح انسانی در معیارهای مختلف حرفه ای و دانشگاهی به دست آورد. OpenAI همچنین GPT-4 را بر روی معیارهای سنتی طراحی شده برای مدل‌های یادگیری ماشین نیز ارزیابی کرد،

جایی که از مدل‌های زبان بزرگ موجود و بیشتر مدل‌های پیشرفته که ممکن است شامل پروتکل‌های آموزشی خاص یا پروتکل‌های آموزشی اضافی باشد، بهتر عمل کرد. این معیارها شامل سؤالات چندگزینه ای در ۵۷ موضوع، استدلال در مورد رویدادهای روزمره، سؤالات علوم چندگزینه ای کلاس ابتدایی و موارد دیگر بود. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

OpenAI با ترجمه معیار MMLU، مجموعه‌ای از ۱۴۰۰۰ مسئله چند گزینه‌ای که شامل ۵۷ موضوع است، به زبان‌های مختلف با استفاده از Azure Translate، قابلیت GPT-4 را در زبان ‌های دیگر را نیز آزمایش کرد. در ۲۴ زبان از ۲۶ زبان آزمایش شده، GPT-4 عملکرد بهتری نسبت به عملکرد زبان GPT-3.5 و سایر مدل های دیگر داشت. به طور کلی، نتایج پایه ای تر GPT-4 نشان دهنده پیشرفت قابل توجهی در تلاش OpenAI برای توسعه مدل های هوش مصنوعی با قابلیت های پیشرفته تر است.

قابلیت های جدید GPT-4

بهبود عملکرد به نسبت نسخه قبلی: همانطور که ممکن است انتظار داشته باشید، GPT-4 به نسبت مدل های GPT-3.5، در زمینه صحت واقعی پاسخ ها بهبود یافته و تعداد دفعاتی که ممکن است خطاهای واقعی یا استدلالی را مرتکب شود ،کمتر است. GPT-4 همچنین “هدایت پذیری” را که توانایی تغییر رفتار بر اساس درخواست کاربر است را نیز بهبود می‌بخشد. به عنوان مثال، می‌توانید به آن دستور دهید که با سبک یا لحن یا صدای متفاوتی بنویسد.
استفاده از ورودی های بصری در GPT-4: یکی از تغییرات عمده دیگر این است که GPT-4 می تواند از ورودی های تصویر و متن نیز استفاده کند. کاربران می‌توانند با وارد کردن متن و تصاویر به هم ریخته، هر چشم انداز یا وظیفه زبانی سیستم را مشخص کنند. نمونه‌هایی نشان می‌دهند که GPT-4 به درستی تصاویر پیچیده‌ای مانند نمودارها، میم‌ها و عکس‌ هایی از مقالات دانشگاهی را تفسیر می‌کند.

OpenAI، آخرین مدل خود یعنی GPT-4 که به توسعه سریع حوزه هوش مصنوعی در بیزینس کمک می کند را ارائه کرده است. سازمان‌ها در حال حاضر از ابزارهای پیشرفته‌ تر هوش مصنوعی برای انجام عملیات روزانه خود استفاده می‌کنند، و GPT-3 و GPT-3.5 OpenAI در شش ماه گذشته محبوبیت خاصی پیدا کرده‌اند و به ChatGPT جذابی تبدیل شده‌اند.

به دایل این محبوبیت، مدل جدید چندوجهی نیز چند روز پیش ارائه شد. به این معنی که کاربران می‌توانند از متن و تصاویر به عنوان ورودی استفاده کنند و به عنوان خلاق ترین و قدرتمندترین مدل ساخته شده توسط OpenAI معرفی شده است. این شرکت می‌گوید که GPT-4 دارای پیشرفت‌های بزرگی است. همان طور که پیش از این نیز مردم را با توانایی خود در ایجاد متنی شبیه به انسان و تولید تصاویر و کدهای رایانه‌ای متحیر کرده است. محققان می گویند این توانایی ها پتانسیل تغییر علم را دارند.

این شرکت همچنین تاکید کرده است که GPT-4 ایمن‌تر از نسخه‌های قبلی است و به شدت به مرزهای تعیین‌شده توسط توسعه‌دهندگان و کاربران خود پایبند است. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

GPT-4 در مقابل GPT-3

همان طور در بخش های قبلی این مقاله از جعو استور بیان کردیم، در تمام معیارها، GPT-4 پیشرفت قابل توجهی نسبت به مدل‌های قبل از خود دارد. با کنار گذاشتن این واقعیت که می تواند تصاویر را مدیریت کند، قابلیتی که در مدل GPT-4 وجود دارد این است که می تواند خروجی های ظریف تر، قابل اعتمادتر و چالش برانگیزتر از GPT-3 یا GPT-3.5 داشته باشد.

در آزمون های شبیه سازی شده طراحی شده برای انسان، GPT-4 تا حد زیادی از نتایج GPT-3.5 پیشی گرفت. در صدک ۹۰ برای Uniform Bar در مقابل نتایج صدک ۱۰ GPT-3.5 و صدک ۸۸ برای LSAT در مقابل صدک ۴۰ GPT-3.5 قرار گرفت. GPT-4 همچنین امتیاز بالایی در معیار درک زبان چندوظیفه عظیم (MMLU) کسب کرد، که مدل ها را در برابر ۱۴۰۰۰ سؤال چند گزینه ای بر اساس طیف وسیعی از موضوعاتی که در مجموعه های آموزشی پوشش داده نشده است، قرار می‌دهد.

OpenAI همچنین ادعا می‌کند که GPT-4 در طیف وسیعی از معیارهای یادگیری ماشینی (ML) از مدل‌های زبان بزرگ (LLM) مانند Google’s Palm و Meta’s LLaMA بهتر عمل کرده است. OpenAI در پست وبلاگ خود در GPT-4 می‌گوید: «به طور قابل توجهی بسیاری از ویژگی‌های ایمنی GPT-4 در مقایسه با GPT-3.5 بهبود بخشیده شده است.

تمایل مدل به پاسخگویی به درخواست‌های محتوای غیرمجاز در مقایسه با GPT-3.5 تا ۸۲ درصد کاهش داده شده و GPT-4 به درخواست‌ های حساس (مانند توصیه ‌های پزشکی و آسیب رساندن به خود) ۲۹ درصد بیشتر پاسخ می‌دهد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

مزایای تجاری GPT-4 چیست؟

یکی از ویژگی‌ های برجسته GPT-4 ماهیت چند وجهی آن است که به کسب ‌و کارها اجازه می‌دهد تا طیف وسیع ‌تری از داده‌ ها را نسبت به قبل به آن وارد کنند. شرکت‌ ها می‌توانند از این مدل برای خلاصه‌سازی فایل‌ های PDF، جمع ‌آوری و زمینه ‌سازی داده‌ های نمودار، تحلیل و نقد قراردادها یا شناسایی سریع بی‌ نظمی های بصری در زیر ساخت فیزیکی، استفاده کنند. GPT-4 می تواند تصاویر و همچنین اطلاعات را از تصاویر استخراج و پردازش کند.

یکی دیگر از ویژگی های جدید GPT-4 که کسب و کارها می توانند آن را به ویژه مفید بدانند، پایبندی بیشتر آن به مرزهای تعیین شده توسط آموزش داده شده به وسیله کاربران است. OpenAI قابلیت «هدایت پذیری» بهبود یافته خود را برجسته می کند، که GPT-4 را مطابق دستورالعمل ها نگه می دارد و در عین حال میزان خطاها را کاهش می‌دهد. برخلاف ChatGPT، GPT-4 می تواند تصاویر را ببیند و درک کند، در حالی که اولی تنها به متن محدود می‌شود.

GPT-4 می‌تواند تصاویر را بگیرد و آنها را پردازش کند تا اطلاعات مرتبط و دقیقی را بیابد. شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد

وبلاگ

شرکت OpenAI از هوش مصنوعی جدید GPT-4 رونمایی کرد