OpenAI از مدل هوش مصنوعی O1 رونمایی کرد؛ اولین مدل با قدرت استدلال
به گزارش تور ارمنستان، شرکت OpenAI از مدل جدیدی به نام O1 رونمایی می نماید. این مدل، اولین مدل در مجموعه ای برنامه ریزی شده از مدل های استدلال گر است که برای پاسخ گویی به سوالات پیچیده تر و سریع تر از انسان آموزش دیده اند. این مدل در کنار O1-mini، نسخه ای کوچک تر و مقرون به صرفه تر، منتشر می گردد. و بله، اگر از شایعات هوش مصنوعی باخبر هستید: این در واقع همان مدل Strawberry بسیار جنجالی است.
برای OpenAI، مدل O1 گامی به سوی هدف گسترده تر آن یعنی هوش مصنوعی شبیه انسان است. از نظر کاربردی، این مدل در نوشتن کد و حل مسائل چندمرحله ای بهتر از مدل های قبلی عمل می نماید. اما در عین حال، استفاده از آن نسبت به GPT-4o گران تر و کندتر است. OpenAI این نسخه از O1 را پیش نمایش می نامد تا بر نوپا بودن آن تأکید کند.
کاربران ChatGPT Plus و Team از امروز به O1-preview و O1-mini دسترسی خواهند داشت، در حالی که کاربران Enterprise و Edu اوایل هفته آینده به آن دسترسی پیدا می نمایند. OpenAI می گوید میخواهد دسترسی به O1-mini را برای همه کاربران رایگان ChatGPT فراهم کند، اما هنوز تاریخ انتشار آن را معین ننموده است. دسترسی توسعه دهندگان به O1 بسیار گران است: در API، O1-preview به ازای هر 1 میلیون توکن ورودی (یا بخش هایی از متن که به وسیله مدل تجزیه می گردد) 15 دلار و به ازای هر 1 میلیون توکن خروجی 60 دلار هزینه دارد. برای مقایسه، GPT-4o به ازای هر 1 میلیون توکن ورودی 5 دلار و به ازای هر 1 میلیون توکن خروجی 15 دلار هزینه دارد.
جری تورک، سرپرست تحقیقات OpenAI، گفته که آموزش مدل O1 اساساً با مدل های قبلی فرق دارد، اگرچه این شرکت در خصوص جزئیات دقیق آن مبهم صحبت می نماید. او می گوید O1 با استفاده از یک الگوریتم بهینه سازی کاملاً نو و یک مجموعه داده آموزشی نو که مخصوص آن طراحی شده، آموزش دیده است.
OpenAI مدل های GPT قبلی را برای تقلید از الگوهای موجود در داده های آموزشی خود آموزش داده بود. با O1، این شرکت مدل را برای حل مسائل به تنهایی با استفاده از تکنیکی به نام یادگیری تقویتی آموزش داده است که سیستم را به وسیله پاداش ها و جریمه ها آموزش می دهد. سپس از یک زنجیره تفکر برای پردازش پرسش ها استفاده می نماید، مشابه نحوه پردازش مسائل به وسیله انسان ها که گام به گام پیش می روند.
OpenAI می گوید که در نتیجه این روش نو آموزشی، مدل باید دقیق تر باشد. تورک می گوید: ما متوجه شده ایم که این مدل کمتر دچار توهم می گردد. اما این مشکل همچنان وجود دارد. نمی توانیم بگوییم که توهم را حل نموده ایم.
به گفته OpenAI، نکته اصلی که این مدل نو را از GPT-4o متمایز می نماید، توانایی آن در حل مسائل پیچیده، مانند کدنویسی و ریاضیات و در عین حال شرح استدلال خود است. باب مک گرو، مدیر ارشد تحقیقات OpenAI، گفته: این مدل قطعاً در حل آزمون ریاضی AP از من بهتر است و من در دانشگاه در رشته ریاضی تحصیل نموده ام. او می گوید OpenAI بعلاوه O1 را در برابر آزمون ورودی المپیاد بین المللی ریاضی آزمایش نموده است و در حالی که GPT-4o فقط 13 درصد از مسائل را به درستی حل نموده، O1 به امتیاز 83 درصد رسیده است.
در مسابقات برنامه نویسی آنلاین که به عنوان مسابقات Codeforces شناخته می شوند، این مدل نو به صدک 89 شرکت نمایندگان رسیده است و OpenAI ادعا می نماید که به روزرسانی بعدی این مدل مشابه دانشجویان دکترا در انجام وظایف چالش برانگیز در فیزیک، شیمی و زیست شناسی عمل خواهد نمود.
در عین حال، O1 در بسیاری از زمینه ها به میزان GPT-4o توانمند نیست. در دانش واقعی در خصوص دنیا به خوبی عمل نمی نماید. بعلاوه قابلیت مرور وب یا پردازش فایل ها و تصاویر را ندارد. با این حال، این شرکت معتقد است که این مدل نشان دهنده طبقه بندی کاملاً نوی از قابلیت ها است. اما این مدل فکر نمی نماید و مطمئناً انسان نیست. پس چرا طوری طراحی شده که به نظر برسد فکر می نماید؟
به گفته تورک، OpenAI به معادل سازی تفکر مدل هوش مصنوعی با تفکر انسان اعتقاد ندارد. اما هدف این رابط کاربری نشان دادن این است که چگونه مدل زمان بیشتری را صرف پردازش و عمیق تر شدن در حل مسائل می نماید. او می گوید: راه هایی وجود دارد که در آنها این مدل نسبت به مدل های قبلی انسانی تر به نظر می رسد.
حرکت به سمت ایجنت ها
مدل های زبان بزرگ به شکلی که امروزه وجود دارند، دقیقاً آنقدرها هوشمند نیستند. آنها در اصل فقط توالی کلمات را پیش بینی می نمایند تا بر اساس الگوهای آموخته شده از حجم وسیعی از داده ها به شما پاسخی بدهند. به عنوان مثال، ChatGPT که تمایل دارد به اشتباه ادعا کند که کلمه strawberry فقط دو حرف R دارد زیرا کلمه را به درستی تجزیه نمی نماید. به هر حال، مدل نو O1 این پرسش را به درستی پاسخ داد.
از آنجایی که طبق گزارش ها، OpenAI در پی جذب سرمایه بیشتر با ارزش گذاری خیره نماینده 150 میلیارد دلار است، حرکت رو به جلوی آن به پیشرفت های تحقیقاتی بیشتر وابسته است. این شرکت قابلیت های استدلال را به مدل های زبان بزرگ (LLM) اضافه می نماید زیرا آینده ای را با سیستم های اتوماتیک یا ایجنت هایی می بیند که قادر به تصمیم گیری و انجام اقدامات از طرف شما هستند.
برای محققان هوش مصنوعی، شکستن استدلال گام بعدی مهمی به سوی هوش در سطح انسان است. گفته می گردد اگر مدلی قادر به انجام کارهای بیشتری از تشخیص الگو باشد، می تواند منجر به پیشرفت در زمینه هایی مانند پزشکی و مهندسی گردد. با این حال، در حال حاضر، قابلیت های استدلال O1 نسبتاً کند است، شبیه به ایجنت ها نیست و استفاده از آن برای توسعه دهندگان گران است.
مک گرو می گوید: ما ماه هاست که روی استدلال کار می کنیم زیرا فکر می کنیم این در واقع یک موفقیت حیاتی است. اساساً، این یک روش نو برای مدل ها است تا بتوانند مسائل واقعاً سختی را که برای پیشرفت به سوی سطوح هوش انسانی ضروری است، حل نمایند.
منبع: The Verge
منبع: دیجیکالا مگ