شرکت «انویدیا» اولین هوش مصنوعی با استدلال باز موسوم به «Alpamayo-R1» را برای خودروهای خودران منتشر کرد.
به گزارش ایسنا، شرکت «انویدیا» مدلهای هوش مصنوعی باز از جمله «Alpamayo-R1» را برای خودروهای خودران و ابزارهای «Cosmos» را برای رباتیک و شبیهسازی عرضه میکند.
به نقل از آیای، «انویدیا» با یک اقدام جسورانه، مرزهای تحقیقات هوش مصنوعی را گسترش میدهد. این شرکت به تازگی از راهاندازی مدلهای هوش مصنوعی فیزیکی و دیجیتال باز خبر داد که میتوانند خودروهای خودران، رباتیک و پردازش گفتار را تغییر شکل دهند.
این شرکت از این پیشرفتها در یکی از برترین کنفرانسهای هوش مصنوعی جهان به نام «NeurIPS» رونمایی کرد و دوران جدیدی را برای توسعه هوش مصنوعی متنباز آغاز کرد.
از جمله نکات برجسته، معرفی «Alpamayo-R1» یا «AR1»، اولین مدل بینایی-زبان-عمل(VLA) با استدلال باز جهان برای رانندگی خودران است.
مدل AR1 که برای ترکیب استدلال زنجیرهای فکری با برنامهریزی مسیر طراحی شده است، به خودروها کمک میکند تا سناریوهای پیچیده را با قضاوتی شبیه به انسان هدایت کنند.
«انویدیا» گفت: «AR1» این کار را با تجزیه یک سناریو و استدلال در هر مرحله انجام میدهد. این مدل، مسیرهای ممکن را ارزیابی میکند و از دادههای زمینهای برای انتخاب امنترین مسیر استفاده میکند و آن را قادر میسازد تا تقاطعهای شلوغ با عابران پیاده، وسایل نقلیه پارک دوبل یا بسته شدن خطوط در حال نزدیک شدن را مدیریت کند.
دسترسی آزاد در استراتژی «انویدیا» نقش اساسی دارد. «AR1» که بر پایه «NVIDIA Cosmos Reason» ساخته شده است، میتواند توسط محققان برای کاربردهای غیرتجاری سفارشیسازی شود.
یادگیری تقویتی پس از آموزش، پیشرفتهای قابل توجهی در قابلیتهای استدلال مدل در مقایسه با نسخه از پیش آموزش دیده آن نشان داده است.
استدلال، استقلال را هدایت میکند
مدل «AR1» هم اکنون به همراه زیرمجموعهای از دادههای آموزشی در مجموعه دادههای باز هوش مصنوعی فیزیکی «انویدیا» موجود است. محققان همچنین میتوانند از چارچوب «AlpaSim» برای ارزیابی عملکرد این مدل استفاده کنند.
فراتر از «AR1»، پلتفرم «Cosmos» مجموعهای از ابزارها را برای توسعه هوش مصنوعی فیزیکی ارائه میدهد. این موارد شامل «LidarGen» میشود که دادههای لیدار را برای شبیهسازی حرکت خودروی برقی تولید میکند یا «Omniverse NuRec Fixer» برای پاکسازی بازسازیهای عصبی؛ «Cosmos Policy» برای ایجاد قوانین رفتار رباتیک و «ProtoMotions3» که رباتهای انساننما را در محیطهای شبیهسازی شده و واقعگرایانه آموزش میدهد.
توسعهدهندگان و محققان در سراسر جهان در حال حاضر در حال آزمایش این مدلها هستند. شرکای اکوسیستم «انویدیا» مانند Voxel51، 1X، Figure AI، Foretellix، Gatik، Oxa، PlusAI و X-Humanoid در حال استفاده از مدلهای بنیادی Cosmos در پروژههای رانندگی خودکار و رباتیک هستند.
محققان سوئیسی در مؤسسه «ETH» زوریخ نیز از «Cosmos» برای ایجاد صحنههای سهبعدی استفاده میکنند و یافتههای خود را در «NeurIPS» ارائه میدهند.
گسترش هوش مصنوعی دیجیتال
«انویدیا» در جبهه دیجیتال، در حال بهبود جعبه ابزار «نموترون»(Nemotron) خود است. از نکات برجسته آن میتوان به «MultiTalker Parakeet»، یک مدل تشخیص گفتار خودکار چند گوینده و «Sortformer» که تنظیم خودکار گوینده را در لحظه انجام میدهد، اشاره کرد.
«نموترون» همچنین مدلهای ایمنی هوش مصنوعی مبتنی بر استدلال و مجموعه دادههای مصنوعی را برای یادگیری تقویتی و توسعه هوش مصنوعی مختص دامنه معرفی میکند.
سایر بهروزرسانیهای قابل توجه شامل «Audio Flamingo 3»، یک مدل زبان صوتی بزرگ که قادر به استدلال در گفتار، موسیقی و صدا است و «Minitron-SSM» است که مدلهای ترکیبی را بدون کاهش عملکرد فشرده میکند.
محققان «انویدیا» همچنین «Jet-Nemotron» و «Nemotron-Flash» را که برای استنتاج و تأخیر کارآمد مدل زبان بهینه شدهاند، به نمایش گذاشتند.
«انویدیا» خاطرنشان کرد: یادگیری تقویتی طولانیمدت یا ProRL تکنیکی است که آموزش مدل را در دورههای طولانیتری گسترش میدهد. این روش منجر به مدلهایی میشود که به طور مداوم از مدلهای پایه برای استدلال بهتر عمل میکنند.
با این اعلامیهها، «انویدیا» همچنان هوش مصنوعی متنباز را به مراحل جدیدی میرساند و ابزارهایی را ارائه میدهد که محققان، توسعهدهندگان و نوآوران سیستمهای خودمختار را به طور یکسان توانمند میسازد.
انتهای پیام
source