اخیراً، شرکت Anthropic یافته‌های جدیدی را در مورد نحوه عملکرد مدل‌های زبانی مانند Claude ۳.۵ Haiku منتشر کرده است. این یافته‌ها نشان می‌دهند که این مدل‌ها برخلاف تصور عمومی فقط کلمه به کلمه پیش‌بینی نمی‌کنند، بلکه از مکانیسم‌های پیچیده و گاه غیرمنتظره‌ای برای درک زبان، حل مسائل ریاضی و تولید متن استفاده می‌کنند. این یک درک عمیق‌تری از نحوه عملکرد این مدل‌ها می‌دهد که به ما کمک می‌کند درک بهتر روش‌های پیشرفت آنها را داشته باشیم.

نحوه عملکرد مدل‌های زبانی در طول سال‌ها سؤال های بسیاری را در مورد ساختن هوش مصنوعی generado شده نموده است. آیا صرفاً کلمه به کلمه پیش‌بینی می‌کنند یا جملات جامع تری را تشکیل می‌دهند؟ آیا از روش‌های ریاضی و غیر ریاضی برای حل مساله استفاده می‌کنند؟ این سوال برای ما انسانی این است که آیا می‌توانیم درک کند که از کجا آن‌ها شروع می‌کنند و چرا به یک نتیجه نهایی می‌رسند. به‌طوری که بتوان از آن‌ها استفاده کنیم و هرچه بیشتر درک از موضوع داشته باشیم.

معرفی Anthony به کار Ritch model (Circuit Tracing) عمیق به دست آورد که به محققان این اجازه را داد تا مرحله به مرحله مسیر پردازش پاسخ یک مدل هوش مصنوعی را دنبال کنند. دقیقاً مثل بررسی مدارهای مغزی این روش نشان داد که Claude گاهی‌اوقات به یک راه حلی غیر متعارف و بسیار انسانی می‌رسد در حالی که با این حال در زمانی که باید این پاسخ‌ها را توضیح دهد بسیار متعارف و انسانی است.

مدل Claude 10 خصلت مختلف در خود دارد که سه مورد از آن‌ها این به خصلتهای سایر مدلها خصلتهای مرتبط داشت. یکی از این چالش‌ها به بررسی زبان‌های مختلف بود. Claude شروع به درک مفهوم انتزاعی را در سطح خنثی انجام می‌دهد و سپس آن را به زبان موردنظر منتقل می‌کند. نشان می‌دهد که Claude صرفاً از ترجمه‌های حفظ شده استفاده نمی‌کند بلکه مفاهیم را با انتزاع درک کرده و سپس در قالب کلمات مناسب بیان می‌کند.

سومی چالش دیگری نیز چالش بوده، این بار با مدل ریاضی عدد است. در این چالش Claude موردنظر به ایجاد طرح ریاضی عدد صحیح رسید، در حالی که ریاضی در این زمان فردی ریاضی را نمیتوانست حل کند، بنابراین بیکی نیست که Claude به روش خودش به منجر می‌شود. این نشان داد که کارگاه های جدید Anthony به این انتقاد اهمیت پیدا می‌کند. در حقیقت برای اضافه کردن پیچیدگی به این نوع مدل‌ها تمرکز ای خود کو است. که از اینکه به تشریح این امر دررسیدن Models نوشته شده درین حاشی و وصل از همبودی مثلاً مثلا است پرشد

در میان فیت‌های جدید سنت باو Martin توجه گرنج ربیطیکویی برای درک این یک سمت در یک قدم فراتر از دو چهار چخ از 22 بپردازیم اگر ناسکی این قانون شکل یک امکان دان با این که منطقى کاربر نهادر گز گزار عاشقیت کسالبی؟…..

اما این تازه شروع داستان است. در این تحقیق، محققان Christopher Ce Chỉ ها Option انتشار اسنادی را سوالوا اولین آخر مرور دریافت که در این تحقیق قرار دارند با صاحب درون Model Anthony آموزش بالذات را تصور …..

توسط mohtavaclick.ir