سرک کشیدن به ذهن یک مدل زبانی؛ هوش مصنوعی دروغ می‌گوید؟ / Claude ۳.۵ روش حل خود را پنهان می‌کند!

اخیراً، شرکت Anthropic یافته‌های جدیدی را در مورد نحوه عملکرد مدل‌های زبانی مانند Claude ۳.۵ Haiku منتشر کرده است. این یافته‌ها نشان می‌دهند که این مدل‌ها برخلاف تصور عمومی فقط…