چین به زودی یک مدل هوش مصنوعی جدید با نام DeepSeek R2 را عرضه خواهد کرد. این مدل از معماری ترکیبی Mixture of Experts (MoE) بهره میبرد و شامل مکانیزمهای گیتینگ پیشرفته و ترکیبی از لایههای MoE و Dense برای بهینهسازی عملکرد در پردازشهای سنگین خواهد بود. DeepSeek R2 با ۱٫۲ تریلیون پارامتر عرضه میشود و در سطح مدلهای مشهوری همچون GPT-4 Turbo و Gemini 2.0 Pro قرار خواهد گرفت.
استفاده از معماری ترکیبی MoE، DeepSeek R2 را منحصر به فرد میکند و از آن باعث میشود که در پردازشهای سنگین عملکرد بهتری داشته باشد. همچنین، این مدل از خوشهی پردازشی مبتنیبر تراشهی Ascend 910B هواوی با توان پردازشی ۵۱۲ پتافلاپس (با دقت FP16) استفاده میکند. این موضوع نشان میدهد که چین تلاش کرده است تا زنجیرهی تأمین هوش مصنوعی خود را بهطور کامل یکپارچه کرده است.
DeepSeek R2 با هزینهی پردازش بسیار پایین در مقایسه با GPT-4 عرضه میشود. این کاهش هزینه میتواند DeepSeek R2 را به گزینهای بسیار مقرونبهصرفه برای سازمانها تبدیل کند. اما باید توجه داشت که اطلاعات موجود رسمی نیستند و ممکن است مشخصات نهایی مدل متفاوت باشد.
این وضعیت برخی را در چالش مبنی بر جدایی از تولیدات خارجی، و روی آوردن به تولید و بهکارگیری تکنولوژیهای داخلی، قرار میدهد. آیا نوبت تولیدکنندگان داخلی است که برای در دست گرفتن مهار این فناوریها تلاش کنند یا از شکافهایی که در بسیاری از صنایع وجود دارد استفاده میکنند؟
چین در دهههای گذشته رشد قابل توجهی در حوزهی فناوری تجربه کرده است. با این حال، در مسیری که در حال طی کردن است، تمرکز زیادی بر روی تکیه بر منابع داخلی و استقلال زنجیرهی تأمین وجود دارد. این تلاشها نشان میدهد که چین به زودی به یکی از مهمترین بازیگران در صنعت هوش مصنوعی تبدیل خواهد شد.
عملیاتی که چین در حال انجام است میتواند الگوی برای کشورهای در حال توسعه یا حتی کشورهای توسعهیافته باشد. آیا کشوری که در حال توسعهی یک صنعت هوش مصنوعی منحصر به فرد است، میتواند در بلندمدت منافات با کشورهای با تأسیسات و تجربهی بیشتری بهسرعت جابهجا شود؟
کاهش هزینهی پردازش DeepSeek R2 میتواند در جذب سازمانها به آن بسیار مؤثر باشد. اما آیا این تنها پارامتر برای ارزیابی ارزش یک مدل هوش مصنوعی است؟ یا برخی از مدلهای دیگر با پارامترها مشابه یا حتی کمتر از R2، در بسیاری از مسائل عملکرد بهتری دارند؟
طرح DeepSeek R2 بر پیچیدگی مشکلات این صنعت برای کشورهای در حال توسعه متمرکز است. با وجود بیگانگی در技術 و دسترسی به منابع، آیا اتحاد میان کل نقاط جهان ممکن است الگویی برای یک پروژه زمان بندی شده در تولید یک دوره-Big_dataset bes off گزینش کشورهای در حال توسعه با شناخت مسئله ایجاد شود؟
ارائه این موضوع و ساخت یک آشفتگی در بین کشورهای مرتبط و چین در کوتاهمدت میتواند باعث برتری آن بر دیگر کشورها شود.