استارتاپ فرانسوی Mistral مدل زبانی بزرگ جدید خود به نام Large 2 را رونمایی کرد و ادعا میکند در زمینههایی مانند کدنویسی، ریاضیات و استدلال، در سطح قویترین مدلهای OpenAI و متا قرار میگیرد.
انتشار مدل Large 2 تنها یک روز پس از آن اتفاق افتاد که متا آخرین و بهترین نسخهی مدل متنباز خود، Llama 3.1 با ۴۰۵ میلیارد پارامتر را معرفی کرد. میسترال بهپشتوانهی معیارهای سنجش متعددی ادعا میکند که Large 2 عملکرد و هزینهی مدلهای متنباز را بهبود میبخشد.
بهنظر میرسد Large 2 در مقایسهبا Llama 3.1 در زمینهی تولید کد و عملکرد ریاضی سرعت بیشتری دارد و این کار را با ۱۲۳ میلیارد پارامتر انجام میدهد.
استارتاپ هوش مصنوعی مستقر در پاریس بهتازگی ۶۴۰ میلیون دلار تأمین مالی جذب کرده است. میسترال یکی از بازیگران جدید در عرصهی هوش مصنوعی محسوب میشود که میخواهد خودش را با سرعت زیادی به فناوری روز دنیا برساند و با شرکتهای بزرگ رقابت کند.
یکی از ویژگیهایی که Large 2 میسترال و Llama 3.1 متا فاقد آن هستند، قابلیت چندحالتی (Multimodal) است. این ویژگی باعث میشود که مدل بتواند درخواستهای متنی، تصویری و صوتی را بهطور همزمان پردازش کند. مدلهای هوش مصنوعی OpenAI، گوگل و مایکروسافت در زمینهی چندحالتی پیشتاز هستند.
Large 2 دارای Context Window با ۱۲۸,۰۰۰ توکن است، به این معنی که میتواند مقدار زیادی داده (معادل تقریباً یک کتاب ۳۰۰ صفحهای) را در یک درخواست واحد دریافت کند. مدل جدید میسترال، زبانهای انگلیسی، فرانسوی، آلمانی، اسپانیایی، ایتالیایی، پرتغالی، عربی، هندی، روسی، چینی، ژاپنی و کرهای را بههمراه ۸۰ زبان برنامهنویسی میفهمد.
Mistral در رونمایی از مدل قبلی خود، Mistral Large گفته بود که قیمتگذاری API این مدل، مبتنیبر میزان استفاده از آن است و بهازای هر یک میلیون توکن ورودی هشت دلار و به ازای هر یک میلیون توکن خروجی ۲۴ دلار قیمت دارد. برای مقایسه، OpenAI بهازای هر میلیون توکن ورودی و خروجی GPT-4o، بهترتیب ۶۰ دلار و ۱۲۰ دلار از مشتریانش دریافت میکند.
مدل Mistral Large 2 هماکنون از طریق پلتفرمهای Google Vertex AI ،Amazon Bedrock ،Azure AI Studio و IBM watsonx.ai در دسترس است و میتوانید از آن در چتبات میسترال با عنوان Le Chat استفاده کنید.
source