به گزارش بازار، استارتاپ چینی Moonshot AI از مدل جدید خود با نام Kimi K۲ Thinking رونمایی کرد؛ مدلی که نهتنها رقبای متنباز، بلکه مدلهای اختصاصی و پولی مانند GPT-۵ و Claude Sonnet ۴.۵ را نیز در بنچمارکهای مهم استدلال و کدنویسی پشت سر گذاشته است.
براساس نتایج منتشرشده توسط Moonshot AI، مدل Kimi K۲ Thinking به رکوردهای جدیدی دست یافته است: در بنچمارک BrowseComp (جستجوی ایجنتی وب) این مدل امتیاز ۶۰.۲ درصد را کسب کرد. این امتیاز بهطور قابل توجهی بالاتر از رقیب چینی Deepseek-V۳.۲ و مدلهای آمریکایی GPT-۵ (با امتیاز ۵۴.۹ درصد) و Claude Sonnet ۴.۵ (با امتیاز ۲۴.۱ درصد) است.

همچنین این مدل در آزمون استدلال HLE با امتیاز ۴۴.۹ درصد یک رکورد جدید ثبت کرد. در بنچمارک کدنویسی SWE-Bench Verified نیز با امتیاز ۷۱.۳ درصد بالاتر از GPT-۵ و Claude قرار میگیرد.
Kimi K۲ Thinking حتی در بنچمارکهای ریاضی سطح بالا مانند AIME ۲۰۲۵ و HMMT ۲۰۲۵ نیز با GPT-۵ برابری میکند. این اولینبار است که یک مدل متنباز بهطور کامل در کارهای استدلالی پیشرفته به سطح مدلهای اختصاصی پولی میرسد یا از آنها عبور میکند.
معرفی مدل متنباز Kimi K۲ Thinking
مدل Kimi K۲ Thinking برپایه معماری ترکیب متخصصان (MoE) و با ۱ تریلیون پارامتر ساخته شده است. بااینحال، به لطف معماری MoE، در هر لحظه فقط ۳۲ میلیارد پارامتر فعال است که این امر آن را بسیار بهینه میکند. این مدل همچنین دارای پنجره زمینه بزرگ ۲۵۶ هزار توکنی است.
با وجود مقیاس ۱ تریلیون پارامتری، Kimi K۲ Thinking با فرایند آموزشی Quantization فشرده شده است. این فرایند نیاز به حافظه را کاهش میدهد و سرعت تولید متن را در مقایسه با نسخه فشردهنشده، تقریباً دو برابر میکند.
Kimi K۲ Thinking هماکنون در وبسایت kimi.com و از طریق API در دسترس است. همچنین این مدل در Hugging Face در دسترس است. هزینه استفاده از API آن (۰.۶۰ دلار برای هر ۱ میلیون توکن ورودی) بهطور قابل توجهی ارزانتر از GPT-۵ (۱.۲۵ دلار) است که آن را به گزینهای بسیار رقابتی تبدیل میکند.
Moonshot AI این مدل را تحت «مجوز MIT اصلاحشده» منتشر کرده است. این مجوز بهطور کامل اجازه استفاده تجاری را میدهد، اما یک محدودیت دارد: «اگر نرمافزار یا محصول مشتقشده از آن، به بیش از ۱۰۰ میلیون کاربر فعال ماهانه خدمترسانی کند یا بیش از ۲۰ میلیون دلار در ماه درآمد داشته باشد، ارائهدهنده باید نام Kimi K۲ را بهشکل واضح در رابط کاربری محصول نمایش دهد.



نظر شما