عملکرد از GPT-4 Turbo پیشی گرفت! “SenseTime RiRixin” تا حد زیادی ارتقا یافته است و یک سوپر مارکت داخلی در مقیاس بزرگ افتتاح شده است.

چند سال قبل از اینکه موج مدل‌های بزرگ فراگیر شود، در واقع موجی از کارآفرینی هوش مصنوعی وجود داشت. از جمله SenseTime Technology، Megvii Technology، Yuncong Technology و Yitu Technology نمایندگان این دوره هستند.

در این موج جدید که توسط OpenAI راه اندازی شده است، SenseTime، یکی از چهار اژدهای کوچک، هنوز در مرکز صحنه باقی مانده است. در آوریل سال گذشته، SenseTime سری "Ririxin·Large Model" را منتشر کرد.

هر روز جدید است و هر روز جدید است.

تانگ، بنیانگذار سلسله شانگ، شعار خودخواهی بالا را بر روی وان حمام حک کرد درست مانند عمق تغییرات در زمینه AIGC امروز، ریتم به روز رسانی مدل های بزرگ شانگ تانگ نیز می تواند به عنوان "هر روز جدید" توصیف شود. "

دو ماه پیش، SenseTime سیستم مدل بزرگ «Ririxin SenseNova 4.0» را راه‌اندازی کرد و حتی اولین API دستیاران جهان را راه‌اندازی کرد که از فراخوان‌های مختلف ابزار مدال قبل از OpenAI پشتیبانی می‌کند.

و امروز بعد از ظهر، SenseTime، که "Rixin" است، به راه اندازی یک سری از مدل ها و برنامه های کاربردی هوش مصنوعی بر اساس "Rixin" ادامه داد:

  • Ririxin 5.0: در ارزیابی های هدف مشترک به GPT-4 Turbo می رسد یا از آن فراتر می رود
  • مدل انتهایی 1.8B: بهترین عملکرد در همان مقیاس، پیشرو در مقیاس
  • دستگاه همه کاره برنامه در سطح سازمانی: شامل امور مالی، پزشکی، امور دولتی، کدنویسی و سایر زمینه ها
  • پلتفرم تولید ویدیو Wensheng که هنوز راه اندازی نشده است

پانچ GPT-4 توربو، ضربه به DALL·E 3

در عصر هوش مصنوعی 2.0، هوش مصنوعی مولد به عنوان یک فناوری مهم در نظر گرفته می‌شود که باعث پیشرفت بهره‌وری می‌شود، اگر بتواند به پیشرفت‌هایی در قابلیت‌های سه لایه دانش، استدلال و اجرا دست یابد، واقعاً یک جهش به همراه خواهد داشت. توسعه رو به جلو بهره وری کل جامعه.

ماه گذشته، ژو لی، مدیرعامل SenseTime دیدگاه فوق را در کنفرانس مطبوعاتی 2024 مطرح کرد، او بار دیگر تاکید کرد که SenseTime به کاوش در معماری سه لایه KRE برای قابلیت‌های مدل بزرگ تحت هدایت قانون ادامه خواهد داد. مقیاس (دانش-استدلال-اجرا)، دائماً از مرزهای قابلیت های مدل بزرگ عبور می کند.

بنابراین نکات برجسته به‌روزرسانی RiRixin SenseNova 5.0 به‌روزرسانی شده (که از این پس RiRixin 5.0 نامیده می‌شود) چیست؟

  • معماری MOE را بپذیرید
  • بر اساس آموزش توکن های 10 ترابایتی، مقدار زیادی داده مصنوعی
  • پنجره زمینه استنتاج از 200K پشتیبانی می کند
  • ارزیابی جامع دانش، استدلال، ریاضیات و کد با GPT-4 Turbo

Ririxin 5.0 این به‌روزرسانی عمدتاً بر افزایش دانش، ریاضیات، قابلیت‌های استدلال و کدنویسی تمرکز دارد و کاملاً با GPT-4 Turbo همسو می‌شود.

در ارزیابی‌های هدف اصلی، RiRiXin 5.0 به نسخه GPT-4 Turbo منتشر شده توسط OpenAI در کنفرانس توسعه‌دهندگان در سال گذشته رسیده یا از آن پیشی گرفته است، و همچنین تقریباً به طور کامل Llama 3-70B را که اخیراً منتشر شده بود، شکست داد.

همه صحبت‌ها و بدون تمرین، در کنفرانس مطبوعاتی، SenseTime همچنین قابلیت‌های واقعی Ririxin 5.0 را در زبان، استدلال ریاضی و سایر جنبه‌ها به طور کامل نشان داد.

همچنین یک سوال انشایی امتحان ورودی کالج 2022 را وارد کنید و آن را با GPT-4 Turbo مقایسه کنید (فقط نسخه مربوط به نوامبر سال گذشته، همان زیر می توان دریافت که نتایج تولید شده توسط Ririxin 5.0 از محدودیت های قالب ها خارج است). و روتین ها، و افراد با ذوق، در نگاه اول، مقاله ای است که می تواند وارد قلب معلم نمره گذاری کنکور شود.

در مواجهه با مشکلات ریاضی، GPT-4 Turbo نه تنها فرآیند محاسباتی پیچیده بود، بلکه نتایج نهایی نیز اشتباه بود، اما پاسخ های به دست آمده توسط RiRixin 5.0 بسیار منطقی و کاملاً صحیح بود.

تمایز در صنعت یک عامل کلیدی برای برجسته شدن مدل های بزرگ از رقبا است.

Ririxin 5.0 که سناریوهای کاربردی محلی را هدف قرار می دهد، در درک فرهنگ و زمینه منحصر به فرد چینی بهتر از GPT-4 Turbo است. از آنجایی که GPT-4 Turbo با زمینه چینی آشنا نیست، طبیعتاً نمی تواند قوانین بازی محلی "عقاب گرفتن مرغ" را به درستی درک کند.

قابلیت های چندوجهی به طور کلی توسط صنعت به عنوان یک مسیر کلیدی برای دستیابی به AGI در نظر گرفته می شود.

با قضاوت از نتایج تست معیار، RiRixin 5.0 همچنین می تواند به شدت با GPT-4V رقابت کند و هر دو طرف برنده یا بازنده شوند. در نمایش مورد واقعی، اثر تولید یک فیل پیر در چند ثانیه که توسط RiRiXin 5.0 پشتیبانی می‌شود، طبیعی‌تر است.

بر اساس تصویر پرتره ایجاد شده توسط همان فرمان، بافت پوست ایجاد شده توسط SenseTime's Miahua طبیعی است، بدون پرداخت بیش از حد پوست و فیلترها، و با موفقیت نشانگر "زیبا" را تکمیل می کند. با توجه به اینکه پایگاه داده بین المللی پرتره های آسیایی مورد استفاده برای آموزش مدل های هوش مصنوعی نسبتا محدود است، چنین نتایج مقایسه ای نسبتاً طبیعی است.

در ترکیب با قابلیت های چند وجهی و تجزیه و تحلیل داده ها، هوش مصنوعی می تواند به وظایف پیچیده تر و پیشرفته تری دست یابد.

RiRiXin 5.0 می‌تواند خلاصه‌ای از تصاویر طولانی را بشکند بی اعتبار کردن.

همیشه گفته می شود که هوش مصنوعی روند کار را تغییر می دهد این بار نیز SenseTime توانایی های راکون اداری را در این زمینه نشان داد.

رکورد سه ساله شرکت راننده مسابقات فرمول یک ژو گوانیو را وارد سیستم کنید و اجازه دهید ببر هیستوگرام تعداد مسابقاتی را که در آنها شرکت کرده است نشان دهد.

ژو گوانیو در مسابقات بین المللی از نام انگلیسی خود برای رقابت استفاده می کند. مدل‌های بزرگ سنتی معمولاً هنگام برخورد با وظایف تشخیصی که شامل املای غیر متعارف انگلیسی یا افراد خاص است، عملکرد ضعیفی دارند. اگرچه راکون اداری ارتقا یافته در Ririxin 5.0 پیچ و خم هایی را تجربه کرد، اما سرانجام با موفقیت ترسیم شد.

مدل انتها به پهلو بزرگ، فقط سریع و هرگز خراب نمی شود

در دنیای هنرهای رزمی، "تنها هنر رزمی در جهان که نمی توان آن را شکست، سریع است" بر اهمیت سرعت در نبرد واقعی تاکید دارد و در نبردهای بزرگ نیز این اصل صدق می کند.

با توسعه سریع فناوری مدل های بزرگ، نیازهای سناریوهای کاربردی مختلف به طور فزاینده ای در حال ظهور هستند. .

SenseTime که عملگراتر شده است، در این کنفرانس به طور رسمی نسخه 1.8B SenseChat-Lite مدل انتهایی را راه اندازی کرد.

در تست معیار، این مدل سمت پایانی به طور جامع از مدل‌های بزرگ با ابعاد MiniCPM-2B و Phi-2 پیشی گرفت و حتی از مدل‌های بزرگ 7B و 13B نیز پیشی گرفت مقیاس یکسان، که در تمام سطوح پیشرو است.

تحقیقات نشان می دهد که سریع ترین سرعت خواندن چشم انسان حدود 20 کلمه در ثانیه است و مدل سمت دستگاه SenseTime مجهز به 1.8B می تواند به سرعت 18.3 کلمه در ثانیه بر روی یک تلفن همراه میان رده دست یابد، در حالی که موبایل پرچمدار تلفن می تواند تا 78.3 کلمه در ثانیه را پشتیبانی کند و به سریع ترین سرعت استنتاج در صنعت تبدیل شود.

SenseTime همچنین راه‌حلی برای همکاری دستگاه-ابر راه‌اندازی کرده است که می‌تواند از مزایای مربوط به دستگاه و ابر از طریق همکاری قضاوت هوشمند استفاده کند، هنگامی که جستجوی اینترنتی یا صحنه‌های پیچیده نیاز به پردازش دارند، در برخی از سناریوها به ابر بارگذاری می‌شوند. پردازش سمت پایانی بیش از 80% را تشکیل می دهد و در نتیجه هزینه استنتاج را به میزان قابل توجهی کاهش می دهد.

در چند ثانیه گفتگو با «مشاوره»، چه تهیه گزارش درخواست مرخصی در چند ثانیه باشد و چه خلاصه یک سند چند هزار کلمه ای، می توانیم به سرعت پاسخ دهیم.

مدل انتشار سمت دستگاه همچنین می‌تواند به سریع‌ترین سرعت استنتاج در صنعت دست یابد. در یک پلتفرم اصلی، فناوری گسترش تصویر LDM-AI در سمت دستگاه دارای سرعت استنتاج کمتر از 1.5 ثانیه است که 10 برابر سریع‌تر از سرعت استنتاج است. برنامه های ابری رقیب از خروجی 12 میلیون پیکسل و بالاتر پشتیبانی می کند.

در طول نمایش در محل، کارکنان توانستند در حین شلیک خود را گسترش دهند، و به طور کامل توانایی مدل بزرگ انتها به سمت را برای "سریع رفتن اما هرگز شکستن" نشان داد.

علاوه بر این، طبق گفته Xu Li، مدل پایان به انتها در مقیاس بزرگ عمدتاً برای شش حوزه اصلی مناسب است: گفتگوی روزانه، پرسش و پاسخ عقل سلیم، تولید کپی‌نویسی، مدیریت آلبوم عکس، تولید تصویر و گسترش تصویر -تطبیق دستگاه، به آن اجازه می دهد تا به طور انعطاف پذیر در انواع سناریوها و دستگاه های مختلف اعمال شود.

در پاسخ به تقاضای رو به رشد برای برنامه های کاربردی هوش مصنوعی در لبه صنایع کلیدی مانند امور مالی، برنامه نویسی، مراقبت های پزشکی و امور دولتی، SenseTime همچنین رسما یک دستگاه برنامه کاربردی همه کاره در سطح سازمانی راه اندازی کرده است که مقرون به صرفه است. آماده استفاده، امن از نظر داده ها، و تولید ملی، پوشش مالی، پزشکی، امور دولتی، کدگذاری و چهار صنعت عمده دیگر.

به عنوان مثال، پلتفرم مشاوره و پرسش و پاسخ هوشمند دولتی را در نظر بگیرید که نه تنها می تواند سؤالات مطرح شده توسط کاربران را درک کند، بلکه می تواند منابع مرجع برای پاسخ ها را نیز ارائه دهد و سطح اطلاعاتی خدمات دولتی را تا حد زیادی بهبود بخشد.

Xu Li اشاره کرد که زبان طبیعی هنوز نمی تواند جایگزین زبان های برنامه نویسی شود.

بنابراین، امروز SenseTime همچنین نسخه سبک وزن دستگاه All-in-one مدل بزرگ Little Raccoon Code را منتشر کرد که می تواند یک تیم تحقیق و توسعه 100 نفره را روی یک دستگاه پشتیبانی کند. از داده‌هایی پشتیبانی می‌کند که دامنه را ترک نمی‌کنند، امنیت تضمین شده است و می‌توان از استقرار رایگان خارج از جعبه استفاده کرد. قیمت هر واحد از 350000 یوان است که گزینه ای مقرون به صرفه برای کاربران شرکت های کوچک و متوسط ​​است.

از ابتدای سال جاری، ظهور Sora به مردم این امکان را داد که پتانسیل خلاقانه نامحدود تولید ویدیوی هوش مصنوعی را مشاهده کنند، همچنین Xu Li "یک چیز دیگر" را در جلسه پایانی به ارمغان آورد – سه ویدیو کاملاً تولید شده توسط مدل های بزرگ. پلتفرم تولید ویدیو Wensheng آینده همچنین دارای عملکرد عالی در کنترل شخصیت، قابلیت کنترل اکشن و کنترل صحنه است.

اجرای برنامه های کاربردی هوش مصنوعی به یک سوپر مارکت مدل بزرگ نیاز دارد

یک سال پس از انتشار GPT-4، مدل های بزرگ هنوز به طور مداوم پارامترها را برای تجدید رتبه بندی جمع آوری می کنند. اما آنچه امسال واقعاً همه در صنعت نگران آن هستند این است که چگونه می توان مدل های بزرگ را از طریق نمایندگان در جریان کار شرکت ها و افراد بی شماری ادغام کرد.

فروشگاه GPT OpenAI به فروشگاه GPT صنعت هوش مصنوعی تبدیل نشده است، اما بسیاری از نیازها و مشکلات هنوز وجود دارد. فقدان پل هموار بین قابلیت‌های قدرتمند مدل‌های بزرگ و پیاده‌سازی آن‌ها در سناریوهای مختلف صنعت نیز نشان‌دهنده یک فرصت بزرگ است.

پلتفرم باز RiRixin SenseTime در واقع یک سوپر مارکت مدل بزرگ است. از طریق قابلیت‌های مدل چند وجهی، کارایی تماس‌های API بهبود می‌یابد و آستانه فراخوانی و سفارشی‌سازی عملکردهای مختلف هوش مصنوعی برای شرکت‌ها و توسعه‌دهندگان کاهش می‌یابد.

در مقایسه با پارامترهای مقیاس مدل، SenseTime بیشتر بر روی کاربرد قابلیت‌های مدل تمرکز می‌کند. از مدل‌های صنعتی بزرگ SenseTime برای امور مالی، مراقبت‌های پزشکی، امور دولتی و کدنویسی گرفته تا مدل سمت مشتری با سریع‌ترین سرعت استنتاج در صنعت، و همچنین برنامه‌های کاربردی بومی هوش مصنوعی مانند Discuss، Ruying، Dayi، و Little Raccoon Family. می‌توان دید که SenseTime Tang می‌خواهد جعبه ابزار هوش مصنوعی با رابط‌های غنی‌تر ارائه کند که بتواند وظایف پیچیده‌ای را در صنایع مختلف انجام دهد.

"گزارش بازار پلتفرم توسعه هوش مصنوعی چین 2023" منتشر شده توسط Frost & Sullivan، یک سازمان تحقیقاتی معروف، اشاره می‌کند که دستگاه‌های بزرگ SenseCore به ارائه‌دهنده زیرساخت محاسبات ابری پیشرو برای پلتفرم‌های توسعه هوش مصنوعی چین تبدیل شده‌اند. در پنج مورد ارزیابی سازگاری زیرساخت‌های سخت‌افزاری، همکاری زنجیره‌ای صنعتی، ماژول بهینه‌سازی آموزش مدل، قابلیت‌های فنی حاشیه‌نویسی هوشمند و سطح فنی مدل پیش‌آموزشی، SenseTime بالاترین امتیاز را دریافت کرد.

مدتی پیش در مورد نسخه سازمانی WPS AI Kingsoft Office گزارش دادیم و یکی از مدل های بزرگی که با آن همکاری می کند SenseTime است. Kingsoft گفت که SenseTime در تجزیه و تحلیل داده ها عالی است، بنابراین WPS AI آن را برای رسیدگی به سناریوهایی که نیاز به تفکر علمی دارند فرا می خواند.

APPSO شرکت‌هایی مانند Kingsoft را که مدل‌های بزرگ تولید نمی‌کنند، اما مصمم به استفاده از مدل‌های بزرگ هستند، به عنوان اپلیکیشن‌های هوش مصنوعی می‌خواند. نقشی که SenseTime ایفا می‌کند نه ارائه‌دهنده مدل‌های بزرگ، بلکه یک فروشگاه بزرگ و سوپرمارکت است که به صنایع مختلف کمک می‌کند تا برنامه‌های کاربردی هوش مصنوعی در مقیاس بزرگ را اجرا کنند.

فروشگاه بزرگ چیست؟ این دارای طیف گسترده ای از خطوط تولید است که می تواند نیازهای شخصی مصرف کنندگان مختلف، بزرگ و کوچک را برآورده کند. از همه مهمتر، ظهور فروشگاه‌های بزرگ و سوپرمارکت‌ها، طیف گسترده‌ای از محصولات را در دسترس عموم قرار داده است و به مردم عادی این امکان را می‌دهد تا به راحتی از محصولات و تجربیات با کیفیت بالا از سراسر جهان لذت ببرند.

و این بزرگترین ارزشی است که AIGC در حال ظهور در آینده برای ما به ارمغان خواهد آورد. به عنوان یکی از بزرگترین اختراعات جامعه مدرن، گفته می شود که این شرکت چهارمین انقلاب صنعتی را به وجود می آورد که به احتمال زیاد از تأثیر آن بر شرکت ها شروع شده است. فقید تانگ شیائو، بنیانگذار SenseTime نیز گفت:

هیچ صنعت هوش مصنوعی وجود ندارد، تنها صنعت هوش مصنوعی نیاز به همکاری با صنایع سنتی دارد.

تانگ شیائو در یک سخنرانی اشاره کرد که «تامین مالی شرکتی برای انجام کارهای بزرگ نیست، «کار بزرگ» که SenseTime در ده سال آینده انجام خواهد داد، کمک به هزاران صنعت برای اجرای AIGC خواهد بود.

نویسنده: لی چاوفان، مو چونگیو

# خوش آمدید به دنبال حساب عمومی رسمی وی چت Aifaner: Aifaner (شناسه WeChat: ifanr در اسرع وقت در اختیار شما قرار خواهد گرفت).

Ai Faner |. لینک اصلی · مشاهده نظرات · Sina Weibo