چند سال قبل از اینکه موج مدلهای بزرگ فراگیر شود، در واقع موجی از کارآفرینی هوش مصنوعی وجود داشت. از جمله SenseTime Technology، Megvii Technology، Yuncong Technology و Yitu Technology نمایندگان این دوره هستند.
در این موج جدید که توسط OpenAI راه اندازی شده است، SenseTime، یکی از چهار اژدهای کوچک، هنوز در مرکز صحنه باقی مانده است. در آوریل سال گذشته، SenseTime سری "Ririxin·Large Model" را منتشر کرد.
هر روز جدید است و هر روز جدید است.
تانگ، بنیانگذار سلسله شانگ، شعار خودخواهی بالا را بر روی وان حمام حک کرد درست مانند عمق تغییرات در زمینه AIGC امروز، ریتم به روز رسانی مدل های بزرگ شانگ تانگ نیز می تواند به عنوان "هر روز جدید" توصیف شود. "
دو ماه پیش، SenseTime سیستم مدل بزرگ «Ririxin SenseNova 4.0» را راهاندازی کرد و حتی اولین API دستیاران جهان را راهاندازی کرد که از فراخوانهای مختلف ابزار مدال قبل از OpenAI پشتیبانی میکند.
و امروز بعد از ظهر، SenseTime، که "Rixin" است، به راه اندازی یک سری از مدل ها و برنامه های کاربردی هوش مصنوعی بر اساس "Rixin" ادامه داد:
- Ririxin 5.0: در ارزیابی های هدف مشترک به GPT-4 Turbo می رسد یا از آن فراتر می رود
- مدل انتهایی 1.8B: بهترین عملکرد در همان مقیاس، پیشرو در مقیاس
- دستگاه همه کاره برنامه در سطح سازمانی: شامل امور مالی، پزشکی، امور دولتی، کدنویسی و سایر زمینه ها
- پلتفرم تولید ویدیو Wensheng که هنوز راه اندازی نشده است
پانچ GPT-4 توربو، ضربه به DALL·E 3
در عصر هوش مصنوعی 2.0، هوش مصنوعی مولد به عنوان یک فناوری مهم در نظر گرفته میشود که باعث پیشرفت بهرهوری میشود، اگر بتواند به پیشرفتهایی در قابلیتهای سه لایه دانش، استدلال و اجرا دست یابد، واقعاً یک جهش به همراه خواهد داشت. توسعه رو به جلو بهره وری کل جامعه.
ماه گذشته، ژو لی، مدیرعامل SenseTime دیدگاه فوق را در کنفرانس مطبوعاتی 2024 مطرح کرد، او بار دیگر تاکید کرد که SenseTime به کاوش در معماری سه لایه KRE برای قابلیتهای مدل بزرگ تحت هدایت قانون ادامه خواهد داد. مقیاس (دانش-استدلال-اجرا)، دائماً از مرزهای قابلیت های مدل بزرگ عبور می کند.
بنابراین نکات برجسته بهروزرسانی RiRixin SenseNova 5.0 بهروزرسانی شده (که از این پس RiRixin 5.0 نامیده میشود) چیست؟
- معماری MOE را بپذیرید
- بر اساس آموزش توکن های 10 ترابایتی، مقدار زیادی داده مصنوعی
- پنجره زمینه استنتاج از 200K پشتیبانی می کند
- ارزیابی جامع دانش، استدلال، ریاضیات و کد با GPT-4 Turbo
Ririxin 5.0 این بهروزرسانی عمدتاً بر افزایش دانش، ریاضیات، قابلیتهای استدلال و کدنویسی تمرکز دارد و کاملاً با GPT-4 Turbo همسو میشود.
در ارزیابیهای هدف اصلی، RiRiXin 5.0 به نسخه GPT-4 Turbo منتشر شده توسط OpenAI در کنفرانس توسعهدهندگان در سال گذشته رسیده یا از آن پیشی گرفته است، و همچنین تقریباً به طور کامل Llama 3-70B را که اخیراً منتشر شده بود، شکست داد.
همه صحبتها و بدون تمرین، در کنفرانس مطبوعاتی، SenseTime همچنین قابلیتهای واقعی Ririxin 5.0 را در زبان، استدلال ریاضی و سایر جنبهها به طور کامل نشان داد.
همچنین یک سوال انشایی امتحان ورودی کالج 2022 را وارد کنید و آن را با GPT-4 Turbo مقایسه کنید (فقط نسخه مربوط به نوامبر سال گذشته، همان زیر می توان دریافت که نتایج تولید شده توسط Ririxin 5.0 از محدودیت های قالب ها خارج است). و روتین ها، و افراد با ذوق، در نگاه اول، مقاله ای است که می تواند وارد قلب معلم نمره گذاری کنکور شود.
در مواجهه با مشکلات ریاضی، GPT-4 Turbo نه تنها فرآیند محاسباتی پیچیده بود، بلکه نتایج نهایی نیز اشتباه بود، اما پاسخ های به دست آمده توسط RiRixin 5.0 بسیار منطقی و کاملاً صحیح بود.
تمایز در صنعت یک عامل کلیدی برای برجسته شدن مدل های بزرگ از رقبا است.
Ririxin 5.0 که سناریوهای کاربردی محلی را هدف قرار می دهد، در درک فرهنگ و زمینه منحصر به فرد چینی بهتر از GPT-4 Turbo است. از آنجایی که GPT-4 Turbo با زمینه چینی آشنا نیست، طبیعتاً نمی تواند قوانین بازی محلی "عقاب گرفتن مرغ" را به درستی درک کند.
قابلیت های چندوجهی به طور کلی توسط صنعت به عنوان یک مسیر کلیدی برای دستیابی به AGI در نظر گرفته می شود.
با قضاوت از نتایج تست معیار، RiRixin 5.0 همچنین می تواند به شدت با GPT-4V رقابت کند و هر دو طرف برنده یا بازنده شوند. در نمایش مورد واقعی، اثر تولید یک فیل پیر در چند ثانیه که توسط RiRiXin 5.0 پشتیبانی میشود، طبیعیتر است.
بر اساس تصویر پرتره ایجاد شده توسط همان فرمان، بافت پوست ایجاد شده توسط SenseTime's Miahua طبیعی است، بدون پرداخت بیش از حد پوست و فیلترها، و با موفقیت نشانگر "زیبا" را تکمیل می کند. با توجه به اینکه پایگاه داده بین المللی پرتره های آسیایی مورد استفاده برای آموزش مدل های هوش مصنوعی نسبتا محدود است، چنین نتایج مقایسه ای نسبتاً طبیعی است.
در ترکیب با قابلیت های چند وجهی و تجزیه و تحلیل داده ها، هوش مصنوعی می تواند به وظایف پیچیده تر و پیشرفته تری دست یابد.
RiRiXin 5.0 میتواند خلاصهای از تصاویر طولانی را بشکند بی اعتبار کردن.
همیشه گفته می شود که هوش مصنوعی روند کار را تغییر می دهد این بار نیز SenseTime توانایی های راکون اداری را در این زمینه نشان داد.
رکورد سه ساله شرکت راننده مسابقات فرمول یک ژو گوانیو را وارد سیستم کنید و اجازه دهید ببر هیستوگرام تعداد مسابقاتی را که در آنها شرکت کرده است نشان دهد.
ژو گوانیو در مسابقات بین المللی از نام انگلیسی خود برای رقابت استفاده می کند. مدلهای بزرگ سنتی معمولاً هنگام برخورد با وظایف تشخیصی که شامل املای غیر متعارف انگلیسی یا افراد خاص است، عملکرد ضعیفی دارند. اگرچه راکون اداری ارتقا یافته در Ririxin 5.0 پیچ و خم هایی را تجربه کرد، اما سرانجام با موفقیت ترسیم شد.
مدل انتها به پهلو بزرگ، فقط سریع و هرگز خراب نمی شود
در دنیای هنرهای رزمی، "تنها هنر رزمی در جهان که نمی توان آن را شکست، سریع است" بر اهمیت سرعت در نبرد واقعی تاکید دارد و در نبردهای بزرگ نیز این اصل صدق می کند.
با توسعه سریع فناوری مدل های بزرگ، نیازهای سناریوهای کاربردی مختلف به طور فزاینده ای در حال ظهور هستند. .
SenseTime که عملگراتر شده است، در این کنفرانس به طور رسمی نسخه 1.8B SenseChat-Lite مدل انتهایی را راه اندازی کرد.
در تست معیار، این مدل سمت پایانی به طور جامع از مدلهای بزرگ با ابعاد MiniCPM-2B و Phi-2 پیشی گرفت و حتی از مدلهای بزرگ 7B و 13B نیز پیشی گرفت مقیاس یکسان، که در تمام سطوح پیشرو است.
تحقیقات نشان می دهد که سریع ترین سرعت خواندن چشم انسان حدود 20 کلمه در ثانیه است و مدل سمت دستگاه SenseTime مجهز به 1.8B می تواند به سرعت 18.3 کلمه در ثانیه بر روی یک تلفن همراه میان رده دست یابد، در حالی که موبایل پرچمدار تلفن می تواند تا 78.3 کلمه در ثانیه را پشتیبانی کند و به سریع ترین سرعت استنتاج در صنعت تبدیل شود.
SenseTime همچنین راهحلی برای همکاری دستگاه-ابر راهاندازی کرده است که میتواند از مزایای مربوط به دستگاه و ابر از طریق همکاری قضاوت هوشمند استفاده کند، هنگامی که جستجوی اینترنتی یا صحنههای پیچیده نیاز به پردازش دارند، در برخی از سناریوها به ابر بارگذاری میشوند. پردازش سمت پایانی بیش از 80% را تشکیل می دهد و در نتیجه هزینه استنتاج را به میزان قابل توجهی کاهش می دهد.
در چند ثانیه گفتگو با «مشاوره»، چه تهیه گزارش درخواست مرخصی در چند ثانیه باشد و چه خلاصه یک سند چند هزار کلمه ای، می توانیم به سرعت پاسخ دهیم.
مدل انتشار سمت دستگاه همچنین میتواند به سریعترین سرعت استنتاج در صنعت دست یابد. در یک پلتفرم اصلی، فناوری گسترش تصویر LDM-AI در سمت دستگاه دارای سرعت استنتاج کمتر از 1.5 ثانیه است که 10 برابر سریعتر از سرعت استنتاج است. برنامه های ابری رقیب از خروجی 12 میلیون پیکسل و بالاتر پشتیبانی می کند.
در طول نمایش در محل، کارکنان توانستند در حین شلیک خود را گسترش دهند، و به طور کامل توانایی مدل بزرگ انتها به سمت را برای "سریع رفتن اما هرگز شکستن" نشان داد.
علاوه بر این، طبق گفته Xu Li، مدل پایان به انتها در مقیاس بزرگ عمدتاً برای شش حوزه اصلی مناسب است: گفتگوی روزانه، پرسش و پاسخ عقل سلیم، تولید کپینویسی، مدیریت آلبوم عکس، تولید تصویر و گسترش تصویر -تطبیق دستگاه، به آن اجازه می دهد تا به طور انعطاف پذیر در انواع سناریوها و دستگاه های مختلف اعمال شود.
در پاسخ به تقاضای رو به رشد برای برنامه های کاربردی هوش مصنوعی در لبه صنایع کلیدی مانند امور مالی، برنامه نویسی، مراقبت های پزشکی و امور دولتی، SenseTime همچنین رسما یک دستگاه برنامه کاربردی همه کاره در سطح سازمانی راه اندازی کرده است که مقرون به صرفه است. آماده استفاده، امن از نظر داده ها، و تولید ملی، پوشش مالی، پزشکی، امور دولتی، کدگذاری و چهار صنعت عمده دیگر.
به عنوان مثال، پلتفرم مشاوره و پرسش و پاسخ هوشمند دولتی را در نظر بگیرید که نه تنها می تواند سؤالات مطرح شده توسط کاربران را درک کند، بلکه می تواند منابع مرجع برای پاسخ ها را نیز ارائه دهد و سطح اطلاعاتی خدمات دولتی را تا حد زیادی بهبود بخشد.
Xu Li اشاره کرد که زبان طبیعی هنوز نمی تواند جایگزین زبان های برنامه نویسی شود.
بنابراین، امروز SenseTime همچنین نسخه سبک وزن دستگاه All-in-one مدل بزرگ Little Raccoon Code را منتشر کرد که می تواند یک تیم تحقیق و توسعه 100 نفره را روی یک دستگاه پشتیبانی کند. از دادههایی پشتیبانی میکند که دامنه را ترک نمیکنند، امنیت تضمین شده است و میتوان از استقرار رایگان خارج از جعبه استفاده کرد. قیمت هر واحد از 350000 یوان است که گزینه ای مقرون به صرفه برای کاربران شرکت های کوچک و متوسط است.
از ابتدای سال جاری، ظهور Sora به مردم این امکان را داد که پتانسیل خلاقانه نامحدود تولید ویدیوی هوش مصنوعی را مشاهده کنند، همچنین Xu Li "یک چیز دیگر" را در جلسه پایانی به ارمغان آورد – سه ویدیو کاملاً تولید شده توسط مدل های بزرگ. پلتفرم تولید ویدیو Wensheng آینده همچنین دارای عملکرد عالی در کنترل شخصیت، قابلیت کنترل اکشن و کنترل صحنه است.
اجرای برنامه های کاربردی هوش مصنوعی به یک سوپر مارکت مدل بزرگ نیاز دارد
یک سال پس از انتشار GPT-4، مدل های بزرگ هنوز به طور مداوم پارامترها را برای تجدید رتبه بندی جمع آوری می کنند. اما آنچه امسال واقعاً همه در صنعت نگران آن هستند این است که چگونه می توان مدل های بزرگ را از طریق نمایندگان در جریان کار شرکت ها و افراد بی شماری ادغام کرد.
فروشگاه GPT OpenAI به فروشگاه GPT صنعت هوش مصنوعی تبدیل نشده است، اما بسیاری از نیازها و مشکلات هنوز وجود دارد. فقدان پل هموار بین قابلیتهای قدرتمند مدلهای بزرگ و پیادهسازی آنها در سناریوهای مختلف صنعت نیز نشاندهنده یک فرصت بزرگ است.
پلتفرم باز RiRixin SenseTime در واقع یک سوپر مارکت مدل بزرگ است. از طریق قابلیتهای مدل چند وجهی، کارایی تماسهای API بهبود مییابد و آستانه فراخوانی و سفارشیسازی عملکردهای مختلف هوش مصنوعی برای شرکتها و توسعهدهندگان کاهش مییابد.
در مقایسه با پارامترهای مقیاس مدل، SenseTime بیشتر بر روی کاربرد قابلیتهای مدل تمرکز میکند. از مدلهای صنعتی بزرگ SenseTime برای امور مالی، مراقبتهای پزشکی، امور دولتی و کدنویسی گرفته تا مدل سمت مشتری با سریعترین سرعت استنتاج در صنعت، و همچنین برنامههای کاربردی بومی هوش مصنوعی مانند Discuss، Ruying، Dayi، و Little Raccoon Family. میتوان دید که SenseTime Tang میخواهد جعبه ابزار هوش مصنوعی با رابطهای غنیتر ارائه کند که بتواند وظایف پیچیدهای را در صنایع مختلف انجام دهد.
"گزارش بازار پلتفرم توسعه هوش مصنوعی چین 2023" منتشر شده توسط Frost & Sullivan، یک سازمان تحقیقاتی معروف، اشاره میکند که دستگاههای بزرگ SenseCore به ارائهدهنده زیرساخت محاسبات ابری پیشرو برای پلتفرمهای توسعه هوش مصنوعی چین تبدیل شدهاند. در پنج مورد ارزیابی سازگاری زیرساختهای سختافزاری، همکاری زنجیرهای صنعتی، ماژول بهینهسازی آموزش مدل، قابلیتهای فنی حاشیهنویسی هوشمند و سطح فنی مدل پیشآموزشی، SenseTime بالاترین امتیاز را دریافت کرد.
مدتی پیش در مورد نسخه سازمانی WPS AI Kingsoft Office گزارش دادیم و یکی از مدل های بزرگی که با آن همکاری می کند SenseTime است. Kingsoft گفت که SenseTime در تجزیه و تحلیل داده ها عالی است، بنابراین WPS AI آن را برای رسیدگی به سناریوهایی که نیاز به تفکر علمی دارند فرا می خواند.
APPSO شرکتهایی مانند Kingsoft را که مدلهای بزرگ تولید نمیکنند، اما مصمم به استفاده از مدلهای بزرگ هستند، به عنوان اپلیکیشنهای هوش مصنوعی میخواند. نقشی که SenseTime ایفا میکند نه ارائهدهنده مدلهای بزرگ، بلکه یک فروشگاه بزرگ و سوپرمارکت است که به صنایع مختلف کمک میکند تا برنامههای کاربردی هوش مصنوعی در مقیاس بزرگ را اجرا کنند.
فروشگاه بزرگ چیست؟ این دارای طیف گسترده ای از خطوط تولید است که می تواند نیازهای شخصی مصرف کنندگان مختلف، بزرگ و کوچک را برآورده کند. از همه مهمتر، ظهور فروشگاههای بزرگ و سوپرمارکتها، طیف گستردهای از محصولات را در دسترس عموم قرار داده است و به مردم عادی این امکان را میدهد تا به راحتی از محصولات و تجربیات با کیفیت بالا از سراسر جهان لذت ببرند.
و این بزرگترین ارزشی است که AIGC در حال ظهور در آینده برای ما به ارمغان خواهد آورد. به عنوان یکی از بزرگترین اختراعات جامعه مدرن، گفته می شود که این شرکت چهارمین انقلاب صنعتی را به وجود می آورد که به احتمال زیاد از تأثیر آن بر شرکت ها شروع شده است. فقید تانگ شیائو، بنیانگذار SenseTime نیز گفت:
هیچ صنعت هوش مصنوعی وجود ندارد، تنها صنعت هوش مصنوعی نیاز به همکاری با صنایع سنتی دارد.
تانگ شیائو در یک سخنرانی اشاره کرد که «تامین مالی شرکتی برای انجام کارهای بزرگ نیست، «کار بزرگ» که SenseTime در ده سال آینده انجام خواهد داد، کمک به هزاران صنعت برای اجرای AIGC خواهد بود.
نویسنده: لی چاوفان، مو چونگیو
# خوش آمدید به دنبال حساب عمومی رسمی وی چت Aifaner: Aifaner (شناسه WeChat: ifanr در اسرع وقت در اختیار شما قرار خواهد گرفت).
Ai Faner |. لینک اصلی · مشاهده نظرات · Sina Weibo