چیپ آینده ای که اپل، کوالکام و گوگل روی آن شرط بندی می کنند چیست؟ | فلسفه سخت

در طول تجربه‌ام با Pixel 6 Pro، جدای از عکس‌برداری، به ندرت در مورد چیزی که گوگل آن را «هوشمندترین تلفن پیکسل» می‌نامید، احساس اشتباهی داشتم تا اینکه یک روز صبح که زنگ تلفنم مرا از خواب بیدار کرد.

متفاوت از عمل لغزش برای بستن زنگ هشدار در یک تلفن همراه معمولی، Pixel 6 Pro از من می‌خواهد بگویم «تعویق (یک استراحت دیگر)» یا «توقف (توقف)» برای کنترل زنگ، و وقتی می‌گویم «توقف» "با دقت، آلارم تلفن همراهی که ادامه می داد ساکت بود.

این یک ویژگی کوچک پیش پا افتاده است، اما هر روز صبح که با ساعت زنگ دار از خواب بیدار می شوم، حالم را خوب نگه می دارد.

در نهایت، دیگر لازم نیست برای جستجوی تلفن همراهم خواب آلودگی را مجبور کنم، فقط به یک جمله نیاز دارم تا گوشی تلفن همراه تهدید کننده زندگی را ببندم. این اولین بار است که احساس می کنم تلفن همراه می تواند مرا "درک" کند.

راز "درک حرف مردم" در TPU فروتن نهفته است.

محاسبات هوش مصنوعی همه جا حاضر

در SoC تلفن همراه، وجود NPU همیشه ضعیف تر از CPU و GPU است.

این پردازنده که بر روی عملیات شبکه عصبی تمرکز دارد، حتی یک نام یکپارچه هم ندارد: آن را NPU در تراشه Kirin، و Neural Engine در تراشه بیونیک سری A نامیده می‌شود؛ گوگل آن را TPU می‌نامد و مدیاتک فکر می‌کند که برای آن استفاده می‌شود. برای محاسبه هوش مصنوعی باید APU نامیده شود…

اگرچه این تراشه‌ها نام‌ها و معماری‌ها و اصول متفاوتی دارند، اما اهداف آن‌ها تا حد زیادی مشابه است – تسریع یادگیری ماشین و بهبود قدرت محاسباتی هوش مصنوعی تلفن‌های همراه.

اگر به عملکرد پردازنده تلفن همراه دقت کنید، متوجه خواهید شد که چه تراشه سری A آیفون باشد و چه تراشه پرچمدار اسنپدراگون اندروید، قدرت محاسباتی CPU در گذشته بسیار محدود شده است. دو سال، و پدیده "فشرده کردن خمیر دندان" در عملکرد بیشتر و بیشتر و جدی تر است.

در مقابل، قدرت محاسباتی هوش مصنوعی به شاخص پارامتری تبدیل شده است که تولیدکنندگان بیشتری مایل به ذکر آن هستند. با در نظر گرفتن تراشه سری A به عنوان مثال، تراشه بیونیک A14 اپل، اوج قدرت محاسباتی خود را در مقایسه با نسل قبلی تقریبا دو برابر کرده است و می تواند 11 تریلیون عملیات در ثانیه انجام دهد.

یک سال بعد، تراشه بیونیک A15 همچنان می تواند بر این اساس بیش از 40 درصد پیشرفت قابل توجهی داشته باشد و می تواند تا 15.8 تریلیون عملیات در ثانیه انجام دهد.

پیشرفت قدرت محاسباتی هوش مصنوعی کمپ اندروید نیز بسیار چشمگیر است.در لیست تست عملکرد هوش مصنوعی که توسط دانشگاه صنعتی زوریخ راه اندازی شد، امتیاز عملکرد Kirin 970 AI که برای اولین بار با NPU معرفی شد، امتیاز گرفت. امتیاز 23600. چهار سال بعد تراشه Google Tensor با امتیاز بالای 214700 به اوج رسید و Kirin 9000 و Snapdragon 888 نیز حدود 160000 امتیاز کسب کردند.

از آنجایی که قدرت محاسباتی هوش مصنوعی تقریباً به طور تصاعدی در حال رشد است، چرا احساس هرگونه تغییر برای ما دشوار است؟ آیا عملکرد هوش مصنوعی کلمه کمی پیشرفته از ما بسیار دور است؟

▲ تصویر از: Gadgetmatch

در واقع، هر بار که قفل گوشی را باز می‌کنید، دستیار صوتی را بیدار می‌کنید یا حتی شاتر را فشار می‌دهید، ارتباط نزدیکی با محاسبات هوش مصنوعی دارد.

NPU مانند یک جعبه سیاه است، فرآیند محاسبه هوش مصنوعی را تقریباً غیرقابل مشاهده می کند، و شما را برای فناوری نامرئی می کند، اما با تعامل طبیعی تر انسان و رایانه احاطه شده است. تکامل دستیار صوتی گوگل مثال خوبی است.

از آنجایی که سیری در سال 2014 به عملکرد بیداری صوتی "Hey, Siri" ملحق شد، کلمات بیدارباش تقریباً به دستیار صوتی متصل هستند. هر بار که با دستیار صوتی صحبت می کنیم، باید زحمت کشیدن نام آنها را متحمل شویم. : Siri, Xiao Ai, Xiao Bu , Xiaoyi… اگر محیط صدا بسیار پر سر و صدا باشد ممکن است این روند شرم آور بارها تکرار شود.

▲ تصویر چاپ صوتی برای تشخیص کلمه بیدار از: اپل می آید

دلیل آن این است که به دلیل ملاحظات مصرف انرژی، پردازنده تلفن همراه نمی تواند قدرت محاسباتی خود را برای تجزیه و تحلیل هر جمله کاربر در پس زمینه برای مدت طولانی هدر دهد.در این زمان یک گیرنده صوتی با مصرف انرژی کم و فقط تشخیص کلمات بیدار می باشد. برای کار دائمی مورد نیاز است.

هنگامی که سیگنال کلمه بیداری دریافت می شود، پردازنده اصلی برای گوش دادن به دستورالعمل بعدی کاربر بسیج می شود.

با این حال، اگرچه این می تواند به بیدار شدن صدای کم قدرت برسد، اما هنوز کمی با شکل ایده آل دستیاران هوش مصنوعی در فیلم های علمی تخیلی فاصله دارد. مثل این است که مرد آهنی قبل از مبارزه بگوید "هی، جارویس". باز هم انسان- تعامل کامپیوتر کمی ناخوشایند است.

ویژگی «فرمان های میانبر» گوگل در سری پیکسل 6 این تعامل طبیعی را که در فیلم های علمی تخیلی وجود دارد به واقعیت تبدیل می کند.

همانطور که در ابتدای مقاله ذکر شد، کاربران همچنین می توانند از طریق "دستورالعمل های میانبر"، دستیار گوگل را برای انجام کارهای مشخصی مانند خاموش کردن ساعت زنگ دار و پاسخ به تماس ها بدون فریاد زدن کلمات بیدار کننده مانند "OK Google" بیدار کنند.

▲ الگوریتم VoiceFilter ارائه شده توسط Google Image از: Google

برای جداسازی جهتی صداهای انسان در یک محیط صدای پر سر و صدا، تلفن های همراه باید قابلیت های تشخیص پرینت صوتی با دقت بالاتری داشته باشند و از الگوریتم های شبکه عصبی کانولوشنال پیچیده تری برای ضبط و تشخیص دقیق رمز عبور کاربر استفاده کنند.

و تراشه TPU گوگل که مخصوص محاسبات هوش مصنوعی طراحی شده است، نیاز به توان محاسباتی هوش مصنوعی را برآورده می کند و این تعامل صوتی طبیعی در نهایت در سری پیکسل 6 تحقق می یابد.

NPU مبتنی بر واحد پردازش عصبی بسیار کارآمدتر از CPU سنتی در تشخیص و پردازش تصویر و گفتار است.بنابراین سازندگان تلفن همراه می توانند بسیاری از عملکردها مانند عکاسی محاسباتی و تشخیص متن را برای غنی سازی عملکردهای نرم افزاری سیستم توسعه دهند.

در آخرین iOS 15 اپل، بسیاری از ویژگی‌های جدید بر اساس موتورهای محاسبات عصبی طراحی شده‌اند، مانند حالت صوتی فضایی و پرتره اضافه شده به FaceTime، استخراج و ترجمه متن در زمان واقعی، آلبوم‌های عکس برای جستجوی مستقیم متن در عکس‌ها، عملکرد آفلاین Siri و غیره. .

از آنجایی که این توابع دارای الزامات خاصی برای قدرت محاسباتی هوش مصنوعی هستند، اپل همچنین تأکید کرد که اگر تراشه SoC مدل بعدی A12 Bionic نباشد، حتی اگر به iOS15 ارتقا دهید، این عملکردها قابل تجربه نیستند.

مثال دیگر شناسایی هوشمند عکس‌های ID در MIUI13، افزودن واترمارک، محافظت از حریم خصوصی تأیید چهره و سایر عملکردها است. حرکات فضایی و چرخش سر HarmonyOS نیز با استفاده از فناوری‌هایی مانند تشخیص تصویر هوش مصنوعی و OCR متن توسعه داده شده‌اند.

عملکردهای هوش مصنوعی شروع به تبدیل شدن به بخش مهمی از تجربه روزانه تلفن همراه ما کرده‌اند و NPU که در ابتدا بی‌اهمیت در نظر گرفته می‌شد، به بخشی جدایی ناپذیر از تجربه نرم‌افزاری سیستم تبدیل شده است.

چرا به تراشه های محاسباتی هوش مصنوعی نیاز دارید؟

در مقایسه با سایر بخش های تلفن همراه، NPU خیلی دیرتر ظاهر شد.

در سپتامبر 2017، هواوی Kirin 970 را در نمایشگاه IFA در برلین منتشر کرد که اولین SoC با NPU یکپارچه است.در همان دوره، اپل اولین تراشه بیونیک A11 مجهز به موتور محاسبات عصبی را منتشر کرد. دو اردوگاه مورد توجه قرار گرفتند. در زمینه محاسبات هوش مصنوعی بطور شگفت انگیزی همزمان.

ظهور عملکردهای هوش مصنوعی ممکن است ناگهانی به نظر برسد، اما در واقع نتیجه تکامل طبیعی در طول توسعه اشکال گوشی های هوشمند است.

مجله Wired در مصاحبه ای با معاون اپل تیم میلت در مورد تراشه های سری A اشاره کرد که چند سال قبل از عرضه آیفون X، برخی از مهندسان اپل پیشنهاد کردند که از الگوریتم های یادگیری ماشین برای هوشمندتر کردن دوربین آیفون استفاده کنند.

این ایده است که آیفون X را که شکل آیفون را در دهه آینده مشخص می کند، ممکن می کند. جابجایی به آیفون X تمام صفحه نیاز به مکانیزم امنیتی جدیدی برای جایگزینی تاچ آی‌دی دارد که در اصل چانه را اشغال می‌کند و نمی‌تواند از نظر دقت و سرعت باز کردن قفل از حالت اول عقب بماند. برای دستیابی به این نکات، اپل به سمت نور ساختاری سه بعدی روی آورد. به رسمیت شناختن.

هر بار که آیفون برای باز کردن قفل روشن می شود، دوربین تشخیص عمق واقع در چتری یک نقشه عمق را از طریق هزاران نقطه ایجاد می کند که با داده های چهره ذخیره شده مقایسه می شود تا باز کردن قفل کامل شود و این روند جمع آوری، ایجاد شود. در یک چشم به هم زدن، مهمتر از آن، مصرف برق باید در حد کافی پایین نگه داشته شود.

طبق اطلاعات منتشر شده توسط اپل، کاربران آیفون به طور متوسط ​​80 بار در روز قفل را باز می کنند. اگر CPU یا GPU برای انجام عملیات گرافیکی با قدرت بالا در هر بار باز کردن قفل نیاز داشته باشند، این یک چالش قابل توجه برای عمر باتری خواهد بود. تلفن.

▲ فرآیند یادگیری ماشینی

موتور محاسبات عصبی معماری چند هسته ای می تواند تعداد زیادی عملیات را به طور همزمان انجام دهد و از طریق یادگیری ماشین عمیق می تواند اطلاعات چهره انسان را مانند مغز انسان تشخیص دهد و قضاوت کند. استفاده از آن برای درک تشخیص چهره مصرف انرژی متفاوتی دارد. عملکرد نسبت به CPU های سنتی مزیت کوچک.

تیم میلت در این مصاحبه گفت: ما نمی توانستیم این کار را بدون موتور محاسبات عصبی انجام دهیم.

با افزایش تعداد هسته ها، قدرت محاسباتی موتور محاسبات عصبی نیز بسیار بهبود می یابد و کاربردهای آن بیشتر و گسترده تر می شود.

به عنوان مثال، موتور محاسبات عصبی 8 هسته‌ای تراشه A13 بایونیک، عملکردهای Deep Fusion و حالت صحنه شب را به سری آیفون 11 می‌آورد که وضوح و جزئیات عکس‌ها را از طریق ادغام چندگانه بهبود می‌بخشد؛ برای دستیابی به یک نتیجه، همزمان با چند دوربین تماس بگیرید. تجربه زوم صاف

▲ آناتومی تراشه بیونیک A15 و تراشه بیونیک A14، موتور محاسبات عصبی در گوشه پایین سمت چپ متمرکز شده است.

به طور کلی، ظهور NPU ها مانند موتورهای محاسبات عصبی می تواند فشار محاسباتی CPU یا GPU را به خوبی به اشتراک بگذارد. از طریق تجزیه و تحلیل موازی کارآمد و محاسبه کلان داده ها، می توان نتایج معنی داری استخراج کرد و از پردازش طبیعی تری استفاده کرد. قابلیت بهبود تجربه ما

هوش مصنوعی دوباره گوشی های هوشمند را تعریف می کند

جان جیاناندریا، معاون ارشد یادگیری ماشینی و استراتژی هوش مصنوعی اپل، در مصاحبه‌ای اشاره کرد که معتقد است در چند سال آینده، تمام عملکردهای iOS یا اکوسیستم نرم‌افزار اپل توسط یادگیری ماشینی تغییر خواهند کرد.

من فکر می کنم اپل همیشه نشان دهنده نقطه تلاقی خلاقیت و فناوری بوده است. وقتی به ایجاد تجربه‌های هوشمند فکر می‌کنید، ادغام عمودی برنامه‌ها، فریم‌ورک‌ها، تراشه‌ها واقعاً مهم است… من فکر می‌کنم این یک سفر است، این آینده دستگاه‌های محاسباتی است که ما داریم، آنها هوشمند می‌شوند و سپس این هوش نامرئی خواهد شد. .

آیفون اصلی، تلفن همراه را با تعامل صفحه لمسی و اتصال به اینترنت در هر زمان و هر مکان بازتعریف کرد. از آن زمان، تلفن همراه به عنوان شاخه‌ای از "تلفن ویژه" و "تلفن هوشمند" ظهور کرد.

هنگامی که عملکردهای تلفن های هوشمند همگرا می شوند، به اصطلاح "هوشمند" – ارسال WeChat، پخش موسیقی، عکس گرفتن، تماشای اخبار و غیره، به یک معنا به عملکرد خود باز می گردند.

▲ تصویر از: Gadgetmatch

گوشی‌های هوشمند باید بازتعریف شوند و هوش جدید باید به عنوان تلفن همراهی تعبیر شود که «مردم را درک می‌کند». می‌تواند دنیایی که می‌بینید را تشخیص دهد، هر فرمان شما را بفهمد و به صورت پویا مطابق با محیط تنظیم شود. همه اینها به تراشه‌های هوش مصنوعی نیاز دارند. دریافت کنید. عمیقا درگیر

با شفاف‌تر شدن زنجیره تامین سخت‌افزار تلفن‌های همراه، تفاوت‌ها در اجزای اصلی تلفن‌های همراه میان‌رده و گران‌قیمت کوچک‌تر و کوچک‌تر می‌شود و عملکردهای نرم‌افزاری بیشتر و بیشتر مورد توجه تولیدکنندگان قرار گرفته است. درست مانند آشپزی. ، زنجیره تامین سخت افزار راه خوبی برای تهیه "مواد اولیه" ظروف فراهم می کند، و اگر می خواهید طعمی منحصر به فرد بپزید، تجربه نرم افزاری عالی کلید "ادویه" است.

امروزه، ما در حال حاضر یک صفحه نمایش به اندازه کافی شفاف و یک دوربین داریم که می تواند مناظر را از فاصله 100 متری عکاسی کند، اما تجربه تلفن های هوشمند به نمایشگر و عکاسی معمولی محدود نمی شود.

باید به شما این امکان را بدهد که همزمان چندین عکس با فاصله کانونی بگیرید، به طوری که با عجله برای فوکوس، مناظر را از دست ندهید؛ باید بتواند پیش‌نمایش صحنه شب یا افکت HDR را در منظره یاب در زمان واقعی مشاهده کند، و نه برای تصویربرداری بیشتر منتظر بمانید؛ حتی باید تبدیل به مترجمی شود که می تواند شما را در سفرهایتان همراهی کند، حتی اگر شبکه ضعیف باشد، می تواند کار ترجمه بلادرنگ را به صورت آفلاین انجام دهد.

هوش مصنوعی بهترین انتخاب برای کمک به ما در درک این عملکردها است. به منظور شخصی سازی عملکردهای نرم افزاری عمیق تر، تولیدکنندگان تلفن همراه بیشتری مانند گوگل و OPPO شروع به مشارکت در طراحی تراشه های NPU کرده اند تا با پیشگامانی مانند اپل و و… هواوی.

در عین حال، قدرت محاسباتی قدرتمند هوش مصنوعی دیگر حق امتیاز پخش‌کننده‌های تراشه‌های خود توسعه‌یافته نیست. Qualcomm Snapdragon 8 و Dimensity 9000 هر دو قدرت محاسباتی هوش مصنوعی را به عنوان محور پیشرفت در نظر می‌گیرند و از Tensor گوگل در عملکرد هوش مصنوعی پیشی گرفته‌اند. Exynos 2200 که اخیراً منتشر شده است نیز بر بهبود عملکرد NPU تمرکز دارد و بهبودی دو برابری را به همراه دارد.

تلاش‌های متمرکز غول‌های تراشه در عملکرد هوش مصنوعی باعث می‌شود که تراشه‌های هوش مصنوعی موبایل به نظر در حال تجربه «قانون جدید مور» هستند.

علاوه بر سرعت رشد عملکرد، محبوبیت تراشه های هوش مصنوعی نیز بسیار چشمگیر است.طبق آمار آژانس آمار Counterpoint، تعداد تلفن های همراه با تراشه های هوش مصنوعی داخلی در سال 2017 تنها 3 درصد از بازار را به خود اختصاص داده است. سهم و در سال 2020 این رقم به 35 درصد رسیده است.

در آینده، تلفن‌های همراه بیشتری از محاسبات شتاب‌دهی هوش مصنوعی پشتیبانی می‌کنند، به این معنی که استفاده از یادگیری ماشینی برای توسعه برنامه‌های تلفن همراه به یک امر عادی تبدیل خواهد شد. در واقع، در برنامه‌های سطح ملی مانند Douyin و WeChat، استفاده از ماشین یادگیری قبلاً ظاهر شده است. عملکردهای هوش مصنوعی مانند محو کردن پس زمینه و برش با یک کلیک را درک کنید.

با مشارکت تولیدکنندگان تلفن همراه و توسعه شخص ثالث، برنامه‌های کاربردی هوش مصنوعی به عمیق‌تر شدن ادامه خواهند داد و شکل تلفن‌های هوشمند نیز ممکن است بر این اساس تغییر کند و تبدیل به یک همزیستی نرم‌افزاری-سخت‌افزاری برای تجربه‌ای دلپذیر شود.

در آن زمان، نبرد برای حق صحبت در قالب تلفن های هوشمند به تدریج از مدیریت زنجیره تامین به کنترل داده های بزرگ کاربر تغییر خواهد کرد.

حرف های بیهوده را بس کن

#خوش آمدید به حساب رسمی وی چت آیفانر: آیفانر (وی چت: ifanr) توجه کنید، در اسرع وقت مطالب هیجان انگیزتری برای شما آورده خواهد شد.

لاو فانر | لینک اصلی · مشاهده نظرات · سینا ویبو