متا نسخه خود از حالت صوتی پیشرفته را در Connect 2024 عرضه می کند

زاکربرگ در حال معرفی تعاملات صوتی طبیعی است
متا

در Meta Connect 2024 در روز چهارشنبه، مدیرعامل مارک زاکربرگ روی صحنه رفت تا درباره آخرین پیشرفت‌های شرکتش در هوش مصنوعی صحبت کند. زاکربرگ در آنچه او به عنوان "احتمالاً بزرگترین اخبار هوش مصنوعی در اختیار داریم" توصیف کرد، از تعاملات صوتی طبیعی، رقیب مستقیمGemini Live گوگل و حالت صدای پیشرفته OpenAI، رونمایی کرد.

زاکربرگ اظهار داشت: «من فکر می‌کنم این صدا روشی طبیعی‌تر از متن برای تعامل با هوش مصنوعی خواهد بود. من فکر می‌کنم که این پتانسیل این را دارد که یکی از [اگر نه رایج‌ترین] راه‌هایی باشد که همه ما با هوش مصنوعی تعامل داریم.» زاکربرگ همچنین اعلام کرد که این ویژگی جدید از امروز در تمامی برنامه‌های اصلی متا از جمله اینستاگرام، واتس‌اپ، مسنجر و فیس‌بوک در اختیار کاربران قرار خواهد گرفت.

تصاویری از ویژگی های تعاملات صوتی طبیعی
متا

زاکربرگ گفت: «هوش مصنوعی متا نه تنها با ارائه مدل‌های پیشرفته هوش مصنوعی، بلکه دسترسی نامحدود به آن مدل‌ها برای ادغام رایگان در محصولات و برنامه‌های مختلف ما، خود را در این دسته متمایز می‌کند.» هوش مصنوعی متا در مسیر تبدیل شدن به پر استفاده ترین دستیار هوش مصنوعی در جهان است. ما تقریباً به 500 میلیون فعال ماهانه رسیده ایم و حتی در برخی از کشورهای بزرگتر هنوز راه اندازی نشده است.

همانند Gemini Live و Advanced Voice Mode ، Natural Voice Interactions به کاربران این امکان را می دهد که از پیام های متنی صرف نظر کنند و مستقیماً با ربات چت صحبت کنند. کاربران می توانند لکنت کنند، خود را اصلاح کنند، هوش مصنوعی را قطع کنند و به طور کلی همانطور که با انسان دیگری صحبت می کنند صحبت کنند و همچنان چت بات مکالمه را دنبال کند. این ویژگی جدید همچنین به کاربران اجازه می‌دهد تا صدای هوش مصنوعی را انتخاب کرده و از میان افراد مشهور مختلف از جمله جان سینا، دیم جودی دنچ، کریستن بل، کیگان مایکل کی و آکوافینا انتخاب کنند. ممکن است این ترکیب را از حمله قبلی متا به چت به زبان طبیعی به خاطر بیاورید، که در ماه آگوست بسته شد زیرا کاربران این تعامل را "وحشتناک" و "سوررئال" می دانستند.

نام او جان سینا است
متا

زاکربرگ یک نمایش زنده از این ویژگی روی صحنه ارائه کرد و از ربات چت یک سری سؤالات سافت بال پرسید که هوش مصنوعی به آنها پاسخ رضایت بخشی داد. آهنگ گفتاری آن نسبت به حالت صوتی پیشرفته، کمی آرام و کمتر محاوره‌ای به نظر می‌رسید، اما همچنان بسیار بهتر از صدای یکنواختی بود که از پاسخ سیری دریافت می‌کردید. با این حال، تا زمانی که زاکربرگ از هوش مصنوعی به عنوان Awkwafina یاد کرد، این گزارشگر متوجه شد که قرار است صدای آن کسی باشد.

فعل و انفعالات صوتی طبیعی "احتمالا بزرگترین" خبر هوش مصنوعی بود که در روز چهارشنبه اعلام شد، اما به دور از تنها اعلامیه بود. زاکربرگ همچنین فاش کرد که مدل Llama متا به نسخه 3.2 رسیده است، زیرا سیستم چند وجهی شده است. Llama 3.2 11B و 90B (با اشاره به تعداد پارامترهایی که هر کدام روی آنها آموزش داده شده است) اکنون می توانند نمودارها و نمودارها را تفسیر کنند، دارایی های درون تصاویر را شناسایی کنند و همچنین شرح تصاویر را ایجاد کنند.

متاسفانه این مدل های جدید در اروپا عرضه نخواهند شد. این به دلیل آن چیزی است که متا به عنوان محیط نظارتی «غیرقابل پیش‌بینی» اتحادیه اروپا طبقه‌بندی می‌کند، که مانع از استفاده شرکت از داده‌های اروپایی‌ها برای آموزش مدل‌های هوش مصنوعی می‌شود. این شرکت در حال راه اندازی یک جفت مدل بسیار سبک وزن در اروپا با نام های Llama 3.2 1B و 3B است که هیچ یک از آنها بر روی داده های اروپایی آموزش ندیده اند. این مدل ها برای گوشی های هوشمند و دیگر دستگاه های لبه ساخته شده اند.

و به دلایل به ظاهر غیرقابل درک، متا همچنین اعلام کرد که در حال آزمایش ویژگی جدیدی است که تصاویر تولید شده با هوش مصنوعی – که برخی از آنها ممکن است شبیه شما باشد – را مستقیماً به فیدهای فیس بوک و اینستاگرام شما تزریق می کند. این تصاویر "Imagined for You" کاربران را وادار می کند که تصویر را همانطور که هست به اشتراک بگذارند یا در برنامه و در زمان واقعی آن را تکرار کنند.

زاکربرگ در مصاحبه اخیر خود با The Verge گفت: "من فکر می کنم در طول زمان این روند وجود داشته است که در آن فیدها به عنوان محتوای اصلی و منحصراً برای افرادی که شما آنها را دنبال می کنید، دوستان خود شروع کردند." و شما فقط به آن اضافه کنید، یک لایه از «بسیار خوب، و ما همچنین محتوایی را به شما نشان خواهیم داد که توسط یک سیستم هوش مصنوعی تولید شده است که ممکن است چیزی باشد که شما به آن علاقه مند باشید.» بستگی به اجرا و خوب بودن آن دارد.»