از هوش مصنوعی باز گرفته تا عینک های هوشمند هک شده، در اینجا 5 بزرگترین عناوین هوش مصنوعی این هفته آورده شده است

عینک هوشمند Ray-Ban Meta به سبک Headline توسط یک مدل استفاده می شود.
متا

ما این هفته رسماً به فصل Spooky تبدیل شدیم و بین دور بودجه 6.6 میلیون دلاری OpenAI، LLM غافلگیرکننده Nvidia و برخی عینک‌های هوشمند متا که حریم خصوصی را نقض می‌کنند، شاهد پیشرفت‌های ترسناکی در فضای هوش مصنوعی بودیم. در اینجا پنج مورد از بزرگترین اعلامیه ها آورده شده است.

سام آلتمن، مدیر عامل OpenAI، در یک رویداد محصول روی صحنه ایستاده است.
اندرو مارتونیک / روندهای دیجیتال

OpenAI در آخرین دور بودجه 6.6 میلیارد دلاری را تضمین می کند

وجود جذاب سم آلتمن با اخباری که در این هفته منتشر شد، ادامه می‌یابد که OpenAI 6.6 میلیارد دلار سرمایه‌گذاری اضافی را به عنوان بخشی از آخرین دور سرمایه‌گذاری خود تضمین کرده است. سرمایه گذاران موجود مانند مایکروسافت و Khosla Ventures توسط تازه واردان SoftBank و Nvidia پیوستند. ارزش شرکت هوش مصنوعی در حال حاضر 157 میلیارد دلار است که آن را به یکی از ثروتمندترین شرکت های خصوصی روی زمین تبدیل می کند. و اگر طرح تجدید ساختار انتفاعی پیشنهادی OpenAI انجام شود، این ارزش گذاری بیش از 150 میلیارد دلار سهام به آلتمن اعطا می کند و او را به فهرست 10 ثروتمند برتر روی کره زمین تبدیل می کند. پس از انتشار اخبار مالی، OpenAI Canvas را عرضه کرد که ویژگی مشترک Artifacts آنتروپیک است.

جنسن مدیر عامل انویدیا در مقابل پس زمینه.
Nvidia

انویدیا به تازگی یک LLM منبع باز برای رقیب GPT-4 منتشر کرده است

انویدیا با انتشار این هفته LVNM 1.0 ، یک مدل زبان بزرگ واقعاً منبع باز که در انواع وظایف بینایی و زبانی برتر است، از سخت افزار هوش مصنوعی به نرم افزار هوش مصنوعی جهش می کند. این شرکت ادعا می کند که خانواده مدل جدید که توسط مدل 72 میلیارد پارامتری LVNM-D-72B رهبری می شود، می تواند رقیب GPT-4o باشد. با این حال، انویدیا LVNM را نه به عنوان یک رقیب مستقیم برای سایر LLM های کلاس مرزی، بلکه به عنوان پلتفرمی که توسعه دهندگان دیگر می توانند چت بات ها و برنامه های کاربردی خود را بر روی آن ایجاد کنند، قرار می دهد.

نمایشی از Gemini Live در Google Pixel 9.
جو مارینگ / روندهای دیجیتال

Gemini Live گوگل اکنون به حدود چهار دوجین زبان صحبت می کند

به نظر می رسد که بتوانید مستقیماً با چت بات خود صحبت کنید، ویژگی جدید ضروری است. گوگل این هفته اعلام کرد کهGemini Live را برای مکالمه به حدود چهار ده زبان فراتر از انگلیسی، از فرانسوی، آلمانی، پرتغالی، هندی و اسپانیایی، گسترش می‌دهد . مایکروسافت همچنین ویژگی مشابهی را برای Copilot به نام Copilot Voice فاش کرد که این شرکت ادعا می‌کند "بصری‌ترین و طبیعی‌ترین راه برای طوفان فکری در حال حرکت است." آنها به حالت صوتی پیشرفته ChatGPT و تعاملات صوتی طبیعی متا می پیوندند و به کاربران اجازه می دهند با تلفن های خود صحبت کنند، نه فقط با آنها.

گوین نیوسام، فرماندار کالیفرنیا، در یک سخنرانی صحبت می کند
گیج اسکیدمور / فلیکر

فرماندار کالیفرنیا لایحه گسترده ایمنی هوش مصنوعی را وتو کرد

تمام درگیری‌ها بر سر SB 1047، قانون نوآوری ایمن و ایمن کالیفرنیا برای مدل‌های مصنوعی مرزی، بی نتیجه بود زیرا فرماندار گاوین نیوسام لایحه ایمنی هوش مصنوعی را در این هفته وتو کرد . او در نامه‌ای به قانون‌گذاران استدلال کرد که این لایحه به صورت نزدیک‌بینانه بر بزرگترین مدل‌های زبان تمرکز دارد و «مدل‌های تخصصی کوچک‌تر ممکن است به همان اندازه یا حتی خطرناک‌تر از مدل‌های هدف SB 1047 ظاهر شوند».

عینک هوشمند Ray-Ban Meta در کنار استخر.
فیل نیکینسون / روندهای دیجیتال

هکرها عینک هوشمند متا را به دستگاه داکس خودکار تبدیل می کنند

404 Media در این هفته گزارش داد که یک جفت دانشجوی علوم کامپیوتر دانشگاه هاروارد موفق شدند یک جفت عینک هوشمند متا را اصلاح کنند تا بتوانند هر فردی را که به میدان دید آنها وارد می شود شناسایی و جستجو کنند. این عینک، بخشی از آزمایش I-XRAY، برای ثبت تصاویر غریبه ها در خیابان طراحی شده است، آن تصاویر را از طریق نرم افزار تشخیص تصویر PimEyes اجرا می کند تا سوژه را شناسایی کند، سپس از آن اطلاعات اولیه برای جستجوی اطلاعات شخصی آنها استفاده می کند. شماره تلفن و آدرس منزل) در سایت های کارگزاری داده های تجاری.

این جفت در یک ویدئوی نمایشی که برای X ارسال شده است ، توضیح می‌دهد: «برای استفاده از آن، فقط عینک را می‌زنید، و سپس وقتی در کنار مردم راه می‌روید، عینک تشخیص می‌دهد که چه زمانی صورت کسی در کادر است. "پس از چند ثانیه، اطلاعات شخصی آنها در تلفن شما ظاهر می شود." پیامدهای حریم خصوصی برای چنین سیستمی وحشتناک است. این دو هیچ قصدی برای انتشار عمومی کد منبع ندارند، اما اکنون که نشان داده‌اند این کار می‌تواند انجام شود، نمی‌توان از مهندسی معکوس آن توسط دیگران جلوگیری کرد.