آیا نگاه کردن به چانه کافی است؟ در اینجا گردنبندی می آید که زبان های بی صدا را می شناسد

تصور کنید در یک اتاق کنفرانس یا کتابخانه نشسته اید که می توانید صدای سوزن ها را بشنوید و بگویید "سیری، فردا به هوا نگاه کن" که ممکن است مناسب نباشد.

وقتی فردی نمی تواند صحبت کند یا مجبور است ساکت باشد اما باید به یک دستگاه هوشمند دستورالعمل بدهد، چه باید کرد؟

برای این منظور، چنگ ژانگ، استادیار علوم اطلاعات در دانشگاه کرنل، و رویدونگ ژانگ، دانشجوی دکترا، گردنبندی به نام "Speechin" طراحی کردند .

▲ تصویر از: دانشگاه کرنل

بر اساس حرکات فک، "تصاویری از تغییر شکل پوست گردن و صورت" برای تشخیص زبان بی صدا و در حال حاضر تشخیص عبارات ساده به زبان انگلیسی و چینی می گیرد.

▲ متحرک از: YouTube@Cornell University

دوربین مادون قرمز SpeeChin بر روی یک "قاب گردنبند" چاپ سه بعدی نصب شده است که روی یک زنجیر نقره ای آویزان شده است و دوربین به سمت چانه کاربر نشانه رفته است. برای بهبود پایداری، توسعه دهندگان "بال" را در طرفین طراحی کردند و یک سکه در پایین قرار دادند.

علاوه بر اینها، SpeeChin به ریزپردازنده، باتری و ماژول بلوتوث نیز مجهز است.

▲ تصویر از: دانشگاه کرنل

با استفاده از الگوریتم‌های مبتنی بر یادگیری ماشینی، دستگاه می‌تواند بر اساس حرکات فک کاربر، تعیین کند که پوشنده چه فرمان‌هایی را بی‌صدا ادا می‌کند و آن دستورات را به یک تلفن هوشمند جفت شده ارسال کند، دقیقاً شبیه سیری در شکل دیگری از ارتباط.

برای جلوگیری از مشکلات حریم خصوصی، SpeeChin فقط زیر چانه چمباتمه می زند و مستقیماً به صورت کاربر اشاره نمی کند.

در یک آزمایش اولیه روی 20 شرکت‌کننده (10 نفر انگلیسی صحبت می‌کردند، 10 نفر ماندارین)، محققان موقعیت پایه فک‌های آنها را اندازه‌گیری کردند و سپس از تصاویر دیفرانسیل برای آموزش SpeeChin برای تشخیص دستورات ساده استفاده کردند.

10 شرکت کننده انگلیسی زبان در سکوت 54 دستور شامل اعداد، دستورات تعاملی، دستورات دستیار صوتی، دستورات نقطه گذاری و دستورات ناوبری و همچنین 44 فرمان از 10 شرکت کننده دیگر که به زبان ماندارین صحبت می کردند، بیان کردند.

▲ انیمیشن توسط: YouTube@Cornell University

به نظر می رسد که SpeeChin دستورات انگلیسی و ماندارین را به ترتیب با دقت متوسط ​​​​90.5٪ و 91.6٪ تشخیص می دهد. محققان می گویند این دستگاه پتانسیل یادگیری الگوهای گفتار بی صدا افراد را دارد.

محققان همچنین از شش شرکت‌کننده خواستند که 10 عبارت ماندارین و 10 عبارت انگلیسی را در سکوت بیان کنند. این مطالعه میزان موفقیت پایینی داشت، عمدتاً به این دلیل که سر شرکت کنندگان به روش های غیرقابل پیش بینی حرکت می کرد.

چرا تشخیص گفتار بی صدا به صورت گردنبند انجام می شود؟ یکی از محققین هدف از مطالعه خود را بیان کرد:

ما گردنبند را شکلی می‌دانیم که مردم به آن عادت کرده‌اند، نه دستگاه‌های روی گوش، که ممکن است ناراحت‌کننده باشد؛ در مورد صدای بی‌صدا، مردم ممکن است فکر کنند "من قبلاً یک دستگاه تشخیص صدا در تلفنم دارم". اما باید برای برخی افراد و موقعیت‌هایی که نمی‌توانید صحبت کنید.

شایان ذکر است که SpeeChin از نظر ظاهری شبیه NeckFace است. NeckFace، دستگاهی که سال گذشته توسط چنگ ژانگ و تیم آزمایشگاه SciFi او معرفی شد، به طور مداوم حالات چهره را با استفاده از یک دوربین مادون قرمز برای گرفتن تصاویری از فک و صورت زیر گردن و ایجاد بازسازی های سه بعدی از حالت کامل ردیابی می کند.

▲ متحرک از: YouTube@CornellScifiLab

NeckFace می تواند به ویژه در فضای سلامت روان مفید باشد، زیرا خلق و خوی افراد را در طول روز ردیابی می کند. در حالی که افراد همیشه احساسات را در چهره خود نشان نمی دهند، میزان تغییر حالات چهره در طول زمان می تواند نشان دهنده نوسانات خلقی باشد.

از NeckFace می‌توان در سناریوهای دیگر نیز استفاده کرد، مانند جلسات مجازی که گزینه‌های دوربین جلویی گزینه‌ای نیستند، تشخیص حالت چهره در سناریوهای واقعیت مجازی و موارد دیگر.

اگر SpeeChin توسعه بیشتری پیدا کند، موارد استفاده از آن نیز افزایش می‌یابد، از جمله محیط‌هایی که باید ساکت باشند، محیط‌های پر سر و صدا غیرقابل تشخیص و افرادی که مهارت‌های زبانی ندارند.

انگور تنها میوه نیست.

#خوش آمدید به حساب رسمی وی چت آیفانر: آیفانر (وی چت: ifanr) توجه کنید، در اسرع وقت مطالب هیجان انگیزتری برای شما آورده خواهد شد.

لاو فانر | لینک اصلی · مشاهده نظرات · سینا ویبو