تصور کنید در یک اتاق کنفرانس یا کتابخانه نشسته اید که می توانید صدای سوزن ها را بشنوید و بگویید "سیری، فردا به هوا نگاه کن" که ممکن است مناسب نباشد.
وقتی فردی نمی تواند صحبت کند یا مجبور است ساکت باشد اما باید به یک دستگاه هوشمند دستورالعمل بدهد، چه باید کرد؟
برای این منظور، چنگ ژانگ، استادیار علوم اطلاعات در دانشگاه کرنل، و رویدونگ ژانگ، دانشجوی دکترا، گردنبندی به نام "Speechin" طراحی کردند .
▲ تصویر از: دانشگاه کرنل
بر اساس حرکات فک، "تصاویری از تغییر شکل پوست گردن و صورت" برای تشخیص زبان بی صدا و در حال حاضر تشخیص عبارات ساده به زبان انگلیسی و چینی می گیرد.
▲ متحرک از: YouTube@Cornell University
دوربین مادون قرمز SpeeChin بر روی یک "قاب گردنبند" چاپ سه بعدی نصب شده است که روی یک زنجیر نقره ای آویزان شده است و دوربین به سمت چانه کاربر نشانه رفته است. برای بهبود پایداری، توسعه دهندگان "بال" را در طرفین طراحی کردند و یک سکه در پایین قرار دادند.
علاوه بر اینها، SpeeChin به ریزپردازنده، باتری و ماژول بلوتوث نیز مجهز است.
▲ تصویر از: دانشگاه کرنل
با استفاده از الگوریتمهای مبتنی بر یادگیری ماشینی، دستگاه میتواند بر اساس حرکات فک کاربر، تعیین کند که پوشنده چه فرمانهایی را بیصدا ادا میکند و آن دستورات را به یک تلفن هوشمند جفت شده ارسال کند، دقیقاً شبیه سیری در شکل دیگری از ارتباط.
برای جلوگیری از مشکلات حریم خصوصی، SpeeChin فقط زیر چانه چمباتمه می زند و مستقیماً به صورت کاربر اشاره نمی کند.
در یک آزمایش اولیه روی 20 شرکتکننده (10 نفر انگلیسی صحبت میکردند، 10 نفر ماندارین)، محققان موقعیت پایه فکهای آنها را اندازهگیری کردند و سپس از تصاویر دیفرانسیل برای آموزش SpeeChin برای تشخیص دستورات ساده استفاده کردند.
10 شرکت کننده انگلیسی زبان در سکوت 54 دستور شامل اعداد، دستورات تعاملی، دستورات دستیار صوتی، دستورات نقطه گذاری و دستورات ناوبری و همچنین 44 فرمان از 10 شرکت کننده دیگر که به زبان ماندارین صحبت می کردند، بیان کردند.
▲ انیمیشن توسط: YouTube@Cornell University
به نظر می رسد که SpeeChin دستورات انگلیسی و ماندارین را به ترتیب با دقت متوسط 90.5٪ و 91.6٪ تشخیص می دهد. محققان می گویند این دستگاه پتانسیل یادگیری الگوهای گفتار بی صدا افراد را دارد.
محققان همچنین از شش شرکتکننده خواستند که 10 عبارت ماندارین و 10 عبارت انگلیسی را در سکوت بیان کنند. این مطالعه میزان موفقیت پایینی داشت، عمدتاً به این دلیل که سر شرکت کنندگان به روش های غیرقابل پیش بینی حرکت می کرد.
چرا تشخیص گفتار بی صدا به صورت گردنبند انجام می شود؟ یکی از محققین هدف از مطالعه خود را بیان کرد:
ما گردنبند را شکلی میدانیم که مردم به آن عادت کردهاند، نه دستگاههای روی گوش، که ممکن است ناراحتکننده باشد؛ در مورد صدای بیصدا، مردم ممکن است فکر کنند "من قبلاً یک دستگاه تشخیص صدا در تلفنم دارم". اما باید برای برخی افراد و موقعیتهایی که نمیتوانید صحبت کنید.
شایان ذکر است که SpeeChin از نظر ظاهری شبیه NeckFace است. NeckFace، دستگاهی که سال گذشته توسط چنگ ژانگ و تیم آزمایشگاه SciFi او معرفی شد، به طور مداوم حالات چهره را با استفاده از یک دوربین مادون قرمز برای گرفتن تصاویری از فک و صورت زیر گردن و ایجاد بازسازی های سه بعدی از حالت کامل ردیابی می کند.
▲ متحرک از: YouTube@CornellScifiLab
NeckFace می تواند به ویژه در فضای سلامت روان مفید باشد، زیرا خلق و خوی افراد را در طول روز ردیابی می کند. در حالی که افراد همیشه احساسات را در چهره خود نشان نمی دهند، میزان تغییر حالات چهره در طول زمان می تواند نشان دهنده نوسانات خلقی باشد.
از NeckFace میتوان در سناریوهای دیگر نیز استفاده کرد، مانند جلسات مجازی که گزینههای دوربین جلویی گزینهای نیستند، تشخیص حالت چهره در سناریوهای واقعیت مجازی و موارد دیگر.
اگر SpeeChin توسعه بیشتری پیدا کند، موارد استفاده از آن نیز افزایش مییابد، از جمله محیطهایی که باید ساکت باشند، محیطهای پر سر و صدا غیرقابل تشخیص و افرادی که مهارتهای زبانی ندارند.
#خوش آمدید به حساب رسمی وی چت آیفانر: آیفانر (وی چت: ifanr) توجه کنید، در اسرع وقت مطالب هیجان انگیزتری برای شما آورده خواهد شد.