این محصولات هوش مصنوعی در حال شکستن موانع برای 430 میلیون نفر هستند

ما قبلاً مقاله ای نوشتیم – "دیگر از من نپرسید چرا ناشنوایان به جشنواره های موسیقی می روند" که موقعیت ویژه جشنواره های موسیقی خارج از کشور را محبوب کرد: مترجمان زبان اشاره.

اگرچه افراد کم شنوایی نمی توانند موسیقی را به وضوح بشنوند یا بشنوند، اما می توانند ریتم موسیقی و گرمای فضا را از طریق حرکات دست، حالات چهره و زبان بدن بسیار عفونی مترجمان زبان اشاره احساس کنند.

این ممکن است یک سناریوی غیرمنتظره زبان اشاره برای شنیدن افراد باشد. در واقع، هنوز مکان‌های زیادی وجود دارد که به مترجمان زبان اشاره، چه آنلاین و چه آفلاین، نیاز است، اما تعداد کافی از آنها وجود ندارد.

سالی چالک، انگلیسی، در سال 2002 یک شرکت مترجم زبان اشاره بریتانیا را افتتاح کرد. پس از 20 سال فعالیت، این شرکت به مقیاس قابل توجهی رشد کرده است و زمان رزرو مترجم زبان اشاره به 30 دقیقه کاهش یافته است. هنوز راضی نیست

آیا افراد کم شنوا می توانند به تفسیر زبان اشاره دسترسی فوری داشته باشند، درست مانند روشن کردن زیرنویس در یک وب سایت ویدیویی؟

پاسخ او این است که هوش مصنوعی را درگیر کند.

از آنلاین تا آفلاین، افراد کم شنوا باید اجازه داشته باشند که بیشتر از "زبان مادری" خود استفاده کنند

در سال 2022، سالی چالک یک شرکت جدید به نام Signapse را افتتاح کرد که بر توسعه نرم‌افزار ترجمه زبان اشاره مولد هوش مصنوعی برای ترجمه متن نوشته شده به زبان اشاره آمریکایی و زبان اشاره بریتانیا تمرکز دارد.

در ماه مه امسال، سیگناپس 2 میلیون پوند به عنوان سرمایه اولیه دریافت کرد که 500000 پوند آن از سوی دولت بریتانیا تامین شد.

یکی از سناریوهای آفلاین که آنها هدف قرار می دهند، مراکز حمل و نقل مانند ایستگاه های قطار و فرودگاه ها است.

فرودگاه بین المللی سینسیناتی/نورترن کنتاکی در ایالات متحده با Signapse همکاری کرده است تا زبان اشاره آمریکایی را بر روی صفحه نمایش دهد تا اطلاعات مربوط به استقبال، امنیت، خروج، ورود و سایر اطلاعات را ارائه دهد.

هوش مصنوعی چگونه کار می کند؟ Signapse بر اساس یک مجموعه داده بزرگ زبان اشاره است و از شبکه‌های متخاصم مولد (GAN) و تکنیک‌های یادگیری عمیق برای ایجاد مفسرهای واقعی زبان اشاره مجازی استفاده می‌کند که تا حد امکان دقیق ترجمه می‌کنند.

این آواتارها بر اساس مترجمان واقعی زبان اشاره هستند و هر بار که به صورت تجاری از آنها استفاده می شود، افراد واقعی دچار کات می شوند.

با توجه به اینکه مقصد فرودگاه، زمان حرکت و شماره پلت فرم اغلب تغییر می‌کند، ترجمه زبان اشاره Signapse را می‌توان با یکپارچه‌سازی با داده‌های ترافیک در زمان واقعی به‌روزرسانی کرد.

در عین حال، Signapse نیازهای آنلاین را نادیده نگرفته است و همچنین ترجمه زبان اشاره را برای وب سایت ها و پخش ویدیو ارائه می دهد.

اگرچه وب‌سایت‌هایی مانند یوتیوب زیرنویس‌های بسته دارند، افراد کم‌شنوا اغلب زبان اشاره را به زیرنویس ترجیح می‌دهند، زیرا زبان اشاره ساختارهای دستوری و عباراتی دارد که مستقل از زبان‌های دیگر است و تجربه آنلاین آنها را بهتر می‌کند.

باید توجه می کردید که هنگام اشاره به زبان اشاره، از زبان اشاره آمریکایی و زبان اشاره انگلیسی استفاده می کنیم. همانطور که زبان های گفتاری و نوشتاری در سراسر جهان غیرقابل درک هستند، زبان اشاره نیز همه جانبه است.

طبق گزارش سازمان ملل، تقریباً 70 میلیون نفر در سراسر جهان از زبان اشاره به عنوان شکل اصلی ارتباط خود استفاده می کنند و بیش از 300 نوع مختلف از زبان اشاره در سراسر جهان استفاده می شود. تنها در ایالات متحده، 500000 نفر از زبان اشاره آمریکایی استفاده می کنند.

بنابراین، کاری که Signapse در حال حاضر انجام می دهد، در واقع بسیار محدود است و تنها تعداد کمی از افرادی که از زبان اشاره آمریکایی و بریتانیایی استفاده می کنند، و سناریوهای عمودی محدود را پوشش می دهد. در طول دو سال گذشته، Signapse هر روز حدود 5000 اعلان ترافیک انگلیسی زبان اشاره ایجاد کرده است.

Signapse امیدوار است که در آینده خدمات آنها جهانی تر شود، به آموزش و سایر سناریوها گسترش یابد و همچنین شخصی تر شود و به کاربران اجازه دهد ظاهر مترجمان مجازی زبان اشاره را سفارشی کنند.

محیط و شرایط از هوش مصنوعی پشتیبانی می کند و تولیدکنندگان بزرگ داخلی نیز محصولات مشابه زبان اشاره دارند.

مجریان زبان اشاره هوش مصنوعی در اتاق پخش زنده Honor of Kings Tencent و کنفرانس توسعه دهندگان هواوی ظاهر شده اند.

در المپیک زمستانی 2022، گوینده زبان اشاره هوش مصنوعی به طور مشترک توسط CCTV News و Baidu Intelligent Cloud Xilin راه اندازی شد و دانشکده هوش مصنوعی ناشنوایان دانشگاه صنعتی تیانجین در حاشیه نویسی مطالب زبان اشاره شرکت کرد.

در پشت لنگر زبان اشاره هوش مصنوعی، پلتفرم زبان اشاره هوش مصنوعی بایدو Cloud Xiling نیز می‌تواند نیازهای ترجمه سریع زبان اشاره را در سناریوهای مختلف مانند بیمارستان‌ها، ایستگاه‌ها، بانک‌ها و غیره برآورده کند که همان قهرمان Signapse است.

سفر آرام تر، تجربه تماشای همه جانبه تر، خدمات بدون مانع بیشتر…

اگر فضا برای پیشرفت در تفسیر زبان اشاره عمیق‌تر از دریا باشد، حداقل روشی که افراد کم‌شنوا به اطلاعات عمومی دست می‌یابند توسط هوش مصنوعی تغییر می‌کند و امواج مرئی همچنان بالا می‌آیند.

مردم دولینگو در دنیای زبان اشاره

آیا افراد کم شنوا نیز نیاز به «گوش دادن» به موسیقی دارند؟ آیا خواندن متن برای افراد کم شنوا کافی است؟ این یک مشکل معمولی است که از منظر شنیدن منطق مردم در نظر گرفته می شود.

در واقع باید برعکس بپرسیم: افراد کم شنوا چگونه می توانند حس شرکت در جشنواره های موسیقی را نیز داشته باشند؟ چگونه اینترنت می تواند گشت و گذار را برای افراد کم شنوا لذت بخش تر کند؟

بنابراین، این نیست که یک صفحه نمایش اضافی در یک ایستگاه شلوغ وجود داشته باشد، بلکه باید صفحه نمایش آنجا باشد.

شرکت‌های بیشتری و افراد بیشتری از قدرت فناوری استفاده می‌کنند تا زبان اشاره را بیشتر و بیشتر مرتبط کنند.

اجازه دادن به افراد شنوا برای یادگیری زبان اشاره یکی از ایده های ساده تر برای فکر کردن است.

PopSign یک برنامه برای یادگیری زبان اشاره در حین بازی است و به طور مشترک توسط گوگل، موسسه فناوری روچستر و موسسه فناوری جورجیا ساخته شده است کودکان کم شنوایی والدین.

از این درس یاد می گیریم که حفظ کردن کلمات با "رها کردن" شروع می شود و با تسلیم شدن به پایان می رسد، PopSign ویدیوهای خسته کننده زبان اشاره را پخش نمی کند، بلکه از بازی های کوچک برای افزایش علاقه و اعتماد به نفس شما در یادگیری زبان اشاره استفاده می کند Duolingo، که دیوانه‌وار از شما می‌خواهد که وارد شوید.

همچنین یک شرکت آمریکایی به نام SLAIT وجود دارد که می‌خواهد «دولینگو» در دنیای زبان اشاره باشد. آنها همچنین دوره‌ها و آزمون‌های تعاملی همهجانبه‌ای را ارائه می‌کنند، اگر آن را درست انجام دهید، معلم هوش مصنوعی به شما بازخورد در زمان واقعی می‌دهد و مقدار مناسبی از ارزش احساسی را ارائه می‌دهد.

با این حال، آموزش زبان اشاره تنها دومین گزینه برتر برای SLAIT است.

اما تهیه یک وعده غذایی بدون برنج، یک تیم کوچک بدون داده یا بودجه کافی است، در مقایسه با ترجمه مستقیم جملات زبان اشاره، آموزش واژگان زبان اشاره ساده تر است.

کار سخت تفسیر زبان اشاره به غول های ثروتمند سپرده شده است.

در آگوست 2023، لنوو برزیل یک برنامه ترجمه چت بی‌درنگ مبتنی بر هوش مصنوعی برای ترجمه زبان اشاره پرتغالی توسعه داد و قصد دارد در آینده زبان‌های اشاره بیشتری را در سراسر جهان پوشش دهد.

هنگامی که یک فرد کم شنوا جلوی دوربین دستگاه امضا می کند، الگوریتم فوراً آن را به متن پرتغالی ترجمه می کند و از طرف دیگر برای گیرنده ارسال می کند.

باید تا حد امکان چنین ابزارهایی وجود داشته باشد که مکمل خدمات آموزش زبان اشاره باشد و به افراد کم شنوا اجازه دهد تا موقعیت فعال تری داشته باشند و مبتکران بیشتری برای مکالمه باشند.

گوگل بیشتر محصول محور است و مسابقه تشخیص زبان اشاره Kaggle AI 2023 را راه اندازی کرد.

موضوع این مسابقه بسیار جالب است – شرکت کنندگان یک مدل املای انگشتی می سازند که از دوربین های هوشمند برای ردیابی سریع انگشتان، کف دست ها و صورت ها بر اساس بیش از 3 میلیون کاراکتر املای انگشتی که از سلفی افراد کم شنوا به دست آمده است، استفاده می کند.

املای انگشتی نوعی زبان اشاره است که از اشکال و موقعیت های مختلف انگشتان برای نشان دادن حروف استفاده می کند. برای بسیاری از افراد دارای معلولیت، املای انگشت بسیار سریعتر از تایپ روی صفحه کلید مجازی گوشی هوشمند است.

بنابراین، بهبود تشخیص زبان اشاره و ساختن مدل‌های املای انگشتی این است که به افراد کم‌شنوا اجازه می‌دهد به‌جای تایپ کردن و صحبت کردن، مستقیماً از زبان اشاره که در آن بهتر هستند استفاده کنند و از عملکردهایی مانند جستجو، نقشه‌ها و پیام‌های متنی در تلفن همراه خود استفاده کنند. تلفن ها

علاوه بر این، این به توسعه برنامه‌های زبان اشاره به گفتار نیز کمک می‌کند و از بن‌بست افراد کم‌شنوا که قادر به استفاده از صدا برای احضار دستیارهای دیجیتال نیستند، کمک می‌کند.

به عبارت دیگر، بسیاری از محصولات صوتی از ابتدا به کاربرانی توجه نکرده اند که در صحبت کردن خوب نیستند.

سام سپه، مدیر ارشد محصولات تحقیقاتی دسترسی در گوگل، در مصاحبه ای با فوربس اشاره کرد که هدف آنها این است که زبان اشاره را به یک گزینه زبان جهانی در هنگام استفاده از محصولات گوگل تبدیل کنند.

در واقع، این باید هدف کل اینترنت نیز باشد – تبدیل زبان اشاره به یک زبان جهانی در دنیای دیجیتال.

Duolingo به عنوان یک نرم افزار یادگیری زبان، فرصت های آموزشی برابر را برای همه فراهم می کند. چیزی که محصولات زبان اشاره هوش مصنوعی به مردم احساس می‌کنند این است که محدودیت‌هایی که نباید وجود داشته باشند برداشته شده‌اند و افراد می‌توانند در همه جا با یکدیگر ارتباط برقرار کنند.

هرچه هوش مصنوعی قدرتمندتر شود، ما باید برای انسانیت بیشتر ارزش قائل شویم

در ماه مه، زمانی که GPT-4o منتشر شد، یک ویدیوی نمایشی بسیار تاثیرگذار بود که به عنوان چشم عمل کرد و به افراد کم بینا اجازه داد تا محیط اطراف را ببینند.

فرد کم بینا از دهان هوش مصنوعی می‌داند که پرچم‌ها بر فراز کاخ باکینگهام به اهتزاز در می‌آیند، اردک‌ها با آرامش در رودخانه بازی می‌کنند و تاکسی در آستانه ورود به گوشه‌های دهانش است.

همانطور که گفته می شود، فناوری درها را به روی دنیای جدیدی باز می کند.

داده های سازمان بهداشت جهانی نشان می دهد که 430 میلیون نفر در سراسر جهان به درمان توانبخشی برای رفع کم شنوایی ناتوان کننده نیاز دارند. تعداد مترجمان زبان اشاره در ایالات متحده کافی نیست، نسبت کاربران کم شنوایی به مترجمان زبان اشاره آمریکایی تقریباً 50 به 1 است.

بنابراین در حال حاضر، زبان اشاره هوش مصنوعی تنها نقش مکمل و نقش مهمی را ایفا می کند و هنوز در نقطه "دزدیدن مشاغل" قرار نگرفته است.

محصولات زبان اشاره هوش مصنوعی که در بالا ذکر شد اساساً در مقیاس کوچک، عمودی و ریشه در مناطق خاصی هستند و عدم دسترسی مترجمان انسانی را جبران می‌کنند.

ماه گذشته، من همچنین یک محصول جالب با زبان اشاره هوش مصنوعی را دیدم.

محققان چندین دانشگاه، از جمله دانشگاه راتگرز و دانشگاه کارنگی ملون، ویدئوهای زبان اشاره عمومی را در یک مجموعه داده شامل 8 زبان اشاره پردازش کردند و SignLLM، اولین مدل تولید زبان اشاره چند زبانه را آموزش دادند.

این زبان‌های اشاره مختلفی را پوشش می‌دهد و می‌تواند زبان‌های اشاره را از طریق کلمات متنی ایجاد کند، آیا این خیلی راحت نیست؟ با این حال، محققان گفتند که دنیای خارج نباید نتایج تحقیقات آنها را اغراق کند.

در عین حال، برخی از متخصصان کم شنوایی نیز آمده اند و می گویند که کیفیت ترجمه زبان اشاره در این فیلم ها متفاوت است، برخی از آنها کاملاً غیرقابل درک هستند و این پروژه دارای پتانسیل هایی است نیاز به بهبود دارد.

مهمترین چیز این است که به کاربران کم شنوایی اجازه مشارکت، بیان نظرات و بهبود مشترک محصول داده شود، زیرا "بدون مشارکت ما، هیچ تصمیمی در مورد ما وجود نخواهد داشت."

یک احساس ظریف این است که "سکسی" کردن محصولات بدون مانع دشوار به نظر می رسد.

آنها اغلب به اندازه عرضه مدل‌های بزرگ و سخت‌افزارهای هوش مصنوعی هیجان‌انگیز نیستند.

و از نظر سرمایه گذاری خطرپذیر، آنها نیز جایگاه ویژه ای دارند، پتانسیل ناشناخته ای دارند و ممکن است بازگشت سرمایه نداشته باشند.

اما «مادری هوش مصنوعی» لی فیفی یک بار گفت که هوش مصنوعی برای کمک به مردم است، هر چه هوش مصنوعی قوی‌تر باشد، باید انسانیت را بیشتر گرامی بداریم.

همه نباید از از دست دادن یک پرواز بترسند، همه باید بتوانند با محصولات ارتباط برقرار کنند و همه باید از جشنواره های موسیقی لذت ببرند.

آن چیزهایی که زمانی نامرئی و ناشنیده بودند نیز باید با نور فناوری روشن شوند. بیایید انگشتانمان را با طنین بشکافیم تا نیازهای مردم بیشتر برآورده شود، توانایی های افراد بیشتر شود، تا بتوانیم بیشتر به دست آوریم و کمتر ضرر کنیم.

مانند یخبندان پاییزی تیز است و می تواند بلایای بد را دفع کند. ایمیل کاری: [email protected]

# خوش آمدید به دنبال حساب عمومی رسمی وی چت Aifaner: Aifaner (شناسه WeChat: ifanr در اسرع وقت در اختیار شما قرار خواهد گرفت).

Ai Faner |. لینک اصلی · مشاهده نظرات · Sina Weibo