ما قبلاً مقاله ای نوشتیم – "دیگر از من نپرسید چرا ناشنوایان به جشنواره های موسیقی می روند" که موقعیت ویژه جشنواره های موسیقی خارج از کشور را محبوب کرد: مترجمان زبان اشاره.
اگرچه افراد کم شنوایی نمی توانند موسیقی را به وضوح بشنوند یا بشنوند، اما می توانند ریتم موسیقی و گرمای فضا را از طریق حرکات دست، حالات چهره و زبان بدن بسیار عفونی مترجمان زبان اشاره احساس کنند.
این ممکن است یک سناریوی غیرمنتظره زبان اشاره برای شنیدن افراد باشد. در واقع، هنوز مکانهای زیادی وجود دارد که به مترجمان زبان اشاره، چه آنلاین و چه آفلاین، نیاز است، اما تعداد کافی از آنها وجود ندارد.
سالی چالک، انگلیسی، در سال 2002 یک شرکت مترجم زبان اشاره بریتانیا را افتتاح کرد. پس از 20 سال فعالیت، این شرکت به مقیاس قابل توجهی رشد کرده است و زمان رزرو مترجم زبان اشاره به 30 دقیقه کاهش یافته است. هنوز راضی نیست
آیا افراد کم شنوا می توانند به تفسیر زبان اشاره دسترسی فوری داشته باشند، درست مانند روشن کردن زیرنویس در یک وب سایت ویدیویی؟
پاسخ او این است که هوش مصنوعی را درگیر کند.
از آنلاین تا آفلاین، افراد کم شنوا باید اجازه داشته باشند که بیشتر از "زبان مادری" خود استفاده کنند
در سال 2022، سالی چالک یک شرکت جدید به نام Signapse را افتتاح کرد که بر توسعه نرمافزار ترجمه زبان اشاره مولد هوش مصنوعی برای ترجمه متن نوشته شده به زبان اشاره آمریکایی و زبان اشاره بریتانیا تمرکز دارد.
در ماه مه امسال، سیگناپس 2 میلیون پوند به عنوان سرمایه اولیه دریافت کرد که 500000 پوند آن از سوی دولت بریتانیا تامین شد.
یکی از سناریوهای آفلاین که آنها هدف قرار می دهند، مراکز حمل و نقل مانند ایستگاه های قطار و فرودگاه ها است.
فرودگاه بین المللی سینسیناتی/نورترن کنتاکی در ایالات متحده با Signapse همکاری کرده است تا زبان اشاره آمریکایی را بر روی صفحه نمایش دهد تا اطلاعات مربوط به استقبال، امنیت، خروج، ورود و سایر اطلاعات را ارائه دهد.
هوش مصنوعی چگونه کار می کند؟ Signapse بر اساس یک مجموعه داده بزرگ زبان اشاره است و از شبکههای متخاصم مولد (GAN) و تکنیکهای یادگیری عمیق برای ایجاد مفسرهای واقعی زبان اشاره مجازی استفاده میکند که تا حد امکان دقیق ترجمه میکنند.
این آواتارها بر اساس مترجمان واقعی زبان اشاره هستند و هر بار که به صورت تجاری از آنها استفاده می شود، افراد واقعی دچار کات می شوند.
با توجه به اینکه مقصد فرودگاه، زمان حرکت و شماره پلت فرم اغلب تغییر میکند، ترجمه زبان اشاره Signapse را میتوان با یکپارچهسازی با دادههای ترافیک در زمان واقعی بهروزرسانی کرد.
در عین حال، Signapse نیازهای آنلاین را نادیده نگرفته است و همچنین ترجمه زبان اشاره را برای وب سایت ها و پخش ویدیو ارائه می دهد.
اگرچه وبسایتهایی مانند یوتیوب زیرنویسهای بسته دارند، افراد کمشنوا اغلب زبان اشاره را به زیرنویس ترجیح میدهند، زیرا زبان اشاره ساختارهای دستوری و عباراتی دارد که مستقل از زبانهای دیگر است و تجربه آنلاین آنها را بهتر میکند.
باید توجه می کردید که هنگام اشاره به زبان اشاره، از زبان اشاره آمریکایی و زبان اشاره انگلیسی استفاده می کنیم. همانطور که زبان های گفتاری و نوشتاری در سراسر جهان غیرقابل درک هستند، زبان اشاره نیز همه جانبه است.
طبق گزارش سازمان ملل، تقریباً 70 میلیون نفر در سراسر جهان از زبان اشاره به عنوان شکل اصلی ارتباط خود استفاده می کنند و بیش از 300 نوع مختلف از زبان اشاره در سراسر جهان استفاده می شود. تنها در ایالات متحده، 500000 نفر از زبان اشاره آمریکایی استفاده می کنند.
بنابراین، کاری که Signapse در حال حاضر انجام می دهد، در واقع بسیار محدود است و تنها تعداد کمی از افرادی که از زبان اشاره آمریکایی و بریتانیایی استفاده می کنند، و سناریوهای عمودی محدود را پوشش می دهد. در طول دو سال گذشته، Signapse هر روز حدود 5000 اعلان ترافیک انگلیسی زبان اشاره ایجاد کرده است.
Signapse امیدوار است که در آینده خدمات آنها جهانی تر شود، به آموزش و سایر سناریوها گسترش یابد و همچنین شخصی تر شود و به کاربران اجازه دهد ظاهر مترجمان مجازی زبان اشاره را سفارشی کنند.
محیط و شرایط از هوش مصنوعی پشتیبانی می کند و تولیدکنندگان بزرگ داخلی نیز محصولات مشابه زبان اشاره دارند.
مجریان زبان اشاره هوش مصنوعی در اتاق پخش زنده Honor of Kings Tencent و کنفرانس توسعه دهندگان هواوی ظاهر شده اند.
در المپیک زمستانی 2022، گوینده زبان اشاره هوش مصنوعی به طور مشترک توسط CCTV News و Baidu Intelligent Cloud Xilin راه اندازی شد و دانشکده هوش مصنوعی ناشنوایان دانشگاه صنعتی تیانجین در حاشیه نویسی مطالب زبان اشاره شرکت کرد.
در پشت لنگر زبان اشاره هوش مصنوعی، پلتفرم زبان اشاره هوش مصنوعی بایدو Cloud Xiling نیز میتواند نیازهای ترجمه سریع زبان اشاره را در سناریوهای مختلف مانند بیمارستانها، ایستگاهها، بانکها و غیره برآورده کند که همان قهرمان Signapse است.
سفر آرام تر، تجربه تماشای همه جانبه تر، خدمات بدون مانع بیشتر…
اگر فضا برای پیشرفت در تفسیر زبان اشاره عمیقتر از دریا باشد، حداقل روشی که افراد کمشنوا به اطلاعات عمومی دست مییابند توسط هوش مصنوعی تغییر میکند و امواج مرئی همچنان بالا میآیند.
مردم دولینگو در دنیای زبان اشاره
آیا افراد کم شنوا نیز نیاز به «گوش دادن» به موسیقی دارند؟ آیا خواندن متن برای افراد کم شنوا کافی است؟ این یک مشکل معمولی است که از منظر شنیدن منطق مردم در نظر گرفته می شود.
در واقع باید برعکس بپرسیم: افراد کم شنوا چگونه می توانند حس شرکت در جشنواره های موسیقی را نیز داشته باشند؟ چگونه اینترنت می تواند گشت و گذار را برای افراد کم شنوا لذت بخش تر کند؟
بنابراین، این نیست که یک صفحه نمایش اضافی در یک ایستگاه شلوغ وجود داشته باشد، بلکه باید صفحه نمایش آنجا باشد.
شرکتهای بیشتری و افراد بیشتری از قدرت فناوری استفاده میکنند تا زبان اشاره را بیشتر و بیشتر مرتبط کنند.
اجازه دادن به افراد شنوا برای یادگیری زبان اشاره یکی از ایده های ساده تر برای فکر کردن است.
PopSign یک برنامه برای یادگیری زبان اشاره در حین بازی است و به طور مشترک توسط گوگل، موسسه فناوری روچستر و موسسه فناوری جورجیا ساخته شده است کودکان کم شنوایی والدین.
از این درس یاد می گیریم که حفظ کردن کلمات با "رها کردن" شروع می شود و با تسلیم شدن به پایان می رسد، PopSign ویدیوهای خسته کننده زبان اشاره را پخش نمی کند، بلکه از بازی های کوچک برای افزایش علاقه و اعتماد به نفس شما در یادگیری زبان اشاره استفاده می کند Duolingo، که دیوانهوار از شما میخواهد که وارد شوید.
همچنین یک شرکت آمریکایی به نام SLAIT وجود دارد که میخواهد «دولینگو» در دنیای زبان اشاره باشد. آنها همچنین دورهها و آزمونهای تعاملی همهجانبهای را ارائه میکنند، اگر آن را درست انجام دهید، معلم هوش مصنوعی به شما بازخورد در زمان واقعی میدهد و مقدار مناسبی از ارزش احساسی را ارائه میدهد.
با این حال، آموزش زبان اشاره تنها دومین گزینه برتر برای SLAIT است.
اما تهیه یک وعده غذایی بدون برنج، یک تیم کوچک بدون داده یا بودجه کافی است، در مقایسه با ترجمه مستقیم جملات زبان اشاره، آموزش واژگان زبان اشاره ساده تر است.
کار سخت تفسیر زبان اشاره به غول های ثروتمند سپرده شده است.
در آگوست 2023، لنوو برزیل یک برنامه ترجمه چت بیدرنگ مبتنی بر هوش مصنوعی برای ترجمه زبان اشاره پرتغالی توسعه داد و قصد دارد در آینده زبانهای اشاره بیشتری را در سراسر جهان پوشش دهد.
هنگامی که یک فرد کم شنوا جلوی دوربین دستگاه امضا می کند، الگوریتم فوراً آن را به متن پرتغالی ترجمه می کند و از طرف دیگر برای گیرنده ارسال می کند.
باید تا حد امکان چنین ابزارهایی وجود داشته باشد که مکمل خدمات آموزش زبان اشاره باشد و به افراد کم شنوا اجازه دهد تا موقعیت فعال تری داشته باشند و مبتکران بیشتری برای مکالمه باشند.
گوگل بیشتر محصول محور است و مسابقه تشخیص زبان اشاره Kaggle AI 2023 را راه اندازی کرد.
موضوع این مسابقه بسیار جالب است – شرکت کنندگان یک مدل املای انگشتی می سازند که از دوربین های هوشمند برای ردیابی سریع انگشتان، کف دست ها و صورت ها بر اساس بیش از 3 میلیون کاراکتر املای انگشتی که از سلفی افراد کم شنوا به دست آمده است، استفاده می کند.
املای انگشتی نوعی زبان اشاره است که از اشکال و موقعیت های مختلف انگشتان برای نشان دادن حروف استفاده می کند. برای بسیاری از افراد دارای معلولیت، املای انگشت بسیار سریعتر از تایپ روی صفحه کلید مجازی گوشی هوشمند است.
بنابراین، بهبود تشخیص زبان اشاره و ساختن مدلهای املای انگشتی این است که به افراد کمشنوا اجازه میدهد بهجای تایپ کردن و صحبت کردن، مستقیماً از زبان اشاره که در آن بهتر هستند استفاده کنند و از عملکردهایی مانند جستجو، نقشهها و پیامهای متنی در تلفن همراه خود استفاده کنند. تلفن ها
علاوه بر این، این به توسعه برنامههای زبان اشاره به گفتار نیز کمک میکند و از بنبست افراد کمشنوا که قادر به استفاده از صدا برای احضار دستیارهای دیجیتال نیستند، کمک میکند.
به عبارت دیگر، بسیاری از محصولات صوتی از ابتدا به کاربرانی توجه نکرده اند که در صحبت کردن خوب نیستند.
سام سپه، مدیر ارشد محصولات تحقیقاتی دسترسی در گوگل، در مصاحبه ای با فوربس اشاره کرد که هدف آنها این است که زبان اشاره را به یک گزینه زبان جهانی در هنگام استفاده از محصولات گوگل تبدیل کنند.
در واقع، این باید هدف کل اینترنت نیز باشد – تبدیل زبان اشاره به یک زبان جهانی در دنیای دیجیتال.
Duolingo به عنوان یک نرم افزار یادگیری زبان، فرصت های آموزشی برابر را برای همه فراهم می کند. چیزی که محصولات زبان اشاره هوش مصنوعی به مردم احساس میکنند این است که محدودیتهایی که نباید وجود داشته باشند برداشته شدهاند و افراد میتوانند در همه جا با یکدیگر ارتباط برقرار کنند.
هرچه هوش مصنوعی قدرتمندتر شود، ما باید برای انسانیت بیشتر ارزش قائل شویم
در ماه مه، زمانی که GPT-4o منتشر شد، یک ویدیوی نمایشی بسیار تاثیرگذار بود که به عنوان چشم عمل کرد و به افراد کم بینا اجازه داد تا محیط اطراف را ببینند.
فرد کم بینا از دهان هوش مصنوعی میداند که پرچمها بر فراز کاخ باکینگهام به اهتزاز در میآیند، اردکها با آرامش در رودخانه بازی میکنند و تاکسی در آستانه ورود به گوشههای دهانش است.
همانطور که گفته می شود، فناوری درها را به روی دنیای جدیدی باز می کند.
داده های سازمان بهداشت جهانی نشان می دهد که 430 میلیون نفر در سراسر جهان به درمان توانبخشی برای رفع کم شنوایی ناتوان کننده نیاز دارند. تعداد مترجمان زبان اشاره در ایالات متحده کافی نیست، نسبت کاربران کم شنوایی به مترجمان زبان اشاره آمریکایی تقریباً 50 به 1 است.
بنابراین در حال حاضر، زبان اشاره هوش مصنوعی تنها نقش مکمل و نقش مهمی را ایفا می کند و هنوز در نقطه "دزدیدن مشاغل" قرار نگرفته است.
محصولات زبان اشاره هوش مصنوعی که در بالا ذکر شد اساساً در مقیاس کوچک، عمودی و ریشه در مناطق خاصی هستند و عدم دسترسی مترجمان انسانی را جبران میکنند.
ماه گذشته، من همچنین یک محصول جالب با زبان اشاره هوش مصنوعی را دیدم.
محققان چندین دانشگاه، از جمله دانشگاه راتگرز و دانشگاه کارنگی ملون، ویدئوهای زبان اشاره عمومی را در یک مجموعه داده شامل 8 زبان اشاره پردازش کردند و SignLLM، اولین مدل تولید زبان اشاره چند زبانه را آموزش دادند.
این زبانهای اشاره مختلفی را پوشش میدهد و میتواند زبانهای اشاره را از طریق کلمات متنی ایجاد کند، آیا این خیلی راحت نیست؟ با این حال، محققان گفتند که دنیای خارج نباید نتایج تحقیقات آنها را اغراق کند.
در عین حال، برخی از متخصصان کم شنوایی نیز آمده اند و می گویند که کیفیت ترجمه زبان اشاره در این فیلم ها متفاوت است، برخی از آنها کاملاً غیرقابل درک هستند و این پروژه دارای پتانسیل هایی است نیاز به بهبود دارد.
مهمترین چیز این است که به کاربران کم شنوایی اجازه مشارکت، بیان نظرات و بهبود مشترک محصول داده شود، زیرا "بدون مشارکت ما، هیچ تصمیمی در مورد ما وجود نخواهد داشت."
یک احساس ظریف این است که "سکسی" کردن محصولات بدون مانع دشوار به نظر می رسد.
آنها اغلب به اندازه عرضه مدلهای بزرگ و سختافزارهای هوش مصنوعی هیجانانگیز نیستند.
و از نظر سرمایه گذاری خطرپذیر، آنها نیز جایگاه ویژه ای دارند، پتانسیل ناشناخته ای دارند و ممکن است بازگشت سرمایه نداشته باشند.
اما «مادری هوش مصنوعی» لی فیفی یک بار گفت که هوش مصنوعی برای کمک به مردم است، هر چه هوش مصنوعی قویتر باشد، باید انسانیت را بیشتر گرامی بداریم.
همه نباید از از دست دادن یک پرواز بترسند، همه باید بتوانند با محصولات ارتباط برقرار کنند و همه باید از جشنواره های موسیقی لذت ببرند.
آن چیزهایی که زمانی نامرئی و ناشنیده بودند نیز باید با نور فناوری روشن شوند. بیایید انگشتانمان را با طنین بشکافیم تا نیازهای مردم بیشتر برآورده شود، توانایی های افراد بیشتر شود، تا بتوانیم بیشتر به دست آوریم و کمتر ضرر کنیم.
# خوش آمدید به دنبال حساب عمومی رسمی وی چت Aifaner: Aifaner (شناسه WeChat: ifanr در اسرع وقت در اختیار شما قرار خواهد گرفت).
Ai Faner |. لینک اصلی · مشاهده نظرات · Sina Weibo