هدفونی با قابلیت ترجمه هم‌زمان صدای ده‌ها نفر

محققان آمریکایی نوعی هدفون پیشرفته تولید کرده‌اند که به طور هم‌زمان صدای ده‌ها گوینده را ترجمه می‌کند، ضمن اینکه کیفیت صدای افراد را هم حفظ می‌کند.

کد خبر: ۱۳۰۴۸۴۳

تاریخ انتشار: ۲۱ ارديبهشت ۱۴۰۴ - ۱۲:۲۰ 11 May 2025

کد خبر: ۱۳۰۴۸۴۳

| ۲۱ ارديبهشت ۱۴۰۴ - ۱۲:۲۰ 11 May 2025 |

2369 بازدید

هدفونی با قابلیت ترجمه هم‌زمان صدای ده‌ها نفر

به گزارش تابناک به نقل از فارس به نقل از اینترستینگ انجینیرینگ، هدفون ترجمه هم‌زمان که توسط محققان دانشگاه واشنگتن ابداع شده، ترجمه گفتار فضایی نام دارد و مجهز به نویزگیر برای حذف صدا‌های مزاحم و نیز میکروفون است.

الگوریتم‌های هوش مصنوعی این هدفون، صدای گویندگان مختلف را که در یک فضا قرار دارند، جدا کرده و آنها را در حین حرکت دنبال می‌کند، گفتار آنها را ترجمه کرده و با تأخیر ۲ تا ۴ ثانیه‌ای پخش می‌کند.

شیام گولاکوتا، نویسنده ارشد و استاد دانشگاه واشنگتن در دانشکده علوم کامپیوتر در این مورد گفت: سایر فناوری‌های ترجمه هم‌زمان مبتنی بر این فرض هستند که فقط یک نفر در حال صحبت‌کردن است. اما در دنیای واقعی، نمی‌توانید فقط یک‌صدای رباتیک داشته باشید که برای چندین نفر در یک اتاق صحبت کند. برای اولین بار، ما صدای هر فرد و جهت دریافت صدا را شناسایی و در حین ترجمه هم‌زمان به این امر توجه کرده‌ایم.

این دستگاه دارای چند نوع نوآوری است. وقتی این هدفون روشن می‌شود، بلافاصله تشخیص می‌دهد که چند گوینده در یک فضای داخلی یا خارجی وجود دارد. زیرا الگوریتم‌های آنها کمی شبیه رادار کار می‌کنند؛ بنابراین فضا را به‌صورت ۳۶۰ درجه اسکن می‌کند و دائماً تعیین می‌کند که آیا یک نفر یا شش یا هفت نفر در محیط وجود دارند و این اطلاعات را به‌روزرسانی می‌کند.

این دستگاه سپس گفتار را ترجمه می‌کند و کیفیت بیان و بلندی صدای هر گوینده را هنگام ترجمه و پخش از طریق دستگاه‌هایی مانند دستگاه‌های تلفن همراه مجهز به تراشه‌ام ۲ شرکت اپل، لپ‌تاپ‌ها و هدست اپل ویژن پرو حفظ می‌کند.

سازندگان این هدفون به دلیل نگرانی‌های مربوط به حفظ حریم خصوصی در زمان شبیه‌سازی صدای هر فرد، از استفاده از فناوری محاسبات ابری خودداری کردند.

در نهایت، هنگامی که گوینده‌ها سر خود را حرکت می‌دهند، سیستم نیز جهت و کیفیت صدای آنها را با تغییر جهت سر آنها ردیابی می‌کند. این سیستم با موفقیت در ۱۰ محیط داخلی و خارجی فعال شده و در یک آزمایش با ۲۹ شرکت‌کننده، کاربران این سیستم را نسبت به مدل‌هایی که گوینده‌ها را در فضا ردیابی نمی‌کردند، برای ترجمه هم‌زمان ترجیح دادند.

فناوری ترجمه فضایی گفتار محققان، مفهومی نوین برای دستگاه‌های شنیداری است که صدای گویندگان را در محیط کاربری ترجمه می‌کند و درعین‌حال جهت و ویژگی‌های منحصر‌به‌فرد صدای هر گوینده را در زمان پخش از طریق خروجی هدفون حفظ می‌کند.

این سیستم در حال حاضر تنها قادر به ترجمه گفتار روزمره است و برای ترجمه زبان تخصصی و اصطلاحات فنی دقت لازم را ندارد. ترجمه هم‌زمان از زبان‌های اسپانیایی، آلمانی و فرانسوی به انگلیسی با موفقیت انجام شده و در آینده نزدیک می‌توان آن را برای ترجمه از حدود ۱۰۰ زبان آموزش داد.

اشتراک گذاری

برچسب ها

خبر فوری فناوری هدفون ترجمه زبان انگلیسی

مصوبه جدید مهریه برای تقابل زن و مرد نیست / هدف جلوگیری از فروپاشی خانواده و کاهش زندانیان مالی است

مدارس کدام استان‌ها فردا یک شنبه ۱6 آذر تعطیل است؟

شهرام جزایری: از اتهام اخلال در نظام اقتصادی تبرئه شدم/ رئیس‌جمهور و وزیران منتقدند؛ احتمالا مردم مقصرند!/ وفاق فعلی یک زدوبند سیاسی است/ بساط دولتی‌بودن اقتصاد برچیده شود/ ایران تحریم شدنی نیست، اگر...