هدفونی با قابلیت ترجمه هم‌زمان صدای ده‌ها نفر

محققان آمریکایی نوعی هدفون پیشرفته تولید کرده‌اند که به طور هم‌زمان صدای ده‌ها گوینده را ترجمه می‌کند، ضمن اینکه کیفیت صدای افراد را هم حفظ می‌کند.
کد خبر: ۱۳۰۴۸۴۳
|
۲۱ ارديبهشت ۱۴۰۴ - ۱۲:۲۰ 11 May 2025
|
1374 بازدید

هدفونی با قابلیت ترجمه هم‌زمان صدای ده‌ها نفر

به گزارش تابناک به نقل از فارس به نقل از اینترستینگ انجینیرینگ، هدفون ترجمه هم‌زمان که توسط محققان دانشگاه واشنگتن ابداع شده، ترجمه گفتار فضایی نام دارد و مجهز به نویزگیر برای حذف صدا‌های مزاحم و نیز میکروفون است.

الگوریتم‌های هوش مصنوعی این هدفون، صدای گویندگان مختلف را که در یک فضا قرار دارند، جدا کرده و آنها را در حین حرکت دنبال می‌کند، گفتار آنها را ترجمه کرده و با تأخیر ۲ تا ۴ ثانیه‌ای پخش می‌کند.

شیام گولاکوتا، نویسنده ارشد و استاد دانشگاه واشنگتن در دانشکده علوم کامپیوتر در این مورد گفت: سایر فناوری‌های ترجمه هم‌زمان مبتنی بر این فرض هستند که فقط یک نفر در حال صحبت‌کردن است. اما در دنیای واقعی، نمی‌توانید فقط یک‌صدای رباتیک داشته باشید که برای چندین نفر در یک اتاق صحبت کند. برای اولین بار، ما صدای هر فرد و جهت دریافت صدا را شناسایی و در حین ترجمه هم‌زمان به این امر توجه کرده‌ایم.

این دستگاه دارای چند نوع نوآوری است. وقتی این هدفون روشن می‌شود، بلافاصله تشخیص می‌دهد که چند گوینده در یک فضای داخلی یا خارجی وجود دارد. زیرا الگوریتم‌های آنها کمی شبیه رادار کار می‌کنند؛ بنابراین فضا را به‌صورت ۳۶۰ درجه اسکن می‌کند و دائماً تعیین می‌کند که آیا یک نفر یا شش یا هفت نفر در محیط وجود دارند و این اطلاعات را به‌روزرسانی می‌کند.

این دستگاه سپس گفتار را ترجمه می‌کند و کیفیت بیان و بلندی صدای هر گوینده را هنگام ترجمه و پخش از طریق دستگاه‌هایی مانند دستگاه‌های تلفن همراه مجهز به تراشه‌ام ۲ شرکت اپل، لپ‌تاپ‌ها و هدست اپل ویژن پرو حفظ می‌کند.

سازندگان این هدفون به دلیل نگرانی‌های مربوط به حفظ حریم خصوصی در زمان شبیه‌سازی صدای هر فرد، از استفاده از فناوری محاسبات ابری خودداری کردند.

در نهایت، هنگامی که گوینده‌ها سر خود را حرکت می‌دهند، سیستم نیز جهت و کیفیت صدای آنها را با تغییر جهت سر آنها ردیابی می‌کند. این سیستم با موفقیت در ۱۰ محیط داخلی و خارجی فعال شده و در یک آزمایش با ۲۹ شرکت‌کننده، کاربران این سیستم را نسبت به مدل‌هایی که گوینده‌ها را در فضا ردیابی نمی‌کردند، برای ترجمه هم‌زمان ترجیح دادند.

فناوری ترجمه فضایی گفتار محققان، مفهومی نوین برای دستگاه‌های شنیداری است که صدای گویندگان را در محیط کاربری ترجمه می‌کند و درعین‌حال جهت و ویژگی‌های منحصر‌به‌فرد صدای هر گوینده را در زمان پخش از طریق خروجی هدفون حفظ می‌کند.

این سیستم در حال حاضر تنها قادر به ترجمه گفتار روزمره است و برای ترجمه زبان تخصصی و اصطلاحات فنی دقت لازم را ندارد. ترجمه هم‌زمان از زبان‌های اسپانیایی، آلمانی و فرانسوی به انگلیسی با موفقیت انجام شده و در آینده نزدیک می‌توان آن را برای ترجمه از حدود ۱۰۰ زبان آموزش داد.

تابناک را در شبکه های اجتماعی دنبال کنید

اشتراک گذاری
برچسب ها
تور پاییز ۱۴۰۳ صفحه خبر
بلیط هواپیما
مطالب مرتبط
نظر شما

سایت تابناک از انتشار نظرات حاوی توهین و افترا و نوشته شده با حروف لاتین (فینگیلیش) معذور است.

برچسب منتخب
# قیمت طلا # مذاکره ایران و آمریکا # قیمت سکه # کالابرگ # حقوق بازنشستگان # انفجار بندرعباس
نظرسنجی
آیا از ابزارهای هوش مصنوعی استفاده می کنید؟
نظرسنجی
توافق نهایی ایران و آمریکا تا چه زمانی انجام می شود؟
الی گشت