
به گزارش سرویس علم و فناوری تابناک، گوگل در تازهترین حرکت خود در حوزه هوش مصنوعی، نسل جدیدی از مدلهای پردازش تصویر و ویدیو را معرفی کرده که با بهرهگیری از معماریهای نوین یادگیری عمیق، قادر است پیچیدهترین و ظریفترین جزئیات بصری را شناسایی و تحلیل کند.
این پیشرفت، مرزهای فناوری بینایی ماشین را جابجا کرده و امکانات بیسابقهای را در اختیار کاربران و کسبوکارها قرار میدهد.
ویژگیهای برجسته فناوری جدید
مدل جدید گوگل توانایی تشخیص دقیق اشیاء در تصاویر و ویدیوها را دارد، حتی در شرایطی که اشیاء مخدوش، نیمه پنهان یا در پس زمینههای شلوغ قرار دارند. این سیستم همچنین قادر است روابط پیچیده بین اشیاء و افراد را در صحنهها درک کند، مثلا تشخیص تعاملات انسانی، حرکات و حتی حالات چهره را با دقت بالا انجام میدهد.
از دیگر ویژگیهای مهم این مدل، توانایی تولید توضیحات متنی دقیق و قابل فهم درباره محتوای ویدیوها است؛ این قابلیت میتواند بهطور خودکار خلاصههایی برای ویدیوهای طولانی تولید کند یا به کاربران کمک کند محتوای ویدیویی را بهتر جستوجو و دستهبندی کنند.
کاربردهای انقلابی در حوزههای مختلف
پزشکی: در تشخیص بیماریها از تصاویر پزشکی مانند MRI و CT Scan، این فناوری میتواند با دقت بیشتری نواحی مشکلدار را شناسایی کند و روند تشخیص و درمان را تسریع بخشد. همچنین در تحلیل تصاویر جراحی زنده، به جراحان کمک میکند تصمیمهای بهتری بگیرند.
امنیت: با امکان تشخیص دقیق چهرهها، حرکات مشکوک و حتی اشیاء خطرناک، این سیستم میتواند در حوزه نظارت و امنیت عمومی تحول ایجاد کند و به نیروهای امنیتی در پیشگیری از جرایم کمک کند.
رسانههای دیجیتال و سرگرمی: کاربران یوتیوب، گوگل فوتوز و پلتفرمهای دیگر میتوانند از قابلیتهای جستجوی پیشرفته و توضیح خودکار ویدیوها بهرهمند شوند. این تکنولوژی به تولیدکنندگان محتوا امکان میدهد به شکلی سادهتر و هوشمندانهتر به مخاطبان خود دسترسی پیدا کنند.
زندگی روزمره: دستیار صوتی گوگل با ترکیب این فناوری قادر خواهد بود محتوای بصری محیط اطراف کاربران را بهتر درک کرده و پاسخهای دقیقتر و کاربردیتری ارائه دهد، مثلا توضیح درباره اشیاء اطراف یا کمک در فعالیتهای روزمره.
چشمانداز آینده
گوگل اعلام کرده که این فناوری به زودی در سرویسهای مختلف این شرکت مانند گوگل فوتوز، یوتیوب، گوگل اسیستنت و سایر محصولاتش ادغام خواهد شد. همچنین توسعهدهندگان میتوانند با استفاده از APIهای ارائهشده، این قابلیتها را در اپلیکیشنها و سرویسهای خود به کار گیرند و تجربه کاربری را به سطحی فراتر ارتقاء دهند.
کارشناسان معتقدند این گام بزرگ گوگل، نه تنها در توسعه هوش مصنوعی بینایی ماشین، بلکه در شکلدهی آینده تعامل انسان با کامپیوترها بسیار تأثیرگذار خواهد بود. با پیشرفت چنین فناوریهایی، دستگاهها دیگر صرفا ابزار نیستند، بلکه همدمهایی هوشمند خواهند شد که واقعاً محیط اطراف ما را «میبینند» و میفهمند.
سایت تابناک از انتشار نظرات حاوی توهین و افترا و نوشته شده با حروف لاتین (فینگیلیش) معذور است.