به گزارش تابناک و براساس گزارش هوشیو، این پژوهش، که توسط سازمان Model Evaluation & Threat Research (METR) انجام شده، با معرفی معیار «مدتزمان انجام کار» عملکرد هوش مصنوعی را بر اساس زمانی که برای تکمیل وظایف در مقایسه با انسانها صرف میکند، سنجیده است.
نتایج نشان میدهد که هوش مصنوعی در وظایف کوتاهمدت (کمتر از چهار دقیقه) تقریباً ۱۰۰ درصد موفق است، اما در وظایف بیش از چهار ساعت، موفقیت آن به ۱۰ درصد کاهش مییابد، هرچند مدلهای جدیدتر عملکرد بهتری نسبت به مدلهای قدیمی دارند.
این مطالعه با آزمایش مدلهایی مانند Sonnet ۳.۷، GPT-۴، و Claude ۳ Opus، وظایفی از جستوجوی ساده در ویکیپدیا تا پروژههای پیچیده مانند نوشتن کرنل CUDA یا رفع باگ در PyTorch را بررسی کرد.
ابزارهای تست HCAST و RE-Bench، که شامل وظایف نرمافزاری و پروژههای تحقیقاتی در حوزه یادگیری ماشین و امنیت سایبری هستند، نشان دادند که هوش مصنوعی در مدیریت وظایف پیچیده و چندمرحلهای با سرعت چشمگیری پیشرفت میکند.
پژوهشگران معتقدند که این روند میتواند به خودکارسازی کامل برخی مشاغل تا سال ۲۰۳۲ منجر شود، اما همچنان چالشهایی مانند هماهنگی در وظایف طولانی و پیچیدگیهای دنیای واقعی باقی است.
کارشناسان، از جمله النور واتسون از دانشگاه سینگولاریتی، این معیار را ارزشمند میدانند، زیرا توانایی هوش مصنوعی در حفظ عملکرد منسجم در طول زمان را میسنجد.
واتسون پیشبینی میکند که تا سال ۲۰۲۶، هوش مصنوعی همهفنحریف ظهور خواهد کرد و قادر به مدیریت وظایف متنوع در بازههای زمانی طولانی، مانند برنامهریزی سفر یا مدیریت مالی، خواهد بود.
این پیشرفت میتواند بهرهوری کسبوکارها را افزایش دهد، هزینهها را کاهش دهد و به افراد اجازه دهد بر کارهای خلاقانه تمرکز کنند، اما همزمان نگرانیهایی درباره جایگزینی مشاغل انسانی و تأثیرات اجتماعی آن به وجود آورده است.
سایت تابناک از انتشار نظرات حاوی توهین و افترا و نوشته شده با حروف لاتین (فینگیلیش) معذور است.