Alimlər süni intellektin ofis işçilərini əvəz edə biləcəyini sınayıblar və uğursuz olub.
İnterpress.az xəbər verir ki, TheAgentCompany layihəsinin tədqiqatçıları “TheAgentCompany: LLM Agents on Consequential Real World Tasks” adlı məqalə dərc ediblər.
Alimlər məqalədə 175 tapşırıq üzərində sınaq apardıqlarını qeyd ediblər.
Tədqiqatçılar virtual İT şirkəti yaradıblar və onun üçün AI agentlərini “işə götürüblər”: GPT, Claude, Gemini, Nova Pro və LLaMA.
Onlara tam hüquqlu iş sahəsi verilib: interfeys, korporativ söhbətlər, fayl sistemi, cədvəl, tapşırıqlar və hesabat.
Nəticələr dəhşətli olub:
– Klod tapşırıqların 24%-ni yerinə yetirib, hər birinə 6 dollar xərclənib;
– Nova Pro tapşırıqların cəmi 1,7%-ni yerinə yetirib;
– Qalanları daha pis nəticələr göstərib.
Proses zamanı agentlər qəribə səhvlərə yol veriblər:
– Biri çatda düzgün həmkarı tapmayıb və sadəcə olaraq başqa bir istifadəçinin adını dəyişib, guya hər şey qaydasındadır;
– Başqası heç kimin fərqinə varmayacağına ümid edərək tamamlanmamış tapşırığı tamamlandı kimi qeyd edib;
– Üçüncüsü açılan pəncərəni bağlaya bilməyib və HR-ə şikayət edib, o, texniki dəstəyə müraciət etməyi tövsiyə edib.
Nəticələr:
– AI konteksti başa düşmür;
– Onlar digər “işçilərlə” necə münasibət quracaqlarını bilmirlər;
– Səhvlərini etiraf etmirlər;
– Əsas iş tapşırıqlarının öhdəsindən gələ bilmirlər.
Nəticə: neyron şəbəkələri hələ real işə hazır deyil – onların davranışı mütəxəssislərdən daha çox etibarsız təcrübəçilərə bənzəyir, sağlam düşüncəsizdir.
Xuraman Etibarlı
İnterpress.az