12 937.160 so‘m

increase

23.970

13 937.200 so‘m

increase

28.400

154.550 so‘m

increase

0.380

12 937.160 so‘m

increase

23.970

3 kun avval
Texnologiya

Qaysi sunʼiy intellekt modeli oʻzbek tilini yaxshiroq tushunadi?

Benchmark testi natijalariga koʻra, Claude 3.5 Sonnet, Gemini 2.0 Pro Experimental va GPT-4o oʻzbek tilini tushunish boʻyicha eng yuqori natijalarga erishdi.

Ularning aniqligi viktorinani yechgan odamlarning oʻrtacha koʻrsatkichidan ham yuqoriroq boʻlgan.

Qaysi sunʼiy intellekt modeli oʻzbek tilini yaxshiroq tushunadi?
Foto: AI / Pinkod.uz

Tahrirchi.uz tomonidan mashhur sunʼiy intellekt modellarining oʻzbek tilini qanchalik yaxshi tushunishi oʻrganib chiqildi. Bu maqsadda loyiha doirasida oʻzbek tilidagi birinchi keng qamrovli Benchmark – UzLiB (Uzbek Linguistic Benchmark) yaratildi.

Benchmarkni yaratishda turli Telegram kanallardagi oʻzbek tili grammatikasi, lugʻati va toʻgʻri qoʻllanilishiga oid bilimni sinovchi viktorinalardan foydalanilgan.

Natijalar qanday boʻldi?

Tadqiqot natijalariga koʻra, tijoriy modellar eng yuqori aniqlikka ega boʻldi. Claude 3.5 Sonnet (63.62%), Gemini 2.0 Pro Experimental (63.03%) va GPT-4o (62.87%) ushbu sinovda yetakchilik qilgan. Ularning natijalari nafaqat sunʼiy intellektlar orasida eng yuqori boʻldi, balki Telegram viktorinalarida qatnashgan insonlarning oʻrtacha aniqlik koʻrsatkichidan (taxminan 59%) ham oʻzib ketdi. 

Shunga qaramay, hatto eng ilgʻor modellar ham test savollarining qariyb 40% ga notoʻgʻri javob bergan. Bu sunʼiy intellekt modellarining oʻzbek tilini tushunishi hali mukammallikdan yiroqligini va yanada chuqur tadqiqotlar va takomillashtirish ishlarini talab qilishini anglatadi. 

Yopiq kodli modellar umumiy hisobda yaxshiroq natija qayd etgan boʻlsa-da, baʼzi ochiq kodli modellar ham eʼtiborga molik natijalarga erishdi. Masalan, Llama 3.1 405B (55.13%) va DeepSeek-V3 (52.98%) Benchmarkda ancha yaxshi ishladi. 

Baʼzi modellar esa sezilarli darajada past natija qayd etgan. Jumladan, Mistral 7B (33.48%), Llama 3.1 8B Uz (31.76%) kabi modellar oʻzbek tilidagi test savollarini tahlil qilishda qiyinchiliklarga duch keldi. 

Pinkod.uz saytida e'lon qilingan materiallardan nusxa ko'chirish, tarqatish va boshqa shakllarda foydalanish faqat tahririyat yozma roziligi bilan amalga oshirilishi mumkin.

O‘zbekiston Respublikasi Prezidenti Administratsiyasi huzuridagi Axborot va ommaviy kommunikatsiyalar agentligi tomonidan 15.10.2024 sanasida №440126 sonli guvohnoma bilan OAV sifatida ro‘yxatga olingan.

© 2025 Pinkod.uz.
Barcha huquqlar himoyalangan.

18+