Илон Маскийн xAI компани өөрийн хиймэл оюун ухааны загварын шинэ үе болох Grok 4.1-ийг өчигдөр олон нийтэд танилцууллаа. Шинэчлэгдсэн хувилбарыг одоо grok.com сайтаар, мөн X платформ болон iOS, Android гар утасны аппликейшнүүдээр ашиглах боломжтой болсон байна. Систем анхдагчаар Grok 4.1-ийг санал болгож байгаа ч хэрэглэгч хүсвэл гараар сонгон ашиглаж болно.
Сэтгэл хөдлөлийг “мэдэрдэг” шинэ Grok
Grok 4.1-ийн хамгийн том өөрчлөлт нь сэтгэл хөдлөлийн оюун ухаан болон харилцааны байгалийн байдлыг мэдэгдэхүйц сайжруулсан явдал юм. Шинэ хувилбар нь ярилцагчийн сэтгэл санааны өнгө аясыг илүү сайн таньж, урт ярианы туршид логик, уялдаа холбоог алдалгүй барьж, “робот” загварын хүйтэн хэв шинжээс ангид, илүү дулаан, хүний ярианд ойр хариу өгдөг болсон гэж xAI онцолж байна.
Нарийвчлал, найдвартай байдлын хувьд өмнөх үеийн түвшнээ хадгалсан ч харилцааны чанар, өнгө аяс, харилцан ойлголцлын мэдрэмж илүү сайжирсан нь туршилтуудаар батлагджээ.
Сургалтын шинэ арга, хэрэглэгчийн бодит үнэлгээ
Шинэ загварыг бэлтгэхдээ өмнөх сургалтын архитектурыг сайжруулж, хариултыг бодит цаг хугацаанд автоматаар үнэлдэг нэмэлт системүүдийг нэвтрүүлсэн байна. 11 дүгээр сарын 1–14-ний хооронд хийгдсэн хаалттай туршилтын үеэр хэрэглэгчид хуучин хувилбартай нь харьцуулан сонголт хийхэд 64.78 хувь нь Grok 4.1-ийг илүүд үзсэн нь шинэчлэл бодитоор мэдрэгдэж байгааг харуулжээ.
xAI-ийн дурдсанаар Grok 4.1 өдөр тутмын энгийн зөвлөгөөнөөс эхлээд мэдрэмтгий сэдэв, хувь хүний сэтгэл хөдлөл бүхий яриануудад хүртэл илүү ойлгомжтой, хүний харилцаанд дөхөм хандлагатай болж чадсан байна.
Дээд түвшний шалгуур дээрх амжилт
Гүйцэтгэлийн бие даасан үнэлгээний платформууд дээр Grok 4.1 аль хэдийн өндөр байр эзэлж эхэлжээ. LMArena-ийн Текстийн тэргүүлэгчдийн самбарт Grok 4.1 Thinking хувилбар нь 1483 Elo оноотой, энгийн хувилбар нь 1465 оноотойгоор чансааны оройд бичигдсэн байна.
Сэтгэл хөдлөлийн оюун ухааныг онцгойлон хэмждэг EQ-Bench3 тест дээр Grok 4.1 нь 1586 оноо авч, бусад бүх өрсөлдөгч загваруудаасаа давсан үзүүлэлт үзүүлжээ. Энэ нь зөвхөн баримт боловсруулах чадвар бус, хүний сэтгэл хөдлөлийг таних, түүнд тохирсон хариу өгөх тал дээр ч тэргүүлэгчийн байр суурь эзэлж буйг харуулж байна.
“Хүний” мэт харилцаа: жишээгээр илэрхийлбэл
Шинэ хувилбарын ялгаа хэрэглээний түвшинд маш тодорхой харагдаж байна. Жишээлбэл, хэрэглэгч хайртай муураа алдсан тухай гунигтайгаар хуваалцах үед өмнөх хувилбар нь харьцангуй хуурай, стандарт хариу өгдөг байсан бол Grok 4.1 нь өмнөх ярианы нарийн деталийг санаж, тухайн амьтны тухай өмнө ярилцсан зүйлийг дурдаж, сэтгэл хөдлөлийг ойлгож байгааг харуулсан, илүү дулаан, дэмжлэгтэй хариу өгч чадсан байна.
Бүтээлч даалгаврын хувьд ч шинэ Grok X дээр уншигчдыг татахуйц богино текст, сошиал бичлэг, уран сайхны өнгө аястай контентуудыг илүү сонирхолтой, илүү дэс дараатай бүтээж байгааг хөгжүүлэгчид тэмдэглэжээ.
“Хий үзэгдэл” эрс багассан
Хиймэл оюун ухааны салбарын нэг том асуудал болох “хий үзэгдэл” буюу үндэслэлгүй, зохиомол баримт хэлэх алдааг Grok 4.1-д эрс бууруулжээ. Дотоод тестийн үр дүнгээр:
- Алдааны түвшин 12.09 хувиас 4.22 хувь болж буурсан
- Олон нийтэд нээлттэй FActScore хэмжүүр дээр 9.89 хувиас 2.97 хувь болж багассан байна
Өөрөөр хэлбэл, шинэ загвар нь бодит мэдээлэл дээр тулгуурлах, баримтыг гуйвуулахгүй байх тал дээр илт сайжирсан. Мөн өдөр тутмын асуултад урт, тойруу ярихын оронд богино, хэрэгтэй гол мэдээллийг шууд өгөх хандлага нэмэгдсэн нь хэрэглэгчдийн зүгээс өндөр үнэлгээ авч байна.
Дэлхийн тэргүүлэгч загваруудтай шууд өрсөлдөх түвшинд
xAI-ийн мэдээлж буйгаар Grok 4.1 нь өмнөх хувилбарынхаа хурд, нөөцийн үр ашгийг хадгалсан хэвээр хэр нь нарийвчлал, мэдрэмж, харилцааны чанар, баримтын үнэн зөв байдлын нийлбэр дүнгээрээ дэлхийн тэргүүлэх загваруудын эгнээнд шууд орж ирээд байна.
Гүн шинжилгээ, урт ярилцлага, мэдрэмтгий сэдэв, бүтээлч контент гээд олон төрлийн хэрэглээнд Grok 4.1 нь “зүгээр л ухаалаг хариулт өгдөг” систем бус, тодорхой хэмжээнд хүний ярианы хэв маяг, сэтгэл хөдлөлийг ойлгож, уялдаатай харилцдаг шинэ шатны хиймэл оюун ухаан болохоор зорьж буйг энэ шинэчлэлт илтгэж байна.





