Grok 4.1: Сэтгэл хөдлөлийг “мэдэрдэг” шинэ үеийн ИИ загвар

Илон Маскийн xAI компани өөрийн хиймэл оюун ухааны загварын шинэ үе болох Grok 4.1-ийг өчигдөр олон нийтэд танилцууллаа. Шинэчлэгдсэн хувилбарыг одоо grok.com сайтаар, мөн X платформ болон iOS, Android гар утасны аппликейшнүүдээр ашиглах боломжтой болсон байна. Систем анхдагчаар Grok 4.1-ийг санал болгож байгаа ч хэрэглэгч хүсвэл гараар сонгон ашиглаж болно.

Сэтгэл хөдлөлийг “мэдэрдэг” шинэ Grok

Grok 4.1-ийн хамгийн том өөрчлөлт нь сэтгэл хөдлөлийн оюун ухаан болон харилцааны байгалийн байдлыг мэдэгдэхүйц сайжруулсан явдал юм. Шинэ хувилбар нь ярилцагчийн сэтгэл санааны өнгө аясыг илүү сайн таньж, урт ярианы туршид логик, уялдаа холбоог алдалгүй барьж, “робот” загварын хүйтэн хэв шинжээс ангид, илүү дулаан, хүний ярианд ойр хариу өгдөг болсон гэж xAI онцолж байна.

Нарийвчлал, найдвартай байдлын хувьд өмнөх үеийн түвшнээ хадгалсан ч харилцааны чанар, өнгө аяс, харилцан ойлголцлын мэдрэмж илүү сайжирсан нь туршилтуудаар батлагджээ.

Сургалтын шинэ арга, хэрэглэгчийн бодит үнэлгээ

Шинэ загварыг бэлтгэхдээ өмнөх сургалтын архитектурыг сайжруулж, хариултыг бодит цаг хугацаанд автоматаар үнэлдэг нэмэлт системүүдийг нэвтрүүлсэн байна. 11 дүгээр сарын 1–14-ний хооронд хийгдсэн хаалттай туршилтын үеэр хэрэглэгчид хуучин хувилбартай нь харьцуулан сонголт хийхэд 64.78 хувь нь Grok 4.1-ийг илүүд үзсэн нь шинэчлэл бодитоор мэдрэгдэж байгааг харуулжээ.

xAI-ийн дурдсанаар Grok 4.1 өдөр тутмын энгийн зөвлөгөөнөөс эхлээд мэдрэмтгий сэдэв, хувь хүний сэтгэл хөдлөл бүхий яриануудад хүртэл илүү ойлгомжтой, хүний харилцаанд дөхөм хандлагатай болж чадсан байна.

Дээд түвшний шалгуур дээрх амжилт

Гүйцэтгэлийн бие даасан үнэлгээний платформууд дээр Grok 4.1 аль хэдийн өндөр байр эзэлж эхэлжээ. LMArena-ийн Текстийн тэргүүлэгчдийн самбарт Grok 4.1 Thinking хувилбар нь 1483 Elo оноотой, энгийн хувилбар нь 1465 оноотойгоор чансааны оройд бичигдсэн байна.

Сэтгэл хөдлөлийн оюун ухааныг онцгойлон хэмждэг EQ-Bench3 тест дээр Grok 4.1 нь 1586 оноо авч, бусад бүх өрсөлдөгч загваруудаасаа давсан үзүүлэлт үзүүлжээ. Энэ нь зөвхөн баримт боловсруулах чадвар бус, хүний сэтгэл хөдлөлийг таних, түүнд тохирсон хариу өгөх тал дээр ч тэргүүлэгчийн байр суурь эзэлж буйг харуулж байна.

“Хүний” мэт харилцаа: жишээгээр илэрхийлбэл

Шинэ хувилбарын ялгаа хэрэглээний түвшинд маш тодорхой харагдаж байна. Жишээлбэл, хэрэглэгч хайртай муураа алдсан тухай гунигтайгаар хуваалцах үед өмнөх хувилбар нь харьцангуй хуурай, стандарт хариу өгдөг байсан бол Grok 4.1 нь өмнөх ярианы нарийн деталийг санаж, тухайн амьтны тухай өмнө ярилцсан зүйлийг дурдаж, сэтгэл хөдлөлийг ойлгож байгааг харуулсан, илүү дулаан, дэмжлэгтэй хариу өгч чадсан байна.

Бүтээлч даалгаврын хувьд ч шинэ Grok X дээр уншигчдыг татахуйц богино текст, сошиал бичлэг, уран сайхны өнгө аястай контентуудыг илүү сонирхолтой, илүү дэс дараатай бүтээж байгааг хөгжүүлэгчид тэмдэглэжээ.

“Хий үзэгдэл” эрс багассан

Хиймэл оюун ухааны салбарын нэг том асуудал болох “хий үзэгдэл” буюу үндэслэлгүй, зохиомол баримт хэлэх алдааг Grok 4.1-д эрс бууруулжээ. Дотоод тестийн үр дүнгээр:

Алдааны түвшин 12.09 хувиас 4.22 хувь болж буурсан
Олон нийтэд нээлттэй FActScore хэмжүүр дээр 9.89 хувиас 2.97 хувь болж багассан байна

Өөрөөр хэлбэл, шинэ загвар нь бодит мэдээлэл дээр тулгуурлах, баримтыг гуйвуулахгүй байх тал дээр илт сайжирсан. Мөн өдөр тутмын асуултад урт, тойруу ярихын оронд богино, хэрэгтэй гол мэдээллийг шууд өгөх хандлага нэмэгдсэн нь хэрэглэгчдийн зүгээс өндөр үнэлгээ авч байна.

Дэлхийн тэргүүлэгч загваруудтай шууд өрсөлдөх түвшинд

xAI-ийн мэдээлж буйгаар Grok 4.1 нь өмнөх хувилбарынхаа хурд, нөөцийн үр ашгийг хадгалсан хэвээр хэр нь нарийвчлал, мэдрэмж, харилцааны чанар, баримтын үнэн зөв байдлын нийлбэр дүнгээрээ дэлхийн тэргүүлэх загваруудын эгнээнд шууд орж ирээд байна.

Гүн шинжилгээ, урт ярилцлага, мэдрэмтгий сэдэв, бүтээлч контент гээд олон төрлийн хэрэглээнд Grok 4.1 нь “зүгээр л ухаалаг хариулт өгдөг” систем бус, тодорхой хэмжээнд хүний ярианы хэв маяг, сэтгэл хөдлөлийг ойлгож, уялдаатай харилцдаг шинэ шатны хиймэл оюун ухаан болохоор зорьж буйг энэ шинэчлэлт илтгэж байна.

Grok 4.1: “Хүнийрхсэн” хиймэл оюун – шинэ түвшинд

Сэтгэл хөдлөлийг “мэдэрдэг” шинэ Grok

Сургалтын шинэ арга, хэрэглэгчийн бодит үнэлгээ

Дээд түвшний шалгуур дээрх амжилт

“Хүний” мэт харилцаа: жишээгээр илэрхийлбэл

“Хий үзэгдэл” эрс багассан

Дэлхийн тэргүүлэгч загваруудтай шууд өрсөлдөх түвшинд

Увсад гэрэл зурагчин ирвэсийг хоёр гүемтэй нь дурандаа буулгажээ

НАСА-гийн анхны эмнэлгийн нүүлгэн шилжүүлэлт: шинэ дэлгэрэнгүй мэдээлэл

2026 оны 3-р сарын 8-нд Т.Ариунаа M Bank Arena-д “International Women’s Day” тусгай тоглолтоо хийнэ

Хараа эрсдэлд: өдөр тутмын энгийн дадал ойрын харааг өдөөдөг байж магадгүй

Увсад гэрэл зурагчин ирвэсийг хоёр гүемтэй нь дурандаа буулгажээ

НАСА-гийн анхны эмнэлгийн нүүлгэн шилжүүлэлт: шинэ дэлгэрэнгүй мэдээлэл

2026 оны 3-р сарын 8-нд Т.Ариунаа M Bank Arena-д “International Women’s Day” тусгай тоглолтоо хийнэ

Хараа эрсдэлд: өдөр тутмын энгийн дадал ойрын харааг өдөөдөг байж магадгүй

ХАРИУ ҮЛДЭЭХ Хариу цуцлах

Редакторын сонголт

Б.Чойжилсүрэн: Увс аймгийн 100 жилийн ойг угтаж миний сайдын багцаас ₮2 тэрбумыг зарцуулсан

“Gangbay” хамтлагийн бие даасан “Касета” тоглолт энэ сарын 24-нд болно

“Вакцин эсэргүүцэгчдийн уршгаар” — Улаанбурхан өвчнөөр өвдсөн хүүхдийн тоо эрс өсөв

Онцлох нийтлэлүүд

The MongolZ — дэлхийн №1 баг ба шинэ ялалт

16 настай охины амь насыг хөнөөсөн хэрэг: Э.Нандин-Эрдэнийн цагдан хориог дахин сунгалаа

НАСА-гийн анхны эмнэлгийн нүүлгэн шилжүүлэлт: шинэ дэлгэрэнгүй мэдээлэл

Алдартай ангилал