2025 оны арванхоёрдугаар сарын үнэлгээ: Grok бизнесийн чатботуудын шинэ стандарт болов
2025 оны арванхоёрдугаар сард гарсан хиймэл оюун ухааны найдвартай байдлын зэрэглэлээр Илон Маскийн xAI компанийн Grok загвар бизнесийн хэрэгцээнд зориулагдсан чатботуудын дундаас хамгийн найдвартайд тооцогдлоо.
Relum аналитик компанийн хийсэн судалгаанд зах зээлд тэргүүлж буй арван том мэдрэлийн сүлжээг бизнесийн бодит даалгаварт ашиглах үед гаргадаг “хий үзэгдэл” буюу бодит бус, буруу мэдээлэл үүсгэх давтамжаар нь харьцуулан дүгнэжээ.
Grok – 8% алдаатай, ChatGPT ба Gemini – хэд дахин өндөр эрсдэлтэй
Судалгааны дүнгээс үзэхэд Grok хамгийн бага алдаатай загвар болж, буруу буюу бодит эх сурвалжгүй мэдээлэл өгөх түвшин нь ердөө 8 хувь байсан.
Үүний зэрэгцээ:
- OpenAI-ийн ChatGPT ойролцоогоор 35 хувийн алдааны түвшинтэй,
- Google-ийн Gemini 40 хувиас дээш алдаатай,
- Microsoft Copilot 27 хувь орчим буруу хариулт өгсөн үзүүлэлттэй гарчээ.
Найдвартай байдлаар тохиромжтой гүйцэтгэл үзүүлсэн бусад загваруудад Хятадын DeepSeek (14%), хайлтын суурьтай Perplexity (13%), мөн Claude (17%) зэрэг үйлчилгээ багтсан байна. Эдгээрийн хувьд алдааны хувь өндөр загваруудаас мэдэгдэхүйц бага байгаа ч Grok-оос давсангүй.
Яагаад энэ рейтинг бизнесүүдэд шууд нөлөөтэй вэ?
Мэргэжилтнүүдийн тайлбарласнаар, хиймэл оюун ухааны хариултын бодит нарийвчлал нь бизнесийн орчинд гол шийдвэрийн хүчин зүйл болж эхэлжээ. АНУ-ын компаниудын 65 гаруй хувь нь аль хэдийн AI-г өдөр тутмын ажиллагаандаа нэгтгэсэн бөгөөд энэ хувьцаа цаашид өсөх төлөвтэй байна.
Үүний зэрэгцээ байгууллагууд “хамгийн ухаалаг” эсвэл “хамгийн алдартай” загварыг сонгохоос илүү “хамгийн бага алдаа гаргадаг, бодит мэдээлэлд суурилсан” системийг илүүд үзэх хандлагатай болж байна. Хуулийн, санхүүгийн, эрсдэлийн, стратегийн шийдвэрүүдийг AI-д тулгуурлан гаргаж эхэлж буй нөхцөлд нэг тодорхой буруу хариулт ч хавсарсан зардал, итгэлцэл, нэр хүндийн эрсдэлийг дагуулж болох тул найдвартай байдлын ийм рейтингүүд стратегийн ач холбогдолтой үзүүлэлт болж хувирч байна.
Ийнхүү Grok-оос эхлээд DeepSeek, Perplexity, Claude зэрэг харьцангуй найдвартай загварууд бизнесийн AI зах зээл дээр илүү их анхаарал татаж, харин алдааны хувь өндөртэй ChatGPT, Gemini зэрэг загваруудыг ашиглах байгууллагууд бодит эрсдэлийн өртөг, ашигт ажиллагааны тэнцвэрийг илүү нягт тооцоолох шаардлагатай болж байна.






Хиймэл оюун ухаан ийм хурдтай хөгжиж байгаад гайхаж байна
Аль систем нь бодит амьдралд илүү хэрэгтэй вэ гэдэг л чухал