2025 оны эхээр OpenAI ChatGPT-ийн зураг үүсгэх боломжийг томоохон хэмжээнд шинэчилж, богино хугацаанд цахим орчинд хүчтэй тархсан шинэ загвараа танилцуулсан. Энэхүү шинэчлэл компанидаа өндөр үр дүн авчирч, ил болсон мэдээллүүдээс харахад сая сая шинэ хэрэглэгч татахад чухал нөлөө үзүүлсэн байна.
Үүний дараа, 2025 оны дөрөвдүгээр сард OpenAI уг технологио хөгжүүлэгчдэд API хэлбэрээр нээж, gpt-image-1 нэртэйгээр ашиглах боломж олгосон. Харин 2025 оны арванхоёрдугаар сард тус компани өмнөх хувилбараасаа мэдэгдэхүйц сайжруулалттай gpt-image-1.5-ыг танилцуулжээ.
Нөгөө талд Google өнгөрсөн оны есдүгээр сараас эхлэн Gemini Nano Banana нэртэй өөрийн зураг үүсгэх загваруудын шугамыг идэвхтэй хөгжүүлж эхэлсэн. Энэ оны эхээр тус компани Nano Banana 2 буюу Gemini 3.1 Flash Image гэгддэг хамгийн сүүлийн үеийн загвараа танилцуулсан бөгөөд энэ нь Nano Banana Pro-той ойролцоо түвшний чанар үзүүлэхийн зэрэгцээ нэмэлт сайжруулалтуудыг агуулж буйгаар онцлог болсон.
Google-ийн өрсөлдөөнд OpenAI шинэ хариу барив
Gemini Nano Banana 2-т өгч буй хариу болгож OpenAI өнөөдөр ChatGPT Images 2-ыг зарлалаа. Шууд дамжуулалтын үеэр гүйцэтгэх захирал Sam Altman болон компанийн баг шинэ системийн боломжуудыг үзүүлсэн байна. Компанийн тайлбарласнаар ChatGPT Images 2 нь текст агуулсан зураг үүсгэхдээ өмнөхөөсөө хавьгүй сайн ажилладаг болжээ. Тухайлбал, хэрэглэгчид одоо macOS интерфейс эсвэл чат цонхны дүрслэл зэрэгт текстэн элементүүдийг илүү нарийвчлалтай гаргах боломжтой болсон байна.
OpenAI мөн Images 2.0 нь өгөгдсөн зааврыг илүү оновчтой дагаж, шаардлагатай деталуудыг алдалгүй хадгалж, жижиг элементүүдийг зөв дүрслэх чадвар нь эрс сайжирсан гэж мэдэгджээ. Үүнд текст, дүрс тэмдэг, интерфейсийн хэсгүүд, төвөгтэй зохиомж, тэр бүү хэл нүдэнд төдийлөн өртөхгүй хэв маягийн өнгө аяс хүртэл багтаж байна. Мөн энэ загвар нь 2K хүртэлх нягтралтай зураг үүсгэх чадвартай бөгөөд 3:1 хэмжээтэй өргөн форматаас 1:3 хэмжээтэй босоо формат хүртэл олон төрлийн харьцааг дэмжиж байгаа аж.
Хоёр хувилбар гарч, “сэтгэх” горимтой загвар ч нэмэгдэв
Introducing ChatGPT Images 2.0
Images 2.0 нь хоёр өөр хувилбартайгаар хэрэглэгчдэд хүрэх юм.
- ChatGPT Images 2.0 Instant
- ChatGPT Images 2.0 Thinking
Хэрэв ChatGPT дээр thinking горим эсвэл Pro тохиргоо сонгогдсон бол Images 2.0 нь хүсэлтийн дагуу интернэтэд холбогдон хамгийн сүүлийн үеийн мэдээлэл авч, илүү нарийвчлалтай зураг бүтээх боломжтой гэжээ. Үүнээс гадна нэг хүсэлтээс хэд хэдэн тусдаа хувилбар гаргаж, эцсийн үр дүнг давхар шалгах чадвартай болсон байна.
Ерөнхийдөө Images 2.0 нь олон хэлний ойлголтыг сайжруулсан бөгөөд латин бус бичвэрүүдийг илүү үнэн зөв дүрслэх чадвараараа онцгой ахиц үзүүлжээ. Ялангуяа япон, солонгос, хятад, хинди, бенгал зэрэг хэл дээрх текстийг өмнөхөөсөө хавьгүй зөв гаргах болсон байна.
API үнэ болон хэрэглэгчдэд нээгдсэн хувилбарууд
Хөгжүүлэгчдэд зориулсан gpt-image-2 загвар API-ээр дараах үнэтэйгээр санал болгогдож байна:
- Оролт: 8.00 ам.доллар
- Кэшлэгдсэн оролт: 2.00 ам.доллар
- Гаралт: 30.00 ам.доллар
ChatGPT Images 2.0-ийн Instant хувилбар аль хэдийн ChatGPT болон Codex-ийн бүх хэрэглэгчдэд нээгдсэн байна. Харин thinking горимтой хувилбар нь одоогоор зөвхөн ChatGPT Plus, Pro болон Business багцын захиалагчдад зориулагджээ.