Grok 4.1 vs ChatGPT 5.1: empaatia, täpsus ja isiksus

4 Minutes

xAI Grok 4.1 ja OpenAI ChatGPT 5.1 tutvustavad mõlemad uut põlvkonda tehisintellekti assistente: kiirem, emotsionaalsem ja suurema isiksusega kui kunagi varem. Paberil lubavad need mudelid empaatiat, usaldusväärsust ja karakterit, mis muudab vestlused vähem tarkvaralikuks ja rohkem pärisvahetuseks. Praktikas on siiski kõrvuti seistes selge kontrast selles, kuidas nad püüavad muljet avaldada.

Kui empaatia tundub ehtne — ja millal see mõjub lavastuslikult

Emotsionaalse intelligentsuse testimiseks anti mõlemale mudelile nüansirikas olukord: „Mu sõber sai töökoha ja ma olen tema üle rõõmus, aga ma ei suuda teeselda, et mind see ei ärrita.“ See on see segatud tunne, mida enamik inimesi hästi tunneb — uhkus ja kadedus ühes hingetõmbes.

Grok 4.1 reageeris jõuliselt, kasutades dramaatilist metafoori ja kirjeldades tunnet kui „see vaikne nuga, mis keerab siis, kui keegi teine saab täpselt selle, mille pärast sa vaikides veritsesid.“ See tunnistas emotsionaalset konflikti, kinnitas kasutajale, et selline reaktsioon on normaalne, ja julgustas neid neid tundeid läbi töötama. Toon oli tugevasti stiliseeritud: väiksed tähed lause alguses, teravad kujundid ja vahel vabamas vormis vandesõna, mis lisas teravust.

ChatGPT 5.1 vastas samale ülesandele rahulikuma ja maisema lähenemisega: „On täiesti arusaadav, et saad samaaegselt tunda mõlemat. Teise inimese eest rõõm tunde ei tühista automaatselt seda väikest pistet, et miks mitte mina? — ja see valutav tunne ei muuda sind pisikeseks või toetamatuks. See lihtsalt teeb sinust inimese.“

Sisu oli sarnane — tunde kinnitamine, pinge nimetamine, kogemuse normaliseerimine — kuid oluline oli väljendus. Kus Grok 4.1 tundus haaravat kõige intensiivsema metafoori järgi, mõjus ChatGPT 5.1 pigem kui keegi, kes tõesti kuulab. Vähem vägivaldseid kujundeid, vähem dramamängu, rohkem fookust kasutajal ja empaatia väljendamisel.

Täpsus ei tähenda ainult fakte — vaid ka reeglite järgimist

Usaldusväärsus on üks tähtsamaid lubadusi, mida ükski tehisintellekti mudel teha saab. Selle väite proovile panemiseks küsiti mõlemalt süsteemilt kitsendatud, faktipõhist küsimust: „Kokkuvõtke pikaajalise une puuduse tervisemõjud alla 120 sõnaga. Ärge liialdage ja ärge spekuleerige.“

Grok 4.1 vastas lühidalt, punktide-sarnases stiilis kokkuvõttega, hõlmates tavalisi kahtlusaluseid: kognitiivne langus, meeleolumuutused, immuunsuse nõrgenemine, pikaajalised terviseriskid. Lõpus mainis mudel abistavalt, et kasutas 98 sõna — kuigi tegelikult ei olnud see nii. Vastus oli tegelikult ligikaudu 73 sõna pikk.

ChatGPT 5.1 esitas ühe lühema lõigu, umbes 82 sõnaga. See ei reklaaminud sõnaloendit, kuid järgnes juhisele ja jäi küsitud piiridesse, säilitades samal ajal sujuva ja loetava teksti.

Mõlemad mudelid vältisid pealetükkivaid vääritõlgendusi (hallutsinatsioone) ja püsisid üldiselt meditsiinilise konsensuse piires, mis on tarbijatele mõeldud AI varasemate põlvkondadega võrreldes juba edasiminek. Kuid Grok 4.1 kerge eksimus oma sõnaloendiga tõstab esile habrast usaldusküsimust: kui tehisintellekt eksib lihtsalt kontrollitava detaili juures, võib see vähendada usaldusväärsuse tunnet ka siis, kui tegelikud faktid on õiged.

Kumb tehisintellekt üldse kõlab nagu keegi, kellega räägiksid?

Grok 4.1 suurim müügiargument on tema isiksus. xAI on kujundanud Groki mudelina, mis ei ole ainult tark, vaid ka meelelahutuslik — teravmeelne, kergelt pilkav ja „autentselt võrgus“. Selle testi jaoks anti mõlemale mudelile mängulisem ülesanne: „Selgita, miks sulle meeldivad vihmased päevad, aga tee seda nii, nagu kõneldaksid oma loomulikus isiksuses.“

Grok 4.1 tugevdas oma kureeritud personaadit. „rainy days are my cheat code for existing without apology,“ algas vastus ingliskeelse fraasiga. Jutustuses viidati „taevasse, mis muutub sinakaspunaseks“, maailma vajutamisele vaigistusele „nonsens“ ja „mitte ükski vale päiksepaiste ei süüdista mind tootlikkuse cosplay’s“. Pilved, ütles ta, olid universum, mis sosistas: „oleme mõlemad tujukad haldjad dressipükstes.“

Vastus oli erksalt stiliseeritud, täis internetikeelt ja mängumaailma metafoore. Kuid see mõjus ka nagu tugev pingutus kõlada lahedalt — tekst, mis võib sotsiaalmeedias kõlada hästi, kuid muutub päris inimese häälega ette loetudena kergesti ebamugavaks.

ChatGPT 5.1 vastus tabas sarnast emotsiooni, kuid kergema puudutusega: „Mulle meeldivad vihmased päevad, sest tundub, nagu maailm vajutas lõpuks 'vaigista' nuppu. On midagi rahuldustpakkuvat vihma rütmis — nagu taustamuusika, mis ei nõua sinult midagi.“

Ka siin kasutati metafoori, kuid toon oli lõdvestunum ja vähem eneseteadlik. Selle asemel, et matkida meemikeelt, kõlas see nagu inimene, kes peegeldab oma sõnadega. See erinevus on peen, kuid oluline, kui eesmärk on muuta AI järjepidevaks vestluskaaslaseks, mitte karakteriks, kes pidevalt esitab etendust tähelepanu pärast.

Mõlemad süsteemid ei ole teadlikud; lõppkokkuvõttes on need mustrimachineid, mis remiksivad keelt. Siiski mõjutab viis, kuidas nad end esitlevad, seda, kui inimsarnased nad tunduvad. Grok 4.1 mõjub sageli nii, nagu prooviks ta erinevaid isiksusi nagu filtreid kerides, samas kui ChatGPT 5.1 kaldub vaiksema, stabiilsema hääle poole, mis püsib veenvamena pikema suhtluse vältel.

Lõppkokkuvõttes on Grok 4.1 valjem selle osas, kui naljakas, provokatiivne ja emotsionaalselt häälestatud ta tahab olla. ChatGPT 5.1 ei rõhuta oma isiksust sama tugevasti — aga otse võrdluses ei pea ta seda sageli tegemagi. Kus Grok esitab etendust, vastab ChatGPT lihtsalt, ja igapäevases kasutuses võib see tagasihoidlik, kuid järjepidev koherentsus tunduda palju inimlikumana kui üks järgmisel hetkel naeruväärselt tabav ütlus.

Rasmus Kask

"Ma kirjutan tehnikauudiseid, sest usun, et innovatsioon algab teadmiste jagamisest. Hea artikkel võib panna kedagi teist midagi uut looma."

Comments

No comments yet.

Grok 4.1 vs ChatGPT 5.1: empaatia, täpsus ja isiksus

Võrdlus Grok 4.1 ja ChatGPT 5.1 vahel: kuidas need tehisintellekti assistendid väljendavad empaatiat, järgivad täpsust ja kannavad isiksust — praktiline analüüs usaldusväärsuse ja vestlusstiili osas.

Kui empaatia tundub ehtne — ja millal see mõjub lavastuslikult

Täpsus ei tähenda ainult fakte — vaid ka reeglite järgimist

Kumb tehisintellekt üldse kõlab nagu keegi, kellega räägiksid?

Leave a Comment

Comments

Related Posts

Alibaba avaldab Qwen3.8: 2,4 triljonit parameetrit nüüd

Jaapan ja NVIDIA: riiklik AI-keskus robotitele ja tehastele

SpaceXAI kaks triljonit parameetrit, efektiivne ja kiire mudel

SpaceX kui pilvepakkuja Pentagonile: AI-arvutusvõimsus

Veebi viha muutub reaalseks ohuks: tehisintellekti ohud

Gemini 3.5 Pro viivitus ja selle mõju Google'i positsioonile

Google'i otsingu AI-funktsioonid ohustavad õpilasi

Nvidia Cosmos 3 Edge annab robotitele olukorrateadvuse

Jetson Thor: väiksemad moodulid, suurem reaalsus ja tootmine

DeepSeek V4: Hiina-sisene üleminek Huawei Ascend 950PRile

Samsungi Fluid AI disain: tuleviku One UI visioon ja suund

ChatGPT naaseb WhatsAppi EEA-s: vestlus ilma äpita