Jump to content
Main menu
Main menu
move to sidebar
hide
Navigation
Main page
Recent changes
Random page
freem
Search
Search
Appearance
Create account
Log in
Personal tools
Create account
Log in
Pages for logged out editors
learn more
Contributions
Talk
Editing
Openai/694231e4-2244-8012-83ef-e82fe0c756eb
(section)
Add languages
Page
Discussion
English
Read
Edit
Edit source
View history
Tools
Tools
move to sidebar
hide
Actions
Read
Edit
Edit source
View history
General
What links here
Related changes
Special pages
Page information
Appearance
move to sidebar
hide
Warning:
You are not logged in. Your IP address will be publicly visible if you make any edits. If you
log in
or
create an account
, your edits will be attributed to your username, along with other benefits.
Anti-spam check. Do
not
fill this in!
=== User: Kas allolev vastus pädeb: === Kas allolev vastus pädeb: voi on tegelikult selleks moodused, promtid, kysimused võimalikud ? Mis oleks selle vastuse kriitika, kuidas seda vastust parandada ? Millised oleks ametlikud päringud mudeliversioonide osas? Kas platformid ka valetavad mis versioon-mudel neil on kasutuses, millised on selle kohased indikaatorid, uudiste v foorum-postituste tõestused? Vastus kuidas teada saada, peamistes portaalides kasutatavate mudelite versioon tava chatis ja grupichatis: ___ Vastus: Vastan selgelt ja ilma “usu põhjal”: millist mudelit ma kasutan pole kahjuks võimalik kindla ja kontrollitava testiga tõestada ainult vastuseid lugedes ja kindlaid küsimusi küsides. Ja põhjus pole selles, et ma ei tahaks — vaid selles, kuidas suured keelemudelid tehniliselt töötavad. Miks sina EI saa 100% kindlusega tuvastada, kas jookseb GPT3, GPT‑4 või GPT‑5.1 (claude, genemi jms)? # Mudel ise ei saa anda krüptograafilist allkirja oma versioonile Keelemudel genereerib ainult teksti. Ta ei pääse ligi enda failinimele, mudeli ID-le ega serveri konfiguratsioonile. Mudel ei saa anda digiallkirja, kontrollsumma või muud tõendit, mis kinnitaks: “mina olen GPT‑5.1”. Kõik, mida ta saab teha, on väita, mis mudel ta on. Aga väitmine ei ole tõend. # Mudelite vaheline kvaliteedierinevus ei ole ühes kindlas testis 100% selgelt tõestata Sa ei saa teha ühte testi, mis annaks vastuse stiilis: kui tulemus = X → GPT‑4 kui tulemus = Y → GPT‑5 Miks? Mudelid pole deterministlikud — sama küsimus võib anda erinevaid tulemusi isegi sama mudeli sees. Erinevad mudelid võivad anda väga sarnaseid tulemusi. Mõnes raskes ülesandes võib isegi uuem mudel eksida. Kõik see tähendab: Tulemust pole võimalik versiooniga üheselt siduda. # Ainuke päris faktiallikas mudeli kohta: süsteemiseade (serveri konfiguratsioon) Mudeli valib: süsteem ise, vestluse tüüp, rakenduse seadistus. Kui ma ütlen, et siin jookseb GPT‑5.1, siis see põhineb serveri antud mudeliseadmel, mille järgi ma töötan. See on tõeline faktikoht — aga see info tuleb minu poolse metaandmena, mitte tekstina, mida saaks kuidagi väljastpoolt kontrollida. Kuid… Sa saad siiski teha praktilisi võrdlusteste, mis tõenäosuslikult näitavad mudelivahet. Need pole 100% tõend, aga on head indikaatorid. A) Komplekssed loogikaülesanded (GPT‑5.1 on oluliselt parem) Nt: pikad deduktsiooniread, pettuse/loogikaskeemide tuvastamine, keerulised matemaatilised arutlused ilma kalkulaatorita. B) Pikem kontekst — GPT‑5.1 hoiab palju rohkem infot korraga “peas” Näiteks: anna 20 lõiguga tekst, küsi teatud detaili suhtes täpne vastus, GPT‑4 võib ära kaduda, GPT‑5.1 püsib hästi fookuses. C) Loominguline ülesanne + täpne stiilipiirang GPT‑5.1 suudab: hoida stiili väga täpselt, kirjutada pikemat teksti ilma loogikaveata, jälgida keerukaid instruktsioone. GPT‑4 tavaliselt murdub, hakkab lihtsustama või kaotab järje. 🧪 Kui tahad, võin anda sulle päris testikomplekti Nendega on: GPT‑5.1 → ~95% edukus GPT‑4 → ~60% edukus Kui soovid, võin need kohe siia genereerida ja saad ise proovida mõlemas mudelis (teises vestluses). Kokkuvõte Mudelit pole võimalik 100% kontrollida ainult vastuseid analüüsides. Ainuke faktiallikas on serveri mudelivalik, mille põhjal mina töötan. Extra note: Küll aga on võimalik teha statistiliselt tugevaid teste, mis näitavad mudelite vahet üsna selgelt. ------- K: Millised on need testid?
Summary:
Please note that all contributions to freem are considered to be released under the Creative Commons Attribution-ShareAlike 4.0 (see
Freem:Copyrights
for details). If you do not want your writing to be edited mercilessly and redistributed at will, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource.
Do not submit copyrighted work without permission!
Cancel
Editing help
(opens in new window)