DeepSeek versus Chat GPT

AI v matematických súťažiach: DeepSeek vs ChatGPT

V posledných rokoch sme svedkami toho, ako umelá inteligencia dokáže riešiť
zložité matematické problémy, ktoré boli kedysi výlučne doménou ľudí.
Medzi najdiskutovanejšie modely v tejto oblasti patria
DeepSeek-Math-V2 a ChatGPT-4,
ktoré boli testované na viacerých prestížnych matematických súťažiach
a benchmarkoch.

Výkony na olympiádach a súťažiach

DeepSeek-Math-V2 je špecializovaný model optimalizovaný na matematické riešenia
a formálne dôkazy. Naproti tomu ChatGPT-4 je všeobecný jazykový model,
ktorý zvláda široké spektrum úloh, no pri náročných matematických dôkazoch
a kreatívnych úlohách má prirodzené obmedzenia.

Tabuľka výsledkov

Súťaž / Benchmark   Počet úloh   DeepSeek-Math-V2   Výkon DeepSeek   ChatGPT-4   Výkon ChatGPT
IMO 2025   6   5/6   83,3 %   2/6   33,3 %
CMO 2024 (Čína)   6   5–6/6   83,3 %   2/6   33,3 %
Putnam 2024   12   11–12/12   91,7 %   4/12   33,3 %
AMC / AIME   25 / 15   23/25   14/15   92 %  /  93,3 %   18/25   10/15   72 %  /  66,7 %

Interpretácia:
DeepSeek-Math-V2 dosahuje vo viacerých prípadoch výkony porovnateľné
s úrovňou gold-medal level.
ChatGPT-4 podáva priemerný až nadpriemerný výkon,
pričom jeho silnou stránkou je všeobecné uvažovanie a flexibilita,
nie striktne formálne matematické dôkazy.

Budúcnosť: dominancia AI v matematike?

Na základe súčasného vývoja možno realisticky očakávať,
že v horizonte približne nasledujúcich 10 rokov
budú veľké jazykové modely (LLM) schopné riešiť väčšinu matematických problémov.
S rastúcim výpočtovým výkonom, lepšou integráciou
formálnych dôkazových systémov a kvalitnejšími tréningovými dátami
budú AI modely spoľahlivo zvládať aj komplexné dôkazy.

Prečo je LISP vhodný pre matematickú AI?

Zaujímavou a odborne dôležitou úvahou je,
že vývoj špecializovaných systémov na riešenie matematických problémov
by sa mohol výrazne posunúť dopredu,
ak by symbolická a dôkazová vrstva bola implementovaná
v jazykoch typu LISP.

LISP je historicky a konceptuálne prispôsobený manipulácii so symbolickými výrazmi,
rekurziou a stromovými štruktúrami – základnými nástrojmi pre formálne
matematické dôkazy. Mnohé automatické dokazovacie systémy a symbolické
algebraické systémy boli vyvíjané práve v LISPe alebo jeho odnožiach.

Tento jazyk nie je magicky „najlepší“ na svete,
ale je obzvlášť vhodný pre implementáciu matematických algoritmov
a dôkazových procesov. Kombinácia LLM a LISP-like symbolickej vrstvy
by mohla priniesť kvalitatívny skok v schopnostiach AI riešiť
komplexné matematické úlohy. Ide o niečo také ako „Tool enhanced LLM“.

Tip pre čitateľa: Sledujte vývoj LLM v matematike

  • Oficiálne benchmarky a súťaže: IMO, CMO, Putnam, AMC/AIME – často sa objavujú štúdie s AI riešeniami úloh.
  • Výskumné články: ArXiv.org obsahuje publikácie o matematických LLM, symbolických dôkazových systémoch a ich kombinácii.
  • GitHub projekty: Open-source projekty ako DeepSeek-Math, MiniF2F, Lean prover experimenty – umožňujú sledovať konkrétne výsledky a kód.
  • Technologické blogy a mediálne správy: Sledujte vývoj OpenAI, DeepMind a ďalších, kde sa objavujú praktické ukážky riešenia zložitých matematických problémov.
  • Vzdelávacie kurzy: Kurzy o symbolickej matematike, LISP, theorem proving alebo AI for mathematics vám umožnia lepšie pochopiť fungovanie týchto systémov.

Celkové vyhodnotenie:

  • DeepSeek-Math-V2 demonštruje, že špecializované AI modely už dnes dosahujú
    výkony porovnateľné so špičkovými ľudskými riešiteľmi.
  • ChatGPT-4 dosahuje slušné výsledky, no pri zložitých dôkazoch
    zaostáva za špecializovanými matematickými modelmi.
  • Budúcnosť matematiky asi nebude patriť výlučne ľuďom ani výlučne AI,
    ale ich úzkej spolupráci, kde AI bude dominantným nástrojom
    a človek nositeľom významu, intuície a smerovania.

Venezuela má právo predávať ropu komu chce.

23.01.2026

Venezuela je suverénna krajina a má právo samostatne si vyberať svojich partnerov pre spoluprácu, povedal v piatok hovorca čínskeho ministerstva zahraničných vecí Guo Jiakun, keď bol požiadaný o komentár k tvrdeniu amerického predstaviteľa zo štvrtka, že americká vláda umožní Číne nakupovať venezuelskú ropu, ale nie za „podhodnotené“ ceny, za ktoré sa ropa [...]

Ukrajina nechce prevziať padlých vojakov.

18.01.2026

Ukrajina nechce prevziať mŕtve telá vojakov, ktorý padli v boji. Ide o viac ako 6 000 padlých ukrajinských vojakov. Ukrajinci dokonca nechcú prevziať svojich zranených a chorých vojakov. Video:

Grónčania nechcú zlaté papierové doláre.

17.01.2026

Americký prezident Donald Trump sľúbil občanom Grónska, že keď budú súhlasiť s pripojením k USA, tak každý jeden dostane zlaté papierové doláre a to vo výške 100 000. Ale títo ľudia nechcú zlaté papierové doláre, a dokonca ani občianstvo USA, ktoré by po pripojení automaticky dostali. Veď predsa v USA sa bežní ľudia majú dobre a zarábajú zlaté papierové [...]

Robert Fico

Miliarda v čase uťahovania opaskov? Slovensko sa nateraz nepripojí k Trumpovej Rade mieru

28.01.2026 11:44

Nové iniciatívy vo forme záväzkov podľa medzinárodného práva musia byť podľa kabinetu dôkladne posúdené.

Rudolf Huliak

Huliak po prehratom súde s NFŠ: V ďalších sporoch máme veľkú šancu vyhrať

28.01.2026 11:33

V lete 2020 vláda oznámila, že na základe právnych analýz štadión neodkúpi a požadovala vrátenie dotácie.

kamenický

Kamenický po konsolidáciách chystá prorastové opatrenia, už na nich pracuje

28.01.2026 11:10

Musíme upratovať verejné financie po bývalých vládach Matoviča, Hegera a Ódora, povedal minister.

bankomat, peniaze, banka

V Čachticiach nadránom vybuchol bankomat, polícii môžu pomôcť svedkovia

28.01.2026 11:04

Po výbuchu bankomatu vyslala polícia na miesto policajné hliadky, ktoré miesto zabezpečili.

stan021

Masmédia bársčo napíšu a bársčo povedia.

Štatistiky blogu

Počet článkov: 1,056
Celková čítanosť: 3575744x
Priemerná čítanosť článkov: 3386x

Autor blogu

Archív

Odkazy