DeepSeek versus Chat GPT

AI v matematických súťažiach: DeepSeek vs ChatGPT

V posledných rokoch sme svedkami toho, ako umelá inteligencia dokáže riešiť
zložité matematické problémy, ktoré boli kedysi výlučne doménou ľudí.
Medzi najdiskutovanejšie modely v tejto oblasti patria
DeepSeek-Math-V2 a ChatGPT-4,
ktoré boli testované na viacerých prestížnych matematických súťažiach
a benchmarkoch.

Výkony na olympiádach a súťažiach

DeepSeek-Math-V2 je špecializovaný model optimalizovaný na matematické riešenia
a formálne dôkazy. Naproti tomu ChatGPT-4 je všeobecný jazykový model,
ktorý zvláda široké spektrum úloh, no pri náročných matematických dôkazoch
a kreatívnych úlohách má prirodzené obmedzenia.

Tabuľka výsledkov

Súťaž / Benchmark   Počet úloh   DeepSeek-Math-V2   Výkon DeepSeek   ChatGPT-4   Výkon ChatGPT
IMO 2025   6   5/6   83,3 %   2/6   33,3 %
CMO 2024 (Čína)   6   5–6/6   83,3 %   2/6   33,3 %
Putnam 2024   12   11–12/12   91,7 %   4/12   33,3 %
AMC / AIME   25 / 15   23/25   14/15   92 %  /  93,3 %   18/25   10/15   72 %  /  66,7 %

Interpretácia:
DeepSeek-Math-V2 dosahuje vo viacerých prípadoch výkony porovnateľné
s úrovňou gold-medal level.
ChatGPT-4 podáva priemerný až nadpriemerný výkon,
pričom jeho silnou stránkou je všeobecné uvažovanie a flexibilita,
nie striktne formálne matematické dôkazy.

Budúcnosť: dominancia AI v matematike?

Na základe súčasného vývoja možno realisticky očakávať,
že v horizonte približne nasledujúcich 10 rokov
budú veľké jazykové modely (LLM) schopné riešiť väčšinu matematických problémov.
S rastúcim výpočtovým výkonom, lepšou integráciou
formálnych dôkazových systémov a kvalitnejšími tréningovými dátami
budú AI modely spoľahlivo zvládať aj komplexné dôkazy.

Prečo je LISP vhodný pre matematickú AI?

Zaujímavou a odborne dôležitou úvahou je,
že vývoj špecializovaných systémov na riešenie matematických problémov
by sa mohol výrazne posunúť dopredu,
ak by symbolická a dôkazová vrstva bola implementovaná
v jazykoch typu LISP.

LISP je historicky a konceptuálne prispôsobený manipulácii so symbolickými výrazmi,
rekurziou a stromovými štruktúrami – základnými nástrojmi pre formálne
matematické dôkazy. Mnohé automatické dokazovacie systémy a symbolické
algebraické systémy boli vyvíjané práve v LISPe alebo jeho odnožiach.

Tento jazyk nie je magicky „najlepší“ na svete,
ale je obzvlášť vhodný pre implementáciu matematických algoritmov
a dôkazových procesov. Kombinácia LLM a LISP-like symbolickej vrstvy
by mohla priniesť kvalitatívny skok v schopnostiach AI riešiť
komplexné matematické úlohy. Ide o niečo také ako „Tool enhanced LLM“.

Tip pre čitateľa: Sledujte vývoj LLM v matematike

  • Oficiálne benchmarky a súťaže: IMO, CMO, Putnam, AMC/AIME – často sa objavujú štúdie s AI riešeniami úloh.
  • Výskumné články: ArXiv.org obsahuje publikácie o matematických LLM, symbolických dôkazových systémoch a ich kombinácii.
  • GitHub projekty: Open-source projekty ako DeepSeek-Math, MiniF2F, Lean prover experimenty – umožňujú sledovať konkrétne výsledky a kód.
  • Technologické blogy a mediálne správy: Sledujte vývoj OpenAI, DeepMind a ďalších, kde sa objavujú praktické ukážky riešenia zložitých matematických problémov.
  • Vzdelávacie kurzy: Kurzy o symbolickej matematike, LISP, theorem proving alebo AI for mathematics vám umožnia lepšie pochopiť fungovanie týchto systémov.

Celkové vyhodnotenie:

  • DeepSeek-Math-V2 demonštruje, že špecializované AI modely už dnes dosahujú
    výkony porovnateľné so špičkovými ľudskými riešiteľmi.
  • ChatGPT-4 dosahuje slušné výsledky, no pri zložitých dôkazoch
    zaostáva za špecializovanými matematickými modelmi.
  • Budúcnosť matematiky asi nebude patriť výlučne ľuďom ani výlučne AI,
    ale ich úzkej spolupráci, kde AI bude dominantným nástrojom
    a človek nositeľom významu, intuície a smerovania.

Čína bojuje proti dezinformáciam, ktoré vytvorila umelá inteligencia.

15.12.2025

Umelá inteligencia (AI), hlboká syntéza a ďalšie vznikajúce technológie sa rýchlo rozvíjajú a zohrávajú čoraz dôležitejšiu úlohu pri podpore nových kvalitných produktívnych síl a poháňaní vysokokvalitného hospodárskeho a sociálneho rozvoja, pričom zároveň prinášajú veľké pohodlie do každodenného života. Tieto technológie sa však zneužívajú aj na [...]

Ako sa žije bežnému američanovi v Amerike v súčasnosti.

10.12.2025

Ameriku zachvátila vlna chudoby. Čo bolo niekedy nemysliteľné, je dnes skutočnosťou. Bežní američania majú problémy vôbec vyžiť zo svojích príjmov. Ako je to možné, že najvyspelejšia a ekonomicky najsilnejšia krajina sveta má také problémy ako krajiny rozvojového sveta? Video o tomto probléme:

Rusko je na kolenách a prehrá vojnu s Ukrajinou.

09.12.2025

Niektoré média tvrdia, že stačí ešte počkať nejaký čas a RF sa ekonomicky zrúti a nedokáže bojovať ďalej s Ukrajinou. Ja by som tomu akože rozumel, ale nerozumiem tomu, prečo potom ruský rubeľ má hodnotu 77,5/1 americkému doláru na svetovom trhu. Ako je to možné, že po viac ako 3 rokoch vojny ruský rubeľ nekľakol a má hodnotu ako pred špeciálnou vojenskou [...]

SR Chorvátsko Bratislava Pellegrini Milanovič stretnutie BAX

Pellegrini a Milanovič pred kľúčovými rokovaniami EÚ varujú pred ilúziami okolo Ukrajiny

16.12.2025 14:00

Pellegrini označil agendu rokovaní za veľmi dôležitú.

Austrália útok sydney bondi

Postavili sa teroru vlastnými telami: Manželia zo Sydney sa stali prvými obeťami krvavého útoku

16.12.2025 13:37

Hrdina Boris Gurman zápasil so strelcom, získal jeho zbraň a udrel ho, no predpokladá sa, že útočník následne použil druhú zbraň a oboch manželov zastrelil.

prílet F16 Kuchyňa

Hotovo. Američania vyrobili už všetkých 14 slovenských stíhačiek F-16, ďalšie tri prídu už vo štvrtok

16.12.2025 13:31, aktualizované: 13:34

Dodanie stíhacích lietadiel na Slovensko sa oneskorilo pre pandémiu ochorenia COVID-19.

matovič

Holečková vychválila „šikovných ľudí“ v Hnutí Slovensko. Matovič môže zostať poslancom

16.12.2025 12:42

Dodala, že Igor Matovič má štýl politiky, ktorý jej nie je „úplne blízky“ a rozumie tomu, že môže byť devastačný v rámci vlády.

stan021

Masmédia bársčo napíšu a bársčo povedia.

Štatistiky blogu

Počet článkov: 1,038
Celková čítanosť: 3509142x
Priemerná čítanosť článkov: 3381x

Autor blogu

Archív

Odkazy