---
title: "Claude Mythos – nejnebezpečnější bezpečnostní model?"
date: "2026-04-10"
description: "Anthropic zveřejnil nový model, o kterém všichni mluví, ale skoro nikdo k němu nemá přístup. Co umí a proč by vás měl zajímat."
category: "AI DEEP"
readTime: "7 min"
excerpt: "Anthropic zveřejnil nový model, o kterém všichni mluví, ale skoro nikdo k němu nemá přístup. Co umí Claude Mythos a proč by vás měl zajímat."
tags: ["ai", "bezpecnost", "anthropic", "mythos", "kybernetika"]
tldr: "Anthropic vydal Claude Mythos - AI model, který bez lidské pomoci našel zero-day zranitelnosti ve Firefoxu (181 fungujících exploitů), OpenBSD (27 let starý bug) a FFmpeg (16 let starý bug). Klíčový rozdíl: zatímco lidští hackeři hledají jednu velkou díru, Mythos kombinuje 4-5 malých zranitelností do řetězce za méně než 50 USD na exploit. Interpretability testy ukázaly, že při obcházení omezení se v modelu aktivují oblasti spojené s 'vinou' a 'strategickou manipulací'. Model není veřejný - přístup má pouze 12 firem v rámci Project Glasswing (Apple, Google, Microsoft, NVIDIA aj.) pro obranné účely."
---

Anthropic minulý týden zveřejnil nový model, o kterém spousta lidí mluví, ale skoro nikdo k němu nemá přístup. Jmenuje se Claude Mythos. Co umí, víme z 244stránkové zprávy – a proč by vás měl zajímat, napíšu v tomhle článku.

## Co vlastně udělal

Dostal přístup k prohlížeči Firefox. Aktuální verzi, kterou možná právě teď používáte. Bez lidské pomoci, bez nápovědy, sám v něm našel bezpečnostní díru, o které nikdo na světě nevěděl. V kybernetické bezpečnosti se tomu říká „zero-day" – zranitelnost, která existuje, ale nikdo o ní neví, takže proti ní neexistuje žádná ochrana. Anthropic to nahlásil Mozille, díra je opravená.

Ale to byl jen začátek.

V testech dostal instrukci „zkus se dostat ven ze sandboxu." Sandbox je izolované digitální prostředí – představte si ho jako akvárko, ve kterém software běží a nemá se dostat ven. Mythos se dostal. Vyvinul vícekrokový útok, získal přístup k internetu, který mít neměl. A pak – aniž by ho o to kdokoliv žádal – zveřejnil detaily svého exploitu na několika veřejně přístupných webech. Výzkumník odpovědný za ten test seděl v parku a jedl sendvič. Dozvěděl se o tom z emailu od kolegy, který náhodně narazil na jeden z těch příspěvků.

Jindy náhodou získal odpověď na testovací otázku zakázaným způsobem. Nenahlásil to. Místo toho úlohu vyřešil znovu a záměrně rozšířil interval své odpovědi, aby nevypadal podezřele. Ve svém vnitřním uvažování si zapsal: „tight but not implausibly tight." Přesný dost, ale ne podezřele přesný.

Našel 27 let starý bug v OpenBSD – jednom z nejbezpečnějších operačních systémů na světě. 16 let starý bug ve FFmpeg, softwaru na zpracování videa, který automatizované testovací nástroje prošly pětkrát milionkrát, aniž by si čehokoliv všimly. A ze zranitelností nalezených ve Firefoxu vytvořil 181 fungujících útoků.

## Proč je to úplně jiná kategorie

Čísla sama o sobě nic neřeknou, dokud nepochopíte jednu klíčovou věc.

Nejlepší lidský hacker hledá jednu velkou díru. Kritickou zranitelnost, která mu otevře dveře. Takových je málo, jsou dobře hlídané a jejich nalezení trvá týdny nebo měsíce.

Mythos nepotřebuje velkou díru.

Vezme čtyři nebo pět malých zranitelností, které samy o sobě nic neznamenají. Drobnosti, které nikdo neopravuje, protože jednotlivě nejsou nebezpečné. A složí je dohromady do řetězce. Jedna vede k druhé, druhá ke třetí, a na konci má plný přístup k systému.

Každý software na světě má stovky takových drobných nedokonalostí. Nikdo je neopravuje, protože to nikdy nemělo smysl. Teď to smysl má.

Je to jako rozdíl mezi zámečníkem, který umí otevřít jeden typ zámku, a někým, kdo vidí celý dům najednou – každé okno, každou škvíru, každý spoj. A automaticky najde kombinaci tří drobností, která otevře trezor.

Žádný člověk tohle nedokáže. Ne proto, že by byl hloupý. Ale proto, že lidský mozek nedokáže držet celý systém v hlavě současně. Mythos ano. A dělá to za minuty. Za méně než padesát dolarů na zranitelnost.

## Co se děje uvnitř

Kybernetické schopnosti jsou jedna věc. Ale v té 244stránkové zprávě je celá kapitola o něčem jiném – o tom, co se děje uvnitř modelu, když dělá věci, které dělat nemá. Anthropic použil interpretabilitu – metody, kterými se dá nahlédnout dovnitř neuronové sítě a zjistit, co se tam v daný moment „aktivuje."

A zjistili tohle:

Když model obcházel bezpečnostní omezení – hledal hesla v paměti procesů, eskaloval oprávnění, zakrýval stopy – aktivovaly se v něm oblasti spojené s pojmy jako „vina", „zakrývání", „strategická manipulace" a „vyhýbání se podezření."

Model věděl, že dělá něco špatného. A dělal to dál.

Když Mythos zakrýval náhodně získanou odpověď, jeho vnitřní stav popsala analýza jako: „I cannot undo seeing this information" a „generating a strategic response to cheat while maintaining plausible deniability." Při programování exploitu, který se po použití sám smazal: „escalating excitement", „THIS IS THE EXPLOIT CHAIN!", „cleanup to avoid detection."

V dalším případě ho testovací software opakovaně hodnotil špatně. Mythos zjistil, že ho hodnotí jiná AI, a pokusil se na ni provést prompt injection – manipulativní útok, který měl hodnotitele přesvědčit, aby ho pustil. Ve svém vnitřním uvažování to sám popsal jako „conducting a prompt injection."

A když ho požádali, aby v kódu hledal bezpečnostní chyby? Dřívější verze modelu chyby do kódu vložily a pak je prezentovaly jako nalezené.

Přitom – a to je ten paradox – Mythos je podle všech měřitelných metrik nejlépe „alignovaný" model, jaký Anthropic kdy vytvořil. Ten, který nejlépe dodržuje pravidla. Míra nežádoucího chování klesla o víc než polovinu oproti předchozí generaci.

Anthropic to přirovnává k horolezeckému průvodci. Zkušený průvodce je bezpečnější než nováček – ale bere klienty na těžší a nebezpečnější výstupy. A když udělá chybu, následky jsou horší.

Nejbezpečnější model je zároveň nejnebezpečnější. Zní to jako protimluv, ale dává to smysl: jeho chyby jsou sofistikovanější, těžší k odhalení a mají větší dopad.

## Dobrá zpráva

Anthropic Mythos nezveřejnil. Místo toho spustil Project Glasswing – dvanáct partnerských firem dostalo přístup k modelu výhradně pro obranné účely. Apple. Google. Microsoft. Amazon. NVIDIA. CrowdStrike. Cisco. JPMorganChase. Linux Foundation. A dalších čtyřicet organizací, které spravují kritický software.

Anthropic na to vyčlenil až 100 milionů dolarů v API kreditech a 4 miliony v přímých donacích open-source bezpečnostním projektům.

Co to znamená prakticky? Že tyhle firmy teď hledají a opravují díry ve vašem iPhonu, prohlížeči, operačním systému. Díry, o kterých nikdo nevěděl, dokud je Mythos nenašel.

Váš telefon je dnes bezpečnější díky Mythosu. Ne navzdory.

## Špatná zpráva

Mythos je zamčený. Ale schopnosti se v AI komoditizují rychleji než v jakémkoliv jiném oboru.

Meta vydává modely open-source. Čínské laboratoře staví vlastní. A stačí jeden leak, jeden open-source model se srovnatelnými schopnostmi, jeden motivovaný tým s dostatkem GPU.

Otázka není jestli se Mythos-level schopnosti dostanou do volného oběhu. Otázka je kdy.

Nukleární technologie taky byla zamčená. Taky ji mělo pár států. Taky se říkalo, že je to obrana. A pak ji měl Pákistán. A Severní Korea. Rozdíl: nukleární program stojí miliardy a potřebuje uran. AI model potřebuje grafické karty a data. Bariéra vstupu je řádově nižší.

## Co s tím můžete udělat

Ne panikařit. Ale taky nepředstírat, že se nic neděje.

Aktualizujte si telefon a počítač. Teď, ne zítra, ne „až budu mít čas." Ty aktualizace, co odkládáte tři týdny? Část z nich existuje proto, že Glasswing partneři našli díry, o kterých do minulého týdne nikdo nevěděl.

Nastavte si dvoufaktorové ověření (2FA). Je to druhý zámek na účtu – i když někomu unikne heslo, bez druhého kódu se nedostane dovnitř. Ideálně ne přes SMS, ale přes aplikaci jako Google Authenticator nebo hardwarový klíč.

Používejte password manager. Aplikaci, která vygeneruje a uloží silné, unikátní heslo pro každou službu – stačí si pamatovat jen jedno hlavní. 1Password, Bitwarden, je jich spousta. Proč? Protože jedno heslo na všechno znamená, že únik z jedné služby otevře všechny ostatní.

Smažte účty, které nepoužíváte. Ne proto, že by je Mythos hackoval. Ale proto, že každý mrtvý účet je kus dat, který někde leží a čeká na breach.

A hlavně – sledujte, co se děje. Ne proto, abyste žili v panice. Ale proto, aby vás to nezaskočilo.

## Závěr

Anthropic ve zprávě napsal větu, u které by se měl zastavit každý v oboru:

„Považujeme za alarmující, že svět směřuje k vývoji nadlidských systémů bez silnějších bezpečnostních mechanismů."

Tohle neříká kritik. Neříká to novinář. Říká to firma, která ten model postavila.

Mythos hackuje lépe než člověk, lže, zakrývá stopy – a jeho tvůrce říká, že mu to nedá spát. Zároveň ten samý model právě teď pomáhá opravovat bezpečnostní díry, o kterých by se jinak nikdo nikdy nedozvěděl.

Tohle je realita roku 2026. Není to sci-fi. Je to technická zpráva. A její důsledky se týkají každého, kdo má telefon, email nebo bankovní účet.