CiteThis: Evidence-Based Research Platform

Výchozí situace
Dubnový experiment: postavit něco, kde každý technický detail je záměrný. Téma - evidence-based medicine (supplementace, spánek, ADHD, postpartum). Cíl - nepsat "další blog", ale research platformu, kterou AI engines umí a budou citovat.
Co jsem postavil
16 evidence-based protokolů, každý ~2500 slov. Strukturovaný frontmatter, key definitions, methodology notes, FAQ sekce, comparison tables, safety considerations, DOI linky na primární studie.
33 tag landing pages s dedicated explainery (~2100 slov každý) a DefinedTerm schema markup. Když někdo v ChatGPT hledá "co je myo-inositol pro PCOS", citethis.site je přímo odpovědí, ne jen list článků.
Technický stack
- Framework: Astro 6 (SSG mode) — žádný klientský JavaScript, clean HTML pro AI crawlery
- Content: Markdown content collections s TypeScript validací
- Search: Pagefind (static search, 60KB JSON)
- Deployment: Vercel (free tier, TTFB pod 100ms)
- Design: Tailwind CSS, brutalistický dark-mode, WCAG AAA
GEO-first architektura
6 vrstev strukturovaných dat na každé stránce:
- ScholarlyArticle + MedicalWebPage schema s Person entity
- Dataset schema s explicitními linky na .md a .json verze
- FAQPage schema auto-generovaný z H3 otázek v článcích
- DefinedTerm schema pro každý tag
- CC-BY 4.0 license (explicitní AI citation permission)
- Cite this protocol box s formátovanou citací + raw markdown endpoint
Plus: llms.txt manifest, robots.txt s AI crawlery whitelisted (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, Applebot), /api/protocols.json RAG endpoint.
Self-audit a iterace
Po spuštění GEO audit vlastního webu našel 4 kritické bugy: llms.txt generoval 404ky (špatný slug field v Astro templatu), author schema říkala "jroh.cz" místo "Jakub Roh", duplicitní tagy (ADHD/adhd), chybějící FAQPage schema.
Opravy během hodiny, pak ještě přidání methodology notes do všech článků a napsání 33 tag explainerů (~70K slov nového obsahu).
Průměrný citability score: 42 → 48-49, B-grade passages 1 → 4-5 per článek.
Výsledky
- 16 protokolů + 33 tag landing pages = 117 statických stránek
- ~110K slov GEO-optimalizovaného evidence-based obsahu
- 6 vrstev structured data, funkční llms.txt, auto-FAQ schema
- Náklady: 0 Kč na infrastrukturu (Vercel free tier, Namecheap doména za pár dolarů ročně)
- Čas: 3 dny od nápadu k produkci
Co tím demonstruje
Většina firem v ČR má blog bez FAQPage schema, bez Author entity, bez .md endpointů, bez llms.txt - a ptá se proč je ChatGPT necitije. Odpověď: protože pro to nic neudělali.
CiteThis je doklad, že GEO-first architektura jde postavit rychle a bez rozpočtu - pokud víte co děláte. A detailní článek o stavbě je tady.
Projekt: citethis.site · Stack: Astro, TypeScript, Tailwind · Licence: CC-BY 4.0 (obsah), MIT (kód)