HW náročnost Hermes Agenta a Azure VM sizing

Datum: 2026-05-08

Public URL: 132.164.99.216:8443/hermes/hermes-agent-azure-vm-sizing.md

1. Stručné shrnutí doporučení

Pro Zicův provoz Hermes Agenta doporučuji začít na Azure Standard_D2s_v5 nebo Standard_D2as_v5 v regionu West Europe:

Hermes Agent sám o sobě není GPU-heavy. Hlavní zátěž je běh více Python/Node procesů, tool calls, browser automation, logy, session storage, gateway a worker subprocessy. RAM je důležitější než špičkový CPU výkon.

2. Předpoklady

Odhad je pro tento typ instalace:

Orientační provozní nároky:

Komponenta CPU RAM Disk / I/O Poznámka
Hermes CLI / agent proces nízké až střední 300 MB – 1.5 GB malé podle velikosti kontextu a tool outputů
Gateway nízké 300 MB – 1 GB logy roste s počtem platforem
Kanban dispatcher nízké desítky až stovky MB SQLite krátké špičky při spawnu workerů
Worker profil střední 500 MB – 2 GB podle tasku každý paralelní worker přidá procesy a tool outputy
Browser automation střední až vysoké 1–2+ GB cache největší běžná RAM špička
WWW markdown server/dashboard nízké desítky až stovky MB malé většinou zanedbatelné
Logy/session historie nízké roste časem nutná rotace / cleanup

3. Minimální varianta pro hobby/test provoz

Standard_B2s

Plusy:

Mínusy:

Verdikt: použitelné pouze jako test/hobby minimum. Pro stabilní multi-agent Kanban bych B2s nebral jako finální VM.

4. Doporučená varianta pro stabilní multi-agent Kanban

Standard_D2s_v5 nebo Standard_D2as_v5

Plusy:

Mínusy:

Verdikt: nejlepší výchozí volba pro Zicovu VM.

5. Rezervní / výkonnější varianta

Standard_D4s_v5 nebo Standard_D4as_v5

Plusy:

Mínusy:

Verdikt: zvolit, pokud D2* začne narážet na RAM/CPU, nebo pokud je priorita stabilita před cenou.

6. Srovnávací tabulka Azure VM SKU

Orientační ceny níže jsou jen hrubý signál z Azure Retail Prices API pro Linux VM Consumption k datu 2026-05-08; pro finální rozhodnutí použít Azure Pricing Calculator.

Varianta SKU vCPU RAM Disk doporučení Region Orientační vhodnost Plusy Mínusy
Minimum Standard_B2s 2 4 GiB 64 GiB West Europe / Germany West Central / Germany North hobby/test, 0–1 worker levné, stačí na ověření málo RAM, burst kredity, nevhodné pro stabilní paralelní kanban
Levnější RAM varianta Standard_B2ms 2 8 GiB 64–128 GiB West Europe / Germany West Central / Germany North lehký stabilní provoz, pokud CPU špičky nejsou dlouhé 8 GiB RAM za B-series cenu stále burstable CPU, horší pro trvalou zátěž
Silnější B-series Standard_B4ms 4 16 GiB 128 GiB West Europe / Germany West Central / Germany North víc RAM levněji, občasné špičky dobrá RAM rezerva burstable CPU; pro serverový provoz méně předvídatelné než D-series
Doporučeno Standard_D2s_v5 2 8 GiB 64–128 GiB Premium SSD West Europe / Germany West Central stabilní multi-agent Kanban neburstable, stabilní, dobrý default jen 2 vCPU
Doporučeno AMD Standard_D2as_v5 2 8 GiB 64–128 GiB Premium SSD West Europe / Germany West Central stabilní multi-agent Kanban, často dobrá cena dobrý poměr cena/výkon ověřit dostupnost/kvóty v subscription
Výkonnější Standard_D4s_v5 4 16 GiB 128–256 GiB Premium SSD West Europe / Germany West Central více workerů a browser úloh stabilní rezerva vyšší cena
Výkonnější AMD Standard_D4as_v5 4 16 GiB 128–256 GiB Premium SSD West Europe / Germany West Central produktivní multi-agent provoz dobrý výkon i RAM vyšší cena než D2*

Poznámka k regionům:

7. Náklady

Nepoužívat fixní cenu z reportu jako závaznou. Azure ceny se mění podle:

Pro přesnou kalkulaci použít:

Hrubý směr podle Retail Prices API k 2026-05-08:

8. Monitoring a provozní doporučení

Sledovat minimálně:

Doporučené prahy:

Metrika Varování Akce
RAM dlouhodobě > 75 % snížit paralelní workers nebo přejít na větší VM
Swap > 0 stabilně přidat RAM / omezit browser automation
CPU dlouhodobě > 70 % přejít z B-series na D-series nebo z D2 na D4
Disk > 75 % cleanup sessions/logs, zvětšit disk
Worker timeouts opakovaně větší VM nebo snížit paralelismus

Praktická nastavení:

9. Finální doporučení pro Zicovu VM

Doporučuji tuto startovní konfiguraci:

Pokud bude cílem levný test, použít Standard_B2ms spíš než B2s, protože 8 GiB RAM je pro Hermes praktičtější. Pokud bude cílem pohodlný dlouhodobý multi-agent provoz bez častého ladění, použít rovnou Standard_D4as_v5 nebo Standard_D4s_v5.

Krátká odpověď: pro Zica bych vzal Standard_D2as_v5 nebo Standard_D2s_v5 ve West Europe se 128 GiB Premium SSD; při růstu přejít na D4as_v5/D4s_v5.

Zdroje