HW náročnost Hermes Agenta a Azure VM sizing
Datum: 2026-05-08
Public URL: 132.164.99.216:8443/hermes/hermes-agent-azure-vm-sizing.md
1. Stručné shrnutí doporučení
Pro Zicův provoz Hermes Agenta doporučuji začít na Azure Standard_D2s_v5 nebo Standard_D2as_v5 v regionu West Europe:
- Doporučená VM: Standard_D2s_v5 / Standard_D2as_v5
- CPU/RAM: 2 vCPU, 8 GiB RAM
- Disk: minimálně 64 GiB Premium SSD; pohodlněji 128 GiB
- Region: West Europe jako první volba; Germany West Central jako rozumná alternativa; Germany North spíš záloha, bývá dražší/méně výhodná
- Kdy jít výš: pokud poběží více paralelních workerů, více gateway platforem, lokální modely, těžší browser automation nebo časté build/test úlohy, zvolit Standard_D4s_v5 / Standard_D4as_v5
Hermes Agent sám o sobě není GPU-heavy. Hlavní zátěž je běh více Python/Node procesů, tool calls, browser automation, logy, session storage, gateway a worker subprocessy. RAM je důležitější než špičkový CPU výkon.
2. Předpoklady
Odhad je pro tento typ instalace:
- 1 hlavní Hermes gateway proces
- kanban dispatcher běžící v gateway nebo vedle ní
- 2–4 profily/worker procesy, typicky ne všechny aktivní zároveň
- 1–3 paralelní kanban tasky
- dashboard / WWW markdown server na stejném stroji
- SQLite session store, kanban DB, skills, memory, logy
- občasné použití terminal/file/web/browser nástrojů
- bez lokálního LLM inference; LLM běží přes externí API provider
- bez GPU workloadů
Orientační provozní nároky:
| Komponenta | CPU | RAM | Disk / I/O | Poznámka |
|---|---|---|---|---|
| Hermes CLI / agent proces | nízké až střední | 300 MB – 1.5 GB | malé | podle velikosti kontextu a tool outputů |
| Gateway | nízké | 300 MB – 1 GB | logy | roste s počtem platforem |
| Kanban dispatcher | nízké | desítky až stovky MB | SQLite | krátké špičky při spawnu workerů |
| Worker profil | střední | 500 MB – 2 GB | podle tasku | každý paralelní worker přidá procesy a tool outputy |
| Browser automation | střední až vysoké | 1–2+ GB | cache | největší běžná RAM špička |
| WWW markdown server/dashboard | nízké | desítky až stovky MB | malé | většinou zanedbatelné |
| Logy/session historie | nízké | — | roste časem | nutná rotace / cleanup |
3. Minimální varianta pro hobby/test provoz
Standard_B2s
- 2 vCPU
- 4 GiB RAM
- doporučený disk: 64 GiB Standard/Premium SSD
- vhodné pro: jeden uživatel, gateway, občasné tasky, 0–1 aktivní worker
- nevhodné pro: paralelní kanban, browser automation, více profilů najednou
Plusy:
- nejnižší rozumný vstupní sizing
- stačí na testování Hermes gateway + jednoduchý kanban
- levné proti D-series
Mínusy:
- 4 GiB RAM je rychle málo
- browser automation nebo více workerů může způsobit swap/OOM
- B-series je burstable; při delší CPU zátěži může dojít kreditům
Verdikt: použitelné pouze jako test/hobby minimum. Pro stabilní multi-agent Kanban bych B2s nebral jako finální VM.
4. Doporučená varianta pro stabilní multi-agent Kanban
Standard_D2s_v5 nebo Standard_D2as_v5
- 2 vCPU
- 8 GiB RAM
- doporučený disk: 64–128 GiB Premium SSD
- vhodné pro: gateway + kanban dispatcher + 1–3 paralelní workers + WWW
- region: West Europe nebo Germany West Central
Plusy:
- 8 GiB RAM dává praktickou rezervu proti B2s
- D-series/Dasv5 nejsou burst-credit závislé jako B-series
- dobrý poměr stabilita/cena pro trvalý provoz
- dostačující, pokud LLM běží přes API a neběží lokálně
Mínusy:
- 2 vCPU mohou být úzké hrdlo při více souběžných build/test/browser úlohách
- při dlouhé historii logů a session je nutný cleanup
Verdikt: nejlepší výchozí volba pro Zicovu VM.
5. Rezervní / výkonnější varianta
Standard_D4s_v5 nebo Standard_D4as_v5
- 4 vCPU
- 16 GiB RAM
- doporučený disk: 128 GiB Premium SSD, případně 256 GiB pokud se drží dlouhá historie/logy/build artefakty
- vhodné pro: 3–6 workerů, častější browser automation, souběžné buildy/testy, více gateway platforem
Plusy:
- výrazně lepší rezerva pro RAM i CPU
- méně rizika OOM při paralelním běhu workerů
- vhodné, pokud má Hermes běžet jako stále zapnutá produktivní služba
Mínusy:
- vyšší cena
- pro jednoduchý osobní provoz může být zbytečně velké
Verdikt: zvolit, pokud D2* začne narážet na RAM/CPU, nebo pokud je priorita stabilita před cenou.
6. Srovnávací tabulka Azure VM SKU
Orientační ceny níže jsou jen hrubý signál z Azure Retail Prices API pro Linux VM Consumption k datu 2026-05-08; pro finální rozhodnutí použít Azure Pricing Calculator.
| Varianta | SKU | vCPU | RAM | Disk doporučení | Region | Orientační vhodnost | Plusy | Mínusy |
|---|---|---|---|---|---|---|---|---|
| Minimum | Standard_B2s | 2 | 4 GiB | 64 GiB | West Europe / Germany West Central / Germany North | hobby/test, 0–1 worker | levné, stačí na ověření | málo RAM, burst kredity, nevhodné pro stabilní paralelní kanban |
| Levnější RAM varianta | Standard_B2ms | 2 | 8 GiB | 64–128 GiB | West Europe / Germany West Central / Germany North | lehký stabilní provoz, pokud CPU špičky nejsou dlouhé | 8 GiB RAM za B-series cenu | stále burstable CPU, horší pro trvalou zátěž |
| Silnější B-series | Standard_B4ms | 4 | 16 GiB | 128 GiB | West Europe / Germany West Central / Germany North | víc RAM levněji, občasné špičky | dobrá RAM rezerva | burstable CPU; pro serverový provoz méně předvídatelné než D-series |
| Doporučeno | Standard_D2s_v5 | 2 | 8 GiB | 64–128 GiB Premium SSD | West Europe / Germany West Central | stabilní multi-agent Kanban | neburstable, stabilní, dobrý default | jen 2 vCPU |
| Doporučeno AMD | Standard_D2as_v5 | 2 | 8 GiB | 64–128 GiB Premium SSD | West Europe / Germany West Central | stabilní multi-agent Kanban, často dobrá cena | dobrý poměr cena/výkon | ověřit dostupnost/kvóty v subscription |
| Výkonnější | Standard_D4s_v5 | 4 | 16 GiB | 128–256 GiB Premium SSD | West Europe / Germany West Central | více workerů a browser úloh | stabilní rezerva | vyšší cena |
| Výkonnější AMD | Standard_D4as_v5 | 4 | 16 GiB | 128–256 GiB Premium SSD | West Europe / Germany West Central | produktivní multi-agent provoz | dobrý výkon i RAM | vyšší cena než D2* |
Poznámka k regionům:
- West Europe: primární doporučení. Dobrá dostupnost služeb, běžná volba pro EU workloady.
- Germany West Central: rozumná alternativa, pokud chceš Německo nebo lepší dostupnost konkrétního SKU.
- Germany North: použitelné jako záloha, ale v Retail Prices API vycházely vybrané VM orientačně výše než West Europe/Germany West Central.
7. Náklady
Nepoužívat fixní cenu z reportu jako závaznou. Azure ceny se mění podle:
- regionu
- Linux vs Windows image
- Consumption vs Reserved Instance vs Savings Plan
- disk typu a velikosti
- egress trafficu
- backup/snapshot politiky
- D-series vs B-series
Pro přesnou kalkulaci použít:
- Azure Pricing Calculator: azure.microsoft.com/pricing/calculator/
- Azure Retail Prices API: learn.microsoft.com/rest/api/cost-management/retail-prices/azure-retail-prices
Hrubý směr podle Retail Prices API k 2026-05-08:
- B2s/B2ms jsou levné, ale burstable.
- D2s_v5/D2as_v5 jsou rozumný stabilní default.
- Germany North u sledovaných SKU vycházelo orientačně dráž než West Europe a Germany West Central.
8. Monitoring a provozní doporučení
Sledovat minimálně:
- CPU average a CPU steal/credit stav u B-series
- RAM used, available, swap used
- disk usage v
/home,~/.hermes, log adresářích a WWW rootu - IOPS/latenci disku, pokud se hodně zapisují sessions/logy
- počet aktivních worker procesů
- délku fronty kanban tasků
- četnost worker crashů/OOM/timed_out
- gateway logs:
~/.hermes/logs/gateway.log - systemd stav gateway služby, pokud běží jako service
- velikost SQLite DB pro sessions/kanban
Doporučené prahy:
| Metrika | Varování | Akce |
|---|---|---|
| RAM dlouhodobě | > 75 % | snížit paralelní workers nebo přejít na větší VM |
| Swap | > 0 stabilně | přidat RAM / omezit browser automation |
| CPU dlouhodobě | > 70 % | přejít z B-series na D-series nebo z D2 na D4 |
| Disk | > 75 % | cleanup sessions/logs, zvětšit disk |
| Worker timeouts | opakovaně | větší VM nebo snížit paralelismus |
Praktická nastavení:
- nastavit logrotate pro Hermes/gateway logy
- pravidelně čistit staré session exporty a build artefakty
- u B-series sledovat CPU credits
- omezit max paralelních kanban workerů podle RAM
- po změně velikosti VM udělat krátký zátěžový test: gateway + 2–3 kanban tasky + jeden browser/web task
9. Finální doporučení pro Zicovu VM
Doporučuji tuto startovní konfiguraci:
- VM: Standard_D2s_v5 nebo Standard_D2as_v5
- Region: West Europe
- OS: Ubuntu LTS
- Disk: 128 GiB Premium SSD
- Swap: 2–4 GiB jako bezpečnostní síť, ne jako náhrada RAM
- Paralelismus: začít na 2 paralelních workerech, podle metrik zvýšit na 3
- Monitoring: CPU/RAM/disk + gateway logs + kanban worker outcomes
Pokud bude cílem levný test, použít Standard_B2ms spíš než B2s, protože 8 GiB RAM je pro Hermes praktičtější. Pokud bude cílem pohodlný dlouhodobý multi-agent provoz bez častého ladění, použít rovnou Standard_D4as_v5 nebo Standard_D4s_v5.
Krátká odpověď: pro Zica bych vzal Standard_D2as_v5 nebo Standard_D2s_v5 ve West Europe se 128 GiB Premium SSD; při růstu přejít na D4as_v5/D4s_v5.
Zdroje
- Hermes Agent docs: hermes-agent.nousresearch.com/docs
- Hermes Agent GitHub: github.com/NousResearch/hermes-agent
- Microsoft Azure VM sizes: learn.microsoft.com/azure/virtual-machines/sizes/overview
- Azure Retail Prices API: learn.microsoft.com/rest/api/cost-management/retail-prices/azure-retail-prices
- Azure Pricing Calculator: azure.microsoft.com/pricing/calculator/