Procedimientos operativos estándar de seguridad (SOP)
Validador «Konomic» | Versión 1.1 | Última actualización: 16 de junio de 2025
1. Propósito y alcance
Este documento describe la organización de la seguridad, el funcionamiento y la supervisión del validador Konomic que opera en la red Solana Mainnet-Beta.
La política se aplica a:
- El nodo validador principal (vote account) y los nodos de respaldo
- Los servicios auxiliares (relay RPC, supervisión, almacenamiento off-chain)
- Los empleados y procesos automatizados con acceso a las claves y la configuración
2. Gestión de claves
El acceso al HSM está restringido únicamente a dos operadores sénior. No se almacenan claves en instancias en línea; la autorización se realiza mediante transacciones firmadas sin conexión.
| Tipo de clave | Método de almacenamiento | Copia de seguridad | Rotación |
|---|---|---|---|
| Vote e Identity | HSM FIPS-140-3 en segmento sin conexión | Portátil air-gapped (LUKS, TPM) | Programada: cada 18 meses De emergencia: ante sospecha de compromiso |
| Authorized Voter | HSM FIPS-140-3 en segmento sin conexión | Portátil air-gapped (LUKS, TPM) | Con cada actualización del protocolo |
| Authorized Withdrawer | HSM FIPS-140-3 en segmento sin conexión | Tarjeta microSD cifrada guardada en una caja fuerte e imagen cifrada en Cloud Secure Store | Programada: cada 18 meses De emergencia: ante sospecha de compromiso |
3. Infraestructura y red
- Centro de datos: Instalación Tier III en Fráncfort; respaldo: Iron Mountain AMS-1.
- Segmentación: Validador alojado en un clúster dedicado de 3 servidores en un rack de 46U; los RPC públicos están aislados en una subred independiente sin reglas de salida hacia el validador.
- Protección del perímetro: Firewall stateful multicapa, filtrado GeoIP y limitación de velocidad.
- Mitigación de DDoS: Conmutación automática de la dirección Anycast externa al detectar tráfico anómalo.
- Hardware: Cada servidor con 64 vCPU AMD EPYC 9555, 1024 GB de RAM DDR5 6000, 8 SSD NVMe Enterprise de 1,92 TB en RAID-1 + mirrors ZFS (16 en total); todas las unidades con cifrado por hardware.
- Redundancia: La redundancia 2N garantiza la resiliencia ante fallos simultáneos y el mantenimiento programado.
4. Ciclo de vida del software
| Etapa | Proceso |
|---|---|
| Pruebas | Cada versión del cliente se prueba en un clúster privado de DevNet durante un mínimo de 6 horas. |
| Actualización | A la versión N.N.x: en un plazo de 24 horas desde la publicación de la Foundation. CVE críticas: en un plazo de 4 horas. |
| Reversión | Se admite la instantánea de slot en caliente; tiempo de inactividad ≤ 5 minutos. |
| Modificaciones | No se aplican parches al kernel ni compilaciones no estándar. |
5. Supervisión y alertas
- Métricas: skip-rate, vote-credit, ping-latency, CPU/IO-wait, tamaño del ledger.
- Sistema: Prometheus → Alertmanager → Telegram/SMS; respaldo: pasarela de correo electrónico.
- Umbrales:
- skip-rate > 5 % durante 5 minutos: alerta crítica;
- 32 slots perdidos consecutivos: reinicio de emergencia del nodo;
- CPU > 85 % o IO-wait > 30 %: failover preventivo.
6. Respuesta a incidentes
- Detección (T₀): Alerta automática.
- Clasificación (T₀ + 5 min): El operador asigna la prioridad (P1/P2).
- Contención: Activación del validador de respaldo; el nodo principal pasa a solo lectura.
- Resolución: Parche/reinicio/cambio de configuración.
- Recuperación: Sincronización de slots, validación de la consistencia del ledger.
- Post-mortem (≤ 48 horas): Análisis de la causa raíz, publicación del informe interno.
RTO ≤ 30 minutos, RPO ≈ 0 slots.
7. Cumplimiento y auditoría
- Auditoría interna: Trimestral, basada en la lista de verificación CIS Benchmark + NIST 800-53 (42 elementos seleccionados).
- Pruebas de penetración: Anuales, realizadas por un grupo independiente; el informe está disponible para los delegadores tras la firma de un NDA.
- Certificaciones: Centro de datos certificado según ISO 27001/9001/14001/50001, PCI-DSS, SOC 2/3, según lo confirmado por contrato.