PRIMICIA MUNDIAL · La primera tarjeta de IA cognitiva persistente para computadoras personales. Ver especificaciones →
PRESENTAMOS · PUNKY TIGER LABS

NYMPH S-Quantum.
La primera tarjeta PCIe de IA cognitiva persistente
para computadoras personales.

Impulsada por el acelerador de IA DEEPX DX-M1M, ganador en CES. Envuelta en la arquitectura cognitiva persistente de Punky Tiger Labs, con patente en trámite — más de 91 solicitudes ante la USPTO que le dan a las máquinas de consumo una memoria que sobrevive al reinicio.

Insértala. Tu IA deja de olvidar.

31 TOPS de IA dedicada DeepX DX-M1M + RK3588 NPU Doble expansión M.2 Liberación de KV-cache y VRAM ONNX · PyTorch · TensorFlow Decodificación 8K + multimodal PCIe de perfil bajo sin ventilador 100% local + potenciada por la nube
31TOPS
IA dedicada · INT8
<20W
Pico · ~6W típico
31
TOPS de IA dedicada
$590
Precio estimado
PROVEEDORES DE SILICIO
DeepX + Rockchip
Integrados bajo el stack de NYMPH.
No fabricamos silicio — hacemos que recuerde. El DeepX DX-M1M (ganador de dos CES 2026 Innovation Awards) aporta aceleración neuronal dedicada. El SoC RK3588 de Rockchip orquesta el sistema. La arquitectura cognitiva persistente y el producto pertenecen a Punky Tiger Labs.
El problema

Todo sistema de IA olvida en el momento en que termina una sesión.

Cada contexto se reconstruye desde cero. Cada conversación empieza en el punto inicial. La mayor parte del cómputo — y del costo — se va en restablecer lo que el sistema ya sabía.

NYMPH fue diseñada para acabar con eso.

La solución

El estado cognitivo vive en la tarjeta, no en el prompt.

NYMPH S-Quantum descarga la gestión de contexto, el habla, la visión y la inferencia en procesadores dedicados dentro de la tarjeta — liberando por completo la VRAM de la GPU para los pesos del modelo y el renderizado.

La tarjeta no reemplaza tu GPU. La complementa.

Arquitectura

Sistema cognitivo multiprocesador. Preparado para el futuro por diseño.

Cinco procesadores, cada uno en silicio dedicado. Paralelos por construcción. Sin contención.

DX-M1M
25 TOPS
DeepX · Ranura M.2 1
KV Cache · LLM · Visión · Audio
DX-M2
2027
Ranura M.2 2
Samsung 2nm GAA · Lista para actualizar
RK3588 NPU
6 TOPS
Rockchip
Orquestador del sistema
Mali-G610
GPU
Arm
Render en tarjeta
NAND 64GB
Persistente
IP de NYMPH
Almacenamiento de estado

PCIe Gen3 x4 · <20W pico · ~6W típico · Disipador sin ventilador · Perfil bajo · Dos ranuras M.2 (1 ocupada, 1 lista para el futuro)

Más que un acelerador

NYMPH no es una tarjeta aceleradora más.
Habilita formas de IA completamente nuevas a nivel de hardware.

01

Agentes de IA con memoria persistente que sobreviven a los reinicios

El contexto sobrevive a los límites de sesión, a los reinicios de aplicaciones y a los reinicios completos del sistema. Reanudación en estado activo medida en decenas de milisegundos.

Ningún hardware de consumo ofrece esto hoy.
02

Ventanas de contexto hasta 8× más grandes · generación 325% más rápida

El KV cache se traslada a memoria dedicada en la tarjeta, liberando la VRAM de la GPU para los pesos del modelo. La generación de tokens de contexto largo se acelera drásticamente.

Hasta de contexto · +325% de rendimiento en contexto largo
03

Pipelines paralelos de voz + visión + LLM

El habla, la detección de objetos y el modelado de lenguaje corren simultáneamente en procesadores dedicados. Sin contención, sin serialización.

3,523 FPS de clasificación a ~5W · verificado por DeepX
04

Agentes autónomos funcionando 24/7 a ~6W

IA siempre activa por menos de $2/mes de electricidad. El estado persiste a través de cualquier interrupción. Los agentes se reanudan desde el estado exacto tras una caída o un reinicio.

~6W típico · <$2/mes · operación 24/7
05

La GPU queda libre para renderizar, jugar y entrenar

Corre modelos más grandes en la misma GPU mientras NYMPH gestiona la carga cognitiva. NPCs cognitivos que recuerdan al jugador. Cero impacto en los FPS.

Cero impacto en los FPS de renderizado
06

IA local que recuerda y evoluciona con el tiempo

Múltiples espacios de trabajo de IA activos en caché de forma simultánea. Reanudación instantánea de contexto en milisegundos. El conocimiento se acumula a través de sesiones, semanas y meses.

El equivalente cognitivo de los escritorios virtuales.
Más que IA local

Una capa cognitiva para tu máquina.
No solo un lugar para correr un modelo.

La capa cognitiva

Una capa de orquestación coordina la tarjeta con tu CPU, tu RAM y tu GPU como un solo sistema. NYMPH lleva la memoria, la recuperación y la percepción — tu máquina queda libre para su propio trabajo.

Supermemoria

64 GB de estado persistente que sobrevive a los reinicios y a los cortes de energía. Tu IA nunca empieza desde cero — recuerda tus proyectos, tu contexto y tus patrones, y se afina con el tiempo.

Funciona con las herramientas que ya usas

Apunta Claude Code, OpenClaw, ChatGPT, Codex o Cursor a una sola API compatible con OpenAI y a un servidor MCP nativo. Ganan memoria persistente y corren de forma privada, local y sin conexión.

Claude Code · OpenClaw · ChatGPT · Codex · Cursor · LangChain · Open WebUI · cualquier app compatible con OpenAI

Escala

Corre modelos de IA varias veces más grandes
de lo que tu tarjeta gráfica puede contener.

La mayoría de las máquinas solo pueden correr lo que cabe en su memoria. NYMPH cambia la regla. Su orquestación trata tu GPU, tu RAM, la memoria de la tarjeta y tu SSD como una sola jerarquía coordinada — manteniendo la parte activa de un modelo en el nivel más rápido y el resto a un latido de distancia. El modelo completo vive a lo largo de tu máquina; solo corre la parte que está trabajando.

Cualquier arquitectura
Densa, Mixture-of-Experts o de espacio de estados (Mamba/SSM) — lenguaje, visión y habla, cada uno en silicio dedicado.
Te aprende
La tarjeta recuerda qué partes de un modelo usas realmente y las precarga — así arranca lista, no en frío.
Tarjeta de $590 · ~13 W · local
Modelos que jamás cabrían solo en tu GPU — corriendo de forma privada en tu propia máquina, sin nube, sin factura por token.

NYMPH corre la parte activa de un modelo en memoria rápida y transmite el resto bajo demanda — así el tamaño del modelo ya no está limitado por tu GPU.

Especificaciones

Detalles técnicos.

Rendimiento de IA (V1)
31 TOPS (INT8) — DX-M1M 25 TOPS + RK3588 NPU 6 TOPS
Procesadores de IA activos
DX-M1M · RK3588 NPU · Mali-G610 GPU · CPU ARM de 8 núcleos
Ranura de expansión M.2
1× M.2 2280 lista para DX-M2 (actualización 2027)
Motor de cuantización
DeepX IQ8 — precisión nivel FP32 en formato INT8
Memoria en tarjeta
4 GB LPDDR4X (DX-M1M) + LPDDR5 (RK3588)
Almacenamiento persistente
64 GB NAND — el estado cognitivo sobrevive a los reinicios
Interfaz con el host
PCIe Gen3 x4
Consumo de energía
<20W pico · ~6W típico
Solución térmica
Disipador pasivo — operación sin ventilador
Factor de forma
Tarjeta PCIe de perfil bajo
Procesamiento de video
RK3588 VPU — decodificación 8K, codificación 4K
Soporte de SO
Linux (Ubuntu) · Windows · Android AOSP
Frameworks de IA
ONNX · PyTorch · TensorFlow mediante DXNN SDK
Compatibilidad
Cualquier desktop/workstation x86 con ranura PCIe
Precio estimado
$590 USD
Tecnologías con patente en trámite
KV-Pinning State Capsules SCMP TAPIM PNCA OCCS HCIS TOKENFLOW STREAMFLOW
Impacto observado

Lo que cambia cuando la insertas.

31TOPS
IA dedicada
ampliable en 2027
8×
Ventanas de contexto
más grandes
+325%
Generación de tokens
más rápida en contexto largo
100%
El contexto persiste
tras el reinicio
6W
Consumo típico
siempre activo

Observado en pruebas internas controladas. Los resultados reales varían según la configuración.

Comparación

Tu PC hoy vs Tu PC + NYMPH.

Escenario
Sin NYMPH
Con NYMPH
Cerrar la sesión y volver
Se pierde todo el contexto
Se reanuda al instante
Reiniciar la PC
Se destruye todo el estado de la IA
100% preservado en NAND
Cambiar entre proyectos
El anterior se destruye
Todo en caché, cambio instantáneo
Sesión continua de 8 horas
Degradación progresiva
Estable de la hora 1 a la hora 8
LLM + visión + audio
Uno a la vez
Todo en paralelo (dedicado)
Correr un agente de IA toda la noche
GPU a 350W, PC inutilizable
NYMPH a 6W, PC libre
Capacidad de modelo de la GPU
Limitada por la VRAM
Significativamente ampliada
Costos de tokens de IA en la nube
La mayoría es recómputo
Sustancialmente reducidos
Verificado por DeepX · DX-M1M · ~5W

Rendimiento sobre silicio dedicado.

Todas las cargas corren en el DX-M1M mientras la GPU del host permanece 100% disponible.

Modelo / Tarea
Rendimiento
Fuente
MobileNetV2 (Clasificación)
3,523 FPS
Verificado
ResNet50 (Clasificación)
1,186 FPS
Verificado
YOLOv8L (Detección)
366 FPS
Verificado
DeepLabV3 (Segmentación)
223 FPS
Verificado
Estimación de pose
200+ FPS
Verificado

Benchmarks de DeepX a partir de datos publicados del Model Zoo.

Casos de uso

Para quién es.

Desarrolladores de IA

Modelos con memoria persistente, agentes con estado

Ajuste fino local sobre datos privados. Cualquier modelo ONNX con capacidades de nivel nube. SDK abierto.

Usuarios avanzados

Flujos de nube más rápidos a menor costo

Claude Code, ChatGPT, Cursor con costos de tokens drásticamente reducidos. Múltiples contextos en caché. Voz, visión y lenguaje en paralelo.

Gamers y creadores

NPCs cognitivos, game master de IA

Detección de pose a 200+ FPS. SD/Flux + LLM de forma simultánea. Cero impacto en los FPS de los juegos.

Streamers

Moderación, subtítulos, overlays — en paralelo

Moderación de chat con IA, subtítulos en vivo, overlays de detección — todo en NYMPH mientras la GPU se encarga del juego y la codificación.

Entusiastas de la IA local

Contextos extendidos, cambio instantáneo de modelos

Llama, Mistral, DeepSeek con contextos extendidos. Modelos que te recuerdan entre sesiones. Cambio instantáneo con Ollama.

Usuarios que priorizan la privacidad

IA 100% local · soberanía total

Nada sale de tu máquina. Sistema cognitivo completo sin conexión. Arquitectura con patente en trámite, solo tus datos.

SDK ABIERTO

Construye sobre un SDK abierto.

El SDK de NYMPH se publicará como software de código abierto. El hardware es propietario. El ecosistema es libre.

01
Modelos con memoria persistente
IA que acumula conocimiento a lo largo de semanas y meses. Estado a nivel de hardware que el usuario posee y controla.
02
Pipelines multimodales en tiempo real
Audio, visión y lenguaje en procesadores dedicados. Simultáneos, no secuenciales. Menos de 20W en total.
03
Agentes autónomos con estado
Sobreviven a caídas, reinicios y cortes de energía. Se reanudan desde el punto exacto de interrupción. Corren de forma indefinida a ~6W.
04
Ajuste fino local sobre datos privados
La GPU entrena mientras NYMPH gestiona la inferencia y el estado. Los datos privados nunca salen de la máquina.
05
Cualquier modelo compatible con ONNX
Llama, Mistral, Phi, Qwen, DeepSeek — capacidades de nivel nube en un desktop.
06
Personajes de juego cognitivos
Memoria persistente, comportamiento que evoluciona, cero impacto en el renderizado. Una nueva categoría interactiva.
07
Cámaras de seguridad con IA local
El RK3588 VPU decodifica 8K, el DX-M1M corre la detección. Múltiples flujos, privacidad total.
Socios de silicio

El mejor silicio de su clase.
Nuestra arquitectura cognitiva.

NYMPH no fabrica silicio. Integramos lo mejor disponible — y hacemos que recuerde. La arquitectura cognitiva persistente y la tarjeta misma son propiedad intelectual de Punky Tiger Labs.

DeepX
Silicio de IA
Procesador neuronal DX-M1M · 25 TOPS INT8 a ~5W. La cuantización propietaria IQ8 ofrece precisión nivel FP32 en INT8. Ganador de dos CES 2026 Innovation Awards.
CES 2026 ×2 EE Times '24 Producto del Año WEF MINDS '25 Award
Rockchip
SoC del sistema
SoC RK3588 · CPU ARM de 8 núcleos + NPU de 6 TOPS + GPU Mali-G610 + VPU 8K. El orquestador del sistema que coordina el pipeline cognitivo.
ARM de 8 núcleos Decodificación 8K Mali-G610
Ruta de actualización · 2027

NYMPH V2: Inserta el futuro.

NYMPH S-Quantum incluye dos ranuras M.2 2280. La primera aloja el DX-M1M. La segunda está vacía — lista para el procesador DX-M2 de próxima generación de DeepX en el nodo de proceso 2nm GAA (Gate-All-Around) de Samsung. Cuando el DX-M2 esté disponible, insértalo en la segunda ranura. Sin tarjeta nueva. Sin controladores nuevos. Sin estado perdido.

Nodo de proceso del DX-M2
Samsung 2nm GAA (Gate-All-Around)
Muestreo previsto
Q3 2026
Objetivo de actualización NYMPH V2
2027
Instalación
Inserta el DX-M2 en la segunda ranura M.2 de la tarjeta existente
Compatibilidad
Compatibilidad total hacia atrás — SDK V1, State Capsules, datos NAND
Resultado
DX-M1M + DX-M2 corriendo en paralelo en una sola tarjeta

Compra NYMPH hoy con un procesador. Añade la próxima generación mañana. Tu estado, tus datos, tus modelos — todo se transfiere.

Desde el laboratorio

La IA no debería reiniciarse en cada sesión.
La IA debería recordar.

Una evolución del paradigma del LLM — no un reemplazo. Estado persistente a nivel de hardware, que acumula conocimiento a través de las sesiones. Una arquitectura con patente en trámite cubre todo el stack tecnológico.

Un producto distinto para un futuro distinto.
Uno en el que la IA recuerda.
En pocas semanas

El primer hardware de IA de consumo.
Para gamers, devs y usuarios hardcore.

S-Quantum está a semanas del lanzamiento. Deja tu correo y te contactaremos cuando las unidades, el precio y la disponibilidad estén confirmados — sin spam, solo novedades del producto.

Reservar → →