A compact, high-performance model with an OpenAI-compatible API. It runs on a single GPU or a Mac, stays faithful to your data, and does not hallucinate. Request an evaluation key below.Un modelo compacto y de alto rendimiento con API compatible con OpenAI. Corre en una sola GPU o en un Mac, es fiel a tus datos y no alucina. Solicita una clave de evaluación abajo.
Request access →Solicitar acceso →Faithful to your context; it admits what it does not know instead of inventing.Fiel a tu contexto; admite lo que no sabe en vez de inventar.
Runs local / on your infrastructure. Your data never leaves your control.Corre local / en tu infraestructura. Tus datos nunca salen de tu control.
Math, code and structured output at the level of models 10× larger.Matemáticas, código y salida estructurada al nivel de modelos 10× más grandes.
Point your existing code at our endpoint — change base_url and key, zero rewrite.Apunta tu código actual a nuestro endpoint — cambia base_url y key, cero reescritura.
4.5B parameters · up to 128K context · a single 24 GB GPU or a 16 GB Mac. No datacenter required.4.5B parámetros · hasta 128K de contexto · una sola GPU de 24 GB o un Mac de 16 GB. Sin datacenter.