세계 최초 · 개인용 컴퓨터를 위한 최초의 지속형 인지 AI 카드. 사양 보기 →
소개 · PUNKY TIGER LABS

NYMPH S-Quantum.
개인용 컴퓨터를 위한
최초의 지속형 인지 AI PCIe 카드.

CES 수상에 빛나는 DEEPX DX-M1M AI 가속기로 구동됩니다. Punky Tiger Labs의 특허 출원 중인 지속형 인지 아키텍처로 감싸져 있으며 — 소비자용 컴퓨터에 재부팅에도 살아남는 기억을 부여하는 91건 이상의 USPTO 출원으로 뒷받침됩니다.

꽂으세요. 당신의 AI가 더 이상 잊지 않습니다.

31 TOPS 전용 AI DeepX DX-M1M + RK3588 NPU 듀얼 M.2 확장 KV-cache & VRAM 해방 ONNX · PyTorch · TensorFlow 8K 디코딩 + 멀티모달 팬리스 로우 프로파일 PCIe 100% 로컬 + 클라우드 보강
31TOPS
전용 AI · INT8
<20W
최대 · 일반 ~6W
31
TOPS 전용 AI
$590
예상 소비자가
실리콘 공급사
DeepX + Rockchip
NYMPH 스택 아래 통합.
우리는 실리콘을 만들지 않습니다 — 그것이 기억하게 만듭니다. DeepX DX-M1M(CES 2026 혁신상 2개 수상)은 전용 신경망 가속을 제공합니다. Rockchip의 RK3588 SoC가 시스템을 조율합니다. 지속형 인지 아키텍처와 제품은 Punky Tiger Labs의 소유입니다.
문제

모든 AI 시스템은 세션이 끝나는 순간 잊어버립니다.

모든 컨텍스트가 처음부터 다시 구축됩니다. 모든 대화가 0에서 시작됩니다. 연산 — 그리고 비용 — 의 대부분이 시스템이 이미 알고 있던 것을 다시 확립하는 데 들어갑니다.

NYMPH는 바로 그것을 끝내기 위해 설계되었습니다.

해결책

인지 상태는 프롬프트가 아니라 카드 위에 존재합니다.

NYMPH S-Quantum은 컨텍스트 관리, 음성, 비전, 추론을 카드 내 전용 프로세서로 오프로드하여 — GPU VRAM을 전적으로 모델 가중치와 렌더링에 해방합니다.

이 카드는 GPU를 대체하지 않습니다. 보완합니다.

아키텍처

멀티프로세서 인지 시스템. 설계부터 미래에 대비된.

다섯 개의 프로세서, 각각 전용 실리콘 위에. 구조적으로 병렬. 경합 없음.

DX-M1M
25 TOPS
DeepX · M.2 슬롯 1
KV 캐시 · LLM · 비전 · 오디오
DX-M2
2027
M.2 슬롯 2
Samsung 2nm GAA · 업그레이드 준비
RK3588 NPU
6 TOPS
Rockchip
시스템 오케스트레이터
Mali-G610
GPU
Arm
카드 내 렌더링
NAND 64GB
지속형
NYMPH IP
상태 저장소

PCIe Gen3 x4 · 최대 <20W · 일반 ~6W · 팬리스 히트싱크 · 로우 프로파일 · 듀얼 M.2 슬롯 (1개 장착, 1개 미래 대비)

가속기를 넘어서

NYMPH는 그저 또 하나의 가속기 카드가 아닙니다.
하드웨어 수준에서 완전히 새로운 형태의 AI를 가능하게 합니다.

01

재부팅을 견디는 지속형 메모리 AI 에이전트

컨텍스트가 세션 경계, 앱 재시작, 전체 시스템 재부팅을 넘어 살아남습니다. 웜 상태 복구는 수십 밀리초 단위로 측정됩니다.

현재 어떤 소비자용 하드웨어도 이를 제공하지 않습니다.
02

최대 8배 더 큰 컨텍스트 창 · 325% 더 빠른 생성

KV 캐시가 카드 내 전용 메모리로 이동하여 GPU VRAM을 모델 가중치에 해방합니다. 장문 컨텍스트의 토큰 생성이 극적으로 가속됩니다.

최대 8배 컨텍스트 · +325% 장문 컨텍스트 처리량
03

병렬 음성 + 비전 + LLM 파이프라인

음성, 객체 탐지, 언어 모델링이 전용 프로세서에서 동시에 실행됩니다. 경합도, 직렬화도 없습니다.

~5W에서 3,523 FPS 분류 · DeepX 검증
04

~6W로 24시간 작동하는 자율 에이전트

월 $2 미만 전기료로 항시 작동하는 AI. 상태는 어떤 중단에도 지속됩니다. 에이전트는 충돌이나 재부팅 후 정확한 상태에서 재개됩니다.

~6W 일반 · <$2/월 · 24시간 작동
05

GPU는 렌더링, 게임, 학습에 자유롭게 유지

NYMPH가 인지 부하를 처리하는 동안 같은 GPU로 더 큰 모델을 실행하세요. 플레이어를 기억하는 인지형 NPC. FPS에 미치는 영향은 제로.

렌더링 FPS에 영향 제로
06

기억하고 시간에 따라 진화하는 로컬 AI

여러 개의 활성 AI 워크스페이스가 동시에 캐시됩니다. 밀리초 단위의 즉각적인 컨텍스트 복구. 지식이 세션, 주, 월에 걸쳐 축적됩니다.

가상 데스크톱의 인지적 등가물.
로컬 AI 그 이상

당신의 머신을 위한 인지 계층.
단지 모델을 실행하는 장소가 아닙니다.

인지 계층

하나의 오케스트레이션 계층이 카드를 CPU, RAM, GPU와 함께 단일 시스템으로 조율합니다. NYMPH가 기억, 검색, 인식을 담당하고 — 당신의 머신은 자신의 작업에 자유롭게 유지됩니다.

슈퍼 메모리

재부팅과 정전을 견디는 64 GB의 지속형 상태. 당신의 AI는 결코 0에서 시작하지 않습니다 — 당신의 프로젝트, 컨텍스트, 패턴을 기억하고 시간이 갈수록 더 날카로워집니다.

이미 쓰고 있는 도구와 호환

Claude Code, OpenClaw, ChatGPT, Codex, Cursor를 하나의 OpenAI 호환 API와 네이티브 MCP 서버로 연결하세요. 이들은 지속형 메모리를 얻고 프라이빗하게, 로컬에서, 오프라인으로 실행됩니다.

Claude Code · OpenClaw · ChatGPT · Codex · Cursor · LangChain · Open WebUI · 모든 OpenAI 호환 앱

스케일

그래픽 카드가 담을 수 있는 것보다
몇 배 더 큰 AI 모델을 실행하세요.

대부분의 머신은 자신의 메모리에 들어가는 것만 실행할 수 있습니다. NYMPH는 그 규칙을 바꿉니다. 그 오케스트레이션은 GPU, RAM, 카드의 메모리, SSD를 하나의 조율된 계층 구조로 다룹니다 — 모델의 작동 부분을 가장 빠른 계층에 두고 나머지를 한 박자 거리에 둡니다. 모델 전체가 당신의 머신 전반에 존재하고, 작동하는 부분만 실행됩니다.

어떤 아키텍처든
Dense, Mixture-of-Experts, 또는 상태 공간(Mamba/SSM) — 언어, 비전, 음성이 각각 전용 실리콘 위에서.
당신을 학습합니다
카드는 당신이 실제로 사용하는 모델 부분을 기억하고 미리 로드합니다 — 그래서 차갑게가 아니라 준비된 채로 부팅됩니다.
$590 카드 · ~13 W · 로컬
GPU 단독으로는 결코 들어가지 않을 모델을 — 당신 자신의 머신에서 프라이빗하게, 클라우드 없이, 토큰당 청구 없이 실행합니다.

NYMPH는 모델의 활성 부분을 빠른 메모리에서 실행하고 나머지를 필요에 따라 스트리밍합니다 — 그래서 모델 크기가 더 이상 GPU에 의해 제한되지 않습니다.

사양

기술 상세.

AI 성능 (V1)
31 TOPS (INT8) — DX-M1M 25 TOPS + RK3588 NPU 6 TOPS
활성 AI 프로세서
DX-M1M · RK3588 NPU · Mali-G610 GPU · 8코어 ARM CPU
M.2 확장 슬롯
DX-M2 (2027 업그레이드)를 위한 1× M.2 2280 준비
양자화 엔진
DeepX IQ8 — INT8 포맷에서 FP32 수준 정밀도
카드 내 메모리
4 GB LPDDR4X (DX-M1M) + LPDDR5 (RK3588)
지속형 저장소
64 GB NAND — 인지 상태가 재부팅을 견딤
호스트 인터페이스
PCIe Gen3 x4
전력 소비
최대 <20W · 일반 ~6W
방열 솔루션
패시브 히트싱크 — 팬리스 작동
폼팩터
로우 프로파일 PCIe 카드
비디오 처리
RK3588 VPU — 8K 디코딩, 4K 인코딩
OS 지원
Linux (Ubuntu) · Windows · Android AOSP
AI 프레임워크
DXNN SDK를 통한 ONNX · PyTorch · TensorFlow
호환성
PCIe 슬롯이 있는 모든 x86 데스크톱/워크스테이션
예상 소비자가
$590 USD
특허 출원 중인 기술
KV-Pinning State Capsules SCMP TAPIM PNCA OCCS HCIS TOKENFLOW STREAMFLOW
관찰된 효과

꽂는 순간 무엇이 달라지는가.

31TOPS
전용 AI
2027 확장 가능
8×
더 큰 컨텍스트
+325%
더 빠른 장문 컨텍스트
토큰 생성
100%
재부팅 후
컨텍스트 지속
6W
일반 항시 작동
전력 소비

통제된 내부 테스트에서 관찰됨. 실제 결과는 구성에 따라 달라집니다.

비교

오늘의 당신 PC vs 당신 PC + NYMPH.

시나리오
NYMPH 없이
NYMPH와 함께
세션을 닫고 돌아오기
전체 컨텍스트 소실
즉시 재개
PC 재부팅
모든 AI 상태 파괴됨
NAND에 100% 보존
프로젝트 간 전환
이전 것 파괴됨
모두 캐시됨, 즉각 전환
8시간 연속 세션
점진적 저하
1시간부터 8시간까지 안정적
LLM + 비전 + 오디오
한 번에 하나씩
전부 병렬 (전용)
밤새 AI 에이전트 실행
GPU 350W, PC 사용 불가
NYMPH 6W, PC 자유
GPU 모델 용량
VRAM에 의해 제한됨
크게 확장됨
클라우드 AI 토큰 비용
대부분이 재계산
대폭 감소
DeepX 검증 · DX-M1M · ~5W

전용 실리콘에서의 처리량.

모든 워크로드가 DX-M1M에서 실행되는 동안 호스트 GPU는 100% 가용 상태를 유지합니다.

모델 / 작업
처리량
출처
MobileNetV2 (분류)
3,523 FPS
검증됨
ResNet50 (분류)
1,186 FPS
검증됨
YOLOv8L (탐지)
366 FPS
검증됨
DeepLabV3 (분할)
223 FPS
검증됨
자세 추정
200+ FPS
검증됨

DeepX 벤치마크는 공개된 Model Zoo 데이터 기준.

활용 사례

누구를 위한 것인가.

AI 개발자

지속형 메모리 모델, 상태 보존 에이전트

비공개 데이터에 대한 로컬 파인튜닝. 클라우드급 기능을 갖춘 모든 ONNX 모델. 오픈 SDK.

파워 유저

더 낮은 비용으로 더 빠른 클라우드 워크플로

토큰 비용이 대폭 줄어든 Claude Code, ChatGPT, Cursor. 여러 개의 캐시된 컨텍스트. 음성, 비전, 언어 병렬 처리.

게이머 & 크리에이터

인지형 NPC, AI 게임 마스터

200+ FPS 자세 탐지. SD/Flux + LLM 동시 실행. 게임 FPS에 영향 제로.

스트리머

모더레이션, 자막, 오버레이 — 병렬로

AI 채팅 모더레이션, 실시간 자막, 탐지 오버레이 — GPU가 게임과 인코딩을 처리하는 동안 모두 NYMPH에서.

로컬 AI 애호가

확장된 컨텍스트, 즉각적인 모델 전환

확장된 컨텍스트를 갖춘 Llama, Mistral, DeepSeek. 세션을 넘어 당신을 기억하는 모델. Ollama 즉각 전환.

프라이버시 우선 사용자

100% 로컬 AI · 완전한 주권

아무것도 당신의 머신을 떠나지 않습니다. 완전한 오프라인 인지 시스템. 특허 출원 중인 아키텍처, 오직 당신의 데이터만.

OPEN SDK

오픈 SDK 위에서 구축하세요.

NYMPH SDK는 오픈소스 소프트웨어로 공개됩니다. 하드웨어는 독점입니다. 생태계는 무료입니다.

01
지속형 메모리 모델
수 주, 수 개월에 걸쳐 지식을 축적하는 AI. 사용자가 소유하고 제어하는 하드웨어 수준의 상태.
02
실시간 멀티모달 파이프라인
전용 프로세서에서의 오디오, 비전, 언어. 순차적이 아니라 동시적. 총 20W 미만.
03
상태 보존 자율 에이전트
충돌, 재부팅, 정전을 견딥니다. 중단된 정확한 지점에서 재개. ~6W로 무기한 실행.
04
비공개 데이터에 대한 로컬 파인튜닝
NYMPH가 추론과 상태를 처리하는 동안 GPU가 학습합니다. 비공개 데이터는 결코 머신을 떠나지 않습니다.
05
모든 ONNX 호환 모델
Llama, Mistral, Phi, Qwen, DeepSeek — 데스크톱에서 클라우드급 기능.
06
인지형 게임 캐릭터
지속형 메모리, 진화하는 행동, 렌더링 영향 제로. 새로운 인터랙티브 카테고리.
07
로컬 AI 보안 카메라
RK3588 VPU가 8K를 디코딩하고, DX-M1M이 탐지를 실행합니다. 다중 스트림, 완전한 프라이버시.
실리콘 파트너

최고 수준의 실리콘.
우리의 인지 아키텍처.

NYMPH는 실리콘을 제조하지 않습니다. 우리는 구할 수 있는 최고의 것을 통합하고 — 그것이 기억하게 만듭니다. 지속형 인지 아키텍처와 카드 자체는 Punky Tiger Labs의 IP입니다.

DeepX
AI 실리콘
DX-M1M 신경망 프로세서 · ~5W에서 25 TOPS INT8. 독점 IQ8 양자화가 INT8에서 FP32 수준의 정확도를 구현합니다. CES 2026 혁신상 2개 수상.
CES 2026 ×2 EE Times '24 올해의 제품 WEF MINDS '25 수상
Rockchip
시스템 SoC
RK3588 SoC · 8코어 ARM CPU + 6 TOPS NPU + Mali-G610 GPU + 8K VPU. 인지 파이프라인을 조율하는 시스템 오케스트레이터.
8코어 ARM 8K 디코딩 Mali-G610
업그레이드 경로 · 2027

NYMPH V2: 미래를 꽂으세요.

NYMPH S-Quantum은 두 개의 M.2 2280 슬롯과 함께 출고됩니다. 첫 번째는 DX-M1M을 담습니다. 두 번째는 비어 있습니다 — Samsung의 2nm GAA(Gate-All-Around) 공정 노드 기반의 DeepX 차세대 DX-M2 프로세서를 위한 준비 상태입니다. DX-M2가 출시되면 두 번째 슬롯에 꽂으세요. 새 카드도, 새 드라이버도 필요 없습니다. 상태 손실도 없습니다.

DX-M2 공정 노드
Samsung 2nm GAA (Gate-All-Around)
예상 샘플링
Q3 2026
NYMPH V2 업그레이드 목표
2027
설치
기존 카드의 두 번째 M.2 슬롯에 DX-M2 삽입
호환성
완전한 하위 호환 — V1 SDK, State Capsules, NAND 데이터
결과
하나의 카드에서 DX-M1M + DX-M2 병렬 실행

오늘 하나의 프로세서로 NYMPH를 구매하세요. 내일 다음 세대를 추가하세요. 당신의 상태, 데이터, 모델 — 모두 그대로 이어집니다.

연구실에서

AI는 매 세션마다 초기화되어서는 안 됩니다.
AI는 기억해야 합니다.

LLM 패러다임의 진화 — 대체가 아닙니다. 하드웨어 수준의 지속형 상태가 세션을 넘어 지식을 축적합니다. 특허 출원 중인 아키텍처가 전체 기술 스택을 아우릅니다.

다른 미래를 위한 다른 제품.
AI가 기억하는 미래.
몇 주 안에

최초의 소비자용 AI 하드웨어.
게이머, 개발자, 그리고 하드코어 사용자를 위해.

S-Quantum은 출시까지 몇 주 남지 않았습니다. 이메일을 남겨 주시면 물량, 가격, 출시 일정이 확정될 때 연락드리겠습니다 — 스팸 없이, 오직 제품 소식만.

사전 주문 → →