딥실리콘

deepsilicon

하드웨어와 소프트웨어의 통합 최적화를 통해 AI 모델의 추론 속도와 에너지 효율을 극대화하는 가속 솔루션

유료WebNVIDIA GPUs

웹사이트 방문하기ww1.deepsilicon.net

데이터로봇와(과) 비교하기

소개

DeepSilicon(YC S24)은 Ternary(3진수) 연산 기술을 활용하여 신경망을 더 빠르고 경제적으로 실행하는 하드웨어-소프트웨어 통합 솔루션입니다. Microsoft의 BitNet 논문에서 영감을 받아, 가중치를 -1, 0, 1로 변환함으로써 VRAM 사용량을 5배 줄이고 추론 속도를 비약적으로 향상시킵니다. 기존 하드웨어 가속뿐만 아니라 전용 ASIC 설계를 통해 엣지 디바이스에서의 LLM 실행 장벽을 낮추고 있습니다.

활용 워크플로우

입력

Hugging Face Transformer 모델PyTorch 가중치 소스NVIDIA GPU/Jetson 환경 설정 데이터양자화 보정용(Calibration) 데이터셋

딥실리콘

BitNet 기반 Ternary(-1, 0, 1) 가중치 변환DeepSilicon 전용 소프트웨어 커널 매핑레이어 통합(Kernel Fusion) 및 VRAM 최적화하드웨어별 최적화 컴파일 및 바이너리 생성

출력

2-bit 기반 양자화 모델 바이너리VRAM 점유율 분석 리포트(기존 대비 5배 절감)추론 처리 속도(Throughput) 최적화 결과Edge 디바이스 전용 배포 패키지

소프트웨어 가속 경로 (Software-Only)

기존 NVIDIA GPU 환경에서 DeepSilicon 커스텀 커널을 사용하여 즉각적으로 메모리 사용량을 줄이고 성능을 향상시킵니다.

전용 하드웨어 최적화 경로 (Custom ASIC)

DeepSilicon이 개발한 전용 칩셋 및 Chiplet 아키텍처에 맞춤형으로 모델을 최적화하여 극강의 전력 효율을 구현합니다.

핵심 차별점: Ternary(3진수) 양자화 기술을 통해 거대 모델의 메모리 점유율을 5배 낮추면서도 정확도 손실 없이 최대 20배 빠른 추론 속도를 제공합니다.

주요 기능

Ternary(3진수) 양자화 기술
2-bit 가중치 압축 시스템
NVIDIA Jetson 특화 커스텀 커널
전용 ASIC 기반 하드웨어-소프트웨어 공동 설계

장점 & 단점

웹검색을 통해 수집된 사용자 피드백 정보입니다

장점

RAM 사용량을 5배까지 절감
대규모 AI 모델의 즉시 배포 지원
신경망 실행 시 최대 20배 속도 향상
지연 시간 및 에너지 소모량 감소

가격 정보

유료시작 가격: 공식적으로 공개된 가격 플랜은 없으며, 개별 문의를 통해 맞춤 견적을 제공하는 B2B 형태입니다. 단, YC(Y Combinator) 선정 기업들에게는 모델 훈련 및 배포 비용의 50% 할인 혜택을 제공한 기록이 있습니다.

현재 해당 서비스는 운영이 중단되었거나 웹사이트를 통한 공식적인 가격 정보를 제공하지 않아 정보를 확인할 수 없습니다. 과거 신경망 실행 최적화 기술을 제공했으나, 현재는 일반적인 구매나 구독이 불가능한 상태로 파악됩니다.

가격표 확인하기

활용 사례

단일 칩 내 수십억 파라미터 LLM 구동
엣지 디바이스용 실시간 비전 시스템
데이터 센터의 VRAM 비용 절감

대상 사용자

AI 연구원머신러닝 엔지니어

연동 서비스

GitHubPyTorchNVIDIA

유료 · 공식적으로 공개된 가격 플랜은 없으며, 개별 문의를 통해 맞춤 견적을 제공하는 B2B 형태입니다. 단, YC(Y Combinator) 선정 기업들에게는 모델 훈련 및 배포 비용의 50% 할인 혜택을 제공한 기록이 있습니다.WebNVIDIA GPUsproprietary

회사 프로필

deepsilicon · 2024년 설립 · 미국 샌프란시스코

3.8 / 5.0

에디터 스코어

4.6 / 10

인기도

2명

직원 규모

$500K

총 투자

Proprietary (독점)독점 소프트웨어. 소스 코드 비공개, 라이선스 조건에 따라 사용.

라이선스