
| IP명 | 고성능 Fused Multiply-Add(FMA)를 사용한 AI 가속기 설계 | ||
|---|---|---|---|
| Category | Digital | Application | AI 가속기 | 
| 실설계면적 | 4㎛ X 4㎛ | 공급 전압 | 1.8V | 
| IP유형 | Hard IP | 동작속도 | 1Hz | 
| 검증단계 | Silicon | 참여공정 | SF028-2401 | 
| IP개요 | 본 연구는 booth radix 4와 wallace-tree를 이용하여 FP32 FMA 연산기를 구현한다. FMA로 구성된 SYSTOLIC_ARRAY는 곱셈과 덧셈을 동시에 함으로 CLOCK TIMING을 최소화 할수 있고 이외의 SPECIAL FUNCTION들도 최적화 하여 DEEP LEARNING에 필요한 행렬 연산과 SPECTIAL FUNCTION들을 가속화 한다. MNIST dataset을 이 칩을 통해 TRANSFORMER architecture 연산을 수행함으로서 추론 속도를 즉정한다. | ||
| - 레이아웃 사진 -   | |||



