Omnitek DPU Demonstrates Highest Performance Convolutional Neural Network on an FPGA
The Omnitek DPU is a world class performing FPGA-based Processing Unit for Machine Learning in Datacentres and embedded applications.
超ハイエンドチップによる超速処理のCNN IP-Coreのようです。
・Xilinx®Virtex®UltraScale +™XCVU9P-3で5,300fps
・TensorFlowなどの標準フレームワークを使用
・C/C++やPythonによる完全なSW制御が可能で、FPGA設計の専門知識は不要
一方、こちらはローエンドFPGAであるLattice用のCNNアクセラレータIP
https://news.mynavi.jp/article/20181012-705307/
・軽量FPGAのiCE40 UltraPlus向けは従来は1bitだけだったが、新たに6bit(!)の量子化にも対応
・中規模FPGAのECP 5向けは、DRAMのメモリ帯域幅を従来の16bit幅から32bit幅に拡大
6bitって何でしょう?Intel FPGAの12bit精度と同じく、DSPの仕様上の最適bit長でしょうか。