エッジAIを安価・高速に、FPGAを駆使するベンチャー (1/2)
LeapMindは2018年8月31日、東京都内で同社初となるプライベートカンファレンス「DeLTA TECH 2018」を開催した。このイベントでは、LeapMindの強みとなる技術が多く明かされていた。
LeapMind社は、DeLTA-FamilyというWebベースのサービス群で自社の技術を手軽に提供できる仕組みを築くとともに、技術的にも大きなブレイクスルーを達成しています。
低消費電力なSoC FPGAによる組込みDeep Learning物体検出タスクにおいて推論スピード10.5fpsを達成
https://leapmind.io/news/content/?id=2330
CycloneクラスのFPGAで物体検出を10.5fpsで実行できるのは、かなり凄いことです。
(おそらく画像サイズや検出数、分類数に制約があるとはいえ)
まず、YOLOもSSDも、そのままのネットワークではFPGAに入りません。ネットワークの各層を、機能を保ったまま、FPGAが得な方式に、しかもできるだけリソースサイズを小さくして、学習効率と推論精度とFPGA使用率と処理速度のバランスを最適にする必要があります。おそらく、CNN部分はFPGAが得意なVGG系へ変更し、量子化、枝刈りなどを駆使しているものと思われますが、他にローエンドFPGAで実現できた例を聞いていないので、様々な困難があるのだと思われます。
ハイエンドFPGAのコストは他のAIチップに比べてかなり高く、FPGAを実用的にAIで使うにはCycloneVクラスの価格帯がベストなので、CycloneVで一般物体検知AIが動くことで、FPGAの可能性が一気に広がるのではないかと思います。