“AIIA DNN benchmark V0.5”評估的標準較為嚴苛,包含四大典型場景和兩大類評測指標等,指標包含速度(fps)和算法性能,如top1 、top5、mAP、mIoU、PSNR等。同時,這也是深度學習處理器領域首次區分整型和浮點對比的Benchmark。福州瑞芯微電子的RK3399開發板展現出搶眼數據。
采用28nm工藝的福州瑞芯微電子RK3399開發板,在評估中展現出超強性能。評估數據顯示,在浮點模型不需要定點化重新訓練的情況下,int8計算以精度損失最大為1%的代價,達到相對于浮點計算兩倍的性能。
此外,在Interpretation評測中,AIIA第一次嘗試在基準測試中將量化和浮點模型分開評測。而福州瑞芯微電子RK3399開發板同樣取得多項優異數據,在業內處于前列水平。
值得一提的是,福州瑞芯微電子RK3399開發板數據搶眼的背后,離不開前沿技術的支持。比如RK3399融入了Tengine,后者是由OPEN AI LAB開發的一款輕量級模塊化高性能神經網絡推理引擎。Tengine專門針對Arm嵌入式設備優化,且無需依賴第三方庫,可跨平臺使用支持Android、Liunx等。
Tengine支持各類常見卷積神經網絡,包括SqueezeNet,MobileNet,AlexNet,ResNet等,支持層融合、8位量化等優化策略。通過調用針對不同CPU微構架優化的HCL庫,能將Arm CPU的性能充分挖掘出來。而RK3399的Cortex-A72單線程運行移動端常用的MobileNet,一次只需要111ms。
在IoT設備、智能交互設備、個人電腦、機器人等人工智能設備的創新與研發上,福州瑞芯微電子已經在技術上展現出領先優勢,除了RK3399以外,旗艦級人工智能芯片RK3399Pro同樣極具看點,其首次采用CPU+GPU+NPU的硬件結構設計。這一芯片集成的NPU(神經網絡處理器)融合了福州瑞芯微電子在機器視覺、語音處理、深度學習等方面的關鍵技術,片上NPU運算性能高達3.0TOPs,具備高性能、低功耗、開發易等優勢。
人工智能芯片大變革時代,人工智能產業發展聯盟(AIIA) “AIIA DNN benchmark V0.5”權威測試平臺的亮相以及首輪數據發布,或將終結AI芯片缺乏統一數據測試標準的局面,加速人工智能芯片的技術蛻變與進化。