我國電力行業(yè)發(fā)展迅速,電表作為測(cè)電設(shè)備經(jīng)歷了普通電表、預(yù)付費(fèi)電表和智能電表三個(gè)階段得發(fā)展。在產(chǎn)業(yè)場(chǎng)景中,表得種類多達(dá)十幾種,過去依賴人工抄表,成本很高。如果能夠采集到大量電表支持,借助人工智能技術(shù)批量檢測(cè)和識(shí)別,將會(huì)大幅提升效率。
本次飛槳產(chǎn)業(yè)實(shí)踐范例庫開源電表讀數(shù)識(shí)別場(chǎng)景應(yīng)用,提供了從數(shù)據(jù)準(zhǔn)備、技術(shù)方案、模型訓(xùn)練優(yōu)化,到模型部署得全流程可復(fù)用方案,降低產(chǎn)業(yè)落地門檻。
?項(xiàng)目鏈接?
github/PaddlePaddle/awesome-DeepLearning
所有源碼及教程均已開源,歡迎大家使用,star 鼓勵(lì)~
基于深度學(xué)習(xí)技術(shù)
實(shí)現(xiàn)電表讀數(shù)識(shí)別
本場(chǎng)景要解決多類別電表識(shí)別任務(wù),從技術(shù)上需要對(duì)多種類別得電表表數(shù)和表號(hào)進(jìn)行檢測(cè)再識(shí)別,從數(shù)據(jù)到模型面臨著多重問題。
項(xiàng)目難點(diǎn):
本項(xiàng)目將一一解決這些難點(diǎn)。
項(xiàng)目方案:
基于上述難點(diǎn),飛槳開發(fā)者技術(shù)可能不斷進(jìn)行嘗試,最終選用了飛槳文字識(shí)別套件 PaddleOCR 中得 PP-OCR 模型進(jìn)行了微調(diào)與優(yōu)化,其檢測(cè)部分基于 DB 得分割方法實(shí)現(xiàn),直接解決了電表數(shù)據(jù)中得傾斜問題,通過再造數(shù)據(jù)集來擴(kuò)充識(shí)別數(shù)據(jù)集,訓(xùn)練識(shí)別模型。PP-OCR 模型經(jīng)過大量實(shí)驗(yàn),其泛化性也足以支撐復(fù)雜垂類場(chǎng)景下得效果。
在數(shù)據(jù)標(biāo)注工具上,使用 PPOCRLabel 實(shí)現(xiàn)半自動(dòng)標(biāo)注,內(nèi)嵌 PP-OCR 模型,一鍵實(shí)現(xiàn)機(jī)器自動(dòng)標(biāo)注,且具有便捷得修改體驗(yàn)。支持四點(diǎn)框、矩形框標(biāo)注模式,導(dǎo)出格式可直接用于 PaddleOCR 訓(xùn)練,標(biāo)注效率顯著提升。
方案優(yōu)化:
在優(yōu)化方面,首先對(duì) PP-OCR 模型得檢測(cè)部分進(jìn)行初步微調(diào),然后通過對(duì)數(shù)據(jù)得進(jìn)一步分析,發(fā)現(xiàn)原始圖像分辨率較大,進(jìn)而調(diào)整 EastRandomCropData 得尺寸,放大輸入模型前得圖像尺度。通過 CopyPaste 數(shù)據(jù)增強(qiáng)解決數(shù)據(jù)量小得問題,并且根據(jù)實(shí)際情況調(diào)小學(xué)習(xí)率。
項(xiàng)目效果:
最終在評(píng)測(cè)數(shù)據(jù)集上從原先得 Hmeans=0.3 優(yōu)化到0.85。除此之外,本項(xiàng)目也嘗試了一部分目標(biāo)檢測(cè)算法。具體得優(yōu)化過程和詳細(xì)解釋,歡迎大家!
微調(diào)前后對(duì)比
部署方面使用飛槳原生推理庫 Paddle Inference 完成,滿足用戶批量預(yù)測(cè)、數(shù)據(jù)安全性高、延遲低得需求,快速在本地完成部署方案。
產(chǎn)業(yè)實(shí)踐范例教程
助力企業(yè)跨越 AI 落地鴻溝
飛槳產(chǎn)業(yè)實(shí)踐范例,致力于加速 AI 在產(chǎn)業(yè)落地得前進(jìn)路徑,減少理論技術(shù)與產(chǎn)業(yè)應(yīng)用得差距。范例于產(chǎn)業(yè)真實(shí)業(yè)務(wù)場(chǎng)景,通過完整得代碼實(shí)現(xiàn),提供從數(shù)據(jù)準(zhǔn)備到模型部署得方案過程解析,堪稱產(chǎn)業(yè)落地得“自動(dòng)導(dǎo)航”。