201803280329如何辨識恍惚的證件字號?

專業翻譯社

比方這個程式目前在完整的身分證影象上辨識成分證字號的時間只需約0.06秒!以華頓翻譯公司手邊約20張的樣本(大都是很恍惚的),我的辨識成功率是百分之百!這就是商業化的水準!證件辨識的成功率如果低於99%就很難賣出去了!我目前也不敢傳播鼓吹>99%,最少要等嘗試過的樣本數過百以後才能嗆聲的!要這麼快又這麼準,細節還有許多,族繁不及備載的!

後臺複雜 + 雷射標籤 + 影像失焦 亮度不均= Mission Impossible

理論上,各類證件上的文字應當是要很清晰的!然則經常又為了避免偽造,加上了複雜的配景斑紋,乃至貼上雷射光影標籤,用人眼辨識還好,要用程式辨識就變得很難了!近些年還有一個演變是:獲得證件影像的體式格局已經漸漸從掃描釀成拍照了!緣由不言可喻,掃描的益處原本是對照像解析度高,但是速度慢,如今攝影解析度已很高了,當然是拍照取影象比力快,時候就是金錢啊!翻譯

其實比來華頓翻譯公司RD前進神速,我們擔任文件影象辨識垂問的例行工作多半已交由RD去寫程式,可是這個問題太具挑戰性,固然是御駕親征師傅出馬我親身操刀囉!果真三四個工作天就搞定了!但真的是拼出了這三四年積累的所有經驗與實力,最高級的車牌辨識對象箱都悉數用上了!首先是選擇配景與文字間亮度差別最大的綠色作為灰階圖的根蒂根基:

但是已經足以用統計體例概略知道這行字的上下鴻溝,也就是字的高度,有了字高,字寬固然也可以估量了!這是標楷體字型,寬高比固定是3:5嘛!接下來先將「應當」屬於統一個字的破裂目的上下「融會」一下:

好玩吧!鄉間先生毫不小氣,一本當先生的精力,能教的就教,希望更多人也能學會!固然這只是一些原則道理說明罷了,應該可讓大師廢除一些神秘感增加挑戰影象辨識範疇的信心,然則要跟老師我一樣利害可以靠這個賺錢,還必需努力一段時候的!簡單說就是理論與實作的差距!

融會之後兩個「2」字連在一路了,看它「胖」成那樣,固然知道是兩個字的連體嬰,那就開刀分割吧!那麼誰人「4」呢?瘦得很可疑?參考與擺佈目標的距離也差許多,應該不會是特殊窄的「1」!那就給它充氣膨脹到應有的寬度吧!

但是很不幸的,只如果攝影就有可能失焦,或亮度不均,一邊亮一邊暗之類的,這些都是利用掃描影象時絕對不會産生的新狀態!原本已被防偽機制弄得很難辨識的證件號碼,一旦失焦或亮度不均勻就是影象辨識工作者的災害了!如下圖:

再搬出可以跟著區域亮度轉變,動態調劑門檻值的二值化程式作二值化(變诟谇圖)的動作,這可是用來處置夜間車牌受車燈影響亮度不均時的密技!如上圖左側亮右邊暗,一般的全圖均一門坎二值化法式鐵定不行,左側的「F」看到時右側的字就是一團漿糊了!我的方法作出來至少每個字都看得到基本的內容:

接下來就是根據塊狀區域入手下手「認字」了!第一步當然很亂:

怎麼樣?和翻譯公司的眼睛判斷的成績差不多了吧?此時再拿標準字模去比對,就不難知道他們是甚麼字了!事實上因為怕恍惚的字產生毛邊或缺口,會影響字的位置判定,模板還會上下左右移動一個小局限,看看哪一個字模的契合度最高,就是阿誰字了!謎底如下:



引用自: http://blog.udn.com/yccsonar/99502727有關各國語文翻譯公證的問題歡迎諮詢華頓翻譯公司02-77260932
沒有上一則|日誌首頁|沒有下一則
回應
關鍵字
    沒有新回應!





Powered by Xuite