Skip to content

iw5420/tess4j_test

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

專案內容介紹

本專案為java base專案
使用tess4j套件做ocr測試
使用的語言包為繁體中文及英文包
來源: https://github.com/tesseract-ocr/tessdata_best
特色: 精確度較高, 處理上較緩慢

以下測試結果
右邊是原圖, 左邊是被轉換過後的文字

  • 測試結果1
    繁體中文普通格式的話
    精確度相當高

image

  • 測試結果2
    如果有中英混雜
    又有加上數字
    精確度將會降低

image

  • 測試結果3 如果有中英混雜
    又有加上數字
    又加上框限的話
    精確度會變得非常差

image

目前測試結果
如果要產生報告類型
使用一般開源套件尚不可行

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages