mirror of
https://github.com/tesseract-ocr/tesseract.git
synced 2024-12-12 15:39:04 +08:00
Provide more details for sucessfull running of unittests.
This commit is contained in:
parent
9d967cb1ae
commit
7389a2750a
@ -1,5 +1,82 @@
|
||||
Unit Testing for Tesseract
|
||||
----------
|
||||
# Unit Testing for Tesseract
|
||||
|
||||
|
||||
## Requirements
|
||||
|
||||
### Files and structure
|
||||
```
|
||||
|
||||
├── langdata_lstm
|
||||
│ ├── common.punc
|
||||
│ ├── common.unicharambigs
|
||||
│ ├── desired_bigrams.txt
|
||||
│ ├── eng
|
||||
│ │ ├── desired_characters
|
||||
│ │ ├── eng.config
|
||||
│ │ ├── eng.numbers
|
||||
│ │ ├── eng.punc
|
||||
│ │ ├── eng.singles_text
|
||||
│ │ ├── eng.training_text
|
||||
│ │ ├── eng.unicharambigs
|
||||
│ │ ├── eng.wordlist
|
||||
│ │ └── okfonts.txt
|
||||
│ ├── extended
|
||||
│ │ └── extended.config
|
||||
│ ├── extendedhin
|
||||
│ │ └── extendedhin.config
|
||||
│ ├── font_properties
|
||||
│ ├── forbidden_characters_default
|
||||
│ ├── hin
|
||||
│ │ ├── hin.config
|
||||
│ │ ├── hin.numbers
|
||||
│ │ ├── hin.punc
|
||||
│ │ └── hin.wordlist
|
||||
│ ├── kan
|
||||
│ │ └── kan.config
|
||||
│ ├── kor
|
||||
│ │ └── kor.config
|
||||
│ ├── osd
|
||||
│ │ └── osd.unicharset
|
||||
│ └── radical-stroke.txt
|
||||
├── tessdata
|
||||
│ ├── ara.traineddata
|
||||
│ ├── chi_tra.traineddata
|
||||
│ ├── eng.traineddata
|
||||
│ ├── heb.traineddata
|
||||
│ ├── hin.traineddata
|
||||
│ ├── jpn.traineddata
|
||||
│ ├── kmr.traineddata
|
||||
│ ├── osd.traineddata
|
||||
│ └── vie.traineddata
|
||||
├── tessdata_best
|
||||
│ ├── eng.traineddata
|
||||
│ ├── fra.traineddata
|
||||
│ ├── kmr.traineddata
|
||||
│ └── osd.traineddata
|
||||
├── tessdata_fast
|
||||
│ ├── eng.traineddata
|
||||
│ ├── kmr.traineddata
|
||||
│ ├── osd.traineddata
|
||||
│ └── script
|
||||
│ └── Latin.traineddata
|
||||
└── tesseract
|
||||
├── abseil
|
||||
...
|
||||
├── test
|
||||
├── unittest
|
||||
└── VERSION
|
||||
```
|
||||
|
||||
### Fonts
|
||||
|
||||
* Microsoft fonts: arialbi.ttf, times.ttf, verdana.ttf - [instalation guide](https://www.makeuseof.com/tag/how-to-install-microsoft-core-fonts-in-ubuntu-linux/)
|
||||
* [ae_Arab.ttf](https://www.wfonts.com/download/data/2014/12/03/ae-arab/ae-arab.zip)
|
||||
* dejavu-fonts: [DejaVuSans-ExtraLight.ttf](https://dejavu-fonts.github.io/Download.html)
|
||||
* [Lohit-Hindi.ttf](https://raw.githubusercontent.com/pratul/packageofpractices/master/assets/fonts/Lohit-Hindi.ttf)
|
||||
* [UnBatang.ttf](https://raw.githubusercontent.com/byrongibson/fonts/master/backup/truetype.original/unfonts-core/UnBatang.ttf)
|
||||
|
||||
|
||||
## Run tests
|
||||
|
||||
To run the tests, do the following in tesseract folder
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user