mirror of
https://github.com/tesseract-ocr/tesseract.git
synced 2025-08-06 13:56:47 +08:00
Preparations for unicodization
git-svn-id: https://tesseract-ocr.googlecode.com/svn/trunk@35 d0cd1f9f-072b-0410-8dd7-cf729c803f20
This commit is contained in:
parent
0a53f8c5bf
commit
f9d4015c3d
39
tessdata/eng.DangAmbigs
Executable file
39
tessdata/eng.DangAmbigs
Executable file
@ -0,0 +1,39 @@
|
|||||||
|
m rn
|
||||||
|
rn m
|
||||||
|
m in
|
||||||
|
in m
|
||||||
|
d cl
|
||||||
|
cl d
|
||||||
|
nn rm
|
||||||
|
rm nn
|
||||||
|
n ri
|
||||||
|
ri n
|
||||||
|
li h
|
||||||
|
lr h
|
||||||
|
ii u
|
||||||
|
ii n
|
||||||
|
ni m
|
||||||
|
iii m
|
||||||
|
ll H
|
||||||
|
I-I H
|
||||||
|
vv w
|
||||||
|
VV W
|
||||||
|
t f
|
||||||
|
f t
|
||||||
|
a o
|
||||||
|
o a
|
||||||
|
e c
|
||||||
|
c e
|
||||||
|
rr n
|
||||||
|
E fi
|
||||||
|
l< k
|
||||||
|
ld ki
|
||||||
|
lx h
|
||||||
|
xn m
|
||||||
|
ux in
|
||||||
|
r t
|
||||||
|
d tl
|
||||||
|
di th
|
||||||
|
ur in
|
||||||
|
un im
|
||||||
|
u a
|
BIN
tessdata/eng.freq-dawg
Executable file
BIN
tessdata/eng.freq-dawg
Executable file
Binary file not shown.
BIN
tessdata/eng.inttemp
Executable file
BIN
tessdata/eng.inttemp
Executable file
Binary file not shown.
1179
tessdata/eng.normproto
Executable file
1179
tessdata/eng.normproto
Executable file
File diff suppressed because it is too large
Load Diff
92
tessdata/eng.pffmtable
Executable file
92
tessdata/eng.pffmtable
Executable file
@ -0,0 +1,92 @@
|
|||||||
|
! 27
|
||||||
|
# 44
|
||||||
|
$ 45
|
||||||
|
% 46
|
||||||
|
& 46
|
||||||
|
' 7
|
||||||
|
( 28
|
||||||
|
) 27
|
||||||
|
* 14
|
||||||
|
+ 26
|
||||||
|
, 10
|
||||||
|
- 9
|
||||||
|
. 5
|
||||||
|
/ 26
|
||||||
|
0 53
|
||||||
|
1 28
|
||||||
|
2 50
|
||||||
|
3 47
|
||||||
|
4 34
|
||||||
|
5 50
|
||||||
|
6 46
|
||||||
|
7 37
|
||||||
|
8 50
|
||||||
|
9 47
|
||||||
|
: 10
|
||||||
|
; 17
|
||||||
|
< 29
|
||||||
|
= 29
|
||||||
|
> 31
|
||||||
|
? 32
|
||||||
|
@ 54
|
||||||
|
A 45
|
||||||
|
B 52
|
||||||
|
C 47
|
||||||
|
D 57
|
||||||
|
E 49
|
||||||
|
F 41
|
||||||
|
G 58
|
||||||
|
H 56
|
||||||
|
I 26
|
||||||
|
J 33
|
||||||
|
K 51
|
||||||
|
L 34
|
||||||
|
M 55
|
||||||
|
N 53
|
||||||
|
O 56
|
||||||
|
P 44
|
||||||
|
Q 60
|
||||||
|
R 53
|
||||||
|
S 49
|
||||||
|
T 34
|
||||||
|
U 55
|
||||||
|
V 44
|
||||||
|
W 49
|
||||||
|
X 47
|
||||||
|
Y 38
|
||||||
|
Z 46
|
||||||
|
[ 35
|
||||||
|
\ 26
|
||||||
|
] 35
|
||||||
|
^ 18
|
||||||
|
_ 17
|
||||||
|
` 8
|
||||||
|
a 39
|
||||||
|
b 51
|
||||||
|
c 36
|
||||||
|
d 51
|
||||||
|
e 35
|
||||||
|
f 29
|
||||||
|
g 56
|
||||||
|
h 49
|
||||||
|
i 24
|
||||||
|
j 34
|
||||||
|
k 45
|
||||||
|
l 27
|
||||||
|
m 59
|
||||||
|
n 42
|
||||||
|
o 43
|
||||||
|
p 50
|
||||||
|
q 49
|
||||||
|
r 24
|
||||||
|
s 35
|
||||||
|
t 28
|
||||||
|
u 43
|
||||||
|
v 33
|
||||||
|
w 40
|
||||||
|
x 37
|
||||||
|
y 41
|
||||||
|
z 36
|
||||||
|
{ 34
|
||||||
|
} 34
|
||||||
|
~ 18
|
95
tessdata/eng.unicharset
Normal file
95
tessdata/eng.unicharset
Normal file
@ -0,0 +1,95 @@
|
|||||||
|
94
|
||||||
|
NULL
|
||||||
|
!
|
||||||
|
"
|
||||||
|
#
|
||||||
|
$
|
||||||
|
%
|
||||||
|
&
|
||||||
|
'
|
||||||
|
(
|
||||||
|
)
|
||||||
|
*
|
||||||
|
+
|
||||||
|
,
|
||||||
|
-
|
||||||
|
.
|
||||||
|
/
|
||||||
|
0
|
||||||
|
1
|
||||||
|
2
|
||||||
|
3
|
||||||
|
4
|
||||||
|
5
|
||||||
|
6
|
||||||
|
7
|
||||||
|
8
|
||||||
|
9
|
||||||
|
:
|
||||||
|
;
|
||||||
|
<
|
||||||
|
=
|
||||||
|
>
|
||||||
|
?
|
||||||
|
@
|
||||||
|
A
|
||||||
|
B
|
||||||
|
C
|
||||||
|
D
|
||||||
|
E
|
||||||
|
F
|
||||||
|
G
|
||||||
|
H
|
||||||
|
I
|
||||||
|
J
|
||||||
|
K
|
||||||
|
L
|
||||||
|
M
|
||||||
|
N
|
||||||
|
O
|
||||||
|
P
|
||||||
|
Q
|
||||||
|
R
|
||||||
|
S
|
||||||
|
T
|
||||||
|
U
|
||||||
|
V
|
||||||
|
W
|
||||||
|
X
|
||||||
|
Y
|
||||||
|
Z
|
||||||
|
[
|
||||||
|
\
|
||||||
|
]
|
||||||
|
_
|
||||||
|
`
|
||||||
|
a
|
||||||
|
b
|
||||||
|
c
|
||||||
|
d
|
||||||
|
e
|
||||||
|
f
|
||||||
|
g
|
||||||
|
h
|
||||||
|
i
|
||||||
|
j
|
||||||
|
k
|
||||||
|
l
|
||||||
|
m
|
||||||
|
n
|
||||||
|
o
|
||||||
|
p
|
||||||
|
q
|
||||||
|
r
|
||||||
|
s
|
||||||
|
t
|
||||||
|
u
|
||||||
|
v
|
||||||
|
w
|
||||||
|
x
|
||||||
|
y
|
||||||
|
z
|
||||||
|
{
|
||||||
|
|
|
||||||
|
}
|
||||||
|
~
|
921
tessdata/eng.user-words
Executable file
921
tessdata/eng.user-words
Executable file
@ -0,0 +1,921 @@
|
|||||||
|
a
|
||||||
|
absurdum
|
||||||
|
ac
|
||||||
|
acres
|
||||||
|
actions
|
||||||
|
adaption
|
||||||
|
adjustments
|
||||||
|
aerobes
|
||||||
|
affairs
|
||||||
|
agents
|
||||||
|
Alan
|
||||||
|
Albert
|
||||||
|
Alberta
|
||||||
|
Alfred
|
||||||
|
Alice
|
||||||
|
Alicia
|
||||||
|
alliances
|
||||||
|
americas
|
||||||
|
analysts
|
||||||
|
announcements
|
||||||
|
anouncements
|
||||||
|
apples
|
||||||
|
applications
|
||||||
|
apricots
|
||||||
|
architectures
|
||||||
|
areas
|
||||||
|
arguments
|
||||||
|
arrangements
|
||||||
|
Arthur
|
||||||
|
artists
|
||||||
|
arts
|
||||||
|
aspects
|
||||||
|
attitudes
|
||||||
|
attractions
|
||||||
|
auctions
|
||||||
|
aug
|
||||||
|
az
|
||||||
|
baccalaureat
|
||||||
|
backlit
|
||||||
|
bags
|
||||||
|
Barbara
|
||||||
|
Barnabas
|
||||||
|
Barry
|
||||||
|
beliefs
|
||||||
|
benchmarks
|
||||||
|
Betty
|
||||||
|
bi
|
||||||
|
bits
|
||||||
|
blades
|
||||||
|
bonaventure
|
||||||
|
brad
|
||||||
|
broadminded
|
||||||
|
broadway
|
||||||
|
broking
|
||||||
|
brows
|
||||||
|
Bruce
|
||||||
|
bs
|
||||||
|
buddha
|
||||||
|
buddhism
|
||||||
|
buddhist
|
||||||
|
buddhists
|
||||||
|
buffers
|
||||||
|
ca
|
||||||
|
caffein
|
||||||
|
calculational
|
||||||
|
calif
|
||||||
|
California
|
||||||
|
cam
|
||||||
|
cams
|
||||||
|
Canadian
|
||||||
|
cancelling
|
||||||
|
capitulated
|
||||||
|
caps
|
||||||
|
Carmel
|
||||||
|
Carolyn
|
||||||
|
Carroll
|
||||||
|
cars
|
||||||
|
cartridges
|
||||||
|
cassette
|
||||||
|
casuality
|
||||||
|
Catherine
|
||||||
|
centre
|
||||||
|
centres
|
||||||
|
chambermaid
|
||||||
|
chapters
|
||||||
|
characteristics
|
||||||
|
characters
|
||||||
|
Charles
|
||||||
|
cheesy
|
||||||
|
cherokee
|
||||||
|
Chicago
|
||||||
|
chloride
|
||||||
|
Christopher
|
||||||
|
Chrysler
|
||||||
|
Churchill
|
||||||
|
Cicero
|
||||||
|
cinema
|
||||||
|
cinemas
|
||||||
|
Claire
|
||||||
|
Clara
|
||||||
|
clark
|
||||||
|
cleaners
|
||||||
|
clients
|
||||||
|
cliffs
|
||||||
|
clubs
|
||||||
|
co
|
||||||
|
codirector
|
||||||
|
coinsurance
|
||||||
|
Columbus
|
||||||
|
combinations
|
||||||
|
combust
|
||||||
|
combustor
|
||||||
|
comparisons
|
||||||
|
components
|
||||||
|
computerised
|
||||||
|
computers
|
||||||
|
con
|
||||||
|
concepts
|
||||||
|
conclusions
|
||||||
|
connections
|
||||||
|
connectors
|
||||||
|
consequences
|
||||||
|
contemporizing
|
||||||
|
continued
|
||||||
|
contra
|
||||||
|
contractors
|
||||||
|
controls
|
||||||
|
coprocessor
|
||||||
|
corequisite
|
||||||
|
corp
|
||||||
|
corridors
|
||||||
|
corrosive
|
||||||
|
costmetology
|
||||||
|
counterparts
|
||||||
|
cpu
|
||||||
|
crops
|
||||||
|
cueing
|
||||||
|
culturess
|
||||||
|
curtis
|
||||||
|
customers
|
||||||
|
cuts
|
||||||
|
cutout
|
||||||
|
cyanide
|
||||||
|
Czechoslovakia
|
||||||
|
dan
|
||||||
|
databases
|
||||||
|
David
|
||||||
|
Davis
|
||||||
|
days
|
||||||
|
dealership
|
||||||
|
Deborah
|
||||||
|
debut
|
||||||
|
decibles
|
||||||
|
declarations
|
||||||
|
deductible
|
||||||
|
defrayed
|
||||||
|
degrees
|
||||||
|
deionized
|
||||||
|
demobilisation
|
||||||
|
densily
|
||||||
|
departments
|
||||||
|
descriptions
|
||||||
|
desensitization
|
||||||
|
desktop
|
||||||
|
developers
|
||||||
|
developments
|
||||||
|
devices
|
||||||
|
dharma
|
||||||
|
diameters
|
||||||
|
Dianne
|
||||||
|
dicators
|
||||||
|
differences
|
||||||
|
digitising
|
||||||
|
directions
|
||||||
|
directorate
|
||||||
|
disadvantages
|
||||||
|
disassembly
|
||||||
|
disclosures
|
||||||
|
discos
|
||||||
|
discs
|
||||||
|
discusing
|
||||||
|
disks
|
||||||
|
districts
|
||||||
|
doe
|
||||||
|
dogs
|
||||||
|
dominican
|
||||||
|
dominicans
|
||||||
|
Donald
|
||||||
|
dos
|
||||||
|
dots
|
||||||
|
Douglas
|
||||||
|
Douglass
|
||||||
|
downsize
|
||||||
|
downsized
|
||||||
|
drugs
|
||||||
|
dumplings
|
||||||
|
duns
|
||||||
|
eastside
|
||||||
|
ecconomic
|
||||||
|
ecconomics
|
||||||
|
ed
|
||||||
|
Edward
|
||||||
|
efforts
|
||||||
|
Egypt
|
||||||
|
eh
|
||||||
|
Einstein
|
||||||
|
Einsteins
|
||||||
|
Elaine
|
||||||
|
electrophotography
|
||||||
|
elements
|
||||||
|
Elizabeth
|
||||||
|
Elliot
|
||||||
|
emory
|
||||||
|
emulsion
|
||||||
|
energized
|
||||||
|
enquiry
|
||||||
|
ent
|
||||||
|
enthusiasts
|
||||||
|
entrylevel
|
||||||
|
environments
|
||||||
|
epilepsy
|
||||||
|
epistemic
|
||||||
|
er
|
||||||
|
eric
|
||||||
|
erosion
|
||||||
|
errors
|
||||||
|
estuary
|
||||||
|
et
|
||||||
|
events
|
||||||
|
everyone's
|
||||||
|
exactions
|
||||||
|
exegesis
|
||||||
|
exhilarating
|
||||||
|
expenditures
|
||||||
|
explanations
|
||||||
|
explicably
|
||||||
|
expo
|
||||||
|
ext
|
||||||
|
extensions
|
||||||
|
eyelevel
|
||||||
|
facts
|
||||||
|
fastidious
|
||||||
|
fathers
|
||||||
|
favourably
|
||||||
|
fax
|
||||||
|
feb
|
||||||
|
feint
|
||||||
|
ferneries
|
||||||
|
files
|
||||||
|
filters
|
||||||
|
Finland
|
||||||
|
fireplaces
|
||||||
|
flavours
|
||||||
|
flights
|
||||||
|
fluency
|
||||||
|
fluidized
|
||||||
|
fluorescent
|
||||||
|
fm
|
||||||
|
forceps
|
||||||
|
forces
|
||||||
|
forefront
|
||||||
|
foreknowledge
|
||||||
|
forman
|
||||||
|
formfeed
|
||||||
|
formletters
|
||||||
|
Francisco
|
||||||
|
Frankfurt
|
||||||
|
friends
|
||||||
|
frond
|
||||||
|
fronds
|
||||||
|
frontage
|
||||||
|
frontseat
|
||||||
|
ft
|
||||||
|
functions
|
||||||
|
funds
|
||||||
|
futures
|
||||||
|
futuristic
|
||||||
|
ga
|
||||||
|
Galileo
|
||||||
|
Garfield
|
||||||
|
Gary
|
||||||
|
gaskets
|
||||||
|
geiger
|
||||||
|
geist
|
||||||
|
gentiles
|
||||||
|
Georgia
|
||||||
|
georgian
|
||||||
|
giants
|
||||||
|
gigabytes
|
||||||
|
glitches
|
||||||
|
Gloria
|
||||||
|
gm
|
||||||
|
gods
|
||||||
|
gordon
|
||||||
|
governments
|
||||||
|
gravitated
|
||||||
|
gremlins
|
||||||
|
greyhound
|
||||||
|
Griffith
|
||||||
|
groups
|
||||||
|
guages
|
||||||
|
Gwen
|
||||||
|
Hague
|
||||||
|
halftone
|
||||||
|
halftones
|
||||||
|
handfull
|
||||||
|
hans
|
||||||
|
hardcopy
|
||||||
|
harkness
|
||||||
|
Harold
|
||||||
|
Harris
|
||||||
|
haven't
|
||||||
|
Hawaii
|
||||||
|
hazards
|
||||||
|
headlights
|
||||||
|
headquartered
|
||||||
|
Helen
|
||||||
|
helicopter
|
||||||
|
helicopters
|
||||||
|
Henderson
|
||||||
|
herbalists
|
||||||
|
hermeneutical
|
||||||
|
hills
|
||||||
|
hindu
|
||||||
|
historians
|
||||||
|
ho
|
||||||
|
hoc
|
||||||
|
homeowners
|
||||||
|
honduras
|
||||||
|
hong
|
||||||
|
hours
|
||||||
|
houses
|
||||||
|
Howard
|
||||||
|
hr
|
||||||
|
hrs
|
||||||
|
humours
|
||||||
|
hwy
|
||||||
|
hyper
|
||||||
|
hypercard
|
||||||
|
hypertalk
|
||||||
|
hz
|
||||||
|
i
|
||||||
|
I'd
|
||||||
|
i.e.
|
||||||
|
i/o
|
||||||
|
IBM
|
||||||
|
iceskating
|
||||||
|
id
|
||||||
|
Idaho
|
||||||
|
ideas
|
||||||
|
identification
|
||||||
|
identify
|
||||||
|
ie
|
||||||
|
ii
|
||||||
|
iii
|
||||||
|
imaged
|
||||||
|
implementations
|
||||||
|
inc
|
||||||
|
individuals
|
||||||
|
inferences
|
||||||
|
infrastructure
|
||||||
|
inoculation
|
||||||
|
inspectors
|
||||||
|
instructions
|
||||||
|
inter
|
||||||
|
interpretative
|
||||||
|
intro
|
||||||
|
intrusive
|
||||||
|
intrusives
|
||||||
|
irs
|
||||||
|
isaac
|
||||||
|
iso
|
||||||
|
Italy
|
||||||
|
its
|
||||||
|
iv
|
||||||
|
ix
|
||||||
|
Jackson
|
||||||
|
jaguar
|
||||||
|
Jan
|
||||||
|
Jane
|
||||||
|
Jeanne
|
||||||
|
Jed
|
||||||
|
Jennie
|
||||||
|
Jennings
|
||||||
|
jets
|
||||||
|
jew
|
||||||
|
jewish
|
||||||
|
Joe
|
||||||
|
John
|
||||||
|
Jonathan
|
||||||
|
Joseph
|
||||||
|
Joyce
|
||||||
|
jr
|
||||||
|
jurist
|
||||||
|
ka
|
||||||
|
Kansas
|
||||||
|
Karl
|
||||||
|
kbytes
|
||||||
|
Kenneth
|
||||||
|
Kepler
|
||||||
|
keyboards
|
||||||
|
kg
|
||||||
|
kids
|
||||||
|
Kirk
|
||||||
|
kits
|
||||||
|
knockout
|
||||||
|
Kong
|
||||||
|
la
|
||||||
|
labels
|
||||||
|
lakeshore
|
||||||
|
lama
|
||||||
|
lamps
|
||||||
|
lan
|
||||||
|
laptop
|
||||||
|
Larry
|
||||||
|
laserjet
|
||||||
|
laserwriter
|
||||||
|
latin
|
||||||
|
Lawrence
|
||||||
|
laws
|
||||||
|
layouts
|
||||||
|
lb
|
||||||
|
lbs
|
||||||
|
lcd
|
||||||
|
le
|
||||||
|
leaching
|
||||||
|
Lebanon
|
||||||
|
leo
|
||||||
|
leon
|
||||||
|
Lewis
|
||||||
|
licensee
|
||||||
|
licensees
|
||||||
|
limitations
|
||||||
|
limpid
|
||||||
|
Lincoln
|
||||||
|
Linda
|
||||||
|
lines
|
||||||
|
listings
|
||||||
|
literatures
|
||||||
|
lithographic
|
||||||
|
lithography
|
||||||
|
logo
|
||||||
|
London
|
||||||
|
Louis
|
||||||
|
Lynda
|
||||||
|
ma
|
||||||
|
mac
|
||||||
|
mach
|
||||||
|
machines
|
||||||
|
macintosh
|
||||||
|
macintoshes
|
||||||
|
maddened
|
||||||
|
magnetically
|
||||||
|
manmade
|
||||||
|
manufacturers
|
||||||
|
Margaret
|
||||||
|
Maria
|
||||||
|
marriages
|
||||||
|
Martha
|
||||||
|
Martin
|
||||||
|
Marvin
|
||||||
|
Mary
|
||||||
|
mbyte
|
||||||
|
mbytes
|
||||||
|
MD
|
||||||
|
meads
|
||||||
|
meals
|
||||||
|
measurements
|
||||||
|
mechanics
|
||||||
|
med
|
||||||
|
megabit
|
||||||
|
megabyte
|
||||||
|
megabytes
|
||||||
|
members
|
||||||
|
menus
|
||||||
|
mesa
|
||||||
|
methods
|
||||||
|
Mexico
|
||||||
|
Meyer
|
||||||
|
mg
|
||||||
|
MHz
|
||||||
|
Michael
|
||||||
|
micro
|
||||||
|
microbes
|
||||||
|
microbial
|
||||||
|
microbiological
|
||||||
|
microbiology
|
||||||
|
microorganism
|
||||||
|
microorganisms
|
||||||
|
microsoft
|
||||||
|
midrange
|
||||||
|
miles
|
||||||
|
mils
|
||||||
|
min
|
||||||
|
ming
|
||||||
|
mini
|
||||||
|
minors
|
||||||
|
mips
|
||||||
|
mirages
|
||||||
|
misnamed
|
||||||
|
missioned
|
||||||
|
Missouri
|
||||||
|
ml
|
||||||
|
mm
|
||||||
|
mobilisation
|
||||||
|
modules
|
||||||
|
monarchic
|
||||||
|
monastary
|
||||||
|
monochrome
|
||||||
|
month's
|
||||||
|
Moscow
|
||||||
|
motorways
|
||||||
|
msg
|
||||||
|
mt
|
||||||
|
multi
|
||||||
|
multimedia
|
||||||
|
multiuser
|
||||||
|
Nurray
|
||||||
|
museums
|
||||||
|
nasa
|
||||||
|
Nathan
|
||||||
|
nations
|
||||||
|
nd
|
||||||
|
ne
|
||||||
|
Nelson
|
||||||
|
neoprene
|
||||||
|
networks
|
||||||
|
newsletter
|
||||||
|
Newton
|
||||||
|
nicholas
|
||||||
|
nitrate
|
||||||
|
NJ
|
||||||
|
nonessential
|
||||||
|
nonimpact
|
||||||
|
noninfectious
|
||||||
|
normative
|
||||||
|
northside
|
||||||
|
nov
|
||||||
|
ns
|
||||||
|
nuns
|
||||||
|
nutrients
|
||||||
|
NY
|
||||||
|
o
|
||||||
|
odometer
|
||||||
|
oem
|
||||||
|
offcampus
|
||||||
|
offchip
|
||||||
|
offsets
|
||||||
|
offshore
|
||||||
|
ohm
|
||||||
|
Olsen
|
||||||
|
omni
|
||||||
|
onchip
|
||||||
|
ondemand
|
||||||
|
ones
|
||||||
|
opinions
|
||||||
|
optimised
|
||||||
|
options
|
||||||
|
orchards
|
||||||
|
oregon
|
||||||
|
organisations
|
||||||
|
organise
|
||||||
|
organises
|
||||||
|
organising
|
||||||
|
orginal
|
||||||
|
os
|
||||||
|
ot
|
||||||
|
Otto
|
||||||
|
outlets
|
||||||
|
outmoded
|
||||||
|
overdrive
|
||||||
|
overdrives
|
||||||
|
Owens
|
||||||
|
pages
|
||||||
|
paperless
|
||||||
|
papers
|
||||||
|
Paris
|
||||||
|
parkway
|
||||||
|
passages
|
||||||
|
passengers
|
||||||
|
passengerside
|
||||||
|
patio
|
||||||
|
Paul
|
||||||
|
payload
|
||||||
|
pb
|
||||||
|
pc
|
||||||
|
pcs
|
||||||
|
pedal
|
||||||
|
pedals
|
||||||
|
penicillin
|
||||||
|
peoples
|
||||||
|
perambulate
|
||||||
|
perils
|
||||||
|
periods
|
||||||
|
persons
|
||||||
|
pesticides
|
||||||
|
petri
|
||||||
|
pharmacological
|
||||||
|
phd
|
||||||
|
phenomenalists
|
||||||
|
pheobe
|
||||||
|
Phil
|
||||||
|
Philip
|
||||||
|
philosophers
|
||||||
|
phlegm
|
||||||
|
photolithography
|
||||||
|
photometer
|
||||||
|
photometrically
|
||||||
|
photosensitive
|
||||||
|
phototypsetter
|
||||||
|
Pierre
|
||||||
|
plainpaper
|
||||||
|
plans
|
||||||
|
platonic
|
||||||
|
platonism
|
||||||
|
plc
|
||||||
|
plots
|
||||||
|
pluralism
|
||||||
|
pm
|
||||||
|
pocketsized
|
||||||
|
Polly
|
||||||
|
poly
|
||||||
|
polygons
|
||||||
|
polypropylene
|
||||||
|
popup
|
||||||
|
potency
|
||||||
|
pre
|
||||||
|
precautions
|
||||||
|
precepts
|
||||||
|
premises
|
||||||
|
prep
|
||||||
|
prerecorded
|
||||||
|
presswork
|
||||||
|
pretested
|
||||||
|
primal
|
||||||
|
primo
|
||||||
|
problems
|
||||||
|
procedures
|
||||||
|
processors
|
||||||
|
prod
|
||||||
|
profits
|
||||||
|
programme
|
||||||
|
programs
|
||||||
|
promissory
|
||||||
|
propane
|
||||||
|
protestant
|
||||||
|
proto
|
||||||
|
protocols
|
||||||
|
prudential
|
||||||
|
ps
|
||||||
|
pubs
|
||||||
|
racism
|
||||||
|
racist
|
||||||
|
rad
|
||||||
|
radioactive
|
||||||
|
rads
|
||||||
|
Ralph
|
||||||
|
ramirez
|
||||||
|
rashers
|
||||||
|
raster
|
||||||
|
rd
|
||||||
|
reactions
|
||||||
|
realists
|
||||||
|
realtor
|
||||||
|
realty
|
||||||
|
reardeck
|
||||||
|
rearview
|
||||||
|
recalibration
|
||||||
|
recipients
|
||||||
|
recommendations
|
||||||
|
recut
|
||||||
|
redskins
|
||||||
|
reductions
|
||||||
|
ref
|
||||||
|
reflections
|
||||||
|
refund
|
||||||
|
reimburse
|
||||||
|
rel
|
||||||
|
requirements
|
||||||
|
resettable
|
||||||
|
residues
|
||||||
|
resources
|
||||||
|
restaurants
|
||||||
|
rev
|
||||||
|
revue
|
||||||
|
rh
|
||||||
|
rhizomes
|
||||||
|
rhodes
|
||||||
|
richard
|
||||||
|
rickey
|
||||||
|
risc
|
||||||
|
rn
|
||||||
|
Robert
|
||||||
|
Roberts
|
||||||
|
rom
|
||||||
|
roots
|
||||||
|
Rosemary
|
||||||
|
rotor
|
||||||
|
rotors
|
||||||
|
rovers
|
||||||
|
rpm
|
||||||
|
rt
|
||||||
|
rugby
|
||||||
|
rumania
|
||||||
|
rumohra
|
||||||
|
rumours
|
||||||
|
Ryan
|
||||||
|
ryhthm
|
||||||
|
s
|
||||||
|
sacrament
|
||||||
|
sales
|
||||||
|
samaritan
|
||||||
|
San
|
||||||
|
Sandra
|
||||||
|
santa
|
||||||
|
Sarah
|
||||||
|
savagery
|
||||||
|
schemes
|
||||||
|
scholasticism
|
||||||
|
schuler
|
||||||
|
sciencefiction
|
||||||
|
sciencehistory
|
||||||
|
scientists
|
||||||
|
scripts
|
||||||
|
scsi
|
||||||
|
sculptors
|
||||||
|
se
|
||||||
|
Sean
|
||||||
|
Seattle
|
||||||
|
sec
|
||||||
|
sel
|
||||||
|
selectable
|
||||||
|
selectivity
|
||||||
|
selfpaced
|
||||||
|
semesters
|
||||||
|
sensors
|
||||||
|
Sept
|
||||||
|
sets
|
||||||
|
shareholders
|
||||||
|
sheerest
|
||||||
|
Shelley
|
||||||
|
Sheridan
|
||||||
|
ships
|
||||||
|
Shirley
|
||||||
|
shortcomings
|
||||||
|
Sidney
|
||||||
|
sig
|
||||||
|
sinch
|
||||||
|
Sinclair
|
||||||
|
singlesheet
|
||||||
|
singleuser
|
||||||
|
sinkhole
|
||||||
|
sists
|
||||||
|
skiers
|
||||||
|
slots
|
||||||
|
socalled
|
||||||
|
solidstate
|
||||||
|
souls
|
||||||
|
sources
|
||||||
|
southeast
|
||||||
|
soy
|
||||||
|
spa
|
||||||
|
spans
|
||||||
|
spilt
|
||||||
|
splines
|
||||||
|
spots
|
||||||
|
sq
|
||||||
|
squelched
|
||||||
|
sr
|
||||||
|
st
|
||||||
|
Stacey
|
||||||
|
stacks
|
||||||
|
standalone
|
||||||
|
states
|
||||||
|
steps
|
||||||
|
sterility
|
||||||
|
Stevens
|
||||||
|
stoics
|
||||||
|
stoves
|
||||||
|
streakings
|
||||||
|
stucco
|
||||||
|
students
|
||||||
|
stylus
|
||||||
|
sulfuric
|
||||||
|
summa
|
||||||
|
summarise
|
||||||
|
summers
|
||||||
|
sums
|
||||||
|
surveyors
|
||||||
|
susceptibility
|
||||||
|
swab
|
||||||
|
swabs
|
||||||
|
Swiss
|
||||||
|
Switzerland
|
||||||
|
sys
|
||||||
|
systems
|
||||||
|
t
|
||||||
|
Taylor
|
||||||
|
teaparty
|
||||||
|
tech
|
||||||
|
techniques
|
||||||
|
tel
|
||||||
|
temperatures
|
||||||
|
Terry
|
||||||
|
tests
|
||||||
|
th
|
||||||
|
theatre
|
||||||
|
theatres
|
||||||
|
thinning
|
||||||
|
thirdparty
|
||||||
|
Thomas
|
||||||
|
tickets
|
||||||
|
timeout
|
||||||
|
Timothy
|
||||||
|
tm
|
||||||
|
Tokyo
|
||||||
|
tollfree
|
||||||
|
tom
|
||||||
|
topics
|
||||||
|
torah
|
||||||
|
touted
|
||||||
|
towels
|
||||||
|
toxin
|
||||||
|
toxins
|
||||||
|
trademarks
|
||||||
|
traditions
|
||||||
|
trans
|
||||||
|
transfers
|
||||||
|
treatments
|
||||||
|
trees
|
||||||
|
trenchant
|
||||||
|
tribes
|
||||||
|
trinity
|
||||||
|
turbidity
|
||||||
|
turnaround
|
||||||
|
tx
|
||||||
|
types
|
||||||
|
typeset
|
||||||
|
typesetter
|
||||||
|
typestyles
|
||||||
|
typology
|
||||||
|
U.S.
|
||||||
|
UK
|
||||||
|
ultrafine
|
||||||
|
unassisted
|
||||||
|
undercut
|
||||||
|
units
|
||||||
|
unix
|
||||||
|
upchucking
|
||||||
|
upriver
|
||||||
|
ups
|
||||||
|
urea
|
||||||
|
USA
|
||||||
|
userfriendly
|
||||||
|
users
|
||||||
|
utilise
|
||||||
|
utilised
|
||||||
|
v
|
||||||
|
va
|
||||||
|
vacillated
|
||||||
|
vehicles
|
||||||
|
vendors
|
||||||
|
veneer
|
||||||
|
vernal
|
||||||
|
vi
|
||||||
|
victorian
|
||||||
|
videotex
|
||||||
|
Vienna
|
||||||
|
vii
|
||||||
|
viii
|
||||||
|
visitors
|
||||||
|
vitro
|
||||||
|
viva
|
||||||
|
vol
|
||||||
|
vols
|
||||||
|
volumes
|
||||||
|
vt
|
||||||
|
Wallace
|
||||||
|
Walter
|
||||||
|
walz
|
||||||
|
Wang
|
||||||
|
warmup
|
||||||
|
wastebasket
|
||||||
|
Wayne
|
||||||
|
ways
|
||||||
|
weatherproof
|
||||||
|
well
|
||||||
|
wellknown
|
||||||
|
welt
|
||||||
|
Wesley
|
||||||
|
westminster
|
||||||
|
weston
|
||||||
|
Williams
|
||||||
|
winchester
|
||||||
|
windows
|
||||||
|
Winston
|
||||||
|
wireframe
|
||||||
|
Wisconsin
|
||||||
|
wittmann
|
||||||
|
words
|
||||||
|
workstation
|
||||||
|
workstations
|
||||||
|
worlds
|
||||||
|
wows
|
||||||
|
wraps
|
||||||
|
x
|
||||||
|
xerographic
|
||||||
|
xi
|
||||||
|
xii
|
||||||
|
xiii
|
||||||
|
xiv
|
||||||
|
xix
|
||||||
|
xv
|
||||||
|
xvi
|
||||||
|
xvii
|
||||||
|
xviii
|
||||||
|
xx
|
||||||
|
years
|
||||||
|
Yugoslavian
|
||||||
|
zealots
|
||||||
|
zion
|
BIN
tessdata/eng.word-dawg
Executable file
BIN
tessdata/eng.word-dawg
Executable file
Binary file not shown.
@ -42,7 +42,6 @@ EnableNewAdaptRules 1
|
|||||||
################################################################################
|
################################################################################
|
||||||
#
|
#
|
||||||
# File: marks/configs/knobs
|
# File: marks/configs/knobs
|
||||||
# RCS: $Header: /cvsroot/tesseract-ocr/tesseract/tessdata/tessconfigs/batch,v 1.3 2007/02/02 23:45:33 theraysmith Exp $
|
|
||||||
# Description: Control variables for 'marks' code
|
# Description: Control variables for 'marks' code
|
||||||
# Author: Mark Seaman, OCR Technology
|
# Author: Mark Seaman, OCR Technology
|
||||||
# Created: Wed Feb 27 11:27:27 1991
|
# Created: Wed Feb 27 11:27:27 1991
|
||||||
|
@ -41,7 +41,6 @@ MatcherDebugLevel 1
|
|||||||
################################################################################
|
################################################################################
|
||||||
#
|
#
|
||||||
# File: marks/configs/knobs
|
# File: marks/configs/knobs
|
||||||
# RCS: $Header: /cvsroot/tesseract-ocr/tesseract/tessdata/tessconfigs/matdemo,v 1.2 2007/02/02 23:45:33 theraysmith Exp $
|
|
||||||
# Description: Control variables for 'marks' code
|
# Description: Control variables for 'marks' code
|
||||||
# Author: Mark Seaman, OCR Technology
|
# Author: Mark Seaman, OCR Technology
|
||||||
# Created: Wed Feb 27 11:27:27 1991
|
# Created: Wed Feb 27 11:27:27 1991
|
||||||
|
@ -38,7 +38,6 @@ EnableNewAdaptRules 1
|
|||||||
################################################################################
|
################################################################################
|
||||||
#
|
#
|
||||||
# File: marks/configs/knobs
|
# File: marks/configs/knobs
|
||||||
# RCS: $Header: /cvsroot/tesseract-ocr/tesseract/tessdata/tessconfigs/segdemo,v 1.2 2007/02/02 23:45:33 theraysmith Exp $
|
|
||||||
# Description: Control variables for 'marks' code
|
# Description: Control variables for 'marks' code
|
||||||
# Author: Mark Seaman, OCR Technology
|
# Author: Mark Seaman, OCR Technology
|
||||||
# Created: Wed Feb 27 11:27:27 1991
|
# Created: Wed Feb 27 11:27:27 1991
|
||||||
|
Loading…
Reference in New Issue
Block a user