下载安装依赖项leptonica
wget
https://github.com/tesseract-ocr/tesseract/archive/4.1.0.tar.gzwget
http://www.leptonica.org/source/leptonica-1.74.4.tar.gz安装依赖:yum install autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel
这一步是检查环境中是否安装了这些依赖,如果有则会提示已存在
安装leptonica
#解压 tar -xzvf leptonica-1.74.4.tar.gz
cd leptonica-1.74.4.tar.gz
#configure是一个可执行shell,这一步是指定安装位置并调用gcc环境生成Makefile文件为编译做准备
./configure --prefix=/usr/local/leptonica
#编译 make
sudo make install
#编辑 /etc/profile
vim /etc/profile
#添加以下字段
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica
export LIBLEPT_HEADERSDIR
#保存退出 更新一下profile文件
source /etc/profile
二、安装 tesseract
#编译安装
tar -xzvf 4.1.0.tar.gz
cd tesseract-4.1.0
./configure --profix=/usr/local/ocr
make
sudo make install
#配置环境变量
vim /etc/profile
#追加以下字段
PATH=$PATH:/usr/local/ocr/bin
export PATH
#保存退出 更新一下profile文件
source /etc/profile
# tesseract就安装好了,测试一下
tesseract -v
输出:
1. tesseract 4.1.0
2. leptonica-1.74.4
3. libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7
4.
5. Found AVX2
6. Found AVX
7. Found SSE
OK,到这里,就安装成功了
这个版本默认是没有语言包的
在/usr/local/ocr/share/tessdata 下复制Windows的语言包进来
验证
tesseract /neworiental/data/codes.jpg /neworiental/data/22 -l chi_sim
--tesseract 读取文件地址 输出地址+输出文件名 txt格式 -l 中文语言包chi_sim