Install Kaldi: Red Hat

I’ll be using an AWS EC2 instance for the installation but you can do this directly on a linux machine. RedHat

Step1: Install git on AWS Instance

(Keep in mind that the yum install is only for red hat, for debian/ubuntu it would be apt-get install.)

https://cloudaffaire.com/how-to-install-git-in-aws-ec2-instance/

sudo yum update -y
sudo yum install git -y

Step 2: Download Kaldi from GitHub

https://kaldi-asr.org/doc/install.html

git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream
cd kaldi
git pull

Step 3: Read the Kaldi installation instructions and follow Option 1

https://github.com/kaldi-asr/kaldi/blob/master/INSTALL

[ec2-user@ip-172-31-6-113 kaldi]$ nano INSTALL

This is the official Kaldi INSTALL. Look also at INSTALL.md for the git mirror installation.
[Option 1 in the following does not apply to native Windows install, see windows/INSTALL or following Option 2]

Option 1 (bash + makefile):

  Steps:
    (1)
    go to tools/  and follow INSTALL instructions there.

    (2)
    go to src/ and follow INSTALL instructions there.

Option 2 (cmake):

    Go to cmake/ and follow INSTALL.md instructions there.
    Note, it may not be well tested and some features are missing currently.

Step 4: go to tools/ and follow INSTALL instructions there.

https://github.com/kaldi-asr/kaldi/blob/master/tools/INSTALL

cd tools
[ec2-user@ip-172-31-6-113 tools]$ nano INSTALL

Check for dependencies and install missing items

[ec2-user@ip-172-31-6-113 tools]$ ./extras/check_dependencies.sh
[ec2-user@ip-172-31-6-113 tools]$ sudo yum install gcc-c++ automake autoconf patch sox gcc-gfortran libtool subversion

Check for dependencies and install missing items

[ec2-user@ip-172-31-6-113 tools]$ ./extras/check_dependencies.sh
[ec2-user@ip-172-31-6-113 tools]$ sudo yum install zlib-devel

Check for dependencies and install missing items

[ec2-user@ip-172-31-6-113 tools]$ ./extras/check_dependencies.sh 
./extras/check_dependencies.sh: Intel MKL does not seem to be installed.
 ... Run extras/install_mkl.sh to install it. Some distros (e.g., Ubuntu 20.04) provide
 ... a version of MKL via the package manager, but verify that it is up-to-date.
 ... You can also use other matrix algebra libraries. For information, see:
 ...   http://kaldi-asr.org/doc/matrixwrap.html
[ec2-user@ip-172-31-6-113 tools]$

Run make

[ec2-user@ip-172-31-6-113 tools]$ ./extras/install_mkl.sh
[ec2-user@ip-172-31-6-113 tools]$ make

Install IRSTLM: can be useful for interpolations when building LMs

***() Installation of IRSTLM finished successfully
***() Please source the tools/env.sh in your path.sh to enable it
[ec2-user@ip-172-31-6-113 tools]$

Step 5: go to src/ and follow INSTALL instructions there.

[ec2-user@ip-172-31-6-113 src]$ nano INSTALL

cd src
[ec2-user@ip-172-31-6-113 src]$ nano INSTALL
./configure --shared
make depend -j 8
make -j 8

You’re Done!

history.txt

1  sudo yum update -y
2  sudo yum install git -y
3  git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream
4  cd kaldi
5  git pull
6  nano INSTALL
7  cd tools/
8  nano INSTALL
9  ./extras/check_dependencies.sh
10  sudo yum install gcc-c++ automake autoconf patch sox gcc-gfortran libtool subversion
11  ./extras/check_dependencies.sh
12  sudo yum install zlib-devel
13  ./extras/check_dependencies.sh
14  ./extras/install_mkl.sh
15  ./extras/check_dependencies.sh
16  make -j 8
17  ./extras/install_irstlm.sh
18  cd src/
19  ./configure --shared
20  make depend -j 8
21  make -j 8

Kaldi directory:

ubuntu@ip-172-31-6-144:~/kaldi$ tree -L 2
.
β”œβ”€β”€ CMakeLists.txt
β”œβ”€β”€ COPYING
β”œβ”€β”€ INSTALL
β”œβ”€β”€ README.md
β”œβ”€β”€ cmake
β”‚Β Β  β”œβ”€β”€ FindBLAS.cmake
β”‚Β Β  β”œβ”€β”€ FindCUB.cmake
β”‚Β Β  β”œβ”€β”€ FindICU.cmake
β”‚Β Β  β”œβ”€β”€ FindLAPACK.cmake
β”‚Β Β  β”œβ”€β”€ FindNvToolExt.cmake
β”‚Β Β  β”œβ”€β”€ INSTALL.md
β”‚Β Β  β”œβ”€β”€ Utils.cmake
β”‚Β Β  β”œβ”€β”€ VersionHelper.cmake
β”‚Β Β  β”œβ”€β”€ gen_cmake_skeleton.py
β”‚Β Β  β”œβ”€β”€ kaldi-config.cmake.in
β”‚Β Β  └── third_party
β”œβ”€β”€ docker
β”‚Β Β  β”œβ”€β”€ README.md
β”‚Β Β  β”œβ”€β”€ debian10-cpu
β”‚Β Β  β”œβ”€β”€ debian9.8-cpu
β”‚Β Β  β”œβ”€β”€ ubuntu16.04-gpu
β”‚Β Β  └── ubuntu18.04-cuda10.0
β”œβ”€β”€ egs
β”‚Β Β  β”œβ”€β”€ README.txt
β”‚Β Β  β”œβ”€β”€ aidatatang_200zh
β”‚Β Β  β”œβ”€β”€ aishell
β”‚Β Β  β”œβ”€β”€ aishell2
β”‚Β Β  β”œβ”€β”€ ami
β”‚Β Β  β”œβ”€β”€ an4
β”‚Β Β  β”œβ”€β”€ apiai_decode
β”‚Β Β  β”œβ”€β”€ aspire
β”‚Β Β  β”œβ”€β”€ aurora4
β”‚Β Β  β”œβ”€β”€ babel
β”‚Β Β  β”œβ”€β”€ babel_multilang
β”‚Β Β  β”œβ”€β”€ bentham
β”‚Β Β  β”œβ”€β”€ bn_music_speech
β”‚Β Β  β”œβ”€β”€ callhome_diarization
β”‚Β Β  β”œβ”€β”€ callhome_egyptian
β”‚Β Β  β”œβ”€β”€ casia_hwdb
β”‚Β Β  β”œβ”€β”€ chime1
β”‚Β Β  β”œβ”€β”€ chime2
β”‚Β Β  β”œβ”€β”€ chime3
β”‚Β Β  β”œβ”€β”€ chime4
β”‚Β Β  β”œβ”€β”€ chime5
β”‚Β Β  β”œβ”€β”€ chime6
β”‚Β Β  β”œβ”€β”€ cifar
β”‚Β Β  β”œβ”€β”€ cmu_cslu_kids
β”‚Β Β  β”œβ”€β”€ cnceleb
β”‚Β Β  β”œβ”€β”€ commonvoice
β”‚Β Β  β”œβ”€β”€ csj
β”‚Β Β  β”œβ”€β”€ dihard_2018
β”‚Β Β  β”œβ”€β”€ fame
β”‚Β Β  β”œβ”€β”€ farsdat
β”‚Β Β  β”œβ”€β”€ fisher_callhome_spanish
β”‚Β Β  β”œβ”€β”€ fisher_english
β”‚Β Β  β”œβ”€β”€ fisher_swbd
β”‚Β Β  β”œβ”€β”€ formosa
β”‚Β Β  β”œβ”€β”€ gale_arabic
β”‚Β Β  β”œβ”€β”€ gale_mandarin
β”‚Β Β  β”œβ”€β”€ gigaspeech
β”‚Β Β  β”œβ”€β”€ gop_speechocean762
β”‚Β Β  β”œβ”€β”€ gp
β”‚Β Β  β”œβ”€β”€ heroico
β”‚Β Β  β”œβ”€β”€ hi_mia
β”‚Β Β  β”œβ”€β”€ hkust
β”‚Β Β  β”œβ”€β”€ hub4_english
β”‚Β Β  β”œβ”€β”€ hub4_spanish
β”‚Β Β  β”œβ”€β”€ iam
β”‚Β Β  β”œβ”€β”€ iban
β”‚Β Β  β”œβ”€β”€ icsi
β”‚Β Β  β”œβ”€β”€ ifnenit
β”‚Β Β  β”œβ”€β”€ libri_css
β”‚Β Β  β”œβ”€β”€ librispeech
β”‚Β Β  β”œβ”€β”€ lre
β”‚Β Β  β”œβ”€β”€ lre07
β”‚Β Β  β”œβ”€β”€ madcat_ar
β”‚Β Β  β”œβ”€β”€ madcat_zh
β”‚Β Β  β”œβ”€β”€ malach
β”‚Β Β  β”œβ”€β”€ mandarin_bn_bc
β”‚Β Β  β”œβ”€β”€ material
β”‚Β Β  β”œβ”€β”€ mgb2_arabic
β”‚Β Β  β”œβ”€β”€ mgb5
β”‚Β Β  β”œβ”€β”€ mini_librispeech
β”‚Β Β  β”œβ”€β”€ mobvoi
β”‚Β Β  β”œβ”€β”€ mobvoihotwords
β”‚Β Β  β”œβ”€β”€ multi_cn
β”‚Β Β  β”œβ”€β”€ multi_en
β”‚Β Β  β”œβ”€β”€ nsc
β”‚Β Β  β”œβ”€β”€ opensat20
β”‚Β Β  β”œβ”€β”€ ptb
β”‚Β Β  β”œβ”€β”€ reverb
β”‚Β Β  β”œβ”€β”€ rimes
β”‚Β Β  β”œβ”€β”€ rm
β”‚Β Β  β”œβ”€β”€ sad_rats
β”‚Β Β  β”œβ”€β”€ sitw
β”‚Β Β  β”œβ”€β”€ snips
β”‚Β Β  β”œβ”€β”€ spanish_dimex100
β”‚Β Β  β”œβ”€β”€ sprakbanken
β”‚Β Β  β”œβ”€β”€ sprakbanken_swe
β”‚Β Β  β”œβ”€β”€ sre08
β”‚Β Β  β”œβ”€β”€ sre10
β”‚Β Β  β”œβ”€β”€ sre16
β”‚Β Β  β”œβ”€β”€ svhn
β”‚Β Β  β”œβ”€β”€ swahili
β”‚Β Β  β”œβ”€β”€ swbd
β”‚Β Β  β”œβ”€β”€ tedlium
β”‚Β Β  β”œβ”€β”€ thchs30
β”‚Β Β  β”œβ”€β”€ tidigits
β”‚Β Β  β”œβ”€β”€ timit
β”‚Β Β  β”œβ”€β”€ tunisian_msa
β”‚Β Β  β”œβ”€β”€ uw3
β”‚Β Β  β”œβ”€β”€ voxceleb
β”‚Β Β  β”œβ”€β”€ voxforge
β”‚Β Β  β”œβ”€β”€ vystadial_cz
β”‚Β Β  β”œβ”€β”€ vystadial_en
β”‚Β Β  β”œβ”€β”€ wenetspeech
β”‚Β Β  β”œβ”€β”€ wsj
β”‚Β Β  β”œβ”€β”€ yesno
β”‚Β Β  β”œβ”€β”€ yomdle_fa
β”‚Β Β  β”œβ”€β”€ yomdle_korean
β”‚Β Β  β”œβ”€β”€ yomdle_russian
β”‚Β Β  β”œβ”€β”€ yomdle_tamil
β”‚Β Β  β”œβ”€β”€ yomdle_zh
β”‚Β Β  └── zeroth_korean
β”œβ”€β”€ misc
β”‚Β Β  β”œβ”€β”€ README.txt
β”‚Β Β  β”œβ”€β”€ htk_conversion
β”‚Β Β  β”œβ”€β”€ htk_decode_example
β”‚Β Β  β”œβ”€β”€ htk_graph_creation_example
β”‚Β Β  β”œβ”€β”€ logo
β”‚Β Β  β”œβ”€β”€ maintenance
β”‚Β Β  └── papers
β”œβ”€β”€ scripts
β”‚Β Β  β”œβ”€β”€ rnnlm
β”‚Β Β  └── wakeword
β”œβ”€β”€ src
β”‚Β Β  β”œβ”€β”€ Doxyfile
β”‚Β Β  β”œβ”€β”€ INSTALL
β”‚Β Β  β”œβ”€β”€ Makefile
β”‚Β Β  β”œβ”€β”€ NOTES
β”‚Β Β  β”œβ”€β”€ TODO
β”‚Β Β  β”œβ”€β”€ base
β”‚Β Β  β”œβ”€β”€ bin
β”‚Β Β  β”œβ”€β”€ chain
β”‚Β Β  β”œβ”€β”€ chainbin
β”‚Β Β  β”œβ”€β”€ configure
β”‚Β Β  β”œβ”€β”€ cudadecoder
β”‚Β Β  β”œβ”€β”€ cudadecoderbin
β”‚Β Β  β”œβ”€β”€ cudafeat
β”‚Β Β  β”œβ”€β”€ cudafeatbin
β”‚Β Β  β”œβ”€β”€ cudamatrix
β”‚Β Β  β”œβ”€β”€ decoder
β”‚Β Β  β”œβ”€β”€ doc
β”‚Β Β  β”œβ”€β”€ feat
β”‚Β Β  β”œβ”€β”€ featbin
β”‚Β Β  β”œβ”€β”€ fgmmbin
β”‚Β Β  β”œβ”€β”€ fstbin
β”‚Β Β  β”œβ”€β”€ fstext
β”‚Β Β  β”œβ”€β”€ gmm
β”‚Β Β  β”œβ”€β”€ gmmbin
β”‚Β Β  β”œβ”€β”€ gst-plugin
β”‚Β Β  β”œβ”€β”€ hmm
β”‚Β Β  β”œβ”€β”€ itf
β”‚Β Β  β”œβ”€β”€ ivector
β”‚Β Β  β”œβ”€β”€ ivectorbin
β”‚Β Β  β”œβ”€β”€ kaldi.mk
β”‚Β Β  β”œβ”€β”€ kws
β”‚Β Β  β”œβ”€β”€ kwsbin
β”‚Β Β  β”œβ”€β”€ lat
β”‚Β Β  β”œβ”€β”€ latbin
β”‚Β Β  β”œβ”€β”€ lib
β”‚Β Β  β”œβ”€β”€ lm
β”‚Β Β  β”œβ”€β”€ lmbin
β”‚Β Β  β”œβ”€β”€ makefiles
β”‚Β Β  β”œβ”€β”€ matrix
β”‚Β Β  β”œβ”€β”€ nnet
β”‚Β Β  β”œβ”€β”€ nnet2
β”‚Β Β  β”œβ”€β”€ nnet2bin
β”‚Β Β  β”œβ”€β”€ nnet3
β”‚Β Β  β”œβ”€β”€ nnet3bin
β”‚Β Β  β”œβ”€β”€ nnetbin
β”‚Β Β  β”œβ”€β”€ online
β”‚Β Β  β”œβ”€β”€ online2
β”‚Β Β  β”œβ”€β”€ online2bin
β”‚Β Β  β”œβ”€β”€ onlinebin
β”‚Β Β  β”œβ”€β”€ probe
β”‚Β Β  β”œβ”€β”€ rnnlm
β”‚Β Β  β”œβ”€β”€ rnnlmbin
β”‚Β Β  β”œβ”€β”€ sgmm2
β”‚Β Β  β”œβ”€β”€ sgmm2bin
β”‚Β Β  β”œβ”€β”€ tfrnnlm
β”‚Β Β  β”œβ”€β”€ tfrnnlmbin
β”‚Β Β  β”œβ”€β”€ transform
β”‚Β Β  β”œβ”€β”€ tree
β”‚Β Β  └── util
β”œβ”€β”€ tools
β”‚Β Β  β”œβ”€β”€ ATLAS_headers
β”‚Β Β  β”œβ”€β”€ CLAPACK
β”‚Β Β  β”œβ”€β”€ INSTALL
β”‚Β Β  β”œβ”€β”€ Makefile
β”‚Β Β  β”œβ”€β”€ config
β”‚Β Β  β”œβ”€β”€ cub -> cub-1.8.0
β”‚Β Β  β”œβ”€β”€ cub-1.8.0
β”‚Β Β  β”œβ”€β”€ cub-1.8.0.tar.gz
β”‚Β Β  β”œβ”€β”€ env.sh
β”‚Β Β  β”œβ”€β”€ extras
β”‚Β Β  β”œβ”€β”€ install_pfile_utils.sh -> extras/install_pfile_utils.sh
β”‚Β Β  β”œβ”€β”€ install_portaudio.sh -> extras/install_portaudio.sh
β”‚Β Β  β”œβ”€β”€ install_speex.sh -> extras/install_speex.sh
β”‚Β Β  β”œβ”€β”€ install_srilm.sh -> extras/install_srilm.sh
β”‚Β Β  β”œβ”€β”€ irstlm
β”‚Β Β  β”œβ”€β”€ openfst -> openfst-1.7.2
β”‚Β Β  β”œβ”€β”€ openfst-1.7.2
β”‚Β Β  β”œβ”€β”€ openfst-1.7.2.tar.gz
β”‚Β Β  β”œβ”€β”€ sctk -> sctk-20159b5
β”‚Β Β  β”œβ”€β”€ sctk-20159b5
β”‚Β Β  β”œβ”€β”€ sctk-20159b5.tar.gz
β”‚Β Β  β”œβ”€β”€ sph2pipe -> sph2pipe_v2.5
β”‚Β Β  β”œβ”€β”€ sph2pipe-2.5.tar.gz
β”‚Β Β  └── sph2pipe_v2.5
└── windows
    β”œβ”€β”€ INSTALL.atlas
    β”œβ”€β”€ INSTALL.md
    β”œβ”€β”€ INSTALL.mkl
    β”œβ”€β”€ NewGuidCmd.exe
    β”œβ”€β”€ NewGuidCmd.exe.config
    β”œβ”€β”€ cuda_7.0.props
    β”œβ”€β”€ generate_solution.pl
    β”œβ”€β”€ get_version.pl
    β”œβ”€β”€ kaldiwin_atlas.props
    β”œβ”€β”€ kaldiwin_mkl.props
    β”œβ”€β”€ kaldiwin_openblas.props
    β”œβ”€β”€ kaldiwin_win32.props
    β”œβ”€β”€ openfstwin_debug.props
    β”œβ”€β”€ openfstwin_debug_win32.props
    β”œβ”€β”€ openfstwin_release.props
    β”œβ”€β”€ openfstwin_release_win32.props
    β”œβ”€β”€ portaudio.props
    β”œβ”€β”€ portaudio_debug.props
    β”œβ”€β”€ portaudio_release.props
    └── variables.props.dev

186 directories, 55 files
ubuntu@ip-172-31-6-144:~/kaldi$

Comments:

https://github.com/npovey/speech/discussions/categories/announcements