Release 2.0 · kmpoon/hlta

Requirement: Java 8

New Features:

Other changes:

Default using Narrowly Defined Topics
Scala calls use Stepwise EM for parameter estimation
User defined encoding scheme in data conversion
Pre-processor now remove punctuation instead of replacing it with underscore
Subroutines now accept all data formats, while sparse data will be the default format
Data Conversion default only outputs sparse data format
Data Conversion now reads PDF directly
Sparse data format now counts docId from 0
HLCM data format now uses extension .hlcm
Legacy fixes of collision with .bif format reserved words
Fixed invalid json format

Provide feedback