Sphinx/spelldump命令参考
来自站长百科
spelldump 是Sphinx的一个辅助程序。
用于从ispell或者MySpell格式的字典文件中可用来辅助建立词形列表(wordforms)的内容——词的全部可能变化都预先构造好。
一般用法如下:
spelldump [options] <dictionary> <affix> [result] [locale-name]
两个主要参数是词典的主文件([language-prefix].dict)和词缀文件([language-prefix].aff);通常这两种文件被命名为[语言简写].dict和[语言简写].aff,大多数常见的Linux发行版中都有这些文件,网上也到处找得到。
[result] 指定的是字典数据的输出位置,而[locale-name]指定了具体使用的区域设置(locale)
还有一个-c [file]选项,用来指定一个包含大小写转换方面细节的文件。
用法示例:
spelldump en.dict en.aff
spelldump ru.dict ru.aff ru.txt ru_RU.CP1251
spelldump ru.dict ru.aff ru.txt .1251
结果文件会包含字典中包含的全部词,字典序排列,wordforms文件格式。可以根据具体的使用环境定制这些文件。结果文件的一个例子:
zone > zone
zoned > zoned
zoning > zoning