词库相关
关于字库

紫光华宇拼音输入法带有大容量的字库数据,以方便用户进行输入,同时会根据用户输入对字的排序进行调整、记录用户输入字的频率。
紫光华宇拼音输入法提供了字库编辑工具,方便用户对字库中的字进行编辑。
提供了完整音和首字母两种不同形式字的编辑方式。
选中音调会列出所有此发音的字,用户可对字频、字的拼音和集合进行编辑。
汉字管理中设置的字频是随着用户的使用频率而相应改变的,而有一种特殊情况就是,设置中由于使用了最后一次输入的单字优先,如果是用户自己最近输入的汉字会排在输入的第一位。
关于词库

直观易用的词库管理工具,用户使用起来更加方便;同时支持16个专业分类词库,可根据自己的需求进行扩充。新增的用户词库与系统词库有效组合,使输入更加贴近本人的输入习惯且有效的减小了用户词库的容量。
用户词库就是存储了词信息、词使用频率(词频)信息的数据文件,随着用户自己造词或者添加词,词库文件会相应增大。
词库管理中导入的txt格式是:
名称=test word library
作者=unispim
编辑=1(1为能编辑,0为不能编辑)
啊啊 a'a 148(汉字 拼音 词频)
……
定义的词组长度范围是2~32个汉字
指定的词频范围是0~520000,建议大家使用范围为0~500000。长词(5个及5个以上)设置词频为0对词语的使用是没有影响的;相当常用的词语推荐设置范围为100000~500000(100000是非常高词频,500000是最高词频,如“一个”这样的高频词),常用词语推荐范围为0~100000。
创建 根据一个纯文本文件生成词库,针对收录词条的纯文本文件,需检查其拼音,若出现多音字,需确定一个拼音才能创建成功。
文件前三行有格式限制,要求如下:
名称=×××(英文或汉字,不超过30个字符)
作者=×××
编辑=0(0表示不可编辑,1为可编辑)
添加 通过用户备份或其他路径,复制一个词库文件到既定路径
用户可将输入法V3和V5版本的词库导入到V6版本中 。
当用户需要将自己以前使用的紫光华宇拼音输入法的词库导入到新版本中,点击“添加”,在你存放词库文件的文件夹中,选择词库文件添加即可,系统将自动导入。(注:在“文件类型”中选择V6或是V3/V5的词库文件,会显示相应的词库文件,V6版本的词库文件为*.uwl文件,而V3/V5版本的词库文件为*.dat文件)。
导入 从一个纯文本文件导入到选择的词库
每次导入txt文件时,输入法会自动检查拼音的准确度,根据检测的结果将提示用户是否导入,如选择导入,符合标准的词将导入到词库中,其他未能成功导入的词语可能是含有多音字的词语,或是由于词语过长等原因;如果需要将含有多音字的词语导入到词库中,则需要用户对多音字进行具体的音节指定,才能将其添加到词库中。
导出 将选定词库导出到指定的纯文本文件,便于用户浏览、编辑和整理
备份 将选定词库备份到指定的目录下
删除 删除您不需要的词库文件,删除后不可恢复(可以将用户词库清空)

在[字词调整]中设置,勾选即为将用户使用过的词汇记录到用户词库中,取消勾选将只记录用户造的新词。

用户可对选中的词库增加需要的新词,需要输入中文、拼音和词频。

注意:一次性操作的词条数超过1万,建议使用词库管理里面的导入功能。
读入文本 读入已编辑好的词库文本文件
另存为 将文本另存到其他位置或其他的文件名
生成/检查拼音 对导入的文本文件的词汇或词进行拼音检查、或自动生成拼音。
如果词组中有多音字,系统默认生成拼音串中该多音字的读音是所有读音中由程序自动计算为正确率最高的拼音,系统自动计算拼音不能保证100%正确率,紫光华宇会持续努力,提高准确率。
导入到词库 将当前的文本文件导入到词库管理中的一个词库中
字频调整
提供三种字频调整方案,快速、慢速和固定。
快速:最后一次输入的单字优先,将之提升至第一个候选,原来排在前面的顺延于后。
慢速:累计用户输入的各单字的次数,根据次数倒序排列,即输入次数多的居前。以用户使用该字的频率进行排序。如:“我”使用3次,“沃”使用1次,则“我”排在前面,不管上次是否输入了“沃”。
固定:字的顺序恒定不变,不按照输出字的频率进行改变。
注意:若启用固顶字,则固顶字的汉字优先级最高。
词频调整
提供三种词频调整方案,快速、慢速和固定。
快速:最后一次输入的词条优先,将之提升至第一个候选,原来排至前面的顺延于后。
慢速:累计用户输入的各个词条的次数,根据次数倒序排列,即输入次数多的居前。如:“实时”使用3次,“时时”使用1次,则“实时”排在前面,则不管上次是否输入了“实时”。
固定:词的顺序按照当前的词频恒定不变。

|