|
输入法软件的发展方向是输入平台,所谓的平台就是给用户提供一个通用的输入接口软件,完成用户输入中文到功能。具体的这个输入接口软件是使用的拼音还是五笔,或者是二笔或者是郑码,完全由用户自己决定,用户只需准备一个单字的编码码表,而且用户可以自己制作词库,这样的词库会适应用户的用户习惯及行业特点。
龙文平台的推出已经可以说是一个真正意义上的输入平台,在这个平台上输入法的大部分资源都可以自己定制,用户可以充分打造真正属于自己的个性输入软件。好马配好鞍,龙文平台可以充分提高输入的性能与效率。
如果能够真正了解以下的几个方面,那么用户就可以用
龙文平台定制一款自己的个性输入法,使用自己的词库,使用自己的编码方案,也可以对五笔等已有编码方案进行适当的修改。
1、用户可以自己制作安装程序
这是实现平台特性的基础,是定制个性输入法的重要方面。如果用户更改挂接的编码方案或词库,而不能自己制作安装程序,那么这样的更改是没有意义的,因为还是需要每次安装后,都要挂接自己的编码方案和词库。安装程序是使用通用的压缩程序WinRAR制作的。制作步骤如下:
(1)准备制作安装程序的原始文件。
安装龙文输入平台,出现下面的对话框时单击“否”,则不会安装输入法,只是解压缩,释放其中的文件,这样就可以得到原始的安装文件,而不会生成额外的文件。

(2)进入龙文输入平台的安装目录,选择所有文件,然后通过右键菜单调用WinRAR,创建自释放格式文档。

(3)单击“高级”标签,单击“自解压选项”按钮,进入相应设置画面。

(4)在“高级自释放选项”中进行如图设置。
这个对话框中的“文字和图标”及“授权”标签的内容也可以设置。

2、修改编码或挂接自己的编码方案
这是打造自己个性化输入法的核心。任何编码方案,经过长期的使用,用户对整个编码了然于胸,其中编码何处合理,何处需要作适当的改动以提高效率,相信每个用户都会有自己的意见的,也有的用户会在原来的编码方案基础上创建自己的输入法,这些工作现在用
龙文输入平台就可以实现了,不必再使用Windows下的输入法生成器。同输入法生成器一样在龙文输入平台上打造自己的输入方案只需要一个文本文件的码表就可以,采用同样的码表格式。同输入法生成器不一样的是龙文输入平台的码表文件只需要对单字进行编码,不需要对词组进行编码,词组的编码会按构词规则自动生成,这样使编码工作简化许多,减少很多的工作量。如果某些词组的编码不是特别规范,不能由构词规则自动生成正确的编码,这样的词组就需要用户
自己手工编码并保存到一个文件中。
总结起来,用龙文输入平台挂接自己的编码方案或修改需要编码方案,只需要准备两个文件:单字编码文件和词组特殊编码文件
,词组特殊编码文件只是在需要时使用。
除拼音外,龙文输入平台
的大键盘可以同时挂接二个编码方案,小键盘也可以挂接一个。但在安装时可以提供多个输入法方案,供用户选择。每个方案要放到单独的文件夹中。其中
mb.txt是单字
与词组的编码文件
,就是通常说的码表。词组编码可有可无,只有当词组存在多种编码可能时由用户指定编码。
如果词组的编码可以由构词规则自动生成正确的,就可以不需要词组及其编码的条目。
zg.txt是用来定义显示的字根
另外还有Setup.txt文件,是用来定义提供了哪些输入法方案供用户安装
,最多可以提供13个输入方案供用户选择。
文件的格式请参考安装后的相应文件。文件的名字不能改动。
单字码表的要求:一个汉字可有多个编码,每个编码必须单独一行,全码和简码不能放在一行上。全码放在前面的行上,简码放在后面行上,安装程序由位置来判断是全码还是简码,建议把简码集中放在文件的后面,这样修改简码也方便。
龙文使用的码表在[Description]区增加了两个项目:FirstCode,NumkeyBoard,这两个项目需要时可以加上,FirstCode=1表示首码是符号则上屏,有些编码方案除使用26个英文字母外,还使用“,.;/”作编码,这种情况下如果需要第一键按“,.;/”上屏的是标点,就可以设置此项。NumkeyBoard=1表示使用小键盘,对于小键盘码表,必须加上NumkeyBoard=1项目。
为了把标准码表转化成
龙文输入平台需要的单字码表形式,我们提供了一个龙文码表处理程序,专门作这个工作的,安装后执行“开始->程序->龙文输入平台->龙文码表处理程序”就可以。
词组特殊编码文件:有些词组如果以构词规则生成编码,则编码不正确,这种情况在音形码上比较常见,如含有多音字的词组,它们的编码就需要用户自己定义。这个文件可有可无,不需要就删除。龙文多音词组提取程序可以把含有多音字的词库中的词组提取出来
,安装后执行“开始->程序->龙文输入平台->龙文多音词组提取程序”,如果用该程序处理的是普通码表文件,还会保留词组的编码。
所有文件的最后一行要加回车。
3、使用自己的词库文件
龙文输入平台采用文本文件形式的词库,是cz.txt,文件名字不能更改。每条词组占一行,数字是词频,词频和词组之间由空格分割。词频最大为200。在词频上还有一些特殊的规定,词频小于等于9的词组,安装后首次不能用五笔等形码输入,这样的词组首次用拼音输入或用分成多个输入时配合自动添加编码功能会自动加上编码的;如果要实现词组首次就能用五笔形码输入,则词频需设置大于11。如果没有词频,则看成是0词频。cz.txt有11万左右的词组,前3万条是常用词组,词频较大,可以用形码直接输入;其余的词组词频小于9,首次不能用五笔等形码输入。利用词频可以为拼音和五笔建立不同大小的初始词库,小于9的词频初次只能用拼音输入,不能用五笔等形码输入。
如果文件只有词组而没有词频信息,可以用Word等软件处理,把所有的回车符替换成“空格数字回车”。替换结束后检查文件最后一行的形式是否正确。
4、修改或增加简码
通过修改汉字码表文件,用户可以自己指定各级简码,举个例子可以把“w”依拼音的方式安排上“我”,也可以为每个简码安排多个汉字,如“w”可以安排“人、从、他”,这样配合简码不调频,就可以实现一个简码有多个单字。
再进一步,可以为简码安排高频的词组,但这个不是在汉字码表文件中实现,而是在词组特殊编码文件中实现,如下面的例子:
我们trwu
我们w
这样“我们”就会有两个编码,一个是正常的编码,一个是简码。
|