注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

煮字疗饥

 
 
 

日志

 
 

数字文字学应用刍议  

2015-04-07 18:07:11|  分类: 《旅枕漫录》 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

室友卓摩偶尔有小小说发表,我是每文必读的。他的练习方法就是给人编排故事,有一天见他又在给人讲故事,凑近一听,居然是在讲我,他说道:“我这位室友啊,小时候老师让大家讲讲将来的志向,于是有人说将来要做科学家;有人说要当将军……只有他一声不发,于是老师指名要他回答。‘不能说!’他回答道。最后见禁不住追问,他居然说:‘我想当间谍,你们看到过有间谍随便告诉别人的吗!’”

显然,这小子是为了报复我昨天没有告诉他如何破解那一段乱码而编出来的。
  数字阅读中,常常会遇到一些代替某些生僻字的奇怪符号。直接用(艹+亻+匕)表示花字之类似乎还可以明白,但字体太复杂的字就不容易猜了。见我烦恼,有高人就指点说用五笔输入法的原理,就能拼写出电脑上不容易打出的那个字,试了几次觉得果然有点道理。可是卓摩摘录下一段文字中的几个字,用五笔输入法也拼不出来,因为那是一串数字,而且有五个字一组和六个字一组的,两人研究了半天,我告诉他这用的是电码原理,四位数是省略了一位数的零。把《说文解字》当密电码,按页数、行数、第几个字一查,没有,再找来《康熙字典》一查,果然破译了。
  卓摩读清人的《洪福异闻》,到“仁‖有一西友,即前导之”一句,又来问我‖是什么字?“轩。”我头也没抬就告诉了他。他还不服,结果查了别的版本才信服,那确实是洪仁轩,还是玕的错别字。“轩”字不是什么生僻字,我想输入者或许是使用了山寨版的扫描器。有的时候还会出现◆,或者■之类的代替符号,而原文又不是生僻字,那大概也差不多是这个缘故,如果不像“轩”字那样好猜,又不想跳过去,那就只好找别的版本核对了。不过输入电脑搜索,也可能同时出现几个不同的字,那就要凭文字学的功力了。好在读过《说文解字》的人,甲骨文、蝌蚪文之类多少也能认识几个,数字图书中出现的这种现代文字学难题,只要花点功夫,还是能够破解的。
  渐渐熟练于破解,其实还得感谢卓摩经常拿些案例来考我,比如他问我“式洋”是什么意思?破解并不难,按照古人文字通假的原理,那肯定是“式样”,结果在繁简字转换器中得到了证实。是电子书的输入者出于好心,将繁体字转换成了简体字,但转化器却并非那么忠实于原文,不同的转换器对于个别文字都有不同的对应字,比如“一”就可能老是会变成“壹”。
  乱码是最令人头疼的,我也不清楚它产生的原因,只是遇到过电脑上转载多次就出现了乱码,猜想可能是编排的不同使得程序不能兼容吧。虽然现在也有乱码转换器了,但似乎也不是都能转化出来的。昨天卓摩读培根的书到:“读史使人明智,读诗使人灵秀,数学使人周密,科学使人深刻,伦理学使人庄重,逻辑修辞之学使人善辩”一段,之后有一段乱码:“Й#Яゆㄌ﹠ザ $% $#。”转换器上转换不出来,我告诉他那是:“凡有所学,皆成性格”几个字。他不信,并一定要我告诉他是用什么方法破译的才肯罢休。于是我故作神秘地告诉他:这需要运用摩尔斯密码破解,并开玩笑说想弄明白得给我“束脩”,不然没门!于是他就编排了那个想当间谍的故事,其实,所谓摩尔斯密码,卓摩的小小说里曾提到过,但我和他一样根本不明白究竟是怎么回事,只不过是培根的这句话,偶然听老师说过而已。

原载《图书馆报》2015年3月24日

  评论这张
 
阅读(71)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017