对于“汉典重光”这个平台,现在谈什么收藏数量少,网站功能单一,都为时过早

【本文来自《海外古籍数字化回归,上手试了试古籍落地平台…》评论区,标题为小编添加】

总觉得是不是很多人都没认真看过项目介绍。

这个项目的本质是一个能在古代千奇百怪的排版方式中,精准识别大量古代汉字和的ORC技术(Optical Character Recognition,光学字符识别,就是看图认字)。

这个系统要达到的目的是保证低错误率的情况下大量的快速的把中文古籍数字化,不需要人工反复检验。

现在这20万“页”(我就没见过谈古籍的时候用页的,一般都是说多少多少册),实际相当于我们玩手游内测,先拿一小批书籍试试手,后期如果真能实现他们声称的“97%”的准确率,就意味着无论多少古籍,都能轻松数字化。

所以现在谈什么收藏数量少,网站功能单一,都为时过早。

站务

全部专栏