拆掉知网的墙

500

作者 | 施晶晶

“技术让知识越来越便宜,而垄断让价格越来越昂贵。”两会期间,全国政协委员、上海市教委副主任倪闽景关于“知网”提案的一句话引起网络讨论。

做学术、科研的人,对中国知网不会陌生。它是国内最大的知识数据库。2019年初,“博士”翟天临的一句“知网是什么”,让中国知网第一次出圈。此热闹之后,网友对中国知网收费贵、行业垄断、三方利益分配问题的讨论逐渐增多。

作为一家商业数据库,知网做的是学术生意。不过从高校师生到科研工作者,对这项“中国知识基础设施工程”早有怨言。

500

中国知网首页

此次,倪闽景在提案中所建议的,是把中国知网纳入政府购买服务,一部分功能(比如浏览和下载论文)供国内用户免费使用,另一些服务(如论文查重、论文引用检索、大数据服务等)继续收费。

不少人为这个建议点赞,希望在行动中推进。政府买单,有利于打破知网的垄断局面,增加公共服务,而保留付费项目,则考虑了知网的盈利需要,兼顾了公益性和商业活力,虽有难度,但不失为一个好的设想。

1

知网贵在哪?

贵,是知网面临的第一个抱怨。

对个人用户来说,知网期刊论文的收费标准是0.5元/页,以国内经管领域权威期刊《经济研究》为例,单篇文献页数在15上下,单独下载需要支付7.5元。硕士论文15元/篇,博士论文30元/篇。

评估这一价格是否合理,我们需要一个参照系。

对比来看,知网、维普和万方的价格基本处于同一水平;

如果跟ScienceDirect(外文学术出版商Elsevier旗下数据库)相比,中国知网的标价并不算贵。 

500

知网和同类数据库的价格对比

不过,需要特别说明的是,ScienceDirect数据库并非是全部收费,它设有5种访问级别,分别是开放获取(open access)、开放存档(open archive)、全文访问(full text access)、仅有摘要(abstract only)、禁止访问(no access),其中前三项无需付费,只有后两项需要付费才能获取全文。

其中,包括250种完整出版物在内的超过120万篇文章可开放获取,比例占到总数的7.5%,《Lancet》《Cell》等顶级期刊的文献可以免费下载。

对于在校师生来说,“知网论文贵”的问题并不存在,因为学校财务预算会买单兜底,订购知网数据库的使用权限。但背后,是过去7年里,校方和知网因价格问题的多起矛盾。

2013年底,云南省多所高校停用中国知网,起因为中国知网各数据库大幅涨价,联合采购项目谈判陷入僵局。2016年3月,北大出于同样的涨价原因,续订谈判期间一度贴出“可能停用知网”的通知。

500

2016年3月31日,北京大学图书馆贴出的关于“中国知网可能中断服务”的通知

检索中国政府购买服务信息平台显示,2013年以来,各科研机构订购知网数据库项目的成交价格在几十万到数百万不等。

南风窗从知网销售人员和高校负责数据库采购的工作人员处了解到,价格的差异首先取决于购买的子库方案,不同单位根据自己的需要从知网上百个子库中进行选择。

同样寻找参照系,以华南地区某211院校为例,2019年的一份图书馆数据库采购项目公告显示,知网数据库成交价格为110万,比上一年度涨了7万,相比之下,超星、万方的成交价依次是10万和10.3万。

“知网作为最大的中文数据库是独一无二的,价格方面涨确实在涨,在老师、学生还有学校各项建设需求下,图书馆的现有经费非常紧张。但学生有需要我们也要尽力满足,价格就不是首先考虑的问题。”负责广东某高校图书馆数字资源建设的刘强(化名)告诉南风窗。

500

涨价是国内外各大学术数据库的基本走向,区别只在于上涨的幅度,这一幅度体现着数据库的底气。

“关键在于收录内容的权威和全面,数据库不做全是没有价值的。”浙江传媒学院编辑出版专业教授杜恩龙对南风窗表示,和国内其他数据库相比,知网的收录更为全面。

涨价是商业利益驱使,而接受涨价则是因为对数据库的依赖。而这一切动向,都与数据库市场的垄断相关。

“如果不买数据库,那么很容易就会跟最前沿的学术动态脱节。对很多人来讲,知网数据库是获取科研信息的重要途径。”杜恩龙告诉南风窗。

500

另有调查显示,国内医学科研成果,对于Elsevier数据库的依赖程度达到了49%。“如果我们不买数据库,我们每年的医学科研成果就可能减少一半。你想这不很可怕吗,你敢不买吗?”杜恩龙告诉南风窗。

也就是说,购买者是“卑微”的,商业数据库作为卖方,从来都不太需要担心价格。

2

灰色的版权

中国知网出身不凡。

25年前,中国知网在教育部、中共中央宣传部、科技部、国家新闻出版广电总局、国家计委的支持下,由清华大学主办。随后成立公司,同方股份是中国知网的控股公司。

知网最初得到关注,在于1995年,时任清华信息公司总经理王明亮提出一个全文数字出版系统的设想——CAJ-CD(交换、处理、检索、评价文献数据的技术规范),适应了学术界对数字出版的需要。

相比传统纸质出版,数字出版的效率更高,无论在获取科研信息、发表学术成果、影响力传播方面都是如此。于是,学术界和期刊界积极合作,参与数据库的建设,就有了今天最大的中文数据库知网。

500

但是,随之而来的很多新问题,比如数字出版牵涉的著作版权和知识产权保护,多年来始终备受争议。直至今天也没有得到妥善解决。

由于新的数字版权制度规范还未形成,目前主要是知网这样的平台掌握主动权,让“低买高卖”得以持续多年。

作者投稿,被学术期刊录用和纸质出版,期刊杂志社再将文章授权给知网,这是数字出版的一般流程,也是知网文章来源的主要路径。在这一过程中,创作者、学术期刊、知网平台都是利益的相关方。

知网从学术期刊获取文献的成本很低,有的只是象征性地一年支付几千或小几万块钱,这并不能减轻期刊自负盈亏的压力。

“现在很多学术期刊不敢不让知网转载,因为一旦在网上检索不到你期刊的文章,那影响力会因此下降,转载之后还能扩大名声,钱在这时候不是主要的。”杜恩龙告诉南风窗记者。

500

2020年3月2日,知网发布延长免费服务期与新增服务项目的公告,称将继续提供免费服务到2020年4月3日

学术发表需求旺盛,增加了知网的价值,低成本则是知网毛利率较高的一个重要原因。

2018年同方股份的半年度报告里,曾专门透露了同方知网的毛利率为58.83%,要知道,就连以高附加值著称的苹果公司,毛利率也没超过40%。

在此基础之上,围绕版权的争议却始终没能得到很好的解决,利益分配的合理性也积累了不满。

“中国知网转了我六七十篇文章,我从来没有收到它的转载费用,期刊也没有支付过。”杜恩龙曾在一次博览会上见到知网的人,询问过这件事,对方告诉他知网上有一个按钮,可以点击查看,操作申领,但他并没有找到。

南风窗记者登录知网页面,只在页面最底端,一个名为“版权公告”的小五号灰色字样里找到一个“学位论文稿酬通告”,而这份通告的发布时间是2016年10月。其他类型的稿酬如何申领暂未发现。

500

知网上关于学位论文稿酬的通告,而这份通告的发布时间是2016年10月

这份通告中提到:被知网录用出版的硕博士学位论文,作者可联系知网领取稿酬,学位年度2008年以后的博士论文著作权人,可一次性获得面值400元人民币的“CNKI网络数据库通用检索阅读卡”和100元人民币现金稿酬,硕士论文著作权人对应的是300元的阅读卡和60元现金。同时,录用之后不限制作者在其他渠道发表。

根据国家新闻出版广电总局的一份《使用文字作品支付报酬办法》,原创作品的基本稿酬标准为每千字80-300元,改编作品每千字20-100元。

一篇硕士论文的字数一般不少于3万字,博士论文的字数要求通常不低于10万字。如果按照这一办法,知网支付的学位论文稿酬远远低于上述标准。

南风窗询问到3名学位论文被知网收录的硕博士生,但他们都表示不知道有这项通知,也从未收到过稿酬。其中一名硕士毕业生只记得,自己曾经签署过一份学位论文使用授权书,其中就包括允许学校将论文收录进数据库。

500

对于稿酬,另一名负责硕士学位事项的某211院校辅导员给予南风窗的回答也是“没听说”。

如果上面说的这些只是围绕版权的不太合理的利益分配,那么2017年,文著协诉中国知网侵犯会员汪曾祺著作权纠纷案,知网则构成了侵权。

2017年7月,在诸多会员投诉中,文著协选取汪曾祺《受戒》一文起诉知网,在未获得作者许可,也没支付稿费的情况下,上传文字作品,侵犯作者网络信息传播权。

2018年,法院一审认定知网侵害著作权人的信息网络传播权,应承担相应的侵权责任,赔偿万元损失。知网之后两次上诉,均被驳回,法院维持原判。

500

2017年,中国文字著作权协会起诉知网侵犯汪曾祺著作权。2019年6月26日,文著协官网发布公告称终审获胜

颇为无奈的是,这一案件掀起的水花之下,是更多人的被迫忍气吞声和不了了之。学术评价体系的外部因素影响下,很多作者为了发表、收录、引用的结果,一些期刊为了提升自身的学术影响力,而不得不放弃对著作权益的维护。

从这一角度来说,知网的争议,还有包裹在版权之下的学术评价问题。

3

付费不等于保护知识产权

付费是知识产权保护的一种手段,但问题是,由谁付费,以及保护谁的知识产权?

事实上,这种保护,本身就是一把双刃剑。

“知识产权保护,不是我们本土的产物,而是来自西方的一种制度。这种制度保护的是知识创新者的利益,保护的是知识发达国家的利益。也就是说如果你是穷人,你没有钱买这个数据库,那你就没有权利享受人类的最新科研成果,从人类共同进步的角度来讲就是一个悖论。”杜恩龙对南风窗分析道。

对知网和ScienceDirect这类商业数据库来说,吊诡的地方就在于,竖起了付费墙,但这道墙未必如我们所愿,起到应有的版权保护作用,有时反而一边侵害着著作权人的利益,另一边低买高卖,把一批人拒之门外。

500

ScienceDirect首页

这样的付费墙,逐渐被人质疑。

于是有一种声音出现了:我们需要没有付费墙阻隔的科学,任何好奇的公众都可以自由且无限制地取用学术成果。

2006年,在瑞典成立了一个海盗党,这个政党关注知识产权的相关议题,主张改革版权法、废除专利、尊重隐私。

关于版权,它的创始人、IT企业家Rick Falkvinge有十分激烈的看法。

他认为,现行的版权制度已经过时,不应无止境地限制知识共享。版权法的原意就是制造垄断,而不是为了保护作者。如今分发资讯的成本极低,垄断是毫无必要的,专利制度也和鼓励创意无关,使用专利的多为大型公司所用,它的存在是科技进步及个人自由的最大障碍。

500

2011年,一个为访问者提供免费的学术文献的网站,Sci-Hub出现。

一位哈萨克斯坦研究生亚历山德拉·埃尔巴金因为获取学术论文的成本过高,成立了Sci-Hub。他运用特定帐号,每天从各大学术出版网站下载文献,并从后台更新上传到Sci-Hub网站。

目前,网站声称收录了超过8000万篇论文,每天为访客提供数十万份文献。其首页写着:致力于清除科学道路上的一切障碍。

当然,Sci-Hub也没能逃过侵权的指控。2015年,Elsevier向纽约地方法院提交诉讼,指控Sci-Hub侵犯著作权,要求网站永久关闭并支付赔偿。

2017年6月,法院裁定Sci-Hub向Elsevier赔偿1500万美元的侵权损失,但Sci-Hub没有资产,它的运营者也没有意愿支付这笔赔偿。事实上,Sci-Hub仍然运行至今,只不过是以被封禁和重新上线的游击战术存续着。

500

Sci-Hub首页

英国伦敦帝国学院的结构生物学家Stephen Curry2017年6月在《Nature》的一篇评论中感慨道:“Sci-Hub显然是非法的,但是它在学术界内部和外部如此受欢迎的事实,是许多人对学术出版现状感到沮丧的征兆。”

这份沮丧背后的疑问是,新创造的知识应该走向哪里,谁来支付版权,谁能共享,如何实现它的价值最大化?

4

另一束光

打破知识壁垒,另一个切口提供了一束光,得到了多国认可和支持——由政府或公益基金资助的科研项目,研究结果也应由纳税人免费获取。

在欧洲,这一设想被起名为S计划。

这样的倡议是对现有学术出版制度的挑战,更是对学术商业性和公益性的一次调整。

事实上,现有国内大学或科研机构的科研项目中,不少得到了政府经费资助,比如国家社科基金、自然科学基金、教育部课题资助等,但多数科研成果并没有在正式渠道免费下载。

纳税人资助的科研项目,却成了出版商设置访问权限并借机赚钱的工具,这种公益性为商业做嫁衣裳的合理性也引起不小的质疑。

500

2012年,中国社科院建立了国家哲学社会科学数据库,推进学术资源的公益使用、开放共享,公众可以免费下载国家社会科学基金项目的论文成果,但其影响力仍然无法和知网相抗衡,缺乏商业驱动是原因之一。

如果没有商业运营的介入,学术传播未必会比现在更有效率、更有秩序,这是知网和Elsevier的成功之处,也是我们接受商业规则的理由。可一旦这种商业性阻碍了人类智识和创造力的自由传播,就可能造成知识私有化的不平等,这是我们不愿意看到的。

知识产权的保护,也许需要商业规则,但回归学术与知识本身,我们更倾向于把它看作一种公共财产。

提出知识共享,并非是设想一个信息乌托邦,而是希望开拓一片能将先行者的思维成果最大化的土壤。

全部专栏