科技魔方

沉默了很久的知网 对AI重拳出击了

更多动态

2024年08月20日

  知网又又又搞事情了。

  就在前两天,上海秘塔网络科技有限公司发布声明,表示自己在 15 号的时候,收到了一份侵权告知函。

  这个告知函洋洋洒洒总共写了足足 28 页,省流版就是一句话: “ 秘塔 AI 搜索,能够检索出我家的学术文献题录和摘要数据,侵权了 ” 。

  那目的其实也很明显,原文里明明白白写了: “ 如需商务合作,请与我司联系 ” 。

  这不妥妥的就是,“ 打钱 ”的意思吗?

  而这个《 中国学术期刊( 光盘版 ) 》电子杂志社有限公司是谁呢?

  仔细一看,原来是大家都熟悉的老朋友知网啊。

  这位曾经一己之力击退 “ 翟博士 ” ,在前两年被中科院停用、被赵德馨老教授状告,甚至被国家市场监督总局以反垄断罚款 8000 多万,结果一转头,又把手伸向了 AI 了?

  秘塔这边也不怂,直接在文章里反怼,文献的摘要和题录压根就不是你们能用来赚钱的大宝贝,咱家 AI 在收录之后,老老实实贴了你们知网的链接,根本没有侵权。

  甚至他们还表示: “ 没有 search ,就没有 research” ,还怼了一口知网: “ ( 如果都像知网这样 )科学文献若成为一种奢侈品,既不利于知识的公平获取,也不利于科学研究的发展。 ”

  甚至在官网界面直接恶搞了一句 “ 完蛋!我们收到了知网 28 页的侵权告知函 ” 。

  但说归说,秘塔可能是为了规避风险,光速与知网做了切割。

  甚至还因为这波事件,获得了其它几家数据库的橄榄枝。

  我们也立马试了下秘塔搜索,发现他们如今的论文来源除了外网,基本都以万方数据库内容为主了。

  咱们先找了公司的法务了解了下,他告诉我们,最主要是看获取资料涉不涉及盈利性质。

  另一边,我们也找到了在清华的法学博士朋友阿天( 化名 )聊了聊。

  他告诉我们,整个事情很诡异,在他看来,知网大概率就是为了吓唬一下对方,真闹到对簿公堂,法院怎么判,依他看来大概率知网赢不了。

  阿天告诉我们,所谓的律师函,如今经常被作为一种 “ 法律策略 ” 来使用,说白了就是吓唬一下对方。

  比如我们网上冲浪,也经常会看到什么明星,遇到了一些狗血闹剧,然后他第一时间就是发一个律师函。

  但其实他发了律师函不代表这个狗血闹剧就被法律洗白了,很多时候,他只是为了吓唬一下。

  所以,这次知网给秘塔发律师函,到底在法律上走不走得通,不是知网说了算,是法院说了算的。

  而且,阿天感觉这事儿,知网法律依据还真不是那么足。

  因为秘塔用的数据其实就是标题和摘要,这些在知网页面,你只要搜索甚至不用登录都能看到,说白了它其实是公开的状态,所以秘塔 AI 搜索检索到这部分内容,压根就没啥毛病啊。

  论文摘要和标题啥的在知网完全就是公开的

  不仅如此,在阿天看来,国内很多论文,尤其是核心期刊,虽然被知网收录了,但其实这些论文也在期刊的官网、官方公众号等平台被免费公开了,那如果 AI 是通过这些渠道抓取到的论文,虽然和知网收录的一样,但很难说是 AI 侵权了知网。。。

  除非是知网收录的文章本身,是一个付费的非公开资源,然后 AI 搜索利用技术破解出全文,并把这些内容公开了,那才是侵权。

  但秘塔可能也存在一些不正当操作。

  根据界面新闻报道,或许秘塔 AI 搜索的播客和文库板块,可能是有索引库的。

  图自AI 产品 Rena

  也就是秘塔把批量收集的文献,先在内部做了一个 “ 蓄水池 ” 。

  当用户搜索时,秘塔会在外部搜新鲜的,然后把这些新鲜数据和 “ 蓄水池 ” 的内容整合在一起提供答案。

  如果有这个操作,那么或许就可能会面对法律上的风险了。

  我们也试了下让秘塔家的 AI 自己回答,结果它自己也确实有点不自信了。

  可知网那边真的纯粹是为了版权才找秘塔的麻烦吗?

  只能说不一定。

  因为搜索引擎能不能抓取到网站内容,压根就是网站 robots 文件设置决定的。

  如果网站的 robots 文件不允许被抓取,而搜索引擎强行抓取,那才会涉及到侵权。

  但知网主站 robots 文件网页却没禁止任何搜索引擎爬虫,那又怎么说秘塔违规了呢。

  所以,综合看起来,秘塔暂时和知网断开连接大概率是出于保险,而知网更可能是想维护自己的利益。

  大家可能对秘塔还不怎么熟悉,秘塔科技成立于 2018 年 4 月,推出 AI 搜索后,立马起飞。

  今年 3 月,据 SimilarWeb 数据, “ 新生代 ” 秘塔 AI 搜索网站日均访问量达到 20 万次以上,月增速达 551.35% 。

  而咱们编辑部在今年初发现了这个秘塔 AI 搜索,当时它凭借着出色的资料检索能力,特别是 “ 深入 ” 搜索模式,能够帮我们快速从茫茫论文中找到自己想要的资料,很快就在编辑部流行开了。

  后来秘塔也算是爆红,甚至在前不久,秘塔才刚完成了超 1 亿元人民币的新一轮融资,估值已经上涨到了 1.5 亿美元。

  兜里有钱了,知网过来提个醒,想和秘塔搞点合作赚点钱,似乎也是人之常情。

  但没想到,秘塔异常刚,根本不卖知网面子。

  虽然这一下获得了大家的关注和同情,可后面的路,秘塔或许会挺费劲的。因为哪怕秘塔刚拿到融资,可这些 AI 新势力们,大家卷的程度也已经到了难以想象的地步。

  就问常刷 B 站的差友们,上半年有没有被 Kimi 铺天盖地的广告洗脑。

  图自 36Kr

  在这种海量营销下, Kimi 收到的效果也相当明显,隐隐有着破圈的趋势。

  图自智能涌现

  而秘塔在这批 AI 新势力中,最大的特色就是深度搜索做的好,如今一下子断了知网的口子,还能不能稳住自己的特点,还得再看看。

  对于知网的这次的操作,咱们也是有点奇怪。

  明明秘塔这些 AI 搜索们,在一定程度上是给他们引流啊,比如我自己用的时候,就经常会从参考资料来源直接点进知网官网,然后登录看全文。

  可偏偏要用这种显然不被外界接受的方式,玩个大的。。。

  但无论咋说,这次知网和秘塔的故事,也是提前给大家提了个醒。

  在未来, AI 数据应用的混乱,恐怕还会带来更多争议。

  就在上个月,手握《纽约客》、《 Vogue 》和《连线》等媒体的康泰纳仕就出手给海外秘塔 Perplexity 发了份类似的停止函,也是怼这家 AI 搜索公司抄袭。

  再往前一个月,福布斯也同样指控了 Perplexity 。

  这次知网可能是小题大做了,可下次呢?

+1

来源:快科技

延展资讯