alixixi 11 月 11 日消息,维基媒体基金会(Wikimedia Foundation)昨日(11 月 10 日)发布公开声明,敦促人工智能(AI)公司停止通过网络抓取方式获取维基百科内容,推荐使用其付费 API 产品 ——“维基媒体企业平台”(Wikimedia Enterprise)。

alixixi援引博文介绍,维基媒体基金会(维基百科的运营组织)近日正式向 AI 行业发出呼吁,希望开发者能够“负责任地”使用其庞大的知识库。基金会明确提出两项核心要求:

第一,停止使用自动化程序直接抓取网站数据,因为这种行为严重消耗其服务器资源;

第二,转而采用其专为大规模数据使用设计的付费产品 ——“维基媒体企业平台”。此举旨在建立一个更可持续、互惠互利的合作模式。

维基百科发出这一呼吁的背后,是其正面临的生存挑战。该组织近期发现,其网站在五、六月份出现的异常高流量,实际上源于大量试图伪装成人类用户的 AI 机器人进行的密集数据抓取。

在更新了机器人检测系统后,这一现象才被揭示。与此同时,维基百科的“人类页面浏览量”却出现了同比下滑 8%。这种趋势威胁到了维基百科的核心运作模式,即依赖公众访问来吸引新的志愿者和捐赠者。

为应对挑战,维基百科推广其“维基媒体企业平台”作为解决方案。这是一个采用自愿选择模式的付费 API 产品,它不仅为 AI 公司提供了稳定、高效的数据接入方式,避免了因直接抓取而给维基百科服务器带来的巨大压力,其商业收入将直接用于支持维基百科的非营利使命。通过这种方式,AI 公司在使用数据的同时,也为知识的创造与维护做出了贡献。

除了商业合作,维基媒体基金会还着重强调了“内容归属”的重要性。基金会认为,为了让公众信任互联网上的信息,平台必须清楚地标明信息来源。

对于使用维基百科内容训练或生成结果的 AI 模型而言,提供明确的来源归属,是对背后数百万人类志愿者贡献的基本尊重。如果访问量持续减少,志愿者和捐赠者的生态系统将受到侵蚀,最终损害这个全球最大在线百科全书的内容质量与更新速度。

相关阅读:

《AI 导致维基百科人类访问量显著下降,运营方疾呼“危险”》

《维基百科解析 AI 文字内容“套路”:从语气到格式的常见破绽》

本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:[email protected]