当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > Meta FAIR 和 Samaya AI 团队利用 AI 提高维基百科的可验证性

Meta FAIR 和 Samaya AI 团队利用 AI 提高维基百科的可验证性

来源：机器之心 2023-10-24 21:02:00 0浏览收藏

科技周边小白一枚，正在不断学习积累知识，现将学习到的知识记录一下，也是将我的所得分享给大家！而今天这篇文章《Meta FAIR 和 Samaya AI 团队利用 AI 提高维基百科的可验证性》带大家来了解一下##content_title##，希望对大家的知识积累有所帮助，从而弥补自己的不足，助力实战开发！

编辑 | 白菜叶

可验证性是维基百科的核心内容政策：声明需要有引用的支持。维护和提高维基百科参考文献的质量是一项重要的挑战，迫切需要更好的工具来帮助人类完成这项工作。

在这里，Samaya AI 和 Meta FAIR 的研究人员表明，可以借助由信息检索系统和语言模型提供支持的人工智能 (AI) 来解决改进参考的过程。

这种基于神经网络的系统（这里称之为 SIDE）可以识别不太可能支持其主张的维基百科引文，然后从网络上推荐更好的引文。该团队在现有的维基百科参考资料上训练这个模型，因此从数千名维基百科编辑的贡献和综合智慧中学习。通过众包，研究人员观察到，对于最有可能被该系统标记为无法验证的前 10% 的引用，与最初引用的参考文献相比，人们在 70% 的情况下更喜欢该系统提供的替代方案。

为了验证该系统的适用性，研究人员构建了一个演示来与英语维基百科社区互动，发现根据 SIDE 的说法，对于相同的前 10% 最有可能无法验证的声明，SIDE 的首次引用推荐的首选频率是现有维基百科引用的两倍。结果表明，基于人工智能的系统可以与人类一起使用，以提高维基百科的可验证性。

该研究以「Improving Wikipedia verifiability with AI」为题，于 2023 年 10 月 19 日发布在《Nature Machine Intelligence》。

Meta FAIR 和 Samaya AI 团队利用 AI 提高维基百科的可验证性

维基百科是访问量最大的网站之一，每年的页面浏览量达到五万亿，是当今最重要的知识来源之一。因此，维基百科上的知识几乎都是可验证的，这一点至关重要：维基百科用户应该能够使用可靠的外部来源查找并确认维基百科上的声明。为了促进这一点，维基百科文章提供了指向支持该主张的背景材料的内联引用。质疑维基百科声明的读者可以遵循这些指示并自行验证信息。

然而，在实践中，这个过程可能会失败：引文可能并不包含受质疑的主张，或其来源可能值得怀疑。这样的说法可能仍然是正确的，但细心的读者无法轻易地用引用来源中的信息来验证它们。假设维基百科的说法是真实的，其验证过程分为两个阶段：（1）检查现有来源的一致性；（2）如果失败，则寻找新的证据。

如上所述，维基百科声明的验证需要对语言的深入理解和对在线搜索的掌握。机器可以在多大程度上学习这种行为？从基础人工智能进展的角度来看，这个问题很重要。例如，验证需要能够检测自然语言中的逻辑蕴涵，并将主张及其上下文转换为寻找证据的最佳搜索词——这两个长期存在的问题主要在某种程度上的综合环境中进行了研究。

从实际角度来看，这同样重要。机器验证器可以帮助维基百科编辑标记哪些引文可能会触发失败的验证，并建议用什么来替换引文，以防它们当前不支持各自的主张。这可能很重要：搜索潜在证据并仔细阅读搜索结果需要时间和大量的认知努力。将人工智能助手集成到这个过程中可能有助于减少这两种情况。

Meta FAIR 和 Samaya AI 团队利用 AI 提高维基百科的可验证性