伍斯特理工学院(WPI)计算机科学和数据科学助理教授Roee Shraga获得了国家科学基金会的175,000美元资助,用于研究数据发现和整合的人类因素。该研究项目旨在探讨人类在数据准备过程中所起的关键作用,以识别和解决自动化系统可能未能检测到的偏见。“我们将能够创建一个对用户更有利的未来框架,”Shraga说。“这将带来更好的数据、更好的数据集,以及一个更好的用户界面,供人们查找数据。”
Shraga表示,他将研究人类在快速发展的人工智能领域中作为标签者、提示者和验证者的角色,并利用认知心理学文献和技术在数据发现过程中识别偏见,以了解人类如何思考。计算机科学家、编码人员和其他构建人工智能平台的人所具有的隐性偏见可能会影响技术中的算法,导致无法被发现或无意的歧视。
这项为期两年的研究还将探讨大型语言人工智能模型(如ChatGPT)的出现实际上可能需要更多而不是更少的人类参与,以确保结果的质量。这一概念被称为“人体在环”,研究人类视角如何适应机器学习和大型语言人工智能模型,如ChatGPT。资助的一个重点是“表联合搜索”,这是一种科学家通过在线寻找其他来源来扩展数据集的方法。
例如,在医疗保健领域,研究人员可能会进行表联合搜索以获取更多汇总或去识别化的病人数据,从而获得更强大和可靠的结果。这些方法并不新鲜,但过程往往缺乏跟进以确定额外数据是否真的对用户有利。结合“人体在环”互动和人工智能的更佳过程可以为研究人员提供更多可使用的数据,Shraga说。
Shraga还表示,他的研究也在探讨大型语言模型的怪癖,如其产生不正确但貌似合理的数据的倾向,实际上如何能被用来为研究人员所用。在应用中,生成现实但不真实的数据表的重要性体现在数据可能涉及隐私问题的场合。