跳到内容 跳到导航

Research & Ideas

站内搜索

AI揭幕在高中教科书中得到了注意力

自然语言处理揭示了德克萨斯历史教科书如何对待男人,妇女和颜色人的巨大差异。

A black student sitting on a bench wiTH. a backpack, looking at a textbook

学者能够确定德克萨斯州高中历史书籍主要专注于白人。 |

利用机器学习的力量,BET356体育在线的研究人员已经衡量了一些高中历史教科书向白人支付的程度多于黑人,少数民族和女性。

在一个 新研究 美国历史教科书在德克萨斯州使用,研究人员发现了卓越的差异。

例如,西班牙裔学生占德克萨斯州学校的52%的招生,但在任何教科书中几乎没有提到的西班牙裔人民 - 不到四分之一的名字。

相比之下,除了50个最多的50个人中的五个是白人。只有一个女人制作了那个名单 - 埃莉诺罗斯福 - 只有四个人的颜色。前总统巴拉克奥巴马在29岁进入TH.,马丁路德国王进来30TH.,其次是斯科特和弗雷德里克迪格拉斯。安德鲁杰克逊,一个 奴隶主为美洲原住民的种族侵犯贡献,比其他人更加提升。

那些只是顶线号码。使用自然语言处理的工具或NLP,研究人员还量化了各种群体的特征差异。

白人更有可能与表示权力的词语相关,而女性更有可能与婚姻和家庭相关联。非洲裔美国人最有可能与无能为力和迫害的言语相关,而不是政治行动或政府。

“即使对于那些与这些教科书长大的人,这些模式令人惊讶,”说 dorottya demszky.是一个合作项目的语言学博士候选人。 “我们希望这种量化可以成为开发更代表性的教科书的工具。”

暴露模式,更快

可以肯定的是,没有秘密,教科书是由权力人民的优先事项和偏见的形状。最近作为20世纪中叶,许多南方学校都教导了内战主要是关于各国的权利而不是奴隶制。事实上,教育工作者一直在策划教科书,几十年来衡量偏见和扭曲。

研究人员所说的NLP模型可能是这种努力的有用的新工具。由于AI模型读取每个单词并解析每个句子,因此他们可以提供更多的全面,细微且可靠的不同群体的且过度的措施。

斯坦福研究人员分析了18名美国历史教科书,德州学区从2015年到2017年使用,应用了一系列自然语言处理技术。这些包括定量微妙隐式关联的神经网络模型,以及帮助推断出于特定单词组合产生的内涵的语言数据库。

Demszky,谁合作 丹杰夫斯基是斯坦福语言学和计算机科学教授的教授,以及斯坦福和成员 斯坦福人以人为人的人工智能研究所,与露西李,博士学生在UC Berkeley和 Patricia Bromley是斯坦福教育副教授。

“对更具社会意识的模型进行了自然语言处理的实际转变,”JuraFsky说。 “这些可以帮助发现人们在文本中描述的隐含方式,并更好地捕获语言如此重要的人类和社会元素。”

德克萨斯历史项目中最戏剧性的发现是虚拟缺席的西班牙裔人,他们几乎没有关注墨西哥战争之外。女性更好,但他们也比男人更频繁地讨论。

当研究人员看着与不同群体相关的词语时,他们发现黑人与其他团体相连,以免像“奴隶”这样的无能为力,“逃脱”,“拥有”和“禁止”。研究人员表示,这是赔率,具有新的历史研究,强调了黑人为自由而战的权力和机构。与此同时,妇女与动词相连,如“结婚”和“帮助”和“妻子”和“母亲”等名词。 “家庭”,“家”和“家务”是与女性相关的其他顶级词语之一。另一方面,白人与“领导者”,“权威”,“成就”和“强大”的词汇最密切关心。

当他们看着与不同群体相关的主题时,研究人员发现了类似的差异。妇女与两个主题有关 - 家庭和社会运动。男性也与家人有关,也与军事和决策也有关。

也许毫不奇怪,研究人员发现,学区的政治倾向影响了所用教材的种类。由民主选民主导的县的教科书支付了对女性的作用,而不是共和党县中使用的教科书的关注。然而,没有教科书都没有对西班牙裔人进行任何真正关注。

研究人员谨慎,这项研究不会得出关于为什么有些教科书更加关注白人的结论,而不是妇女和少数群体,也没有关于适当的水平。虽然旧的偏见是解释的一部分,但另一种可能性是许多教科书专注于正式的政治事件和领导者,而不是人们的生活。

Demszky说,关键的外卖器是,机器学习和自然语言处理提供了了解教科书真正教学的新机会,并使它们更广泛地相关。

“这有可能改善教科书,以便学生觉得更具代表性,并对历史迈出更加批判,”她说。 “如果我们的论文可能是实现这种发生的一步,我会非常幸福。”