科研人士往往倾向于使用专业术语解释研究内容,而普通人却往往因此类语言不够通俗而倍感痛苦,最后往往放弃阅读。为帮助消除科研人员与普通大众间的语言分歧,以色列理工学院与霍隆理工学院(Holon Institute of Technology)的研究人员共同开发了名为“De-Jargonizer”的网页翻译器,可为普通读者标记并替换科研文章中的专业术语,助其更好地了解前沿科学成果。

“De-Jargonizer”可为浏览科学类学术文章的用户标出文中的专业术语,并替换为更常用的词汇。例如,“myocardial infarction”可被替换为“heart attack”,“aspirate”可被替换为“breathe”,“thoracic cavity”亦可被替换为“chest”。

“De-Jargonizer” 以2012年至2015年出现在BBC网站上的9000多万个单词(colours/color等相同词汇的不同拼写方式亦被添加进该语库)为基础,对约5000份科学论文中词汇的使用习惯进行了深度研究。出现的单词按照使用频率被分为高、中和低三类,而低频词汇即被视为专业术语。

这些单词也被以词族(拥有相同词根的词汇组)进行分类,以便研究人员比较其使用频率(例如,”basis”被认为是常用词汇,而”basely”却是低频词汇)。同一词族内词意相似的高频词往往被用来取代低频词。

“De-Jargonizer”的算法在文本进入其系统后会将不同词频的词汇标记为不同颜色,黑色文本为高频词汇,橙色和红色分别为中频通用词汇和专业术语(低频词汇)。

De-Jargonizer的词频测定结果。(图片来源:以色列理工学院供图)

De-Jargonizer的词频测定结果。(图片来源:以色列理工学院供图)

评价标准被确定后,研究人员便对研究文章、演讲等内容进行了研究,从而确定专业术语的使用程度。不出所料,研究结果表明,科学家们面向科研界发表的演讲中术语数量多于TED等公众演讲。

“科学家们直觉上都知道在与公众交流时需要使用更少的专业术语。”以色列理工学院教授阿耶莱特•巴拉姆-萨巴利(Ayelet Baram-Tsabari)表示,“但如此之多的生僻词就把试图参与的人们排除在了圈外。”萨巴利与同事奇波拉·拉克森(Tzipora Rakedzon)博士及霍隆理工学院的伊莱德·塞格夫(Elad Segev)博士共同指导了此次研究。

可以从De-Jargonizer中获益的不仅是普通公众,也包括医生(患者如果更清楚自己在做什么,可能会更配合地遵守医嘱)、律师(客户会更明白合同内容)、经济学家等政府官员(如今美国新法律已要求联邦部门雇佣能以“被公众所明白和使用的”方式交流的人)等人。

研究人员称,这也将为希望获得公众的资金或其他支持的科学家带来希望。“De-Jargonizer提供了先进的用户友好型工具,可通过分析文本改善交流方式,打破专业标准和‘知识的诅咒’(编辑注:即信息偏差),从而使专业人士和公众之间的交流更加高效。”

本文版权归《以色列时报》中文版所有,未经授权不得以任何形式转载或修改后转载部分或全部内容,违者必究。