ARC·原创|算法透明度:应对“算法黑箱”的工具性概念
2021-12-06 15:48:35
  • 0
  • 0
  • 1

来源:受众研究中心   作者:潘蕾


 前言
步入智媒时代,算法成为数字平台的有机组成部分,嵌入内容生产、分发、核查的每个环节中。智能算法在为用户提供个性化、精准服务的同时,也带来了一大隐患——算法“黑箱”。难窥其里的算法黑箱,使得用户权益保障愈发困难。今年9月发布的《关于加强互联网信息服务算法综合治理的指导意见》、11月施行的《中华人民共和国个人信息保护法》均提出了规范算法使用、应对算法黑箱的指导意见和措施。应对算法黑箱,方向何在?本文将介绍一个源自西方的工具性概念“算法透明度”,探讨打开算法黑箱的可能性和道路。


01.
作为一种工具性概念

算法透明度(Arithmetic Transparency)来源于透明度(Transparency)。透明度原则最早出现于19世纪中叶,是西方民主政治语境的产物,基于透明原则的民主政治能够保护公民知情权,使公权力机关可问责[1]。此后透明度概念推广开来,在管理科学、商业等领域被频繁讨论。透明度被定义为信息的可访问性、可用性及信息可以支持用户决策的程度[2]。

20世纪70年代,透明度概念被挪用至新闻业并成为新闻行业的新核心标准[3]。有学者将透明度定义为使新闻业内外人士“都有机会监督、检查、批评甚至干预新闻报道的方式”[4]。近年来,算法这一以自动化决策过程为核心的力量加入到新闻的生产、分发、核查等环节中,形成“黑箱”,新闻的透明度受到了挑战。在此背景下,“算法透明度”作为优化算法伦理和问责的工具性概念应运而生[5]。

图1 算法黑箱的形成

对于算法透明度的内涵和实现方式,学界有不同的偏向。在算法运行机制的层面,有学者认为算法透明度概念是“阐明与算法有关的信息被公开的机制,披露关于算法如何驱动各种计算系统的信息,以允许用户确定在操作过程中的价值、偏差和意识形态,了解新闻产品中的潜在观点”[6]。具体来说,就是从算法机制运行的流程出发,在每一个层级都定义应该被公开的算法元素,如下图。

图2 四个层级中应被公开的元素[7]

更多学者认为,算法透明度的不应仅仅包括系统设计和算法机制的层面。算法系统不仅仅是代码和数据,还是人类和非人类行动者的集合[8]。算法黑箱实际上存在于“社会网图”和“技术网图”的交叉地带[9],要使之透明化,既要关注技术,也要关注其中进行互动的各主体形成的“行动者网络”。在阐明算法机制的同时,还须阐明算法与其他社会要素之间的互动和这些互动对算法本身的重塑[10]。


02.
作为一种理想

然而,从各方面考虑,包括技术因素、商业利益、隐私保护、用户体验等,完全的、概念上的算法透明度只能作为一种理想而难以成为现实 。

算法经历了由工程师定义到机器学习的阶段。在人工定义的过程中,复杂繁多的规则可以被呈现却难以被解释和理解,不易于理解的信息对于增进算法透明度来说没有意义[11]。机器学习算法通过输入大数据集进行学习,无论是监督学习还是无监督学习,其输出的结果是操作员也难以解释并“提供算法表示”的[12]。随着时间更迭,系统的操作环境变化,算法规则也不唯一[13]。此外,算法透明度很有可能伤害到使用算法的组织的自主权,出于对商业上的竞争优势的考虑,让所有组织追求算法透明度也是不可行的[14]。

从另一角度看,完全的算法透明度并无必要。目前尚没有实证研究证明透明度会带来信任[15],透明度也不一定会带来算法系统使用体验的优化[16]。由于算法以数据为基础,算法透明度必然伴随着用户数据的公开,不利于用户的隐私保护。将冗长的算法机制进行公开,甚至可能损害到系统中的用户体验[17]。


03.
算法透明度的实践路径

算法透明度在理想化的实现上面临着重重困难,并不意味着要放弃对它的追求,它依然是解决算法伦理问题的重要环节[18]。只是在实践路径上,不以追求不可能实现的算法完全透明为目标[19],而是从不同主体出发,提出算法透明度实践的不同方式。

算法的设计者、操作者在实践算法透明度时,要以用户体验为中心,提供适宜的、有效的、可理解的算法透明度。用户对系统的卷入程度决定了他们对算法透明度的需求,企业管理者要理解自己的用户,并灵活地调节算法透明度;对于算法所需的用户数据,应有节制地收取[20]。渐进式披露(Progressive Disclosure)的方式也有助于创造更好的用户体验,具体表现为,只有在用户提出要求时,才会“根据需要”有序、渐进地提供更高一级的信息和解释[21]。

图3 Facebook对其动态消息可调节性的说明

2017年以来,西方一些行业自律组织等也提出了算法透明度原则。美国计算机协会(USACM)发布了关于算法透明度和问责制的原则,为企业的算法透明度实践提供了可执行的方法并呼吁企业参与,包括记录模型、算法、数据、决策以便审计,使用严格的方法来验证、测试和评估算法模型并公开结果等[22]。

针对涉及利益等因素而未公开算法的企业、组织,研究者和行业规范者呼吁采用“逆向工程”的方法来实现监督,即通过系统输出给用户的结果进行观察和反推,推断出算法的模式和规律,人工破解黑箱[23]。如研究者王茜通过对新浪微博公开的材料和热榜上榜词的文本分析,考察了微博热搜的把关标准,总结了微博热搜算法价值的四个要素:时新性、流行性、互动性和导向正确[24]。

图4 “逆向工程”:对热搜上榜词的考察[25]

此外,从规制的角度进行实践,能够更好地保护用户实际权益。《关于加强互联网信息服务算法综合治理的指导意见》指出,要构建算法监管体系,有效监测算法安全风险、推进算法备案工作,推动算法公开透明。《中华人民共和国个人信息保护法》第二十四条也规定,利用个人信息进行自动化决策,要保证决策的透明度和结果公平、公正,应当同时提供不针对其个人特征的选项,个人有权要求对自动化决策进行说明,并有权拒绝。学界则提出,可对数据库分级、管控用户权限;“以算法规制算法”,在代码中加入数据保护步骤等[26]。在事后问责机制上,可通过建立统一的算法技术标准来指引“结构性元规则”的制定,建立算法系统和法律系统间的沟通机制[27]。


结语

算法透明度源于透明度原则,为适应智能时代的算法伦理而生,是应对算法黑箱的工具性概念。通过探讨它的概念和内涵,我们界定了理想上的算法透明度。理想难以企及,但转而从实用主义的角度看,它能够成为智媒治理的有力“辅助性工具”[28],我们更应关注算法透明度的有意义实践。通过算法透明度的实践,“黑箱”将不再密不透风,算法治理未来的方向将更加明晰。


参考文献:
[1][28] 徐琦.辅助性治理工具:智媒算法透明度意涵阐释与合理定位[J].新闻记者,2020(08):57-66.
[2][11] Turilli, M, Floridi, et al. The ethics of information transparency[J]. Ethics & Information Technology, 2009.
[3][4] Deuze M. What is journalism?: Professional identity and ideology of journalists reconsidered[J]. Journalism, 2005.
[5][6][7] Diakopoulos N , Koliska M. Algorithmic Transparency in the News Media[J]. Digital Journalism, 2016:1-20.
[8][17] Ananny M , Crawford K . Seeing without knowing: Limitations of the transparency ideal and its application to algorithmic accountability[J]. New Media & Society, 2016:146144481667664.
[9][13][15] 刘斌.算法新闻的公共性建构研究——基于行动者网络理论的视角[J].人民论坛·学术前沿,2020(01):72-83.
[10] 陈昌凤,张梦.智能时代的媒介伦理:算法透明度的可行性及其路径分析[J].新闻与写作,2020(08):75-83.
[12] Mittelstadt B , Allo P , Taddeo M , et al. The Ethics of Algorithms: Mapping the Debate[J]. Social Science Electronic Publishing.
[14][16][17] Whittaker S , Springer A . Progressive Disclosure: When, Why and How Do Users Want Algorithmic Transparency Information?[J]. The ACM Transactions on Interactive Intelligent Systems, 2020.
[18][21] 张淑玲.破解黑箱:智媒时代的算法权力规制与透明实现机制[J].中国出版,2018(07):49-53.
[19] 师文,陈昌凤.信息个人化与作为传播者的智能实体——2020年智能传播研究综述[J].新闻记者,2021(01):90-96.
[20] Watson H J , Nations C . Addressing the Growing Need for Algorithmic Transparency[J]. Communications of the Association for Information Systems, 2019:488-510.
[22] Association for Computing Machinery. Statement on Algorithmic Transparency and Accountability [EB/OL].https://www.acm.org/binaries/content/assets/public-policy/2017_usacm_statement_algorithms.pdf,2017-01-12.
[23] 仇筠茜,陈昌凤.基于人工智能与算法新闻透明度的“黑箱”打开方式选择[J].郑州大学学报(哲学社会科学版),2018,51(05):84-88+159.
[24][25] 王茜.批判算法研究视角下微博“热搜”的把关标准考察[J].国际新闻界,2020,42(07):26-48.
[26] 吴椒军,郭婉儿.人工智能时代算法黑箱的法治化治理[J].科技与法律(中英文),2021(01):19-28.
[27] 衣俊霖.数字孪生时代的法律与问责——通过技术标准透视算法黑箱[J].东方法学,2021(04):77-92.
*图2来源于论文原文,出处已标注,笔者翻译后重制;
图4来源于论文原文,出处已标注;
其余图片来源于网络
 
最新文章
相关阅读