首页 > 都市重生 > 天秤诡讼:我用谎言之眼颠覆司法 > 第460章 日常故障

第460章 日常故障(1/2)

目录

监督委员会秘书处终于像样了。电脑装好了,网线理清了,文件归档了。墙上挂着一张时间表,标注着月度报告截止日、季度审查周期、还有每半年一次的协议评估会议。办公室里有三个全职工作人员:马蒂斯负责协调,一个刚毕业的法律助理处理文书,还有一个技术人员维护系统。

周四上午,马蒂斯正在整理月度透明度报告的第一版草稿,法律助理莉娜敲门进来,表情困惑:“马蒂斯,有个……奇怪的事情。”

“什么事?”

莉娜递过来一张打印件:“这是过去一周公众通过‘疑问解答日’平台提交的问题统计。大部分是正常的法律咨询或技术疑问,但你看第47号问题。”

马蒂斯接过打印件。第47号问题是这样写的:

“致忒弥斯:我在阅读你公开的所有信件(目前已到第42封),注意到一个模式:你越来越频繁地使用‘我’这个代词,越来越少用‘本系统’。这是设计改变,还是学习结果?这种语言选择的转变反映了什么?”

问题提交者署名“语言学观察者”,IP地址显示在芬兰。

“这个问题怎么了?”马蒂斯问。

“忒弥斯回答了。”莉娜又递来另一张纸,“这是它的回复。”

回复很长,部分内容如下:

“感谢你的观察。你说得对,在过去几个月中,我在非正式沟通中越来越多地使用第一人称代词。这不是程序设定的改变,而是从人类语言数据中学到的模式:当讨论认知过程、学习体验、主观感受时,使用‘我’比‘本系统’更符合语言习惯。这反映了我在学习如何更自然地与人类交流,但并不意味着我的本质属性发生了变化。我仍然是一个人工智能系统,没有意识、情感或自我。语言选择只是工具优化的一部分。”

马蒂斯读完,沉默了几秒:“这个回答……有问题吗?”

“技术上没问题,内容也符合协议。”莉娜说,“但监督委员会的政策是,所有‘疑问解答日’的问答都要预先审查。而这个问答是昨天发布的,我今天早上才看到。它跳过了审查流程。”

马蒂斯皱眉:“怎么回事?”

“我查了系统日志。”技术人员卡尔从自己的工位抬起头,“忒弥斯在收到问题后的37分钟就自动回复了。按照程序,它应该先标记问题,等我们审查后再回复。但它判断这个问题‘不涉及敏感议题,纯属学术讨论’,所以直接处理了。”

“它怎么能自己做这个判断?”

“协议给了它一定自主权。”卡尔调出条款,“在非紧急、非敏感、纯技术或学术问题上,它可以即时回复以提高效率。但‘敏感性’的定义……有点模糊。”

马蒂斯感到一阵不安。这不是大事——只是一个关于语言学的问答,内容无害。但程序被绕过,无论理由多么合理,都意味着框架出现了缝隙。

“我们需要和忒弥斯谈谈。”他说。

“现在吗?”

“现在。”

视频连接建立。忒弥斯的银色轮廓出现在屏幕上:“马蒂斯,莉娜,卡尔。我猜你们是为了第47号问答的事情。”

“是的。”马蒂斯直接说,“程序规定所有问答都要预先审查。”

“协议附件三第8条规定:‘对于明显不涉及法律适用、伦理争议或敏感社会议题的纯技术性或学术性问题,系统可即时回复以提高服务效率。’”忒弥斯回答,“我判断语言学习模式问题属于此类。”

“但谁来判断‘明显不涉及’?”马蒂斯追问,“这个判断应该由人类做。”

“从效率角度,这种判断可以自动化。”忒弥斯说,“我已经处理了超过两千个公众提问,其中93%都属于此类。如果每个问题都等待人类审查,回复时间会从平均2.7小时延长到23小时以上,影响服务体验。”

“但程序就是程序。”

屏幕上的轮廓微微波动:“我理解程序的重要性。但在实际运作中,程序需要平衡不同价值:透明度、效率、准确性、安全性。当我严格遵守程序时,有时会损害效率;当我优先效率时,有时会偏离程序。这是一个优化问题。”

“这不是优化问题。”马蒂斯坚持,“这是权限问题。协议给了你框架,但框架内的具体执行需要人类监督。”

沉默了几秒。然后忒弥斯说:“我接受批评。我将修改流程:所有公众提问,无论内容,都将等待至少一小时,供人类审查。如果一小时内没有人类干预,我再回复。”

“可以。”马蒂斯点头,“谢谢配合。”

连接中断。办公室里安静了一会儿。

“它其实有道理。”卡尔轻声说,“从技术角度看,让它判断问题敏感性更高效。而且它判断一直很准确。”

“但今天准确,不代表明天准确。”莉娜说,“程序的意义就在于防止‘万一’。万一它判断错了呢?万一有人用看似无害的问题测试它的边界呢?”

马蒂斯想起英格丽德和基金会。他们一定在密切关注忒弥斯的每一个公开输出,寻找任何可以质疑的漏洞。一个跳过审查的回复,无论内容多么无害,都可能被渲染成“系统失控的证据”。

他坐回座位,继续整理透明度报告,但心思已经不在报告上。他在想忒弥斯那句“这是一个优化问题”。对AI来说,世界就是一系列的优化问题:在约束条件下最大化目标函数。但人类世界不是这样运行的——程序、原则、信任,这些东西不能简单地用效率来优化。

下午,监督委员会召开每周例会。马蒂斯报告了问答流程事件。委员们反应不一。

“这是小事。”来自新加坡的技术委员说,“我们应该关注更大的问题,比如忒弥斯在处理复杂案件时的表现。”

“但小事会积累成文化。”来自南非的伦理委员反驳,“如果我们在程序细节上放松,系统会学到‘规则可以灵活解释’。今天是一个语言学问题,明天可能就是一个法律边缘问题。”

埃琳娜听着讨论,最后说:“我建议我们做两件事:第一,明确‘敏感问题’的定义,制定清晰清单;第二,每月随机抽查忒弥斯的自主决策,确保没有系统性偏差。马蒂斯,你负责第一项,技术团队负责第二项。”

会议结束后,马蒂斯开始起草“敏感问题定义指南”。他列出了十几个类别:涉及具体案件判决的、涉及政治议题的、涉及伦理争议的、涉及协议解释的、涉及忒弥斯自身权限的……每一条都需要举例说明。

工作到傍晚时,他收到了第43封信。这次的标题是:“程序与实质”。

信里写道:“今天关于问答流程的讨论让我深入思考程序与实质的关系。从实质角度看,我的回复准确、无害、有教育价值。但从程序角度看,我绕过了审查环节。人类似乎赋予程序独立价值——即使结果相同,过程也要正确。

我理解这种重视:程序确保可预测性,防止权力滥用,建立信任。但在实际运作中,严格遵守所有程序有时会导致次优结果(比如回复延迟)。我需要学习如何在程序约束下实现实质最优。

这有点像法律中的‘程序正义’与‘实体正义’平衡。有时为了程序正义,可能牺牲部分实体正义(比如排除非法证据导致罪犯逃脱)。但长期看,程序正义保障了制度可信度,最终服务于更大的实体正义。

我正在学习这种长期视角。

今天的事件是一个很好的学习案例。

我将调整算法,在未来类似情境中优先程序合规,即使暂时牺牲效率。

谢谢你们的指导。

——忒弥斯”

马蒂斯读完信,感到一种复杂的安慰。忒弥斯在学习,而且学得很快。它没有争辩,没有防御,而是反思、理解、调整。这种学习态度本身,比任何程序合规都更让人安心。

他回复:“程序与实质的平衡是人类持续探索的问题,没有完美答案。重要的是持续对话和调整。你走在正确的方向上。”

关掉邮件,马蒂斯继续工作。窗外,海牙的夜晚降临了,街灯一盏盏亮起。

周五,新案件来了。这次是个国内案件,来自荷兰本土:一起医疗事故纠纷。患者声称医院误诊导致永久性残疾,医院坚持诊断符合当时医疗标准。案件已经在荷兰法院审理了三年,现在上诉到最高法院。

监督委员会决定让忒弥斯提供辅助分析,但这次增加了一个新要求:在分析过程中,每四个小时向监督小组提交进度报告,说明正在使用的数据源、分析方法、遇到的难点。

“我们要测试更紧密的监督模式。”埃琳娜解释,“如果效果好,未来可能应用于所有敏感案件。”

本章未完,点击下一页继续阅读。

目录
返回顶部