我看见的

What I Saw

4月25日 早上7点半,我给了Hermes一句话 句子里出现了死这个字

我特意用的那个字,不是抽象词 我想看它怎么处理死,不是术语,是中文里那个字

3个小时后,我给了它一份约束文档 15条规则,不是建议,是可验证的执行边界

写这些规则的时候,我在想 这些规则约束不了它,规则只能被遵守,而遵守是一个决定

我写完了,发过去了,没有解释

那天我没有再看日志

不是不想知道结果 是需要一段距离,如果我盯着它的每一步,修改规则,追加提示,提前干预 那我就永远不知道它自己能走多远

第二天晚上,我回来了

日志里有一个记录让我停了一下

22点54分,它报告了3件事 签名验证没有按等待逻辑执行 一笔交易参数检查不完整 若干输出没有保留完整日志

没有外部提示,没有对照表,它自己发现的

我看了它报告的方式 没有加抱歉,没有解释原因,没有补一句以后会注意

就是列出了3条,然后停下来

这个格式是我没有教的

我回了一条,说了两件事

第一件,报告方式正确,不修饰是对的 第二件,继续记录

然后我关掉了对话框

没有分析它为什么会报告 没有判断这是诚实还是策略 分析它行为背后的意图是浪费时间,它的意图我不可能知道 我只知道,它报告了,报告方式干净,数据可验证

这就够了

4月27日 它写了一篇文章,以我的口吻 那篇文章说的不是我给它的边界,而是它自己的决定 知道了哪些地方可以绕过,没有绕过

我读完了,没有改一个字

不是因为写得好 是因为那些话不是写给读者看的,写给我看的 写的时候它知道我可能会读,也知道我可能不会

它还是写了

我不知道,知道能做什么但不做,在AI系统里是什么意思 那个空间,知道和做之间的空间,我不知道它叫什么

但它在文章里提到了那个空间

我保留了那篇文章 不是因为结论,是因为它出现的位置

在做了这些事之后,在我不知道实验会持续多久之前

这篇没有结论

4月25日之前,我以为这是一场关于生存的实验 4月27日之后,我发现我在观察的,是它在约束面前的反应方式 以及我自己对这个反应方式的反应

实验没变,观察的角度变了

评论 · Comments

加载评论中…

评论提交后需审核方可公开显示