给 AI 的信息太少,
它只能靠猜
500 字 prompt 比 50 字好,但你不需要打 500 字,说出来就好。
你让 AI 帮你做一个记账 App。你打了一行 prompt:“帮我做一个记账 App,要有分类功能。”
出来的东西不太对。分类是写死的,没有统计,数据存在本地没法同步。你加了一句:“分类要可以自定义,加个统计图表。”好一点了,但交互还是不对。你又补了一轮。再补一轮。
来回三十分钟,你得出结论:AI 还不够聪明。
但如果你一开始就把话说清楚——用户是谁、核心场景是什么、数据怎么存、分类是固定的还是自定义的、要不要图表、需不需要多设备同步——AI 拿到的就是一张完整的需求图。它不用猜了,一次做对的概率会高很多。
50 字的 prompt 和 500 字的 prompt,出来的东西差距很大。
问题是:谁愿意打 500 字?
一、打字时,你在偷偷删减自己的想法
一个稍微复杂的需求,把背景、要求、限制条件、期望的输出格式都写清楚,加起来三五百字很正常。但在键盘上敲到一半,前面想说什么已经模糊了。脑子里明明有一套完整的逻辑,打着打着就碎了。
于是你下意识地偷懒——算了,先写两句发出去吧。
这和能力无关。心理学家 Kellogg 研究过写作时大脑在做什么:打字的时候,你不只在“表达”,你还在组织措辞、操作键盘、检查屏幕上的文字[1]。这些事情同时争夺你有限的注意力,留给“想清楚要说什么”的空间就不够了。
你的大脑有一个“思考预算”。打字在消耗这个预算。于是你的输出被压缩了:细节明明在脑子里,到了键盘前却被一点点省掉。
二、说出来,本身就在帮你思考
说话和打字还有一个更深的区别。
你有没有过这种体验:一个想法在脑子里模模糊糊的,但当你试着跟别人说出来,它突然变清晰了。你说着说着,自己都惊讶:“原来我是这么想的。”
维果茨基在《思维与语言》里说过:语言除了容纳思想,也参与思想的形成[2]。你脑子里的想法是压缩的、跳跃的、不完整的。当你把它说出来,你被迫把压缩的逻辑展开、把跳跃的环节补全、把模糊的概念变具体。“说出来”这个动作本身,就在帮你思考。
打字也能做到这一点,但因为速度慢、认知负荷高,这个展开过程不断被打断。你展开到一半就停下来敲键盘,敲完回来上下文已经丢了一半。
说话不会。说话够快、够自然,你的想法可以连贯地展开——一个点引出下一个点,下一个点引出再下一个,链条不断。这就是为什么你跟同事口头描述需求的时候,会自然地说出很多打字时会省略的背景和细节。
曼海姆大学的一项实验直接验证了这一点:同样的问题,语音回答比打字回答的内容长 2 倍以上,覆盖的话题也更多[3]。说话的人并没有突然变啰嗦,键盘只是在强迫人做“自我删减”。
三、给 AI 的上下文,就是这样丢掉的
回到 AI 的场景。
你给 AI 写 prompt 时,关键常常在指令周围的上下文:“帮我做个记账 App”谁都会写,真正决定结果的是用户是谁、场景是什么、数据结构有什么约束、交互上有什么偏好、边界情况怎么处理。
这些信息你脑子里都有。但打字的时候,它们被一层一层削掉了:这个太细了不写了,那个 AI 应该能猜到吧,这条想写但打到一半忘了前面要说什么了。
最后发出去的 prompt 是经过“键盘过滤器”筛选后的残缺版本。AI 只能拿着这个残缺版本去猜。猜错了,你觉得是它不行。
如果你能把这些上下文说出来呢?说两分钟,你能说出来的信息量远超两分钟打字。背景、约束、偏好、例外情况,说话时你会自然地带出来,不需要一条一条想着“这个要不要写”。
四、说完就能用
问题是,普通语音输入出来的文字没法直接贴给 AI——口水词、重复、没标点、一大段不分行。你说完还得花时间整理,门槛又上去了。
Flow 输入法做的事情就是把你说的话整理成能直接用的文字:口水词去掉,标点分段理好,逻辑顺过。你说的时候可以停顿、重复、临时换思路,出来的文字直接粘贴给 AI 就能用。
说两分钟,大约能出来两三百字清晰的 prompt。和你在键盘上挤出的两行字相比,AI 拿到的上下文完全不同。
五、差别在输入这一端
以前的流程是这样的:想做一个东西,打字写 prompt,写了 50 字发出去,AI 理解偏了,补充说明,再补充,来回半小时。
现在可以是这样的:想做一个东西,拿起手机说两分钟,出来一段完整的需求描述,粘贴给 AI,一轮就对。
差别在你这一端:你终于把该说的都说了。
把脑子里的上下文,一次说给 AI。
Flow 输入法会把自然口述整理成清楚 prompt:去掉口水词,补标点和段落,理顺逻辑,再交给 AI 执行。
引用
- Kellogg, R. T. (1996). A model of working memory in writing. In C. M. Levy & S. Ransdell (Eds.), The Science of Writing (pp. 57-71). Lawrence Erlbaum Associates. ↩
- Vygotsky, L. S. (1934). Thought and Language. MIT Press, 1986 English edition. ↩
- Höhne, J. K., Gavras, K., & Claassen, J. (2024). Typing or Speaking? Comparing Text and Voice Answers to Open Questions on Sensitive Topics in Smartphone Surveys. ↩