Flow Insights

给 AI 的信息太少,
它只能靠猜

500 字 prompt 比 50 字好,但你不需要打 500 字,说出来就好。

一条简短输入展开成完整的 AI 需求图
对 AI 说清楚背景、边界和验收标准,结果往往完全不同。

你让 AI 帮你做一个记账 App。你打了一行 prompt:“帮我做一个记账 App,要有分类功能。”

出来的东西不太对。分类是写死的,没有统计,数据存在本地没法同步。你加了一句:“分类要可以自定义,加个统计图表。”好一点了,但交互还是不对。你又补了一轮。再补一轮。

来回三十分钟,你得出结论:AI 还不够聪明。

但如果你一开始就把话说清楚——用户是谁、核心场景是什么、数据怎么存、分类是固定的还是自定义的、要不要图表、需不需要多设备同步——AI 拿到的就是一张完整的需求图。它不用猜了,一次做对的概率会高很多。

50 字的 prompt 和 500 字的 prompt,出来的东西差距很大。

问题是:谁愿意打 500 字?

一、打字时,你在偷偷删减自己的想法

一个稍微复杂的需求,把背景、要求、限制条件、期望的输出格式都写清楚,加起来三五百字很正常。但在键盘上敲到一半,前面想说什么已经模糊了。脑子里明明有一套完整的逻辑,打着打着就碎了。

于是你下意识地偷懒——算了,先写两句发出去吧。

复杂想法经过键盘后被压缩成短短一行输入
打字会把完整想法挤成很短的输入,很多上下文在路上就被删掉了。

这和能力无关。心理学家 Kellogg 研究过写作时大脑在做什么:打字的时候,你不只在“表达”,你还在组织措辞、操作键盘、检查屏幕上的文字[1]。这些事情同时争夺你有限的注意力,留给“想清楚要说什么”的空间就不够了。

你的大脑有一个“思考预算”。打字在消耗这个预算。于是你的输出被压缩了:细节明明在脑子里,到了键盘前却被一点点省掉。

二、说出来,本身就在帮你思考

说话和打字还有一个更深的区别。

你有没有过这种体验:一个想法在脑子里模模糊糊的,但当你试着跟别人说出来,它突然变清晰了。你说着说着,自己都惊讶:“原来我是这么想的。”

说出来的想法逐渐展开成清晰的结构图
说话会迫使模糊想法展开,很多隐藏的逻辑会在讲述中浮出来。

维果茨基在《思维与语言》里说过:语言除了容纳思想,也参与思想的形成[2]。你脑子里的想法是压缩的、跳跃的、不完整的。当你把它说出来,你被迫把压缩的逻辑展开、把跳跃的环节补全、把模糊的概念变具体。“说出来”这个动作本身,就在帮你思考。

打字也能做到这一点,但因为速度慢、认知负荷高,这个展开过程不断被打断。你展开到一半就停下来敲键盘,敲完回来上下文已经丢了一半。

说话不会。说话够快、够自然,你的想法可以连贯地展开——一个点引出下一个点,下一个点引出再下一个,链条不断。这就是为什么你跟同事口头描述需求的时候,会自然地说出很多打字时会省略的背景和细节。

曼海姆大学的一项实验直接验证了这一点:同样的问题,语音回答比打字回答的内容长 2 倍以上,覆盖的话题也更多[3]。说话的人并没有突然变啰嗦,键盘只是在强迫人做“自我删减”。

三、给 AI 的上下文,就是这样丢掉的

回到 AI 的场景。

你给 AI 写 prompt 时,关键常常在指令周围的上下文:“帮我做个记账 App”谁都会写,真正决定结果的是用户是谁、场景是什么、数据结构有什么约束、交互上有什么偏好、边界情况怎么处理。

用户场景、数据结构和边界条件被键盘过滤成稀薄输入
AI 需要的是完整上下文;键盘过滤之后,留下的常常只是一小段残缺输入。

这些信息你脑子里都有。但打字的时候,它们被一层一层削掉了:这个太细了不写了,那个 AI 应该能猜到吧,这条想写但打到一半忘了前面要说什么了。

最后发出去的 prompt 是经过“键盘过滤器”筛选后的残缺版本。AI 只能拿着这个残缺版本去猜。猜错了,你觉得是它不行。

如果你能把这些上下文说出来呢?说两分钟,你能说出来的信息量远超两分钟打字。背景、约束、偏好、例外情况,说话时你会自然地带出来,不需要一条一条想着“这个要不要写”。

四、说完就能用

问题是,普通语音输入出来的文字没法直接贴给 AI——口水词、重复、没标点、一大段不分行。你说完还得花时间整理,门槛又上去了。

零散口述穿过整理层后变成清晰段落
语音输入真正有用的前提,是说完之后的文字能直接交给 AI。

Flow 输入法做的事情就是把你说的话整理成能直接用的文字:口水词去掉,标点分段理好,逻辑顺过。你说的时候可以停顿、重复、临时换思路,出来的文字直接粘贴给 AI 就能用。

说两分钟,大约能出来两三百字清晰的 prompt。和你在键盘上挤出的两行字相比,AI 拿到的上下文完全不同。

五、差别在输入这一端

以前的流程是这样的:想做一个东西,打字写 prompt,写了 50 字发出去,AI 理解偏了,补充说明,再补充,来回半小时。

完整上下文进入 AI 后生成清晰的产品蓝图
当输入端给够背景、约束和验收标准,AI 才有机会少猜一点。

现在可以是这样的:想做一个东西,拿起手机说两分钟,出来一段完整的需求描述,粘贴给 AI,一轮就对。

差别在你这一端:你终于把该说的都说了。

把脑子里的上下文,一次说给 AI。

Flow 输入法会把自然口述整理成清楚 prompt:去掉口水词,补标点和段落,理顺逻辑,再交给 AI 执行。

引用

  1. Kellogg, R. T. (1996). A model of working memory in writing. In C. M. Levy & S. Ransdell (Eds.), The Science of Writing (pp. 57-71). Lawrence Erlbaum Associates.
  2. Vygotsky, L. S. (1934). Thought and Language. MIT Press, 1986 English edition.
  3. Höhne, J. K., Gavras, K., & Claassen, J. (2024). Typing or Speaking? Comparing Text and Voice Answers to Open Questions on Sensitive Topics in Smartphone Surveys.