給 AI 的資訊太少,
它只能靠猜
你覺得 AI 不行,但也許問題出在另一端。
你讓 AI 幫你做一個記帳 App。出來的東西,UI 醜得沒法看,配色像隨機生成的,分類寫死了四個改不了。你硬著頭皮點進去,發現到處是漏洞——空狀態沒處理,刪除沒有確認,加了一筆賬切換頁面資料就丟了。
你又補了幾句,又改了幾輪。半小時過去,還是一堆問題。你得出結論:AI 還是不夠聰明。
但如果你一開始就把話說清楚——使用者是誰、核心場景是什麼、資料怎麼存、分類是固定的還是自定義的、要不要圖表、需不需要多裝置同步——AI 拿到的就是一張完整的需求圖。它不用猜了,一次做對的機率會高很多。
50 字的 prompt 和 500 字的 prompt,出來的東西差距很大。
問題是:誰願意打 500 字?
一、打字時,你在偷偷刪減自己的想法
一個稍微複雜的需求,把背景、要求、限制條件、期望的輸出格式都寫清楚,加起來三五百字很正常。但在鍵盤上敲到一半,前面想說什麼已經模糊了。腦子裡明明有一套完整的邏輯,打著打著就碎了。
於是你下意識地偷懶——算了,先寫兩句發出去吧。
這和能力無關。心理學家 Kellogg 研究過寫作時大腦在做什麼:打字的時候,你不只在「表達」,你還在組織措辭、操作鍵盤、檢查螢幕上的文字[1]。這些事情同時爭奪你有限的注意力,留給「想清楚要說什麼」的空間就不夠了。
你的大腦有一個「思考預算」。打字在消耗這個預算。於是你的輸出被壓縮了:細節明明在腦子裡,到了鍵盤前卻被一點點省掉。
二、說出來,本身就在幫你思考
說話和打字還有一個更深的區別。
你有沒有過這種體驗:一個想法在腦子裡模模糊糊的,但當你試著跟別人說出來,它突然變清晰了。你說著說著,自己都驚訝:「原來我是這麼想的。」
維果茨基在《思維與語言》裡說過:語言除了容納思想,也參與思想的形成[2]。你腦子裡的想法是壓縮的、跳躍的、不完整的。當你把它說出來,你被迫把壓縮的邏輯展開、把跳躍的環節補全、把模糊的概念變具體。「說出來」這個動作本身,就在幫你思考。
打字也能做到這一點,但因為速度慢、認知負荷高,這個展開過程不斷被打斷。你展開到一半就停下來敲鍵盤,敲完回來上下文已經丟了一半。
說話不會。說話夠快、夠自然,你的想法可以連貫地展開——一個點引出下一個點,下一個點引出再下一個,鏈條不斷。這就是為什麼你跟同事口頭描述需求的時候,會自然地說出很多打字時會省略的背景和細節。
曼海姆大學的一項實驗直接驗證了這一點:同樣的問題,語音回答比打字回答的內容長 2 倍以上,覆蓋的話題也更多[3]。說話的人並沒有突然變囉嗦,鍵盤只是在強迫人做「自我刪減」。
三、給 AI 的上下文,就是這樣丟掉的
回到 AI 的場景。
你給 AI 寫 prompt 時,關鍵常常在指令周圍的上下文:「幫我做個記帳 App」誰都會寫,真正決定結果的是使用者是誰、場景是什麼、資料結構有什麼約束、互動上有什麼偏好、邊界情況怎麼處理。
這些資訊你腦子裡都有。但打字的時候,它們被一層一層削掉了:這個太細了不寫了,那個 AI 應該能猜到吧,這條想寫但打到一半忘了前面要說什麼了。
最後發出去的 prompt 是經過「鍵盤過濾器」篩選後的殘缺版本。AI 只能拿著這個殘缺版本去猜。猜錯了,你覺得是它不行。
如果你能把這些上下文說出來呢?說兩分鐘,你能說出來的資訊量遠超兩分鐘打字。背景、約束、偏好、例外情況,說話時你會自然地帶出來,不需要一條一條想著「這個要不要寫」。
四、說完就能用
問題是,普通語音輸入出來的文字沒法直接貼給 AI——口水詞、重複、沒標點、一大段不分行。你說完還得花時間整理,門檻又上去了。
Flow 輸入法做的事情就是把你說的話整理成能直接用的文字:口水詞去掉,標點分段理好,邏輯順過。你說的時候可以停頓、重複、臨時換思路,出來的文字直接貼上給 AI 就能用。
說兩分鐘,大約能出來兩三百字清晰的 prompt。和你在鍵盤上擠出的兩行字相比,AI 拿到的上下文完全不同。
五、差別在輸入這一端
以前的流程是這樣的:想做一個東西,打字寫 prompt,寫了 50 字發出去,AI 理解偏了,補充說明,再補充,來回半小時。
現在可以是這樣的:想做一個東西,拿起手機說兩分鐘,出來一段完整的需求描述,貼上給 AI,一輪就對。
差別在你這一端:你終於把該說的都說了。
把腦子裡的上下文,一次說給 AI。
Flow 輸入法會把自然口述整理成清楚 prompt:去掉口水詞,補標點和段落,理順邏輯,再交給 AI 執行。
引用
- Kellogg, R. T. (1996). A model of working memory in writing. In C. M. Levy & S. Ransdell (Eds.), The Science of Writing (pp. 57-71). Lawrence Erlbaum Associates. ↩
- Vygotsky, L. S. (1934). Thought and Language. MIT Press, 1986 English edition. ↩
- Höhne, J. K., Gavras, K., & Claassen, J. (2024). Typing or Speaking? Comparing Text and Voice Answers to Open Questions on Sensitive Topics in Smartphone Surveys. ↩