MacBookで最も過小評価されているハードウェアは、マイクだ
毎日その上でテキストを生み出している。でもタイピングの仕方は、20年間ほとんど変わっていない。
10万円以上かけてMacBookを買った。チップを調べ、メモリを比較し、ディスプレイを確認し、バッテリー駆動時間も検討した。毎日それを使ってメールを書き、メッセージを送り、ドキュメントを作り、AIにプロンプトを投げている。
しかし、毎日テキストを生み出すその方法は、20年前からほとんど変わっていない——下を向いて、タイピングしている。
その一方で、あなたのMacBookには指向性ビームフォーミング対応の3マイクアレイが搭載されている。あなたの声と周囲の騒音を区別できるマイクだ。MacBook Proのスペックページで、Apple自身が「スタジオ品質」と謳っている。Airにも同じ3マイクアレイとビームフォーミングが備わっている。これはビデオ通話を「なんとかこなす」ためのパーツではない——人間の声を精確に捉えるために設計されたものだ。
しかし、ほとんどの時間、それは何をしているのか。
会議。ビデオ通話。たまのボイスメッセージ。
それ以外の時間は、ただ眠っている。
たぶん一度試して、やめたはずだ
多くの人が音声入力を避けてきたのは、知らなかったからではない。試してみて、キーボードに戻ったのだ。
理由は現実的だ。Appleの標準音声入力は短いフレーズには問題ないが、長い文章、固有名詞、複数言語の混在、あるいは長い思考の連鎖になると、出力にはかなりの修正が必要になる。誤りを直し、句読点を足し、段落を分け直し、トーンを調整する。タイピングの時間は節約できたのに、書き起こしの修正に同じだけ時間がかかる。
怠けているわけではないし、マイクが悪いわけでもない。ソフトウェアの層が追いついていなかったのだ。
ハードウェアは音を捉える。ソフトウェアが、それを使えるテキストにするかどうかを決める。その層が長い間不十分だったので、優れたマイクさえも「会議ツール」に格下げされてきた。
タイピングは思考を圧縮する
タイピングと話すことの違いは、速度だけの問題ではない。
同僚に何かを口頭で説明するとき、自然と丁寧になる。背景、理由、例外ケース、相手にやってほしいこと——話していると自然に出てくる。しかしキーボードの前に座ると、本能的に圧縮する。「もういいや、二行で書こう」。
文章の研究者ケロッグは、これをワーキングメモリの競合として説明した。タイピングするとき、表現、語彙選択、キーボード操作、画面確認が同時に起きる。複数のタスクが注意力を奪い合い、内容が押し出される。
話すことは軽い。キーの位置を考える必要がないから、注意を内容そのものに向けていられる。
こんな経験は誰にでもあるだろう。同僚に複雑なことを説明しようとして、3行打って2行消して、結局「やっぱり電話しよう」と送る。書きたくなかったわけではない——タイピングという行為そのものが、表現を圧縮し続けているのだ。
AIの時代になって、この問題はさらに鋭くなっている。AIへのプロンプトを書くとき、50語の入力と500語の入力では結果がまるで違う。背景、制約条件、受け入れ基準、ユーザーシナリオ——そうした文脈こそAIが本当に必要としているものだ。でもキーボードで500語打ちたい人がいるだろうか。
キーをひとつ押して、2分間話し、その文脈が自動的にテキストになったら?
ひとつのキーと3マイクアレイ
MacBookのキーボードの左下に、ほとんどの人があまり意識していないキーがある。fn(新しいモデルでは🌐も表示されている)。ファンクションキーの切り替えで触る程度で、それ以外に使ったことがない人がほとんどだろう。
しかし、これを音声入力のトリガーだと考えると、実は位置が絶妙だ——左手の小指がちょうどそこに載る。手を動かす必要がなく、作業の流れが途切れない。
Appleは実は音声入力のインフラをすでに整えている。ノイズからあなたの声を分離できるマイクアレイ、手の届く位置にある物理キー、macOSレベルでは通話時の音声品質向上のための「声を分離」機能。ハードウェアもエントリーポイントもすでにある。
足りなかったのは最後の層——話した内容を、そのまま使えるテキストに変えること。
ソフトウェアの層
普通の音声入力は荒いテキストを生みがちだ。つなぎ言葉、繰り返し、句読点なし、段落分けなし。結局あとからキーボードで修正することになり、元に戻ってしまう。
Flow Keyboardがやっていることはシンプルだ。話した内容を、すぐに使えるテキストに変える。途中で間を置いても、繰り返しても、考えが変わっても——つなぎ言葉は除かれ、句読点と段落が整い、論理がなめらかに整えられた状態で出てくる。同僚に送っても、AIのチャットに貼っても、ドキュメントにそのまま落としても使える。
Macのワークフローはもともとテキスト中心だ——メール、ドキュメント、Slack、Notion、コードエディタ、AIツール。Flow Keyboardはあらゆるテキストフィールドで動く。カーソルがある場所が、声を使える場所になる。
会議が終わって、記憶が鮮明なうちに5分間話す——議事録を書く一番難しい部分は「書き始める」ことだが、声にすればその壁を越えられる。退勤前に、今週やったことと来週の予定を3分で話す——週報の下書きが、もうできている。先ほどの場面——同僚への説明、AIへの十分な文脈提供——同じ動作だ。fnを押して、話して、終わり。
すでに持っているハードウェアを活かす
10万円以上かけて買ったMacBook。優れたディスプレイ、高速なチップ、良いキーボードが載っている。
そしてあなたの声のために設計されたマイクアレイと、いつでも押せるキーも載っている。
次に空白のドキュメントを開いたとき、タイピングから始めなくていい。fnを押して、話してみよう。
声を、そのまま使えるテキストに。
Flow Keyboardは口述をそのまま整った文章にします。フィラー語を除去し、句読点と段落を整え、ロジックを整理。自然に話すだけで、すぐに使えるテキストが手に入ります。
参考文献
- Apple. MacBook Pro Technical Specifications: "Studio-quality three-mic array with high signal-to-noise ratio and directional beamforming."
- Apple. MacBook Air Technical Specifications: "Three-mic array with directional beamforming."
- Kellogg, R. T. (1996). A model of working memory in writing. In C. M. Levy & S. Ransdell (Eds.), *The Science of Writing* (pp. 57–71). Lawrence Erlbaum Associates.