AIを使うなら、テクニックより先に環境整備で勝負が決まります。
理由はシンプルで、AI時代の生産性は「思考→入力→生成→編集」の回転数で決まるから。
そして回転数が上がると、迷いが減って“動ける状態”になる。
この記事では、そのための環境を最短で作ります。
キーポイントはたった3つで、
・入力の速度を爆速に仕上げる。
・入力の精度を上げる。
・一次情報(自分の体験)を入れる。
こっちが入力の速度と精度を上げたら、出てくるアウトプットの精度と質も上がるんですね。
これを実現するのが、実はタイピングのスピードではなく、音声入力です。
まだあなたはタイピングしてますか?
スマホでフリック入力していますか?
音声入力を使ってないなら、今すぐに音声入力に切り替えましょう。
僕は23歳の時に超ブラック企業で、とにかくタイピング速くなるようにと、辞書登録とかブラインドタッチとか、いろんなことを仕込まれたんで10年15年ぐらいそれを使ってきました。
だけど今は、入力の主戦力をタイピングから音声に切り替えるだけで勝てる時代になりました。
時代は完全に、音声入力の時代です。
職場などで声が出せない人は「骨子だけ音声」or「短文はタイピング」で十分なので、できることから乗り換え検討しましょう。
では、音声入力ですごく難しいことをするのかというと、全くそうじゃない。
日本語をしゃべることができれば、誰でもAIを使いこなすことができるようになります。
この記事では、僕が主戦力として使っている以下の構成を、迷わず再現できる形でまとめます。
実際に僕が使っているツールを可能な限り寄せていってもらえると、すごく作業環境としていい状態ができるので、参考にしてみてください。
お金がかかるものと、かからないものがあるので、その辺話していきます。
この3つのフェーズがあるので、順に説明しますね。
-
0円:スマホ+無料AIで「慣れる」
-
最低限:ChatGPT+音声入力で「回転数を上げる」
-
ガチ:Mac+音声+AI編集で「生産ライン化する」
無料編:AIに慣れる
まずは無料編。
無料編に関して言うと、手持ちのスマホでやるっていう手段があるんですけど、パソコンがなければ、それでやっていきましょうっていう感じですね。
ただ現状だと、どうしても作業の限界は出てきます。
僕がもし無料のものだけでどうにかするって言うんであれば、
iPhoneもしくはAndroidと、Typelessっていうアプリでやる。
ただし後で話すんですけど、Typelessに関しては
セキュリティの問題がある可能性も否定できないので、そこは注意です。
まだAIを使い慣れてないという方は、まずここから。
AIに対して音声入力で話しかけてみる。ここから始めましょう。
とにかく質よりも量をこなすっていうのが大事で、何でもAIに聞きます。
僕がやってきたことで言うと、ニュースの解説、本の要約、YouTubeの要約、あとトレーニングメニューの作成、原料メニューの作成、あとブランディング、マーケティング、ライティングの文章の叩き台、とにかく何でもです。
これ、AIに聞いたら分からないことが分かるんじゃないかとか、業務が簡単になるんじゃないかみたいなことを思いつく限り全部入れてみる。日常で目の前に、自分専用の24時間文句も言わずに働いてくれる秘書がいると思って、とにかく1回聞いてみるっていうのをやる。
この時に音声入力を使う理由は後で音声入力のAqua Voiceのところで結構話してるんで、そっちを見てみてください。
最低限:課金してみる
ChatGPT(無料or20ドル)と音声入力(Aqua Voice、もしくはTypeless)を使う。
Aqua Voiceを使う場合は追加で10ドルなので全体でだいたい5000円ぐらいかかるって感じですね。
ちなみにある記事で読んだんですけど、AIに課金してる人って世界でまだ2,000万人ぐらいで、人口で言うと0.3%ぐらいらしいです。課金するだけで上位0.3%になれるって話なんで、こんなおいしい話ないんでぜひやりましょう。
それぐらい、実は情報感度が低い人って多いし、まあ全くね。それが100万、200万するっていうなら、話は別なんですけど、月3000円ぐらいでチャレンジできることなんで、1ヶ月だけでも試してみたらいいんじゃないかなって思いますね。
それで使いまくって、使い倒して、これって仕事に使える、使えないっていう判断をすればいいだけです。
さらにもっと言うと、今ってAI業界は、先行投資の期間なんで、ChatGPTとか、Cloudとか、全部赤字なんですね。笑
赤字こいてでも、まずはユーザーを獲得しよう、みたいなボーナス時期なんで、ユーザーを使えば使うほど、得をするっていうボーナス時期なんで、使わない手はないなって個人的に思います。
ガチ:仕事に使う
ガチでAIをツールとして仕事に組み込んでいくってなったら
使う機材、ツールは以下のもの。
-
MacBook Pro(作業母艦。あるといい)
-
HyperXのマイク(音声入力の品質を上げる。なくてもいい)
- Plaud Note Pin(音声文字起こし= コンテキスト。の取得)
- iPhone
-
Aqua Voice(音声入力〜文字起こし/入力の効率化 10ドルプラン推奨)
-
ChatGPT(思考の補助輪+文章生成。20ドル〜プラン推奨)
-
Cursor(AIエディタ:執筆・コード・編集の生産性爆上げ。20ドル〜プラン推奨)
ゴール:「思考が止まらずに、アウトプットまで一気通貫」の環境を作ること。
本当に必要最低限で言うと、iPhone と ChatGPT って話になるんですけど。
仕事で資料作ったり、ガチで使うってなったら、パソコン、あとは Plaud Note Pin、Aqua Voice、Cursor ぐらいは手に入れておきたいですね。
ここまで来ると課金額が1万弱ぐらいになってくるかなって感じなんですけど、これで十分戦えます。もっともっとってなったら、ChatGPTとか、Claude Codeに課金をしていくみたいな感じですね。今回はそういったCHAT GPTの一番上のプランとか、Claude Codeっていうのは一旦なしにして、上記で話した使う機材ツールっていうのをベースに話していきます。
1. 全体像:この環境で何がどう速くなるのか
この構成の強みは、手入力を減らして“喋って作る”比率を上げること。
ワークフロー(完成形)
-
Aqua Voice + マイクで話す(アイデア/骨子/下書き)
-
ChatGPTで構造化(見出し、論点整理、要約)
-
Cursorで整形・編集(文章の最終化、テンプレ適用)
-
必要ならChatGPTで推敲・表現調整・SEO整備
しゃべりやタイピングよりも5倍から10倍ぐらい作業速度が上がるんで
めちゃくちゃストレスなく作業できます
2. 必要機材(購入リスト)
2-1. MacBook Pro(作業母艦)
-
すでにお持ちならOK。迷うなら基本はメモリ優先。 メモリは16GBぐらいは欲しい
-
役割:AI・編集・複数アプリ同時運用の安定性、高めること。
スマホだけでも音声入力と文字起こしとか全然できるけど、しっかりコンテンツ作りたいとか副業にしたい、本業にしたいってなってくると、こういう作業環境は必要ですね。
2-2. HyperX マイク(音声入力の品質を上げる)
音声運用の要はマイクです。
AI環境は「入力の快適さ」がボトルネックになりがちなので、
ここに投資すると体感が変わります。
僕はもうかれこれ数年間、ずっとこのマイク使ってるんですけど、全然問題なく音声入力やれてますね。
パソコンに繋げるマイクであれば何でもいいです。
2-3. Plaud Note Pin(音声入力の品質を上げる)
これは音声で議事録を取ったり、文字起こしを残しておくためのデバイスですね。
これはめちゃくちゃすごい強くて。
例えばの事例なんですけれども、もう議事録を取ったり、メモを取る必要が全くなくなるんですね。
目の前の人の会話に100%集中できるっていうのが、このプライドノートPinのめちゃくちゃいいところです。
会話してる中でメモとか取ってたら、熱心に聞いてるなっていうのは相手に伝わるんですけど、会話自体の熱を感じづらいっていうところはあるんですよね。
僕はめちゃくちゃメモマナーでパソコンでブラインドタッチしながら目の前の人の話を全集中して聞くっていうのをやってたんですけど、やっぱりそれでも今こうやって録音デバイスとか使ってるのを考えると、当時って本当に100%目の前の人に集中できてたかっていうと、んんんー?って思っちゃうぐらいなんで、やっぱりできるだけ録音デバイスにやったほうがいいと思います。
メモを取ることに集中しすぎて、その会話の熱がわからなくなったり、とかもうちょっとそこを深掘るべきところとか、自分の理解が追いついてないところでも、メモを取ることがそっちが目的になっちゃって、本来はそれは何だろう?と。
後で記憶を助けるためのサポートツールでしかないはずなのに、なんかもメモだけ取って満足するみたいなことになっちゃうんですけど、その文字起こしを音声取っておけば、いつでも引っ張り出せるんで。
これに録音入れておけばメモを取らなくて済むんで、目の前の人の熱量が上がってるところとか、こっちがもっと聞きたいみたいなところを深掘りして聞けるっていうのが、めちゃくちゃ強いですね。
議事録で出したりとか、Todoリストを出したりとかもできる。
しかも、後ほど話すカーソルとかを使って、ここで出てきた文字起こしからTodoリストを抜き出して、それを自動でTodoリストに入れて一元管理するとか、そういう仕組みも作れたりします。
3. インストールするソフト(主戦力)
3-1. ChatGPT(思考補助+文章生成)
使い方の立ち位置
-
ChatGPTは「文章作成ツール」ではなく、意思決定と構造化のエンジンとして使うと強いです。
-
例:見出し設計、要約、比較表、読者導線、推敲
この辺は他のAIのジェミニとかよりも全然強いんで、何か考え事の壁打ちする時はChatGPTがメイン。
タスクの管理とか、スケジュールを入れるとかは、Geminiの方が連携しやすいって感じですね。検索エンジンを使ったりする調べ物、あと歴史系の考察とか、そういうのもGeminiの方が強い。
導入(最低限)
-
WebでOK
-
ログインして使える状態にする
- この場合は「option+C」ですぐに出るようショートカット入れてます。(Raycastというアプリで)
3-2. Cursor(AIエディタ:編集と執筆の最終地点)
Cursorで起きること
-
ChatGPTで作った文章を、Cursorで“原稿として仕上げる”
-
文章だけでなく、テンプレや定型文、見出し、表の整形が速い
導入(最低限)
-
Cursorをインストール
-
起動できる状態にする
-
よく使うフォルダ(執筆用)を1つ決める
- あとは音声入力をカーソルでやっていけば割と大概のものは作れます。
最初だけちょっと慣れが必要なんですけど、慣れてきたらChatGPTみたいなニュアンスで使っていけるし、パソコン内のファイルを使って何か書いたり作ったりっていうのができるし、自動化とかもすごいやりやすいんで、めっちゃお勧めですね。
3-3. Aqua Voice(音声入力の主役)
本性入力アプリは
Aqua Voice っていうのが現状一番いいです。
fnボタンを押せばどこでも使えるのが最強です。
長時間の録音でも使えるし、長文になってもパッて出してくれるんで、その時間差のない感じ、タイムラグがない感じが最高ですね。
他にも Typelessとか GenSparkSpeakly とかあるんですけど、中国系のものになるんで。セキュリティの問題で一旦やめといた方がいいです。
僕はこの辺のセキュリティとかリスクのところを考えるときに、あまり考えすぎても正直いいものを見逃してしまう可能性があるから、一旦使ってみるんですね。
シンプルに技術の一番強いやつ使おうと思ったら、セキュリティ無視してガンガン新規のパソコンとかで新しいアプリとかツールをぶん回すっていうのが最強です。あとはもう、そのどこまでできるかって話になるんで、それはもう使い方次第ですね。ケースバイケースです。
ただ人にお勧めするときっていうのは、確実なやつってなると、やっぱAqua Voiceってことになります。
Aqua Voiceは、近々スマホアプリも出るんで、これ使うとスマホでも同じようにできるのもデカいです。
導入(最低限)
-
Aqua Voiceをダウンロード
-
Macにインストール
-
マイク入力をHyperXに設定
-
テキスト入力できる場所(メモ/Notion/Google Doc/Cursor/ターミナル)などどこでも
↑
無料なんで、ぜひ1回使ってみてください。ほんまに、騙されたと思ってやってみてほしい。世界変わります。これは家族にもビジネスパートナーにも親友にもみんな話してるやつなんで、ほんまにいいです。今回の記事で話していることは本当に身近な人に全部伝えているんですけど、一番手っ取り早く効果感じやすいのはAqua Voiceによる音声入力な感じがします。
4. Mac側の設定(ここだけやればOK)
4-1. 入力デバイスをHyperXに固定
-
Macの「システム設定」→「サウンド」
-
入力:HyperXマイクを選択
-
入力音量を適切に(声が割れない範囲)
4-2. “音が悪い”時の最短チェック
-
口元からマイクまでの距離(近すぎ/遠すぎ)
-
入力音量が高すぎて割れてないか
-
マイクが別デバイスに切り替わってないか
この辺だけ注意しとけばいいし、もし分からなかったら「チャットGPTとかにうまく接続できてないんだけど」って聞けばOK。
あとはスクリーンショットとか撮って、問題になってそうなところを送っていけば、必ず解決できます。
5. 使い方テンプレ
5-1. 音声→文章の基本テンプレ
文章を作る系の場合は、こういう感じでやります。
-
Aqua Voiceで話す(60〜120秒)
-
何を書くか / 誰向けか / 結論だけ
-
-
ChatGPTに貼って、こう依頼する
-
「この記事を“見出し→要点→結論”の構造にして」
-
-
Cursorに貼って清書(整形、語尾、冗長削除)
使い方の具体例
パソコンの中のファイルを指定して、これとこれと組み合わせて、文章作ってとか言えば結構作ってくれます。
「あとは何々っていうツールと何々っていうツールを使って、こういう自動化したんやけど実行して」と言えばそれも作ってくれたりします。
あとは「新しいアプリの○○を入れたんで、その初期設定とか、そういうなんかちょっと面倒くさくてやりたくないので実行して」系は全部丸投げできますね。マジで世界変わります。
非エンジニアの方は、Claude Codeよりこっちの方がパッと見で使いやすいし、全然能力的にこれで十分なこと多いので、まずはこっちから覚えるのをお勧めします。
使い方のコツ
入力は基本、Aqua Voiceをバンバン使う感じです。
Aqua Voiceを使う時は、とにかく思ったこと全部伝えるっていうのが、すごい大事です。いきなりまとまったことを言おうとしなくていいし、考えがまとまってもなくていいから、一旦付け始めるみたいな、あとはAIが整理したりとか分析してくれるんで、自分は一次情報を出すってこと、つまり自分が思ってること、感じてること、これいいな、これおかしいな、これ違うやろ、みたいに思ってることをバンバン出すっていうところに集中するって感じです。
5-2. ChatGPTプロンプト(記事内にそのまま掲載用)
-
ノウハウ作る時の構造化用
-
「この文章を、読者が迷わず行動できるように、見出し構成にして。表も入れて。」
↑
これに合わせて、例えば友人とかプチコンサルとかで話した時の音声の文字起こしとかを入れておくと、精度高いノウハウが作りやすいです。だからこそ、音声デバイスで文字起こし(一次情報)を集めておくのがめっちゃ重要。
-
-
推敲用
-
「冗長な部分を削って、テンポよく。結論を先に。専門用語は噛み砕いて。小学生でもわかるように教えて。」↑
これ入れておくと、初心者とかでも読みやすい文章になります。
-
-
FAQ生成
-
「この記事で読者がつまずくポイントをFAQで10個作って。」
↑
よくある質問集みたいなやつですね。この中に必ず入れてほしいのをこっちが指定しておくっていうのもできるし、結構おすすめです。
-
6. よくある詰まりポイント(FAQ:最小)
-
Q. 音声入力じゃなくて、タイピングだけでもいいですか?
A. 推奨はしないです。最強環境の目的は「入力を軽くして脳の回転数を上げる」こと。
-
タイピングだけ=精度は高いが速度が頭打ちになりやすい。音声入力に慣れれば、絶対にしゃべるよりもタイピングは遅くなります。
あと、書き出す時にうまく書こうってします。無意識に脳内で編集作業を入れちゃうので、一時情報感がなくなるっていうのもネック。それに伴って文字が書けないみたいなボトルネックにもなりやすいので、基本はもうしゃべりの方に統一した方がいいですね。声が出ないとか、喉を痛めているとか、よっぽどの事情がない限り。 -
音声=荒くても量が出て、 AIによる構造化をステップとして入れるだけで勝てる
-
一番いい運用方法:骨子だけ音声→できた文字起こしに対して修正はタイピングでする
-
-
Q. なんで“一次情報(自分の体験/観察)”を取る必要があるんですか?
A. AI時代は「一般論」はコモディティ化して、一次情報が差別化になるから。
-
AIは平均点の文章を量産できる
-
でも読者が欲しいのは「その人の現場の判断」
-
一次情報=信頼・説得力・独自性の源泉
-
-
Q. マイクって必須? 内蔵マイクじゃダメ?
A. 動くけど、入力精度が気になるから、マイクは使った方がいい。
-
内蔵マイクは環境音を拾いやすく、認識精度がブレる。特に短文の時が入力悪いなって感じる時、多いですね。長い文章だと文脈で拾ってくれる感じはあります。
-
マイクで入力が安定すると、音声→文章の成功率が上がる
- AIの本質はインプット(入力)とアウトプット(出力)の繰り返しなので、インプットが悪かったらアウトプットも悪くなるから、そこの精度を完成入力で上げるのはボトルネックを解消することにダイレクトに繋がるんですよね。
- 僕の周りの人も最初慣れないって言うんですけど、1週間も経てばもう文字打つの戻られへんって言ってるんで、どんどんやってる人増えてますね。ほんまにLINEしか打てませんみたいな人もLINEの打つ時ですら音声入力に変えちゃうぐらい、本当に今後の必須能力ですね。
- ちなみに予言しときますけど、これから3年とか5年ぐらいの間に、必ずと言っていいほど音声でしゃべる人めっちゃ激増するはずです。今ってスマホを打ちながら歩いている人いて、危なかっしな。みたいな感じあると思うんですけど、あれがなくなっていってスマホに自分の口近づけてブツブツしゃべるような人が乱発しますw
-
-
Q. Aqua Voiceは何が強いんですか?
A. キーボード入力を減らして、発想→文章化を繋ぐ“入口”になる点。
-
思考が乗ってる瞬間に、手を止めずに出せる
- 思いついたままパッとしゃべれるし、それをまとめてくれるから、一時情報として自分の感情とかをむき出しの情報っていうのを抜き出せるのが強い。
-
「書く」じゃなく「喋って素材を出す」ができる
- とにかく素早く、大量のインプットをAIに渡せるのが強みですね。出てきたアウトプットが間違ってたら、追加で情報渡せばいいだけなんで、ガンガン話していくのが重要です。
-
-
Q. ChatGPTだけで完結しません? Cursorいる?
A. ChatGPTは“生成”、Cursorは“制作ライン”。役割が違う。
-
ChatGPT:構造化、推敲、発想支援
-
Cursor:原稿の整形、テンプレ適用、差分編集、最終稿の管理、自動化、作業の自動実行
-
結論:仕上げ工程が多いほどCursorが効く
-
-
Q. 無料プランでもいけますか?
A. いける。ただし“時間コスト”が増えやすい。
-
無料=試すには十分
-
有料=出力の安定・速度・試行回数が増える
-
推奨:まず無料でワークフロー固定 → AIを使う量が増えてきたら、必要なタイミングで課金
-
-
Q. 音声入力が途切れる/変換が変なんですが?
A. だいたい原因は3つだけ。
-
入力デバイスが別になってる
-
入力音量が高すぎて割れている
-
マイク距離が遠い / 角度が悪い
→ **「デバイス確認→音量→距離」**の順で潰す - 使ってるマイク、今の問題点とかをチャットGPTに相談したら解決してくれるんで、問題ないです。
-
-
Q. 周りがうるさい環境でも使えますか?
A. ほぼ問題なく使えるが、音声運用の“精度”が落ちる。
-
対策:マイクを口元に近づける。これで結構解消されます。
-
-
Q. 文章がAIっぽくなるのが怖いです。どう防ぐ?
A. 一次情報+口調テンプレで防げる。
-
自分の体験(失敗/数字/比較/具体例)を入れる。
-
「自分の言い回し」を固定(語尾・言い切り・比喩)→これをAIに先に設定しておく。
- 自分のブログとか YouTubeを分析させて、先にそれをデータとして入れておくのが一番いいですね。
-
仕上げで指示:“AIっぽい言い回し禁止、断定は根拠付きに”
-
-
Q. セキュリティ的に、AIに入れていい情報/ダメな情報は?
A. 原則は“漏れて困るものは入れない”。会社/顧客情報は特に注意。
-
個人情報、契約情報、未公開データ、機密は避ける
-
どうしても扱うなら:固有名詞を伏せる、要約化して入れる
-
設計としては「AIに投げる前の加工」をルール化する
7. まとめ:この環境の勝ち筋
-
HyperX + Aqua Voiceで入力革命(しゃべるだけで入力)
-
ChatGPTで構造化(思考の補助と拡張)
-
Cursorで最終化(アウトプット)
この3点セットで、AI活用が「知識」じゃなくて「生産ライン」になります。
この辺で操作になれたら、他のAIなんかも使っていくみたいな感じで全然いいし、業務で全然使えるレベルのもの出てくるんで、ここをまずは極めていただければなと思います。

