本記事を訪れたあなたはきっと次のように思っていることでしょう。

AIを自分で一から作ってみたいけど、何から手を付けていいか分からない…
AIのイメージがあいまいで漠然としている…
現時点でそのように思っていても大丈夫!
以下のステップを踏んで学んでいくことで、誰でも「自分のAI」を作ることができます!
- ステップ1:作業環境の整備
- ステップ2:目的や方針の決定
- ステップ3:データの収集
- ステップ4:データの前処理
- ステップ5:アルゴリズムの選定
- ステップ6:モデルの構築・学習
- ステップ7:モデルの評価・改善
- ステップ8:実運用
本記事では1~8までのステップについてそれぞれ解説していきます。
初心者でも理解できるよう、専門用語はできる限り使わないように説明しているので、ぜひ最後まで読んでみてください。
自作AIステップ1:作成環境の整備

AIを作るにしても、まずは環境を整えるところから始まります。
環境とは、プログラミング言語を動かせる環境のことです。
PCはもちろん、使用するプログラミング言語がPythonであればPythonのインストールが必要になります。
また、PCに関して補足しておくと、GPUはあったほうがいいでしょう。
AI自体はGPUなしでも作れますが、あるのとないとでは学習スピードが全く異なります。
- すでにPCを所有しているがGPUがない人
→GPUを購入 - PCをまだ所有していない人
→GPU付きのPCを購入
自作AIステップ2:目的や方針の決定

環境を用意できたからと言ってAI作成にいきなり取り掛かるのではなく、事前に目的や方針を決めておきましょう。
目的や方針とは、何のためにAIを作るのか、どのようなAIを作りたいのかというものです。
たとえば…
- 未来の株価を予測したい
- 画像から犬種を分類したい
- 会話が可能なチャットボットを作りたい
上記のような目的や方針がハッキリしていないと、何から手を付けたらいいか分からなくなってしまいます。
そのままでは漠然としたままになるので、しっかりと決めておきましょう。
自作AIステップ3:データの収集

ステップ2で決めた目的や方針をもとに必要なデータを集めます。
データを集める手段としては次のようなものがあります。
- 公開されているデータセットを使用する
- 自分でセンサーやログを使って収集する
- Webスクレイピングでデータを収集する
また、データを集める際にはどこから集めるかが重要です。
というのも、AIはデータをもとに学習しているため、そのデータに信憑性や正確さがないと精度にもろ影響するためです。
出所にはきちんと目を向けるようにしましょう。
また、AIはある程度のデータ量がないとパターンを学習しにくくなってしまうため、集める際はできる限り多くのデータを集めるようにしてください。
自作AIステップ4:データの前処理

データを集めたからといって、そのままAIの学習には使用できません。
事前に加工が必要です。
というのも、集めたデータには外れ値や欠損値、異常値が存在するためです。
ステップ3でも書きましたが、AIはデータをもとにパターンを学習します。
そのため、パターンから外れるものが存在する場合は精度に影響を及ぼすわけです。
外れ値を生かすのか、欠損値を何で埋めるのか、異常値をどう扱うのかを意識しておきましょう。
自作AIステップ5:アルゴリズムの選定

AIはアルゴリズムによりパターンの学習や予測を行っています。
「アルゴリズム」は聞きなれない言葉だと思いますが、簡単に言えばAIにおける頭脳の役割を担っているものです。
そのアルゴリズムはいろいろな種類があり、それぞれ特徴が異なり得意・不得意があります。
ですので自分の目的や方針に合うアルゴリズムを選定しましょう。
- 予測系(株価予測、需要予測)
→線形回帰、LSTM - 分類系(画像・テキスト分類)
→ニューラルネットワーク、ランダムフォレスト - 生成系(文章生成、画像生成)
→Transformer
自作AIステップ6:モデルの構築・学習

アルゴリズムが決まれば、いよいよモデルを構築し学習していきます。
モデルの構築時にはプログラミング言語を用いてコードを書いていきます。

今までプログラミングを学んだことがない…
そもそもどうやってコードを書いたらいいか分からない…
そんな不安を抱えている方でも安心してください。
世の中にはさまざまなプログラミングスクールが用意されています。
その中でも僕が学んでいたのが「AI Academy」
フリープランが用意されていますが、フリーとは言えども基礎的な部分から少し応用した部分まで幅広く学ぶことができます。
そしてモデルを構築できたあとは、前処理を行ったデータをもとにモデルの学習を行います。
学習については自動で行ってくれますが、データ量が多いとそれだけ計算するのにある程度の時間を要します。
自作AIステップ7:モデルの評価・改善

学習を終えた後はモデルが正しく予測しているかどうかを評価していきます。
評価の指標としては主に次のものが使用されています。
- 正解率(Accuracy):すべての予測の中で正しい予測をした割合
- 適合率(Precision):正と予測した中で実際に正であった割合
- 再現率(Recall):実際に正であったものの中で正と予測した割合
それぞれの値が極端に低かったり、逆に極端に高かったりすると過学習や学習不足を引き起こしている場合があります。
たいてい一発目は発生しやすいです。
そこで、値が良くなるよう改善していきます。
改善方法としては一般的に以下の方法を取ります。
- データ量を増やす
- アルゴリズムを変更する
- ハイパーパラメータを調整する
上記の方法を試し、精度がより良いものを作っていくことが大事です。
「一回作ったら終わり」ではなくよりよいものを作っていきましょう。
その過程がAIの醍醐味の一つですね。
自作AIステップ8:実運用

精度が申し分ない値になったら実際に運用していきます。
AIは過去のパターンを学習していますが、今後そのパターンから外れた傾向になることもあるため、その場合は使い物にならなくなってしまいます。
精度については常に監視し、未来のデータも過ぎてしまえば過去のデータとなるため、そのデータも学習に使用していくことも大切です。
そうすればパターンから外れた傾向になったとしてもある程度対応しきれます。
まとめ:8ステップでAIの自作が可能!

さて、本記事ではAIを自分で一から作る方法を解説していきました!
改めて8ステップを振り返りましょう。
- ステップ1:作業環境の整備
- ステップ2:目的や方針の決定
- ステップ3:データの収集
- ステップ4:データの前処理
- ステップ5:アルゴリズムの選定
- ステップ6:モデルの構築・学習
- ステップ7:モデルの評価・改善
- ステップ8:実運用
現時点で難しく思えていたとしても、一歩ずつ進めていけば必ず自分のAIが作れるようになります。
数ヶ月前はAIの仕組みなんて全く分からなかった僕が自分で作れるようになり、今はこうしてブログに残せるようになるまで成長しました。
だから安心してください。
まずは公開されているデータセットを使用して簡単なAIから作ってみることをおすすめします。
そこから応用していけばあなたが理想とするオリジナルのAIを作れるはずです!


コメント