機械学習とは
データを分析する手法の1つです。
- 膨大な素材データをインプットする
- そのデータをもとに、コンピュータが『処理』を実行する
- データのパターンや法則性を自ら学習する
今回はこの『処理』の部分について学んでいきます。
機械学習の種類
機械学習は、インプットするデータの特性によって種類分けされます。
- 教師あり学習
- 教師なし学習
- 強化学習
このテストに使うデータのことを「訓練データ」とも呼びます。
サバ缶
なんだか『実験してる』感のある名前ですね。
教師あり学習
正解であることが分かる「ラベル」が付与された訓練データを使用する学習方法です。
入力データに対する正しい処理(出力、アウトプット)を学習させます。
これは、パターン化された定型作業をAIに任せる際に使われることが多いです。
- 野菜の選別システム
- 監視カメラに搭載される人や自動車を認識するシステム
- 画像の文字を読み取るシステム
テストに使うデータを「訓練データ」と呼びますが、
教師あり学習においては「教師データ」と呼ぶこともあります。
教師なし学習
一方こちらは正解とわかるラベルが無い訓練データを使用する学習方法です。
AIシステムが自ら入力データの特徴を捉え、ラベリング(自分でラベルをつける)を行います。
そのラベリングの結果に基づいて、グループ分けを行なったりします。
教師あり学習が「0」と「1」のように明確に分かれる一方で、教師なし学習は少し抽象的で、曖昧な状態をイメージすると良いでしょう。
- 迷惑メールの自動振り分け(メールの内容を読み取り、特徴を捉えてラベリング)
- 画像認識システム(自動運転自動車、顔認証など)
強化学習
正解のデータを与える代わりに、与えられた環境における個々の行動に対して得点や報酬を与える学習方法です。
こちらは報酬(と同じデータ)を与えるため、より生物実験に近い学習方法です。
正解のデータ(教師データ)は無いですが、システムが出した答え(出力)に対し評価をするため、間接的な正解データを与えることになります。
- 入力データに正解があるか→教師あり学習
- 出力データに正解であるかを評価するか→強化学習
という認識で良いでしょう。
- 将棋や囲碁の学習
- 人工知能ロボットの行動や言動の学習
基本情報・応用情報の問題を解いてみよう
応用情報技術者令和元年秋期問4 教師なし学習で用いられる手法
応用情報技術者平成31年春期問3 ディープラーニングに関する記述
基本情報技術者平成30年秋期問3 AIにおける機械学習の説明はどれか
基本情報技術者平成31年春期問4 教師あり学習の説明はどれか