[日本語訳] 1.1 Machine Learning Welcome by Andrew Ng 機械学習
0情報ソース
1.1 Machine Learning Welcome by Andrew Ng (7 分)
ようこそ、これは機械学習についての無料のオンライン講座です。機械学習は、 最近の技術の中で最も刺激的なものの一つです。
そしてこのクラスでは最先端のアルゴリズムを学び、演習を通してそれらを実装して運用する実体験を得ます。
皆さんは、知らないうちに学習アルゴリズムを一日に何回も使っています。
インターネットを検索するために Google や Bing のようなウェブ検索エンジンを使うたびに、それがうまく機能する理由の一つは、学習アルゴリズムがGoogle あるいは Microsoft に実装されていて、それが ウェブページをランキングする方法を学んだからです。
Facebook や Apple の 写真タグ付けソフトを使い、それが友人の写真を認識するのも、それも機械学習です。電子メールを読む際にスパムフィルターのおかげで大量のスパムメールを仕分ける必要がないのも学習アルゴリズムのおかげです。
私にとって、これが非常に刺激的な理由の一つは、AI の夢、いつの日にか皆さんや私のように知性のある機械を構築することです。それはまだまだ遠いゴールですが、しかし多くの AI 研究者が信じるのは、そのゴールへの最善の道は人間の脳が学習する仕組みを模倣する学習アルゴリズムにあるということです。このクラスではこれについても少しお話します。
このクラスでは最先端の機械学習アルゴリズムについて学びます。しかし、実はただ単にアルゴリズムを知っていて、数学を知っているだけでは、あまり意味がないのです。それを実際に関心のある問題に適用する方法を知らなければ。そこでアルゴリズムをそれぞれ実装して自分自身でそれがどう動作するか確認して頂くために、演習問題をかなりの時間をかけて開発しました。
ではなぜ機械学習が今日ここまで一般的になったのでしょうか。
機械学習は、AI 、人工知能の分野から派生した分野です。知能のある機械を構築したかったのですが、いくつかの基本的なことであれれば機械が行えるようにプログラムできました。例えば、A から Bへの最短パスを見つけるなどです。
しかし、大体においては、どのように AI プログラムを書けばもっと興味深いことができるか分かりませんでした。例えばウェブ検索や写真のタグ付け、メールのスパム対策などです。そこで分かったことは、これらを実現する唯一の方法は、機械に自分で学ばせることだと。そして機械学習は、コンピュータの新たな能力として発展し、今日、産業および基礎科学の多くの分野で影響を与えています。
私にとって、機械学習を研究していると、典型的に一週間の内に話をする相手はヘリコプターパイロットだったり、生物学者、コンピュータシステム関係者(つまりスタンフォードの同僚)だったりし、そして週に 2、3 回はメールでシリコンバレーの産業界の人たちから私に接触があり、学習アルゴリズムが彼らの問題に適用できるか問い合わせて来ます。これは、学習アルゴリズムが対応する問題の範囲の表れです。自律ロボット工学、計算生物学、シリコンバレーで起きている非常に多くのことに機械学習は影響を与えています。
ここにさらに機械学習の他の例があります。データベース・マイニングがあります。機械学習がここまで一般的になった理由の一つにウェブの発展と自動化の発展があります。これは全て今まで以上に大きなデータセットが利用可能であるということを意味します。例えば、数多くのシリコンバレーの企業は今日ウェブのクリックのデータを集めています。これはクリックストリーム・データとも呼ばれ、機械学習のアルゴリズムを使ってこのデータのマイニングを行い、ユーザーの理解を深め、よりユーザーに便利性を提供しようとしています。
これは、現在、シリコンバレーで非常に大きな分野となっています。
カルテ。自動化の到来により、電子カルテが普及しています。この医療データから医療知識を抽出できれば、病気に対する理解を深めることが出来ます。計算生物学。ここでも自動化により、生命学者は遺伝子配列あるいは DNA 配列などについての大量のデータを集めています。そして機械学習アルゴリズムはヒトゲノムそして人間とは何かについてより深い理解を得るのに貢献しています。
そして工学でも、全ての技術分野において、データセットがどんどん大きくなってきており、学習アルゴリズムを使ってそれを理解しようとしています。二番目の機械学習の応用範囲は、手作業でのプログラミングが不可能なものです。例えば、私は自律制御ヘリコプターの研究を長年行いました。どのようにコンピュータプログラムを書けばこのヘリコプターが自律的に飛ぶようになるか分かりませんでした。うまくいった唯一の方法は、コンピュータに自分でこのヘリコプターを飛ばす方法を学ばせることでした。
手書き認識。今日、低コストで手紙を国をまたいで米国内でも海外でも仕分けして郵送できる理由の一つはこうした封筒に書いた場合、そうした手書きを読むように学習した学習アルゴリズムがあって、この封筒が自動的に仕分けされて配送されるので、ほんの数セントで数千マイル先に送ることができるからです。事実、自然言語処理やコンピュータビジョンなどの分野を見れば、これらは AI の分野で言語あるいは画像についての理解に関わる分野です。自然言語処理ととコンピュータビジョンは今日、ほとんど応用機械学習となっています。学習アルゴリズムは自己カスタマイズプログラムで広く使われています。
Amazon や Netflix、iTunes Genius を利用するたびに、お勧めの映画や製品、音楽が表示されるのも、学習アルゴリズムです。考えてみると、数百万のユーザーがいるわけです。数百万の全てのユーザーに足して数百万の別々のプログラムが書けるわけがありません。
ソフトウェアでカスタマイズされたお勧めを提示することが可能になる唯一の方法は
個人の嗜好に合わせて自己カスタマイズするよう学習することです。
最後に、学習アルゴリズムは今日、人間の学習について理解し、脳について理解するために利用されています。研究者がこれをどのように使って大きなAIの夢に向かって進歩を続けているかお話します。
数ヶ月前に、ある学生が記事を見せてくれました。上位 12 位の IT 技能、情報技術の採用責任者がノーと言えない技能についてです。これは少し古い記事でしたが、この最も魅力的な IT 技能の上位 12 のリストの一番上に機械学習がありました。
ここスタンフォードでは、卒業間近の機械学習の学生の紹介の問い合わせで私に接触してくる採用担当者の数は、毎年ここから卒業する機械学習の学生の数よりはるかに多いのです。ですから、この技能に対して莫大な満たされていない需要があると思います。ですから、今は機械学習について学ぶには絶好な時です。
そしてこのクラスで機械学習について多くのことを教えていきたいと思います。次のビデオでは、機械学習とは何か、より正式な定義をしていきます。そして、機械学習問題の主な種類とアルゴリズムについてお話します。主な機械学習の専門語をいくつか学び、どのようなアルゴリズムがあって、そしてどれがどの場合に適切かの概要を理解していきます。