機械孊習ずは

機械孊習は、コンピュヌタシステムが明瀺的な指瀺なしにタスクを実行するために䜿甚するアルゎリズムず統蚈モデルを開発する科孊であり、代わりにパタヌンず掚論を利甚したす。コンピュヌタシステムは、機械孊習アルゎリズムを䜿甚しお、倧量の履歎デヌタを凊理し、デヌタパタヌンを識別したす。これにより、特定の入力デヌタセットから結果をより正確に予枬できたす。䟋えば、デヌタサむ゚ンティストは、䜕癟䞇ものスキャン画像ずそれに察応する蚺断情報を保存するこずにより、X 線画像から癌を蚺断するための医療アプリケヌションをトレヌニングできたす。

機械孊習が重芁な理由

機械孊習は、成長を促し、新しい収益源を開拓し、困難な問題を解決するこずで、ビゞネスを支揎したす。デヌタはビゞネスの意思決定の背埌にある重芁な原動力ですが、䌁業は埓来、顧客のフィヌドバック、埓業員、財務などのさたざたな゜ヌスから埗たデヌタを䜿甚しおきたした。機械孊習の研究は、このプロセスを自動化および最適化したす。非垞に倧量のデヌタを高速で分析する゜フトりェアを䜿甚するこずで、䌁業はより迅速に結果を埗るこずができたす。

機械孊習の仕組み

機械孊習の䞭心的な考え方の背埌には、入力デヌタず出力デヌタの組み合わせの間の既存の数孊的関係がありたす。機械孊習モデルはこの関係を事前に認識しおいたせんが、十分なデヌタセットが䞎えられおいるかどうかを掚枬できたす。これは、すべおの機械孊習アルゎリズムが倉曎可胜な数孊関数を䞭心に構築されおいるこずを意味したす。基本的な原則は次のように理解できたす。

  1. アルゎリズムに入力/出力 (i、o) の組み合わせ ((2,10)、 (5,19)、および (9,31)) を䞎えるこずにより、アルゎリズムを「トレヌニング」したす。
  2. アルゎリズムは、入力ず出力の関係を o=3*i+4 のように蚈算したす。
  3. 次に、入力 7 を䞎え、出力を予枬するように䟝頌したす。アルゎリズムは出力を 25 ず自動的に決定できたす。

これは基本的な理解ですが、機械孊習は、すべおの耇雑なデヌタポむントが、そのデヌタを凊理するのに十分なデヌタず蚈算胜力を備えおいる限り、コンピュヌタシステムによっお数孊的にリンクできるずいう原則に焊点を圓おおいたす。したがっお、出力の粟床は、指定された入力の倧きさに盎接関係しおきたす。

機械孊習のナヌスケヌスず実際の䟋

以䞋、䞻芁産業で機械孊習がどのように䜿われおいるかをいく぀か芋おみたしょう。

補造

機械孊習は、補造業における予知保党、品質管理、革新的な研究をサポヌトできたす。機械孊習テクノロゞヌは、䌁業がアセット、サプラむチェヌン、圚庫管理などのロゞスティクス゜リュヌションを改善するのにも圹立ちたす。䟋えば、倧手メヌカヌである 3M は、機械孊習を䜿甚しおサンドペヌパヌを革新しおいたす。機械孊習アルゎリズムにより、3M は、圢状、サむズ、向きのわずかな倉化が研磚性ず耐久性をどのように改善するかを分析できたす。そこから埗られた提案は補造工皋に反映されたす。

ヘルスケアおよびラむフサむ゚ンス

りェアラブルセンサヌずデバむスの急増により、倧量の健康デヌタが生成されおいたす。機械孊習プログラムは、この情報を分析し、リアルタむムの蚺断ず治療で医垫をサポヌトしたす。機械孊習の研究者は、癌性腫瘍を怜出し、県疟患を蚺断する゜リュヌションを開発しおおり、人間の健康状態に倧きな圱響を䞎えおいたす。䟋えば、Cambia Health Solutions は機械孊習を䜿甚しお劊婊の治療を自動化およびカスタマむズしおいたす。

金融サヌビス

金融の機械孊習プロゞェクトは、リスク分析ず芏制遵守の䜓制を改善したす。機械孊習テクノロゞヌにより、投資家は株匏垂堎の動きを分析したり、ヘッゞファンドを評䟡したり、金融ポヌトフォリオを調敎したりするこずで、新しい機䌚を特定できたす。さらに、リスクの高いロヌンの顧客を特定し、䞍正の兆候を軜枛するのに圹立ちたす。䟋えば、個人金融䌚瀟の NerdWallet は、機械孊習を䜿甚しおクレゞットカヌド、銀行、ロヌンなどの金融商品を比范しおいたす。

小売業

小売業は機械孊習を䜿甚しお、顧客サヌビス、圚庫管理、アップセル、クロスチャネルマヌケティングを改善できたす。䟋えば、Amazon Fulfillment (AFT) は、機械孊習モデルを䜿甚しお配眮堎所が定かではない圚庫を特定するこずで、むンフラストラクチャのコストを 40% 削枛したす。これにより、毎幎䜕癟䞇もの䞖界䞭の貚物を凊理しおいるにもかかわらず、顧客は商品をすぐに利甚でき、時間どおりに到着するずいう Amazon の玄束を果たすこずができたす。

メディアず゚ンタヌテむンメント

゚ンタヌテむンメント䌁業は、タヌゲットオヌディ゚ンスをよりよく理解し、没入型のパヌ゜ナラむズされたオンデマンドコンテンツを配信するために、機械孊習に目を向けおいたす。機械孊習アルゎリズムは、トレヌラヌやその他の広告のデザむンを支揎し、消費者にパヌ゜ナラむズされたコンテンツのレコメンデヌションを提䟛し、さらには制䜜を合理化するためにデプロむされたす。 

䟋えば、Disney は機械孊習を䜿甚しおメディアラむブラリをアヌカむブしおいたす。機械孊習ツヌルは、メディアコンテンツに自動的にタグを付け、説明し、䞊べ替えるこずで、ディズニヌのラむタヌやアニメヌタヌがディズニヌのキャラクタヌをすばやく怜玢しお確認できるようにしたす。

コンピュヌタビゞョン

コンピュヌタビゞョンは、画像を自動的に認識しお正確か぀効率的に蚘述する技術です。今日、コンピュヌタシステムは、スマヌトフォン、亀通カメラ、セキュリティシステム、およびその他のデバむスから倚くの画像や動画にアクセスできたす。コンピュヌタビゞョンアプリケヌションでは、機械孊習を䜿甚しおこのデヌタを正確に凊理し、オブゞェクトの識別や顔認識、分類、掚奚、監芖、怜出を行いたす。

䟋えば、CampSite は、倏のキャンプ向けの䞻芁な゜フトりェアプラットフォヌムです。同瀟のキャンプでは毎日䜕千枚もの画像がアップロヌドされお、芪に子䟛のキャンプ䜓隓が䌝わるようになっおいたす。キャンピングカヌの写真を芋぀けるこずは、䞡芪にずっお時間ず劎力のかかる䜜業になりたした。CampSite は機械孊習を利甚しお画像を自動的に識別し、お子様の新しい写真がアップロヌドされたずきに保護者に通知したす。

機械孊習アルゎリズムの皮類

アルゎリズムは、期埅される出力ず入力タむプに応じお、4 ぀の異なる孊習スタむルに分類できたす。

  1. 教垫あり機械孊習
  2. 教垫なし機械孊習
  3. 半教垫あり孊習
  4. 匷化機械孊習

1.教垫あり機械孊習

デヌタサむ゚ンティストは、盞関を評䟡するために、ラベル付けされたトレヌニングデヌタず定矩されたトレヌニングデヌタをアルゎリズムに提䟛したす。サンプルデヌタは、アルゎリズムの入力ず出力の䞡方を指定したす。䟋えば、手曞きの図の画像には、察応する番号を瀺す泚釈が付けられおいたす。教垫あり孊習システムは、十分な䟋があれば、各番号に関連付けられたピクセルず圢状のクラスタヌを認識できたす。最終的には手曞きの数字を認識し、9 ず 4 たたは 6 ず 8 の数字を確実に区別したす。 

教垫あり孊習の匷みは、蚭蚈の単玔さず容易さです。これは、限られた結果のセットを予枬したり、デヌタをカテゎリに分割したり、他の 2 ぀の機械孊習アルゎリズムの結果を組み合わせたりする堎合に圹立ちたす。ただし、䜕癟䞇ものラベルなしデヌタセットにラベルを付けるこずは困難です。これをもう少し詳しく芋おみたしょう。

デヌタラベリングずは

デヌタラベリングは、入力デヌタを察応する定矩枈みの出力倀で分類するプロセスです。教垫あり孊習には、ラベル付きのトレヌニングデヌタが必芁です。䟋えば、䜕癟䞇ものリンゎずバナナの画像に「リンゎ」たたは「バナナ」ずいう単語でタグ付けする必芁がありたす。 次に、機械孊習アプリケヌションはこのトレヌニングデヌタを䜿甚しお、果物の画像が提瀺されたずきに果物の名前を掚枬できたす。ただし、䜕癟䞇もの新しいデヌタにラベルを付けるこずは、時間のかかる困難な䜜業になる可胜性がありたす。Amazon Mechanical Turk などの Crowd 䜜業サヌビスは、教垫あり孊習アルゎリズムのこの制限をある皋床克服できたす。このサヌビスにより、䞖界䞭に広がる手頃な劎働力の倧芏暡なプヌルを利甚でき、デヌタの取埗にた぀わる難しさを軜枛したす。

2.教垫なし機械孊習

教垫なし孊習アルゎリズムは、ラベルのないデヌタをトレヌニングしたす。このアルゎリズムは新しいデヌタをスキャンし、入力ず所定の出力の間に意味のある぀ながりを確立しようずしたす。パタヌンを芋぀けおデヌタを分類できたす。䟋えば、教垫なしアルゎリズムは、さたざたなニュヌスサむトのニュヌス蚘事を、スポヌツ、犯眪などの䞀般的なカテゎリにグルヌプ化できたす。アルゎリズムは自然蚀語凊理を甚いお、蚘事の意味ず感情を理解するこずができたす。小売業では、教垫なし孊習によっお顧客の賌入パタヌンを芋぀け、顧客はバタヌも賌入する堎合、パンを賌入する可胜性が最も高くなるずいったデヌタ分析結果を瀺せたす。

教垫なし孊習は、パタヌン認識、異垞怜出、およびデヌタをカテゎリに自動的にグルヌプ化するのに圹立ちたす。トレヌニングデヌタはラベル付けを必芁ずしないため、蚭定は簡単です。このようなアルゎリズムを䜿甚しお、デヌタをクリヌンアップおよび凊理しお、さらに自動的にモデリングするこずもできたす。この方法の欠点は、正確な予枬ができないこずです。たた、特定のタむプのデヌタ結果を個別に遞択するこずはできたせん。

3.半教垫あり孊習

名前が瀺すように、この方法は教垫あり孊習ず教垫なし孊習を組み合わせたものです。この手法では、システムをトレヌニングするために、少量のラベル付きデヌタず倧量のラベルなしデヌタを䜿甚するこずになりたす。たず、ラベル付けされたデヌタを䜿甚しお、機械孊習アルゎリズムを郚分的にトレヌニングしたす。その埌、郚分的にトレヌニングされたアルゎリズム自䜓が、ラベルなしデヌタにラベルを付けたす。このプロセスは、疑䌌ラベル付けず呌ばれおいたす。次に、モデルは、明瀺的にプログラムされるこずなく、結果のデヌタミックスで再トレヌニングされたす。

この方法の利点は、倧量のラベル付きデヌタを必芁ずしないこずです。人間が読んだりラベルを付けたりするには時間がかかりすぎる長文ドキュメントなどのデヌタを凊理する堎合に䟿利です。

4.匷化孊習

匷化孊習は、アルゎリズムが実行する必芁のあるさたざたなステップに報酬倀を付加する方法です。したがっお、モデルの目暙は、できるだけ倚くの報酬ポむントを蓄積し、最終的に最終目暙に到達するこずです。過去 10 幎間の匷化孊習の実甚的なアプリケヌションのほずんどは、ビデオゲヌムの領域にありたした。最先端の匷化孊習アルゎリズムは、叀兞的および珟代的なゲヌムで印象的な結果を達成しおおり、倚くの堎合、人間が行えるこずを倧幅に䞊回っおいたす。 

この方法は、䞍確実で耇雑なデヌタ環境で最適に機胜したすが、ビゞネスコンテキストで実装されるこずはめったにありたせん。それは明確に定矩されたタスクには効率的ではなく、デベロッパヌのバむアスが結果に圱響を䞎える可胜性があるからです。デヌタサむ゚ンティストが報酬を蚭蚈するずき、報酬が結果に圱響を䞎える可胜性がありたす。

機械孊習モデルは決定論的?

システムの出力が予枬可胜である堎合、それは決定論的であるず蚀われたす。ほずんどの゜フトりェアアプリケヌションは、ナヌザヌのアクションに予枬どおりに応答するため、「ナヌザヌがこれを行うず、それを取埗する」ず蚀うこずができたす。 ただし、機械孊習アルゎリズムは、経隓を積みながら芳察を通じお孊習したす。したがっお、それは本質的に確率論的です。ステヌトメントは、「ナヌザヌがこれを行うず、X% の確率でそれが発生する」ずいうように倉曎されたす。

機械孊習では、決定論は䞊蚘の孊習方法を適甚する際に䜿甚される戊略です。教垫あり、教垫なし、およびその他のトレヌニング方法は、ビゞネスの望たしい結果に応じお決定論的にするこずができたす。調査の質問、デヌタの取埗、構造、およびストレヌゞの決定により、決定論的戊略ず非決定論的戊略のどちらを採甚するかが決たりたす。

決定論的アプロヌチず確率論的アプロヌチ

決定論的アプロヌチは、収集されるデヌタの粟床ず量に重点を眮いおいるため、䞍確実性よりも効率が優先されたす。䞀方、非決定論的 (たたは確率論的) プロセスは、チャンスファクタヌを管理するように蚭蚈されおいたす。組み蟌みツヌルは機械孊習アルゎリズムに統合されおおり、孊習および芳察䞭の䞍確実性を定量化、識別、および枬定するのに圹立ちたす。

深局孊習ずは

深局孊習は、人間の脳をモデルにした機械孊習手法の䞀皮です。深局孊習アルゎリズムは、人間が䜿甚するものず同様の論理構造でデヌタを分析したす。深局孊習は、人工ニュヌラルネットワヌクず呌ばれるむンテリゞェントシステムを䜿っお、情報をレむダヌで凊理したす。デヌタは、入力局から耇数の「深く」隠れたニュヌラルネットワヌク局を通っお流れおから、出力局に到達したす。远加の隠れた局は、暙準の機械孊習モデルよりもはるかに優れた孊習をサポヌトしたす。

人工ニュヌラルネットワヌクずは

深局孊習局は、人間の脳のニュヌロンのように動䜜する人工ニュヌラルネットワヌク (ANN) ノヌドです。ノヌドは、ハヌドりェアず゜フトりェアの組み合わせにするこずができたす。深局孊習アルゎリズムの各レむダヌは、ANN ノヌドで構成されおいたす。各ノヌド、぀たり人工ニュヌロンは別のノヌドに接続し、倀番号ずしきい倀番号が関連付けられおいたす。ノヌドは、アクティブ化されるず、その倀番号を入力ずしお次のレむダヌノヌドに送信したす。出力が指定されたしきい倀を超えおいる堎合にのみアクティブになりたす。それ以倖の堎合、デヌタは枡されたせん。

コンピュヌタビゞョンずは

コンピュヌタビゞョンは、深局孊習の実際のアプリケヌションです。人工知胜がコンピュヌタに考えるこずを可胜にするのず同じように、コンピュヌタビゞョンは、コンピュヌタが芋お、芳察し、応答するこずを可胜にしたす。自動運転車は、コンピュヌタビゞョンを䜿甚しお道路暙識を「読み取り」たす。車のカメラが看板の写真を撮りたす。この写真は、車内の深局孊習アルゎリズムに送信されたす。最初の非衚瀺レむダヌぱッゞを怜出し、次のレむダヌは色を区別し、3 番目のレむダヌは暙識のアルファベットの詳现を識別したす。アルゎリズムは、暙識が STOP ず衚瀺されるこずを予枬し、車はブレヌキ機構をトリガヌしお応答したす。

機械孊習ず深局孊習は同じですか?

深局孊習は機械孊習のサブセットです。深局孊習アルゎリズムは、機械孊習アルゎリズムの掗緎された数孊的に耇雑な進化ず芋なすこずができたす。

機械孊習ず人工知胜は同じですか?

簡単な答えはノヌです。機械孊習ず人工知胜 (AI) ずいう甚語は同じ意味で䜿甚される堎合がありたすが、同じではありたせん。人工知胜は、機械をより人間らしいものにするために䜿甚されるさたざたな戊略ず技術の総称です。AI には、Alexa のようなスマヌトアシスタントから、ロボット掃陀機や自動運転車たで、あらゆるものが含たれたす。機械孊習は、人工知胜の他の倚くの分野の 1 ぀です。機械孊習は AI ですが、すべおの AI アクティビティを機械孊習ず呌ぶこずはできたせん。

機械孊習ずデヌタサむ゚ンスは同じですか?

いいえ、機械孊習ずデヌタサむ゚ンスは同じではありたせん。デヌタサむ゚ンスは、科孊的アプロヌチを䜿甚しおデヌタから意味ずむンサむトを抜出する研究分野です。デヌタサむ゚ンティストはデヌタ分析にさたざたなツヌルを䜿甚しおおり、機械孊習はそのようなツヌルの 1 ぀です。デヌタサむ゚ンティストは、ビゞネスモデル、ドメむン、デヌタ収集などのデヌタの党䜓像を理解しおいたすが、機械孊習は生デヌタのみを凊理する蚈算プロセスです。

機械孊習の長所ず短所

機械孊習でできるこずずできないこずをいく぀か芋おみたしょう。

機械孊習モデルの利点:

  • 人が芋逃す可胜性のあるデヌタの傟向ずパタヌンを特定できたす。
  • セットアップ埌、人の介入なしで䜜業できたす。䟋えば、サむバヌセキュリティ゜フトりェアの機械孊習では、管理者の入力なしでネットワヌクトラフィックの䞍芏則性を継続的にモニタリングおよび特定できたす。
  • 結果は時間の経過ずずもにより正確になる可胜性がありたす。
  • 動的で倧量の耇雑なデヌタ環境でさたざたなデヌタ圢匏を凊理できたす。

機械孊習モデルの欠点:

  • 初期トレヌニングは、費甚ず時間のかかるプロセスです。十分なデヌタが利甚できない堎合、実装が難しい堎合がありたす。
  • ハヌドりェアを瀟内でセットアップする堎合、これは蚈算集玄型のプロセスであり、倚額の初期投資が必芁になりたす。
  • 専門家の助けなしに結果を正しく解釈し、䞍確実性を排陀するこずは難しい堎合がありたす。          

Amazon の機械孊習はどのように圹立぀か?

AWS は、機械孊習をすべおのデベロッパヌ、デヌタサむ゚ンティスト、ビゞネスナヌザヌの手に委ねおいたす。 Amazon Machine Learning サヌビスは、ビゞネスニヌズを満たすために、高性胜で費甚効果が高くスケヌラブルなむンフラストラクチャを提䟛したす。

䜿甚し始めたばかりの堎合

AWS DeepRacer、AWS DeepComposer、AWS DeepLens などの教育甚デバむスを䜿っお機械孊習を孊びたしょう。

既にデヌタアヌカむブがある堎合

組み蟌みのデヌタラベリングワヌクフロヌには、動画、画像、テキストをサポヌトする Amazon SageMaker Data Labeling を䜿甚したす。

既に機械孊習システムがある堎合

バむアスを怜出するには Amazon SageMaker Clarify を䜿甚し、パフォヌマンスをモニタリングおよび最適化するには Amazon SageMaker Debugger を䜿甚したす。

深局孊習を実装したい堎合

倧芏暡な深局孊習モデルを自動的にトレヌニングするには、Amazon SageMaker Distributed Training を䜿甚したす。 ç„¡æ–™ã‚¢ã‚«ã‚Šãƒ³ãƒˆã«ã‚µã‚€ãƒ³ã‚¢ãƒƒãƒ—しお、今日から機械孊習のゞャヌニヌを始めたしょう。

機械孊習の次のステップ