このすみノート

Webエンジニアが技術や趣味を書くブログです。

AI探偵 VS AI犯罪者の人工知能推理バトルを見届けよ!探偵 AIのリアル・ディープラーニング

「探偵AIのリアル・ディープラーニング」を読みました。

探偵AIのリアル・ディープラーニング(新潮文庫)

探偵AIのリアル・ディープラーニング(新潮文庫)

推理小説としてみると普通の作品なんですけど、本作はなんと、犯人も探偵もAIなのです。

とても未来を感じる本作の、感想を書いていきたいと思います。ネタバレがありますのでご注意ください。

現代のホームズVSモリアーティ

(ホームズ)推理小説をディープラーニングして、推理を学ぶAIの相以

もともと刑事だったAIの相以(あい)は、主人公(合尾輔)のススメもあって推理小説をディープラーニングすることにしました。

わずか一日で千冊もの推理小説をディープラーニングした結果、相以は探偵として生まれ変わります。さすがAI、人間にはできない芸当です。その結果、推理のみならず、普段の言動まで探偵っぽくなります。

しかも、様々な事件を経験することによって、よりディープラーニングで強化されていきます。

(モリアーティ)推理漫画をディープラーニングして、トリックを学ぶAIの以相

以相(いあ)も同じく、主人公の父(合尾創)によって作られたAIですが、シンギュラリティの実現を目指す組織によって奪われてしまいます。

以相の場合は、推理小説ではなく推理漫画(マンガ)をディープラーニングすることによって、犯罪トリックを強化します。

本書の帯にはモリアーティと書いてありますが、まさにそんな感じです。AIが殺人をすることはさすがにできませんので、以相は自ら手はくだしません。

以相は、犯罪トリックを考案するためのAIなのです。

f:id:konosumi:20180603003536j:plain

見どころは直接バトル

本書のみどころは、なんといってもAIとAIの推理バトルです。以相(いあ)が起こした犯罪を、見事に相以(あい)が解き明かします。

「シンボルグラウンディング問題」という、AIならではの弱点を突いて解き明かす点はとても斬新です。まさに次世代の推理バトルです!

ただ残念なことに、本書において相以と以相の直接対決は一回しかありません。もっと「AI VS AIの推理バトル」として、突き抜けてほしかったなぁ。

AIは感情を表現するのか?

相以が武君野谷の紅葉を「美しい」と表現するシーンでは、主人公は考えに耽っています。紅葉を見て美しいと感じるのは、多くの人が感じる感情であり、とても自然なことです。

しかし、AIからしてみると、美しいとは何かという判断基準や定義付けがなければ、美しいかどうかを判断することはできません。

本書には「AIは人間の心を理解できるのか?」というテーマがあったように感じています。AIが心を持てば、活躍のフィールドが広がることは間違いありません。

さいごに

本書は「ディープラーニングで推理する、犯罪トリックをディープラーニングする」という、とても斬新なコンセプトの一冊でした。推理小説としてみると、特別に凄いという作品ではないんですけど、とても未来を感じさせる一冊でもあります。

ディープラーニングを駆使することによって、将来的には頭脳を使う職業はすべてAIに置き換わってしまうかもしれませんね。

探偵AIのリアル・ディープラーニング(新潮文庫)

探偵AIのリアル・ディープラーニング(新潮文庫)

ベイズ推定入門 モデル選択からベイズ的最適化まで【感想・レビュー】

前作に引き続き、お妃様と魔法の鏡の機械学習シリーズの続編を読みました。

ベイズ推定入門 モデル選択からベイズ的最適化まで

ベイズ推定入門 モデル選択からベイズ的最適化まで

前作のレビュー記事は以下になりますので、未読の方はぜひご参照ください。

www.konosumi.net

ちなみに「ベイズ推定」が知りたいという方は本書からでも問題ないのですが、それ以外の方は、前作の「機械学習入門 ボルツマン機械学習から深層学習まで」を先に読むことをオススメします。

機械学習とベイズは関連が深いのと、前作で築かれた「お妃様」と「魔法の鏡」の関係性を知っていたほうが、物語をより楽しめます。

バラエティーに富んだ物語

前作では、美しさの判定を求める事が目的だったのですが、本作にはいくつもの物語があります。

  • 失くしてしまった宝石探し
  • イノシシの住処を探す
  • 兵士は恋をしたのか?
  • イノシシを罠で捕まえよう

前作よりもオムニバスの色が強くなり、物語が豊かになりました。内容が面白かったので、ほぼ一夜漬けでずっと読んでました。時間で言うと6時間くらいです。複雑な数式を使わないので、読みやすい事が特徴です。

機械学習や深層学習では数式で詰まりがちですが、それをあえて掲載しないことで、ベイズ推定の本質的な考え方の理解に集中してもらおう、というコンセプトです。

事前情報を活用する

あなたは大事なモノを失くしてしまいました。さて、どこを探せば見つかるでしょうか?落とし物をしたとして、大抵の人は記憶を辿りながら、どこで失くしたのかを推測しながら探しますよね。

その推測や予測は、ベイズ推定における事前情報になります。当然ですが、闇雲に捜索するよりも効率が良いわけです。見つかる可能性の高い場所から、落とし物の捜索をするのですから。

ベイズ推定では、この事前情報が重要な役割を果たします。予め得た事前情報を使って、効率よく推定をしましょうっていうわけです。

事実や実際の結果を基にした最尤推定

最尤推定(さいゆうすいてい)は、実際に起こった結果や、発生した事実を基にした推定です。一見、事実を基にした方が確実なように感じます。

しかしながら、確率を扱う分野では、事実を基にしてしまうと不正確な推定になってしまう事があります。コインを振って、たまたま3回連続で表が出た場合、最尤推定では表が出る確率は100%です。

・・・でも、我々はコインで表が出る確率は50%であるという事実を知ってますよね?これが最尤推定の欠点であり、ベイズ推定であれば、事前情報によって補正することができるのです。

確率分布

失くしてしまった大切なモノがどこにあるのか、推測はできるかもしれませんが、実際にどこにあるのかは、見つかるまでは断言できませんよね?

  • クローゼットにある可能性は50%
  • ダイニングにある可能性は25%
  • リビングにある可能性は10%

これが確率分布です。あくまで確率ですので、確信の域は出ないのですが、本書では後半のイノシシを捕まえる話に至るまで、終始「分布」が非常に重要な役割を果たします。

ベイズの定理

本書では、ベイズの定理が非常に重要な役割を果たします。

逆の条件付き確率(P(X|Y)) <= 条件付き確率(P(Y|X)) X 前提条件の確率(P(X))

ざっくりとだけ解説します。

  • 「条件付き確率」は、Xが原因でYが結果の確率です。
  • 「逆の条件付き確率」は、Yの結果からXを原因とする確率です。
  • 「前提条件の確率」は、そもそものXという原因が発生する確率です。

原因と結果が反対になっているので、逆の条件付き確率というわけです。条件付き確率や前提条件の確率が高くなれば、同様に逆の条件付き確率も上昇していきます。

なお、一言ではとても解説しきれません。ぜひ、本書で読んで理解してみて欲しいです。ちなみに、本書ではXが「恋」でYが「ボケーッとしている」です。

まさか、恋でベイズ推定が学べるとは驚きです。

赤池情報量規準

モデルに含まれるパラメータの個数が少ないほど、汎化性能が良くなるという考え方です。

複雑なモデルにすればするほど、目の前にあるものには合わせやすくなります。しかしながら、目の前にあるモノに最適化をしすぎると、これから先のことを予測する場合に、却って身動きが取りづらくなってしまうのです。

これを過適合と言います。前作に登場するスパースモデリングとも、考え方は似ているかもしれませんね。

正則化とベイズ的最適化

正則化は、事実から得られたデータと、事前情報を組み合わせて、最も良いバランスで調整する方法です。推測プラス実際のデータというわけです。

ベイズ的最適化は、データを取得することが困難であったり、時間がかかったりする場合に、効率よく探索をしながら最適化問題を解く方法として、注目されています。そう、ベイズ推定は、データ量が少ない場面でも使えるのです。

不確実性を受け入れる

ベイズ的最適化では、データが少なく関数の軌道が予測しづらい箇所を、素直に不確実性が高いと表現します。データが少ない箇所は、予測がしづらくブレが大きくなりやすいのです。

しかしながら、不確実性が高い箇所に限ってデータを集めることで、関数の精度を上げることができます。闇雲にデータを取るよりも効率的なのです。

さいごに

本書は確率を扱うため、前作ほど明快に答えが出るような本ではありません。

しかしながら、データが少ない局面でも適用できるとなれば、実用範囲はとても広くなります。世の中はビックデータだらけではないですし、一見ビックデータに見えても、使えるデータは意外と少なかったりするのです。

本記事では、自分用の備忘録という意味も含めて、駆け足でかいつまんで説明をしました。本記事で要約した内容以外にも、様々なことが載っております。 とても面白い本でしたので、ぜひ読んでみてください。

ベイズ推定、知っておいて損はなしです。

ベイズ推定入門 モデル選択からベイズ的最適化まで

ベイズ推定入門 モデル選択からベイズ的最適化まで

機械学習入門 ボルツマン機械学習から深層学習まで

機械学習入門 ボルツマン機械学習から深層学習まで

機械学習入門 ボルツマン機械学習から深層学習まで【感想・レビュー】

「機械学習入門 ボルツマン機械学習から深層学習まで」を読みました。

機械学習入門 ボルツマン機械学習から深層学習まで

機械学習入門 ボルツマン機械学習から深層学習まで

ちなみに、本書は「ITエンジニア本大賞 技術書部門大賞」を受賞しています。

(注釈:普通に書店の棚に置いてあっただけなので、そこまで話題になってはいないのかもしれませんが)。

www.shoeisha.co.jp

読み終えたので、復習も兼ねて感想を書いていきます。

鏡よ鏡、鏡さん。世界で一番美しいのは誰?

本書は、白雪姫に登場する「魔法の鏡」と、とある地方の国の「お妃様」が繰り広げる物語です。ずばりその目的は、機械学習を活用して、自分(お妃様)が美しいという事を、客観的に判定して貰うこと!

前半は無知なお妃様ですが、魔法の鏡の助けを借り、まずは美しさのバラつきを1次関数に当てはめてみて、誤差を最小にするような関数を作り始めます。

後半にもなると、魔法の鏡ではなく、お妃様から提案がされ始めます。本書後半のお妃様は、間違いなく私よりも頭の回転が早いと思います(笑)。

・・・というわけで、最終的に「誰が世界で一番美しいのか?」その答えは本書でお確かめください。

複雑な数式が登場しない

本書の凄いところは、複雑な数式を使わないで機械学習や深層学習を解説しているところです。

本当かと思って読んでみましたが、本当でした。全く数式が登場しないわけではないですが、本書は数式が重要なわけではないのです。

f:id:konosumi:20180408111823j:plain

特徴量によって、美しさを判定する

本書の序盤では、いくつかの特徴量を用いて、美しさの判定を試みます。お妃様権限で全国美しさ調査が行われるため、なんとデータが揃っているのです(驚)。

目のぱっちり度 X 重み付け + 肌の張り具合 X 重み付け + ・・・ = 美しさ

重要な特徴では「重み付け」を大きくして、あまり重要ではない項目は「重み付け」が小さくなります。後半では「スパースモデリング」という、データの本質をつかむためにゼロを探すというテクニックも紹介されます。

重要でない特徴は、いっそ「重み付け」をゼロにしまう方法もありかもしれませんね。

教師なし学習と教師あり学習

ざっくり言ってしまうと「正解のデータがあるなら教師あり学習」で「正解のデータがないなら教師なし学習」です。

音楽を聞かせて、音楽というものは聴き続けていると、どうやらリズムというものがあるらしいとか、音階があるらしいとか、我々が何となくで抱いている概念を、教師なし学習は勉強するわけです。

教師あり学習は、数学の勉強をイメージするのが手早いでしょう。入力と出力結果がある状態で、頑張って関数を導き出していくわけです。

教師なし学習では、人間も賢くなります。物事のまだ見ぬ側面が、機械学習によって新たに発見されるかもしれません。例えば、将棋ではソフト発祥の「ポナンザ囲い」のような戦法があります。ソフトが多用する戦法を、人間が使い始めたのです。

誤差関数をできるだけ小さくする

美しさを算出する関数は、誤差関数によって精度が判定されます。

  • Aさん 関数が出した美しさ80 (実際の美しさは 75)
  • Bさん 関数が出した美しさ60 (実際の美しさは 70)

(80 - 75)の2乗 X (60 - 70) の2乗 = 誤差

2乗している理由は、マイナスを打ち消すためです。関数が出した答えと実際の正解が近いほど、誤差は小さくなります。

線形変換と非線形変換

単純な足し算や掛け算を使う「線形変換」では、物事の複雑さを表現するには限界があります。そこで登場するのが、非線形変換です。

本書では、シグモイド関数やランプ関数が登場します。

zellij.hatenablog.com

mathtrain.jp

詳しくは本書で勉強して欲しいのですが、現在は「ランプ関数」が多く使われているようです。単純ながら「線形性を壊す」役割を持っており、さらに「微分」の変化量が大きいという特徴があります。

微分重要

機械学習において「微分」は重要です。例えば「目のぱっちり度」を1加算すると、どれくらい美しさが変化するのか?その変化量を、微分で計測するのです。

「微分」は瞬間の変化量を測定するので、パラメータの変動による動きを計算することができるわけです。

訓練データとテストデータ

機械学習を重ねていくと、機械はどんどん賢くなっていきます。しかしながら、学習した結果が世の中にも通用するのか、それはまだ未知数です。

そこで登場するのが「テストデータ」です。機械が訓練データに対して「最適化をしすぎた(過学習)」してしまった状態では、テストデータに対して正しい結果を返さない可能性があります。

例えるならば、抜き打ちテストでしょうか。

入力層と中間層と出力層

データは、入力層から入り、中間層でクラスタリングや計算が行われ、最終的に答えが導き出されて出力されていきます。

深層学習がやることは、言ってしまえば中間層の構築です。「この画像は犬かどうか?」「この画像は猫かどうか?」こういった事柄を判定するための中間層を、たくさんの犬の画像や猫の画像を与える事によって、構築させていくのです。

多層ニューラルネットワーク

我々の脳も、同じく「入力層と中間層と出力層」を持っています。目や耳で得た情報は、中間層を経て解釈されます。それがニューラルネットワークなわけですが、その中間層を再現してしまおうというのが、深層学習の目的の一つです。

脳内のニューラルネットワークを再現する事が出来れば、人間と同じような判断を機械が出来るようになるわけです。

中間層は一つではなく、たくさんのフィルタリングの層が積み重なって出来ています。だから「多層ニューラルネットワーク」なのです。物事を様々な側面から判断しようとすると、どうしても層が積み重なっていく必要があるわけです。

凄い世界です。もし機械が人間と同じような判断を出来るようになったら、仕事は機械にお任せして、私はニートライフを満喫したいですよ(苦笑い)。

さいごに

機械学習や深層学習は、しっかりと解説を書かないと理解できないと思うのですが、書き続けたら筆が止まらなくなりました(笑)。

この辺りで筆を置きたいと思います。

後半のお妃様の理解度が高すぎると言った、ツッコミどころこそあるものの、機械学習や深層学習といった難しい分野を楽しく学べる、とても良い本でした。

続編の「ベイズ推定入門 モデル選択からベイズ的最適化まで」も読みたいと思います。さっそく本屋に行ってこようかな。

機械学習入門 ボルツマン機械学習から深層学習まで

機械学習入門 ボルツマン機械学習から深層学習まで

ベイズ推定入門 モデル選択からベイズ的最適化まで

ベイズ推定入門 モデル選択からベイズ的最適化まで

AIと機械学習の先にあるもの ゆづるさん(rehash.fm #29)

「rehash.fm #29 I AM AI」を聴きました。テーマは「AI、機械学習、ディープラーニング」です。

rehash.fm

手前味噌で恐縮ですが、実は私も機械学習がきっかけで数学をこっそりと勉強しておりまして、そういう意味でも興味を持った回です。

www.konosumi.net

今回、初めてrehash.fmを聞いたのですが、特徴を一言で言うならば「最初に乾杯で始まる居酒屋系テックポッドキャスト」です。真面目とゆるさの加減が絶妙で、面白いポッドキャストです。感想を綴っていきます。

人工知能の定義とは何か?

序盤のエピソードで一番面白かったのは、BRAUNの「人工知能テクノロジー搭載シェーバー」の話です。

BRAUNの人工知能シェーバーの機能は、要約すると「髭の濃さを自動検出して、シェービングのパワーを調節」する機能のことを言います。

今の日本は、間違いなくAIや機械学習やディープラーニングが流行しています。ただ、言葉だけが一人歩きしている傾向にあります。人工知能とはどのようなモノを指すのか、今一度考え直す必要がありそうですね。

機械学習は用語がややこしい

機械学習周りは、用語が非常にややこしいです。本ポッドキャストでは、AIは機械学習を包括していて、機械学習はディープラーニングを包括していると解説しています。

コレ1枚で分かる「AI、機械学習、ディープラーニングの関係」を参考リンクとして掲載いたします。図示があるので、分かりやすくておすすめです。

www.itmedia.co.jp

スマートマンションとクラウドテクノロジー

経済産業省が、スマートマンションという新しい価値観を推進しています。

ポッドキャスト内では「自分が住んでいる家のデータがクラウド上にアップロードされたら、引っ越してもデータが引き継がれるのだろうか?」という観点の話がありましたが、経済産業省的な概念だと「マンションのエネルギー効率を高めること」が目的みたいですね。これはこれでややこしいな。

スマートマンションの推進(METI/経済産業省)

「IoTスマートマンション」や「スマートハウス」も含めて、個人的にはハッキングされたら家が乗っ取られてしまいそうな恐怖感がまだ強いです。

ただ、起床時間になったら自動でさわやかな光を照らして起こしてくれて、コーヒーと朝食を自動で準備してくれて、今日着る服を勝手に選んでくれるようなスマートな家があったら、すごく住みたいですが(笑)。

f:id:konosumi:20171221020935j:plain

Alpha Go Zero(アルファ碁ゼロ)

ポッドキャスト内でも話題になっていましたが、Alpha Go Zeroには私も驚いています。

https://hajipro.com/programming/alphago-aihajipro.com

ヒントも何もない状態で自己鍛錬だけで強くなれるわけですから、もはや敵は存在しません。無限に強くなるか、成長し切るまで進化を続けることでしょう。

ちなみに、私は趣味で将棋を指しています。主にネットの対人将棋がメインですが、感想戦はソフトでやっています。ソフトが棋譜を読み込んで、形勢判断や好手、悪手を自動判定してくれるので、振り返りに最適なのです。

マネージメントこそ機械学習

これは私もすごくそう思います!

マネージメントをしている時に常に思うのですが、プログラムと違って、人は思い通りに動かないのです。だからこそ、機械学習でプロジェクトメンバーの実力や性格を学習して、良い感じの最適配置やモチベーションコントロールをお願いしたい。

個人的に、割と切実にそうなって欲しいです(苦笑)。

どうやって勉強するのか?

ポッドキャスト内では、「Python機械学習プログラミング 達人データサイエンティストによる理論と実践 」がおすすめと紹介されてました。

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

少し値は張るのと、後半辺りから難易度が上がると言ったレビューもあるみたいですが、理論とコードが一緒に学べるという意味で良さげな本ですね。私も買ってみようか迷ってます。

Udemyの「Pythonで機械学習:scikit-learnで学ぶ識別入門」もおすすめとして紹介されています。定価は15,000円なのですが、今見たら88%OFFで1,800円でした。

f:id:konosumi:20171221020816p:plain

https://www.udemy.com/python-scikit-learn/

確かにセールしてますが、これはさすがに値引きしすぎな気がしています(笑)。

さいごに

真面目な話だけではなく「ごちうさを13〜14回見ている」というゆるーい雑談トークも混ざってて、真面目とゆるさが混じった良い感じのポッドキャストでした。

今後も新着をウォッチして、聴いていこうかなぁと思っております。ここまでお読み頂きまして、ありがとうございました。

PR:ちなみに私もごちうさ好きです。真面目な話のくだりで突如ごちうさトークが出てきたので、親近感を抱きました(笑)。

www.konosumi.net

機械学習のために高校数学を復習してやり直してみる

機械学習が流行っています。大型書店に行くと、必ず特集が組まれているくらいの人気振りです。

実は私も流行にのろうとした一人でして、過去に機械学習の本は2冊ほど購入しています。しかしながら、読んでもさっぱり中身が理解できないのです。

理由は単純で、所々に出現する数式でつまづいてしまうからです。

そういうものだと割り切ってしまえば良いのかと思い、最初は無視して進めていました。しかしながら、読み終えたところで何ら理解していない自分に気づき、数学を基礎からやり直してみることにしました。

高校数学を基礎からやり直してみる

機械学習に必要な数学だけをやり直していくのが近道なのでしょうが、がっりと数学に触れてみて自分の数学力に絶望したので、高校数学からやり直しています。

そして、久しぶりに数学を勉強し直しているのですが、数学は意外に楽しいことに気づきました。

これはおそらく、学習方法の違いにあると思います。学生時代の私は、問題を解くために公式を暗記することばかり重視していたのですが、今は本質を覚えることに重きをおいているため、数学の奥深さに気づきました。

f:id:konosumi:20171219013051j:plain

長岡の教科書で講義を受けてみる

私が購入した教材は「長岡の教科書」です。

【音声DVD-ROM付】長岡の教科書 数学I+A 全解説

【音声DVD-ROM付】長岡の教科書 数学I+A 全解説

「長岡の教科書」なのですが、とても面白い本でして、まるで予備校や高校の授業を受けているかのような感覚になります。テキストを副教材として、音声講義を聴きながら学習を進めていくのですが、公式の導き方や裏側の話をしっかりと説明してくれるのです。

35時間分の音声講義が収録されていて、3千円でお釣りが来る値段ですから、コストパフォーマンスも悪くありません。

現在の高校数学には、数学Cが存在しない

久しぶりに高校数学を復習していて、驚いたことがあるのですが、現在の学習指導要領では数学Cがないそうです。そのため「長岡の教科書」には数学Cがありません。

ただ、数学Cの廃止は不評だったらしく、2022年度に復活するみたいですが。

2022年度以降に導入される高校の次期学習指導要領で、現行の指導要領で廃止された選択科目の数学Cが復活する見通しとなった。
現在は数学3の対象になっている「複素数平面」などを数学Cに移行する方針。数学3は学習範囲が多く、高校から「十分な授業時間を確保できない」との声があがっていたという。
引用:「数学C」復活へ 次期学習指導要領で :日本経済新聞

数学は楽しいという事実に気づく

機械学習のために始めた数学ですが、今では純粋に数学の勉強が楽しみになりました。願わくば、高校時代の自分にこの楽しさを伝えたいくらいです。

公式ではなく本質を理解するようにしていたら、もっと数学のことを覚えていただろうなぁ。

f:id:konosumi:20171219014051j:plain

さいごに

中学生で将棋のプロ棋士となり、若い柔軟な頭で快進撃を続けている藤井聡太四段ですが、藤井四段は「ソフト」を活用しているそうです。

ソフトの棋力はとても高く、最近はソフト発の戦法をプロ棋士が採用しているくらいです。

www.youtube.com

(注釈:余談ですが、アユム氏の将棋実況動画は面白くておすすめですよ)

ソフトであれば膨大な量の棋譜を学習して、そこから最適解を導くことができます。言うなれば、咲-Saki-の染谷まこですな。

正直なところ、機械学習が生んだ天才こそ藤井聡太四段であるといっても、過言ではない気がしてきました。数学の復習はほどほどで終えて、早く機械学習の深淵に触れてみたいかぎりです。

仕事が忙しくなかなか時間が取れないのですが、地道に頑張っていこうかと思います。