たけのこブログ

凡人が頑張って背伸びするブログ

fasttext

Dockerで作ったDS環境にmecab+fasttextを安全に入れるための備忘録

前回、以下の記事でDockerを使って簡単にBiqqueryのデータをjupyterで可視化する方法を備忘録として掲載しました。datascience-notebookのDocker-imageを使用しております。 yukr.hatenablog.com 今回は、前回の記事で構築した環境にmecabとfasttextをインス…

word2vecやfasttextを使って類似単語を抽出できる仕組みを数学を一切使わずに頑張って説明してみる

背景 機械学習で過去に実装したものの原理を教えて欲しいと言われて社内勉強会でword2vecを説明した時、数学にあまり詳しくない人にword2vecの仕組みを伝えるのに苦労した。実際に他の現場でも、「単語を学習してるのは分かるんだけど、そもそもなんで似てい…