可変感情可変予定制御

街歩きブログになりつつあるなにか

全ツイート履歴を使ってマルコフ連鎖でツイート生成してみた

Chainerの勉強をしつつ「文を自動生成したいな~」と思って、この3連休を潰しつつLSTMのネットワークとか作っていたもののまともな結果が出ず...。結局今日の夕方あたりになって簡単にできそうなマルコフ連鎖に逃げた。

全ツイート履歴を時々ダウンロードしており、現在のアカウントからも取得したところ、全部で10.5万文くらいデータがあったのでこれを利用してマルコフ連鎖のモデルを作成してみる。昔にダウンロードしたものはcsv形式のファイルがありHTML上で閲覧できるような親切仕様なのだが、最新のものはjsファイルのみになってしまいJavaScript以外ではちょっと扱いづらい。マルコフ連鎖にはPythonのライブラリであるmarkovifyを利用した。深層学習と比べるとこれが驚くほど簡単だ。分かち書きした文を用意するだけでOK。

とりあえず上手く?生成できたツイートをいくつか載せてみる。

 

逆に上手く生成できなかったツイート。前の数単語だけをみて次の単語を決めているので長文になると内容に一貫性がない。やはりまともな文を作るには長期記憶が可能な深層学習が必要だろう。