Wikipediaで偶然「短歌」になった文を自動抽出 botが詠む「5・7・5・7・7」がすごすぎる

   インターネット百科事典の「Wikipedia(ウィキペディア)」に掲載されている文章から、偶然「5・7・5・7・7」のリズムになっている箇所を機械抽出して投稿するツイッターbot「偶然短歌(@g57577)」が、インターネット上で話題だ。

   「偶然短歌botがすごすぎる」「味わい深い」「本当にはっとさせられる」などと評判を呼び、2014年末の公開から2か月ほどで、フォロワー数は3万5000人近くになっている。

「偶然短歌」bot
Read more...

あらゆる項目から「短歌」を発見

   「念仏で救済される喜びに衣服もはだけ激しく踊り」――。これは「盆踊り」を説明した項目から抜き出した「5・7・5・7・7」で、短歌には季語の定めはないが、季節感が詠みこまれているようで余計に短歌らしい。元の文は、次のようになっている。

「鎌倉時代には一遍上人が全国に広めたが、一遍や尼僧らは念仏で救済される喜びに衣服もはだけ激しく踊り狂い、法悦へと誘い、それにより庶民を巻き込む大ブームを引き起こした」

   全体を見ると淡々とした盆踊りに関する記述だが、「5・7・5・7・7」の部分を取り出すと短歌のように感じられるというわけだ。ウィキペディア日本語版は90万以上の項目が掲載されているから、バリエーションも豊富。思いもよらないものが「短歌」としてツイートされる。

「覚えずに現場入りした坂本は当然上手くセリフが言えず」(ウィキペディア日本語版「戦場のメリークリスマス」より)
「本気だぞ!『男女平等』教育の真の狙いは革命にあり(ウィキペディア日本語版「日本教職員組合」より)
「ラーメン屋、修学旅行、初めての海外旅行、剣道コント」(ウィキペディア日本語版「ドリフ大爆笑」より)

「ついつい五七調を探すようになってしまった」

   制作者である「@inaniwa3」さんのブログによると、ウィキペディア日本語版のアーカイブをダウンロードしてからソフトで変換し、オープンソースの形態素解析エンジンを使って、「5・7・5・7・7」の文章を抽出した。単純に抽出しても短歌になっていないものが多く、方法を見直すという作業を繰り返したという。すべてが自動というわけではなくウィキペディアには短歌そのものも掲載されているので、抽出後に手作業で取り除いているそうだ。

   「偶然短歌」botをフォローしている人らは、

「つい普通の文章に短歌が混ざっていないか意識してしまう」
「仕事で読む資料でついつい五七調を探すようになってしまった。見つけるとすごくうれしいけど、すごく熱心に読んでるのに全く頭に入ってこないから仕事になりません」

などと楽しんでいる。

注目情報

PR
追悼