JSの設定

2010年5月28日金曜日

ねづっちボット:現在の機能

お題をだしてもらってなぞかけ(?)をする


「@nezucchi_bot 競馬」などとお題を出す。
※単語じゃなく短い文章でも可。ツイッター検索で結果がでそうなら。

するとこんなリプライが届く。※10分以内に。

ととのいました! 競馬 とかけまして 欧州財政不安継続 とときます、その心は次のツイートで!(ATM:83%)

次のツイートはリプライでは届かない。ねづっちボットをフォローして、さっき届いたリプライの次にあるツイート(公式RT)を見よう。

ユーロ急落、8年半ぶり安値。世界株安連鎖。ダウ1万ドル割れ。欧州財政不安継続。長期投資家もユーロに見切り?いよいよ、今週末の競馬は、負けられない。土曜日に勝ちを確定させ、日曜日は東京競馬場で、史上最強メンバーの日本ダービーを生で観戦し、目黒記念で転がしたい。

「競馬と欧州不安にどんな関係があるんじゃい、と思ったが、なるほどそういうことだったのか」というのがねづっちボットの楽しみ方。ちなみにリプライ末尾にATM:83%とあるのは、

「あなたが選んだお題はどれくらいツイッターのトレンドにマッチしているか指数」の略。

お題でツイッター検索をした結果がたくさんあり、それらのツイートの中身がちゃんとしており(URLやハッシュタグやRTだらけでなく色々な品詞をバランスよく使って自分の言葉で語られている)・・・といったいくつかの条件から算出される。目指せ100%超え!

誰にも相手してもらえないと自分でなぞかけをする


はてなキーワードからお題を取得。
ととのいました! カンヌ国際映画祭 とかけまして 著名映画監督ジャファル とときます、その心は次のツイートで! (*カンヌ国際映画祭 got by: http://bit.ly/ciN5Fc ) 自己採点:80点

このように英語になることも。つぶやくのは毎時3分(1時間に1回)。
I riddle!Why is "Google Chrome" like "erschienen" ? The reason comes in next tweet ! (*Google Chrome got by: http://bit.ly/cXCqmz ) score:46

※ATM、自己採点、scoreは同じ指標。

参照:
ねづっちボットを作ることになった経緯と簡単な仕様説明

2010年5月26日水曜日

別のねずっちボット

3日くらい前、まおらんちという人達に声をかけられた。なんでも、ねずっちボットを作ろうとしていたらすぴー製ねずっちボットを見つけてしまったらしい。ログ

で、これがまおらんち製ねずっちボット。優劣を言うつもりは毛頭ないが、全く違った作りであることは確かなので良い比較対象ができた。まず第一に、ま製はなぞかけという実際の行為を忠実に再現しようとしていることが分かる。

例をひいてみよう。「東京」とかけて、「予定」と説きます。その心は、どちらも「かんこう(観光と刊行)」。これはつまり、東京観光と刊行予定という言葉があって、両方にかんこうという読みが共通して含まれているということだ。

次の例。「終電」とかけて、「土星」と説きます。その心は、どちらも「じこく(時刻と二黒)」。二黒土星(じこくどせい)とは、暦、占いに用いられる九星の一つ。このことを知っていれば意味が分かる。ざっとま製なぞかけを見渡すと、土星と二黒のように、すぐには関連性が分からないものも多い。このへんが課題か。

この発展形を考えるため、自分で作ったなぞかけから例をひく。
厚み とかけまして やり遂げる人 とときます、その心は どちらも意思(石)が強い。
厚みは囲碁の用語で、石が強いことを指す。やり遂げる人は意思が強いというのも、結局同じ意味のことを別の表現で言い換えている。A(厚み)もB(やり遂げる人)も、C(いしがつよい)という共通表現で言い換えることができますよ、というのがこのなぞかけである。

これを考える時の人間の(というか僕の)思考は、石が強い=厚み をまず思い浮かべる。次に「いしがつよい」を何か別の表現で言い換えられないかなと考え、「やり遂げる人」に辿り着く。もう少し詳しくいうと、「いし」はなぞかけに適した語だという認識が予め存在し、これを用いていてなおかつ言い換えが利きそうな文章として「いしが強い」を思い浮かべる。いしを「石」とした場合には「厚み」と言い換えられ、「意思」とした場合には「やり遂げる人」に言い換えられるが、もちろん一発で「いしが強い」を探し当てられるわけではもちろんなく、要は2通りに言い換え可能な表現につきあたるまで探索を繰り返す。

さらに詳しくみよう。まず、このなぞかけを作った時の状況では、お題は自分で自由にだすことができた。だから、「いし」のような特定のものを「自分の中の、なぞかけに適した語データベース」から適当に引っ張り出し、2通りに言い換え可能にするためには「いし」にどんな語をつなげればいいかを色々ためす。

では、お題を自分で選べない時(ねずっちのようにお客さんに出題される場合など)はどうか。
仮に「厚み」と出題されたとする。まずは厚みという語はどんな表現で言い換え可能なのか考える必要があるだろう。しかも言い換えられた表現の中に「なぞかけに適した語」がなければならない。

ということは、「なぞかけに適した語」それぞれと「厚み」という語の関連度を調べればいいのかもしれない。ウェブ検索によって「いし」と「厚み」は関連度が高いと判定されれば、あとはこの「いし」を起点に先ほど(お題を自分で出した時)と同様に2通り言い換え可能表現を探索する。ただしこの場合は片方の言い換えに制約条件がある。

次に、す製を検証してみよう。例をひく。

「桃屋 とかけまして 「鹿角らーゆ」 とときます、その心は次のツイートで!
RT 昨日「鹿角らーゆ」という食べるラー油の類似品食べた。かなり微妙。本家桃屋のは食べたことないけど、ぐーぐる先生曰く似たような味ということなので、食べるラー油ってこんなものなんだなあと思った。」

RT以下全体がこのなぞかけの心だ、意味は自分で読みとけ、と突き放しているのが良くも悪くもこのボットの特徴だ。もちろんこのパターンはあってもよいが、発展形を考えるならば、やはりもっと色々なパターンのなぞかけができるといいだろう。で、とりあえず何故現状す製はこのパターンを採用しているかといえば、ボットの制作難易度とユーザから見た時の面白さのバランスを図った、ということである。

そもそもなぞかけは、面白いものを作ろうと思ったら人間がやっても難しい。なので、面白くするためには人間のツイートを利用するのが手っ取り早いのだ。AとかけてBととく・・・その心がうまくなくても、AとBが登場するCというツイートが見えれば、ボットの心の動き(CのどこからAやBをひろったか、他の語をさしおいてBが選ばれたのは何故か)やC自体の面白さを楽しむことができる。

そういうわけで、ねずっちボットの制作には大きく2つの意味があると思う。1つは「生きた言語空間における自然言語の取り扱い技術、学習技術の習得」。もう1つは「面白さの追求」。どういうなぞかけに対して人間が面白いと思うのか、そのあたりを、実際に面白いなぞかけとつまらないなぞかけを並べてみて比較・分析したり、ま製パターン・す製パターン他にどのようなパターンがなぞかけの範囲の中で考えられるか検討したり。単なるOAuthの練習として始めた課題にしては意外に奥が深い。