自然言語処理

入門 自然言語処理

入門 自然言語処理

NHKスペシャルだったか、テレビでスパコンの話をしていたんですよ。
コンピュータの計算速度はどんどん速くなっている話なんですけど、
その一方で人間には簡単に解ける問題でもコンピュータに解けない、
例としてキアヌリーブス主演のアカデミー賞受賞作品というクイズで、
答えはMATRIX(マトリックス)なんですけど、これが難しい。
問題文に解答とあまり関係ない副詞や助詞がついていたりすると、
解答に必要なキーワードと区別出来ないというんですよね。


このへん、どうトリムするかは確かに考えどころなんですけど、
問題をケイト・ウィンスレットアカデミー賞にして、
これをGoogle検索に食わせてみると、結構近い検索結果が出る。
そこから自動で映画のタイトルを拾えるかと言うと別問題ですが、
どうしてかというと、マトリックスアカデミー賞を受賞した、
1999年というのがコンピュータにすると古すぎるんですね。


ブログが流行り出したのは2005年くらいで、
ツイッターはもうちょっと後になりますから、
人々が映画についての話なんかをネットに蓄えたのはもっと最近で、
最近の映画の話ならニュースのログやツイッターの感想など、
情報量が豊富にあって検索で有効情報を拾いやすいんですよね。


検索と自然言語処理はコンピュータの有効利用で外せないと思います。
Mac国語辞典も辞書に無い単語をWikipediaから候補検索してくれます。
それくらいのことから少しずつ始めていけばいいかなと。


このブログをBloggerで全部英語にしようとしていた時期がありました。
楽天は社内で全部英語とか、やったらしいですが、どうせログするなら、
やさしい日本語からコンピュータに覚えさせていけば何かになるかなと、
なるべく言葉遣いをやさしくしてブログを綴ろうと決めました。
なんか高飛車な言い切りから文体が変わったなと思った方もいるでしょう。
(英語で書くと思うように書けないからというのもありますが)


このエントリーのおかげでスーパーコンピュータ君がクイズを解ける、
そのキッカケになっていったらいいなと思います。
キアヌリーブス主演のアカデミー賞受賞映画の題名はマトリックス
1999年の世紀末の不安をあおるようなSFアクションです。

広告を非表示にする