エントリで使われているキーワードを抽出するMovableTypeプラグイン:YahooKeywordSuggest

Posted by
ぴろり
Posted at
2008/04/15 17:15
Trackbacks
関連記事 (1)
Comments
コメント (6)
Post Comment
コメントできます
Category
プラグイン カテゴリ

 記事を書いた後、キーワード欄にどんなキーワードを設定するか悩んだことはありませんか?   そこで、書かれた記事の内容から頻繁に使われている単語を抽出し、キーワードの候補として提案してくれる MovableType プラグインを書いてみました。
 Yahoo! Developer Network ネタ第二弾。今回は、キーワードの抽出に日本語形態素解析ウェブサービスを利用しています。前回にアプリケーション ID を取得された方は、その ID がそのまま使えます。

このエントリーをはてなブックマークに追加  

動作の概要

 記事が保存されたタイミングで、タイトルや本文、追記の内容に対して日本語形態素解析を行います。その結果、多く使われている単語から順に、キーワードの候補として提示します。日本語形態素解析には、Yahoo! Developer Network の日本語形態素解析ウェブサービスを利用しています。専門用語や固有名詞などについても、Yahoo! の検索エンジンで扱えるレベルで、ある程度の単語まで識別してくれているようです。

 なお、このプラグインを使用するには、プラグインファイルの導入だけでなく、先日に公開した YahooSearchStringUnits プラグイン同様、Yahoo! Developer Network でユーザ毎にアプリケーション ID を申請取得(無料)する必要があります。そちらも合わせて手続きを済ませておいてください。別の ID を取り直す必要はないので、既に ID をお持ちの場合は同じ ID を使いまわしても問題ありません。

使い方

 記事を書き終わったら、キーワード欄に「???」(半角でクエスチョンマークを3つ)と入力して、公開または下書き状態で記事を保存します。すると、記事のタイトルや本文から、キーワード候補の単語を抽出して、自動的に幾つかキーワード欄に設定してくれます。ここで、不要なキーワードを削除したり、足りないキーワードを追加で入力してから、改めて保存し直してください。
 記事を書き直したなどの理由で、再度、キーワードを抽出したい時には、同じ操作を繰り返してください。キーワード欄が「???」以外の文字が含まれる場合には、キーワードの抽出は行いません。

インストール方法

 ダウンロードしたプラグインをサーバ上の plugins ディレクトリにアップロードしてください。
 プラグインのアップロードが完了したら、管理画面からプラグインの設定を行います。[システムメニュー]-[プラグイン]と進んで、YahooKeywordSuggest プラグインの設定画面を開き、先ほど Yahoo! で取得したアプリケーション ID を設定します。アプリケーション ID を設定しないと、プラグインが動作しませんのでご注意ください。
 他に設定可能な項目として、取得するキーワードの上限数については、不要なキーワードについては削除すれば済む話なので、少し大きめの値を設定する方が良いでしょう。また、形態素解析の対象とするフィールドをチェックします。標準では、タイトル、本文、追記に入力されたテキストを解析対象としています。これらのフィールドを別の用途で使用されていて、形態素解析の対象としたくない場合にはチェックを外してください。

設定画面のスクリーンショット

いろいろ

  • MTOS4.1、MTOS4.15b2 上で動作確認を行っています。
  • GNU Public License と商用ライセンスのデュアルライセンスで配布しています。
  • IP 毎に使用回数の制限がありますので、共用レンタルサーバなどではスパマー等のとばっちりを受けるかもしれません。
  • 提示されたキーワードにある程度ならうことで、SEO的にも自然なキーワードを設定することができますね。

ダウンロード

このエントリーをはてなブックマークに追加  



関連記事/トラックバック (全 1 件中、最新 5 件まで表示しています)

Open MagicVox.net のスクリーンショット
タイトル
MovableType プラグインを利用して最強タグ付け環境を作る
Trackbacked at
2009/01/22 17:09
from
Open MagicVox.net
概要
 今まで様々な MovableType プラグインを書いてきましたが,単体ではそれほど使途がないように見えても,他のプラグインと一緒に組み合わせて用いる...

この記事にトラックバックを送るには?

寄せられたコメント (全 6 件中、最新 5 件まで表示しています)

Posted by
中村ミノル中村ミノル
at
2009/03/15 19:57
ID
9IK1pY7E
ぴろりさま。このたびはありがとうございました。
さて、Entry Title、エントリーの内容 (body) 
、Entry Excerptをチェックしています。extendedは使っていませんので。
元々当方のサイトは、商品の画像中心で、テキストが少ないの出、仕方ないのかもしれません。
Yahoo!のウェブサービスまたはこのプラグインでは、titel属性とかalt属性の中のテキストは
解析の対象に含まれるのでしょうか?
Posted by
ぴろり ◆OLEEi.VOX.ぴろり ◆OLEEi.VOX.
at
2009/03/15 18:50
ID
fD/VsEIc
プラグインの設定で,どの入力欄を解析するかチェックか正しくチェックされていますでしょうか?
あと,解析の結果返ってくるキーワードは,Yahoo!側のボキャブラリの問題で意外に少なかったりもします。
Posted by
中村ミノル中村ミノル
at
2009/03/14 23:49
ID
lluiMjcs
画面が崩れる、とおっしゃった意味が検討がつきました。
IDの入力と、キーワード数の入力のフィールドが二つ並んでいたものと思います。
そこで、左側にIDを、右側のキーワードはデフォルトの10のままにして
続行して見ました。
あるエントリーのキーワード欄に「???」とやって保存しましたが、
再表示されたときも、「???」のままでした。
しかし、別のエントリーでやってみました、出ました!
でも、最初の投稿時に、キーワードだと思って設定した単語の
大部分はなくなって、わずかに2つになってしまいました。
キーワード足りうるものは、こんなに絞られてしまうのでしょうか?
Posted by
中村ミノル中村ミノル
at
2009/03/14 23:27
ID
lluiMjcs
ヒロリさま
ありがとうございます。確かに、プラグインの読み込みエラーはなくなりましたが、
Yahoo! ApplicationIDを入力するフィールドが表示されません。
設定: YahooKeywordSuggest
(この後に、おそらくNo of keywords の入力フィールドがあり、次に以下の4つのチェックボックスが出ます)
Entry Title 
エントリーの内容 (body) 
Entry Extended Text 
Entry Excerpt 
この後、どうしたらよいでしょうか?
Posted by
ぴろり ◆OLEEi.VOX.ぴろり ◆OLEEi.VOX.
at
2009/03/14 19:56
ID
nVqrzSdM
こんにちは。
3.37で試したところエラーが出ます。しかし,プラグインの11行目と84行目にあるMT::Pages関連の部分をコメントアウトすると使えてしまいました。
プラグインの設定画面が崩れますが特に問題はなさそうです。

コメントを投稿する

 
 (必須, 匿名可, 公開, トリップが使えます)
 (必須, 匿名可, 非公開, Gravatar に対応しています)
 (必須)
スパム コメント防止のため「投稿確認」欄に ランダムな数字 CAPTCHAについて を入力してから送信してください。お手数ですがご協力のほど宜しくお願いいたします。