このコーナーでは、企業でWebサイトの運営に携わっている方、マーケティング部門等でWebの活用法について考えておられる方向けに、Webマーケティングの実践のための手法やノウハウ、事例をご紹介していきます。市場に出回る書籍や雑誌では論じられることない、Webマーケティングの最前線に触れていただければと思います。
2006年08月25日
ロングテールをWebサイトのアクセスログから検証する
マーケティングユニット 棚橋
先日、弊社のWebサイトのアクセスログを調べていたら、検索エンジン経由の流入キーワード数の上位20%が全体の約80%を占めているとわかりました。いわゆる80:20の法則が見られたわけです。さらに今度は上位20%だけを対象にして、そのうちの上位20%(全体の4%)が全体の20%の何%を占めているかを調べてみると、ここでも同じように上位20%(全体の4%)が全体の20%のうちの80%を占めるという入れ子状の傾向も見られました。
グラフにするとこうなります。
どちらも注目を集めるロングテールのグラフのように見えます。しかし、ロングテールという言葉は若干、誤解されているところがあって、実はインターネットを使えば必ずロングテールになるというわけではありません。上の例のように80:20の分布が見られることもあります。
今回は、いまひとつ誤解されている感のあるロングテールを、パレートの法則、ベキ分布といった観点から見直してみようと思います。
■ロングテールとパレートの法則は矛盾しない
1897年に、イタリアの社会・経済学者ビルフレッド・パレートが発見したパレートの法則は、彼が1880~90年代のヨーロッパ経済を統計的に分析した上で、個人の所得金額(x)とその所得金額以上の所得を得ている人の数との間に、定数aとパラメータαに媒介される、
という関係が成立することを示したものです。
いまではパレートの法則を80:20の法則と呼んだりしますが、実はパレート自身は一度も80:20の法則という言葉を使ってはいないと言われています。実際、上記の式のパラメータαを変化させれば80:20という比率はいくらでも変わることがわかると思います。
つまり、重要なのは80:20という比率ではないということです。
パレートが示したのは、そこに大きな偏りのみられるベキ分布の傾向が存在するということでした。
では、ベキ分布とはどういうものでしょう? まずはこのグラフをご覧ください。
左側のグラフは、パレートの法則の式に類似するベキ分布を示す式を元に作成した数値をグラフ化したものです。左側ではほぼ平らだと思える形で推移した後、右側で急激に数字が伸びているのがわかると思います。
右側のグラフは同じ数値を両対数グラフ(x,y軸ともに数値を対数化したグラフ)で表現しなおしたものです。ベキ分布は両対数グラフにするとこのような直線を描くようになります。ロングテールの場合、この直線の傾きがゆるくなるわけです。
このように見ていくと、ロングテールはパレートの法則と矛盾するものではないことがわかります。むしろ、80:20の法則と間違えて比率を固定されてしまっていたパレートの法則を、再び、その核心部分にあるベキ分布に焦点を当てたものとして理解したほうがその応用範囲は広がるのではないかと思います。
■検索キーワードにみるベキ分布
ベキ分布は、私たちが生活する物理世界においても自然に見られる分布だと言われます。
例えば、ガラスが割れたときの破片は、ごく少数の大きな破片にはじまり、それよりも多い数の中くらいの破片、数え切れない小さな破片、そして、目に見えない大きさの微小な破片が無数に、といった具合に破片の大きさとその数がちょうどベキ分布になるそうです。また、発生する地震のエネルギーも同じくベキ分布になることが昔から知られていたそうです。
こうしたベキ分布は実はWebサイトのアクセスログデータの解析結果から簡単に見つけることができます。
下のグラフは、ある2社のWebサイトの検索エンジン経由の流入キーワード別アクセス数を、両対数グラフで表したものです。縦軸がキーワードごとのアクセス数(の対数)、横軸はキーワード数(の対数)になります。
A社、B社ともに中間部分は直線になっていて、ベキ分布を示しているのがわかります。一方で、両社を比較すると、A社は傾きがゆるやかで、左上の部分がベキ分布を外れた分布(直線ではない)をしており、B社のほうは傾きは急ですが、その代わりに左上までベキ分布となっているのがわかると思います。
また、A社のほうはグラフの左上が下向きに曲線を描くように傾いていますが、これはSEO的な視点でみるとヘッド部分のキーワードが弱いということになります。反対に傾きが急なB社はテールを伸ばせていないとみることができます。
■ページビューはベキ分布にならない
一方でページ単位でのページビューの分布は以下のようなグラフになります。縦軸にページビュー、横軸にページ数をおいた両対数グラフです。
ご覧になってすぐにお気づきかと思いますが、赤、青いずれのグラフも先ほどのようなきれいな直線にはなっていません。両方とも中間部においては直線的な傾向も見られますが、ページビューの多い左上、ページビューの少ない左下は下向きの曲線を描いて落ち込んでいます。
他にもいくつかのWebサイトのページ単位でのページビュー数についても調べてみましたが、やはり上の例と同様に、右下の部分が曲線を描きながら下降する傾向が見られました。これは1万ページを超えるような企業サイトでも、ページ数が100を超える程度のBlogでも同様でした。
■アクセスログ解析からわかるベキ分布の傾向
他にもいくつかの企業サイトを対象に、どのサイトから訪れたかを示す参照元、ユーザーごとの訪問回数、ページ単位での閲覧時間などを調べてみましたが、アクセスログデータにはベキ分布を示すものとそうでないものの2つのタイプがあることがわかりました。
まず、ベキ分布を示すのは、先の検索キーワードをはじめ、参照元、ユーザーごとの訪問回数でした。逆にベキ分布を示さないのは、先のページビューと、同じくページ単位で見た場合の閲覧時間です。
このことから推定されるのは、ベキ分布が成り立つには選択可能なリソースにある程度の規模が必要とされるということです。
検索キーワードの組み合わせ、参照元となりうるインターネット上のWebサイト、訪問者となりうるインターネットユーザーの数などはそれぞれ無限とはいわないまでも膨大な数が想定できます。しかし、一方のページビューなどはあくまで対象となるサイトの有限なページ数に影響されます。先のページビューのグラフでテールのほうが不意に切れてしまっているように落ち込んでしまっているのは、そこに物理的限界があるからなのでしょう。ロングテールの提唱者Chris Andersonが膨大な商品数をもつAmazonで最初にロングテールを発見したのは偶然ではないということです。
インターネットであれば、必ずしもロングテールになるわけではないというのはこうした理由によるものです。
■口コミという視点から見るロングテール
とはいえ、Amazonは単に商品在庫を増やしただけではロングテールを実現したのではないでしょう。
ベキ分布に必要な規模の大きなリソースは、単に商品数などの物理的な規模のみでなく、選択可能な情報の量も同じく影響するからです。Amazonの戦略としては、アフィリエイトという仕組みをうまく活用することで、ユーザーがブログなどを通じて発信する書評、レビューなどの情報も、商品の購買へとつながるものとして活用できる流れをつくったことのほうが、むしろ、要因としては大きかったのではないでしょうか。つまり、サイトの内部だけでは尻尾が途切れてしまうページビューを、サイト外部の個人Blogなどによって長く伸ばすことを可能にしたのではないかと考えられるのです。
これを口コミという視点からみると、従来のマーケティングの視点を転回することができます。つまり、マスメディアと一般の人のあいだで広がる口コミの関係を同じようなベキ乗に広がる裾野をもつベキ分布として捉えることが可能ではないかと思うのです。当然、全体に対して大きな割合を占める少数者にはマスメディアが、そこから果てしなく伸びるテールがユーザー間の口コミです。
このように捉えた場合、ロングテールは決して新しいものではないことがわかります。ベキ分布そのものは昔から存在していたのですから、かつては長いテールの部分にあたる口コミを俯瞰的に統合して捉える視点が存在しなかったために、そのことに気づかなかったということではないでしょうか? こうした点からもやはりロングテールはインターネット固有のものではないことがわかります。
しかし、現在のマスメディアの力は以前に比べると、口コミを誘発するような力が弱まっているといえるでしょう。
その場合、ベキ分布のヘッドはどこに移り、何を基点としてユーザー間で口コミは広がっていくようになっているのでしょうか?
その答えは「ベキ分布にしたがう現象にはフラクタル性がある」というベキ分布の性質に見出されるのではないかと思いますが、これに関してはまた次回に。