なんちゃってロングテール考

数日間でロングテールの見直し論が話題になっていた。http://enterprise.watch.impress.co.jp/cda/infostand/2006/08/21/8465.html はてなブックマーク具体的な数字がでてきたりして、とても面白かった。以前にロングテールの話題が盛り上がった時は見逃してしまったので、この辺りで復習することにした。
群集の知"集合知"というのは非常に面白くて、個体のアリは知恵も持っているようには見えないのに集団としてクールな行動をとることなどが知られている。前に興味を持ったのはH-yamagataさんの紹介にあった決まった命題に対する判断だった。http://www.h-yamaguchi.net/2004/06/the_wisdom_of_c.htmlこの場合は一元的な判断に収束できる特定の課題に対して個々に判断し統計をとる。これは発現力の強い人に左右されないようにするためだ。
この場合は個々の判断が独立しているので、強い肯定から否定までの間に正規分布だろう。しかし実社会の判断では、相談や情報の伝達によってネットワーク化された判断になっている。

ロングテールの議論というのはネットワーク化された判断の中で、価値のある情報の探索に焦点を当てた議論だ。情報の伝達はランダムに広がっていかない。途中ハブとなる1人から多数に広がり、多くの場合はそこで情報伝達が止まるが、その中にハブ的な人がいれば多数に広がる独特な広まり方をする。(どうしてなのかは今回は勉強しなかった、多くの自然現象でも同じ様子がみられ"small world"とか言葉だけは知っている。)
これを、良く伝わった順に並べ替えて縦軸に伝わった人数をとるとべき乗分布になるそうだ。累乗になっているだろうなというのはなんとなく解る。http://tokyo.atso-net.jp/index.php?UID=1126089430


webの利用でコストが低下すれば、このあまりメジャーでないテール部分をなんとか(商売でも情報収集でも)使えないか?それとも思ったほど使えないというのが議論になっている。
商売をやっている人には、たくさん売れることが事が重要だからロングテールが全体のどれだけの比率かが重要になってくる。
対数グラフにすると販売順位下がるにつれて販売数が直線的に低下する。だから販売品目の変化させても比率は変わらない。(ちょっと勘違いしてしまう人もいるみたい。http://blogs.itmedia.co.jp/speedfeed/2006/01/longtail_92c3.html パレート法則&ロングテール:これ自体がBlog界隈で議論になっていて、ためになった)。
実用上の問題は傾きが緩やかなのか急なのかで変わってくる。以前Amazonの例で言われていたのはテール側8割の商品から5割の売り上げを得られるという、実世界の2割の商品から8割より緩やかなテール太い分布だった。
これは人の需要は多様なのに、現実では商品とのマッチィングが十分でないために痩せたテールになっているためだと考えられた。だから並べる商品を増やすことで今まで以上の需要を喚起できるという話に繋がった。
http://www.future-planning.net/x/modules/news/article.php?storyid=840
http://www.itmedia.co.jp/news/articles/0606/12/news059.html


ところが、最近の結果ではテールからの売り上げが半分程度に減ったようだ(並べられるようなデータないのでなんとも)。はてなお気に入りに関しては数値データが紹介されていて実社会の2割8割に近い。これを、どのように解釈するか判断が分かれるところかも。
http://hidekih.cocolog-nifty.com/hpo/2005/08/our_motality_e42c.html
http://www.future-planning.net/x/modules/news/article.php?storyid=886
http://beyond.cocolog-nifty.com/akutoku/2006/08/gigazine_3dcd.html
1.テールの太さって一人の人間が平均からどれだけ外れているかで決まる、人間って思ったより平均的に近かった。
2.品数やはてなのエントリーが増えすぎてしまって、実世界と同じようにマッチング問題が起きている (でも、これってマッチング技術が上がっても、人は情報数の増加に向かって利用してしまうってことだよね。結局、同じ形のテールになるんだよなぁ)。

この法則性って経験則なので人の行動に影響される。特に文化的な側面は大きい気がするので、時代や国を変えたデータが出てくると面白い。はてなのデータは一般的(?)なGIGAZINEのデータだったからとか。商売としては、コストがかからないのなら駄目もとでやってみるのも良いとなるのじゃなかな。


もう1つ面白かったのはテールが途切れるという現象だ。ページビューをサンプルに用いた例だけど、上記のはてなお気に入りと類似のサンプルと見なしてよいだろう。このデータではアクセス数がテールの部分が途中でなくなってしまう。現在のWebでも情報伝達を制限するものが存在しているらしい。
http://gitanez.seesaa.net/article/22670648.html
個々の情報探索の範囲の限定されることは、全体としてテールが途切れることにならないので、ネットワークが切断される別の要因があるとはず。なんだろうな?私が考えたことは、1つのネットワークとして繋がることができる筈のものが、断片化したネットワークとして存在してしまって全体に情報が広まっていないという事だろうか。


ロングテールの観測とは別に漠然とした期待として、テールにあったもの宝がヘッドに押し上げられるのでないかという期待があちこちのBlogで感じられた。これは現在の全体像をみる観測では発見できないし、議論もできない。
データがないのでグタグタになっている議論を承知で書くと、やはり一般的に需要のある情報がヘッドにきて、一部の人にとっての宝は埋もれたままということになる。マイナーの部分から現れた一般的に需要のある情報がヘッドまで来るかは伝達の流動性の問題になるだろう。
べき乗分布を情報として利用しながら一部の人にとっての宝を見つけるには重み付けする必要がある。ネットワークの構造から考えると自分の興味のある(たぶん断片化している)ネットワークを見つけだす技術となるだろうか?Blogを公開して相手から寄ってきてもらうのも1つの手だし、検索+ネットワークの可視化を行い自分のつながっていないネットワークを探すのも手かもしれない。
欲しいのは自分の思っていなかった(近辺になかった)情報でしょ?

いま、あるのは情報ネットワークの構築ツールということになるだろうか?人気も高い。使って面白かったのは「はてブ」の方かな。
好みの近いブックマーカーを探す http://k52.if.tv/tool/tikab/
はてブおせっかい http://ryogrid.myhome.cx/osekkai/

あと、昔「グーグル」と「はてブ・ランキング」を組み合わせるツールを見かけた。それを推し進めて関連項目(キーワード)を提案するような連想型検索があってもいいんじゃないかなー。


9/2追記
ロングテールをもっとわかりやすく説明したページ+資料つきが公開された。さらに"テールが切れる"現象が人気ページアクセスでおこり、アクセスされた検索語では起こらないなどを示してくれてある。その原因をリソース(アクセス可能な母集団)の小ささが原因としているけど、メカニズムは詳しくはわからない。これ以上は論文をあたらないと無理かも。
http://markezine.jp/a/article.aspx?aid=111

 もう1つロングテール商売批判。この人は一貫してロングテールの商売上のメリットを批判しているわけたけど、それが正しいかはともかく(というか、説明のグラフなどは明らかに間違ってしるが)批判部分がとても鋭い。ロングテールが騒がれ始めた時のロングテールの話と、最近の調査結果および解説の間には変化が生じている。私も上記の文では初期のロングテールの話に合わせてテール部分が既存の商売で考えたよりもテールからの利益が大きいことを前提にしている。しかし、最近のロングテールの話はテールから利益が少ないことを認めて、それでも投資コストの低下によってテール部分からも利益が得られるとしている。この修正が説明されずにいるから議論が混乱してしまうのだろう。ネットの資料を検索する場合には現在も過去もないわけだし。
http://beyond.cocolog-nifty.com/akutoku/2006/09/post_a730.html
 この人の批判はテールからわずかな利益が得られたとしても、利益の全体からいえば僅かだし利益/投資の比が下がってしまってメリットがない。さらに現実の店と比べてamazon型の商売では輸送コストがかかり、決して低コストではないと看破している。そちらの批判も正しい。

 それに対する反論としては2点が考えられる。

 1.売れ筋の商品はどの店でも取り扱っているから競争が激しく利益率が低い。
 2.販売側が売れ筋を完全に読みきれることはない。

1.については、逆にいえばテール商品は販売量が少なくても利益率が高くなる。べき乗分布に利益を掛けるともう少しテールに価値が出てくるんじゃないかな。ヘッドについては、コストを下げるために大量の商品を扱える方が有利。潜在的にはWeb上の販売の利点となるとおもうけど現時点では大型店の方が有利かな。ウォルマートとamazonがTower Recordをつぶしてしまうというのは、あながち嘘じゃなさそう。
2.については、議論では小数の商品を販売するときにヘッドを必ず抑えられる事を前提に話している。しかし、商品が飽和ぎみでニーズが分散している現在それを読みきれないからメーカーも販売店も困っているわけで、実際にはヘッドとテールの真ん中あたりを商品を並べてしまうことが多い。商品数の増やすとテール側が伸びるだけでなくヘッド側も伸びる事が期待できる。