@DIME アットダイム|ジャンル|IT・モバイル|【キーパーソン・インタビュー】グーグルの検索エンジニアは毎日どんな仕事をしているのか?
dime.jp | Nov 30th -0001検索は、膨大なインターネットの宇宙の中から情報を探し出すのに不可欠な技術である。検索結果の上位に表示されなければサイトの存在はないに等しく、そのため「SEO」(※1)と呼ばれる、サイトを検索されやすくするビジネスが跋扈している。グーグルの検索は人の手を介さずアルゴリズムのみで行なうのが特徴で、その精度の高さで世界中で評価を得てきた。技術に関する情報は一切非公開で、一見すでに完成されているかのように見えるが、日々新しい技術を取り入れ、進化を続けているという。グーグルの根幹を担う技術の裏側では、いったいどのような作業が行なわれているのか? 検索技術の根幹にかかわるエンジニアリングの部門でディレクターを務めるスコット・ホフマンさんを直撃した。
※1:SEO(Search Engine Optimization)
特定のサイトを検索結果の上位に表示されるようコンテンツを修正したり、タグ情報などを埋め込んだりする手法のこと。広告やマーケティング手法として用いられる。
検索担当ディレクター:スコット・ホフマンさん

エンジニアリング・ディレクターとして検索の品質評価やモバイル検索を担当している。カーネギーメロン大学卒業後にミシガン大学でコンピューターサイエンスの博士号を取得。会計企業やシリコンバレーの検索企業で副社長を務めたのを含め、15年間検索技術にかかわってきた後に、2005年9月にグーグル入社。情報検索など多数の学術論文を発表しており、いくつかの共同特許発明を持つ。サンフランシスコ在住だが、仕事で海外を飛び回ることも多い。家族を大切にするやさしい45歳の父親でもある。
Q.検索はどう進化しているのでしょうか?
グーグルは1998年に創業し、「ペイジランク」と呼ばれる独自のサイト評価法で、ほかの検索エンジンに比べて圧倒的に適切な結果が得られることで支持されてきました。その後も検索技術は進化しています。大きな進化のひとつは2008年から始まった「ユニバーサルサーチ」。検索語句のコンテクスト(文脈)を理解し、ウェブページ以外に地図やビデオ、ブログ、本なども結果に一覧表示されるようになりました。
また、最近一番の大きなローンチ(※2)は、「検索の鮮度」の向上です。全世界の35%の検索結果が、より最近のより新鮮なコンテンツを表示するように改善されました。
例えば、「オバマ」と検索した時に、5分前に彼が行なった演説について知りたいのか、それともプロフィールが見たいのか。おそらく、今の時期ならば演説のほうが可能性が高いでしょう。今回の改善により、そうしたコンテクストを理解して、演説に関するニュースブログが結果の上位に表示されるようになりました。
さらに「場所」についても進化しています。「SUSHI」と検索すると、東京とニューヨークでは全く異なるレストランが結果に表示されます。同様に、「ラグビー」と検索すると、アメリカではラグビーが盛んではありませんから「ラグビー」という小売店が表示され、ニュージーランドではナショナルチームのリンクが表示されます。
※2:ローンチ(launch)
新しいサービスを開始したり、新規参入する場合に、ロケットの打ち上げなどを意味する「ローンチする」という言葉を使う。特にIT業界では好んで使われる。
Q.検索のエンジニアは何をしているのか?
検索を改善するためにグーグルでは、データを重視した科学的なアプローチをとっています。エンジニアが仮説を立て、実際にアルゴリズムに落とし込んで動かす「実験」をするのです(※3)。方法はふたつあり、ひとつは全世界の専門スタッフが、新旧2種類の検索結果を比較し、その結果を統計的に判断するというもの。
もうひとつは、「ライブ・エクスペリメント」と呼ばれるもので、新しいアルゴリズムに基づいた検索結果を、実際に全体の1%のユーザーに提供する方法です。2011年に行なわれた実験の数は5万8000にも上ります。
ユーザー行動の分析手法について詳細は申し上げられません。が、ひとつ言えるのは、ユーザーが検索結果からすぐ別のサイトにジャンプして、また戻ってくるのを何度も繰り返すという時は、いい結果ではないということです。
アルゴリズムの変更に関しては、常にトレードオフの問題があり、損失を利益で補えるかという視点が大事です。中国での実験で、実際にこんなことがありました。類義語を拾い出すアルゴリズムをよりアグレッシブに(類義語を多く拾い出すように)変更したところ、全体的には好評でした。しかし、下位の結果まで細かく見ていくと、「短い」と「背が高い」といった全く意味が異なる言葉が検索結果に登場することがわかったのです。それを受けて、修正をほどこしてからリリースしました。
※3:グーグルの実験主義
文中にある2011年中に行われた5万8000件の実験については、それらの結果に基づいて、最終的に520の新しい機能が実際のサービスに反映された。
Q.検索の未来はどうなるのでしょう?

ユーザーの中には、検索結果は静的だと思われている方もいらっしゃるかもしれませんが、むしろ動的なもので、毎日天気が変わるように時々刻々と変化していきます。ある検索結果について、同じ年の1月1日と12月31日の結果をそれぞれ保存し、違いを調べたことがあります。多少違うくらいかなと思っていたら、驚くほどの大きな違いが出たのです。
例をあげると、「IBM」というキーワードの場合は、1年で検索結果がそれほど変わりませんが、「ギリシア」という言葉の場合は、1年で検索結果が大きく変わります。これは、私たちが作っているアルゴリズムがよく働いているということでもありますが、インターネットのコンテンツが日々大きく変化していることの証でもあります。
そうした中で、これからの検索は、よりパーソナルなものに進化していくでしょう。1月10日に「Search, plus Your World」という新しい検索サービスを米国市場向けにリリースしました。これは、検索する人に、より関連する情報を表示する、画期的な技術です。
例えば、「クロエ」という言葉を検索すると、通常なら香水ブランドや映画のタイトルなどが表示されますが、「クロエ」は私の娘の名前でもあるので、私が検索すると、妻が撮影した娘のすてきな写真が私だけの結果として表示されます。
もうひとつの進化は、モバイル端末での検索です。現在は文字入力が主流ですが、音声検索の進化などで、おそらく未来はもっと便利になるでしょう
Q.プライバシーの問題は大丈夫でしょうか?
個人情報の取り扱い(※4)はセンシティブな問題ですが、グーグルではパーソナライズを含め、ユーザーがコントロールできることが大切だと考えています。ログインの有無を選べたり、パーソナライズ設定をオフにして一般的な検索結果を得ることもできます。また、サービスの中で個人情報が使われているかそうでないかがわかるようにしており、集めた情報がどう使われているかについても、きちんと公開しています。
グーグルは、ユーザーとコミュニケーションをとっていきたいと考えています。例えば先ほどの「Search, plus Your World」では、表示された結果の一部が「あなたのためだけ」であるということが明確にわかるよう、パーソナルな結果の横には人型のアイコンを表示して、わかりやすくしています。
最後にお伝えしたいのは、検索はまだまだ完成からほど遠く、解決しがいのある問題だということです。私自身は長らく検索技術にかかわってきましたが、今なお、この仕事の中で最高にエキサイティングな時間を過ごしています。検索は急速に進化しており、まだまだ手を入れるべきところは多く、日々たくさんの人に会い、意見交換をするなどして、新しいアイデアを探しています。近いうちに非常にドラマチックな変化が訪れるかもしれませんので、ぜひ楽しみにしていてください。
※4:個人情報の取り扱い問題
グーグルは、提供する様々なサービスに合わせて60以上あったプライバシーポリシーを統一し、わかりやすくすると発表しており、3月1日より適用をはじめるとしている。
【ホフマンさんの1日】
6:45 起床
自家用車で会社に向かう。
早朝 出社
毎日決まったスケジュールというのはない。直接プログラミングなどの作業をするのではなく、ユーザー動向の解析をし、エンジニアとのミーティングや、たくさんの人と会うことに時間を費やす。「日本をはじめ海外のチームとも仕事をしているので、ほかの人に比べると出社時間はかなり早いほうですね。帰る時間はまちまちで、早く帰れる時もあります」
18:00~20:00 退社
「家でも仕事をしますが、それほど長い時間ではありません。でも、仕事は好きなので、時間を忘れて没頭する時もあったりします」
深夜 就寝
◎インスタント検索

検索語句を入力している途中で、残りの語句を予想する機能。1文字修正すると、それに応じてインタラクティブに検索結果が変わる。日本では、昨年4月にこの機能が加わった。
◎ソーシャルとの連携で検索が進化する


Google+の情報をもとに、よりパーソナルな検索ができる「Search, plus Your World」。人型のアイコンを選ぶと、友人がアップしたクリップ工作など、より個人的な検索結果が得られる。
◎ユーザーのソーシャルグラフ(人間関係)を検索アルゴリズムに含める機能は、2009年10月より「Google Social Search」で公開されている。これは、検索結果画面で「ソーシャル」を選ぶとGmailなどの情報を元に知人友人の共有情報などが結果に表われる機能。さらに進化した「Search, plus Your World」では、サークルを元に、自分に対してだけ共有された情報も検索できる。
◎Google Dashboardを使うと、自分のどんな情報がグーグルに保管されているのかを見ることができる。Gmail、カレンダー、ドキュメント、ウェブ履歴、アラート、YouTubeなど、20以上のサービスについて、個人情報の設定を変更したり、自身のプライバシーを管理することが可能。いわばコックピット的なサイト。
■関連記事
Original Page: http://dime.jp/genre/12832/
Shared from Read It Later
Sent from my iPad