recruit logo

Corporate Blog

  • サービス

自然文での検索を実現するシステム『OpineDB』

要望が曖昧なユーザーにも新しい出会いを提供したい

情報検索の主戦場が大きな転換期を迎えようとしている昨今、リクルートグループのAI研究機関であるMegagon Labs外部サイトへでは、自然文での検索を実現するシステム『OpineDB』外部サイトへの研究開発に取り組みました。開発の背景、リクルートグループのサービスでの活用可能性、その先に目指す未来について、研究チームを率いたWang-Chiew Tanに聞きました。

post 140 img02

米国シリコンバレーの中心に位置するマウンテンビューオフィス

キーワード検索から、文章検索できる世界へ

ここ数年で、日常的に使う言葉や文章の解析を行う自然言語処理の分野は急速な発展を遂げています。言語モデルの飛躍的進化により、論理性を理解する、質問に自動返答する、といったタスクの精度が大幅に向上。また、2019年にGoogleはキーワード検索から自然文検索への移行を発表※1しました。情報検索の主戦場が大きな転換期を迎えようとしているのです。そのような変化に先駆けて、クチコミのような主観的・体験的な表現が多く含まれる自然文での検索を実現するシステム『OpineDB』の研究開発に取り組んだのが、Wang-Chiew Tanが率いるMegagon LabsのUS研究チーム。この研究論文は世界最高峰の学会VLDB2019※2でベストペーパー賞を受賞、VLDB journal特別号にも掲載される予定です。

※1 出典:Pandu Nayak, Google Fellow and Vice President, Search "Understanding searches better than ever before" google blog, 2019年10月25日

※2 VLDB(Very Large Data Bases)は、データマネジメントに関する国際トップ学会。VLDB Woman in Database Research Awardは、データベースリサーチコミュニティにおいて特に顕著な成果をあげた女性研究者に贈られる表彰で、これまで5名が選出されており、Wang-Chiew Tanは4人目の受賞者。

『OpineDB』がもたらす、ユーザーの検索体験の進化

「例えば、仕事を探す場合、サイトの検索ボックスに職種や勤務地・年収・雇用形態などのスペック条件を入力することが主流です。そのため、『協力的な同僚がいて、良い社風で、ワークライフバランスがとれ、福利厚生も充実している会社』というような、スペック条件以外の曖昧、かつ多様な要望に関しては、ユーザーのあらゆるクチコミを読みながら探さなければいけません。しかし、OpineDBを利用すれば、あるフレーズ(ex.働きやすい)に関する表現のバリエーションを全て見つけ、意味ある形にまとめて表示することができます。要望が曖昧なユーザーも、これまで探せなかった情報にめぐり会えるようになるのです」とWang-Chiew Tan。「技術の力で、多くの人にそれぞれ必要とする情報を提供し最良の決定ができるよう支援するのが、Megagon Labsのミッションなのです。」

post 140 img01

Eser Kandogan(Megagon Labs inc. Head of Engineering)とともに、グループ内でも研究成果をプレゼンテーション

リクルートグループの既存サービスでの活用にむけて

既に『じゃらんnet』では、機能開発の一部でOpineDBを活用した取り組みの検証がスタートしているほか、日本語の自然言語処理研究の発展に貢献するため、クチコミに基づく約12万件のデータを含む学術研究用データセットを公開しています。また、USや日本のリクルートグループ会社とも多くの研究技術の活用に向け検討を行っています。Wang-Chiew Tanは語ります。「リクルートグループには、クチコミ、仕事内容、Q&A投稿など非構造データが多く存在します。OpineDB はこれら全てのデータから情報を分析し、他に類のないインサイトを数多く提供できるでしょう。そのインサイトに基づく検索体験には、多くのビジネスチャンスがあるはずです。OpineDBは私たちが行っている研究のひとつであり、常に新たなテクノロジーの開拓に向け他にも研究を行っています。先進技術が最大限に活かされ、リクルートグループのサービス開発や情報マッチングの革新に貢献できるのなら、これほど嬉しいことはありません。Megagon Labsのテクノロジーがリクルートのサービスに活用され、リクルートと世の中の未来に大きなインパクトを与えられるよう、今後も研究を続けていきます。」

post 140 img03

東京オフィスのメンバーとオンラインミーティングをするWang-Chiew Tan

Wang-Chiew Tan

ワンチュー・タン Megagon Labs inc. Head of Research(研究責任者)

カリフォルニア大学サンタクルーズ校でコンピュータサイエンスの教授を14年間務めた後、2010年から2年間は、シリコンバレーのIBMアルマデン研究センターの研究職員としても勤務。15年に国際トップのコンピュータサイエンス学会団体であるACM※3から、ACMフェローの称号を授与。16年Megagon Labsに参画。19年に、VLDBで、Woman in Database Research Awardを受賞

※3 ACM(Association for Computing Machinery)は、情報技術関連で最も権威のある学会のひとつ。ACMフェローは、情報技術の分野において、技術的・専門的およびリーダーシップの貢献によって、特に卓越した成果を示したメンバーに授与される称号。

2020年12月14日

※事業内容や所属などは記事発行時のものです。