AIニュース速報|AI検索の新星「Perplexity」、月間検索件数が7.8億回に到達—次の目標は週10億回

AIニュース速報|AI検索の新星「Perplexity」、月間検索件数が7.8億回に到達—次の目標は週10億回

Calendar
2025年6月9日
Calendar
590

AI界からこんにちは!🚀

本日のニュースレターでは、以下の注目トピックをご紹介します。

  • AI検索の新星「Perplexity」、月間検索件数が7.8億回に到達—次の目標は週10億回
  • EleutherAI、大規模な8TB AI学習データセットをリリース:著作権素材と公共コンテンツを統合
  • Meta、AI分野で過去最大級の民間出資か——Scale AIとの巨額交渉が進行中

PERPLEXITY

AI検索の新星「Perplexity」、月間検索件数が7.8億回に到達—次の目標は週10億回

急成長を遂げているAI検索サービス「Perplexity」は、2025年5月における月間検索数が7億8,000万回に達したと発表した。この情報は、同年5月30日に開催されたBloomberg Tech Summitにおいて、CEOのアラビンド・スリニバス氏により共有されたものである。さらに、同サービスの月間成長率は20%以上という驚異的な水準を記録している。

Srinivas氏は、現在の成長スピードを維持できれば、向こう1年以内に週あたり10億件の検索が見込まれると述べた。また、2022年初頭には、1日の検索数がわずか3,000件だったことを引き合いに出し、現在の3,000万件という数字がいかに飛躍的な成長であるかを強調した。

この背景には、Perplexityが取り組む次世代ブラウザ「Comet」の存在がある。同社は、従来のブラウザの概念を刷新し、ユーザーとの接点をより深めることを狙っている。

Cometでは、検索フィールドやタブ画面、サイドバーをはじめとしたあらゆるUIで検索が可能となり、ユーザーごとに多様な検索体験を創出できるという。

Srinivas氏は、「自社製ブラウザ内でユーザーが操作を続ける限り、利用時間の延長はほぼ無限に見込める」と語った。検索フィールド、新規タブ、サイドメニュー、あるいはあらゆる閲覧ページにおいて、ユーザーごとにさらなる検索アクションが誘発される仕組みを備えている点を強調した。これにより、従来のChromeのようなブラウザに飽き始めた層への新たな接点が生まれ、来年度に向けた成長の加速要因になると考えられている。

Perplexity AI 1

出典:Perplexity

また同氏は、Cometの開発背景には単なる検索ツールの枠を超えた「能動的なAI」の実現というビジョンがあると述べた。通常のAIによる応答は複数回の検索処理の集約で成り立っているが、もしAIが自ら判断し、直接操作を行えるようになれば、1つの命令だけで一連のウェブ閲覧が完結すると説明した。

これを可能にするためには、従来型のブラウザを基にするのではなく、根本から設計を見直した新たなブラウジング環境が必要になるとし、「処理の連携はサーバーと端末の両方で行われる構造でなければならない」と語った。従来の「ブラウザ」という発想自体に対する再定義が求められているという。

Cometは従来のブラウザというカテゴリを超えた存在であり、Perplexityではこれを「認識型オペレーティングシステム」と位置づけているという。

「Cometは常時ユーザーのそばに存在し、日常生活や業務においてユーザーを支援するシステムである。必要であれば、自律的にウェブ操作を代行する役割も担う」と同氏は説明した。

さらに彼は、「人々とインターネットの関係性が大きく変わりつつある。これまで我々はインターネットを『使って』いたが、今やインターネットの『中で暮らす』ようになってきた。デジタル空間は拡張され、我々の生活に溶け込んでいる。真に個別化されたAIを実現するには、すべての文脈で利用者と一緒にいる存在が求められる。それこそが、ブラウザを再構築する必要性の根本的理由である」と語った。

なお、Cometの詳細な仕様については依然としてベールに包まれているが、Srinivas氏は過去の発言で、Cometがアプリ外での行動追跡を可能にし、高精度な広告配信に活用できるよう設計されていると明かしていた。これは、Googleが過去に行った拡張的な広告ネットワーク戦略と似通っている。

Cometのリリース日については未発表であるが、同氏はSNS「X」で「近日中に公開される予定である」と投稿している。

ELEUTHER

EleutherAI、大規模な8TB AI学習データセットをリリース:著作権素材と公共コンテンツを統合

【2024年6月2日・Reuters】米Meta Platforms(NASDAQ: META)は、2025年末までに、自社のAIシステムを通じて、企業ブランドが広告の制作と配信対象の選定を自由に行えるようにする取り組みを進めていると、米ウォール・ストリート・ジャーナルが報じた。報道は事情に詳しい関係者の話としている。

Metaは現在、世界で34億人以上の月間ユーザーを抱えるSNSアプリを運営しており、そのAI技術はすでに、広告表現の自動最適化、背景の画像生成、動画フォーマットの調整といった広告支援機能を提供している。これにより、広告主は高いパフォーマンスを持つキャンペーンを効率的に展開可能となっている。

記事によると、ブランド側は商品画像と予算のみを用意すれば、MetaのAIが自動的に広告素材(画像、動画、テキスト)を作成し、最適なターゲット設定と出稿予算の提案を含めてInstagramやFacebook上で展開できる仕組みである。

AIの学習に用いられるデータ収集の方法自体は、著作権訴訟によって変化していない。しかし、その一方で企業や研究者が情報を公開する姿勢には明確な萎縮が見られる。EleutherAIのステラ・Biderman氏は、5月31日にHugging Faceで公開した記事において、そのような影響を指摘している。

「データに関する研究を行っている研究者の中には、訴訟のリスクを理由に成果を発表できないとする声も少なくない」と彼女は述べている。

AI 2

出典:GettyImages

現在、EleutherAIが開発した「Common Pile v0.1」は、Hugging FaceおよびGitHubを通じて公開されており、合法的なデータ使用を徹底するために法律の専門家の助言のもとで構築された。このデータセットには、アメリカ議会図書館やInternet Archiveによってデジタル化された30万冊以上のパブリックドメイン書籍が含まれている。

また、OpenAIの音声認識モデル「Whisper」を用いて、音声データをテキストに変換し、追加データとして活用している点も特徴である。

EleutherAIによれば、Common Pile v0.1のごく一部だけで訓練された2つのモデル「Comma v0.1-1T」「Comma v0.1-2T」は、いずれも70億パラメータを有し、Meta社の初代LLaMAモデルと同程度の性能を、プログラミング・画像認識・数学の各分野において達成したとされる。

AI研究団体EleutherAIは、合法性に配慮した新たなデータセット「Common Pile v0.1」をHugging FaceおよびGitHubにて公開した。このデータセットは、法的助言を受けながら構築されており、米国議会図書館やInternet Archiveが収集・公開している30万冊以上のパブリックドメイン書籍を主な情報源としている。加えて、OpenAIの音声認識モデル「Whisper」を用いることで、音声コンテンツからテキストデータを生成する手法も採用されている。

このデータをもとに開発された2つのモデル「Comma v0.1-1T」「Comma v0.1-2T」(それぞれ70億パラメータ)は、「Common Pile v0.1」の一部データのみで学習されたにもかかわらず、Metaの初期LLaMAモデルと同等のパフォーマンスを、各種AI評価テストで記録した。

EleutherAIのBiderman氏は、従来の「高性能なAIは未許可データなしには成立しない」という見解を否定し、パブリックドメインやオープンライセンスデータの可能性を強調している。

今回の「Common Pile v0.1」の公開は、かつてEleutherAIがリリースした著作権を含むデータセット「The Pile」に関する議論を踏まえた“償いの一手”とも位置づけられている。

今後、EleutherAIは研究機関やインフラ提供者との連携を深め、より頻繁に合法的なオープンデータセットを提供していく方針を表明している。

※太平洋時間9時48分の時点での更新:Biderman氏はX(旧Twitter)にて、今回のデータセットおよびモデルの開発にはEleutherAIのほか、トロント大学など複数の機関が共同で関与していることを明らかにした。

META

Meta、AI分野で過去最大級の民間出資か——Scale AIとの巨額交渉が進行中

Bloombergの報道によれば、MetaはAIスタートアップのScale AIに対して、100億ドルを超える可能性のある巨額投資の交渉を行っている。これは、同社にとって最大規模のAI関連出資であり、テック業界の中でも屈指の大型民間調達案件として注目されている。

Meta AI 3

出典:GettyImages

Scale AIは、アレクサンダー・ワンCEOのもとで成長を遂げ、MicrosoftやOpenAIなどにデータラベリングサービスを提供している。AIモデルの訓練に不可欠なこの工程は、多くの場合、外部契約スタッフによって実施されている。過去には、米労働省が同社に対して労働契約の適正性に関する調査を行ったが、結果として法的措置には至らなかった。

2023年には、売上が8.7億ドルに到達し、2024年には20億ドルへの成長が見込まれている。Metaは既に同社のシリーズF資金調達に参加しており、その際にScale AIは138億ドルの企業評価額を得た。

さらに、Scale AIはMetaの「Llama 3」をベースにした軍事用LLM「Defense Llama」の開発にも関与しており、両社の技術的結びつきはより深まっている。

終わりに

本日の内容が、皆様のAI技術の活用や情報収集の一助となれば幸いです。

もし本メールの内容がご参考になりましたら、ぜひご関心のあるご同僚やご友人とも共有いただけますと幸いです。

皆様に有益な情報をお届けできるよう、今後も注目トピックを厳選して配信してまいります。

次回のニュースレターも、ぜひご期待ください。

今後ともどうぞよろしくお願いいたします。

関連記事

2024年のトップ クロス プラットフォーム フレーム ワーク:アプリ開発の優れた選択肢
この記事では、2023 年のプロジェクトで検討できるように、モバイル アプリ開発用のトップ クロス プラットフォーム フレーム ワーク のリストをまとめました。
2023年9月29日
クロスプレイゲームとは?クロスプレイゲーム開発エンジンの紹介!
しかしながら、ゲームプラットフォームの違いによって、プレイヤー同士が同じゲームを楽しむことが制約されることがあります。これが、クロスプレイゲームの概念が登場し、大きな注目を浴びる理由です。
2023年9月27日
クロスプラットフォームとは?3つのメリットや代表的なフレームワーク・種類を開発
プラットフォームとは何でしょうか? この記事では、クロスプラットフォームの概要、メリットとデメリットと種類を解説するとともに、代表的なツールを紹介します。
2023年9月26日
もっと見る