AI界からこんにちは!🚀
本日のニュースレターでは、以下の注目トピックをご紹介します。
・Google、検索結果を音声で要約する「Audio Overview」を試験導入
・OpenAI、米国防総省から先端AIプロジェクトを受託・最大2億ドルの大型契約
・Apple、Image Playgroundに大幅アップデート・ChatGPT統合でAI画像生成が進化
Google、検索結果を音声で要約する「Audio Overview」を試験導入
Googleは、検索結果の内容をAIによって音声形式で要約し提供する新機能「Audio Overview」のテスト運用を発表した。この機能により、ユーザーは読み込むことなく、検索結果の要点を耳で確認することができる。
この取り組みは、AIを活用したノート作成支援ツール「NotebookLM」での実績を基にしており、Googleの次世代AI「Gemini」モデルによって実現されている。ユーザーはより柔軟に、かつ時間や手間をかけずに情報にアクセスできるようになる。
Googleは公式発表において、「Audio Overviewは、両手がふさがっている時や読書が難しいシーンにおいて、手軽に情報を得る手段として有効である」とコメントしている。
出典: Google
限定公開中のLabs経由で利用可能、適合する検索に対応
本機能は「Google Labs」内での限定テストとして提供され、AIシステムが適合すると判断した検索クエリに対して、自動的に音声要約オプションが表示される。
選択すると、簡易的なオーディオプレイヤーが表示され、再生・停止、音量、スピードの調整などが可能となる。また、要約の元となった情報源へのリンクも併せて表示されており、追加での調査にも対応している。
さらに、ユーザーはそれぞれの音声要約に対し評価を行うことができ、Google Labs全体に関するフィードバックも送信できる設計となっている。
NotebookLMおよびAI Overviewsからの発展
Googleが検索機能に導入した「Audio Overview」は、AIが生成する要約表示「AI Overviews」の次なる進化として位置付けられている。
過去には、同社の研究支援ツール「NotebookLM」において、ユーザーが提出した教育資料や法的書類などをもとに、AIがホストを務めるポッドキャスト形式の音声要約機能が提供されていた。今回の検索への拡張は、視覚よりも聴覚によって情報を理解する傾向のあるユーザーや、情報へのアクセスに障壁を感じる人々に対する新たな対応策といえる。
この発表は、ウォール・ストリート・ジャーナル(Wall Street Journal)が、GoogleのAI機能—特にAI Overviews—がニュースメディアなどのウェブサイトへの訪問数に影響を与えていると報じた直後に行われた。そのため、「Audio Overview」はテクノロジーとしての可能性が高く評価される一方で、インターネットの情報エコシステムに対するAIの影響に対して慎重な見方も広がっている。
OPENAI
AI開発企業OpenAIは、アメリカ国防総省(DoD)より最大2億ドル規模の契約を締結し、AIを用いたプロトタイプの構築支援を行うと発表した。本プロジェクトでは、最先端のAIモデル(Frontier Model)を用いた行政支援やデータ統合、サイバー防衛対策などの分野での活用が想定されている。
OpenAIによれば、想定される活用例には、軍関係者の医療サービスへのアクセス支援、異なるプログラム間のデータ統合、そして積極的なサイバー防衛支援などが含まれるという。
同社は「全ての使用例は、OpenAIの方針と利用ガイドラインに準拠する必要がある」と強調している。
一方で、国防総省の公式声明では「国家安全保障に不可欠な課題に対応するためのAI能力を構築する」とされ、「戦闘」という語句も含まれているが、その意味の範囲については曖昧なままである。
出典:Google
ただし、国防総省が言及する「戦闘」という言葉が兵器開発を含むのか、あるいは戦争に関連する行政的・後方支援的な活動に限るのかは明示されていない。これまでOpenAIは、ChatGPTやAPIの軍事目的利用、特に兵器開発に対する禁止を明確にしていたが、2024年1月に「軍事・戦争」という文言を利用規約から削除している。
この背景には、中国の大規模言語モデル(LLM)開発の加速に対する西側諸国の危機感がある。著名ベンチャー投資家であるマーク・アンドリーセン氏は、OpenAIの出資者でもあり、「西側のAIと中国のAIはすでに冷戦状態にある」と警鐘を鳴らしている。
彼はCEOサム・アルトマン氏の弟、ジャック・アルトマン氏とのポッドキャストでも同様の見解を述べており、AIをめぐる地政学的競争が現実のものとなっていることを示している。
OpenAIとMicrosoft、政府向けAI事業で交錯・競争関係の兆しか
OpenAIと米国防総省との大型契約は、OpenAIと主要出資者Microsoftとの間にある微妙な競争構造を浮き彫りにした。
Microsoftはこれまで、米政府向けに数多くの契約を獲得しており、特に国防関連では高度なセキュリティ基準を満たす体制を築いていることで知られている。一方、OpenAIは「OpenAI for Government」という独自の政府向けプログラムを新設し、国家研究所、NASA、空軍、NIH、財務省といった複数の機関との提携を本格化させている。
Microsoftは2024年4月、ようやく国防総省からAzure OpenAIサービスの機密情報対応を認可されたが、その直後にOpenAIがDoDと直接契約を結んだことは、パートナーでありながらライバルでもある両社の緊張関係を象徴する動きとも言える。
この件について、両社とも公式なコメントは控えている状況である。
APPLE
Apple、Image Playgroundに大幅アップデート・ChatGPT統合でAI画像生成が進化
Appleが提供するAI画像生成ツール「Image Playground」は、個人向けの簡易的なクリエイティブ体験を目指して導入されたが、当初はその機能制限や出力精度において賛否が分かれていた。
ユーザーの中には、リクエスト通りの画像が生成されない事例を報告する声も多く、たとえば「手の画像」を依頼したところ6本指の手が出力されたといった指摘もある。また、「高齢男性」や「花」のような基本的な描写でも対応できない場面があり、AI生成ツールとしての完成度に疑問の声が寄せられていた。
その一方で、操作性の高さや軽快な出力スピードなど、ツールとしての楽しさを評価するユーザーも一定数存在していた。
出典:Apple
ChatGPTとの連携で表現の幅が拡大・WWDCで発表された新機能
AppleはWWDCにて、Image Playgroundの進化版を公開し、OpenAIのChatGPTを統合することで画像生成の表現力を強化することを明らかにした。
今回のアップデートでは、従来のアニメ風やアイコンスタイルだけでなく、油絵・水彩・ベクター・アニメ・印刷調といった多様なビジュアルスタイルが選択可能となり、クリエイティブの自由度が大幅に広がる。「Any Style」モードの導入により、より詳細な指示に基づく画像生成も可能となっている。
新たな生成スタイルは「ChatGPT style」として提供され、AI処理がOpenAIを通じて行われることが明示される。Appleはユーザーの入力がChatGPTに送信されるのは明示的な同意がある場合に限られ、プライバシーとデータの透明性が確保されている点も強調している。
Apple Intelligence戦略の一環としてのChatGPT統合
AppleがImage PlaygroundにChatGPTを導入した背景には、単なるユーザー利便性の向上にとどまらず、同機能を本格的な生成AIツールとして他の無料アプリと差別化する狙いがあると考えられる。
これはAppleにとってChatGPTとの初の連携ではない。すでにAppleはSiriや「Notes」「Mail」などの基本アプリにChatGPTを組み込んでおり、Writing Toolsとしての利用を推進してきた。Siriは回答不能な問い合わせに対してChatGPTを活用する機能も備え、より柔軟なアシスタンスを実現している。
そして、Image Playgroundのアップデート版は、今秋公開予定のiOS 26とともに提供される見込みである。Appleは今回の機能拡充を通じて、このツールを一時的な実験要素ではなく、日常的に役立つ本格的なAI画像生成ツールとして定着させたい構えである。