AIニュース速報|Google、Gemini Robotics On-Deviceを発表:インターネット不要でロボット操作が可能に

AIニュース速報|Google、Gemini Robotics On-Deviceを発表:インターネット不要でロボット操作が可能に

Calendar
2025年6月25日
Calendar
66

AI界からこんにちは!🚀

本日のニュースレターでは、以下の注目トピックをご紹介します。

 ・Google、Gemini Robotics On-Deviceを発表:インターネット不要でロボット操作が可能に

 ・Grok、新機能「スプレッドシート編集機能」がリーク:xAI、対話型生産性ツールを開発中

 ・Alexa+、生成AIを搭載しテストユーザー100万人を突破

GOOGLE 

Google、Gemini Robotics On-Deviceを発表:インターネット不要でロボット操作が可能に

Google DeepMindは、新たに「Gemini Robotics On-Device」を発表した。これは、インターネット接続なしでロボットの操作を可能にするAIモデルである。

本モデルは、2025年3月に公開されたGemini Roboticsに基づいており、自然言語コマンドによってロボットの動作を制御・調整できる。クラウド版に匹敵する性能を持ち、内部ベンチマークによれば、既存のオンデバイスAIモデルよりも優れた汎用性能を示したとされている。

デモでは、ロボットがバッグの開閉や衣類の折りたたみを行う様子が披露された。初期はALOHAシリーズのロボット向けに設計されていたが、現在ではFranka FR3(二腕型)やApptronikのヒューマノイド型ロボット「Apollo」など、複数の機種に対応している。

gemini AI

出所:Gemini

Googleは、Franka FR3が未経験の状況や未知の物体に対しても高い対応力を持ち、産業用組立ラインでの作業も実施可能であると述べている。

さらに、GoogleはGemini Robotics SDKも公開しており、開発者はMuJoCo物理シミュレーターを用いて、50~100件の操作例を提示することで、ロボットを効率的にトレーニングすることができる。

この分野では、Google以外にも複数の大手テック企業およびスタートアップが積極的に取り組んでいる。

 ・Nvidiaはヒューマノイドロボット用の基盤モデル開発プラットフォームを構築中。

 ・Hugging Faceはオープンソースのロボット向けAIモデルやデータセットの開発だけでなく、自社でロボットの研究開発も行っている。

タートアップRLWRLD(Mirae Assetが支援)も、ロボット専用の基盤モデル構築を目指している。

GROK

Grok、新機能「スプレッドシート編集機能」がリーク:xAI、対話型生産性ツールを開発中

Elon Musk氏が設立したAI企業「xAI」は、独自のAIアシスタント「Grok」において、スプレッドシートの編集を可能にする新しい機能を開発していることが、最近発見されたコードのリークによって判明した。この機能により、ユーザーはGrokと会話しながら、リアルタイムでファイルの内容を修正できるようになるとみられている。

この取り組みは、AIを日常の業務ツールに深く統合しようとするxAIの方針を反映しており、OpenAI、Google、Microsoftといった大手テック企業が展開する生産性支援機能に対抗する形で進められている。エンジニアのNima Owji氏がSNS上で公開した情報によれば、「チャットをしながらファイルを編集する」という体験が、ユーザーにとって直感的で効率的なものになることを目指しているという。

xAI

マルチモーダルかつインタラクティブなワークスペースへと進化

xAIは、Grokを中核としたマルチモーダルな作業環境の構築にも力を入れている。公式に戦略が発表されたわけではないが、2025年4月にリリースされた「Grok Studio」や「Workspaces」の導入などから、その方向性は明確に読み取れる。

Grok Studioでは、画面を分割してGrokとリアルタイムで共同作業が可能であり、文章作成、コード記述、レポート作成、さらにはブラウザゲームの開発など、多様な業務に対応している。また、Workspaces機能を使えば、ユーザーはチャットの履歴や各種ファイルを1つの空間内で一元的に管理できるため、作業効率が大幅に向上する。

これらの取り組みは、Googleの「Gemini Workspace」によく似ているが、大きな違いはその運用方針にある。Gemini WorkspaceがGoogleのエコシステム内に閉じているのに対し、xAIはより柔軟性と独立性を重視している。

xAIは、インタラクティブかつマルチモーダルなAIワークスペースの開発に関して、現時点で具体的な戦略を公式には発表していないものの、これまでの一連の発表内容からその方向性は明確に見て取れる。

2025年4月、xAIは「Grok Studio」を公開した。これは画面を分割してGrokと共同作業が可能な環境であり、ユーザーはドキュメントの作成、コードの記述、レポートの作成、さらにはブラウザゲームの開発までも行うことができる。また、同時に「Workspaces」機能も導入され、ユーザーはファイルとチャット履歴を同一空間内で整理・管理することが可能となった。

現在、OpenAIやMicrosoftも同様の機能を提供しているが、Googleの「Gemini Workspace」がxAIの取り組みに最も近いとされている。Gemini Workspaceは、Docs、Sheets、Gmailなどの編集機能と、Geminiとの対話的な操作が統合された環境を提供している。

しかしながら、Gemini WorkspaceはGoogleのエコシステム内でのみ動作するのに対し、xAIはより独立性が高く、他のツールやプラットフォームとの柔軟な統合を可能とするソリューションを目指しているようである。

なお、xAIの新しいファイルエディタがスプレッドシート以外のファイル形式に対応するか、またはGoogle WorkspaceやMicrosoft 365と競合するようなフルスイートのオフィス製品へと発展するかについては、現時点では明らかになっていない。

もし、Nima Owji氏が示唆した情報が正しければ、今回の機能追加は、Elon Musk氏が目指す「X」をSNS、チャット、決済、そしてドキュメント機能までも統合した“スーパーアプリ”へと進化させるうえで、極めて重要な一歩となるであろう。

ALEXA+

Alexa+、生成AIを搭載しテストユーザー100万人を突破

Amazonは、生成AIを統合した新しいバージョンの仮想アシスタント「Alexa+」のテスト利用を段階的に拡大しており、すでに100万人以上のユーザーが試験的に使用していると発表した。このサービスは、2025年2月に初めて発表され、現在も一般公開には至っていない。

現在、Alexa+の利用はウェイティングリストを通じて提供されており、事前登録したユーザーに対して順次招待が送られている。ここ数週間、多くのユーザーがSNS上で招待を受け取ったことを共有しており、パーソナライズされた体験やスマートホームとの統合能力、そしてAIによる新機能の充実が高く評価されている。

Early Access期間中は、Alexa+は完全に無料で利用可能であり、正式リリース後もAmazon Prime会員は無料で引き続き利用できる予定である。一方、Prime非会員は月額19.99ドルの利用料が必要となる。

Amazonは、導入を段階的に進めていると以前から述べており、2025年5月にはCEOのAndy Jassy氏が「当時は10万人程度のユーザーにしか届いていない」と語っていた。しかし、ここ数週間で利用者数は急増している。

ALEXA+ AI

出所:Amazon

生成AIによるAlexaの再定義

Alexa+は、Amazonにとって生成AIを中核とする新たなスマートアシスタントの実現を意味し、収益モデルの多様化を図る大きな試みでもある。

従来のAlexaは、スマートスピーカーEchoをはじめとするデバイスに広く搭載されていたものの、そうしたエコシステムから大きな利益を得ることには成功していなかった。ChatGPTなどの台頭により、従来型のAlexaは時代遅れで、柔軟性に欠けるとされる場面も目立つようになっていた。

Alexa+では、ユーザーはより自然な話し方で命令を出すことが可能になっている。たとえば、「ここ寒いな」と言えば、自動的に室温が調整されるなど、明示的なコマンドを必要としない対応が実現されている。また、事前に設定したルーチンの起動、Ringカメラからの映像取得、会話中にトピックを切り替えるといった操作もスムーズに行えるようになった。

ALEXA+ AI 2

出所:Amazon

個人に寄り添い、行動を学習するスマートな体験

Alexa+は、ユーザーの嗜好や利用パターンを学習し、それに応じたパーソナライズドな対応を提供する。たとえば、よく聴く音楽、お気に入りのレシピ、スマートホーム機器の使い方などを記憶し、日々の操作がスムーズに行えるようになる。

さらに、生成AIの活用により、以下のような機能を実現している:

 ・ユーザーが共有した長文メールの要点を自動で要約

 ・子ども向けの就寝前の物語をその場で作成

 ・学習用資料から試験問題を生成

 ・旅行のスケジュールを自動作成

 ・家のスマートデバイスの操作記録を統合管理

また、Alexa+は以下のような実用的なアクションにも対応している:

 ・OpenTableを通じたレストラン予約

 ・Ticketmasterでのチケット購入

 ・Uber EatsやGrubhubでの料理注文

 ・欲しい商品が値下がりした際の通知の受信

既に、OpenTable、Ticketmaster、Uber Eats、Tripadvisor、Yelp、Priceline、Viator、Thumbtack、Atom、Fodor’sなど、幅広いブランドと連携が進められている。

Alexa+は、現在アメリカ国内の一部Echo Showデバイス(8、10、15、21)に限って提供されているが、今後は他のEchoシリーズ、Fire TV、Fireタブレットなどへの対応も計画されている。

実際に招待を受けた試験ユーザーの中には、Alexa+を「Siriより優れている」と評価する声もあり、高い満足度を示す意見が増えている。一方で、一部ユーザーからは「まだ完全ではない」とする指摘もあるが、Amazonは現在、既に発表された機能の約90%を実装済みと明かしており、正式リリースは間近であるとみられている。

終わりに

本日の内容が、皆様のAI技術の活用や情報収集の一助となれば幸いです。

もし本メールの内容がご参考になりましたら、ぜひご関心のあるご同僚やご友人とも共有いただけますと幸いです。

皆様に有益な情報をお届けできるよう、今後も注目トピックを厳選して配信してまいります。

次回のニュースレターも、ぜひご期待ください。

今後ともどうぞよろしくお願いいたします。

関連記事

2024年のトップ クロス プラットフォーム フレーム ワーク:アプリ開発の優れた選択肢
この記事では、2023 年のプロジェクトで検討できるように、モバイル アプリ開発用のトップ クロス プラットフォーム フレーム ワーク のリストをまとめました。
2023年9月29日
クロスプレイゲームとは?クロスプレイゲーム開発エンジンの紹介!
しかしながら、ゲームプラットフォームの違いによって、プレイヤー同士が同じゲームを楽しむことが制約されることがあります。これが、クロスプレイゲームの概念が登場し、大きな注目を浴びる理由です。
2023年9月27日
クロスプラットフォームとは?3つのメリットや代表的なフレームワーク・種類を開発
プラットフォームとは何でしょうか? この記事では、クロスプラットフォームの概要、メリットとデメリットと種類を解説するとともに、代表的なツールを紹介します。
2023年9月26日
もっと見る