Android に Gemini Nano で AI が搭載される: 知っておくべきことすべて

Android に Gemini Nano で AI が搭載される: 知っておくべきことすべて

Siri、Cortana、Google Assistant など、AI アシスタントは以前からスマートフォンに搭載されています。そして、あらゆる分野で人工知能技術が急速に進歩しているため、これらのアシスタントは時間とともにさらに進化していくことは間違いありません。

その最初の例は、Android スマートフォンのデフォルトの AI アシスタントとして Google アシスタントに取って代わった Google の Gemini です。以前の Gemini は Google アシスタントに比べてできることがかなり限られていましたが、Google は最近、このチャットボットを非常に強力で便利なものにする大幅なアップデートを発表しました。

これは、1 月に Pixel 8 スマートフォンと Samsung Galaxy S24 で発表された Gemini Nano に特に当てはまります。Google がこのモデルをどのようにアップデートして、さらに優れたものにする予定かをご紹介します。

ジェミニのコンテキスト認識は大幅に改善される

他のチャットボットと同様に、Gemini は通常、ユーザーが対話するコンテキストを理解できますが、常にそうであるとは限りません。そのため、最も重要な変更点の 1 つは、コンテキスト認識機能の大幅な改善です。

Gemini は、画面上で何が起こっているか、また、その時点で使用しているアプリケーションさえも簡単に理解できるようになりました。Google によると、ユーザーは別のアプリを使用しながら Gemini オーバーレイを表示して AI を利用できるようになります。たとえば、Gemini で画像を生成し、それを Google メッセージ、Gmail、または別のアプリに直接ドラッグ アンド ドロップできます。

Gemini Nano で生成された画像を別のアプリにドラッグ アンド ドロップします。出典: Google

もう 1 つの例として、YouTube 動画を視聴しているときに、Gemini の「この動画に質問」機能を使用して、その動画から情報を取得できます。これは、PDF を完全に読まなくても PDF からすばやく情報を取得できる Gemini Advanced の「この PDF に質問」機能に似ています。

最後に、Gemini が画面をチェックして提供する動的な提案があります。Gemini は作業内容のコンテキストを自動的に理解するため、何も入力しなくても提案が表示されます。

たとえば、Google メッセージでコーヒーを飲みに行く会話をしているときに、Gemini は Google マップで近くにあるおすすめのコーヒーショップを自動的に推奨できます。

ユーザーはまもなく、結果を提供している間も表示されるオーバーレイ パネルから Gemini にアクセスできるようになるため、毎回フルスクリーン モードで開く必要がなくなります。

ジェミニ ナノが完全なマルチモーダル機能を実現

これまで、Gemini はテキストまたは音声ベースの入力に依存してユーザーのクエリを理解し、適切な回答を提供してきました。現在、Google はその機能をアップグレードし、マルチモーダル機能を備えた Gemini Nano と呼んでいます。これは、更新されたモデルが、視覚情報、音声、およびサウンドを使用してユーザーの要求を理解できるためです。

これは非常に大きな、しかし非常に歓迎すべきアップグレードであり、AI アシスタント搭載スマートフォンの機能を大幅に変えることになります。Pixel スマートフォンを使用すると、テキストだけに頼るのではなく、カメラとマイクを介して周囲の情報を取得できるようになります。

Circle to Searchが学生を支援するためにアップデートされました

1 月に Google は、一部の Android スマートフォン向けに新機能「Circle To Search」を発表しました。この機能を使用すると、使用中のアプリを離れることなく、簡単なジェスチャーで情報を検索できます。この機能はマルチ検索で機能し、画像とテキストの両方を使用して、画面上のあらゆるものについて Google に質問できます。

Circle To Launch は発売以来、フルスクリーン翻訳などの機能が追加されてアップデートされてきたが、I/O 開発者会議で Google はさらなるアップデートを発表した。これにより、数学や物理の問題を簡単に解くことができ、生徒の宿題を支援できるようになった。

生徒は助けが必要な問題を丸で囲むだけで、Gemini が答えを得るために必要な手順を提供します。

Circle to Search の動作。出典: Google

Google はまた、Circle To Search が、グラフ、図、数式などを含む複雑な問題の解決にも役立つようになることも発表しました。Google は、この機能をさらに多くの Pixel および Samsung スマートフォンに拡張する予定です。

トークバックはより良い説明を提供します

Talkback は、スマートフォンの画面に表示されている内容を説明することで視覚障害を持つ人々を支援するために設計された Android の機能です。Gemini Nano がマルチモーダル機能を獲得したことで、Talkback はオブジェクトや要素の説明も大幅に改善されています。

この機能の最も印象的な点は、デバイスがオフラインの場合でも機能することです。更新された Gemini Nano モデルは、人間が提供するものと非常によく似た説明を提供できるため、現在の Talkback の動作に比べてはるかに便利です。

TalkBack は Gemini Nano を搭載しています。出典: Google

Gemini が詐欺電話を​​警告できるようになりました

詐欺防止策が年々強化されるにつれ、詐欺電話もより巧妙になってきました。そのため、こうした対策にもかかわらず、詐欺電話と本物の電話を区別できない人がまだたくさんいます。そのため、Google は、詐欺防止のために Gemini Nano がリアルタイムで警告を発する新機能をテストしています。

詐欺電話によくある会話のパターンを検出し、すぐに警告することができます。たとえば、銀行の担当者を名乗る人物から送金を依頼する電話を受けた場合など、同様の内容の電話を受けた場合、警告が表示されます。これはデバイス上での保護であるため、プライバシーが侵害されることはありません。

Gemini Nano が提供する詐欺警告。出典: Google

Gemini Nano は今年初めに Pixel 8 シリーズおよび Samsung Galaxy S24 とともに発表されました。アップデートされたモデルは今年後半に Pixel スマートフォンに搭載される予定で、詐欺電話アラートなどの機能はすべての Android デバイスに搭載される予定です。

これらのアップデートにより、Google は Gemini をより強力にし、必要なときにいつでもユーザーを支援できる仮想アシスタントとしてより優れたものにしています。ただし、これらの機能のほとんどは、少なくとも現時点ではフラッグシップ フォンに限定されるため、他のデバイスで利用できるようになるまでにはしばらく待たなければならない可能性があります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です