ホームITGoogle社の生成AIツール「Gemini」とは?

IT Insight

Google社の生成AIツール「Gemini」とは?

レンテックインサイト編集部

Google社の生成AIツール「Gemini」とは?

検索やグループウエア、機械学習プラットフォームなど多くのITサービスを展開するGoogle。盛り上がりを見せる生成AI分野においてもその存在感は大きく、2024年2月にはそれまでの「Bard」「Duet AI」を統合する形で次世代AIサービス「Gemini」がリリースされ大きな話題を呼びました。勃興する生成AIの中でも特に高い期待が寄せられているものの一つである「Gemini」。

本記事では、Google WorkspaceなどGoogle社の他サービスとのコラボレーションも含め、その概要やメリット、活用の可能性についてご紹介します。

「Gemini」とは? どのようなメリットがあるのか

Geminiは、GoogleのAIモデルおよび対話型AIサービスです。2024年2月、Googleがそれまでリリースしていた対話型生成AIサービス「Bard」とAIアシスタント「Duet AI」の両方を統合する形でリリースされました。例えば前者はChatGPTが、後者はMicrosoft 365 Copilotが対応するようなサービスであり、二つの機能が統合されたカバー範囲の広さがGeminiの特長の一つです(Microsoft 365 Copilotについて詳しくはこちらの記事をご参照ください)。

また、Gmail、Googleドキュメント、GoogleスプレッドシートなどのGoogle WorkspaceやGoogle検索、Google Cloudとのシームレスな連携が実現されるのもGeminiならではのメリットといえるでしょう。「Gemini for Google Workspace」ではメール文章の自動生成や顧客分析などの営業アシスタント、Google検索と連動したトレンド情報のリサーチ、「Gemini for Google Cloud」ではコーディング補助やクラウドに関する対話型Q&A、サイバーセキュリティ、BigQueryでのデータ分析などの機能が提供されます。

AIによる回答にWeb検索やあらかじめ用意されたドキュメント・データの参照(Retrieval)を組み合わせることで回答の精度を高めるRAG(Retrieval-augmented Generation)にあたっても、Google検索やGoogle Workspaceとの連携は効果的と考えられます。「Google Workspace」「Googleフライト」「Googleホテル」「Googleマップ」「YouTube」との連携は、Geminiのチャット画面左下の歯車マークから「拡張機能」にアクセスすることで行えます。

APIを利用することでGPTなど外部の生成AIをAIアシスタント化する方法もありますが、Geminiが、外部の生成AIを取り巻く状況も踏まえてそれまでのGoogleのサービスを統合する形で生まれたからこそ、よりシームレスな連携が期待できます。

Geminiの4つのモデルと有料プランを解説

2024年6月時点で「Gemini Pro」「Gemini nano」「Gemini Ultra」「Gemini flash」の4つのモデルがリリースされています。 それぞれの特徴は以下の通りです。

Gemini Pro

最も一般的かつ幅広いタスクに適したモデル。対話型AIサービスの無料プランではGemini1.0 Proが、有料プランでは次世代モデルのGemini1.5 PROが利用可能

Gemini Ultra

コーディングや推論といった高度なタスク向けの高度なモデル。Gemini1.5PROのリリース・アップデートにより、最上位モデルの枠を譲ったが、今後のアップデートで再度存在感を高める可能性

Gemini nano

一つのタスクの処理に特化した軽量モデル。モバイル端末での利用を想定しており、画像処理やスピーチ文字起こし、テキスト要約などが活用例として提示

Gemini 1.5 flash

2024年5月14日、他のモデルに追加する形で発表された軽量性と性能のバランスを重視したモデル。APIやVertex AI(Google Cloudが提供する機械学習プラットフォーム)経由で利用可能

Geminiには有料プランのGemini Advancedが存在し、その価格は2024年6月10日時点で2900円/月です。有料プランでは最上位の性能と高速性のバランスを持つGemini1.5 PROが利用できるようになり、ドキュメントやPDF、スプレッドシートを読み込ませての文章要約、データ分析や Python コードの編集・実行、2TBのストレージ特典などが利用可能になります。

「Gemini」の具体的な活用事例は?

Geminiは具体的にどのような目的で活用されているのか、二つの事例を見てみましょう。

ドキュメントからの情報抽出とインサイト獲得

Geminiの活用事例の一つの典型として挙げられるのが、ドキュメントやデータの整理とそこからの情報の抽出、自動入力です。生成AIの弱点としていかにもありそうな誤情報を堂々と記述してしまうハルシネーションがあり、その対策の一つとして正確な情報が記載されていると分かっているドキュメントから情報を抽出し、まとめるという手段が挙げられます。例えばドキュメントから財務情報などの数値情報を抽出し、ダッシュボードに反映、そこからインサイトを抽出するといった業務にGeminiが活用される場合もあります。

生成AIのハルシネーションについて詳しくはこちらの記事をご参照ください。

マルチモーダル性を利用した、会議や商談の文字起こし・分析

Geminiのマルチモーダル性を利用して、会議の議事録を音声認識でリアルタイムに生成し、レポーティングまで一気通貫で行うという事例もあります。会議のみならず商談のトーク内容を分析させたり、採用面接のサポートをさせたりとその可能性はさまざまです。もちろん、Geminiに個人情報や機密情報を入力するリスクについては最大限に注意を払うべきです。とはいえ、Google のプライバシーポリシーに従ってGeminiが運用されていることは、GoogleWorkSpaceやストレージサービス「Google One」を利用しているユーザーにとっては安心感にもつながるでしょう。

有効性を知るため、まずは無料プランの範囲で性能を試してみるのも一つの手

ほかのサービスを凌駕するベンチマークスコアが報告されている例も見られるGoogleの生成AI「Gemini」について解説してまいりました。ハルシネーションなど問題も存在する一方、適した作業に応用し、外部のサービスと組み合わせることで生産性に大いにプラスに働く場合もあります。まずは無料プランの範囲で利用し、一度その性能を実際に試してみてはいかがでしょうか。

IT Insightの他記事もご覧ください

Prev

Next