



WithCodeMedia-1-pc
WithCodeMedia-2-pc
WithCodeMedia-3-pc
WithCodeMedia-4-pc




WithCodeMedia-1-sp
WithCodeMedia-2-sp
WithCodeMedia-3-sp
WithCodeMedia-4-sp









生徒GeminiってGoogleのAIですよね?ChatGPTは聞くけどGeminiはよく分からなくて…。モデルがいっぱいあって、何ができて、料金がどうなってるのか、ぜんぶゴチャゴチャです。
ペン博士いい質問だね。GeminiはGoogle製のAIで、文章も画像も動画も扱える“マルチモーダル”が強み。ただモデルの種類が多くて料金体系も2段構えだから、最初は迷って当然。この記事で公式情報をもとに、モデル・できること・料金を一枚の地図みたいに整理するよ!
「Gemini(ジェミニ)」はGoogleが開発する生成AIです。文章生成だけでなく、画像・音声・動画・PDFまで一度に扱えるマルチモーダル(複数の種類のデータを同時に処理できる)が最大の特徴で、検索のGoogle、Gmail、ドキュメント、スマホのAndroidとも深くつながっています。ただ、モデルの種類が「3.5 Flash」「3.1 Pro」「2.5 Flash」…と多く、しかも数か月ごとに更新されるため、初めて触れる人には全体像がつかみにくいのも事実です。
この記事では、Gemini の公式ドキュメント・公式ブログ(一次情報)をもとに、2026年7月1日時点のモデル一覧・できること・料金を、専門用語をかみ砕きながら一気に整理します。中小事業者の方が業務に使う場合、Web制作者がサイトに組み込む場合、開発を始めたばかりの方がAPIを叩く場合——どの立場でも「まず読めば迷わない」ことを目指しました。
この記事の結論
要点:GeminiはGoogle製のマルチモーダル生成AI。「アプリで使う」か「APIで自分のサービスに組み込む」かの2つの入口があり、どちらも複数のモデルから用途に合うものを選んで使います。まずこの構図だけ押さえれば、後の細かい話が頭に入りやすくなります。
Geminiは、Googleおよびその研究部門であるGoogle DeepMindが開発する生成AIの総称です。単一の製品名ではなく、用途や規模ごとに分かれた“モデルの家族(ファミリー)”を指します。文章を書く・要約する・翻訳する・コードを書く・画像を理解する/生成する・音声を聞き取る——といった幅広いタスクを、1つの基盤でこなせるのが特徴です。
Geminiに触れる方法は大きく2通りです。多くの人がまず使うのは前者、開発者やWeb制作者が自分のサービスに組み込むときは後者を使います。
| 入口 | 誰向け | アクセス先 | できること |
|---|---|---|---|
| アプリ版(Geminiアプリ) | 一般ユーザー・業務利用 | gemini.google.com / スマホアプリ | チャットで質問・文章作成・画像生成・資料調査など |
| API版(Gemini API) | 開発者・Web制作者 | Google AI Studio / API キー | 自社アプリやサイトにGeminiの機能を組み込む |
この記事では、まずモデルの一覧を整理し、次に「アプリでできること」「APIでできること」、最後に「料金」の順で解説します。出典はすべてGoogleの公式ページ(Gemini API ドキュメントほか)です。
マルチモーダルとは、テキスト・画像・音声・動画など複数の種類(モード)のデータをまとめて扱えるという意味です。たとえば「この写真に写っているグラフを読み取り、内容を表にまとめて」といった、人間なら自然にできる“見て・聞いて・書く”を1つのモデルで処理できます。Geminiは設計当初からマルチモーダルを前提としており、ここが大きな強みです。
要点:2026年7月時点の主力は第3世代(Gemini 3 系)。賢さ重視の「Pro」、速さとコストのバランスに優れる「Flash」、最安・最速の「Flash-Lite」という三層構造で覚えると整理しやすいです。加えて安定版として2.5系も現役で、画像・動画・音声・埋め込みの専用モデルもそろっています。
まず、Geminiのモデル名は基本的に「世代番号 + グレード名」で構成されます。たとえば「Gemini 3.5 Flash」なら世代が3.5、グレードがFlash。グレードの意味は次の通りです(公式モデル一覧)。
| グレード | 位置づけ | 向いている用途 |
|---|---|---|
| Pro | 最も高性能・高度な推論 | 複雑な問題解決・高度なコード生成・エージェント |
| Flash | 価格と性能のバランス型 | 高ボリューム・低遅延で“考える”処理が要る作業 |
| Flash-Lite | 最速・最安の軽量版 | 大量処理・コスト最優先・シンプルなタスク |
2026年7月1日時点で、公式が掲載している主なモデルは次の通りです。世代が新しいほど賢く、グレードがProに近いほど高性能・高単価になります。リリース日は公式リリースノートに基づきます。
| モデル名 | 世代/グレード | 特徴 | 状態(2026/7/1) |
|---|---|---|---|
| Gemini 3.5 Flash | 第3世代・Flash | エージェントやコード作業で持続的に高性能 | 一般提供(2026年5月19日 GA) |
| Gemini 3.1 Pro | 第3世代・Pro | 高度な知能・複雑な問題解決・強力なエージェント | プレビュー(2026年2月19日〜) |
| Gemini 3.1 Flash-Lite | 第3世代・Flash-Lite | 大型モデルに迫る性能を低コストで | 一般提供(2026年5月7日 GA) |
| Gemini 3 Flash | 第3世代・Flash | 性能と効率のバランス型 | プレビュー |
| Gemini 2.5 Pro | 第2.5世代・Pro | 深い推論とコーディングに強い安定版 | 一般提供 |
| Gemini 2.5 Flash | 第2.5世代・Flash | 低遅延・高ボリューム向けのバランス型 | 一般提供 |
| Gemini 2.5 Flash-Lite | 第2.5世代・Flash-Lite | 最速・最も低コストのマルチモーダル | 一般提供 |
注意:第3世代のProやFlashの一部は「プレビュー(試験提供)」段階です。プレビュー版は仕様や料金が変わる可能性があるため、業務で安定運用するなら一般提供(GA)のモデルを基本に選ぶと安心です。最新の状態は必ず公式モデル一覧で確認してください。
Geminiファミリーには、テキスト以外に特化したモデルもそろっています。これらはAPIから個別に呼び出して使います。
| 種類 | 代表モデル(2026/7/1時点) | 役割 |
|---|---|---|
| 画像生成 | Nano Banana 2 / Nano Banana Pro / Nano Banana Lite | テキストから画像を生成・編集 |
| 動画生成 | Veo 3.1 / Gemini Omni Flash(プレビュー) | テキストや画像から動画を生成 |
| 音声(ライブ/読み上げ) | Gemini 3.1 Flash Live / Gemini 3.1 Flash TTS | リアルタイム音声対話・テキスト読み上げ |
| 埋め込み(ベクトル化) | Gemini Embedding 2 / Gemini Embedding | 検索・分類・RAG用にテキストを数値化 |
| 音楽生成 | Lyria 3 Pro / Lyria RealTime | テキストから音楽を生成 |
「埋め込み(Embedding)」は聞き慣れないかもしれませんが、文章を“意味のベクトル(数値の並び)”に変換する技術です。社内文書を検索可能にしたり、AIに自社データを参照させる仕組み(RAG)を作るときの土台になります。
要点:迷ったら「Flash」から。ほとんどの業務はFlashで十分こなせます。難しい推論や高品質なコード生成が要るならPro、大量処理でコストを抑えたいならFlash-Liteへ。賢さ・速さ・コストの三角形でバランスを取るのがコツです。
| やりたいこと | おすすめグレード | 理由 |
|---|---|---|
| 社内文書の要約・メール下書き | Flash | 速さとコストのバランスが良く実用十分 |
| 仕様の難しいプログラム生成・設計相談 | Pro | 深い推論力が必要なため |
| 大量の問い合わせ自動分類・タグ付け | Flash-Lite | 1件あたりの単価を最小化できる |
| 画像から情報を読み取る(OCR的用途) | Flash 以上 | マルチモーダル性能が安定して必要 |
| 商品画像・バナーの生成 | Nano Banana 系 | 画像生成専用モデルが適任 |
実務でのおすすめ手順は、①まずFlashで試す → ②精度が足りなければProに上げる → ③コストが気になればFlash-Liteを試す、という順です。最初から最上位モデルを使う必要はありません。
要点:アプリ版はブラウザやスマホからチャットで使える“すぐ使える窓口”。文章作成・調べもの・画像生成・資料の読み込みなどを、プログラミングなしで利用できます。GoogleアカウントがあればOKです。
Geminiアプリ(gemini.google.com)は、ChatGPTのチャット画面のように使えるサービスです。質問を打ち込めば答えが返り、追加で指示すれば会話を続けながら作業できます。主にできることは次の通りです。
Deep Researchは、1つのテーマについてWeb上の複数情報を自動で調べ、レポート形式にまとめてくれる機能です。「競合5社の料金を比較して」のような調査を任せると、出典つきの調査結果を生成します。手作業の下調べを大幅に短縮できます。
Gemsは、用途に合わせて指示や役割をあらかじめ設定した“自分専用のGemini”を作れる機能です(ChatGPTのGPTsに近い発想)。Canvasは、文章やコードを横の作業画面で見ながら編集できるモードで、長文の推敲やコードの試作に向いています。
これらはプランによって使える範囲が変わります。無料でも基本機能は使えますが、Deep Researchの回数や最新モデルへのアクセスは有料プランで拡張されます(詳細は後述の料金章で解説)。
要点:Geminiの真価は“Googleの普段使いのツールに溶け込む”点。Gmail、ドキュメント、スプレッドシート、スマホのAndroidなどにGeminiが組み込まれ、別アプリを開かずに作業の流れの中でAIを呼び出せます。
Google WorkspaceにGeminiが統合されており、たとえば次のような使い方ができます。
これらは「アプリを切り替えず、作業画面の中でAIを呼び出せる」のが利点です。コピペの往復が減り、業務のテンポが上がります。
NotebookLMは、自分がアップロードした資料(PDF・メモ・URLなど)だけを根拠にして答えるツールです。社内マニュアルや議事録を読み込ませ、その内容に限定して質問・要約・音声化できるため、情報の出どころが明確で、業務利用との相性が良い機能です。
要点:Gemini APIを使えば、自社サイトやアプリにGeminiの機能を直接組み込める。問い合わせ自動応答、商品説明の自動生成、画像のタグ付けなどを“自分のサービスの中で”動かせます。Google AI Studioで無料から試せます。
Gemini API(公式ドキュメント)は、プログラムからGeminiを呼び出す窓口です。チャット画面を開かずに、コードから「この文章を要約して」「この画像に何が写っている?」と指示を送り、結果を受け取れます。Web制作者なら、問い合わせフォームの自動返信、ブログの下書き生成、画像の自動alt付与などに使えます。
Google AI Studioは、APIキー発行・プロンプトの試し打ち・利用状況の確認ができる無料のブラウザツールです。コードを書く前に、ここで動作を試すのが定番の流れです。
| 機能 | 内容 | 使いどころの例 |
|---|---|---|
| テキスト生成 | 文章の作成・要約・翻訳 | 記事下書き・商品説明文の自動生成 |
| マルチモーダル理解 | 画像・動画・音声・PDFの解析 | レシート読み取り・画像のタグ付け |
| Function calling(関数呼び出し) | 外部APIや社内処理を呼び出す | 在庫検索・予約処理と連携するエージェント |
| 構造化出力 | JSONなど決まった形式で返す | 後続処理に渡しやすい定型データ生成 |
| Thinking(思考) | 難問で内部的に推論を深める | 複雑な条件分岐・設計判断 |
| グラウンディング | Google検索やMapsで根拠を補強 | 最新情報や店舗情報を反映した回答 |
| コンテキストキャッシュ | 繰り返し使う前提文を再利用し節約 | 同じ社内資料を何度も参照する用途 |
| バッチ処理 | 大量リクエストをまとめて安価に処理 | 夜間にまとめて分類・要約する処理 |
Python向けの公式SDKを使うと、数行でモデルを呼び出せます。下は概念を示すイメージです(実際のコードや最新の書き方は公式ドキュメントを参照してください)。
# 概念イメージ(公式SDKの利用例)
from google import genai
client = genai.Client(api_key="あなたのAPIキー")
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="次の文章を100字で要約して:……",
)
print(response.text)
APIキーはパスワードと同じく秘密情報です。ソースコードに直接書き込まず、環境変数(.env)に入れ、公開リポジトリに含めないようにしましょう。漏えいは不正利用や高額請求につながります。
Geminiを開発で使う経路は2つあります。混同しやすいので整理します。
| 経路 | 向いている人 | 特徴 |
|---|---|---|
| Gemini API(Google AI Studio) | 個人・小規模・まず試したい人 | APIキー1つで手早く開始。無料枠あり |
| Vertex AI(Google Cloud) | 企業・本格運用・厳格な管理が要る人 | Cloud上で権限管理・監査・スケールに対応 |
まず試すならGoogle AI StudioのGemini API、社内の本番システムに組み込み権限管理やガバナンスが必要ならVertex AI、という使い分けが基本です。
要点:Geminiの技術的な強みは「長い入力を一度に扱える」ことと「種類の違うデータをまたいで処理できる」こと。たとえば100万トークン級の長文を読ませて要約させたり、画像と文章を同時に渡して質問したりできます。
コンテキスト(文脈)長とは、AIが一度に受け取れる入力量の上限です。たとえばGemini 2.5 Flashの場合、入力トークン上限は1,048,576(約100万トークン)、出力上限は65,536トークンです(公式: 2.5 Flash仕様)。トークンは文章を区切る単位で、日本語ではおおむね1文字=1〜2トークン程度。100万トークンあれば、分厚いマニュアルや長時間の議事録をまるごと読ませて要約・検索させられます。
| 項目 | Gemini 2.5 Flash(参考値) |
|---|---|
| 入力トークン上限 | 1,048,576(約100万) |
| 出力トークン上限 | 65,536 |
| 対応入力 | テキスト・画像・動画・音声 |
| 知識のカットオフ | 2025年1月 |
| 思考(Thinking) | 対応 |
| 関数呼び出し | 対応 |
| 構造化出力 | 対応 |
| 検索グラウンディング | 対応 |
「知識のカットオフ」とは、モデルが学習した情報の最終時点のことです。これより新しい出来事は、検索グラウンディング(Google検索で根拠を補う機能)を使わないと正確に答えられない場合があります。最新情報を扱うときは、グラウンディングの利用を検討しましょう。
要点:アプリ版は無料でも使える。より多くの利用枠や最新モデル・高度な機能が欲しい人向けに、Google AI Pro(月19.99ドル)やAI Ultra(月100ドル〜)などの有料プランが用意されています(2026年7月1日時点)。
Geminiアプリは、Googleアカウントがあれば無料で基本機能を利用できます。さらに使い込む人向けに、Google Oneの一部として有料の「Google AI」プランが提供されています。価格はGoogle公式ブログ(I/O 2026発表)およびGoogle One プランに基づきます。
| プラン | 月額(USD・2026/7/1時点) | 主な内容 |
|---|---|---|
| 無料 | 0ドル | 基本のチャット・画像生成など(利用上限あり) |
| Google AI Plus | 7.99ドル | 利用枠が無料の約2倍・ストレージ400GB・Geminiの拡張機能 |
| Google AI Pro | 19.99ドル | 利用枠が約4倍・ストレージ5TB・Deep Research拡張・YouTube Premium Lite等 |
| Google AI Ultra | 100ドル〜 | Proの約5倍の利用枠・ストレージ20TB・最上位機能(上位版は200ドル) |
注意:プラン内容と価格は変動します。また地域や時期でキャンペーンが入る場合があります。契約前に必ずGoogle公式のプランページで最新の価格・内容を確認してください。日本円での表示はGoogle One上で確認できます。
要点:API版は使った分だけ払う従量課金で、無料枠もある。料金は「100万トークンあたり何ドル」で決まり、Flash-Liteなど軽量モデルほど安価です。さらにバッチ処理で半額、キャッシュで繰り返し分を節約できます。
Gemini APIには無料利用枠(Free tier)があり、Flash系の多くのモデルは無料で試せます(利用上限あり・内容は製品改善に使われる場合あり)。本格利用は有料(Paid tier)で、価格は100万(1M)トークンあたりのドル建てです。以下は主要モデルの代表的な単価です(公式 料金ページ、2026年7月1日時点)。
| モデル | 入力(USD/1M) | 出力(USD/1M) | 備考 |
|---|---|---|---|
| Gemini 3.5 Flash | 1.50 | 9.00 | キャッシュ0.15/保存1.00(1M・1時間) |
| Gemini 3.1 Pro(プレビュー) | 2.00(〜200k)/ 4.00(超) | 12.00(〜200k)/ 18.00(超) | 長文ほど上位単価 |
| Gemini 3.1 Flash-Lite | 0.25(テキスト/画像/動画) | 1.50 | 音声入力は0.50 |
| Gemini 2.5 Pro | 1.25(〜200k)/ 2.50(超) | 10.00(〜200k)/ 15.00(超) | 安定版のPro |
| Gemini 2.5 Flash | 0.30(テキスト/画像/動画) | 2.50 | 音声入力は1.00 |
| Gemini 2.5 Flash-Lite | 0.10(テキスト/画像/動画) | 0.40 | 最安クラス・音声入力0.30 |
「〜200k / 超」とは、入力の長さ(プロンプトのトークン数)が20万トークン以下か超かで単価が変わるしくみです。長文を投げるProモデルでは、超過分が割高になる点に注意してください。
| 対象 | 代表的な料金(2026/7/1時点) | 出典上の単位 |
|---|---|---|
| 画像生成(Imagen 4 系) | 約0.02〜0.06ドル / 1枚 | 1画像あたり |
| 動画生成(Veo 3.1) | 約0.05〜0.60ドル / 1秒 | 動画1秒あたり |
| 埋め込み(Gemini Embedding 2) | 0.20ドル(テキスト)/ 0.45ドル(画像) | 1Mトークン等 |
料金は頻繁に改定されます。見積もりの前に必ず公式 料金ページで最新の単価・無料枠の条件を確認してください。プレビュー版モデルは特に変更が入りやすいです。
たとえばGemini 2.5 Flash で、入力1万トークン・出力2千トークンのリクエストを1回送った場合の概算は次の通りです(為替・改定で変動するため目安)。
要点:便利でも“最終確認は人間”が原則。ハルシネーション(もっともらしい誤り)、機密情報の取り扱い、料金の上振れ、モデルの更新・終了(廃止)に注意して運用しましょう。
これらは公式リリースノートや料金ページで随時更新されます。重要な前提ほど、定期的に公式を見直す運用にしておくと安全です。
要点:どれも優秀なAIだが、Geminiの個性は“Googleエコシステムとの統合”と“ネイティブなマルチモーダル・長文脈”。普段Googleサービスを使う事業者ほど恩恵が大きいです。
| 観点 | Geminiの特徴 |
|---|---|
| 提供元 | Google / Google DeepMind |
| 強み | 長文脈(最大100万トークン級)・マルチモーダル・Google連携 |
| 連携 | Gmail・ドキュメント・スプレッドシート・Android・検索と統合 |
| 入口 | アプリ(gemini.google.com)とAPI(Google AI Studio / Vertex AI) |
| こんな人に | Google Workspaceを日常的に使う事業者・開発者 |
どのAIが“最強”かは用途次第です。すでにGoogleのツールで仕事をしているなら、Geminiは導入の摩擦が小さく相性が良いという点が、選ぶ大きな理由になります。
要点:はじめての疑問をまとめて解消。料金・無料範囲・日本語対応・安全性など、つまずきやすいポイントをQ&Aで整理しました。
A. はい。GeminiアプリはGoogleアカウントがあれば無料で基本機能を利用できます(利用上限あり)。Gemini APIにも無料枠があり、Flash系モデルを試せます。より多くの枠や最新機能が欲しい場合に有料プランやAPIの有料利用へ進みます(料金ページ)。
A. 迷ったらFlashから始めるのが無難です。多くの業務はFlashで十分こなせます。高度な推論や難しいコード生成が必要ならPro、大量処理でコストを抑えたいならFlash-Liteを選びます。
A. 対応しています。Geminiは多言語に対応しており、日本語での入力・出力・要約・翻訳が可能です。専門的な文章や固有名詞は誤りが出ることもあるため、重要な箇所は人が確認しましょう。
A. アプリ版はチャット画面で“すぐ使う”ための窓口、API版は自社サービスにGeminiの機能を“組み込む”ための窓口です。文章作成や調べものはアプリ版、フォーム自動応答や自動生成の仕組み化はAPI版が向いています。
A. プランや利用形態によって異なります。一般に無料枠では入力が製品改善に使われる場合があり、有料(Paid)やエンタープライズ向けでは「製品改善に使わない」とされています。機密情報・個人情報を扱う前に、必ず最新の利用規約と対象プランの条件を確認してください。
A. 文章作成・要約・翻訳・調べもの(Deep Research)・画像生成・PDFや画像の読み取り・コード生成などです。APIを使えば、これらを自社サイトやアプリの機能として組み込めます。
A. APIは従量課金のため、利用上限アラートやレート制限の設定、バッチ処理(約50%オフ)やコンテキストキャッシュの活用、軽量モデル(Flash-Lite)の使い分けで費用を抑えられます。まずは小さく試し、必要な箇所だけ上位モデルに切り替えるのがコツです。
A. あります。Googleはモデルに終了(廃止)日を設けることがあり、たとえば2.0系は2026年6月1日に廃止予定とされています。利用中のモデルは公式リリースノートで状況を確認し、後継モデルへの移行を計画しておきましょう。
Geminiは、Googleが開発するマルチモーダル × 長文脈 × Google連携が強みの生成AIです。入口は「アプリ版」と「API版」の2つ。モデルは賢さ・速さ・コストでPro/Flash/Flash-Liteに分かれ、2026年7月時点の主力は第3世代(3.5 Flash・3.1 Pro など)と安定版の2.5系です。料金は無料枠から始められ、APIは100万トークン単位の従量課金。バッチやキャッシュ、モデルの使い分けでコストを最適化できます。
・入口:アプリ版(手早く使う)とAPI版(組み込む)
・モデル選び:迷ったらFlash→精度ならPro→コストならFlash-Lite
・料金:無料枠あり/APIは従量課金(2026年7月1日時点)
・運用:最終確認は人間/機密の入力と料金上限に注意
AIを“使いこなす土台”はWeb制作とAPIの基礎理解。WithCodeで手を動かして学べば、Geminiのようなツールを自分のサービスに組み込み、業務を自動化できる人材を目指せます。
本記事の仕様・料金・モデル情報は、以下のGoogle公式ページ(2026年7月1日時点)に基づいて作成しています。最新の数値は各リンク先でご確認ください。
WithCodeでは、Web制作の基礎から実務的な技術まで、実践的なスキルを段階的に学べます。
副業・フリーランスが主流になっている今こそ、自らのスキルで稼げる人材を目指してみませんか?
未経験でも心配することはありません。まずは無料カウンセリングで、悩みや不安をお聞かせください!
WithCodeでWeb制作を習得後、フリーランスエンジニアとして活動。HTML/CSS・JavaScript・WordPress案件を中心に年間20件以上の制作実績を持つ。「難しい技術をわかりやすく」をモットーに、初心者〜中級者向けの技術記事を執筆。副業・フリーランス独立を目指す方に向けた情報発信に注力している。
公式サイト より
今すぐ
無料カウンセリング
を予約!