LMDE7にGemini CLIをインストール〜サクッとセットアップしてターミナルから使用開始

Gemini CLIを使いたい
念の為TimeShiftでシステムのバックアップをとる
Gemini CLIで必須となるアプリ（パッケージ）
Gemini CLIの起動
早速Gemini CLIを試してみる
宿題：画像の内容までチェック出来るのか？
対話形式の資料集めと要約にも使える
AIの活用方法は未知数

Gemini CLIを使いたい

Google GeminiはWebブラウザで使用して、アイキャッチ画像をAI生成して貰ったりしていますが、ローカルのファイル操作なんかも出来るGemini CLIはかなり魅力的なので、遅ればせながら使用してみることにしました。Linuxだと簡単らしいので使わない手はありません。

Gemini CLIの魅力は、やっぱり直にファイル操作をさせられるという点ですね。ファイル名のリネーム（連番にする）等も簡単に出来ますし、その時に使用されるプログラム的なコードも表示されるので、プログラマーさんはAI生成のコードを読む勉強にもなります。私はよくわからないのでそのまま実行させますが・・

念の為TimeShiftでシステムのバックアップをとる

インストールに失敗したことを考えて、LMDE7のシステムのスナップショットを撮っておきます。最悪失敗してもTimeShiftで戻せますので安心です。一手間かかりますが何事も備えておくにこしたことは無いです。多分問題ないと思いますが保険みたいなものですね。

Gemini CLIで必須となるアプリ（パッケージ）

Gemini CLIをセットアップするためには、「Node.js」と「Node.js用のパッケージマネージャ（npm）」が必要だと分かりました。

Node.js
npm

それと必要なものは、無料版だとGoogleアカウントが必要になります。私は大したことはしないので今のところは無料版のGoogleアカウント連携で使うことにします。

しかし先のことは分かりません。Gemini CLIをガシガシ使うことになったら有料版にする可能性もありそうです。今のところは無料枠でお勉強です。

環境準備：Node.jsをインストール

コマンドでインストールも良いのですが、ここは「ソフトウェアマネージャー」からインストールしてみます。やっぱりデスクトップOSはGUIでインストールが基本かなと。aptコマンドでインストールするよりも、極力ソフトウェアマネージャーに任せるのが私流です。コマンドの方が手っ取り早い場面もありますが気長にやってます。

環境準備：npmをインストール

Node.jsのパッケージマネージャーであるnpmのインストールです。これも「ソフトウェアマネージャ」からインストールしました。やはり意識的にGUIでインストールして行きます。

Gemini CLIのインストール

ここはどうしようもないので（npmコマンドを使うしか無いので）ターミナルからnpmコマンドでインストールしました。

~$ npm install -g @google/gemini-cli

私の環境ではsudoで実行する必要がありました。

~$ sudo npm install -g @google/gemini-cli

Gemini CLIの起動

ターミナルを起動して、Gemin CLIのバージョンを確認してみます。バージョン情報が表示されたので無事にインストールされたみたいです。

~$ gemini --version
0.18.4

Gemini CLIを起動して初期セットアップをします。（Googleアカウントとの連携）

~$ gemini

私は普段使用しているGoogleアカウントと連携して使用するため、
「1.Login with Google」を選びました。上下カーソルで選択してENTERで実行です。

すると、デフォルトブラウザとしてFirefoxで普段からGoogleを使用しているので、GoogleアカウントをGemini CLIに許可して良いかという主旨の確認が表示されました。問題ないので受け入れて本人確認を済ませます。これで使用できるようになりました。

早速Gemini CLIを試してみる

手っ取り早く、画像フォルダにある画像ファイルのファイル名を連番にする処理を走らせてみたいと思います。Gemini CLIからカレントディレクトリの移動方法がわからないので、（CTRL+Cを2連打）で一旦終了させました。

次に、実験したい画像ファイルが沢山保存されているフォルダ内で右クリックしターミナルを起動しました。これでカレントディレクトリが画像フォルダ内になっています。

おっと、リネームは実験的にやってみたいだけなので、画像ファイルを全部選択して右クリックでアーカイブ（圧縮）しておくことにします。圧縮した後でデスクトップに移動して確保。後で元に戻したいのでね。

準備が出来たので、再びGemini CLIを起動して「日本語の自然言語でプロンプトから指示」を出しました。「画像ファイルを3桁数字の連番のファイル名にして欲しい」ということを指示しました。

直ぐにやりたいことを理解してくれた様で、これからやることを確認してきました。まだ実験的なので、Onceで一回こっきりの実行を許可します。

実行内容（プログラム的なものも提示）を表示して、「これを実行しますね」みたいな感じのやり取りになります。最終的にOnceで許可すると連番ファイルにリネームが終わりました。

宿題：画像の内容までチェック出来るのか？

今回は実験的に画像ファイルを連番にしてくれと指示を出しただけですが、Gemini CLIは画像ファイルの内容（どういう画像なのか）までチェックすることが出来るのでしょうか？

これはまた後日時間のある時にでもやってみようと思います。もし画像の内容をチェックしてから分類してファイル名を変更してくれるならかなり実用的です。なんとなくそれも出来てしまいそうな気がします。

申し訳ありませんが、私はソフトウェアエンジニアリングタスクの支援に特化しており、画像処理や画像生成は私の能力範囲外です。

画像認識まではGemini CLIでは行えないようです。ですが聞いた話によるとファイル名から特定出来なかった場合は画像を解析して判定するらしいので、これもやってみるしか無さそうです。着実に進化するので出来ない事がいつの間にか出来るようになる可能性はありそうです。

対話形式の資料集めと要約にも使える

Geminiはネットから情報を収集してきて資料作成もできます。出力先を.md（マークダウン）形式に指定すると、見出し、小見出し、箇条書きなど書式を整理してくれます。これらの生成された資料は、ハルシネーション（誤回答）もあるのでチェックが必要です。間違えている所を修正して資料として完成させます。

そしてそれらの資料となった.mdファイルをGemini CLIに@を入力してドラッグ＆ドロップするとファイルとしてアップロード指定できるので、「これらの資料から重要なポイントを要約してくれ」とか、そういう指定方法もできます。以前は結構ハルシネーションが起きていましたが、最近のGeminiの回答や調査はほとんどハルシネーションが起きません。ジャンルにもよるとは思いますが。

Geminiはプログラミングの補助やモックアップの生成に強いと言われますが、資料集めなんかにも十分使えると感じました。調べさせたことを.mdファイルで整理して資料に残せるのも、Gemini CLIの良いところですね。

AIの活用方法は未知数

Gemini CLIの活用方法については、これからリサーチして実践しながら学習して行こうと思います。こういう技術は体感的にやってみて覚えないと身につかないですからね。歳のせいにしておっくうがっていては時代に取り残されてしまいますので、地道にぼちぼち頑張ります。

美味しい情報を持っている方は是非コメントで教えて下さい。

Linux Mint
Linux Mint Japan
Linux Mint Japan 日本語フォーラム