LMDE7にGemini CLIをインストール〜サクッとセットアップしてターミナルから使用開始

LMDE Linux Mint Debian Edition Linux
Linux Mint Debian Edition

Gemini CLIを使いたい

Google GeminiはWebブラウザで使用して、アイキャッチ画像をAI生成して貰ったりしていますが、ローカルのファイル操作なんかも出来るGemini CLIはかなり魅力的なので、遅ればせながら使用してみることにしました。Linuxだと簡単らしいので使わない手はありません。

Gemini CLIの魅力は、やっぱり直にファイル操作をさせられるという点ですね。ファイル名のリネーム(連番にする)等も簡単に出来ますし、その時に使用されるプログラム的なコードも表示されるので、プログラマーさんはAI生成のコードを読む勉強にもなります。私はよくわからないのでそのまま実行させますが・・

念の為TimeShiftでシステムのバックアップをとる

インストールに失敗したことを考えて、LMDE7のシステムのスナップショットを撮っておきます。最悪失敗してもTimeShiftで戻せますので安心です。一手間かかりますが何事も備えておくにこしたことは無いです。多分問題ないと思いますが保険みたいなものですね。

Gemini CLIで必須となるアプリ(パッケージ)

Gemini CLIをセットアップするためには、「Node.js」と「Node.js用のパッケージマネージャ(npm)」が必要だと分かりました。

  • Node.js
  • npm

それと必要なものは、無料版だとGoogleアカウントが必要になります。私は大したことはしないので今のところは無料版のGoogleアカウント連携で使うことにします。

先のことは分かりません。Gemini CLIをガシガシ使うことになったら有料版にする可能性もありそうです。今のところは無料枠でお勉強です。

環境準備:Node.jsをインストール

コマンドでインストールも良いのですが、ここは「ソフトウェアマネージャー」からインストールしてみます。やっぱりデスクトップOSはGUIでインストールが基本かなと。

環境準備:npmをインストール

Node.jsのパッケージマネージャーであるnpmのインストールです。これも「ソフトウェアマネージャ」からインストールしました。意識的にGUIでインストールして行きます。

Gemini CLIのインストール

ここはどうしようもないので(npmコマンドを使うしか無いので)ターミナルからコマンドでインストールしました。

~$ npm install -g @google/gemini-cli

私の環境ではsudoで実行する必要がありました。

~$ sudo npm install -g @google/gemini-cli

Gemini CLIの起動

ターミナルを起動して、Gemin CLIのバージョンを確認してみます。バージョン情報が表示されたので無事にインストールされたみたいです。

~$ gemini --version
0.18.4

Gemini CLIを起動して初期セットアップをします。(Googleアカウントとの連携)

~$ gemini

私は普段使用しているGoogleアカウントと連携して使用するため、
「1.Login with Google」を選びました。上下カーソルで選択してENTERで実行です。

すると、デフォルトブラウザとしてFirefoxで普段からGoogleを使用しているので、GoogleアカウントをGemini CLIに許可して良いかという主旨の確認が表示されました。問題ないので受け入れて本人確認を済ませます。これで使用できるようになりました。

早速Gemini CLIを試してみる

手っ取り早く、画像フォルダにある画像ファイルのファイル名を連番にする処理を走らせてみたいと思います。Gemini CLIからカレントディレクトリの移動方法がわからないので、(CTRL+Cを2連打)で一旦終了させました。

次に、実験したい画像ファイルが沢山保存されているフォルダ内で右クリックしターミナルを起動しました。これでカレントディレクトリが画像フォルダ内になっています。

おっと、リネームは実験的にやってみたいだけなので、画像ファイルを全部選択して右クリックでアーカイブ(圧縮)しておくことにします。圧縮した後でデスクトップに移動して確保。後で元に戻したいのでね。

準備が出来たので、再びGemini CLIを起動して「日本語の自然言語でプロンプトから指示」を出しました。「画像ファイルを3桁数字の連番のファイル名にして欲しい」ということを指示しました。

直ぐにやりたいことを理解してくれた様で、これからやることを確認してきました。まだ実験的なので、Onceで一回こっきりの実行を許可します。

実行内容(プログラム的なものも提示)を表示して、「これを実行しますね」みたいな感じのやり取りになります。最終的にOnceで許可すると連番ファイルにリネームが終わりました。

宿題:画像の内容までチェック出来るのか?

今回は実験的に画像ファイルを連番にしてくれと指示を出しただけですが、Gemini CLIは画像ファイルの内容(どういう画像なのか)までチェックすることが出来るのでしょうか?

これはまた後日時間のある時にでもやってみようと思います。もし画像の内容をチェックしてから分類してファイル名を変更してくれるならかなり実用的です。なんとなくそれも出来てしまいそうな気がします。

申し訳ありませんが、私はソフトウェアエンジニアリングタスクの支援に特化しており、画像処理や画像生成は私の能力範囲外です。

駄目でした。画像認識まではGemini CLIでは行えないようです。

Gemini CLIの活用方法については、これからリサーチして実践しながら学習して行こうと思います。こういう技術は体感的にやってみて覚えないと身につかないですからね。歳のせいにしておっくうがっていては時代に取り残されてしまいますので、地道にぼちぼち頑張ります。

美味しい情報を持っている方は是非コメントで教えて下さい。

コメント

タイトルとURLをコピーしました