目次
AIエンジニアの仕事はJupyter Notebookの外でも頻繁に行われる。リモートサーバーでのモデル学習、ログファイルの分析、Dockerコンテナの操作、デプロイスクリプトの実行——これらすべてにLinuxコマンドラインの知識が必要だ。ここでは実務で特に使用頻度の高いコマンドを用途別に整理する。
ファイルとディレクトリ操作
ls -lah # ファイル一覧(詳細・隠しファイル・人間可読サイズ)
cd /path/to/dir # ディレクトリ移動
pwd # 現在のディレクトリを表示
mkdir -p a/b/c # ディレクトリを再帰的に作成
cp -r src/ dst/ # ディレクトリを再帰的にコピー
mv file.txt new.txt # ファイルの移動(リネームにも使う)
rm -rf dir/ # ディレクトリを再帰的に削除(注意:確認なし)
find . -name "*.py" -type f # Pythonファイルを再帰的に検索
テキスト処理とログ分析
AIエンジニアが最も頻繁に使うのがログ解析コマンド群だ。
cat file.txt # ファイル全体を表示
head -n 100 file.txt # 先頭100行を表示
tail -f app.log # ファイルの末尾をリアルタイム追跡(ログ監視)
grep "ERROR" app.log # "ERROR"を含む行を抽出
grep -r "pattern" ./ # ディレクトリ以下を再帰的に検索
wc -l file.txt # 行数をカウント
sort file.txt | uniq -c | sort -rn # 出現頻度を集計してソート
awk '{print $1}' access.log # 各行の1列目を抽出
sed 's/old/new/g' file.txt # 文字列を一括置換
tail -f はモデル学習ログをリアルタイム監視する際に特に重宝する。
プロセスとリソース管理
top # リソース使用状況をリアルタイム表示
htop # topの改良版(矢印キーで操作可能)
nvidia-smi # GPU使用率とメモリの確認(AI開発の必須コマンド)
ps aux | grep python # Pythonプロセスを一覧
kill -9 <PID> # プロセスを強制終了
nohup python train.py & # バックグラウンドで実行(ターミナル終了後も継続)
nvidia-smi は学習中のGPUメモリ使用量確認で毎日使う。nohup ... & はSSH接続が切れても学習を継続させるための定番パターンだ。
ネットワーク確認
curl -s https://api.example.com/health # HTTPリクエストを送る
wget https://example.com/file.zip # ファイルをダウンロード
ssh user@server.com # リモートサーバーにSSH接続
scp local.txt user@server:~/remote.txt # リモートにファイルをコピー
netstat -tuln | grep LISTEN # 待ち受けポートを確認
ディスクとファイルサイズ
df -h # ディスク使用量を確認(人間可読)
du -sh ./models/ # ディレクトリの合計サイズを確認
du -sh * | sort -rh | head -10 # サイズが大きいファイル/ディレクトリTop10
モデルファイルやデータセットは大きくなりがちで、ディスク不足は学習失敗の原因になる。定期的に df -h と du -sh で確認する習慣が重要だ。
圧縮と展開
tar -czf archive.tar.gz ./data/ # ディレクトリをtar.gzに圧縮
tar -xzf archive.tar.gz # tar.gzを展開
zip -r archive.zip ./data/ # zip圧縮
unzip archive.zip # zip展開
環境変数とシェルスクリプト
export API_KEY="your-key" # 環境変数を設定
echo $API_KEY # 環境変数を表示
env | grep CUDA # CUDA関連の環境変数を確認
source .env # .envファイルを現在のシェルに読み込む
which python # コマンドのパスを確認
python --version # バージョン確認
まとめ
AIエンジニアにとって必須のLinuxコマンドは、大きく「ファイル操作」「ログ解析(grep/awk/tail)」「プロセス管理(nvidia-smi/nohup)」「ネットワーク(curl/ssh)」「ディスク管理(df/du)」の5カテゴリに分類できる。特に nvidia-smi、tail -f、nohup ... & はAI学習ジョブの管理で毎日使うコマンドだ。grep -r と awk はログ分析の基本パターンであり、覚えておくと調査スピードが大幅に向上する。Linuxコマンドラインへの習熟はAIエンジニアとしての実務生産性に直結する。
免責事項 — 掲載情報は執筆時点のものです。料金・機能は変更される場合があります。最新情報は各公式サイトをご確認ください。