【Python入門シリーズ②】変数とデータ型を徹底解説!AI開発のデータ操作の基礎

python入門

【Python入門シリーズ①】では、PythonがAI開発の標準言語である理由と、print()関数による基本的な出力方法を学びました。

今回は、プログラミングの中核をなす「変数」と「データ型」について徹底的に解説します。AIや機械学習は、膨大な「データ」を扱う技術です。そのデータをプログラム上で自在に操るための、最も基本的かつ重要な概念がここに詰まっています。

この回をマスターすれば、あなたはデータを「入れ物」に格納し、その「性質」を理解する、データ操作の第一歩を踏み出すことになります。

このシリーズの目次

このシリーズでは、プログラミングの基礎から始めて、最終的にはAI・機械学習の初歩までを体験できるような構成になっています。

  • 第3回: 基本的な演算子と演算
  • 第4回: 条件分岐の仕方
  • 第5回: 繰り返し処理でプログラムを自動化する
  • 第6回: 関数を作ってコードを整理整頓する
  • 第7回: 複数のデータを扱う「リスト」と文字列操作
  • 第8回: ライブラリでPythonの能力を拡張する
  • 第9回: ファイルの読み込みと書き込み
  • 第10回: Matplotlib入門!データをグラフで可視化する
  • 第11回: 画像データの仕組みとPillowでの基本操作
  • 第12回: 画像処理の基礎(フィルタリングと特徴抽出)
  • 第13回: 機械学習実践!AIによる画像分類に挑戦
  • 第14回: オープンデータの取得と前処理(データクレンジング)
  • 第15回: 実践データ分析!オープンデータから傾向を読み解く

変数とは?データを格納する「ラベル付きの箱」

プログラミングでは、後で再利用したいデータや計算結果を、一時的にメモリ上に保存しておく必要があります。そのための仕組みが「変数 (Variable)」です。

変数は、データを入れておくための「名前付きの箱」だとイメージしてください。

Pythonで変数を使うのは非常に簡単で、=(代入演算子)を使います。

まずは、ep2.py を作成してコードを書き込んでいきます。(ファイルの作成は第0回 , コメントは第1回)

# 'user_name'という名前の変数に、"Taro"という文字列データを代入
user_name = "Taro"

# 'user_age'という変数に、25という整数データを代入
user_age = 25

# 変数の中身をprint()関数で確認
print(user_name)
print(user_age)

これを実行すると、ターミナルにTaro25が表示されます。

うまく実行されましたね!!

なぜ変数が必要なのか?

変数は、コードの可読性、再利用性、メンテナンス性を劇的に向上させます。 例えば、消費税率を0.1と決めたとします。この数値をコードの10箇所で直接書いてしまうと、将来税率が変わったときに10箇所すべてを修正する必要があり、ミスも発生しやすくなります。

# 良い例: 変数で管理する
tax_rate = 0.1
price = 1000

# ...様々な処理...
payment = price * (1 + tax_rate)
print(payment)
1100.0

このように変数で管理すれば、最初の1行をtax_rate = 0.08に変更するだけで、全ての計算に正しく反映されます。これは、複雑なAIモデルを構築する上で不可欠なテクニックです。


AI開発で必須の基本データ型

変数という「箱」には、様々な性質のデータを入れることができます。このデータの種類のことを**「データ型 (Data Type)」**と呼びます。 まずはAI・機械学習の現場で頻繁に使われる4つの基本データ型をマスターしましょう。

1. 整数型 (int)

整数型 (integer) は、-1, 0, 100 のような小数点を含まない数値です。

  • 身近な例: user_age = 25, item_count = 3
  • AI/MLでの役割: このように個数や回数を数える整数は、AI開発ではディープラーニングの学習回数(エポック数)、画像のピクセル数、あるいは「犬=0, 猫=1」のようにカテゴリを数字で表現する際などに使われます。

2. 浮動小数点数型 (float)

浮動小数点数型 (float) は、3.14, 1.75 のような小数点を含む数値です。

  • 身近な例: height_meter = 1.75, tax_rate = 0.1
  • AI/MLでの役割: 機械学習の計算において最も中心的なデータ型です。 モデルの性能評価(正解率0.985など)や、AIの学習を調整するための重要なパラメータ(学習率0.001など)は、ほとんどがこのfloatで表現されます。

3. 文字列型 (str)

文字列型 (string) は、"Hello"'Taro' のように、文字の連なりを表現します。" または ' で囲みます。

  • 身近な例: user_name = "Suzuki", message = "こんにちは"
  • AI/MLでの役割: 人間の言葉をAIに扱わせる自然言語処理 (NLP) の分野では、文章そのものが文字列型のデータとして扱われます。その他、データのファイルパスやグラフのラベルなど、様々な場面で活躍します。

4. ブール型 (bool)

ブール型 (boolean) は、True (真) と False (偽) の2つの値しか持たない特殊なデータ型です。

  • 身近な例: is_member = True, has_coupon = False
  • AI/MLでの役割: このON/OFFのような状態は、プログラムの動作を切り替える「フラグ」として使われます。例えば、モデルを「学習モード (is_training = True)」と「推論モード (is_training = False)」で切り替えたり、GPUを使用するかどうかを制御したりする際に不可欠です。

自分のデータの「型」を確認する方法

変数がどのデータ型を持っているかを確認するために、Pythonには type() という便利な組み込み関数が用意されています。

age = 25
height = 1.75
name = "Taro"
is_active = True

print(type(age))
print(type(height))
print(type(name))
print(type(is_active))

これを実行すると、以下のように各変数のデータ型が表示されます。

<class 'int'>
<class 'float'>
<class 'str'>
<class 'bool'>

予期せぬエラーの多くは、このデータ型の不一致が原因です。type()関数は、エラーの原因を特定する(デバッグ)際に非常に強力な武器となります。

予期せぬエラーの多くは、このデータ型の不一致が原因です。type()関数は、エラーの原因を特定する(デバッグ)際に非常に強力な武器となります。

また、よくあるエラーと解決策、pythonの型についてはこちらの記事でまとめています!


まとめ

今回は、プログラミングの基礎体力となる、変数とデータ型について学びました。

  • 変数: データに名前(ラベル)を付けて格納するための仕組み。
  • データ型: int, float, str, bool など、データの性質を表す分類。
  • type()関数: 変数のデータ型を調べるためのツール。

データを「箱」に入れ、その「性質」を理解できるようになったあなた。次はいよいよ、そのデータを使って様々な「計算」や「比較」を行っていきます。

次回は【第3回 基本的な演算と演算子】です。四則演算から、AIのロ-ジック構築に欠かせない比較演算までを学びます。お楽しみに!

コメント

タイトルとURLをコピーしました