Python ile Veri Analizi: Pandas Kütüphanesi

Python ile Veri Analizi: Pandas Kütüphanesi

Python ile Veri Analizi: Pandas Kütüphanesi

1. Giriş 

Veri analizi, modern dünyada karar alma süreçlerinin merkezinde yer alan kritik bir süreçtir. Büyük veri çağında, verilerin etkin bir şekilde işlenmesi, temizlenmesi ve analiz edilmesi gerekmektedir. Python programlama dili, veri analizi için geniş çapta kullanılan bir dizi güçlü kütüphane sunmaktadır. Bunlardan biri de Pandas kütüphanesidir. Pandas, özellikle veri manipülasyonu ve analizine yönelik güçlü fonksiyonlarıyla dikkat çeker. 

Python Programlama - TekNo Gen TR
Python Programlama - TekNo Gen TR

Bu makalede, Pandas kütüphanesinin temel özellikleri, veri okuma ve işleme yöntemleri, temel analiz teknikleri ve gerçek dünyadaki kullanım senaryoları ele alınacaktır.

2. Pandas Kütüphanesine Genel Bakış 

Pandas, veri manipülasyonu ve analizi için açık kaynaklı bir Python kütüphanesidir. 2008 yılında Wes McKinney tarafından geliştirilmiş ve açık kaynak olarak sunulmuştur. Pandas, özellikle tablo biçimindeki verilerin yönetimini kolaylaştıran DataFrame ve Series veri yapıları ile öne çıkar.

Pandas kütüphanesi, aşağıdaki avantajları sunar:

  • Büyük veri kümeleri üzerinde hızlı ve verimli işlemler gerçekleştirme
  • Veri temizleme, filtreleme ve dönüştürme
  • SQL benzeri veri manipülasyon işlemleri
  • Çeşitli dosya formatları (CSV, Excel, JSON, SQL vb.) ile çalışma
  • Güçlü zaman serisi analizi desteği

3. Pandas Veri Yapıları

3.1. Series Veri Yapısı 

Series, Pandas’ın temel veri yapılarından biridir ve tek boyutlu diziler olarak düşünülebilir. Bir Series nesnesi, etiketlenmiş veri değerlerinden oluşur.

Örnek:

import pandas as pd
import numpy as np

data = pd.Series([10, 20, 30, 40], index=["a", "b", "c", "d"])
print(data)

Bu kod parçası, indekslenmiş bir Series nesnesi oluşturur.

3.2. DataFrame Veri Yapısı 

DataFrame, Pandas’ın en önemli veri yapısıdır ve iki boyutlu tablo benzeri bir yapıya sahiptir. Veri analizinde yaygın olarak kullanılır.

Örnek:

data = {"isim": ["Ahmet", "Ayşe", "Mehmet"], "yaş": [25, 30, 35], "maas": [4000, 5000, 6000]}
df = pd.DataFrame(data)
print(df)

Bu kod, üç sütundan oluşan bir DataFrame nesnesi oluşturur.

4. Pandas ile Veri Okuma ve Yazma 

Pandas, farklı formatlardaki verileri okuyabilir ve dışa aktarabilir.

4.1. CSV Dosyası Okuma ve Yazma

df = pd.read_csv("veri.csv")  # CSV dosyasını okuma
df.to_csv("yeni_veri.csv", index=False)  # CSV dosyasına yazma

4.2. Excel Dosyası Okuma ve Yazma

df = pd.read_excel("veri.xlsx")  # Excel dosyasını okuma
df.to_excel("yeni_veri.xlsx", index=False)  # Excel dosyasına yazma

5. Veri Manipülasyonu ve Temizleme 

Veri analizi süreçlerinde, verinin temizlenmesi ve düzenlenmesi gereklidir. Pandas, veri temizleme işlemlerini kolaylaştıran birçok fonksiyon sunar.

5.1. Eksik Verileri İşleme

df.dropna()  # Eksik verileri silme
df.fillna(value=0)  # Eksik verileri 0 ile doldurma

5.2. Sütun ve Satır Seçimi

df["isim"]  # Belirli bir sütunu seçme
df.iloc[0]  # Belirli bir satırı seçme

5.3. Filtreleme ve Koşullu Seçim

df[df["yaş"] > 30]  # Yaşı 30'dan büyük olanları seçme

6. Veri Analizi Teknikleri

6.1. Temel İstatistiksel İşlemler 

Pandas, veriler üzerinde temel istatistiksel işlemleri kolaylaştırır.

df.describe()  # Temel istatistiksel özet
df.mean()  # Ortalamalar
df.median()  # Medyan değerler

6.2. Gruplama ve Toplulaştırma 

Gruplama işlemleri, büyük veri kümelerinin özetlenmesi için kullanılır.

df.groupby("departman")["maas"].mean()  # Departmana göre maaş ortalamalarını hesaplama

7. Pandas’ın Gerçek Dünya Kullanım Alanları

Pandas, veri analizi ve iş zekası gibi alanlarda yaygın olarak kullanılmaktadır. Örnek kullanım alanları şunlardır:

  • Finansal veri analizi
  • Sağlık verilerinin işlenmesi
  • Büyük ölçekli e-ticaret analizleri
  • Makine öğrenmesi ön işlemleri

8. Sonuç 

Pandas, veri analizi ve manipülasyonu için güçlü ve esnek bir kütüphanedir. Özellikle büyük veri kümeleriyle çalışırken, Pandas’ın sağladığı fonksiyonlar sayesinde veriler hızlı ve verimli bir şekilde işlenebilir. Bu makalede, Pandas’ın temel veri yapıları, veri okuma ve temizleme işlemleri ile veri analizi teknikleri ele alınmıştır. Gelecekte Pandas kütüphanesinin gelişerek veri bilimi ve yapay zeka uygulamalarında daha da önemli bir yer edinmesi beklenmektedir.

9. Kaynakça

  • McKinney, W. (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly Media.
  • VanderPlas, J. (2016). Python Data Science Handbook: Essential Tools for Working with Data. O'Reilly Media.
  • Pandas Resmi Dokümantasyonu: https://pandas.pydata.org/docs/
  • NumPy Resmi Dokümantasyonu: https://numpy.org/doc/

10. Kaynak: (TekNo.Gen.TR)

Bu doküman, platformumuzun uzman editörleri tarafından özenle hazırlanarak titizlikle derlenmiştir. İçerik, alanında deneyimli profesyonellerin katkılarıyla, en güncel bilgilere ve kaynaklara dayanarak oluşturulmuştur. 

Python Programlama - TekNo Gen TR
Python Programlama - TekNo Gen TR
Bilgi

Python Programlama - Ak Web TR
Python Programlama - Ak Web TR

Ak.Web.TR, Python Programlama alanında kapsamlı eğitimler sunarak, katılımcıların yazılım geliştirme becerilerini ileriye taşımasına yardımcı olmaktadır. Python'un basit ve etkili yapısı, hem yeni başlayanlar hem de deneyimli yazılımcılar için ideal bir dil olmasını sağlar. Eğitimlerimiz, veri analitiği, yapay zeka, web geliştirme ve otomasyon gibi geniş alanlarda derinlemesine bilgi edinmenizi sağlar. Python programlamada temel kavramlardan ileri düzey tekniklere kadar geniş bir yelpazede içerik sunan kurslarımız, katılımcılara sektördeki en güncel bilgileri öğretmek amacıyla tasarlanmıştır. 

Ak.Web.TR ile Python öğrenerek, yazılım dünyasında güçlü bir kariyer temeli oluşturabilirsiniz.

Editör

Zara
Ben Zara, CSS Tasarım Uzmanıyım. Ak. WEB

Yorum Gönder

Teknoloji Haberleri Dünyası Ak | WEB