Python ile Veri Analizi: Pandas Kütüphanesi
1. Giriş
Veri analizi, modern dünyada karar alma süreçlerinin merkezinde yer alan kritik bir süreçtir. Büyük veri çağında, verilerin etkin bir şekilde işlenmesi, temizlenmesi ve analiz edilmesi gerekmektedir. Python programlama dili, veri analizi için geniş çapta kullanılan bir dizi güçlü kütüphane sunmaktadır. Bunlardan biri de Pandas kütüphanesidir. Pandas, özellikle veri manipülasyonu ve analizine yönelik güçlü fonksiyonlarıyla dikkat çeker.
![]() |
Python Programlama - TekNo Gen TR |
Bu makalede, Pandas kütüphanesinin temel özellikleri, veri okuma ve işleme yöntemleri, temel analiz teknikleri ve gerçek dünyadaki kullanım senaryoları ele alınacaktır.
2. Pandas Kütüphanesine Genel Bakış
Pandas, veri manipülasyonu ve analizi için açık kaynaklı bir Python kütüphanesidir. 2008 yılında Wes McKinney tarafından geliştirilmiş ve açık kaynak olarak sunulmuştur. Pandas, özellikle tablo biçimindeki verilerin yönetimini kolaylaştıran DataFrame ve Series veri yapıları ile öne çıkar.
Pandas kütüphanesi, aşağıdaki avantajları sunar:
- Büyük veri kümeleri üzerinde hızlı ve verimli işlemler gerçekleştirme
- Veri temizleme, filtreleme ve dönüştürme
- SQL benzeri veri manipülasyon işlemleri
- Çeşitli dosya formatları (CSV, Excel, JSON, SQL vb.) ile çalışma
- Güçlü zaman serisi analizi desteği
3. Pandas Veri Yapıları
3.1. Series Veri Yapısı
Series, Pandas’ın temel veri yapılarından biridir ve tek boyutlu diziler olarak düşünülebilir. Bir Series nesnesi, etiketlenmiş veri değerlerinden oluşur.
Örnek:
import pandas as pd
import numpy as np
data = pd.Series([10, 20, 30, 40], index=["a", "b", "c", "d"])
print(data)
Bu kod parçası, indekslenmiş bir Series nesnesi oluşturur.
3.2. DataFrame Veri Yapısı
DataFrame, Pandas’ın en önemli veri yapısıdır ve iki boyutlu tablo benzeri bir yapıya sahiptir. Veri analizinde yaygın olarak kullanılır.
Örnek:
data = {"isim": ["Ahmet", "Ayşe", "Mehmet"], "yaş": [25, 30, 35], "maas": [4000, 5000, 6000]}
df = pd.DataFrame(data)
print(df)
Bu kod, üç sütundan oluşan bir DataFrame nesnesi oluşturur.
4. Pandas ile Veri Okuma ve Yazma
Pandas, farklı formatlardaki verileri okuyabilir ve dışa aktarabilir.
4.1. CSV Dosyası Okuma ve Yazma
df = pd.read_csv("veri.csv") # CSV dosyasını okuma
df.to_csv("yeni_veri.csv", index=False) # CSV dosyasına yazma
4.2. Excel Dosyası Okuma ve Yazma
df = pd.read_excel("veri.xlsx") # Excel dosyasını okuma
df.to_excel("yeni_veri.xlsx", index=False) # Excel dosyasına yazma
5. Veri Manipülasyonu ve Temizleme
Veri analizi süreçlerinde, verinin temizlenmesi ve düzenlenmesi gereklidir. Pandas, veri temizleme işlemlerini kolaylaştıran birçok fonksiyon sunar.
5.1. Eksik Verileri İşleme
df.dropna() # Eksik verileri silme
df.fillna(value=0) # Eksik verileri 0 ile doldurma
5.2. Sütun ve Satır Seçimi
df["isim"] # Belirli bir sütunu seçme
df.iloc[0] # Belirli bir satırı seçme
5.3. Filtreleme ve Koşullu Seçim
df[df["yaş"] > 30] # Yaşı 30'dan büyük olanları seçme
6. Veri Analizi Teknikleri
6.1. Temel İstatistiksel İşlemler
Pandas, veriler üzerinde temel istatistiksel işlemleri kolaylaştırır.
df.describe() # Temel istatistiksel özet
df.mean() # Ortalamalar
df.median() # Medyan değerler
6.2. Gruplama ve Toplulaştırma
Gruplama işlemleri, büyük veri kümelerinin özetlenmesi için kullanılır.
df.groupby("departman")["maas"].mean() # Departmana göre maaş ortalamalarını hesaplama
7. Pandas’ın Gerçek Dünya Kullanım Alanları
Pandas, veri analizi ve iş zekası gibi alanlarda yaygın olarak kullanılmaktadır. Örnek kullanım alanları şunlardır:
- Finansal veri analizi
- Sağlık verilerinin işlenmesi
- Büyük ölçekli e-ticaret analizleri
- Makine öğrenmesi ön işlemleri
8. Sonuç
Pandas, veri analizi ve manipülasyonu için güçlü ve esnek bir kütüphanedir. Özellikle büyük veri kümeleriyle çalışırken, Pandas’ın sağladığı fonksiyonlar sayesinde veriler hızlı ve verimli bir şekilde işlenebilir. Bu makalede, Pandas’ın temel veri yapıları, veri okuma ve temizleme işlemleri ile veri analizi teknikleri ele alınmıştır. Gelecekte Pandas kütüphanesinin gelişerek veri bilimi ve yapay zeka uygulamalarında daha da önemli bir yer edinmesi beklenmektedir.
9. Kaynakça
- McKinney, W. (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly Media.
- VanderPlas, J. (2016). Python Data Science Handbook: Essential Tools for Working with Data. O'Reilly Media.
- Pandas Resmi Dokümantasyonu: https://pandas.pydata.org/docs/
- NumPy Resmi Dokümantasyonu: https://numpy.org/doc/
10. Kaynak: (TekNo.Gen.TR)
Bu doküman, platformumuzun uzman editörleri tarafından özenle hazırlanarak titizlikle derlenmiştir. İçerik, alanında deneyimli profesyonellerin katkılarıyla, en güncel bilgilere ve kaynaklara dayanarak oluşturulmuştur.
![]() |
Python Programlama - TekNo Gen TR |
![]() |
Python Programlama - Ak Web TR |
Ak.Web.TR, Python Programlama alanında kapsamlı eğitimler sunarak, katılımcıların yazılım geliştirme becerilerini ileriye taşımasına yardımcı olmaktadır. Python'un basit ve etkili yapısı, hem yeni başlayanlar hem de deneyimli yazılımcılar için ideal bir dil olmasını sağlar. Eğitimlerimiz, veri analitiği, yapay zeka, web geliştirme ve otomasyon gibi geniş alanlarda derinlemesine bilgi edinmenizi sağlar. Python programlamada temel kavramlardan ileri düzey tekniklere kadar geniş bir yelpazede içerik sunan kurslarımız, katılımcılara sektördeki en güncel bilgileri öğretmek amacıyla tasarlanmıştır.
Ak.Web.TR ile Python öğrenerek, yazılım dünyasında güçlü bir kariyer temeli oluşturabilirsiniz.