M8 · Pandas ile Veri Analizi
DataFrame: Verinin Konuşan Hali
Neden bu konu?
Spreadsheet yüz bin satırda yavaşlar ve en önemlisi: yaptığın işlemler kayıt altına alınmaz — 'bu sayıya nasıl ulaştın?' sorusunun cevabı tıklamalarında kaybolur. DataFrame iki sorunu birden çözer: milyonlarca satırı rahatça taşır VE her adım kod olarak yazılı kalır, yani analizin tekrarlanabilir ve denetlenebilir olur. Ayrıca pandas, makine öğrenmesi dünyasının giriş kapısıdır: scikit-learn gibi kütüphaneler DataFrame ile beslenir — DS yolculuğunun altyapısını bugün döşüyorsun.
Benzetme: kavramın günlük karşılığı
DataFrame, konuşabilen bir spreadsheet sekmesidir. Hücrelere tıklamak yerine ona cümle kurarsın: 'İzmir siparişlerini göster' cümlesinin pandas'çası df[df["sehir"]=="İzmir"]. Sheet'te elinle yaptığın her tıklamanın burada yazılı bir karşılığı var — ve yazılı olduğu için tekrarı bedava: aynı analizi yarınki veriyle çalıştırmak tek tuş.
Bu işin sırrı: kalıplar
- oku → bak seremonisi: read_csv ile oku; head() (ilk satırlar), info() (tipler + eksikler), describe() (özet istatistik) ile tanış. Yeni veriyle her karşılaşmanın ilk üç hamlesi hep budur.
- Köşeli parantez = seçim/filtre: df["sutun"] tek sütunu seçer; df[koşul] koşula uyan SATIRLARI süzer. İçeride ne olduğuna bak: metin → sütun, koşul → filtre.
+ 2 kalıp daha tam derste
İlk uygulama adımı
1. Sıfır kurulumla ortam aç
Tarayıcıda colab.research.google.com'a git, 'New notebook' de. İlk hücreye şunu yaz ve Shift+Enter ile çalıştır: import pandas as pd
Kontrol noktası: Hücre hatasız çalıştı; hiçbir çıktı görünmemesi NORMAL (import sessizdir).
+ 4 adım daha tam derste
Dersin devamı erken erişimde
Tam derste seni bekleyenler: 5 kontrol noktalı uygulama adımı, gerçek dünya kullanımı (analist + scientist + AI perspektifi), 3 yaygın tuzak, mülakat sorusu ve model cevabı, 4 soruluk quiz, 6 tekrar kartı ve NovaCommerce proje görevi.