VERİ KEŞFİ · KURULUM REHBERİ
BigQuery Kurulumu: Sıfırdan İlk SQL Sorguna
Ömür Yalçın Mutlu · Güncellendi: 2 Temmuz 2026
Bu rehber sonunda ne yapabileceksin?
Kredi kartı vermeden, yalnızca tarayıcın ve bir Google hesabınla BigQuery'yi açacak, hazır bir genel veri kümesini bulacak ve doğrulanmış üç SQL sorgusunu çalıştırıp kendi ilk sonucunu okuyacaksın. Kelime sıklığı analiziyle bitiren küçük bir mini projen de olacak.
01Neden öğreniyoruz?
Neden BigQuery?
Bir veri analisti olarak ilk gerçek engelin çoğu zaman veri değil, veriye ulaşmak ve onu sorgulayabilmektir. Elinde ilginç bir soru var — "hangi kelime en çok geçiyor?", "hangi ay en çok doğum olmuş?" — ama sorgulayacağın bir yer, kuracağın bir veritabanı yok. Kurulumla uğraşırken merakın soğuyor.
BigQuery tam bu boşluğu kapatır: kurulum yok, sunucu yok, indirilecek gigabaytlarca dosya yok. Tarayıcıda bir sorgu yazarsın, Google'ın barındırdığı hazır ve büyük veri kümeleri üstünde saniyeler içinde cevabını alırsın. Yeni başlayan için değeri şudur: SQL öğrenmeye ilk günden gerçek, büyük veriyle başlayabilirsin. Öğrendiğin bu beceri doğrudan portföyüne ve mülakatlarına yazılır.
02Zihinsel model
Benzetme: Çalışma odası, klasör, dosya
BigQuery'nin dört temel kavramını somut bir sahneye oturtalım; bu resim aklında kalırsa arayüz hiç yabancı gelmeyecek:
Milyonlarca satırı saniyeler içinde tarayan büyük ambar. Sen soruyu yazarsın, o dev rafların arasında koşup cevabı getirir.
Tüm işinin toplandığı oda. Faturalandırma, erişim ve ayarlar bu odaya bağlıdır; her şey bir projenin içinde yaşar.
İlgili tabloları bir arada tutan klasör. Örneğin 'samples' klasörü, öğrenmeye uygun örnek tabloları toplar.
Asıl veriyi tutan tablo — satırlar ve sütunlar. 'shakespeare' bu klasörün içindeki bir dosya gibidir.
Özetle: BigQuery = büyük veri sorgu deposu · Proje = çalışma odası · Dataset = klasör · Table = dosya. Birazdan sorgulayacağın adres bu mantıkla okunur: bigquery-public-data.samples.shakespeare yani proje.klasör.dosya.
03Hazırlık
Gerekli araçlar
İyi haber: kurulacak bir şey yok. Bu rehber için elinde olması gereken tek şey:
- •Güncel bir web tarayıcısı (Chrome, Edge, Firefox — hepsi olur).
- •Bir Google hesabı (Gmail hesabın yeterli).
- •Yaklaşık 15 dakika ve merak.
Program indirmek, veritabanı sunucusu kurmak ya da komut satırıyla uğraşmak zorunda değilsin. İleride istersen bq komut satırı aracını da kullanabilirsin (bölüm 08), ama başlamak için tarayıcı yeter.
04Adım adım uygulama
BigQuery Console'a giriş
Sandbox modu, BigQuery'yi kredi kartı vermeden denemene izin verir. Sorgu yazıp çalıştırmak için başlangıçta bu yeterlidir. Adımlar:
- 1Google hesabınla giriş yap, sonra BigQuery Konsolu'nu aç.
- 2İlk kez giriyorsan Google Cloud seni yeni bir proje oluşturmaya yönlendirir. Projeye anlamlı bir ad ver (örn. 'ogrenme-sql'). Bu senin 'çalışma odan' olacak.
- 3Kredi kartı istenmeden devam edebiliyorsan sandbox modundasın demektir. Bu modda hazır genel veri kümelerini sorgulayabilirsin.
- 4Sol taraftaki gezinme panelinden veri kümelerini, üstteki editörden ise sorgularını yazacaksın.
Ücret ve kota uyarısı
BigQuery'nin ücretsiz sorgu kotası, depolama ücretleri ve faturalandırma koşulları zaman içinde değişir. Bu sayfada kesin rakam yazmıyoruz. Güncel kota, fiyatlandırma ve billing için her zaman resmi Google Cloud dokümanını kontrol et.
Sandbox ile faturalandırma etkinleştirmenin farkları ve güncel sınırlar için resmi BigQuery sandbox dokümanına bak.
05Veriyi bulma
Genel bir veri kümesi bulmak
Google, herkesin ücretsiz sorgulayabildiği veri kümelerini bigquery-public-data projesinde toplar. Bizim öğrenme için kullanacağımız tablo, küçük ve anlaşılır olan samples.shakespeare: Shakespeare'in eserlerindeki her kelimenin kaç kez geçtiğini tutar.
samples.shakespeare — sütunlar
| Sütun | Tip | Ne tutar |
|---|---|---|
| word | STRING | Kelimenin kendisi |
| word_count | INT64 | O kelimenin o eserde geçme sayısı |
| corpus | STRING | Eserin adı (küçük harf, örn. hamlet) |
| corpus_date | INT64 | Eserin tahmini yazım yılı |
Diğer genel veri kümeleri de vardır — doğum kayıtları samples.natality, hava durumu samples.gsod, Wikipedia gibi. Bunların ne içerdiğini merak et, ama sütun adlarını önce konsolda doğrula: her tablonun şeması farklıdır. Bu rehberde çalıştırılabilir sorguları yalnızca sütunlarını kesin bildiğimiz shakespeare üstünden veriyoruz.
06Ana kalıplar
İlk SQL sorguların (3 çalıştırılabilir sorgu)
Aşağıdaki üç sorgu, shakespeare tablosunun doğrulanmış sütunlarıyla yazılmıştır ve olduğu gibi çalışır. Her birini konsoldaki editöre yapıştır, Çalıştır (Run) de ve sonucu incele. Sırayla gitmeni öneririm — her sorgu bir SQL kalıbı öğretir.
En sık geçen 10 kelime
Tüm oyunlarda her kelimenin toplam kullanımını toplar, en çok kullanılan 10 kelimeyi büyükten küçüğe sıralar. İlk çalıştıracağın sorgu bu olsun; sonucu bir tablo hâlinde görürsün.
SELECT
word,
SUM(word_count) AS total_count
FROM `bigquery-public-data.samples.shakespeare`
GROUP BY word
ORDER BY total_count DESC
LIMIT 10;Kaç farklı kelime var?
Tablodaki benzersiz (tekrarsız) kelime sayısını tek bir rakam olarak döndürür. COUNT(DISTINCT ...) kalıbını ilk kez burada görüyorsun: aynı kelime farklı oyunlarda geçse bile bir kez sayılır.
SELECT
COUNT(DISTINCT word) AS distinct_words
FROM `bigquery-public-data.samples.shakespeare`;Yalnızca Hamlet'in en sık kelimeleri
WHERE ile veriyi tek bir oyuna (corpus = 'hamlet') daraltır, o oyunda en çok geçen 10 kelimeyi listeler. Filtreleme + sıralama + sınırlama kalıbını bir arada görürsün.
SELECT
word,
word_count
FROM `bigquery-public-data.samples.shakespeare`
WHERE corpus = 'hamlet'
ORDER BY word_count DESC
LIMIT 10;İpucu: Konsol, sorguyu çalıştırmadan önce ne kadar veri tarayacağını tahmini olarak gösterir. Bu, ücretin veri tarama miktarına bağlı olduğunu hatırlatan güzel bir alışkanlıktır — ama kesin ücret/kota için her zaman resmi fiyatlandırma dokümanına bak.
07Kontrol noktası
Kendini sına
Devam etmeden önce şu soruları kendine cevapla. Hepsine "evet" diyebiliyorsan temeli attın demektir:
- 1Q1 sorgusu çalıştı mı ve sana bir tablo (kelime + sayı) döndürdü mü?
- 2Q1 sonucunda kaç satır geldi? (LIMIT 10 dediğimize göre kaç bekliyorsun?)
- 3En sık geçen kelime hangisiydi? Seni şaşırttı mı, yoksa tahmin ettiğin gibi mi?
- 4Q2'de kaç farklı kelime çıktı? Bu sayı tek bir hücre miydi?
- 5Q3'te sadece Hamlet'e daralttığında sonuç Q1'den nasıl farklılaştı?
08Takılırsan
Alternatif yollar
Konsolda bir yere takıldıysan ya da farklı bir ortam denemek istiyorsan, aynı SQL bilgisini başka kapılardan da kullanabilirsin:
bq komut satırı
Terminali sevenler için Google'ın resmi CLI aracı. Aynı sorguları tarayıcı yerine komut satırından çalıştırırsın.
Colab + Python
Google Colab'da BigQuery istemcisiyle sorgu sonucunu doğrudan bir Python tablosuna (DataFrame) alıp analiz edebilirsin.
Yerel SQLite
İnternetsiz pratik için küçük veriyle SQLite kur. Sözdizimi birebir aynı olmasa da SELECT / WHERE / GROUP BY mantığı aynıdır.
Kurulum ve komut ayrıntıları için resmi bq komut satırı dokümanına bakabilirsin.
09Proje çıktısı
Mini proje: Kelime sıklığı analizi
Şimdi öğrendiklerini küçük bir çıktıya dönüştürelim. Amaç sadece sorgu çalıştırmak değil, bulgunu yorumlamak — çünkü işverenin aradığı beceri budur.
- 1Q1'i çalıştır ve en sık geçen 10 kelimeyi not al. Bunların çoğu 'the', 'and', 'to' gibi bağlaç/edat mı? (Bunlara 'stop words' denir.)
- 2Q3'ü Hamlet için çalıştır; sonra corpus değerini 'macbeth' yapıp tekrar çalıştır. İki oyunun en sık kelimeleri arasında dikkat çeken bir fark var mı?
- 3Kısa bir gözlem cümlesi yaz: 'En sık kelimeler anlam taşımıyor çünkü…' ve 'Anlamlı kelimelere ulaşmak için şunu yapardım: …' (ipucu: stop words'ü filtrelemek).
Portföye nasıl bağlanır?
Sorgularını, ekran görüntülerini ve o üç-dört cümlelik yorumunu tek bir not hâline getir: "BigQuery ile Shakespeare kelime sıklığı — ilk SQL analizim". Bu, mülakatta "gerçek bir veri kümesiyle SQL çalıştırdın mı?" sorusuna somut cevabın olur. Küçük ama gerçek bir çıktı, "kurs izledim" demekten her zaman güçlüdür.
10Dokümantasyon
Resmi kaynaklar
Bu rehber seni başlatmak için var; derinleşmek ve güncel bilgiye ulaşmak için her zaman resmi Google Cloud dokümanına git. Aşağıdakiler işine en çok yarayacak resmi kapılar:
BigQuery genel veri kümeleri (public data)
Google'ın barındırdığı ücretsiz sorgulanabilir veri kümelerinin ana sayfası.
BigQuery sandbox (kart gerektirmez)
Kredi kartı olmadan BigQuery'yi denemene izin veren kum havuzu modu.
Konsol hızlı başlangıç: genel veri kümesi sorgula
İlk sorgunu tarayıcıdaki konsolda çalıştırmayı adım adım gösteren resmi rehber.
Örnek tablolar (sample tables)
shakespeare gibi küçük, öğrenmeye uygun örnek tabloların listesi.
BigQuery fiyatlandırma
Sorgu ve depolama ücretlerinin güncel resmi kaynağı (rakamlar değişkendir).
Google Cloud ücretsiz katman
Ücretsiz kullanım sınırları ve yeni hesap avantajları (koşullar değişkendir).
BigQuery Konsolu
Sorgularını yazıp çalıştıracağın tarayıcı arayüzü.
bq komut satırı aracı
Konsol yerine terminalden sorgu çalıştırmak isteyenler için resmi CLI.
Ücret ve kota uyarısı
BigQuery'nin ücretsiz sorgu kotası, depolama ücretleri ve faturalandırma koşulları zaman içinde değişir. Bu sayfada kesin rakam yazmıyoruz. Güncel kota, fiyatlandırma ve billing için her zaman resmi Google Cloud dokümanını kontrol et.
Öğrenme günlüğü satırı
"Bugün BigQuery'yi tarayıcıdan açtım, kredi kartı olmadan sandbox'ta samples.shakespeare üstünde ilk üç SQL sorgumu çalıştırdım. En sık geçen kelimenin anlam taşımayan bir bağlaç olduğunu, anlamlı analiz için bunları filtrelemem gerektiğini fark ettim. Bir sonraki adım: WHERE ile kendi filtrelerimi kurmayı denemek."