VERİ KEŞFİ · KURULUM REHBERİ

BigQuery Kurulumu: Sıfırdan İlk SQL Sorguna

Ömür Yalçın Mutlu · Güncellendi: 2 Temmuz 2026

Bu rehber sonunda ne yapabileceksin?

Kredi kartı vermeden, yalnızca tarayıcın ve bir Google hesabınla BigQuery'yi açacak, hazır bir genel veri kümesini bulacak ve doğrulanmış üç SQL sorgusunu çalıştırıp kendi ilk sonucunu okuyacaksın. Kelime sıklığı analiziyle bitiren küçük bir mini projen de olacak.

01Neden öğreniyoruz?

Neden BigQuery?

Bir veri analisti olarak ilk gerçek engelin çoğu zaman veri değil, veriye ulaşmak ve onu sorgulayabilmektir. Elinde ilginç bir soru var — "hangi kelime en çok geçiyor?", "hangi ay en çok doğum olmuş?" — ama sorgulayacağın bir yer, kuracağın bir veritabanı yok. Kurulumla uğraşırken merakın soğuyor.

BigQuery tam bu boşluğu kapatır: kurulum yok, sunucu yok, indirilecek gigabaytlarca dosya yok. Tarayıcıda bir sorgu yazarsın, Google'ın barındırdığı hazır ve büyük veri kümeleri üstünde saniyeler içinde cevabını alırsın. Yeni başlayan için değeri şudur: SQL öğrenmeye ilk günden gerçek, büyük veriyle başlayabilirsin. Öğrendiğin bu beceri doğrudan portföyüne ve mülakatlarına yazılır.

02Zihinsel model

Benzetme: Çalışma odası, klasör, dosya

BigQuery'nin dört temel kavramını somut bir sahneye oturtalım; bu resim aklında kalırsa arayüz hiç yabancı gelmeyecek:

BigQueryDevasa veri sorgu deposu

Milyonlarca satırı saniyeler içinde tarayan büyük ambar. Sen soruyu yazarsın, o dev rafların arasında koşup cevabı getirir.

ProjeÇalışma odan

Tüm işinin toplandığı oda. Faturalandırma, erişim ve ayarlar bu odaya bağlıdır; her şey bir projenin içinde yaşar.

DatasetOdadaki bir klasör

İlgili tabloları bir arada tutan klasör. Örneğin 'samples' klasörü, öğrenmeye uygun örnek tabloları toplar.

TableKlasördeki dosya

Asıl veriyi tutan tablo — satırlar ve sütunlar. 'shakespeare' bu klasörün içindeki bir dosya gibidir.

Özetle: BigQuery = büyük veri sorgu deposu · Proje = çalışma odası · Dataset = klasör · Table = dosya. Birazdan sorgulayacağın adres bu mantıkla okunur: bigquery-public-data.samples.shakespeare yani proje.klasör.dosya.

03Hazırlık

Gerekli araçlar

İyi haber: kurulacak bir şey yok. Bu rehber için elinde olması gereken tek şey:

  • Güncel bir web tarayıcısı (Chrome, Edge, Firefox — hepsi olur).
  • Bir Google hesabı (Gmail hesabın yeterli).
  • Yaklaşık 15 dakika ve merak.

Program indirmek, veritabanı sunucusu kurmak ya da komut satırıyla uğraşmak zorunda değilsin. İleride istersen bq komut satırı aracını da kullanabilirsin (bölüm 08), ama başlamak için tarayıcı yeter.

04Adım adım uygulama

BigQuery Console'a giriş

Sandbox modu, BigQuery'yi kredi kartı vermeden denemene izin verir. Sorgu yazıp çalıştırmak için başlangıçta bu yeterlidir. Adımlar:

  1. 1Google hesabınla giriş yap, sonra BigQuery Konsolu'nu aç.
  2. 2İlk kez giriyorsan Google Cloud seni yeni bir proje oluşturmaya yönlendirir. Projeye anlamlı bir ad ver (örn. 'ogrenme-sql'). Bu senin 'çalışma odan' olacak.
  3. 3Kredi kartı istenmeden devam edebiliyorsan sandbox modundasın demektir. Bu modda hazır genel veri kümelerini sorgulayabilirsin.
  4. 4Sol taraftaki gezinme panelinden veri kümelerini, üstteki editörden ise sorgularını yazacaksın.

Ücret ve kota uyarısı

BigQuery'nin ücretsiz sorgu kotası, depolama ücretleri ve faturalandırma koşulları zaman içinde değişir. Bu sayfada kesin rakam yazmıyoruz. Güncel kota, fiyatlandırma ve billing için her zaman resmi Google Cloud dokümanını kontrol et.

Sandbox ile faturalandırma etkinleştirmenin farkları ve güncel sınırlar için resmi BigQuery sandbox dokümanına bak.

05Veriyi bulma

Genel bir veri kümesi bulmak

Google, herkesin ücretsiz sorgulayabildiği veri kümelerini bigquery-public-data projesinde toplar. Bizim öğrenme için kullanacağımız tablo, küçük ve anlaşılır olan samples.shakespeare: Shakespeare'in eserlerindeki her kelimenin kaç kez geçtiğini tutar.

samples.shakespeare — sütunlar

SütunTipNe tutar
wordSTRINGKelimenin kendisi
word_countINT64O kelimenin o eserde geçme sayısı
corpusSTRINGEserin adı (küçük harf, örn. hamlet)
corpus_dateINT64Eserin tahmini yazım yılı

Diğer genel veri kümeleri de vardır — doğum kayıtları samples.natality, hava durumu samples.gsod, Wikipedia gibi. Bunların ne içerdiğini merak et, ama sütun adlarını önce konsolda doğrula: her tablonun şeması farklıdır. Bu rehberde çalıştırılabilir sorguları yalnızca sütunlarını kesin bildiğimiz shakespeare üstünden veriyoruz.

06Ana kalıplar

İlk SQL sorguların (3 çalıştırılabilir sorgu)

Aşağıdaki üç sorgu, shakespeare tablosunun doğrulanmış sütunlarıyla yazılmıştır ve olduğu gibi çalışır. Her birini konsoldaki editöre yapıştır, Çalıştır (Run) de ve sonucu incele. Sırayla gitmeni öneririm — her sorgu bir SQL kalıbı öğretir.

Q1

En sık geçen 10 kelime

Tüm oyunlarda her kelimenin toplam kullanımını toplar, en çok kullanılan 10 kelimeyi büyükten küçüğe sıralar. İlk çalıştıracağın sorgu bu olsun; sonucu bir tablo hâlinde görürsün.

Sorgu Q1SQL
SELECT
  word,
  SUM(word_count) AS total_count
FROM `bigquery-public-data.samples.shakespeare`
GROUP BY word
ORDER BY total_count DESC
LIMIT 10;
Q2

Kaç farklı kelime var?

Tablodaki benzersiz (tekrarsız) kelime sayısını tek bir rakam olarak döndürür. COUNT(DISTINCT ...) kalıbını ilk kez burada görüyorsun: aynı kelime farklı oyunlarda geçse bile bir kez sayılır.

Sorgu Q2SQL
SELECT
  COUNT(DISTINCT word) AS distinct_words
FROM `bigquery-public-data.samples.shakespeare`;
Q3

Yalnızca Hamlet'in en sık kelimeleri

WHERE ile veriyi tek bir oyuna (corpus = 'hamlet') daraltır, o oyunda en çok geçen 10 kelimeyi listeler. Filtreleme + sıralama + sınırlama kalıbını bir arada görürsün.

Sorgu Q3SQL
SELECT
  word,
  word_count
FROM `bigquery-public-data.samples.shakespeare`
WHERE corpus = 'hamlet'
ORDER BY word_count DESC
LIMIT 10;

İpucu: Konsol, sorguyu çalıştırmadan önce ne kadar veri tarayacağını tahmini olarak gösterir. Bu, ücretin veri tarama miktarına bağlı olduğunu hatırlatan güzel bir alışkanlıktır — ama kesin ücret/kota için her zaman resmi fiyatlandırma dokümanına bak.

07Kontrol noktası

Kendini sına

Devam etmeden önce şu soruları kendine cevapla. Hepsine "evet" diyebiliyorsan temeli attın demektir:

  • 1Q1 sorgusu çalıştı mı ve sana bir tablo (kelime + sayı) döndürdü mü?
  • 2Q1 sonucunda kaç satır geldi? (LIMIT 10 dediğimize göre kaç bekliyorsun?)
  • 3En sık geçen kelime hangisiydi? Seni şaşırttı mı, yoksa tahmin ettiğin gibi mi?
  • 4Q2'de kaç farklı kelime çıktı? Bu sayı tek bir hücre miydi?
  • 5Q3'te sadece Hamlet'e daralttığında sonuç Q1'den nasıl farklılaştı?

08Takılırsan

Alternatif yollar

Konsolda bir yere takıldıysan ya da farklı bir ortam denemek istiyorsan, aynı SQL bilgisini başka kapılardan da kullanabilirsin:

bq komut satırı

Terminali sevenler için Google'ın resmi CLI aracı. Aynı sorguları tarayıcı yerine komut satırından çalıştırırsın.

Colab + Python

Google Colab'da BigQuery istemcisiyle sorgu sonucunu doğrudan bir Python tablosuna (DataFrame) alıp analiz edebilirsin.

Yerel SQLite

İnternetsiz pratik için küçük veriyle SQLite kur. Sözdizimi birebir aynı olmasa da SELECT / WHERE / GROUP BY mantığı aynıdır.

Kurulum ve komut ayrıntıları için resmi bq komut satırı dokümanına bakabilirsin.

09Proje çıktısı

Mini proje: Kelime sıklığı analizi

Şimdi öğrendiklerini küçük bir çıktıya dönüştürelim. Amaç sadece sorgu çalıştırmak değil, bulgunu yorumlamak — çünkü işverenin aradığı beceri budur.

  1. 1Q1'i çalıştır ve en sık geçen 10 kelimeyi not al. Bunların çoğu 'the', 'and', 'to' gibi bağlaç/edat mı? (Bunlara 'stop words' denir.)
  2. 2Q3'ü Hamlet için çalıştır; sonra corpus değerini 'macbeth' yapıp tekrar çalıştır. İki oyunun en sık kelimeleri arasında dikkat çeken bir fark var mı?
  3. 3Kısa bir gözlem cümlesi yaz: 'En sık kelimeler anlam taşımıyor çünkü…' ve 'Anlamlı kelimelere ulaşmak için şunu yapardım: …' (ipucu: stop words'ü filtrelemek).

Portföye nasıl bağlanır?

Sorgularını, ekran görüntülerini ve o üç-dört cümlelik yorumunu tek bir not hâline getir: "BigQuery ile Shakespeare kelime sıklığı — ilk SQL analizim". Bu, mülakatta "gerçek bir veri kümesiyle SQL çalıştırdın mı?" sorusuna somut cevabın olur. Küçük ama gerçek bir çıktı, "kurs izledim" demekten her zaman güçlüdür.

10Dokümantasyon

Resmi kaynaklar

Öğrenme günlüğü satırı

"Bugün BigQuery'yi tarayıcıdan açtım, kredi kartı olmadan sandbox'ta samples.shakespeare üstünde ilk üç SQL sorgumu çalıştırdım. En sık geçen kelimenin anlam taşımayan bir bağlaç olduğunu, anlamlı analiz için bunları filtrelemem gerektiğini fark ettim. Bir sonraki adım: WHERE ile kendi filtrelerimi kurmayı denemek."