AI API'leri ile geliştirmeye başlamak için kredi kartına ihtiyacınız yok. Ücretsiz katmanlar, açık kaynaklı modeller ve kayıt kredileri arasında; prototip oluşturmak, test etmek ve hatta küçük üretim iş yüklerini çalıştırmak için yeterli sıfır maliyetli seçenek mevcut.
İşte şu anda mevcut olan tüm ücretsiz seçenekler, pratik kullanışlılıklarına göre sıralanmıştır.
Eğer ücretsiz yolları bir geçiş basamağı olarak değerlendiriyorsanız, pricing comparison ve China developer guide sayfalarını yakınınızda bulundurun. Kağıt üzerindeki en ucuz yol, her zaman işletilmesi en kolay yol değildir.
1. Seviye: Resmi Ücretsiz Katmanlar (Kredi Kartı Gerekmez)
Google AI Studio (Gemini Modelleri)
Google hala en güçlü resmi ücretsiz katmana sahip, ancak kullanışlı seçenekler Gemini 3.1 ailesine doğru kaydı.
| Model | Ücretsiz Katman | Neden Önemli |
|---|---|---|
| Gemini 3.1 Flash-Lite Preview | Ücretsiz girdi/çıktı katmanı | ucuz, yüksek hacimli agentic işler |
| Gemini 3.1 Flash | Ücretsiz girdi/çıktı katmanı | genel amaçlı hızlı model |
| Gemini 3.1 Pro | Ücretsiz girdi/çıktı katmanı | uzun bağlam ile daha güçlü akıl yürütme |
| Gemini Embedding | Ücretsiz girdi katmanı | erken aşama RAG deneyleri için kullanışlı |
Prototip oluşturma ve kişisel projeler için bunu geçmek hala zor. Google AI Studio, bir karta dokunmadan modern bir öncü model ailesini denemenin en kolay resmi yolu olmaya devam ediyor.
from google import genai
client = genai.Client(api_key="YOUR_FREE_KEY")
response = client.models.generate_content(
model="gemini-3.1-flash",
contents="Explain quantum computing in simple terms"
)
print(response.text)
Groq (Açık Kaynaklı Modeller, Hızlı Inference)
Groq, son derece hızlı inference ile açık kaynaklı modellere ücretsiz erişim sağlar.
| Model | Ücretsiz Limit | Hız |
|---|---|---|
| Llama 3.3 70B | 30 req/min | ~500 tokens/sec |
| Mixtral 8x7B | 30 req/min | ~480 tokens/sec |
| Gemma 2 9B | 30 req/min | ~750 tokens/sec |
Groq'un hız avantajı gerçektir. Açık kaynaklı modelleri kullanabileceğiniz gecikmeye duyarlı uygulamalar için bu, en hızlı ücretsiz seçenektir.
Mistral (Le Plateforme)
Mistral, daha küçük modellerine ücretsiz API erişimi sunuyor.
| Model | Ücretsiz Limit |
|---|---|
| Mistral Small | Sınırlı ücretsiz katman |
| Codestral | Kod görevleri için ücretsiz |
Cloudflare Workers AI
Cloudflare'ın ücretsiz tahsisi artık istek sayısı yerine nöronlarla (neurons) ölçülüyor. Ücretsiz plan günlük 10.000 nöron içeriyor; bu, katı bir “N istek” sınırından daha esnektir ancak etkili ücretsiz hacmin hangi modeli çalıştırdığınıza bağlı olduğu anlamına gelir.
2. Seviye: Kayıt Kredileri (Kredi Kartı Gerekebilir)
OpenAI
Yeni hesaplar sınırlı ücretsiz kredi alır (miktar bölgeye ve zamana göre değişir). Bundan sonra minimum yükleme 5 dolardır.
Anthropic
Yeni API hesapları sınırlı ücretsiz kredi alır. Kredilerin süresi dolduktan sonra minimum yükleme 5 dolardır.
LemonData
Yeni hesaplar, kredi kartı gerektirmeden 1$ ücretsiz kredi alır. Bu yaklaşık şunları kapsar:
- 2.500 GPT-4.1-mini isteği (her biri 1K girdi + 500 çıktı token'ı)
- 150 Claude Sonnet 4.6 isteği
- 500 DeepSeek V3 isteği
LemonData 300'den fazla modeli bir araya getirdiği için, 1 dolarlık krediniz hepsinde geçerlidir.
Kayıt kredilerini ücretsiz bir katman değil, bir köprü sermayesi olarak düşünün. Bunlar, sağlayıcı uyumluluğunu test etmek için en iyisidir, etraflarında uzun ömürlü ücretsiz bir ürün tasarlamak için değil.
OpenRouter
OpenRouter'ın ücretsiz katmanı şu anda günlük 50 istek sınırı ile 25'ten fazla model içeriyor. Bu, deney yapmak ve model keşfi için yeterlidir, ancak istikrarlı bir ücretsiz üretim planı ile karıştırılmamalıdır.
3. Seviye: Açık Kaynaklı Modeller (Self-Hosted)
Eğer bir GPU'nuz (veya Apple Silicon işlemcili bir Mac'iniz) varsa, modelleri sıfır API maliyetiyle yerel olarak çalıştırabilirsiniz.
Ollama (En Kolay Kurulum)
# Install
curl -fsSL https://ollama.com/install.sh | sh
# Run a model
ollama run llama3.3
# Use as API (OpenAI-compatible)
curl http://localhost:11434/v1/chat/completions \
-d '{"model":"llama3.3","messages":[{"role":"user","content":"Hello"}]}'
Popüler Self-Hosted Modeller
| Model | Parametreler | Min RAM | Kalite |
|---|---|---|---|
| Llama 3.3 70B | 70B | 48GB | GPT-4 seviyesine yakın |
| Qwen 2.5 72B | 72B | 48GB | Güçlü çok dilli |
| DeepSeek R1 (distilled) | 32B | 24GB | İyi akıl yürütme |
| Mistral Small 3.1 | 24B | 16GB | Hızlı, verimli |
| Phi-4 | 14B | 12GB | Boyutuna göre iyi |
| Gemma 2 9B | 9B | 8GB | Hafif |
Donanım Gereksinimleri
- 8GB RAM: 7B modelleri çalıştırabilir (Gemma 2, Llama 3.2 3B)
- 16GB RAM: 14B modellere kadar çalıştırabilir (Phi-4, Mistral Small)
- 32GB RAM: 32B modelleri çalıştırabilir (DeepSeek R1 distilled)
- 64GB+ RAM: 70B+ modelleri çalıştırabilir (Llama 3.3, Qwen 2.5)
192 GB birleşik belleğe sahip Mac Studio M4 Ultra, 400B parametreye kadar olan modelleri çalıştırabilir, bu da onu geliştirme için bulut GPU örneklerine uygun bir alternatif haline getirir.
Karşılaştırma: Hangi Ücretsiz Seçeneği Kullanmalısınız?
| Kullanım Durumu | En İyi Ücretsiz Seçenek | Neden |
|---|---|---|
| Prototip Oluşturma | Google AI Studio | şu anki en güçlü resmi ücretsiz katman |
| Hızın kritik olduğu durumlar | Groq | en hızlı open-weight inference |
| Üretim denemeleri | LemonData $1 kredi | tek anahtar, birçok model ailesi |
| Gizlilik hassasiyeti | Ollama (yerel) | veriler asla makinenizden çıkmaz |
| Küçük uç uygulamalar | Cloudflare Workers AI | ücretsiz nöronlar + edge runtime |
| Embeddings | Google AI Studio | en kolay resmi ücretsiz giriş noktası |
Maksimum Kapsam İçin Ücretsiz Katmanları Birleştirmek
Bağımsız geliştiriciler için pratik bir strateji:
- Geliştirme ve test için Google AI Studio kullanın
- Gecikmeye duyarlı özellikler için Groq kullanın (30 req/min)
- Başka yerde bulunmayan modeller (Claude, GPT-4.1) için LemonData'nın 1 dolarlık kredisini kullanın
- Sınırsız çevrimdışı inference için Ollama'yı yerel olarak çalıştırın
Bu kombinasyon, geliştirme için neredeyse sıfır maliyetle hemen hemen her ana model ailesine erişmenizi sağlar ve erken prototipleri idare edecek kadar kapasite sunar.
Ücretsiz Olması Üretime Uygun Olduğu Anlamına Gelmez
Ücretsiz erişim şunlar için harikadır:
- prototip oluşturma
- smoke testleri
- değerlendirme çalışmaları
- editör denemeleri
Ücretsiz erişim şunlar için genellikle zayıftır:
- öngörülebilir gecikme
- SLA destekli iş yükleri
- büyük günlük hacim
- istikrarlı uzun vadeli bütçeleme
Bu nedenle ekipler genellikle ücretsiz bir katmanla başlar ve ürün prototip aşamasını geçtikten sonra küçük bir ücretli gateway bütçesine geçerler.
Net devir noktası basittir: Ücretsiz kurulumunuz, deneylere olanak sağlamaktan ziyade sevkiyat kararlarını engellemeye başladığında, ücretli bir yola geçme zamanı gelmiş demektir.
Bu noktada hedef artık “ücretsiz kalmak” değildir. Hedef, “sağlayıcıları çoğaltmadan esnek kalmak”tır.
Ne Zaman Ödemeye Başlamalı?
Ücretsiz katmanlar şu durumlarda pratik olmaktan çıkar:
- Sürekli olarak günlük ~1.000'den fazla isteğe ihtiyacınız olduğunda
- Garantili çalışma süresi ve SLA gerektiğinde
- Ücretsiz katmanlarda bulunmayan modellere (ölçekli Claude Opus 4.6, GPT-4.1) ihtiyaç duyduğunuzda
- Gecikme gereksinimleriniz ücretsiz katmanların sunduklarını aştığında
Bu noktada, en uygun maliyetli yol genellikle LemonData veya OpenRouter gibi bir toplayıcıdır; burada küçük bir bakiye yüklemesi, birden fazla sağlayıcı hesabını yönetmeden yüzlerce modele erişim sağlar.
Ücretsiz katmanların ötesine geçmeye hazır mısınız? lemondata.cc kayıt olduğunuzda 1$ ücretsiz kredi ile 300'den fazla model sunar. Kredi kartı gerekmez.
