Manage how you interact with AI

Discover how you can manage, promote and monetize your digital assets.

Sign Up Now

Eğitim Aldım mı?

İçeriğinizin önemli yapay zeka eğitim veri kümelerinde yer alıp almadığını doğrulayın. Canlı API'leri kontrol ediyor ve kapsamlı bir kapsam sağlamak için herkese açık veri kümelerinin dizinlenmiş kopyalarını tutuyoruz.

Varlıklarım eğitildi mi?

Yapay Zeka Eğitim Veri Kümelerini Anlama

Modern yapay zeka sistemlerini destekleyen veri kümeleri ve içeriğinizi nasıl koruyacağınız hakkında bilgi edinin

Doğruladığımız Eğitim Veri Kümeleri

Common Crawl Live

Web Text Dataset

Current web crawl data

Wikipedia Live

Text Dataset

Wikipedia dumps used by virtually all LLMs

Internet Archive Live

Web Archive

Historical snapshots of web content

GitHub & Code Live

Code Dataset

Public code repositories

Reddit & Social Media Live

Conversational Dataset

Reddit posts and conversations

LAION-5B Cached

Image Dataset

5.85B image-text pairs (offline since late 2023)

C4 Corpus Static

Text Dataset

Cleaned Common Crawl text (Google T5)

OpenImages Offline

Image Dataset

9+ million labeled images (Google)

RedPajama Static

Text Dataset

1.2 trillion tokens (LLaMA replication)

Books & Literature Static

Text Dataset

Books corpus from various sources

Audio Datasets Offline

Audio Dataset

Voice and speech data (LibriSpeech, Common Voice)

DALL-E Training Data Offline

Image Dataset

Proprietary image dataset

Midjourney Training Data Offline

Image Dataset

Proprietary/secret dataset

Multimodal Web Data Cached

Multimodal Dataset

Combined text, image, and video data

Neden Önbelleğe Alınan Sonuçlar?

Many AI training datasets don't offer public live APIs because:

Ölçek

LAION-5B gibi veri kümeleri milyarlarca giriş içerir

Gizlilik ve Maliyet

Büyük veri kümeleri için gerçek zamanlı API'ler pahalıdır

Statik Doğa

Birçok eğitim veri kümesi dondurulmuş versiyonlardır

Önbelleğe alınmış sonuçlarımız gerçek verilere dayanmaktadır - doğru doğrulama için indeksli kopyalar tutuyoruz

Sonuçlar Nasıl Yorumlanır?

Doğrulama durumunu ve güven düzeylerini anlama

Doğrulama Durumu

KURMAK

Bu veri kümesinde içerik mevcut

BULUNAMADI

Veri setinde içerik algılanmadı

HATA

Geçici API sorunu

Güven Düzeyleri

90-100%

Yüksek güvenilirlik (canlı API veya tam eşleşme)

70-89%

İyi güven (önbelleğe alınmış veritabanı eşleşmesi)

50-69%

Orta (desen tabanlı algılama)

İçeriğinizi Nasıl Korursunuz?

İçeriğinizde yapay zeka eğitimini önleme adımları

1

Meta Etiketleri Ekle

<meta name="robots" content="noai, noimageai">
2

Robots.txt dosyasını güncelleyin

User-agent: GPTBot
Disallow: /
3

Başlıkları Kullan

X-Robots-Tag: noai
4

Kaldırma Talebinde Bulunun

Veri kümesi bakımcılarıyla doğrudan iletişime geçin