Counterfeit Intelligence • Görsel Algoritmalar
Görsel benzerlik algoritmaları, ürün görsellerini “anlamaya” ve sahte veya taklit ilanları tespit etmeye odaklanır. Bu sistemler; pazar yerleri, sosyal platformlar ve web genelinde görüntü temelli eşleşmeler kurarak sahtecilik ağlarını hızla ortaya çıkarır. Aşağıda bu teknolojinin çalışma mantığı, kullanılan yöntemler, karşılaşılan zorluklar ve pratik uygulamalar özetlenmiştir.
B10 Digital Agency • 2025 • Okuma süresi: ~7 dk
1. Temel Mimari: Crawl → Preprocess → Embed → Match → Score
- Crawl: Pazaryeri ilanları, sosyal gönderiler, satıcı profilleri ve dark web kaynakları toplanır.
- Preprocess: Görseller normalize edilir (boyut, renk uzayı, meta temizliği) ve meta veriler çıkarılır.
- Embed: Görsel, derin öğrenme tabanlı bir embed vektörüne dönüştürülür (CNN / Vision Transformer).
- Match: Vektör bazlı nearest-neighbor aramaları veya hashing ile benzer görseller bulunur.
- Score: Görsel + metin + satıcı sinyalleri (fiyat, lokasyon, geçmiş) kombinlenerek risk skoru hesaplanır.
“Görsel benzerlik; tek başına bir şüphe kaynağıdır, fakat metin ve operasyonel sinyallerle birleştiğinde kanıt gücü kazanır.”
2. Kullanılan Algoritmalar ve Teknikler
Teknik | Kısa Açıklama | Avantaj / Dezavantaj |
---|---|---|
Perceptual Hash (pHash, aHash) | Görselin özet bir hash’ini çıkarır; küçük değişikliklere toleranslıdır. | Hızlı, hafif — ancak ağır editlerde (re-cropping, AI-upscale) başarısı düşer. |
Feature-based (SIFT, ORB) | Anahtar nokta ve eşleştirme tabanlı klasik yöntemler. | Objektif eşleşmelerde iyi — ancak büyük veri ölçeğinde yavaş. |
CNN Embeddings (ResNet, EfficientNet) | Derin ağlardan çıkarılan vektörler; görselin semantik temsilini verir. | Yüksek doğruluk, ölçeklenebilir ANN (Faiss/HNSW) ile hızlı arama. |
Vision Transformers (ViT) & CLIP | Görsel–metin eşleştirmede güçlü; metin açıklamalarla cross-modal arama sağlar. | Metin ile birlikte çalışınca çok güçlü — hesaplama maliyeti yüksek olabilir. |
SSIM / Image Similarity | İki görselin yapısal benzerliğini ölçer (dik farklar için). | Doğrudan karşılaştırma için iyi — ama ölçeklenebilir değil. |
3. Cross-Modal Yaklaşım: Görsel + Metin + Satıcı Sinyalleri
En güvenilir sonuçlar, yalnızca görsel benzerlik değil; ilan başlığı, açıklama, fiyat, seller ID, lokasyon, aynı IP adresinden gelen çoklu ilanlar gibi sinyallerle birleştirildiğinde elde edilir. CLIP benzeri modeller, görseli doğrudan metinle eşleştirerek “dolaylı” taklitleri de yakalayabilir (ör. görselde logo yok ama açıklamada taklit ifadesi geçiyor).
4. Proof Pack: Kanıt Oluşturma Standartları
- Timestamped screenshot + orijinal image URL
- Embedding similarity score (örn. cosine = 0.92)
- Perceptual hash ve SSIM raporu
- Satıcı bilgileri (ID, ödeme yöntemi, değerlendirme geçmişi)
- Çapraz doğrulama: aynı görselin birden fazla ilan/hesapta bulunması
5. Ölçek ve Hız: Teknik Mimariler
- Faiss / HNSW: Milyonlarca embedding içinde hızlı nearest-neighbor araması.
- Approximate Nearest Neighbor (ANN): Gerçek zamanlı tarama gereksinimleri için tercih edilir.
- Batch & Streaming Pipeline: Gerçek zamanlı (stream) + periyodik (batch) tarama kombinasyonu.
6. Karşılaşılan Zorluklar
- Adversarial manipülasyon: Görsellerin küçük değişikliklerle algıdan kaçırılması.
- Generative (AI) ürün görselleri: Ürüne ait olmayan ama gerçekçi render’lar üretme.
- Ambalaj varyasyonları: Bölgesel ambalaj, ambalaj yenilemeleri ve mevsimsel etiketler yanlış negatif yaratır.
- Scale/Noise: Yüksek hacimde yanlış pozitifleri minimize etmek kritik.
7. Performans Metrikleri (KPI)
KPI | Açıklama | Hedef |
---|---|---|
Precision / Recall | Doğru tespit oranı ve yakalanan gerçek ihlaller oranı | Precision yüksek (≥90%) — Recall dengeli |
MTTD (Mean Time To Detect) | Tespit süresi (ilk saptama) | <24 saat (ideali saatler içinde) |
MTTR (Mean Time To Remove) | Kaldırma süresi (platform yanıtı) | <48 saat (otomatik başvurularla kısalır) |
False Positive Rate | Yanlış raporlanan vakalar yüzdesi | Düşük (%<5 hedefi) |
8. En İyi Uygulamalar (Operational)
- Embeddings güncellemesi: model drift’e karşı periyodik yeniden eğitme
- Human-in-the-loop: kritik vakalarda insan doğrulaması
- Satıcı kümeleme: aynı ağın parçası olan satıcıları eş zamanlı kaldırma
- Yasal entegrasyon: DMCA/UDRP/marketplace API otomasyonu
“AI tespit eder; süreç ve hukuk kaldırır — en iyi sonuçlar üçünün uyumuyla gelir.”
9. Gelecek: Önleyici (Predictive) Gözetim
Gelişen modeller, sadece mevcut görselleri eşleştirmekle kalmayıp; hangi ürünlerin taklit edilme olasılığının yüksek olduğunu önceden tahmin edebilir. Bu sayede tedarik zinciri doğrulaması, akıllı ambalaj ve perakende ortaklıklarıyla sahteciliğin oluşması engellenir.
Marka taklitlerini proaktif olarak durdurun.
B10 CounterShield™, görsel benzerlik algoritmaları, proof-pack oluşturma ve otomatik kaldırma iş akışlarıyla marka korumanızı uçtan uca sağlar.