Genel

Shazam Algoritması Nasıl Çalışır?

Shazam, ortamdaki ses dalgalarını dijital verilere dönüştürür. Bu teknoloji, her ses için benzersiz bir parmak izi oluşturur. Yazılım, ses sinyallerini frekans ve zaman ekseninde analiz eder. Ardından spektrogram denilen üç boyutlu veri haritaları oluşturur. Bu süreçte gürültüleri filtreler ve en karakteristik spektral zirveleri ayıklar. Ardından şarkının melodik iskeletini temsil eden bir yıldız haritası çıkarır.

Shazam Şarkıları Nasıl Tanıyor?

Shazam, duyduğu sesi bir parmak izine dönüştürerek şarkıları tanır. Bu noktada Shazam, mikrofonla alınan sesin gürültülerini ayıklayıp sadece en baskın frekans noktalarını seçer. Ayrıca bu noktaları yıldız haritası gibi eşleştirip benzersiz bir matematiksel kod oluşturur. Hazırlanan özel kod, müzik kütüphanesindeki kayıtlarla saniyeler içinde kıyaslanır. Bu sayede şarkının ismi kesin olarak belirlenir.

Ses Parmak İzi (Audio Fingerprinting) Nedir?

Her ses, tıpkı insan parmak izi gibi kendine has frekans yapısına sahiptir. Bu bağlamda yazılımlar, ilgili yapıyı analiz ederek sese özgü karakteristik bir özet çıkarır. Sistem, sesin tamamı yerine en baskın ve ayırt edici enerji noktalarını seçer. Ayrıca arka plandaki gürültüler ve konuşmalar, bu işlem sırasında elenir.

Seçilen stratejik noktalar, zaman ve frekans ekseninde eşleştirilerek dijital bir haritaya dönüştürülür. Oluşturulan dijital harita, veri tabanındaki milyonlarca farklı kayıtla saniyeler içinde karşılaştırılır. Sistem, yakalanan veri dizisi mevcut bir örnekle örtüştüğünde harekete geçer. Bu aşamada soyut kodları somut eser ve sanatçı bilgisine dönüştürür. Teknoloji, herhangi bir şarkının en kalabalık ortamlarda dahi kolayca tespit edilmesini sağlar.

Spektrogram ile Tanıma

Söz konusu yazılım, spektrogram analizi sırasında aşağıdaki işlemleri gerçekleştirir:

  1. Görselleştirme ve Spektrogram: Sistem, ilk olarak ses sinyallerini zaman ve frekans ekseninde görselleştirir. Bu işlem sonucunda üç boyutlu spektrogram grafikleri oluşturur.
  2. Yıldız Haritası Oluşturma: Algoritma, grafik üzerindeki en yüksek enerjili noktaları seçer. Ardından şarkının melodik iskeletini temsil eden bir yıldız haritası çıkarır.
  3. Gürültü Filtreleme: Yazılım, sesin temel frekans yapısını baz alır. Bu sayede çevresel gürültüler, matematiksel bir filtreleme yöntemiyle saniyeler içinde elenir.
  4. Dijital Parmak İzi (Hash): Uygulama, seçilen bu stratejik noktaları birbirine bağlar. Ardından hash adı verilen kısa kodlar üreterek dijital bir parmak izi hazırlar.
  5. Kütüphane Eşleşmesi: Sunucular, oluşturulan özgün kodları kütüphanedeki milyonlarca kayıtla kıyaslar. Bu süreçte sanatçı ve eser bilgilerine en doğru şekilde ulaşmanızı sağlar.

Analiz süreci, zaman içindeki frekans değişimlerini sabit bir veri setine indirger. Böylece çevresel seslerin yarattığı karmaşayı ortadan kaldırır. Ayrıca videodan şarkı bulma sitesi, en zayıf sinyalleri dahi yüksek doğruluk oranına sahip olan dijital imzalara dönüştürür.

Landmark ve Hash Noktaları: Şarkıların Eşleşme Süreci

Shazam, ses spektrumundaki en baskın frekans zirvelerini belirler. Bu stratejik nirengi noktalarını landmark olarak tanımlar. Algoritma, bu zirvelerin birbirlerine olan uzaklığını ve zaman farkını ölçüp şarkının melodik iskeletini çıkarır. Ayrıca yazılım, gürültülü ortamlarda dahi yalnızca yüksek enerjili noktaları dikkate alır ve çevresel sesleri analiz dışında tutar.

Sistem, belirlenen landmark çiftlerini hash adı verilen kısa ve özgün matematiksel kodlara dönüştürür. Bu noktada her bir hash kodu, şarkının belirli bir anındaki frekans ilişkisini temsil eden dijital mühür işlevi görür. Söz konusu işlem, büyük ses dosyalarını küçük ve taranabilir veri paketlerine indirgeyip süreci hızlandırır. Yazılım, bu hash kodlarını kütüphanedeki verilerle kıyaslar. Bu sırada hem ses benzerliğine hem de verilerin zaman akışındaki dizilim sırasına odaklanır.

Sunucular, oluşturulan bu özgün hash dizilerini saniyeler içinde kıyaslar. Bu işlem için kütüphanedeki milyonlarca kayıtlı parmak izini kullanır. Uygulama, eşleşme gerçekleştiği anda matematiksel verileri birleştirir. Bu verileri somut bir sanatçı ve eser ismiyle ilişkilendirip sonucu ekrana yansıtır. Verileri süzerek işleyen teknoloji, en zayıf sinyallerde bile etkili sonuçlar verir. Bu sayede hatasız bir tanımlama performansı sergiler.

Akıllı telefon ekranında Shazam logosu ve son dinlenen şarkı geçmişi illüstrasyonu.

Gürültülü Ortamlarda Shazam Nasıl Çalışır?

Uygulama, ses sinyallerini frekans ve zaman ekseninde analiz eder. Bu teknolojiyle, spektrogram adı verilen üç boyutlu veri haritaları oluşturur. Bu kapsamda algoritma, gürültülü ortamlarda bile şarkıları hatasız saptamak için aşağıdaki adımları takip eder:

  1. Sinyal Analizi: Sistem, mikrofon aracılığıyla alınan ses karmaşasını frekanslarına ayırır. Düşük enerjili arka plan uğultularını ise matematiksel filtrelemeyle eler.
  2. Spektral Zirvelerin Belirlenmesi: Algoritma, spektrogram üzerindeki en yüksek genliğe sahip noktaları seçer. Sadece spektral zirvelere odaklanarak aranan şarkının melodik iskeletini temsil eden bir yıldız haritası oluşturur.
  3. Hash Koduna Dönüştürme: Yazılım, belirlenen bu enerji noktaları arasındaki zaman farklarını ölçüp hash kodlarına dönüştürür. Bu işlemle sesin gürültüden etkilenmeyen dijital parmak izinin hazırlanmasını sağlar.
  4. Veri Tabanı Kıyaslaması: Uygulama, oluşturulan bu özgün kodları saniyeler içinde kıyaslar. Bulut tabanlı devasa kütüphanedeki milyonlarca kaydı tarayarak eşleşme olasılıklarını titizlikle analiz eder.
  5. Bilgi Eşleşmesi: Sunucular, eşleşme gerçekleştiği anda devreye girip soyut verileri somut eser ismi ve sanatçı bilgisine dönüştürerek sonucu ekrana yansıtır.

Analiz süreci, sesin tamamını kaydetmekle uğraşmaz. Bunun yerine yalnızca stratejik frekans zirvelerine odaklanır. Böylece çevresel seslerin yarattığı kirlilik, veri setinin dışında kalır. Modelleme, müziğin özgün karakterini en kalabalık mekanlarda bile korur. Milisaniyelik hızlarla çalışarak doğru sonuçlara ulaşılmasını sağlar.

SoundHound vs Shazam

Shazam ve SoundHound, müzik tanıma işlemini farklı teknolojik yaklaşımlar aracılığıyla gerçekleştirir. Bu iki uygulama, müzik tanıma konusunda oldukça popülerdir. Bu noktada Shazam, orijinal kayıtları saptama hızıyla bilinir. SoundHound Online ise kullanıcı sesinden melodi tanıma yeteneğiyle öne çıkar. İki platform arasındaki temel farklar aşağıdaki gibi özetlenebilir:

  • Shazam, orijinal şarkı kayıtlarını saniyeler içinde kütüphanesindeki verilerle eşleştirip kullanıcıya sunar. Çünkü bu uygulama, Apple ekosistemiyle uyumludur.
  • SoundHound, kullanıcılar melodiyi ıslıkla çaldığında veya mırıldandığında bile doğru sonuçlar üretir. Şarkı bulma yöntemini bu şekilde kullananlar için etkili çözümler sunar.
  • Shazam, arayüz tasarımıyla üyelerine kolaylık sağlar. Aranan parçaları doğrudan çalma listelerine aktarma ve şarkı sözlerini anlık takip etme fırsatı sunar.
  • SoundHound uygulamasında yerleşik bir asistan bulunur. Bu asistan, kullanıcıların ellerini kullanmadan arama yapmasını sağlar.
  • Shazam’ın filtreleme algoritması, gürültülü ortamlarda bile stabil çalışır. Uygulama, müziği karmaşık sesler arasından hızlı bir şekilde ayıklar.

Kullanıcılar, uygulama seçimlerini o anki ihtiyaçlarına göre gerçekleştirmelidir. Bu süreçte akıllı cihazlarının özelliklerini de dikkate almaları gerekir. Shazam, halihazırda çalan orijinal bir kaydı bulmak isteyenler için idealdir. Gürültülü mekanlarda bile en yüksek hızda sonuçlar verir. Bu bağlamda uygulama, Apple entegrasyonuyla güçlendirilmiştir.

SoundHound, aklında kalan ezgiyi sesiyle canlandırarak bulmayı hedefleyenler için uygundur. Uygulama, ses analizi için özel algoritmalar kullanır. Bu algoritmalar sayesinde ses analizi konusunda uzmanlaşmıştır. Sistem, ıslık gibi farklı ses girişlerini bile orijinal kayıtların ana frekans yapısıyla eşleştirir. Bu yöntem sayesinde şarkıyı bulma ihtimalini artırır.

Shazam Şarkıları Nasıl Buluyor?

Sesin akustik parmak izini çıkarır ve veri tabanındaki milyonlarca kayıtla saniyeler içinde eşleştirir.

Shazam Arka Planda Nasıl Çalışır?

Auto Shazam moduyla mikrofonu düşük güçte kullanır ve ortamdaki müzikleri otomatik olarak listeler.

Shazam Hangi Ülkenin?

İngiltere’de kurulmuştur, günümüzde ise ABD merkezli Apple’a aittir.

Ceyhun Demirtaş

Ceyhun Demirtaş, çocukluktan gelen dijital yolculuğuyla Grafik Tasarım, Yazılım ve Dijital Reklamcılık gibi farklı deneyimler kazanmıştır. Bu alanlardaki arayışının ardından, ilgisini çeken taraf ise SEO olduğunu keşfetti. Şu anda ise SosyalEvin bünyesinde, İçerik Yöneticisi ve SEO Uzmanı olarak deneyimlerini artırmaya devam ediyor.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu