Uyarı: Bu sayfa otomatik (makine) bir çeviridir, herhangi bir şüpheniz olması durumunda lütfen orijinal İngilizce belgeye bakın. Bunun neden olabileceği rahatsızlıktan dolayı özür dileriz.

Gazer'i aç

Gazer Review'u aç

Detaylı Açıklama:

Opengazer bakışınızın yönünü tahmin etmek için sıradan bir web kamerası kullanan açık kaynaklı bir uygulamadır. Bu bilgi daha sonra diğer uygulamalara aktarılabilir. Mesela, Dasher ile birlikte kullanıldığında, saydamlaştırıcı gözlerinizle yazmanıza izin verir. Opengazer, ticari donanım tabanlı göz takip cihazlarına alternatif olarak düşük maliyetli bir yazılım olmayı hedeflemektedir.

Opengazer'in ilk versiyonu, Samsung ve Gatsby Charitable Foundation tarafından desteklenen PiotrZieliński tarafından geliştirilmiştir. Bu sürüm hakkında daha fazla ayrıntı bulunabilir.

Opengazer için araştırmalar Emli-Mari Nel tarafından canlandırıldı ve şimdi Avrupa Komisyonu tarafından AEGIS projesi ve Gatsby Charitable Vakfı bağlamında destekleniyor.

Open Gazer

Opengazer'in önceki sürümü, kafa hareketi değişimlerine karşı çok hassastır. Bu sorunu düzeltmek için şu anda bakış pozisyonlarını çıkarmadan önce kafa poz değişikliklerini düzeltmek için kafa takip algoritmalarına odaklanıyoruz. Tüm yazılımlar C ++ ve Python ile yazılmıştır. Baş izleme algoritmamızdan birinin örnek bir videosunu buradan indirebilirsiniz. Windows'ta video VLC oynatıcı ile izlenebilir. Linux'ta en iyi Mplayer Movie Player kullanılarak görüntülenir.

Baş izleme algoritmamızın ilk sürümü, video akışındaki (dosya / kameradan yakalanan) en büyük yüzü kare kare boyutuna yerleştiren Viola-Jones yüz algılayıcısını temel alan temel bir versiyondur. çerçeve temeli İzlemedeki xy koordinatları, Dasher kullanarak yazmak için zaten kullanılabilir. Bu, 1B modunda (örneğin, sadece y koordinatlarını izlemekten) veya 2D modunda yapılabilir. Baş poz yazılımımızın piyasaya sürülmesinden sonra çok daha iyi sonuçlar beklenebilir olmasına rağmen, bu yazılım hızlı yüz yerelleştirmesi için zaten faydalıdır. Algoritmamız, xy koordinatlarına basit bir otoregressive lowpass filtresi uygular ve Viola-Jones yüz algılayıcısının algılama sonuçlarının ölçeğini uygular ve aynı zamanda ilgilenilen bölgeyi çerçeveden çerçeveye sınırlar. Tespit parametreleri, özel uygulamamıza göre (yani, Masaüstü Bilgisayarında / dizüstü bilgisayarında çalışan tek bir kullanıcı) göre belirlenmiştir. Algoritma en iyi 320x240 görüntülerde, 30 fps kare hızında ve makul ışık koşullarında çalışır.

Open Gazer

Opengazer'in bir alt projesi, anahtar tabanlı bir program yürütmek için yüz hareketlerinin otomatik olarak algılanmasını içerir. Bu program her hareket için kısa bir öğrenme aşamasına (30 saniyenin altında) sahiptir ve sonrasında hareket otomatik olarak algılanır. Birçok hasta (örneğin, serebral palsili hastalar), tespit sırasında yanlış pozitifler ortaya koyabilecek istemsiz kafa hareketlerine sahiptir. Dolayısıyla, istemsiz hareketlerle başa çıkmak için bir arka plan modeli de eğitiyoruz. Tüm yazılımlar C ++ ve Python ile yazılmış ve yakında indirilmeye hazır olacak. Hareket değiştirme algoritmamızın örnek bir videosunu buradan indirebilirsiniz. Windows'ta video VLC oynatıcı ile izlenebilir. Linux'ta en iyi Mplayer Movie Player kullanılarak görüntülenir. Bu videonun sesi olduğunu unutmayın. Üç olası anahtarlama olayı meydana getirmek için üç hareket uygulandı: sol bir gülümseme, sağ bir gülümseme ve yukarı doğru kaş hareketi, anahtarlama olaylarına karşılık geliyor. Arka plan modeli, bu durumda, yanıp sönmeleri, aydınlatmadaki ani değişiklikleri ve büyük kafa hareketlerini algılar. İlk resmi açıklama Haziran 2012'nin sonunda olacak.

Opengazer'in ilk sürümü şu iş akışına sahip:

Özellik noktası seçimi:
Başlatma sırasında, kullanıcının fareyi kullanarak yüzündeki özellik noktalarını seçmesi beklenir. Bu noktalar algoritmanın sonraki adımlarında izlenir. İlk iki nokta, göz görüntülerini çıkarmak için sonraki adımlarda da kullanılan gözlerin köşelerine karşılık gelir. Kullanıcı, tüm işlem boyunca başını hareketsiz tutmak zorundadır. Bu noktada, kullanıcı tercihen seçilen tüm özellik noktalarını kaydetmelidir.

Sistemi kalibre:
Bu adım sırasında, ekranda çeşitli konumlarda birkaç kırmızı nokta görüntülenir. Gözlerin görüntüleri her noktanın gösterimi sırasında çıkarılır. Göz görüntüleri ve karşılık gelen nokta konumları, bir göz görüntüsü ile ekrandaki konum arasındaki eşleşmeyi temsil eden bir Gauss Süreci yetiştirmek için kullanılır. Baş pozundaki değişikliklerin genellikle sistemin yeniden kalibre edilmesini gerektirdiğini unutmayın.

Takip:

Tüm kalibrasyon noktaları işlendikten sonra, Gauss İşlemi, tahminde bulunacak bir dağılım verir, böylece ekran monitöründe beklenen göz odak noktası, gözün yeni bir görüntüsü verildiğinde tahmin edilebilir. Kullanıcı seçilen özellik noktalarını yüklerse, Viola Jones yüz dedektörü, özellik noktalarının beklendiği arama bölgesini belirlemek için bir kez kullanılır. Daha sonra, her özellik noktasını izlemek için optik akış kullanılır. Göz görüntüleri (referans olarak seçilen ilk iki köşe noktası kullanılarak) çıkarılır ve bakış, çıkarılan göz görüntüleri ve eğitimli Gauss Süreci kullanılarak tahmin edilir.