चेतावनी: यह पृष्ठ एक स्वचालित (मशीन) अनुवाद है, किसी भी संदेह के मामले में कृपया मूल अंग्रेजी दस्तावेज़ देखें। इससे होने वाली असुविधा के लिए हम क्षमा चाहते हैं।

गजरे खोलें

ओपन गेजर रिव्यू

विस्तृत विवरण:

Opengazer एक खुला स्रोत अनुप्रयोग है जो आपके टकटकी की दिशा का अनुमान लगाने के लिए एक साधारण वेब कैमरा का उपयोग करता है। यह जानकारी तब अन्य अनुप्रयोगों को पास की जा सकती है। उदाहरण के लिए, डैशर के साथ संयोजन में उपयोग किया जाता है, opengazer आपको अपनी आंखों से लिखने की अनुमति देता है। Opengazer का लक्ष्य कमर्शियल हार्डवेयर-आधारित आई ट्रैकर्स के लिए कम लागत वाला सॉफ्टवेयर विकल्प होना है।

Opengazer का पहला संस्करण PiotrZieli ,ski द्वारा विकसित किया गया था, जिसे सैमसंग और गैट्सबी चैरिटेबल फाउंडेशन द्वारा समर्थित किया गया था। इस संस्करण के बारे में अधिक विवरण पाया जा सकता है।

Opengazer के लिए अनुसंधान को इमली-मारी नेल द्वारा पुनर्जीवित किया गया है, और अब यूरोपीय आयोग द्वारा एईजीआईएस परियोजना और गैट्सबी चैरिटेबल फाउंडेशन के संदर्भ में समर्थित है।

Open Gazer

Opengazer का पिछला संस्करण हेड-मोशन विविधताओं के लिए बहुत संवेदनशील है। इस समस्या को ठीक करने के लिए हम वर्तमान में हेड ट्रैक पोजिशनिंग को सही करने के लिए हेड ट्रेकिंग एल्गोरिदम पर ध्यान केंद्रित कर रहे हैं। सभी सॉफ्टवेयर C ++ और Python में लिखे गए हैं। हमारे हेड ट्रैकिंग एल्गोरिदम में से एक का एक उदाहरण वीडियो [यहां] डाउनलोड किया जा सकता है। विंडोज पर वीडियो को वीएलसी प्लेयर के साथ देखा जा सकता है। लिनक्स पर इसे Mplayer मूवी प्लेयर का उपयोग करके सबसे अच्छा प्रदर्शित किया जाता है।

हमारे सिर ट्रैकिंग एल्गोरिथ्म का पहला संस्करण एक प्राथमिक एक है, जो वियोला-जोन्स फेस डिटेक्टर पर आधारित है, जो वीडियो स्ट्रीम में सबसे बड़ा चेहरा (एक फ़ाइल / कैमरा से कैप्चर किया गया) जितनी जल्दी हो सके, एक फ्रेम-बाय पर पता लगाता है। आधार। ट्रैकिंग से एक्स-निर्देशांक पहले से ही डैशर का उपयोग करने के लिए उपयोग किया जा सकता है। यह 1D मोड में किया जा सकता है (जैसे, केवल y-निर्देशांक पर नज़र रखने से), या 2D मोड में। यद्यपि हमारे हेड-पोज़ सॉफ़्टवेयर की रिलीज़ के बाद बहुत बेहतर परिणाम की उम्मीद की जा सकती है, यह सॉफ़्टवेयर पहले से ही तेज़ चेहरे के स्थानीयकरण के लिए उपयोगी है। हमारा एल्गोरिथ्म वियाला-जोन्स फेस डिटेक्टर से एक्सआई-निर्देशांक और पहचान परिणामों के पैमाने पर एक सरल ऑटोरेजिव लोअर फिल्टर लागू करता है, और फ्रेम से फ्रेम तक ब्याज के क्षेत्र को भी प्रतिबंधित करता है। पता लगाने के मापदंडों को हमारे विशिष्ट एप्लिकेशन (यानी, अपने डेस्कटॉप डेस्कटॉप / लैपटॉप पर काम करने वाले एकल उपयोगकर्ता) के अनुसार निर्धारित किया गया है। एल्गोरिथ्म 30x एफपीएस के फ्रेम दर और उचित प्रकाश व्यवस्था की स्थिति में 320x240 छवियों पर सबसे अच्छा काम करता है।

Open Gazer

Opengazer के एक उपप्रोजेक्ट में स्विच-आधारित प्रोग्राम को चलाने के लिए चेहरे के हावभाव का स्वचालित पता लगाना शामिल है। इस कार्यक्रम में प्रत्येक इशारे के लिए एक छोटा सीखने का चरण (30 सेकंड से कम) होता है, जिसके बाद इशारा स्वचालित रूप से पता लगाया जाता है। कई रोगियों (जैसे, सेरेब्रल पाल्सी वाले रोगियों) में अनैच्छिक सिर की गति होती है जो पता लगाने के लिए गलत सकारात्मकता का परिचय दे सकती है। इसलिए हम अनैच्छिक गतियों से निपटने के लिए एक पृष्ठभूमि मॉडल भी प्रशिक्षित करते हैं। सभी सॉफ्टवेयर C ++ और Python में लिखे गए हैं और जल्द ही डाउनलोड के लिए उपलब्ध होंगे। हमारे जेस्चर स्विच एल्गोरिथ्म का एक उदाहरण वीडियो डाउनलोड किया जा सकता है [यहां]। विंडोज पर वीडियो को वीएलसी प्लेयर के साथ देखा जा सकता है। लिनक्स पर इसे Mplayer मूवी प्लेयर का उपयोग करके सबसे अच्छा प्रदर्शित किया जाता है। ध्यान दें कि इस वीडियो में ध्वनि है। तीन इशारों को तीन संभव स्विच घटनाओं को उत्पन्न करने के लिए प्रशिक्षित किया गया है: एक बाएं मुस्कुराहट, सही मुस्कुराहट, और ऊपर की ओर आइब्रो आंदोलन घटनाओं को स्विच करने के लिए सभी पत्र। पृष्ठभूमि मॉडल, इस मामले में, पलकें का पता लगाता है, प्रकाश में अचानक परिवर्तन, और बड़े सिर की गति। पहली आधिकारिक रिलीज़ जून 2012 के अंत में होगी।

Opengazer के पहले संस्करण में निम्नलिखित वर्कफ़्लो हैं:

सुविधा बिंदु चयन:
स्टार्टअप के दौरान उपयोगकर्ता को माउस का उपयोग करके चेहरे पर सुविधा बिंदुओं का चयन करने की उम्मीद है। इन बिंदुओं को एल्गोरिथम में बाद के चरणों में ट्रैक किया जाता है। पहले दो बिंदु आंखों के कोनों के अनुरूप होते हैं, जिनका उपयोग बाद के चरणों में आंखों की छवियों को निकालने के लिए भी किया जाता है। उपयोगकर्ता को पूरी प्रक्रिया के दौरान अपने सिर को बहुत स्थिर रखना होता है। इस बिंदु पर उपयोगकर्ता को सभी चयनित सुविधा बिंदुओं को अधिमानतः सहेजना चाहिए।

सिस्टम को कैलिब्रेट करना:
इस चरण के दौरान कुछ लाल बिंदुओं को स्क्रीन पर विभिन्न पदों पर प्रदर्शित किया जाता है। प्रत्येक डॉट के प्रदर्शन के दौरान आंखों के चित्र निकाले जाते हैं। आंख की छवियां और उनके संबंधित डॉट पोजिशन का उपयोग एक गॉसियन प्रक्रिया को प्रशिक्षित करने के लिए किया जाता है जो एक आंख की छवि और स्क्रीन पर स्थिति के बीच मानचित्रण का प्रतिनिधित्व करता है। ध्यान दें कि हेड पोज़ में बदलाव के लिए अक्सर सिस्टम को रिकैलिब्रेट करने की आवश्यकता होती है।

नज़र रखना:

सभी अंशांकन डॉट्स संसाधित होने के बाद गॉसियन प्रोसेस एक भविष्य कहनेवाला वितरण देता है, ताकि डिस्प्ले मॉनिटर पर आंख के फोकस के अपेक्षित बिंदु को आंख की एक नई छवि का अनुमान लगाया जा सके। यदि उपयोगकर्ता अपने चयनित फीचर बिंदुओं को लोड करता है, तो खोज क्षेत्र निर्धारित करने के लिए एक बार वायोला जोन्स फेस डिटेक्टर का उपयोग किया जाता है जहां सुविधा बिंदु अपेक्षित हैं। इसके बाद, प्रत्येक सुविधा बिंदु को ट्रैक करने के लिए ऑप्टिकल प्रवाह का उपयोग किया जाता है। आंख की छवियों को निकाला जाता है (संदर्भ के रूप में पहले दो चयनित कोने बिंदुओं का उपयोग करके), और निकाले गए आंखों के चित्रों और प्रशिक्षित गाऊसी प्रक्रिया का उपयोग करके टकटकी की भविष्यवाणी की जाती है।