সতর্কতা: এই পৃষ্ঠাটি একটি স্বয়ংক্রিয় (মেশিন) অনুবাদ, কোনও সন্দেহের ক্ষেত্রে অনুগ্রহ করে মূল ইংরেজি নথিটি দেখুন to এই অসুবিধার জন্য আমরা ক্ষমা চাইছি।

ওপেন গ্যাজার

গজার রিভিউ খুলুন

বিস্তারিত বিবরণ:

ওপেনগাজার একটি ওপেন সোর্স অ্যাপ্লিকেশন যা আপনার দৃষ্টির দিকনির্দেশনা অনুমান করার জন্য একটি সাধারণ ওয়েবক্যাম ব্যবহার করে। এই তথ্যটি অন্য অ্যাপ্লিকেশনগুলিতে প্রেরণ করা যেতে পারে। উদাহরণস্বরূপ, দশেরের সাথে একত্রে ব্যবহৃত ওপেনগ্যাজার আপনাকে আপনার চোখ দিয়ে লেখার অনুমতি দেয়। ওপেনগাজার লক্ষ্য হ'ল বাণিজ্যিক হার্ডওয়্যার-ভিত্তিক চক্ষু ট্র্যাকারগুলির জন্য একটি স্বল্প মূল্যের সফ্টওয়্যার বিকল্প।

ওপেনগাজারের প্রথম সংস্করণটি পিয়োট্রজিয়েলিস্কি দ্বারা বিকাশ করা হয়েছিল, স্যামসুং এবং গ্যাটসবি চ্যারিটেবল ফাউন্ডেশন দ্বারা সমর্থিত। এই সংস্করণটি সম্পর্কে আরও বিশদ পাওয়া যাবে।

ওপেনগাজারের জন্য গবেষণা এমিলি-মারি নেল পুনরুদ্ধার করেছেন এবং এইজিআইএস প্রকল্প এবং গ্যাটসবি চ্যারিটেবল ফাউন্ডেশন প্রসঙ্গে ইউরোপীয় কমিশন দ্বারা এটি এখন সমর্থন করে।

Open Gazer

ওপেনগজারের পূর্ববর্তী সংস্করণটি হেড-মোশনের পরিবর্তনের জন্য খুব সংবেদনশীল। এই সমস্যাটি সংশোধন করার জন্য আমরা দৃষ্টিকটু অবস্থানগুলি অনুমান করার আগে মাথার ভঙ্গির পরিবর্তনের জন্য সংশোধন করার জন্য বর্তমানে হেড ট্র্যাকিং অ্যালগরিদমগুলিতে ফোকাস করছি। সমস্ত সফ্টওয়্যার সি ++ এবং পাইথনে লেখা আছে। আমাদের মাথার ট্র্যাকিংয়ের অ্যালগরিদমের একটি উদাহরণ ভিডিও ডাউনলোড করা যেতে পারে [এখানে]। উইন্ডোজ ভিডিওটি ভিএলসি প্লেয়ারের সাথে দেখা যেতে পারে। লিনাক্সে এটি এমপ্লেয়ার মুভি প্লেয়ার ব্যবহার করে সেরা প্রদর্শিত হয়।

আমাদের মাথার ট্র্যাকিং অ্যালগরিদমের প্রথম সংস্করণটি একটি প্রাথমিক একটি যা ভায়োলা-জোনস ফেস ডিটেক্টরের উপর ভিত্তি করে তৈরি করা হয়েছে, যা ভিডিও স্ট্রিমের বৃহত্তম মুখটি (একটি ফাইল / ক্যামেরা থেকে ধরা হয়েছে) যত তাড়াতাড়ি সম্ভব একটি ফ্রেম-বাইতে সন্ধান করে ates ফ্রেম ভিত্তি। ট্র্যাকিংয়ের xy- স্থানাঙ্কগুলি ইতিমধ্যে ড্যাশার ব্যবহার করে টাইপ করতে ব্যবহার করা যেতে পারে। এটি 1 ডি মোডে করা যেতে পারে (উদাঃ, কেবল y- স্থানাঙ্কগুলি অনুসরণ করা থেকে) বা 2 ডি মোডে। যদিও আমাদের মাথা-পোজ সফ্টওয়্যার প্রকাশের পরে আরও অনেক ভাল ফলাফল আশা করা যায়, এই সফটওয়্যারটি ইতিমধ্যে দ্রুত মুখের স্থানীয়করণের জন্য কার্যকর। আমাদের অ্যালগরিদম ভায়োলা-জোনস ফেস ডিটেক্টর থেকে সনাক্তকরণ ফলাফলের এক্সওয়াইড-স্থানাঙ্ক এবং স্কেলে একটি সাধারণ অটোরগ্রেসিভ লোপাস ফিল্টার প্রয়োগ করে এবং আগ্রহের অঞ্চলটিকে ফ্রেম থেকে ফ্রেমে সীমাবদ্ধ করে। সনাক্তকরণের প্যারামিটারগুলি আমাদের নির্দিষ্ট অ্যাপ্লিকেশন অনুসারে নির্ধারণ করা হয়েছে (যেমন, একক ব্যবহারকারী তার / তার ডেস্কটপ পিসি / ল্যাপটপে কাজ করছেন)। অ্যালগরিদম 30 এফপিএসের ফ্রেম হার এবং যুক্তিসঙ্গত আলোয় অবস্থার উপর 320x240 চিত্রগুলিতে সেরা কাজ করে।

Open Gazer

ওপেনগাজারের একটি সাবপ্রজেক্টটিতে একটি স্যুইচ-ভিত্তিক প্রোগ্রাম চালানোর জন্য মুখের অঙ্গভঙ্গিগুলির স্বয়ংক্রিয় সনাক্তকরণ জড়িত। এই প্রোগ্রামটির প্রতিটি অঙ্গভঙ্গির জন্য একটি সংক্ষিপ্ত শেখার পর্ব রয়েছে (30 সেকেন্ডের নীচে), এর পরে অঙ্গভঙ্গিটি স্বয়ংক্রিয়ভাবে সনাক্ত করা যায়। অনেক রোগী (উদাঃ, সেরিব্রাল প্যালসিতে আক্রান্ত রোগীদের) অনিচ্ছাকৃত মাথার গতি থাকে যা সনাক্তকরণের সময় মিথ্যা ইতিবাচক পরিচয় দিতে পারে। অতএব আমরা অনৈচ্ছিক গতিগুলি মোকাবেলায় একটি পটভূমি মডেলকেও প্রশিক্ষণ দিই। সমস্ত সফ্টওয়্যার সি ++ এবং পাইথনে লেখা এবং শীঘ্রই ডাউনলোডের জন্য উপলব্ধ হবে। আমাদের অঙ্গভঙ্গির স্যুইচ অ্যালগরিদমের একটি উদাহরণ ভিডিও ডাউনলোড করা যেতে পারে [এখানে]। উইন্ডোজ ভিডিওটি ভিএলসি প্লেয়ারের সাথে দেখা যেতে পারে। লিনাক্সে এটি এমপ্লেয়ার মুভি প্লেয়ার ব্যবহার করে সেরা প্রদর্শিত হয়। মনে রাখবেন এই ভিডিওটিতে শব্দ রয়েছে। তিনটি সম্ভাব্য স্যুইচ ইভেন্ট উত্পন্ন করার জন্য তিনটি অঙ্গভঙ্গি প্রশিক্ষণ দেওয়া হয়েছে: একটি বাম হাসি, ডান হাসি এবং উপরের দিকে ভ্রু আন্দোলন সমস্তই ইভেন্টগুলি স্যুইচ করার অনুরূপ। ব্যাকগ্রাউন্ড মডেল, এই ক্ষেত্রে, জ্বলজ্বলগুলি, আলোতে আকস্মিক পরিবর্তন এবং মাথার বড় গতিগুলি সনাক্ত করে। প্রথম আনুষ্ঠানিক প্রকাশটি জুন ২০১২ এর শেষে হবে।

ওপেনগাজারের প্রথম সংস্করণে নিম্নলিখিত কর্মপ্রবাহ রয়েছে:

বৈশিষ্ট্য বিন্দু নির্বাচন:
শুরুর সময় ব্যবহারকারী মাউস ব্যবহার করে মুখের বৈশিষ্ট্যগুলি বেছে নেবেন বলে আশা করা হচ্ছে। এই পয়েন্টগুলি অ্যালগরিদমের পরবর্তী পদক্ষেপগুলিতে ট্র্যাক করা হয়। প্রথম দুটি পয়েন্ট চোখের কোণগুলির সাথে মিলে যায়, যা চোখের চিত্রগুলি বের করার জন্য পরবর্তী পদক্ষেপেও ব্যবহৃত হয়। পুরো প্রক্রিয়া চলাকালীন ব্যবহারকারীকে তার মাথাটি খুব স্থির রাখতে হবে। এই মুহুর্তে ব্যবহারকারীর পছন্দসই সমস্ত নির্বাচিত বৈশিষ্ট্য পয়েন্টগুলি সংরক্ষণ করা উচিত।

সিস্টেমটি ক্রমাঙ্কন করা হচ্ছে:
এই পদক্ষেপের সময় পর্দার বিভিন্ন অবস্থানে কয়েকটি লাল বিন্দু প্রদর্শিত হয়। প্রতিটি বিন্দুর প্রদর্শনের সময় চোখের চিত্রগুলি বের করা হয়। চোখের চিত্র এবং তাদের সাথে সম্পর্কিত ডট অবস্থানগুলি গাউসিয়ান প্রক্রিয়া প্রশিক্ষণের জন্য ব্যবহৃত হয় যা চোখের চিত্র এবং পর্দার অবস্থানের মধ্যে ম্যাপিং উপস্থাপন করে। নোট করুন যে মাথা ভঙ্গিতে পরিবর্তনগুলি প্রায়শই সিস্টেমে পুনরুদ্ধার করা প্রয়োজন।

ট্র্যাকিং:

সমস্ত ক্যালিব্রেশন ডটগুলি প্রক্রিয়া করার পরে গাউসিয়া প্রক্রিয়া একটি ভবিষ্যদ্বাণীপূর্ণ বিতরণ দেয়, যাতে ডিসপ্লে মনিটরে চোখের ফোকাসের প্রত্যাশিত বিন্দুটি চোখের একটি নতুন চিত্র দেখিয়ে অনুমান করা যায়। যদি ব্যবহারকারী তার / তার নির্বাচিত বৈশিষ্ট্য পয়েন্টগুলি লোড করে, তবে ভিওলা জোনস ফেস ডিটেক্টরটি অনুসন্ধান অঞ্চলটি নির্ধারণ করতে একবার ব্যবহার করা হবে যেখানে বৈশিষ্ট্য পয়েন্টগুলি প্রত্যাশিত। পরবর্তীকালে, প্রতিটি বৈশিষ্ট্য পয়েন্ট ট্র্যাক করতে অপটিকাল প্রবাহ ব্যবহৃত হয়। চক্ষু চিত্রগুলি বের করা হয় (প্রথম দুটি নির্বাচিত কোণার পয়েন্টগুলি রেফারেন্স হিসাবে ব্যবহার করে), এবং দৃষ্টিশক্তি দ্বারা পূর্বাভাস দেওয়া হয় চোখের চিত্র এবং প্রশিক্ষিত গাউসিয়ান প্রক্রিয়া ব্যবহার করে।