رؤية حاسوبية

الرؤية الحاسوبية، هي واحدة من مجالات علم الحاسوب، هدفها بناء تطبيقات ذكية تستطيع فهم محتوى الصور كما يستوعبها الإنسان. حيث من الممكن أن تأخذ بيانات الصور عدة أشكال كالصور المتعاقبة (فيديو)، المشاهد من مجموعة كاميرات، بيانات ذات عدة أبعاد مأخوذة من جهاز تصوير طبي.

أمثلة

ومن الأمثلة على تطبيقات الرؤية الحاسوبية تحتوي: تطبيق قادر على التعرف على الأغراض أو الأشخاص ضمن صورةتطبيقات التحكم الآلي (الروبوت الصناعي، المركبات الآلية). بناء نماذج للأشياء أو للمحيط (الفحص الصناعي، تحليل الصورة الطبية). تطبيق يستطيع متابعة غرض يتحرك ضمن صورة تطبيق قادر على معرفة البعد الثالث من صورة أو أكثر ثنائية البعد (أو من صورة وضوء ليزري متحرك)

مقارنة

مع الرؤية الطبيعية من الممكن وصف الرؤية الحاسوبية باعتبارها مرادفاً(وليس بالضرورة عكساً) للرؤية الفيزيولوجية. فكما أن الرؤية الفيزيولوجية للإنسان والحيوانات المختلفة تتم دراستها للتعرف على خصائصها، فإن علم الرؤية الحاسوبية يدرس ويصف أنظمة الرؤية الصنعية التي يتم تنفيذها في البرامج أو الأجهزة. وقد أظهر التعاون بين مجالي دراسة الرؤية الفيزيولوجية والحاسوبية تطوراً في تعميق الفهم لكلا المجالين.

فروع

تندرج المجالات التالية تحت مجال الرؤية الحاسوبية:

تقدير اتجاه الحركة
ترميم الصور
تمييز الأشياء
التتبع
تفاعل إنساني حاسوبي

المهام الأساسية للرؤية الحاسوبية

كل واحد من التطبيقات المذكورة آنفاً يتضم العديد من مهام الرؤية الحاسوبية، بعضها مهام للقياس، وبعضها مهام حسابية تستخدم لحل العديد من المسائل. هذه بعض المهام الأساسية لعلم الرؤية الحاسوبية.

التعرف

هي المهمة التقليدية في الرؤية الحاسوبية، وهي القيام بتحديد ما إذا كانت الصورة تحتوي أو لا تحتوي جسماً، معلماً، أو نشاطاً معيناً. هذه المهمة من الممكن حلها بباسطة وبدون أي جهد يذكر بواسطة الإنسان، لكن لا تزال هذه المسألة غير محلولة بشكل فعال ونهائي من قبل الحاسوب في شكلها العام. جميع الطرق الموجودة لحل هذه المسألة تقوم بإيجاد أفضل الحلول من أجل إيجاد أشكال معينة كالأشكال الهندسية، وجوه الأشخاص، الأحرف المطبوعة أو المكتوبة، أو السيارات، وفي حالات معينة فقط محددة على الغالب بظروف إضاءة محددة، خلفية ووضعية معينة للجسم بالنسبة للكاميرا. هناك أنواع مختلفة لمشكلة التعرف مشروحة في المراجع العلمية:

التعرف Recognition: يتم التعرف على واحد أو البعض من الأجسام التي تم تعليمها مسبقاً للحاسوب، غالباً بأوضاعها المختلفة أو بزاويا مختلفة للكاميرا.
التحديد: تحديد مطابق وحيد للجسم المعرف. مثلاً: تحديد وجه شخص معين أو التعرف على بصمة شخص معين أو سيارة من نوع معين.
التحري: يتم البحث في بيانات الصورة لإيجاد جسم معين. مثال: تحري وجود خلايا مريضة في صورة طبية، التحري عن وجود سيارة على طريق سريع.
استرجاع الصورة بناء على المضمون: یتم استراجاع الصور المخزنة في قاعدة بيانات معينة، بناء على المحتوى والمفاهيم المشابهة للإستعلام من داخل قاعدة البيانات، من أشهر طرق الإستعلام في أنظمة ال CBIR هو الإستعلام بالصورة Query Image حيث يتم ادخال صورة ويكون الخرج مجموعة الصور المشابهة.

الحركة

يوجد العديد من المهام التي تتعلق بتقدير الحركة حيث تعالج فيها سلسلة من الصور المتعاقبة زمنياً من أجل حساب السرعة إما عند كل نقطة في الصورة أو في المشهد الثلاثي الأبعاد. بعض الأمثلة على هذه المهام هي:

حركة الكاميرا Egomotion: تحديد الحركة الصلبة للكاميرا في الفضاء الثلاثي الأبعاد.
التتبع Tracking: تتبع حركة الأجسام في الصورة المتعاقبة زمنياً (فيديو) مثل تتبع الأشخاص أو السيارات.
التدفق البصري : يحدد نمط الحركة الظاهرية لكل نقطة في المشهد المرئي.

إعادة بناء المشهد

بإعطاء صورة واحدة (بشكل عام أكثر من واحدة) لجسم معين أو صور متعاقبة، تهدف عملية بناء المشهد إلى حساب الموديل الثلاثي البعد للمشهد. وفي أبسط الحالات من الممكن إعادة بناء الجسم على شكل مجموعة من النقاط الثلاثية الأبعاد. وهناك طرق معقدة أكثر تقوم ببناء النموذج السطحي الكامل للأجسام.

هناك عدة تقنيات لتركيب المشهد منها:Photometric Stereo: وتتم عن طريق القاء الضوء على الجسم مرتين (أو ثلاث مرات لإزالة التشويش) من مكانين مختلفين. عن طريق معادلات رياضية ممكن معرفة العلاقة بين سطح الجسم ومقدار الضوء المرتد من السطح. Stereo Correspondence: وتتم عن طريق الأخذ بصورتين ثنائيتي الأبعاد من المشهد الذي يراد اظهاره في ثلاثة ابعاد. الصورتين لابد ان تكون من مكانين مختلفين من المشهد (الأفضل ان تكونا على نفس الخط الأفقي ولكن هناك اختلاف بسيط في الخط العمودي).

ترميم الصورة

تهدف عملية ترميم الصور إلى إزالة التشويش (تشويش المستشعرات، تشويش الحركة وغيرهما) من الصور. تعتبر عمليات الفلترة (فلتر المتوسط - فلتر الوسيط..الخ) من أبسط عمليات إزالة التشويش من الصور. وهناك عمليات معقدة أكثر تفترض الشكل الذي تبدو عليه الصور مما يسمح لها بالتمييز بين الصورة والتشويش. يتم بشكل مبدئي التعرف على مكونات الصورة كالخطوط والمستقيمات ومن ثم التحكم بالفلتر بناء على المعلومات المحلية في جزء الصورة حيث يتم الحصول على نتائج أفضل من استخدام الفلاتر البسيطة.

المراجع

areq.net

التصانيف

حوسبة رؤية حاسوبية ذكاء اصطناعي العلوم التطبيقية

رؤية حاسوبية

أمثلة

مقارنة

فروع

المهام الأساسية للرؤية الحاسوبية

التعرف

الحركة

إعادة بناء المشهد

ترميم الصورة

المراجع

التصانيف

مقالات قد تهمك

تصفح الموسوعة

المقالات الأكثر قراءة

رؤية حاسوبية

أمثلة

مقارنة

فروع

​​المهام الأساسية للرؤية الحاسوبية

التعرف

الحركة

​​إعادة بناء المشهد

ترميم الصورة

المراجع

التصانيف

مقالات قد تهمك

تصفح الموسوعة

المقالات الأكثر قراءة

الإشتراك بالقائمة البريدية

المهام الأساسية للرؤية الحاسوبية

إعادة بناء المشهد