إزالة الغموض عن YOLO: فهم خوارزمية اكتشاف الكائنات مع الأمثلة

تتعمق هذه المقالة في خوارزمية YOLO (أنت تنظر مرة واحدة فقط)، وهي طريقة عالية الكفاءة للكشف عن الأشياء تستخدم على نطاق واسع في مجالات مثل المراقبة والسيارات ذاتية القيادة والروبوتات.

من خلال استخدام شبكة عصبية تلافيفية بالكامل، يتيح YOLO اكتشاف الكائنات في الوقت الفعلي، مما يجعله مناسبًا للبيئات المحدودة الموارد.

يستكشف المقال تطور YOLO من خلال إصدارات مختلفة، مع تسليط الضوء على التحسينات مثل صناديق التثبيت، وبنيات CNN المختلفة، وصناديق التثبيت الديناميكية.

ويناقش أيضًا مقاييس التقييم الرئيسية لقياس أداء نموذج اكتشاف الكائنات.

بالنسبة لأولئك الذين يسعون إلى فهم شامل لتطورات YOLO's، توفر هذه المقالة رؤى وأمثلة قيمة.

الماخذ الرئيسية

  • YOLO (أنت تنظر مرة واحدة فقط) هي خوارزمية شائعة للكشف عن الكائنات بلقطة واحدة لتحديد الكائنات وتحديد موقعها في الصور أو مقاطع الفيديو.
  • تم تحسين إصدارات YOLO بشكل مستمر على مر السنين، حيث يقدم كل إصدار ميزات وبنيات جديدة لتعزيز الدقة والأداء.
  • تتميز خوارزميات الكشف عن الكائنات ذات اللقطة الواحدة مثل YOLO بالكفاءة الحسابية ومناسبة للتطبيقات في الوقت الفعلي والبيئات المحدودة الموارد.
  • من ناحية أخرى، توفر خوارزميات الكشف عن الكائنات ثنائية الطلقة دقة أعلى ولكنها أكثر تكلفة من الناحية الحسابية ومناسبة للتطبيقات التي تكون فيها الدقة أكثر أهمية من الأداء في الوقت الفعلي.

أساسيات الكشف عن الكائنات

يعد اكتشاف الكائنات مهمة حاسمة في رؤية الكمبيوتر، ويتضمن تحديد الكائنات وتوطينها في الصور أو مقاطع الفيديو. ويلعب دورًا حيويًا في تطبيقات مختلفة مثل المراقبة والسيارات ذاتية القيادة والروبوتات.

ومع ذلك، هناك العديد من التحديات في الكشف عن الكائنات التي تحتاج إلى معالجة. تتضمن هذه التحديات التعامل مع الانسدادات، والاختلافات في مظهر الكائن، ووجود الخلفيات المزدحمة. بالإضافة إلى ذلك، يجب أن تكون خوارزميات اكتشاف الكائنات فعالة ودقيقة لتلبية متطلبات التطبيقات في الوقت الفعلي.

على الرغم من هذه التحديات، فإن تطبيقات اكتشاف الأشياء واسعة النطاق وتستمر في التوسع. من تحسين أنظمة الأمان إلى تمكين المركبات ذاتية القيادة، تتمتع تكنولوجيا الكشف عن الأشياء بالقدرة على إحداث ثورة في مختلف الصناعات.

طلقة واحدة مقابل. كشف الأجسام بطلقتين

عند مقارنة خوارزميات الكشف عن الكائنات، أحد الفروق المهمة التي يجب مراعاتها هو الاختيار بين طرق الكشف عن اللقطة الواحدة أو اللقطة المزدوجة.

توفر خوارزميات الكشف عن الكائنات ذات اللقطة الواحدة، مثل YOLO، ميزة الكفاءة الحسابية من خلال إجراء تنبؤات في تمريرة واحدة من الصورة المدخلة. وهذا يجعلها مناسبة للتطبيقات في الوقت الحقيقي والبيئات المحدودة الموارد. ومع ذلك، قد تكون لطرق الكشف بالطلقة الواحدة قيود في الكشف الدقيق عن الأجسام الصغيرة وقد تكون أقل دقة بشكل عام مقارنة بطرق الكشف بالطلقتين.

من ناحية أخرى، تشتمل طرق الكشف عن الكائنات ذات اللقطة المزدوجة على تمريرتين للصورة المدخلة، حيث يؤدي التمرير الأول إلى إنشاء مقترحات للكائنات والتمرير الثاني إلى تحسين هذه المقترحات. على الرغم من أنها توفر دقة أعلى، إلا أنها أكثر تكلفة من الناحية الحسابية وقد لا تكون مناسبة للتطبيقات في الوقت الفعلي.

يعتمد الاختيار بين اكتشاف الكائنات بطلقتين أو طلقة واحدة على المتطلبات والقيود المحددة للتطبيق، مع تحقيق التوازن بين الدقة والكفاءة الحسابية.

المقاييس الأساسية لتقييم نماذج الكشف عن الكائنات

أحد الجوانب المهمة التي يجب مراعاتها عند تقييم نماذج اكتشاف الكائنات هو اختيار المقاييس الأساسية لقياس أدائها. يطرح تقييم نماذج الكشف عن الكائنات العديد من التحديات، بما في ذلك الحاجة إلى الكشف الدقيق والفعال عن الكائنات في بيئات مختلفة والقدرة على التعامل مع مجموعة واسعة من أحجام الكائنات والانسدادات.

ولمواجهة هذه التحديات، تم اقتراح مقاييس تقييم مختلفة لخوارزميات الكشف عن الكائنات. أحد المقاييس الشائعة الاستخدام هو التقاطع عبر الاتحاد (IoU)، الذي يقيس دقة الترجمة للمربعات المحيطة المتوقعة. يعد متوسط الدقة (AP) مقياسًا مهمًا آخر يوفر قياسًا لأداء النموذج عبر الفئات المختلفة. يتم أيضًا استخدام الدقة والاستدعاء بشكل شائع لتقييم أداء اتخاذ القرار لنماذج اكتشاف الكائنات.

تطور YOLO: الإصدارات والتحسينات

يمكن رؤية تطور YOLO، وهي خوارزمية مستخدمة على نطاق واسع للكشف عن الكائنات، من خلال إصداراتها وتحسيناتها المستمرة. من المتوقع أن يوفر الإصدار المؤكد YOLO v8 ميزات جديدة وأداءً محسنًا. مع واجهة برمجة التطبيقات الجديدة ودعم إصدارات YOLO السابقة، تهدف إلى تعزيز قدرات الخوارزمية.

في تحليل مقارن مع خوارزميات الكشف عن الكائنات الأخرى، أظهرت YOLO نقاط قوتها من حيث الأداء والكفاءة في الوقت الفعلي. ومع ذلك، فقد تم اعتباره بشكل عام أقل دقة مقارنة بالكاشفات ثنائية الطلقة. من المتوقع أن يعالج YOLO v8 هذه القيود ويسد فجوة الدقة بشكل أكبر مع نظيراته.

مع الوعد بأداء أفضل وميزات جديدة، تم إعداد YOLO v8 لترسيخ مكانتها كخوارزمية رائدة للكشف عن الكائنات.

YOLO V2: صناديق التثبيت ووظيفة الخسارة الجديدة

أحدث YOLO V2 ثورة في اكتشاف الكائنات من خلال دمج صناديق التثبيت وإدخال وظيفة فقدان جديدة. جلب هذا التقدم تحسينات كبيرة على أداء خوارزمية YOLO.

دعونا نلقي نظرة فاحصة على تأثير هذه التغييرات:

مزايا صناديق التثبيت:

  • المربعات المرساة هي مربعات محيطة محددة مسبقًا بأحجام ونسب عرض إلى ارتفاع مختلفة.
  • إنها تسمح للنموذج بالتنبؤ بالأشياء ذات الأشكال والأحجام المختلفة بشكل أكثر دقة.
  • توفر صناديق التثبيت معرفة مسبقة حول الكائنات، مما يساعد في تحديد الموقع الدقيق.

تأثير وظيفة الخسارة على أداء YOLO v2:

  • تأخذ وظيفة الخسارة الجديدة في الاعتبار أخطاء التصنيف والتعريب.
  • فهو يعاقب التنبؤات غير الصحيحة بشكل أكثر فعالية، مما يؤدي إلى دقة أفضل.
  • تشجع وظيفة الخسارة أيضًا النموذج على التركيز على التنبؤ بالأشياء ذات المقاييس ونسب العرض إلى الارتفاع المختلفة.

YOLO V3: بنية CNN وشبكات الهرم المميزة

قدمت خوارزمية YOLO V3 بنية الشبكة العصبية التلافيفية (CNN) وتتميز بالشبكات الهرمية، مما أدى إلى تقدم كبير في اكتشاف الكائنات. لقد وجد YOLO V3 تطبيقات واسعة النطاق في الكشف عن الأشياء في الوقت الفعلي نظرًا لكفاءته ودقته. إنه يتفوق على الإصدارات السابقة من YOLO وخوارزميات الكشف عن الكائنات الأخرى من حيث السرعة وأداء الكشف.

تتيح بنية CNN في YOLO V3 للشبكة التعرف على الميزات المعقدة وإجراء التنبؤات على مستويات متعددة. يتيح ذلك لـ YOLO V3 اكتشاف الكائنات ذات الأحجام المختلفة بدقة.

تعمل الشبكات الهرمية المميزة على تعزيز قدرات الكشف من خلال دمج ميزات متعددة النطاق من طبقات مختلفة من الشبكة. يتيح ذلك لـ YOLO V3 التعامل مع الكائنات بمقاييس ونسب أبعاد مختلفة بشكل أكثر فعالية.

YOLO V4 إلى V7: التطورات وآخر التطورات

مع إصدار YOLO v4 في عام 2020، جلبت الإصدارات اللاحقة (v5 وv6 وv7) تطورات كبيرة وآخر التطورات في خوارزمية YOLO للكشف عن الكائنات. وكان لهذه التطورات تأثير عميق على تطبيقات الوقت الحقيقي، مما أحدث ثورة في مجال رؤية الكمبيوتر.

فيما يلي بعض النقاط الرئيسية:

  • تحسين الدقة والسرعة: قدم YOLO v4 بنية CNN جديدة، وأنشأ صناديق ربط باستخدام تجميع الوسائل k، واستخدم فقدان GHM. أدت هذه التحسينات إلى تحسين الدقة وأوقات معالجة أسرع، مما يجعل YOLO أكثر كفاءة للتطبيقات في الوقت الفعلي.
  • قدرات محسنة للكشف عن الكائنات: يتضمن الإصدار 5 من YOLO بنية EfficientDet وصناديق التثبيت الديناميكية وتجميع الهرم المكاني (SPP)، مما يزيد من تحسين أداء اكتشاف الكائنات، خاصة بالنسبة للأشياء الصغيرة.
  • أداء متطور: يستخدم الإصدار 7 من YOLO، الإصدار الأحدث، تسعة صناديق تثبيت، وفقدان بؤري، ودقة أعلى لتحقيق دقة وسرعة أفضل.

وقد فتحت هذه التطورات في اكتشاف الكائنات إمكانيات جديدة لمجموعة واسعة من التطبيقات، بما في ذلك المراقبة والمركبات ذاتية القيادة والروبوتات، مما مكن المستخدمين من الحصول على قدرات متقدمة للكشف عن الكائنات في الوقت الفعلي.

أسئلة مكررة

كيف يمكن مقارنة YOLO بخوارزميات اكتشاف الكائنات الأخرى من حيث الدقة والكفاءة الحسابية؟

من حيث الدقة والكفاءة الحسابية، فإن YOLO (أنت تنظر مرة واحدة فقط) يمكن مقارنتها بشكل إيجابي بخوارزميات الكشف عن الكائنات الأخرى. عند مقارنتها بـ Faster R-CNN، توفر YOLO سرعة استدلال أسرع نظرًا لنهج الكشف عن اللقطة الواحدة.

ومع ذلك، قد يضحي YOLO ببعض الدقة، خاصة في اكتشاف الأشياء الصغيرة. تعد هذه المقايضة بين الدقة والسرعة أحد الاعتبارات الشائعة في خوارزميات اكتشاف الكائنات.

في النهاية، يعتمد الاختيار بين YOLO والخوارزميات الأخرى على المتطلبات والقيود المحددة للتطبيق.

ما هي مزايا وعيوب اكتشاف الأجسام بلقطة واحدة مقارنة باكتشاف الأجسام بلقطة مزدوجة؟

تشمل مزايا اكتشاف الأشياء بلقطة واحدة ما يلي:

  • الأداء في الوقت الحقيقي
  • الملاءمة للبيئات المحدودة الموارد

يستخدم اكتشاف الكائنات بلقطة واحدة تمريرة واحدة للصورة المدخلة، مما يجعلها فعالة من الناحية الحسابية. ومع ذلك، قد تكون أقل دقة، خاصة في اكتشاف الأشياء الصغيرة.

من ناحية أخرى، يوفر اكتشاف الأشياء ثنائي الطلقة ما يلي:

  • دقة أعلى باستخدام تمريرتين
  • تحسين مقترحات الكائنات

يعد اكتشاف الكائنات ثنائي الطلقة أكثر ملاءمة للتطبيقات التي يتم فيها إعطاء الأولوية للدقة على الأداء في الوقت الفعلي.

يعتمد الاختيار بين الاثنين على متطلبات وقيود محددة.

هل يمكنك شرح مقياس التقاطع فوق الاتحاد (Iou) وكيف يتم استخدامه لتقييم نماذج اكتشاف الكائنات؟

يُستخدم مقياس التقاطع على الاتحاد (IoU) بشكل شائع لتقييم دقة نماذج اكتشاف الكائنات. إنه يقيس التداخل بين المربع المحيط المتوقع والمربع المحيط بالحقيقة الأرضية لكائن ما. يشير ارتفاع IoU إلى دقة توطين أفضل.

بالإضافة إلى تقييم نماذج الكشف عن الكائنات، فإن مقياس IoU له تطبيقات في مجالات أخرى مثل تجزئة الصور وتتبعها.

لتحسين دقة نماذج الكشف عن الكائنات، يمكن استخدام تقنيات مثل القمع غير الأقصى وتحسين صندوق التثبيت بناءً على مقياس IoU.

ما هي الاختلافات والتحسينات الرئيسية التي تم إدخالها في كل إصدار من إصدارات YOLO (V2، V3، V4، V5، V6، V7)؟

تعتبر الاختلافات والتحسينات الرئيسية التي تم إدخالها في كل إصدار من YOLO (الإصدار 2، الإصدار 3، الإصدار 4، الإصدار 5، الإصدار 6، الإصدار 7) مهمة.

تم دمج صناديق التثبيت في YOLO v2 ووظيفة خسارة جديدة.

قدم YOLO v3 بنية CNN جديدة، وصناديق ربط بمقاييس ونسب عرض إلى ارتفاع مختلفة، وشبكات هرمية مميزة (FPN).

قدم YOLO v4 بنية CNN جديدة، وأنشأ صناديق ربط باستخدام تجميع الوسائل k، واستخدم فقدان GHM.

استخدم YOLO v5 بنية EfficientDet وصناديق التثبيت الديناميكية والتجميع الهرمي المكاني (SPP).

استخدم YOLO v6 بنية EfficientNet-L2 وقدم صناديق تثبيت كثيفة.

يستخدم الإصدار الأحدث من YOLO v7 تسعة صناديق تثبيت وفقدان بؤري ودقة أعلى لتحسين الدقة والسرعة.

حققت هذه الإصدارات من YOLO تحسينات كبيرة من حيث الدقة والكفاءة مقارنة بالإصدارات السابقة وخوارزميات الكشف عن الكائنات الأخرى.

يعتمد الاختيار بين اكتشاف الأجسام بلقطة واحدة أو طلقتين على المتطلبات والقيود المحددة للتطبيق.

هل هناك أي ميزات أو تحسينات قادمة متوقعة في الإصدار التالي من YOLO (V8)؟

يمكن توقع الميزات والتحسينات القادمة في الإصدار التالي من YOLO، وبالتحديد YOLO v8.

كإصدار متوقع للغاية، يعد YOLO v8 بتقديم ميزات جديدة وتحسين الأداء.

بفضل واجهة برمجة التطبيقات الجديدة ودعم إصدارات YOLO السابقة، يمكن للمستخدمين التطلع إلى وظائف محسنة ومرونة أكبر في مهام اكتشاف الكائنات الخاصة بهم.

بالإضافة إلى ذلك، قد يقدم YOLO v8 تطورات في مجالات مثل الدقة والسرعة وبنية النموذج، مما يزيد من توسيع حدود خوارزميات الكشف عن الكائنات.

خاتمة

في الختام، تطورت خوارزمية YOLO للكشف عن الكائنات بشكل ملحوظ على مر السنين، حيث أدخلت تحسينات مثل صناديق التثبيت، وبنيات CNN المختلفة، والشبكات الهرمية المميزة، وصناديق التثبيت الديناميكية.

أتاحت هذه التطورات لشركة YOLO تحقيق الأداء في الوقت الفعلي وجعلها مناسبة للبيئات المحدودة الموارد.

ومع التطوير المستمر وإصدار YOLO v7، تواصل الخوارزمية تعزيز قدرات اكتشاف الأشياء، مما يجعلها أداة قيمة في مجالات مختلفة مثل المراقبة والسيارات ذاتية القيادة والروبوتات.

اترك ردّاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

arArabic