الأربعاء، 19 فبراير 2020

اليات عمل محركات البحث العكسي بالصور

ربما تكون صورتك المتوسطة أقل بكثير من ألف كلمة - فهناك الكثير مما يمكنك تعلمه من صور سيلفي. لكن في بعض الأحيان تحتاج فقط إلى معرفة مصدر الصورة ، بغض النظر عن عدد الكلمات التي تستحقها.
لذلك ، توجد محركات بحث عكسي للصور مقدمة من أمثال Google و TinEye و Bing و Yandex و Pixsy وغيرها الكثير. نظرًا لأنك لا تقدم أي كلمات في استفسارك ، فكيف يعرفون ما الذي تبحث عنه؟ والأهم من ذلك ، كيف يجدونها؟ تختلف طريقة عمل البحث عن الصور العكسي لكل محرك بحث ، ويحتفظون بخوارزمياتهم الدقيقة تحت اللفائف ، لكن الأفكار الأساسية موجودة ولا يصعب فهمها.
البصمات
قد تكون الصور في الواقع أكثر فريدة من بصمات الأصابع البشرية ، نظرًا لأن احتمالات ظهور صورتين تحتويان على نفس الترتيب الدقيق للبكسلات لا حدود لها على الإطلاق ، في حين أن فرصة الاصطدام ببصمات الأصابع تبلغ حوالي 64 مليار - احتمالات جيدة نسبيًا. ولكن كيف يمكنك بصمة صورة؟ تختلف الخطوات اعتمادًا على الخوارزمية ، ولكن معظمها يتبع نفس الصيغة الأساسية.
أولاً ، يجب عليك قياس ميزات الصورة ، والتي قد تشمل اللون ، والأنسجة ، والتدرجات ، والأشكال ، والعلاقات بين أجزاء مختلفة من الصورة ، وحتى أشياء مثل Fourier Transforms (طريقة لتقسيم الصور إلى جيب التمام وجيب التمام).
لنفترض أننا نبحث عن الصورة التالية ونحتاج إلى بصمة منها.
للقيام بذلك ، قد نستخدم ، من بين أشياء أخرى ، رسم بياني لوني للصورة ، وتحويل فورييه ، وخريطة نسيج ،
إذا تم تغيير حجم الصورة أو عدم وضوحها أو تدويرها أو معالجتها بطريقة أخرى ، فسيكون هناك عدد من الخوارزميات التي تستخدم ما سبق والميزات الأخرى لمحاولة العثور على نتائج.
الترميز والتخزين والبحث
يمكن تشفير كل ميزة صورة في بصمة الإصبع كسلاسل من الحروف والأرقام ، والتي يسهل تخزينها وفهرستها في قاعدة بيانات. أيا كان الجمع بين الميزات المستخرجة وتخزينها ، فسيصبح إدخال محرك بحث الصور العكسي لتلك الصورة. تحتوي قاعدة بيانات TinEye ، على سبيل المثال ، على حوالي 39.6 مليار صورة مفهرسة اعتبارًا من فبراير 2020 ، مما يعني أنهم قاموا بتشغيل الخوارزمية الخاصة بهم على العديد من الصور ويقومون بتخزين كل تلك البصمات لمقارنة الصور التي يتم البحث عنها.
عكس قاعدة بيانات البحث عن الصور
الجزء الرئيسي الثاني من الخوارزمية هو معرفة الصور المتشابهة. عندما تقوم بتحميل صورة ، فسوف تمر عبر خوارزمية البصمة لمحرك بحث الصور العكسي. سيحاول محرك البحث بعد ذلك العثور على الإدخالات التي لها أقرب بصمات ، والتي يشار إليها باسم "مسافة الصورة". إن تحديد العوامل التي يمكن مقارنتها وكيفية ترجيحها يعود إلى كل محرك بحث ، لكنهم يهدفون في الغالب إلى إيجاد مسافة صورة كلية قريبة من الصفر قدر الإمكان.
ماذا عن التعلم الآلي / الذكاء الاصطناعي؟
بفضل تقنيات البصمات / الفهرسة الموضحة أعلاه ، كان البحث العكسي عن الصور جيدًا جدًا حتى قبل تطبيق نظام الذكاء الاصطناعي عليه. نظرًا لأن الذكاء الاصطناعي ممتاز في معالجة الصور ، فمن المرجح أن تستخدم العديد من محركات البحث الرئيسية أشياء مثل الشبكات العصبية التلافيفية (CNN) للمساعدة في استخراج الملصقات وتمييزها. يمكن أن تستخدم Google ، على سبيل المثال ، شبكة CNN في بحثها العكسي عن الصور ، مما يسمح لها بالوصول إلى الكلمات الرئيسية المحتملة للصورة وإنتاج نتائج الويب والصور ذات الصلة ، كما كانت تفعل في صور Google لبعض الوقت الآن.
هذا يأخذ البحث عن الصور العكسي خطوة فوق استخراج ميزة بسيطة ومسافة الصورة. تعمل الشبكات العصبية التلافيفية بشكل أساسي على تشغيل الصور من خلال مرشحات متعددة تحدد عدة أنواع مختلفة من الميزات ، ثم حاول تصنيفها بناءً على التدريب السابق. هذا تبسيط مفرط ، بالطبع ، لكن يكفي القول إن شبكات CNN تجعل البحث عن الصور أكثر دقة ومساعدة وربما يتم تنفيذها إلى جانب أساليب البصمات الأقدم لرؤية الكمبيوتر.
ما هو أفضل محرك بحث عكسي للصور؟
تعني الخوارزميات المختلفة أن محركات البحث عن الصور المختلفة جيدة في أشياء مختلفة ، على الرغم من أنها كلها تهدف في النهاية إلى الهدف نفسه: العثور على تطابق للصورة التي قمت بتحميلها. تتميز صور Google بمعدل نجاح جيد جدًا ، على سبيل المثال ، ولكنها تتمتع بالكثير من "أفضل التخمين" ، حيث تحصل على العديد من الصور المتشابهة ولكن غير متطابقة. هذا شيء رائع إذا كنت تتبع حالة مزاجية أو فئة عامة ، لكن محركًا مثل TinEye يركز بشكل كبير على العثور على صور متطابقة ، حتى لو كانت شديدة التحرير ، ويمكنه حتى تحديد الصور داخل الصور ، مما يجعله أفضل قليلاً إذا أنت بحاجة إلى تطابق تام.
يشتهر محرك البحث الروسي أيضًا بأنه يمتلك أداة ممتازة للبحث عن الصور ، على الرغم من أنه من المحتمل أن يكون أفضل ما يمكن عمله في الموضوعات الروسية. تركز أدوات مثل Pixsy و ImageRaider على تحديد حالات الاستخدام غير المصرح به ، لذلك تميل إلى تضمين المزيد من الميزات مثل التنبيهات والتركيز على مراقبة مكتبات صور المستخدم.
نظرًا لأن الخوارزميات تتغير طوال الوقت وتظل مغلقة عمومًا ، فإن الأمر يستحق التحقق من عدة محركات مختلفة إذا لم يعرض أحد النتائج التي تبحث عنها.

تعليقات فيسبوك
0 تعليقات بلوجر

ليست هناك تعليقات:

إرسال تعليق

إتصل بنا

الإسم الكريم البريد الإلكتروني مهم الرسالة مهم