رئيسي التعاون يتيح Google AI Now للمستخدمين ترجمة النص على الفور بـ 27 لغة باستخدام كاميرات الهاتف

يتيح Google AI Now للمستخدمين ترجمة النص على الفور بـ 27 لغة باستخدام كاميرات الهاتف

ما الفيلم الذي يجب رؤيته؟
 
(Gif: جوجل)

(Gif: جوجل)



بفضل الذكاء الاصطناعي ، لم يكن السفر إلى الخارج أسهل من أي وقت مضى.

يتيح تطبيق Google Translate للمستخدمين ترجمة النص على الفور. في التطبيق ، ما عليك سوى توجيه الكاميرا نحو النص الذي تريد ترجمته وسترى أنه يتحول إلى لغتك التي تريدها مباشرة أمام عينيك - لا يلزم الاتصال بالإنترنت أو بيانات الهاتف الخلوي. هذه الميزة المفيدة كانت متاحة لبعض الوقت ، لكنها كانت متوافقة مع سبع لغات فقط. الآن بفضل التعلم الآلي ، قامت Google بترقية التطبيق لترجمة 27 لغة على الفور.

لذا في المرة القادمة التي تكون فيها في براغ ولا يمكنك قراءة قائمة الطعام ، فقد نساندك ، كتب أوتافيو جود ، مهندس برمجيات في Google ، عن أبحاث الشركة مدونة او مذكرة .

استخدمت Google أيضًا الذكاء الاصطناعي لتقليل أخطاء التعرف على الكلام إلى النصف.

اعتبارًا من اليوم ، بالإضافة إلى الترجمة بين الإنجليزية والفرنسية والألمانية والإيطالية والبرتغالية والروسية والإسبانية ، يمكن ترجمة اللغات العشرين التالية في الوقت الفعلي أيضًا: البلغارية والكتالونية والكرواتية والتشيكية والدنماركية والهولندية والفلبينية ، الفنلندية والهنغارية والإندونيسية والليتوانية والنرويجية والبولندية والرومانية والسلوفاكية والسويدية والتركية والأوكرانية. وإذا اخترت التقاط صورة بدلاً من مشاهدة النص يترجم مباشرة ، فسيتم دعم ما مجموعه 37 لغة.

إذن كيف تمكنت Google من زيادة عدد اللغات المتاحة؟ استحوذوا أولاً على Word Lens ، وهو تطبيق لترجمة الواقع المعزز سابقًا ، واستخدموا التعلم الآلي والشبكات العصبية التلافيفية لتعزيز إمكانات التطبيق. كانت التطورات في التعرف على الصور أساسية.

قبل خمس سنوات ، إذا أعطيت جهاز كمبيوتر صورة قطة أو كلب ، فسيواجه صعوبة في معرفة أيهما. قال السيد جود إنه بفضل الشبكات العصبية التلافيفية ، لا تستطيع أجهزة الكمبيوتر فقط التمييز بين القطط والكلاب ، بل يمكنها أيضًا التعرف على سلالات مختلفة من الكلاب. نعم ، هم جيدون لأكثر من مجرد تريبي الفن —إذا كنت تترجم قائمة أجنبية أو توقع باستخدام أحدث إصدار من تطبيق الترجمة من Google ، فأنت الآن تستخدم شبكة عصبية عميقة.

خطوة بخطوة

أولا ، يجب أن يتخلص تطبيق الترجمة من الفوضى الموجودة في الخلفية ويحدد النص. عندما تحدد نقاط البكسل من نفس اللون ، فإنها تحدد أنها أحرف. وعندما تكون هذه النقاط قريبة من بعضها البعض ، فإنها تدرك أنه سطر متصل يجب قراءته.

التالي، يجب أن يتعرف التطبيق على ماهية كل حرف على حدة. هذا هو المكان الذي يأتي فيه التعلم العميق.

نحن نستخدم شبكة عصبية تلافيفية ، ندربها على الحروف وغير الحروف حتى تتمكن من معرفة شكل الحروف المختلفة ، كما يقرأ منشور المدونة.

كان على الباحثين تدريب البرنامج ليس فقط باستخدام الأحرف ذات المظهر النظيف ، ولكن باستخدام الأحرف القذرة أيضًا. كتب السيد جود أن الرسائل في العالم الحقيقي تشوبها الانعكاسات والأوساخ واللطخات وجميع أنواع الغرابة. لذلك قمنا ببناء مولد الرسائل الخاص بنا لإنشاء جميع أنواع الأوساخ المزيفة لتقليد ضوضاء العالم الحقيقي بشكل مقنع - الانعكاسات المزيفة واللطخات المزيفة والغرابة الزائفة في كل مكان. قليلا من ال

بعض الحروف القذرة تستخدم للتدريب. (الصورة: جوجل)








ال الثالث الخطوة هي البحث عن الأحرف التي تم التعرف عليها في قاموس للحصول على الترجمات. وللمحاولة الإضافية للدقة ، تكون عمليات البحث في القاموس تقريبية في حالة خطأ قراءة S على أنها 5.

أخيرا، يتم تقديم النص المترجم أعلى النص الأصلي بنفس النمط.

يمكننا القيام بذلك لأننا وجدنا بالفعل الأحرف الموجودة في الصورة وقرأناها ، حتى نعرف مكانها بالضبط. يمكننا إلقاء نظرة على الألوان المحيطة بالحروف واستخدامها لمحو الأحرف الأصلية. وبعد ذلك يمكننا رسم الترجمة في الأعلى باستخدام لون المقدمة الأصلي ، كما يقرأ منشور المدونة.

من أجل تحقيق أكبر قدر ممكن من الكفاءة والسماح بإكمال كل هذه الخطوات في الوقت الفعلي دون اتصال بالإنترنت أو اتصال بيانات ، طور فريق Google شبكة عصبية صغيرة جدًا بحد أعلى على كثافة المعلومات التي يمكنها التعامل معها. نظرًا لأنهم كانوا ينشئون بيانات التدريب الخاصة بهم ، كان من المهم تضمين البيانات الصحيحة ولكن لا شيء إضافي حتى لا تستخدم الشبكة العصبية الكثير من كثافة المعلومات الخاصة بها في أشياء غير مهمة. مثال على ذلك هو كيف يحتاج إلى التعرف على حرف مع قدر ضئيل من الدوران ، ولكن ليس كثيرًا.

في النهاية ، يتبقى للمستخدمين 20 لغة أخرى ولكن بنفس السرعة.

راجع أيضًا: قدم لنا فريق الذكاء الاصطناعي في Google المعلومات الداخلية حول أبحاث التعلم الآلي

المقالات التي قد تعجبك :