الحواس الخمس هي وسائل الإدراك لدى الكائنات الحية التي تساعد في التعرف على الأشياء وتصنيفها لإدراك أهميتها، وتؤدي دورًا فريدًا عن طريق تلقي معلومات الإشارة من البيئة المحيطة عن طريق أجهزة الإحساس ثم تعمل على نقلها إلى الدماغ حتى يقوم بتفسيرها.
تتعلق الحواس الخمسة بالذكاء الاصطناعي في العديد من الجوانب. إليك بعض العلاقات بين الحواس الخمسة والذكاء الاصطناعي:
الرؤية
1. الرؤية الحاسوبية: تتيح تقنيات الذكاء الاصطناعي للكمبيوتر رؤية الصور والفيديوهات وتحليلها وتفسيرها.
2. التعرف على الأشكال: يمكن للذكاء الاصطناعي التعرف على الأشكال والكائنات في الصور والفيديوهات.
3. التعرف على الوجوه: يمكن للذكاء الاصطناعي التعرف على الوجوه وتحليل التعبيرات Facial Recognition.
السمع
1. التعرف على الصوت: يمكن للذكاء الاصطناعي التعرف على الأصوات والكلمات في الصوت.
2. التعرف على اللغة: يمكن للذكاء الاصطناعي التعرف على اللغة وتحليلها وتفسيرها.
3. الترجمة الآلية: يمكن للذكاء الاصطناعي ترجمة اللغات من لغة إلى أخرى.
اللمس
1. التعرف على اللمس: يمكن للذكاء الاصطناعي التعرف على اللمس والضغط على الشاشات اللمسية.
2. التعرف على الحركة: يمكن للذكاء الاصطناعي التعرف على الحركة والحركات الجسدية.
3. السيطرة على الروبوتات: يمكن للذكاء الاصطناعي السيطرة على الروبوتات وتوجيهها.
التذوق
1. التعرف على النكهات: يمكن للذكاء الاصطناعي التعرف على النكهات والروائح.
2. التعرف على المواد الغذائية: يمكن للذكاء الاصطناعي التعرف على المواد الغذائية وتحليلها.
3. تطوير الوصفات: يمكن للذكاء الاصطناعي تطوير الوصفات وتحسينها.
الشم
1. التعرف على الروائح: يمكن للذكاء الاصطناعي التعرف على الروائح والكيماويات.
2. التعرف على المواد الكيميائية: يمكن للذكاء الاصطناعي التعرف على المواد الكيميائية وتحليلها.
3. تطوير أنظمة الكشف: يمكن للذكاء الاصطناعي تطوير أنظمة الكشف عن المواد الكيميائية والروائح.
هذه بعض الأمثلة على العلاقة بين الحواس الخمسة والذكاء الاصطناعي. يمكن للذكاء الاصطناعي تحسين وتطوير العديد من التطبيقات والأنظمة التي تعتمد على الحواس الخمسة.
ما هي الحواس التي تمتلكها الذكاء الاصطناعي؟
قد يعتمد هذا على أجهزة استشعار تحاكي الحواس البشرية الشائعة ــ البصر والسمع واللمس والتذوق ــ فضلاً عن استيعاب المعلومات بطرق لا يستطيع البشر استيعابها. ويتطلب استشعار المعلومات ومعالجتها بواسطة الآلة عموماً أجهزة وبرامج متخصصة
كيف يدرك الذكاء الاصطناعي العالم ؟
الإدراك الآلي هو قدرة الكمبيوتر على استيعاب ومعالجة المعلومات الحسية بطريقة تشبه كيفية إدراك البشر للعالم. قد يعتمد على أجهزة الاستشعار التي تحاكي الحواس البشرية المشتركة — البصر والصوت واللمس والطعم — بالإضافة إلى أخذ المعلومات بطرق لا يستطيع البشر.
يتطلب استشعار ومعالجة المعلومات بواسطة الجهاز بشكل عام أجهزة وبرامج متخصصة. إنها عملية متعددة الخطوات لاستيعاب البيانات الخام ثم تحويلها أو ترجمتها إلى المسح الشامل والاختيار التفصيلي للتركيز الذي يدرك به البشر (والحيوانات) عالمهم.
الإدراك هو أيضا المرحلة الأولى في العديد من الذكاء الاصطناعي (AI) النماذج الحسية. تقوم الخوارزميات بتحويل البيانات التي تم جمعها من العالم إلى نموذج خام لما يتم إدراكه. المرحلة التالية هي بناء فهم أكبر للعالم المتصور ، وهي مرحلة تسمى أحيانًا الإدراك. بعد ذلك يأتي وضع الاستراتيجيات واختيار كيفية التصرف.
في بعض الحالات ، ليس الهدف هو جعل الآلات تفكر تمامًا مثل البشر ولكن فقط التفكير بطرق مماثلة. كثير خوارزميات التشخيص الطبي قد يوفر إجابات أفضل من البشر لأن أجهزة الكمبيوتر يمكنها الوصول إلى صور أو بيانات أكثر دقة مما يمكن للبشر إدراكه. الهدف ليس تعليم خوارزميات الذكاء الاصطناعي التفكير تمامًا كما يفعل البشر ، ولكن لتقديم رؤى مفيدة حول المرض الذي يمكن أن يساعد الأطباء والممرضات. هذا يعني أنه من المقبول وأحيانًا يفضل أن تدرك الآلة بشكل مختلف عن البشر.
أنواع إدراك الآلة
هنا بعض أنواع الإدراك الآلي ، في مراحل مختلفة من التطوير:
رؤية الآلة أو الكمبيوتر عبر الكاميرا الضوئية
السمع الآلي (اختبار الكمبيوتر) عبر الميكروفون
لمس الجهاز عبر مستشعر اللمس
رائحة الآلة (المُحمية) عن طريق الأنف الإلكتروني
طعم الآلة عبر اللسان الإلكتروني
التصوير ثلاثي الأبعاد أو المسح عبر ليدار مستشعر أو ماسح ضوئي
كشف الحركة عن طريق مقياس التسارع أو الجيروسكوب أو مقياس المغناطيسية أو مستشعر الانصهار
التصوير الحراري أو الكشف عن الأشياء عبر الماسح الضوئي بالأشعة تحت الحمراء
من الناحية النظرية ، فإن أي جمع مباشر للمعلومات من العالم يعتمد على الكمبيوتر هو تصور الآلة.
تعتبر العديد من المجالات التي تعتبر عادة تحديات لتطوير الإدراك الجيد للآلة هي تلك التي يعمل فيها البشر بشكل جيد ، ولكن ليس من السهل ترميزها كقواعد بسيطة. على سبيل المثال ، غالبًا ما تختلف الكتابة اليدوية البشرية من كلمة إلى أخرى. يمكن للبشر تمييز نمط ولكن من الصعب تعليم الكمبيوتر التعرف على الحروف بدقة لأن هناك العديد من الاختلافات الصغيرة.
حتى فهم النص المطبوع يمكن أن يكون تحديًا ، بسبب الخطوط المختلفة والتغيرات الدقيقة في الطباعة. يتطلب التعرف البصري على الأحرف برمجة الكمبيوتر للتفكير في أسئلة أكبر ، مثل الشكل الأساسي للحرف ، والتكيف إذا امتد الخط إلى بعض الجوانب.
يرغب بعض الباحثين في إدراك الآلة في إنشاء ملحقات بالكمبيوتر يمكن أن يبدأ حقًا في تكرار الطريقة التي يشعر بها البشر بالعالم. يقوم البعض ببناء أنوف وألسنة إلكترونية تحاول تقليد أو حتى تكرار التفاعلات الكيميائية التي يفسرها الدماغ البشري.
في بعض الحالات ، توفر الإلكترونيات استشعارًا أفضل من الأعضاء البشرية المكافئة. يمكن للعديد من الميكروفونات الشعور بترددات الصوت خارج النطاق البشري. يمكنهم أيضًا التقاط أصوات ناعمة جدًا بحيث لا يمكن للبشر اكتشافها. ومع ذلك ، فإن الهدف هو فهم كيفية جعل الكمبيوتر يشعر بالعالم كما يفعل الإنسان.
يركز بعض علماء إدراك الآلة على محاولة محاكاة كيفية قدرة البشر على التمسك بأصوات معينة. على سبيل المثال ، غالبًا ما يكون الدماغ البشري قادرًا على تتبع محادثات معينة في بيئة صاخبة. يعد تصفية ضوضاء الخلفية تحديًا لأجهزة الكمبيوتر لأنه يتطلب تحديد الميزات البارزة خارج بحر من النغمة.
ما هي الحواس البشرية التي يمكن للآلات تقليدها جيدًا؟
تعتمد أجهزة الكمبيوتر على العديد من أجهزة الاستشعار المختلفة للسماح لها بالتواصل مع العالم ، لكنها تتصرف بشكل مختلف عن الأعضاء البشرية التي تشعر بنفس الأشياء. بعضها أكثر دقة ويمكنه التقاط المزيد من المعلومات حول البيئة بدقة أكبر. البعض الآخر ليس دقيقًا.
رؤية الآلة قد يكون أقوى معنى ، بفضل الكاميرات المتطورة والعدسات البصرية التي يمكن أن تجمع المزيد من الضوء. في حين يتم ضبط العديد من هذه الكاميرات عن عمد لتكرار الطريقة التي تستجيب بها العين البشرية للون ، يمكن للكاميرات الخاصة التقاط مجموعة أوسع من الألوان ، بما في ذلك بعض الألوان التي لا تستطيع العين البشرية رؤيتها. غالبًا ما تستخدم أجهزة استشعار الأشعة تحت الحمراء للبحث عن تسرب الحرارة في المنازل.
الكاميرات أيضًا أكثر حساسية للتغيرات الدقيقة في شدة الضوء ، لذلك من الممكن لأجهزة الكمبيوتر إدراك التغييرات الطفيفة بشكل أفضل من البشر. على سبيل المثال ، يمكن للكاميرات التقاط التدفق الخفي الذي يأتي مع اندفاع الدم من خلال الشعيرات الدموية للوجه وبالتالي تتبع ضربات قلب الشخص.
صوت غالبًا ما يكون النوع التالي الأكثر نجاحًا لإدراك الماكينة. الميكروفونات صغيرة وغالبًا ما تكون أكثر حساسية من آذان الإنسان ، وخاصة آذان الإنسان القديمة. يمكنهم اكتشاف الترددات بشكل جيد خارج النطاق البشري ، مما يسمح لأجهزة الكمبيوتر بسماع الأحداث وتتبع الأصوات التي لا يستطيع البشر حرفياً.
يمكن أيضًا وضع الميكروفونات في صفائف ، حيث يتتبع الكمبيوتر ميكروفونات متعددة في وقت واحد ، مما يسمح له بتقدير موقع المصدر بكفاءة أكبر مما يستطيع البشر. يمكن أن توفر المصفوفات التي تحتوي على ثلاثة ميكروفونات أو أكثر تقديرات أفضل من البشر الذين لديهم أذنان فقط.
يمكن لأجهزة الكمبيوتر الشعور لمس، ولكن عادة فقط في ظروف خاصة. يمكن أن تكون شاشات اللمس أو لوحات اللمس على الهواتف وأجهزة الكمبيوتر المحمولة دقيقة للغاية. يمكنهم اكتشاف أصابع متعددة وحركات صغيرة. عمل المطورون أيضًا على السماح لهذه المستشعرات باكتشاف الاختلافات في طول اللمس ، بحيث يمكن أن يكون لإجراءات مثل اللمسة الطويلة أو الصنبور القصير معاني مختلفة.
رائحة و طعم يتم التعامل معها بشكل أقل شيوعًا من قبل مطوري تصور الآلة. هناك عدد قليل من أجهزة الاستشعار التي تحاول تقليد هذه الحواس البشرية ، ربما لأن هذه الحواس تعتمد على مثل هذه الكيمياء المعقدة. في بعض المختبرات ، تمكن الباحثون من تقسيم العمليات إلى خطوات صغيرة بما يكفي يمكن لبعض خوارزميات الذكاء الاصطناعي أن تبدأ في شمها أو تذوقها.
هل الإدراك الآلي صعب؟
علم علماء الذكاء الاصطناعي بسرعة أن بعض أبسط المهام للبشر يمكن أن يكون من الصعب جدًا على أجهزة الكمبيوتر تعلم القيام به. على سبيل المثال ، إن النظر إلى غرفة والبحث عن مكان للجلوس يحدث تلقائيًا لمعظمنا. لا تزال مهمة صعبة للروبوتات.
في الثمانينيات ، وصف هانز مورافيك المفارقة بهذه الطريقة: “من السهل نسبيًا جعل أجهزة الكمبيوتر تعرض أداءً على مستوى البالغين في اختبارات الذكاء أو لعب لعبة الداما ، ومن الصعب أو المستحيل منحها مهارات طفل يبلغ من العمر عامًا واحدًا عندما يتعلق الأمر بالإدراك والتنقل. ”
بعض هذا لأن البشر لا يلاحظون مدى صعوبة عمل دماغهم على تفسير حواسه. غالبًا ما يقدر علماء الدماغ أن أكثر من نصف الدماغ يعمل على فهم ما تحدق به أعيننا. نميل إلى رؤية الأشياء دون أن نقرر بوعي البحث عنها ، على الأقل في الإضاءة العادية. فقط في الظلام أو في الضباب يبحث البشر عن أدلة مرئية حول الأشياء وأين قد تكون.
الرؤية الآلية هي مجرد مجال واحد لإدراك الآلة ، ويستمر العلماء في النضال من أجل تكرار حتى أبسط المهام البشرية. عندما تعمل الخوارزميات ، فإنها تُرجع إجابات واضحة ، رقمية إلى حد كبير وغالبًا ما تفتقر إلى السياق أو التفسير. قد تكون المستشعرات قادرة على اكتشاف كائن أحمر في موقع معين ، ولكن تحديد ذلك أو حتى تحديد ما إذا كان جزءًا من كائن آخر أمر صعب.
كيف تتعامل شركات الذكاء الاصطناعي الكبرى مع إدراك الآلة؟
توفر الشركات الكبرى التي تبيع خوارزميات الذكاء الاصطناعي مجموعة متنوعة من الأدوات لاستشعار ومعالجة أنواع الإدراك البشري ، من البصر إلى اللغة. غالبًا ما يتم تمييزها بواسطة خوارزميات البرامج التي تعالج وتحلل وتقدم النتائج والتنبؤات الحسية. إنها توفر أدوات أولية للمؤسسات التي ترغب في العمل من مؤسسة ، بالإضافة إلى أدوات خاصة بالمجال تعالج مشاكل معينة مثل البحث في موجز فيديو عن إجراءات غير طبيعية أو التحدث مع العملاء.
IBM
كانت IBM رائدة في تحسين خوارزمياتها ’ القدرة على رؤية العالم كما يفعل البشر. لها نظام Watson AI، على سبيل المثال ، يبدأ بطبقة متطورة من معالجة اللغة الطبيعية (NLP) التي تمنحها واجهة محادثة. يمكن للعملاء استخدام IBM واتسون ستوديو لتحليل الأسئلة واقتراح إجابات افتراضية ثم البحث في مجموعة الأدلة للحصول على إجابات صحيحة. النسخة التي فازت بألعاب Jeopardy ضد أبطال الإنسان هي مثال جيد على الخوارزميات الاجتماعية التي يمكن أن تتفاعل مع البشر لأنهم يدركون الكلمات ، بشكل أو بآخر ، كما يفعل البشر.
أمازون
تقدم أمازون مجموعة واسعة من المنتجات والخدمات ، بدءًا بالأدوات الأساسية وأيضًا بما في ذلك الأدوات المتخصصة. على سبيل المثال ، يستخلص Amazon Comprehed المعلومات من اللغة الطبيعية. نسخة متخصصة ، الأمازون فهم الطب، يركز على تقديم نوع التحليل الآلي والتشفير الذي تحتاجه المستشفيات والأطباء مكاتب ’. أمازون بحيرة صحية هو منتج تخزين البيانات يطوى في إجراءات الذكاء الاصطناعي لاستخراج المعنى وإجراء تنبؤات من البيانات المخزنة.
جوجل
تقدم Google عددًا من المنتجات السحابية لحل المشكلات الأساسية والمركزة. كما تم إضافة خوارزميات أفضل بهدوء آلة الإدراك إلى منتجاتها القياسية ، مما يجعلها أكثر فائدة وبديهية في كثير من الأحيان. على سبيل المثال ، سيطبق Google Drive بهدوء خوارزميات التعرف على الأحرف الضوئية لقراءة النص في البريد الإلكتروني أو الملفات المخزنة. يتيح هذا للمستخدمين البحث بنجاح عن الكلمات التي قد تكون فقط في صورة أو ميمي. ستستخدم Google Photo خوارزميات تصنيف عالية المستوى لتمكين البحث عن الصور بناءً على محتواها.
مايكروسوفت
تقدم Microsoft مجموعة متنوعة من الخدمات لمساعدة العملاء على بناء أدوات أكثر إدراكًا. مفهوم الأزور يوفر مجموعة من نماذج الذكاء الاصطناعي المعدة مسبقًا والتي يمكن تخصيصها ونشرها باستخدام Studio IDE بسيط. تم تصميم هذه المنتجات المتطورة لدمج كل من البرامج والأجهزة المخصصة في منتج واحد. تركز أدوات تطوير Microsoft على فهم اللغة الطبيعية بالإضافة إلى خلاصات الفيديو والصوت التي يمكن جمعها بواسطة إنترنت الأشياء (IoT) الأجهزة.
ميتا
تستخدم Meta أيضًا مجموعة متنوعة من خوارزميات البرمجة اللغوية العصبية لتحسين منتجها الأساسي وشبكتها الاجتماعية. بدأت الشركة أيضًا في استكشاف ميتافيرس وباستخدام واجهات اللغة الطبيعية وخوارزميات رؤية الماكينة بشكل نشط لمساعدة المستخدمين على إنشاء واستخدام metaverse. على سبيل المثال ، يرغب المستخدمون في تزيين مساحاتهم الشخصية ، وتجعل واجهات الذكاء الاصطناعي الجيدة من السهل على الأشخاص إنشاء واستكشاف تصميمات مختلفة.
الذكاء الاصطناعي (AI) الى اين ؟
