Visual ChatGPT | انشاء الصور بالذكاء الاصطناعي .

ما هو Visual ChatGPT؟

14 مارس، 2023آخر تحديث: 14 مارس، 2023

1٬229 4 دقائق

تُستخدم عبارة "نماذج الأساس المرئي" (VFMs) بشكل شائع لوصف مجموعة من الخوارزميات الأساسية المستخدمة في رؤية الكمبيوتر. تُستخدم هذه الأساليب لنقل مهارات رؤية الكمبيوتر القياسية إلى تطبيقات الذكاء الاصطناعي ويمكن أن تكون بمثابة أساس لنماذج أكثر تعقيدًا.

كيفية استخدام Visual ChatGPT؟

تواصل Microsoft سباق الذكاء الاصطناعي بلاهوادة دون تغيير السرعة باستخدام Visual ChatGPT. Visual ChatGPT هو نموذج جديد يجمع بين ChatGPT و VFMs ، بما في ذلك Transformers و ControlNet و Stable Diffusion. ًيبدو جيدا؟ تجعل هذه التقنية أيضًا من الممكن لمحادثات ChatGPT أن تتجاوز الحواجز اللغوية. مع اقتراب تاريخ إصدار GPT-4 ، يصبح مستقبل ChatGPT أكثر إشراقًا مع مرور كل يوم.
على الرغم من وجود الكثير من مولدات صور الذكاء الاصطناعي الناجحة ، مثل DALL-E 2 و Wombo Dream والمزيد ، فإن أداة فنية حديثة للذكاء الاصطناعي تتلقى دائمًا ترحيبًا حارًا من المجتمع. هل ستواصل Visual ChatGPT هذا التقليد؟ دعونا نلقي نظرة فاحصة.

ما هو Visual ChatGPT؟

Visual ChatGPT هو نموذج جديد يجمع بين ChatGPT و VFMs مثل Transformers و ControlNet و Stable Diffusion. في الأساس ، يعمل نموذج الذكاء الاصطناعي كجسر بين المستخدمين ، مما يسمح لهم بالتواصل عبر الدردشة وإنشاء صور مرئية . يقتصر ChatGPT حاليًا على كتابة وصف للاستخدام مع Stable Diffusion أو DALL-E أو Midjourney ؛ لا يمكنه معالجة أو إنشاء الصور من تلقاء نفسه. ولكن مع نموذج Visual ChatGPT ، يمكن للنظام إنشاء صورة وتعديلها واقتصاص العناصر غير المرغوب فيها والقيام بأكثر من ذلك بكثير. اجتذبت ChatGPT اهتمامًا متعدد التخصصات نظرًا لكفاءتها الرائعة في المحادثة وقدرات التفكير عبر العديد من القطاعات ، مما أدى إلى اختيار ممتاز لواجهة لغوية.
ومع ذلك ، فهو تدريب لغوي يمنعه من معالجة أو إنشاء صور من البيئة المرئية. وفي الوقت نفسه ، تُظهر النماذج ذات الأسس المرئية ، مثل Visual Transformers أو Steady Diffusion ، فهمًا بصريًا رائعًا وقدرات إنتاجية عند القيام بمهام ذات مدخلات ومخرجات ثابتة من جولة واحدة. يمكن إنشاء نموذج جديد ، مثل Visual ChatGPT ، من خلال الجمع بين هذين النموذجين. إنه يمكّن المستخدمين من التواصل مع ChatGPT بطرق تتجاوز الكلمات.

ما هي نماذج الأساس المرئي (VFMs)؟

تُستخدم عبارة “نماذج الأساس المرئي” (VFMs) بشكل شائع لوصف مجموعة من الخوارزميات الأساسية المستخدمة في رؤية الكمبيوتر. تُستخدم هذه الأساليب لنقل مهارات رؤية الكمبيوتر القياسية إلى تطبيقات الذكاء الاصطناعي ويمكن أن تكون بمثابة أساس لنماذج أكثر تعقيدًا.

مميزات Visual ChatGPT

طور الباحثون في Microsoft نظامًا يسمى Visual ChatGPT يتميز بالعديد من نماذج الأساس المرئي وواجهات المستخدم الرسومية للتفاعل مع ChatGPT.
ما الذي سيتغير مع Visual ChatGPT؟ سيكون قادرًا على ما يلي:
بالإضافة إلى النص ، قد تقوم Visual ChatGPT أيضًا بإنشاء واستقبال الصور.
يمكن معالجة الاستفسارات المرئية المعقدة أو تعليمات التحرير التي تتطلب تعاون نماذج مختلفة من الذكاء الاصطناعي عبر مراحل متعددة بواسطة Visual ChatGPT.
للتعامل مع النماذج التي تحتوي على العديد من المدخلات / المخرجات وتلك التي تتطلب ملاحظات بصرية ، طور الباحثون سلسلة من المطالبات التي تدمج معلومات النموذج المرئي في ChatGPT. اكتشفوا من خلال الاختبار أن Visual ChatGPT يسهل التحقيق في القدرات المرئية لـ ChatGPT باستخدام نماذج الأساس المرئية.
انها ليست مثالية بعد. لاحظ الباحثون بعض المشكلات في عملهم ، مثل النتائج غير المتسقة الناتجة عن فشل نماذج الأساس المرئي (VFMs) وتنوع المحفزات. توصلوا إلى استنتاج مفاده أن وحدة التصحيح الذاتي مطلوبة لضمان توافق نتائج التنفيذ مع الأهداف البشرية ولإجراء أي تصحيحات ضرورية. نظرًا للحاجة إلى تصحيح المسار المستمر ، فإن تضمين مثل هذه الوحدة يمكن أن يطيل وقت الاستدلال للنموذج. يعتزم الفريق إجراء بحث أعمق في هذه المسألة في دراسة لاحقة.

كيفية استخدام Visual ChatGPT؟

تحتاج إلى تشغيل العرض التوضيحي لـ Visual ChatGPT أولاً. وفقًا لصفحة GitHub الخاصة به ، إليك ما عليك القيام به من أجلها:

# create a new environment
conda create -n visgpt python=3.8

# activate the new environment
conda activate visgpt

#  prepare the basic environments
pip install -r requirement.txt

# download the visual foundation models
bash download.sh

# prepare your private openAI private key
export OPENAI_API_KEY={Your_Private_Openai_Key}

# create a folder to save images
mkdir ./image

# Start Visual ChatGPT !
python visual_chatgpt.py

بعد بدء تشغيل العرض التوضيحي لـ Visual ChatGPT على جهاز الكمبيوتر الخاص بك ، كل ما تحتاج إليه هو إعطائه موجهًا! باستخدام أدوات مثل Visual ChatGPT ، يمكن خفض منحنى التعلم لنماذج تحويل النص إلى صورة ، ويمكن لبرامج الذكاء الاصطناعي المختلفة التواصل مع بعضها البعض. تم تطوير أحدث النماذج السابقة ، مثل نماذج LLM و T2I ، بشكل منفصل ؛ ولكن بمساعدة الابتكارات ، قد نتمكن من تحسين أدائها بشكل ملحوظ.
عندما يتعلق الأمر بإنتاج الصور باستخدام ChatGPT ، يتبادر إلى الذهن GPT-4 على الفور. إذن ، متى سيتم إطلاق هذا النموذج المرتقب بشدة؟

تاريخ إصدار GPT-4

نموذج جديد للذكاء الاصطناعي يسمى GPT-4 على وشك أن تطلقه شركة OpenAI ، الشركة التي تقف وراء ChatGPT ، في وقت مبكر من الأسبوع المقبل ، وفقًا لما ذكره كبير مسؤولي التكنولوجيا في Microsoft Germany (CTO). يعتبر هذا الإصدار الجديد على نطاق واسع أكثر قدرة من سابقه ، مما سيمهد الطريق لاعتماد واسع النطاق للذكاء الاصطناعي التوليدي في مجال الأعمال.
منذ عام 2019 ، عندما استثمرت Microsoft مليار دولار في OpenAI ، كانت Microsoft شريكًا مهمًا لشركة AI الناشئة. رفعت Microsoft حصتها في مختبر الذكاء الاصطناعي بعدة مليارات من الدولارات في يناير ، بعد النجاح الملحوظ الذي حققته ChatGPT ، وهو روبوت محادثة مدعوم بالذكاء الاصطناعي والذي أحدث ثورة في الإنترنت في الأشهر الأخيرة.

استخدام ذاكرة GPU للدردشة المرئية

شارك Visual ChatGPT أيضًا قائمة باستخدام ذاكرة GPU لكل نموذج أساس مرئي.
لحفظ ذاكرة GPU الخاصة بك ، يمكنك تعديل “self.tools” مع عدد أقل من نماذج الأساس المرئي.

منظومة الذكاء الصناعي 101

هل أنت جديد في مجال الذكاء الاصطناعي؟ لا يزال بإمكانك ركوب قطار الذكاء الاصطناعي! لقد أنشأنا مسردًا مفصلاً للذكاء الاصطناعي لمصطلحات الذكاء الاصطناعي الأكثر استخدامًا وشرح أساسيات الذكاء الاصطناعي بالإضافة إلى مخاطر وفوائد الذكاء الاصطناعي. لا تتردد في استخدامها.

أدوات الذكاء الاصطناعي الأخرى التي عليك مراجعتها

كل يوم تقريبًا ، تظهر أداة أو نموذج أو ميزة جديدة وتغير حياتنا وعليك بالفعل مراجعة بعض من أفضلها:

أدوات الذكاء الاصطناعي لتحويل النص إلى نص

هل تريد معرفة كيفية استخدام ChatGPT بشكل فعال؟ لدينا بعض النصائح والحيل لك دون التبديل إلى ChatGPT Plus! إن الهندسة السريعة للذكاء الاصطناعي هي مفتاح الوصول إلى عوالم لا حدود لها ، ولكن يجب أن تكون حذرًا ؛ عندما تريد استخدام أداة الذكاء الاصطناعي ، يمكنك الحصول على أخطاء مثل “ChatGPT قيد السعة الآن” و “العديد من الطلبات في ساعة واحدة حاول مرة أخرى لاحقًا”. نعم ، إنها أخطاء مزعجة حقًا ، لكن لا تقلق ؛ نعرف كيف نصلحها. أدوات الذكاء الاصطناعي لتحويل النص إلى صورة

بينما لا تزال هناك بعض النقاشات حول الصور الناتجة عن الذكاء الاصطناعي ، لا يزال الناس يبحثون عن أفضل المولدات الفنية للذكاء الاصطناعي. هل سيحل الذكاء الاصطناعي محل المصممين؟

بواسطة

المصدر

الوسوم