Sora: أطلقت شركة OpenAI أداة لإنشاء فيديو مباشرة من النص
كشفت شركة OpenAI يوم الخميس الماضي عن أداة تحمل الإسم Sora “سورا” يمكنها إنشاء مقاطع فيديو من المطالبات النصية.
النموذج الجديد، الملقب بـ Sora نسبة إلى الكلمة اليابانية التي تعني “السماء”، يمكنه أيضًا إنتاج لقطات واقعية تصل مدتها إلى دقيقة واحدة وتلتزم بتعليمات المستخدم فيما يتعلق بالموضوع والأسلوب. وفقًا لمدونة الشركة، فإن النموذج قادر أيضًا على إنشاء مقطع فيديو استنادًا إلى صورة ثابتة.
وجاء في منشور المدونة: “نحن نعلم الذكاء الاصطناعي كيفية فهم ومحاكاة العالم المادي المتحرك، بهدف تدريب النماذج التي تساعد الأشخاص على حل المشكلات التي تتطلب تفاعلًا في العالم الحقيقي”.
كان أحد مقاطع الفيديو المضمنة من بين عدة أمثلة أولية من الشركة بناءً على النص التالي: “مقطع دعائي لفيلم يعرض مغامرات رائد فضاء يبلغ من العمر 30 عامًا يرتدي خوذة دراجة نارية من الصوف الأحمر، والسماء الزرقاء، والصحراء المالحة، بأسلوب سينمائي”. ، تم تصويره على… فيلم مقاس 35 مم، بألوان زاهية.
أعلنت الشركة أيضًا أنها فتحت الوصول إلى Sora لعدد صغير من الباحثين ومنشئي الفيديو. بينما سيقوم الخبراء بـ “الفريق الأحمر” للمنتج – واختباره لمعرفة ما إذا كان بإمكانه التحايل على شروط خدمة OpenAI، التي تحظر “العنف الشديد، أو المحتوى الجنسي، أو الصور التي تحض على الكراهية، أو صور المشاهير، أو الملكية الفكرية للآخرين”، وفقًا لما جاء في تقرير الشركة.
بينما تسمح الشركة فقط بوصول محدود للباحثين والفنانين البصريين وصانعي الأفلام، على الرغم من أن الرئيس التنفيذي سام ألتمان استجاب لمكالمات المستخدمين على تويتر بعد الإعلان بمقاطع فيديو قال إنها من صنع سورا. تحمل مقاطع الفيديو علامة مائية لإظهار أنها من إنتاج الذكاء الاصطناعي.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vfAdvertisement— OpenAI (@OpenAI) February 15, 2024
أطلقت الشركة لأول مرة مولد الصور الثابتة Dall-E في عام 2021 وروبوت الدردشة المولد بالذكاء الاصطناعي ChatGPT في نوفمبر 2022، والذي جمع بسرعة 100 مليون مستخدم. وقد طرحت شركات الذكاء الاصطناعي الأخرى أدوات إنشاء الفيديو لأول مرة، على الرغم من أن هذه النماذج لم تكن قادرة إلا على إنتاج بضع ثوانٍ فقط من اللقطات التي غالبًا ما لا علاقة لها بمطالباتها. قالت شركتا Google وMeta إنهما بصدد تطوير أدوات فيديو توليدية، على الرغم من أنهما لم تصدراها للعامة. وأعلنت يوم الأربعاء عن تجربة لإضافة ذاكرة أعمق إلى ChatGPT حتى يتمكن من تذكر المزيد من محادثات مستخدميه.
لم تكشف OpenAI عن مقدار اللقطات التي تم استخدامها لتدريب Sora أو المكان الذي قد تكون نشأت فيه مقاطع الفيديو التدريبية، بخلاف إخبار صحيفة نيويورك تايمز أن المجموعة تحتوي على مقاطع فيديو كانت متاحة للجمهور ومرخصة من أصحاب حقوق الطبع والنشر. تمت مقاضاة الشركة عدة مرات بتهمة انتهاك حقوق الطبع والنشر في تدريب أدوات الذكاء الاصطناعي التوليدية الخاصة بها، والتي تستوعب كميات هائلة من المواد المستخرجة من الإنترنت وتقليد الصور أو النصوص الموجودة في مجموعات البيانات تلك.
خاتمة
في الختام، يبدو أن OpenAI قد خطت خطوة كبيرة نحو المستقبل بإطلاقها لأداة Sora، القادرة على تحويل النصوص إلى مقاطع فيديو ذات جودة عالية. مع استمرار أبحاث الذكاء الاصطناعي وتطورها، سيصبح بإمكان المبدعين والباحثين التعبير عن أفكارهم بطرق جديدة وفريدة من نوعها، مما يفتح آفاقًا جديدة للابتكار. وبالرغم من التحديات الأخلاقية والقانونية المرتبطة بحقوق النشر واستخدام المحتوى، يبقى التركيز على الأثر الإيجابي الذي يمكن أن يقدمه هذا التقدم للمجتمع. يتوجب على المؤسسات المعنية مواكبة هذه التطورات وضمان استخدامها بطرق تعود بالنفع على الجميع بشكل مسؤول وخلاق.