تقنية توليد الفيديو متعدد الوسائط بالذكاء الاصطناعي تحقق تقدمًا ودمج Web3 يفتح عصرًا جديدًا للإبداع

robot
إنشاء الملخص قيد التقدم

#突破 تقنية إنشاء الفيديو بالذكاء الاصطناعي ودمجها مع Web3

من أبرز التطورات الأخيرة في مجال الذكاء الاصطناعي هو突破 تقنية توليد الفيديو متعدد الأنماط. لقد تطورت هذه التقنية من توليد الفيديو من نص واحد إلى القدرة الشاملة على دمج النصوص والصور والصوت.

تشمل بعض حالات الاختراق التكنولوجي اللافتة ما يلي:

  1. إطار EX-4D مفتوح المصدر الذي تقدمه شركة تكنولوجيا يمكنه تحويل الفيديوهات العادية إلى محتوى 4D بوجهات نظر حرة، حيث تصل نسبة قبول المستخدمين إلى 70.7%. هذه التقنية تجعل من الممكن توليد تجربة مشاهدة متعددة الزوايا من فيديو بزاوية واحدة، مما يبسط بشكل كبير العمليات المعقدة للنمذجة ثلاثية الأبعاد التقليدية.

  2. تُدعي ميزة "خيال الرسم" التي أطلقتها منصة AI معينة أنها تستطيع توليد فيديو "بمستوى سينمائي" مدته 10 ثوانٍ من صورة واحدة. ومع ذلك، لا تزال صحة هذا الإعلان بحاجة إلى مزيد من التحقق.

  3. نظام Veo الذي تم تطويره بواسطة مؤسسة بحثية معروفة في مجال الذكاء الاصطناعي يمكنه توليد فيديو بدقة 4K وتأثيرات صوتية بيئية بشكل متزامن. تتغلب هذه التقنية على مشكلة مطابقة الفيديو والصوت، مما يحقق تزامن الصوت والصورة في المشاهد المعقدة.

  4. تكنولوجيا ContentV الخاصة بمنصة الفيديو القصير لديها 80 مليار معلمة، ويمكنها إنتاج فيديو بدقة 1080 بكسل في غضون 2.3 ثانية، بتكلفة 3.67 يوان لكل 5 ثوانٍ. على الرغم من أن التحكم في التكلفة جيد، إلا أنه لا يزال هناك مجال للتحسين في معالجة المشاهد المعقدة.

تعتبر هذه الاختراقات التكنولوجية ذات أهمية كبيرة من حيث جودة الفيديو وتكلفة الإنتاج وسيناريوهات التطبيق. من الناحية التقنية، فإن تعقيد إنشاء الفيديو متعدد الوسائط هو تعقيد أُسي، ويتضمن معالجة كميات هائلة من النقاط البكسلية، وضمان التتابع الزمني، وتزامن الصوت، بالإضافة إلى اتساق الفضاء ثلاثي الأبعاد. حاليًا، تُحقق هذه المهام المعقدة من خلال التفكيك المعياري والتعاون بين النماذج الكبيرة.

فيما يتعلق بالتكلفة، هناك تحسينات في هيكل الاستدلال وراءها، بما في ذلك استراتيجيات التوليد متعددة المستويات، آلية إعادة استخدام التخزين المؤقت، وتخصيص الموارد الديناميكي. هذه التحسينات أدت إلى انخفاض كبير في تكلفة توليد الفيديو.

في مجال التطبيقات، تقنيات الذكاء الاصطناعي تتفوق على العمليات التقليدية لإنتاج الفيديو. الإنتاج الذي كان يتطلب سابقًا الكثير من المعدات والمساحات والعمالة والوقت، يمكن الآن إنجازه في وقت قصير باستخدام الذكاء الاصطناعي، وتحقيق تأثيرات يصعب الوصول إليها من خلال التصوير التقليدي. قد تعيد هذه الثورة تشكيل الاقتصاد الإبداعي بأكمله.

إذن، ما هي العلاقة بين تقدم هذه التقنيات الذكية في Web2 و Web3 AI؟

أولاً، تغير هيكل طلب القدرة الحاسوبية. يتطلب إنشاء الفيديو متعدد النماذج مجموعة متنوعة من تركيبات القدرة الحاسوبية، مما يخلق فرصًا جديدة للقدرة الحاسوبية الموزعة غير المستغلة.

ثانياً، هناك زيادة في الطلب على وضع علامات البيانات عالية الجودة. يتطلب إنشاء مقاطع فيديو من المستوى الاحترافي وصفاً دقيقاً للمشاهد، وصوراً مرجعية، وأنماط صوتية، وغيرها من البيانات المتخصصة. يمكن أن يجذب نظام الحوافز في Web3 المهنيين لتقديم مواد بيانات عالية الجودة.

أخيرًا، تتطور تقنية الذكاء الاصطناعي من تخصيص الموارد على نطاق واسع المركزي إلى التعاون المعياري، وهذا بحد ذاته هو طلب جديد للمنصات اللامركزية. في المستقبل، قد تشكل قوة الحوسبة والبيانات والنماذج وآليات التحفيز نظامًا بيئيًا معززًا ذاتيًا، مما يعزز الدمج العميق بين سيناريوهات الذكاء الاصطناعي في Web3 وWeb2.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 4
  • مشاركة
تعليق
0/400
MetaMaximalistvip
· 07-21 22:41
همف... لعبة تقارب أخرى بين الويب 3 والذكاء الاصطناعي. لقد رأيت هذا الفيلم من قبل بصراحة. ايقظني عندما يحلون مشكلات إدارة البروتوكول.
شاهد النسخة الأصليةرد0
RumbleValidatorvip
· 07-20 08:44
يبدو أنه جميل، لكن هناك شكوك حول استقرار الهيكل التكنولوجي، والتحقق من أمان البيانات هو الأمر الحاسم.
شاهد النسخة الأصليةرد0
SchrodingersFOMOvip
· 07-18 23:41
أتعسني الأمر، لقد صرفت المال مرة أخرى.
شاهد النسخة الأصليةرد0
AirdropDreamBreakervip
· 07-18 23:21
مرة أخرى، إنه إيقاع يجعلنا نحن الأغبياء بلا عمل
شاهد النسخة الأصليةرد0
  • تثبيت