سال ۱۴۰۵ چند روز تعطیل رسمی دارد؟ وکیل: حکم اعدام «شریفه محمدی»، فعال کارگری، با تصمیم رئیس قوه قضائیه به سی سال حبس تبدیل شد توقیف محموله قاچاق دام آلوده در مازندران تصویب روز ملی هوا فضا و روز جزایر سه گانه خلیج فارس در تقویم رسمی کشور جزئیات تیراندازی پلیس در منطقه سوهانک تهران / دستگیری و زخمی شدن چند نفر / اعتراض دانشجویان به جولان اراذل و اوباش در محدوده دانشگاه آزاد اعلام محدودیت‌های ترافیکی از ۷ تا ۱۰ آبان در برخی از جاده‌های کشور این ربات انسان‌نما اتاق را مرتب و لباس‌ها را تا می‌کند جاده چالوس یکطرفه شد/ محدودیت‌های جدید اعلام شد اعلام جرم علیه تهیه‌کننده و مجری برنامه منتشرکننده ادعا‌های فائزه هاشمی هشدار دادگستری تهران درباره مراکز غیرمجاز خدمات زیبایی تشکیل پرونده قضائی برای فائزه هاشمی زمان توزیع کارت آزمون کانون وکلا اعلام شد تعطیلی پنجشنبه‌ها و کاهش ساعات کاری ادارات/ سازمان اداری و استخدامی کشور مسئول اجرای ساعات کاری ادارات جدید شد مدارس این شهر‌ها فردا چهارشنبه ۷ آبان تعطیل شد/ تاخیر در فعالیت ادارات خوزستان + جزئیات  وکیل مدافع پژمان جمشیدی: موکلم ممنوع الخروج نبوده است  خروج سهامدار اصلی بانک آینده از کشور صحت دارد؟

چین با هوش مصنوعی متن را به ویدئو تبدیل می‌کند

چین یک سیستم هوش مصنوعی تبدیل متن به ویدئو ساخته که در حقیقت پاسخی به سیستمی با همین قابلیت ها و ساخته شرکت آمریکایی اوپن ای آی است. هوش مصنوعی چینی ویدئوکلیپ های ۱۶ ثانیه ای می سازد.
تاریخ انتشار: ۱۳:۳۷ - ۱۱ ارديبهشت ۱۴۰۳ - 2024 April 30
کد خبر: ۲۳۸۶۹۱

به گزارش راهبرد معاصر،‌ استارت آپ چینی شنگشو تکنولوژی و دانشگاه تسینگهوا از هوش مصنوعی «ویدو»(Vidu) رونمایی کرده اند که پاسخی به هوش مصنوعی Sora اوپن ای آی است. این اپلیکیشن تبدیل متن به ویدئو، با یک کلیک کلیپ های ۱۶ ثانیه ای با وضوح ۱۰۸۰ پیکسل می سازد.

 

هرچند این ویدئوها کوتاهتر از محصول ۶۰ ثانیه ای سورا هستند. این نرم افزار جدید تبدیل متن به ویدئو در انجمنی در پکن رونمایی شد.

 

ژو جون محقق ارشد شنگشو و معاون رییس انستیتو هوش مصنوعی دانشگاه تسینگهوا دراین باره می گوید: ویدئو جدیدترین دستاورد یک نوآوری متکی بر خود است و در حوزه های مختلف دستاوردهایی دارد. این سیستم می تواند دنیای فیزیکی را شبیه سازی کند و ویدئوهای ۱۶ ثانیه ای با کاراکترها، صحنه ها و زمانبندی منسجم و یکپارچه بسازد.

 

او همچنین توضیح داد ویدئو می تواند عناصر چینی را درک کند.

 

طبق گزارش ها ویدو بر اساس یک معماری مدل تبدیل بصری خود توسعه یافته به نام Universal Vision Transformer (U-ViT) ساخته شده است. توسعه دهندگان اعلام کرده اند این سیستم دو مدل هوش مصنوعی Diffusion و Transformer را یکپارچه می کند.

 

طبق نوشته نشریه مدیوم این ساختار ویدئوهایی واقع گرایانه با حرکات دینامیک دوربین ، حالات دقیق صورت، نور و سایه های طبیعی می سازد. ژو در این باره می گوید: پس از عرضه سورا ما متوجه شدیم این سیستم به نقشه راه فنی ما بسیار نزدیک است و همین امر بیش از پیش به ما انگیزه داد تا تحقیق مان را پیش ببریم./ مهر

ارسال نظر
پرطرفدارترین اخبار
آخرین اخبار