Step‑Video‑T2V est actuellement l’un des modèles texte-to-video open‑source les plus avancés, alliant large modèle, compression innovante et finitions via feedback humain. Il rivalise avec les alternatives propriétaires tout en restant accessible (à condition d’avoir les ressources matérielles). Le projet pose aussi les bases pour les futurs modèles de génération vidéo prédictive plus complexes (niveau “Level‑2”)
FoleyCrafter
FoleyCrafter est une solution innovante pour générer automatiquement des effets sonores cohérents et synchronisés à partir de vidéos muettes — tout en permettant un contrôle via du texte et avec une qualité audio remarquable.