Seaweed, сокращение от "Seed-Video", является основным моделью для генерации видео, которая использует диффузионные трансформеры с примерно 7 миллиардами параметров. Обученная с использованием эквивалентной вычислительной мощности 1,000 H100 GPU, Seaweed изучает представление мира на основе обширных мультимодальных данных, включая видео, изображения и текст. Эта модель позволяет создавать видео в различных разрешениях, соотношениях сторон и продолжительности на основе текстовых описаний, демонстрируя свою универсальность для широкого спектра приложений.