9月24日下午消息,在2025杭州云棲大會上,阿里發布通義萬相Wan2.5 preview系列模型,涵蓋文生視頻、圖生視頻、文生圖和圖像編輯四大模型,其中,通義萬相2.5視頻生成模型能生成和畫面匹配的人聲、音效和音樂BGM,首次實現音畫同步的視頻生成能力,有效降低了電影級視頻創作的門檻。即日起,用戶可在阿里云百煉平臺調用API,或在通義萬相官網直接體驗。
據悉,全新的通義萬相2.5在創作能力上實現了全面升級:視頻生成時長從5秒提升至10秒,單次生成可實現更完整的劇情故事;支持24幀每秒的1080P高清視頻生成,畫面質量進一步提升,滿足電影級場景的創作需求;與此同時,模型指令遵循能力進一步提升,在視頻生成任務中可理解運鏡等復雜連續變化指令控制,圖像編輯任務也可以跟隨指令一鍵實現人物變身、風格變化等效果。用戶只需輸入提示詞即可生成人聲、環境音效和背景音樂,并且精準與畫面內容、人物口型匹配,讓視頻演繹更加生動形象。
此外,通義萬相2.5還升級了圖像生成能力,可生成中英文文字和圖表,包含復雜文字排版、藝術海報、流程圖、架構圖等,同時支持圖像編輯功能,輸入一句話即可完成P圖。
目前,通義萬相模型家族已支持文生圖、文生視頻、圖生視頻、人聲生視頻和動作生成等10多種視覺創作能力,累計生成3.9億張圖片、7000萬個視頻。自今年2月以來,通義萬相已連續開源20多款模型,在開源社區和三方平臺的下載量已超3000萬。