AI正在加速行業(yè)變革。OpenAI其正探索視頻數(shù)據(jù)生成模型的大規(guī)模訓(xùn)練。
AI企業(yè)OpenAI今日正式發(fā)布視頻生成模型sora,Sora是視覺數(shù)據(jù)的通用模型,它可以生成不同時長、長寬比和分辨率的視頻和圖像,最多可達(dá)一分鐘的高清視頻。
具體來說,Sora在可變持續(xù)時間、分辨率和寬高比的視頻和圖像上聯(lián)合訓(xùn)練文本條件擴散模型。Sora利用對視頻和圖像潛在代碼的時空補丁進行操作的變壓器架構(gòu)。
Sora能夠生成具有多個角色、特定類型的運動以及主體和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場景。該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。
該模型對語言有深入的理解,使其能夠準(zhǔn)確地解釋提示并生成引人注目的字符來表達(dá)充滿活力的情感。Sora還可以在單個生成的視頻中創(chuàng)建多個鏡頭,準(zhǔn)確地保留角色和視覺風(fēng)格。
OpenAI的結(jié)果表明,擴展視頻生成模型是構(gòu)建物理世界通用模擬器的一條有前途的途徑。
比如,一位時尚女性走在充滿溫暖霓虹燈和動畫城市標(biāo)牌的東京街道上。
她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信而隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。
Sora展示的海龜也是栩栩如生。
比如,幾只巨大的毛茸茸的猛犸象正踏著白雪皚皚的草地走近,它們長長的毛茸茸的皮毛在風(fēng)中輕輕飄動,遠(yuǎn)處覆蓋著積雪的樹木和雄偉的雪山,午后的陽光下有縷縷云彩,太陽高掛在天空中?!?/span>
距離產(chǎn)生了溫暖的光芒,低攝像頭視角令人驚嘆地捕捉到了大型毛茸茸的哺乳動物,具有美麗的攝影和景深?!?/span>
比如,動畫場景的特寫鏡頭是一個毛茸茸的小怪物跪在一根融化的紅色蠟燭旁邊。藝術(shù)風(fēng)格是3D和現(xiàn)實的,重點是燈光和紋理。這幅畫的基調(diào)是驚奇和好奇,怪物睜大眼睛、張開嘴巴凝視著火焰。它的姿勢和表情傳達(dá)出一種天真和俏皮的感覺,就好像它第一次探索周圍的世界一樣。暖色調(diào)和戲劇性燈光的使用進一步增強了圖像的舒適氛圍。
OpenAI CEO Sam Altman已經(jīng)在線接單,稱今天開始為有限數(shù)量的創(chuàng)作者提供訪問權(quán)限?!皉emarkable moment.(非凡的時刻。)”
從目前的效果來看,這對廣告行業(yè)、動畫行業(yè)、對影視行業(yè)可能都會產(chǎn)生一系列的變革。
資訊來源:雷遞網(wǎng)