當前位置:探秘志 > 獵奇八卦 > 正文

Sora的潘多拉魔盒里有什么Sora有哪些功能

OpenAI推出了文生視頻模型Sora,在科技圈引發(fā)熱議,其發(fā)展速度似乎超越了同行的多個量級。雖然還沒有正式對公眾開放,但是通過其發(fā)布的視頻合集可以充分的看出,Sora不僅在生成視頻的逼真性方面獲得了技術性的突破,在視頻時間長度方面也遠遠的甩開了對手。

Runway在AI視頻界有MidJourney之稱,可以生成四秒長的視頻,其生成的視頻可以被用戶延長到16秒,這個長度,2023年在AI生成視頻界已經(jīng)是最長的記錄了。Pika可生成的視頻長度只有三秒,Stable Video可以生成的視頻也只有4秒。而Sora可以生成的視頻,卻長達一分鐘,可以算得上是王炸。

Runway在幾個月前推出了第2代AI生成視頻模型,隨后又在今年1月份,推出了多頭運動筆刷的功能,讓用戶可以對ai視頻生成中的多個元素的運動進行控制。Runway所提供的視頻制作解決方案集合了多種AI工具,因此備受推崇。但是Runway的CEO在Sora發(fā)布之后在社交媒體上發(fā)布了GameOn這兩個字。這兩個字充分的表達了AI視頻界的比賽開始了。

Stability的創(chuàng)始人,在 OpenAI的CEO山姆奧特曼發(fā)布了由Sora所生成的以巫師為主題的視頻之后,在社交平臺上發(fā)文稱奧特曼是一位巫師大人。充分的說明了這段視頻在AI視頻所帶來的沖擊很大。

Sora在本質(zhì)上與AI視頻生成公司Runway、Pika采用的底層模型是相似的。但是唯一的不同之處在于Sora將其他公司所采用的小模型的思維進行了變化,采用transformer架構(gòu)替換了U-Net架構(gòu)。這種新的架構(gòu)能夠?qū)D像和視頻通過集合視覺編碼的較小數(shù)據(jù)單元表現(xiàn)出來,然后再將這些內(nèi)容進行解碼,并創(chuàng)造出視頻,而且還可以達到大模型智能涌現(xiàn)的能力,明顯的將樣本的質(zhì)量提高。

OpenAI最新發(fā)布了Sora的研究報告,充分地彰顯出來 OpenAI將會使用大模型進行物理世界模擬的雄心。

分享至:

獵奇八卦相關

郵箱不能為空
留下您的寶貴意見