细节表现超Sora,网友:真正的国产之光!MiniMa
- 编辑:admin -细节表现超Sora,网友:真正的国产之光!MiniMa
3 个月前,MiniMax 宣布了首款 AI 高清视频天生模子 Abab-video-1。只用了 5 周时光,海螺 AI 的网页版拜访量便增速超 800%,还登上了 AI 产物榜当月寰球增速榜、海内增速榜双榜单 TOP 1。一时光,不少海内网友直呼其为“国产之光”。12 月初,MiniMax 又上新了图生视频模子 I2V-01-Live,新的模子专门对二次元后果停止了优化,可能更好的将静态的二次元图片转化为流利且天然的静态视频,至此,海螺 AI 开端进军“动漫界”。与此同时,OpenAI 的“双十二”运动也在热火朝天的停止着,万众等待的 Sora Turbo 趁势开放。当“国产之光”碰上“话题之王”,会擦出怎么的火花?雷峰网(大众号:雷峰网)AI 科技批评第一时光对二者最新、最完全的模子停止了一手休会,在给定的一系列牢固提醒词的前提下,海螺 AI 的天生后果失实令人面前一亮。「国产之光」VS「话题之王」在这场视频天生的狂欢中,不少网友脑洞年夜开,供给了种种真假联合的风趣 idea:在网友对照海螺 AI 跟 Sora 天生的“品茗的龙”的视频下,批评区广泛以为 Sora 天生的龙与配景存在必定的违跟感,只管可能发明出看似实在的图像,但在细节融会跟场景分歧性上可能还存在一些挑衅。提醒词:ancient dragon drinking tea。陈旧的龙在品茗。也有网友直接让两个模子天生《了不得的盖茨比》小说中所描写的画面,对照其天生后果的复原度,并锋利点评:海螺 AI 的后果确切有 20 世纪的滋味,但 Sora 的后果却显得过于古代,不合乎提醒词的请求。提醒词:A realistic, high-definition 16:9 horizontal video depicting a lavish party at Jay Gatsby’s mansion from F. Scott Fitzgerald’s novel ‘The Great Gatsby’. The scene captures the extravagant 1920s.一个实在、高清的16:9横向视频,刻画了F. Scott Fitzgerald的小说《了不得的盖茨比》中Jay Gatsby的豪宅里举行的豪华派对场景。这场戏捕获了20世纪20年月的豪华气氛。另有网友将统一提醒词下 sora 跟海螺 AI 天生的视频做了横向对照并批评:当初不须要Sora,海螺 AI 也能满意我的所有需要。提醒词:An astronaut in a white suit with a reflective visor stands amidst a glowing meadow of bioluminescent flowers under a surreal, starry night sky. The astronaut reaches out toward ethereal, glowing jellyfish floating gracefully in the air. The camera performs a slow dolly zoom。一位衣着白色宇航服、戴着反光面罩的宇航员站在一片发光的生物荧光花丛中,头顶是超事实的繁星点点的夜空。宇航员伸手向空中优雅沉没的鬼魂般发光的水母。摄像机停止迟缓的推拉变焦拍摄。除了以上这些对照二者天生后果实在性的网友外,也有大量网友在休会了 MiniMax 最新的 I2V-01-Live 图生视频模子后纷纭参加了对 海螺AI 的赞美行列。有从事艺术行业的网友晒图并表现:这是我实验过的最难动画化的图片之一,多少乎全部平台都试过了,只有海螺 AI 胜利让这张图片动了起来!更有网友专门收拾了视频海螺 AI 的视频合集,并配文:I2V-01-Live 就是为了让 2D 动画动起来而计划的,它不会让你扫兴!乃至有网友用 I2V-01-Live “回生”了塔罗牌:这些人物举措流利,好像被注入了性命一样!也有网友在实验过之后,以为这个模子的天生后果跟儿童故事的插图完善婚配,后果非常完善。流利、实在、有质感看过了网友们对海螺 AI 跟 Sora 的实在测评后,AI科技批评也停止了一手休会,为了愈加直不雅的停止对照,天生时同一应用了 Sora 官方 demo 的视频提醒词。在实验制造“猕猴眼部特写镜头”视频时,海螺 AI 的天生后果相较于 Sora 更为直不雅。视频中,镜头慢慢挪动,提醒出配角是一只猕猴,毛发与脸部表面处置实在精致。但是,Sora 的后果假如不联合提醒词来懂得,很难让人将其与“猕猴”接洽起来。只管如斯,Sora 却胜利捕获到了山公眼中的“星河宇宙”,而这一细节在海螺AI的后果中并不那么显明。提醒词:a closeup of the eye of a macaque monkey. it is very still. the eye does not move, and the gaze of the eye does not move. the monkey stares back at us in the camera. we see the universe in the eye of the monkey.一只猕猴的眼睛的特写镜头。它十分运动。眼睛不动,眼光也不挪动。山公在镜头中注视着咱们。咱们在山公的眼睛里看到了宇宙。在处置“头发混乱不胜”这一指令时,两个模子都抉择了经由过程“风吹”的后果来展示。但是,海螺 AI 所浮现的画面更具动感,画面感更为激烈。画面中,一位白叟慢慢回身,大风轻拂,天然地掀起他的头发,显得既实在又精致。比拟之下,Sora 的处置则显得有些粗暴,好像是在“乱吹”。提醒词:a close up of an old man having a really bad hair day.一个白叟头发混乱不胜的特写镜头。配角行走时举措僵直、缺少流利性是很多视频天生年夜型模子广泛面对的成绩,即便是被誉为“话题之王”的 Sora 也未能免俗。在 Sora 天生的视频中,人物行走时步调略显僵直,同时随同着镜头的稍微拉近,本意是为了营建一种从远及近的视觉后果,但成果却不尽人意,反而让画面显得有些不和谐。而海螺 AI 在这方面的处置则显得更为天然且流利,奇妙地防止了这些成绩,让人物的举措跟镜头的过渡都愈加跟谐,视觉舒服感拉满。提醒词:a hooded hunter walking between the trees in the snow.一个戴着兜帽的猎人在雪中的树林间行走。技巧至臻,才干画面至美测评之外,实在的榜双数据也在彰明显 MiniMax 的技巧气力。时至本日,MiniMax 视频模子仍然凭仗其出色的画面质感、内容的实在性以及流利性等上风,在 VBench榜独自破测评评分上稳居首位。据 MiniMax 先容,他们的年夜模子天天要与寰球用户停止超30亿次交互,均匀处置超越3万亿文本token,天生2000万张图片以及7万小时语音。在寰球领有多元化用户散布的同时,位居海内 AI 公司年夜模子日处置交互量榜首。跟Sora在年终的首次表态比拟, MiniMax 在视频天生赛道上的“捷足先登”,公司开创人闫豪杰则表现这实在是一种“蓄力”,他盼望 MiniMax 可能在技巧上构成相对上风后再进入赛道,以补充入局晚的优势。在他看来,要年夜投入去做的技巧研发,不该该只寻求 5% 或是 10% 的晋升,而应当寻求多少倍的晋升。也正因如斯,MiniMax 在视频天生赛道中的“迟到行动”,便更像是锐意而为之,给人一种待万事俱备之时,再乘春风之势,一举成名的沉着与淡定。现实证实,他们做到了。2024 年 8 月,MiniMax 的 Abab-video-1 模子一经上线便火遍寰球,敏捷包办各年夜榜单的 TOP 1。但在人们一声声“国产之光”的喝彩中,闫豪杰开始沉着上去,他晓得对 MiniMax 而言,技巧的主要性还在一直的晋升,技巧好了,才干留住用户。他曾说:“当技巧做欠好的时间,全部货色都是成绩,当技巧做好了,全部成绩都市被掩饰。”继10月上线图生视频功效后,MiniMax此次宣布最新图生视频模子 I2V-01-Live,再次证实了 MiniMax 在视频天生年夜模子范畴的技巧才能。疾速的产物更新周期将人们对海螺 AI 将来的文+图天生视频以及编纂可控性的等待值直接拉满。在竞争日益剧烈的视频天生年夜模子范畴,MiniMax 作为新兴力气,凭仗专一深耕的技巧道路与精准前瞻的策略规划怀才不遇,拉着视频天生行业往前走了一年夜步。但是,作为“厥后者”,MiniMax毕竟是怎样推进行业开展的?此中原因并不难懂得。从Mini,到MaxSora 高潮掀起了海内对视频天生年夜模子的普遍存眷,各至公司“先后”入局,MiniMax 凭始创公司的身份,在一众“宇宙年夜厂”眼前表示不输。从大名鼎鼎的始创公司,仅用了三年时光便到“国产之光”,MiniMax 或者真的纷歧般。自公司建立,MiniMax保持在多模态发力,其视频天生模子天生内容从细节性、正确性以及丰盛度上都失掉了不错的后果。在利用趋向上,MiniMax 的两款视频天生模子抢在 2024 年正式上线,紧抓 AI 视频年夜模子暴发式增加的机会。作为 AI 视频的利用元年,2024 年不只是一个主要出发点,也预示着行业迈入高速开展的新阶段。跟着模子才能的一直晋升跟推理本钱的逐渐降落,将来3-5年内,各种利用场景将连续被解锁。而 MiniMax 的这一规划,无疑盘踞了行业利用趋向的制高点。从更久远的视角来看,视频天生模子则承载着更巨大的愿景,无望成为天下模子以及通用 AGI 弗成或缺的主要构成局部。无论是面前仍是将来,MiniMax 的路看似都不走错。除此之外,新一代的 AI 视频任务流也正在萌发,它将会整合音频、视频的全部创作流程,年夜年夜的进步创作效力,同时也能够下降 AI 视频内容在制造中各个环节的“违跟”景象。这个任务流重要包含“精致化天生”跟“流程化整合”两个偏向,前者重要是对视频中的各种细节停止精准调试,后者是经由过程一站式效劳进步任务效力。在这方面,MiniMax凭仗自研语音模子、音乐模子的翻新跟利用,可能早已为此做好了规划。MiniMax 抉择在海内的 B 端跟 C 端同时发力,攻破了海内市场被“年夜厂”朋分的贸易化规划,力图在差别市场层面获得冲破。经由过程满意企业客户的高效任务流需要以及团体用户对翻新东西的寻求,MiniMax 可能在两条市场线中取得更多机遇。除此之外,MiniMax 还踊跃扩大海内市场,追求寰球化的开展机会,应用差别地域的需要特色跟潜力,推进品牌的寰球化开展,并为其将来的贸易化带来更多的机会。与此同时 ,MiniMax 也在 AI 视频天生的竞争中,凭仗其在基本模子、产物跟场景三个要害因素上的深度规划,逐渐推进了技巧跟市场的开展,拉着海内视频天生行业往前走了一年夜步。至于 MiniMax 还能走多远,看它硬是把本人从 mini 拼成了 Max 的劲头,足以信任它当前的路还会很长。雷峰网原创文章,未经受权制止转载。概况见转载须知。]article_adlist--> 申明:新浪网独家稿件,未经受权制止转载。 -->