自聊天机器(qì)人(rén)ChatGPT火爆(bào)以来,微软公司创始(shǐ)人比(bǐ)尔·盖茨已多次公开(kāi)谈论人工(gōng)智能话题。在最近的一(yī)次采(cǎi)访(fǎng)中,他(tā)再次表示(shì):“AI可能会让科技行业迎来一次剧(jù)烈(liè)的洗牌(pái)”。
这个(gè)结(jié)论是他在当地(dì)时间2月20日接受《In Good Company》节目专访时提出的。
他预期(qī),AI的发(fā)展可能会威胁到谷歌的市占率,因为微(wēi)软在AI方(fāng)面的行动(dòng)相(xiāng)当(dāng)迅速。而最终科技(jì)巨头将把AI整合成用(yòng)户的“全能助手”,包揽一切应用,与人们(men)进行沟通并提供建议,可以(yǐ)取代亚马逊、Siri或Outlook等应用。
大佬口中全能助手的到来(lái)可能(néng)尚需(xū)时(shí)日,但由ControlNet引发的(de)又一(yī)次AI绘画浪潮(cháo),让AIGC在(zài)ChatGPT的(de)话题热点包围中(zhōng)杀(shā)出重围。
01
ControlNet颠(diān)覆AI绘(huì)画新玩(wán)法
AIGC向可控靠近
以AI绘(huì)画为代表的AIGC上一(yī)次爆火的时候(hòu),还是2022年8月,在美国科罗(luó)拉多ny是什么牌子中文名 ny是奢侈品牌吗州举办的新兴数字(zì)艺术家竞(jìng)赛中(zhōng),一幅名为《太空歌剧院》的作品获奖。
随后各(gè)大厂商的AI绘画(huà)软件被广大(dà)网友(yǒu)熟(shú)知并体验,Stable Diffusion便是其中代(dài)表。
用户(hù)们可(kě)以在应用中(zhōng)输入(rù)一(yī)组(zǔ)关键词或者一张照片,就(jiù)能获得一幅(fú)AI创作的(de)画作(zuò)。
作画(huà)的关键就是所输入的文本(běn)。同一组关键词也可(kě)以创(chuàng)作(zuò)出很多张风格不一(yī)样的画(huà)作,这让创作的过程就像开盲(máng)盒。
很(hěn)多(duō)用户很喜欢(huān)这(zhè)种不确(què)定的惊喜(xǐ),他(tā)们会将生成的美图当(dāng)做头像(xiàng)。而另一部分喜欢翻看AI绘(huì)画的“翻车”作品(pǐn)。在社(shè)交媒体上,许多用户分(fēn)享(xiǎng)AI“翻车现场”,例如,一位网友的小(xiǎo)狗照片被AI画成了“肌肉男”,还有网(wǎng)友(yǒu)的(de)个人照片被AI识别(bié)成了建筑。
而如今随着ControlNet的出现(xiàn)与加持,以往AI绘(huì)画的(de)填写关键词游(yóu)戏可能要(yào)被颠覆(fù)了。
ControlNet是一位正在斯坦(tǎn)福读(dú)博(bó)的中国(guó)人(rén)张(zhāng)吕(lǚ)敏创作的一(yī)种基于控制点(diǎn)的(de)图像变形算法,主要用于数字图像处(chù)理、计算机视觉和计算机(jī)图形(xíng)学等领域。
其SD插(chā)件一经(jīng)发布,在短短(duǎn)的两天内便成为了AI绘画领域最新的热(rè)点(diǎn)。
在此(cǐ)之前(qián),大家用(yòng)了很多方法想让AI生(shēng)成的结(jié)果尽可能的符合要求,但是(shì)都不尽如人意(yì),它(tā)的(de)出现(xiàn)代(dài)表着(zhe)AI生(shēng)成开始进入真正的可控时期。
因为ControlNet可以直接提取画(huà)面的构图,人物(wù)的姿势和画面的深度信息等(děng)。有了它的帮助,就不用频繁的用提(tí)示词来碰运气,抽盲(máng)盒式的创作了。
通(tōng)俗的(de)说ControlNet相(xiāng)当于(yú)给AI绘画加了“魔法(fǎ)”,不少(shǎo)博主的作品已经获得了大量的浏览量,“viggo”就是其中之一,他用朋友的照片直接带她们走进动漫(màn)世(shì)界。
viggo先用StableDiffusion图(tú)片(piàn)转(zhuǎn)文字。
再(zài)用Text2Prompt插件拓(tuò)展找到对(duì)应的关键词;最(zuì)后用ControlNet插件绑定(dìng)骨骼开始(shǐ)换(huàn)关键词试效(xiào)果。
通过(guò)图片就可以(yǐ)看出(chū)来,效果十分惊(jīng)艳(yàn)。
更厉害的是,除了真实的照片,草图(tú)也可以(yǐ)加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实现(xiàn)线稿转全彩图。大神张吕(lǚ)敏其本尊也(yě)亲自(zì)回应。
不得不说(shuō)当下(xià)AIGC已经变得越来越强大,甚(shèn)至(zhì)输出的作品都已经能以假乱真了。
02
难(nán)辨虚实,AIGC技术力(lì)爆发
警惕(tì)安(ān)全(quán)问题
近日(rì),“苏州金鸡湖(hú)有游艇party”的消息火遍网络(luò),而经(jīng)过(guò)警方辟谣这所谓的“party”可能是全国第一(yī)起AI绘(huì)图诈骗。
由(yóu)于这个活动里面给出的美女照片(piàn)都(dōu)是AI制作的(de)真人照片绘图,因为太逼(bī)真,被大家当(dāng)成真事(shì)传播了。
不(bù)过仔细观察可以发现,活动发起者提供的(de)照(zhào)片中有个很(hěn)大的漏洞可以发现并非真人,而是(shì)AI绘(huì)图,那便是图片(piàn)中女性(xìng)的手指部分(fēn)有的存在(zài)异常。
有行(xíng)业人事表示:“现在因为(wèi)手指部分的(de)绘画算法比较复杂,AI还不太(tài)会画人的手,但(dàn)最新看到的图片已经有越来(lái)越完美的AI模型出(chū)现,以后可能就(jiù)完全没有漏洞(dòng)了。”
类似的(de)AI作图诈骗在国(guó)外也已有发生。据英国广(guǎng)播公司报(bào)道,土耳(ěr)其地震期间(jiān),有(yǒu)Tiktok用户使用AI合成了儿童受灾的(de)假照(zhào)片发(fā)布到(dào)网络,以此(cǐ)诱骗善良(liáng)的人(rén)打(dǎ)赏“捐助”从(cóng)而(ér)实施(shī)诈骗。
目前随着技术发(fā)展,AIGC已经能(néng)做出真人照片般的绘(huì)图效果,如果这样的图片被用来诈骗,将非(fēi)常可怕。
此外AIGC还引(yǐn)发了很多担忧,一方面,批判者认为AI在“学习”了大量前(qián)人的作品之后,其创作没有任何(hé)情(qíng)绪和(hé)灵魂,难以和人类的艺(yì)术创作相提并论。
另一方面,AIGC背后的版权、目前都并没有(yǒu)得到有效的解决,还有AIGC会不会代(dài)替人类“至高无(wú)上(shàng)”的创意。
马斯克也强调,人工智能的安全问题需要得到重视,太晚就来(lái)不及了。
03
AIGC下一(yī)站除了(le)视频,还有远方(fāng)
技术都是有两面性的,潜在(zài)的危害(hài)并不能(néng)掩盖其光(guāng)辉的贡献。现(xiàn)在(zài)看(kàn)来,人工智(zhì)能(néng)技术将是第(dì)四次工(gōng)业革命的核心(xīn)驱动力(lì)量,将创造新(xīn)的增(zēng)长(zhǎng)奇迹(jì)。
过去一(yī)年,人工智能(néng)在(zài)技术和商业层面都有了巨大进(jìn)展(zhǎn),AI绘画就是人(rén)工智能(néng)技术(shù)发生方向性(xìng)改变的一个代表。其下一站或(huò)许就(jiù)是视频。
此前,Meta和谷歌先(xiān)后发布了几条引爆科技(jì)圈(quān)的短视频(pín)。这些视频引发关注并非内容(róng)做得(dé)多(duō)优秀,反而都非常(cháng)简(jiǎn)单,比如一匹正在喝水的马,一(yī)只画(huà)画的玩(wán)具熊,或者一段骑(qí)摩(mó)托车的第一视角录像(xiàng),随便一个有手(shǒu)机(jī)的人都可以随手录下一段(duàn)。
但这些(xiē)短视频的创作方式非常简单,创作(zuò)者仅仅需(xū)要(yào)向AI输入一段(duàn)话,甚(shèn)至只是说一下要求,AI就可以根据需(xū)要(yào)生成一段视频。
谷歌(gē)发布(bù)的两个AI生成视频(pín)分别来自于Imagen Video和(hé)Phenaki,前者主(zhǔ)要突出的是高(gāo)清,与(yǔ)Meta的(de)Make-A-Video没有太多的差(chà)别。
在Make-A-Video公布了AI生成的视频后(hòu),AI圈(quān)就已经玩了一波梗,一个能够做出(chū)更高(gāo)清视频(pín)的AI还不足以在短时(shí)间内(nèi)戳(chuō)中兴奋点。
Phenaki更加(jiā)令人震惊的地方在于,它(tā)可以制(zhì)作出超过2分钟(zhōng)的连贯的也有确(què)切内容(róng)的视频,这才(cái)是真(zhēn)正(zhèng)让人们感到惊喜(xǐ)的地方。因为无论(lùn)AI生成的视(shì)频多(duō)么高清(qīng),也(yě)只能是为(wèi)内容生产者提供一个灵(líng)感,一个素材,一个过场动画。
不(bù)过能够(gòu)制作出有具体剧(jù)情内容的(de)视频就(jiù)意味着,一些视频创(chuàng)作(zuò)由AI代替人工完(wán)成(chéng)已经初步有了可能。
当下AI的发展速(sù)度已(yǐ)经超过大部分人的想象(xiàng)。内容产业的(de)本(běn)质是供给创(chuàng)造(zào)需求(qiú),AIGC作为全(quán)新的内容生产方式,可以为(wèi)内容(róng)产(chǎn)业带来(lái)更新的(de)内容风格(gé)、更快的(de)生产速度,更(gèng)低(dī)的(de)生产成(chéng)本(běn),这无(wú)疑会驱(qū)动内容产业的大爆(bào)发。
除了AI绘图、视频,AIGC技术还能应用(yòng)于音乐、代码(mǎ)、机器人动作等多种内容形式的生(shēng)成。不难发现该项技术不仅在游戏等行业能(néng)得到有效(xiào)应用,对于(yú)下(xià)一代互联网各种(zhǒng)元素的(de)构建亦有(yǒu)关键意义。
从商业化的角度来看,文化娱乐、教育、传(chuán)媒等诸多领域,本身就对基于AI的可视化内(nèi)容有强烈需求。
因(yīn)此,AI绘(huì)画及(jí)视频(pín)或不是结果,而只是AI进程中的(de)一块重(zhòng)要拼图(tú),有望在技术更新的(de)加持下实现更大的(de)应(yīng)用价值。
AI从(cóng)理(lǐ)解内容,走向(xiàng)了可以生成内(nèi)容,甚(shèn)至能够创造出独(dú)立价值和(hé)独立视角的内(nèi)容。AIGC的再次出圈,更代表(biǎo)着未(wèi)来的先进生产力即将到来。
04
紧(jǐn)抓大(dà)模(mó)型与算(suàn)力(lì),牢固AIGC底(dǐ)座
从(cóng)技术的发展也可(kě)以看出,在语(yǔ)言大模型、图(tú)像(xiàng)大(dà)模型之后,多模态大模型已经(jīng)成为了(le)新的趋势。
大模(mó)型被誉(yù)为当前(qián)人工智能(néng)发展(zhǎn)的智能底(dǐ)座(zuò),是全(quán)球竞争最激烈的(de)研究(jiū)方向之一,包括谷歌、亚(yà)马逊、百度、阿里、腾讯等(děng)众多头部企业都在竞相发力。
不过训练大模型的确价(jià)格不菲,以(yǐ)国盛证券发布的《ChatGPT需要多少算力》报告(gào)估算,GPT-3训练一次的(de)成本约为(wèi)140万美(měi)元(yuán)。而对(duì)于一些更大的LLM(大型语言模型),训练成(chéng)本则介(jiè)于200万美元至1200万美元高价之间。
以(yǐ)ChatGPT在(zài)2023年1月的(de)独立访客平均数1300万计算(suàn),其对(duì)应芯片需求为(wèi)3万多片英伟达A100 GPU,初(chū)始投入成本(běn)约为8亿美元,每日仅电费(fèi)就在5万美元左右。
此外不论是(shì)ChatGPT还是(shì)AIGC,都离(lí)不(bù)开庞(páng)大算力支(zhī)持。在(zài)关注各类大模型(xíng)的发(fā)展(zhǎn)同时(shí),更应该关注算力网络的建设。
算力网(wǎng)络正驱动AI产业发(fā)展进入史诗级加速进程,让AIGC及通用AI这一(yī)人(rén)工智能发展的终极目标(biāo)离得更(gèng)近。
因为算(suàn)力可以对突(tū)破性技术创新(xīn)提供大(dà)力的(de)支(zhī)持。这方面(miàn),多(duō)模态大模型(xíng)是(shì)典型(xíng)。作(zuò)为(wèi)面向未来强人(rén)工智能(néng)、通用人工智(zhì)能的重要(yào)技(jì)术创新,多模态大模型已经在人工(gōng)智能领域提出了(le)很多(duō)年(nián),业界也(yě)有(yǒu)不(bù)少(shǎo)技(jì)术突破,但是,多(duō)模态大(dà)模型进(jìn)一步(bù)往下走,算力需(xū)求呈(chéng)几(jǐ)何式上升,一般的(de)算力基(jī)础设施(shī)很(hěn)快(kuài)将难以胜(shèng)任。
从图(tú)像、文字、语音单独(dú)一项的训练,到双模态、三模态(tài)的跃迁(qiān),让人工智(zhì)能可(kě)以灵活应(yīng)对不同(tóng)模态(tài)的(de)转化、像人(rén)与世界(jiè)交互一(yī)样(yàng)自然,这方面,由算力网络来(lái)驱动将有明(míng)显优势(shì)。
此外,还有很(hěn)多(duō)需(xū)要(yào)爆发(fā)式增长(zhǎng)的算(suàn)力来ny是什么牌子中文名 ny是奢侈品牌吗支撑(chēng)的技术创新,将在人工智能算力网络支撑下快(kuài)速(sù)推(tuī)进。
AIGC已(yǐ)经露出曙光(guāng),期(qī)待(dài)在大模型和(hé)大算(suàn)力(lì)的支持(chí)下AIGC能持续颠(diān)覆内容(róng)生产的方式,将创(chuàng)造的边际成本降低,让万众受益(yì)。
未经允许不得转载:绿茶通用站群 ny是什么牌子中文名 ny是奢侈品牌吗
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了